研究人员推出了一款多模态大学聊天机器人,旨在通过使用检索增强生成(RAG)帮助利益相关者及时获取信息。该系统将大型语言模型与语义检索相结合,从大学手册等机构资源中生成基于上下文的响应。

  • 通过视觉语言模型接受文本和图像查询。
  • 应用量化推理以在受限硬件上快速部署。
  • 使用基于 FastAPI 构建的可扩展后端和使用 Next.js 开发的响应式前端。
  • 与现有系统相比,幻觉率从 31.7% 降低到 6.6%。

定量评估证实了检索基础的效力,而多模态测试显示尽管视觉输入的响应时间增加,但两种查询类型的满意度评分都很高。