AI 赋能的文档问答系统 (RAG)

项目概述
开发了一个基于检索增强生成(RAG)技术的文档问答系统。该系统利用 LangChain 框架,集成了多种大语言模型和嵌入模型,能够处理包括 PDF、Word、Excel 在内的多种文档格式。系统支持增量更新文档索引,并提供命令行和 Web API 两种交互方式,实现了对非结构化文档内容的智能问答。
使用的技术
- Python
- LangChain
- FastAPI
- ChromaDB
- OpenAI API / DeepSeek API / 智谱 AI API
- Docker
项目成果
- 实现了支持多种文档格式的 RAG 问答流程
- 集成了多种主流大语言模型和嵌入模型
- 支持向量数据库的增量更新,避免重复处理
- 提供了命令行和 FastAPI Web 接口,方便使用和集成
- 支持文档来源追踪,答案可溯源