课程大纲
准备篇 安装最新版 Cursor 并配置 DeepSeek 等大模型
第一章

说明

指导安装最新版 Cursor,并配置最新的大模型(如 DeepSeek-V3、DeepSeek-R1、GPT-4o、Claude-3.5 Sonnet 等),实现高效的 AI 开发环境。此外,还将涵盖 RAG 相关工具的配置,助力智能检索与内容生成任务。

详细内容

  • 安装最新版 Cursor
    • 介绍 Cursor 的特点及其对 AI 编程的优化
    • 下载安装最新版本的 Cursor
    • 配置适用于大模型开发的环境与插件
  • 配置 DeepSeek 等大模型
    • 安装并配置 DeepSeek-V3、DeepSeek-R1
    • 介绍 GPT-4o/DeepSeek-V3/DeepSeek-R1 的区别及适用场景
    • 配置 API 调用,支持在 Cursor 内无缝切换不同模型

 

第一部分:RAG 基础和 RAG 真实落地项目实战
第一课
RAG 三问

说明

通过三个问题,快速了解 RAG 的核心概念、应用场景和优化方向,为后续学习打下基础。
1. 掌握 RAG 的基本概念和整体框架,
2. 了解 RAG 的典型应用场景和优势
3. 明确 RAG 系统的关键优化方向和步骤

详细内容

  • RAG 的整体框架和技术组件是什么?
    • 详解 RAG 的三个核心组成部分:文档读取、检索和生成
    • 10 大核心组件:文档导入、文本分块、嵌入、向量存储、查询优化、检索、检索后处理、生成、评估、整体流程优化
    • RAG 的完整流程,并讲解每个环节的作用和意义
  • 如何快速搭建 RAG 系统?
    • 使用 LlamaIndex 和 LangChain 快速搭建 RAG 系统(在 GPT-o1/DeepSeek-V3/R1 等最新大模型间任意切换)
    • 不使用框架,直接用嵌入模型、向量数据库和 LLM 搭建 RAG 系统
    • 使用 Coze、Dify 和 Ragflow 等可视化工具搭建 RAG 系统
  • 从何处入手优化 RAG 系统?
    • 分块策略:不同粒度对检索效率和准确度的影响
    • 嵌入策略:如何选择合适的嵌入模型和向量数据库
    • 检索策略:关键词检索、语义检索和混合检索的优缺点
    • 生成策略:如何控制生成内容的质量和相关性
    • 评估体系:如何评估 RAG 系统的性能和效果

第二课

实战项目-1:构建自己的 RAG 前端和后端框架

说明

本课及后续几个项目实战旨在让学员快速搭建完整项目,搭建起基于本地知识库的企业问答系统,并初步运行 RAG 系统。后续章节的核心技术详解篇仍将基于这些项目逐步优化 RAG 系统,并在过程中逐步深化对 RAG 各个组件的理解。

      • 项目目标
        • 掌握 RAG 前端框架的设计和开发
        • 学习如何与后端 RAG 系统进行交互
        • 实现用户友好的界面和交互体验
        • 自己搭建框架,便于评估,调试
        • 自主配置各种 RAG Pipeline, 文档解析器,嵌入模型和生成模型
      • 项目内容
        • 设计前端界面,包括用户输入、结果展示、交互功能等
        • 使用 JavaScript、HTML、CSS 等技术实现前端框架
        • 与后端 RAG 系统进行 API 对接,实现数据传输和交互
        • 优化前端性能,提升用户体验

第三课

实战项目-2:金融/医疗领域专有词汇标准化系统开发

说明

金融/医疗领域有自己的特定术语系统,如何在金融(或医疗)文档中识别这些术语,并进行标准化处理,可以节省从业人员的时间成本,提升工作效率,同时提高文档的专业程度。

  • 项目目标
    • 掌握金融 / 科技专有词汇标准化系统的开发
    • 学习如何处理金融 / 医疗领域的专业术语,将非标准化术语通过 RAG 和检索系统进行标准化,以及缩略语的自动扩写
    • 构建一个可以对专有词汇进行标准化的 RAG 系统
  • 项目内容
    • 收集整理银行/医疗领域的专有词汇和相关文档
    • 构建 RAG 系统,实现对专有词汇的识别和标准化

第四课

实战项目-3:企业文档合规性检索和问答系统开发

说明

企业文档合规性检索和问答系统开发,通过 RAG 系统帮助企业进行合规性审查,提升工作效率,同时降低合规风险。

  • 项目目标
    • 掌握企业文档合规性检索和问答系统的开发
    • 学习如何处理法律法规、行业标准等文档
    • 构建一个可以帮助企业进行合规性审查的 RAG 系统
  • 项目内容
    • 收集整理企业内部文档和相关法律法规、行业标准等
    • 对文档进行预处理,包括分词、实体识别等
    • 构建 RAG 系统,实现对文档的检索和问答功能
    • 尝试 BM25、Naive RAG、混合检索等多种算法
    • 对系统进行评估和优化,提升准确性和效率

第五课

实战项目-4:基于 GraphRAG、LightRAG 和 LazyGraphRAG 的知识图谱 RAG 系统构建

说明

近年来,知识图谱在企业 RAG 系统中得到了越来越广泛的应用,本项目将实现医学领域的医疗术语的知识图谱的构建和可视化,同时可以进行知识推理和问答。

  • 项目目标
    • 掌握基于图的 RAG 系统的构建
    • 学习 GraphRAG、LightRAG 和 LazyGraphRAG 等方法
    • 构建一个可以进行知识推理和问答的 RAG 系统
  • 项目内容
    • 收集整理知识图谱数据
    • 基于知识图谱构建 RAG 系统

第二部分:RAG 各组件与核心技术详细拆解

第一课

数据导入技术

说明

掌握从不同来源导入数据的技巧,包括文本、表格、图像、网页等,为 RAG 系统提供丰富的数据支持。
1. 学会使用不同的数据加载器读取各种格式的文档,尤其是复杂 PDF 的解析方式
2. 掌握处理图像和网页数据的技巧
3. 了解如何保留文档的结构化信息

详细内容

    • 简单文本的读取
      • 使用 LangChain 和 LlamaIndex 读取 txt 文档
      • 各种主要文档加载器的介绍和使用
    • 表格数据的导入
      • 使用 Unstructured 处理 CSV 数据
      • 自动形成和手动指定元数据
    • PDF 图像 表格和网页数据的处理
      • 使用 OCR 技术识别图像中的文字
      • 利用 LLM 解析图文信息
      • 爬取网页数据并进行解析
  • 实战
    • 重构实战项目 1 和 3 中的数据导入部分。

第二课

文本分块技术

理解文本分块的重要性,掌握不同的分块策略,并学习如何优化分块效果。

  • 教学目标
    • 理解分块对 RAG 系统的影响
    • 掌握按大小、格式和语义进行分块的技巧
    • 学习如何为文本块添加元数据
  • 详细内容
    • 分块的重要性
      • 影响检索效率和准确度
      • 避免 LLM 的上下文窗口限制
    • 不同的分块策略
      • 按大小分块:固定长度、滑动窗口等
      • 按格式分块:段落、课节等
      • 按语义分块:主题、实体等
    • 高级分块技巧
      • 使用 Tiktoken 计算 Token 数量
      • 为文本块添加元数据
      • 构建多层次索引
  • 实战
    • 重构实战项目 1 和 3 中的文本分块部分。

第三课

嵌入技术

了解嵌入模型的原理,掌握不同嵌入模型的特点,并学习如何选择合适的嵌入模型。

  • 教学目标
    • 掌握嵌入模型的基本概念和作用
    • 了解不同嵌入模型的优缺点和适用场景
    • 学习如何评估嵌入模型的效果
  • 详细内容
    • 嵌入模型的原理
      • 将文本转换为向量表示。
      • 捕捉文本的语义信息。
    • 不同嵌入模型的特点
      • 商用模型:OpenAI、Cohere、VoyageAI 等
      • 开源模型:BGE、Sentence Transformer 等
      • 实战案例:使用 OpenAI 嵌入模型进行文本聚类
    • 嵌入模型的评估和选择
      • MTEB 基准测试
      • 稀疏嵌入和密集嵌入
      • 重排序模型
  • 实战
    • 重构实战项目 1、2、3 中的嵌入部分。

第四课

向量存储和索引技术

掌握向量数据库的工作原理,了解不同向量数据库的特点,并学习如何选择和使用向量数据库。不同索引的区别、维度区别、如何加速索引,Query 和 Search 的区别和组合。

  • 教学目标
    • 理解向量数据库的基本概念和作用
    • 了解不同向量数据库的优缺点和适用场景
    • 学习如何优化向量数据库的性能
  • 详细内容
    • 向量数据库的工作原理
      • 存储和检索文本向量
      • 加速语义检索
    • 不同向量数据库的特点
      • Milvus、Weaviate、Qdrant 等
      • 索引和搜索设置
      • 实战案例:使用 Milvus 构建 RAG 系统
    • 向量数据库的高级应用
      • 混合嵌入和混合检索(稀疏检索 + 密集检索 / BM25 + ANN 相似度检索)
      • 多模态检索
  • 实战
    • 重构实战项目 1、2、3、4 中的向量存储部分

第五课

预检索-查询优化技术

学习如何优化查询语句,提高检索效率和准确度。

  • 教学目标
    • 掌握查询重写、分解和澄清的技巧
    • 了解查询路由和扩展的应用
  • 详细内容
    • 查询构建(Query Rewriting)
      • Text-to-SQL:将自然语言转换为 SQL 语句
      • Text-to-Cypher:适配图数据库的查询转换
      • Self-query Retriever:自动从查询中提取结构化信息
    • 查询优化(Query Translation)
      • 查询重写(Query Rewriting):使用 LLM 优化查询语句改写原始查询以提高准确性
      • 查询分解(Query Decomposition):将复杂查询拆分为多个子查询
      • 查询澄清(Query Clarification):通过交互明确用户意图
      • 查询扩展 – HyDE:生成假设文档来增强查询效果
    • 查询路由
      • 语义路由:根据查询内容选择合适的知识库
      • 定义路由:基于预设规则进行查询分发
  • 实战
    • 重构实战项目 1、2、3、4 中的查询优化部分。

第六课

提升检索准确性的方法

学习如何优化检索策略,包括索引结构、检索算法和结果排序等,讲解如何利用多路知识来源,以及上下文窗口过大的处理等。

  • 教学目标
    • 掌握不同的检索策略和技巧
    • 学习如何处理各种检索问题
  • 详细内容
    • 检索策略
      • 从小到大:节点 – 句子滑动窗口技术
      • 粗中有细:RecursiveRetriever 构建多层次索引
      • 分层合并:组合相关节点
      • 混合查询:结合关键词检索和语义检索
    • 检索问题和解决方法
      • 关键文档未被检索到
      • 关键文档排名过低
      • 检索结果不够全面或过于宽泛
      • 检索结果过于冗长
  • 实战
    • 重构实战项目 1、2、3、4 中的检索部分。

 

第七课

检索后处理技术

学习如何对检索结果进行后处理,包括重排、压缩和校正等,进一步提高 RAG 系统的性能。

教学目标
掌握不同的检索后处理技术
了解各种后处理技术的优缺点和适用场景
详细内容
重排
根据语义相似度、时效等因素对检索结果重新排序
RRF、CrossEncoder Reranking 等方法
压缩
精简检索结果,避免 LLM 的上下文窗口限制
LLMLingua、RECOMP 等方法
校正
纠正检索结果中的错误和偏差
Corrective RAG 等方法
实战
重构实战项目 1、2、3、4 中的检索后处理部分。

 

第八课

生成过程中的技术

学习如何优化生成过程,包括提示设计、结果规范化和内容控制等,从而提高 RAG 系统的输出质量。

  • 教学目标
    • 掌握不同的生成优化技术
    • 了解如何将检索结果融入生成过程
  • 详细内容
    • 提示设计
      • 规范化生成结果
      • 控制生成内容的准确性和多样性
    • 检索结果集成方式
      • 输入层集成
      • 输出层集成
      • 中间层集成
    • 高级生成技术
      • Self – RAG:自我反思式生成
      • RRR:动态生成优化
  • 实战
    • 重构实战项目 1、2、3、4 中的生成部分。

 

第九课

评估检索结果的技术

学习如何评估 RAG 系统的性能,包括检索评估和响应评估,并掌握不同的评估指标和框架。

  • 教学目标
    • 了解 RAG 系统的评估体系
    • 掌握不同的评估指标和框架
    • 学习如何利用评估结果优化 RAG 系统
  • 详细内容
    • 评估指标
      • 检索评估:精确率、召回率、F1 值等
      • 响应评估:语义相似度、忠实度等
    • 评估框架
      • RAGAS、Phoenix、TruLens 等
    • 评估结果的应用
      • 优化分块策略、嵌入模型、检索算法等
      • 构建高性能 RAG 系统
  • 实战
    • 可以通过本课内容,重构实战项目 1、2、3、4 中的评估部分。

第十课

复杂检索策略和范式

了解 RAG 的高级应用和未来发展趋势,包括图检索、多模态检索、迭代式检索等。

  • 教学目标
    • 掌握 GraphRAG、Contextual Retrieval 等高级检索技术
    • 了解多模态 RAG、Agentic-RAG 等前沿研究方向
  • 详细内容
    • GraphRAG
      • 利用图结构增强语义检索
      • 构建知识图谱,实现更精准的知识问答
    • Contextual Retrieval
      • 基于上下文和多轮对话的高级检索策略
      • 实现对结构化数据的精准检索
    • 多模态 RAG
      • 融合图像、视频等多模态信息
      • 实现更全面的信息检索和理解
    • Agentic-RAG
      • 基于 Agent 的检索和生成策略
      • Agent 作为检索控制器,实现更智能的检索和生成
      • 动态检索路径(Dynamic Retrieval Planning)

第十一课

其他工具、论文和开源项目

  • 教学目标
    • RAG 领域的前沿进展,拓展 RAG 领域的知识和视野,了解更多的工具、论文和开源项目。
  • 详细内容
    • Modular RAG
      • 构建可插拔的 RAG 系统
      • 提高系统的灵活性和可扩展性
    • RAG + Fine-tuning
      • 结合 RAG 和微调技术
      • 进一步提高 LLM 的性能
    • RAG 相关论文和开源项目
      • 同济大学综述论文:Retrieval-Augmented Generation for Large Language Models: A Survey
      • 香港理工大学综述:A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models
      • LightRAG、StructRAG、LazyGraphRAG、Agentic-RAG 等最新进展

 

加餐篇 DeepSeek-V3 及 DeepSeek-R1 技术详解

说明

介绍 DeepSeek 系列模型的技术创新和实践应用,帮助学员更好地理解和使用这些模型进行 RAG 开发。

详细内容

  • DeepSeek 的架构特点和性能优势
    • 不同规模DeepSeek模型的能力与特点
      • DeepSeek-V3 vs DeepSeek-R1
      • 原版 671B 和蒸馏版
      • 文本、代码生成和推理能力分析
      • 对比 GPT-4/Claude 等模型的优势
    • 不同场景下的模型选择策略
      • RAG 系统中的最佳实践
      • 本地部署 vs API 调用的选择
  • DeepSeek 核心技术创新详解
    • R1 的推理增强型架构设计
    • MoE(Mixture of Experts)结构
      • 专家路由机制原理
      • 动态计算资源分配
      • 性能和效率的平衡
    • 多头潜在注意力(MLA)
      • 注意力机制的改进
      • 上下文理解能力提升
    • 多令牌预测(MTP)
      • 并行生成策略
      • 生成效率优化
  • 如何在本机快速部署适合大小的 DeepSeek 模型
    • 不同硬件配置下的部署选择
    • 量化方案(4bit/8bit)对比
    • 推理加速技术(vLLM/TGI 等)
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。