• 前置篇AI 通识基础与核心技术
    • 1. 机器学习与深度学习理论基础
      • 机器学习基础
        • 监督学习:定义、典型算法(线性回归、逻辑回归、SVM、决策树、随机森林)、应用场景(图像分类、文本分类、回归预测)
        • 非监督学习:定义、典型算法(K-means聚类、层次聚类、PCA、自编码器)、应用场景(用户分群、异常检测、数据降维)
        • 半监督学习:结合少量标注数据和大量未标注数据,提升模型性能
      • 神经网络与深度学习基础
        • 神经元与激活函数:输入、权重、偏置、激活函数(ReLU、Sigmoid、Tanh)
        • 前向传播与反向传播:计算输出、通过梯度下降优化权重
        • 损失函数与优化器:均方误差(MSE)、交叉熵(Cross-Entropy)、SGD、Adam、RMSprop
        • 经典网络结构:全连接网络(FCN)、卷积神经网络(CNN)、循环神经网络(RNN)
        • 深度学习框架:PyTorch、TensorFlow、JAX
    • 2. 大模型发展全景与关键技术
      • Transformer架构的诞生与应用
        • 注意力模型(Attention Model):捕捉长距离依赖
        • 自注意力机制(Self-Attention):语义理解的钥匙
        • 多头注意力(Multi-Head Attention):并行计算不同子空间的特征
        • 位置编码(Positional Encoding):引入序列位置信息
      • 大模型技术突破与前沿趋势
        • 大模型的定义与特点
        • 传统模型与大模型的差异
        • 稀疏注意力(Sparse Attention):降低计算复杂度(Longformer、BigBird)
        • 混合专家模型(MoE):动态路由机制(GShard、Switch Transformer)
        • 模型压缩与加速:量化(INT8、FP16)、知识蒸馏(小模型学习大模型的知识)
  • DeepSeek 篇大模型应用与 Agent 开发入门
    • 3. DeepSeek 现状、应用与技术创新
      • DeepSeek 国运级爆火的现象与本质
        • DeepSeek 为什么火?
        • DeepSeek 是什么?
        • DeepSeek 还能火多久?
      • DeepSeek 应用快速入门
        • DeepSeek 提示工程核心原则与技巧
        • DeepSeek 文案生成和迭代实践
        • DeepSeek 代码生成和测试实践
      • DeepSeek 等前沿大模型技术发展现状
        • 中美在大模型领域的技术与政策对比
        • 潜在的合作与竞争格局
      • DeepSeek 里程碑模型与关键技术
        • DeepSeek V1:重新定义 Scaling Laws 与超参数幂律关系公式
        • DeepSeek V2:提出多头潜在注意力机制(MLA) 与 DeepSeekMoE 架构
        • DeepSeek-VL2: 首个多模态大模型,多种尺寸适用于不同资源下的应用场景
        • DeepSeek V3:无辅助损失策略与多 Token 预测实现超低成本训练
      • DeepSeek-R1 开启推理大模型新篇章
        • 一阶段训练:RL 自进化成果 DeepSeek-R1-Zero
        • 二阶段训练:RL 与 SFT 共舞诞生 DeepSeek-R1
        • 三阶段训练:推理能力蒸馏(Distill)迁移至小模型
        • 成功经验:纯 RL 与冷启动数据 推动性能螺旋上升
        • 失败尝试:过程奖励模型(RPM)与蒙特卡洛树搜索(MCTS)
    • 4. 使用 DeepSeek 开发你的第一个 RAG
      • DeepSeek API 开发平台
        • DeepSeek 官方发布 API 服务
        • 硅基流动(联合华为云)API 服务
        • 腾讯云 API 服务
        • 阿里云百炼 API 服务
        • 字节火山方舟 API 服务
        • DeepSeek 应用开发环境搭建与实战
      • 向量数据库:原理、架构与选型
        • 向量数据库基本原理
        • 向量数据库架构
        • 向量数据库的选型与对比
        • 向量数据库存储与检索嵌入实践
      • 检索增强生成(RAG, Retrieval Augmented Generation)介绍
        • RAG 系统架构与工作流程
        • RAG 在信息检索与生成任务中的优势
        • RAG 的实践应用与案例分析
      • 实战:使用 DeepSeek API 开发智能问答系统
    • 5. 使用 DeepSeek 开发小红书爆款文案生成助手
      • Agent 理论基础与开发入门
        • Agent 基本概念与工作机制
        • LLM + Agent 的核心能力与优势
        • Agent 开发流程与关键模块解析
      • DeepSeek Agent 开发入门与案例分析
        • DeepSeek 工具调用入门
        • DeepSeek Prompt 设计策略方法
        • DeepSeek Agent 真实应用案例解析
      • 实战:使用 DeepSeek 开发小红书爆款文案生成助手
        • 需求拆解与 Agent 任务规划
        • 爆款文案生成逻辑与 Prompt 设计
        • 文案生成策略与评估优化
    • 6. DeepSeek 私有化部署与最佳实践
      • 私有化部署的概念与需求分析
        • 私有化部署的定义与核心价值
        • 适用场景:金融、医疗、政府等高隐私要求行业
        • 私有化部署的优势:数据隔离、定制化服务、性能优化
      • 大模型私有化部署技术选型
        • 私有化部署技术栈:构建你自己的 AI 工厂
        • 选型建议:基础设施、容器、推理服务、容器编排、应用接口
        • 关于行业标准的探讨:从云原生到智能体
      • 实战:基于 Ollama 的 DeepSeek 私有化部署
        • 大模型私有化部署工具:Ollama
        • 基于华为云 GPU 服务器部署 DeepSeek
      • 实战:私有化部署的小红书爆款文案生成助手
  • Dify 篇基于工作流编排的 Agent 设计与开发
    • 7. 大模型应用开发平台 Dify 快速入门
      • Dify 开发平台简介
        • 平台定位:面向零基础人员的 Agent 开发平台
        • 基础概念:后端即服务(Backend as Service)、LLMOps、工作流、提示词编排等
      • Dify 平台使用方法
        • 云服务:开箱即用的 Dify 在线服务
        • 社区版:使用 Docker (Compose) 部署
        • 上手操作:账号注册、新建应用、节点配置、提示词设置、调试预览
        • 核心功能:内置工具接入、变量管理、条件分支、迭代与模板转换
      • 使用 Dify 快速搭建 Agent 应用原型
        • 实战:使用 Dify 快速搭建 AI 图像生成应用
        • 实战:使用 Dify 快速搭建智能客服机器人
    • 8. LangBot 大模型原生即时通信机器人平台
      • LangBot 平台简介
        • 平台定位:高稳定性、多模态支持的即时通信机器人开发框架
        • 核心优势:多平台适配(微信/飞书/钉钉等)、插件扩展性、Anthropic MCP 协议兼容
        • 基础概念:多轮对话引擎、工具调用机制、敏感词过滤与访问控制
      • 核心功能与技术特性
        • 多模态对话能力
          • 支持的大模型列表:DeepSeek/Claude
          • 群聊与私聊场景适配、多模态输入输出(文本/图像/文件)
        • 高稳定性设计
          • 限速机制、熔断策略、错误自动恢复
          • 动态配置热更新(通过 JSON/YAML)
      • 快速部署方案
        • 使用 Docker Compose 一键部署 LangBot
        • 快速入门 LangBot WebUI 管理面板
      • 实战: LangBot 微信智能对话机器人
        • 机器人配置:企业微信应用创建与回调配置
        • 大模型配置:DeepSeek 对话模型接入
        • 流水线配置:LangBot 内置 Agent 运行器
        • 实战:LangBot 微信对话智能机器人
    • 9. 使用 Dify 和 LangBot 研发多平台智能客服 Agent
      • 多平台智能客服方案概述
        • 介绍 Dify + LangBot 组合的优势:快速接入、统一管理、多模态支持
        • 典型应用场景:智能客服、群助手、工作流自动化
      • 实战:企业微信 雪茄通-智能客服(RAG)
        • LangBot 的 Dify API 流水线配置
        • LangBot 与 Dify Chatflow 对接
        • 在企微和个微测试 RAG 智能客服机器人
      • 实战:飞书 高考志愿填报-智能客服
        • LangBot 对接飞书机器人及流水线配置
        • 飞书开发者平台应用与权限配置
        • 在多个客户端测试高考志愿智能客服
    • 10. 使用 Dify 研发代码自动生成 Agent
      • 需求与应用价值
        • 市场背景:自动化代码生成提升开发效率、降低成本
        • 应用场景:企业工具开发、自动化测试、快速原型、跨平台应用构建
      • 技术方案与系统架构设计
        • 分阶段设计:产品需求、研发实现、执行与反馈
        • 核心模块:需求解析、高效提示词、模型选择、分支逻辑实现
        • 完整工作流:用户输入->需求理解->代码生成->执行与反馈
      • 实战:一键生成小游戏(贪吃蛇、五子棋)
      • 实战:公司官方网站的构建与调试
  • 协议篇:MCP & A2A 快速入门与实战
    • 11.模型上下文协议(MCP)简介与开发实战
      • MCP 概述
        • MCP 的愿景:提供标准化协议连接 LLM 与数据/工具
        • MCP 的作用:构建 Agent 和复杂工作流,实现数据与工具整合
        • MCP 的优势:预构建集成、LLM 供应商灵活切换、安全的数据访问
      • MCP 架构、组件与技术实现
        • MCP 技术架构与关键组件
        • MCP 三驾马车:Prompts, Resources, Tools
      • 使用 Cherry Studio 快速体验 MCP
        • Cherry Studio 介绍与安装部署
        • Cherry Studio 模型服务与 MCP 服务配置
        • 基于 12306 MCP Server 实现旅行规划助手
      • MCP 开源生态:站在巨人的肩膀上
    • 12.模型上下文协议(MCP)部署与开发实战
      • MCP Server 开发与部署
        • MCP 通信技术架构与原理
        • MCP Server 开发环境搭建与项目初始化
        • MCP 天气查询服务器开发(基于 NWS API)
      • MCP 天气查询应用实战与调试
        • MCP Host 选择:VS Code + CLINE 插件
        • MCP Server 本地部署与 Client 配置方法
      • 基于 CLINE 开发与调试行程规划助手
        • 魔塔社区 MCP Server 配置与调试
        • 使用中国天气查询与 12306 API 实现行程规划
      • 深入浅出 MCP 底层技术原理
        • MCP 协议层与传输层解读
        • MCP 调用栈与生命周期解析
    • 13.A2A 协议与 MCP 的协同之道
      • AI 协作的黎明:A2A 协议系统性介绍(“Why” & “What”)
        • AI Agent “能力孤岛”与 A2A 的破局之道
        • A2A 核心使命:打破壁垒、赋能协作、保护隐私
        • A2A 设计哲学:仰望星空,脚踏实地
      • 深入 A2A 的运作肌理 (“How”)
        • A2A 核心架构与 Agent Card 介绍
        • A2A 交互流程、四要素和两种模式详解
        • A2A 落地场景:自动化企业招聘和采购,超级智能私人助理
      • 伟大的协同:当 MCP 遇见 A2A (“Synergy”)
        • Agent 世界观类比:个体(MCP)与社会(A2A)
        • MCP 与 A2A 全面对比:核心差异,技术栈分层,场景选择,终局展望
        • MCP 与 A2A 协同使用场景与未来展望
      • 实战 A2A 官方 Python 示例 HelloWorld
  • FastGPT 篇企业级知识库设计与 RAG 进阶开发
    • 14. 企业知识库与问答系统设计
      • 企业数据治理与知识库搭建现
        • 知识库需求分析与功能规划
        • 企业数据采集、清洗与知识提取
        • 企业知识库的设计原则与架构
        • 向量数据库技术选型:开源 vs 商业服务
      • 如企业级 RAG 系统设计方案
        • 从基础版到企业级 RAG 系统
        • 从提示工程到上下文工程(Context Engineering)
        • 深入解析 RAG 系统评估方法
      • 企业级应用的挑战与解决方案
        • 在企业环境中实施AI大模型的难点
        • 可扩展性与容错机制设计
        • 高效管理与调度模型资源
        • 安全合规、成本控制与可观测性设计
    • 15. 企业级 RAG 开发框架 FastGPT 快速入门
      • FastGPT 概述与核心价值
        • FastGPT 的定位:企业级 RAG 开发框架
        • 核心功能:知识库问答、工作流编排、自动化数据处理
        • 应用场景:智能客服、企业知识管理、业务流程自动化、影视剧专业翻译等
      • 快速上手 FastGPT 在线版
        • 知识库构建与使用
          • 使用雪茄问答对文档构建知识库
          • 使用 AI 基于公司手册自动生成问答对
        • 基于办公服务模板快速开发 雪茄百科问答
        • 结合重排实现高质量的 AI 行政助理
      • 使用 Docker Compose 快速部署 FastGPT
        • FastGPT 部署架构与硬件推荐配置
        • 环境准备工作与关键配置解析
    • 16. 使用 FastGPT 开发企业级智能问答 Agent
      • FastGPT 高级功能实战:AI 行政助理 Pro
        • 问题分类背景优化与 RAG Prompt 设置
        • 知识库分块处理与检索调优
        • 文本内容提取与代码运行
        • Email 工具与企微邮箱收发信设置
        • 实战:AI 行政助理 Pro 开发与测试
      • FastGPT 高级功能实战:电商专业客服 RAG
        • 构建多模态与混合数据源的复杂业务流 Agent
        • 售前咨询+售后投诉的 Agent 工作流设计
        • 结合图像理解模型的售后投诉处理 RAG Agent
        • 结合 PostgreSQL 数据库的售前产品咨询 RAG Agent
        • 实战:电商专业客服 RAG 开发与测试
      • FastGPT API 发布与接入飞书机器人
  • 企业篇应用数据安全与行业经验推广
    • 17. 企业应用中的权限分级控制与数据隐私保护
      • 权限分级设计与实施
        • 角色定义:管理员、开发者、普通用户
        • 权限分配:模型访问、数据读写、API调用
        • 实施工具:RBAC(基于角色的访问控制)
      • 训练中的数据隐私保护策略
        • 差分隐私:训练中加入噪声
        • 联邦学习:分布式训练,数据不出本地
        • 数据脱敏:敏感信息替换或加密
      • 数据加密与隔离策略
        • 传输加密:TLS/SSL协议
        • 存储加密:AES-256算法
        • 数据隔离:多租户架构
      • 数据合规性保障
        • GDPR合规:数据主体权利、泄露通知
        • 中国法规:网络安全法、数据安全法、个人信息保护法
        • 审计与监控:日志记录、异常检测、定期合规检查
    • 18. 跨行业经验复制与应用
      • 跨行业移植的核心方法论
        • 移植第一步:解构 (Deconstruct) – 深度洞察新行业的需求与红线
        • 移植第二步:适配 (Adapt) – 对知识库、工作流与提示词进行精准改造
        • 移植第三步:验证 (Validate) – 设计行业考题,检验移植成果
      • 行业案例深潜:金融领域的移植实践
        • 需求解构:洞察金融业对“精准、安全、合规”的极致要求
        • 关键适配:如何将通用 AI 改造为严谨的“数字合规官
        • 案例学习:撮合交易、因子挖掘、保险科技 Agent
      • 行业案例深潜:医疗领域的移植实践
        • 需求解构:理解医疗领域“权威、关怀、边界”的核心诉求
        • 市场洞察:万亿美金的“效率黑洞”与 AI 机遇
        • 案例学习:Woebot 心理陪伴、Abridge 医生减负、Infinitus 效率革命行业经验转化与优化
      • 行业案例深潜:教育领域的移植实践
        • 需求解构:平衡学生“要答案”与教育者“给思路”的矛盾
        • 行业变革:AI 是“助教”,更是“引路人”
        • 案例学习:可汗学院 Khanmigo、多邻国 Duolingo
    • 19. 代码生成 Agent:产品、技术与商业模式
      • AI 时代的“新”程序员:Code Agent 市场概览
        • 从代码补全到开发伙伴:市场格局与核心玩家
        • “软件开发 2.0” 时代与 Code Agent 核心价值
      • 业界标杆产品深度剖析 (Case Study)
        • GitHub Copilot:生态之王与行业定义者
        • 通义灵码 (Lingma):国产力量与生态整合
        • Cursor:AI-First 的挑战者
        • Trae:全能型 Agent 的探索
      • 揭秘 Code Agent 背后的核心技术栈
        • Code LLM: 基石模型的能力边界
        • Context Awareness:让 Agent “看懂”你的项目
        • Agentic Loop:从生成到自修复的闭环
        • IDE 集成技术:深入开发者工作流的“毛细血管”
      • Code Agent 商业模式与企业战略
        • To C vs. To B:两种市场的不同玩法
        • 开源 vs. 闭源:代码 Agent 的战略抉择
  • 模型篇知识驱动与推理驱动的大模型竞争格局
    • 20. 上半场:国际巨头引领的模型技术路线
      • OpenAI:掀起技术革命的行业灯塔
        • 为什么从国际巨头讲起?—— 技术源头与标准定义
        • 从 GPT-1 到 GPT-3:预训练模型的诞生与”上下文学习(ICL)”范式的确立
        • GPT-4/Turbo:迈向多模态与实用主义的巅峰
        • OpenAI o1/o3:开启”推理”新纪元,从”博学”到”聪明”的跨越
      • Meta LLaMA:开源世界的”普罗米修斯”
        • LLaMA-1/2:点燃开源之火,成为开源社区的事实标准
        • LLaMA-3:性能追赶与生态构建,打破技术垄断
        • LLaMA-4:四面楚歌,用力过猛后的被动升级
      • Anthropic & Google & xAI:差异化竞争的探索者
        • Anthropic Claude 系列:主打”安全、可靠、长文本”的对话专家
        • Google Gemini 系列:原生多模态的野心与”全家桶”生态战略
        • xAI Grok 系列:马斯克旗下”巨魔”模型的独特之处与实时性优势
      • 国际主流大模型能力对比与选型策略
    • 21. 下半场:国内先驱主导的开源先进模型
      • 追求极致性能的技术派 —— DeepSeek
        • DeepSeek-V1 到 V3.1:低成本大规模通用模型训练开创者
        • DeepSeek-R1:全球首个开源超越 OpenAI o1 架构的推理模型
        • DeepSeek-VL2:MOE 架构下的视觉语言模型
      • 覆盖全场景的生态王者 —— Qwen
        • Qwen-7B/14B/72B(首代开源奠基):中文开源领导者,逼近 GPT-3.5
        • Qwen-VL/Audio(多模态探索):业界首个开源视觉/音频大模型
        • Qwen2.5 系列( 性能与场景突破):
        • Max( 闭源旗舰 ):性能对标 GPT-4.5, 综合性能超越 Llama-3.1-405B
        • VL-72B( 视频智能体 ):1 小时长视频理解,免微调跨设备操作能力
        • Qwen3 旗舰(推理架构革命):
        • 235B-A22B(混合推理 ):双模式推理架构,超越 DeepSeek R1
        • 4B-Thinking(端侧推理):黑板式思维链,AIME25 测评 81.3 分
      • 突围的后起之秀 —— Minimax 与 Kimi
        • Minimax-M1:首个开源百万上下文大模型, 创新的 Lighting Attention 机制
        • Kimi K2:面向代码生成与 Agent 通用任务优化的 MoE 万亿模型
    • 22. 展望未来:大模型应用的趋势与挑战
      • 未来已来:大模型的技术演进与趋势预测
        • 能力边界的拓展:从理解到创造
          • 趋势一:多模态的深度融合与具身智能
          • 趋势二:走向自主的智能体
          • 技术基石(一):模型架构的进化 – 超越 Transformer
          • 技术基石(二):训练范式的革新 – 自主进化
        • 可持续与可信的根基:从野蛮生长到行稳致远
          • 趋势三:绿色 AI 与效率革命
          • 趋势四:模型安全与可信 AI
      • 外部环境变化对大模型的影响:浪潮中的航向
        • 中美 AI 竞争的核心差异:从“模型之战”到“生态之战”
        • 经济与技术对 AI 发展的影响:从“技术狂热”到“价值回归”
      • 开发者的未来:AI 时代的职业机会与终身学习
        • AI 时代的人才需求变迁:岗位的消失与崛起
        • 构建你的个人护城河:一个面向未来的学习路线图
  • 训练篇DeepSeek 模型微调与蒸馏
    • 23. DeepSeek-R1 模型微调与案例分析
      • 战略抉择:当 RAG 不再足够,我们为何需要微调?
        • 知识的两种形态:外挂知识库 vs. 内化知识
        • 深度对比:RAG 与微调的适用场景
        • 微调核心范式:模型蒸馏、指令微调和高效微调
      • 指令微调:为大模型设计一套“精英课程”
        • 指令微调的本质:从补全到执行
        • 指令三要素与优秀数据集赏析
        • 数据集构建的核心原则与避坑指南
      • 高效微调:四两拨千斤的“教学”魔法
        • 成本之墙:全量微调为何是“天价”游戏
        • PEFT 核心思想:冻结大脑,训练插件
        • PEFT 明星技术:LoRA 与 QLoRA 技术解密
      • 案例分析: 看 DeepSeek-R1 蒸馏模型如何被“驯服”
        • 医疗领域—医疗诊断助手(指令微调 + LoRA 实战)
        • 隐藏的挑战:训练中的工程优化问题
    • 24. 实战 DeepSeek-R1-Qwen 小模型蒸馏
      • 蒸馏理论:巨人的智慧如何传承
        • 知识蒸馏基础理论:教师-学生模型
        • 三大技术流派:数据蒸馏、Logits 蒸馏、特征蒸馏
      • 工具与流程:高效蒸馏的现代化工作流
        • 开源模型训练库:HuggingFace transformers, trl, datasets, PEFT
        • 微调加速训练库:unsloth
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。