
-
前置篇AI 通识基础与核心技术
-
1. 机器学习与深度学习理论基础
-
机器学习基础
-
监督学习:定义、典型算法(线性回归、逻辑回归、SVM、决策树、随机森林)、应用场景(图像分类、文本分类、回归预测)
-
非监督学习:定义、典型算法(K-means聚类、层次聚类、PCA、自编码器)、应用场景(用户分群、异常检测、数据降维)
-
半监督学习:结合少量标注数据和大量未标注数据,提升模型性能
-
-
神经网络与深度学习基础
-
神经元与激活函数:输入、权重、偏置、激活函数(ReLU、Sigmoid、Tanh)
-
前向传播与反向传播:计算输出、通过梯度下降优化权重
-
损失函数与优化器:均方误差(MSE)、交叉熵(Cross-Entropy)、SGD、Adam、RMSprop
-
经典网络结构:全连接网络(FCN)、卷积神经网络(CNN)、循环神经网络(RNN)
-
深度学习框架:PyTorch、TensorFlow、JAX
-
-
-
2. 大模型发展全景与关键技术
-
Transformer架构的诞生与应用
-
注意力模型(Attention Model):捕捉长距离依赖
-
自注意力机制(Self-Attention):语义理解的钥匙
-
多头注意力(Multi-Head Attention):并行计算不同子空间的特征
-
位置编码(Positional Encoding):引入序列位置信息
-
-
大模型技术突破与前沿趋势
-
大模型的定义与特点
-
传统模型与大模型的差异
-
稀疏注意力(Sparse Attention):降低计算复杂度(Longformer、BigBird)
-
混合专家模型(MoE):动态路由机制(GShard、Switch Transformer)
-
模型压缩与加速:量化(INT8、FP16)、知识蒸馏(小模型学习大模型的知识)
-
-
-
-
DeepSeek 篇大模型应用与 Agent 开发入门
-
3. DeepSeek 现状、应用与技术创新
-
DeepSeek 国运级爆火的现象与本质
-
DeepSeek 为什么火?
-
DeepSeek 是什么?
-
DeepSeek 还能火多久?
-
-
DeepSeek 应用快速入门
-
DeepSeek 提示工程核心原则与技巧
-
DeepSeek 文案生成和迭代实践
-
DeepSeek 代码生成和测试实践
-
-
DeepSeek 等前沿大模型技术发展现状
-
中美在大模型领域的技术与政策对比
-
潜在的合作与竞争格局
-
-
DeepSeek 里程碑模型与关键技术
-
DeepSeek V1:重新定义 Scaling Laws 与超参数幂律关系公式
-
DeepSeek V2:提出多头潜在注意力机制(MLA) 与 DeepSeekMoE 架构
-
DeepSeek-VL2: 首个多模态大模型,多种尺寸适用于不同资源下的应用场景
-
DeepSeek V3:无辅助损失策略与多 Token 预测实现超低成本训练
-
-
DeepSeek-R1 开启推理大模型新篇章
-
一阶段训练:RL 自进化成果 DeepSeek-R1-Zero
-
二阶段训练:RL 与 SFT 共舞诞生 DeepSeek-R1
-
三阶段训练:推理能力蒸馏(Distill)迁移至小模型
-
成功经验:纯 RL 与冷启动数据 推动性能螺旋上升
-
失败尝试:过程奖励模型(RPM)与蒙特卡洛树搜索(MCTS)
-
-
-
4. 使用 DeepSeek 开发你的第一个 RAG
-
DeepSeek API 开发平台
-
DeepSeek 官方发布 API 服务
-
硅基流动(联合华为云)API 服务
-
腾讯云 API 服务
-
阿里云百炼 API 服务
-
字节火山方舟 API 服务
-
DeepSeek 应用开发环境搭建与实战
-
-
向量数据库:原理、架构与选型
-
向量数据库基本原理
-
向量数据库架构
-
向量数据库的选型与对比
-
向量数据库存储与检索嵌入实践
-
-
检索增强生成(RAG, Retrieval Augmented Generation)介绍
-
RAG 系统架构与工作流程
-
RAG 在信息检索与生成任务中的优势
-
RAG 的实践应用与案例分析
-
-
实战:使用 DeepSeek API 开发智能问答系统
-
-
5. 使用 DeepSeek 开发小红书爆款文案生成助手
-
Agent 理论基础与开发入门
-
Agent 基本概念与工作机制
-
LLM + Agent 的核心能力与优势
-
Agent 开发流程与关键模块解析
-
-
DeepSeek Agent 开发入门与案例分析
-
DeepSeek 工具调用入门
-
DeepSeek Prompt 设计策略方法
-
DeepSeek Agent 真实应用案例解析
-
-
实战:使用 DeepSeek 开发小红书爆款文案生成助手
-
需求拆解与 Agent 任务规划
-
爆款文案生成逻辑与 Prompt 设计
-
文案生成策略与评估优化
-
-
-
6. DeepSeek 私有化部署与最佳实践
-
私有化部署的概念与需求分析
-
私有化部署的定义与核心价值
-
适用场景:金融、医疗、政府等高隐私要求行业
-
私有化部署的优势:数据隔离、定制化服务、性能优化
-
-
大模型私有化部署技术选型
-
私有化部署技术栈:构建你自己的 AI 工厂
-
选型建议:基础设施、容器、推理服务、容器编排、应用接口
-
关于行业标准的探讨:从云原生到智能体
-
-
实战:基于 Ollama 的 DeepSeek 私有化部署
-
大模型私有化部署工具:Ollama
-
基于华为云 GPU 服务器部署 DeepSeek
-
-
实战:私有化部署的小红书爆款文案生成助手
-
-
-
Dify 篇基于工作流编排的 Agent 设计与开发
-
7. 大模型应用开发平台 Dify 快速入门
-
Dify 开发平台简介
-
平台定位:面向零基础人员的 Agent 开发平台
-
基础概念:后端即服务(Backend as Service)、LLMOps、工作流、提示词编排等
-
-
Dify 平台使用方法
-
云服务:开箱即用的 Dify 在线服务
-
社区版:使用 Docker (Compose) 部署
-
上手操作:账号注册、新建应用、节点配置、提示词设置、调试预览
-
核心功能:内置工具接入、变量管理、条件分支、迭代与模板转换
-
-
使用 Dify 快速搭建 Agent 应用原型
-
实战:使用 Dify 快速搭建 AI 图像生成应用
-
实战:使用 Dify 快速搭建智能客服机器人
-
-
-
8. LangBot 大模型原生即时通信机器人平台
-
LangBot 平台简介
-
平台定位:高稳定性、多模态支持的即时通信机器人开发框架
-
核心优势:多平台适配(微信/飞书/钉钉等)、插件扩展性、Anthropic MCP 协议兼容
-
基础概念:多轮对话引擎、工具调用机制、敏感词过滤与访问控制
-
-
核心功能与技术特性
-
多模态对话能力
-
支持的大模型列表:DeepSeek/Claude
-
群聊与私聊场景适配、多模态输入输出(文本/图像/文件)
-
-
高稳定性设计
-
限速机制、熔断策略、错误自动恢复
-
动态配置热更新(通过 JSON/YAML)
-
-
-
快速部署方案
-
使用 Docker Compose 一键部署 LangBot
-
快速入门 LangBot WebUI 管理面板
-
-
实战: LangBot 微信智能对话机器人
-
机器人配置:企业微信应用创建与回调配置
-
大模型配置:DeepSeek 对话模型接入
-
流水线配置:LangBot 内置 Agent 运行器
-
实战:LangBot 微信对话智能机器人
-
-
-
9. 使用 Dify 和 LangBot 研发多平台智能客服 Agent
-
多平台智能客服方案概述
-
介绍 Dify + LangBot 组合的优势:快速接入、统一管理、多模态支持
-
典型应用场景:智能客服、群助手、工作流自动化
-
-
实战:企业微信 雪茄通-智能客服(RAG)
-
LangBot 的 Dify API 流水线配置
-
LangBot 与 Dify Chatflow 对接
-
在企微和个微测试 RAG 智能客服机器人
-
-
实战:飞书 高考志愿填报-智能客服
-
LangBot 对接飞书机器人及流水线配置
-
飞书开发者平台应用与权限配置
-
在多个客户端测试高考志愿智能客服
-
-
-
10. 使用 Dify 研发代码自动生成 Agent
-
需求与应用价值
-
市场背景:自动化代码生成提升开发效率、降低成本
-
应用场景:企业工具开发、自动化测试、快速原型、跨平台应用构建
-
-
技术方案与系统架构设计
-
分阶段设计:产品需求、研发实现、执行与反馈
-
核心模块:需求解析、高效提示词、模型选择、分支逻辑实现
-
完整工作流:用户输入->需求理解->代码生成->执行与反馈
-
-
实战:一键生成小游戏(贪吃蛇、五子棋)
-
实战:公司官方网站的构建与调试
-
-
-
协议篇:MCP & A2A 快速入门与实战
-
11.模型上下文协议(MCP)简介与开发实战
-
MCP 概述
-
MCP 的愿景:提供标准化协议连接 LLM 与数据/工具
-
MCP 的作用:构建 Agent 和复杂工作流,实现数据与工具整合
-
MCP 的优势:预构建集成、LLM 供应商灵活切换、安全的数据访问
-
-
MCP 架构、组件与技术实现
-
MCP 技术架构与关键组件
-
MCP 三驾马车:Prompts, Resources, Tools
-
-
使用 Cherry Studio 快速体验 MCP
-
Cherry Studio 介绍与安装部署
-
Cherry Studio 模型服务与 MCP 服务配置
-
基于 12306 MCP Server 实现旅行规划助手
-
-
MCP 开源生态:站在巨人的肩膀上
-
-
12.模型上下文协议(MCP)部署与开发实战
-
MCP Server 开发与部署
-
MCP 通信技术架构与原理
-
MCP Server 开发环境搭建与项目初始化
-
MCP 天气查询服务器开发(基于 NWS API)
-
-
MCP 天气查询应用实战与调试
-
MCP Host 选择:VS Code + CLINE 插件
-
MCP Server 本地部署与 Client 配置方法
-
-
基于 CLINE 开发与调试行程规划助手
-
魔塔社区 MCP Server 配置与调试
-
使用中国天气查询与 12306 API 实现行程规划
-
-
深入浅出 MCP 底层技术原理
-
MCP 协议层与传输层解读
-
MCP 调用栈与生命周期解析
-
-
-
13.A2A 协议与 MCP 的协同之道
-
AI 协作的黎明:A2A 协议系统性介绍(“Why” & “What”)
-
AI Agent “能力孤岛”与 A2A 的破局之道
-
A2A 核心使命:打破壁垒、赋能协作、保护隐私
-
A2A 设计哲学:仰望星空,脚踏实地
-
-
深入 A2A 的运作肌理 (“How”)
-
A2A 核心架构与 Agent Card 介绍
-
A2A 交互流程、四要素和两种模式详解
-
A2A 落地场景:自动化企业招聘和采购,超级智能私人助理
-
-
伟大的协同:当 MCP 遇见 A2A (“Synergy”)
-
Agent 世界观类比:个体(MCP)与社会(A2A)
-
MCP 与 A2A 全面对比:核心差异,技术栈分层,场景选择,终局展望
-
MCP 与 A2A 协同使用场景与未来展望
-
-
实战 A2A 官方 Python 示例 HelloWorld
-
-
-
FastGPT 篇企业级知识库设计与 RAG 进阶开发
-
14. 企业知识库与问答系统设计
-
企业数据治理与知识库搭建现
-
知识库需求分析与功能规划
-
企业数据采集、清洗与知识提取
-
企业知识库的设计原则与架构
-
向量数据库技术选型:开源 vs 商业服务
-
-
如企业级 RAG 系统设计方案
-
从基础版到企业级 RAG 系统
-
从提示工程到上下文工程(Context Engineering)
-
深入解析 RAG 系统评估方法
-
-
企业级应用的挑战与解决方案
-
在企业环境中实施AI大模型的难点
-
可扩展性与容错机制设计
-
高效管理与调度模型资源
-
安全合规、成本控制与可观测性设计
-
-
-
15. 企业级 RAG 开发框架 FastGPT 快速入门
-
FastGPT 概述与核心价值
-
FastGPT 的定位:企业级 RAG 开发框架
-
核心功能:知识库问答、工作流编排、自动化数据处理
-
应用场景:智能客服、企业知识管理、业务流程自动化、影视剧专业翻译等
-
-
快速上手 FastGPT 在线版
-
知识库构建与使用
-
使用雪茄问答对文档构建知识库
-
使用 AI 基于公司手册自动生成问答对
-
-
基于办公服务模板快速开发 雪茄百科问答
-
结合重排实现高质量的 AI 行政助理
-
-
使用 Docker Compose 快速部署 FastGPT
-
FastGPT 部署架构与硬件推荐配置
-
环境准备工作与关键配置解析
-
-
-
16. 使用 FastGPT 开发企业级智能问答 Agent
-
FastGPT 高级功能实战:AI 行政助理 Pro
-
问题分类背景优化与 RAG Prompt 设置
-
知识库分块处理与检索调优
-
文本内容提取与代码运行
-
Email 工具与企微邮箱收发信设置
-
实战:AI 行政助理 Pro 开发与测试
-
-
FastGPT 高级功能实战:电商专业客服 RAG
-
构建多模态与混合数据源的复杂业务流 Agent
-
售前咨询+售后投诉的 Agent 工作流设计
-
结合图像理解模型的售后投诉处理 RAG Agent
-
结合 PostgreSQL 数据库的售前产品咨询 RAG Agent
-
实战:电商专业客服 RAG 开发与测试
-
-
FastGPT API 发布与接入飞书机器人
-
-
-
企业篇应用数据安全与行业经验推广
-
17. 企业应用中的权限分级控制与数据隐私保护
-
权限分级设计与实施
-
角色定义:管理员、开发者、普通用户
-
权限分配:模型访问、数据读写、API调用
-
实施工具:RBAC(基于角色的访问控制)
-
-
训练中的数据隐私保护策略
-
差分隐私:训练中加入噪声
-
联邦学习:分布式训练,数据不出本地
-
数据脱敏:敏感信息替换或加密
-
-
数据加密与隔离策略
-
传输加密:TLS/SSL协议
-
存储加密:AES-256算法
-
数据隔离:多租户架构
-
-
数据合规性保障
-
GDPR合规:数据主体权利、泄露通知
-
中国法规:网络安全法、数据安全法、个人信息保护法
-
审计与监控:日志记录、异常检测、定期合规检查
-
-
-
18. 跨行业经验复制与应用
-
跨行业移植的核心方法论
-
移植第一步:解构 (Deconstruct) – 深度洞察新行业的需求与红线
-
移植第二步:适配 (Adapt) – 对知识库、工作流与提示词进行精准改造
-
移植第三步:验证 (Validate) – 设计行业考题,检验移植成果
-
-
行业案例深潜:金融领域的移植实践
-
需求解构:洞察金融业对“精准、安全、合规”的极致要求
-
关键适配:如何将通用 AI 改造为严谨的“数字合规官
-
案例学习:撮合交易、因子挖掘、保险科技 Agent
-
-
行业案例深潜:医疗领域的移植实践
-
需求解构:理解医疗领域“权威、关怀、边界”的核心诉求
-
市场洞察:万亿美金的“效率黑洞”与 AI 机遇
-
案例学习:Woebot 心理陪伴、Abridge 医生减负、Infinitus 效率革命行业经验转化与优化
-
-
行业案例深潜:教育领域的移植实践
-
需求解构:平衡学生“要答案”与教育者“给思路”的矛盾
-
行业变革:AI 是“助教”,更是“引路人”
-
案例学习:可汗学院 Khanmigo、多邻国 Duolingo
-
-
-
19. 代码生成 Agent:产品、技术与商业模式
-
AI 时代的“新”程序员:Code Agent 市场概览
-
从代码补全到开发伙伴:市场格局与核心玩家
-
“软件开发 2.0” 时代与 Code Agent 核心价值
-
-
业界标杆产品深度剖析 (Case Study)
-
GitHub Copilot:生态之王与行业定义者
-
通义灵码 (Lingma):国产力量与生态整合
-
Cursor:AI-First 的挑战者
-
Trae:全能型 Agent 的探索
-
-
揭秘 Code Agent 背后的核心技术栈
-
Code LLM: 基石模型的能力边界
-
Context Awareness:让 Agent “看懂”你的项目
-
Agentic Loop:从生成到自修复的闭环
-
IDE 集成技术:深入开发者工作流的“毛细血管”
-
-
Code Agent 商业模式与企业战略
-
To C vs. To B:两种市场的不同玩法
-
开源 vs. 闭源:代码 Agent 的战略抉择
-
-
-
-
模型篇知识驱动与推理驱动的大模型竞争格局
-
20. 上半场:国际巨头引领的模型技术路线
-
OpenAI:掀起技术革命的行业灯塔
-
为什么从国际巨头讲起?—— 技术源头与标准定义
-
从 GPT-1 到 GPT-3:预训练模型的诞生与”上下文学习(ICL)”范式的确立
-
GPT-4/Turbo:迈向多模态与实用主义的巅峰
-
OpenAI o1/o3:开启”推理”新纪元,从”博学”到”聪明”的跨越
-
-
Meta LLaMA:开源世界的”普罗米修斯”
-
LLaMA-1/2:点燃开源之火,成为开源社区的事实标准
-
LLaMA-3:性能追赶与生态构建,打破技术垄断
-
LLaMA-4:四面楚歌,用力过猛后的被动升级
-
-
Anthropic & Google & xAI:差异化竞争的探索者
-
Anthropic Claude 系列:主打”安全、可靠、长文本”的对话专家
-
Google Gemini 系列:原生多模态的野心与”全家桶”生态战略
-
xAI Grok 系列:马斯克旗下”巨魔”模型的独特之处与实时性优势
-
-
国际主流大模型能力对比与选型策略
-
-
21. 下半场:国内先驱主导的开源先进模型
-
追求极致性能的技术派 —— DeepSeek
-
DeepSeek-V1 到 V3.1:低成本大规模通用模型训练开创者
-
DeepSeek-R1:全球首个开源超越 OpenAI o1 架构的推理模型
-
DeepSeek-VL2:MOE 架构下的视觉语言模型
-
-
覆盖全场景的生态王者 —— Qwen
-
Qwen-7B/14B/72B(首代开源奠基):中文开源领导者,逼近 GPT-3.5
-
Qwen-VL/Audio(多模态探索):业界首个开源视觉/音频大模型
-
Qwen2.5 系列( 性能与场景突破):
-
Max( 闭源旗舰 ):性能对标 GPT-4.5, 综合性能超越 Llama-3.1-405B
-
VL-72B( 视频智能体 ):1 小时长视频理解,免微调跨设备操作能力
-
Qwen3 旗舰(推理架构革命):
-
235B-A22B(混合推理 ):双模式推理架构,超越 DeepSeek R1
-
4B-Thinking(端侧推理):黑板式思维链,AIME25 测评 81.3 分
-
-
突围的后起之秀 —— Minimax 与 Kimi
-
Minimax-M1:首个开源百万上下文大模型, 创新的 Lighting Attention 机制
-
Kimi K2:面向代码生成与 Agent 通用任务优化的 MoE 万亿模型
-
-
-
22. 展望未来:大模型应用的趋势与挑战
-
未来已来:大模型的技术演进与趋势预测
-
能力边界的拓展:从理解到创造
-
趋势一:多模态的深度融合与具身智能
-
趋势二:走向自主的智能体
-
技术基石(一):模型架构的进化 – 超越 Transformer
-
技术基石(二):训练范式的革新 – 自主进化
-
-
可持续与可信的根基:从野蛮生长到行稳致远
-
趋势三:绿色 AI 与效率革命
-
趋势四:模型安全与可信 AI
-
-
-
外部环境变化对大模型的影响:浪潮中的航向
-
中美 AI 竞争的核心差异:从“模型之战”到“生态之战”
-
经济与技术对 AI 发展的影响:从“技术狂热”到“价值回归”
-
-
开发者的未来:AI 时代的职业机会与终身学习
-
AI 时代的人才需求变迁:岗位的消失与崛起
-
构建你的个人护城河:一个面向未来的学习路线图
-
-
-
-
训练篇DeepSeek 模型微调与蒸馏
-
23. DeepSeek-R1 模型微调与案例分析
-
战略抉择:当 RAG 不再足够,我们为何需要微调?
-
知识的两种形态:外挂知识库 vs. 内化知识
-
深度对比:RAG 与微调的适用场景
-
微调核心范式:模型蒸馏、指令微调和高效微调
-
-
指令微调:为大模型设计一套“精英课程”
-
指令微调的本质:从补全到执行
-
指令三要素与优秀数据集赏析
-
数据集构建的核心原则与避坑指南
-
-
高效微调:四两拨千斤的“教学”魔法
-
成本之墙:全量微调为何是“天价”游戏
-
PEFT 核心思想:冻结大脑,训练插件
-
PEFT 明星技术:LoRA 与 QLoRA 技术解密
-
-
案例分析: 看 DeepSeek-R1 蒸馏模型如何被“驯服”
-
医疗领域—医疗诊断助手(指令微调 + LoRA 实战)
-
隐藏的挑战:训练中的工程优化问题
-
-
-
24. 实战 DeepSeek-R1-Qwen 小模型蒸馏
-
蒸馏理论:巨人的智慧如何传承
-
知识蒸馏基础理论:教师-学生模型
-
三大技术流派:数据蒸馏、Logits 蒸馏、特征蒸馏
-
-
工具与流程:高效蒸馏的现代化工作流
-
开源模型训练库:HuggingFace transformers, trl, datasets, PEFT
-
微调加速训练库:unsloth
-
-
-
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)