极客时间 AI全栈开发实战营-itall6

前置篇AI 通识基础与核心技术
- 1. 机器学习与深度学习理论基础
  - 机器学习基础
    
    监督学习：定义、典型算法（线性回归、逻辑回归、SVM、决策树、随机森林）、应用场景（图像分类、文本分类、回归预测）
    
    非监督学习：定义、典型算法（K-means聚类、层次聚类、PCA、自编码器）、应用场景（用户分群、异常检测、数据降维）
    
    半监督学习：结合少量标注数据和大量未标注数据，提升模型性能
  - 神经网络与深度学习基础
    
    神经元与激活函数：输入、权重、偏置、激活函数（ReLU、Sigmoid、Tanh）
    
    前向传播与反向传播：计算输出、通过梯度下降优化权重
    
    损失函数与优化器：均方误差（MSE）、交叉熵（Cross-Entropy）、SGD、Adam、RMSprop
    
    经典网络结构：全连接网络（FCN）、卷积神经网络（CNN）、循环神经网络（RNN）
    
    深度学习框架：PyTorch、TensorFlow、JAX
- 2. 大模型发展全景与关键技术
  - Transformer架构的诞生与应用
    
    注意力模型（Attention Model）：捕捉长距离依赖
    
    自注意力机制（Self-Attention）：语义理解的钥匙
    
    多头注意力（Multi-Head Attention）：并行计算不同子空间的特征
    
    位置编码（Positional Encoding）：引入序列位置信息
  - 大模型技术突破与前沿趋势
    
    大模型的定义与特点
    
    传统模型与大模型的差异
    
    稀疏注意力（Sparse Attention）：降低计算复杂度（Longformer、BigBird）
    
    混合专家模型（MoE）：动态路由机制（GShard、Switch Transformer）
    
    模型压缩与加速：量化（INT8、FP16）、知识蒸馏（小模型学习大模型的知识）
DeepSeek 篇大模型应用与 Agent 开发入门
- 3. DeepSeek 现状、应用与技术创新
  - DeepSeek 国运级爆火的现象与本质
    
    DeepSeek 为什么火？
    
    DeepSeek 是什么？
    
    DeepSeek 还能火多久？
  - DeepSeek 应用快速入门
    
    DeepSeek 提示工程核心原则与技巧
    
    DeepSeek 文案生成和迭代实践
    
    DeepSeek 代码生成和测试实践
  - DeepSeek 等前沿大模型技术发展现状
    
    中美在大模型领域的技术与政策对比
    
    潜在的合作与竞争格局
  - DeepSeek 里程碑模型与关键技术
    
    DeepSeek V1：重新定义 Scaling Laws 与超参数幂律关系公式
    
    DeepSeek V2：提出多头潜在注意力机制（MLA）与 DeepSeekMoE 架构
    
    DeepSeek-VL2: 首个多模态大模型，多种尺寸适用于不同资源下的应用场景
    
    DeepSeek V3：无辅助损失策略与多 Token 预测实现超低成本训练
  - DeepSeek-R1 开启推理大模型新篇章
    
    一阶段训练：RL 自进化成果 DeepSeek-R1-Zero
    
    二阶段训练：RL 与 SFT 共舞诞生 DeepSeek-R1
    
    三阶段训练：推理能力蒸馏（Distill）迁移至小模型
    
    成功经验：纯 RL 与冷启动数据推动性能螺旋上升
    
    失败尝试：过程奖励模型（RPM）与蒙特卡洛树搜索（MCTS）
- 4. 使用 DeepSeek 开发你的第一个 RAG
  - DeepSeek API 开发平台
    
    DeepSeek 官方发布 API 服务
    
    硅基流动（联合华为云）API 服务
    
    腾讯云 API 服务
    
    阿里云百炼 API 服务
    
    字节火山方舟 API 服务
    
    DeepSeek 应用开发环境搭建与实战
  - 向量数据库：原理、架构与选型
    
    向量数据库基本原理
    
    向量数据库架构
    
    向量数据库的选型与对比
    
    向量数据库存储与检索嵌入实践
  - 检索增强生成（RAG, Retrieval Augmented Generation）介绍
    
    RAG 系统架构与工作流程
    
    RAG 在信息检索与生成任务中的优势
    
    RAG 的实践应用与案例分析
  - 实战：使用 DeepSeek API 开发智能问答系统
- 5. 使用 DeepSeek 开发小红书爆款文案生成助手
  - Agent 理论基础与开发入门
    
    Agent 基本概念与工作机制
    
    LLM + Agent 的核心能力与优势
    
    Agent 开发流程与关键模块解析
  - DeepSeek Agent 开发入门与案例分析
    
    DeepSeek 工具调用入门
    
    DeepSeek Prompt 设计策略方法
    
    DeepSeek Agent 真实应用案例解析
  - 实战：使用 DeepSeek 开发小红书爆款文案生成助手
    
    需求拆解与 Agent 任务规划
    
    爆款文案生成逻辑与 Prompt 设计
    
    文案生成策略与评估优化
- 6. DeepSeek 私有化部署与最佳实践
  - 私有化部署的概念与需求分析
    
    私有化部署的定义与核心价值
    
    适用场景：金融、医疗、政府等高隐私要求行业
    
    私有化部署的优势：数据隔离、定制化服务、性能优化
  - 大模型私有化部署技术选型
    
    私有化部署技术栈：构建你自己的 AI 工厂
    
    选型建议：基础设施、容器、推理服务、容器编排、应用接口
    
    关于行业标准的探讨：从云原生到智能体
  - 实战：基于 Ollama 的 DeepSeek 私有化部署
    
    大模型私有化部署工具：Ollama
    
    基于华为云 GPU 服务器部署 DeepSeek
  - 实战：私有化部署的小红书爆款文案生成助手
Dify 篇基于工作流编排的 Agent 设计与开发
- 7. 大模型应用开发平台 Dify 快速入门
  - Dify 开发平台简介
    
    平台定位：面向零基础人员的 Agent 开发平台
    
    基础概念：后端即服务（Backend as Service）、LLMOps、工作流、提示词编排等
  - Dify 平台使用方法
    
    云服务：开箱即用的 Dify 在线服务
    
    社区版：使用 Docker (Compose) 部署
    
    上手操作：账号注册、新建应用、节点配置、提示词设置、调试预览
    
    核心功能：内置工具接入、变量管理、条件分支、迭代与模板转换
  - 使用 Dify 快速搭建 Agent 应用原型
    
    实战：使用 Dify 快速搭建 AI 图像生成应用
    
    实战：使用 Dify 快速搭建智能客服机器人
- 8. LangBot 大模型原生即时通信机器人平台
  - LangBot 平台简介
    
    平台定位：高稳定性、多模态支持的即时通信机器人开发框架
    
    核心优势：多平台适配（微信/飞书/钉钉等）、插件扩展性、Anthropic MCP 协议兼容
    
    基础概念：多轮对话引擎、工具调用机制、敏感词过滤与访问控制
  - 核心功能与技术特性
    
    多模态对话能力
    
    支持的大模型列表：DeepSeek/Claude
    
    群聊与私聊场景适配、多模态输入输出（文本/图像/文件）
    
    高稳定性设计
    
    限速机制、熔断策略、错误自动恢复
    
    动态配置热更新（通过 JSON/YAML）
  - 快速部署方案
    
    使用 Docker Compose 一键部署 LangBot
    
    快速入门 LangBot WebUI 管理面板
  - 实战： LangBot 微信智能对话机器人
    
    机器人配置：企业微信应用创建与回调配置
    
    大模型配置：DeepSeek 对话模型接入
    
    流水线配置：LangBot 内置 Agent 运行器
    
    实战：LangBot 微信对话智能机器人
- 9. 使用 Dify 和 LangBot 研发多平台智能客服 Agent
  - 多平台智能客服方案概述
    
    介绍 Dify + LangBot 组合的优势：快速接入、统一管理、多模态支持
    
    典型应用场景：智能客服、群助手、工作流自动化
  - 实战：企业微信雪茄通-智能客服（RAG）
    
    LangBot 的 Dify API 流水线配置
    
    LangBot 与 Dify Chatflow 对接
    
    在企微和个微测试 RAG 智能客服机器人
  - 实战：飞书高考志愿填报-智能客服
    
    LangBot 对接飞书机器人及流水线配置
    
    飞书开发者平台应用与权限配置
    
    在多个客户端测试高考志愿智能客服
- 10. 使用 Dify 研发代码自动生成 Agent
  - 需求与应用价值
    
    市场背景：自动化代码生成提升开发效率、降低成本
    
    应用场景：企业工具开发、自动化测试、快速原型、跨平台应用构建
  - 技术方案与系统架构设计
    
    分阶段设计：产品需求、研发实现、执行与反馈
    
    核心模块：需求解析、高效提示词、模型选择、分支逻辑实现
    
    完整工作流：用户输入->需求理解->代码生成->执行与反馈
  - 实战：一键生成小游戏（贪吃蛇、五子棋）
  - 实战：公司官方网站的构建与调试
协议篇：MCP & A2A 快速入门与实战
- 11.模型上下文协议（MCP）简介与开发实战
  - MCP 概述
    
    MCP 的愿景：提供标准化协议连接 LLM 与数据/工具
    
    MCP 的作用：构建 Agent 和复杂工作流，实现数据与工具整合
    
    MCP 的优势：预构建集成、LLM 供应商灵活切换、安全的数据访问
  - MCP 架构、组件与技术实现
    
    MCP 技术架构与关键组件
    
    MCP 三驾马车：Prompts, Resources, Tools
  - 使用 Cherry Studio 快速体验 MCP
    
    Cherry Studio 介绍与安装部署
    
    Cherry Studio 模型服务与 MCP 服务配置
    
    基于 12306 MCP Server 实现旅行规划助手
  - MCP 开源生态：站在巨人的肩膀上
- 12.模型上下文协议（MCP）部署与开发实战
  - MCP Server 开发与部署
    
    MCP 通信技术架构与原理
    
    MCP Server 开发环境搭建与项目初始化
    
    MCP 天气查询服务器开发（基于 NWS API）
  - MCP 天气查询应用实战与调试
    
    MCP Host 选择：VS Code + CLINE 插件
    
    MCP Server 本地部署与 Client 配置方法
  - 基于 CLINE 开发与调试行程规划助手
    
    魔塔社区 MCP Server 配置与调试
    
    使用中国天气查询与 12306 API 实现行程规划
  - 深入浅出 MCP 底层技术原理
    
    MCP 协议层与传输层解读
    
    MCP 调用栈与生命周期解析
- 13.A2A 协议与 MCP 的协同之道
  - AI 协作的黎明：A2A 协议系统性介绍(“Why” & “What”)
    
    AI Agent “能力孤岛”与 A2A 的破局之道
    
    A2A 核心使命：打破壁垒、赋能协作、保护隐私
    
    A2A 设计哲学：仰望星空，脚踏实地
  - 深入 A2A 的运作肌理 (“How”)
    
    A2A 核心架构与 Agent Card 介绍
    
    A2A 交互流程、四要素和两种模式详解
    
    A2A 落地场景：自动化企业招聘和采购，超级智能私人助理
  - 伟大的协同：当 MCP 遇见 A2A (“Synergy”)
    
    Agent 世界观类比：个体（MCP）与社会（A2A）
    
    MCP 与 A2A 全面对比：核心差异，技术栈分层，场景选择，终局展望
    
    MCP 与 A2A 协同使用场景与未来展望
  - 实战 A2A 官方 Python 示例 HelloWorld
FastGPT 篇企业级知识库设计与 RAG 进阶开发
- 14. 企业知识库与问答系统设计
  - 企业数据治理与知识库搭建现
    
    知识库需求分析与功能规划
    
    企业数据采集、清洗与知识提取
    
    企业知识库的设计原则与架构
    
    向量数据库技术选型：开源 vs 商业服务
  - 如企业级 RAG 系统设计方案
    
    从基础版到企业级 RAG 系统
    
    从提示工程到上下文工程（Context Engineering）
    
    深入解析 RAG 系统评估方法
  - 企业级应用的挑战与解决方案
    
    在企业环境中实施AI大模型的难点
    
    可扩展性与容错机制设计
    
    高效管理与调度模型资源
    
    安全合规、成本控制与可观测性设计
- 15. 企业级 RAG 开发框架 FastGPT 快速入门
  - FastGPT 概述与核心价值
    
    FastGPT 的定位：企业级 RAG 开发框架
    
    核心功能：知识库问答、工作流编排、自动化数据处理
    
    应用场景：智能客服、企业知识管理、业务流程自动化、影视剧专业翻译等
  - 快速上手 FastGPT 在线版
    
    知识库构建与使用
    
    使用雪茄问答对文档构建知识库
    
    使用 AI 基于公司手册自动生成问答对
    
    基于办公服务模板快速开发雪茄百科问答
    
    结合重排实现高质量的 AI 行政助理
  - 使用 Docker Compose 快速部署 FastGPT
    
    FastGPT 部署架构与硬件推荐配置
    
    环境准备工作与关键配置解析
- 16. 使用 FastGPT 开发企业级智能问答 Agent
  - FastGPT 高级功能实战：AI 行政助理 Pro
    
    问题分类背景优化与 RAG Prompt 设置
    
    知识库分块处理与检索调优
    
    文本内容提取与代码运行
    
    Email 工具与企微邮箱收发信设置
    
    实战：AI 行政助理 Pro 开发与测试
  - FastGPT 高级功能实战：电商专业客服 RAG
    
    构建多模态与混合数据源的复杂业务流 Agent
    
    售前咨询+售后投诉的 Agent 工作流设计
    
    结合图像理解模型的售后投诉处理 RAG Agent
    
    结合 PostgreSQL 数据库的售前产品咨询 RAG Agent
    
    实战：电商专业客服 RAG 开发与测试
  - FastGPT API 发布与接入飞书机器人
企业篇应用数据安全与行业经验推广
- 17. 企业应用中的权限分级控制与数据隐私保护
  - 权限分级设计与实施
    
    角色定义：管理员、开发者、普通用户
    
    权限分配：模型访问、数据读写、API调用
    
    实施工具：RBAC（基于角色的访问控制）
  - 训练中的数据隐私保护策略
    
    差分隐私：训练中加入噪声
    
    联邦学习：分布式训练，数据不出本地
    
    数据脱敏：敏感信息替换或加密
  - 数据加密与隔离策略
    
    传输加密：TLS/SSL协议
    
    存储加密：AES-256算法
    
    数据隔离：多租户架构
  - 数据合规性保障
    
    GDPR合规：数据主体权利、泄露通知
    
    中国法规：网络安全法、数据安全法、个人信息保护法
    
    审计与监控：日志记录、异常检测、定期合规检查
- 18. 跨行业经验复制与应用
  - 跨行业移植的核心方法论
    
    移植第一步：解构 (Deconstruct) – 深度洞察新行业的需求与红线
    
    移植第二步：适配 (Adapt) – 对知识库、工作流与提示词进行精准改造
    
    移植第三步：验证 (Validate) – 设计行业考题，检验移植成果
  - 行业案例深潜：金融领域的移植实践
    
    需求解构：洞察金融业对“精准、安全、合规”的极致要求
    
    关键适配：如何将通用 AI 改造为严谨的“数字合规官
    
    案例学习：撮合交易、因子挖掘、保险科技 Agent
  - 行业案例深潜：医疗领域的移植实践
    
    需求解构：理解医疗领域“权威、关怀、边界”的核心诉求
    
    市场洞察：万亿美金的“效率黑洞”与 AI 机遇
    
    案例学习：Woebot 心理陪伴、Abridge 医生减负、Infinitus 效率革命行业经验转化与优化
  - 行业案例深潜：教育领域的移植实践
    
    需求解构：平衡学生“要答案”与教育者“给思路”的矛盾
    
    行业变革：AI 是“助教”，更是“引路人”
    
    案例学习：可汗学院 Khanmigo、多邻国 Duolingo
- 19. 代码生成 Agent：产品、技术与商业模式
  - AI 时代的“新”程序员：Code Agent 市场概览
    
    从代码补全到开发伙伴：市场格局与核心玩家
    
    “软件开发 2.0” 时代与 Code Agent 核心价值
  - 业界标杆产品深度剖析 (Case Study)
    
    GitHub Copilot：生态之王与行业定义者
    
    通义灵码 (Lingma)：国产力量与生态整合
    
    Cursor：AI-First 的挑战者
    
    Trae：全能型 Agent 的探索
  - 揭秘 Code Agent 背后的核心技术栈
    
    Code LLM: 基石模型的能力边界
    
    Context Awareness：让 Agent “看懂”你的项目
    
    Agentic Loop：从生成到自修复的闭环
    
    IDE 集成技术：深入开发者工作流的“毛细血管”
  - Code Agent 商业模式与企业战略
    
    To C vs. To B：两种市场的不同玩法
    
    开源 vs. 闭源：代码 Agent 的战略抉择
模型篇知识驱动与推理驱动的大模型竞争格局
- 20. 上半场：国际巨头引领的模型技术路线
  - OpenAI：掀起技术革命的行业灯塔
    
    为什么从国际巨头讲起？—— 技术源头与标准定义
    
    从 GPT-1 到 GPT-3：预训练模型的诞生与”上下文学习（ICL）”范式的确立
    
    GPT-4/Turbo：迈向多模态与实用主义的巅峰
    
    OpenAI o1/o3：开启”推理”新纪元，从”博学”到”聪明”的跨越
  - Meta LLaMA：开源世界的”普罗米修斯”
    
    LLaMA-1/2：点燃开源之火，成为开源社区的事实标准
    
    LLaMA-3：性能追赶与生态构建，打破技术垄断
    
    LLaMA-4：四面楚歌，用力过猛后的被动升级
  - Anthropic & Google & xAI：差异化竞争的探索者
    
    Anthropic Claude 系列：主打”安全、可靠、长文本”的对话专家
    
    Google Gemini 系列：原生多模态的野心与”全家桶”生态战略
    
    xAI Grok 系列：马斯克旗下”巨魔”模型的独特之处与实时性优势
  - 国际主流大模型能力对比与选型策略
- 21. 下半场：国内先驱主导的开源先进模型
  - 追求极致性能的技术派 —— DeepSeek
    
    DeepSeek-V1 到 V3.1：低成本大规模通用模型训练开创者
    
    DeepSeek-R1：全球首个开源超越 OpenAI o1 架构的推理模型
    
    DeepSeek-VL2：MOE 架构下的视觉语言模型
  - 覆盖全场景的生态王者 —— Qwen
    
    Qwen-7B/14B/72B（首代开源奠基）：中文开源领导者，逼近 GPT-3.5
    
    Qwen-VL/Audio（多模态探索）：业界首个开源视觉/音频大模型
    
    Qwen2.5 系列（性能与场景突破）：
    
    Max（闭源旗舰）：性能对标 GPT-4.5，综合性能超越 Llama-3.1-405B
    
    VL-72B（视频智能体）：1 小时长视频理解，免微调跨设备操作能力
    
    Qwen3 旗舰（推理架构革命）：
    
    235B-A22B（混合推理）：双模式推理架构，超越 DeepSeek R1
    
    4B-Thinking（端侧推理）：黑板式思维链，AIME25 测评 81.3 分
  - 突围的后起之秀 —— Minimax 与 Kimi
    
    Minimax-M1：首个开源百万上下文大模型，创新的 Lighting Attention 机制
    
    Kimi K2：面向代码生成与 Agent 通用任务优化的 MoE 万亿模型
- 22. 展望未来：大模型应用的趋势与挑战
  - 未来已来：大模型的技术演进与趋势预测
    
    能力边界的拓展：从理解到创造
    
    趋势一：多模态的深度融合与具身智能
    
    趋势二：走向自主的智能体
    
    技术基石（一）：模型架构的进化 – 超越 Transformer
    
    技术基石（二）：训练范式的革新 – 自主进化
    
    可持续与可信的根基：从野蛮生长到行稳致远
    
    趋势三：绿色 AI 与效率革命
    
    趋势四：模型安全与可信 AI
  - 外部环境变化对大模型的影响：浪潮中的航向
    
    中美 AI 竞争的核心差异：从“模型之战”到“生态之战”
    
    经济与技术对 AI 发展的影响：从“技术狂热”到“价值回归”
  - 开发者的未来：AI 时代的职业机会与终身学习
    
    AI 时代的人才需求变迁：岗位的消失与崛起
    
    构建你的个人护城河：一个面向未来的学习路线图
训练篇DeepSeek 模型微调与蒸馏
- 23. DeepSeek-R1 模型微调与案例分析
  - 战略抉择：当 RAG 不再足够，我们为何需要微调？
    
    知识的两种形态：外挂知识库 vs. 内化知识
    
    深度对比：RAG 与微调的适用场景
    
    微调核心范式：模型蒸馏、指令微调和高效微调
  - 指令微调：为大模型设计一套“精英课程”
    
    指令微调的本质：从补全到执行
    
    指令三要素与优秀数据集赏析
    
    数据集构建的核心原则与避坑指南
  - 高效微调：四两拨千斤的“教学”魔法
    
    成本之墙：全量微调为何是“天价”游戏
    
    PEFT 核心思想：冻结大脑，训练插件
    
    PEFT 明星技术：LoRA 与 QLoRA 技术解密
  - 案例分析：看 DeepSeek-R1 蒸馏模型如何被“驯服”
    
    医疗领域—医疗诊断助手（指令微调 + LoRA 实战）
    
    隐藏的挑战：训练中的工程优化问题
- 24. 实战 DeepSeek-R1-Qwen 小模型蒸馏
  - 蒸馏理论：巨人的智慧如何传承
    
    知识蒸馏基础理论：教师-学生模型
    
    三大技术流派：数据蒸馏、Logits 蒸馏、特征蒸馏
  - 工具与流程：高效蒸馏的现代化工作流
    
    开源模型训练库：HuggingFace transformers, trl, datasets, PEFT
    
    微调加速训练库：unsloth

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

极客时间 AI全栈开发实战营

评论(0)

提示：请文明发言取消回复

作者信息

文章展示

极客时间 PostgreSQL进阶训练营

极客时间 Ai算法进阶训练营

极客时间微服务进阶训练营

极客时间大模型高级工程师认证课

极客时间 AIOps训练营

极客时间 AIGC产品经理训练营

排行榜展示

呀这个资源忘记放百度网盘链接了请联系客服直接领取

客服QQ号：3807009482 首次加客服可免费领取本网站一个月的会员

Go进阶 IM系统设计与落地，单体到微服务深度剖析

MQ大牛成长课–从0到1手写分布式消息队列中间件

MCP+A2A 从0到1构建类Manus多Agent全栈应用

AI Agent股票异动风控机器人实战

极客时间 AI全栈开发实战营

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

文章展示

排行榜展示

提示：请文明发言取消回复