《大模型与 Agent:AI 技术探索、实践与人才发展培训》大纲——赵卫东
面向AI研发人员的专业培训课程,系统讲解大模型与Agent技术体系,涵盖理论基础、架构设计、训练实践、应用场景及人才发展影响,助力企业把握AI技术前沿。
一、机器学习 vs 深度学习
1. 基础概念辨析
- 监督学习/无监督学习/强化学习范式对比
- 特征工程与传统机器学习流程
- 端到端学习与表示学习的革命
2. 技术演进路线
- 从SVM到神经网络的跨越
- 深度学习的三大支柱:数据/算力/算法
- 现代AI系统的分层架构(感知→认知→决策)
3. 实战对比分析
- 相同任务下的不同实现路径(如CV/NLP案例)
- 计算资源与模型性能的trade-off分析
二、神经网络的数学本质与训练逻辑
1. 数学基础深度解析
- 高维空间中的流形学习理论
- 张量运算的几何解释
- 损失函数的拓扑性质
2. 训练动力学
- 梯度下降的物理系统类比
- 优化器设计哲学(Momentum/Adam进化史)
- 损失景观与收敛性分析
3. 高级训练技术
- 二阶优化方法实践
- 混合精度训练的数理基础
- 分布式训练的收敛性保证
三、Transformer架构
1. 核心机制解构
- 自注意力机制的量子力学类比
- 位置编码的傅里叶分析视角
- 多头注意力的并行计算范式
2. 架构变体分析
- 稀疏Transformer的工程优化
- 高效Attention的数学近似方法
- 跨模态架构设计原则
3. 工业级实现
- 内存优化技巧(Flash Attention等)
- 硬件适配策略(TPU/GPU异构计算)
- 推理延迟优化实战
四、大模型训练全流程揭秘
1. 预训练阶段
- 千亿token数据处理流水线
- 分布式训练框架对比(Megatron/Deepspeed)
- 万亿参数模型的3D并行策略
2. 微调技术
- 参数高效微调全景图(LoRA/Adapter)
- 指令微调的数据配比策略
- 多任务学习的梯度冲突解决
3. 对齐与安全
- RLHF中的奖励模型设计
- 价值观对齐的评估体系
五、大模型的核心能力与边界
1. 能力评估体系
- 涌现能力的临界尺度分析
- 世界模型的理论框架
- 多模态推理的神经基础
2. 技术局限性
- 幻觉产生的认知机制
- 逻辑推理的符号接地问题
- 长上下文建模的挑战
3. 前沿突破方向
- 神经符号系统融合路径
- 能量基模型新范式
- 世界模型构建方法论
六、推理模型的兴起
1. 技术原理
- 思维链的认知科学基础
- 程序辅助推理的编译原理
- 自洽性验证的数学原理
2. 工程实践
- 推理加速技术(KV Cache优化)
- 采样策略对比(Beam Search vs Nucleus)
- 多智能体辩论系统实现
3. 应用场景
- 复杂决策支持系统
- 自动定理证明
- 科学发现辅助
七、Agent的兴起与应用
1. 架构设计
- 记忆模块的数据库实现
- 工具使用的外接神经系统
- 反思机制的强化学习实现
2. 开发框架
- AutoGPT架构剖析
- LangChain核心组件
- 多Agent协调协议
3. 行业解决方案
- 金融领域的智能投研Agent
- 医疗诊断辅助系统
- 工业数字孪生应用
八、数据即模型,模型即服务
1. 数据飞轮构建
- 高质量数据标注体系
- 自动数据清洗流水线
- 持续学习的数据闭环
2. 模型服务化
- 推理API的性能优化
- 模型即插即用接口设计
- 边缘计算部署方案
3. 商业模式创新
- 模型能力开放平台架构
- 垂直行业精调即服务
- AI-Native应用设计模式
九、大模型对人才结构的影响
1. 技能矩阵重构
- 新一代AI工程师能力模型
- 提示工程的专业化路径
- 模型运维(MLOps)技能树
2. 组织变革
- AI研发团队的敏捷实践
- 人机协作的流程再造
- 复合型人才孵化机制
3. 教育体系响应
- 高校课程体系改革案例
- 企业大学建设实践
邀请嘉宾演讲电话:13811229543 李助理(工作日8:30-18:00,仅限演讲其他勿扰)
免责声明:以上内容(包括文字、图片、视频)为用户上传并发布,本平台仅提供信息存储服务。如涉及版权问题,请联系我们并提供版权证明,我们将立即删除!