大模型技术与应用培训提纲
第一天:基础篇与技术概览
-
上午(3小时)
-
大模型技术基础与最新进展
-
大模型的定义与关键技术概览
-
生成式人工智能(AIGC)概念
-
ChatGPT历史与发展
-
一些关键技术
-
人工智能实验环境的搭建
-
机器学习环境与深度学习环境
-
Python编程与数据科学工具库介绍
-
GPU与cuda
-
深度学习框架:PyTorch
-
ChatGPT模型背后的NLP基础知识
-
深度学习算法基础
-
MLP与CNN、RNN
-
特殊字符、分词与停用词处理技术
-
词向量与Embedding
-
介绍大模型前沿应用
-
企业应用场景案例分析
-
金融机构中的智能风险评估系统案例
-
教育机构的个性化学习路径推荐系统案例
-
下午(3小时)
-
大模型的核心技术深入
-
Transformer架构的深入解析与优化
-
Transformer中的block
-
自注意力机制与多头注意力
-
位置编码(为什么可以抛弃RNN)
-
Batch Norm与Layer Norm
-
解码器的构造
-
chatGPT的原理介绍
-
指示学习与InstructGPT
-
相关数据集
-
有监督微调(SFT)
-
从人类反馈中RL的思路
-
奖励建模(RM)
-
运用PPO改进
-
企业应用场景案例分析
-
法律行业的法条自动生成案例
-
法律行业的智能合同审核与咨询案例
-
实战演练:基础模型的使用与体验
-
演示如何使用最新的开源大模型ChatGLM3
-
学员动手操作,体验模型的基本功能及最新特性
第二天:进阶篇与实战应用
-
上午(3小时)
-
大模型的微调和优化
-
ChatGLM部署
-
ChatGLM3-6B介绍
-
ChatGLM3搭建流程
-
应用场景(工具调用、代码执行)
-
权重量化
-
ChatGLM3原理
-
Code Interpreter
-
多模态CogVLM
-
WebGLM搜索增强
-
大模型训练的高效算法与优化技术
-
LoRA
-
Prefix Tuning
-
P-Tuning
-
Prompt Tuning
-
freeze
-
企业应用场景案例分析
-
金融科技中的自动化报告生成与分析案例
-
医疗研究中的文献检索与知识提取案例
-
教育技术中的智能教学辅助工具案例
-
下午(3小时)
-
实战演练:大模型的微调实践
-
演示ChatGLM3微调过程
-
学习LangChain所需的知识储备
-
词嵌入与语义空间
-
高维向量的快速模糊匹配
-
局部敏感哈希(LSH)
-
向量数据库
-
建立企业级对话系统
-
LangChain的原理
-
大模型利用的难点与痛点
-
Langchain的基本思路
-
关键组件
-
大模型的部署与运维
-
模型部署的最佳实践,包括容器化、云服务等
-
ChatGLM.cpp等
-
Docker简介
-
K8s简介
-
运维中的监控、调优与安全性管理
-
企业应用场景案例分析
-
企业内部的知识管理系统与智能助手案例
-
卫生行业的智能助手
通过这个为期两天的培训,学员将能够全面掌握大模型技术的基础知识、最新进展、企业级应用场景以及未来趋势。通过案例分析、实战演练和高级应用开发,学员将能够深入理解并应用大模型技术,为企业带来创新与价值。
邀请嘉宾演讲电话:13811229543 李助理(工作日8:30-18:00,仅限演讲其他勿扰)
免责声明:以上内容(包括文字、图片、视频)为用户上传并发布,本平台仅提供信息存储服务。如涉及版权问题,请联系我们并提供版权证明,我们将立即删除!