欢迎来到大模型时代:生成式 AI 与基础范式
01
建立共同语言:大语言模型能做什么、为什么能做到,以及从预训练到对齐的基本流程与关键概念。
Topics
- 大模型时代:能力边界与应用场景
- 判别式 vs 生成式:生成模型的直觉
- 预训练、指令微调、偏好对齐(RLHF/DPO)的基本流程
- Token、上下文窗口与推理成本(延迟/吞吐)
Outcomes
- 能用清晰术语解释训练/对齐各阶段的目标与差异
- 能识别常见误用边界,形成合理预期与沟通口径
课程大纲与学习目标
建立共同语言:大语言模型能做什么、为什么能做到,以及从预训练到对齐的基本流程与关键概念。
从自监督学习出发理解语言建模,并掌握 Transformer/注意力机制支撑规模化训练与推理的核心直觉。
从强化学习与策略优化的基本概念出发,理解 LLM 对齐中的 RLHF/DPO 等方法,以及“决策式智能”的工程含义。
理解规模化训练与推理服务的基本规律,并掌握常见失效模式(幻觉/越权/注入)与防护思路。
从 Prompt 到轻量微调与工具学习,理解如何让模型更稳定、更可控地完成复杂任务并与外部能力协作。
了解图文对齐、多模态生成与对话系统的关键技术,并理解世界模型/模拟器与具身智能的核心想法与挑战。