教学大纲
- 授课方式: 腾讯会议(详见课程微信群、Canvas 公告)
- 课程时间: 星期六(3 月 8 日 - 4 月 19 日)
- 上午 9 时 - 11 时 35 分
- 下午 14 时 - 16 时 35 分
- 课程邮箱: [email protected]
课程简介
《走近大模型》是一门面向高中生的学森挑战计划导论课程。课程的前半部分从大语言模型的基础开始,包括网络架构、训练、推理和评估。随后讨论大语言模型的解释(或解释尝试)、对齐以及涌现能力,接着探讨其在语言任务中的常见应用以及文本之外的新用途。在后半部分,课程首先介绍扩展语言模型预训练的技术,以及近期在使大模型预训练和部署更高效方面的方法。然后讨论部署大语言模型时的各种顾虑,最后以LLM发展面临的挑战和前沿领域作为总结。本课程旨在让高中生全面了解大语言模型背后的技术,并在大语言模型的基础理论和前沿发展方面获得深入认识,呼应大模型时代对人才培养的最新要求。
培养目标
我们希望参与课程的高中生,在顺利完成一学期的导论课程后能够:
- 阅读大语言模型相关的最新学术论文,熟悉其中常用术语(如对齐、扩展定律、RLHF、提示工程、指令微调等)
- 比较和分析大语言模型生态系统中不同模型的异同,从而为特定任务确定最佳模型
- 学习使用大语言模型智能体构建平台(如 Dify、Coze 等)从零开始实现大语言模型智能体
- 理解如何将大语言模型应用于各种下游应用,以创新方式应用现有的大规模语言模型
课程形式
星期六的线上课程将由以下三部分组成:
- 课前阅读:每节课都会有相关阅读材料,建议有兴趣的学生在上课前完成浏览
- 课堂教学:每节课将由一位老师主讲,课程内容围绕大语言模型的理论基础、智能范式、评测应用等三方面展开
- 当堂互动:课堂讲授期间将穿插一些不计分的互动活动,包括与同学线上分组讨论课堂话题,或通过投票软件回答问题等
考核方式
- 60%: 共有三次课后思考作业,需独立完成并在规定时间内提交
- 每次课后思考作业占总成绩的20%
- 40%: 课程大作业汇报展示,需三人合作完成并在最后一节课进行展示
- 时间: 5/10/2025 (线上)