• 授课方式: 腾讯会议(详见课程微信群、Canvas 公告)
  • 课程时间: 星期六(3 月 8 日 - 4 月 19 日)
    • 上午 9 时 - 11 时 35 分
    • 下午 14 时 - 16 时 35 分
  • 课程邮箱: [email protected]

课程简介

《走近大模型》是一门面向高中生的学森挑战计划导论课程。课程的前半部分从大语言模型的基础开始,包括网络架构、训练、推理和评估。随后讨论大语言模型的解释(或解释尝试)、对齐以及涌现能力,接着探讨其在语言任务中的常见应用以及文本之外的新用途。在后半部分,课程首先介绍扩展语言模型预训练的技术,以及近期在使大模型预训练和部署更高效方面的方法。然后讨论部署大语言模型时的各种顾虑,最后以LLM发展面临的挑战和前沿领域作为总结。本课程旨在让高中生全面了解大语言模型背后的技术,并在大语言模型的基础理论和前沿发展方面获得深入认识,呼应大模型时代对人才培养的最新要求。

培养目标

我们希望参与课程的高中生,在顺利完成一学期的导论课程后能够:

  • 阅读大语言模型相关的最新学术论文,熟悉其中常用术语(如对齐、扩展定律、RLHF、提示工程、指令微调等)
  • 比较和分析大语言模型生态系统中不同模型的异同,从而为特定任务确定最佳模型
  • 学习使用大语言模型智能体构建平台(如 DifyCoze 等)从零开始实现大语言模型智能体
  • 理解如何将大语言模型应用于各种下游应用,以创新方式应用现有的大规模语言模型

课程形式

星期六的线上课程将由以下三部分组成:

  • 课前阅读:每节课都会有相关阅读材料,建议有兴趣的学生在上课前完成浏览
  • 课堂教学:每节课将由一位老师主讲,课程内容围绕大语言模型的理论基础、智能范式、评测应用等三方面展开
  • 当堂互动:课堂讲授期间将穿插一些不计分的互动活动,包括与同学线上分组讨论课堂话题,或通过投票软件回答问题等

考核方式

  • 60%: 共有三次课后思考作业,需独立完成并在规定时间内提交
    • 每次课后思考作业占总成绩的20%
  • 40%: 课程大作业汇报展示,需三人合作完成并在最后一节课进行展示
    • 时间: 5/10/2025 (线上)