(内容来自四川大学计算机学院官方网站)
2025年5月17日,浙江大学求是特聘教授、中国人工智能学会会士、中国图像图形学学会会士庄越挺教授应邀于我院进行交流访问,并在望江校区基础教学大楼B302为我院师生带来了一场精彩的学术报告,报告的主题为“模型大推理的进化:从DeepSeek说起”。
庄越挺教授是国家杰出青年基金获得者,973项目首席科学家,“百千万人才工程”国家级人选,国务院计算机学科评议组专家,享受国家政府特殊津贴,中国人工智能学会会士,中国图像图形学学会会士,浙江省特级专家。现任浙江大学学术委员会副主任,中国人工智能学会副理事长,浙江大学求是特聘教授,教育部人工智能协同创新中心主任,数字图书馆教育部工程研究中心主任,浙江省计算机学会理事长。曾任浙江大学计算机学院院长,浙江大学人工智能研究所所长,中国图像图形学学会副理事长。主要从事人工智能、大数据智能处理、多媒体信息检索、跨媒体计算理论等领域的研究。作为第一完成人,曾获国家科技进步奖二等奖、浙江省科技进步奖一等奖等多项奖励。
DeepSeek-R1为代表的大语言模型(LLM)带来了数学、编程等推理能力上令人惊叹的提升,并被冠以“推理大模型”之称。语言模型的基本原理很简单,其本质仅仅是“下一个单词的预测”,ChatGPT为代表的AIGC的成功,标志着LLM在对话类的语言生成方面进入了实用化,但其推理能力之弱一直被人诟病。然而短短的2年时间来,DeepSeek-R1为代表的LLM的推理能力得到了极大提升,LLM甚至吸引了数学家们所使用。这种进化究竟是如何发生的?本报告对这一问题进行了深入探索,庄越挺教授也分享了近期的一些思考。
报告结束后,庄越挺教授与在场师生进行了深入的学术交流,并对提出的问题结合实例进行了详细解答,现场学术气氛浓厚,我院师生受益匪浅。
(记者团:张书宇)
计算机学院(软件学院、智能科学与技术学院)
2025年5月17日