2025年6月15日,第十四届江苏省计算机大会分论坛——“大模型推理与调度系统关键技术论坛”在南京顺利召开。本次论坛由江苏省计算机学会主办,江苏省计算机学会系统结构专业委员会承办,江苏省软件新技术与产业化协同创新中心提供支持。论坛聚焦大模型推理与调度系统的全栈优化关键技术,邀请了5位领域内的专家学者,分享最新研究成果与技术实践。论坛吸引了70余位相关领域的科研人员、工程技术人员和高校师生现场参与,围绕产学研协同创新展开深入交流,对推动江苏省智能化产业升级发挥了积极作用。论坛由江苏省计算机学会系统结构专业委员会常务委员顾荣主持。
在专题报告环节,哈尔滨工业大学(深圳)夏文教授、南方科技大学唐博研究员、天津大学赵来平教授、上海交通大学糜泽羽副教授、南京大学顾荣特聘研究员分别作了题为《面向大模型场景的数据去重压缩研究》《大模型时代的数字基座》《面向英伟达GPU的分离式算子混部技术》《端侧大模型稀疏推理框架PowerInfer》以及《面向大模型推理的高效KV缓存与模型缓存技术》的学术报告。五位专家围绕大模型推理这一实现人工智能技术应用价值的核心环节,深入剖析了当前面临的关键问题与最新技术突破,涵盖数据压缩优化、基础设施构建、异构计算调度、边端推理优化以及缓存机制设计等多个前沿方向。报告内容前沿务实,观点深刻新颖,引发了现场参会者的广泛关注与热烈讨论,现场交流气氛热烈,学术氛围浓厚。
哈尔滨工业大学(深圳)夏文教授作报告
南方科技大学唐博研究员作报告
天津大学赵来平教授作报告
上海交通大学糜泽羽副教授作报告
南京大学顾荣特聘研究员作报告
近年来,随着新一代人工智能技术的迅猛发展,大模型在多个行业领域展现出广阔的应用前景。作为人工智能技术落地的关键环节,模型推理的效率直接关系到其应用的可行性与经济效益。本届学术论坛成功搭建起一个聚焦大模型推理系统前沿技术的高水平学术交流平台,积极促进了省内外高校、科研院所与企事业单位之间的深度交流与协同合作。论坛广泛展示了大模型推理系统领域的最新研究成果与技术趋势,为江苏省智能化基础研究和技术创新注入了新动能,为培育面向未来的智能化新质生产力提供了有力支撑。
|