国内首个48小时大模型极限挑战赛落幕,四位“天才程序员”共同夺冠

  4 月 21 日晚,第四届 ATEC 科技精英赛(ATEC2023)线下赛落幕。本届赛事以大模型为技术基座,围绕“科技助老”命题,是国内首个基于真实场景的大模型全链路应用竞赛。ATEC2023 线下赛采用 48 小时极限挑战的形式,来自东南大学、哈尔滨工业大学、华中科技大学的 4 名选手夺冠并捧走 100 万元奖金。赛事赛题的全程解读及代码展示,将在国内首档程序员科技节目《燃烧吧!天才程序员4》中播出。

国内首个 48 小时大模型极限挑战赛落幕,四位“天才程序员”共同夺冠
 

  本届 ATEC 科技精英赛(ATEC2023)由中国电子学会主办,ATEC 前沿科技探索社区承办,清华大学等 17 所高校参与,清华大学与蚂蚁集团共同命题。

  经过三个月层层海选,从 1901 支报名队伍 3000 余位选手中脱颖而出的 16 位选手,在 48 小时内,依托大模型技术,在支付宝智能助手等真实业务场景中,极限破解老年人异地就医所遇到的一系列现实问题。

  “大模型+贴近工业真实”,这两大亮点让本届赛事报名人数及 985、211 高校占比都创下历史新高。本次竞赛的核心挑战,是解决工业真实场景中,大模型训练过程及落地应用亟需解决的三个核心问题:可用性、安全性、高效能。

  赛题出题人之一、蚂蚁集团基础智能部技术总监张志强告诉记者,赛题围绕这三个核心问题来出题,考验选手们的破解思路和能力,比如让模型学会检索文档并总结文档内容做出精确回答、让模型学会收集用户需求并调用工具解决实际问题;在模型推理阶段,掌握好模型效果和推理速度的平衡,以让模型能为生产之用;在追求模型效果和迭代效率的同时,也追求模型线上推理速度,以让计算成本可控。

  值得一提的是,这届赛事以大模型为技术基座,以贴近工业真实的业务场景做命题,折射了以蚂蚁为代表的国内互联网企业加速发展 AI 及 AI 落地应用的趋势。譬如,本届赛事命题中涉及的蚂蚁大模型医疗场景,今年年初在权威全球医疗评测榜单 PubMedQA 中,就以最小的模型参数,取得了准确度位居第五的成绩,排在 GPT-4 之前。

  “选手们面临的都是来自真实应用的挑战,在大模型了转向大规模落地应用的当下,ATEC 是技术青年们很好的练兵场。”ATEC2023 评审委员会主席、西安交通大学教授沈超教授强调,“给代码赋予意义、让技术造福社会,关注科技助老等价值命题,是大赛组委会的初心。