上海首个政务服务大模型在徐汇上线,真人窗口会被AI取代吗?

  摘要:人类不要纠结于是否会被取代,而是要将人工智能为自己解放出来的时间和精力,用在更高阶的地方。

  “我要开公司,有哪些流程?”“设立企业对注册资本有要求吗?”“我的公司股东有一家是法人单位,怎么做实名?”徐汇行政服务中心一楼法人事项综合受理大厅,18 个综合窗口的受理人员几乎每天都会多次重复回答上述问题。

  而眼下,经过 3 个多月的模型训练及调优,基于通义政务大模型技术和徐汇区智能算力平台而研发的“徐汇区政务服务大模型”正式上线。这也是上海首个政务服务垂类大模型应用。

  聚焦政务服务全生命周期的咨询业务,徐汇政务大模型汇聚了 39 个涉企事项数据集、超过 500 个体系化知识点和 2300 多条高频咨询语料,在政务服务办理流程、申请材料、办事要素、特殊情况处理等涉企服务场景,能实现 10 轮以上的自然语言咨询能力,对于高频事项的咨询准确率超过 90%。

  面对越来越“聪明”的大模型,政务服务的一线窗口人员怎么看?大模型,会取代人类吗?

  徐汇政务服务大模型 pad 端

  “十八罗汉”的帮手

  “公司的法定代表人有违法行为,如何变更法人?”当刘蕾在对话框输入这条问题时,她决定试着用更口语化的方式向大模型发问:“公司法人坐过牢,怎么办?”

  刘蕾是徐汇区行政服务中心法人事项综合受理大厅(A厅)的一名综窗工作人员,每天和同事们负责大厅 18 个综合办理窗口的咨询受理工作,因而被称为“十八罗汉”。自 2018 年徐汇在沪首创“零差别”受理综合窗口以来,每位“十八罗汉”都通晓 1000 余项法人事务“一窗综办”事项。

  既然有业务精湛的窗口人员,为何还要专门研发政务大模型?徐汇区大数据局副局长胡炳介绍介绍,徐汇累积的数字化基础,新公司法带来的办件量增长,还有不断涌现的新产业、新赛道,都推动着徐汇区在海量政务信息中梳理、锻造出具有行业针对性的政务垂类大模型。

  徐汇行政服务中心法人事项综合受理大厅

  “一方面,综窗开设 6 年来,1000 多项事项情形的办理数据均数字化留档,形成了数字底座。另一方面,A厅每天办件量约 90% 都围绕企业经营变更,单日办件量创下最高纪录 800 件的那天,约 85% 都是办理这类事项,重复性突出。”徐汇区行政服务中心公共服务科副科长黄炜说,无论是 5 月新出台的食品登记管理条例,还是 7 月 1 日即将实施的新公司法,只要相关法规更新变化,一线窗口人员就要第一时间学习掌握。

  因此,依托当下发展迅速、成熟的大模型技术,来辅助窗口人员提升办事效率和收件准确率,从而减少企业的跑动次数和等待时间,是徐汇花大力气研发政务垂类大模型的初衷。

  去年末,基于徐汇区行政服务中心、区大数据中心和区城运中心“三中心合并”的数字底座贯通优势,徐汇启动了政务大模型的研发。技术支撑来自阿里云团队,从语料梳理、技术部署、服务器等本地化资源配置、实际训练到测试上线,开发周期不到 4 个月。

  最终,经过 30 多轮微调和模型链路优化、2 万多轮对话测试,今年 3 月底,法人事项综合受理大厅最终被确认为首个亮相的政务大模型应用场景。5 月 24 日,业务梳理全部完成,政务服务大模型正式“见习上岗”。

  刘蕾在窗口使用大模型辅助受理业务

  从通用到垂类

  “五一”前夕,刘蕾开始使用测试阶段的徐汇政务服务大模型。起初,她在对话框询问大模型最常见的窗口办理事项,譬如“企业注销如何操作”。但大模型回复得非常宽泛,不是内容关联不上,就是洋洋洒洒把沾边的办理操作都列举一通。

  不过,刘蕾的任务并非只是与大模型“聊天”,而是不断通过进阶式问答,引导大模型最终输出最准确的答案。常见的训练方式是给大模型更具象的关键词,比如,提问时告知大模型是咨询企业“简易注销”还是“普通注销”。“训练几次后,大模型就学会反问是哪一种注销,甚至会主动提问,是注销内资公司还是外资公司,学得非常快。”

  除了窗口工作人员的日常“训练”,数据量的多少也决定了大模型的能力上限。

  去年,徐汇区在全市率先推出“线上政务服务大厅”,随后上线“办件中心”模块。这让徐汇率先拥有了政务服务领域的“问题发现模型”,在对涉及环节超时、多次补正、多次跑动、材料规范等 4 大类 93 万条办件数据进行智能自检后,转化为了可用、可查询的大模型基础数据。

  徐汇区大数据中心积累的“数字底座”涵盖高频业务、法律政策、日常办件数据,使得徐汇政务服务大模型“横空出世”时,基础数据规模就达到 12.31PB。加上徐汇目前可支撑 72B 参数的大语言模型算力,政务大模型的“基建”有了保障。

  “我们将通义大模型技术与徐汇政务服务事项创新结合,通过智能体 Agent 技术、RAG 检索增强生成技术等的综合应用,提升政务服务大模型学习业务知识的能力,以及意图分类与识别、专业问题回答的准确率。”

  徐汇政务服务大模型 PC 端

  阿里云解决方案架构师、徐汇政务服务大模型项目负责人张朋表示,当经历 ChatGPT 带来的直观变革,面对“百模大战”退潮中逐步浮现的行业真相,不少从业者都发现,光把大模型的参数做大并不够,必须将大模型与行业深度结合。

  “徐汇作为上海首个国家级‘互联网+政务服务’示范区,既有厚实的大数据基础,也有一批对数字化高度敏感的窗口受理人员,将新知识、新场景‘教授’给大模型。”张朋说。

  阿里团队在徐汇做了三件事:梳理大模型要学习的知识点;总结法人事项办理综窗的高频问答;在徐汇本地化部署阿里云通义千问 72B 的基础大模型。政务大模型在“动脑筋”时,会同时调动基础知识点、高频问答以及通用大模型这三路,经算法合成为一个回答。

  窗口人员在实际使用中,纠正大模型缺失、使用错误的知识点,补上正确的回答后提交给后台,算法会将上述反馈应用到模型库,大模型自己学习后,再遇到同类问题就能给出更精准的答案。

  高质量语料在何处

  这一过程中,帮助政务服务场景实现“业务智能化”的是阿里云百炼平台,起到了链接行业数据与算力的关键作用。

  “阿里云数字政府团队提供的政务咨询大模型产品,能帮助初上岗的窗口工作人员尽可能地像工作多年的‘老法师’一样心里有底。”黄炜发现,大模型还有意想不到优点:帮助窗口新人快速成长。此前,一名综窗人员从入职到“独立上窗”,至少要4-5 个月的培训周期,资深窗口人员还要牺牲一定的办件时间来手把手“传帮带”新上岗人员。

  “95 后”李子安是首批使用政务大模型的窗口人员。回忆起一年多前自己刚转岗到综窗,大量需要记忆、背诵、理解和掌握的培训内容,让小伙子直言多少有些“痛苦”。例如,股东在有限责任公司和合伙企业中分别称为“股东”和“合伙人”,对待不同性质的企业要随时切换表述。而动辄比砖块还厚的法规条文,即便在窗口能开卷翻阅,仍需要事先记忆大量内容。

  徐汇政务服务大模型 pad 端

  而现在,这些内容都能由大模型辅助提供,窗口人员要做的更多是对问题进行定性、分类与反馈。

  3 月初,李子安第一次与政务大模型进行问答,很快发现对方会“答非所问”。原因恰恰是大模型“什么都知道”,甚至出现了“知识幻觉”——掌握的语料范围太广、语料质量参差不齐,往往会阻碍大模型更加“垂直聚焦”。

  今年全国两会,不少代表委员就提到,全球大模型领域普遍面临数据瓶颈。我国也存在垂直领域公共数据来源少、专业垂类数据稀缺等问题,高质量语料仍有明显缺口。

  “政务服务中心有天然的高质量语料供给。”张朋介绍,徐汇政务服务大模型的基础语料来自公司登记管理条例,还有市场监管领域 39 个业务情形的相应材料规范、拆解规范和填写规范。根据这些场景,再梳理出 200 多个知识点,最终结合窗口累积的高频问题,衍生出近 2400 个细分知识点。

  随着窗口人员日复一日的使用,大模型的学习效果也颇为显著。“一开始问‘股东去蹲局子了股权变更怎么做’,大模型会纠结于口语化的表述,但现在,它已经能理解这个问题本质就是问股权变更,能找到对应的知识点来回答。”李子安说。

  徐汇行政服务中心法人事项综合受理大厅

  培育新质生产力的切口

  眼下,徐汇政务服务大模型已构建“办事人提问-窗口人员转化-大模型详细回复”的应用场景,有效提升了窗口人员翻阅法条、比对具体数字的效率。“真人”窗口人员会被大模型取代吗?

  “未来或许会有 18 个数字人坐在综窗,但目前,大模型尚处在学习进化的过程,人与人面对面交流的温度和效率还不可取代。”黄炜说。“测试时我们尝试催促大模型赶快作答,结果它被问到‘烧干 CPU’宕机。”刘蕾从这个例子发现,人类不要纠结于是否会被取代,而是要将人工智能为自己解放出来的时间和精力,用在更高阶的地方。

  据悉,基于徐汇政务服务大模型的“十八罗汉数字人”正计划推出,相应的模型算法也将推广至徐汇的各街镇和功能区。

  对具备通义大模型开发能力的企业来说,发展行业垂类大模型并非单独一家企业能做到,需要整个行业生态向前推进。目前,国内最大的开源社区阿里云魔搭已落地徐汇滨江。同一区域内,全国首个大模型创新生态社区“模速空间”落成刚满 9 个月已聚集 80 余家大模型企业。

  “中国人工智能产业人才济济,大模型的生态团队也正频繁涌现。”张朋说,当越来越多的基础模型实现开源,就会有更多团队在此之上,聚焦行业开发垂类模型、赋能产业,真正让大模型为人所用,实现培育壮大新质生产力的愿景。