12 日,Microsoft 发布了一个新的大型语言模型,计划为 Excel、谷歌 Sheets 等电子表格应用程序开发全新的 AI 大语言模型--SpreadsheetLLM。
Microsoft 在论文指出,SpreadsheetLLM 作为一款全新的 AI 模型,将广泛使用于理解并处理复杂的电子表格数据。
SpreadsheetLLM 具有改变电子表格数据管理和分析的潜力,为更智能和高效的用户交互铺平了道路。
这或许会让会计师和数据分析师们对他们的未来工作前景感到担忧。网友们在社交平台X上调侃,认为“凯伦的工作很快就会被人工智能取代”。
“凯伦可能很快就会失业”
研究人员指出,当前的电子表格应用程序功能丰富,在布局和格式方面为用户提供了大量选择,这使得传统的 AI 大语言模型难以在电子表格处理方面发挥作用。而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型。
微软还开发了 SheetCompressor(压缩电子表格)工具,以帮助 SpreadsheetLLM 更好地理解和处理电子表格数据。
研究人员称,SpreadsheetLLM 的潜在应用非常广泛,从自动执行日常数据分析任务,到提供基于电子表格数据的智能见解和建议。例如,SpreadsheetLLM 可用于自动生成财务报告、识别数据中的异常或趋势、为客户提供个性化的产品或服务推荐等。
因此,SpreadsheetLLM 有可能彻底改变企业处理数据的方式。
一位用户声称:“正如我们所知,能够编写 SQL 的 LLM 将扼杀整个数据工程行业。”
另一位写道,“SaaS 陷入了深深的麻烦。”
“这对金融界来说将产生巨大影响”
宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克(Ethan Mollick)在推特上写道:“这再次表明 LLM 很快就能处理结构化和非结构化电子表格数据。这将解锁许多用例(预测、财务、估值等),并且拥有电子表格真实来源往往会减少幻觉。”
SpreadsheetLLM 如何工作?
SpreadsheetLLM 通过将电子表格数据编码为大型语言模型(LLM)可以理解的格式,从而使 LLM 能够对电子表格数据进行推理、回答有关数据的问题,甚至根据自然语言提示生成新的电子表格。
SpreadsheetLLM 的核心是“SheetCompressor”框架,该框架可以有效地压缩和编码电子表格数据,使其更易于 LLM 处理。SheetCompressor 由三个模块组成:
- 基于结构锚点的压缩:在整个电子表格中放置“结构锚点”,以帮助 LLM 理解数据结构。
- 逆索引翻译:将电子表格转换为更紧凑的格式,并消除冗余数据。
- 数据格式感知聚合:根据数字格式和数据类型对相邻单元格进行分组。
SHEETCOMPRESSOR 框架的插图(图片:Microsoft)
Microsoft 称,SpreadsheetLLM 显着提高了电子表格检测任务的性能,在 GPT4 的上下文学习设置中比普通方法高出 25.6%,使用词元(token)的成本降低了 96%,并能提供更好的处理结果。
目前,Microsoft 还没有公布何时向公众发布 SpreadsheetLLM 的消息。该论文指出,该模型仍有一些限制,如对于复杂或结构化程度高的数据,其理解能力仍然有限;SheetCompressor 目前还不能压缩包含自然语言的单元格等等。