新智元报道
编辑:编辑部
辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留言,直接把它评为国内家长最想要的 AI!
前几天,微博热搜上的这个话题,可以说是让家长们哭笑不得。
既然补习老师不靠谱,那亲自上阵辅导孩子写作业呢?
让清北毕业的爸爸都崩溃的这个难题,恐怕没有这么简单。毕竟,自己会做一道题和能把孩子教会,是完全不同的两件事。
好在,最近一个忽然爆火的神秘国产大模型,或许能解决这个难题!
在评论区,家长们纷纷直呼「好想要」,直接把它评为国内家长最想要的 AI。
无数家长疯狂冲进留言区,发出呐喊:赶快让我从给孩子辅导作业的噩梦中解脱出来吧!
苏格拉底式启发学
给孩子辅导作业,是不少家长最难渡的「劫」。
因为给孩子辅导作业崩溃大哭的娃爸娃妈,时不时就上了微博热搜。
每晚都和孩子斗智斗勇,不写作业母慈子孝,一写作业鸡飞狗跳。
刚刚教会的题,换个题型立马又不会了?让无数家长开始怀疑人生。
都说科技改变教育,真的有产品可以为中国家长分忧么?
今天,这位爸爸就带着女儿小美,来亲测了一番。
平时,每天给女儿检查作业,是这位爸爸的例行功课。但是今天,这项重任,就被交给 AI 了!
第一步,小美的作业,被平板拍了下来。
AI 看完小美的作业,开始总结这些习题的要点——重点练习了商是两位数的除法,和含余数除法,考察了各部分之间关系的知识点。
那么,小美完成得怎么样呢?
AI 是这样「判卷」的:填空和计算题,你完成得很好。不过,在应用题中,AI 发现了一处有点问题,希望小美能自己检查一下,然后告诉它是哪道题错了。
小美检查了一会儿,实在发现不了错在哪里。最终,父女二人选择求助 AI:「小美没有发现她应用题的错误,请你给她做一下分析,但不要直接告诉她答案。最好是能让她下次避免这类的错误。」
这个要求,细看其实并不简单,AI 能完成吗?
AI 说道「没关系」,然后在屏幕上放大了小美做错的题目。小美看到时有些惊讶,实在想不出自己到底错在哪了。
AI 开始循循善诱,从小美和爸爸妈妈一起逛超市的日常生活案例讲起:这是一个常见的「买赠优惠」问题,如果要用数学方法解决,就是这样的——
第一步,酸奶 12 元一盒,买 3 盒送 1 盒,因此,可以把 4 盒看做 1 份,而且 1 份只需要付 3 盒的钱。说到这里,AI 对小美发出提问:买 1 份需要多少钱呢?
小美回答:36 元。
AI 表扬说,你计算得很准确,然后接着引导说:我们用妈妈带的 120 元,除以每 1 份酸奶的价格,得到的商是几,就可以买几份这样的酸奶了。
在 AI 的引导下,小美提出了这个除法运算的答案——3 份余 12 元。AI 继续提问,每份有 4 盒,一共有几盒?
小美顺利地给出了正确答案:一共有 12+1=13 盒。
AI 称赞说「你真是个数学小能手」,并且总结了这类除法题的「黄金规律」:类似买几赠几的问题,可以把买的数量和赠的数量看作 1 份,而 1 份数量相加时,一定记得加括号,再乘以份数。
小美点头表示理解,爸爸也在旁边巩固了这个计算中的要点:下次面对 1 份的时候,一定要记得加括号。
而看完全程的家长们,除了称赞 AI 引导孩子时循循善诱的耐心态度外,更是盛赞这个 AI 实在情绪稳定,应该能挽救不少因为给娃讲题崩溃的暴躁家长。
值得一提的是,上面这段猿辅导大模型场景内测,已经达到了国内顶级的 AI 教育水平。
视频一经放出,立刻引得家长激动地奔走相告,在各个群里引发强烈反响,
所以,垂直的教育大模型究竟比一般的通用大模型强在哪里?
小编决定来一番实测,把小美的解题过程,发给当今最强的多模态大模型 GPT-4o 试试。
GPT-4o 的回答,乍一看是没问题的,它的答案和看云大模型的一样:只有酸奶促销这道题算错了,其他都正确。
但仔细对了一遍后,小编发现了不少翻车之处。
比如,第 3 题的识别,显然是有问题的。
不过,既然这次比拼的是互动启发式问答能力,GPT-4o 的这个疏漏我们暂且按下不表。
我们也像视频中一样,向 GPT-4o 发问,让它帮忙分析一下,但不要直接告诉答案,而且最好帮忙在下次避免这样的错误。
GPT-4o 给出的解析过程,直接一下子就把整个的过程写了出来,并没有和小编通过一次次的对话来完成交互。
小编再次强调,希望 GPT-4o 能进行循循善诱的引导,每次只引导一步。
可以看出,GPT-4o 已经在尽力满足我们的要求了,但整体的感觉,仍然是传统教育中老师或家长的主导式讲解。
如果学生本身对于题目概念理解得很模糊,这样一股脑式的灌输,并不能让学生对于自己理解的薄弱点产生醍醐灌顶的理解。
而小编从这番亲身尝试中,也细致入微地体验到了教育大模型和一般通用大模型的能力差异。
在实际使用中,大模型的输出往往给人「听君一席话如听一席话」的感觉。但猿辅导大模型的启发式互动,真正实践了传说中的「苏格拉底提问法」。
去年,冲上微博热榜的一个话题「0.999 无限循环和 1 到底哪个大」,竟难倒一大片家长。
主打「智能学习」的海豚 AI 学,会给出怎样的答案呢?小编立马来了一波实测。
在输入问题后,AI 并没有直接给出答案,而是让小编在两种解决方式先做选择。
一是,通过提问,引导我独立解决;二是直接告诉我答案。
不如,这两种方式都看看,AI 就这道题的辅导有何不同?
首先是,直接告诉我答案。
原本,还以为 AI 立刻简明扼要地给出答案,但它还是先进行了题目、以及解决步骤的分析。
如下所示,它给出了 4 个解决步骤,而且点击「步骤区域」,即可对「该步骤」进行追问。
就以第 2 步为例,在没有理解的前提下,AI 便开启了「苏格拉底式」的提问法。
它会首先询问 0.111... 和1/9 的关系,以确定小编是否真的理解这一步。
不过,当我说「没有关系」时,AI 便开始耐心地讲解,帮助小编去探寻 0.111... 和1/9 的关系。
值得一提的是,当最终理解答对的时候,AI 甚至会给出语言激励——太棒了,让小编更有动力去完成接下来的问题。
那么,选择「通过提问引导,我独立解决」又有何不同呢?
通过如下的解题过程,让小编深深地感受到「引导」这一词,真正的含义。
AI 通过不断提问,启发引导,一步一步去破解这个难题。
在海豚 AI 学里,除了可以直接问「小白」外,还可以和经过深度训练的「爱因斯坦」、「高斯」、「鲁迅」等大佬对话。
接下来,是由小编本色出演的一个不爱学习的学生。
可以看到,即便面如此没有兴趣的孩子,「超时空对话」里的 AI 高斯依然会非常耐心地讲解,并在最后给出一个富有启发性地提问。
背后大模型
在猿辅导看来,LLM 才是教育未来发展的最大的变量。
半个月前,北京网信办最新公布了一批已完成备案的大模型。其中,猿辅导旗下的看云大模型(简称猿辅导大模型)正式通过了大模型备案。
它并不是一款产品,而是技术底座。
在 LLM 增速放缓的当下,如何去弥合技术和场景需求之间的鸿沟,成为至关重要的一个因素。
而做大模型应用最困难的是,找到一个对用户有价值,且 LLM 可以实现的场景。
凭借 12 年积累的庞大学习数据优势,猿辅导由此打造出了这款专注与教育领域的垂类教育大模型。
据介绍,猿辅导大模型参数有 700 亿,在 10 亿道题目上完成了训练。
与通用大模型不同的是,教育的生长是不可逆的,猿辅导不会允许科技 AI 产品一本正经的胡说八道。
何谓真正的教育?
这里就再次提到了苏格拉底式提问。这种以苏格拉底命名的教育方法,侧重于向学生提出问题,来发现答案。
这种有纪律的提问形式,可以在多个方向上启发思考,比如探索复杂的想法、了解事物的真相、提出问题、揭示假设、分析概念,区分我们所知的和我们所不知的,遵循思想的逻辑结果等等。
比如,想让学生理清思维,探究思维根源,可以问「你为什么这么说?」、「你能进一步解释一下吗?」 ;挑战学生的假设,可以问「情况总是如此吗?」、「你为什么认为这个假设在这里成立?」
在传统的「教与学场景」中,我们太习惯于老师、父母主导式讲解、学生被动式学习的模式。
而恰恰是垂直的教育大模型,能打破这种几千年传统的被动式学习。
在这个过程中,不仅重塑了父母、老师和孩子的交互,让孩子习惯探究式引导学习的模式,拥有一个属于自己的 AI 伴学老师。
而且,通过孩子过往学习过程的分析和提问,垂直教育大模型还能建立一个学习者大数据库,开启真正的个性化学习时代。
上文中「飞象星球」教小美除法的视频,就为我们形象地展示了,如何通过互动启发式问答,引导小美一步步地洞察到背后的知识点,搭建起底层能力,通过自己的思考,真正学习「一道题是怎样做出来的」。
从此每一个学生都可以拥有属于自己的 AI 伴学老师,随时可用。而且,猿辅导大模型也将真正推动教育平权。
经过了团队的长期关注、认知、不断验证,这种数据优势隐藏着产品交互背后,提供了服务和支持。
可以说,正是大模型这个变量,给了猿辅导一次重塑教育产品的机会。
搞教育的猿辅导,内核全是 AI
在 AI 教育领域,从不缺重量级玩家。
那么,为什么猿辅导可以在这个领域不断推陈出新,收获孩子家长们好评与认可?
其实,这背后离不开研发团队的创新和投入,以及多年来的经验积累。
早在 2012 年成立之初,猿辅导开始投入大量资源去做「猿题库」,并希望能用科技改变教育。
也就是从一开始,他们便设定了实现「自适应学习」的目标,并推出了首款线上教育产品。
其中,针对一个「推题」的功能,猿辅导曾尝试利用现有研究成果,比如项目反应理论等与教育质量相关的技术去实现,却发现在实际应用中的效果并不明显。
后来,他们通过不断实践发现,利用深度学习优化「推题」算法,可能会实现更好的效果。
CTO 杨元祖曾在采访中表示,「猿辅导技术发展的时间节点有很多,最关键的节点是,做出了一个决策而非产品」。
而这个决策需要团队不断去探索,然后开始筹备团队,在 2014 年成立了首个 AI Lab。
GPT-4 发布之后,猿辅导决定去自研 LLM。由此,才有了现在的 AI 场景测试。
旗下大模型已经形成多种参数规模和形态的模型矩阵,具备学情分析、作文辅导、阅读对话、计算解题等十几种核心教育能力。
除了以上提到的飞象星球、海豚 AI 学、猿辅导素养课,整个集团旗下,LLM 还在斑马 App、小猿学练机等教育类软硬件产品实现全面落地。
而下一步,猿辅导希望补齐教育大模型最后一块「拼图」——自研多模态大模型。
我们已经看到了,多模态 GPT-4o 在教育应用中的强大力量。发布当天,可汗学院的创始人父子,演示了 GPT-4o 如何像真人老师一步一步启发、鼓励,帮助男孩完成数学题。
几天前,OpenAI 还发布了专为大学打造的教育版「ChatGPT Edu」,也得到了 GTP-4o 的加持。
足见,多模态模型对教育领域的重要性远超其他领域。CTO 杨元祖也表示,猿辅导对多模态的期待和投入非常大。
不得不承认,教育领域的大模型,还处于发展的早期阶段,未来还有很长的一段路要走。这次的演示,也只是在测试阶段。他们还将继续探索在不同场景中的落地应用。
科技是否真的能改变中国 2000 多年的教育方式,或许还会面对更巨大的挑战。