对话周鸿祎:做大模型是一场持久战

  周鸿祎从不掩饰对大模型发展前景的看好。自称 GPT 布道士的他,自 ChatGPT 爆发起就金句频出。

  在他看来,ChatGPT 代表了人工智能的一个重要里程碑,是通用人工智能的奇点,也是强人工智能到来的拐点。

  4 月,周鸿祎发布内部公开信,要求 360 全面拥抱 AI,并给所有产品经理留下作业。后 360 智脑加持的浏览器和搜索产品开放内测。5 月,他现场演示两款大模型产品,“360 智脑”以及 AI 生图工具“360 鸿图”。月底,360 又推出 360 智脑·视觉大模型及多款 AI 硬件新品。

  以上还只是开始。周鸿祎称:“360 做大模型已经准备好打一场持久战。”

  360 未来的整体布局是怎样的?做搜索的他又如何看待大模型将取代传统搜索的论调?安全问题未来又将如何应对?网易科技与周鸿祎进行了深入交流。

  “场景成熟一个开放一个”

  谈布局:360 的两件事和四个场景

  “360 就做好两件事。”谈到 360 的整体布局,周鸿祎用两点来概括。一是围绕数字化战略,与时俱进,夯实数字化的安全底座。解决网络安全的同时,也要解决数据安全和人工智能安全。

  二是把大模型的核心技术牢牢抓在自己手里。周鸿祎将具体战略形容为“两翼齐飞”。一方面加紧核心算法自研,造自己的“发动机”,另一方面尽快推出相关产品,抢占用户场景。

  “这是一场工业革命级的变革,谁不掌握大模型的核心技术,谁没有大模型的实际场景的实际的使用,谁就会被行业淘汰掉,基本上所有的业务都会被重塑。”周鸿祎这样描述大模型技术带来的颠覆性改变。

  采访中,他多次强调场景的重要性,“没有场景的大模型是没有生命力的。”并提出四个场景设想。

  第一,面对中小企业,根据其碎片化场景需求,提供各种工具。第二,合作黑马,共同打造行业 GPT。第三,探索将大模型提供给政府和企业。第四,将大模型应用于智能硬件。

  他指出,“我们内部叫 All In 大模型”,据悉,360 的智能硬件部门正在探索如何将大模型应用于智能硬件。

  “大模型并不能替代搜索”

  谈幻觉:既是优点也是缺点

  在大模型展现惊人创造力的同时,人们也观察到,大模型时常存在“幻觉”,即生成的内容不基于任何现实世界的数据,而是大模型自己想象。也就是大家通常所说的“胡说八道”。

  周鸿祎曾公开谈论,认为这种“胡说八道”正是大模型“智能”的展现。

  “不可否认,ChatGPT 并不完美。比如它经常一本正经地‘胡说八道’,给出的答案可能张冠李戴。但我认为这些都是瑕不掩瑜,通过增加训练和用户反馈都可以解决。ChatGPT 不是搜索,搜索的目标是搜出精准的资料不出错。ChatGPT 也不是简单的输出,它是基于学习到的知识,利用推理的能力来组织问题的答案。从这个角度来讲,ChatGPT 的‘胡言乱语’恰恰体现了它的智能。拥有想象力、可以无中生有地‘编故事’,正是智人区别于猿人和其他动物的重要标志。”

  但同时他也认为,大模型存在的这种知识模糊如果是用来娱乐应用,脑洞大开地写一些东西,则无伤大雅。但如果是用在诸如法律、教育、医疗,或者公司的事务性工作里边,知识模糊就会变得很严重。

  正因如此,做搜索出身的周鸿祎,对于大模型取代搜索持否认态度。

  他强调:“解决知识模糊的一个重要工具就是搜索引擎,所以我们现在在把搜索引擎变成一个知识库,当涉及到知识准确性问题的时候就可以通过搜索来把对它的答案进行验证和校正。包括搜索还可以同时解决一个时效性的问题,因为大模型训练总有一个训练的截止日期,过了这个截止日期就没法再训练进去。所以,大语言模型并不能替代搜索,它的搜索其实是相对增强。”

  “不会只有一个大模型”

  谈安全:不发展是最大的不安全

  为什么要做自己的大模型?周鸿祎直言不讳。

  “第一,不发展是最大的不安全。AI 是一场工业革命,我们不能因为它有一些安全的问题就因噎废食。第二,如果不去做大模型的研发,不了解,你只是把它当一个黑盒子,当一个不懂的东西,你怎么去解决它?所以,在一边做的过程中,我们既有研发团队在做,同时我们的安全能力也在了解它的原理和整个完整的过程,在这个过程中,可能我们能够提出更好的安全方案。”

  他也不否认国内与国外之间的差距。

  “目前国内可能跟 GPT-4 真正的差距,我觉得主要是在所谓的超强的涌现能力方面。这个差距不是算法的差距,也不是模型的差距,是预训练数据和训练方法,我们有一些坑没有踩完。”

  他预言,未来中国不会只有一个大模型。“从国际上的一个趋势来看,不会只有一个在云端的大模型,将来会有不同 level 的大模型,有的模型部署在电脑上,有的模型部署在手机上,还有一些模型规模不一定很大,不一定到千亿,千亿的成本很高,可以是几百亿,或者百亿级用在行业上。”

  他认为未来很有可能会出现一个大模型,带着多个小规模的大模型的局面。因为一个大模想要在各方面的能力都训练得很强,这需要时间和成本。然而在专业领域,大模型需要的并不是无关的技能,而是足够专业的领域知识和理解能力。

  最后,他强调场景的作用。“大模型还是要找各种场景,我们说跟各个场景结合,跟软件,跟浏览器,跟搜索,微软是跟全家桶都发生了关系,全家桶都改造了一遍。”

  而这,正是周鸿祎正在做的事情。(袁宁)