全球聚焦：李开复：要允许大模型一本正经地“胡说八道”

来源：济南时报 2023-05-31 06:28:44

在5月28日举行的2023中关村论坛上，创新工场董事长兼首席执行官李开复发表了主题为“AI1.0到AI2.0的新机遇”的演讲。他表示，在所有APP里面，AI first（人工智能优先）将是最重要的应用，过去，移动互联网是Mobile first（移动优先），今天要在人工智能领域创业或投资，那一定要做非有人工智能不可的APP。

“大模型真的不只是一个问答引擎，它改变了所有APP的生态，它会让我们今天用的每一个生态通通改写一次”，李开复坦言，要允许今天的大模型一本正经地“胡说八道”，如果把它胡说八道的能力全部降至零，它也就不具备推理能力了。李开复认为，一直以来都是人类学习计算机的语言，大模型时代将是计算机学习人类的语言。未来，用户只需要向AI描述目的就会达到期待。

李开复还就“大模型公司太多”“只有头部公司才有机会”等论调谈了自己的看法，他指出，国内外的文化习惯、法律法规都不一样，拿海外训练出来的大模型在国内做微调是非常危险的，在大模型领域，大家都还有机会，应该鼓励各种不同的模式去探索。

(资料图片)

以下为李开复在“人工智能大模型发展论坛”的演讲内容，经新黄河记者整理：

近年来，看到整个AI2.0和大模型的启动，创新工厂的投资团队、科技团队都在研究这个领域,为此也到美国去了解一些新态势。今天我介绍的不是创新工场投资的公司或者业务，而是对于最近关于AI2.0和大模型做一个比较通俗的分享，希望对大家有帮助。

AI1.0时代每个应用都是一个孤岛

AI 1.0是AlphaGo（阿尔法围棋）之后发生的深度学习，也就是在八九年前开始，进入各行各业，这是我们都熟悉的。到一两年前碰到了一些瓶颈，而这些瓶颈，正好是AI2.0和大模型能够解决的。AI1.0遇到的瓶颈是什么呢？当时还没有大模型，我们要做一个领域的AI应用,要到该领域去收集、清洗、标注数据，再拿去调整模型，这个过程成本是非常昂贵的，对于互联网巨头来说没有问题，因为他们收集的数据实在太多，用来赚钱的机会也很多，但是如果一家工厂想让AI应用落地，就会面临着非常昂贵的成本。

大模型是人类智慧的累积，有一个很大的特点，就是我们可以一次性训练一个大模型，当要应用的时候可以做一个迁移学习或者微调，也就是说之前AI1.0时代，每个应用都是一个孤岛，有大模型之后，用海量的数据一次性训练一个基础大模型，那么再以这个模型作为基础去做微调，就具备非常大的威力。比如，像音响类似的产品，过去跟它讲话的时候，一旦跳出了它懂的领域就蒙了，做不了很多事情。当放一个类似ChatGPT的东西进去，它的知识就会被激活，只要调整对话，它就会成为一个非常好用的机器人，如果需要它在另外的领域完成其他事情，我们可以把这个大模型再微调，使其进入对应的应用场景。

有些领域可以容忍大模型的不完美

今天的大模型还会一本正经地“胡说八道”，这个问题非常难解决，因为它的推理能力，也来自于同样的理由。如果把它的胡说八道全部降到了接近零，那它的推理能力几乎也没有了，所以那些让它聪明的理由也是让它胡说八道的理由，但是我们未来还是可以解决的。

我们要先接受大模型是非完美的、会胡说八道的，即便一个非完美的大模型还是有相当大的商业价值。例如，不管记者用AI来写作，或者律师用AI来写诉讼，最后负责的还是人类，律师或者记者会很清晰地知道AI可能会犯错，我们不是把它拿来做一个终极的应用。在娱乐领域的应用，是可以允许AI犯一些错误，比如游戏里面的英雄胡子长了一点短了一点，这都无伤大雅。此外，还有很多领域是可以容忍大模型的不完美，基于这个事实，今天大模型的商机已经存在。

当然我们还要继续努力，让它降低胡说八道的习惯。比如，从预训练的数据到训练对齐，再到之后的后处理，还有一些预警和快速修正的方法，这些需要结合在一起，提高大模型的处理能力。需要重视的是，有些领域是非常关键和严肃的，比如说新闻、政府网站、医疗、教育，这些就不容易做，未来需要化解这些问题。

AI大模型能带来应用的爆发

大模型的价值绝对不只是有一个很聪明的AI引擎，而是能带来应用的爆发。

用AI写稿子、写诉讼、画图、抠图等都是应用层的，还存在一个中间层，中间层包括两部分，第一个部分是从模型里面往外提供功能，比如说模型做得很大，针对某一个领域，能否把一个大模型变成一个小模型，这是从模型往上的。另一个部分是从应用往下的，用大模型做的很多产品需要去中间化。比如，过去由平面设计师来设计图，以后市场总监用语言就能直接把图做出来。当然这个过程不是一天两天能实现的，但长期来看，相对重复性的工作是可以被技术取代的，同时会产生非常大的经济价值，这样的情况之下才能让应用的数量变多，形成应用带来更多用户，用户带来更多应用的良性循环。

AI.2.0平台和应用将颠覆许多行业。简单举个例子，比如制造游戏的时候，所有角色、背景、道具、衣服、故事的产生，甚至所有的代码最终都会用AI来写。很可能以后一些小朋友会把他想玩的游戏写出来，大家彼此用文字做一个游戏介绍，几秒钟以后就可以玩了，这跟今天的游戏制作就有巨大的差别。所以，大模型真的不只是一个问答引擎，它改变了所有APP的生态，它会让我们今天用的每一个生态通通改写一次。

从Mobile first到AI first

在所有的应用里面AI first（人工智能优先）将是最重要的应用，什么叫AI first？就是说这个应用没有AI就不成立。过去移动互联网是Mobile first（移动优先），比如，在PC时代打车软件滴滴是没有用的，因为你随时可能在不同的地方，当年如果要选择在移动互联网创业或者投资，那一定要选那些非有移动不可的APP，所以今天要在人工智能领域创业或投资，那一定要做非有人工智能不可的APP。简单地说，当我们把大模型抽掉，这个应用就完全瘫痪，那这个应用就特别需要做而且应该做。当然，这个过程中，我们还有很多的挑战，需要监管和技术同时发挥作用去解决。

最近有几个比较大的声音，如“使用海外的开源大模型就可以做出中国版的openAI”“大模型耗钱且耗人，只有巨头才有入场券”“大模型公司太多了”“不用开发大模型，开发小模型就够用了”等说法。

开源是非常非常重要的，高校和创业者没有开源很难得到启动力量，但“使用海外的开源大模型就可以做出中国版的openAI”的说法是绝对错误的。开源模型本身有一定局限性，如果直接使用海外的开源大模型，你的天花板决定了永远做不出达到或者超越ChatGPT4.0。很多人做开源大模型训练的时候用ChatGPT4.0来训练，真的不敢保证ChatGPT4.0会让人人都能拿去使用，从商业的角度也没有理由让你占这个便宜，再就是它对有些国家可能也会限制。拿海外训练出来的大模型，在国内来做微调是非常危险的，国内外的文化习惯、法律法规都不一样，每个国家处理方法都不一样，自主创新做大模型是有必要的。

当然，未来不可能有50家大模型公司存在，会收敛到一个小的数字上。比如，美国的搜索引擎，刚开始的时候有十来家，最后变成五六家。不过，在大模型这个领域，大家都还有机会，我们还在追赶，应该鼓励各种不同的模式去做。

中国公司急需赶超全球一线公司

大语言模型分三步演进，第一步是中等规模的大型语言模型，第二步是跨越“涌现”（备注：涌现在大模型领域指的是当模型突破某个规模时性能显著提升）门槛，成为主流大型语言模型，第三步是领先的大型语言模型。目前ChatGPT和谷歌的大语言模型PaLM处于第三阶段。中国有些公司当然有野心，也可能自认为接近了，但是我觉得主要还是在一个比较中等规模的水平，基本可以工作，但是它可能“涌现”不一定特别强大。这不是说中国公司做得不好，而是起步时间较短，再就是中文的数据质量还不足够。

大模型训练质量跟数量都重要，但是相比来说质量是不可牺牲的。我觉得有国家力量来推动收集更多更高质量的数据非常重要，要不然的话追赶会比较难。中国这个阶段的经济发展，并没有足够多的人为了公益来把很多好的内容汇集起来，中美以后的差距可能就体现在数据上面。

多年来，人类需要学习计算机的语言，现在倒过来，计算机学习人类的语言，这会大大把人类解放出来。我们只要把想要做一件事情的目的告诉未来的AI，它就会帮我们完成，不用告诉它如何一步一步去解决。比如我跟未来的智能助手说，明天是我太太的生日，需要鲜花、蛋糕、礼物，它就通通帮我搞定，这就节省大量的时间，现在还没有这样的智能助手，我可能要花几个小时搜索，再逐个下单。

未来最伟大的应用是必须要有AI大模型，拿掉大模型它就不工作。大模型就是委派式的，用户描述目的就可以达到期望，当然要解决隐私的问题，不能把我们每一个要求都传到云端。最终这天到来的时候，商业模式也会发生变化，当我跟AI说帮我买蛋糕、鲜花、礼物的时候，它会直接把电商当做仓库一样地去帮我搭配。当然，这方面的应用可能还比较长远，需要学术界跟产业的合作。

AI大模型是中国绝对不能错过的历史机遇，这是有史以来最大的一个平台革命。它会让每个应用都改写，重构人类的工作，让我们的聪明才智被放大10倍或更多。在人才方面，可能顶级的一些人才还在美国，但中国有非常巨大的人才优势，数量非常多，而且很多年轻的科学家都非常厉害。

最后我想提一句话，来自硅谷顶级投资人对这个领域的预测：这个市场的潜在规模难以把握 ——它将介于所有软件和所有人类的努力之间。

新黄河记者：王立奎整理报道

编辑：常萌