专访王晓航：大模型需落地千行百业，生态繁荣才能摆脱增长焦虑

洪福气质 2024-01-04 19:13:25 64892 0

蚂蚁集团副总裁、金融大模型负责人王晓航

大模型闯入大众视野一年后，“百模大战”进入下半场，如何落地产业、成为大众高频刚需，已是大模型的重要打磨方向，也成为全球范围内“大模型竞赛”的第二赛点。

今年9月，蚂蚁集团在上海“外滩大会”上发布了自研的蚂蚁金融大模型，展示了从基础大模型到行业大模型以及产业应用的全栈布局。过去一年，蚂蚁摸索大模型在数字金融领域的研发与应用落地，测试基于自研金融大模型的智能理财助理支小宝2.0，以及面向金融产业专家的智能业务助手“支小助”。可以说，在产业落地进展上，蚂蚁金融大模型的一举一动，极具代表性。

近日，蚂蚁集团副总裁、金融大模型负责人王晓航在和媒体访问交流时，就大模型的国内外现状、算法、应用、监管等话题分享了自己的看法。作为蚂蚁金融大模型的负责人，这是王晓航至今最为全面的一次交流分享，也代表了蚂蚁在大模型领域的判断和思考。以下是对话要点：

一、打造超级生态，才能摆脱增长的焦虑

问：如何看待OpenAI增长放缓？

王晓航：从模型能力来讲，共识是模型架构是趋于统一的，所以模型能力的演进是靠数据驱动的。今天比较大的问题是，互联网上公开可得的高质量图文数据基本上已经开始枯竭了。解决路径有两条：

一是模型架构如何优化来对齐多模态数据，包括图文、视频、IoT等一系列多模态数据，打破数据规模、数据质量瓶颈，这是各大AI大模型厂商现在最主要的方向之一。

二是落地，OpenAI正在寻找产业数据合作伙伴，这意味着公开可得的数据、高质量的数据耗尽之后，千行百业专业领域里的高质量私域数据规模，重要性变得和开放数据不相上下。这部分产业数据，怎么像自来水一样源源不断接入到大模型也很关键，这不存在捷径，要跟行业一起努力。

用户增长放缓是事实，早期爆炸式增长不是可持续的。更主要的问题是，AGI作为中心化的常识问答产品，没法成为大众高频刚需。大模型要融入千行百业，让产业从AI化中收获价值，才能成为广泛的刚需，这是下一步的增长空间。整个大模型行业，不应只是一个简单的中心化的超级AI，而是一个千行百业组成的超级生态。所谓超级生态，就是更通用强大的模型、更高效的开发、开发之后集成到各产业中。现在还没有特别成功的产业案例，但可能会在未来一两年发生，这也是行业趋势。

问：谁能够成为OpenAI的真正挑战者？

王晓航：五年前，很少有人预料到OpenAI会成为AI领跑者。所以挑战者有可能是像Llama这样背靠开源生态的开源大项目，像谷歌这样有数据飞轮、有充沛资源的大公司，也有可能是另一个“OpenAI”，也就是专注在算法架构和深度学习领域潜心钻研的创业公司。

问：未来一年，大模型的多模态化预计会演化到什么程度？

王晓航：多模态是现在行业重点方向之一，海量多模态数据之间的理解和对齐技术还会快速进步。高维度数据，不只是图文、视频，还有IoT和物理世界连接的研究也会慢慢浮出水面，也就是传感、控制这些模态的数据也会跟自然语言的语义空间对齐，在AI领域这个技术叫grounding（落地），怎么让语言从抽象的符号到真正连接现实世界，让AI能在所在的环境里感知和行动，然后产生更多新能力，比如自动驾驶能力、机器人能力，真正端到端地解决实际业务问题，我觉得未来一两年会有大突破。

比如自动驾驶，以往是多个模块进行拼接来训练，但现在像特斯拉的自动驾驶主要在研究端到端的训练，把雷达、视频、驾驶数据和传感器的大量车速、刹车控制数据当作序列数据，来学习它们之间的对应和关联，在海量数据中相互映射后更好理解和预测。这些多模态数据之间的对齐已经超过了自然语言能够描述的知识。所以，多模态数据不只是文生图转换，更重要的是如何跟现实世界连接，这在未来会打开另一个新的空间。

问：大语言模型下一步的进化方向是什么，有什么挑战？

王晓航：有三个方向，第一就是刚刚讲的多模态。第二是落地产业，端到端解决产业问题的能力，也就是以Agent为代表的技术。比如金融行业有大量严谨的知识，一款保险能不能买、能不能赔，大模型本身很难在严谨领域里跟这些知识对应，模型本身抽象的符号怎么跟现实世界中的物理动作、控制、概念进行映射很重要，大模型在专业领域里精准调用这些知识，是Agent要解决的一个问题，功能和工具的调用也很重要。Agent其实核心就需要解决符号连接环境的问题，一个很强大的模型作为一个中枢，跟场景、数据、服务连接在一起，无缝解决用户需求。

第三是可靠性，模型能力越强大，可靠性问题越关键。OpenAI前两周的动荡中，非常受争议的是超级对齐，前首席科学家想要花4年时间、20%的算力，系统性解决对齐问题。

其实大模型要真正进入产业，最终不是形成一个超级APP，而是一个超级生态，对可靠性要求的挑战非常大。大模型非常擅长创作性的工作、文科生的工作，因为没有对错，文无第一，武无第二。但像医疗、交通、金融这些专业领域没有很高的容错空间，所以如何解决可靠性比大家想象的要复杂很多，不是简单的对齐和幻觉问题，它要遵循现实社会和现实行业的规范、规章、价值观、专业性、事实性，才能落地。不存在捷径，我们只能通过系统工程的方式去解决可靠性问题，也有探索在大模型底层如何做好进一步的对齐。

问：OpenAI召开首届AI开发者大会后，AI领域的小公司还有没有机会？

王晓航：就像App Store，在移动互联网领域成功的不只是iPhone和Android，每个行业都有现象级的产品，千行百业也迸发出非常多的创新，电商、生活服务、金融、内容媒体都长在移动互联网生态上。拥抱AI的时代，很大程度上不需要重造操作系统和大模型，它作为一个好的开发者生态，自然而然会开发出新的应用。OpenAI也需要从一个超级APP转化成一个超级生态，生态的繁荣才能真正意义上带来增长，给所有人创造增量价值。这是一个商业的必然，从一个超级APP变成一个超级生态，才能摆脱增长的焦虑。

问：未来一年，中国的百模之战会如何演化？

王晓航：我觉得未来通用且开放的大模型,会更加收敛和集中，大部分大模型厂商、创业公司会走向第二层竞争――进入产业，这会非常多元化。现在产业落地的进展是相对滞后的，百模大战投入了大量资源，很大程度上是造轮子，但产业落地没什么特别好的案例。比如金融领域利用大模型开发价值，没有看到特别好的案例，明年可能开始会有很多卷大模型的厂商进入到行业中寻找自己的发展空间。

二、大模型落地千行百业，最成功的会是创造型和知识密集型产业

专访王晓航：大模型需落地千行百业，生态繁荣才能摆脱增长焦虑

问：未来一年，会出现一个现象级的生成式AI应用吗？

王晓航：肯定会，但不知道是什么时间出现。下一个应用不会是GPT本身，应该会在产业中，产业里会出现不止一个应用，各个行业都会有，比如电商、金融。我们就在研发和测试基于大模型的智能理财助理支小宝。

数字化金融服务已经非常丰富多元了，但对大众来说还是过于复杂，怎么把简单、专业、智能的财富管理服务带给客户，这样的应用有非常深的价值，下一步服务体验升级只有通过AI才能实现。每个行业都在等待自己的AI超级应用，谁在产业里更有数字化基础，谁把行业和技术结合得更紧密，谁就能够带来这样的产品。

问：大模型落地最成功的产业，会是哪些？

王晓航：有两类，一类是创造型产业，比如设计、文娱、游戏；另一类是高知识密集型行业，比如金融、医疗、法律。大语言模型是一个强大的参数化的世界知识的容器，它能媲美、赋能，甚至某种程度上替代一部分知识型工作者的职能。

问：大模型落地产业的最大难点是什么？

王晓航：大模型是基于全网可得的公开数据所训练的，理解和生成能力非常强，但遇到专业严谨行业时有非常多挑战。通用大模型在专业通识方面是短板，比如金融专业性很深，各种金融决策的复杂性和严谨性要求很高，医疗行业更加复杂严谨。比如理财领域，做家庭资产配置保障计划，不是简单推荐，而是计算偏离度、风险集中度、风险等级、承受能力，像这样的决策不是大模型擅长的，它无法学习，即使有足够的数据，它的严谨度和计算，也远远达不到今天的行业要求。医疗、金融等强监管行业对可靠性要求极高，我讲的可靠性不只是“幻觉”，还有合规性、适当性、伦理问题等，涉及每个行业的价值主张。

如果这三个问题不解决，大模型在严谨产业落地时潜力无法发挥。如何解决这三个问题？一是大模型要跟领域内的专用小模型结合，比如资产配置，在理解用户需求后调动资产配置工具，而不需要让大模型直接计算资产该怎么配置。二是结构化的知识图谱很重要，比如我们为了做好医疗理赔工作，要建非常完备的医疗和保险知识图谱，在大模型训练过程中注入，降低幻觉，提高专业性，在应用过程中优先考虑知识图谱跟大模型怎么结合。检索增强技术也非常有效，在专业领域中定位内容以后进行解答，就像从一本专业书籍中找答案，这些技术都可以大幅提高大模型专业性和真实性。这是一个系统工程。

问：蚂蚁的金融大模型目前什么进展？

王晓航：在大模型时代之前的小模型时代，我们已经全面AI化了，涉及风险管理、智能理赔、智能助理、智能营销等环节。但大模型的到来，还是给我们带来很大震撼，因为它在很多金融场景里能够轻易刷新小模型时代的最好表现，意图理解、定性分析、量化分析等领域已经超过人工。

小模型时代，每一个应用场景都要进行非常深的端到端定制，算法工程师和时间成本很昂贵，大模型统一了算法架构，一个模型经过简单的微调和适配后可以解决一大票问题，做得比以前更好，提高企业经营效率，所以加速创新，能让人聚焦在专业有深度的创造性工作上。专业化的金融服务也会有一种替代性的体验。现在所有移动互联网的交互都以图形界面（GUI）为主，未来的服务要通过多模态的交互、语言的交互来完成，怎么跟移动互联网的图形界面融合，形成一种新的界面和体验，可能是未来两年会发生的。

蚂蚁的金融大模型，在理财和保险业务上，已经进行了大半年深度内部测试。我们希望能给用户带来代际上有区别的不同服务体验，在金融资讯、金融通识方面做到有问必答，在几百款数字化工具上做到有求必应，定制个性化服务方案，改变图形界面的交互方式。

在B端，我们为理财师、分析师、销售人员、理赔专家团队、内容运营创作团队在打造智能业务助理“支小助”，包括投研版、理赔版、服务版等。数字金融可以看作一个大模型落地产业的大样板间，我们虽然是刚起步，但也看到了一些快速迭代，在大模型的冲击下打开了眼界。

三、安全、隐私、伦理、可解释性会持续成为全球监管重点

问：未来一年，全球范围的AI监管，预计会出现哪些进展？

王晓航：安全、隐私、伦理、可解释性，会持续成为监管的关注对象。医疗、金融等专业领域有准入规范，从业人员需要持证上岗，专业能力要经受考核。所以现在有个趋势是，大模型深入到这些产业时也不能被豁免，它需要准入以后才能落地产业，相当于大模型要通过职业考试达到一定准入门槛，这是以前的AI所不存在的一个问题。

问：除了生成式AI，AGI是否会存在其他形式？

王晓航：生成式AI只是这一波技术革命的中枢，但最终要实现AGI、端到端解决现实世界的问题，需要一个系统工程组合技术。大模型如果真的要往通用智能和更高级的智能演进，比如具身智能，就需要跟现实世界进行连接、互动，这包括多模态理解、传感和交互技术。也已经有其他AI的分支技术被吸收到大模型的技术范式里了，比如强化学习。

问：大模型的下一阶段会是什么，是超级智能体吗？

王晓航：Agent的本质是一个智能在环境中自治的框架，有较多可选的技术组合，可以把很多标签和新技术往Agent的框架里塞，但最终的本质还是AI要解决现实世界的任务。目前最有希望的方式是以大模型为中枢，提供落地的连接、知识存储，思考和规划的框架，这是产业落地的一个最关键的技术载体。

问：对于应对AGI，你最想知道答案的一个问题是什么？

王晓航：价值对齐。一旦有一天大模型开始有自主意识以后，最重要的是价值对齐，以及对人类的系统性保护。所谓价值对齐，就是大模型有自主意识后，当它的智能和能力媲美和超过创造者时，它需要以什么样的态度来看待创造者。超级智能在智力和能力上比人更强时，我们如何跟它们共存，这是超级对齐的本源，也就是我们作为一个物种跟更高阶的新物种一起，安全利用、共处、生存和发展。当然，这是高级阶段的问题，现在大模型首先要能落地产业。（CIS）

校对：王蔚