第四范式联合创始人 陈雨强:奇点临近,AI 大模型如何重构企业级软件_天天亮点
5 月 23 日,36 氪举办「颠覆 · AIGC」产业发展峰会。本次峰会汇聚产业力量,共同探讨企业、行业在面临变革时的应对策略,分享思考,探索和发现产业中最具潜力的企业与最具价值的技术,在激荡的环境中探寻前行的方向。
(相关资料图)
大会上,第四范式联合创始人、首席科学家陈雨强发表了题为《奇点临近,AI 大模型如何重构企业级软件》的主题演讲。陈雨强认为,对企业级软件,生成式 AI 的价值在于极大优化了软件界面和交互方式,一方面带来了软件用户体验的革命性提升;另一方面,能够帮助用户实质性地提高工作效率。他以产品开发为例,指出,GPT 的出现降低了开发者调用底层功能的门槛,简化了开发流程,提升了开发效率。
陈雨强进一步提出了生成式 AI 重构企业软件的三个阶段:第一个阶段是协助执行任务,核心能力是企业级 Copilot。AI 能听懂并正确执行用户的简单指令;第二阶段是 AI" 攻略式 " 帮助人实现更复杂的工作,核心能力是知识库和企业级 Copilot。AI 能自动查阅软件使用攻略,用 1.0 阶段的方式按需求执行;第三阶段是 AI 自动执行复杂工作,核心能力思维链和企业级 Copilot。通过对 1.0、2.0 阶段积累的数据进行学习,思维链可以归纳出解决复杂问题的攻略,自动执行攻略中的每一步操作。
但同时,陈雨强也指出,大模型在 toB 领域落地还存在内容可信度、数据安全、成本控制三个主要挑战。他认为,企业要用好大模型,就必须解决好上述三个问题。首先,要确保内容的真实、可靠、专业,就需要通过引入企业内部高质量数据;其次,企业在使用大模型时需要保证数据不出组织内部。这就要求模型的私有化部署;最后,企业可以通过适当减小模型规模来降低应用落地成本,做到成本可控。
以下为陈雨强演讲实录(经 36 氪整理编辑):
今年,随着 GPT 等技术的发展,AIGC 受到了大家的广泛讨论。AIGC 之所以这么火,是因为 AIGC 可以直接写论文,可以画画,可以干更多的事情。第四范式也在思考,GPT 技术如何应用到 B 端领域。
我们看到,C 端软件或产品已经逼近用户体验的上限,比如短视频 APP,通过上下刷完成所有对信息的需求。而类似于 CRM、ERP 等 B 端企业级软件,往往有几十层级菜单,功能成百上千个,即使是修改客户信息这样基础的操作,也需要多层级的查找到相关功能。
GPT 能在其中发挥什么样的作用?它可以给企业软件界面和交互带来大幅度升级。我们也叫 AIGS(AI-Generated Software),以生成式 AI 重构企业软件。
首先,它可以成为多模态的对话式的助手,用户直接用人类自然语言的方式交互,就能完成一个比较复杂的任务。想象一下,操作过程从七八个繁琐的点按操作,直接变成了给 GPT 下达一句语言指令,这样对体验的提升几乎是革命性的。
除了软件体验之外,生成式 AI 也带来开发效率的大幅提升。过去,软件开发会分为产品开发、功能开发两部分。其中,功能开发主要是开发数据库并调用对应的接口。而产品开发涉及到界面、交互,要把成千上万的功能集成在一个页面下,并且保证合理、易用,所以它会耗费非常多的时间和成本。但这个部分的时间和精力又是不得不花的,因为如果只有底层功能开发,除了有技术背景的员工之外,没有人会使用这样的软件。
有了 GPT 之后,任何人通过「对话框」实现底层功能的调用。这样一个模式变化之下,我开发出来功能后,只需要向系统注册一下新开发出的底层 API,就能实现对这个功能的调用了,这让以前数月开发上线培训才能使用的软件开发周期,直接缩短到天级别。
所以,不仅仅是体验,AIGS 还让复杂的工作变得更加简单。我们把它分为 3 个阶段。
生成式 AI 重构企业软件的三个阶段 企业供图1.0 阶段叫做协助执行任务,核心能力是企业级 Copilot,也就是 AI 听懂你说的话,并且正确执行你说的话,这些能力是软件本身具备的能力。以 PhotoShop 为例,假如我想说照片亮度提高 20%,机器可以理解这样的需求,并且找到对应功能完成这样的需求,这个功能看起来不是特别复杂,但是 PhotoShop 有上千个功能,很多我们并不知道如何操作,甚至我们根本不知道有这样的功能。
2.0 阶段是 AI" 攻略式 " 帮助人实现更复杂的工作,之所以复杂是因为完成工作不是一步简单的执行,核心能力是知识库和企业级 Copilot。还是以 PhotoShop 为例,假设需求不是把照片亮度提升 20% 这样单一,而是说把照片 P 的好看一点。过去,我们会查找 PS 攻略,看看一共需要几步,再按攻略一步步操作。现在,AI 可以自动查询这样的攻略,然后用 1.0 阶段的方式一步步按照需求执行,完成整体的美化工作。这个阶段有一个比较明显的缺陷,所有攻略都需要人运营,开放性不高,不是所有的工作我们都信息化下来。
我们能不能让 AI 自己找到解决问题的方法,这就进入到AIGS3.0 阶段,叫 AI 自动执行复杂工作,核心能力思维链和企业级 Copilot。思维链通过对大量 1.0、2.0 阶段积累下来的数据进行学习,可以归纳出解决复杂问题的攻略,再自动执行攻略中的每一步操作。这种情况下,即使是一个小白,AIGS 也可以完成 " 把照片 P 的更好看 " 这类以往需要打开五个窗口操作的复杂指令。这其实对我们业务帮助非常大。
例如在第四范式和某航空制造企业的合作中,过去的工业设计软件,工程师不希望每个零件都去设计,所以有一个很常用的功能是查找相似零件。(视频)可以看到传统的软件方式,大概需要 6-7 步才能完成一个相似零件的查找。经过 AIGS 改造后的软件,只需要语音或文字输入 " 帮我找出相似零件 ",或者 " 这些零件能不能组装在一起 ",就可以完成这样的操作了。
查找相似零件示例 企业供图这个复杂的设计软件里有成百上千个功能,很多功能对于外行来说不经过一个月培训,根本不能使用,现在有了 GPT 之后,门槛是极大降低了。类似这样的 case,我们很多客户已经落地,让他们生产效率得以提升。
但是,要做大模型在 toB 领域落地,显然会面临非常多的挑战。大模型会产生幻觉、大模型会有自己的想法,大模型没有办法知道自己知道什么,或者不知道什么,不能为了追求模型能力就牺牲掉数据安全,以及如何降低大模型的成本……这些都是企业在应用大模型时首先要考虑的问题。
首先是内容可信,要甄别内容是不是编的,确保生成的内容真实、可靠、专业。解决这个问题,大模型必须要引入企业内部高质量的数据,并且做到生成的每句话都能溯源。
其次是数据安全,最近有很多企业限制员工使用 ChatGPT,所以私有部署大模型对企业来说至关重要,要保证所有数据不出企业内部。
最后是成本可控。企业并不需要所有 GPT 所掌握的知识,可以根据企业自身的需要适当减小模型规模,以降低应用落地成本。
这也是行业大模型的价值。最近我们和我爱我家一起做的房产经纪大模型,就是把我爱我家积累的领域专业知识灌注到「式说」大模型,用培训合格房产经纪人的方式来训练大模型。最终,与通用大模型相比,它生成内容会更加专业、可信、可靠,成为经纪人助手甚至是教练。并且做到数据安全与成本可控。
我爱我家房产经纪大模型应用示例 企业供图我们可以把通用的 GPT 当做是考高考学生,它可能能考普通本科或者是清华,有不同的能力。但毕竟还是一个高中毕业生,你直接让他做房产经纪人,他不知道什么是满五唯一,不知道这个房子有贷款和没有贷款怎么区别操作。不管清华学生还是其他学校都是不知道的,所以真正在企业中用好大模型,仅仅是广域的知识还不够,需要用行业数据把学生训练成一个具备专业能力和知识储备的行业从业者。
最后介绍一下第四范式在 AIGS 的布局,今年 2 月,我们发布了「式说」大模型。底层是一整套多模态大模型,包含了文本、图像、视频、语音、结构化机器学习、决策优化等,在大模型基础上囊括了知识库、思路链 CoT、Copilot 学习能力。再往上,我们有一个开发平台,来支持开发金融、零售、医疗、制造、能源等行业应用,为整个行业供给更多可落地的企业级应用。
整理|沈筱