第四范式联合创始人兼总裁胡时伟
「行业大模型的真正价值,在于为企业解决核心业务痛点的场景大模型集合,这些行业大模型将成为 AI +千行百业的新型基础设施。」胡时伟说道。
而围绕这一实际诉求,行业大模型在落地应用过程中需要解决的三大核心问题也变得清晰起来。
一是价值,即明确 AI 或者说行业大模型要解决的行业核心问题是什么,这是根本,不同的行业场景有不同的核心问题。比如,零售行业场景的核心问题是如何做好供应链;医疗健康运营场景的核心问题是怎么做好鉴别和预防;金融风险运营场景的核心问题是如何实施风控。
二是信息,大模型需要训练,没有信息就没法训练。企业一般觉得这不是问题,自身的信息仓库里存放着大量的信息,但是他们没有意识到那些信息根本不是解决这个问题所需要的信息。甚至可以说,如今大量企业能够有效用到的信息不到其整体的 5%。
对于行业大模型而言,不仅需要通用语料库,还需要针对具体行业、具体场景的专业语料库,这意味着需要对各业务产生的信息进行处理、标注,才能得到可以用于大模型训练的有效信息,「真正优质的信息由人与人之间的互动过程产生」,而不是任意、随机生成的信息。
三是模型,模型是需要迭代的,这意味着即便有现成的模型也不能拿过来直接用,也要针对企业自身的场景、问题,一轮一轮迭代、调试,解决一个又一个具体的问题。
「只要把这三大核心问题解决了,那么算力、行业 Know how 等作用行业大模型落地的问题就都不是问题了。」
可对于企业来说,知道了什么是有价值的、所在行业的核心问题是什么、训练大模型需要怎样的信息,就能选择出适合的大模型,来加速自身的数字化转型吗?
显然,这并不是一件容易的事情。
比如,零售行业、医疗行业、金融行业场景的一些核心问题分别是如何做好供应链、做好鉴别和预防、实施风控,而相对应的信息模态依次是监测信息、体检报告、风险评估报告等,这些都不是语言,如果仅仅把这些行业知识灌输到大语言模型中,也只能做到「隔靴搔痒」,根本无法解决核心问题,实现企业的本质诉求。
那怎么办?
第四范式十年的行业大模型实践心得:降低应用门槛,做有价值的AI
今年 3 月,第四范式发布先知 AIOS 5.0行业大模型平台,基于各行业场景的 X 模态信息,构建行业基座大模型,以解决当前行业大模型只能将行业文本信息「喂」给大语言模型、生成下一个 token 的问题,从而促进大模型在更为广泛的场景中落地应用。
怎么理解?
我们都知道,当前以 OpenAI 的 GPT 为主流的大模型本质是预测下一个 Token,即 Predict the next X 中的 X 指的是大语言模型中的文本。那么,面对当前不同行业场景的核心诉求,能不能试着将 X 的内涵延伸到不同的模态信息?
答案是可以的,第四范式此次所推出的行业大模型平台「先知 AIOS 5.0」就进一步升级了预测下一个 X 的能力。对于不同行业场景的企业来说,只要在平台上传其核心模态信息,就可以训练出符合其需求的行业大模型,大大降低了训练门槛,不再让应用大模型遥不可及。
这是第四范式作为一名行业「老兵」,在过去十多年的实战中获得的经验。
其实,如果仔细看,抛开 Transformer、GPT 的定义才算大模型,从解决实际问题的角度出发,第四范式做行业大模型的时间线由来已久。2014年第四范式成立,是国内最早思考「通用智能」的 AI 公司——提出做 AutoML,本质是为了减轻 AI 项目定制化中机器学习工程师的工作量。
胡时伟告诉雷峰网,第四范式成立的目的主要就是想把机器学习这件事情给应用到解决行业实际问题中。
而第四范式创始人兼 CEO 戴文渊也多次公开表示,「从十年前创业第一天开始,第四范式做的就是行业大模型。」
其实我们也可以从先知 AIOS 平台的每一次迭代中窥探到这一点。从 1.0 到 5.0,十年间,先知 AIOS 历经 5 次升级,而每一次的工艺迭代,都是针对彼时企业在应用 AI 时的痛点问题,围绕着降低门槛、提升开发效率的诉求,一步步推进,做有价值的 AI,一如第四范式从第一天起就明确的价值观——AI for everyone。
2014 年 12 月,先知 AIOS 1.0 首次推出,据胡时伟介绍,当时企业自称有业务、有信息,只差运算规则,于是就先做机器学习运算规则,通过高维、实时、自学习框架大幅提升模型精度。但之后发现,对于企业来说,生产系统、基础设施并不像想象的那么完备,无法解决深度学习的新架构问题,于是,第四范式开始推进先知 AIOS 2.0。
2017 年先知 AIOS 2.0 发布,它解决的是基础架构等问题,可利用自动建模工具 HyperCycle,大幅降低模型的开发门槛,开始真正在企业中发挥实质价值、落地生产应用。
紧接着,第四范式发现,虽然企业有大量的信息,但那些都是用来做数仓的信息,没有标注,缺乏真正用来培养机器智能的信息。于是,第四范式开始加快先知 AIOS 3.0 的研发步伐,希望把信息这一问题快点解决。
之后,等到 2020 年发布的先知 AIOS 3.0 平台,规范了 AI 信息治理和上线投产,完成了从模型构建到落地应用的「最后一公里」。
而等到先知 AIOS 4.0 的研发阶段时,第四范式开始琢磨企业还有哪些问题没有解决,后来发现,企业不知道该拿先知平台来做什么,虽然能在场景中使用,但发挥的价值不高。
于是,沿着为企业创造最高价值的目标,2022 年第四范式发布的先知 AIOS 4.0 ,引入了北极星指标,添加了运营层面的能力,最大化发挥 AI 的应用价值,以提升企业核心竞争力。
之后,就是今年 3 月推出的先知 AIOS 5.0,提供了各类开发工具以及企业级模型纳管平台,业务人员可通过自然语言交互(企业级AI Agent)的方式,实现行业大模型的构建、优化、报告、运营全流程。
据第四范式 2024 年第一季度财报信息显示,前三个月,第四范式实现营收 8.28 亿元,同比增长 28.5%。其中,先知平台收入 5 亿元,在总收入中的占比高达 60.6%,已然成为第四范式的核心业务。
目前,以先知 AI 平台为核心,以及 SHIFT 智能解决方案、第四范式式说 AIGS 支持,共同组成第四范式的三大主要业务板块。
SHIFT 智能解决方案是基于第四范式底层 AI 能力,以及和生态伙伴的行业实践经验,沉淀出各行各业的智能解决方案产物。
AIGS 平台,即「以生成式 AI 重构企业软件」,在今年 4 月第四范式发布「式说3.0」大模型时正式提出,这是基于「式说」大模型能力打造的生成式 AI 软件开发平台,也可视为第四范式在大模型商业化方向的开拓。
「这三者形成一个闭环,不断迭代,不停解决具体问题,为企业创造价值,提升核心竞争力。」胡时伟说道。
「量变」到「质变」,第四范式独有的纵向 AGI 路线图
当行业大模型解决了企业的核心问题,提升了核心竞争力之后,或将加速企业的数字化转型步伐,带来企业的核心竞争力产生由「量变」到「质变」的巨大变革,加速企业朝着「下一代企业」迈进。
怎么理解?
在胡时伟看来,随着外部环境的竞争加大,面对剧增的的经营压力,很多企业试图寻求通过数字化转型来改变这一困境。
而相较于传统的「金字塔型运营体系」,企业可以试着面向核心竞争力建设基于数字化工艺的经营运营体系,按照战略数字化、策略数字化、执行数字化和评价数字化的四大维度推进,打造闭环的数字化迭代体系,推动企业核心竞争力从「量变」到「质变」,率先成为「下一代企业」。
在过去的几年里,第四范式主要聚集在使用 AI 帮企业解决从战略到策略数字化的推进,而大模型的出现,加速了策略数字化向执行数字化的演进,企业数字化转型的步伐大大提升。
比如,上文提到的某餐饮连锁集团,在明确了自身的核心诉求后,第四范式以个性化点餐系统为切入点,为客户量身打造了个性化的精准推荐支持,不断优化客户体验,提升客单价及整体销售额。另外,第四范式还为其构建了 AI 平台,让 AI 能够以平台化、高效能的方式落地从线上到线下、从营销到营运的关键业务场景。
结果就是,该集团的平均客单价提升了 2%,全年销售额增长数亿元。
其实,不仅是在企业的数字化转型上,推动企业核心竞争力从「量变」到「质变」,率先成为「下一代企业」,在通往 AGI 的道路上,第四范式也在走着一条独特的从「量变」到「质变」的路径。
当前,关于 AGI 的定义和道路问题,业界根本无法达成共识,各路人马争吵不休,纷纷为自己的信仰正名。
而胡时伟更喜欢务实,想要在热闹中,从扎根做 ToB 的实用主义角度出发,抓住这一波浪潮中 AI 价值的「波峰」。
他认为,AGI 并非新事物,从 2016 年的 AlphaGo,往前,上世纪 90 年代的深蓝,再往前甚至是上世纪 50 年代 AI 刚兴起时,人们就开始谈论「 AI 替代人类」「 AI 消灭人类」等话题,其实都属于 AGI 的范畴,几乎每隔二三十年都会重新「热」起来,然后再「落」下去,呈现「波峰波谷」式增长。
但同时还有另外一条增长曲线,那就是 AI 价值,一直是稳固上扬式前进。而到这一波,「AI 价值已经达到了顶峰,政策、资本、企业、公众全部参与进来,相较于上一波甚至整个 AI 的增长历史来看,都是最高点。」因此,要抓住机会,最大化发挥 AI 价值,做好行业大模型。
而当行业大模型汇聚成海时,或许就是通往 AGI 之日。
胡时伟认为,如果我们能够因地制宜,结合中国市场特点,一个接一个地把每个行业、场景所需要的行业大模型做到极致,那么就可以由点到线再到面地往前推进,而随着覆盖面越来越密集,最终就可以汇聚成海,从「量变」到「质变」,最终实现 AGI。
这就是第四范式所坚持的、不同于以 OpenAI 为代表的工艺信仰派的纵向 AGI 路线。
「我国有完善的产业链,有场景,有信息,有行业进行数字化转型升级的需求」,而这正是我国区别于国外增长大模型的战略优势,或许也是即便在工艺上居于劣势,也能实现弯道超车的机会,胡时伟说道。
据了解,目前第四范式的行业大模型业务已在金融、制造、医疗、零售、教育、能源、地产经纪等领域落地,距离汇聚成海时,未来可期。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
文章版权声明:除非注明,否则均为本站原创文章,转载或复制请以超链接形式并注明出处