这年头,不做大模型就不好意思说自己是科技公司。
(相关资料图)
这不,“百模”大战打了几个月之后,又有新玩家入场了,京东、携程都加入了大模型“战场”。
相比京东、携程发发布大模型布,这两天的大模型发生了一个更重量级的事情:Meta发布新一代AI模型LLama V2,并宣布LLama V2开源,并可直接商用。
傅盛发朋友圈评论:“这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所……”
据传,LLama V2性能超过了GPT-4、Microsoft和Google的AI模型,能够生成语言、代码和图像。最重要的,相比GPT4,LLama V2开源,并且可以直接商用。
消息一出,不少人都在感慨:一夜之间大模型变天了。
要说大模型行业变天,恐怕还有点早,但LLama V2开源可商用、再加上国内这么多大模型落地,“百模”大战,恐怕要迎来第一个“淘汰赛”阶段。
“百模”大战之后,大模型迈进应用驱动阶段
大模型赛道,做通用模型的都是大公司。
Open AI背后站在微软,文心一言背后是百度,通义千问背后是阿里,混元大模型背后是腾讯……再加上商汤、讯飞等“本土”玩家,留给后来者的舞台其实并不大。
而这个不大的舞台,如今却显得有些拥挤。此前一份国产大模型列显示,目前国内的大模型已经有近百家。
这么多大模型落地,说明AI大模型可能即将进入产品驱动阶段。
互联网江湖认为,大模型的发展会经过三个阶段。
第一阶段,模型数据、数据为核心的技术驱动阶段。
从ChatGPT 到GPT3阶段,大模型是由技术驱动,这时候关键是算法,和数据训练。
GTP3之后,差距就在于数据量,这不难理解,这好比是一个有着超强学习能力的孩子,在咿呀学语之前,进步不大,一旦掌握了世界的“数据语言”,那么大模型的进展是飞速的。
而做通用大模型的玩家,需要尽快度过这个阶段,并建立自己的核心优势。
目前来看,百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等,国产主要大模型都走到这一阶段。
这些大模型,都是大公司做出来的,能走到这个阶段的大模型,要么算法更先进,要么有足够的数据参数和训练量。
以百度为例,5月份上线的文心大模型3.5,能力已经超出ChatGPT 3.5,虽然官方没有公布具体的数据量级,但大量的数据、算法优化训练是必经之路。
这个阶段,拼的其实就是硬实力,拼的是数据生态,人才技术和资金投入,创业公司很难真的从底层做起来。
第二阶段,是产品驱动阶段。
当国产大模型不断涌现,“百模”大战的格局上演之后,行业其实就已经走到了产品驱动阶段。
产品驱动阶段,“百模”大战会经历一轮淘汰赛。
大模型从业者普遍认为,400 亿-500亿参数量级是模型能力“质变”的门槛。 换言之,对于资本市场来说,百亿参数量级之前,一些大模型项目很可能会首先遇到“生存问题”。也就是说,对于一些后来者、在遇到生存问题之前,必须要有足够应用落地。
也因此,产品阶段的大模型,核心在落地场景。
大模型其实没有什么路线之争,垂直或者通用,与其说是路线之争,倒不如说是落地的场景之争。
我们认为产品驱动阶段,大模型落地的重点在于,大公司底层做起,打造行业大模型基础设施,在此之上,垂类的创业公司去做应用端的垂直创新。
其实现在已经有企业走在这条道路上了,比如商汤SenseChat大模型,在不少领域已经开始与品牌合作落地。
“表面上看通用大模型和垂直大模型代表了两种技术方向,但实际上两者相辅相成,可以并行发展。更强的通用大模型具备更强大的学习能力,可以快速融合不同行业领域的知识,支持垂直大模型的训练和开发。”商汤科技相关人士表示。
在大模型领域,商汤扎根很深。
4月份,商汤“日日新SenseNova”大模型体系公布,并迅速落地。在自动驾驶行业,商汤构建了业内首个感知决策一体化的端到端自动驾驶解决方案UniAD,,使车道线的预测准确率提升了30%,预测运动位移的误差降低了近40%,规划误差降低了近30%。
天眼查APP显示,商汤科技2021年在香港上市,彼时上市募资55亿港元。
科大讯飞落地也很快。此前科大讯飞曾表示,随着星火认知大模型的不断迭代,其诊后康复管理平台将逐步实现对所有病种、病程的精细化管理等能力。科大讯飞的大模型最大的特点是更C端,有自己的产品矩阵,接入大模型之后,更容易触达C端用户。
大模型领域,最先产生商业价值不一定是通用的ChatGPT4,反而更可能产生在应用端走得更快的领域。
实际上,在科技进步的浪潮中,并不是所有的价值都会被先发的企业拿走,技术商业化的价值,往往会被更成熟的企业拿走的更多。
就像微信不是最先出现的社交应用,但无疑是最成功的。
第三个阶段,是用户驱动阶段。
有了场景之后,最重要的是能够获得用户的认可。从过去AI技术的落地来看,由ToB到ToC,是大模型落地的最终路径。所以,首先为大模型买单的一定是B端。
不过,从底层商业逻辑上,谁是最终的“受益者”,也就会是最终的“买单者”,说到底,大模型应用的最终结果还是要服务用户。长期来看,也最终会走到用户驱动的阶段。
只不过,与现在大家所熟知的移动应用不同,“大模型应用”的用户驱动会更快更直接,因此,有大量C端用户的公司(百度、阿里、腾讯)的进展速度可能会超出想象。
大模型应用爆发的黎明,商业化拐点已至?
虽然大模型很火,但真正躬身下沉的玩家都是大公司,投资市场的交易数量与去年淡季没有什么变化。
很明显,市场有顾虑。
比如,现在下场了,将来如何退出?大模型毕竟是个需要长期投入的项目,募资难,想要退出也难。再比如,比较有潜力的大模型项目其实都在大公司手里,这不是说创业公司没有机会,但市场还是在观察。
“大模型的终局会是什么呢?我认为对于大模型来说,终局会集中在少量的几个大模型”。百度集团副总裁吴甜表示。
吴甜认为,大模型产业生态可类比芯片代工厂,把大数据、大算力、大算法都封装,建设自动化、数字化、标准化的生产模式。
一方面,从底层做起来的大模型,成本非常高,需要多年积累。另一方面,应用层面,几个少量大模型,就会有非常广泛的应用生态。换句话来说,其实并不需要那么多大模型来做重复的应用。
大模型领域,可能也会有一个新的“二八定律”:两成的大模型玩家掌握真正的底层核心技术,而八成的大模型企业都在各个领域创新,去做大模型的应用。
可以预见的是,Meta的LLama V2大模型开源、放开商业化之后,大模型应用端的创新会迎来一个高潮,而国内大模型产品集中爆发,应用端也会迎来许多的新变化。
过去的十年,以用户关系为中心,互联网完成了内容消费、服务消费、商品消费的中心化。
大家看视频到抖音、快手、B站,买东西到淘宝京东拼多多,本地生活到饿了么美团。于是,搜索广告之后,短视频、本地生活、电商,成了互联网技术创造价值的主要方式。
而大模型,正在用新技术和新交互,重新改变价值的创造方式。
这种改变分为几个方面:
一、过去的互联网是分发内容,而大模型则是在分发的过程中创造内容;
你向大模型发出一个提问,AI不是事先给出答案,而是在实时生成答案,这样的信息交互方式,本身是分发,也是在创造。
如果应用到广告领域,就可以通过大模型实时生成广告,广告内容、呈现方式触达用户更精准,不再是所谓的“精准投放”而是真正意义上的“一对一”的制作、传播广告。
在过去,一千读者心中有一千个哈姆雷特,而在未来,一千个用户面前同时展示的,则是一千个不同定制的品牌广告。用户更能接收到品牌关键信息,广告的转化率也就更高。
在广告领域,已经有相关的尝试,百度基于大模型推出“擎舵"、腾讯推出“混元”,阿里妈妈的AIGB出价模型,都是这个方向上的应用尝试。
进一步来看,这种“黑镜”式的信息分发、创造,可能会改变整个互联网的内容生产逻辑。
二、大模型的交互设计,有新的商业化机会;
大模型的应用,浅层的是强调功能性,深层的是改变成本结构。
一个基本的判断是,大模型商业化应用首先会改变的一定是广告、营销行业,因为广告行业对用户获取信息的方式变化更敏感。
因此,在营销、内容创造等行业,一些新的商业机会可能会被发现。
几乎可以确定的是,在初期的应用阶段,商业化的机会一定与交互有关。
比如,Copy.AI和Jasper这两个营销创意工具,以GPT-3作为底层接口实现了持续的规模化变现。他们提供了交互界面和插件、API接口,让大模型能更好的去服务某个领域的客户。
当然,这只是解决最基本的功能性问题,大模型真正的价值在于改变垂直行业的成本结构,比如自动驾驶大模型的商业化价值,就是在于改变了人们的出行成本结构。
营销只是一个方面,商业化方面,其实还是得看具体细分领域的应用。
对于不同的领域,大模型会不断的被垂直细分,去满足更小、更细微的场景应用。而这些更细微,更小的场景,可能会有率先商业化的机会。
比如,文本生成,比如图片生成。能够先让编剧、漫画家的工作变得更容易?能不能把文案从做PPT的日常循环中给解放出来,这些细小的场景,能够率先变现。
大公司,和创业公司,在应用层差别可能不是很大,应用层是创业机会最多的大模型领域,未来行业内也可能会跑出几家专注于大模型应用的公司。
互联网江湖认为,新技术应用,找到专有价值链要素,嵌入行业,是一个必经之路。因此在应用上,找场景的公司,比练算法、堆参数的公司更有机会。
大模型的成功有阶段性质变,就像是GPT3到GPT4,但接下来这种变化会越来越不明显。也就是说,数据训练的边际收益会降低,
大模型能力的进阶需要数据量做支撑,而商业化则需要考虑成本问题,如何解决这个问题,颇为关键。
商业化拐点已至,大模型的商业化短期看B端,长期机会可能还是在C端。
大模型,有点像前几年火的ToB,不仅是要看自身的成熟度,也得看行业端的适配。
大模型的成本很高,商业化首先就要到合适的场景中,并且能够真正赚到钱,只有真正在AI应用场景中挣到钱,并且能够真正与行业适配,大模型才有商业化的竞争力。
能够承载大模型商业化的,只有降本需求更迫切的B端。
事实也的确如此,以商汤为例,在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,试图帮助银行金融机构降本增效。
在医疗领域,商汤中文医疗语言大模型“大医”,也能够提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。
进一步来看,B端之外,未来的大模型也可能会承载更多的商品和服务分发。
移动生态中,触达用户的方式其实就是网页、APP、小程序,那么未来的大模型生态中,如果用大模型来分发内容,那么流量的分发会更加去中心化。
实际上,一旦语言大模型成熟,并且有了足够多的用户习惯,那么,承载商品与服务分发的APP、小程序,可能就会被大模型取代。
也就是说,在ToB应用的阶段之后,未来大模型长期的价值和商业化机会,更多其实还是在C端。
只不过,以当下的视角来看,很难去定义AI应用的“新场景”,这就像是当你身处90年代,你不可能预测到如今的微信、抖音崛起。
如今的大模型也同样如此。
结语
从公元元年到18世纪,人类经济增长曲线几乎是平的,也只有在近三百年才出现工业革命,近几十年才有了信息技术。
人类历史上第一台计算ENIAC最初诞生,并不是用于个人计算,而是用于大量军用数据的计算,但数十年后,它却彻底改变了人们的生活方式。
如今的大模型,就如同当年的ENIAC。
当泡沫散去,大模型究竟是不是“比互联网更伟大”的机会?或许人们心中早已有了答案。
关键词: