就像一个轮回,一级市场对AI(人工智能)的投资热情再次被点燃。
在五源资本投资人石允丰看来,当下行业的火热一个重要原因在于,2008年、2009年技术时代迭代时,因为犹豫带来的后果太过惨痛,国内平台型头部企业几乎换了一轮。十来年的肌肉记忆仍旧清晰,决策者尤甚。
2023年,因ChatGPT的火热而引发的投资热潮汹涌而持续,产业互联网时代到来、移动互联网红利见顶的观点似乎刚在耳边响过,如今资本再次热浪翻腾。一位关注产业技术的投资人对第一财经记者笑称:现在谁敢说反对的观点?只能说都是“周期”,遵循规律,顺应趋势。
但摆在创业者与投资人面前的技术差距、高额成本、落地应用试错,仍是不可避免的挑战。动辄数百万美元的训练成本到底是否适合初创公司杀入?拥有更优牌面的互联网大厂真的能笑到最后吗?本轮AI热潮相较上一波深陷亏损泥淖的明星公司们发生了什么变化?第一财经记者对话多位行业人士,试图在AI产业进入新一轮热潮的节点,给出冷静视角下的观察。
AI投资人重新亢奋
AI行业重新火热,在多位投资人士看来,具体表现在大家对于AI行业终于达成了共识——做通用型大平台。
一家日常对接一级市场投资机构与创业项目的机构(以下简称“FA机构”),AI项目小组从2022年八九月便开始关注新的AI方向,当时生成式AI概念还未诞生,团队彼时暂将新方向定义为AI对内容行业的降本增效。
但那时,投资人群体尚未对AI行业形成一致认知,因此在推动项目过程中,不得不花费更多时间去教育投资人,或与对方一起探讨这个行业。单看TO B与SaaS赛道的投资人更多聚焦在商汤旷视等老一波AI逻辑的公司;关注TO C与TMT赛道的投资人多从传统互联网逻辑去考察创业公司项目的留存DAU(日活)等数据。行业并未形成统一的看项目的维度与标准。
2022年年底,文生图领域火起来,券商分析师密集发布AIGC(即人工智能生成内容)行业报告,国内投资人也开始关注跨模态或多模态的生成式AI。一夕之间,投资人群体关注点突然统一了——他们询问创业者“你们要不要做图?”“你们有没有文生图的能力?”
待到ChatGPT真正火起来,常把“技术性感”挂在嘴边、认为文字对文字这类项目不够性感的投资人,终于放下“偏见”,认识到文字仍是刚需,投入到寻找类ChatGPT项目的潮流中。
该AI项目小组对第一财经记者表示,由于生成式AI的爆火,投资人的选择风向一直在改变。但如今,大家不会像2022年10月、11月时,对生成式AI观点参差不齐,而是都对行业未来持有了信心。
这背后的根本原因在该AI项目小组看来,在于技术发展需要达到一个“节点”,开始向爆发性趋势走时,本没有关注这个行业的投资人也会被吸引。AI模型能力实际一直处在稳步提升发展的过程中,但当它没有一个落地应用出现时,市场上大众的注意力便不会被吸引,其中便存在一个认知迭代的过程。
去年年底到硅谷探访一圈的石允丰也持有相似观点,在他看来,目前湾区技术玩家——包括大公司与创业公司,也迅速达成了共识,新的通用型技术平台已经浮出水面,湾区优质创业项目估值基本都达到10亿美元级别,共识来得非常快,当然这也是在ChatGPT热度的带动下发生的。
算力或将成为追赶隐患
此次业界共识的主角大模型,成为AI未来确定的发展趋势。作为“大算力+强算法”的产物,搭建大模型的算力、算法、数据、硬件、工程化能力等,成为不同入局者竞争的重要指标。
此前,Meta首席人工智能科学家杨立昆(Yann LeCun)表示,ChatGPT“没有太大创新”,基本仍是基于谷歌2017年发布的Transformer神经网络技术。曾效力于谷歌的人工智能伦理学家玛格丽特·米歇尔(Margaret Mitchell)也表示,“我们大多数人都(对ChatGPT的爆红)感到意外”,“这项技术并没有推进任何的底层突破”。
对于该观点,石允丰对记者表示:“说得都对,但是,算法的核心要素没太大壁垒,数据的标注有壁垒,用户的反馈有壁垒,”谷歌与百度冲出来后,现在谁还觉得搜索有多高的技术难度?但一项技术突然火起来,是因为它发展到了一定程度,不难不代表没有突破。
所谓突破,在石允丰看来,包括算法创新、工程创新,以及面对未知目标投入的决心。当年OpenAI做决策,与今天行业做决策的难度是不同的,今天行业已经知道这个项目能成功,明白它将带来的商业价值。但当年OpenAI是冒着未知的风险在做巨量投入,所以今天他们获得了半年到一年的领先窗口期。
FA机构AI项目小组表示,所谓“没有明显技术迭代”,是指ChatGPT使用的仍是transformer——一个诞生了很多年的模型。但不能因为底层模型未发生质变,就说技术没有发展,如模型基础训练参数由十亿级别发展至百亿级别,其中需要巨量投入。另外,随着行业发展与社会资源投入变多,决定模型能力强弱的参数量也在直线上升。同时,伴随对模型算法与基础设施的优化,模型训练成本也在慢慢下降,这些都是进步的方面。
在宁畅副总裁兼CTO赵雷看来,ChatGPT最大的需求肯定是算力,若要实现理想化人工智能的算力需求,短时间来看也需要三个数量级的算力,至少是目前行业平均水平的百倍。另外,ChatGPT是一个TB级的运算训练库,目前需要几十到几百台GPU或几百台一个级别服务器的体量才能够做到。
云九资本执行董事沈文杰表示,ChatGPT展示内容的高效性和其“内嵌”的服务模式会推倒、重建很多商业模式,甚至可能包括当下最大的商业模式之一——搜索。算力成本可能是当下最棘手的问题,算力的总需求肯定会被推到远超当下全部的程度,需要算力+算法+商业模式共同解决这个问题。
壁仞科技方面也认为,ChatGPT的“爆火”对于国内算力芯片厂商而言,意味着未来将诞生一个具有巨大潜力的应用市场。当然,目前这一领域依然由国际厂商的成熟算力产品所垄断,国内厂商要想在这一领域实现突破,就要利用好自身优势,与国内的算法、模型开发者,以及应用开发者保持密切的合作,并根据应用市场的需求优化自身产品。只有这样,才能在大参数模型的大规模商业化进程中“分一杯羹”。
算法层面,赵雷表示,GPT是一套算法模式,经历GPT1至GPT3.5的发展,算法门槛仍存在,但并不高。深度学习或机器学习算法存在多种算法,每种算法对应不同领域,这方面中美差距或头部公司之间的差距并不大。
另外,赵雷称,除算力之外,另一个核心因素是训练模型库,100亿条人类的对话和10000亿条人类的对话,相同的算力下,后者需要更多的时间,但它的训练精度一定会更好。
巨头与创业者冲入技术军备竞赛
目前,行业已经将ChatGPT的成本问题算清楚:GPT3训练一次的费用约为460万美元,ChatGPT单轮对话平均费用在0.01美元至0.2美元之间。即便如今声名成功如OpenAI,其2022年收入3000万美元,但净亏损高达5.445亿美元。高昂的成本决定了这不是一项创业公司随随便便就能上牌桌的竞赛。
OpenAI创始人山姆·阿尔特曼(Sam Altman)此前曾表示,预计将来会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型,然后开放API供他人使用。
阿尔特曼认为,将来在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功,但这取决于它们能在“数据飞轮”上走多远。所谓“数据飞轮”,是指ChatGPT带来的最大变革——建立起用户真实反馈与模型迭代之间的飞轮,反馈越多,模型迭代速度越快。
FA机构AI项目小组也持有相似观点,他们认为在模型层与应用层中间还有存在中间层,其中将诞生面向垂直领域的API接口,或者面向垂类领域的具体应用。另在应用层,也是中国团队弯道超车的机会。
当下投资人群体也在苦恼寻找真正实现AI落地、帮助行业降本增效的AI应用,近期他们不是在排会、就是在项目投决会上。已有的AI项目已经不是“香饽饽”,一位投资人对记者称,他不喜欢改的,而喜欢新的,改良版本AI产品难以具备突出重围的特质。
FA机构AI项目小组认为,以目前国内的AI技术来说,能够做到80分地解决垂直场景下的问题,这类项目也是投资人希望在应用层看到的。
创业者们显然并未被即将付出的高额成本吓退,沉寂许久的AI领域人士们一夕觉醒。前美团联合创始人王慧文连续发布动态,称“伟大新时代,应该匹配一个全新生命体”。13日,其最新动态称要组队拥抱新时代,打造中国OpenAI,设立北京光年之外科技有限公司,出资5000万美元,估值2亿美元(约13.62亿元人民币),其个人不占股份,资金占股25%,75% 的股份用于邀请顶级研发人才,下轮融资已有顶级VC认购2.3亿美元(约15.66亿元人民币)。同时,王慧文称本轮只招研发。
王慧文之后,前搜狗CEO王小川也加入战局,称“正在快速筹备中”。他认为“OpenAI的成功,首先是技术理想主义的胜利。中国需要自己的OpenAI,就需要技术理想主义。大厂受自己的业务牵引,追逐资本热点的创业公司更动作变形。不止如此,这种理想主义还需要有爱国之心、商业智慧和学术尊重去获得政府支持,推动企业联盟和学术界协同。中国能诞生自己的OpenAI”。
此外,出门问问创始人兼CEO李志飞也发声评论称,2023年是AI大模型时代元年,如果把搞中国版OpenAI/ChatGPT“比作一场运动竞赛,那么2023年第一季度是报名阶段,目前的报名费是5000万美元起”。
大厂涌入、创业者崛起,行业似乎再一次卷入烧钱竞赛的状态。FA机构AI项目小组认为,所谓的“烧钱”更多聚焦在底层大模型层面的训练成本与技术研发投入,从这个角度来看,资金缺乏的创业公司相对来说没有大厂具备优势,可以做、但ROI(Return ofinvestment,投资回报率)不高。
但在应用侧,该团队称,当下的市场环境已经不是烧钱买量的打法了,反而更利于创业公司去想清楚具体落地场景,想清楚如何将技术产品化。
谈及大厂与创业公司之间的优劣势,石允丰对记者表示,中国平台型公司在这场战局里的优势在于,此前不够重视技术迭代,最终对这样犹豫的后果记忆犹新,所以此次反应非常快。而创业公司的优势在于更善于通过期权等激励措施吸引最顶级的算法工程人才。两相对比的话,在石允丰看来,大厂的牌面可能更大一些,但历史规律在于,牌好的人,未必能赢到最后。
本轮AI热潮变了吗?
冷静之下,本轮AI热潮与此前行业动态呈现诡异的相似——热点迸发,热钱涌入,大厂与创业公司层出不穷,最终由于缺乏规模化商业落地,或不了了之,或大幅亏损。
曾经名噪一时的AI四小龙,如今来看,仍未能摆脱长期亏损的泥淖。2022年三季度财报数据显示,云从科技前三季度累计亏损5.89亿元,逼近2021年全年亏损额的6.32亿元。商汤科技自2018年至2021年的亏损率分别为185.2%、164.1%、352.8%、365.5%。迟迟未能上市的旷视科技招股书显示,其在2018年至2021年上半年亏损金额分别为28亿元、66.43亿元、33.26亿元、18.65亿元。另一家冲刺上市失败的依图科技自2017年至2020年上半年累计亏损高达72.68亿元。
规模化变现难题直接扼住国内AI产业发展,据IT桔子数据,从融资交易事件来看,国内人工智能领域的风险投资在2021年达历史最高点,共832起,主要得益于政策的利好释放。2022年,AI行业投融资数量断崖式下跌。
寒冬之下,投资界与创业界呐喊“回归技术本质,不追求泡沫热点”。产业互联网的热度还没持续多久,如今,ChatGPT的热度再一次将从业者拉入了新一波轮回。这次技术浪潮,相较过去,真的有所不同了吗?
实际上,这也是当下投资人群体担忧的点,但他们也认为此轮AI行业相较2014年那波热潮是不同的。具体表现在当时的AI热点还停留在深度卷积神经网络层面,大家具备的AI能力有限,更偏向于一个试图去理解人的辅助角色。如果说那时的AI是缺乏想象力的“输入”,那么现在的AI便是“输出”。其次,当下经历过去AI技术浪潮洗礼,AI人才的视野也与过去不同了,行业见证过中国互联网浪潮与商业模式的运作方式。
曾投资爱彼迎、Pinterest的埃拉德·吉尔(Elad Gil)发表过对本轮AI潮流中的差异化分析,埃拉德称,尽管之前很多人工智能创业公司努力前行,但上一波人工智能的价值大多归于成熟企业而非创业公司,原因包括:其一,上一波AI浪潮创造的产品并未好到可以击败成熟企业已经构建好的刚性市场格局;其二,数据差异化与优势,在过去比现在更为重要,且今天想要训练出通用模型如GPT-3,是非常困难的;第三,只要老牌企业将AI与已有的核心受欢迎产品捆绑在一起,基于客户基数庞大的优势,他们仍然可以获胜。
而本轮AI浪潮的不同之处在埃拉德看来,包括:本次AI技术能力与优势大大增强,意味着更容易创造出10倍以上优势产品,来满足现有需求;新技术意味着初创公司可以为行业其他部分提供有价值的基础设施,具有广泛的采用与快速增长的应用场景;虽有明确的应用案例,但市场上成熟企业在这些应用领域并不强大,如总结或生成文本、图像对推广产品应用是必要的,由新AI技术以高保真方式实现,这种情况在之前的AI浪潮中并不存在。
即便如此,当下行业确实仍未探索出有效的商业化落地场景。赵雷表示,ChatGPT距离成为真正的人类自然语言助理还有五至十年的时间,现在大家去尝试、去参与内测,更多怀抱一种尝鲜或猎奇的心态,ChatGPT离实际业务变现或业务应用到生产力工具,还有非常长的路要走。
此前谈及AI赋能企业数字化转型过程中存在的多种挑战,一位咨询服务机构合伙人表示,主要有几方面:一是应用定制化、碎片化,大量的技术场景存在于需求的长尾中,AI泛化能力不足,针对不同应用场景建设投入成本居高不下,制约AI应用的进一步发展。其次是模型定制化,模型算法随着场景定制化不断变多,其使用在某种程度上依赖于资深数据科学家,导致许多AI应用无法大规模推广。
该人士认为,当前,人工智能已经走过了技术商业化的第一个阶段,即突破了“工业红线”, 让技术变得更加实用, 下一个阶段则是实现“规模化生产”,让AI真正改变各行各业。
但不可否认,投资与创业做的就是前瞻性布局,生成式AI的未来机会到底在哪里?赵雷认为,ChatGPT要真正实现商业变现或高盈利,最终还是要做成ToC产品,ToB的市场容量相对有限,但ToC市场拥有无限的人民群众,因此更看好它作为ToC产品的经济可行性。
FA机构AI项目小组表示,包括大模型在内的底层技术的制约,追赶起来并非线性增长关系,需要花费更长时间、更高成本投入。中国团队在应用层更具备弯道超车的机会——对应用进行模式创新,打造在C端更受欢迎的产品,反向进行产品输出,“当你卷不了技术的时候,你只能卷应用了。”
石允丰称,归根到底,生成式AI就像一场“炼丹”,知道了步骤不代表能炼出来,工程化是件复杂的事情。另一位希望匿名的投资人认为,B端需要等到技术发展至100%或者99%的成功率才会应用它,因此低配可控版是目前可试行的首选,行业会在低配可控领域把这件事情卷到底。