大模型时代,创业者的机会在哪?企业级大模型怎么做?“杀手级应用”何时诞生……3月28日下午,在“2024创业黑马集团AI战略发布会”现场,360董事长周鸿祎与金沙江创投主管合伙人朱啸虎围绕“每一家中小企业都有AI梦”的主题展开对谈。
周鸿祎在对话伊始就表示,自己与朱啸虎在很多观点上“英雄所见略同”,因为大家都是投过很多公司,也拥有血淋淋的教训。
“我觉得有些话是以讹传讹,非要强行地把我们刻画成‘特实用’(的形象),一副赚钱的嘴脸,叫实用派。有些公司冰清玉洁,出淤泥而不染,也不想赚钱,要梦想改变世界,就称为信仰派。这完全是胡说八道。”周鸿祎认为,今天所有在推动人工智能发展的都是AI的信仰派。他表示,自己在探索AI的场景应用,朱啸虎在投资AI的创业公司,大家都是用实际行动在身体力行地推动AI的发展。
此外,朱啸虎与周鸿祎均指出,市场对聊天机器人过于迷恋,聊天机器人肯定不是AI时代的杀手级应用,因为它对用户提出了更高要求。
图片来源:每经记者 李少婷 摄
不建议创业者“卷”通用大模型
在周鸿祎看来,AI在中国的发展并非只有一条路径,就如同尽管OpenAI受到了广泛关注,但美国的AI发展亦非仅有OpenAI一条道路。
“(在)中国(市场),我非常坚信有第二条路,就是走场景化之路。AI如果永远都是说十万卡(参数规模)起‘玩儿’,或者百万块卡才能干这件事儿,那这个成本就高到无法产生工业革命。”在周鸿祎看来,通过走企业级应用路线,把大模型做小、做专,让大模型的成本从高昂的“原子弹”转变为人人可负担的“茶叶蛋”,让央国企、大型企业和中小企业都用得起,进而实现真正的数字平权、拉平智能鸿沟,同样是在推动人工智能综合发展。
周鸿祎强调,不建议创业者去做通用大模型的创业,“如果有一个创业公司真的很有理想,也确实遇上了‘金主爸爸’,给投了十亿美金,而且不要求回报,不要求短期赚钱,想怎么花就怎么花,那没问题,我认为可以去做”。但对绝大多数创业者而言,在资金有限的情况下,去涉足通用大模型,将面临来自巨头的激烈竞争,并且在AGI的竞争中,算力是一个“卡脖子”问题。另一方面,还面临着头部开源模型的竞争压力。“处在这个夹缝之中,作为创业者,光有一个理想和一个口号是不可能成功的。所以如果没有足够的资金,没有足够的技术积累,去碰通用大模型可能是没有结果的。”
朱啸虎同样不建议创业者投身通用大模型的创业中。
3月27日,美国AI初创公司Databricks宣布其通用大模型DBRX将开源。Databricks表示,该大模型花费了大约1000万美元和三个月的时间来训练,性能已经超越GPT-3.5。
朱啸虎由此展开表示:“通用大模型是个先行者劣势的商业模式,先行者在前面试错,成本巨高无比。但是在后面跟进的,成本可能越来越低。今天减一个零,再过一年可能还要减一个零。”
基于当前的创业融资环境,朱啸虎认为,“跟在后面”是更舒服的状态。回顾过去30年,从PC电脑时代到PC互联网时代到移动互联网时代,中国始终在后面跟进,且在迭代曲线放缓后,在工业实践中,中国相较而言具有显著优势。因此,对创业者而言,在通用大模型上进行试错毫无意义。相反,积极抢占用户、场景和数据更有意义。
对于众多已有场景和用户的创业者而言,实现“+AI”相对简单。相反,很多通用大模型公司想尝试切入这些场景和用户是很难的,因为他们缺乏对垂直场景和销售业务的深入理解。而这些正是创业者的独特优势。
破局企业级大模型:越做越专
企业级大模型被认为是更加可行的探索路径。
周鸿祎认为,大模型的路径并非只有越做越大一条,也存在另一种路径,即把大模型越做越专。在企业的定向应用场景中,只需要大模型专注于解决该场景下的专有问题,不需要大模型具备创作古诗、解答奥数题等多样化能力,而仅需专注于其核心任务。基于此,利用企业专有的数据和专业知识进行训练,将大模型与企业的现有业务系统进行深度整合,从而真正融入企业的运营环境中。“我们用实践例子证明了,在这个单项能力上是可以超过GPT4的。”
对企业而言,未来的企业级大模型,不再需要依赖千亿级别的参数规模,百亿甚至几十亿级别的大模型已经足够。在当前,几十亿、百亿级别的大模型在国内外均拥有丰富的开源选择。“换句话,大模型今天已经不是白菜价了,大模型已经免费。”周鸿祎说。因此,在企业实践中,真正的矛盾焦点不再是如何选择大模型,而是如何确定应用场景、积累相应知识,实现大模型与企业业务的结合。
图片来源:视觉中国-VCG31N2008743681
朱啸虎也认同,大模型是像大学一样的“基础设施”,如同各个大学各有所长,大模型也同样如此。
此外,朱啸虎提到,OpenAI在GPT4中已经开始使用计算机合成数据来提高模型的能力,有消息称GPT5中合成数据的比例已达到90%。他的判断是,靠计算机合成数据反复来提高大模型的能力,很快会碰到上限。
“任何一个时代都有永动机的谬论,AI时代的永动机谬论就是能够靠计算机合成数据来反复提升模型的能力,我觉得很快会到瓶颈。这也是为什么需要这么大的(算力),因为它本身效率非常低,很多合成数据可能都是没有信息价值的。”因此,朱啸虎认为中国的AI大模型及应用的追赶前景乐观。随着上述瓶颈的出现,迭代曲线放缓,将为中国AI产业发展提供新机遇。
对于没有融到资的创业者,周鸿祎认为,企业市场依旧是很好的机会。他表示,中国的企业市场独特之处在于其碎片化特征,按照地域、行业以及企业规模的不同,被划分为多个细分市场。这种分割为创业者提供了宝贵的生存空间,即使对行业巨头而言,也难以实现全面的垄断。与此同时,企业始终愿意为降本增效投入资金。
周鸿祎表示,过去,企业软件市场一直“难赚钱”,是因为给用户带来的降本增效价值没那么大。然而,如果AI能够真正找到为企业带来显著降本增效的路径,企业会愿意为此付费。
市场过于迷恋聊天机器人
在场景的选择上,小而专的场景被认为更有机会。
周鸿祎的建议是,场景的选择,一定要选择非常具体的小切口,避免宏大叙事。例如,开发医疗或教育大模型的表述过于笼统,必须把行业“打开看”,寻找50到100个非常具体的场景。创建医疗大模型并不现实,但可以在如医生听写、病例润色和生成等具体场景上寻找机会。
其次是建立大模型在专业领域的深度,构建知识壁垒。周鸿祎认为,大模型是把网上的“亮知识”找到,但在企业内部存在着大量“暗知识”,这些知识难以在网络上找到,甚至可能连企业老板都无法全面掌握。因此,若能探索出有效方法,将具备行业深度的“暗知识”纳入大模型的训练,其训练成果将更加显著。否则,很容易被通用大型模型取代。
此外,周鸿祎认为,当下大家过于迷信聊天机器人。在他看来,OpenAI推出聊天机器人ChatGPT,让大家容易接受。但在企业内部,聊天机器人并不是最好的人机界面。“在企业里,大模型有点像一个发动机,但用户要的不是发动机,用户要的是车。所以得想办法,把大模型通过各种方法和企业原来的业务系统融在一起,这样这个大模型才不是游离在企业信息系统之外的孤立的问答机器人。”
对此,朱啸虎亦指出,问答机器人肯定不是AI时代的杀手级应用,因为它对用户提出了更高要求。用户需思考如何提问才能获得最佳答案,这对用户而言是一个挑战。“AI时代,尤其在消费端应用,肯定不是ChatGPT这种问答式机器人,肯定是要让用户更懒、更好用、更方便的,才会成为AI时代的杀手级应用。”
周鸿祎也表示,自从ChatGPT首次亮相,市场就特别迷恋prompt(注:提示词),有人甚至预测,未来prompt engineer(注:提示工程师)可能会成为一种新兴职业。“但是prompt简直是反人性,就是很难写。每次我写一样的东西,它给我的结果也是不一样的。人跟人之间互相都很难理解,更何况和机器之间。所以在做深度应用时候不要迷信prompt,prompt反而是现在很多企业应用大模型难度最大的问题。”
C端应用场景比功能更能打动用户
对于To C的AI创业者来说,又该如何优化商业模式,实现不烧钱或者说不太烧钱?
在周鸿祎看来,答案是要先找杀手级的场景。他认为,市场上所有的大模型,去年成功的地方在于赶上了GPT3.5,不成功的地方在于To C业务上,都只做了聊天机器人,但聊天机器人并非用户真正需要的场景。
周鸿祎进一步表示,当大模型厂商向用户承诺,提供人工智能全场景应用时,用户往往对其抱有较高的期望。然而,当前的大型模型在实际应用中势必会出现部分问题回答不及用户预期的情况,无法满足用户的期望,进而也导致大模型在用户端难以形成良好的口碑。
放弃将自己定位为全功能AI产品,选择专注于能够真正打动小众用户的特定场景或垂直场景,是周鸿祎认为的解决之策。“功能是打动不了用户的,只有场景能打动。”周鸿祎认为,应当从需求场景出发,创造应用级的产品来解决这些场景中的需求。而大型模型则作为支撑,隐藏在背后解决这些问题。
朱啸虎则认为,目前大模型在消费端的具体应用仍需进一步观察。“我觉得可能要到明年,直到iPhone都用了大模型以后,一个手机都有几个大模型以后,可能才会发现到底C端应用会在哪一点引爆。”但总体的方向一定是让消费者更方便、更容易获取的服务。但目前,大模型尚未出现有明确高频刚需的场景,“C端应用场景背后的逻辑始终是一样的:你到底是不是一个刚需、高频的入口级的场景,不是这样的场景最终还是没法防守的”。