查看原文
其他

顶尖投资人对大模型的判断:Scaling Law仍未达上限,没出现Killer App的根因是能力不足

明说开源
2024-08-28

Editor's Note

Atom Capital是一支由连续创业者和投资人成立的新锐风险投资基金,专注于AI领域的早期投资,其创始合伙人Melissa Yang与业界创新企业创始人、投资人同台对话,针对生成式 AI 的发展趋势、潜在挑战以及新时代创业机遇等话题分享洞察思考

The following article is from Atom Capital Author 科技最前沿的

写在前面


5月29日-30日,「2024 亚马逊云科技中国峰会」在上海隆重召开,AI是此次峰会上最受关注的话题,来自全球的人工智能技术专家、行业领袖以及创新者汇聚一堂,围绕AI技术的全球前沿创新与应用实践等话题展开了热烈的交流与分享。







 01  自我介绍

Q:非常高兴邀请到Melissa参与本场圆桌讨论,请您给现场观众做一下自我介绍?

Melissa:大家好,我叫Melissa,我的身份既是个创业者,也是个投资人。我之前是美国和中国的连续创业者,最近几年在专业做投资。我在西雅图创业做了一家SaaS公司,被HomeAway收购上市。最近的一次创业是联合创办途家网。Atom Capital是我去年创办的一家基金,主要是围绕新一代的AI技术应用和infra做早期投资,过去一年我们在硅谷和国内都有投资项目。

 02  大模型迭代路线

Q:您对模型下一步迭代的路线有何看法?市场接下去是继续通过Scaling Law卷模型性能还是有更多力量去做Model-Product-Fit的生产可用模型?Scaling Law被封为圭臬,但对于它是否已经达到瓶颈目前业界也有很多争议,您怎么看?

Melissa:目前大模型领域最核心的工作还是提高模型的性能(以复杂推理能力为代表)在这个性能达到上限之前,我认为大家还会聚焦在性能层面,而不是优化成本。因为在性能达到上限之前,很难确定你优化的是否是最核心的东西。

虽然去年硅谷就有很多人在讨论Transformer架构的上限,但我们看到目前Scaling Law还没有达到瓶颈,大家还是沿着这个路线在不断增加规模。

Scaling Law往下走主要面临几个限制:算力、数据和数据中心。

  • 算力问题主要需要依靠一些商业模式的探索和创新,做好大模型的商业化,从而可以保证可持续的在算力层面的投资来解决。

  • 数据层面,有很多人担忧目前已有的数据已经不够大模型训练了,但这个问题是有解决方案的,比如通过人工合成多模态数据的方式来解决。

  • 最后是数据中心,这也是个很挑战的问题,因为随着多模态的增加,视频的数据是非常大的,尤其现在多模态下很多视频数据是生成性的数据,跟youtube不一样,youtube可以做Cache, 生成性视频无法做cache, 导致数据量大了很多倍,数据中心的基础设施也会面临很大挑战。

 03  应用生态

Q:作为深入观察中美两地AI初创企业的一线投资人,您怎么看中美两个市场上Gen AI应用生态?从2B和2C维度来看,我们观察到国内市场上2C的应用生态并不输美国,而海外的2B AI应用远比中国繁荣。两国在2B和2C产品特性、市场策略也有所不同,想听听您对这个问题的观察和思考?

Melissa:我认为相比中美以及2B、2C这样的维度,目前决定了应用生态的核心还是AI的能力有多强、能解锁多少应用场景。我们看到,大模型目前的能力已经可以解决一些应用场景,但还有很多场景,目前AI的能力达不到。举个简单的例子,我是技术出身,花了挺多时间看AI编程这个方向,因为编程占了ChatGPT三分之一的应用场景,是目前大模型很重要的一个应用领域。在这个方向上,目前大模型可以做到的是Github Copilot这类辅助人去写程序的场景,这也是中国、美国都有很多人在做的方向。但是如果我们想做成一个Code Agent, 让AI直接从需求产生出一个完整的产品的代码,或者让AI在一个复杂系统中修改代码,这件事情无论在中国还是美国,现在都做不了。

所以,我们认为,很多场景的解锁是依赖AI能力的发展,并不是中美或2B/2C的问题。

回到中美的差异,我个人在中美都创业、投资过,对两边的市场都比较了解,我认为中美有两个比较大的区别:

  • 产业生态上,美国的水平分工更加成熟。很多小公司专注于某个领域或者某个点去创造价值,在美国就可以活得很好。而在中国,大厂倾向于上下游通吃。

  • 中美投资机构对初创公司的偏好存在差异。如果一个项目只是在某个点上做得很好,美国投资人可能会考虑投资,但中国的投资人可能会觉得太小而不投。这背后可能也跟中美在退出路径上存在差异有关,美国有非常成熟的并购文化,大量中小公司是通过并购退出。相比而言,中国并没有成熟的并购文化,投资人更希望一家初创公司“做大做强”上市退出。

回到产品上,我认为中国在2C领域有一个很大的优势是过去十几年中国互联网的高速发展和“卷”,让国内的团队对于人性、用户心理有非常好的洞察和积累,所以我们可以把产品和运营做的非常好。举个例子,大家比较熟悉的AI陪伴领域的头部产品C.ai和星野。C.ai是美国团队,他们的更多精力还是放在底层大模型的打造,C端产品上显得有些“放养”,在设计和运营上没有那么精细。而国内大模型厂商Minimax所开发的星野,在产品的设计与运营上明显更加精细,比如C.ai完全依靠文字交流,而星野会更加注重视觉、声音等多模态内容的融合带给用户更好的体验。同时在玩法和商业模式上,星野也进一步与游戏融合,构建了一套卡牌系统,用户之间也可以相互交易卡牌,相当于同时为平台上的创作者打造了一个经济系统。这些产品和运营的设计是我们国内团队擅长的。

 04  应用场景


Q:我们发现,目前Gen AI应用不论2B还是2C核心都在解决两条曲线问题,也即在「技术方案能达到的效果-成本曲线」和客户的「需求满足度-付费意愿曲线」之间寻找交叉点, 您认为哪些场景的主要矛盾是第一条曲线,哪些场景的主要矛盾是第二曲线,哪些场景已经实现了2条曲线的交汇点?

Melissa:我对这两个曲线的理解,可以把它看成经济学里的供需关系曲线。一条线描述的是供给,一条线描述是需求,这两者的交叉点是指用户愿意支付的价格已经可以cover技术的成本。

我们观察到,现阶段AI还没有出现任何的Killer app(杀手级应用), 即使是ChatGPT——从日活角度去看,它也构不成一个Killer app. 这是为什么?是技术太贵大家用不起?还是技术不足够好用、不能满足用户的需求?我认为现阶段的主要矛盾还是后者,是大模型能力的问题。而不是前者——从历史上来看,好用的技术的成本问题在规模化使用之后都可以有各种方法解决。

举几个例子,比如2B领域,我们研究过大模型在法律领域的落地,我们访谈的一些律所,他们对于大模型准确率的要求是95%以上,现在大模型的幻觉导致做到这个准确率还是比较困难的,这是没法用起来的核心原因。在2C领域,情感陪伴是目前AI应用流量最大的方向之一,但当你仔细去研究那些产品,你会发现大部分产品做的还是“擦边”,一方面因为这是用户的刚需,另外一方面,也是因为这类产品不需要对用户有过多的了解,在现阶段大模型的memory、学习能力都不够好的情况下,也只能做好这类产品,目前大模型的能力还无法达到能做出智能助手、Her的水平。

 05  投资及创业者洞察

Q:您所在机构投资策略是怎样的?喜欢什么样的团队、核心关注哪些指标?

Melissa:机构的投资策略跟技术发展的阶段是相关的。技术发展有探索期,突破期和成熟期,我们判断目前这轮AI技术还处在探索期,技术还在发展中,商业模式和落地场景都有很大的不确定性。在这个阶段,我们认为,人比事更加重要一些。从看人的角度,我们认为有两点比较重要:

  • 一是对大模型有一定了解的新一代AI native团队,对于大模型能做什么、不能做什么、未来能做什么有个清晰的认知和判断,这样才能最大化利用大模型的能力去解决问题。

  • 二是团队对要解决的问题/场景有清晰的认知。我们希望创始人对于某个行业有深刻的积累和洞察,能够发现其中长期未解决的核心问题是什么,用好新的AI技术去解决。把这个问题想清楚了,公司的长期目标、商业价值以及产品的形态和发展路径也就相对清晰了。

另外,我们比较看重创业者的几个素质:快速学习能力,战略能力以及创新能力。Q:最后,请您分享一句话,送给在座的创业者们。Melissa:创业不要怕小,关键是找到真正的价值点,最大化利用大模型能力来创新地解决问题。


亲爱的读者们,不星标《明说开源》公众号,不仅会收不到最新推送,还会看不到主理人精心挑选的封面大图星标《明说开源》,不错过每一篇最值得阅读的开源文章。主编:李小明@明说开源

继续滑动看下一个
明说开源
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存