生成式AI：三块短板、两道难题、一个悖论

站长网2024-04-24 19:48:230阅

闫德利腾讯研究院资深专家

炼大模型，大炼模型

近年是全球风险投资的低潮，生成式AI（GenAI）却逆市而起，去年的融资笔数和融资额分别增长66%和400%(来源:CB Insight，如下图所示)，融资额高居所有细分领域第一位(来源:Dealroom.co)。去年美国前5大风险投资中，OpenAI、Anthropic(2笔)和Inflection AI三家GenAI公司占据了4个，融资额分别高达100亿美元、40亿美元、20亿美元和13亿美元，主要投资者是微软、亚马逊、谷歌和英伟达等巨头(来源:Crunchbase)。

2019-2023年全球GenAI的融资笔数和融资额

当下的GenAI热潮起源于美国产业界，实际上美国政府也高度重视，提出了“确保继续保持领导地位”的战略目标。在奥巴马时期，美国白宫发布《国家人工智能研发战略计划》（2016），特朗普时期(2019)和拜登时期(2023)分别对其进行了更新，从而形成了9大战略——长期投资、人和AI协作、伦理、安全、数据集、评估标准、人才、公私合作、国际合作。为推进战略执行和落地，美国白宫科技政策办公室(OSTP)相继设置了人工智能特别委员会(2018)和国家人工智能倡议办公室(2021)。

我国也炼大模型、大炼模型。今年一季度，全球前三大GenAI风险投资中，我国占其二——月之暗面10亿美元A轮融资和MiniMax6亿美元融资。电信运营商、手机厂商、家电厂商、汽车公司、软件公司、AI公司、互联网公司、电商等各类型的企业纷纷涉足，已有117个大模型通过国家生成式人工智能服务备案。大模型成为大厂标配。不过并没有短兵相接的“百模大战”，反而颇有井水不犯河水之意。

三块短板

我国人工智能位居世界前列。但也存在尚待补齐的短板，集中体现在算力、数据集和人才三个方面。

一是算力。GenAI以算力堆积实现智能涌现，其成功依赖暴力美学。根据Jaime Sevilla等人的研究（2022），在前深度学习时代(1952-2009)，算力需求每21.3个月翻一番，符合摩尔定律;在深度学习时代(2010-2022)，算力需求加快到每5.6个月翻一番。如下图所示。根据THE DECODER披露(2023)，GPT-4的每秒浮点运算次数(FLOPs)达到2.15×10^25，一次训练成本6300万美元。

里程碑机器学习系统的训练算力需求

来源:Sevilla J， Heim L， Ho A， et al. Compute trends across three eras of machine learning.2022.

在机器学习图形处理器领域，英伟达占有95%的市场份额（来源:New Street Research，2023）。英伟达的A100和H100芯片是训练大模型的“金刚钻”，具有不可替代性。由于美国对华GPU限令，我国面临卡脖子现实。

二是数据集。我国数据规模大。根据国家互联网信息办公室《数字中国发展报告（2022年）》，2022年我国数据产量8.1ZB，全球占比10.5%，位居世界第二。这被看作发展相关产业的优势。然而，规模优势不足以弥补质量欠缺。不管把多大数量的马车连续相加，也决不能得到一条铁路(熊彼特，1934)。数据质量至少同等重要。在Hugging Face的高质量数据集中，英语以37.7%的比重位居第一位，中文仅占3.2%，和波兰语并列第九(来源:OECD，2023)。如下图所示。我国数据集的质量仍有待进一步提升。当然，这非一日之功，需要历经岁月的积累。

三是人才。自1966年以来，全世界共有77人获得图灵奖。其中只有一名华人——姚期智（2000）。我国计算机科学的历史积淀尚有不足，所幸近年进步很大，成为美国最大的竞争对手。根据MacroPolo数据(2024)，全球最顶级(前2%)AI研究人员的原籍国中，我国以26%的比例逼近美国(28%)，位居第二位。在顶级(前20%)AI研究人员的原籍国中，我国有47%，远超美国(18%)。但仍有隐忧，在最顶级(前2%)AI研究人员的就业国家中，我国仍位居第二，但仅有12%，远落后于美国(57%)。如下表所示。GenAI高度依赖人们的创新能力。如何吸引全球顶尖人才来华创业、就业，是需要努力的方向。

全球AI人才的分布比例

来源:根据MacroPolo（2024）数据整理

两道难题

每次创新都不是轻而易举的，都需要破除很多困难，遭受人们的质疑。当前的GenAI面临以下两个比较突出的问题。当然，只有发展才能解决问题。

一是缺乏杀手级应用，面临商业化困难。伟大的时代，必有杀手级应用。例如PC时代的Office，桌面互联网时代的搜索，移动互联网时代的手机支付。GenAI是世界潮流，然而还处于应用推广的早期，美国企业的AI采用率仅有5.4%（来源:人口普查局，2024）。大模型燃烧的是美元，产出是更少的美元。作为全球最性感的GenAI公司， OpenAI 有会员订阅付费、开发者付费和微软分成三种盈利模式，自成立以来的收入累计不足20亿美元(来源:Finbold)，却耗费了113亿美元融资。微软的GitHub C o p i l o t也采用会员订阅模式，用户需支付10美元月费或100美元年费。但因计算成本高，微软平均每月在每个用户上的亏损超过20美元，重度用户高达80美元(来源:华尔街日报，2023.10)。GenAI尚不具备传统软件的规模经济，需要通过给用户巨额补贴来培育市场。国内用户则更喜欢免费，为优质内容和知识付费的习惯尚未形成，会员订阅不成主流。GenAI的商业模式仍处于探索的初期。

二是未能显著提振平台企业业绩，云和芯片是最大受益者。GenAI的兴起为我国平台经济注入了一线生机，各大平台纷纷下场推出大模型。然而，GenAI的火爆未能显著提振平台企业的业绩，我国互联网平台仍处于萎靡期。自ChatGPT发布以来，尽管叠加了疫情结束、国家支持等利好因素，我国互联网公司的市值仍有涨有跌，相当大比例的企业跌幅较大，如下图所示。

自ChatGPT发布以来我国十大互联网公司的市值涨跌情况

来源:根据雪球财经数据整理，数据截止2024年4月11日

大模型训练需要耗费大量算力，云和芯片公司是直接受益者。根据A16Z（2023）数据，GenAI总收入的10-20%将流向云服务提供商。其中，创业公司80%-90%的早期融资都用于向云计算平台购买算力。微软、亚马逊和谷歌是全球三大云基础设施服务商，也是最活跃的GenAI投资者，就不足为奇了。自ChatGPT发布以来，英伟达市值增长457%，成为全球市值第三高的公司，是最大获益者。

第四次工业革命的悖论

自1956年达特茅斯会议提出“人工智能”术语以来，人工智能的发展起起伏伏，经历了多次炒作周期。这次似乎不一样，即使对怀疑论者来说，ChatGPT的发布也意味着人工智能技术的重大突破。人们兴奋大呼:人工智能驱动的第四次工业革命正在到来!

工业革命的影响是全面的、深刻的、长远的，“综观世界经济史，工业革命是唯一一件大事”（Irad Kimhi，2006）。第四次工业革命如果到来，人们必会踌躇满志，经济必会生机蓬勃，生活必会欣欣向荣。然而，好像并不是。这是一个悖论。对此，时间可以给出答案，我们不必争论。有四个事实予以说明。

第一，人们对“智能”怀有与生俱来的痴迷，人工智能的发展充斥着乐观思潮。谢耘（2023）对其评价是:“志存高远，盲目乐观。”达特茅斯会议的主要参与者就曾作出大胆预言:

1958年，艾伦·纽厄尔和赫伯特·西蒙（两人共同获得1975图灵奖）:“十年之内，数字计算机将成为国际象棋世界冠军” “十年之内，数字计算机将发现并证明一个重要的数学定理”。

1965年，赫伯特·西蒙（1978年诺贝尔经济学奖获得者）:“二十年内，机器将能完成人能做到的一切工作。”

1970年，马文·闵斯基（1969图灵奖获得者）:“在三到八年的时间里，我们将得到一台具有人类平均智能的机器。”

第二，自2009年以来我们时刻在“经历”第四次工业革命（也有人说是第三次工业革命）。在中国知网上，以“第四次工业革命”和“第四次产业革命”为题名的文章分别有386篇和48篇（不计入2024年），如下图所示。微电子(1984)、云计算(2012)、物联网(2016)、大数据(2016)、区块链(2017)、工业互联网(2017)、新基建(2020)等，都曾被赋以“第四次工业革命”的使命。现在轮到GenAI了。这意味着，GenAI需要达到与蒸汽机、发电机、内燃机、计算机和互联网一样的高度。

中国知网以“第四次工业（产业）革命”为题名的文章分布

第三，国外一般把GenAI（或AI）比作智能手机、云计算、互联网等特定技术，且通常使用“可能”“之一”等词汇。例如:

黄仁勋（2023.2）:ChatGPT是“the iPhone moment of AI”， OpenAI 所做工作是“one of the greatest things that have ever been done for computing”。

比尔·盖茨在《The Age of AI has begun》（2023.3）中表示，图形用户界面和GPT是他一生中见证过的两次革命性技术展示，并指出:“人工智能的发展与微处理器、个人电脑、互联网和移动电话的诞生一样重要。”

亚马逊CEO贾西致股东信（2024.4）:“Generative AI may be the largest technology transformation since the cloud(which itself， is still in the early stages)， and perhaps since the Internet.”

第四，历次工业革命都不是预测的结果，而是后人的总结。第一次工业革命（1760—1840）结束40年后，术语“Industrial Revolution”才在阿诺德·汤因比的推动下为大众所知;第二次工业革命(1870—1914)结束40年后，经济学家才开始使用“Second Industrial Revolution”，到1969年戴维·兰德斯《不受束缚的普罗米修斯》才标准化了其学术定义;第三次工业革命尚无统一认识，暂且不表。这颇有“伟大不能被计划”的味道，让我们期待第四次工业革命不同。

本文写作中，得到马骏、马源、石光、王明辉、李勇坚、白惠天等人的支持和帮助，在此一并感谢。

生成式AI三块短板两道难题一个悖论

0000

评论列表

共(0)条

相关推荐

站长资讯
AMD收购开源AI软件企业Nod.ai 加速AI硬件优化
文章概要:-AMD收购创立仅3年的Nod.ai，显示其正竞相AI芯片快速增长的市场。-Nod.ai软件可加速AI模型部署于AMD各类硬件平台。-AMD力图利用Nod.ai的工程人才，提升开源开发者声誉。AMD宣布计划收购Nod.ai，这是一家专门针对高性能硬件优化人工智能软件的初创公司。
站长网2023-10-11 16:51:24
0000
站长资讯
Hugging Face、GitHub 等联合呼吁欧盟AI立法中不该阻碍开源创新
由六家开源人工智能利益相关者组成的联盟——HuggingFace、GitHub、EleutherAI、CreativeCommons、LAION和OpenFuture——呼吁欧盟政策制定者在最终确定欧盟人工智能法案时保护开源创新，该法案将成为欧盟人工智能法案的最终版本，号称是世界上第一部全面的人工智能法。
站长网2023-07-27 11:23:05
0000
站长资讯
ECOGEN:一种用于生成逼真鸟鸣的深度学习新方法
**划重点:**1.🌐利用深度学习技术，加拿大蒙克顿大学的研究人员开发了ECOGEN，这是一种能够生成逼真鸟鸣的创新方法，旨在帮助生态学家更好地监测和保护世界上一些最稀有的鸟类。
站长网2023-11-22 16:07:39
0000
站长资讯
亚马逊AWS宣布2024年2月1日开始向公共IPV4地址收费
亚马逊宣布将从2024年2月1日开始对所有公共IPv4地址收费，每个IP地址每小时收费0.005美元。
站长网2023-08-01 15:42:13
0000
站长资讯
潮汕女生要去IPO敲钟了
把自己的爱好做成一家上市公司，朱嘉盈快要实现这个梦想了。投资界-天天IPO获悉，近日，日日煮食品集团DayDayCook（简称“日日煮”）向美国证券交易委员会(SEC)递交F1文件，拟在美国纽约证券交易所(NYSE)上市。据悉，日日煮这次计划通过上市融资筹集最少4000万美元。
站长网2023-06-24 14:17:05
0000