中国生成式AI生态的崛起:投资热潮与未来展望

·

在全球生成式人工智能(AI)的发展格局中,中国已成为除美国大型科技平台以及加拿大、法国少数主要参与者之外,拥有最多大语言模型(LLM)及应用开发者的国家。中国的生成式AI生态充满活力,涵盖了大型科技平台、社交媒体公司以及近年来涌现的一批资金雄厚的初创企业。

本文将深入探讨中国生成式AI领域面临的机遇与挑战,分析其如何推动中美科技竞争,并探讨其与AI治理政策之间的关联。对政策制定者而言,理解中国生成式AI领域的实际发展动态至关重要——这一领域主要由私营企业和风险资本推动,绝大多数创新活动由市场主导,且中国企业及研究者仍深度参与全球技术生态。


中国生成式AI生态的现状

中国的生成式AI领域正处于快速扩张和演变阶段。既有科技平台不断迭代模型,新创企业纷纷涌入,投资者则在努力理解商业模式、应用场景和盈利前景。自2023年9月以来,该行业已发生显著变化。

目前,中国生成式AI产业仍处于发展初期。各类企业正在寻求投资,开发、微调并迭代大语言模型,而终端用户则在尝试在企业网络中部署不同应用。与美国及其他发达市场类似,中国企业渴望在业务流程中利用大语言模型的优势,但对选择特定平台或模型仍持谨慎态度。

未来六到九个月将是中国AI企业发展的关键时期。模型开发将趋于稳定,性能基准测试成绩将提升,与OpenAI、Google和Anthropic等全球领先者的差距将缩小。与此同时,基础设施投资周期将进入新阶段,需要更多资源以跟上西方模型的发展步伐。

与中国AI企业的广泛讨论表明,行业将见证越来越多旨在解决实际问题的企业级部署,并开始展现出生产力提升的效果。在此期间,中国AI开发者还需应对美国对先进GPU的限制,并展示实质性收入以证明硬件投资的合理性。

👉 获取更多AI领域前沿洞察

主要参与者与市场格局

中国AI发展环境的一个显著特点是分散化,目前约有50家企业正在开发大语言模型。这与美国形成鲜明对比——在美国,少数资金雄厚的大型平台(如Google、Meta和AWS)以及初创公司(如OpenAI、Anthropic和Inflection)主导市场。

这种分散格局导致一些行业领袖,如百度CEO李彦宏,质疑是否需要这么多模型。李彦宏认为,中国可能只需要两三个优秀模型来推动企业级生成式AI的采用。

然而,新市场参与者仍在不断涌现,这表明行业并未完全采纳这一建议。过去六到十二个月中,一批新AI初创企业获得了关注和融资,这些企业大多有大型科技公司和风投支持,估值达10亿美元,并拥有行业背景深厚的工程师团队。

这些企业中,智谱AI、MiniMax、百川智能、月之暗面、01.AI、阶跃星辰和元器优选等已迅速崛起成为中国生成式AI领域的核心力量。一批重要的国内风投机构继续投资该领域,包括创新工场、真格基金、深圳创投、顺为资本、红点中国、华为哈勃等,以及阿里巴巴、腾讯、小米、蚂蚁集团、美团和金山软件的投资部门。

企业应用与商业化进展

尽管这些企业的收入潜力尚未得到完全验证,但企业级应用已经开始。百度等公司开始报告声称直接来自生成式AI应用的收入。

2024年2月底,百度在财报电话会议中表示,生成式AI和基础模型为其AI云业务贡献了6.56亿元人民币收入,占其第四季度总营收84亿元的相当比例。百度指出,云服务业务已拥有超过26,000家文心一言企业用户,包括三星中国、联想和荣耀等公司。

2024年4月,百度声称文心一言已有2亿用户,8.5万家企业使用其云平台并创建了19万个AI应用。同月,百度发布了三款新开发工具,以促进AI代理、应用和模型的创建。

阿里巴巴在2024年5月声称,其通义千问模型正在9万家企业中使用,涵盖医疗、交通、航空航天、采矿、游戏和PC等多个行业。公司还表示,超过220万家企业通过其企业通讯应用钉钉使用通义千问。

监管环境与计算资源挑战

AI企业在寻求盈利过程中面临两个关键障碍:监管环境和计算资源获取。

中国网络空间监管机构最初对该领域实施了严格监管,但现阶段对大语言模型的监管已趋于稳定。国家互联网信息办公室(CAC)在过去六个月中批准了40多个大语言模型发布,并向1,432个独特的面向公众的AI驱动应用发放了运营许可证。

尽管尚未有正式的许可模型列表,但CAC已向所有主要平台和一些重要初创企业发放了书面批准,如李开复的01.AI。关于哪些大语言模型获得许可的困惑可能会持续,因为CAC仍在确定其长期许可制度的要求,包括对外国产大语言模型的处理。

有迹象表明,中国正在努力平衡鼓励AI创新与减少对国外大语言模型依赖之间的关系。2024年5月底,中国信息技术标准化技术委员会TC260发布了生成式AI安全标准草案,支持实施去年发布的CAC AI法规。

值得注意的是,新草案删除了要求AI工具提供商只能使用已在当地注册的第三方基础模型的条款。如果保留这一条款,可能会形成对外国产大语言模型的事实禁令,因为这些模型不太可能向CAC注册。监管机构虽然仍然关注外国产大语言模型的安全性和一些中国AI企业对外国模型的依赖,但这一省略表明,至少目前,监管机构似乎更关注禁止外国产大语言模型对创新的负面影响,而不是这些模型的安全性。

硬件挑战与解决方案

除了监管障碍,中国生成式AI企业还需要在未来六个月内确定如何保持对先进GPU的可靠获取,以训练前沿AI模型。美国官员在2023年10月收紧了先进GPU的出口规则,商务部长吉娜·雷蒙多在12月首次明确表示,控制的目的包括减缓中国公司训练前沿AI模型的速度。

美国GPU领导者英伟达以及其他公司(如英特尔和AMD)为中国市场设计合规GPU的努力面临多重挑战,英伟达新款H20、L20和L2 GPU的性能降级足够显著,以至于国内科技巨头华为的昇腾9XX系列数据中心芯片在某些基准测试中表现优于英伟达产品,使中国主要企业对购买英伟达专为中国市场设计的产品兴趣降低。

据报道,国内对华为芯片的需求巨大(超过百万单位),但该公司在中芯国际提高产量面临挑战,中芯国际仍在努力改进其7纳米生产工艺的良率。

长期来看,硬件问题将越来越成为中国企业的挑战。大型美国AI参与者如OpenAI、Google和Meta正在使用数万甚至数十万个先进英伟达GPU构建计算基础设施,并将在今年或明年安装新的尖端Blackwell系统。积累如此多先进GPU对中国科技平台和初创企业来说几乎是不可能实现的目标。

对中国大语言模型企业来说,保持竞争力的唯一途径可能是通过利用开源工具。关键问题是,像Meta、Google和法国领导者Mistral这样的公司是否会继续开源越来越先进的模型。如果不这样做,中国企业将被推向更创新的解决方案,例如开发更小但仍适用于某些应用的强大模型。

长期来看,中国AI训练硬件的答案似乎是华为。去年,华为推出了由数千个昇腾910组成的Atlas 900超级集群。华为声称可以训练参数超过1万亿的基础模型,旨在直接竞争英伟达提供的类似系统。

挑战在于国内代工领导者中芯国际与华为工程师合作能否扩大规模以满足其硬件需求,如昇腾系列和华为智能手机的麒麟9XXX工艺。中芯国际使用7纳米工艺制造更先进处理器的能力有限,但仍在扩展。


常见问题

中国生成式AI市场的主要参与者有哪些?
中国生成式AI生态包含多种类型的企业,包括百度、阿里巴巴、腾讯等大型科技平台,以及智谱AI、MiniMax、百川智能、月之暗面、01.AI等资金雄厚的初创企业。这些企业正在大语言模型开发和实际应用部署方面展开激烈竞争。

中国企业如何应对美国GPU出口限制?
中国企业正在通过多种方式应对这些限制,包括使用国内替代品如华为昇腾芯片、优化模型以减少计算需求、利用开源模型,以及探索模型训练和推理的创新方法。华为等公司正在提供集成了自家芯片的“AI一体机”解决方案。

中国生成式AI模型的性能如何与国际领先模型比较?
根据各类基准测试,一些中国模型如百度的文心一言和智谱AI的GLM-4已经达到GPT-4水平。到2023年底,中国前15大企业的模型可能已赶上GPT-3.5的性能,更多企业可能在2024年中赶上GPT-4。然而,追赶GPT-4比GPT-3.5要困难得多,且基准测试本身存在局限性。


未来发展路径

中国企业在未来几个月将努力解决一些棘手问题,包括确保长期可靠的计算资源获取、培育可行的国内模型开发环境、确定如何及何时利用西方开源模型,以及继续开发主要面向企业市场并产生收入的应用,同时争夺人才。

中国企业追赶西方竞争对手面临障碍,中国行业领袖清楚认识到这些挑战。2024年4月初,阿里巴巴联合创始人蔡崇信断言,中国AI公司比美国同行落后两年。蔡崇信提到的一个主要因素是训练用先进硬件的获取。

旨在缓解中国AI领域对未来的焦虑的说法,如百度CEO李彦宏3月声称文心一言在生成唐诗风格诗歌方面优于GPT-4,虽然成为头条新闻,但并不代表模型开发的重大突破。

2024年,AI初创企业将继续艰难获取计算资源,尤其是由于美国对华先进GPU出口收紧导致云服务成本变化。快速波动的计算能力价格使AI企业难以制定稳定的发展路线。

据估计,自去年夏天以来,大语言模型初创企业支付给云服务提供商的合同价格已上涨50%。月之暗面创始人杨植麟指出,在相当长一段时间内,GPU访问价格每天都在变化:“价格不断变化,策略也必须不断变化。在选择渠道、购买还是租赁方面存在很多差异。”

这给像阿里巴巴这样的公司提供了通过计算积分投资初创企业的杠杆。大型超大规模企业如阿里巴巴、百度、腾讯等可能会为自己的大语言模型开发以及他们大量投资的企业(如阿里巴巴投资的MiniMax和月之暗面)保留计算资源访问权限。

现在看到的大型科技企业风投部门(尤其是阿里巴巴和腾讯)与投资于六七家领先初创企业的大量风投公司之间的合作,需要其中一些企业在未来六到十二个月在模型开发上取得突破,无论是通过整合外国开源技术还是通过修改和复制它们,以创建在中国市场表现良好的模型和应用。

投资这些初创企业的公司也在尝试通过 pooling 资源来分散风险,考虑到获取计算能力训练模型的高资本成本。据澄明资本创始合伙人表示,“这意味着这些大语言模型公司将不会只有少数股东,而是很多人——每个人都涌入,每个人都在分散风险。”根据行业观察者的说法,这反映了中国风投当前的实用倾向。

然而,中国AI社区内部关于专注大语言模型的初创公司应该优先考虑什么仍然存在重大辩论。他们应该优先考虑大语言模型的商业化和开发实际应用,还是应该寻求开发自己的专有能力而不参考西方模型,并专注于人工通用智能(AGI)的长期发展?

月之暗面创始人杨植麟似乎是追求AGI需求的坚定信念者,但其他人,如知名风险投资者朱啸虎,则持怀疑态度,考虑到模型的开源和从零开始开发模型所需的巨额硬件投资。这场辩论将继续,获取可靠长期先进硬件来源等因素使情况复杂化。

2024年3月初,有迹象表明地方政府也准备帮助AI初创企业解决云中计算机访问成本高的问题。包括上海在内的17个市政府承诺向面临数据中心计算访问成本上升的AI初创企业提供“计算券”。这些积分提供最高约30万美元的额度,用于支付训练大语言模型的计算时间。

开发大语言模型的中国公司以及渴望提升中国企业在生成式AI领域竞争地位的政府官员,将继续关注美国和大语言模型领导者如OpenAI、Google、Anthropic和Meta,作为评估国内进展和创新的参考点。

随着围绕生成式AI的初步全面法规现已到位(例如Matt Sheehan的总结 here),中国监管机构似乎更专注于使该领域的企业能够成功并与西方同行竞争。这发生在多个前沿领域,从发展国家计算能力(如我们在此详述的)到发布可用于训练新多模态模型的数据集。

国家计算问题的重要性在3月底再次被强调,当时国家数据局局长刘烈宏在党的顶级理论期刊《求是》上发表不同寻常的评论,强调了国家统一计算能力网络(NUCPN)对AI的重要性。刘烈宏强调了NUCPN对于中国通过提升国家支持计算密集型应用开发的整体能力来保持AI竞争力的重要性。

随着涉及能够吸收不同类型数据的多模态模型和上下文窗口的一些最新进展,未来六个月将在中国看到许多关于文本到视频等领域的公告。例如,2月底,人民数据宣布已编制了包含3亿条新闻相关数据的语义语料库,专门用于支持类似Sora的应用开发。

Sora可以根据文本提示生成高质量视频,由OpenAI于2024年2月发布,在中国AI领域产生了重大涟漪,有些人认为它显示了中国的生成式AI公司与OpenAI等领导者相比落后多远。中国企业已经在回应Sora带来的挑战。

3月初,北京大学和深圳AI公司Rabbitpre的研究团队联合推出了Open-Sora项目,目标是复制Sora。此外,社交媒体巨头字节跳动去年底发布了其MagicVideo文本到视频模型。腾讯和阿里巴巴的达摩院视觉智能实验室也发布了文本到视频工具。

4月,由蚂蚁集团、百度风投和启明创投等支持的清华大学衍生公司生数科技发布了Vidu,一个文本到视频平台,该公司声称几乎与Sora持平。早期证据表明它不如Sora好,但可能仍然是第二好的此类模型。该公司在2023年开源了其文本到图像模型UniDiffuser。

此外,4月,Meta发布了Llama-3,三天内Hugging Face上出现了六个基于Llama-3的微调模型。Llama-3以及很快GPT-5的发布将是中国开源大语言模型开发者的关键时刻。正如Tony Peng在他的Recode博客中指出的,“如果这些基于Llama-3的微调模型匹配或超过领先的中国开源大语言模型的基准,那么开发模型的理由就值得怀疑。”

但对整个行业来说,开源和Llama-3问题可能不会影响资金充足的初创企业,如月之暗面、MiniMax和智谱AI。所有领先的云制造商都在4月托管了Llama-3模型版本——百度云和阿里云支持Llama-3 8B模型,百度还支持70B版本,腾讯协助开发者微调Llama-3。

一个主要问题是,小型或大型大语言模型的大型企业用户将继续偏好使用国内开发的大语言模型,并可能回避基于西方开源模型(如Meta的Llama-2/3或Mistral模型)的国内版本,以避免监管风险。

在另一个可能扩大的趋势中,阿里巴巴在6月初声称其最新的开源模型Qwen2在数学和计算机编码相关基准测试中击败了Llama-3。这一公告就在阿里巴巴发布闭源模型Qianwen 2.5一个月后,该公司声称该模型在某些基准测试中表现优于GPT-4。未来,针对专有和开源模型的基准测试将成为常态。

软件开发环境问题未来将是一个挑战,但显然中国有些人理解这个问题并正在寻找解决方案。2024年3月北京两会会议的一项政策提案来自京东技术委员会主席曹鹏,他强调国内AI硬件需要与国内软件兼容并紧密结合开发。此外,百度CEO李彦宏要求政策制定者加大支持创新软件和AI的努力。

最后,3月全国人大会议期间发布的2024年政府工作报告暗示即将推出一项名为“AI+”行动计划的新政策倡议,旨在提升中国企业在AI领域的竞争力,这可能类似于2015年推出的“互联网+”行动计划。

“互联网+”包括提升医疗、教育和制造等行业数字化足迹的单独计划。“AI+”行动计划可能会做类似的事情,政府通过利用AI平台访问为传统行业升级提供一些支持。鉴于“互联网+”使大型科技平台受益的经验,“AI+”行动计划可能会使半导体公司和数据中心以及能够将其优先事项与新倡议对齐的AI开发者受益。

此外,“AI+”现在也与NUCPN联系在一起,AI显然是“新质生产力”概念的关键元素,这一概念首次由习近平在9月提及。4月初,国务院国资委确定了首批在AI、量子信息和生物医学等新兴领域的国有初创公司,作为发展“新质生产力”的一部分。

政府通过这些倡议对AI的支持将如何转化为推动AI发展(尤其是生成式AI)的私营部门的进展尚不清楚,但政府倡议发出了一个强烈信号,表明北京将继续支持新兴技术,并相信AI将是未来经济增长的关键驱动力。因此,2024年对中国AI行业来说,在许多方面都将是关键一年。