近年来,随着训练数据量增长及所属设备的升级,大模型研发费用明显上涨。斯坦福大学发布的《2024年人工智能指数报告》显示,OpenAI的GPT-4等前沿模型系统的训练成本预估在7800万美元,而谷歌的Gemini Ultra的计算成本花费预估为1.91亿美元。相比之下,2017年最初发布的Transformer模型、2019年推出的ROBERTa Large模型的训练成本分别为900美元、16万美元。
在4月初采访中,OpenAI的竞争对手Anthropic的首席执行官达里奥·阿莫代伊也曾表示,当前市场上人工智能模型的培训成本已高达约1亿美元,目前正在训练的模型,以及预计在今年晚些时候或明年年初不同时间推出的模型,其成本已接近10亿美元,到2025—2026年,这一成本预计将飙升至50亿—100亿美元。
高昂的研发费用可能会让小型公司和研究机构望而却步,进而构成进入壁垒。因此,我们对当前开发AI大模型企业2023年的研发投入情况进行盘点,以了解行业竞争格局与发展现状。
本文选取的研究对象为五批《境内深度合成服务算法备案清单》所涉及的国内上市公司(包含A股、港股、美股上市公司),共计61家。
数据显示,2023年,开发AI大模型的上市公司平均研发投入达59.56亿元,其中13家研发投入超百亿元,最高达640.78亿元。
研发投入占比方面,2023年,开发AI大模型的上市公司“研发投入占营收比重”的均值为16.49%,其中有10家超30%,商汤-W(0020.HK)的研发投入占比最高,达101.76%,而且2020—2022年,该公司的研发投入占比分别为71.21%、76.89%、105.38%% ,均超过70%%。
值得一提的是,互联网及电商巨头基本都在开发自身大模型,包括BAT(百度、阿里巴巴、腾讯)、京东、美团、网易、快手、三六零。这些企业每年研发投入巨大,基本都在百亿元以上,在开发资金上具备优势。
在庞大的研发投入基础上,百度开发了文言一心,阿里巴巴开发了通义千问,腾讯开发了混元大模型。
整体来看,企业开发大模型可分为“通用大模型”和“垂直大模型”,通用大模型是设计用来处理广泛任务和应用场景的模型,如OpenAI 开发的GPT-4,上面提到的文言一心、通义千问、混元大模型亦属于通用大模型。
相比于通用大模型,垂直大模型则专注于特定领域的应用,如医疗、金融、法律、教育等,例如,医疗领域的垂直大模型可以用于诊断、医学影像分析和医疗文献总结。
实际上,除了BAT等少数巨头致力于开发通用大模型,面对通用大模型高昂的开发成本,多数企业选择开发适用自身业务的垂直大模型,如金山办公开发的WPS AI专注于办公领域,同花顺开发的“鸿鹄大模型”专注于投资领域,万兴科技开发的“天幕大模型”专注于多媒体处理和创作。
垂直大模型因数据量相对较小、适用领域集中,开发成本及难度相对较低,且具备差异化竞争优势,已成为多数企业开发大模型的主要路线,企业主要通过这些大模型提升自身产品及服务的智能化程度。