乐鱼体育大模型“全网最低”之战巨头们葫芦里卖的什么药

2024-06-02

  6·18购物节狂欢活动正如火如荼地展开,领跑的“榜一大哥”却是大模型这个生面孔。

  今年5月,多家大模型齐降价,迅速掀起整个行业的低价热潮。去年以来,随着ChatGPT的快速走红,AI大模型开始井喷式发展,创业公司、头部企业纷纷入局,新领域一跃成为投资市场的香饽饽。大厂为何竞相降价?降价后的大模型赛道又将迎来怎样的变化和挑战呢?

  想要感知这次大模型降价潮的力度,首先需要了解“token”是什么,它是服务端生成的一串字符串,以作客户端进行请求的一个令牌,通俗来讲,其实可以理解为大模型文本处理过程中的最小单位。

  5月6日,幻方量化旗下DeepSeek发布第二代MoE(专家模型)DeepSeek-V2,该模型在性能上对标GPT-4 Turbo,价格却仅有后者的百分之一,每百万tokens输入价格为1元、输出价格为2元。

  随着DeepSeek打响大模型降价第一枪,几大巨头先后卷入价格战。几天之后,智谱AI上线新的价格体系,大幅提升新用户的赠送额度,其入门级产品GLM-3 Turbo模型调用价格则降低80%至1元/百万tokens。

  5月15日,火山引擎原动力大会开幕,字节跳动发布豆包大模型并公布0.0008元/千tokens的超低定价,凭借比行业低99.3%的价格,字节将大模型带入“厘元时代”。

  至此,其实大模型已经没有更多压价空间。当日下午,百度宣布文心大模型中的两大主力模型 ERNIE Speed 和 ERNIE Lite 全面免费。

  次日,科大讯飞和腾讯立刻跟进降价,讯飞星火API能力正式免费开放,其中,讯飞星火Lite API永久免费开放,这也是业界首个永久免费版本,此外,科大讯飞还压低了顶配版本的价格,腾讯则宣布混元-lite模型全面免费开放。

  事实上,大模型降价早有趋势。自去年开始,赛道领头羊OpenAI已经先后进行了4次降价,不久前,其发布的最新模型GPT-4o,不仅性能实现大幅提升,价格也下调了50%。

  从卷参数到卷低价,赛道开始急速升温,吸引众多市场目光的同时,也不禁令人疑惑:巨头如此舍本烧钱,目的究竟是什么?

  从客观来看,技术取得一定进步后,降价其实顺理成章。一方面芯片技术突破导致算力成本下降,压缩了大模型的推理成本,另一方面是大模型的量化压缩技术也在不断优化,二者的结合使大幅度降价成为可能。

  此外,经过一年多的市场化发展,文本生成领域的大模型目前相对成熟,其在端侧的运行其实无需太多成本,还能帮助企业最大化利用过剩产能。

  然而,技术进步并非主要原因,算力优化虽然能降低成本,但眼下各大厂商的降价幅度显然超出了正常范畴。实际上,尽管ChatGPT让大众感知到AI技术的进阶,但赛道目前仍处于初期阶段。在AI大模型爆发之初,市场对技术驱动的服务优化热情高涨,推动了智能服务对基础层服务的汰换迭代,而随着进度条的延伸,应用化的下一个增长空间在哪?行业迟迟未能给出答案。

  单一的人机对话窗口,在端侧的吸引力是有限的,因为这需要用户具备文本提问和寻找答案的主动意识。另外,许多镶嵌在主流APP中的AI智能助手作用较为鸡肋,实际上这些APP已经具有稳定的用户群体,并形成稳定的交互模式,很难在内部二次孵化对AIGC的大量需求,而AI智能助手所能提供的支持也仅限于给出方案以作参考,例如购物时提供衣物搭配和物品的使用方法、出游订票时提供榜单数据和目的地选项等等。

  总而言之,由于场景渗透的局限性,现阶段C端用户的使用习惯尚未成型,加上此前设置的价格进一步抬高使用门槛,又缺乏爆款应用作为宣传载体,大模型的用户规模虽然在前期实现了快速增长,但总体仍有很大提升空间。QuestMobile发布的《2024中国移动互联网春季大报告》显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。

  在整体的市场蛋糕未能做大的前提下,各家所分得的市场显然十分有限,而在相似度极高的发展路径下,各家大模型产品的用户粘性更是无从谈起。

  对于头部企业而言,在技术和市场规模双双陷入增长瓶颈时,非常需要更多开发者和用户的加入,突破圈内自嗨转向全民应用,一是能为行业注入新鲜血液,或许有机会激发更多技术上的创新,二是有助于推动AI应用的普及,促进大模型的应用化,从而为进一步实现商业化奠定市场基础。当然更重要的是,行业竞争无处不在。

  阿里通义千问系列大模型调价后,记者曾就此询问字节方的看法。火山引擎相关负责人表示:”非常欢迎通义千问大模型降。


本文由:乐鱼app官方网站提供