乐鱼体育AI手机PC大爆发Arm从软硬件到生态发力打造行业AI百宝箱

2024-06-11

  随着“Gen-AI”时代的到来,AI手机、AI PC等关键核心移动设备都在快速与生成式AI结合,越来越多的AI新功能涌现,深刻影响着我们每个人的生活和工作。

  需求变得多样化,场景也更加复杂,生成式AI带来新的算力挑战和存储挑战,加速着背后一系列硬件、软件、算法、生态等方面的技术迭代。

  作为一切移动计算“根基”提供者的Arm,也在积极开拓新的解决方案,给行业带来新的解题思路。

  近年来,Arm已不止于提供IP,从架构、硬件、软件到生态,Arm转型为一家计算平台公司,为产业提供完整的计算解决方案。

  针对云数据中心和汽车应用,Arm相继推出对应的计算子系统(CSS),而就在上周,Arm为终端设备市场发布了首款终端计算子系统(CSS),结合了最新Armv9架构的特性,其中CPU和GPU在AI方面都有大幅性能提升。此外,Arm还为开发人员量身定制了开发工具Kleidi。

  今年Arm从全面计算解决方案(TCS)升级到了终端CSS,两者的主要不同之处在于,Arm首次提供了CPU和GPU物理实现,这可以让构建和部署基于Arm架构的解决方案变得更加简单。显然,这样的改变正是为了让生态伙伴可以快速把握AI新机遇,加速产品上市进程。

  可以说,这无疑是Arm面向AI时代的一次关键发力,Arm这一系列重磅技术和新品都瞄准了端侧AI。

  此次智东西对话Arm 终端事业部产品管理副总裁James McNiven,对背后的关键突破进行了深入挖掘,对Arm在生成式AI时代的布局和深入思考进行了探讨。

  我们可以清晰地看到,Arm正在通过横跨架构、硬件、软件、生态的完整解决方案,让合作伙伴的产品快速与AI结合并推向市场,实现落地,为行业打造一个“AI百宝箱”。

  在今天的智能终端产业中,AI手机和AI PC无疑已经成为了产业关注的焦点赛道,生成式AI在这两个领域的融合也最为快速。终端设备能够处理的任务越来越复杂,并且生成式AI在感知、理解、交互等方面都带来了全新的技术挑战,涌现出更多的计算需求。

  如今一切移动端生成式AI的运行几乎都离不开Arm的CPU和GPU,据了解,有70%的第三方安卓ML工作负载都是在CPU上运行的,因此CPU仍然是AI时代计算的核心。

  在这样的背景下,Arm作为底层关键技术提供者,无疑已成为这场AI变革的关键变量。

  为什么如此关键?AI时代带来了诸多挑战,其中最明显的就是,高性能和高能效的重要性被放到了空前高度,而能效恰恰是Arm的DNA。

  新的终端CSS基于最新的Armv9构建,计算和图形性能提升幅度超过30%,同时其AI推理速度提高了59%,这些提升对于处理要求更加严苛的安卓实际用例以及AI、ML和计算视觉工作负载都十分重要。

  采用3nm工艺的新Arm Cortex-X925主频飙至3.8GHz,配合微架构的改进,与2023年旗舰智能手机采用的4nm SoC相比,其单线%。

  在AI性能方面,Cortex-X925的token 首次响应时间提高了41%,这可以提升如大语言模型等端侧生成式AI的响应能力。

  McNiven透露,为了提升AI算力,Arm采用了迄今为止最宽的解码和矢量的微架构设计,实现了50% TOPS数的增长。

  GPU方面,新Arm Immortalis-G925 GPU在各类头部手游应用中实现了37%的性能提升,在多个AI和ML网络上实现了34%的性能提升。

  值得一提的是,Arm终端CSS还具备基于3nm工艺生产就绪的 CPU 和 GPU 物理实现。

  据了解,物理实现中包括晶体管的设计和线路,可以显著帮助Arm的合作伙伴节省芯片开发的时间,同时优化芯片的性能和能效。

  除了架构和硬件设计,在工具和软件库方面,Arm还首次发布了Arm Kleidi,其中包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。

  Arm做Kleidi最核心的目的,就是要确保开发者能够快速获得开发生成式AI应用所需的性能、工具和软件库。

  简单理解,KleidiAI是一套面向AI框架开发者的计算内核,像PyTorch、Tensorflow、MediaPipe这样的热门AI框架都已经集成到KleidiAI中了,这对于加速主流AI大模型是十分重要的。

  值得一提的是,在Arm看来,CPU是唯一可以确保运行未来网络的计算引。


本文由:乐鱼app官方网站提供