微软披露十大AI产品策略新亮点全乐鱼体育力抢攻桌面AI应用浪潮

2024-05-23

  今天(北美太平洋夏令时间5月21日)今年度微软Build大会正式展开,微软首席执行官Satya Nadella一口气披露不少新进展,可分为2大类,包括专为AI开发优化的执行环境Windows Copilot Runtime,以及Copilot技术架构的重大更新。这2大类中就有新添的Phi-3 Silica多模态小型语言模型、GPT-4o正式在Azure AI Studio开发环境中上架、Azure AI Studio正式上线,甚至在数据分析平台Microsoft Fabric上,还添加即时智能(Real-time Intelligence)解决方案,可处理PB级流媒体数据等。

  Satya指出,70年前,科学家对计算机的期待是“计算功能理解我们吗?还是我们要理解它?”以及“计算功能帮助我们理解复杂数据吗?”这是70年来科学家追寻的2大目标。

  在底层中,Satya披露2大重点更新,一是开发者现在通过DirectML,就能享有Windows操作系统对PyTorch开发框架的原生支持。这意味着,Hugging Face上的上千个模型终于能在Windows中执行,同时,微软也正式推出GPU对PyTorch的支持,NPU支持也即将上线。

  另一个底层更新是WebNN,也就是网页原生的机器学习框架,可在Windows作业程序中通过DirectML和ONNX Runtime Web来执行。这个WebNN目前为开发者预览版,它的出现,能让开发者更好地利用设备硬件资源,来提供更好的AI网页App体验。

  往上一层,就是Windows Copilot函示库与设备端模型层。这层包含了由40多个设备端AI模型驱动的API、矢量存储库和算法。在这层的模型部分,Satya宣布Phi系列模型正式可用、Phi-3-vision开始预览,并披露最新、只有33亿参数的SOTA小型语言模型Phi-Silica,专为Copilot+ PC和NPU设计而成。

  不只模型,在API部分也有重磅更新,包括Studio Effects、即时字幕翻译、OCR、Recall with User Activity和Phi Silica等API将于6月向开发者提供,之后会再纳入矢量嵌入、支持地端数据的检索增强生成(RAG)、文本摘要和其他API。

  再往上一层,到应用程序和体验层,这层的新进展包括微软最新开发的AI App,如回顾(Recall)、图像创作(Cocreator)、即时字幕翻译(Live Caption)、风格编辑(Restyle Image)等。其中,回顾是通过对屏幕快照,来让用户以关键字,进行语义搜索、找出所需资讯,不论是网页、演示文稿还是对话都可以。图像创作则以小型语言模型和Stable Diffusion等扩散模型驱动,可根据文本提示和简单笔画,来产出逼真的图像。即时字幕则支持笔记本上任何音频的语言翻译,可将40多种语言翻译为英文,脱机也行。

  “我们一直是平台公司,要建造完整的技术架构!”Satya解释,Copilot技术架构(Tech Stack)就是一大重点,从底层开始向上,可分为AI基础设施、基础模型、数据、AI调度与工具链,以及最上层的微软Copilot/自建Copilot、Copilot插件等。微软今年大会的重点更新,也围绕这个架构展开。

  就AI基础设施层而言,Satya回顾,光是去年,微软就在60多个区域构建数据中心,接下来则要在2025年前,全部采用再生能源,不产生任何碳排。同时,在硬件部分,微软还正式推出基于AMD最新Instinct GPU的处理器ND MI300X v5,可更快、更有效率执行AI应用,另也公开预览Cobalt 100芯片。

  甚至,在Azure AI Studio中,还包含即将上线的安全工具与功能,包括自定义类别(将上线)、提示盾(预览)、基准侦测(预览)等。而且,Azure AI Studio还推出定制化模型功能,允许用户用自己的数据训练定制化模型。

  往上一层到数据层,重大更新莫属微软自家的数据分析平台Microsoft Fabric,特别针对企业难以处理的数据即时分析,推出一项无程序代码/低程序代码的即时智能(Real-Time Intelligence)SaaS解决方案。Satya强调,用户可通过这个功能,来更快速处理大量、颗粒度更细致的数据。

  这项即时智能目前为公开预览版,因为无/低程序代码特性,分析师能简单上手,另也能针对专业开发者提供完整的程序代码使用界面。比。


本文由:乐鱼app官方网站提供