杀疯了!地表最强模型GPT-4o登场速度提升200%、价格便宜50%或将颠覆实时

2024-05-21

  杀疯了!地表最强模型GPT-4o登场,速度提升200%、价格便宜50%,或将颠覆实时翻译等行业

  15日谷歌Google I/O开发者大会公布 AI 产品24小时前夕,OpenAI成功抢夺了谷歌风头。

  北京时间5月14日凌晨1点,在26分钟春季ChatGPT发布会上,美国OpenAI公司推出可实时进行音频、视觉和文本推理的全新旗舰AI模型GPT-4o,并将推出PC桌面版ChatGPT。

  OpenAI首席技术官米拉·穆拉蒂 (Mira Murati) 表示, 在API使用方面, 相比去年11月发布的 GPT-4-turbo, GPT-4o价格降低一半(50%),速度提升两倍(200%)。 GPT-4o的 语音和视频输入功能将在未来几周内推出。

  OpenAI CEO奥尔特曼(Sam Altman)发实时推文表示,新的GPT-4o模型是OpenAI有史以来最好的模型,它很智能,速度很快,它是原生多模态,并且它可供所有 ChatGPT 用户使用,无论是免费版本还是付费GPT-4版。“这对我们的使命很重要,我们希望将出色的 AI 工具交到每个人手中。”

  OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)发GPT-4o介绍视频中表示,这是OpenAI朝着更自然的人机交互(甚至人机-计算机交互)形式迈出的重要一步。

  仅仅26分钟,打响了5月全球AI“军备竞赛”。同时,GPT-4o的发布,或将颠覆外语、实时翻译、音视频剪辑等众多行业。

  随着2022年底AI 聊天机器人ChatGPT风靡全球,掀起新一轮AIGC浪潮。过去530天里,研发ChatGPT背后的OpenAI公司身处聚光灯下,并迅速成长为860亿美金估值的 AI 独角兽。

  2023年3月,OpenAI推出多模态大模型GPT-4,不仅理解能力、可靠性和长文本技术能力全面增强,且具备图像处理。而且在专业基准测试中,GPT-4表现近似于人类的水平,如模拟律师考试得分能排到前10%左右,击败90%的人类。

  随后,OpenAI升级ChatGPT付费,每月达20美元;5月,OpenAI陆续推出iOS、安卓版ChatGPT应用,下载量已突破1.1 亿次,移动端应用收入近3000万美元;8月,企业版ChatGPT发布,性能比标准GPT-4快两倍。

  2023年11月,OpenAI发布最强模型GPT-4 Turbo,提供强大上下文理解能力,支持12.8万个token,并且公布自定义大模型的GPTs、GPT Store等众多产品。然而,仅仅两周后,OpenAI突发高层“大地震”,奥尔特曼遭遇“乌龙”式罢免,五天后最终得以重掌公司大权,并组建董事会。112天后,OpenAI董事会放心表态:对Sam Altman和Greg Brockman继续领导OpenAI充满信心。

  据公开数据显示,整个2023年,在奥尔特曼带领下,OpenAI年化收入已经超过20亿美元,同比增长4500%以上,跻身于历史增长最快的科技公司之列。

  2月,OpenAI发布首个AI视频大模型Sora,逼真的影视效果引爆了整个视频和电影行业;

  3月,马斯克(Elon Musk)状告OpenAI,使奥尔特曼创始团队“反击”;

  此次发布会之前,关于OpenAI 新品传闻甚嚣尘上,不仅包括性能超级强大的GPT-5,而且还传有对标谷歌的 AI 搜索引擎产品,以及与苹果合作研发的 AI 语音生成产品等,引发众多关注。

  然而,奥尔特曼发推文称,此次公布的不是GPT-5,也不是 AI 搜索引擎,而是开发的一些“我们认为人们会喜欢的新东西”。

  米拉·穆拉蒂透露,目前有1亿多用户使用ChatGPT创造工作、学习,有100多万开发者在GPTs上创造新的工具。

  OpenAI表示,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。

  GPT-4o可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

  具体来说,GPT-4o主要特色分为四部分:模型能力、基准测试、模型安全性和局限。


本文由:乐鱼app官方网站提供