乐鱼体育OpenAI深夜炸场!最强模型GPT-4o完全免费实时语音视频交互震撼世

2024-05-17

  OpenAI深夜炸场!最强模型GPT-4o完全免费,实时语音视频交互震撼世界

  北京时间5月14日凌晨,美国OpenAI公司推出可免费使用的全新旗舰AI模型GPT-4o,并将推出PC桌面版ChatGPT。

  OpenAI首席技术官米拉·穆拉蒂 (Mira Murati)表示,GPT-4o里的“o”是Omni(全能模型)的缩写,可实时进行音频、视觉和文本推理,它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。

  米拉·穆拉蒂指出,在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格降低一半(50%),速度提升两倍(200%)。

  这个深夜,OpenAI不止成功在15日I/O开发者大会之前抢夺谷歌风头,而且新的大模型交互体验正颠覆世界。

  GPT-4o新模型自今早起陆续推出,付费版本用户今天就能看到GPT-4o新模型提示,甚至今晨GPT-4o消息都是实时展示。

  OpenAI CEO奥尔特曼(Sam Altman)发实时推文表示,新的GPT-4o是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。

  “这对我们的使命很重要,我们希望将出色的 AI 工具交到每个人手中。”奥尔特曼表示。

  OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)发GPT-4o介绍视频中表示,这是OpenAI朝着更自然的人机交互(甚至人机-计算机交互)形式迈出的重要一步。

  发布之后,网友:它是不是完全可以替盲人看世界了?OpenAI要颠覆世界了?为外语行业默哀。

  凌晨仅仅26分钟的发布会,打响了这个5月全球 AI“军备竞赛”。同时,GPT-4o的发布,或将颠覆外语、实时翻译、音视频剪辑等众多行业。

  随着2022年底AI 聊天机器人ChatGPT风靡全球,掀起新一轮AIGC浪潮。过去530天里,研发ChatGPT背后的OpenAI公司身处聚光灯下,并迅速成长为860亿美金估值的 AI 独角兽。

  2023年3月,OpenAI推出多模态大模型GPT-4,不仅理解能力、可靠性和长文本技术能力全面增强,且具备图像处理。而且在专业基准测试中,GPT-4表现近似于人类的水平,如模拟律师考试得分能排到前10%左右,击败90%的人类。

  随后,OpenAI升级ChatGPT付费版本,每月达20美元;5月,OpenAI陆续推出iOS、安卓版ChatGPT应用,下载量已突破1.1 亿次,移动端应用收入近3000万美元;8月,企业版ChatGPT发布,性能比标准GPT-4快两倍。

  2023年11月,OpenAI发布最强模型GPT-4 Turbo,提供强大上下文理解能力,支持12.8万个token,并且公布自定义大模型的GPTs、GPT Store等众多产品。然而,仅仅两周后,OpenAI突发高层“大地震”,奥尔特曼遭遇“乌龙”式罢免,五天后最终得以重掌公司大权,并组建董事会。112天后,OpenAI董事会放心表态:对Sam Altman和Greg Brockman继续领导OpenAI充满信心。

  据公开数据显示,整个2023年,在奥尔特曼带领下,OpenAI年化收入已经超过20亿美元,同比增长4500%以上,跻身于历史增长最快的科技公司之列。

  2月,OpenAI发布首个AI视频大模型Sora,逼真的影视效果引爆了整个视频和电影行业;

  3月,马斯克(Elon Musk)状告OpenAI,使奥尔特曼创始团队“反击”;

  此次发布会之前,关于OpenAI 新品传闻甚嚣尘上,不仅包括性能超级强大的GPT-5,而且还传有对标谷歌的 AI 搜索引擎产品,以及与苹果合作研发的 AI 语音生成产品等,引发众多关注。

  然而,奥尔特曼发推文称,此次公布的不是GPT-5,也不是 AI 搜索引擎,而是开发的一些“我们认为人们会喜欢的新东西”。

  米拉·穆拉蒂透露,目前有1亿多用户使用ChatGPT创造工作、学习,有100多万开发者在GPTs上创造新的工具。

  OpenAI表示,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。

  GPT-4o可以在短至 232 毫秒的时间内响应音频输。


本文由:乐鱼app官方网站提供