OpenAI
-
OpenAI Sora 与 AWS Nova 的区别:哪个更适合视频创作?
最近,OpenAI 的 Sora 和亚马逊(AWS)的 Nova 在 Bedrock 平台上发布,标志着 AI 领域翻开了激动人心的新篇章。虽然这两种模式都以各自的方式推动着这一领…
-
OpenAI 在实时图像和虚拟世界创建方面的突破
探讨 OpenAI 在实时图像和虚拟世界的突破对各行各业的专业人士意味着什么、带来了哪些机遇,以及随着这些功能的发展,未来可能会是什么样子。
-
OpenAI 开始将 WebRTC 用于自己的语音机器人
在5月13日公布的信息中,OpenAI 正在部署一些特别的功能,可以使得ChatGPT进行类似电话通话能力。 OpenAI已经部署了必要的 WebRTC 服务器来实现这一功能。最初…
-
OpenAI 警告企业逐步淘汰基于语音的身份验证,并停止发布其语音克隆工具
OpenAI 已对各公司发出红色警报,警告他们在开发语音引擎解决方案的过程中,是时候放弃语音身份验证了。 语音引擎是一种语音克隆工具,可以生成“非常类似于”原始说话者的自然语音。 …
-
OpenAI 发布语音引擎“Voice Engine”来创建人类声音
OpenAI 现在可以利用其 “语音引擎 “(Voice Engine)平台重现人类的声音。由于明显的道德和法律问题,这家由微软投资的公司对新的人工智能引擎…
-
Sora引领的AI生成视频时代,如何应对背后的内容风险挑战?
在推出ChatGPT一年多后,OpenAI近日发布文生视频大模型Sora,成为龙年科技界的“第一把火”,并以惊人的速度持续发热,再次引发全球瞩目。Sora可根据用户输入的指令,生成…
-
解读OpenAI Sora文生视频技术原理
以下文章来源于清熙 ,作者王庆法。 OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗…
-
Sora: 作为世界模拟器的视频生成模型
OpenAI新提出了一种功能强大的视频生成大模型,采用tansformer结构处理视频图像的时空块,支持不同长度、不同分辨率和不同长宽比的视频生成。其中最大的Sora模型支持长达一…
-
MetaAI发布语音识别错误率是OpenAI的Whisper模型的一半且支持1107种语言的语音模型:MMS
今天,Meta的首席AI科学家Yann LeCun在推特上宣布了MetaAI的最新研究成果:MMS,一个支持1107种语言的自动语音识别模型和语音合成模型,该模型自动语音识别的单词…
-
微软GitHub引入OpenAI聊天功能,允许开发人员询问如何编码
北京时间3月22日晚间消息,据报道,微软(272.29, -1.49, -0.54%)旗下软件开发平台GitHub今日发布了新版编程工具“Copilot X”,…
-
比较 OpenAI 的 CodeX 和 ChatGPT
随着 AI 平台研究和开发的进步,数据解释和分析的自动化程度提高将变得司空见惯——从而带来更高效的流程和应用程序。OpenAI 是人工智能领域的先驱,开发了CodeX 和ChatG…
-
OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平
9月21日,OpenAI 发布了一个名为「Whisper 」的神经网络,声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。 「Whisper 」式一个自动语音识别(ASR)系…
-
OpenAI的DALL·E迎来升级,不止文本生成图像,还可二次创作
在令人叹为观止方面,OpenAI 从不令人失望。 去年 1 月 6 日,OpenAI 发布了新模型 DALL·E,不用跨界也能从文本生成图像,打破了自然语言与视觉次元壁,引起了 A…