OpenAI

WebRTC

测量 OpenAI 基于 WebRTC 的实时 API 的响应延迟

从 Chrome 浏览器中提取的原始 RTP 数据包来测量总延迟，本文分析了这种方法在 OpenAI 的 WebRTC 实时 API 中的应用，并分析了结果。

webrtc学习和实践
2025年4月3日
行业资讯

OpenAI 将 Sora 视频生成器引入英国和欧盟

OpenAI 从今天开始向英国和欧洲的用户推出其 Sora 视频生成系统。ChatGPT Pro 和 Plus 用户现在无需额外付费即可使用该工具，但会受到一些使用限制。尽管So…

茉莉
2025年2月28日
行业资讯

推进对话式 AI：OpenAI 为 Claude 提供全新双向语音模式

最近的报告显示，OpenAI 正在为其 AI 模型 Claude 开发新功能，包括突破性的“双向”语音模式。这一进步代表了对话式 AI 技术的重大飞跃，旨在使与 AI 系统的交互更…

茉莉
2025年1月22日
技术文章

OpenAI Sora 与 AWS Nova 的区别：哪个更适合视频创作？

最近，OpenAI 的 Sora 和亚马逊（AWS）的 Nova 在 Bedrock 平台上发布，标志着 AI 领域翻开了激动人心的新篇章。虽然这两种模式都以各自的方式推动着这一领…

AIGC
2024年12月12日
行业资讯

OpenAI 在实时图像和虚拟世界创建方面的突破

探讨 OpenAI 在实时图像和虚拟世界的突破对各行各业的专业人士意味着什么、带来了哪些机遇，以及随着这些功能的发展，未来可能会是什么样子。

AIGC
2024年11月8日
行业资讯

OpenAI 开始将 WebRTC 用于自己的语音机器人

在5月13日公布的信息中，OpenAI 正在部署一些特别的功能，可以使得ChatGPT进行类似电话通话能力。 OpenAI已经部署了必要的 WebRTC 服务器来实现这一功能。最初…

AIGC
2024年5月16日
行业资讯

OpenAI 警告企业逐步淘汰基于语音的身份验证，并停止发布其语音克隆工具

OpenAI 已对各公司发出红色警报，警告他们在开发语音引擎解决方案的过程中，是时候放弃语音身份验证了。语音引擎是一种语音克隆工具，可以生成“非常类似于”原始说话者的自然语音。 …

rikhard
2024年4月3日
行业资讯

OpenAI 发布语音引擎“Voice Engine”来创建人类声音

OpenAI 现在可以利用其 “语音引擎 “(Voice Engine)平台重现人类的声音。由于明显的道德和法律问题，这家由微软投资的公司对新的人工智能引擎…

追风者
2024年3月30日
行业资讯

Sora引领的AI生成视频时代，如何应对背后的内容风险挑战?

在推出ChatGPT一年多后，OpenAI近日发布文生视频大模型Sora，成为龙年科技界的“第一把火”，并以惊人的速度持续发热，再次引发全球瞩目。Sora可根据用户输入的指令，生成…

AIGC
2024年2月23日
技术文章

解读OpenAI Sora文生视频技术原理

以下文章来源于清熙，作者王庆法。 OpenAI Sora文生视频（图像看作单帧视频）一放出就炸翻整个AI 圈，也是ChatGPT掀起GenAI热潮时隔一年后，OpenAI再次史诗…

音视频开发进阶
2024年2月21日
技术文章

Sora: 作为世界模拟器的视频生成模型

OpenAI新提出了一种功能强大的视频生成大模型，采用tansformer结构处理视频图像的时空块，支持不同长度、不同分辨率和不同长宽比的视频生成。其中最大的Sora模型支持长达一…

视频技术
2024年2月20日
技术文章

MetaAI发布语音识别错误率是OpenAI的Whisper模型的一半且支持1107种语言的语音模型：MMS

今天，Meta的首席AI科学家Yann LeCun在推特上宣布了MetaAI的最新研究成果：MMS，一个支持1107种语言的自动语音识别模型和语音合成模型，该模型自动语音识别的单词…

追风者
2023年5月24日
行业资讯

微软GitHub引入OpenAI聊天功能，允许开发人员询问如何编码

北京时间3月22日晚间消息，据报道，微软(272.29, -1.49, -0.54%)旗下软件开发平台GitHub今日发布了新版编程工具“Copilot X”，…

追风者
2023年3月23日
行业资讯

比较 OpenAI 的 CodeX 和 ChatGPT

随着 AI 平台研究和开发的进步，数据解释和分析的自动化程度提高将变得司空见惯——从而带来更高效的流程和应用程序。OpenAI 是人工智能领域的先驱，开发了CodeX 和ChatG…

假装是大佬
2023年2月6日
行业资讯

OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

9月21日，OpenAI 发布了一个名为「Whisper 」的神经网络，声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。「Whisper 」式一个自动语音识别（ASR）系…

厂商动态
2022年9月22日
行业资讯

OpenAI的DALL·E迎来升级，不止文本生成图像，还可二次创作

在令人叹为观止方面，OpenAI 从不令人失望。去年 1 月 6 日，OpenAI 发布了新模型 DALL·E，不用跨界也能从文本生成图像，打破了自然语言与视觉次元壁，引起了 A…

元二
2022年4月7日