英特尔 OpenVINO 2025.0 带来对 Deepseek 模型的支持和更佳的 AI 性能

追风者 • 2025年2月7日上午10:23 • 行业资讯

英特尔致力于 OpenVINO AI 工具包的软件工程师近日发布了 OpenVINO 2025.0，它支持备受关注的 Deepseek 模型以及其他大型语言模型 (LLM)，对一些现有模型支持的性能改进以及其他变化。

英特尔 OpenVINO 2025.0 开源 AI 工具包支持的新模型包括 Qwen 2.5、Deepseek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Qwen-7B 和 DeepSeek-R1-Distill-Qwen-1.5B、FLUX.1 Schnell 和 FLUX.1 Dev。

OpenVINO 2025.0 还通过 OpenVINO 的 GenAI API 在 CPU、集成 GPU 和独立 GPU 上提供了更好的 whisper 模型性能。此外，英特尔 NPU 还初步支持 torch.compile，以便在英特尔 NPU 上使用 PyTorch API。

英特尔 OpenVINO 2025.0 带来对 Deepseek 模型的支持和更佳的 AI 性能

OpenVINO 2025.0 还改进了 LLM 的第二个令牌延迟，现在为 CPU 上的 INT8 启用了 KV 缓存压缩，支持 Core Ultra 200H“Arrow Lake H”处理器，Triton 推理服务器支持 OpenVINO 后端，OpenVINO 模型服务器现在可以在 Windows Server 部署上本地运行。

了解 OpenVINO 2025.0 更多详细信息：https://github.com/openvinotoolkit/openvino/releases/tag/2025.0.0

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/zixun/55601.html

赞 (0)

追风者认证作者

0 0

行业资讯

英特尔发布 OpenVINO 2024.2，进行了 Llama 3 优化和更多 AVX2 与 AVX-512 优化

2024年6月17日，英特尔发布了 OpenVINO 2024.2，这是其开源人工智能工具包的最新版本，用于在一系列人工智能框架和广泛的硬件类型中优化和部署深度学习（A）推理模型。…

追风者
2024年6月18日
行业资讯

OpenVINO 2024.5 发布，具有更多英特尔优化、更好的 LLM/GenAI 覆盖范围

2024年11月20日，英特尔开源软件开发人员发布了 OpenVINO 2024.5，这是此跨平台 AI 工具包的最新主要功能版本。 OpenVINO 2024.5 继续构建此工具…

追风者
2024年11月21日
行业资讯

OpenVINO 2024.0 带来更多 GenAI 功能和新的 JavaScript API

2024年3月7日，英特尔发布了开源 OpenVINO 2024.0 工具包，用于在各种硬件上优化和部署人工智能推理。 OpenVINO 是英特尔出色的开源 AI 工具包，不仅可以…

追风者
2024年3月7日
行业资讯

英特尔发布 OpenVINO 2024.1，提供更多人工智能和 LLM 功能

2024年4月25日，英特尔工程师发布了 OpenVINO 2024.1，这是这一优秀的开源人工智能工具包的最新功能版本，它将继续扩展其功能和能力，尤其是围绕生成式人工智能 &#8…

追风者
2024年4月26日
行业资讯

OpenVINO 2023.3 全面支持 Intel Emerald Rapids、更广泛的 GenAI 和 LLM

英特尔工程师周三发布了 OpenVINO 2023.3，作为这一领先的开源人工智能工具包的最新重大更新。OpenVINO 2023.3 为新型 Emerald Rapids 和 M…

追风者
2024年1月26日
行业资讯

OpenVINO 2024.4 为 Core Ultra 系列 2、新一代 AI 模型做好准备

2024 年 9 月 19 日，英特尔工程师发布了 OpenVINO 2024.4，这是其开源 AI 工具包的最新版本。OpenVINO 2024.4 为即将推出的英特尔酷睿超系列…

追风者
2024年9月20日

发表回复

登录后才能评论