

大厂Animal认证作者
-
Seedream 3.0 文生图模型技术报告发布
字节跳动 Seed 团队正式发布 Seedream 3.0 技术报告。Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型,对比 Seedream 2.0,…
-
CVPR 2025 | 火山引擎获得NTIRE 视频质量评价挑战赛冠军
近期,在计算机视觉领域最具影响力的「国际竞赛 CVPR 2025 NTIRE」中,火山引擎多媒体实验室团队同学组成“SharpMind”小组,在NTIRE 2025 Short-f…
-
FLUX提速1.9X & LoRA热插拔!图像生成加速新标杆lyraDiff全面开源!
刚刚,腾讯天琴实验室在官微宣布 lyraDiff 全面开源,以下为全文内容。 还在忍受原生Stable Diffusion与FLUX等文生图模型的龟速推理和显存与成本焦虑?第三方加…
-
2025 B站春晚直播——极速流式直播转点播在春晚项目中的实践
项目背景 2025年春晚是公司(B站)的年度大型直播活动,在常规的直播之外,直播结束之后转出点播稿件的耗时,也是一项重要的竞争指标。根据运营团队同步的信息,一些竞品可以在10分钟之…
-
淘宝直播AI提效探索的一些心得
本文围绕淘宝直播团队在过去半年中基于AI技术在工程侧提效的探索展开,详细介绍了服务端、前端、数据科学、测试和数据研发等职能团队如何结合AI能力进行创新尝试。文章不仅总结了现阶段取得…
-
百万级群聊的设计实践
本文介绍了服务端在搭建 Web 版的百万人级别的群聊系统时,遇到的技术挑战和解决思路,内容包括:通信方案选型、消息存储、消息有序性、消息可靠性、未读数统计。 作者:来自 vivo …
-
直播间互动框架性能优化与稳定性实践
导读:直播间互动体验框架技术实践,揭秘性能与稳定性优化之道,快来探索吧!在百度直播间歌会红包等活动中,我们创新性地将红包互动与高质内容深度融合,通过技术架构升级与系统性优化,打造了…
-
基于流媒体点直播业务的算法赋能探索
本文从B站流媒体点直播的日常业务出发,结合具体业务实例详细介绍如何利用算法赋能业务。 作者丨Fiver来源 | 多媒体 哔哩哔哩技术 背景概述 早在20世纪人们就开始了人工智能的相…
-
B站自研的第二代视频连麦系统(上):如何使用WebRTC的标准应用编程接口来接入视频连麦业务
本系列文章将从客户端、服务器以及音视频编码优化三个层面,介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解,帮助开发者更全面地了解 WebRTC 的核心技术与实践应用…
-
WebAssembly视频检测在社区创作平台的落地与实践 | 得物技术
一 背景&现状 创作者服务平台作为得物为社区创作者提供的PC端视频发布入口,地位非常重要。且随着功能的升级迭代,用户群体也越来越多。但我们偶尔会收到如下反馈: 视频的损坏不…
-
通义3D-Speaker多说话人日志功能
说话人日志任务(Speaker Diarization)是指将音频划分为属于不同说话人的多个段落。其目标是确定音频中有多少个不同的说话人,并且识别出每个说话人在音频中的开始时间和结…
-
语音生成大模型CosyVoice升级2.0版本 | 开源更新
CosyVoice是阿里巴巴通义实验室语音团队于今年7月份开源的语音生成大模型,依托大模型技术,实现自然流畅的语音生成体验。与传统语音生成技术相比,CosyVoice具有韵律自然、…
-
MQ消息乱序问题解析与实战解决方案
1. 背景 在分布式系统中,消息队列(MQ)是实现系统解耦、异步通信的重要工具。然而,MQ消费时出现的消息乱序问题,经常会对业务逻辑的正确执行和系统稳定性产生不良影响。本文将详细探…
-
3D直播观赛的背后:2D转3D技术
写在前面:随着技术的不断进步和创新,人们对于视听体验的需求也在不断提升。通过将平面视频转变为3D视频,观赏者能够沉浸于更加立体、生动的视听世界中,享受到更加真实、逼真的观赏体验。随…
-
火山引擎veImageX助力谱时智能云深耕照片直播赛道
照片直播作为一种新兴的影像传播方式,正在逐渐改变人们记录和分享美好瞬间的方式。无论是个人活动、婚礼庆典,还是企业会议、产品发布,照片直播都能实时记录并分享每一个精彩瞬间,共享美好时…
-
通义语音处理技术ClearerVoice-Studio
随着语音技术的普及,语音质量已成为人们关注的焦点。环境噪声、混响、设备拾音等问题,常常使语音质量和可懂度大打折扣。无论是录制清晰语音却因周围环境嘈杂充满噪声,还是在地铁、餐厅等喧闹…
-
对齐人类主观偏好的图像质量评价方法 | 火山引擎论文入选国际会议ACM MM’24
2024年10月28日至11月1日,ACM Multimedia(ACM MM) 2024在澳大利亚墨尔本召开,该会议是中国计算机学会(CCF)推荐的多媒体领域的A类国际学术会议。…
-
哔哩哔哩客服坐席调度系统的演进
本文详细探讨了哔哩哔哩客服坐席调度系统的演进,特别是在线客服和工单客服的调度策略。随着客户需求的增加,尤其是在大型活动期间,客服系统面临着突发的高流量和复杂的客户问题。为了提高服务…
-
B站直播S14保障全解析:高效保障技术实践
在高并发、大流量的互联网时代,如何在大型活动期间保障系统的稳定性和用户的流畅体验,是每个技术团队都面临的挑战。本文以B站直播团队在英雄联盟2024赛季全球总决赛(S14)期间的保障…
-
将淘宝直播间融入H5页面的技术探索
在数字化转型的浪潮中,如何将直播间无缝融入H5页面,成为提升用户体验和业务转化率的关键挑战之一。本文探讨了这一创新实践,通过技术解析和实际案例,展示了如何在H5页面上实现直播间的高…