技术文章
-
基于IM场景下的Wasm初探:提升Web应用性能|得物技术
一 何为Wasm ? Wasm,全称 WebAssembly,官网描述是一种用于基于堆栈的虚拟机的二进制指令格式。Wasm被设计为一个可移植的目标,用于编译C/C++/Rust等高…
-
REST 的消亡:WebSockets 将成为 AI 代理的新标准
想象一下,AI co-pilot 不仅仅是一个聊天机器人,它还具有语音功能,能够倾听、理解并立即做出响应,为您的应用程序创造自然的交互体验。随着 AI 和大型语言模型(LLM)进一…
-
WebRTC API 应用:如何使用 JavaScript 访问相机和拍照
在当今的数字时代,通过网络浏览器访问用户设备上的摄像头已成为从社交媒体平台到视频会议工具等各种应用的基本功能。WebRTC API 为这一功能提供了便利,它允许开发人员利用实时媒体…
-
Meta AI 发布 Sparsh:首个基于视觉的触觉传感通用编码器
触觉传感在机器人技术中起着至关重要的作用,它能帮助机器有效地了解环境并与之互动。然而,基于视觉的触觉传感器的现状带来了巨大挑战。传感器的形状、光照和表面标记各不相同,因此很难构建通…
-
音视频面试题集锦第 35 期 | 播放器功能方案(附伪代码)
音视频面试题集锦第 35 期,来自音视频技术社群关键帧的音视频开发圈。 下面是大厂音视频面试中,关于播放器一些具体功能技术方案的面试题提纲,我们在参考答案中使用伪代码进行了模块实现…
-
超低延迟多路径传输:技术演进与大规模业务实践
在网络技术迅猛发展的当下,超低延迟已成为视频流媒体传输的关键需求。2022 年起,火山引擎多媒体实验室针对超低延迟多路径传输领域展开了深入的前沿探索与研究。 目前,多媒体实验室与流…
-
如何在 Linux 上安装带有 NVIDIA GPU 加速的 FFmpeg
FFmpeg 是一款适用于 Linux 和类 Unix 系统的免费开源视频格式转换器套件。不过,在 Ubuntu/Debian Linux 和其他发行版上,基于 NVIDIA 硬件…
-
VoIP 协议比较:SIP、H.323 和 WebRTC 的区别
本文将详细探讨三种著名的 VoIP 协议: SIP(会话发起协议)、H.323 和 WebRTC。我们将研究它们的功能、用例、性能、安全性、互操作性等。
-
SmolLM2 发布:新系列(0.1B、0.3B 和 1.7B)小语言模型,性能优于 Meta Llama 3.2 1B
近年来,大型语言模型 (LLM) 的激增极大地改变了我们处理自然语言处理任务的方式。然而,这些进步并非没有缺点。GPT-4 和 Meta 的 LLaMA 等大型 LLM 的广泛使用…
-
Meta AI 发布 MobileLLM 125M、350M、600M 和 1B 模型检查点
大型语言模型 (LLM) 的广泛采用为对话式 AI、内容生成和设备端应用等领域带来了重大进步。然而,部署这些模型严重依赖大量云资源,引发了对延迟、成本和环境可持续性的担忧。像 GP…
-
webrtc demo功能示例(视频互动及通讯功能Demo)
该文章为即构科技webrtc的使用示例demo,希望帮助开发者快速上手webrtc-sdk;每个页面展示sdk一种功能,可根据实际场景自由组合。 WebRTC Demo 在线演示地…
-
音视频面试题集锦第 34 期|直播和视频播放器方向
音视频面试题集锦第 34 期,内容来自音视频技术社群关键帧的音视频开发圈。 下面是大厂音视频面试官常备的播放器面试题提纲,这些面试题覆盖了播放器 SDK 技术的主要方面,包括架构设…
-
使用 Pub/Sub 模型在 Flutter 中进行实时通信
在 Flutter 开发中,管理应用程序各个组件之间的通信是一项挑战,尤其是当您需要发送实时更新时。这正是 pub/sub(发布-订阅)模型的优势所在。在发布/订阅模型中,组件(订…
-
ffmpeg支持webrtc推流
作者:音视频小话来源:https://mp.weixin.qq.com/s/urFWlNYcOFs5OwCrre9WGA 1 前言 ffmpeg是音视频业界最著名的开源之一,支持多…
-
Meta AI 发布 LongVU:一种可解决长视频理解重大挑战的多模态大型语言模型
理解和分析长视频一直是人工智能领域的一大挑战,这主要是因为需要大量的数据和计算资源。由于上下文长度有限,传统的多模态大型语言模型 (MLLM) 难以处理大量视频内容。这一挑战对于长…
-
OpenSIPS 社区版:开源 SIP 平台/解决方案
2024年10月29日,OpenSIPS 官方博客表示考虑进一步采用开源模式,从代码层面扩展到解决方案/平台层面,实现这一目标的方法就是 OpenSIPS Community Ed…
-
音视频面试题集锦第 33 期 | 面试官针对编解码方向的追问
分享音视频面试题集锦第 33 期,内容来自音视频技术社群关键帧的音视频开发圈。 今天我们继续从一位音视频面试官的面试题库中,挑出他在编解码方向会追问候选人的问题,这些面试题覆盖了音…
-
Mini-InternVL: 多模态大语言模型 (MLLM) 1B 至 4B 系列,仅用 5%的参数就能实现 90% 的性能
多模态大型语言模型 (MLLM) 在人工智能领域发展迅速,它集成了视觉和语言处理功能,以增强对各种数据类型的理解和交互。这些模型通过将视觉和文本数据处理结合到一个连贯的框架中,在图…
-
如何快速实现APP中的IM即时聊天功能
如何快速实现APP中的IM即时聊天功能?本文主要分享IM开发的3种实现方式:包括使用开源、自研、以及使用厂商SDK的经验,希望对IM开发者有所帮助。
-
Flutter 中的 HTTP 和 WebSocket 有什么区别?
了解 Flutter 中 HTTP 和 WebSocket 通信之间的主要区别,以及何时使用它们来构建高效的应用程序。 在 Flutter 中,HTTP 和 WebSocket 都…