在数字视频处理和流媒体领域,FFmpeg 是不可或缺的基石。作为领先的开源多媒体框架,它为从 Blender 等视频编辑软件到 YouTube 等流媒体巨头的无数应用程序和服务提供了支持。FFmpeg 能够解码、编码、转码和处理几乎任何多媒体格式,因此成为开发人员和内容创作者的首选解决方案。
挑战:版本迁移导致帧重复
最近,在从 FFmpeg 4.4 迁移到 7.0.1 的过程中,我遇到了一个有趣的问题。当转码具有特定开始时间参数的视频片段时,新版本开始产生异常多的重复帧,确切地说,有 43 个。这种情况在 4.4 版中并不存在,这表明代码库中存在回归问题。
该问题出现在使用恒定帧速率模式(-fps_mode cfr)并调整 start_seek 时。错误信息如下:
Correcting start time of Input #0 by 23222 us.
[graph 0 input from stream 0:0 @ 0x6000008d5080] video frame properties congruent with link at pts_time: 1.441667
[vost#0:0/libx264 @ 0x12df04650] *** 43 dup!
使用的示例命令:
# 4.4
ffmpeg -v verbose -hide_banner -probesize 8388608 -analyzeduration 60000000 -threads 16 -ss 0:00:23.991667 -fflags +genpts -i videos/segment-test-video-mpegts.ts -dn -max_interleave_delta 20000000 -fflags +genpts -muxdelay 0 -pix_fmt yuv420p -r 30.000000 -rc-lookahead 40 -refs 1 -g 60 -vf "bwdif=deint=interlaced, scale='min(ceil(iw/2)*2,1280)':-2" -vsync cfr -vcodec libx264 -x264opts "bitrate=872:vbv-maxrate=1744:vbv-bufsize=872:no-scenecut:stitchable" -profile:v main -level 31 -map 0:0 -f ssegment -an -initial_offset 0:00:23.991667 -segment_start_number 6 -segment_list_type m3u8 -segment_time 4.0 -segment_list required-by-ffmpeg-but-ignored-by-us.m3u8 -segment_time_delta 0.01667 6-1/from_6_%d.ts
# 7.0.1
ffmpeg_7_0 -v verbose -hide_banner -probesize 8388608 -analyzeduration 60000000 -threads 16 -fflags +genpts -ss 0:00:23.991667 -accurate_seek -i videos/segment-test-video-mpegts.ts -dn -max_interleave_delta 20000000 -muxdelay 0 -pix_fmt yuv420p -r 30.000000 -rc-lookahead 40 -refs 1 -g 60 -vf "bwdif=deint=interlaced, scale='min(ceil(iw/2)*2,1280)':-2" -fps_mode cfr -vcodec libx264 -x264opts "bitrate=872:vbv-maxrate=1744:vbv-bufsize=872:no-scenecut:stitchable" -profile:v main -level 31 -map 0:0 -f ssegment -an -segment_time_delta 0.00833 -segment_start_number 6 -output_ts_offset 0:00:23.991667 -segment_list_type m3u8 -segment_time 4.0 -segment_list required-by-ffmpeg-but-ignored-by-us.m3u8 6/from_6_%d.ts
Git Bisect:开发人员的时间机器
为了找出根本原因,我们使用了 git bisect,这是一款功能强大的调试工具,可以对提交历史进行二进制搜索。这种有条不紊的方法让我们通过大约 10 次迭代缩小了有问题的变更范围,并用可重现的测试用例测试了每个版本。
通过搜索,我们找到了 5ccd4d306054cec839e9078203a3b3892a3372a2 次提交,它对 FFmpeg 输入文件处理中的时间戳处理逻辑进行了修改。
罪魁祸首:运算符优先级错误
仔细检查代码后,我们发现了一个微妙但重要的运算符优先级问题。有问题的一行是
abs_start_seek = is->start_time + (ifile->start_time != AV_NOPTS_VALUE) ? ifile->start_time : 0;
在 C 语言中,加法运算符 (+) 的优先级高于条件运算符 (?:)。这意味着表达式的求值方式如下:
abs_start_seek = (is->start_time + (ifile->start_time != AV_NOPTS_VALUE)) ? ifile->start_time : 0;
而不是预期的:
abs_start_seek = is->start_time + ((ifile->start_time != AV_NOPTS_VALUE) ? ifile->start_time : 0);
This precedence issue caused incorrect start time calculations, leading to the frame duplication problem we observed.
解决方法:使用显式括号解决问题
在提交aa20294b317558957cf124bb8e4da0521ab3c423中实现的解决方案很简单但至关重要——添加明确的括号来强制执行正确的评估顺序。
经验教训:Git Bisect 的价值
这次调试之旅凸显了 git bisect 在追踪回归方面的宝贵价值。在像 FFmpeg 这样复杂的代码库中,主要版本之间有数千个提交,手动搜索回归源就像大海捞针。
Git bisect 的二分搜索方法将原本需要几天或几周的调查变成了一个仅需大约 10 个步骤的系统化过程。每个步骤都提供了有关问题是否存在的明确反馈,使我们能够锁定导致回归的确切提交。
这次经历凸显了软件开发的两个关键方面:复杂表达式中显式括号的重要性以及全面回归测试的必要性。虽然 C 的运算符优先级规则定义明确,但显式括号使代码的意图更清晰,有助于防止出现细微错误。此外,这次事件凸显了为什么 FFmpeg 项目会受益于额外的回归测试,这些测试专门验证时间戳处理和帧重复场景。此类测试可以在开发周期的早期发现类似问题,以免影响全球数百万依赖 FFmpeg 的用户。
最后,这项调查表明,像 FFmpeg 这样的工具对于视频流行业有多么重要,以及通过仔细调试和测试来保持其可靠性有多么重要。虽然修复很小,但可以确保无数依赖 FFmpeg 满足多媒体需求的应用程序和服务能够更准确地处理视频。
作者:Pradeep Kumar Goudagunta,Dropbox、Magic Pocket – 核心存储团队的高级工程师。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/55038.html