FFmpeg 8 支持实时生成字幕
标签:
ffmpeg
实时
字幕
| 发表时间:2025-08-29 14:16 | 作者:
出处:https://www.solidot.org
刚刚释出的开源编解码器 FFmpeg 8 集成了语音识别和转录机器学习模型 Whisper,意味着它支持实时为视频生成字幕。FFmpeg 8 代号为 Huffman,以 1952 年发明的 Huffman 编码算法名字命名。Huffman 算法是历史最悠久的无损压缩算法之一。Whisper 模型由 OpenAI 于 2022 年 9 月发布,whisper.cpp 是 Georgi Gerganov 在 Whisper 基础上开发的本地和离线运行版本。
相关 [ffmpeg 实时 字幕] 推荐:
- - 奇客Solidot–传递最新科技情报
刚刚释出的开源编解码器 FFmpeg 8 集成了语音识别和转录机器学习模型 Whisper,意味着它支持实时为视频生成字幕. FFmpeg 8 代号为 Huffman,以 1952 年发明的 Huffman 编码算法名字命名. Huffman 算法是历史最悠久的无损压缩算法之一. Whisper 模型由 OpenAI 于 2022 年 9 月发布,whisper.cpp 是 Georgi Gerganov 在 Whisper 基础上开发的本地和离线运行版本.
- -
环境: ubuntu 16.04. 使用 opencv 获取摄像头数据帧, 进行处理之后(如进行 keypoint 识别), 将 opencv 中图像的 Mat类型转化为 ffmpeg 的 AvPicture 格式, 然后推送到流媒体服务器上, 本地通过 VLC 播放器查看实时检测效果. /etc/ffserver.conf配置外部可接入地址 在文件的.
- - SSORC.twSSORC.tw
ffmpeg 是一個命令列工具,用來對視訊檔案轉換格式. -i = 來源影片 (後面的參數先不接的話可以查看來源影片的詳細資訊,可供想要轉成什麼品質的參考). -vcodec = video code (如果要保留原格式就用 -vcodec copy). -acoder = audio code (如果要保留原格式就用 -vcodec copy).
- - inJava
这里裁剪是指时间轴裁剪,不是空间裁剪. 比如说,你想把视频的从一分20秒开始,30秒的视频裁剪出来,保存成一个视频. ffmpeg提供简单的命令参数:. -ss 开始时间,如: 00:00:20,表示从20秒开始;. -t 时长,如: 00:00:10,表示截取10秒长的视频;. -i 输入,后面是空格,紧跟着就是输入视频文件;.
- mk - OSMSG
FFmpeg堪称音频和视频应用程序的瑞士军刀,提供了丰富的选项和灵活性.很多时候用户为了看视频和听音乐都安装了ffmeg.更多关于ffmeg的详细介绍:here,可以通过ffmpeg -formats查看FFmpeg支持的视音频格式,左侧若是E表明可以编码,D表明可以解码. 本文着重介绍命令行下ffmeg的7个技巧:.
- - 移动开发 - ITeye博客
起始Nginx来搭建HLS步骤非常少. 安装好Nginx,然后跑起来. 把切片好的视频和m3u8文件放到部署目录,直接访问就可以了. 网上国内国外的找了好多博客. 这里一定注意一点,不要用VLC播放器来测试,最好用iPad或者iPhone,再么用Safari 开发模式下模拟iPad、iPhone的浏览器模式播放.
- - CSDN博客综合推荐文章
FFMPEG 是一个广泛用于媒体处理的库,在Java的世界里,处理视频的能力相当弱,于是有很大需求需要Java 调用 FFMPEG. Java 调用C 的方式有很多,可以用最原始的JNI方式,也可以JNA方式,还可以是命令行. 采用命令行的方式比较简单,不过有很大局限性,尤其是涉及到 视频的处理和分析的时候,比如要取出某个packet,然后进行处理.
- - Solidot
Google透露,它在两年多时间内帮助开源跨平台多媒体编解码器库FFmpeg发现和修复了1000多个bug. Google称,它不仅仅重视自家产品的安全,它的安全团队和Google雇员还经常评估外部软件,并将结果报告给软件供应商或维护者. FFmpeg和它的衍生版本Libav被许多项目广泛使用,其中包括Google Chrome、MPlayer、VLC和xine,Google认为帮助FFmpeg发现bug将会让数以百万计的用户受益.
- - 开源软件 - ITeye博客
-muxrate 复用码率,设置之后整体码率模式才是CBR. -c:v mpeg2video MPEG2视频编码. -flags ildct+ilme 隔行扫描. -top 隔行扫描前场/后场优先模式 ,1是前场(顶场),0是后场(底场). -streamid 设置视频、音频PID,0视频,1音频.
- - 掘金 后端
FFMpeg读做“FF Mpeg”, “FF”指的是 “Fast Forward”,而“Mpeg”指的是 Moving Picture Experts Group(动态图像专家组). 根据官方介绍,FFMpeg是一个完整的、跨平台的音频和视频录制、转换和流媒体解决方案. 简单来说,只要涉及 音视频开发,基本绕不开这个工具.