谷歌开源Live Transcribe语音识别转文字工具

标签: 业界动态 | 发表时间:2019-08-18 19:33 | 作者:user@gmail.com (translate)
出处:https://www.williamlong.info/

  谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助。

  Live Transcribe 是谷歌于今年2月推出的一款Android应用程序,它的语音识别由谷歌最先进的Cloud Speech API提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此,谷歌把它开源出来,希望开发人员在已有的基础上进一步构建和开发。

  Cloud Speech API目前无法支持无限的音频流,团队采取了一些措施来解决这一难题,例如在达到超时之前关闭并重新启动流式传输请求,这将有效减少会话中丢失的文本量。

Live Transcribe

  值得一提的是,Live Transcribe支持超过70种语言,并能够根据语音自动识别语种,其中也包括中文。

  另外,由于是提供实时语音转录,转录出来的文本会随着语音的输入不断发生变化,降低延迟自然十分必要。该引擎能够大大降低延迟率,这都要归功于它的自定义Opus编码器。

   Live Transcribe语音引擎功能

  Google列出了语音引擎的以下功能(不包括说话人识别):

  无限流媒体。

  支持70多种语言。

  可以简化网络丢失(在网络和Wi-Fi之间切换时)。文字不会丢失,只会延迟。

  强大的扩展网络损耗。即使网络已经停电数小时,也会重新连接。当然,没有连接就不能进行语音识别。

  可以轻松启用和配置Opus,AMR-WB和FLAC编码。

  包含文本格式库,用于可视化ASR置信度、发言人ID等。

  可离线模型扩展。

  内置支持语音检测器,可在延长静音期间用于停止ASR,以节省资金和数据。

  内置支持扬声器识别,可根据扬声器编号标记或着色文本。

  英文原文: Bringing Live Transcribe's Speech Engine to Everyone

相关 [谷歌 开源 live] 推荐:

谷歌开源Live Transcribe语音识别转文字工具

- - 月光博客
  谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助.   Live Transcribe 是谷歌于今年2月推出的一款Android应用程序,它的语音识别由谷歌最先进的Cloud Speech API提供.

微软关闭Windows Live Spaces

- 柑桔 - 月光博客
  微软今天发布消息称,微软即将关闭已经运营了四年的Windows Live Spaces服务,并在未来六个月中将用户转移至WordPress.com博客平台.   微软和Wordpress共同宣布了这一消息,目前Windows Live Spaces拥有3000万用户,而WordPress拥有2600万用户.

Sony Ericsson Live With Walkman 评测

- 品味视界 - Engadget 中国版
刚刚一个九月,推出的手机不多,值得让我们去详细试玩评测的更少. 不过,作为 Walkman 系列中规格比较象样的一部手机,Live With Walkman 我们还是一定要评测的,虽然整体和其他 Xperia 系列手机的分别不大,但加上 Walkman 的标记,难免会让人有所期望. 到底 Live With Walkman 能不能让 Walkman 手机复活,以一部手机而言它又是否出色.

Windows Live支持XMPP协议

- 康爷 - Solidot
微软在BUILD会议上宣布Windows Live Messenger将支持开放标准网络即时消息协议XMPP. Google Talk、Facebook聊天服务和IBM Lotus Sametime都等支持XMPP. 微软表示,Windows Live Messenger将提供XMPP接口,允许用户将Messenger整合到基于Web、桌面和移动IM产品中.

基于云的Live Debian系统

- greenar - Solidot
goofegg 写道 "中国科技大学的学生建造了一套校内使用的基于云的Live Debian系统. 文章称:“借助于科大PXE服务(校外无法访问),我们正在定制一个‘云存储’Linux 系统. 此前,科大校园内通过PXE启动可以进入一些Live Linux系统,但在这些系统中的 所有修改都仅存在于内存中,关机后就丢失了.

Linkin Park - Rolling In The Deep(live中英字幕)

- Alen - 音动我心 – Mtime时光网

Xbox Live 确认将会登陆 Windows 8

- ts - Engadget 中国版
看过 Windows 8 新功能总整理后,感觉上缺了一些东西. 没错了,就是在 Windows Phone 7 上也能看见的 Xbox Live. 数天前,微软全球市场及互动娱乐部门的副执行长 Mike Delman 曾经在 The Seattle Times 上说过「Xbox Live 已在 Windows Phone 上取得成就」,「Xbox Live 将会内置于 PC 中.

Nginx+ffmpeg搭建Apple Http Live Streaming笔记

- - 移动开发 - ITeye博客
起始Nginx来搭建HLS步骤非常少. 安装好Nginx,然后跑起来. 把切片好的视频和m3u8文件放到部署目录,直接访问就可以了. 网上国内国外的找了好多博客. 这里一定注意一点,不要用VLC播放器来测试,最好用iPad或者iPhone,再么用Safari 开发模式下模拟iPad、iPhone的浏览器模式播放.

Redis服务器监控工具redis-live

- - 企业架构 - ITeye博客
Redis服务器监控工具redis-live. 413 views     comments 暂无评论. 目前来说,越来越多的使用多了NOSQL的业务,但是这方面的监控缺不多. 今天给大家介绍几个专业监控redis服务的工具,便于大家进行redis性能分析. 这个工具是用ruby语言写的,ruby是小鬼子弄出来的,个人真心觉得比较难用.

红帽CEO:没有开源就没有谷歌和Facebook

- 幻幽 or A書 - cnBeta.COM
美国科技博客BusinessInsider近日对红帽CEO吉姆・怀特赫斯特(Jim Whitehurst)进行了采访,怀特赫斯特称,如今开源应用几乎无处不在,科技公司、银行和股票交易所等都是使用. 没有开源,谷歌和Facebook根本不可能继续存在.