谷歌Live Transcribe语音转文字应用 帮助听力障碍人士进行交流

来源:证券日报  2019-04-25 02:58
分享到:
导语

近日,Google推出了一款基于Android系统的实时转录应用Live Transcribe,可以将自动字幕融入日常会话,减少现实世界中的对话障碍。

近日,Google推出了一款基于Android系统的实时转录应用Live Transcribe,可以将自动字幕融入日常会话,减少现实世界中的对话障碍。

Live Transcribe是基于Google在过去几十年的自动语音识别(ASR)技术的研究基础之上,针对安卓平台的设备来开发的应用程序。支持70多种语言,覆盖全球80%以上的人口。在有网络的地方,转录延时不会超过 200 毫秒。

根据世界卫生组织统计,目前全球约有4.66亿耳聋和听力障碍患者。以往耳聋和听障人士主要依赖于人工转录服务,服务费用高昂,且通常需要提前很久预约。

Live Transcribe的产品经理Sagar Savla表示,实时语音识别的模型由三个部分组成,第一个是声音模型,主要是辨别一个单词中的不同音节;第二个是发音模型,把第一个模型辨别出来的这些音节,组成实际的单词。第三个模型是语言的模型,会根据这些单词给它增加适当的标点符号和停顿。

据了解,之所以选择在 Android 手机上开发这项无障碍服务,是因为相比电脑、平板设备、投影仪和可穿戴设备等,智能手机是相对价格成本最低廉的一种选择。

据悉,在实时这个字幕的时候是否要在旁边显示字幕转录的置信度?可能大家自然而然地就觉得,当然要去显示它的准确度是多少。但是事实上,显示这个可能就会造成一种用户体验非常不好的情况,因为都会给用户带来一种误导。

Sagar Salva还表示,Live Transcribe原本属于Google20%的创新项目,但是开始不久就立刻就意识到,这其实是一个非常切实的项目。所以最终我们其实是把它作为了一个实际的项目固定下来了,建立了相应的产品开发团队。它不光可以帮助完全听不到的聋人,对于出现听觉障碍的老年人,也非常适用。

编辑:王晓婧
语音 文字 应用
分享到:
  • 热门排行
  • 大家喜欢
  • 在云原生快速普及的趋势下,传统软件架构正在全面转向云架构,而传统软件开发也全面向云开发的模式推进。特别是企业内的基础支撑系统在积极适应业务互联网化、数字化过程中,产生了“敏捷开发”、“快速迭代”的刚性需求。CIO和CTO如何打造全新的IT团队和模式?如何更好的满足越来越多由业务部门发起的零散IT需求,成为巨大的挑战。为了一种全新的IT基础系统,低代码开发平台正在快速的出现和普及

  • 5月24日,阿里云宣布与马来西亚知名智能交通公司Sena Traffic Systems(Sena)达成深度合作,在吉隆坡建设智能交通管理系统。该系统集成阿里云城市大脑的核心技术引擎,可对城市中交通管理设施进行智能化改造,或将为当地节省12%的出行时间。

  • 5月22日早上,有外媒报道称海康威视(002415.SZ)可能遭遇美国供应商“断供”。受此利空消息影响,海康威视股价开盘逼近跌停,对此公司投资者关系负责人早间回应第一财经记者查询时表示:“我们这边暂时没有接到消息。”

  • 5月23日,全球知名物流公司DHL在官方公众号发布文章《关于近期部分媒体报道的声明》,回应“停止接受华为快件”一事。