产品描述

提供业界领先的多场景语音识别技术,让您的应用长上耳朵



产品功能

语音识别

为您提供高精度的语音识别服务,融合百度领先的自然语言处理技术,支持多场景智能语音交互

长语音识别

将长语音(长时间连续说话)转换为文字,让您解放双手,告别键盘输入时代

远场语音识别

通过麦克风阵列前端处理算法,让目标说话人即使在3-5米的距离说话,也可准确识别

呼叫中心实时语音识别

针对呼叫中心设备特征,特训大量电话数据形成专属识别模型。专为企业中对ASR时效要求高的业务,提供百毫秒级实时语音转文字的服务

呼叫中心音频文件转写

针对呼叫中心设备特征,特训大量电话数据形成专属识别模型。专为企业对ASR时效要求较低的业务,提供最低成本音频文件转文字的服务



产品优势

使用方式灵活

支持Android、iOS以及全平台的REST API方式调用,提供多垂类识别

效果表现优秀

提供基于百度大脑的业界顶级语音模型,效果行业领先,为业务产品营造顺畅体验

离线在线融合模式

根据当前用户网络状况,自动判断使用本地引擎还是云端引擎进行处理,可以兼顾速度及流量消耗



应用场景

语音输入法

摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷

主要服务: 语音识别 长语音识别

语音搜索

搜索内容直接以语音的方式输入,让搜索更加高效 

主要服务: 语音识别 长语音识别

智能家居

通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作

主要服务: 远场语音识别 语音合成 语音唤醒

机器人语音交互

提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便

主要服务: 远场语音识别 语音合成 语音唤醒

实时字幕

将直播、视频、现场演讲等音频进行实时的字幕转换,降低理解成本,提升用户体验

主要服务: 长语音识别

语音笔记

可将笔记、总结等,通过语音的方式转为文字,进行记录,大幅提升了用户的录入效率

主要服务: 长语音识别




产品参数

产品价格

套餐名称规格价格