帮助文档能力产品语音识别处理

语音识别处理

1、平台简介

语音识别处理平台是由中国移动推出的智能语音能力平台,采用来自科大讯飞的全球领先智能语音技术,向开发者提供语音识别、语音合成、语义理解、声纹识别、语音评测等能力,为开发者提供方 便易用的开发接口,使用户随时随地享受高质量的智能语音服务。

2、语音能力

2.1、语音能力

1)语音合成:语音识别处理平台所采用的语音合成系统是新一代的文语转化引擎,采用最先进的中文文本、韵律分析算法和大语料库的合成方法,合成语音非常接近真人的自然语音效果。支持支持合 成中、英、粤以及台湾普通话、四川话、东北话、河南话、湖南话、陕西话等方言;支持中英文混读合成;支持多种不同音色发音人的选择。

2)语音识别:语音识别能力可提供关键字识别和语音听写功能。具备优秀的识别率(98%以上),提供全面的开发支持,丰富的工具易于使用,核心技术上达到了国际领先水平。支 持识别中文、英文、粤语;支持中英文同时混合识别;支持个性化用户词表识别;语音听写时支持标点智能预测。

3)语义理解:即让机器能更好理解特定场景和领域内语言的含义和发音人的意图,语音识别处理针对许多常用的场景和使用领域,进行语料的大量收集和分析,提供的语义服务满足现今嵌入式设 备和移动设备的日常使用所需。

4)声纹识别:这是一项根据语音波形反映说话人生理和行为特征的语音参数、自动识别说话人身份的技术。只需要电话和麦克风即可,数据采集极为方便,造价低廉。语音识别处理支持文本密码 (密码为指定文本内容)、数字密码(密码为随机数字串)和自由说(密码内容不限)三种类型声纹密码。识别率超95%,可应用于安保(门禁)、金融(支付安全)、智能硬件(设备授权) 等领域。

5)语音评测:这项技术是通过智能语音技术自动对发音水平进行评价、发音错误、缺陷定位和问题分析的。涉及的核心技术主要可分为三个部分:中文普通话发音水平自动评测技术、英文 发音水平自动评测技术、中英文发音自动评测统一技术框架。涵盖中文和英文两种语种,提供字、词、句的标准及流畅度评分。

2.2、如何申请语音能力

①请先登录中国移动开发者社区。(本社区目前支持IE内核浏览器,如:IE、遨游、世界之窗)

②登录成功后,进入“管理中心”再点击左菜单“应用发布”

③填妥应用的名称和简介,务必勾选“含有能力”,选择你希望应用语音能力的平台并在更多能力一栏勾选“语音识别处理能力”

④AppID申请成功,下载SDK,集成开发,让你的应用灵动犀利,与众不同

3、支撑平台

目前支持Android、IOS、Windows Phone、Symbian、Kjava;Windows、Linux、Java、Flash等平台。

目录
  • 1、平台简介
  • 2、语音能力
  • 3、支撑平台