智能语音

提供语音识别、语音合成、语义理解等智能语音交互能力,让您的产品能听会说,更懂您。

产品介绍

提供语音识别、语音合成、语义理解、声纹识别、离线合成、离线命令词、离线唤醒功能,同时支持天气、股票、新闻、小说、电影、电影院、餐饮、航班、火车、酒店、视频、打电话、发短信、日程提醒、联系人、话费业务、手机积分、流量业务18个语义场景。

产品能力

  • 语音识别

    自动识别您的语音,转变为文字,进行信息输入

  • 语音合成

    将文字合成语音进行播报,变看为听,同时支持离线合成能力

  • 语音理解

    建立常用的使用场景,让应用充分了解您话语的含义,您说它做

  • 声纹识别

    提取说话人声音特征和说话内容信息,自动核验说话人身份,保障身份验证真实可靠

  • 离线唤醒

    通过唤醒词让休眠状态下的设备进入等待指令状态

  • 离线命令词

    通过命令词让设备作出相应的反馈

产品优势

  • 准确率高

    语音识别引擎识别准确率位于语音能力行业前列,普通话识别准确率可达到98%以上

  • 多语言识别

    支持中文、英文两个语种的识别,同时还提供粤语、河南话、东北话、四川话等方言的识别,提供更贴合用户需求的选项

  • 听感自然

    语音合成基于参数合成技术,提供多角色发音人声音包,合成效果堪比真人,并可根据需求定制发音人

  • 语义丰富

    多年积累的语义库保障语义理解的通用性和实用性,可达商用效果,支持自定制语义库与现有语义库结合使用,支撑垂直场景下的语义运营工作

应用场景

智能硬件

适用于智能音箱、智能家居、机器人等智能硬件开发,使设备具有语音交互能力,让生活更加智能

软件应用

适用于语音导航、阅读类、掌厅类、输入法类等需要语音交互的软件应用开发,提升用户体验

开发文档