1. 智能语音交互

录音文件识别

 

提供的是将语音转写成文字的服务。

实时语音转写

对首频流做实时转写,达到边说边出文字的效果。

一句话识别

 

对时长较短(一分钟以内)的语音进行转写。

语音合成

 

语音合成服务(TTS),就是将文本转成语音的服务。

语音合成声音定制

为企业提供深度定制TTS声音的能力。

语言模型自学习工具

 

通过文本数据自学习训练语音模型,以达到定制效果。

人工智能

人脸识别

 

提供人脸检测定位、人脸属性识别等独立服务模块。

2. 人脸识别

图像识别

 

基于大数据和深度学习实现,可精准识别图像中的视觉内容。

3. 图像识别

图像搜索

 

帮助用户在自建图库中实现相同或相似图片搜索的服务。

4. 图像搜索