申请免费百度语音识别API:简单、高效、安全
2023.10.10 11:47浏览量:1331简介:百度短语音识别可以将 60 秒以下的音频识别为文字。适用于语音对话、语音控制、语音输入等场景
精品推荐
实时语音识别-中文普通话
将音频流实时识别为文字,并返回每句话的开始和结束时间
接口
中文普通话
规格
10小时
短语音识别标准版 (中文普通话)
将60秒内的中文普通话音频识别为文字,适用于语音对话、控制和输入
接口
中文普通话
规格
1万次
短语音识别极速版
实时返回识别结果,适用于手机语音搜索、聊天输入等场景
规格
1万次
时长
12个月
短语音识别标准版-产品概述
百度短语音识别可以将 60 秒以下的音频识别为文字。适用于语音对话、语音控制、语音输入等场景。
- 接口类型:通过 REST API 的方式提供的通用的 HTTP 接口。适用于任意操作系统,任意编程语言
- 接口限制:需要上传完整的录音文件,录音文件时长不超过 60 秒。浏览器由于无法跨域请求百度语音服务器的域名,因此无法直接调用API接口。
- 支持音频格式:pcm、wav、amr、m4a
- 音频编码要求:采样率 16000、8000(仅支持普通话模型),16 bit 位深,单声道(音频格式查看及转换)
在线调试
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
调用流程
创建账号及应用: 在 ai.baidu.com 控制台中,创建应用,勾选开通 “语音技术”—“短语音识别”、“短语音识别极速版” 能力。获取AppID、API Key、Secret Key,并通过请求鉴权接口换取 token ,详细见 “接入指南”。
创建识别请求: POST 方式,音频可通过 JSON 和 RAW 两种方式提交。JSON 方式音频数据由于 base64 编码,数据会增大1/3。其他填写具体请求参数 ,详见 ”请求说明“。
短语音识别请求地址: http://vop.baidu.com/server_api
返回识别结果:识别结果会即刻返回,采用 JSON 格式封装,如果识别成功,识别结果放在 JSON 的 “result” 字段中,统一采用 utf-8 方式编码。详见 ”返回说明“。

发表评论
登录后可评论,请前往 登录 或 注册