申请免费百度语音识别API:简单、高效、安全

作者:快去debug2023.10.10 11:47浏览量:1331

简介:百度短语音识别可以将 60 秒以下的音频识别为文字。适用于语音对话、语音控制、语音输入等场景

精品推荐

实时语音识别-中文普通话

将音频流实时识别为文字,并返回每句话的开始和结束时间

接口

中文普通话

规格

10小时

短语音识别标准版 (中文普通话)

将60秒内的中文普通话音频识别为文字,适用于语音对话、控制和输入

接口

中文普通话

规格

1万次

短语音识别极速版

实时返回识别结果,适用于手机语音搜索、聊天输入等场景

规格

1万次

时长

12个月

短语音识别标准版-产品概述

百度短语音识别可以将 60 秒以下的音频识别为文字。适用于语音对话、语音控制、语音输入等场景。

  • 接口类型:通过 REST API 的方式提供的通用的 HTTP 接口。适用于任意操作系统,任意编程语言
  • 接口限制:需要上传完整的录音文件,录音文件时长不超过 60 秒。浏览器由于无法跨域请求百度语音服务器的域名,因此无法直接调用API接口。
  • 支持音频格式:pcm、wav、amr、m4a
  • 音频编码要求:采样率 16000、8000(仅支持普通话模型),16 bit 位深,单声道(音频格式查看及转换)

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

调用流程

创建账号及应用: 在 ai.baidu.com 控制台中,创建应用,勾选开通 “语音技术”—“短语音识别”、“短语音识别极速版” 能力。获取AppID、API Key、Secret Key,并通过请求鉴权接口换取 token ,详细见 “接入指南”。

创建识别请求: POST 方式,音频可通过 JSON 和 RAW 两种方式提交。JSON 方式音频数据由于 base64 编码,数据会增大1/3。其他填写具体请求参数 ,详见 ”请求说明“。

短语音识别请求地址: http://vop.baidu.com/server_api

返回识别结果:识别结果会即刻返回,采用 JSON 格式封装,如果识别成功,识别结果放在 JSON 的 “result” 字段中,统一采用 utf-8 方式编码。详见 ”返回说明“。

article bottom image

相关文章推荐

发表评论

图片