讯飞语音识别
讯飞语音识别技能提供了将语音转换为文本的功能,基于讯飞开放平台的实时语音识别服务。
代码配置
使用讯飞语音识别技能需要先在讯飞开放平台注册账号并创建应用,获取相关的AppID、API Key和Secret Key。(有免费额度)
typescript
const ppagent = new PPAgent({
skills: [
{
name: "xunfei-stt",
options: {
instanceName: "xunfei-stt", // 实例名称,需要全局唯一
appId: "xxxxxxxx", // 必填,讯飞应用的AppID
apiKey: "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", // 必填,讯飞应用的API Key
secretKey: "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", // 必填,讯飞应用的Secret Key
// ... 其他基础STT配置选项 ...
}
}
],
// ... source和bot等配置 ...
});
服务器运行请参考 install_code.md 文件。
注意事项
- 使用前需确保已经在讯飞开放平台创建了应用,并获取了正确的AppID、API Key和Secret Key。
- 该技能处理的音频数据会被转换为s16le格式,采样率为16000Hz。
- 讯飞语音识别服务有调用次数和流量限制,请关注平台的使用额度。
- 在配置中需要提供三个必要参数:appId、apiKey和secretKey,缺一不可。
- 该技能支持中文普通话识别,如需其他语言或方言识别,需要在讯飞平台开通相应服务。