Skip to content

讯飞语音识别

讯飞语音识别技能提供了将语音转换为文本的功能,基于讯飞开放平台的实时语音识别服务。

代码配置

使用讯飞语音识别技能需要先在讯飞开放平台注册账号并创建应用,获取相关的AppID、API Key和Secret Key。(有免费额度)

typescript
const ppagent = new PPAgent({
    skills: [
        {
            name: "xunfei-stt",
            options: {
                instanceName: "xunfei-stt", // 实例名称,需要全局唯一
                appId: "xxxxxxxx", // 必填,讯飞应用的AppID
                apiKey: "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", // 必填,讯飞应用的API Key
                secretKey: "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", // 必填,讯飞应用的Secret Key
                // ... 其他基础STT配置选项 ...
            }
        }
    ],
    // ... source和bot等配置 ...
});

服务器运行请参考 install_code.md 文件。

注意事项

  1. 使用前需确保已经在讯飞开放平台创建了应用,并获取了正确的AppID、API Key和Secret Key。
  2. 该技能处理的音频数据会被转换为s16le格式,采样率为16000Hz。
  3. 讯飞语音识别服务有调用次数和流量限制,请关注平台的使用额度。
  4. 在配置中需要提供三个必要参数:appId、apiKey和secretKey,缺一不可。
  5. 该技能支持中文普通话识别,如需其他语言或方言识别,需要在讯飞平台开通相应服务。