Skip to content

腾讯语音合成

腾讯语音合成技能基于腾讯云的语音合成服务,支持将文本转换为多种音色的语音。

特点

  • 支持多达46种不同音色,包括标准音色和精品音色
  • 可调节语速、音量等语音参数
  • 支持最大150个字符的转换
  • 可配置触发概率,灵活控制语音回复的频率
  • 可选择是否自动移除无法阅读的内容(如emoji和Markdown)

代码配置

typescript
const agent = new PPAgent({
    skills: [
        {
            name: "tencent-tts-skill",
            options: {
                instanceName: "tencent-tts", // 实例名称,需全局唯一
                secretId: "your-secret-id", // 腾讯云API的Secret ID,必填
                secretKey: "your-secret-key", // 腾讯云API的Secret Key,必填
                voice: 0, // 发音人编号,默认为0(标准音色-灵悦(通用女声))
                spd: 0, // 语速,取值范围[-2,6],默认为0(中语速)
                vol: 0, // 音量,取值范围[-10,10],默认为0(中音量)
                probability: 1, // 触发概率,取值范围[0,1],默认为1(100%触发)
                deleteUnreadableText: false // 是否自动移除无法阅读的内容,默认为false
            }
        }
    ],
    source: [...],
    bots: [...]
});

服务器运行请参考 install_code.md 文件。

注意事项

  1. 使用前需要在腾讯云申请开通语音合成服务,并获取对应的SecretId和SecretKey。

  2. 发音人编号(voice)选择众多,从标准音色到精品音色共46种选择,详细音色列表可参考腾讯云语音合成音色文档

  3. 语音合成有字数限制,单次最多支持150个字符,超过限制的文本将无法进行语音合成。

  4. 如果回复内容中包含emoji、Markdown等不可朗读的内容,默认情况下会取消语音转换。如需在此情况下仍然进行语音转换,可将deleteUnreadableText设置为true