撰写自然的文字转语音脚本

若要根据文本创建富有吸引力且听起来自然的音频,需要了解口语的细微差别,并将其转换为脚本形式。本指南将帮助您撰写听起来真实且能体现所选语气的脚本。

了解目标:自然语音

主要目标是让合成语音听起来尽可能接近自然的人类讲话者。这些行为包括:

  • 模仿自然节奏:说话的快慢。
  • 打造流畅的节奏:确保句子和短语之间顺畅过渡。
  • 添加逼真的停顿:加入停顿以强调和清晰地表达内容。
  • 捕获对话语气:让音频听起来像是真实对话。

自然语音的关键技术

  • 用于节奏和节奏的标点符号

    • 英文句号 (.):表示完全停止和更长时间的暂停。使用它们来分隔完整的想法,并明确句子边界。
    • 英文逗号 (,):表示句子中较短的停顿。用它们来分隔从句、列表项或引入短暂的休息时间。
    • 省略号 (...):表示更长、更有目的的停顿。它们可以表示后续想法、犹豫或戏剧性停顿。
      • 示例:“然后…就这样发生了。”
    • 连字符 (-):可用于表示短暂的停顿或突然的思维中断。
      • 示例:“我想说 - 但我说不出来。”
  • 加入停顿和口误

    • 战略性停顿:在人类讲者自然会停顿呼吸或强调的地方,使用省略号、英文逗号或英文连字符来添加停顿。
    • 口误(嗯和呃):虽然某些文本转语音模型会自动处理口误,但了解它们的作用至关重要。这些音效可以增添真实感,让语音听起来不那么机械。即使模型添加了这些空白,了解它们在人类语音中自然出现的位置也有助于您了解脚本的整体流程。
  • 实验和迭代

    • 重新合成:请不要担心,可以使用同一声音多次重新合成同一消息。对标点、空格或用词进行细微调整可能会对最终音频产生重大影响。
    • 仔细聆听:仔细注意合成音频的节奏、流畅度和整体语气。找出听起来不自然的部分,并相应地调整脚本。
    • 声音变体:如果系统允许,请尝试使用不同的声音,看看哪种声音最适合您的脚本和所选语气。
  • 实用脚本编写提示

    • 大声朗读:在合成之前,请大声朗读您的脚本。这有助于您发现不当的措辞、不自然的停顿以及需要调整的方面。
    • 以对话方式撰写:使用缩写词(例如”和“我们”)以及非正式用语,使脚本听起来更自然。
    • 考虑情境:脚本的语气和节奏应与音频的情境相符。正式演示与随意对话所需的方法不同。
    • 拆解复杂句子:长而复杂的句子可能难以被 TTS 引擎处理。将其拆分为更短、更易于管理的句子。
  • 脚本改进示例

    • 原始脚本(机器人):“该商品现已发售。我们推出了新功能。这非常令人兴奋。”

    • 改进后的脚本(自然):“该产品现已推出... 我们还添加了一些令人兴奋的新功能。这很令人兴奋。”

    • 原始脚本(机器人):“这是一封由系统自动发送的确认邮件。您的预订已处理。以下详细信息与您即将入住的酒店有关。预订号为 12345。已注册的房客姓名是 Anthony Vasquez,入住日期为 3 月 14 日。出发日期为 3 月 16 日。客房类型为豪华套房。入住人数为 1 人。入住时间为下午 3 点。退房时间为上午 11 点。请注意,根据取消政策,您需要在入住前 48 小时通知我们。如果您未在此时间范围内发出通知,我们将收取一晚的住宿费用。您的预订包含的其他设施包括:免费 Wi-Fi、健身中心和免费早餐。如有任何疑问,请直接致电 855-555-6689 与酒店联系。感谢您选择我们酒店。”

    • 改进后的脚本(自然):“Anthony Vasquez,您好!很高兴确认您与我们预订的服务!您已顺利预订 3 月 14 日至 3 月 16 日入住我们美丽的豪华套房。这是 1 位旅客的价格。您的确认码是 12345,请记下这个编号,以备您日后参考。

      温馨提醒一下,入住时间为下午 3 点,退房时间为上午 11 点。

      现在,请注意我们的取消政策。如果您需要取消,请至少在入住前 48 小时通知我们,好吗?否则,您需要支付一晚的住宿费。

      为了让您的住宿体验更加愉快,我们还提供免费 Wi-Fi、健身中心和每天早上的免费美味早餐!

      如果您有任何疑问,请随时致电 855-555-6689 与我们联系。我们非常期待您入住我们的酒店!”

    • 变更说明

      • 省略号 (...) 用于营造强调效果的停顿。
      • “and we've”使用了缩写形式,以便采用更口语化的语气。
      • “It's, well, it's very exciting” 会略微增加口吃和强调。
      • “好的?”以友好的方式提醒,让语气变得柔和。

    遵循以下准则,您可以创建听起来自然、富有吸引力且像真人一样的语音转文字脚本。请注意,要想掌握此技能,实践和实验是关键。