什么是语音输出系统

达珥闻


发布时间:

2024-07-04

语音输出系统是指某种人工制品,可以是专用机器,也可以是计算机程序,它产生的信号在功能上与人类发出的语音相同。目前,语音输出系统通常只产生音频信号,但正在开发的实验室系统会将(人造)说话者面部的视觉图像补充到音频信号中。

什么是语音输出系统

  语音输出系统是指某种人工制品,可以是专用机器,也可以是计算机程序,它产生的信号在功能上与人类发出的语音相同。目前,语音输出系统通常只产生音频信号,但正在开发的实验室系统会将(人造)说话者面部的视觉图像补充到音频信号中。

  视听(或双模)语音输出比纯音频输出更易于理解,尤其是在音频通道 质量较差的情况下。本章中,我们将不讨论双模或多模语音输出系统,而是专注于纯音频输出。

  我们将诸如录音机之类的设备和其他更先进的系统排除在语音输出系统的范围之外,这些系统基于完整的预存消息(“预录语音” 或“复制合成”)输出语音,而不管用于节省存储空间的编码或信息压缩类型如何。我们严格限制我们的定义,使其能够生成新消息,无论是从头开始(即完全按照规则)还是通过重新组合较短的预存单元。此定义还包括混合合成系统,其中单独存储的单词(例如数字)被替换为 载体句子中的信息槽 (例如在时间表咨询服务中)。

  我们认为,语音输出系统有两种基本类型,即文本转语音 (TTS) 和概念转语音 (CTS)  。其他更复杂的系统结合了这两种系统的特点。

  文本转语音。大多数语音输出系统由文本输入驱动。这些系统将以正常正字法打印的文本(通常以 ASCII 码形式存储在计算机内存中)转换为语音。传统拼写可以合理地指示要输出的声音和单词,但通常不能充分体现信息的韵律属性,例如 重音的位置 、语音旋律和时间组织,包括语音节奏。话语的韵律 反映了输入文本作者的交流意图等,而这些意图无法仅从文本中重建。

  概念到语音。在其他类型的语音输出系统中,尤其是对话系统,系统本身决定要传达什么信息。当然,对话系统可能仍然会误解用户的请求,从而发出不适当的响应消息,但这不应被视为输出系统的错误。

伊迈澳
全部
  • 全部
  • 产品管理
  • 新闻资讯
  • 介绍内容
  • 企业网点
  • 常见问题
  • 企业视频
  • 企业图册

关键词:  公共广播系统   无纸化会议系统    数字广播系列