TOP
首頁 > HTML5、CSS3、其他 > 文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?

文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?

2022-10-24 278

相關文章

微軟的TTS語音合成技術目前已經做到了非常自然,接近真人音色、音調、語氣,網路上有很多影片都是這樣配音的,在不瞭解前提下有時候真的很難分辨出是機器合成還是真人的聲音。

 

目前微軟的文字轉語音已經支援150多種語言,簡體中文的配音多達21個,還有十多種聲音風格的選擇,包括語速、音調的自由調整。美中不足的是臺灣只有三個配音,有些多音字無法正確發音,例如:長、朝、為、微

文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?

雖然是免費使用,不過還是有最多1000字的限制,而且無法下載語音檔,如果希望轉換後的語音檔下載回來,請使用Googlo Chrome瀏覽器進入Microsoft 文字轉語音下載器頁面,點擊安裝 Chrome 擴展程序』完成擴充程式安裝,

文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?

擴充程式安裝完成後,再進入Microsoft azure頁面並往下捲動就可以看到『DOWNLOAD』按鈕了,預設情況下將使用文字方式進行轉換,輸入或貼上文字之後(逗號,句號。頓號、驚歎號!空行都有停頓效果),右側的語言清單選擇語言(例:Chinese (Taiwanese Mandarin)=臺灣,Chinese (Mandarin, Simplified)=大陸),語音清單選擇發音者,而『說話風格』會根據發音者不同有所差異,選項有助理、聊天、客服、新聞、深情、憤怒、冷靜、快樂、不滿、恐懼、溫柔、抒情、悲傷、嚴肅、讀詩等大部份只有預設值,最後調整說話速度與音調,然後點擊『播放』即可試聽文字轉語音結果。直到滿意後就可以點擊『DOWNLOAD』按鈕直接下載存檔

文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?

SSML:語音合成標記語言 (SSML) 是以 XML 為基礎的標記語言,可讓開發人員指定如何使用文字轉換語音,相較於純文字,SSML 可微調文字轉換語音輸出的音調、停頓、說話速度、音量等等。也可用於對話或說故事等需要多重發音的場景,這部份將在聊解字數限制之後分享

文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?


如果你對文字轉語音最自然接近人聲的機器配音技術 – 和配音員搶頭路?有任何問題請到討論區發帖。