只需 10-20 秒人聲樣本,AI 即可學習其音色並生成任何內容。建議在安靜環境下錄製以獲得最佳效果。
長音訊、影片音軌皆可
支援 WAV, MP3, M4A (建議 10-20 秒清潔人聲)
上傳後將自動辨識參考語音的內容,您可以手動修正以提高準確度。
這通常需要一些時間,請稍候。