当地时间3月29日,OpenAI在官网首次展示了名为“Voice Engine”的语音生成模型。
该模型正处于小规模预览阶段,可利用文本输入及单个15秒音频样本来生成与原声非常相似的自然语音。
OpenAI声称,他们在2022年底首次开发出该模型,并已将其应用于其文本转语音API以及ChatGPT语音和朗读功能中的预设语音。OpenAI表示,由于合成语音被滥用的潜在风险,将采取谨慎和知情的方式进行更广泛的发布,“根据这些对话和小规模测试的结果,我们将就是否以及如何大规模部署这项技术作出更明智的决定。”(校对/韩秀荣)