英偉達(dá)展示AI模型Fugatto:可修改并生成新聲音快訊

快科技 2024-11-26 10:52
分享到:
導(dǎo)讀

英偉達(dá)展示了一種用于生成音樂(lè)和音頻的新型人工智能模型Fugatto,對(duì)于何時(shí)會(huì)推出能夠生成音頻或視頻的先進(jìn)模型,隨著生成式人工智能模型的快速發(fā)展。

11月26日消息,據(jù)報(bào)道,英偉達(dá)展示了一種用于生成音樂(lè)和音頻的新型人工智能模型Fugatto,它可以修改聲音并生成新的聲音。

Fugatto的獨(dú)特魅力在于其超越傳統(tǒng)的人工智能界限,不僅能夠接收并分析現(xiàn)有音頻素材,還能對(duì)其進(jìn)行靈活修改。

舉例來(lái)說(shuō),它能將鋼琴伴奏的旋律無(wú)縫轉(zhuǎn)化為動(dòng)人的人聲演唱,或是調(diào)整口語(yǔ)錄音中的口音特征與情感色彩,展現(xiàn)出前所未有的音頻轉(zhuǎn)換能力。

盡管英偉達(dá)目前尚未規(guī)劃將此技術(shù)面向公眾開(kāi)放,但Fugatto在合成音頻領(lǐng)域的潛在應(yīng)用及其可能帶來(lái)的變革,已引起了業(yè)界的廣泛矚目與熱烈討論。

然而,隨著生成式人工智能模型的快速發(fā)展,其創(chuàng)建者也面臨著如何有效防止技術(shù)濫用的挑戰(zhàn)。特別是如何阻止用戶利用此類技術(shù)制造誤導(dǎo)性信息,或是通過(guò)生成受版權(quán)保護(hù)的角色與內(nèi)容來(lái)侵犯他人權(quán)益,成為亟待解決的問(wèn)題。

此外,行業(yè)內(nèi)的其他巨頭如OpenAI與Meta,對(duì)于何時(shí)會(huì)推出能夠生成音頻或視頻的先進(jìn)模型,同樣保持著神秘的態(tài)度,尚未透露具體的時(shí)間表。(鹿角)

音頻 生成 技術(shù) 人工智能 模型
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。