天天综合色天天综合色h,欧美一区亚洲一区,亚洲精品成人一区,在线不卡日本v二区707

網(wǎng)站地圖 - 關(guān)于我們
您的當(dāng)前位置: 首頁(yè) > 資訊 > 資訊 正文

趣丸科技聯(lián)合港中大(深圳)開(kāi)源首個(gè)語(yǔ)音大模型,效果全球領(lǐng)先躋身第一梯隊(duì)

作者:網(wǎng)絡(luò) 時(shí)間:2024-10-25 10:57 點(diǎn)擊:
導(dǎo)讀:10月24日,趣丸科技宣布與香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語(yǔ)音大模型“MaskGCT”正式開(kāi)源,面向全球用戶開(kāi)放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模

10月24日,趣丸科技宣布與香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語(yǔ)音大模型“MaskGCT”正式開(kāi)源,面向全球用戶開(kāi)放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模型與語(yǔ)音表征解耦編碼的創(chuàng)新范式,在聲音克隆、跨語(yǔ)種合成、語(yǔ)音控制等任務(wù)中展現(xiàn)出卓越效果。

趣丸科技聯(lián)合港中大(深圳)開(kāi)源首個(gè)語(yǔ)音大模型,效果全球領(lǐng)先躋身第一梯隊(duì)(圖1)

據(jù)介紹,MaskGCT在三個(gè)TTS基準(zhǔn)數(shù)據(jù)集上都達(dá)到了SOTA效果,超過(guò)當(dāng)前最先進(jìn)的同類模型,某些指標(biāo)甚至超過(guò)人類水平。顯著特點(diǎn)如下:

1、秒級(jí)超逼真的聲音克隆:提供3秒音頻樣本即可復(fù)刻人類、動(dòng)漫、“耳邊細(xì)語(yǔ)”等任意音色,且能完整復(fù)刻語(yǔ)調(diào)、風(fēng)格和情感。

2、更精細(xì)可控的語(yǔ)音生成:可靈活調(diào)整生成語(yǔ)音的長(zhǎng)度、語(yǔ)速和情緒,支持通過(guò)編輯文本編輯語(yǔ)音,并保持韻律、音色等方面的極度一致。

3、高質(zhì)量多語(yǔ)種語(yǔ)音數(shù)據(jù)集:訓(xùn)練于香港中文大學(xué)(深圳)和趣丸科技等機(jī)構(gòu)聯(lián)合推出的10萬(wàn)小時(shí)數(shù)據(jù)集Emilia,是全球最大且最為多樣的高質(zhì)量多語(yǔ)種語(yǔ)音數(shù)據(jù)集之一,精通中英日韓法德6種語(yǔ)言的跨語(yǔ)種合成。

趣丸科技聯(lián)合港中大(深圳)開(kāi)源首個(gè)語(yǔ)音大模型,效果全球領(lǐng)先躋身第一梯隊(duì)(圖2)

據(jù)介紹,MaskGCT(Masked Generative Codec Transformer)是一個(gè)大規(guī)模的零樣本TTS模型,采用非自回歸掩碼生成Transformer,無(wú)需文本與語(yǔ)音的對(duì)齊監(jiān)督和音素級(jí)持續(xù)時(shí)間預(yù)測(cè)。其技術(shù)突破性在于采用掩碼生成模型與語(yǔ)音表征解耦編碼的創(chuàng)新范式。實(shí)驗(yàn)表明,MaskGCT在語(yǔ)音質(zhì)量、相似度和可理解性方面優(yōu)于當(dāng)前最先進(jìn)的TTS模型,并且在模型規(guī)模和訓(xùn)練數(shù)據(jù)量增加時(shí)表現(xiàn)更佳,同時(shí)能夠控制生成語(yǔ)音的總時(shí)長(zhǎng)。MaskGCT已在香港中文大學(xué)(深圳)與上海人工智能實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的開(kāi)源系統(tǒng)Amphion發(fā)布。

該模型研發(fā)團(tuán)隊(duì)在語(yǔ)音領(lǐng)域擁有深厚的研究積累和原創(chuàng)性成果。這主要依托趣丸科技十年深耕音頻技術(shù)領(lǐng)域和億級(jí)高質(zhì)量語(yǔ)音用戶的服務(wù)經(jīng)驗(yàn),以及香港中文大學(xué)(深圳)國(guó)際一流水平的師資隊(duì)伍。早在今年5月份,趣丸科技就與香港中文大學(xué)(深圳)宣布共建聯(lián)合實(shí)驗(yàn)室,針對(duì)人工智能音頻大模型相關(guān)的前沿課題進(jìn)行研究,旨在突破行業(yè)難題,促進(jìn)產(chǎn)學(xué)研深度融合,打造技術(shù)領(lǐng)先的生成式音頻大模型,填補(bǔ)業(yè)界空白。

趣丸科技聯(lián)合港中大(深圳)開(kāi)源首個(gè)語(yǔ)音大模型,效果全球領(lǐng)先躋身第一梯隊(duì)(圖3)

目前,MaskGCT在短劇出海、數(shù)字人、智能助手、有聲讀物、輔助教育等領(lǐng)域擁有豐富的應(yīng)用場(chǎng)景。為了加快落地應(yīng)用,在安全合規(guī)下,趣丸科技打造了多語(yǔ)種速譯智能視聽(tīng)平臺(tái)“趣丸千音”。一鍵上傳視頻即可快速翻譯成多語(yǔ)種版本,并實(shí)現(xiàn)字幕修復(fù)與翻譯、語(yǔ)音翻譯、唇音同步等功能。該產(chǎn)品進(jìn)一步革新視頻翻譯制作流程,大幅降低過(guò)往昂貴的人工翻譯成本和冗長(zhǎng)的制作周期,成為影視、游戲、短劇等內(nèi)容出海的理想選擇平臺(tái)。


打賞

取消

感謝您的支持,我會(huì)繼續(xù)努力的!

掃碼支持
掃碼打賞,你說(shuō)多少就多少

打開(kāi)支付寶掃一掃,即可進(jìn)行掃碼打賞哦

網(wǎng)友評(píng)論:

推薦使用友言、多說(shuō)、暢言(需備案后使用)等社會(huì)化評(píng)論插件

Copyright ? 2021 早報(bào)網(wǎng) 版權(quán)所有
蘇ICP備2024138443號(hào)

蘇公網(wǎng)安備32130202081338號(hào)

本網(wǎng)站所刊載信息,不代表早報(bào)網(wǎng)觀點(diǎn)。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權(quán)違法立即與我們聯(lián)系客服 106291126@qq.com 對(duì)其相關(guān)內(nèi)容進(jìn)行刪除。
早報(bào)網(wǎng)登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
《早報(bào)網(wǎng)》官方網(wǎng)站:www.m.mfzxfx.com互聯(lián)網(wǎng)違法和不良信息舉報(bào)中心
Top 主站蜘蛛池模板: 轮台县| 芦山县| 蒙阴县| 沅江市| 岳西县| 瑞金市| 南雄市| 泰和县| 澄迈县| 钟祥市| 珲春市| 诸城市| 浦江县| 都兰县| 香格里拉县| 日照市| 瑞安市| 丹棱县| 岳池县| 台南县| 罗源县| 合阳县| 武山县| 偏关县| 福清市| 古田县| 子洲县| 延安市| 英吉沙县| 大新县| 承德市| 济源市| 柘荣县| 基隆市| 祁连县| 玛纳斯县| 渑池县| 历史| 栾川县| 台北市| 苏州市|