從最開始的大牌明星定制語(yǔ)音包,到全世界第一個(gè)個(gè)人語(yǔ)音定制作用,在語(yǔ)音定制這一行業(yè),百度地圖可謂是走在業(yè)內(nèi)前端,這都?xì)w功于百度搜索獨(dú)創(chuàng)性的Meitron音質(zhì)韻律轉(zhuǎn)移技術(shù)性?,F(xiàn)如今,此項(xiàng)技術(shù)性再度邁入創(chuàng)新,客戶只必須錄制9句話就可以輕松玩語(yǔ)音定制,巨大減少了語(yǔ)音定制作用的應(yīng)用門坎,那麼百度地圖是怎么保證的呢?
(百度地圖語(yǔ)音定制作用發(fā)布9句話錄制的“極速模式”)
2019年9月,百度地圖推出世界第一個(gè)地圖語(yǔ)音定制商品,客戶必須錄制20句、每句話15個(gè)字上下的文字,通過(guò)15-20min的AI練習(xí),最后完成定制語(yǔ)音包的生成導(dǎo)出。而現(xiàn)如今,借助百度搜索獨(dú)創(chuàng)性的時(shí)間可控性端到端生成技術(shù)性,更新后的地圖語(yǔ)音定制作用對(duì)這其中的Tacotron實(shí)體模型開展了調(diào)節(jié)和提升,特別是在Location Sensitive Attention的體制上,促使語(yǔ)音生成全過(guò)程里時(shí)長(zhǎng)信息內(nèi)容的獲得更為靈便、可控性,巨大提升了培訓(xùn)轉(zhuǎn)移的可靠性,就算根據(jù)非常少的句子也可以開展平穩(wěn)的生成,最后完成了從20句到9句的錄制減縮。
雖然錄制全過(guò)程干了加減法,但百度地圖依然可以轉(zhuǎn)化成一如既往的高質(zhì)量語(yǔ)音生成實(shí)際效果,這身后依靠的,便是百度搜索獨(dú)創(chuàng)性的音質(zhì)設(shè)計(jì)風(fēng)格粗粒度伺服電機(jī)。根據(jù)Global Style Tokens技術(shù)性,本次更新加強(qiáng)了分離出來(lái)音質(zhì)設(shè)計(jì)風(fēng)格信息內(nèi)容的工作能力,提高了音質(zhì)設(shè)計(jì)風(fēng)格提取的一致性,就算僅有少量的句子,也可以進(jìn)行平穩(wěn)的音質(zhì)設(shè)計(jì)風(fēng)格操縱和轉(zhuǎn)移。
現(xiàn)階段,百度地圖智能化語(yǔ)音小助手用戶數(shù)量超4億,人性化語(yǔ)音包每日播放視頻頻次超1億個(gè)。伴隨著百度地圖語(yǔ)音定制作用的再度更新,堅(jiān)信會(huì)出現(xiàn)愈來(lái)愈多客戶去試著錄制自身獨(dú)有的語(yǔ)音包,在導(dǎo)航欄、語(yǔ)音互動(dòng)、智能化度假旅游等諸多地圖情景中,感受本人專享語(yǔ)音包的風(fēng)采。