QQ音樂(lè )領(lǐng)先科技打造品質(zhì)音樂(lè )生活,做更有溫度的音樂(lè )平臺
“生命,宇宙以及一切的終極答案是什么?”
1979年,道格拉斯·亞當斯發(fā)表了讓他日后名垂青史的科幻小說(shuō)《銀河系漫游指南》。在這本小說(shuō)中,他描繪了一臺名為“深思”的超級人工智能——它的使命,便是解答上面的問(wèn)題。
經(jīng)過(guò)整整750萬(wàn)年的運算,這臺遠超一切造物的人工智能給出了結果:“答案就是42。”
無(wú)法解釋的荒謬答案,既反映著(zhù)整個(gè)宇宙不會(huì )被人賦予意義的本質(zhì),也在一定程度上代表著(zhù)世人對科技的看法:人工打造的科技,可不一定具備真正的“智能”。 今年一過(guò),這位老先生就已駕鶴西去20年,但相較于“深思”,科技正在改變著(zhù)我們的日常生活體驗,甚至在某些領(lǐng)域,讓我們甘拜下風(fēng)。
不過(guò),今天要講的并不是人類(lèi)如何再次被科技“擊敗”,而是一個(gè)有關(guān)于“欣賞”和“辨別”的故事。
緣起:科技遇見(jiàn)音樂(lè )
光聽(tīng)“人工智能”這四個(gè)字,冷冰冰的感覺(jué)就涌上心頭。它不像你隔壁工位坐著(zhù)的Steven Liu,在我們的認知中,它無(wú)法動(dòng)用情感,更別提去鑒別,欣賞一幅畫(huà),一首歌的美。
真是這樣嗎?
幾年前,身處新加坡科技設計大學(xué)從事音樂(lè )研究的一位熱愛(ài)音樂(lè )的科研工作者Dr. Simon,已經(jīng)開(kāi)始思索這個(gè)問(wèn)題:AI究竟能不能與音樂(lè )領(lǐng)域進(jìn)行結合,碰撞出絢爛的火花?在研究的過(guò)程中,他也發(fā)現自己缺乏機遇:“沒(méi)有太多人做這個(gè)領(lǐng)域,而我的研究成果,也很難切實(shí)地幫助音樂(lè )人。”
在2600公里外的深圳,一群人也正在對相同的想法大搖其頭。Ben曾在偶然間發(fā)現“以往唱片公司通過(guò)人工聽(tīng)Demo,來(lái)決定哪首歌值得推,但Demo的數量遠遠超過(guò)人工能聽(tīng)的數量,導致很多歌從來(lái)沒(méi)有被聽(tīng)過(guò)而被埋沒(méi),十分可惜。”這一現象激發(fā)了他的思考,如果用不知疲倦的AI算法去評價(jià)歌曲,效果會(huì )怎樣?但Ben身邊的同行都不看好:“音樂(lè )是藝術(shù),難以用科學(xué)或是算法去衡量它的質(zhì)量。”
除了選擇音樂(lè ),在Ethan眼中,通過(guò)科技讓聽(tīng)者獲得更好的音樂(lè )體驗也變得越發(fā)重要:“經(jīng)過(guò)多年的技術(shù)發(fā)展,音樂(lè )技術(shù)已經(jīng)從純信號處理向AI轉變。”這就意味著(zhù),科技將是改變每一位聽(tīng)眾日常聽(tīng)音體驗的關(guān)鍵要素,“但在國內音頻行業(yè)還是存在空白。”
三個(gè)人的問(wèn)題其實(shí)異曲同工:如何用AI算法,鑒別、推送更為“動(dòng)聽(tīng)”的歌?如何借助科技,全方位讓聽(tīng)者及音樂(lè )人的音樂(lè )生活變得更美好?
或許是緣分,亦或是因為心中久久揮之不去的“執念”,念念不忘終有回響,2018年,三個(gè)人的軌跡開(kāi)始串聯(lián)在了一起。當年,騰訊音樂(lè )娛樂(lè )集團CEO彭迦信去新加坡開(kāi)會(huì ),遇到了雷教授,兩人互相交流了自己對音樂(lè )的見(jiàn)解。雷教授發(fā)現,彭迦信的想法和自己不謀而合:“他跟我說(shuō),騰訊音樂(lè )的夢(mèng)想,不只是做音樂(lè )播放器,更是要打造一個(gè)豐富、良性的音樂(lè )生態(tài),讓音樂(lè )進(jìn)入生活的每個(gè)場(chǎng)景,讓音樂(lè )人擁有體面的收入和生活,這一點(diǎn)深深打動(dòng)了我。”相比于教授的身份,雷教授本身也是一位音樂(lè )人,“我在大學(xué)時(shí)期,曾在餐廳做過(guò)駐場(chǎng)的小提琴手,深知音樂(lè )人的不易。”
面對TME拋來(lái)的橄欖枝,雷教授并沒(méi)有顧慮太多,他加入了TME,從成為QQ音樂(lè )多媒體研發(fā)中心負責人的那一刻起,如何用科技改變音樂(lè )人及億萬(wàn)用戶(hù)的方方面面……太多想做的事情縈繞在他腦海,他充滿(mǎn)興奮和期待,甚至讓他在入職的第一天就把行李落在了出租車(chē)上。
同年,曾在王者榮耀項目上率領(lǐng)AI擊敗人類(lèi)冠軍戰隊的Ben,也如約加入到團隊之中,擔任多媒體研發(fā)中心創(chuàng )新組負責人。也正是在這里,他們遇到愛(ài)朗聲說(shuō)笑話(huà)的基礎開(kāi)發(fā)組負責人Ethan——上文提到的三位“現代工匠”和他們所率領(lǐng)的團隊,從此將共同致力于用科技逐步改變每一位聽(tīng)眾的音樂(lè )生活。
匠心:讓AI學(xué)會(huì )“聽(tīng)”歌
一首歌,是怎樣送到聽(tīng)眾耳邊的?
除了人工篩選,隨著(zhù)流媒體平臺普及和技術(shù)進(jìn)步,大家開(kāi)始習慣通過(guò)播放量來(lái)選聽(tīng)歌曲。“這種方式會(huì )造成鮮明的馬太效應,熱歌只會(huì )越來(lái)越熱,但0播放量的歌,可能永遠是0。”雷教授認為業(yè)界此前通用的技術(shù),并沒(méi)有解決音樂(lè )人的難題。
想來(lái)想去,方法其實(shí)也很簡(jiǎn)單:為AI注入溫度,讓AI學(xué)會(huì )鑒賞歌曲,利用其對海量數據的高速處理能力,輔助人工篩選,讓有才華的作品不被埋沒(méi)。
和世間的道理一樣,都是說(shuō)來(lái)容易,做起來(lái)難。AI的數據處理能力,要建立在對歌曲細顆粒度“標記”上,在這個(gè)層面有兩個(gè)難題,如何對一首歌曲進(jìn)行評價(jià),維度該如何定?作為一項“藝術(shù)”,音樂(lè )的喜好沒(méi)有恒定標準,AI的篩選,是否能說(shuō)服眾人?
在想法落地的過(guò)程中,Ben拉上了他的同事Moyan, 從曲風(fēng)、歌詞、音色、演唱者唱腔、到后期制作與編排等,為AI制定了詳細的評判維度——QQ音樂(lè )科技團隊雖然大多出身技術(shù),但大家都同樣愛(ài)好音樂(lè )且具備一定的專(zhuān)業(yè)音樂(lè )素養。再加上QQ音樂(lè )數以?xún)|計的海量大數據,讓AI學(xué)習有了最重要的數據參考。
“當時(shí)我們都不知道要花多久,但它一定得做出來(lái),讓優(yōu)秀但暫時(shí)沒(méi)名氣的音樂(lè )作品和音樂(lè )人不再被埋沒(méi),就是懷著(zhù)這樣的信念堅持著(zhù)。”靠著(zhù)過(guò)硬的技術(shù),與對音樂(lè )的深度了解,再加上多版本的迭代和打磨,Ben的團隊推出了一項名為Predictive Model的自研技術(shù)。
通過(guò)PDM,即使是0播放量的冷啟動(dòng)音樂(lè )作品,AI也能根據音頻和歌詞內容給予充分且匹配的受眾識別與推送曝光,讓歌曲得以更高效、精準地覆蓋到適合的目標人群。換句話(huà)說(shuō),就是AI能夠辨別“欣賞”歌曲,并將符合用戶(hù)喜好的歌送到億萬(wàn)樂(lè )迷耳邊。AI就相當于一位慧耳識音的“伯樂(lè )”,找到好內容的“千里馬”,并且把“千里馬”精準地送到會(huì )喜歡它、欣賞它的人身邊。
雖然對于技術(shù)的細節不是特別了解,但資深樂(lè )迷王小毛就對PDM感觸頗深:“最近在QQ音樂(lè )上,聽(tīng)到不少新歌手的新歌,而且這些歌質(zhì)量都非常高。像是此前火爆全網(wǎng)的《微微》,聽(tīng)說(shuō)就是由AI技術(shù)選出來(lái)的,著(zhù)實(shí)讓我感嘆了一下科技的力量。”
其實(shí)在PDM落地后,已經(jīng)有數十首歌曲借其“獨具慧眼”的挖掘實(shí)現“爆紅”。 不僅是《微微》,《收斂》《厚顏無(wú)恥》《忘川彼岸》以及近期悄然走紅的《失控》等“國民級”歌曲,都得益于PDM技術(shù)的“鑒賞”,才步步“刷屏”全網(wǎng)。當然,億萬(wàn)像王小毛一樣的樂(lè )迷,也在這個(gè)過(guò)程中發(fā)現了自己喜歡的更多類(lèi)型的新歌。
得益于QQ音樂(lè )PDM技術(shù)的多首熱歌
除了用AI“欣賞”歌曲,科技也在Ethan團隊的手上,化為了找尋陌生好歌的“必備神器”。2013年上線(xiàn)的QQ音樂(lè )聽(tīng)歌識曲技術(shù),就一直以“穩準狠”著(zhù)稱(chēng)。“在看一段廣告時(shí),可能吸引我們的并不是廣告產(chǎn)品本身,而是它的配樂(lè )。又或者我們非常想要知道電影背后的歌曲是什么。”Ethan回憶起當時(shí)建立聽(tīng)歌識曲團隊的初衷。
但在2019年初,聽(tīng)歌識曲團隊也迎來(lái)了新挑戰。團隊成員Lester收到用戶(hù)們的反饋,稱(chēng)原唱版本的歌曲都是秒速找到,但翻唱版本的歌曲卻難以識別。這在當時(shí)是一個(gè)全新的命題,由于音樂(lè )模式的逐步豐富,越來(lái)越多的歌曲有了各色翻唱版本,用戶(hù)們除了找原唱,對找翻唱、改編版本的歌曲也有很大的需求。
聽(tīng)歌識曲1.0版本的識別原理,主要是“聲紋識別”,就像每個(gè)人都有自己的指紋一樣,歌曲和聲音同樣也擁有自己專(zhuān)屬特征的“聲音指紋”,聽(tīng)歌識曲可以通過(guò)識別一小段音頻的聲紋,就能找出對應的歌曲,這對于尋找原版歌曲可謂無(wú)往而不利;但對于翻唱版、現場(chǎng)Live版等版本,由于聲紋的變化,確實(shí)難以識別。
針對這一問(wèn)題,Ethan和隊友開(kāi)始計劃將原有的聽(tīng)歌識曲技術(shù)拓展到2.0版本,并成功實(shí)現“模糊識別”,目的是為了讓在看劇、看綜藝、刷短視頻或者身處在一些小型Live現場(chǎng)時(shí),卻苦于找不到當時(shí)入耳的那首歌的樂(lè )迷,能輕松找到自己心儀的歌曲。“至今還記得,其中有一首歌叫《一曲相思》,就花了很多努力才實(shí)現可測。”Ethan團隊對于當時(shí)的“攻堅經(jīng)歷”記憶猶新。
功夫不負有心人,經(jīng)過(guò)一年艱苦的研發(fā)攻堅,業(yè)界首創(chuàng )的聽(tīng)歌識曲2.0“翻唱識別”橫空出世,領(lǐng)先行業(yè),一騎絕塵。通過(guò)智能AI,它不僅能識別短視頻、綜藝里的多輪翻唱歌曲,還能識別Live、直播等諸多場(chǎng)景,精準匹配度大幅提升。
值得一提的是,團隊還制作了“離線(xiàn)系統”的小彩蛋,在歌曲第一次未能成功識別后,系統會(huì )在一周之內自動(dòng)向全曲庫發(fā)起請求,識別成功后,用戶(hù)會(huì )收到聽(tīng)歌識曲小助手的反饋提醒。匠心換得真心,“他們的反饋特別好玩,收到私信后會(huì )驚訝地問(wèn),聽(tīng)歌識曲后臺是不是有人工一直守著(zhù),是不是員工偷偷識別出來(lái)的。”團隊成員Jerry笑著(zhù)說(shuō)。
有好幾次,Jerry在看電影時(shí)發(fā)現前排觀(guān)眾的手機屏幕亮了,界面顯示的正是在使用QQ音樂(lè )聽(tīng)歌識曲,“那時(shí)候的感覺(jué),可能就是標準的幕后英雄。”聽(tīng)得出Jerry的自豪感。
QQ音樂(lè )聽(tīng)歌識曲功能
讓AI學(xué)會(huì )欣賞、辨別每一首歌,對樂(lè )迷的好處顯而易見(jiàn):聽(tīng)見(jiàn)更多好歌,不會(huì )錯過(guò)任何一首喜歡的歌。但在音樂(lè )創(chuàng )作層面,技術(shù)的革新,還將帶來(lái)更加深遠的影響。
改變:當技術(shù)服務(wù)于藝術(shù)
“在PDM誕生之初,我們也曾請新生代歌手帶著(zhù)音樂(lè )作品來(lái)做內部測試,發(fā)生了一些很有意思的事情。”Ben介紹。
“參與測試歌手”就有應嘉俐,不少聽(tīng)眾都聽(tīng)過(guò)應嘉俐的《涼茶》《那又如何》:“當時(shí)正好是國際Discovery頻道團隊來(lái)對QQ音樂(lè )‘黑科技’進(jìn)行訪(fǎng)問(wèn),我和我的新作品體驗PDM系統的經(jīng)歷也有幸被拍攝見(jiàn)證。”在這次PDM的打分測試時(shí),應嘉俐帶來(lái)了兩首全新作品《神游星期天》和《上山來(lái)》。
“我一開(kāi)始覺(jué)得,《神游星期天》的分數不會(huì )比《上山來(lái)》更高,因為前者帶著(zhù)我更多的個(gè)人印記,而《上山來(lái)》是一首命題作文,是為電影創(chuàng )作的插曲,編曲配樂(lè )都更加偏向流行。”應嘉俐告訴刺猬公社。
但PDM判定的結果卻出人意料:認為《神游星期天》的旋律更朗朗上口,更適合向受眾推廣。她對此感到十分驚訝,“打動(dòng)我的也是打動(dòng)PDM的一個(gè)因素,但是這個(gè)想法我并沒(méi)有告訴過(guò)PDM團隊”。
原來(lái),《神游星期天》的旋律雖然安靜平緩,卻讓她傾注了非常深厚的感情,而《上山來(lái)》對她來(lái)說(shuō),更像是一篇“命題作文”。“超出我想象的是,PDM好像特別了解歌手創(chuàng )作時(shí)的情緒和微妙的思考似的,PDM在對歌曲情感的判定上,《神游星期天》的分數也要高很多,這跟我自己的情感感受很一致。”
這次打分,也讓?xiě)卫_(kāi)始重新審視技術(shù)。作為專(zhuān)業(yè)音樂(lè )人,她在打分之前對技術(shù)總是抱有疑問(wèn):“單從音樂(lè )技術(shù)上而言,就有非常多細化的標準,AI能夠做到專(zhuān)業(yè)嗎?”在看到QQ音樂(lè )的后臺系統后,她的想法大為改觀(guān):“評價(jià)一首歌的所有細分門(mén)類(lèi)和專(zhuān)業(yè)技術(shù),都有完整的體系了。”
但讓?xiě)卫杏|最深的,還是經(jīng)過(guò)PDM的打分,讓她更明白在創(chuàng )作上,要保持自己的初心,延續自己的風(fēng)格,這才是創(chuàng )作的本質(zhì)。
讓音樂(lè )人能夠不受限制地表達內心,同時(shí)又讓這些表達能夠走進(jìn)億萬(wàn)樂(lè )迷耳邊,“有了這些好的案例,這讓我們對技術(shù)有了更大的信心。通過(guò)PDM技術(shù)去找出滄海遺珠,酒香也怕巷子深,我們要找到懷才不遇的好音樂(lè )和音樂(lè )人,給他們更好的機會(huì )。”雷教授說(shuō)。
其實(shí),經(jīng)過(guò)多年深耕,QQ音樂(lè )已走出了一條深受認可的“科技匠心”之路。2019與2020連續兩年,在國際音樂(lè )學(xué)術(shù)界公認的最權威比賽——國際音頻檢索評測大賽上,QQ音樂(lè )(PDM) 技術(shù)團隊不僅在“預測識別”中取得突破性結果,一舉打破世界紀錄。同時(shí),QQ音樂(lè )的“聽(tīng)歌識曲”等音頻技術(shù)也奪得兩項世界冠軍,三項成績(jì)打破世界紀錄。當時(shí)連小馬哥都在朋友圈為產(chǎn)品獲獎成果點(diǎn)贊,這在內部相當罕見(jiàn)。
除了在國際頂級技術(shù)舞臺上拋頭露面,QQ音樂(lè )還推出了“銀河音效”,將用戶(hù)“聽(tīng)”的體驗全面升級,同時(shí)上線(xiàn)了全新黑科技“定制音效”——通過(guò)用戶(hù)耳形特征和聽(tīng)覺(jué)特征的智能化分析,打造“私人訂制”體驗。最近,銀河音效又“上新”了針對揚聲器聽(tīng)音的“外放環(huán)繞音效”和“車(chē)載定制音效”。編輯部的黃湘就絲毫不吝惜對音效體驗的贊美,“前者能夠省下一個(gè)小音箱的錢(qián),而后者則是駕車(chē)出游聽(tīng)歌必備。”
QQ音樂(lè )“銀河音效”上的“定制音效”
不僅在音樂(lè )實(shí)用技術(shù)上,QQ音樂(lè )多媒體技術(shù)團隊更是在科技向善的“科技+溫度”這條路上一路狂奔,基于當下年輕人對聽(tīng)書(shū)這一“耳朵經(jīng)濟”的進(jìn)階需求,QQ音樂(lè )已獨家研發(fā)并最新上線(xiàn)行業(yè)首個(gè)“AI有聲書(shū)”功能,尤其是語(yǔ)音合成AI主播“Q音電臺bot”,是業(yè)界首個(gè)可以朗讀出極具情感表現力的嗓音,第一個(gè)成功用“黑科技”表達“聲音中的細微情緒”,為用戶(hù)提供更加聲臨其境的有聲書(shū)體驗。
13世紀,意大利畫(huà)家借用更加巧妙的化學(xué),大幅改良了一種名為“濕壁畫(huà)”的繪畫(huà)方法,讓墻壁上的繪畫(huà)能夠保存得更久,色彩更靚麗。得益于新興的技術(shù),當時(shí)的畫(huà)家們可以用更加新穎的主題,在大面積墻壁上繪出栩栩如生的人物。近200年以后,米開(kāi)朗基羅、達芬奇相繼用同樣的技術(shù),繪下了他們的傳世名作,成為文藝復興運動(dòng)的“最高瑰寶”。
這個(gè)例子看似和音樂(lè )界沒(méi)有關(guān)系,但科技和藝術(shù)創(chuàng )作從未分開(kāi),隨著(zhù)科技的革新,堅持科技向善,憑借“科技+溫度”的藝術(shù)創(chuàng )作將可以用全新的方式釋放美——或許可以想象一下,在QQ音樂(lè )科技的步步“升溫”之后,會(huì )不會(huì )讓音樂(lè )創(chuàng )作,乃至我們每個(gè)人的音樂(lè )生活產(chǎn)生翻天覆地的變化?
將要發(fā)生的一切改變,值得拭目以待。
文章來(lái)源于“刺猬公社”,作者:刺猬君
評論
- 評論加載中...