螞蟻持續(xù)發(fā)力AI研發(fā),24篇論文入選計算機視覺頂會CVPR2024觀點

當(dāng)?shù)貢r間6月17日,為期5天的IEEE國際計算機視覺與模式識別會議(CVPR2024)在美國西雅圖舉辦。
當(dāng)?shù)貢r間6月17日,為期5天的IEEE國際計算機視覺與模式識別會議(CVPR2024)在美國西雅圖舉辦。官方數(shù)據(jù)顯示,本屆會議共收到11532篇有效論文投稿,接收了其中2719篇,錄用率為23.6%,比例低于往年。
CVPR主辦方是IEEE,為全球計算機視覺三大頂會之一,迄今舉辦了40次會議。本屆會議螞蟻集團有24篇論文被收錄,其中一篇被組委會重點推薦(highlight)。24篇論文研究方向包括計算機視覺、深度學(xué)習(xí)、數(shù)字人、大模型等。
被組委會重點推薦的論文“用于時序一致性視頻處理的內(nèi)容變形場”,提出了一種全新的視頻處理方法CoDeF,它能將視頻處理簡化為圖像處理。相較于傳統(tǒng)方法,CoDeF能夠?qū)崿F(xiàn)跨幀一致性,跟蹤煙霧、水流等非剛性物體,支持各種圖像算法直接用于視頻處理。用戶只需要處理每個視頻對應(yīng)的靜態(tài)規(guī)范圖像,通過形變場的變換,就可將圖像處理結(jié)果自然地沿著時間維度進行傳播,達到對整個視頻處理的目的,也因此保證了高度的時序一致性。
據(jù)了解,這二十余篇學(xué)術(shù)成果,有部分已經(jīng)在真實業(yè)務(wù)場景中落地應(yīng)用。比如“面向地球觀測影像通用解譯的多模態(tài)遙感基礎(chǔ)模型”一文,介紹了螞蟻自研的多模態(tài)遙感基礎(chǔ)模型SkySense,它是迄今為止國際上參數(shù)規(guī)模最大、覆蓋任務(wù)最全、識別精度最高的多模態(tài)遙感基礎(chǔ)模型。在17 項國際權(quán)威測試場景中,SkySense 的指標(biāo)全面超過國際同類產(chǎn)品。
目前,SkySense已應(yīng)用于網(wǎng)商銀行的衛(wèi)星遙感風(fēng)控系統(tǒng)“大山雀”,可精準(zhǔn)識別和捕捉20多種農(nóng)作物的種類和長勢,讓它們成為銀行認可的資產(chǎn)抵押物,從而靈活、隨時給到種糧戶合理的貸款額度和還款周期。
還有部分學(xué)術(shù)成果,致力于優(yōu)化和提高AI的可靠性、經(jīng)濟性和易用性,為AI持續(xù)降本增效,以推動大模型在真實場景,尤其是嚴(yán)謹產(chǎn)業(yè)中得以規(guī)模化落地應(yīng)用。比如“基于promp的視覺語言模型無監(jiān)督蒸餾”一文,提出了一種基于可學(xué)習(xí)提示的視覺語言模型 CLIP 的蒸餾方法,可將大型 CLIP 教師模型的知識遷移至輕量級 CLIP 學(xué)生模型中。這是將大模型做“小”,提高AI經(jīng)濟性的有效技術(shù)解決方案,AI降本,大模型應(yīng)用才有可能成為主流。實驗結(jié)果表明,該蒸餾方法訓(xùn)練出的模型,在多個數(shù)據(jù)集上達到了最先進的性能。
據(jù)介紹,螞蟻此次被CVPR收錄的24篇論文中,有13篇出自螞蟻技術(shù)研究院。作為螞蟻聚焦前瞻科技的科研團隊,螞蟻技術(shù)研究院設(shè)立了交互智能、數(shù)據(jù)庫、圖計算、計算系統(tǒng)、程序設(shè)計語言與編譯器、密碼學(xué)等六個實驗室,以推動實現(xiàn)幾個階段性目標(biāo):在人工智能方向,能做出真正通過圖靈測試的智能模型,以及可以以假亂真、實時可交互的高精度數(shù)字人;在隱私計算方向,實現(xiàn)隱私計算軟硬件結(jié)合加速10萬倍;在數(shù)據(jù)方向,做到讓數(shù)據(jù)庫更智能,以及在圖計算上部署大腦模擬和融合神經(jīng)科學(xué)的智能機理研究。
據(jù)了解,清華大學(xué)、南京大學(xué)、華中科技大學(xué)、哈爾濱工業(yè)大學(xué)、西安電子科技大學(xué)、華南理工大學(xué)、騰訊、字節(jié)跳動等國內(nèi)高校和互聯(lián)網(wǎng)企業(yè)均有論文被該會議收錄。在這波生成式AI科技浪潮下,國內(nèi)校企正在發(fā)力積極參與其中。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。