上海天若信息科技有限公司
微軟亞洲研究院副院長(cháng)劉鐵岩:可持續發(fā)展的人工智能(né厭到ng)
來源: | 作者:shnews01 | 發(fā)布時(shí)間: 2021-10-08 | 486 次浏覽 | 分享到:
在近日舉行的世界人工智能(néng師放)雲端峰會(huì)上,微軟舉辦了“人工智能(老輛néng)予力永續未來”論壇,與國(g飛商uó)内外行業專家、學(xué)者和商業領袖一起(qǐ)圍如那繞AI和物聯網技術在城市建設、傳染病防護、節能(néng)減排等多個領麗和域的應用,探讨科技創新如何推進(jìn)整個社票業會(huì)的可持續發(fā)展,爲人類創造永久存續的未不書來。

在近日舉行的世界人工智能(néng)雲端峰會北技(huì)上,微軟舉辦了“人工智能(néng)予力永續未來”論壇,與國(gu舊腦ó)内外行業專家、學(xué)者和商業領袖一起靜長(qǐ)圍繞AI和物聯網技術在城市建設、傳染病防護、節能(néng)減章如排等多個領域的應用,探讨科技創新如何推進(jìn)整個社會(huì)的可持續音坐發(fā)展,爲人類創造永久存續的未來。 &nbs筆身p;


以下爲微軟亞洲研究院副院長(chá分術ng)劉鐵岩的内容分享:


可持續發(fā)展是一個非常重要的主題說可,無論是環保、健康、能(néng)源和材料,都(dōu)與人類的生存還國和發(fā)展息息相關。随著(zh微我e)工業的發(fā)展和科技的進(jìn)步,我們看到行照大氣、水質、土壤受到了嚴重的破壞和污染,維護生态平衡、保護自然環境,确保件街社會(huì)的可持續發(fā)展已經(jīng)成(chéng)爲人類生火農存發(fā)展的根本性問題。一直以來,微軟在環保、節能(néng)明離方面(miàn)投入了大量精力,而利用AI等技術解區空決環保、能(néng)源問題,實現可持續發(fā)展,也是微書短軟亞洲研究院的一個重要研究課題。


人工智能(néng)助力環保,潛力巨白為大


提到環保,大氣污染治理是其中一個主要方向(xiàng)。此前,微軟承諾到203還南0年實現負碳排放,到2050年,消除微軟自1975年成(ch子黃éng)立以來的碳排放量總和,包括直接排放或因用電産生的碳排的筆放,立足于科學(xué)和數學(xué),爲微軟的碳足迹負房到責。同時(shí)承諾未來四年内投入10億美元設立一項氣候創新基金,照訊幫助加速全球碳減排、碳捕獲和碳消除技術的發(fā)展。


現階段一些大氣污染治理方式取得了不錯的效果,年鐵不過(guò)在精準度方面(miàn)還(hái)有待進(j這多ìn)一步提高,不然很容易導緻大氣污染治理和經(jīng)濟發關刀(fā)展之間産生難以調和的矛雪熱盾。而實現精準的大氣污染治理,面(miàn)臨兩(liǎng)個挑戰:首先,從銀要知道(dào)當前各個地區具體的污染物排我自放情況,構建一份詳細的排放清單;其遠信次,要了解針對(duì)某一類特到爸殊排放物或者污染源進(jìn)行處理之後(hòu),它們在多大程度上、會電嗎(huì)以何種(zhǒng)來妹方式去影響最終空氣的質量。


兩(liǎng)個問題看似簡單,實現起(qǐ)來并不容易謝到。以排放清單估計爲例,由于污染排放源複雜且不斷變化,我們需要理解各種(z技會hǒng)排放物在各個地區每小時(shí)的變化,但又無法在雨醫每個排放源旁都(dōu)擺放一個傳花花感器,去采集細粒度、高精度的排嗎些放數據。因此當前的排放清單估計,嚴重依賴于專家根據宏觀經(jīng)濟信息進紙頻(jìn)行排放普查,費時(shí)費力,缺乏精度保障。據金關專家估計,該精度隻有60%左右。


排放估計機器學(xué)習模型:光玩誤差降低65%


利用人工智能(néng)、機器學(xué)習關笑技術自動估計精确的排放清單,可以節省大量人力劇學成(chéng)本,并且爲決策提供更及時(shí信快)、有力的支撐。


首先,我們來構建一個機器學(x長票ué)習模型,從大氣的污染物分布出發(fā),去預測排放清空錯單。通常我們會(huì)需要大量訓練數據,這(zhè)些數據需要包含不同類型的北農大氣污染物分布所對(duì)應的排放清單,但這低女(zhè)正是我們要通過(guò)AI去解決的問題,因爲現實中答男我們無法采集到細粒度、高精度的排放清單,訓練數據在這(zh制的è)裡(lǐ)出現了“雞生蛋、蛋老用生雞”的尴尬局面(miàn)。


我們注意到,這(zhè)個問題的背後(hòu)有一個反向(用森xiàng)問題,我們可以從排放清單出發(fā),通過(guò)推演獲得大對大氣中污染物的分布,這(zhè)個問題的難度則要低得多路是。這(zhè)裡(lǐ)剛好(hǎo)可以用到微軟亞洲研究院近年來所提出船草的“對(duì)偶學(xué)習”思想。利用對(duì)偶學(xué)習,從白愛大氣污染物分布出發(fā),經(jīng)過(guò)排放清單,再回到大氣污染制動物分布,形成(chéng)學(雨她xué)習閉環,我們就(jiù)可以利用對(duì)大氣污染物預測的誤差,來火短驅動整個學(xué)習過(guò)通分程,最終獲得排放清單估計模型。


事(shì)實上,在環境科學(xué男用)領域,從排放清單推演出大氣污影到染物的分布,已經(jīng)有一個被(bèi)廣泛使水學用的系統,叫(jiào)做化學(xué)輸送模型(CTM),我們可坐議以把CTM當作對(duì)偶學(xué)習閉環中的一環答報,來實現學(xué)習過(gu門化ò)程。不過(guò)CTM系統有個小問題,它是一個離散系統,不可求導,因此我明離們提出構建一個連續可導的函數,用讀線它來逼近CTM系統。考慮到CTM中有非常複雜的化學(xué自兒)反應,以及時(shí)空的對(duì)流擴散等過(guò)程區輛,我們選用了一個相對(duì)複雜的複合神經(jīng)網絡來實現。劇鐘在該網絡裡(lǐ),我們用CNN實現了對(duì)去懂地理位置的編碼,用LSTM循環神經(jīng)網絡對(duì)時(村短shí)域信息進(jìn)行編明見碼,用U-Net實現對(duì)空間信息的建模。


在過(guò)去的一年,我們與清華大學(xu讀弟é)的科學(xué)家一起(qǐ),基于1500個觀測站點的山兵排放數據,評測了排放估計模型。實驗表明,相比之前的專家估計,機司上器學(xué)習模型不僅節省了大量的人力成(討內chéng)本,還(hái)把相對金但(duì)的估計誤差降低了65%,極大提升了排放清又章單估計模型的精度。 


一次CTM仿真,即可獲得精準的大氣化學(xué)反應曲面(miàn)


當有了相對(duì)準确的排放清單估計之後(hòu),下一個兵身問題就(jiù)是,基于這(zhè著男)個清單對(duì)其中的某種(zh討快ǒng)排放物或污染源進(jìn)行控制,最終會(huì)如何影響大氣污場做染物的分布?如果每一次排放控制都(dōu)經(jīng)過(guò)一次C習媽TM仿真才能(néng)獲得大氣污染物的變化,那湖如幾乎要窮舉所有的排放狀況,才能(néng)全面(m家光iàn)掌握這(zhè)個問題,這(zhè少樹)顯然不可行。


人們通常采用基于采樣(yàng)的近似曲面(miàn)估計方法去構建大氣化學樹鄉(xué)反應的曲面(miàn),可以有效降低CTM仿真的複雜度,但這那河(zhè)個曲面(miàn)的精度和構建曲面(miàn)時(shí)所需要的樣家光(yàng)本點數目密切相關,而在實踐中數你想得到一個相對(duì)細緻的大氣化學(xué)反應曲面(miàn)輛但,通常要采集幾百萬個樣(yàng)本點,其中的運算複雜度非常高。


微軟亞洲研究院和清華大學(xué)合作研發(fā化們)了全新的方法,隻需要經(jīng)過(guò討麗)一次CTM仿真就(jiù)可以獲得精準的大氣化學(xué)反應曲面(m有慢iàn),這(zhè)個算法背後(hòu)的特别之處在于我們對(黃舊duì)于大氣化學(xué)反應機理也師的深刻認識。大氣中化學(xué)反應通常是可逆的,而且生成志師(chéng)物的濃度與反應物濃度煙錯之間存在一定的定量關系。這(zhè)個關系與隻依賴于友醫外部條件的一個化學(xué)平衡常數K有關,還(hái)與一個反應關系函數R有睡也關。因此,我們不需要對(duì鄉大)每種(zhǒng)反應物的濃度進(jìn)行CTM仿真,隻需要在一個基準濃都美度的CTM仿真基礎上,在外部條件不變的前提下,利用這(zhè)個反應關如美系函數R直接估計出各種(zhǒng)情況下生成(chéng)物的濃度。在爸錢實際操作中,我們用神經(jīng)網絡來對(du內又ì)反應關系函數R進(jìn)行建模,再用一高制定量的訓練數據去學(xué)習這(zhè)個神妹看經(jīng)網絡的參數即可。


由于傳統基于采樣(yàng)點來逼近化學(xué)反應曲面(mià區日n),會(huì)受到采樣(yàng)點數目的限制,好船無法實現完全精準的曲面(miàn)拟合。而我們的方法利用大氣化學(xué)來上反應的本質規律,不存在采樣(yàng)點帶來的報區近似誤差。通過(guò)測試,新方法不僅節省了用于CTM仿真的大量計算資到劇源,而且在預測精度上還(hái)將(jiāng)相對(duì)誤差動友降低了近40%。目前,該研究成(chéng)果和短已經(jīng)發(fā)表在環境科學(xué)領域頂級期刊《環著城境科學(xué)與技術》上,并已被(bèi)應用于大氣污染治理的技飛實戰。


關注AI背後(hòu)的能(néng)耗,算員件法可以更精巧


人工智能(néng)是一把雙刃劍,一方面(miàn)它可訊年以幫助解決可持續發(fā)展所面(miàn)臨的問題,媽少如前文提到的大氣污染與能(néng)源損耗,另一方面(miàn),人刀民工智能(néng)模型的訓練本身也要消耗大量資源。近些年人工智能(néng)呢舊領域有一個令人擔憂的現象,就(jiù)是所謂大力出奇筆開迹——人們過(guò)度依賴大模型、大數間制據去解決人工智能(néng)的精度問題現小,這(zhè)不可避免要消耗大量能(néng)源。


例如,圍棋選手AlphaGo在鐘師戰勝人類世界冠軍的背後(hòu),是上千塊CPU和上光章百個GPU的消耗;自然語言預處理技湖聽術Bert背後(hòu)需要幾十個TPU的支火新撐,才能(néng)夠完成(chéng)一個有效的訓練;用于圖像生成(ch機器éng)的大規模對(duì)抗生成(線能chéng)網絡也要消耗幾百個GPU。每一個人區物工智能(néng)系統本身,就(jiù)是資源消耗大戶,AI自身的可持續發舞熱(fā)展問題又該如何解決呢?


作爲研究人員,我們不禁自問:人工智能(néng)要發(fā)揮威力這空,一定需要消耗巨大的計算資源嗎?過(guò)去的5年裡土大(lǐ),我們基于這(zhè)樣(yàng)的思路,藍近開(kāi)發(fā)了一批高效實用錢影的低功耗人工智能(néng)技術看化,包括讓計算複雜度與主題數目無關的高效主題模型LightLDA,隻需歌近300個CPU内核,就(jiù)訓練出車土了比以往要用上萬個内核才能(né吃關ng)訓練出的模型還(hái)要大若幹數量級的新模型;速兒花度快、準确率高、内存要求低、分布式支持還(hái)可輕松快速處理海量數據的工近LightGBM算法,實現了比市場哥場上最好(hǎo)的梯度決策樹算法還(hái)要快一個數量級的新算法;兼具快速、鐘作魯棒、可控等優點的語音合成(chéng)算法FastS下作peech,將(jiāng)性能(néng)最好我冷(hǎo)的語音合成(chéng)引擎提速嗎坐了近270倍,而且隻需要使用低業都端GPU就(jiù)可以實現實時(shí)的語音合成(ché靜票ng)服務。 


微軟亞洲研究院高效的人工智能(n內鄉éng)算法


這(zhè)些新技術因爲低功耗、高效讀北率,或是可以在同樣(yàng)時(shí)間内訓練出些輛性能(néng)更好(hǎo)的機器學(xué)習模型,已經(jīng愛著)應用于微軟的多個産品中,也受到了外界的廣泛關注。Light雪遠LDA模型爲必應搜索引擎的上下文廣告提供了精細匹配的支持,黃土增加了廣告拍賣的密度;LightGBM算法極大程度上推進(就服jìn)了人工智能(néng)算法的平民化,受到了GitHub社火飛區的青睐,同時(shí)也是必應搜索引擎後(hò國木u)台的核心技術之一;Fastspeech算法在微軟Azure的電外認知服務中支持15種(zhǒng)語相對言的語音合成(chéng),也是市場上語音處理開(kāi)源軟件的呢工主流技術。


這(zhè)幾個來自微軟亞洲研究院的高效算法隻是一個開(kāi)始,爲了人匠我工智能(néng)的可持續發(fā)展,我們不僅要關心算校機法的性能(néng)、精度,還(hái)要注意其背後(hòu)的能(為腦néng)耗問題。也希望這(zhè)些算法設計的店著新角度,可以給大家一些啓示,去聚焦精巧的算村時法創新,做到事(shì)半功倍,以多快好(hǎo)省的方式,實現真正可持劇問續發(fā)展的人工智能(néng)。


隻有當人工智能(néng)算法本身具有可持續發(fā)都很展性,它才有資格、有能(néng)內光力去助力其他關鍵領域的技術轉型。我們熱切地呼籲鐵技人工智能(néng)領域的研究人員和從業者共同努力、精誠合作,用可持現刀續發(fā)展的人工智能(néng)技術去真正推動人類社會(hu算習ì)的可持續發(fā)展。


采編:上海天若信息科技有限公司市場部

來源:網絡

返回上一頁