上海天若信息科技有限公司
微軟亞洲研究院副院長(cháng)劉鐵岩:可持續發(fā)展的人工智能(n是議éng)
來源: | 作者:shnews01 | 發(fā)布時(shí)間: 2021-10-08 | 485 次浏覽 | 分享到:
在近日舉行的世界人工智能(néng)雲端峰會(huì)上,微軟舉辦了黃不“人工智能(néng)予力永續未來”論壇,與國(guó)内外行業專家歌了、學(xué)者和商業領袖一起(q文鐘ǐ)圍繞AI和物聯網技術在城市建設、傳染病防護、節能(néng)減排等多子船個領域的應用,探讨科技創新如何推進(jìn)整個社會(huì)的可持續發(fā空慢)展,爲人類創造永久存續的未來。

在近日舉行的世界人工智能(néng)雲端峰會(huì)上,微軟舉長票辦了“人工智能(néng)予力永續未來”論壇,與國(guó)内外行業地姐專家、學(xué)者和商業領袖一起(qǐ)圍繞AI鄉時和物聯網技術在城市建設、傳染病防護、節能(né玩上ng)減排等多個領域的應用,探讨科技創新如何推進(jìn)文可整個社會(huì)的可持續發(fā)展,爲人類創造永久存續的未來。 暗文; 


以下爲微軟亞洲研究院副院長(cháng)劉鐵岩的内容分享:


可持續發(fā)展是一個非常重要的主題,無論是環保、健康、著男能(néng)源和材料,都(dōu)與人類的生我低存和發(fā)展息息相關。随著(zhe)工業的發(fā)展和科技的進(jìn得樹)步,我們看到大氣、水質、土壤受到了嚴重的破壞和一風污染,維護生态平衡、保護自然環境,确保社會(huì)的可持續發(fā)展已音見經(jīng)成(chéng)爲人類生存發(fā)展的根本性問題。一直以來風鄉,微軟在環保、節能(néng)方面(mià要體n)投入了大量精力,而利用AI等技術解決環保、能(néng)源問題器女,實現可持續發(fā)展,也是微軟亞洲研究院花匠的一個重要研究課題。


人工智能(néng)助力環保,潛力巨大


提到環保,大氣污染治理是其中一個城湖主要方向(xiàng)。此前,微軟承諾到2030年實現負碳排放,到20黑低50年,消除微軟自1975年成(chéng)立以來的碳排放量總離銀和,包括直接排放或因用電産生的碳排放,立足于科學(xué坐黑)和數學(xué),爲微軟的碳足迹負責。同時(shí)低筆承諾未來四年内投入10億美元設立一項氣你內候創新基金,幫助加速全球碳減排、碳捕獲和碳消除技術的樂花發(fā)展。


現階段一些大氣污染治理方式取得了不錯的效果,不過(guò)在精準度方爸靜面(miàn)還(hái)有待進(jìn)一步提高,不對科然很容易導緻大氣污染治理和經(坐妹jīng)濟發(fā)展之間産生難以調和也舊的矛盾。而實現精準的大氣污染治理,面(mi女熱àn)臨兩(liǎng)個挑戰:首先,要知道(dào)當前各個地區具體的污染物謝問排放情況,構建一份詳細的排放清睡計單;其次,要了解針對(duì)某一類特殊排放物或者污染源進(j為熱ìn)行處理之後(hòu),它們在多大程度上、會(huì)以何種(z的你hǒng)方式去影響最終空氣的質量。


兩(liǎng)個問題看似簡單,實現起(qǐ)來并不容易。以排放清單估計我校爲例,由于污染排放源複雜且不斷變化,我慢村們需要理解各種(zhǒng)排放物在黑信各個地區每小時(shí)的變化,但又無法制中在每個排放源旁都(dōu)擺放一個傳感器,去采集細粒度、用子高精度的排放數據。因此當前的排放清單估計,嚴重依賴于專家根據宏觀經(樂的jīng)濟信息進(jìn)行排放普查,費時(shí)費力,秒個缺乏精度保障。據專家估計,該精度隻有60%左右。


排放估計機器學(xué)習模型:誤差降低65現理%


利用人工智能(néng)、機器學(xué)習技術自動音黑估計精确的排放清單,可以節省大量人力成(很草chéng)本,并且爲決策提供更及時公煙(shí)、有力的支撐。


首先,我們來構建一個機器學(x廠有ué)習模型,從大氣的污染物分布出發(fā),她計去預測排放清單。通常我們會(huì)需要大量訓練數據,這(zhè)些數不現據需要包含不同類型的大氣污染物分布所對(duì)應的排放清單,但這(zhè)正工理是我們要通過(guò)AI去解決的問題,因爲現實中我們無法采年房集到細粒度、高精度的排放清單,訓練數據在這(zhè)裡(lǐ)出現了“雞生玩廠蛋、蛋生雞”的尴尬局面(miàn)。


我們注意到,這(zhè)個問題的背後(hòu)有廠報一個反向(xiàng)問題,我們可以從排放清單出發(fā),業女通過(guò)推演獲得大氣中污愛場染物的分布,這(zhè)個問題的難度則要低得多。這(z在地hè)裡(lǐ)剛好(hǎo)可以用到微軟亞洲研究院近年來所提出的“草和對(duì)偶學(xué)習”思想。利用對(duì)偶學(xué)習就公,從大氣污染物分布出發(fā),經(jīn鄉又g)過(guò)排放清單,再回到大氣污染物分布,形成(chén水愛g)學(xué)習閉環,我們就(jiù)可以利用對(duì可到)大氣污染物預測的誤差,來驅動整個學(xué)習過(g玩如uò)程,最終獲得排放清單估計模型。


事(shì)實上,在環境科學(xué)領域,從排放清單推演出大氣校她污染物的分布,已經(jīng)有一個被(bèi)廣泛使用的系統,叫(水制jiào)做化學(xué)輸送模型(CTM),不到我們可以把CTM當作對(duì)偶學(xu計懂é)習閉環中的一環,來實現學(xué)習過(guò)業又程。不過(guò)CTM系統有空刀個小問題,它是一個離散系統,不可求導,因此我們提出構建一個連續可笑音導的函數,用它來逼近CTM系統喝生。考慮到CTM中有非常複雜的化學(xué)反應,以及時(shí)劇報空的對(duì)流擴散等過(g妹亮uò)程,我們選用了一個相對(duì)複雜的複合神經(j很路īng)網絡來實現。在該網絡裡(lǐ),我們用CNN實現了對(上計duì)地理位置的編碼,用LSTM循環神經(jīng行人)網絡對(duì)時(shí)域信息進(jìn)行編碼,用U-Ne體費t實現對(duì)空間信息的建模。


在過(guò)去的一年,我們與清華大學(xué)的科學(xué)家一起(qǐ熱房),基于1500個觀測站點的排放數據,評測了排放估計模型。實驗表明,相比東南之前的專家估計,機器學(xué)習模型不僅節省了大量的人力成聽了(chéng)本,還(hái)把相對(duì)的估計誤差降鄉話低了65%,極大提升了排放清單估計模型的精度。 


一次CTM仿真,即可獲得精準的大氣化學(xué)反應吃員曲面(miàn)


當有了相對(duì)準确的排放清他器單估計之後(hòu),下一個問題就(jiù)是很草,基于這(zhè)個清單對(duì)其中的某風還種(zhǒng)排放物或污染源進(jìn)行控制,綠器最終會(huì)如何影響大氣污染物的分布?如果每一次排車到放控制都(dōu)經(jīng)過(guò)近分一次CTM仿真才能(néng)獲得大氣污染物的變化,那幾乎要窮舉所有的排放狀弟關況,才能(néng)全面(miàn)綠從掌握這(zhè)個問題,這(zhè)顯然不不也可行。


人們通常采用基于采樣(yàng)的近似曲面(miàn)估計方法去構建大氣化學(話物xué)反應的曲面(miàn),可以有效降低CTM仿真的雜化複雜度,但這(zhè)個曲面(miàn)的精度和構建曲面(mià吧身n)時(shí)所需要的樣(y鄉女àng)本點數目密切相關,而在實踐中想得到一個相對(d這有uì)細緻的大氣化學(xué)反這動應曲面(miàn),通常要采集幾百靜算萬個樣(yàng)本點,其中的運算複雜度非常高。中近


微軟亞洲研究院和清華大學(xué)合作研發(fā)了全新的方法,隻需要經(jī下船ng)過(guò)一次CTM仿真就(jiù)可以獲得精準的大氣化學(xué)光民反應曲面(miàn),這(zhè關飛)個算法背後(hòu)的特别之處在于我們對(duì)于大氣化學(xué)反應機短知理的深刻認識。大氣中化學(xué)反應子事通常是可逆的,而且生成(chéng)物的濃度與反應物濃度之間存在一定為答的定量關系。這(zhè)個關系與隻依賴于外部條件的一個化學(xué)平衡常數可藍K有關,還(hái)與一個反應關系函數R有關。因此,我視化們不需要對(duì)每種(zh能電ǒng)反應物的濃度進(jìn)行CTM仿真,隻需電木要在一個基準濃度的CTM仿真基裡見礎上,在外部條件不變的前提下,利用這(zhè)個反應關系函林東數R直接估計出各種(zhǒng)情況下生成(chéng)物的濃度。在好習實際操作中,我們用神經(jīng)網絡來對(duì)反應關系函數R進(j報票ìn)行建模,再用一定量的訓練數據去學(xué)習這(zhè)林下個神經(jīng)網絡的參數即可道志。


由于傳統基于采樣(yàng)點來逼近化學(x少如ué)反應曲面(miàn),會(huì)受到采樣(y去知àng)點數目的限制,無法實現完全精準的曲面(mià弟下n)拟合。而我們的方法利用大氣化學(xué)反應的本質規律,不存在采樣(yà跳近ng)點帶來的近似誤差。通過(guò)測試,新方法不僅節省了刀司用于CTM仿真的大量計算資源,而且在預測精度上還(hái)將(jiāng)相玩身對(duì)誤差降低了近40%。目前,該研究成(chéng年那)果已經(jīng)發(fā)表在環境科學(xué)領域頂級期刊《環境科學(x秒計ué)與技術》上,并已被(bèi舊煙)應用于大氣污染治理的實戰。


關注AI背後(hòu)的能(néng)耗,算法可以更精巧


人工智能(néng)是一把雙刃劍,一方面(miàn)它草離可以幫助解決可持續發(fā)展所面(miàn)臨的問題,如前文提到的大船林氣污染與能(néng)源損耗,另一方看影面(miàn),人工智能(néng)模型的嗎在訓練本身也要消耗大量資源。近些年人工智能(néng)領域有一個令人擔憂的現象,亮房就(jiù)是所謂大力出奇迹——人們過(guò)度依賴大模型、大數據去解決人下視工智能(néng)的精度問題,這(zhè)不可避免要消耗水科大量能(néng)源。


例如,圍棋選手AlphaGo在戰勝人類世界冠軍的背後(hòu)討冷,是上千塊CPU和上百個GPU司電的消耗;自然語言預處理技術Bert背後(hòu)需要幾十個TPU少個的支撐,才能(néng)夠完成(chéng)一個有效的訓練;用于圖像生成(科站chéng)的大規模對(duì)抗生成(chéng)網絡也要消耗幾兵化百個GPU。每一個人工智能(néng)系統本身,就(jiù)是資源消耗會書大戶,AI自身的可持續發(fā)展問題司要又該如何解決呢?


作爲研究人員,我們不禁自問:人工上明智能(néng)要發(fā)揮威力,一定需要消耗巨火海大的計算資源嗎?過(guò)去的5年裡(lǐ),我們基于這(zhè)樣(鐵可yàng)的思路,開(kāi)發(fā)了一批高效實用的新媽低功耗人工智能(néng)技術,包括讓計算複通我雜度與主題數目無關的高效主題模型LightLDA,隻需300個CPU内核,就舞問(jiù)訓練出了比以往要用上萬個内核才能(néng)訓練出的模型還(há河能i)要大若幹數量級的新模型;速度快、準确率高、内存要求低、分布農錯式支持還(hái)可輕松快速處理海量數據的LightGBM算法,實現了東下比市場上最好(hǎo)的梯度決策樹算法還(hái)姐校要快一個數量級的新算法;兼具快速、魯她服棒、可控等優點的語音合成(chéng)算法FastSpe我笑ech,將(jiāng)性能(néng)最好(hǎo)低信的語音合成(chéng)引擎提速了近270倍,而且隻需要使用低端GPU就(ji慢那ù)可以實現實時(shí)的語音合成(ché月道ng)服務。 


微軟亞洲研究院高效的人工智能(néng)算法


這(zhè)些新技術因爲低功耗、高效率,或是可以在裡光同樣(yàng)時(shí)間内訓車人練出性能(néng)更好(hǎo)的機器學(xué匠日)習模型,已經(jīng)應用于微軟的多個産品中,也受到了外界的廣泛關注。L樂快ightLDA模型爲必應搜索引擎的上下文廣告提供了精細匹配的支持,增加美拍了廣告拍賣的密度;LightGBM算法極大程度上推進(jìn熱森)了人工智能(néng)算法的平民化,受到了GitHub社區的青睐,同時和黑(shí)也是必應搜索引擎後(知器hòu)台的核心技術之一;Fastspeech算在吃法在微軟Azure的認知服務中支持15種北師(zhǒng)語言的語音合成(chéng),也是子金市場上語音處理開(kāi)源軟件的主流歌房技術。


這(zhè)幾個來自微軟亞洲研究院笑道的高效算法隻是一個開(kāi)始,爲了人工智能(得對néng)的可持續發(fā)展,我們不僅要答外關心算法的性能(néng)、精度,還(hái)器月要注意其背後(hòu)的能(néng)耗問題。也希望這(zhè)些算法設電計計的新角度,可以給大家一些啓示票場,去聚焦精巧的算法創新,做到事(shì)半功倍,妹數以多快好(hǎo)省的方式,實現真正可持續發(fā)展的人工智能(電內néng)。


隻有當人工智能(néng)算法本身具有可持續發(fā)展性,它才志路有資格、有能(néng)力去助力其他關鍵領域的技術轉型。我廠街們熱切地呼籲人工智能(néng)領域的研究人員和從業者共同努力、精開喝誠合作,用可持續發(fā)展的人工智能(nén鄉吧g)技術去真正推動人類社會(huì)的可持續發都校(fā)展。


采編:上海天若信息科技有限公司市場部

來源:網絡

返回上一頁