2022年7月16日-18日,第十一屆吳文俊人工智能科學(xué)技術(shù)獎暨2021中國人工智能產(chǎn)業(yè)年會在北京和蘇州同期圓滿舉辦。深圳云天勵飛技術(shù)股份有限公司首席科學(xué)家王孝宇受邀在2021中國人工智能產(chǎn)業(yè)年會主論壇上發(fā)表主旨報告《Towards Automated Artificial Intelligence》。
人工智能在過去十年得到了長足的發(fā)展。人工智能加速發(fā)展的這十年,也是人工智能研究及產(chǎn)業(yè)技術(shù)不斷走向開源、開放、自動化的十年。報告通過梳理人工智能研發(fā)不斷邁向自動化的努力,闡述其下一階段大規(guī)模行業(yè)化的關(guān)鍵方向。報告亦會介紹與各國際高校學(xué)者聯(lián)合發(fā)布的YMIR開源自動化AI研發(fā)平臺。此平臺賦能的項目獲此次吳文俊人工智能科技進步一等獎。
以下為王孝宇博士的現(xiàn)場演講內(nèi)容:
我今天主要是根據(jù)我們在美國的十年和在中國五年創(chuàng)業(yè)的經(jīng)驗談一談我們對自動化機器學(xué)習(xí)和自動化人工智能的認識,并且同步介紹一下我們在這方面的成果。
其實深度學(xué)習(xí)最標(biāo)志性的事件是在2012年的時候,多倫多大學(xué)有一位教授Geoffrey Hinton,帶著兩個學(xué)生拿了國際比賽的第一名,并且比第二名高出很多,那個比賽叫ImageNet。后來這三個人就組建了一個科技公司賣給了Google。再后來這三個人也在人工智能的領(lǐng)域大展拳腳,Geoffrey Hinton是圖靈獎的得主,Ilya后來成為Opne AI的首席科學(xué)家,Alex后來去了Google做研究。
Alex對業(yè)界的貢獻非常大。為什么2012年之前有這么大的發(fā)展,其實這是一個逐步累積的過程,一方面互聯(lián)網(wǎng)的數(shù)據(jù)達到了一定的程度,另外一方面顯卡、GPU算力達到一定的程度,但是很多時候忽視了第三方面就是GPU當(dāng)時的編程很復(fù)雜,尤其是把深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)編寫到一個并行計算的框架里面,并不是簡單的任務(wù),Alex就把這個GPU實現(xiàn)了,并且得到了很好的結(jié)果,把這個結(jié)果release就分享給全社會了,所有學(xué)者都可以用,當(dāng)時叫Cuda-convnet。其實我們在2011、2012年做深度學(xué)習(xí)研究的時候,用的全是這個深度學(xué)習(xí)的框架。
在這之后,又有一個學(xué)生叫賈揚清(阿里巴巴副總裁),他release一個深度學(xué)習(xí)的框架叫Decaf,其實跟Alex的那個有點像,但是稍微比Alex那個框架又好用一點,這個得到了非常大的傳播。
由于Decaf本身存在一些工程上的問題,2014年伯克利又release了Decaf的第二版,我們叫Caffe。Caffe后來變成廣泛流傳的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練框架,這是2014年。
在這之后,各大公司就投入做深度學(xué)習(xí)的框架,這是一個營造科技生態(tài)非常重要的環(huán)節(jié),包括Google的TensorFlow,亞馬遜的Mxnet,Meta的Pytorch,包括中國百度的PaddlePaddle?,F(xiàn)在流行的主要是兩個,就是Google的TensorFlow、Meta的Pytorch。
這個領(lǐng)域你會發(fā)現(xiàn)變得越來越開放,第一步開放是研究學(xué)者之間的開放。我2008年在美國讀博士的時候,那個時候做研究就是你做你的,我做我的,我把我的方法做出來之后,你要實現(xiàn),可能要花半年的時間先去實現(xiàn)別人的方法,現(xiàn)在不用了,現(xiàn)在幾個小時的時間就實現(xiàn)別人的方法,大家把代碼開源了,并且用了統(tǒng)一的研究框架,開源統(tǒng)一的研發(fā)框架極大程度上研究了相互之間的參照,或者成果的自動化分享。
這是一方面,在研發(fā)架構(gòu)上以及研發(fā)方法上的自動化分享越來越便捷,另外一方面學(xué)者也注意到,現(xiàn)在很多優(yōu)秀的人才,所聚焦的研發(fā)或者工業(yè)界聚焦的研發(fā)更多的是在調(diào)參數(shù)。這些實際上本不應(yīng)該成為研究的核心內(nèi)容,所以大家開始探索,有沒有自動化的方法,讓我們深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)架構(gòu)可以自動化設(shè)計,可以面對一個問題的時候,自動化的選擇一個方法解決我現(xiàn)在的問題。
所有的學(xué)者在2022年的時候,也是最近,發(fā)起了一個會議叫做International Conference on Automated Machine Learning。大家發(fā)現(xiàn)這個東西可以自動化的完成,自動化有哪些內(nèi)容去做呢?這是他們所包含的領(lǐng)域,這里面有Neural Architecture Search,就是神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)能不能自動化尋找和設(shè)計。Hyperparameter Optimization,就是自動化神經(jīng)網(wǎng)絡(luò)訓(xùn)練時候的哪一個參數(shù)好一點,哪一個參數(shù)差一點,這個事情也別去想,你可以預(yù)測,也可以去尋找,但沒有必要讓研究學(xué)者拿這么高的工資調(diào)這個參數(shù)。
包括CASH(Combined Algorithm Selection and Hyperparameter Optimization),這個是什么呢?當(dāng)你要解決一個具體問題的時候,你用哪些混合的方法幫你實現(xiàn),幫你做這些東西,而不需要你自己手動設(shè)計,這是更難的問題,因為這要解決具體的問題。
我想說的是在第一波結(jié)果的自動化分享的基礎(chǔ)之上,大家開始慢慢地看能不能自動化做技術(shù)的設(shè)計,把我之前所做設(shè)計的工作負擔(dān)降低一點,這是大家努力的方向。
這個是算法設(shè)計的自動化,之前研究成果的是第一階段,第二階段是算法設(shè)計能不能自動化,自動化的好處是什么呢?減少了大量不具備科學(xué)價值的模型調(diào)參,這樣我們的核心人才就可以投入到更高級的人工技術(shù)的研發(fā)。
在這個基礎(chǔ)上,事情正在起變化,什么在起變化呢?去年在NIPS(Conference and Workshop on Neural Information Processing Systems)上,知名的科學(xué)家吳恩達,舉辦了一個workshop,主要是談模型和數(shù)據(jù)到底哪一個更重要。
他一個觀點就是,以模型為中心的技術(shù)研發(fā)轉(zhuǎn)化成以數(shù)據(jù)為中心的技術(shù)研發(fā)。我怎么類比這個問題呢?這是我個人的理解,不代表大家的看法,模型和數(shù)據(jù)之間的對比,你可以簡單的類比為一個人的IQ和知識儲備的對比。這個人很聰明,如果從小就放在家里面,永遠不跟社會打交道,也不讓他學(xué)習(xí)新的知識,還是一個很笨的人。但即使這個人資質(zhì)平平,但是他見過全世界各地的東西,去美國留學(xué)過,去歐洲留學(xué)過,在中國做過實際工業(yè)化的生產(chǎn),看過很多設(shè)計的案例,他可能比這個IQ高的人更厲害,如果這樣理解,模型就有點像IQ,數(shù)據(jù)就有點像知識,knowledge,兩個同等重要,而且越到后面你會發(fā)現(xiàn)knowledge越來越重要。
工業(yè)化大規(guī)模發(fā)展里面,大家慢慢地轉(zhuǎn)化為從模型為中心的生產(chǎn)轉(zhuǎn)化為以數(shù)據(jù)為中心生產(chǎn)的轉(zhuǎn)變,這是做的一些實驗的對比,我們可以看到有一個基礎(chǔ)算法之后,我們以兩個維度提高基礎(chǔ)算法的perfomance,一個是Model-centric,就是想盡各種辦法提高模型設(shè)計的復(fù)雜度、技術(shù)含量。另外就是Data-centric,加數(shù)據(jù),看數(shù)據(jù)有沒有問題,當(dāng)然加數(shù)據(jù)里面也有一些科學(xué)方法的,并不是加數(shù)據(jù)一定會提高。會發(fā)現(xiàn)Data-centric的方法比Model-centric的方法提高很多,這是我們自己做模型生產(chǎn)時候發(fā)現(xiàn)一個結(jié)論,越到后面你數(shù)據(jù)的迭代越來越重要,所有模型的服務(wù)實際上是針對某一個特定場景,有特定的數(shù)據(jù)解決它。
在過去我們實踐的八年時間中,我們就會發(fā)現(xiàn)算法的迭代事實上變成了數(shù)據(jù)的迭代,另外一個維度看,我們研發(fā)到現(xiàn)在為止幾百個算法的模型,從來沒有一個模型說我搜集了一次數(shù)據(jù),調(diào)整一次參數(shù)就不用變它了,我們很多模型都迭代了5-6年,主要迭代是什么?是數(shù)據(jù)的迭代。因為我們解決不同的需求,不同場景的時候,我們會受到不同場景泛化性的問題,我們碰到的問題越來越不一樣,不是因為算法的不一樣,是因為場景的不一樣,所以要處理的數(shù)據(jù)不一樣,我們要不停地更新迭代數(shù)據(jù),才能夠滿足不同場景應(yīng)用的需求。
算法迭代變成了數(shù)據(jù)迭代,有沒有辦法把數(shù)據(jù)的迭代也自動化呢?我們后面會講。算法設(shè)計可以自動化,數(shù)據(jù)迭代也可以自動化,我們就可以端到端的完成自動化的AI模型的生產(chǎn),就逐漸地成為可能,最起碼理論上是這樣。
算法設(shè)計的自動化,學(xué)者陸陸續(xù)續(xù)意識到這個問題是可以做的,有專門的學(xué)術(shù)會議討論設(shè)計這方面的新的算法,讓設(shè)計可以自動化,數(shù)據(jù)迭代的自動化也需要技術(shù)的支持,同時需要系統(tǒng)層級的支持。
為什么要做這件事情?為什么要做AI模型生產(chǎn)的平臺化?過去,只有科技巨頭,比如谷歌、IBM、微軟、蘋果等等公司會去投入AI,因為他們有大量的數(shù)據(jù)需要處理,所以他們需要智能化的算法。但現(xiàn)在不一樣了。我了解到很多房地產(chǎn)公司在投入AI,這代表他們也有對AI人才的需求。我們發(fā)現(xiàn)地產(chǎn)公司、物業(yè)公司等等傳統(tǒng)行業(yè)的公司都慢慢引入AI解決實際問題。為什么會這樣呢,有一句話概括得很貼切,就是AI就像電一樣,是一個非常基礎(chǔ)的能力,讓你所做的事情效率高一點,它不改變行業(yè),但是可以提升你生產(chǎn)的效率,所以影響是全方位的?,F(xiàn)在慢慢地波及到房地產(chǎn)公司了。更不用現(xiàn)在這么多廣泛的制造業(yè),制造過程中有很多AI的能力去構(gòu)建,如果想提高自己的國際競爭力,提高自己的生產(chǎn)質(zhì)量、效率,就需要AI的能力去賦能生產(chǎn)。
但問題又來了,我們沒有這么多AI人才。這種形勢下AI人才薪資待遇非常高,一個高質(zhì)量的AI博士工作三四年就要花三四百萬、四五百萬成本,但問題是很多企業(yè)一年的利潤都沒有這么多。從這個角度考慮,我們就做了這樣一個東西——YMIR自動化模型生產(chǎn)系統(tǒng),我們先看一段VCR。
視頻里面這四位研發(fā)人員,除了我自己之外,另外一位硅谷的科技公司的創(chuàng)始人,另外兩位都是前Google的員工。
大家可以看到這是一個國際化的項目,這是我們和國際知名高校和科技公司一起聯(lián)合發(fā)起的開源的、公益性的AI模型生產(chǎn)平臺。我們邀請了多家美國科技巨頭公司的首席AI官擔(dān)任項目顧問,已經(jīng)在GitHub上面開源。
接下來我詳細介紹一下這個平臺,為什么它能夠去解決實際應(yīng)用中的問題。
工業(yè)化模型生產(chǎn)主要流程,主要分成這幾個部分。第一需求的定義;第二是技術(shù)方案,技術(shù)方案就是什么樣的技術(shù)可以解決問題,或者用怎么樣的組合的技術(shù)解決這個問題;第三開始做數(shù)據(jù)收集,用AI方法解決問題。數(shù)據(jù)收集之后進入迭代的階段,迭代就包括數(shù)據(jù)的標(biāo)注、模型的訓(xùn)練、數(shù)據(jù)的挖掘。
在整個迭代化的大系統(tǒng)里面,也有一些技術(shù)需要power,包括數(shù)據(jù)預(yù)標(biāo)注技術(shù)。數(shù)據(jù)預(yù)標(biāo)注就是在數(shù)據(jù)沒有標(biāo)注之前,打一個可能的標(biāo)簽,可以極大提升數(shù)據(jù)標(biāo)注的速度。預(yù)訓(xùn)練大模型可以提高模型訓(xùn)練的performance。當(dāng)模型performance比較高的時候,你做數(shù)據(jù)挖掘的效率就會比較高,需要標(biāo)注的數(shù)據(jù)就會比較少,有效標(biāo)注就會比較高。當(dāng)你有了初始模型,需要高效的找數(shù)據(jù)訓(xùn)練模型的時候,就需要主動學(xué)習(xí)技術(shù)。主動學(xué)習(xí)就是海量的幾億、上百億的數(shù)據(jù)里面找到你想要的數(shù)據(jù),而不是把100億的數(shù)據(jù)標(biāo)注一遍。主動學(xué)習(xí)可以降低數(shù)據(jù)標(biāo)注的成本,提高標(biāo)注的效率。
這是一個簡單的技術(shù),我不做技術(shù)細節(jié)的敘述,預(yù)訓(xùn)練大模型在實際生產(chǎn)中產(chǎn)生了一些效率,這里講了城市治理的例子,包括垃圾暴露、廣告牌的識別、垃圾桶滿溢的識別,這都是在日常城市治理中所需要的算法,我們發(fā)現(xiàn)加入了預(yù)訓(xùn)練大模型之后,再在小模型上訓(xùn)練模型,至少提高10個點的performance,10個百分點的performance很多時候就意味著只標(biāo)注一半數(shù)據(jù),就節(jié)省了一半的成本,實際上我們企業(yè)做事情,每一個事情都是對應(yīng)成本核算的,大模型可以幫助我們減少一半的成本,它極大提升算法的泛化性能,同時加速樣本收集,就是我說的數(shù)據(jù)的效率。
再看看主動學(xué)習(xí)。主動學(xué)習(xí)要解決的就是數(shù)據(jù)自動化的關(guān)鍵技術(shù),以前我們都是閉著眼睛標(biāo)數(shù)據(jù),這兒有一批數(shù)據(jù)拿過來標(biāo)一下,模型訓(xùn)練到一定程度之后,不是所有數(shù)據(jù)都對模型訓(xùn)練有幫助,你需要找到能提升模型精度的數(shù)據(jù),這個技術(shù)就叫主動學(xué)習(xí),我們主動學(xué)習(xí)的框架也把它開源了。
有了這些技術(shù)的power之后,我們打造了一套工程化的系統(tǒng),就是YMIR。它能夠覆蓋模型生產(chǎn)全流程,與現(xiàn)有的模型生產(chǎn)系統(tǒng)不一樣,在正常使用過程當(dāng)中都不太能夠滿足真實在工業(yè)界場景迭代的需求,所以這個自動化平臺就聚焦在模型的快速迭代,不是訓(xùn)練出一個模型這個事情就結(jié)束了,主要是解決現(xiàn)實場景的需求,可以一直迭代。
這是整個技術(shù)的框架,左邊是一次性的過程,數(shù)據(jù)的準(zhǔn)備、數(shù)據(jù)的標(biāo)注、模型的訓(xùn)練,右邊是迭代的過程,包括挖掘數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、更新訓(xùn)練集、模型訓(xùn)練。
這是我們實際正在使用一套系統(tǒng)實際的UI的界面,每一步都有提示,告訴你導(dǎo)入數(shù)據(jù)之后,要繼續(xù)做訓(xùn)練了,訓(xùn)練之后做數(shù)據(jù)挖掘,數(shù)據(jù)挖掘之后做標(biāo)注,然后再訓(xùn)練,這是一個輪回的過程。
這是我們導(dǎo)入數(shù)據(jù)集的界面,你點擊可以選擇一個數(shù)據(jù)的鏈接,也可以建立一個文件把數(shù)據(jù)放到我們系統(tǒng)里面去。導(dǎo)入數(shù)據(jù)之后可以可視化,看看有哪些沒有標(biāo)注好的,或者有數(shù)據(jù)標(biāo)簽有偏差的,不同的任務(wù)數(shù)據(jù)不均衡的,都可以通過可視化的方式呈現(xiàn)在你的面前,發(fā)掘數(shù)據(jù)里面的問題。
在這基礎(chǔ)之上有一排按鈕,有的按鈕打了藍色背景,有藍色背景就是你現(xiàn)在可以執(zhí)行的操作,現(xiàn)在執(zhí)行的就是準(zhǔn)備數(shù)據(jù)。后面我們看到數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注都沒有點亮,是可以通過人機交互來看怎么做,數(shù)據(jù)準(zhǔn)備完之后看數(shù)據(jù)挖掘,第二個按鈕就會亮起來。挖掘數(shù)據(jù)是沒有被標(biāo)注的數(shù)據(jù),挖掘過程是在海量的數(shù)據(jù)里面找到可以讓你使用的數(shù)據(jù),你可以標(biāo)注它,標(biāo)注完之后,你可以和以前有的數(shù)據(jù)合在一起,更新數(shù)據(jù)集,然后再訓(xùn)練。這步走完了之后又回到最初始的第一步,而且你會發(fā)現(xiàn)整個過程中,完全不需要算法人員,不需要寫代碼,甚至連軟件的基本操作都不需要,通過點擊按鈕就完成研發(fā)過程。
研發(fā)過程中這個模型到底好不好呢?我們有一個可視化的界面,讓你診斷模型到底好不好,這個功能叫模型的診斷。這個里面可以看到專業(yè)化的詞匯,叫FN、FP,我不展開講,F(xiàn)N實際上就是這個是一個正樣本,但是沒有檢測到,F(xiàn)P就是“假陽性”,就是你檢測到了,但是實際上不是。你的錯誤到底是FN產(chǎn)生的還是FP產(chǎn)生的,還是其他方式產(chǎn)生的,通過可視化產(chǎn)生的方式告訴你這個模型產(chǎn)生的問題,當(dāng)你發(fā)現(xiàn)存在問題的時候,要么就把數(shù)據(jù)打回去重新標(biāo)注,也有可能數(shù)據(jù)偏差出現(xiàn)了問題,需要更多的數(shù)據(jù)標(biāo)簽,通過可視化的方式就可以知道實際應(yīng)用中知道模型到底還有哪些問題,以及下一步用什么方式解決它。
除了這個之外,還有一個很好的地方,就是購買了足夠的算力,這一套系統(tǒng)可以供很多人一起開發(fā),而不是只有一個人開發(fā),這里面有很多project,每一個project都是算法模型的任務(wù),你可以很多人同時進行算法研發(fā),這些人員只要高中生畢業(yè)就可以,不需要花幾百萬招聘算法人員去做。
我們做了很多實驗,在自己公司里面,我們做了大概6個月長期的跟蹤實驗,我們投入的標(biāo)注人員是10個,要么是高中生,要么是職業(yè)院校畢業(yè)的學(xué)生,算法人員也有投入。為什么不能完全脫離算法人員,當(dāng)你面對一個問題的時候,怎么分解成技術(shù)實現(xiàn),還需要算法人員介入,同時需要給標(biāo)注人員做一些簡單的系統(tǒng)的培訓(xùn),算法人員投入0.3左右,就是一天中花30%的時間做這個事,其他時間的還要做算法研發(fā),當(dāng)然還要做標(biāo)志文檔的審核,模型迭代情況的查看以及發(fā)現(xiàn)模型的問題,帶著大家去做。
我們標(biāo)注圖片的總數(shù)是100萬,標(biāo)注人員的工作內(nèi)容,90%用在標(biāo)注上,就是要把檢測的物體標(biāo)注出來,有10%的時間是放在操作YMIR系統(tǒng)上。我們在三個月時間里面生產(chǎn)了50個算法,算法大部分滿足實際應(yīng)用的需求,有的算法都達到97%,相對來說比較簡單,很多問題不是單純的靠技術(shù)可以解決,天生就不能得到很高的精度。在三個月里面我們用10個標(biāo)注人員,0.3個算法人員就可以完成了50個算法的研發(fā),并且可以實際應(yīng)用在城市治理的場景里面,包括應(yīng)急里面的滅火器檢測、消防栓檢測和城市治理的需求。
這是投入時間,我們有這一套系統(tǒng)和沒有系統(tǒng)的對比,周期都是三個月左右,沒有這套系統(tǒng)的時候,算法人力的投入大概是36人/天,我們標(biāo)注人員的投入是240/天,我們模型生產(chǎn)了六個算法。投入了這一套系統(tǒng)之后,我們可以生產(chǎn)51個算法,時間周期差不多,生產(chǎn)效率大概是17個算法/月,以前是3個算法/月。我們使用自動化平臺后算法生產(chǎn)效率提升6倍,但是算法人員需求降為原來1/10。
這是一個開源的系統(tǒng),已經(jīng)有260家公司/個人試用,YMIR遵循Apache2.0授權(quán),自用商用均免費。
這是GitHub的界面,大家有興趣可以去GitHub了上下載代碼,去運行這套系統(tǒng),看看在實際運用中用這套系統(tǒng)能不能解決實際問題。
今天我想表達的是什么呢?隨著AI的發(fā)展越來越廣泛波及到各行各業(yè),我們相信自動化的生產(chǎn)模型系統(tǒng)會發(fā)展起來,作為生產(chǎn)力工具快速發(fā)展起來。因為在這個發(fā)展過程當(dāng)中就極大降低AI研發(fā)成本,加速普及,這樣AI整個研發(fā)才會進入到下一個階段,我們跟投資人聊,很多人都說AI平臺公司什么時候會出現(xiàn),當(dāng)每一個公司都要用到AI的時候,AI平臺公司就會出現(xiàn),我相信這一天很快就會到來。
這就是我今天演講的內(nèi)容,謝謝大家!
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點,亦不代表本網(wǎng)站贊同其觀點或證實其內(nèi)容的真實性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120230012 信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0121673 增值電信業(yè)務(wù)經(jīng)營許可證京B2-20171219 廣播電視節(jié)目制作經(jīng)營許可證(京)字第10250號
關(guān)于我們 中宏網(wǎng)動態(tài) 廣告服務(wù) 中宏網(wǎng)版權(quán)所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.uokii.com. all rights reserved 運營管理:國家發(fā)展和改革委員會宏觀經(jīng)濟雜志社