發(fā)展人工智能,庫卡機器人驅(qū)動器維修,人類需要像開跑車一樣緊盯時速表
微軟最近說自己的語音轉(zhuǎn)錄軟件在精確度方面又創(chuàng)造了一個新紀錄。在對一個標準集的電話錄音進行轉(zhuǎn)錄中,其系統(tǒng)僅錯了20個單詞這一能力已經(jīng)可以與接受相同挑戰(zhàn)的人類匹敵。
其結(jié)果就是一系列的近期發(fā)現(xiàn),這些發(fā)現(xiàn)被部分人認為是人工智能的發(fā)展正在加速,會對經(jīng)濟造成威脅的證據(jù)。一些軟件已經(jīng)證明了在識別汽車或者貓這樣的對象時自己表現(xiàn)比人類還要好,而Google的AlphaGo軟件已經(jīng)暴虐了多位圍棋世界冠軍這一壯舉直到最近還被認為是10之后的事情。各家公司都渴望乘上這一進展的東風,在公司財報會上都會提到AI或多或少已經(jīng)有了指數(shù)式的發(fā)展。
現(xiàn)在,一些AI觀察家正在試圖對這一技術(shù)的進展情況以及速度描繪一幅更精確的圖景。通過衡量不同領(lǐng)域的進展或者滯后情況,他們希望能撥開AI炒作的迷霧。該項目的目的,是讓研究人員和政策制定者對該領(lǐng)域哪些部分進展最迅速以及可能需要做出什么樣的回應看得更加清楚。
2016年在標準ImageNet測試中,圖像識別軟件的表現(xiàn)已經(jīng)超過了人類。
非盈利的SRIInternational實驗室研究人員RayPerrault說:需要干這事兒的原因是大家對AI何去何從的看法都太瘋狂了。Perrault是AIIndex項目的領(lǐng)導之一,這個項目的目標是在今年年底發(fā)布一份該領(lǐng)域現(xiàn)狀以及進展速度的詳細快照。項目得到了OneHundredYearStudy的支持,后者是斯坦福大學在2015年設(shè)立的,旨在研究AI對社會的影響。
這些日子以來,到處都可以看到宣稱AI取得進展的消息,有些甚至是來自于快餐和牙刷的營銷者。哪怕是來自可靠的研究團隊的自吹自擂也很難評估。去年10月,微軟首先宣布自己的語音識別技術(shù)已經(jīng)與人類不相上下。但IBM的研究人員和眾包公司Appen隨后證明人類的精確度其實要比微軟宣稱的高。軟件巨頭需要把自己的錯誤率再降12%才能趕上人類的表現(xiàn)。
過去30年下棋軟件的能力突飛猛進
ElectronicFrontierFoundation(EFF)也已經(jīng)開始了自己對AI進展的衡量以及背景研究的努力。這家非營利組織正在梳理微軟等的論文,搭建一個跟蹤AI進展與表現(xiàn)的在線開源數(shù)據(jù)點庫。EFF的首席計算機科學家PeterEckersley說:我們希望知道真實版本的AI會有哪些緊迫的和更長期的政策影響,KUKA機器人示教器維修,而不是那些讓大家過度興奮的猜測版AI的影響。
這兩個項目都嚴重依賴于機器學習與AI方面已發(fā)布的研究。比方說,EFF的庫包括了自2012年以來表明圖像識別取得快速發(fā)展的圖表以及機器和人類在一項挑戰(zhàn)軟件理解童書的測試中的表現(xiàn)差距。AIIndex項目正在尋求將最受研究人員關(guān)注的AI子域的趨勢以圖表形式表現(xiàn)出來。
AIIndex還試圖監(jiān)控和衡量AI在現(xiàn)實世界是如何應用的。比方說,Perrault說把從事這一技術(shù)的工程師數(shù)量以及流入到以AI為中心的企業(yè)的投資額記錄下來可能就很有用。其目標是找出這一研究對商業(yè)化產(chǎn)品產(chǎn)生了多大的影響。他說盡管他承認那些公司可能會不愿發(fā)布這些數(shù)據(jù)。AIIndex項目正在致力于跟蹤媒體和公眾對AI關(guān)注的程度和情緒。
Perrault說該項目應該能贏得廣大受眾,因為研究人員和基金會非常渴望看到AI的哪些領(lǐng)域勢頭最好,或者需要支持和新思路。他說銀行和咨詢公司已經(jīng)給他們打電話了,希望能對AI的真實情況能夠有更好的了解。技術(shù)產(chǎn)業(yè)跟衡量和預測計算機處理器進展情況的摩爾定律數(shù)十年的羅曼史,KUKA機器人維修,說明展示AI進展情況的圖表很容易能夠在硅谷找到受眾。
這類衡量手段對政府官員和監(jiān)管當局應對更智能的軟件在隱私等領(lǐng)域的影響有多少幫助就沒那么清楚了。華盛頓大學法律教授RyanCalo最近提出了一份有關(guān)AI政策問題的詳細路線圖,他說:我不太確定這能有多大用處。他認為決策者需要對底層技術(shù)有較高層面的把握,并且對價值觀有強烈的感受,而不是這些細顆粒的進展情況衡量。
EFF的Eckersley認為,隨著時間轉(zhuǎn)移AI跟蹤項目會變得更加有用。比方說,可以跟蹤軟件程序?qū)μ囟üと撕诵娜蝿者M行自動化的進展情況,有了這些數(shù)據(jù)的支撐,有關(guān)失業(yè)的爭論會更加有依據(jù)。Eckersley說,對該領(lǐng)域進展情況進行衡量讓他確信提高AI系統(tǒng)可信賴度的重要性。他說:AI系統(tǒng)的安全性是一個重大也許甚至是緊迫的研究領(lǐng)域,這個看法得到了我們收集的數(shù)據(jù)的支持。
學術(shù)界以及Google等公司的研究人員最近已經(jīng)在研究如何給AI軟件設(shè)置機關(guān)來防止發(fā)生不當行為。隨著各家公司爭先恐后讓軟件來控制汽車等更常見技術(shù),衡量如何讓AI保持安全可靠的進展情況可能是最重要的。