深度|從基礎(chǔ)設(shè)施到API:亞馬遜AWS的人工智能拼圖
無論是人工智能技術(shù)的開發(fā)者還是應(yīng)用者,當(dāng)你按照自己需求構(gòu)建架構(gòu)時(shí),都可以自然地從AWS的產(chǎn)品列表里找到適合的服務(wù),像拼圖一樣完成你的人工智能產(chǎn)品。
作為亞馬遜旗下的云計(jì)算服務(wù)平臺(tái),AWS如今已邁入第11個(gè)年頭,KUKA機(jī)器人維修,成為年化收入140億美元,卻仍然保有43%年增長(zhǎng)的龐然大物。
在亞馬遜AWS全球副總裁、大中華區(qū)執(zhí)行董事容永康看來,AWS取得今天的成績(jī)是一個(gè)水到渠成的過程。當(dāng)其他企業(yè)還在討論亞馬遜提出的新概念的可行性時(shí),公司就已積累了大量?jī)?nèi)部測(cè)試經(jīng)驗(yàn),當(dāng)一項(xiàng)技術(shù)達(dá)到一定的成熟度,AWS則順理成章地將相關(guān)資源開放給客戶。
從一個(gè)眾人眼中的公有云平臺(tái),到被公認(rèn)為企業(yè)轉(zhuǎn)型與創(chuàng)新所需的技術(shù)平臺(tái),亞馬遜的技術(shù)儲(chǔ)備,就是AWS提供云服務(wù)的底氣。與谷歌、微軟以軟件即服務(wù)(SaaS)起家,逐漸下移到平臺(tái)即服務(wù)(PaaS)和基礎(chǔ)設(shè)施即服務(wù)(IaaS)的路線不同,亞馬遜一開始就提供基礎(chǔ)設(shè)施,在此基礎(chǔ)上,為滿足不同開發(fā)者的需求,進(jìn)一步提供平臺(tái)與軟件。如今,AWS提供超過90個(gè)大類的服務(wù),擁有數(shù)百萬月活躍用戶,涵蓋了不同的企業(yè)類型與企業(yè)規(guī)模。
7月27日,2017AWS技術(shù)峰會(huì)北京站在國(guó)家會(huì)議中心舉行,會(huì)上,容永康與亞馬遜首席技術(shù)執(zhí)行官WernerVogels對(duì)AWS的業(yè)務(wù)進(jìn)行了梳理,眾多AWS的客戶和合作伙伴也分享了他們使用AWS云服務(wù)的經(jīng)驗(yàn)。人工智能作為一個(gè)對(duì)云計(jì)算有巨大需求的領(lǐng)域,作為AWS眼中未來十年的大趨勢(shì)之一和近期投入大量資源的方向,也引發(fā)了廣泛的關(guān)注和討論。AWS為人工智能領(lǐng)域提供了哪些產(chǎn)品?其優(yōu)勢(shì)體現(xiàn)在哪些方面?機(jī)器之能在采訪了相關(guān)負(fù)責(zé)人及行業(yè)用戶之后結(jié)合演講內(nèi)容進(jìn)行了以下梳理。
應(yīng)用云計(jì)算的人工智能相關(guān)公司可以從「開發(fā)者」和「應(yīng)用者」的角度簡(jiǎn)單分為兩類。開發(fā)者以人工智能模型本身作為產(chǎn)品,以算法為核心建立新的行業(yè)秩序、劃定新的分配原則,創(chuàng)造或顛覆一種商業(yè)模式。他們對(duì)云的需求是數(shù)據(jù)存儲(chǔ)、計(jì)算能力基礎(chǔ)設(shè)施以及機(jī)器學(xué)習(xí)框架平臺(tái)。此類業(yè)務(wù)中最典型的莫過于自動(dòng)駕駛。
應(yīng)用者則利用人工智能的技術(shù)加強(qiáng)自己原有的產(chǎn)品與服務(wù),這類企業(yè)的工程師未必有人工智能核心算法的開發(fā)能力,因此以SaaS的形式提供通用的,可以進(jìn)行有針對(duì)性微調(diào)的人工智能接口更符合他們的需求。這類公司可以通過調(diào)用相應(yīng)API與自身的產(chǎn)品或服務(wù)配合。智能家居、智能農(nóng)業(yè)公司都是常見的應(yīng)用者。
AWS為兩種類型的公司都提供了豐富的產(chǎn)品線。
致力于自動(dòng)駕駛領(lǐng)域的圖森未來是開發(fā)者中的AWS「重度用戶」,其COO郝佳男在媒體溝通會(huì)上提供了近十種圖森未來使用AWS的典型場(chǎng)景。他表示,AWS吸引他的地方在于,當(dāng)他按照需求構(gòu)建架構(gòu)時(shí),可以像拼圖一樣從AWS的產(chǎn)品列表中找到合適的產(chǎn)品。
Vogel也在演講中表示,規(guī)模龐大、來源復(fù)雜的數(shù)據(jù)是人工智能領(lǐng)域面對(duì)的首要挑戰(zhàn),首先要對(duì)數(shù)據(jù)進(jìn)行管理和處理,然后是使用GPU進(jìn)行訓(xùn)練,最后在邊緣設(shè)備上運(yùn)行模型做出預(yù)測(cè)。
對(duì)于圖森來說,車就是「邊緣設(shè)備」,而為了讓車運(yùn)行,主要的工作其實(shí)都在車外的云端完成。研發(fā)車背后的系統(tǒng)需要大規(guī)模的基礎(chǔ)架構(gòu)平臺(tái)支持,這就是圖森未來與AWS結(jié)合之處。
首先是數(shù)據(jù),郝佳男介紹,需要解決的問題涉及數(shù)據(jù)的上傳、存儲(chǔ)、標(biāo)注、抓取等多方面。用于數(shù)據(jù)收集的車輛上搭載大量傳感器,每輛車每小時(shí)產(chǎn)生的原始數(shù)據(jù)就有TB級(jí)別。如何讓不同來源的數(shù)據(jù)從車上流暢地流向云端并不是一件容易的事情。而數(shù)據(jù)上傳之后,還需要上千人對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,之后才能訓(xùn)練監(jiān)督學(xué)習(xí)類型的人工智能算法。標(biāo)注完成,在使用數(shù)據(jù)時(shí),并非每次都抓取所有的數(shù)據(jù),比如訓(xùn)練雨天的算法,就需要對(duì)雨天的數(shù)據(jù)進(jìn)行查詢和操作。
為了解決這些復(fù)雜的問題,圖森未來使用了多種AWS產(chǎn)品,將數(shù)據(jù)從本地傳到云端,穩(wěn)定的鏈路需要DirectConnet,傳輸大量數(shù)據(jù)需要Snowball。數(shù)據(jù)和大部分產(chǎn)品在S3上,數(shù)據(jù)到達(dá)S3就會(huì)觸發(fā)Lambda做預(yù)處理,Glacier提供數(shù)據(jù)備份,RDS提供元數(shù)據(jù)檢索。
在架構(gòu)和算法層面,庫(kù)卡機(jī)器人驅(qū)動(dòng)器維修,以可擴(kuò)展性聞名的MXNet是AWS的官方深度學(xué)習(xí)平臺(tái),使用者可以通過MXNet的AMI快速構(gòu)建MXNet環(huán)境。一個(gè)典型的訓(xùn)練,可能需要8個(gè)GPU花費(fèi)數(shù)小時(shí)才能完成,EC2提供的彈性計(jì)算資源則從基礎(chǔ)架構(gòu)層面解決了資源調(diào)度的問題。
作為一家自動(dòng)駕駛公司,庫(kù)卡機(jī)器人驅(qū)動(dòng)器維修,郝佳男認(rèn)為,他們應(yīng)該把更多精力和成本投入在自動(dòng)駕駛上,AWS則以低運(yùn)營(yíng)成本、高可用性,滿足了人工智能開發(fā)者在研發(fā)過程中對(duì)基礎(chǔ)架構(gòu)的需求,使他們的研發(fā)得以順利進(jìn)行,減少車輛在路測(cè)時(shí)的問題。
Vogel展示了一張?jiān)贏WS上運(yùn)行的人工智能企業(yè)的列表,包括用機(jī)器學(xué)習(xí)算法評(píng)估房地產(chǎn)價(jià)值的Zillow、依靠推薦系統(tǒng)起家的視頻流網(wǎng)站Netflix以及GPU發(fā)明者英偉達(dá)等。Vogel表示,服務(wù)這些人工智能最前沿公司的底氣來源于亞馬遜自己的機(jī)器學(xué)習(xí)經(jīng)驗(yàn),因?yàn)閬嗰R遜電商網(wǎng)站的庫(kù)存管理、搜索排序、對(duì)評(píng)論的整理、對(duì)新產(chǎn)品的預(yù)測(cè)都使用了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。
除了讓人工智能開發(fā)者的注意力集中在自身算法的開發(fā)之外,AWS提供了三種可以立刻應(yīng)用的人工智能服務(wù):對(duì)話服務(wù)Lex、語音服務(wù)Polly以及視覺服務(wù)Rekognition,使人工智能應(yīng)用者節(jié)省了模型搭建的時(shí)間,從而將注意力集中在服務(wù)本身。
Lex來源于亞馬遜語音服務(wù)Alexa背后的技術(shù),使用自動(dòng)語音識(shí)別(ASR)技術(shù)將語音轉(zhuǎn)為文本,然后用自然語言理解(NLU)技術(shù)理解文本的意圖,能讓開發(fā)者將對(duì)話接口用于任何使用語音或文本的應(yīng)用中。作為L(zhǎng)ex的客戶之一,NASA用Lex復(fù)制了一個(gè)火星探測(cè)車Rov-E,使學(xué)生通過對(duì)話的形式學(xué)習(xí)火星相關(guān)知識(shí)。iRobot則開發(fā)了能用語音控制的掃地機(jī)器人。
語音服務(wù)Polly利用深度學(xué)習(xí)技術(shù)將文本轉(zhuǎn)換成類似人聲的語音。華盛頓郵報(bào)作為Polly的客戶,正在利用這一功能開發(fā)語音版報(bào)刊。
視覺服務(wù)Rekognition則幫助人們識(shí)別圖形,提取其中的信息。比如判斷圖片中是否有人,通過面部檢測(cè)、判斷這個(gè)人是否佩戴眼鏡、有什么樣的表情,也可以找出做不同表情的同一個(gè)人。美國(guó)的有線電視網(wǎng)絡(luò)C-SPAN在Rekognition發(fā)布兩周之后,就通過對(duì)近十萬條數(shù)據(jù)的學(xué)習(xí)建立了一個(gè)精確到秒的甄別器,用于快速識(shí)別視頻內(nèi)發(fā)表演說的政治家。
通過向應(yīng)用者提供人工智能服務(wù),AWS提供了一個(gè)大公司將深度學(xué)習(xí)技術(shù)民主化的良好范例:所有開發(fā)者都能運(yùn)用亞馬遜級(jí)別的技術(shù)創(chuàng)建自己的應(yīng)用,這些應(yīng)用可以服務(wù)于任何有需要的群體。而這些用戶和合作伙伴又進(jìn)一步構(gòu)成了一個(gè)活躍的生態(tài)系統(tǒng),正如AWS首席云計(jì)算企業(yè)顧問張俠所言,「當(dāng)你有特定需求的時(shí)候,在我們的生態(tài)系統(tǒng)里能找到一批可以直接借鑒的成功案例。」