英特爾無人駕駛的跬步千里基于OpenCL*的DLA:低功耗支撐無人駕駛強計算
從前人們認為無人駕駛、機器駕駛員解放人類駕駛員這樣的概念還遙不可及,然而英特爾正在讓這樣的構想落地。為了驅動車輪上的數據中心,英特爾當前在無人駕駛領域的發力用不積跬步無以至千里來形容再合適不過,而其中的的六大技術即是跬步,也是助力無人駕駛車輛致千里的關鍵所在。
你知道嗎?未來,一輛無人駕駛汽車在90分鐘之內就會產生4TB的數據量,這些數據可以幫助汽車了解其所在環境,讓車輛可以安全的行駛在道路上。如果沒有車內人工智能利用機器視覺和深度學習實時對數據加以分析,無人駕駛汽車就很難輕松上路。但這類人工智能負載通常需要消耗非常多的電力,并且難以在車內有限的功率下運行。因此,如果能用更低功耗來支撐更強大的計算,就會更有效地利用人工智能幫助汽車做決策。英特爾研發基于OpenCL*的DLA(DeepLearningAccelerator)就可以有效解決這一難題,為功耗減負、為計算加碼。
能效乘法:對CPU和FPGA進行優化分區
人工智能是一個混合算法,它不僅僅是計算機視覺,機器人維修,從自然語言處理到決策都對計算有著不同的需求,因此,只有有的放矢才能讓功耗最大化。當前英特爾在利用CPU做預測和順序執行方面很有優勢,但同時,車內人工智能算法中有大量的并行執行。隨著英特爾收購Altera,FPGA在并行執行上的優異表現讓這一問題得以解決。英特爾在無人駕駛領域采用了混合架構,其中包括CPU、FPGA以及未來Mobileye專用的視覺芯片與視覺計算等方式,充分發揮每個芯片的特點來保證計算效果,從而在開放混合的平臺上保證人工智能在無人駕駛上的實現,KUKA機器人電路板維修,同時保證了性能、功耗已經工程化的統一。
通過優化分區CPU和FPGA,英特爾能夠使能效提高6倍,利用非常低的功耗僅23fps/瓦就能實時執行復雜的人工智能算法。
40瓦vs.250瓦:FPGA相對于GPU的能效優勢
汽車利用多攝像頭中的深度學習來執行實時對象檢測和分類
無人駕駛汽車需要時刻眼觀六路,多攝像頭神經網絡就會利用復雜的深度學習算法來對物體進行檢測和分類:哪些是行人?哪個是箱子?這些功耗都將被控制在40瓦以下,而通過對比,GPU完成這一系列動作則需要250瓦的功耗。因此,KUKA機器人維修,利用運行在WindRiverLinux*上的英特爾?Arria?10FPGA和英特爾?至強?CPU,展示了英特爾技術明顯的功耗優勢。
如果想早日體驗高度無人駕駛帶來的高效與便利,就不能忽視量產過程中的能耗問題。因此,英特爾讓混合架構中的每一部分發揮各自所長,這既是技術積累,又是能耗減負,有了這一關鍵技術,英特爾就能助力無人駕駛車輛輕裝上陣。