人工智能的興起讓機器學習成為了時下最為火熱的領域之一,圍棋人機大戰(zhàn)為更多人普及了智能的認識。大多數(shù)機器學習都是基于大規(guī)模網(wǎng)絡支持背景下對于算法和信息的深度優(yōu)化?,F(xiàn)有人工智能機器學習的特點是高功耗支持下高速運算,但對于嵌入式系統(tǒng)方面的應用而言,鑒于能耗以及網(wǎng)絡條件的不確定等因素的限制,機器學習的實現(xiàn)則需要跨越重重阻隔。2017年3月13日FPGA領域的領導企業(yè)賽靈思推出了強大工具reVISION——嵌入式視覺堆棧,實現(xiàn)視覺導向的機器學習應用讓開發(fā)人員的生產(chǎn)力再次得到解放。
為什么一定要是視覺?
賽靈思之所以選擇視覺作為機器學習應用,是因為在當今攝像頭的廣泛應用,讓視頻文件數(shù)量形成了爆炸式增長,機器完全可以通過視覺引導識別視頻中的每一幀的內(nèi)容并且進行學習和記錄,如無人機,自動駕駛,和工業(yè)機器人等嵌入式等應用也是完全基于視覺引導,攝像頭的使用相當于給機器裝上了眼睛,據(jù)統(tǒng)計差不多80%最初的機器學習的應用都是以視覺系統(tǒng)為基礎,而其余有20%的應用是關于控制系統(tǒng)和安全性應用。
實現(xiàn)端到云的部署
對于云端數(shù)據(jù)應用,賽靈思已經(jīng)推出了可重配置加速堆棧,它可以滿足目前云端數(shù)據(jù)分析處理的需要,而對于邊緣端的應用賽靈思今天又推出了reVISION作為更全面的補充。
紅色的部分關于與工業(yè)領域的相關的應用,從左到右展示了從用戶端到云端的各種場景的應用,虛線中的應用為賽靈思器件已經(jīng)服務的領域,但無需棧輔助的應用。
技術核心——融合
賽靈思發(fā)布reVISION,最大特點就是融合。賽靈思戰(zhàn)略與市場營銷高級副總裁Steve Glaser在宣講reVISION的最大特點的時候強調(diào)了它的融合能力,將視覺,機器學習,多種傳感器融合以及鏈接控制,四大關鍵點打通,形成獨一無二的開發(fā)環(huán)境。
reVISION 堆棧把機器視覺,機器學習,傳感器融合,以及鏈接,四者在賽靈思開發(fā)板上實現(xiàn)融合。
傳感器在應用中出現(xiàn)的融合趨勢,也是為什么可重配置能力的系統(tǒng)能夠勝出的原因,現(xiàn)在的應用已經(jīng)不再是僅僅對環(huán)境或者化學機械方面的偵測,融合的趨勢讓機器學習的能力得到了進一步的擴展,僅在成像方面就出現(xiàn)了多種傳感的融合。這又不得不提到ADAS,在這方面賽靈思reVISION對比mobileye 不僅能夠提供視覺傳感方面的處理,而且還能實現(xiàn)機器學習。
僅在成像方面,就出現(xiàn)了多種傳感的融合
更高執(zhí)行,更低時延
與CPU,GPU和傳統(tǒng)SOC相比,但是在效率和運行速度上都無法與reVISION想比尤其在低時延方面賽靈思的優(yōu)勢非常明顯。以Nvidia的tegra 為例,基于谷歌網(wǎng)絡(Googlenet)條件下運行,賽靈思reVISION與英偉達Tegra對比測試差別高達6倍的推理速度,42倍的幀率速度,并且小于1/5毫秒的時延。案例方面以自動駕駛為例,汽車在突然緊急制動時速是65英里,賽靈思的reVISION響應時間是2.5毫秒,Nvidia的解決方案的響應時間可以從49毫秒一直到320毫秒,取決于工程師是如何來部署tegra系統(tǒng),這種響應時間的差異也體現(xiàn)在實際停車距離上,這個距離差是5英尺到33英尺不等,這期間的區(qū)別很有可能最后轉(zhuǎn)化成結(jié)果,就是是否發(fā)生了撞車甚至撞到了行人。同時,低時延在工業(yè)方面也會涉及到生產(chǎn)安全的,醫(yī)療領域的遠程診斷以及手術實施亦是離不開低時延的支持。
那為什么賽靈思能夠?qū)崿F(xiàn)這樣快速的響應速度呢?典型的嵌入式的GPU和典型的SoC,傳感器的數(shù)據(jù)需要外部存儲,在處理的步驟當中,也需要不斷的去訪問外部存儲。但是如果是賽靈思的Zynq器件的話,就能夠非常簡化獲得非常直接的數(shù)據(jù)流,直接的經(jīng)過傳感器,傳感器的處理,機器學習,一直到控制。這就會對響應的時間造成很大的影響,除此以外,還會影響到可預見性,也就是用戶所說的決定性,用戶希望整個過程是可以預見的,可以確定的,并且響應速度要很快。所以賽靈思能夠提供非??焖俚臎Q定性的響應,同類競爭產(chǎn)品的響應速度則要慢很多,而且大多是不可預見的。
降低開發(fā)門檻
賽靈思作為硬件芯片公司,也將各種庫和算法進行了開發(fā)并集成到了reVIISION當中,簡化了工程師80%的工作。在revision的開發(fā)環(huán)境里可以降低硬件知識門檻,讓工程師能夠快速上手。通過reVISION,能夠使得用戶在他們比較熟悉、比較喜歡的環(huán)境下來進行開發(fā),說到的框架就是Caffe,還有習慣使用的庫,還有其他的機器學習的一些元素,它可以大大簡化開發(fā)過程,但是有些情況用戶還是需要開發(fā)過程中開發(fā)自己庫的功能,比如說計算機視覺方面來支持他的庫,有些環(huán)節(jié)現(xiàn)在還缺失。另外,用戶也需要一些小的知識來修改一些以C語言為基礎的庫來做計算機視覺,來實現(xiàn)對Zynq器件的編譯。此外利用賽靈思器件的INT8優(yōu)化也可以針對嵌入式視覺進行深度學習方面的優(yōu)化開發(fā),對比其他FPGA DSP 而言可以獲得1.75倍的解決方案性能。
工業(yè)領域的應用場景
對于工業(yè)領域方面的視覺引導類應用開發(fā),就不得不提到機器視覺以及柔性協(xié)作機器人。人機協(xié)作隨工業(yè)4.0的興起被逐漸得到重視,但還是未得到大規(guī)模普及,對于低時延的要求成為考量安全標準的重要因素,賽靈思reVISION顯然不怕來自于時延方面的考量,而在實現(xiàn)制造產(chǎn)線的靈活性的制造方面,視覺引導的機器學習將發(fā)揮巨大作用,按需制造的柔性生產(chǎn)的多品類混流制造也是機器視覺和機器學習融合的開發(fā)方向,其他領域的工業(yè)應用如造價高達幾百萬的電力巡檢機器人,高危地區(qū)的檢測等等也都是基于視覺引導類的學習類應用,相信reVISION也會更多的在工業(yè)檢測類應用項目中出現(xiàn),為智能制造的創(chuàng)新開拓新路。