【
儀表網 行業科普】通過AI和嵌入式視覺,下一代數字
圖像處理技術能夠提高機器
視覺系統的效率,使設備能夠適應不受控制的現實世界條件,并將持續學習帶到現場的機器中。
數字圖像處理極大地改變了我們用二維視角觀察我們的世界和外面世界的能力。數字圖像處理最初需要大量的計算能力來處理低分辨率圖像,但在20世紀60年代,數字圖像處理的新發展為我們提供了第一張月球圖像,改變了我們對地球天然衛星的看法。
后來,傳統數字圖像處理技術的進步又為我們帶來了從醫療可視化技術到工廠車間機器視覺系統等我們賴以生存的技術。盡管傳統數字圖像處理技術帶來了許多創新,但可提升的空間有限。相反,人工智能(AI)和更復雜的嵌入式視覺技術的應用正在將數字系統圖像處理推向了一個全新的水平。
與傳統圖像處理相比,基于AI的圖像處理有哪些優勢,如果不是AI專家,您該如何使用它?AI和嵌入式視覺在當前和未來都有哪些用途?本文將更深入地探討這些問題。
01 AI與傳統圖像處理的對比
如果所有圖像處理都是在受控環境中進行的,例如具有均勻照明、形狀和顏色的室內空間,那么我們幾乎不需要AI。但實際情況很少是這樣,因為大多數圖像處理都是在現實世界中進行的——在不受控制的環境中,如街景或工業環境中,不同形狀和顏色的物體是常態,而不是例外。
AI可以容忍環境光線、視角、雨水、灰塵、遮擋和其他環境因素的顯著變化,例如,如果您要在24小時內捕捉街道上行駛的汽車,那么光線和圖像捕捉角度就會不斷變化。
再舉一個例子,假設你是一個大型西紅柿種植者,你需要將西紅柿包裝成三包,以便分發到雜貨店倉庫。西紅柿的形狀和顏色必須均勻,以滿足倉庫客戶的質量控制標準。只有基于AI的成像系統才能支持形狀和顏色的高度變化,僅識別那些形狀和顏色符合成熟度要求的西紅柿。這聽起來不錯,但如果您既不是AI專家,也不是圖像處理方面的專家,您如何實現這一目標?
02 基于AI的圖像處理技術
自從支持AI的圖形用戶界面(GUI)工具可用于在2D圖像上訓練神經網絡以來,已經有幾年了。在取得這一巨大成就之前,訓練用于機器視覺和檢測或智能交通平臺的神經網絡需要在機器學習和數據科學方面擁有廣泛的專業知識,這對任何公司來說都是一項昂貴且耗時的投資。幸運的是,隨著時代的變化,AI工具也隨之發生了變化。那么,AI圖形用戶界面工具應具備哪些功能?
· 靈活性:找到一個GUI工具,讓您能夠導入自己的圖像樣本并訓練神經網絡來執行分類、對象檢測、分割和降噪,從而獲得更大的靈活性和定制性帶來的好處。
· 本地化:使用一種工具,讓您無需連接到云,就可以在自己的 PC 上對訓練數據進行建模,從而為您提供許多行業現在所需的更高級別的數據隱私。
· 導出以進行推理:選擇一款允許您將模型文件導出到推理工具的工具,以便您可以在實時視頻流上執行。
· 直觀:使用數值指標和熱圖可視化模型性能。
· 利用預訓練模型:使用軟件包附帶的預訓練模型來減少訓練工作量。
讓我們看一個例子。您需要找到并識別特定的硬件零件、螺母、螺釘、釘子和墊圈,但這些零件擠在帶有大量彩色標簽的反光表面上(圖1)。使用傳統的圖像處理實現所需的高魯棒性將非常耗時,但AI工具可以提供一種對象檢測算法,該算法只需使用幾十個樣本即可輕松訓練。這種類型的軟件工具將使您能夠更快、更輕松地構建強大而準確的定位和檢測系統,從而減少人工開發時間及其相關成本。
▲圖1:使用傳統的圖像處理實現所需的高魯棒性將非常耗時,
但AI工具可以提供一種對象檢測算法,從而提高效率并減少相關成本。
智能交通系統(ITS)也與AI圖像處理系統完美匹配。從收費管理和交通安全監控到超速和闖紅燈執法,AI軟件可用于高精度地定位、分割和識別車輛和其他移動和靜止物體。
03 AI軟件工具的開發過程
AI軟件工具到手后,開發過程通常有幾個主要步驟。
首先,您需要創建數據,然后編輯和修改數據集。您需要獲取訓練圖像,并提供與這些圖像相對應的注釋。一般來說,您會從遠程位置的文件夾導入這些圖像,或者從網絡或PC上的文件夾獲取這些圖像。在此過程中,請記住模型的質量取決于模型中數據集的質量。您還需要選擇一個具有足夠功率的圖形處理器 (GPU),以管理圖像處理。
接下來,您將通過訓練引擎傳遞數據以創建模型。您需要使用結果進行模型測試。這包括使用混淆矩陣來顯示假陽性和假陰性,以及可視化熱圖來顯示神經網絡的激活情況。模型經過訓練和測試后,就可以導出為模型文件,用于圖像處理應用程序。
04 即插即用的嵌入式視覺功能
作為一個話題,嵌入式視覺彌合了許多不同的解釋。有多種不同的方案可供選擇,包括帶有內置 AI 的嵌入式視覺平臺,每個用戶在做出決定之前都應該權衡各種選項(包括成本)。
嵌入式視覺可能包括帶有嵌入式處理器或現場可編程門陣列(FPGA)的攝像頭、可編程視覺傳感器或智能攝像頭,或具有靈活嵌入式應用的通用機器。無論采用何種方式部署,嵌入式視覺應用都以其體積小、重量輕、功耗低等優點而著稱。
▲圖2:AI工具開發過程的主要步驟。
嵌入式視覺應用還可以減少從相機到主機PC的數據量,從而減少通過管道的數據量。此外,它還具有其他優勢,包括降低成本(因為嵌入式視覺應用不需要PC上昂貴的 GPU 卡),以及可預測的性能、離線操作(不需要網絡連接)和易于設置。如果您正在尋找一款易于設置和部署到現場的一體化產品,嵌入式視覺可以提供實實在在的好處。嵌入式視覺非常適合工業應用,例如在防錯和識別過程中使用。
在防錯過程中的應用
· 模式匹配,檢查存在、位置;
· 特征或部件存在/缺失/計數;
· 特征或零件測量;
· 通過顏色進行零件或裝配驗證。
在識別過程中的應用
· 產品驗證:讀取產品代碼以避免標簽混淆;
· 標記驗證:驗證產品類型、批次、日期代碼;
· 質量驗證:檢查標記、標簽位置、特征存在/缺失;
· 裝配驗證:在制造的每個階段跟蹤裝配歷史記錄;
· 物流:確保收貨、揀選、分揀和運輸的正常流程。
05 集成AI和嵌入式視覺
無論是單獨使用還是一起使用,AI和嵌入式視覺都標志著數字圖像處理的進化飛躍。例如,一款執行紅燈和限速的交通應用軟件使用嵌入式視覺系統以最有效的方式捕獲圖像。然后,它使用AI來幫助設備在不同的天氣和照明條件下可靠地運行。是下雨還是下雪?光線是亮的還是暗的?AI的實現使設備能夠適應不受控制的現實世界條件。
通過AI和嵌入式視覺,下一代數字圖像處理技術可以確定汽車是否有足夠的乘客進入拼車車道,駕駛員是否在車內使用手機,或者駕駛員和乘客是否系安全帶。這種智能水平可以使駕駛員考慮得更周到,并且可以更安全地駕駛汽車。
▲圖3:嵌入式視覺非常適合工業應用,例如在防錯和識別過程中使用。
雖然傳感、處理和軟件技術以及智能相機的進步,是我們在AI圖像處理和嵌入式視覺系統方面取得進展的主要原因,但我們也不能忽視邊緣AI的崛起。邊緣AI降低了成本和帶寬,因為大量數據不會持續發送到云端進行處理,同時還降低了延遲,從而提高了隱私性并提升了應用性能。
而這僅僅是利用這些較新的圖像處理技術所能實現的目標的開始。一旦我們能夠將“持續學習”帶到現場的機器中,我們就會擁有在運行時自動學習的設備。通過使現有模型適應上下文變化,持續學習使開發團隊無需在實驗室中執行強制性的完整模型重新訓練,從而節省了無數的人力時間。
這種方法的一個很好的例子是使用無人機在多個高度飛行進行交通監控。我們可以使用在單一高度(如 10 米)收集的圖像來訓練初始模型。一旦部署到現場,持續學習算法就會啟動,當無人機在其他高度飛行時自動“調整 ”模型。
如果沒有持續學習算法,無人機每達到一個高度,我們就必須重新訓練模型,以獲得準確的性能。但有了持續學習,模型就能對尺寸、距離以及飛行器視角的變化做出反應。圖像處理技術中的這種即時學習方式極大地改進了應用性能。
所有評論僅代表網友意見,與本站立場無關。