【導(dǎo)讀】在人們從自然界獲取的各種信息中,視覺(jué)獲取量最高,約占總信息量的80%。隨著信息技術(shù)的發(fā)展,人類(lèi)的視覺(jué)功能逐步被賦予計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器。目前正處在行業(yè)風(fēng)口的機(jī)器視覺(jué)就是這樣一種技術(shù),它通過(guò)圖像處理實(shí)現(xiàn)自動(dòng)檢測(cè)和分析應(yīng)用,包括自動(dòng)檢測(cè)、過(guò)程控制和機(jī)器人導(dǎo)航等。目前,機(jī)器視覺(jué)(MV)技術(shù)已經(jīng)實(shí)現(xiàn)產(chǎn)品化。視覺(jué)傳感器、鏡頭、高速相機(jī)、光源、視覺(jué)軟件、圖像采集卡、視覺(jué)處理器等都變得越來(lái)越完善。在工業(yè)自動(dòng)化環(huán)境中,機(jī)器視覺(jué)越來(lái)越受到行業(yè)的關(guān)注,并被大量用于諸如自動(dòng)駕駛汽車(chē)、食品生產(chǎn)、包裝和物流、機(jī)器人和無(wú)人機(jī)等。
機(jī)器視覺(jué)
在人們從自然界獲取的各種信息中,視覺(jué)獲取量最高,約占總信息量的80%。隨著信息技術(shù)的發(fā)展,人類(lèi)的視覺(jué)功能逐步被賦予計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器。目前正處在行業(yè)風(fēng)口的機(jī)器視覺(jué)就是這樣一種技術(shù),它通過(guò)圖像處理實(shí)現(xiàn)自動(dòng)檢測(cè)和分析應(yīng)用,包括自動(dòng)檢測(cè)、過(guò)程控制和機(jī)器人導(dǎo)航等。目前,機(jī)器視覺(jué)(MV)技術(shù)已經(jīng)實(shí)現(xiàn)產(chǎn)品化。視覺(jué)傳感器、鏡頭、高速相機(jī)、光源、視覺(jué)軟件、圖像采集卡、視覺(jué)處理器等都變得越來(lái)越完善。在工業(yè)自動(dòng)化環(huán)境中,機(jī)器視覺(jué)越來(lái)越受到行業(yè)的關(guān)注,并被大量用于諸如自動(dòng)駕駛汽車(chē)、食品生產(chǎn)、包裝和物流、機(jī)器人和無(wú)人機(jī)等。
當(dāng)提到機(jī)器視覺(jué)時(shí),技術(shù)人員可能會(huì)很多理解,本文嘗試著從四個(gè)方面逐一解釋有關(guān)機(jī)器視覺(jué)應(yīng)了解的真相。
真相一:機(jī)器視覺(jué)≠計(jì)算機(jī)視覺(jué)
機(jī)器視覺(jué)是一種通過(guò)光學(xué)設(shè)備和非接觸傳感器自動(dòng)接收和處理真實(shí)物體圖像的設(shè)備,以獲取所需信息或控制機(jī)器人的運(yùn)動(dòng)。自20世紀(jì)50年代開(kāi)始運(yùn)行,從1980年到1990年,這項(xiàng)技術(shù)真正開(kāi)始起飛并逐漸普及。經(jīng)過(guò)數(shù)十年的發(fā)展,機(jī)器視覺(jué)已經(jīng)為它是什么以及它是如何工作的積累了各種定義。
自動(dòng)化成像協(xié)會(huì)(AIA)給出了一個(gè)更具廣義意味的定義,即:機(jī)器視覺(jué)包括所有工業(yè)和非工業(yè)應(yīng)用,其中硬件和軟件的組合為設(shè)備執(zhí)行基于圖像捕獲和處理的功能提供操作指導(dǎo)。而SearchEnterpriseAI則給出了機(jī)器視覺(jué)的狹義定義,將其稱(chēng)之為“計(jì)算機(jī)的視覺(jué)能力”,該系統(tǒng)使用一個(gè)或多個(gè)攝像機(jī)、模數(shù)轉(zhuǎn)換(ADC)和數(shù)字信號(hào)處理(DSP),將產(chǎn)生的數(shù)據(jù)傳輸?shù)接?jì)算機(jī)或機(jī)器人控制器。
在實(shí)際應(yīng)用中,機(jī)器視覺(jué)通常需要與其他先進(jìn)的技術(shù)協(xié)同工作,包括自然語(yǔ)言處理、機(jī)器人過(guò)程自動(dòng)化(RPA)、人工智能(AI)和機(jī)器學(xué)習(xí)(ML)等,以實(shí)現(xiàn)自動(dòng)化所需的“視覺(jué)”功能。你可以把機(jī)器視覺(jué)看作是自動(dòng)化的眼睛,AI和ML是大腦,RPA提供了完成工作所需的“鍵盤(pán)手”。近年來(lái),自動(dòng)化的采用速度不斷加快,這對(duì)企業(yè)保持行業(yè)競(jìng)爭(zhēng)力至關(guān)重要。如果把自動(dòng)化想象成“數(shù)字化員工”在工作,假如不增加機(jī)器視覺(jué),那么所有這些“數(shù)字化員工”都會(huì)處于失明狀態(tài)。
計(jì)算機(jī)視覺(jué)也是近年來(lái)的行業(yè)大熱門(mén),那么它與機(jī)器視覺(jué)又有什么關(guān)聯(lián)呢?宏觀來(lái)講,機(jī)器視覺(jué)是一種以新的方式與現(xiàn)有技術(shù)集成并應(yīng)用于解決現(xiàn)實(shí)世界問(wèn)題的技術(shù)能力,是一門(mén)系統(tǒng)工程學(xué)科。而計(jì)算機(jī)視覺(jué)是計(jì)算機(jī)科學(xué)的一種形式,不是通過(guò)固定在機(jī)器人上的視覺(jué)設(shè)備如攝像頭等有形硬件來(lái)實(shí)現(xiàn)的。
更具體來(lái)說(shuō),機(jī)器視覺(jué)是一個(gè)系統(tǒng)的主體,而計(jì)算機(jī)視覺(jué)是系統(tǒng)的智能,是處理信息的大腦。沒(méi)有計(jì)算機(jī)視覺(jué),機(jī)器視覺(jué)將無(wú)法工作。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)是通過(guò)機(jī)器視覺(jué)系統(tǒng)以更快的速度處理項(xiàng)目的三種技術(shù)。這三種技術(shù)可用于擴(kuò)大機(jī)器視覺(jué)對(duì)要定位的內(nèi)容的理解,使其成為機(jī)器視覺(jué)的寶貴資產(chǎn)。隨著計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步,機(jī)器視覺(jué)潛在應(yīng)用的可能性也相應(yīng)增加。
值得注意的是,機(jī)器視覺(jué)與圖像處理同樣是兩個(gè)不同的概念,圖像處理是一個(gè)輸出圖像的過(guò)程,而機(jī)器視覺(jué)系統(tǒng)可以檢測(cè)和分類(lèi)廣泛行業(yè)中的各種物體和項(xiàng)目,包括汽車(chē)、電子和半導(dǎo)體、食品和飲料、道路和車(chē)輛交通或智能運(yùn)輸系統(tǒng)(ITS)、醫(yī)療成像、包裝、標(biāo)簽和印刷、制藥、電視廣播等,基于機(jī)器視覺(jué)的技術(shù)正在成為自動(dòng)化創(chuàng)建的核心。
真相二:
硬件和軟件的發(fā)展促成了機(jī)器視覺(jué)的進(jìn)步
機(jī)器視覺(jué)是工業(yè)自動(dòng)化的眼睛。其主要工作流程是:系統(tǒng)通過(guò)機(jī)器視覺(jué)產(chǎn)品(如攝像頭、CMOS或CCD)將拍攝的目標(biāo)轉(zhuǎn)換為圖像信號(hào),然后將圖像信號(hào)傳輸?shù)綄?zhuān)用圖像處理系統(tǒng)。根據(jù)像素分布、亮度和顏色等信息,再將圖像信號(hào)轉(zhuǎn)換為數(shù)字化信號(hào),最終使機(jī)器(機(jī)器人或其他工業(yè)工具)能夠完成制造和質(zhì)量驗(yàn)證等工業(yè)任務(wù)。
機(jī)器視覺(jué)是工業(yè)4.0的關(guān)鍵要素,它正以多種方式幫助工業(yè)自動(dòng)化系統(tǒng),例如通過(guò)改善庫(kù)存、檢測(cè)故障產(chǎn)品和提高制造質(zhì)量來(lái)提高效率。若要準(zhǔn)確地模擬人類(lèi)的感知,機(jī)器視覺(jué)需要一系列設(shè)備和軟件的幫助。而這些軟硬件技術(shù)的不斷發(fā)展進(jìn)一步推動(dòng)了機(jī)器視覺(jué)技術(shù)的演進(jìn)。
#01
智能攝像頭
攝像頭(camera)是機(jī)器視覺(jué)系統(tǒng)中檢查物體或物品的主要設(shè)備。有時(shí),一個(gè)特定的檢查點(diǎn)可能需要安裝多個(gè)攝像頭,以確??梢哉_檢查每一個(gè)細(xì)節(jié)。當(dāng)機(jī)器視覺(jué)系統(tǒng)需要從圖像中捕獲和提取特定應(yīng)用程序的信息時(shí),這時(shí)就需要智能攝像頭的支持。智能攝像頭通常包含所有必要的通信接口,并可連接到Wi-Fi或服務(wù)器,以便傳輸捕獲的圖像數(shù)據(jù)。作為一種強(qiáng)大工具,深度學(xué)習(xí)能使系統(tǒng)設(shè)計(jì)師快速實(shí)現(xiàn)復(fù)雜且主觀決策的自動(dòng)化,同時(shí)有效提高產(chǎn)品質(zhì)量和產(chǎn)能。由Teledyne Flir公司提供的FLIR Firefly DL攝像頭,內(nèi)建的深度學(xué)習(xí)推斷使得該產(chǎn)品不再需要任務(wù)分類(lèi)的主機(jī)系統(tǒng),大大降低了系統(tǒng)的成本和復(fù)雜性。Firefly DL攝像頭尺寸小巧、重量輕且功耗低,非常適合嵌入移動(dòng)、桌面和手持系統(tǒng)。
圖1:Teledyne公司FLIR Firefly DL攝像頭,具有尺寸小巧、功耗低等特點(diǎn)
(圖源:Teledyne)
Omron Industrial Automation公司的S133 UVC彩色CMOS攝像頭同樣是一款智能攝像頭產(chǎn)品,它內(nèi)置CMOS傳感器,采用超緊湊結(jié)構(gòu),即插即用,是尋找具有機(jī)器視覺(jué)功能攝像頭的理想選擇。由于使用方便,S133 UVC彩色CMOS攝像頭深受工業(yè)/機(jī)器視覺(jué)應(yīng)用、汽車(chē)、生命科學(xué)等領(lǐng)域的歡迎。
圖2:S133 UVC彩色CMOS攝像頭
(圖源:Omron)
#02
3D攝像頭
3D攝像頭可以在圖像中顯示被檢測(cè)物的深度,以顯示圖像的不同角度。通過(guò)在機(jī)器視覺(jué)系統(tǒng)中使用3D攝像頭,將帶來(lái)不同的視角和深度感知。飛行時(shí)間(ToF)攝像頭是使用飛行時(shí)間原理測(cè)量距離的3D攝像頭。ToF成像技術(shù)允許它在不掃描物體的情況下進(jìn)行3D成像,該技術(shù)通??筛采w幾米到約40米的距離,每秒最多100張圖像,距離分辨率約為5到10毫米,橫向分辨率約為200 x 200。
歷史上,因?qū)oF的準(zhǔn)確性存在一些質(zhì)疑,人們通常將其視為精度較低的3D傳感技術(shù)。當(dāng)然,近些年很多頭部企業(yè)已經(jīng)開(kāi)發(fā)出高達(dá)130萬(wàn)像素的高分辨率產(chǎn)品,用于機(jī)器視覺(jué)系統(tǒng)的高精度ToF攝像頭能顯著提高生產(chǎn)的靈活性和自動(dòng)化程度。索尼公司的IMX556 DepthSense ToF傳感器采用CAPD和背面照明(BSI)技術(shù),與市場(chǎng)上現(xiàn)有的ToF解決方案相比,能夠提供精確到毫米的精度,在6米工作距離下,以30fps的速度提供640 x 480的分辨率。
圖3:索尼IMX556 DepthSense ToF傳感器能夠更可靠地以3D格式,更詳細(xì)更快速的幀率重建被測(cè)物體
(圖源:Sony)
Texas Instruments的OPT8241飛行時(shí)間 (ToF) 傳感器,將ToF傳感與模數(shù)轉(zhuǎn)換器和可編程定時(shí)發(fā)生器(TG)相結(jié)合,該器件能以高達(dá)150幀/秒的幀速率提供320 x 240分辨率的圖像。內(nèi)置的TG可控制復(fù)位、調(diào)制和讀出數(shù)字化序列。同時(shí),TG具備可編程性,可靈活優(yōu)化各項(xiàng)深度感知性能指標(biāo),例如功率、運(yùn)動(dòng)穩(wěn)健性、信噪比和環(huán)境消除等。
圖4:TI公司OPT8241 ToF傳感器系統(tǒng)框圖
(圖源:TI)
#03
視覺(jué)傳感器
視覺(jué)傳感器是機(jī)器視覺(jué)系統(tǒng)的核心,是最大化環(huán)境特性的來(lái)源,其核心設(shè)備是CCD、CMOS等圖像傳感器。這些分辨率較高的視覺(jué)傳感器通常能夠生成包含更多像素的圖像,非常有助于提高圖像質(zhì)量,更容易識(shí)別視覺(jué)細(xì)節(jié)。
長(zhǎng)期以來(lái),CCD傳感器是捕獲高質(zhì)量、低噪聲圖像的主流技術(shù)。但是CCD傳感器的制造成本很高,因此價(jià)格普遍較高,功耗也要比CMOS傳感器高很多。如今,CMOS傳感器技術(shù)已經(jīng)發(fā)展到可以快速接近CCD技術(shù)的質(zhì)量和功能,并且價(jià)格更低,體積更小,功耗更低。CMOS相機(jī)的幀速率通常要高于CCD相機(jī),對(duì)于那些依賴(lài)實(shí)時(shí)圖像處理進(jìn)行自動(dòng)化或圖像數(shù)據(jù)分析的機(jī)器視覺(jué)系統(tǒng)而言,此功能至關(guān)重要。另外,CMOS傳感器比CCD傳感器對(duì)紅外波長(zhǎng)更敏感,CMOS芯片和相機(jī)制造商利用這一優(yōu)勢(shì)可捕獲紅外線,為圖像識(shí)別提供了額外的成像能力。兩相權(quán)衡,CMOS傳感器可能更加適合機(jī)器視覺(jué)應(yīng)用。
安森美(onsemi)AR0130是一款1/3英寸CMOS數(shù)字圖像傳感器,有源像素陣列為1280H x 960V,使用滾動(dòng)快門(mén)讀數(shù)捕獲圖像。該產(chǎn)品包括復(fù)雜的相機(jī)功能,如自動(dòng)曝光控制,窗口,以及視頻和單幀模式。AR0130能夠拍攝非常清晰的數(shù)字圖像,并且能夠捕獲連續(xù)視頻和單幀,尤其適合高性能機(jī)器視覺(jué)應(yīng)用。
#04
光源
作為一種輔助成像設(shè)備,光源對(duì)成像質(zhì)量往往起到至關(guān)重要的作用。以LED照明產(chǎn)品為例,它們具有更高的靈活性,具有可調(diào)角度和附加波長(zhǎng),更一致的光譜響應(yīng)。市場(chǎng)上有多種波長(zhǎng)和形狀的光源可供選擇,產(chǎn)品的選擇并不難。
#05
圖像采集卡
圖像采集卡通常以電腦插卡的形式存在,它的主要工作是將圖像輸出傳送到計(jì)算機(jī)主機(jī)。圖像采集卡需要將來(lái)自相機(jī)的模擬或數(shù)字信號(hào)轉(zhuǎn)換為特定格式的圖像數(shù)據(jù)流,還可以控制相機(jī)的一些參數(shù),例如觸發(fā)信號(hào)、曝光/積分時(shí)間、快門(mén)速度等。圖像采集卡通常針對(duì)不同類(lèi)型的相機(jī)具有不同的硬件結(jié)構(gòu),同時(shí)也具有不同的總線形式,如PCI、PCI64、Compact PCI、PC104、ISA等。
#06
視覺(jué)處理軟件
機(jī)器視覺(jué)軟件用于完成輸入圖像數(shù)據(jù)的處理,然后通過(guò)一定的計(jì)算就可以得到需要的結(jié)果。通用機(jī)器視覺(jué)軟件以C/C++圖像庫(kù)、ActiveX控件和基于圖形的編程環(huán)境等形式出現(xiàn),可以專(zhuān)用,例如僅用于LCD檢測(cè)、BGA檢測(cè)、模板對(duì)齊等,或通用,包括定位、測(cè)量、條形碼/字符識(shí)別、斑點(diǎn)檢測(cè)等。
真相三:
機(jī)器視覺(jué)市場(chǎng)發(fā)展迅速,汽車(chē)行業(yè)功不可沒(méi)
機(jī)器視覺(jué)在自動(dòng)化方面的價(jià)值在于它能夠快速高效地捕獲和處理大量文檔、圖像和視頻,其數(shù)量和速度遠(yuǎn)遠(yuǎn)超過(guò)人類(lèi)的能力。
廣闊的應(yīng)用前景和巨大的市場(chǎng)潛力決定了機(jī)器視覺(jué)必將是一個(gè)不斷增長(zhǎng)的市場(chǎng),Markets and Markets的數(shù)據(jù)表明,機(jī)器視覺(jué)的市場(chǎng)規(guī)模預(yù)計(jì)將從2020年的107億美元增長(zhǎng)到2025年的147億美元,復(fù)合年增長(zhǎng)率為6.5%。
根據(jù)grand view research的數(shù)據(jù),2021年,全球機(jī)器視覺(jué)市場(chǎng)規(guī)模為132.3億,預(yù)計(jì)2022年至2030年將以7.7%的復(fù)合年增長(zhǎng)率(CAGR)增長(zhǎng)。汽車(chē)、食品和飲料、制藥和化工以及包裝領(lǐng)域?qū)σ曈X(jué)引導(dǎo)機(jī)器人系統(tǒng)的需求是推動(dòng)市場(chǎng)增長(zhǎng)的主要?jiǎng)恿?。其中,汽?chē)行業(yè)依然是全球最大的機(jī)器視覺(jué)系統(tǒng)采用者,在2021年,來(lái)自汽車(chē)行業(yè)的收入份額超過(guò)了15.0%,預(yù)計(jì)未來(lái)幾年仍將繼續(xù)穩(wěn)步增長(zhǎng)。
圖5:按照行業(yè)劃分,2020年--2030年美國(guó)機(jī)器視覺(jué)市場(chǎng)發(fā)展趨勢(shì)
(圖源:grand view research)
真相四:
機(jī)器視覺(jué)在機(jī)器人應(yīng)用中將大顯身手
在市場(chǎng)范圍和應(yīng)用方面,機(jī)器視覺(jué)有很多機(jī)會(huì)可以擴(kuò)展。這些機(jī)會(huì)需要一些想象力,這意味著機(jī)器視覺(jué)不僅僅是取代技術(shù)人員的眼睛,而是充分利用機(jī)器人完成技術(shù)人員無(wú)法完成的任務(wù)。機(jī)器視覺(jué)使得機(jī)器人擁有實(shí)時(shí)、高細(xì)節(jié)地“看到”的能力,它允許機(jī)器人根據(jù)對(duì)象或環(huán)境的綜合視圖做出決策。如今,機(jī)器人在世界上的使用越來(lái)越多。當(dāng)機(jī)器人配備機(jī)器視覺(jué)時(shí),會(huì)給它們帶來(lái)更高的精確度、方向感和理解力,能夠更準(zhǔn)確地抓取物品,以更高的精度放置物品,并更快地執(zhí)行更復(fù)雜的任務(wù)。
機(jī)器視覺(jué)在機(jī)器人應(yīng)用中正變得越來(lái)越重要,根據(jù)自動(dòng)化促進(jìn)協(xié)會(huì)(A3)最近的一份報(bào)告,與2020年相比,機(jī)器人和機(jī)器視覺(jué)市場(chǎng)在2021年第二季度取得了實(shí)質(zhì)性增長(zhǎng)。工業(yè)機(jī)器人已經(jīng)被廣泛使用,隨著協(xié)作機(jī)器人的出現(xiàn)和3D機(jī)器視覺(jué)的快速發(fā)展,它們將被更多地結(jié)合使用。
機(jī)器視覺(jué)體現(xiàn)的是一種技術(shù)能力,自動(dòng)化、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等其他能力也是如此。這是一種可以集成到其他技術(shù)和流程中的能力,用以造福行業(yè)并提高業(yè)務(wù)效率?,F(xiàn)在的機(jī)器人已經(jīng)越來(lái)越多地內(nèi)置機(jī)器視覺(jué),機(jī)器視覺(jué)使機(jī)器人能夠執(zhí)行更復(fù)雜的任務(wù)。如果沒(méi)有機(jī)器視覺(jué)告訴機(jī)器人物品的確切位置,這些任務(wù)是不可能完成的。機(jī)器視覺(jué)是釋放自動(dòng)化全部潛力的關(guān)鍵,為智能自動(dòng)化添加了更多智能。
來(lái)源:Mouser
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系小編進(jìn)行處理。
推薦閱讀:
基于傳感器內(nèi)神經(jīng)網(wǎng)絡(luò)的模擬-信息轉(zhuǎn)換技術(shù),可顯著降低傳感器功耗