每天,我們睜開眼都會看見這個多彩的世界,五彩斑斕的花朵、湛藍(lán)的天空、還有親人熟悉的笑容,對于每一個健康人一出生便享有上天賜予的美好特權(quán),我們可以通過眼鏡感知這個世界。然而,小伙伴們知道視覺對于機(jī)器人是多么難能可貴嗎?我們平時所說的計算機(jī)視覺和機(jī)器視覺又有什么區(qū)別呢?今天小編就為大家講一講什么是計算機(jī)視覺、什么又是機(jī)器視覺。
首先在很多文獻(xiàn)中,計算機(jī)視覺與機(jī)器視覺是不加區(qū)分的,但其實(shí)這兩個術(shù)語既有區(qū)別又有聯(lián)系的。計算機(jī)視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段,著重于一幅或多幅圖像的計算機(jī)分析。機(jī)器視覺則偏重于計算機(jī)視覺技術(shù)工程化,能夠自動獲取和分析特定圖像,以控制相應(yīng)的行為。
計算機(jī)視覺
計算機(jī)視覺是指用攝像機(jī)和電腦及其他相關(guān)設(shè)備,對生物視覺的一種模擬。它的主要任務(wù)是通過對采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場景的三維信息,就像人類和許多其他類生物每天所做的那樣。
計算機(jī)視覺的最終目標(biāo)是使計算機(jī)能像人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。但能真正實(shí)現(xiàn)計算機(jī)能夠通過攝像機(jī)感知這個世界卻是非常之難,因?yàn)殡m然攝像機(jī)拍攝的圖像我們平時所見一樣,但對于計算機(jī)來說,任何圖像都只是如上圖右半邊所示的像素值排列,是一堆死板的數(shù)字。如何讓計算機(jī)從這些死板的數(shù)字里面讀取到有意義的視覺線索,是計算機(jī)視覺應(yīng)該解決的問題。
然而,計算機(jī)視覺發(fā)展多年,卻依然存在著一系列難以解決的難題。目前人們掌握的具體計算機(jī)視覺任務(wù)的方法,也僅僅適用于狹隘的人臉識別、指紋識別等簡單任務(wù),無法廣泛的應(yīng)用于不同場合。不過,也有學(xué)者認(rèn)為,隨著機(jī)器學(xué)習(xí)方法的日漸普及以及大數(shù)據(jù)科技的應(yīng)用,計算機(jī)視覺實(shí)現(xiàn)質(zhì)的突破也是指日可待的。
機(jī)器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機(jī)器視覺就是用機(jī)器代替人眼來做測量和判斷。機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。
機(jī)器視覺是一項(xiàng)綜合技術(shù),包括圖像處理、機(jī)械工程技術(shù)、控制、電光源照明、光學(xué)成像、傳感器、模擬與數(shù)字視頻技術(shù)、計算機(jī)軟硬件技術(shù)(圖像增強(qiáng)和分析算法、圖像卡、 I/O卡等)。一個典型的機(jī)器視覺應(yīng)用系統(tǒng)包括圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。
機(jī)器視覺系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動化程度。在一些不適合于人工作業(yè)的危險工作環(huán)境或人工視覺難以滿足要求的場合,常用機(jī)器視覺來替代人工視覺;同時在大批量工業(yè)生產(chǎn)過程中,用人工視覺檢查產(chǎn)品質(zhì)量效率低且精度不高,用機(jī)器視覺檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。而且機(jī)器視覺易于實(shí)現(xiàn)信息集成,是實(shí)現(xiàn)計算機(jī)集成制造的基礎(chǔ)技術(shù)。上圖便是機(jī)器視覺的一個典型應(yīng)用。
毋庸置疑,計算機(jī)視覺與機(jī)器視覺在技術(shù)和應(yīng)用領(lǐng)域上都有相當(dāng)大的重疊,這表明這兩個學(xué)科的基礎(chǔ)理論大致是相同的,但細(xì)究其機(jī)理,確實(shí)也有一些不同之處:
計算機(jī)視覺的研究對象主要是映射到單幅多幅圖像上的三維場景。計算機(jī)視覺的研究很大程度上是針對圖像的內(nèi)容。如下圖所示,如何讓計算機(jī)判斷出圖片中都是貓,才是計算機(jī)視覺研究的內(nèi)容。
機(jī)器視覺主要是指工業(yè)領(lǐng)域的視覺研究,例如自主機(jī)器人的視覺,用于檢測和測量的視覺。這表明在這一領(lǐng)域通過軟件硬件,圖像感知與控制理論往往與圖像處理得到緊密結(jié)合來實(shí)現(xiàn)高效的機(jī)器人控制或各種實(shí)時操作。舉個不恰當(dāng)?shù)睦樱€是上圖中的貓,機(jī)器視覺是觀察上圖中成百上千個某一特定形態(tài)的貓,發(fā)現(xiàn)哪只貓缺只耳朵,然后把它剔除出去。