計算機視覺綜述范文

時間:2024-01-09 17:35:15

導語:如何才能寫好一篇計算機視覺綜述,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

計算機視覺綜述

篇1

Abstract: This paper puts forward the camera calibration method in computer vision, through analysis of principle of computer vision, and analyzes the application of camera calibration methods in computer vision.

關(guān)鍵詞: 計算機;視覺;攝像機;定標

Key words: computer;visual;camera;scaling

中圖分類號:TP391.4 文獻標識碼:A 文章編號:1006-4311(2013)24-0193-02

0 引言

在計算機技術(shù)快速發(fā)展的今天,人們越來越依賴于計算機,計算機在人們的生活工作中占有重要的地位。計算機中的各種應用層出不窮,廣泛應用在各個領(lǐng)域,計算機視覺在攝像中的應用為攝像機定標方法提供了巨大的參考價值。由于人們對攝像機拍攝效果的要求,使得攝像機在不斷改革更新,攝像機的定標方法是攝像機研究領(lǐng)域備受關(guān)注的話題。計算機視覺中攝像機的定標方法是攝像機研究領(lǐng)域所推崇的,它受到了研究人員的高度重視。計算機視覺中攝像機的定標方法呈現(xiàn)出了高質(zhì)量的攝像效果,極大地滿足了人們對攝像機攝像效果的要求。

1 計算機視覺投影原理

計算機視覺投影原理是利用光的折射現(xiàn)象,把視覺中呈現(xiàn)的影像投射到攝影機的屏幕上,形成了固定的圖像。在計算機視覺中攝影機的成像原理就是利用光的感應,通過對攝像機的焦距進行調(diào)整,確定拍攝目標在攝像機鏡頭中的位置,然后利用光的折射形成固定的圖像。在進行攝像時調(diào)整焦距是非常關(guān)鍵的,焦距就是鏡頭與目標之間的距離,這兩者距離的遠近決定了攝像的效果。如果焦距太遠的話,目標成像就會非常小甚至是模糊。如果焦距太近的話,目標成像會很大也會導致無法看清圖像,所以調(diào)整焦距是非常必要的,只有調(diào)好了焦距才會形成高質(zhì)量的圖像。

2 計算機視覺中的攝像機定標方法

2.1 三維立體定標法 攝像機的成像往往都是三維立體的,把圖形通過每個立體面詳細的表現(xiàn)出來,以達到完美的效果。要想達到三維立體的效果在對攝像目標的位置進行確定時,就要找出目標的三維坐標點,以便接下來的攝像工作可以順利進行。然后在圖像投影中找到對應的三維坐標,這一步?jīng)Q定了整個攝像過程的設(shè)計方案。最后確定目標在攝影鏡頭中的實際三維坐標,根據(jù)鏡頭中目標的實際三維坐標形成具體的圖像。三維立體定標方法的操作原理就是把目標的三維投影進行分步成像,和實際成像效果相聯(lián)系,形成鏡頭中具體的三維圖像。在計算機視覺中把三維成像圖進行處理,對三維定標的參數(shù)進行分析,找出最優(yōu)的三維成像方法,使攝像機呈現(xiàn)出高質(zhì)量的攝像效果。

2.2 平面定標法 平面定標法就是利用多個成像平面對目標的位置進行分析,選擇合適的成像平面對目標進行位置的確定。每個平面的成像都是不同的,由于每個平面的成像都是在運動的,所以應該在攝像機與目標之間的平面內(nèi)找到一個點,來分析目標與攝像機之間的成像規(guī)律,然后根據(jù)這一規(guī)律對目標進行定標,使攝像機中運動的目標給人們帶來不一樣的感受。隨著目標的不斷運動,攝像機與目標之間平面內(nèi)的點會越來越多,對物體的定標會受到這些點的影響,物體定標的準確度也越來越高,為攝像機定標提供了可靠的信息支持,會減少攝像機定標的成本,提高了攝像的經(jīng)濟效益。相比三維立體定標法,平面定標的精確度更高,定標所用的時間相對較短,所以平面定標法在攝像研究領(lǐng)域中值得推廣。

2.3 雙平面定標法 所謂的雙平面定標法就是利用鏡頭與目標之間的兩個平面的成像點來進行定標,不需要成像平面上的光線通過平面中心,只要選取兩個平面之間任意兩點坐標來對定標參數(shù)進行計算分析,得出具體的成像圖。這種定標方式不受平面中心的影響可以在任意點上成像,減少了定標參數(shù)的數(shù)量,提高了定標的工作效率。但是由于雙平面定標法只是任意選取兩平面上的點,對定標的精確度造成了一定的影響,使計算機對參數(shù)的運算缺少可靠的數(shù)據(jù)支持,一定程度上降低了攝像機的成像清晰度,使計算機視覺中攝像機的定標精度存在一定的偏差,呈現(xiàn)出來的具體圖像質(zhì)量相對比較差。

2.4 直線兩點定標法 在三維立體和平面定標法的基礎(chǔ)上,又進一步研究了直線兩點定標法,極大程度上滿足了人們對攝像效果的要求。直線兩點定標法是利用定標物與攝像機鏡頭之間的直線上的兩點進行定標。然后通過計算機視覺對這兩點的坐標參數(shù)進行分析,然后攝像機利用這些參數(shù)對攝像機的焦距進行調(diào)整,確定物體的具置。在三維立體和平面定標的基礎(chǔ)上對計算機視覺程序進行改進升級,進一步提高對物體定標的精確度。對原有定標方法進行創(chuàng)新改進得出了直線兩點定標法使定標參數(shù)的數(shù)量大幅度的下降,節(jié)省了很多的人工成本,攝像機的清晰度也會大大提高。

2.5 透視變換焦距的定標法 透視變換焦距定標法是通過分析鏡頭與目標之間的距離,不斷調(diào)整兩者之間的距離使鏡頭里呈現(xiàn)出來的圖形清晰為止,然后就將現(xiàn)在的目標設(shè)置為定標物。由于這種定標方法不用去分析具體的定標參數(shù)被人們廣泛的應用。隨著科技的發(fā)展現(xiàn)在的攝像機都有自動調(diào)整焦距功能,不用人為的去調(diào)整焦距,使定標物更快地呈現(xiàn)在鏡頭中,節(jié)省了大量的定標時間,計算機的運算速度也加快了。但是這種定標方法也存在一定的缺陷,在實際操作如果不考慮攝像環(huán)境以及攝像鏡頭的變化,定標的精確度會存在一定的偏差,導致鏡頭中的定標物成像不清晰。

3 計算機視覺中攝像機定標方法的應用

3.1 在計算機視覺中攝像機的主動定標 計算機視覺中攝像機的定標方法推動了計算機技術(shù)在攝像機中的廣泛應用。計算機視覺中攝像機的主動定標是計算機技術(shù)在攝像機中的顯著應用。計算機技術(shù)使攝像機在定標過程中主動尋找定標物,使焦距和視角很好地配合,充分發(fā)揮計算機視覺在攝像機中的成像原理,把定標方法合理地運用在攝像機主動定標過程中,使攝像機的清晰度得到大幅度地提升。

3.2 分層次進行攝像機的定標 隨著計算機技術(shù)在攝像機定標中的不斷發(fā)展更新,攝影者喜歡分層次地進行定標,把自己的觀點融入到攝像機定標過程中,用自己的思維對定標參數(shù)進行分析,利用計算機視覺成像原理把定標物直觀的反映在計算機上,以便更好的對定標物進行分析,以其中一個定標物的成像平面來確定定標物的具體成像圖,使攝像機鏡頭中的定標物圖像可以更清晰。這種分層次的定標使計算機技術(shù)可以更好的應用在攝像機定標過程中,呈現(xiàn)出高質(zhì)量的攝像效果。

4 總結(jié)

在計算機視覺中攝像機的定標方法都是可行的,但各種方法都存在一定的缺陷,所以在實際應用中還應該根據(jù)攝影環(huán)境以及攝影機的質(zhì)量選擇最優(yōu)的定標方法,保證定標參數(shù)的準確性,在鏡頭里呈現(xiàn)出清晰的成像。針對計算機視覺中攝像機定標方法的缺陷,攝像機的研究領(lǐng)域應該要不斷更新攝像機定標方法,提高攝像機定標的精確度,不斷滿足人們對攝像機清晰度的要求,呈現(xiàn)出清晰的攝像效果。

參考文獻:

[1]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報,2000(1).

[2]伍雪冬,蔣新華,李建興,黃靖.計算機視覺中傳統(tǒng)攝像機定標方法綜述[J].福建工程學院學報,2007(1).

篇2

關(guān)鍵詞:計算機視覺系統(tǒng) 工業(yè)機器人 探究

中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9416(2015)05-0000-00

計算機視覺系統(tǒng)主要是為了工業(yè)機器人更好的工作而研發(fā)出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統(tǒng)。近年來,機器人已經(jīng)廣泛使用于工業(yè)生產(chǎn),但是多數(shù)機器人都是通過“示教-再現(xiàn)”的模式工作,在工業(yè)機器人工作是都是由操作員進行操作示范再由機器人跟著示范進行工作。由于機器人缺乏對外界事物的識別能力,工作中經(jīng)常發(fā)生偏差或者位移等情況。由于工作環(huán)境的惡劣以及各種阻礙,為了提高工業(yè)機器人的工作效率、靈活性、適應性等,讓機器人更好的識別外部環(huán)境并及時調(diào)整運作方向,能更好的發(fā)揮其作用,在原有的機器人系統(tǒng)中添加了一套計算機視覺系統(tǒng),利用計算機視覺圖像裝置的信息,通過圖像使機器人進行外部環(huán)境的識別處理,采用三維的重建,通過作業(yè)中利用三維圖像的信息進行計算,采用Motocom32軟件和機器人控制柜通訊等設(shè)備,對工業(yè)機器人進行控制,更好的實現(xiàn)機器人對空間特點的跟蹤與定位。

1系統(tǒng)的結(jié)構(gòu)與原理

本文主要針對Motoman UP6工業(yè)機器人系統(tǒng)的二次研究,在原有的工業(yè)機器人的系統(tǒng)中,增加了一套計算機視覺系統(tǒng), 使工業(yè)機器人更好的識別外界環(huán)境的系統(tǒng)。計算機視覺系統(tǒng)主要包括:Panasonic CCD攝像機、Motoman UP6工業(yè)機器人系統(tǒng)、工控機、OK C-50圖像采集卡等外部設(shè)備。工業(yè)機器人的整個系統(tǒng)由原有系統(tǒng)與計算機視覺系統(tǒng)組成,在原有的系統(tǒng)中包含了YASNAC-XRC- UP6機器人控制柜、Motoman UP6工業(yè)機器人本體、示教編程器、Motocom32系統(tǒng)以及相關(guān)的外部設(shè)備等[1]。計算機視覺系統(tǒng)的設(shè)備主要有Panasonic CCTV攝像機、AVENIR TV鏡頭、OK系列C-50圖像采集卡、工控機、AVENIR TV鏡頭、Panasonic CCD攝像機、OK系列C-50圖像采集卡形成的視頻采集系統(tǒng)主要是捕獲物體的圖像,該功能主要是分三個層次進行圖像處理、計算、變換以及通信等功能來實施工控機。利用遠程控制來對工業(yè)機器人進行Motocom32系統(tǒng)進行通信。

2計算機視覺系統(tǒng)的構(gòu)建

2.1硬件的組成

CCD攝像頭:選用的CCD攝像機采用PAP-VIVC810AOZ型彩色攝像頭,如圖1。攝像機的像素為P:500(H)x582(V),N:510(H)x 492(V),攝像機的分辨率為420。攝像機的成像器使用1/33"CCD,信噪>48 dB,同時攝像機具有自動背景光補償、自動增益控制等功能。

圖像采集卡:圖像采集卡主要采用CCD攝像頭配套的MV-200工業(yè)圖像處理。如圖2所示。MV-200圖像采集卡的分辨率、圖像清晰度具有較高的穩(wěn)定性,其真彩色實施工業(yè)圖像采集卡,該圖像采集卡的硬件構(gòu)造、地層函數(shù)都具有穩(wěn)定性,同時在惡例的環(huán)境中都可以穩(wěn)定運行[2]。圖像采集卡的圖像采集效果非常好,畫面效果非常流暢。

MV-200圖像采集卡性能特點:其分辨率為768 x 576,具有獨特的視頻過濾技術(shù),使圖像質(zhì)量的采集、顯示更加清晰流暢。主要支持的系統(tǒng)為Win98 /2K/XP,主要用于人工智能、事物識別、監(jiān)控等多種領(lǐng)域。

工控機:工控機以奔4系列為主。

2.2軟件組成

圖像匹配軟件。

圖像處理與獲取軟件。

定標和定位算法軟件,功能分布如圖3所示。

3視覺系統(tǒng)的原理及流程圖

工業(yè)機器人的主要系統(tǒng)包括是由工業(yè)機器人本體、相關(guān)的外部設(shè)備、控制器(供電系統(tǒng)、執(zhí)行器等)計算機視覺系統(tǒng)主要由三部分組成:圖像處理和獲取、圖像匹配、攝像機的定位等組成。通過借助OpenCV的視覺庫進行VC++.NET實行,流程如下圖表4所示。

在本視覺系統(tǒng)運行中,需要對攝像機實行定標,建立實際空間點和攝像機的對應點。在定標的過程中,就需要標記基準點,使攝像機在采集圖像時可以準確的把這些基準點投放到攝像機的坐標上[3]。同時在采集卡的圖像中,對圖像進行處理并計算出該基準點圖像的坐標,通過定標計算法,從而得出攝像機的參數(shù)。

在機器人系統(tǒng)中的反饋,計算機通過C語言的調(diào)節(jié)圖像采集卡進行動態(tài)鏈接來控制函數(shù)[4]。同時,對攝像機中的數(shù)據(jù)、視頻信號進行采集,構(gòu)成數(shù)字化的圖像資料,采用BMP格式存儲進行計算,在計算機上顯示活動視頻,然后系統(tǒng)對獲取的圖像進行分析處理,以及對噪聲的去除、圖像的平滑等進行處理,利用二值化處理對那些灰度閥值的圖像進行處理,同時檢測計算機獲取圖像的特征量并計算[5]。在完成圖像的處理后,就需要確立圖像的匹配特征,對圖像進行匹配[6]。如果兩個圖像不重疊,就需要建立3D數(shù)據(jù)庫進行模型重新選擇,再把模型進行計算、投影計算、坐標更換等指令,直到找到與圖像相匹配的數(shù)據(jù)模型,才能真正得到真實有效的圖像。重疊時,要獲得有效的圖像,以工業(yè)機器人識別物體為目的,才能建立機器人系統(tǒng)之間的通信。同時,通過三維圖像重建,進行機器人空間定位[7]。如下圖表5所示。

4結(jié)語

綜上所述,計算機視覺系統(tǒng)主要是為了工業(yè)機器人更好的工作而研發(fā)出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統(tǒng)。通過3D數(shù)據(jù)模型指定目標,機器人系統(tǒng)利用計算機視覺圖像的采集裝置來識別外界環(huán)境的數(shù)據(jù),經(jīng)過圖像的姿態(tài)預算、影像的投影計算產(chǎn)生圖像,通過圖片的合成比較,以此來實現(xiàn)機器人在工作中對物體的識別。利用計算機系統(tǒng)對機器人進行有效的控制,在工業(yè)機器人工作中對事物目標的搬運、跟蹤、夾持等指令。計算機視覺系統(tǒng)具備清晰的視覺功能,有利于提高工業(yè)機器人的靈活性以及適應性。

參考文獻

[1]夏群峰,彭勇剛.基于視覺的機器人抓取系統(tǒng)應用研究綜述[J].機電工程,2014(06):221-223.

[2]華永明,楊春玉.機器人視覺系統(tǒng)在立體編織自動鋪紗過程中的應用研究[J].玻璃纖維,2011(01):189-191.

[3]王培屹.基于多傳感器多目標實時跟蹤視覺系統(tǒng)在全自主機器人上的應用[J].軟件導刊,2011(01):263-264.

[4]譚民,王碩.機器人技術(shù)研究進展[J].自動化學報,2013(07):123-125.

[5]鮑官軍,荀一,戚利勇,楊慶華,高峰.機器視覺在黃瓜采摘機器人中的應用研究[J].浙江工業(yè)大學學報,201(01):93-95.

篇3

Abstract: Surface roughness is key indexes to evaluate surface quality. Surface quality has influence on service life and usability. Two basic measuring methods are introduced: contact measuring and non-contact measuring. Non-contact measuring method based on the computer vision technology is discussed in detail.

關(guān)鍵詞: 表面粗糙度;非接觸;光學測量

Key words: surface roughness;non-contact;optics measurement

中圖分類號:TH6文獻標識碼:A文章編號:1006-4311(2011)08-0050-02

0引言

隨著科學技術(shù)的進步和社會的發(fā)展,人們對于機械產(chǎn)品表面質(zhì)量的要求越來越高。表面粗糙度是評價工件表面質(zhì)量的一個重要指標,國內(nèi)外很多學者在表面粗糙度檢測方面做了大量研究工作。目前測量表面粗糙度的主要方法有:接觸式測量和非接觸式測量。

1接觸式測量

接觸式測量就是測量裝置的探測部分直接接觸被測表面,能夠直觀地反映被測表面的信息,接觸式測量方法主要是觸針法,該方法經(jīng)過幾十年的充分發(fā)展,以其穩(wěn)定、可靠的特點被廣泛應用。但接觸式測量存在很大的缺陷,具體表現(xiàn)在:①對高精度表面及軟質(zhì)金屬表面有劃傷破壞作用;②受觸針尖端圓弧半徑的限制,其測量精度有限;③因觸針磨損及測量速度的限制,無法實現(xiàn)在線實時測量[1]。

2非接觸式測量

為了克服接觸式測量方法的不足,人們對非接觸式測量方法進行了廣泛研究。研究表明,非接觸式測量方法具有非接觸、無損傷、快速、測量精度高、易于實現(xiàn)在線測量、響應速度快等優(yōu)點。目前已有的非接觸式測量方法包括各種光學測量方法、超聲法、掃描隧道顯微鏡法、基于計算機視覺技術(shù)的表面粗糙度檢測方法等。這里我們只對基于光學散射原理的測量方法、基于光學干涉原理的測量方法和基于計算機視覺技術(shù)的測量方法做簡單介紹。

2.1 基于光學散射原理的測量方法當一束光以一定的角度照射到物體表面后,加工表面的粗糙不平將引起發(fā)生散射現(xiàn)象。研究表明:表面粗糙度和散射光強度分布有一定的關(guān)系。對于表面粗糙度數(shù)值較小的表面,散射光能較弱,反射光能較強;反之,表面粗糙度數(shù)值較大的表面,散射光能較強,反射光能較弱。

基于光學散射原理測量表面粗糙度的研究方法和理論較多。四川聯(lián)合大學和哈爾濱理工大學相繼提出了一種稱之為散射特征值的參數(shù),表征被測物體表面上反射光和散射光的分散度,散射特征值與被測物體表面的粗糙度有很好的對應關(guān)系[2]。哈爾濱理工大學利用已知表面粗糙度參數(shù)值的標準樣塊測得其散射特征值,建立―關(guān)系曲線,從而實現(xiàn)利用散射特征值測量火炮內(nèi)膛表面粗糙度[3]。

基于光學散射原理的表面粗糙度檢測方法,具有結(jié)構(gòu)簡單、體積小、易于集成產(chǎn)品、動態(tài)響應好、適于在線測量等優(yōu)點。該方法的缺點是測量精度不高,用于超光滑表面粗糙度的測量還有待進一步改進。

2.2 基于光學干涉原理的測量方法當相干光照射到工件表面同一位置時,由于光波的相互位相關(guān)系,將產(chǎn)生光波干涉現(xiàn)象。一般的干涉法測量是利用被測面和標準參考面反射的光束進行比較,對干涉條紋做適當變換,通過測量干涉條紋的相對變形來定量檢測表面粗糙度。該方法的測量精度取決于光的波長。但是由于干涉條紋的分辨率是以光波波長的一半為極限的,僅從條紋的狀態(tài)無法判斷表面是凸起還是凹陷,因此,作為一種具有較好分辨率、寬測量范圍的表面粗糙度在線檢測技術(shù),這種干涉法測量技術(shù)還有待于進一步發(fā)展[4]。

基于光學干涉原理,1984年美國洛克西德導彈公司huang采用共模抑制技術(shù)研制成功了光學外差輪廓儀,光外差干涉檢測技術(shù)是一種具有納米級測量準確度的高精度光學測量方法,適用于精加工、超精加工表面的測量,而且可以進行動態(tài)時間的研究;華中理工大學采用光外差干涉方法研制出2D-SROP-1型表面粗糙度輪廓儀[5]。美國的維易科(VEECO)精密儀器有限公司,采用共光路干涉法研制了WYKO激光干涉儀和光學輪廓儀,可用來測量干涉條紋位相[6]。

基于光學干涉原理測量表面粗糙度分辨率高,適于測量超光滑表面粗糙度,但由于該方法的測量精度受光波波長的影響很大,所以其測量范圍受到一定影響。

2.3 基于計算機視覺技術(shù)的測量方法基于計算機視覺的粗糙度測量方法是指使用攝像機抓取圖像,然后將該圖像傳送至處理單元,通過數(shù)字化處理,根據(jù)像素分布和灰度、紋理、形狀、顏色等信息,選用合理的算法計算工件的粗糙度參數(shù)值。近年來,隨著計算機技術(shù)和工業(yè)生產(chǎn)的不斷發(fā)展,該方法受到越來越多的關(guān)注。

北京理工大學的王仲春等人采用顯微鏡對檢測表面進行放大,并通過對CCD采集加工表面微觀圖像進行處理實現(xiàn)了表面粗糙度的檢測[7]。哈爾濱理工大學吳春亞、劉獻禮等為解決機械加工表面粗糙度的快速、在線檢測,設(shè)計了一種表面粗糙度圖像檢測方法,建立了圖像灰度變化信息與表面粗糙度之間的關(guān)系模型[8]。英國學者Hossein Ragheb和Edwin R.Hancock通過數(shù)碼相機拍攝的表面反射圖來估計表面粗糙度參數(shù),運用Vernold Harvey修正的B K散射理論模型獲得了比Oren Nayar模型更好的粗糙度估計結(jié)果[9]。澳大利亞學者Ghassan A.Al-Kindi和Bijan Shirinzadeh對基于顯微視覺的不同機械加工表面粗糙度參數(shù)獲取的可行性進行了評估,討論了照射光源與表面輻照度模型對檢測的影響,結(jié)果顯示盡管從視覺數(shù)據(jù)和觸針數(shù)據(jù)所獲得的粗糙度參數(shù)存在一定差異,但是基于視覺的方法仍是一種可靠的粗糙度參數(shù)估計方法[10-11]。

可以看出,基于計算機視覺技術(shù)的測量方法主要有統(tǒng)計分析、特征映射和神經(jīng)網(wǎng)絡等黑箱估計法。通過這些方法獲得的表面粗糙度參數(shù)的估計值受諸多因素的影響,難以給出其準確的物理解釋。真正要定量地計算出粗糙度參數(shù),需要科學的計算。

但是隨著機械加工自動化水平的提高,基于計算機視覺技術(shù)的檢測方法處理內(nèi)容豐富、處理精度高、處理速度快、易于集成等優(yōu)點將受到越來越多的重視。

3結(jié)束語

接觸式測量測量速度較慢,容易劃傷工件表面,并且不適用于連續(xù)生產(chǎn)材料表面的檢測。非接觸式測量具有無損傷、快速、測量精度高、易于實現(xiàn)在線測量等優(yōu)點,已成為表面粗糙度檢測的重點研究方向。非接觸測量以光學法為主,隨著計算機技術(shù)和工業(yè)生產(chǎn)的迅猛發(fā)展,基于計算機視覺技術(shù)的表面粗糙度非接觸式檢測方法受到越來越多的重視。

參考文獻:

[1]劉斌,馮其波,匡萃方.表面粗糙度測量方法綜述[J].光學儀器,2004,26(5):54-55.

[2]苑惠娟等.非接觸式表面粗糙度測量儀[J].哈爾濱科學技術(shù)大學學報,1995,19(6):30-34.

[3]強熙富,張詠,許文海.擴展激光散射法測量粗糙度的測量范圍的研究[J].計量學報,1990,11(2):81-85.

[4]王文卓,李大勇,陳捷.表面粗糙度非接觸式測量技術(shù)研究概況[J].機械工程師,2004,11:6-9.

[5]王菊香.2D-SROP-1型表面粗糙度輪廓儀[J].工業(yè)計量,1994,(4):27-29.

[6]徐德衍等.光學表面粗糙度研究的進展與方向[J].光學儀器,1996,18(1):32-41.

[7]王仲春,高岳,黃粵熙等.顯微成像檢測表面粗糙度[J].光學技術(shù),1998,5:46-48.

[8]吳春亞,劉獻禮,王玉景等.機械加工表面粗糙度的圖像檢測方法[J].哈爾濱理工大學學報,2007,12(3):148-151.

[9]Hossein Ragheb,Edwin R.Hancock.The modified Beckmann Kirchhoff scattering theory for rough surface analysis[J].Pattern Recognition,2007,40:2004-2020.

篇4

英文名稱:Journal of Image and Graphics

主管單位:中國科學院

主辦單位:中國科學院遙感應用研究所;中國圖象圖形學學會;北京應用物理與計算數(shù)學研究所

出版周期:月刊

出版地址:北京市

種:中文

本:大16開

國際刊號:1006-8961

國內(nèi)刊號:11-3758/TB

郵發(fā)代號:82-831

發(fā)行范圍:國內(nèi)外統(tǒng)一發(fā)行

創(chuàng)刊時間:1996

期刊收錄:

中國科學引文數(shù)據(jù)庫(CSCD―2008)

核心期刊:

中文核心期刊(2008)

中文核心期刊(2004)

中文核心期刊(2000)

期刊榮譽:

聯(lián)系方式

期刊簡介

《中國圖象圖形學報》是由中國科學院遙感應用研究所、中國圖象圖形學會、北京應用物理與計算數(shù)學研究所共同創(chuàng)辦,是集計算機圖像圖形高科技理論、技術(shù)方法與應用研究成果產(chǎn)業(yè)化于一體的綜合性學術(shù)期刊?!吨袊鴪D象圖形學報》是被國內(nèi)主要檢索系統(tǒng)收錄的核心中文期刊,是圖像圖形學及相關(guān)領(lǐng)域的權(quán)威性雜志。

篇5

【關(guān)鍵詞】雙膚色模型;AdaBoost算法;人臉檢測;OpenCV

Design of Face Detection System Based on Dual Skin Models and AdaBoost Algorithm

HOU Shun-yan QIE Jian-min XU Jing

(College of Electronic and Information Engineering, Hebei University, Baoding Hebei 071002,China)

【Abstract】A practical face detection system which is based on VS2010 and Intel open source computer vision library (OpenCV) under the platfrom of windows.was designed. It shoud bring out the face region detection in the complex backgroud image which may consist of face regions. The realization of face detection function is mainly fusion of dual skin models and Adaboost algorithm. The image segemention of skin region was firstly got based on a smiple boundary skin model and Gaussian skin color model in the YCbCr color space. The face coarse region location was determined by using the results of skin color segmentaion. Combining Adaboost algorithm, the accurate candidate face region was acquired secondly. This system is easy to use and has better detection.

【Key words】Dual skin models;AdaBoost algorithm;Face detection;OpenCV

0 引言

人臉檢測是人臉表情識別、人機交互的第一步,快速有效的人臉檢測直接影響人臉識別系統(tǒng)的實現(xiàn)。人臉檢測是指運用一定的算法從不同背景或者視頻中圖像確定其中是否有人臉,若有則標出人臉的大小、位置、是否旋轉(zhuǎn)以及旋轉(zhuǎn)角度等信息。自上世紀90年代以來,科研人員提出了很多人臉檢測算法,大致分為四類:基于知識的方法、基于特征的方法、基于模板的方法和基于表象的方法[1]。本文結(jié)合雙膚色模型與Adaboost算法開發(fā)人臉檢測系統(tǒng)。

1 系統(tǒng)開發(fā)方案

Intel公司的開源計算機視覺庫OpenCV (Open Source Computer Vision Library)[2],由一系列C函數(shù)和少量 C++ 類構(gòu)成,具有良好的可移植性,其代碼都經(jīng)過優(yōu)化,可以進行圖像的實時處理。OpenCV廣泛應用在人機互動、物體識別、圖象分割、人臉識別、動作識別、運動跟蹤、機器人等領(lǐng)域。利用OpenCV實現(xiàn)人臉檢測,為系統(tǒng)開發(fā)帶來了極大的方便。

在Windows環(huán)境下,基于可視化開發(fā)平臺VS2010,調(diào)用OpenCV視覺庫,設(shè)計人臉檢測算法,開發(fā)一個實用的人臉檢測系統(tǒng)。

2 人臉檢測算法設(shè)計

2.1 顏色空間的選擇

膚色作為人臉的主要特征,從圖像中抽取膚色,利用膚色檢測可有效減小搜索范圍,提高檢測速度。常用的顏色空間有RGB、HIS、CYMK、YCbCr等,其中,YCbCr色彩空間是MPEG數(shù)字視頻編碼標準建議的顏色空間,具有計算、表示簡單,亮度分離,能較好的限制膚色分布范圍等特點。本文在YCbCr空間下實現(xiàn)膚色檢測,從RGB空間到Y(jié)CbCr空間的轉(zhuǎn)化可由線性公式(1)得到。

■ (1)

2.2 基于雙膚色模型的人臉粗檢

膚色模型是指用一種代數(shù)的(解析的)或查找表等形式來表示哪些像素的顏色屬于膚色,或者表征出某一像素的顏色與膚色的相似程度[3]。

2.2.1 簡單邊界膚色模型

簡單邊界膚色模型依據(jù)膚色在顏色空間中相對的集中在某一區(qū)域,使用一個或一組已知數(shù)學公式來表示膚色范圍。簡單邊界模型要取得好的效果必須解決兩個問題[4]:(1)如何選擇合適的顏色空間;(2)如何確定規(guī)則中的參數(shù)。在選擇顏色空間時除了要考慮膚色在顏色空間中的聚集程度外,還要考慮膚色與非膚色區(qū)域的可分離性。

2.2.2 高斯膚色模型

根據(jù)統(tǒng)計理論,在YCbCr空間中膚色的分布是連續(xù)的并且滿足高斯分布。本文從自建的圖像集中選取大量含有膚色的圖像,分出膚色像素點,組成訓練樣本,利用樣本的統(tǒng)計方法、EM算法確定Gauss分布的均值和方差。根據(jù)膚色在YCbCr空間的高斯分布,對被檢測的圖像計算像素點距離高斯模型分布中心的馬氏距離。按照公式(2)得到各像素點屬于膚色區(qū)域的概率,即可得到膚色似然圖。

p(Cb,Cr)=e0.5(x-m)TC-1(x-m) (2)

其中,m是該圖像的平均值;C是協(xié)方差矩陣;

xi=[Cbi,Cri]T,C=E{(x-m)(x-m)T}。

2.2.3 基于雙膚色模型的膚色分割

簡單邊界模型運行效率較高,邏輯簡單,常用于實時系統(tǒng)檢測,但是膚色范圍如果設(shè)置的太大,則會引入大量非膚色?;诟怕实膭討B(tài)閾值模型如高斯模型,相對來說實現(xiàn)較復雜,但是檢測精度高。因此本文采用簡單邊界模型和高斯模型相結(jié)合的方法優(yōu)化膚色檢測過程。

首先輸入圖像如圖1(a),選擇YCbCr顏色空間中的CbCr平面,設(shè)置膚色邊界范圍:100≤Cb≤127,133≤Cr≤173。如果圖像中的像素落在限定的矩形區(qū)域內(nèi),就認為該像素為膚色,從而得到初次分割結(jié)果,如圖1(b)。通常采用白色表示膚色區(qū)域,黑色表示非膚色區(qū)域。

初次分割的結(jié)果修正高斯膚色模型,對輸入圖像應用高斯模型進行膚色相似度判定,得到膚色似然圖,如圖1(c)。用最大類間方差法確定最佳閾值,得到膚色二值圖像如圖1(d)。

2.2.4 人臉粗檢

對膚色分割得到的二值圖像進行后處理,通過膨脹與腐蝕等形態(tài)學處理填充小空洞,去除小的噪聲,以去除非人臉區(qū)域,判定膚色區(qū)域內(nèi)孔的數(shù)量、大小及其位置關(guān)系,計算連通區(qū)域的寬和高,確定候選人臉區(qū)域。

2.3 結(jié)合AdaBoost的人臉精檢測

Viola[5]提出了一種結(jié)合Adaboost和Cascade算法的多特征檢測系統(tǒng),具有極高的運行速度,實現(xiàn)了人臉的實時檢測,并具有較高的檢測準確率,在人臉分析領(lǐng)域引起了廣泛的關(guān)注。該算法采用一組類似于哈爾小波變換(Haar-Like)的濾波器來計算圖象的特征值,包括3種特征:雙矩形特征、三矩形特征和四矩形特征。

(a)原始圖像 (b)簡單邊界模型初次分割結(jié)果

(c)膚色似然圖 (d)高斯模型二次分割結(jié)果

圖1 基于雙膚色模型的膚色分割

本文利用AdaBoost級聯(lián)分類器掃描候選人臉區(qū)域,依次調(diào)用每級強分類器對該區(qū)域檢測,因此AdaBoost級聯(lián)分類器不用掃描整個圖像,從而提高了人臉檢測速度,準確的定位出人臉。

3 系統(tǒng)運行及功能分析

3.1 系統(tǒng)運行界面

人臉檢測系統(tǒng)基于Windows風格,方便用戶操作。系統(tǒng)運行界面如圖2,圖中為精確定位人臉實例。

3.2 人臉檢測功能分析

人臉檢測是人臉識別的第一步,檢測效果直接影響后續(xù)工作。對人臉檢測效果進行分析,采用540張靜態(tài)圖像進行測試,包括各種復雜環(huán)境和背景、不同尺寸、不同角度的單人臉和多人臉圖像,共878個人臉。通過測試,共檢測出789張人臉,誤檢人臉43張,檢測率為89.9,平均每張臉檢測時間0.963秒??傮w說來,檢測效果較好,基本滿足系統(tǒng)要求。

圖2 人臉檢測系統(tǒng)運行界面

4 結(jié)論

基于雙膚色模型和AdaBoost算法,開發(fā)了一個實用的人臉檢測系統(tǒng)。該系統(tǒng)實現(xiàn)了膚色檢測、人臉檢測及特征定位等功能。實驗證明該系統(tǒng)在檢測率和檢測速度上均有一定的提高,為后續(xù)人臉識別及實際應用提供了有力的保障。

【參考文獻】

[1]Yang M H, Kriegnum D J. Ahuja N.Delecting face in images:a survey[J].Pattern Analysis and Machine Intelligence, 2002,24(1):34-58.

[2]賈小軍,喻擎蒼.基于開源計算機視覺庫OpenCV的圖像處理[J].計算機應用與軟件,2008,25(4):276-278.

[3]Guangzheng Yang, Thomas S Huang. Human face detection in a complex background[J]. Pattern Recognition,1996:345-350.

篇6

【關(guān)鍵詞】智能車輛 機器視覺 發(fā)展

一、前言

機器視覺技術(shù),即計算機視覺技術(shù),是智能車輛行駛環(huán)境感知的通道,一些控制決策參數(shù)直接由機器視覺獲取。例如,智能車輛自主導航行駛時前方預瞄點位置的獲取,超車行駛時前方車輛和車道邊界位置的獲取等等都要由機器視覺來完成。機器視覺系統(tǒng)在智能車輛上的應用源于20世紀 80年代中期。其早期研究是針對具有良好的室內(nèi)試驗環(huán)境條件進行設(shè)計的。

從20世紀90年代中期開始,智能車輛機器視覺的研究出現(xiàn)兩個發(fā)展方向,其中一個發(fā)展方向是相對簡單的機器視覺系統(tǒng)在智能車輛中的早期應用。主要體現(xiàn)在如下幾個方面:(1)機器視覺橫向輔助導航系統(tǒng)。(2)自適應導航控制系統(tǒng)。(3)自主“停車啟動”駕駛系統(tǒng)。(4)換道輔助系統(tǒng)[1]。智能車輛機器視覺技術(shù)發(fā)展的另一個方向是研制開發(fā)具有擬人駕駛性能水平的復雜機器視覺系統(tǒng)。從長遠來看,這種視覺系統(tǒng)還應具有自學習的功能。目前,德國聯(lián)邦國防大學(UBM)著名學者Dickmanns教授開展了“多焦距主動汽車眼”(MarVEye-Multi-focal active/reactive Vehicle Eye)的研究。這種新型的綜合視覺系統(tǒng)將智能車輛機器視覺技術(shù)提高到了一個新的水平。

二、國內(nèi)外研究現(xiàn)狀

機器視覺導航智能車輛已經(jīng)成為當今智能車輛的發(fā)展主流,世界各主要國家都在競相開展智能車輛視覺系統(tǒng)的研究。機器視覺系統(tǒng)是智能車輛感知局部環(huán)境的重要“器官”,而其所起的核心作用無外乎兩個:識別行駛道路邊界與行駛環(huán)境中的其它車輛(主要指前方車輛)或其它障礙物。具體地講,就是利用安裝在智能車輛前方的單目或多目光學CCD攝像機(或其它傳感器)實時地獲取圖像,利用圖像中的信息根據(jù)設(shè)計的算法識別出道路邊界位置和前方車輛位置,再將這些路、車位置信息傳給智能車輛的指揮系統(tǒng),為其自主導航?jīng)Q策提供依據(jù)。而國內(nèi)外的研究工作也主要集中在道路位置識別和前方車輛識別這兩個方面。

目前對道路邊界的識別主要集中在直線路形和路旁障礙物較少的道路條件。直線路形識別較為簡單,用直線方程描述道路邊界,可以大大減少計算量,此技術(shù)也相對較為成熟,例如有霍夫變換法,通過幾何折射關(guān)系直接將道路邊界標注出來。這種方法的缺點是受噪聲尤其是直線噪聲的影響較大,且算法不穩(wěn)定。

吉林大學智能車輛課題組用基于圖像灰度與方差統(tǒng)計的方法識別直線路界,即在得到圖像后進行預處理并在最終的二值圖像中劃分網(wǎng)格,通過計算各網(wǎng)格的統(tǒng)計特性,由馬氏距離區(qū)分道路邊界點與非邊界點,得到邊界點最多的一條直線作為直線道路邊界。此方法能夠準確的識別道路邊界,但當路旁噪聲較大時識別效果不夠理想。同時,基于熵最大化邊緣提取的圖像預處理過程由于算法復雜,耗時較長。

由于彎曲路形模式較為復雜,情況變化多樣,算法難以統(tǒng)一,并且由于算法的復雜性,很難滿足準確性和實時性要求。因此國內(nèi)外對彎曲路徑識別的研究從方法上并不成熟。國外有人用具有某些特征的曲線方程擬合彎曲路界,但由于參數(shù)的增加,計算量增大,因此很難滿足實時性要求。國內(nèi)有人用直線整條或分段近似擬合彎曲路界,在車道邊界曲率不大時能夠基本滿足要求,但當曲率較大時識別準確性不高。因此,可以認為對道路邊界尤其是彎曲道路邊界的識別還有待于進一步研究。

由于前方車輛在圖像中的灰度信息特征很不明顯,例如當車輛在遠方與近處時的灰度統(tǒng)計特性、紋理特性、外形特性等完全不同。因此,算法魯棒性是一個非常棘手的問題。很難提出一種滿足各種狀態(tài)的識別算法。一般利用機器視覺進行車輛識別的方法可分為以下三類:

(1)基于車輛特征的方法。該方法利用圖像中車輛存在的特征(紋理、邊緣、對稱性以及底部陰影等)進行分割和識別。這種方法的缺點是,當單獨使用某一種特征時,經(jīng)常會因光照或環(huán)境的變化,導致該特征信息量不足。因此,極易出現(xiàn)錯判或漏判的現(xiàn)象。

(2)基于模板匹配的方法。這種方法利用大量的預先做好的車輛模板(基于灰度信息或小波特征) ,與實時采集的圖像進行匹配。尋找相關(guān)性最大的匹配區(qū)域作為車輛存在區(qū)域。通常,這種方法魯棒性相對較好,缺點是實時性較差。

(3)基于學習的方法。這種方法的本質(zhì)是利用神經(jīng)網(wǎng)絡,對大量的車輛圖像進行訓練,然后通過分類器進行分類。通常這種方法被用來對已檢測的車輛進行驗證。

吉林大學智能車輛課題組提出一種基于車輛特征的方法識別和跟蹤前方的車輛。首先,利用車輛底部存在陰影的特征,在圖像中確定可能存在的車輛區(qū)域。然后,通過分形維數(shù)計算該區(qū)域的紋理特征,排除非車輛區(qū)域。這種方法對于強光條件和車輛顏色與路面的顏色特征相似的情況,識別和定位的效果不夠理想。

三、關(guān)鍵難點與長遠發(fā)展

在不考慮硬件設(shè)備的情況下,制約智能車輛視覺系統(tǒng)探測效果的三個關(guān)鍵因素是視覺系統(tǒng)所應用算法的實時性、魯棒性和精確性。實時性要求視覺系統(tǒng)數(shù)據(jù)處理必須與車輛的高速行駛同步進行;魯棒性要求智能車輛視覺系統(tǒng)在各種復雜的路面環(huán)境下均具有良好的適應性,例如路面有大量樹木與建筑物陰影、變化的氣候條件等;精確性則要求視覺系統(tǒng)在一些復雜環(huán)境下不能出現(xiàn)過多的錯判率。這三個要求相輔相成,互相制約。要完全達到上述要求,智能車輛機器視覺系統(tǒng)還需要很長的發(fā)展歷程。目前有關(guān)智能車輛機器視覺系統(tǒng)的研究正處于一個高速發(fā)展的階段,由于硬件水平的提高和理論研究工作的深入,在可以預見的將來將達到一個更高的水平。

參考文獻:

[1]王榮本, 游峰, 崔高健, 郭烈. 基于計算機視覺高速智能車輛的道路識別. 計算機工程與應用,2004,(8):34-39

[2]顧柏園, 王榮本, 余天洪, 郭烈. 基于視覺的前方車輛探測技術(shù)研究方法綜述. 公路交通科技. 2005,(10):28-33

篇7

關(guān)鍵詞:無人機平臺;多視角;傾斜影像;匹配策略;影像獲??;影像處理 文獻標識碼:A

中圖分類號:P231 文章編號:1009-2374(2017)08-0023-02 DOI:10.13535/ki.11-4406/n.2017.08.011

1 概述

隨著地理信息產(chǎn)業(yè)的快速發(fā)展,用戶對于地理信息產(chǎn)品的地理要素完整性、精確性、實時性提出了更高要求。近年來提出的“數(shù)字地球、智慧城市”預示著未來地理信息產(chǎn)業(yè)中三維城市建模的重要性。傳統(tǒng)單鏡頭、近似垂直攝影測量作業(yè)模式經(jīng)過幾十年的發(fā)展,在理論、技術(shù)上趨于完善,但是其獲取的影像缺乏高大地物的側(cè)面紋理信息。為了同時獲取地物多個側(cè)面的信息,多視角傾斜航空攝影技術(shù)受到越來越多的重視。當前隨著無人機技術(shù)的發(fā)展,多視角傾斜航空攝影成本正逐步降低,大規(guī)模運用指日可待。

2 傾斜影像攝影作業(yè)概述

多視角傾斜航空攝影從多個視角拍攝地面影像,較常見的構(gòu)造為1個下視鏡頭+4個傾斜鏡頭,此外也有1個下視鏡頭+2個傾斜鏡頭(如Trimble的AOS相機)。三線陣CCD掃描相機ADS40在參考文獻[1]中也作為三視角傾斜相機。不論是五視角相機還是三視角相機,多個鏡頭的分布一定是嚴格對稱且關(guān)系穩(wěn)固的。這些數(shù)字傾斜相機都集成精確的定位定姿系統(tǒng)(GPS/IMU)獲取影像外方位元素。本文只研究五視角相機的影像獲取和處理技術(shù)。五視角傾斜相機集成1個下視鏡頭和4個傾斜鏡頭。每次曝光垂直和傾斜相機設(shè)計為同時曝光。以AMC580相機為例,曝光瞬間同時存儲1張垂直影像和4張傾斜影像,并記錄這5張影像的外方位元素。

傾斜航攝作業(yè)記錄的數(shù)據(jù)包括控制數(shù)據(jù)和影像數(shù)據(jù)。航攝飛行記錄包括航攝時間、天氣狀況、航線的分布圖以及每條航線上每次曝光記錄的影像名序列。

其中,相機檢校文件包括相機名稱、主距、像主點偏移、輻射畸變改正系數(shù)、偏心變形系數(shù)以及像點糾正方程。POS數(shù)據(jù)指的是每張影像的外方位元素。影像外方位元素由線元素和角元素共6元素組成,線元素Xs、Ys、Zs是投影中心在物方空間坐標系中的位置,角元素描述成像面在成像時刻的姿態(tài)。傾斜航空攝影測量作業(yè)也可以與傳統(tǒng)單鏡頭作業(yè)模式一樣,在按照“S型”軌跡拍攝完后,再垂直于這組“平行航線”沿“垂直架構(gòu)航線”獲取影像,以增強影像間的相關(guān)性,便于后續(xù)平差處理。

3 傾斜影像匹配難點

五鏡頭傾斜航空攝影獲取的影像具有如下難點:(1)地面分辨率、比例尺不一致。傾斜鏡頭對嚴格水平的地面成像時,遠景的GSD(地面采樣間隔)比近景的要低。參考文獻[2]給出了計算傾斜影像上不同點比例尺以及近景點與遠景點比例尺差異的公式。離相機遠的地面點和離相機近的地面點成像比例尺不一致;(2)傾斜影像遮擋嚴重,高度重疊,數(shù)據(jù)冗余;(3)在航攝角度上,5個鏡頭朝向各異,進入鏡頭的光強也會明顯不同,因此不同鏡頭、不同航線影像的亮度、對比度有較大偏差;(4)從影像像素尺度來看,在多視角傾斜影像匹配中,待匹配窗口與模板窗口之間發(fā)生了大的變形,像素值發(fā)生偏移,正方形框是開取的模板窗口和搜索窗口,計算兩個正方形框內(nèi)像素的相關(guān)系數(shù),相關(guān)程度不可能很高。前期實驗表明,適用于傳統(tǒng)垂直影像性能穩(wěn)定的灰度匹配算法,在應用于傾斜影像時往往出現(xiàn)大量誤匹配,甚至失效。

4 常規(guī)匹配方法

影像匹配可能由于存在遮擋而無解或因重復模式存在多解。在匹配過程中加入約束條件對匹配有重要作用:縮小影像上的匹配搜索空間,提高匹配效率,同時也提高匹配正確率。傾斜影像嚴重的幾何畸變本身就給“點―點”的相似性測度計算帶來很大困難,這時有效限制搜索范圍對于匹配成功尤為重要。

4.1 金字塔多級匹配

金字塔多級匹配就是先把待匹配的左、右原始影像降采樣成多個尺度的影像。沿著影像金字塔自上而下,尺度由粗到精,單個像素對應的地面尺寸逐漸減小,地面采樣間隔GSD(Ground Sampling Distance)減小,影像空間分辨率提高。首先在影像金字塔上層匹配,然后將匹配結(jié)果傳遞到下層影像上,直至最高分辨率的原始影像上。多級匹配方法可以達到減小搜索空間的目的。

影像匹配是直接對像素灰度值進行的操作。在影像金字塔上層,細節(jié)信息已被平滑,整體紋理具有更大的相似性,因而能取得更理想的匹配效果;在影像金字塔下層,細節(jié)信息未被平滑,灰度變化更劇烈,輕微的幾何變形就會給匹配增加很大難度。

4.2 單應約束

單應約束的理論基礎(chǔ)是計算機視覺中Marr提出的影像匹配約束框架。無論是基于灰度還是特征的匹配,整體匹配結(jié)果體現(xiàn)的視差變化規(guī)律應該是連續(xù)的、相容的、協(xié)調(diào)的,而除了特殊地形外不會出現(xiàn)視差突變、跳躍的情況?;谶@一原理,可以利用影像整體的視差對每個點的匹配過程進行約束。

RANSAC是計算機視覺中穩(wěn)定的參數(shù)估計算法,其作用是排除不穩(wěn)定和錯誤的匹配點對,對于兩張影像間的幾何關(guān)系進行最似然模擬。其思想就是根據(jù)已知同名點對估計單應矩陣H,再根據(jù)求出的變換矩陣對于已知同名點對進行劃分,篩選出符合模型的同名點,利用新的同名點集重新估計變換模型。這樣迭代若干次后同名點對數(shù)最多時的單應矩陣H即為最優(yōu)解。也可以說,利用盡可能多的同名像點估計的單應矩陣H更具有一般性,能對更大范圍的像點進行有效的幾何約束。

篇8

關(guān)鍵詞:CCD、軌跡、圖像處理

視覺在人類生活中起著非常重要的作用,人們每天都通過眼睛采集大量的信息,這些信息經(jīng)過大腦的處理,成為人們認知和理解世界的基礎(chǔ)。機器人視覺信息主要指CCD攝像機采集的二維圖像信息。視覺信息能否被正確、實時地處理直接關(guān)系到機器人對障礙物的避碰、對路標的識別以及對路徑的跟蹤,對系統(tǒng)的實時性和魯棒性具有決定性的作用。視覺信息的處理技術(shù)是移動機器人研究中關(guān)鍵的技術(shù)之一。為了簡化視覺信息處理,通常把移動機器人的工作環(huán)境分為結(jié)構(gòu)化道路環(huán)境和非結(jié)構(gòu)化道路環(huán)境。結(jié)構(gòu)化道路的檢測相對來說較易實現(xiàn),其檢測技術(shù)一般都以邊緣檢測為基礎(chǔ),輔以Hough變換、模式匹配等,并利用最小二乘法對應于道路邊界的線條,得出道路的幾何描述。由于非結(jié)構(gòu)化道路的環(huán)境復雜、特征描述困難,使得非結(jié)構(gòu)化道路的檢測及信息處理復雜化。

近年來,機器人視覺導航技術(shù)有了很大的發(fā)展。移動機器人的工作環(huán)境可能比較復雜,因此,提高圖像識別的準確性以實現(xiàn)移動機器人的準確定位是移動機器人完成其導航任務的首要前提;同時,由于移動機器人在導航過程中需要實時的采集并分析圖像信息,從而實現(xiàn)對作業(yè)環(huán)境的識別以進行準確的路徑跟蹤。因此,如何在提高圖像識別的準確性的同時達到較好的實時性是移動機器人視覺技術(shù)的一個發(fā)展方向

   1.圖像處理

數(shù)字圖像處理,是對數(shù)字圖像信息進行加工以滿足人的視覺心理或應用需求的行為,數(shù)字圖像處理的英文名稱是"Digital Image Processing'',通常所說的數(shù)字圖像處理是指用計算機對圖像進行的處理,因此也稱為計算機圖像處理。圖像處理就是用一系列的特定操作來改變圖像的像素,以達到特定的目標,比如使圖像更清晰,或者從圖像中提取某些特定的信息等。

CCD攝像頭的主要工作原理具體而言,就是攝像頭連續(xù)地掃描圖像上的一行,輸出就是一段連續(xù)的電壓視頻信號,該電壓信號的高低起伏正反映了該行圖像的灰度變化情況。當掃描完一行,視頻信號端就輸出低于最低視頻信號電壓的電平(如0.3v),并保持一段時間。這樣相當于,緊接著每行圖像對應的電壓信號之后會有一個電壓"凹槽",此"凹槽"叫做行同步脈沖,它是掃描換行的標志。然后就需要跳行,跳過一行后(因為攝像頭是隔行掃描的方式),開始掃描新的一行,如此下去,直到掃描完該行的視頻信號,接著就會出現(xiàn)一段場消隱區(qū)。此區(qū)中有若干個復合消隱脈沖,其中會有個脈沖遠寬于(即持續(xù)時間長于)其它的消隱脈沖,該消隱脈沖又稱為場同步脈沖,它是掃描換行的標志。場同步脈沖標志著新的一場的到來,不過,場消隱區(qū)恰好跨在上一場的結(jié)尾部分和下一場的開始部分,要等到場消隱區(qū)過去,下一場的視頻信號才真正到來。攝像頭每秒掃描25幅圖像,每幅又分奇、偶兩場,先奇場后偶場,故每秒掃描50場圖像。奇場時只掃描圖像中的奇數(shù)行,偶場時則只掃描偶數(shù)行。

選擇一款具有全電視信號輸出的黑白CCD圖像傳感器,用LMl881進行信號分離,結(jié)合A/D采樣,實現(xiàn)了視頻信號的采集。在總線周期為400M的情況下,每行采集72個有效數(shù)據(jù),攝像頭每場信號有320行,其中第23到310行為視頻信號。我們從中均勻采集了24行,最后得到一個24×72的二維數(shù)組。

CCD采集的原始數(shù)據(jù)包含了黑線的位置信息,為了穩(wěn)定可靠地提取這一信息,有一下幾種方法:

(1)二值化算法

算法的思路是:設(shè)定一個閾值value,對于視頻信號矩陣中每一行,從左至右比較各像素值和閾值的大小。若像素值大于等于閾值,則判定該像素對應的是白色道路;反之,則判定對應的是目標指引線。記下第一次和最后一次出現(xiàn)像素值小于閾值時的像素點的列號,算出兩者的平均值,以此作為該行上目標指引線的位置。該算法的思想簡單,具體實現(xiàn)時還可以一旦檢測到左邊緣后就退出該行掃描,這樣上面的流程圖將變得更加簡潔。但是這種提取算法魯棒性較差,當拍攝圖像中只有目標指引線一條黑線時,還能準確提取出目標指引線。但當光強有大幅度的變化,或圖像中出現(xiàn)其它黑色圖像的干擾時,并且離機器人比較近的黑線比較的明顯,離機器人越來越遠時黑線越來越淡,該算法提取的位置有可能與目標指引線的實際位置偏離較大。

(2)直接邊緣檢測算法

算法的思路是:設(shè)定一個閾值,對于視頻信號矩陣中每一行,從左至右求出相鄰兩像素值的差值(左減右)。若差值大于等于閾值,則判定下一個的像素點對應的是目標指引線的左邊緣,以此像點作為該列的特征點,記錄下此像素點的列號,作為該行上目標指引線的位置。當然,可能出現(xiàn)差值始終小于閾值的情況,此時一種方法是令該行上目標指引線位置為0,通過進一步濾波或擬合來修正;另一種方法是讓該行上目標指引線位置和通過上一場視頻數(shù)據(jù)求得的位置一樣。

該算法較二值化方法而言,抗環(huán)境光強變化干擾的能力更強.同時還能削弱或消除垂直交叉黑色指引線的干擾。因為該算法在視頻信號矩陣中是由左至右來尋找目標指引線的左邊緣的,所以當黑色圖像出現(xiàn)在目標指引線左方時,該算法無法排除干擾,而當其出現(xiàn)在右方時,則可以排除干擾。

(3)跟蹤邊緣檢測法

這種算法跟直接邊緣榆測算法一樣,也是尋找出目標指引線的左邊緣,仍然用左邊緣的位置代表目標指引線的位置。但跟蹤邊緣檢測從視頻信號矩陣每行中尋找左邊緣的方法與直接邊緣檢測法不同。

因為目標指引線是連續(xù)曲線,所以相鄰兩行的左邊緣點比較靠近。跟蹤邊緣檢測正是利用了這一特性,對直接邊緣檢測進行了簡化。其思路是:若已尋找到某行的左邊緣,則下一次就在上一個左邊緣附近進行搜尋。這種方法的特點是始終跟蹤每行左邊緣的附近,去尋找下一列的左邊緣,所以稱為"跟蹤"邊緣檢測算法。

在首行邊緣檢測正確的前提下,該算法具有較強的抗干擾性,能更有效地消除垂直交叉黑色指引線的干擾,以及指引線外黑色圖像的影響,始終跟蹤目標指引線。

另外,較之前兩種算法,跟蹤邊緣檢測算法的時間復雜度更低,因此效率更高。但值得注意的是第一行的左邊緣位置對整個目標指引線的搜尋影響 很大,一旦它的位置和實際導引線偏差較大,就會產(chǎn)生一連串的錯誤,這是不可容忍的。

通過比較本系統(tǒng)選擇了效率更高,更可靠的跟蹤邊緣檢測法。流程圖如圖所示:

                           

2.結(jié)論

本文中圖像處理和路徑信息識別的方法,并對不同時刻不同位置采集到的圖像的處理效果進行比較研究,結(jié)合實際環(huán)境中的圖像特點,確定出適合于本研究的圖像處理算法。提出了改善路徑信息辨識速度和精度的方法。

參考文獻:

[1]張文志,呂恬生.基于改進的遺傳算法和模糊邏輯控制的移動機器人導航[J].機器人.2003,

25(1):1

[2]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報.2000,26(1):44-45

[3]吳文琪,孫增圻.機器視覺中的攝像機定標方法綜述[J].計算機應用研究.2004,21(2):4-5

篇9

關(guān)鍵詞:彩色圖像聚類算法;K-means算法;行為分析

中圖分類號:TP391 文獻標志碼:A 文章編號:1009-3044(2015)13-0180-02

隨著科學技術(shù)的不斷發(fā)展、計算機應用領(lǐng)域的不斷開拓,圖像處理方法應運而生,目的是利用計算機設(shè)備將圖像進行分類處理,用于智能分析圖像信息。當今圖像處理與識別的應用范圍越來越廣,但就目前的水平而言,計算機對外部的感知能力還比較薄弱,還需要投入大量人力、物力從事數(shù)字圖像處理與識別的理論和應用的研究。于是各行各業(yè)對于數(shù)字圖像處理技術(shù)的精確化與智能化有著更大的需求。這樣的需求尤其體現(xiàn)在航空航天、生物醫(yī)學工程、工業(yè)檢測、機器人視覺、公安司法、文化藝術(shù)等領(lǐng)域。

而本文針對數(shù)字圖像處理技術(shù)的特性,將其應用在普遍計算機操作行為的分析之中,實現(xiàn)了一種根據(jù)計算機操作過程中顯現(xiàn)的圖像色彩來智能分析其操作行為的創(chuàng)新功能。

1 算法簡介

彩色圖像的聚類分析以及K-means算法是本課題的關(guān)鍵。本文通過彩色圖像聚類分析與K-means算法將圖像轉(zhuǎn)化為3類模塊,分別為正常圖像,渲染圖像與灰度圖像。對這3類模塊同時進行遍歷與聚類,計算出其影響行為分析判斷的影響色塊區(qū)間與影響深度區(qū)間,基于兩類區(qū)間相互結(jié)合,最終依照閥值界限對原圖像進行行為判斷,得出操作行為分析結(jié)論。

圖1為算法結(jié)果演示圖。

2 算法實現(xiàn)

2.1獲取計算機圖像

獲取當前窗體的大小,創(chuàng)建一個以當前窗體為模板的圖象,創(chuàng)建一個位圖Bitmap繪圖圖面,得到窗體的句柄和圖像的句柄,復制土塊的光柵操作碼,調(diào)用API函數(shù),實現(xiàn)窗體捕獲。釋放句柄,保存圖像。本例中圖像結(jié)果如圖2。

2.2彩色圖像聚類分析

根據(jù)行為分析圖像?自定義顏色的色系,程序?qū)@取的圖像,統(tǒng)一轉(zhuǎn)化為rgb格式,遍歷圖像的像素點,獲取圖像中色系種類與比例及色系的位置,統(tǒng)計主要顏色所在色系的權(quán)重。根據(jù)自定義的色彩模型,分析圖像內(nèi)容。

基于色彩圖像的RGB格式,建立三維坐標圖,其中R為X軸,G為Y軸,B為Z軸,坐標軸長度均為255,根據(jù)近似色的微小差別,將三通道色素劃分為14個色系,即14個色彩區(qū)塊,之后根據(jù)色彩區(qū)塊的冷暖調(diào)與鮮明程度,與已有的操作行為圖像結(jié)果進行匹配統(tǒng)計得出具體閥值。圖4為劃分的部分色系圖。

根據(jù)彩色圖像將所有像素點規(guī)劃到14個色彩區(qū)塊,之后遍歷所有像素點將其編入類組,將同一類組的像素點進行渲染形成同一顏色,圖3為渲染圖。

通過反復試驗經(jīng)驗積累,按照冷暖色調(diào)與色彩鮮明度提取出色彩區(qū)塊中該色彩比例對行為分析判斷結(jié)果造成影響的六類色區(qū)。構(gòu)建一個影響色塊區(qū)間,存放六類色區(qū)中最終對行為分析結(jié)果造成影響的像素點。統(tǒng)計這六類色區(qū),當某一色區(qū)所占總像素比例超過指定閥值時(本閥值是在反復試驗中經(jīng)過大量已歸類行為圖片分析計算后歸約出來的行為色彩區(qū)分界限),保存其色區(qū)像素比例致影響色塊區(qū)間。圖5為主色系所占比例。

2.2灰度圖像聚類分析

本研究中對于灰度圖像的聚類分析主要根據(jù)K-means算法進行聚類實現(xiàn)。

本研究所采用的K-Means聚類算法的優(yōu)點主要集中在:算法快速、簡單;對大數(shù)據(jù)集有較高的效率并且是可伸縮性的;時間復雜度近于線性,而且適合挖掘大規(guī)模數(shù)據(jù)集。

K-Means聚類算法的時間復雜度是O(nkt) ,其中n代表數(shù)據(jù)集中對象的數(shù)量,t代表著算法迭代的次數(shù),k代表著簇的數(shù)目。

K-means算法具體流程為:

1)隨機選取k個聚類質(zhì)心點(cluster centroids)為[μ1,μ2,...,μk∈Rn]。

2)重復下面過程直到收斂

對于每一個樣例i,計算其應該屬于的類

[c(i)=argminj||x(i)-μj||2]

對于每一個類j,重新計算該類的質(zhì)心

[μj:=i=1m1{c(i)=j}x(i)i=1m1{c(i)=j}]

在 K-means 算法中 K 的選取均有人工指定,而 K 值的選定是非常難以估計的。本文在對大量原始數(shù)據(jù)實驗結(jié)果的基礎(chǔ)上進行總結(jié),得出當k值選定為5時,對于操作行為分析具有最佳精準度。

在 K-means 算法中,首先需要根據(jù)初始聚類中心來確定一個初始劃分,然后對初始劃分進行優(yōu)化。這個初始聚類中心的選擇對聚類結(jié)果有較大的影響,一旦初始值選擇不當,則可能無法得到有效的聚類結(jié)果。本研究中初始聚類中心,是根據(jù)彩色圖像的比例最大的主色系的位置的中心來設(shè)定的。

3 算法效果

本文針對目前市面中出現(xiàn)率頻繁的娛樂游戲、電影、辦公軟件、學習軟件進行檢測,本算法效果有著較強實用性。其中,深色系游戲與電影分析的效果顯著,如《英雄聯(lián)盟》、

《DOTA》、《哈利波特》。而淺色系游戲,在特定場景中分析效果會受到干擾,如《劍網(wǎng)三》當中對圖片進行光暈處理后,其影像色彩區(qū)間受到波動。對此現(xiàn)象,經(jīng)過大量的圖片測試,對游戲類的圖像進行了歸納,這對今后的算法修改提供了很好的數(shù)據(jù)矯正。

4 結(jié)束語

本文立足于圖像處理技術(shù)的創(chuàng)新與應用,并將圖像處理技術(shù)與計算機操作行為分析相結(jié)合,運用自編彩色圖像聚類分析算法對圖像色彩進行分類統(tǒng)計,構(gòu)建影響色彩區(qū)間并對區(qū)間色彩進行操作行為匹配,劃定區(qū)間閥值。以及引入K-means算法對圖像進行灰度化處理,通過實驗數(shù)據(jù)結(jié)果以及經(jīng)驗選擇K值以適應行為分析計算,同時構(gòu)建深度影響區(qū)間,對圖像色彩深度進行分類,最終結(jié)合影響色彩區(qū)間劃定行為分析界限。實現(xiàn)了智能分析計算機操作行為的創(chuàng)新,擺脫人工監(jiān)控與識別行為。這對將來自動對計算機圖像界面、行為模式分析的監(jiān)控與統(tǒng)計提供了可觀的價值。

參考文獻:

[1] Parker J R. 圖像處理與計算機視覺算法及應用[M]. 2版. 北京: 清華大學出版社, 2012.

[2] 趙春江. C#數(shù)字圖像處理算法典型實例[M]. 北京: 人民郵電出版社, 2009.

[3] 謝鳳英. 數(shù)字圖像處理及應用[M]. 北京: 電子工業(yè)出版社, 2008.

篇10

關(guān)鍵詞:手勢分割;輪廓模型;運動分析;膚色提取

中圖分類號:TP391.41

隨著計算機技術(shù)的發(fā)展,出現(xiàn)了物聯(lián)網(wǎng)、信息物理系統(tǒng)(CPS)等新概念、新技術(shù),人機交互技術(shù)的重要性更加凸顯并成為當前信息產(chǎn)業(yè)競爭中的一個焦點。與傳統(tǒng)的交互方式相比,手勢以其獨有的簡潔、直觀、人性化、信息量豐富的特點成為與計算機交互的媒介。手勢分割是整個手勢識別系統(tǒng)中的起點和關(guān)鍵技術(shù)之一,其分割質(zhì)量的好壞直接影響到后續(xù)操作如特征提取、目標識別的最終效果。手勢分割[1]可以理解為從包含手勢的圖像中提取出有意義地手勢區(qū)域的過程,其主要特點是選取如顏色,灰度等與無意義區(qū)域有明顯差異的特征,將手勢區(qū)域與無意義區(qū)域分離,致使二者之間存在更為明顯差異。因此對于基于內(nèi)容的圖像檢索,對象分析等提取有用信息,必須采用分割效果較好的分割方法。作為計算機視覺中的一個重要研究內(nèi)容,手勢分割技術(shù)在圖像處理領(lǐng)域有著至關(guān)重要的地位。

1 基于活動輪廓模型的分割技術(shù)

活動輪廓模型的提出給傳統(tǒng)的圖像分割和邊界提取技術(shù)帶來了重大突破?;顒虞喞P褪侵冈趫D像域上的曲線(曲面),在圖像力(內(nèi)力)和外部約束力共同作用下向物體邊緣靠近的模型,外部約束力是由圖像數(shù)據(jù)定義的?;顒虞喞P椭饕赡P偷拿枋?,模型的能量函數(shù)和模型的最小化組成?;诨顒虞喞P偷姆指罘椒ㄊ且环N半自動的基于先驗知識和用戶交互的圖像分割。根據(jù)使用方式、應用曲線的類型和圖像能量項的選擇等,將其劃分為基于變分法的活動輪廓模型和幾何活動輪廓模型的分割方法。

1.1 基于變分法的活動輪廓模型分割方法

在1987年Kass,Witkin和Terzopoulos提出了Snake模型[2] ,即基于變分法的活動輪廓模型,又稱為參數(shù)活動輪廓模型。它是直接以不規(guī)則排列的不連續(xù)點構(gòu)成曲線或基函數(shù)構(gòu)成的曲面的參數(shù)形式顯式地表達曲線/曲面的演化。其工作機制是首先為給定的模型構(gòu)造所需的能量函數(shù),其次利用變分法對該能量函數(shù)極小化,最后根據(jù)獲得模型演化的偏微分方程,當輪廓線到達目標邊界時,能量函數(shù)達到最小值而自動停止。該模型的優(yōu)點是把圖像分割問題轉(zhuǎn)化成泛函數(shù)求極值問題,通過合適地初始化后輪廓線能夠自主地收斂于能量極小值狀態(tài),從而獲得正確的邊界,同時保持了邊界的光滑性,降低計算復雜度。但是Snakes模型的缺點是分割的最終效果與活動輪廓的初始位置有關(guān),需要依賴其他方式將Snake放置在感興趣圖像特征周圍;當靠近曲率高的邊緣時,活動輪廓線有可能收斂到局部極值點,甚至發(fā)散;其拓撲結(jié)構(gòu)不易改變。

1.2 幾何活動輪廓模型分割方法

幾何活動輪廓模型分割方法主要是基于曲線進化的思想和水平集方法共同描述曲線進化的過程,因為采用了水平集方法而隱含有拓撲變化的能力,使得更為復雜結(jié)構(gòu)的圖像分割成為可能。其原理是把平面閉合曲線隱性地表示為具有相同函數(shù)值的點集,然后根據(jù)曲面的進化過程來隱性求解曲線的進化過程,嵌入的曲面總是其零水平集,因此只要確定零水平集就能夠確定移動界面演化的結(jié)果。由于幾何活動輪廓模型的初始輪廓線與參數(shù)特性無關(guān),無需對曲線重新進行參數(shù)化,它是在輪廓曲線(如曲率)的幾何特性的推動下運動到目標邊緣,這就彌補了基于變分法的活動輪廓模型的某些缺陷,比如因為水平集方法的引入,從而可以自然的處理拓撲結(jié)構(gòu)的變化。對初始位置不敏感,避免了參數(shù)活動輪廓模型必須重復地參數(shù)化曲線,提供了穩(wěn)定的數(shù)值算法等優(yōu)點,基于上述優(yōu)點,研究學者們把幾何活動輪廓模型越來越廣泛的應用到計算機視覺和圖像處理領(lǐng)域。但該模型的不足之處是僅僅利用了圖像區(qū)域的灰度信息,致使圖像邊緣定位的精確度不高。因此目前幾何活動輪廓模型分割方法研究的重點和難點是如何求解出不同的輪廓曲線能量函數(shù),獲取所需的圖像分割結(jié)果。

2 基于運動分析的分割技術(shù)

視頻序列中的手勢圖像作為一種運動目標實體是手勢識別系統(tǒng)的研究重點和難點。視頻中的運動目標分割的是指在二維連續(xù)圖像序列中,將感興趣的運動目標實體從場景中提取的過程。但是由于視頻場景的復雜性,如受到光照、陰影等因素的影響,使得運動目標的分割變得困難。針對不同運動視頻場景而言,目前常用于視頻圖像序列中的手勢分割方法主要有以下幾種:基于背景減法的分割方法、基于幀間差閾值的方法、基于光流場的分割方法。

2.1 基于背景減法的分割方法

基于背景減法的分割方法原理是先選取多幅圖像的平均構(gòu)建一個背景圖像,利用當前幀圖像與背景幀圖像相減,進行背景消去來獲得差分圖像,最后通過設(shè)定閾值進行目標提取的一種檢測運動區(qū)域算法。這種方法的優(yōu)點在于原理和算法都比較簡單,根據(jù)它較為完整的特征數(shù)據(jù),更好的解決幀間差分法中目標區(qū)域偏大,目標內(nèi)部出現(xiàn)孔洞等問題。但是由于受光照變化和外部條件的影響,場景的動態(tài)變化致使目標陰影的出現(xiàn),導致檢測的最終效果受到干擾,還有對于背景的更新問題也難以解決。

2.2 基于幀間差分閾值的分割方法

2.3 基于光流場的分割方法

光流技術(shù)的思想是通過序列圖像中各個像素的矢量特征對光流方程進行求解,從而檢測出運動區(qū)域,其實質(zhì)是求解運動目標的速度。基于光流法的分割方法[3]也稱為連續(xù)處理方法,是由光流場估計和運動場模型構(gòu)成,通常忽略相鄰時刻之間的間隔。在攝像機運動時,能夠有效地反映出運動不一致的區(qū)域,具有較好魯棒性,該方法能夠在進行運動檢測時,給出運動的大小和方向信息。光流法具有很多優(yōu)點的同時,也存在一些問題,對于運動物體遮擋和運動偏差,沒有有效的解決手段。計算過程相當復雜,導致所使用的計算時間太長,一般條件下不能應用于全幀視頻流的實時處理。此外還會衰減目標的邊緣運動信息,將運動邊界模糊化,最終降低了分割準確性。

3 基于膚色檢測的分割技術(shù)

同其他特征的處理方式相比,顏色特征的處理更快捷簡單,同時對方向不敏感,所以膚色檢測在人臉和手勢的識別與跟蹤、數(shù)字視頻處理、安全防范、醫(yī)療保健等領(lǐng)域有著極為廣泛的應用價值。根據(jù)有沒有涉及成像過程,將膚色檢測方法分成基于統(tǒng)計的方法和基于物理的方法兩種基本類型。

基于統(tǒng)計的膚色檢測是利用建立的膚色統(tǒng)計模型實現(xiàn)膚色檢測,包括顏色空間的選取和膚色建模兩個方面,主要分為靜態(tài)膚色檢測和動態(tài)膚色檢測。顏色空間是顏色的一種數(shù)學表示方式,人們對顏色的研究和應用產(chǎn)生了許多不同的顏色空間,例如用于電視工業(yè)的YUV,YIQ,YCbCr,色度學的CIE-RGB真實三原色系統(tǒng)和CIE-XYZ虛擬三原色系統(tǒng),面向色調(diào)的HIS,HSL,HSV等HS系列和TSL。靜態(tài)膚色模型中,目前常用的主要為非參數(shù)化的直方圖統(tǒng)計、閾值化的規(guī)定膚色范圍。直方圖統(tǒng)計膚色模型是一種非參數(shù)模型,理論上因為與膚色分布形態(tài)無關(guān),所以速度快。但是不足之處就是需要大量的統(tǒng)計樣本和存儲空間,更適用于大規(guī)模訓練和測試的圖像數(shù)據(jù)。由于受到某些顏色空間的色域沒有規(guī)則的邊界的影響,閾值化的規(guī)定膚色范圍主要考慮何種顏色空間適合以及如何確定規(guī)則的參數(shù)。目前主要包括能夠適應成像條件隨時間的變化的圖像和將膚色模型參數(shù)調(diào)節(jié)到適應具體的某幅靜態(tài)圖像的兩大類動態(tài)膚色建模方法。但是一般情況這些自適應的方法所建立的模型通用性較差,只有規(guī)定在具體特定條件下才能得到較高的檢測率。

基于物理的方法從皮膚的光學特性出發(fā),引入照明和皮膚間的相互作用,估計膚色可能的分布范圍,盡可能實現(xiàn)膚色的光照不變性。在復雜光照條件,基于統(tǒng)計的膚色檢測技術(shù)不能有效分割感興趣區(qū)域時,就需要此方法對膚色區(qū)域進行檢測和糾正??傊谖锢淼哪w色檢測和基于統(tǒng)計的膚色檢測所使用的數(shù)學工具基本相同,主要差異在于是否利用解釋皮膚輻射特性的物理模型。

目前膚色檢測技術(shù)仍然存在一些問題:

(1)環(huán)境因素:復雜照明或復雜背景下的膚色檢測效果欠佳,單一手段不能獲取理想的分割效果。

(2)因為目前還沒有建立起統(tǒng)一的膚色數(shù)據(jù)庫,運用定量的手段對各種膚色檢測技術(shù)的性能進行比較是難以實現(xiàn)的。因此為了能夠客觀地比較各種膚色的性能,應該著手建立一個統(tǒng)一的系統(tǒng)測評方法和規(guī)范。

(3)顏色空間的選擇和量化級數(shù)與膚色建模和分類方法有關(guān),膚色不是很獨特,會出現(xiàn)類膚色與膚色范圍重疊,因此應該采用均勻的顏色空間,而不要只局限于比較不同顏色空間的膚色分布形態(tài)和交疊情況。

4 總結(jié)

隨著手勢識別技術(shù)的廣泛應用,手勢圖像質(zhì)量要求越來越高,出現(xiàn)了多種手勢分割的算法。這些算法各有其優(yōu)缺點,目前涉及到的大部分算法都是針對較為簡單環(huán)境下,理想和清晰的目標圖像。但是在實際處理過程中,特別是在復雜多變的環(huán)境中,想使用單一的分割方法分割出較好的手勢圖像還存在明顯不足。比如復雜環(huán)境下出現(xiàn)與手勢膚色重疊的情況下,會造成干擾以及運動目標識別困難,使得分割的手勢圖像存在偏差。另外在獲取手勢視頻序列過程中,往往受光照角度和亮度,背景復雜度以及光源的顏色的影響,也無法得到理想的手勢分割圖像。那么如何在復雜多變的情況下將人手高效地分離出來,同時提高獲取圖像的實時性,將成為后續(xù)的研究重點。

參考文獻:

[2]王輝.基于視覺的實時手勢跟蹤與識別及其在人機交互中的應用[D].杭州:浙江大學,2008.

[2]李培華,張?zhí)镂?主動輪廓線模型綜述[J].軟件學報,2000,11(6):751-757.

[3]Jun Zhao, Shuguang Zhao, Yuan Wang. A novel method for moving object detection in intelligent video surveillance systems[A]. International Conference on Computational Intelligence and Security[C],IEEE,2006,2:1797-1800.