時(shí)間:2023-03-14 14:49:21
導(dǎo)語:在圖像處理技術(shù)論文的撰寫旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。

簡單來說,計(jì)算機(jī)圖像處理技術(shù)就是將一些圖像、視頻、圖片等進(jìn)行數(shù)字轉(zhuǎn)化,并且通過轉(zhuǎn)化將其變成計(jì)算機(jī)技術(shù)所能識別的固定代碼,從而便于計(jì)算機(jī)進(jìn)行識別和美化,通過對圖像的一些操作使圖像呈現(xiàn)出我們想要的圖像效果,計(jì)算機(jī)圖像處理技術(shù)的處理速度是相對較快的,而且其存儲空間也相對較大,所以,對于那些已經(jīng)處理過的圖像和視頻可以直接保存,同時(shí),隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,計(jì)算機(jī)圖像處理技術(shù)也取得了一定的進(jìn)展,計(jì)算機(jī)圖像處理技術(shù)只需要將數(shù)字轉(zhuǎn)化為紅、黃、藍(lán)三種原始色彩的數(shù)字圖像就可以,然后計(jì)算機(jī)通過對這些圖像進(jìn)行分析和處理,從而實(shí)現(xiàn)圖像的多樣化操作,同時(shí),計(jì)算機(jī)圖像處理技術(shù)的提高也體現(xiàn)在圖像清晰度和分辨率,以及圖像傳輸率等技術(shù)的提升和發(fā)展。
2計(jì)算機(jī)圖像處理技術(shù)在網(wǎng)頁設(shè)計(jì)中的應(yīng)用
在網(wǎng)頁設(shè)計(jì)的過程中,圖像的處理和美化是其中最重要的環(huán)節(jié)之一,在一些較為復(fù)雜的網(wǎng)頁中,可能會包含一些動態(tài)的圖像以及flash元素等,這些元素的存在無疑增加了網(wǎng)頁的特色,同時(shí),也會提高客戶體驗(yàn),為了保持這些元素的鮮明性就需要將計(jì)算機(jī)圖像處理技術(shù)很好的應(yīng)用到網(wǎng)頁設(shè)計(jì)中,提高網(wǎng)頁質(zhì)量的同時(shí),增加網(wǎng)頁的特點(diǎn)。
2.1滿足網(wǎng)頁設(shè)計(jì)中對于圖片格式的需求
滿足網(wǎng)頁設(shè)計(jì)中對圖片格式的需求是網(wǎng)頁設(shè)計(jì)過程中最基礎(chǔ)的環(huán)節(jié),在網(wǎng)頁設(shè)計(jì)中,需要各種不同的元素來組成一個(gè)完整的、特色鮮明的網(wǎng)頁,從而讓瀏覽者瞬間獲取自己所需要的信息和資源,同時(shí),網(wǎng)頁設(shè)計(jì)必須具有一定的便捷性,這樣才能有效的增加用戶體驗(yàn),同時(shí)增強(qiáng)用戶瀏覽體驗(yàn)的感受,由此可見,圖像的處理是網(wǎng)頁設(shè)計(jì)中最基礎(chǔ)的內(nèi)容,所以,計(jì)算機(jī)圖像處理技術(shù)首先需要處理的就是網(wǎng)頁設(shè)計(jì)中的圖像問題,其中jpeg是最為常用的圖片格式,而gif可以實(shí)現(xiàn)圖像的動態(tài)效果,由于這兩種的網(wǎng)絡(luò)圖像格式所需要的參數(shù)和規(guī)格是不盡相同的,所以在應(yīng)用計(jì)算機(jī)圖像處理技術(shù)時(shí),應(yīng)該滿足其格式的不同需求。
2.2對網(wǎng)頁設(shè)計(jì)中圖像的大小進(jìn)行控制
眾所周知,計(jì)算機(jī)的長度和寬度是有限的,這在一定程度上就決定了網(wǎng)頁設(shè)計(jì)的圖像也應(yīng)該是有一定的規(guī)格,同時(shí),為了保障網(wǎng)頁瀏覽的清晰度和流暢度,就需要對網(wǎng)頁中的圖像進(jìn)行一些特定的處理來限制其圖像的大小,由于圖像的大小與其所展現(xiàn)的清晰度有直接關(guān)系,所以,需要借助計(jì)算機(jī)圖像處理技術(shù)來進(jìn)行處理,以此來緩解清晰度和圖像大小之間的矛盾,在追求圖片高清晰度的同時(shí),提高網(wǎng)頁加載的速度和質(zhì)量,同時(shí)提高網(wǎng)頁瀏覽的效果。計(jì)算機(jī)圖像處理技術(shù)主要是一種針對jpeg圖片進(jìn)行處理來權(quán)衡加載速度和網(wǎng)頁瀏覽效果的一種技術(shù),從而提高網(wǎng)頁設(shè)計(jì)的瀏覽效果和網(wǎng)頁質(zhì)量。
2.3對網(wǎng)頁設(shè)計(jì)進(jìn)行進(jìn)一步的開發(fā)
只有綜合運(yùn)用計(jì)算機(jī)圖像處理技術(shù)對網(wǎng)頁設(shè)計(jì)進(jìn)行進(jìn)一步的開發(fā)和應(yīng)用,才能從根本上提高網(wǎng)頁設(shè)計(jì)效果,近年來,計(jì)算機(jī)圖像處理技術(shù)主要是以軟件為主,photoshop是目前最為常用的圖片處理軟件,但是,隨著網(wǎng)頁設(shè)計(jì)的不斷普及和發(fā)展,出現(xiàn)了更多網(wǎng)頁個(gè)體設(shè)計(jì)者,為了滿足不同個(gè)體對網(wǎng)頁設(shè)計(jì)的個(gè)性化需求,同時(shí)帶動個(gè)體成為網(wǎng)頁設(shè)計(jì)的主流,豐富網(wǎng)頁的內(nèi)容和色彩,就需要適當(dāng)?shù)慕档陀?jì)算機(jī)圖像處理技術(shù)的技術(shù)水平,以此滿足社會大眾的需求,其中photoshop的圖片處理功能相對強(qiáng)大,但是photoshop主要是針對專業(yè)的網(wǎng)頁設(shè)計(jì)人員開發(fā)的一種技術(shù)處理軟件,所以,對于那些非專業(yè)的網(wǎng)頁設(shè)計(jì)者,這個(gè)軟件具有一定的難度,這在一定程度上限制了網(wǎng)頁設(shè)計(jì)的普及和發(fā)展,所以,為了滿足更多網(wǎng)頁開發(fā)者的設(shè)計(jì)體驗(yàn),要不斷開發(fā)出一些相對簡單和實(shí)用的計(jì)算機(jī)圖像處理技術(shù),進(jìn)而推動計(jì)算機(jī)圖像處理技術(shù)的革新和技術(shù)升級。
3結(jié)語
【關(guān)鍵詞】機(jī)器視覺 Matlab 圖像處理 尺寸測量
在工業(yè)生產(chǎn)中,測量是進(jìn)行質(zhì)量管理的手段,是貫徹質(zhì)量標(biāo)準(zhǔn)的技術(shù)保證。機(jī)械零件的尺寸檢測作為產(chǎn)品加工的一個(gè)關(guān)鍵環(huán)節(jié),其檢測結(jié)果不僅影響產(chǎn)品的質(zhì)量,而且對后續(xù)零件的再加工和裝配產(chǎn)生決定性的作用。目前,常規(guī)的零件尺寸測量手段主要采用游標(biāo)卡尺、激光測量儀和輪廓儀等完成檢測環(huán)節(jié)。以上零件尺寸測量方法要么受測量工具限制,其測量精度有限;要么檢測儀器過于昂貴且操作復(fù)雜,同時(shí)其準(zhǔn)確率往往受人為因素的影響。
鑒于當(dāng)前機(jī)器視覺技術(shù)的快速發(fā)展以及其在工業(yè)檢測方面的成功應(yīng)用,論文構(gòu)想利用攝像機(jī)替代人眼,讓計(jì)算機(jī)替代人腦,從而研制出一套針對零件常規(guī)尺寸的自動化y量系統(tǒng)。
1 系統(tǒng)概述
在充分遵循系統(tǒng)的完整性、可靠性、經(jīng)濟(jì)性和實(shí)時(shí)性等原則的基礎(chǔ)上,本文設(shè)計(jì)出了一套基于機(jī)器視覺的零件常規(guī)尺寸測量系統(tǒng)。該測量系統(tǒng)主要由圖像攝取、圖像處理、圖像特征提取和分析、圖像常規(guī)尺寸測量和結(jié)果輸出幾部分組成。其工作原理圖如圖1所示。
2 硬件設(shè)計(jì)
基于機(jī)器視覺的零件常規(guī)尺寸測量系統(tǒng)的硬件主要包括:照明裝置、攝像機(jī)、計(jì)算機(jī)和透明工作臺。各部件的主要功能是:照明裝置主要為零件圖像采集提供合適的光照環(huán)境;攝像機(jī)用來采集零件數(shù)字圖像并傳送到計(jì)算機(jī),然后保存為相應(yīng)圖片格式;計(jì)算機(jī)通過系統(tǒng)軟件實(shí)現(xiàn)對零件圖像的預(yù)處理、邊界提取、特征提取、相機(jī)標(biāo)定和常規(guī)尺寸計(jì)算;透明工作臺用來承載被測零件。
3 算法設(shè)計(jì)
圖像處理算法對機(jī)器視覺測量系統(tǒng)會產(chǎn)生決定性的影響。為了能滿足零件尺寸測量的要求,針對零件產(chǎn)品圖像的特點(diǎn),我們設(shè)計(jì)了一套合理的圖像處理算法流程。其流程圖如圖2所示。
首先對獲取的零件圖像進(jìn)行預(yù)處理,包括圖像灰度化、圖像去噪、圖像分割和邊界提??;然后提取零件的幾何特征;最后通過對系統(tǒng)的標(biāo)定,實(shí)現(xiàn)了零件圖像常規(guī)尺寸的測量和結(jié)果顯示。
3.1 圖像預(yù)處理
3.1.1 圖像灰度化
經(jīng)過攝像機(jī)采集到的零件圖像是24位真彩色RGB圖像,該圖像中的每個(gè)像素由R、G、B三個(gè)分量決定,而灰度圖像的每個(gè)像素由一個(gè)值確定。為了減少后續(xù)操作過程中的計(jì)算量,需要對采集到的零件圖像進(jìn)行灰度化處理。
3.1.2 圖像去噪
采集系統(tǒng)獲取的待檢零件圖像由于受照明程度、環(huán)境溫度、電源變化、電磁輻射和振動等隨機(jī)因素的干擾,圖像會包含大量的噪聲,表現(xiàn)為圖像模糊、失真和大量斑點(diǎn)等。為了消除和抑制噪聲對零件圖像后續(xù)處理的影響,必須對圖像進(jìn)行濾波處理。由于中值濾波既能消除噪聲又能保持圖像的細(xì)節(jié),符合本系統(tǒng)檢測的需求。
3.1.3 圖像分割
在所采集到的零件圖像中,我們只對零件區(qū)域本身感興趣,對于圖像中的其他要素則要盡量消除。圖像分割就是指把圖像分成各具特性的區(qū)域,并提取出感興趣目標(biāo)的技術(shù)和過程。經(jīng)過大量的實(shí)驗(yàn)驗(yàn)證,本文采用迭代閾值分割法實(shí)現(xiàn)對零件圖像的分割,達(dá)到了預(yù)期的處理效果。
3.1.4 邊界提取
輪廓是對物體形狀的有力描述,對圖像分析和識別十分有用,而通過邊界提取算法就可以得到物體的邊界輪廓。目標(biāo)圖像邊界提取的方法很多,主要包括鏈碼表示法、標(biāo)記圖法以及多邊形近似法等。論文采用8連通鏈碼法對待測零件進(jìn)行了邊界提取,為后續(xù)零件尺寸的檢測奠定了很好的基礎(chǔ)。
3.2 圖像分析
3.2.1 特征檢測
要測量零件的尺寸,首先應(yīng)該檢測出零件所包含的直線和圓等基本的幾何特征。目前常用的幾何特征檢測方法有Hough變換法、擬合法和模板匹配法等。本文采用最小二乘法實(shí)現(xiàn)了對直線和圓的擬合,其擬合具體過程如下:
(1)采用最小二乘法實(shí)現(xiàn)對直線的擬合。
(2)采用最小二乘法實(shí)現(xiàn)對圓和圓弧的擬合。
采用最小二乘法對圓和圓弧的擬合過程與直線的擬合求解過程類似。設(shè)所求擬合圓的方程為:。根據(jù)最小二乘法應(yīng)滿足的條件,可以求出擬合圓的三個(gè)參數(shù):u、v和r。
這樣,通過基于最小二乘法的直線和圓擬合方法,可以順利檢測到直線和圓弧幾何特征,為后續(xù)零件尺寸的測量奠定了基礎(chǔ)。
3.2.2 系統(tǒng)的標(biāo)定
相機(jī)拍攝到的圖像是以像素為單位的,要得到待檢零件的實(shí)際尺寸,需要將像素尺寸轉(zhuǎn)換為長度尺寸,這個(gè)過程稱為系統(tǒng)的標(biāo)定。本文使用0級精度量塊,采用二次標(biāo)定法實(shí)現(xiàn)了對系統(tǒng)的標(biāo)定過程。被測零件的實(shí)際尺寸L與像素尺寸N之間應(yīng)滿足如下關(guān)系式:L=KN+b
式中,b為系統(tǒng)誤差,K為標(biāo)定系數(shù);
在攝像機(jī)固定的情況下,求取參數(shù)K和b值的具體步驟如下:
(1)在被測位置放置一長度為L1的標(biāo)準(zhǔn)量塊;
(2)對標(biāo)準(zhǔn)量塊進(jìn)行掃描、處理,得到對應(yīng)的像素尺寸N1;
(3)在被測位置放置另一長度為L2的標(biāo)準(zhǔn)量塊,重復(fù)步驟2,得到對應(yīng)像素尺寸N2;
(4)求取參數(shù)值:
4 軟件設(shè)計(jì)
本著穩(wěn)定、可靠、合理、高效、簡潔和易于操作的原則,我們采用面向?qū)ο蟮腗atlab程序語言,實(shí)現(xiàn)了基于Matlab GUI的測量系統(tǒng)軟件的設(shè)計(jì)。
本測量系統(tǒng)軟件主要包括用戶登錄模塊、文件管理模塊、圖像處理模塊、參數(shù)設(shè)置模塊、數(shù)據(jù)瀏覽模塊和幫助模塊等。其中,用戶登錄模塊可以完成用戶的注冊、登陸、密碼修改和賬號管理;文件管理模塊主要包括待測零件圖像的打開、關(guān)閉和保存等功能;圖像處理模塊不僅包含文中所涉及到的算法,還增加了其他算法功能;參數(shù)設(shè)置模塊可以實(shí)現(xiàn)對攝像機(jī)、零件和圖像參數(shù)的設(shè)置;數(shù)據(jù)瀏覽模塊可以完成對實(shí)時(shí)數(shù)據(jù)、歷史數(shù)據(jù)和操作記錄的查看;軟件幫助模塊主要用來說明軟件的使用和系統(tǒng)的更新問題。
5 實(shí)驗(yàn)結(jié)果
為了驗(yàn)證測量系統(tǒng)的適應(yīng)性、穩(wěn)定性和可靠性,本文選用工作面距離為1.49mm的0級量塊和直徑為2.03mm的標(biāo)準(zhǔn)環(huán)規(guī)對系統(tǒng)進(jìn)行了可靠性測試。實(shí)驗(yàn)的測量結(jié)果如表1所示。
采用概率與數(shù)理統(tǒng)計(jì)的方法對測量結(jié)果進(jìn)行了處理。由處理結(jié)果可以看到,采用本測量系統(tǒng),其測量精度可以達(dá)到微米級,可以滿足在線實(shí)時(shí)測量的需要。
6 結(jié)論
作者設(shè)計(jì)了一套基于機(jī)器視覺的零件幾何尺寸在線檢測系統(tǒng),克服當(dāng)前人工檢測的不足,提高了產(chǎn)品的檢測精度。同時(shí),完成了系統(tǒng)硬件、軟件和圖像處理算法的設(shè)計(jì)。實(shí)驗(yàn)結(jié)果表明:該測量系統(tǒng)的測量精度可以達(dá)到2um以下,滿足零件尺寸非接觸在線測量要求,具有很好的應(yīng)用前景。
參考文獻(xiàn)
[1]王保軍.基于機(jī)器視覺的藥瓶封裝缺陷檢測系統(tǒng)研究[D].沈陽:東北大學(xué)(碩士學(xué)位論文),2014.
[2]李巖,花國梁.精密測量技術(shù)[M].北京:中國計(jì)量出版社,2001.
[3]章毓晉.圖像工程(上冊)――圖像處理和分析[M].北京:清華大學(xué)出版社,1999,5-120.
[4]張錚,王艷平,薛桂香.數(shù)字圖像處理與機(jī)器視覺[M].北京:人民郵電出版社,2012(12):63-160.
作者簡介
王保軍(1988-),男,山西省忻州市人。碩士研究生學(xué)歷。現(xiàn)為山西機(jī)電職業(yè)技術(shù)學(xué)院助理講師。主要研究方向?yàn)榛跈C(jī)器視覺的零件在線檢測。
【關(guān)鍵詞】椒鹽噪聲 雙閾值 隸屬函數(shù)
1 引言
噪聲主要在數(shù)字圖像的獲取和傳輸過程中產(chǎn)生,一般是不可預(yù)測的隨機(jī)信號,只能用概率統(tǒng)計(jì)的方法去識別。噪聲對圖像處理十分重要,其會影響圖像處理的輸入、采集、處理的各個(gè)環(huán)節(jié)以及輸出結(jié)果的全過程。其中,椒鹽噪聲一般是由于傳輸誤差或比特丟失造成的。椒鹽噪聲與其他的像素點(diǎn)有明顯的區(qū)別,一般是鄰域中的像素值的極值點(diǎn)。但是極值點(diǎn)并不一定是噪聲點(diǎn)。椒鹽噪聲在圖像上表現(xiàn)出黑白相間的亮暗點(diǎn),會嚴(yán)重影響圖像的質(zhì)量。傳統(tǒng)中值濾波算法(SMF)[1]能夠減弱或消除傅里葉空間的高頻分量,但是同時(shí)會影響低頻分量。由于高頻分量對應(yīng)圖像中的邊沿灰度值具有較大較快變化的部分,所以SMF算法可將這些分量濾除,使圖像平滑,破壞圖像的邊緣和細(xì)節(jié)。
文獻(xiàn)[2]提出了模糊開關(guān)中值濾波算法(FSM),F(xiàn)SM算法處理效果比SMF算法要好一點(diǎn)。文獻(xiàn)[3]提出了自適應(yīng)模糊開關(guān)中值濾波(NAFSM)算法。文獻(xiàn)[4]提出了EDPA算法。文獻(xiàn)[5]和文獻(xiàn)[6]提出基于神經(jīng)網(wǎng)絡(luò)的模糊中值濾波算法,對于受密度噪聲污染的圖像取得了不錯(cuò)的效果,但是計(jì)算量很大。文獻(xiàn)[7]、文獻(xiàn)[8]、文獻(xiàn)[9]、文獻(xiàn)[10]提出了一種自適應(yīng)模糊中值濾波算法(AFM)。AFM算法對傅里葉空間的低頻分量具有較好的濾除效果,但對高頻分量的處理效果不是很好,主要是沒有考慮椒鹽噪聲對圖像的污染程度。所以本文在AFM的基礎(chǔ)上提出了一種雙閾值模糊中值濾波算法,該算法能很好地保護(hù)圖像的細(xì)節(jié),具有高效地處理椒鹽噪聲的能力。
2 算法的基本思想和實(shí)現(xiàn)
2.1 建立模糊系統(tǒng)
利用模糊系統(tǒng)(如圖1所示),計(jì)算輸入?yún)?shù)的模糊系數(shù)權(quán)值。因?yàn)樘幚淼氖墙符}噪聲,所以只需輸入濾波窗口中原值與中值的差,最后通過去模函數(shù)去模糊化,濾波輸出。
圖1 模糊濾波系統(tǒng)設(shè)計(jì)
濾波窗口S由w×w(w默認(rèn)值為3,一般為奇數(shù))的方陣組成。對S里的像素點(diǎn)值進(jìn)行快排序,可得濾波窗口中像素的最小值為Smin,最大值為Smax,中值為Smed,均值為Smean。x(i,j)表示噪聲圖像在(i,j)的灰度值。模糊系統(tǒng)首先是計(jì)算參數(shù)S1(i,j)=x(i,j)-Smed。在圖像處理的時(shí)候一般對像素的污染程度進(jìn)行閾值的設(shè)置。這里假設(shè)最小閾值為Tmin,最大閾值為Tmax,同時(shí)設(shè)置參數(shù)S2=|x(i,j)-Smean|。當(dāng)S2Tmax時(shí),認(rèn)為像素點(diǎn)嚴(yán)重污染,這時(shí)就用最近鄰域已處理的像素點(diǎn)求均值代替。
設(shè)當(dāng)前像素的灰度值為x(i,j),濾波后的像素的灰度值為y(i,j),模糊濾波系數(shù)為P。則模糊隸屬函數(shù)為:
(1)
如果S2
y(i,j)=S(i,j) (2)
如果Tmin≤S2≤Tmax時(shí),則:
y(i,j)=P×S(i,j)+(1-P)×Smed (3)
如果S2>Tmax時(shí),則:
, i=0,j=0 (4)
,i>0,j=0 (5)
,i=0,j>0 (6)
,
i>0,j>0 (7)
2.2 算法實(shí)現(xiàn)
定義S(i,j)是以點(diǎn)(i,j)為中心,大小為w×w的方形窗口,可表示為S(i,j)={(k,l)||k-i|
具體方法如下:
設(shè)最大窗口為wmax×wmax,輸出圖像為y(i,j)。自適應(yīng)雙閾值模糊中值濾波算法的基本思想是通過判斷窗口中心點(diǎn)是否為噪聲來調(diào)節(jié)窗口的大小,以克服中值濾波對細(xì)節(jié)的破壞。
具體算法如下:
初始化窗口大小,令w=3。
計(jì)算窗口S(i,j)中像素的最小值Smin,最大值Smax,中值Smed及均值Smean。
如果Smin
如果w≤wmax跳到第2步,否則說明是噪聲點(diǎn),用鄰域已處理點(diǎn)灰度值均值代取y(i,j)。
如果Smin
2.3 實(shí)驗(yàn)實(shí)現(xiàn)與分析
在win7系統(tǒng)和vs2010+opencv環(huán)境下,經(jīng)過大量的仿真實(shí)驗(yàn),最終得到Tmin=5,Tmax=13可以達(dá)到很好的去噪效果。實(shí)驗(yàn)分別對加入30%、80%的椒鹽噪聲的Lena.jpg進(jìn)行處理。具體如圖2、圖3、圖4所示:
圖2 無噪聲的原圖
觀察圖3(a~e)到圖4(a~e)可以發(fā)現(xiàn),噪聲輕度污染時(shí)各算法去噪能力沒有明顯差別;當(dāng)噪聲嚴(yán)重污染時(shí)SMF基本不能保護(hù)圖像的細(xì)節(jié),AFM、FSM能夠適當(dāng)?shù)乇Wo(hù)圖像的細(xì)節(jié),但是噪聲點(diǎn)還是很多,論文算法能夠很好地保護(hù)圖像細(xì)節(jié)并去除噪聲。
采用峰值信噪比(PSNR)歸一化均方誤差(NMSE)度量處理圖像效果的好壞,定義如下:
(8)
(9)
式中y(i,j)表示去噪后的圖像各像素點(diǎn)的灰度值,I(i,j)表示原始無噪圖像各像素點(diǎn)的灰度值。M、N分別表示圖像的高和寬。表1為幾種算法的NMSE比較,表2為幾種算法的PSNR的比較。
各種算法的NMSE如圖5所示,各種算法的PSNR如圖6所示。
從表1、表2、圖5和圖6可以看出論文算法去噪和其他算法相比優(yōu)勢非常明顯。在加入小于40%的噪聲時(shí)各算法的去噪效果差別不是很大。隨著噪聲的加大,其他算法處理能力明顯下降,但是論文算法卻達(dá)到一種趨衡的狀態(tài)。
表1 幾種算法的NMSE比較
噪聲密度/
% 不同算法處理的NMSE
SMF AFM EDPA 論文算法
10 0.0022 0.0006 0.0012 0.0006
20 0.0048 0.0014 0.0021 0.0011
30 0.0171 0.0022 0.0029 0.0021
40 0.0457 0.0042 0.0066 0.0041
50 0.1096 0.0097 0.0149 0.0042
60 0.2156 0.0267 0.0271 0.0043
70 0.3673 0.0712 0.0734 0.0044
80 0.5661 0.1791 0.1578 0.0047
90 0.7968 0.4175 0.3785 0.0051
表2 幾種算法的PSNR的比較
噪聲密度/
% 不同算法的PSNR
SMF AFM EDPA 論文算法
10 32.2789 37.4440 36.7873 37.4440
20 28.8538 34.3215 33.2178 35.2321
30 23.3064 32.2061 30.1963 32.2624
40 19.0506 29.4123 27.2338 29.4182
50 15.2454 25.7989 23.7133 29.4086
60 12.3090 21.3828 20.7634 29.3226
70 9.99450 17.1203 17.2960 29.1659
80 8.11600 13.1141 13.4691 28.9376
90 6.63180 9.43800 10.2843 28.5508
圖5 各種算法的NMSE
圖6 各種算法的PSNR
3 結(jié)束語
本文在AFM算法的基礎(chǔ)上提出了一種自適應(yīng)雙閾值模糊中值濾波算法。和其他去噪算法相比,論文算法具有極強(qiáng)的去噪性,同時(shí)很好地保護(hù)了圖像的細(xì)節(jié),并且算法具有穩(wěn)定性,是去除椒鹽噪聲的好算法。
參考文獻(xiàn):
[1] Pitas I, Venetsanopoulos A N. Order statistics in digital image processing[J]. Proceeding of the IEEE, 1992,80(12): 1893-1921.
[2] H Ibrahim, K K V Toh, M N Mahyuddin. Salt-and-pepper noise detection and reduction using fuzzy switching median filter[J]. IEEE Transaction on Consumer Electronics, 2008,54(4): 1956-1961.
[3] K K V Toh, N A M Isa. Noise Adaptive Fuzzy Switching Median Filter for Salt-and-Pepper Noise Reduction[J]. IEEE Signal Processing Letters, 2010,17(3): 281-284.
[4] Nibong Tebal, Penang. Fuzzy Multipass Filter for Impulse Noise Removal in Digital Images[C]. Signals and Information Technology, 2013.
[5] M E Yuksel. A hybrid neuro-fuzzy filter for edge preserving restoration of images corrupted by impulse noise[J]. IEEE Transactions on Image Processing, 2006,15(4): 928-936.
[6] S Schulte, M Nachtegael, V D Witte, et al. A fuzzy impulse noise detection and reduction method[J]. IEEE Transactions on Image Processing, 2006,15(5): 1153-1162.
[7] T Palabas, A Gangal. Salt and pepper noise reduction in images using adaptive fuzzy filter[C]. SIU, 2012: 1-4.
[8] T Palabas, A Gangal. Adaptive fuzzy filter combined with median filter for reducing intensive salt and pepper noise in gray level images[C]. Innovations in Intelligent Systems and Applications, 2012: 1-4.
關(guān)鍵詞: MATLAB; 預(yù)處理; Hough變換; 降維; 形態(tài)學(xué)
中圖分類號:TP391.41 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2016)11-17-04
Research on the image recognition of target sheet with MATLAB
Wang Weiyang, Ding Jiayue, Wang Penghong, Lu Zhengyong
(School of Imformation & Electronic Engineering, Zhejiang Gongshang University, Hangzhou, Zhejiang 310018, China)
Abstract: According to the shooting competition when a real-time and accurate detection of the shooting results is required, a research on image recognition of target sheet with MATLAB is presented in this paper. An image processing algorithm based on MATLAB is used in order to analyse the ring number of impact point on the target sheet captured by digital camera. Grayscale conversion, median filtering, and binariztion of the target sheet image are used in the image pretreatment. Sobel operator is used to extract image edge, so the amount of computation is dramatically reduced. And the bullet hole is recognized and located by using improved Hough transform, image subtraction method and morphological algorithm. The experimental results show that the image processing algorithm has fast speed and good accuracy.
Key words: MATLAB; pretreatment; Hough transform; mension reduction; morphology
0 引言
隨著科技的發(fā)展,射擊比賽時(shí)采用自動報(bào)靶系統(tǒng),將會越來越普遍。這種方式不僅能減少人力物力支出、提高報(bào)靶效率,還能減小由于人為帶來的不確定因素。目前已有不少單位研究出多種自動報(bào)靶系統(tǒng)[1-4]。基于機(jī)器視覺的自動報(bào)靶系統(tǒng),應(yīng)用環(huán)境要求特殊,還未得到普及[1-4]。本文基于MATLAB函數(shù)工具箱實(shí)現(xiàn)靶紙彈孔檢測的數(shù)字化方法,在射擊時(shí)對靶紙圖像進(jìn)行采集,通過基于MATLAB的圖像處理技術(shù)對靶紙圖像進(jìn)行處理分析,并模擬圖像進(jìn)行成績輸出。
1 靶紙圖像采集讀取
靶紙圖像采集可以有多種方式,本實(shí)驗(yàn)采用最高像素值為300萬的數(shù)碼相機(jī)拍攝,圖像采集簡便,便于推廣應(yīng)用。MATLAB中提供的imread()函數(shù)用于實(shí)現(xiàn)圖像的讀取操作,可讀取JPG、TIF、GIF、HDF、XWD和CUR等多種圖像格式。調(diào)用該函數(shù)后將得到一個(gè)存儲圖像數(shù)據(jù)的矩陣,后期對圖像的各種處理正是基于該數(shù)據(jù)矩陣來完成。
2 靶紙圖像預(yù)處理[1]
2.1 圖像灰度化
數(shù)碼相機(jī)拍攝的圖像為彩色圖像,圖像中每個(gè)像素都包含有R(紅色)、G(綠色)、B(藍(lán)色)三種基色分量信息,每種基色分量均需要占用八位來表示基色強(qiáng)度,數(shù)據(jù)量較大。為減輕計(jì)算機(jī)工作量,去除掉部分無用信息,將圖像進(jìn)行灰度化處理,減少后續(xù)處理分析耗時(shí)。
在MATLAB中采用rgb2gray()函數(shù)對圖像進(jìn)行灰度化處理,該函數(shù)中三基色的權(quán)重系數(shù)取值為(0.299,0.587,0.114)[5]。
2.2 圖像增強(qiáng)
對靶紙圖像增強(qiáng)是為了突出圖像中的有用信息,同時(shí)對噪聲等無用信息進(jìn)行一定的消除,類似信號處理中的濾波器。圖像噪聲常常表現(xiàn)為孤立像素點(diǎn),如果不去除噪聲,會對邊緣檢測、圖像變換以及后續(xù)的彈孔定位帶來影響。MATLAB中提供了平滑濾波器、中值濾波器以及銳化濾波器這三種圖像增強(qiáng)濾波器[6]。平滑濾波器本質(zhì)上類似低通濾波器,只對信號的低頻部分有很好地選通性。靶紙圖像中對屬于高頻部分的圓環(huán)邊緣提取十分重要,采用平滑濾波器將對其造成破壞。銳化濾波器有時(shí)會導(dǎo)致輸出圖像灰度值出現(xiàn)負(fù)值,還需要進(jìn)行相應(yīng)灰度轉(zhuǎn)換,增加處理工作量。本文采用中值濾波器對靶紙圖像進(jìn)行濾波處理,能有效去除類似斑點(diǎn)噪聲及椒鹽噪聲的孤立像素點(diǎn),同時(shí)較好地保留了圖像的邊緣信息[2]。這是一種非線性的去噪方法,其基本原理是在圖像中一個(gè)像素周圍確定一個(gè)鄰域,以該鄰域中各像素點(diǎn)灰度值的中值來代換該像素點(diǎn)自身的灰度值[4]。
MATLAB中提供medfilt2()函數(shù)用于對圖像信息進(jìn)行中值濾波,二維濾波窗口可以為方形、圓形、菱形等,由圖像像素點(diǎn)構(gòu)成,可在函數(shù)中設(shè)置窗口形狀,默認(rèn)為像素點(diǎn)的方形窗口[5]。
2.3 靶紙圖像二值化
由于對靶紙圖像的處理主要是對圓環(huán)和彈孔的識別提取,對于圖像灰度值并沒有特定的要求,所以進(jìn)一步對圖像二值化以去除無用信息。所選取的閾值需要能夠有效保留圖像特征,保證后續(xù)處理的可靠性。對灰度化后的靶紙圖像繪制灰度直方圖,如圖1所示。
從直方圖看出灰度值集中在Y220范圍內(nèi),其中Y220對應(yīng)白色背景以及白色圓環(huán)部分,所以閾值TG取值應(yīng)在30/255
3 基于Hough變換的靶心定位
3.1 Hough變換圓檢測原理[2,7]
Hough變換將二維圖像平面轉(zhuǎn)換為三維參數(shù)空間,采用類似“投票”模式的判斷方法。三個(gè)參數(shù)值分別為圓心的行坐標(biāo)a,圓心列坐標(biāo)b,以及半徑r。對于圖像平面中的任何一個(gè)像素點(diǎn)(x,y)都要在三維參數(shù)空間內(nèi)進(jìn)行遍歷運(yùn)算,若運(yùn)算結(jié)果滿足關(guān)系式,則對應(yīng)三維空間中的參數(shù)點(diǎn)票數(shù)加一。完成運(yùn)算后,三維空間中“票數(shù)”最多(或滿足一定數(shù)量)的參數(shù)點(diǎn),其參數(shù)即為檢測到的圓所對應(yīng)圓心坐標(biāo)以及半徑值。Hough變換檢測圓三個(gè)參數(shù)間的一般關(guān)系如下式:
3.2 用于靶紙圓環(huán)提取的Hough變換降維算法
從Hough變換原理可知,其運(yùn)算過程中將會有大量的時(shí)空消耗,減少運(yùn)算維度和參與運(yùn)算的像素點(diǎn)數(shù)可以提高Hough變換效率。前期已對靶紙圖像進(jìn)行預(yù)處理得到圖像的二值圖,減少了參與Hough變換的像素點(diǎn)數(shù)。接著,采用Sobel算子對靶紙圓環(huán)進(jìn)行邊緣提取。圖像邊緣是圖像局部特征不連續(xù)的表現(xiàn),出現(xiàn)在兩個(gè)不同圖像區(qū)域的交界,常常是灰度突變的結(jié)果,在灰度突變處進(jìn)行微分運(yùn)算將產(chǎn)生高值[8]。MATLAB中通過調(diào)用edge()函數(shù)進(jìn)行邊緣提取,函數(shù)計(jì)算結(jié)果為和輸入圖像一樣大小的二值圖。邊緣提取對圖像的特征信息進(jìn)行提取,進(jìn)一步減少Hough變換算法的工作量,減少運(yùn)算時(shí)間。
由于靶紙圓環(huán)均為同心圓環(huán),只存在一個(gè)位置固定的圓心。經(jīng)邊緣提取后的圖像是由像素點(diǎn)組成的多個(gè)同心圓環(huán),圓環(huán)特征較為明顯,考慮降低Hough變換的計(jì)算維度來提高計(jì)算速度[9],先進(jìn)行靶紙圓心的提取,將圓心橫縱坐標(biāo)分別提取。首先是橫坐標(biāo)的提取,以平行于X軸的掃描線,自圖像頂部向下縱向掃描。此時(shí)靶紙上圓環(huán)邊緣點(diǎn)值為“1”,背景為“0”,因此每向下掃描一行,記錄該行i中間距最大的兩個(gè)“1”值像素點(diǎn)的橫坐標(biāo)分別為、,直至掃描完圖像。接著,以平行于Y軸的掃描線,自圖像左邊向右橫向掃描,記錄像素點(diǎn)縱坐標(biāo)分別為ali、a2i,直至掃描完圖像。若某行只存在一個(gè)“1”值點(diǎn),則跳過該行。距離最遠(yuǎn)的兩“1”值點(diǎn)為最外圈圓環(huán)上的點(diǎn),坐標(biāo)中值(ami,bmi)即為對應(yīng)圓心坐標(biāo),計(jì)算公式如下:
由于邊緣提取后的圓環(huán)邊緣不完全連續(xù),且可能存在彈孔邊緣信息以及噪聲點(diǎn),若以文獻(xiàn)[10]中盡量多弦交點(diǎn)的簡單統(tǒng)計(jì)平均來計(jì)算坐標(biāo),將引入上述影響因素,導(dǎo)致圓心定位出現(xiàn)誤差。因此,采用類似Hough變換證據(jù)積累的判斷方法,對每行/列掃描得出的中值坐標(biāo)采取投票的積累方式,出現(xiàn)相同的中值點(diǎn)坐標(biāo)時(shí)則對該坐標(biāo)對應(yīng)“票數(shù)”Na[ami]加1,當(dāng)遍歷完整幅圖像時(shí),找出“票數(shù)”最多的中值點(diǎn)坐標(biāo)ammax。此處,可設(shè)置一個(gè)閾值Ta,考慮到圖像像素點(diǎn)的離散化以及邊緣提取帶來的影響,將中值坐標(biāo)滿足
內(nèi)的對應(yīng)點(diǎn)ami求和,接著求取平均值,此平均值記為圓心坐標(biāo)a。同理得b。通過這種方法可以有效減少非最外圈圓環(huán)上弦交點(diǎn)即錯(cuò)誤點(diǎn)或者噪聲點(diǎn)的干擾的影響。MATLAB中調(diào)用sum()函數(shù)用于求和,調(diào)用max()函數(shù)用于求取最大值。坐標(biāo)關(guān)系式如下:
上述算法的部分MATLAB代碼如下:
%BW為邊緣提取后靶紙圖
[rows,cols]=find(BW); %搜索1值像素點(diǎn)
mount=size(rows); number=mount(1);
i=1; j=1;
while(i
xjd(j,1)=rows(a);
while(i
if(cols(i)==cols(i+1))
xjd(j,2)=rows(i+1);i=i+1;
else
i=i+1; j=j+1; break;
end
end
end
number=length(xjd); Na=zeros(1,number);
for n=1:number%for循環(huán)計(jì)算中值及票數(shù)
zz(n)=round((xjd(n,1)+xjd(n,2))/2);
Na(zz(n))=Na(zz(n))+1;
end
[amax,id]=max(Na); %找出票數(shù)最多中值點(diǎn)
a=(Na(id)*id+Na(id-Ta)*(id- Ta)+Na(id+Ta)*(id+Ta))/
sum(Na(id-Ta:id+Ta))%基于閾值Ta計(jì)算均值得坐標(biāo)a
根據(jù)機(jī)器視覺中的ROI(Region Of Interest)理論,恰當(dāng)選取ROI能有效減少圖像運(yùn)算的計(jì)算量[11]。根據(jù)先驗(yàn)知識圖像采集時(shí)圓心處于圖像中部區(qū)域,將待驗(yàn)證像素點(diǎn)所處范圍設(shè)定為圖像中部的矩形區(qū)域,該矩形區(qū)域邊長設(shè)為圖像邊長的1/4,由此進(jìn)一步減少參與運(yùn)算的像素點(diǎn)。本算法將圓的參數(shù)方程寫為極坐標(biāo)形式:
已知圓心坐標(biāo),根據(jù)先驗(yàn)知識設(shè)定r的可能取值范圍,遍歷計(jì)算感興趣區(qū)域中的邊緣點(diǎn),采用上述Hough變換證據(jù)積累的方法得到r[9],且設(shè)定一個(gè)閾值Tr,減少離散數(shù)據(jù)帶來的誤差。閾值的設(shè)定使得對于一些存在干擾的靶紙圖像也能有效地進(jìn)行圓環(huán)檢測,例如靶紙存在一定形變或者是子彈擊中內(nèi)圓環(huán)帶來的干擾,提高了算法的魯棒性。
4 基于圖像差影法的彈孔定位[12]
4.1 圖像差影算法[2,4]
本文在彈孔定位的分析上,將彈孔視為一個(gè)運(yùn)動目標(biāo),每次射擊后彈著點(diǎn)都不同,近似為目標(biāo)的運(yùn)動過程。運(yùn)動目標(biāo)的檢測算法有幀間差分法、背景差分法以及基于光流場的檢測方法,圖像差影法是利用當(dāng)前圖像與初始圖像進(jìn)行減運(yùn)算來提取目標(biāo)的一種檢測方法[13]。首先,采集射擊前的靶紙圖像以及本次射擊后的靶紙圖像,將兩幅圖像視為視頻中的前后兩幀圖像,接著采用幀間差分法獲得彈孔信息,并將彈孔圖像二值化處理。
4.2 形態(tài)學(xué)濾波處理[3]
提取的彈孔圖像可能會包含噪聲,將會導(dǎo)致彈孔定位出現(xiàn)誤差,對該圖像進(jìn)行先腐蝕后膨脹處理的開運(yùn)算[5]。在MATLAB中調(diào)用imerode()函數(shù)對圖像進(jìn)行腐蝕操作,去除圖像中小而無意義的噪聲像素點(diǎn);接著調(diào)用imdilate()函數(shù)對圖像進(jìn)行膨脹操作,使彈孔區(qū)域恢復(fù)至原始大小,即消除由于腐蝕對彈孔面積帶來的影響。兩個(gè)函數(shù)均采用strel()函數(shù)定義一個(gè)結(jié)構(gòu)元素,其在形態(tài)學(xué)中的作用好比濾波器中的濾波窗口,該函數(shù)支持創(chuàng)建線形、矩形、方形、球形和自定義類型等的結(jié)構(gòu)元素。
實(shí)現(xiàn)彈孔提取及定位的部分MATLAB代碼如下:
b=imread('current.jpg'); %靶紙讀取
B=I-b; %射擊前后的靶紙圖像差影
B=im2bw(B,T); %基于閾值T進(jìn)行二值化
subplot(221),imshow(B)
se=strel('square',2); %定義方形結(jié)構(gòu)元素
imeBW=imerode(B,se); %圖像腐蝕
subplot(222),imshow(imeBW)
imdBW=imdilate(imeBW,se); %圖像膨脹
subplot(223),imshow(imdBW)
[row,col]=find(imdBW==1); %搜索彈孔
x=min(col); w=max(col)-x;
y=min(row); h=max(row)-y;
subplot(224),imshow(imdBW)
hold on; %圖像保持
rectangle('Position',[x,y,w,h],'LineWidth',1,'EdgeColor',
'w'); %框彈孔區(qū)域
5 實(shí)驗(yàn)結(jié)果
仿真實(shí)驗(yàn)在2.3GHz,RAM為4GB的計(jì)算機(jī)上進(jìn)行,采用MATLAB8.2語言編寫代碼。本次實(shí)驗(yàn)采用靶紙滿環(huán)11環(huán),且不同環(huán)數(shù)圓環(huán)半徑差相同。實(shí)驗(yàn)結(jié)果如圖2、圖3和圖4所示。
求得彈著點(diǎn)環(huán)數(shù)及誤差。其中(a,b)為環(huán)心坐標(biāo),(xd,yd)為彈孔坐標(biāo),r為中心圓環(huán)半徑,Hj為環(huán)數(shù)計(jì)算值,Sj為人工計(jì)算值(采用尺規(guī)法測量),ρ為環(huán)數(shù)相對誤差。計(jì)算結(jié)果若為負(fù)數(shù),則判為脫靶。靶紙測試結(jié)果如表1所示。
6 總結(jié)
基于MATLAB函數(shù)工具箱的圖像處理,函數(shù)調(diào)用方便,程序設(shè)計(jì)高效。首先通過圖像預(yù)處理去除無用信息,接著將Hough變換算法降維進(jìn)行內(nèi)圓環(huán)的定位,最后搜索定位彈孔,求出彈著點(diǎn)坐標(biāo),方案適用于圓環(huán)完整的靶紙識別。計(jì)算出的射擊環(huán)數(shù)相比人工計(jì)算誤差在0.1環(huán)以內(nèi),且計(jì)算速度較快。進(jìn)一步,可考慮靶紙形變帶來的影響或?qū)⒎桨皋D(zhuǎn)換為硬件系統(tǒng)以提高實(shí)時(shí)處理性能,可以應(yīng)用于射擊比賽中的自動報(bào)靶系統(tǒng),免去人工報(bào)靶可能帶來的不確定性因素,提高比賽的公正度和效率。
參考文獻(xiàn)(References):
[1] 周曉偉.基于圖像處理的自動報(bào)靶系統(tǒng)研究[D].中北大學(xué)碩
士學(xué)位論文,2011.
[2] 陳海萍.基于機(jī)器視覺技術(shù)的模擬射擊訓(xùn)練系統(tǒng)研究與設(shè)計(jì)[D].
廈門大學(xué)碩士學(xué)位論文,2012.
[3] 羅真.基于圖像處理的自動報(bào)靶系統(tǒng)設(shè)計(jì)[D].中南大學(xué)碩士
學(xué)位論文,2014.
[4] 謝殿強(qiáng).基于ARM-Linux機(jī)器視覺的軍用自動報(bào)靶系統(tǒng)的
研究[D].山東大學(xué)碩士學(xué)位論文,2009.
[5] 周品.MATLAB圖像處理與圖形用戶界面設(shè)計(jì)[M].清華大學(xué)
出版社,2013.
[6] 葉雯.基于MATLAB的圖像去噪研究[J].計(jì)算機(jī)時(shí)代,
2015.6:10-12
[7] 陳小艷,王強(qiáng),李柏林.改進(jìn)的Hough變換檢測圓方法[J].計(jì)算
機(jī)系統(tǒng)應(yīng)用,2015.8:197-201
[8] 蔣先剛.數(shù)字圖像模式識別工程軟件設(shè)計(jì)[M].中國水利水電
出版社,2008.
[9] 趙京東.用兩步Hough變換檢測圓[J].計(jì)算機(jī)應(yīng)用,2008.7:
1761-1763
[10] 孫蓉蓉.圖像處理技術(shù)在自動報(bào)靶系統(tǒng)中的應(yīng)用研究[D].南
京理工大學(xué)碩士學(xué)位論文,2006.
[11] 孫國棟,趙大興.機(jī)器視覺檢測理論與算法[M].科學(xué)出版社,
2015.
[12] 崔亞琳.基于計(jì)算機(jī)視覺的射箭精確自動報(bào)靶系統(tǒng)研究[J].
火控雷達(dá)技術(shù),2015.12:27-30
關(guān)鍵詞:數(shù)字圖像處理 教學(xué)模式 教學(xué)改革
中圖分類號:G642
文獻(xiàn)標(biāo)識碼:A
文章編號:1004-4914(2013)05-216-02
一、引言
隨著電子和信息技術(shù)的迅速發(fā)展,數(shù)字圖像處理已成為當(dāng)今信息處理技術(shù)中發(fā)展很快且應(yīng)用面很廣的新興學(xué)科之一?!皵?shù)字圖像處理”課程也成為了高校本科計(jì)算機(jī)與信息類專業(yè)的一門專業(yè)核心課程。但由于數(shù)字圖像處理學(xué)科所涉及的知識面廣,理論復(fù)雜,對數(shù)學(xué)基礎(chǔ)的要求高,實(shí)踐環(huán)節(jié)動手能力要求強(qiáng),其課程內(nèi)容也在不斷更新豐富。在以往傳統(tǒng)教學(xué)過程中呈現(xiàn)出了以下弊端:(1)教材中大量理論和算法推導(dǎo)給學(xué)生的學(xué)習(xí)帶來困難;(2)單一的單機(jī)版多媒體教學(xué),無法滿足學(xué)生對新知識、新技術(shù)、新應(yīng)用的了解和深入學(xué)習(xí);(3)沒有完善系統(tǒng)的實(shí)驗(yàn)指導(dǎo)書,促使學(xué)生學(xué)習(xí)的積極性下降,導(dǎo)致實(shí)驗(yàn)效果不佳;(4)沒有實(shí)際項(xiàng)目作為應(yīng)用鍛煉,造成理論與實(shí)踐脫鉤,無法激發(fā)學(xué)生的學(xué)習(xí)動力和興趣等。
針對數(shù)字圖像處理教學(xué)過程中出現(xiàn)的上述問題,國內(nèi)很多教學(xué)專家和學(xué)者,結(jié)合自己的實(shí)際教學(xué)過程,各抒己見,陸續(xù)提出了很多寶貴的改革建議和方案,取得了相應(yīng)的教學(xué)改革成果。如山東工商學(xué)院的魏廣芬和王永強(qiáng)等于2009年針對“數(shù)字圖像處理”課程和學(xué)生特點(diǎn),介紹了教學(xué)過程中實(shí)施的一些改革措施,包括采用現(xiàn)代化教學(xué)手段,“設(shè)問-思考-引導(dǎo)-嘗試-總結(jié)”的教學(xué)模式和學(xué)生分組的學(xué)習(xí)方式,加強(qiáng)實(shí)驗(yàn)和課程設(shè)計(jì)教學(xué)環(huán)節(jié)以及完善評分機(jī)制等方面。并對教學(xué)過程中發(fā)現(xiàn)的相關(guān)問題進(jìn)行探討。西北民族大學(xué)的李向群和王書文于2010年從教學(xué)內(nèi)容建設(shè)、教學(xué)手段改革、實(shí)驗(yàn)環(huán)境建立、考核方式改革等方面入手進(jìn)行了深入細(xì)致的探討,并將這些方法應(yīng)用到實(shí)際教學(xué)過程中,收到了較好的效果。中國傳媒大學(xué)的呂朝輝也于2010年根據(jù)數(shù)字圖像處理課程的特點(diǎn),探討了本門課程的教學(xué)改革和實(shí)踐,經(jīng)過五年來的教學(xué)實(shí)施,取得了良好的教學(xué)效果。南通大學(xué)的趙敏于2011年,針對該課程的特點(diǎn),論述了在教學(xué)中引入案例教學(xué)法的可行性和具體實(shí)施方案。
通過對上述數(shù)字教學(xué)改革的學(xué)習(xí)和研究,結(jié)合我?!按蟮掠蠊こ?,大實(shí)踐”的辦學(xué)理念和信息與計(jì)算科學(xué)專業(yè)“3+1”教育模式(本專業(yè)“3+1”教育模式是指3年在學(xué)校完成理論課學(xué)習(xí),1年在軟件實(shí)習(xí)公司等完成工程實(shí)訓(xùn)、生產(chǎn)實(shí)習(xí)、畢業(yè)實(shí)習(xí)和畢業(yè)設(shè)計(jì)等實(shí)踐環(huán)節(jié),以培養(yǎng)應(yīng)用型人才為培養(yǎng)目標(biāo))及本科生的特點(diǎn)。對本專業(yè)數(shù)字圖像處理課程的教學(xué)進(jìn)行了改革研究和實(shí)踐。建立了一個(gè)以學(xué)生為主體,以現(xiàn)代網(wǎng)絡(luò)多媒體教學(xué)為平臺,以大學(xué)生科研立項(xiàng)為載體,以大學(xué)生就業(yè)或考研深造為目標(biāo)的一套較為完善的數(shù)字圖像處理課程教學(xué)體系結(jié)構(gòu)。
二、課程改革內(nèi)容
結(jié)合傳統(tǒng)教學(xué)中存在的問題,和現(xiàn)代網(wǎng)絡(luò)多媒體教學(xué)建設(shè)的需要。本課題研究內(nèi)容主要將通過教學(xué)內(nèi)容、教學(xué)方法、教學(xué)手段和考核機(jī)制來探索和實(shí)施。
1.優(yōu)化教學(xué)內(nèi)容。數(shù)字圖像處理課程的基本內(nèi)容包括圖像處理的基礎(chǔ)知識、圖像增強(qiáng)、圖像變換、圖像分割、圖像復(fù)原、圖像特征提取與選取以及圖像壓縮編碼等知識。但隨著信息化時(shí)代知識的加快更新、技術(shù)快速革新,數(shù)字圖像處理課程已成為模式識別和計(jì)算機(jī)視覺等新學(xué)科的基礎(chǔ),并根據(jù)學(xué)生就業(yè)需求的主線要求。通過對教學(xué)內(nèi)容的深入研究,在本專業(yè)新版教學(xué)大綱中,對授課內(nèi)容中要求以基礎(chǔ)理論知識為基礎(chǔ),把相關(guān)的科研項(xiàng)目和實(shí)際項(xiàng)目滲透到授課中。例如在介紹圖像處理的基礎(chǔ)知識的時(shí)候,我們可以結(jié)合案例驅(qū)動來講述圖像處理的過程;將車牌識別、人臉識別、筆記識別等實(shí)際項(xiàng)目穿插到圖像增強(qiáng)、圖像分割、頻域處理以及特征提取與選取中。同時(shí),我們把信息熵、模糊數(shù)學(xué)和小波分析等概念滲透到部分章節(jié)中,并給出該理論解決問題的結(jié)果,以提高學(xué)生學(xué)習(xí)新理論的興趣,促使部分同學(xué)自學(xué)新的理論,培養(yǎng)學(xué)生的自學(xué)能力。在講述專業(yè)基礎(chǔ)知識的過程中,我們將適時(shí)地增強(qiáng)相關(guān)的軟件的學(xué)習(xí)和資源庫的介紹,例如通過實(shí)驗(yàn)和實(shí)訓(xùn)的教學(xué)加強(qiáng)學(xué)生對Matlab和VC++等語言的學(xué)習(xí)和實(shí)踐。通過CNKI和IEEE Tran文章的介紹,提高學(xué)生對最新科研成果的了解,激發(fā)學(xué)生學(xué)習(xí)的興趣,培養(yǎng)學(xué)生對新事物的學(xué)習(xí)能力。鼓勵(lì)學(xué)生進(jìn)行大學(xué)生參加校內(nèi)科研立項(xiàng),引導(dǎo)學(xué)生分析問題和解決實(shí)際問題的能力,進(jìn)一步提高學(xué)生的綜合素質(zhì)能力。
2.豐富教學(xué)方法。在以往的教學(xué)過程中,數(shù)字圖像處理課程的教學(xué)主要以“填鴨式”教學(xué)方法為主,只注重對學(xué)生的教,而忽視了學(xué)生的學(xué)和做,沒能產(chǎn)生良好的教學(xué)效果。通過對當(dāng)前主要教學(xué)方法的研究與探索,我們豐富了數(shù)字圖像處理課程的教學(xué)方法,以“啟發(fā)式”教學(xué)方法為主,以綜合運(yùn)用講授法、研究法、討論法、實(shí)驗(yàn)法等教學(xué)法,把“教、學(xué)和做”很好地穿插起來,發(fā)揮各種方法的優(yōu)勢,引導(dǎo)學(xué)生積極參與教學(xué),實(shí)現(xiàn)教與學(xué)深層次互動。促進(jìn)學(xué)生對數(shù)字圖像處理基本知識和方法的掌握及動手能力的培養(yǎng)。
3.提升教學(xué)手段。針對該門課程理論性強(qiáng)、乏味單調(diào)的特點(diǎn),應(yīng)用現(xiàn)代網(wǎng)絡(luò)多媒體教學(xué)手段,借鑒當(dāng)前較為流行的CDIO教學(xué)模式,進(jìn)行教學(xué)手段的提升。結(jié)合教學(xué)內(nèi)容的組合的優(yōu)化和教學(xué)方法的豐富,在教學(xué)中以現(xiàn)代網(wǎng)絡(luò)多媒體為教學(xué)媒體,通過制作多媒體課件,以“少而精”和“圖文并茂”為原則,并結(jié)合Matlab和VC++等軟件編程實(shí)例的案例教學(xué),在課堂教學(xué)中適時(shí)引入前沿?zé)狳c(diǎn)圖例分析和編程處理實(shí)例,引導(dǎo)學(xué)生進(jìn)行理論知識的學(xué)習(xí),使學(xué)生體會到易學(xué)、樂學(xué)和會做。
4.改善考核機(jī)制。摒棄了以往“一考定乾坤”的考核方式,將平時(shí)出勤與課堂表現(xiàn)情況、作業(yè)和實(shí)驗(yàn)成績等進(jìn)行量化,納入最終成績的綜合評核。并結(jié)合“3+1”創(chuàng)新教育模式對學(xué)生實(shí)踐能力和CDIO培養(yǎng)大綱對學(xué)生素質(zhì)進(jìn)行全面考核的要求。側(cè)重學(xué)生對基礎(chǔ)知識的把握、個(gè)體實(shí)踐能力、團(tuán)隊(duì)協(xié)作能力的考核。
三、實(shí)踐效果
通過數(shù)字圖像處理教學(xué)內(nèi)容、教學(xué)方法、教學(xué)手段和考核機(jī)制等四方面的改革研究與實(shí)踐,近幾年本專業(yè)每年都有10%左右的學(xué)生選擇數(shù)字圖像處理的相關(guān)研究內(nèi)容作為本科畢業(yè)論文選題,并取得了較好的成績。通過對畢業(yè)生的跟蹤調(diào)查發(fā)現(xiàn),考研深造的部分學(xué)生也把圖像處理及新興相關(guān)學(xué)科前沿方向作為自己的學(xué)術(shù)研究方向,工作就業(yè)的部分學(xué)生也從事了與數(shù)字圖像處理相關(guān)的研究工作領(lǐng)域。
四、結(jié)束語
本文對以往數(shù)字圖像處理課程教學(xué)過程中存在的主要問題進(jìn)行了簡要的介紹,并對主要相關(guān)學(xué)者的教學(xué)改革內(nèi)容進(jìn)行了闡述。結(jié)合我校的教學(xué)理念以及本專業(yè)的“3+1”教學(xué)改革模式,針對本專業(yè)本科生的特點(diǎn),進(jìn)行了數(shù)字圖像處理教學(xué)的改革研究和實(shí)踐。實(shí)踐表明,此次教學(xué)改革提高了教學(xué)效果,得到了學(xué)生的認(rèn)可和好評。完成了對本專業(yè)學(xué)生在知識、能力與素質(zhì)等方面要求的綜合培養(yǎng)。
[基金項(xiàng)目:黑龍江省教育科學(xué)“十二五”規(guī)劃研究課題(GBC1212076);黑龍江科技學(xué)院教學(xué)研究項(xiàng)目]
參考文獻(xiàn):
1.魏廣芬,王永強(qiáng),丁昕苗,何愛香.“數(shù)字圖像處理”課程教學(xué)改革的嘗試.電氣電子教學(xué)學(xué)報(bào),2009(6)
2.李向群,王書文.《數(shù)字圖像處理》課程的教學(xué)改革初探.微計(jì)算機(jī)信息,2010(3-2)
3.呂朝輝.數(shù)字圖像處理課程教學(xué)改革與實(shí)踐.高教論壇,2010(11)
4.趙敏.MATLAB用于數(shù)字圖像處理的教學(xué)實(shí)踐研究.電腦知識與技術(shù),2012(31)
5.查建中.CDIO:顛覆性的工科教育模式改革[J].中國遠(yuǎn)程教育,2009(3)
關(guān)鍵詞:注冊;識別;圖像獲取
1.指紋識別技術(shù)的發(fā)展
在生活中較常見的指紋識別應(yīng)用有:指紋鎖、指紋考勤、指紋門禁、指紋保管箱、筆記本電腦指紋登陸模塊、手機(jī)指紋開機(jī)驗(yàn)證模塊、指紋網(wǎng)上銀行。相信隨著技術(shù)發(fā)展成熟,應(yīng)用成本越來越低,指紋識別技術(shù)會越來越廣泛地應(yīng)用到我們?nèi)粘I钪衼怼?/p>
指紋識別由于其電子門鎖技術(shù)的成熟和成本降低,開始徹底走向民用。國內(nèi)生物識別未來將形成上百億元的市場,其中安防業(yè)是最重要的應(yīng)用領(lǐng)域之一,市場空間很大。目前,羅湖口岸已經(jīng)用了指紋通關(guān),德國將指紋識別付款應(yīng)用到某些超市中。預(yù)計(jì)指紋門禁、指紋讀卡器、指紋智能鎖,指紋門禁考勤一體機(jī)及相關(guān)指紋身份識別系統(tǒng)將會迅速普及到每一個(gè)安全防范項(xiàng)目和智能大廈,目前國內(nèi)年門禁安裝數(shù)量大約是在50萬門以上,其中指紋識別的在門禁應(yīng)用大概只有1%左右,而一般國外這個(gè)比例大約應(yīng)為20%以上。換句話說,在國內(nèi)安防業(yè),生物識別產(chǎn)品的市場缺口在9.5萬臺左右,另一個(gè)比較明顯的狀況是,目前專門從事指紋讀頭和電子門鎖指紋門禁生產(chǎn)和銷售企業(yè)很少,所以綜合起來看這個(gè)市場有兩個(gè)明顯的特點(diǎn):市場大,競爭少。
社會在不斷的進(jìn)步,身份的鑒別工作也提出越來越高的要求,在各種生物特征識別技術(shù)中,歷史最悠久、使用最廣泛的無疑是指紋識別技術(shù),是一種相對比較成熟的身份鑒別方法,無論是在科學(xué)研究還是在工業(yè)界的實(shí)際應(yīng)用中都得到了人們的廣泛關(guān)注。盡管指紋識別技術(shù)在研究與使用得到了關(guān)注,但其發(fā)展還是不能滿足社會日益增長的需求,究其原因是指紋識別在識別率、穩(wěn)定性以及識別速度等方面還不能夠滿足實(shí)際使用時(shí)的要求。
2.指紋識別技術(shù)的應(yīng)用
毫無疑問,指紋識別技術(shù)具有廣泛的市場前景,其社會效益及經(jīng)濟(jì)效益是具大的,一般的自動指紋識別技術(shù)都需要有四個(gè)過程,即指紋圖像的獲取、指紋圖像的處理、指紋特征提取和指紋匹配,也就是說,指紋識別的大部分工作都是數(shù)字圖像處理的工作,而本文的主要研究內(nèi)容也是數(shù)字圖像處理在指紋識別中的應(yīng)用。在數(shù)字圖像處理中,圖像獲取就是把一幅模擬圖像(如照片、畫片等)轉(zhuǎn)換成適合計(jì)算機(jī)或數(shù)字設(shè)備的數(shù)字信號。這一過程主要包換攝取圖像、光電轉(zhuǎn)換、數(shù)字化等步驟,而指紋圖像的獲取就是通過一定的設(shè)備采集手指表面的指紋凹凸信息同時(shí)將之轉(zhuǎn)化為數(shù)字信號圖像的過程;而在指紋圖像處理的過程中,包含了幾種常用的圖像處理手段,如圖像增強(qiáng),圖像分割等,其中在圖像增強(qiáng)的過程中又包含了灰度與對比度的處理過程,主要是為了突出圖像中感興趣的信息,衰減或去除不需要的信息,從而使有用的信息得到增強(qiáng),便于目標(biāo)區(qū)分或?qū)ο窭斫?;指紋特征提取則是從經(jīng)過預(yù)處理的圖像中提取指紋特征;指紋匹配顧名思義是指匹配指紋的特征,從而進(jìn)行識別。故對幾幅指紋圖像進(jìn)行匹配一般是從圖像中提取的特征進(jìn)行匹配。
一般來說,指紋圖像有全局特征和局部特征兩大特征,能夠反映指紋整體開關(guān)特征的是全局特征,這個(gè)特征的提取一般局于指紋分類;能夠反映指紋細(xì)節(jié)特點(diǎn)是局部特征,這個(gè)特征一般用于指紋對比。指紋線中的中斷點(diǎn)、交叉點(diǎn)及拐點(diǎn)是指紋的特征點(diǎn)。
指紋識別系統(tǒng)的主要工作分為兩個(gè)階段,即注冊階段與識別階段,也就是提取指紋特征和識別指紋特征的過程。一般在注冊階段,都要求輸入各自的用戶名以及對應(yīng)的指紋,該過程需要將手指放在專門的采集指紋窗口上,經(jīng)過指紋識別系統(tǒng)的指定模塊特征提取模塊將輸入指紋的特征提取出來,結(jié)合用戶名形成一個(gè)數(shù)據(jù)庫;識別階段時(shí),該系統(tǒng)會將輸入的指紋與數(shù)據(jù)庫中現(xiàn)在有的指紋中進(jìn)行一系列的匹配,特征點(diǎn)特征線等,這個(gè)過程需要讀取數(shù)據(jù)庫中保存的指紋特征信息。通用的指紋識別系統(tǒng)的流程圖如圖1所示。
圖1指紋識別系統(tǒng)
就使用情況看,現(xiàn)有的指紋識別系統(tǒng)通常分為兩大類,即嵌入式系統(tǒng)和計(jì)算機(jī)終端指紋識別系統(tǒng)。嵌入式系統(tǒng)是一個(gè)獨(dú)立的系統(tǒng),它不需要其它的設(shè)備就可以完成工作,這方面的應(yīng)用有指紋鎖,指紋考勤機(jī)(此處的指紋考勤機(jī)需要定期連接設(shè)備讀取存檔)等;計(jì)算機(jī)終端的指紋識別系統(tǒng)的設(shè)計(jì)與使用則更加靈活,通過計(jì)算機(jī)的分配,可以使多個(gè)系統(tǒng)共同使用指紋數(shù)據(jù)庫,若用在考勤設(shè)備中,則可以實(shí)時(shí)顯示該工作人員是否在崗。
除了公司等地的考勤、安保等地,還有一個(gè)與我們是日常生活更為接近的使用場合,即筆記本的指紋識別系統(tǒng),現(xiàn)在,有很多品牌的筆記本已經(jīng)將指紋識別系統(tǒng)應(yīng)用到計(jì)算機(jī)上,筆記本的指紋識別系統(tǒng)大概經(jīng)歷了兩代,第一代的指紋識別系統(tǒng)使用的是光學(xué)識別系統(tǒng),這種技術(shù)容易出錯(cuò)而且不穩(wěn)定,而第二代指紋識別系統(tǒng)采用的是電容傳感技術(shù),利用小信號創(chuàng)建指紋圖像的半導(dǎo)體設(shè)備,電容傳感器產(chǎn)生的電子信號可以直接達(dá)到真皮層讀取指紋圖案,提高了整個(gè)系統(tǒng)的可靠性。
3.結(jié)束語
指紋作為生物特征之一,其先天具有的不變性,唯
一性和可分類性,是公認(rèn)的具有法律地位的個(gè)人身份特
征的可靠證據(jù)。指紋識別系統(tǒng)相對其他生物識別系統(tǒng),
起點(diǎn)較早、種類最多應(yīng)用最廣泛,由于指紋識別系統(tǒng)成
本低,可以集成在很小的芯片上進(jìn)行處理,已經(jīng)普遍被
用來替換用戶名/ 口令、電子令牌等傳統(tǒng)的身份認(rèn)證終
端設(shè)備。目前,指紋識別系統(tǒng)已用到了幾乎所有需要進(jìn)
行安全性防范的場合,遍及諸多領(lǐng)域。
參考文獻(xiàn):
[1] 郭浩.基于嵌入式隱Markov模型的指紋分類和匹配研究.[博士學(xué)位論文].大連:大連理工大學(xué),2004
[2] Jain A K, Pankanti S. Automated Fingerprint Identification and Imaging Systems. Technical Report. Miehigan State University,1999.
[3] 李曉昆.基于結(jié)構(gòu)特征的指紋識別.計(jì)算機(jī)工程與科學(xué).1999,21(2):25~29
[4] 王崇文,李見為等.自動指紋識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).計(jì)算機(jī)應(yīng)用.2001,12:63~65
[5] 章毓晉.中國圖像工程及當(dāng)前的兒個(gè)研究熱點(diǎn).計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2002,14(6):489~193
[6] 高靖靖.指紋識別預(yù)處理算法研究:[碩士學(xué)位論文].成都:電子科技大學(xué),2007
關(guān)鍵詞:表格圖像處理;性能評測;表格版面結(jié)構(gòu);線條交點(diǎn)
中圖分類號:TP751文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2007)03-10754-02
1 引言
隨著圖像處理技術(shù)的不斷發(fā)展,對文檔圖像的處理已經(jīng)從一個(gè)字符識別器發(fā)展到一個(gè)復(fù)雜的包含圖文分割、公式識別、表格識別等功能的智能化系統(tǒng)。其中表格圖像最為常見,對于表格圖像的識別也是DIP(Document Image Processing)領(lǐng)域的一個(gè)研究重點(diǎn)[1]。
表格圖像中表格結(jié)構(gòu)的存在是不確定的,表格結(jié)構(gòu)存在的數(shù)量和位置也是不固定的。表格圖像處理的目的就是從包含有表格數(shù)據(jù)的圖像中定位出表格的位置,然后再對表格內(nèi)部版面結(jié)構(gòu)進(jìn)行分析,最后按照某種格式保存,變成計(jì)算機(jī)能夠處理的表格信息。表格圖像處理技術(shù)是一個(gè)有相當(dāng)難度的課題[1],許多處理方法不盡完善,需要不斷探索,針對表格圖像處理系統(tǒng)建立一個(gè)完整的評測體系尤為重要。目前的評測方法主要有兩種:一種是手工評測,一種是自動評測。手工評測是由評測人員用肉眼來觀察處理結(jié)果的好壞,自動評測是利用評測軟件分析系統(tǒng)的處理性能,評測過程是自動或半自動的。
本文針對表格版面結(jié)構(gòu)定位與分析的性能評測問題展開研究,在前人提出的“線條交點(diǎn)矩陣”匹配的評測機(jī)制[8]基礎(chǔ)上,做了優(yōu)化和改良,建立了完整的評測系統(tǒng),最后,基于南開大學(xué)機(jī)器智能研究所RTK系統(tǒng),進(jìn)行實(shí)際的測試分析,得出實(shí)驗(yàn)結(jié)果。
2 表格圖像處理自動評測模型
2.1 性能評測基本概念
首先我們引入DIP系統(tǒng)評測機(jī)制中使用的概念:
(1)性能評測(Performance Evaluation):根據(jù)一系列基準(zhǔn)數(shù)據(jù)對系統(tǒng)進(jìn)行性能測試。
(2)理想系統(tǒng)(Ideal System):相對實(shí)際待評測系統(tǒng)而言的,是個(gè)理想化的系統(tǒng),對于一定的輸入,產(chǎn)生期望的輸出。每個(gè)實(shí)際系統(tǒng)都有個(gè)對應(yīng)的理想系統(tǒng)。
(3)測試樣本(Test Sample):在系統(tǒng)測試或者評測過程中需要的對實(shí)際系統(tǒng)的輸入。
(4)測試基準(zhǔn)(Ground Truth):就是標(biāo)準(zhǔn)結(jié)果,測試樣本輸入理想系統(tǒng)得到的結(jié)果[3]。
(5)處理結(jié)果(Processing Result):將測試基準(zhǔn)作為實(shí)際系統(tǒng)的輸入,得到的結(jié)果就是處理結(jié)果。
(6)評測機(jī)制(Evaluation Mechanism):包括確定評測內(nèi)容、設(shè)計(jì)評測方法、制定評測標(biāo)準(zhǔn)和評測參數(shù)、選擇評測樣本、監(jiān)督評測實(shí)施和分析評測結(jié)果。
2.2 自動性能評測流程
圖1簡單描述了表格圖像處理性能評測的流程:
圖1 性能評測流程簡圖
其中標(biāo)準(zhǔn)結(jié)果是評測系統(tǒng)的一個(gè)基準(zhǔn),它是表格的所有線條和交點(diǎn)的集合,我們構(gòu)建一個(gè)數(shù)據(jù)庫來存放表格的標(biāo)準(zhǔn)結(jié)果;實(shí)際系統(tǒng)是我們待評測的表格處理系統(tǒng);評測函數(shù)是自動評測的核心。一個(gè)有效的評測算法是做到自動評測的關(guān)鍵[4],本文采用的是“線條交點(diǎn)”的評測機(jī)制,從整體和局部都能找到錯(cuò)誤的原因,為表格圖像的處理性能提高和完善提供指導(dǎo)信息;性能評測的結(jié)果是評測的比較結(jié)果,我們以圖形和表格等信息來描述評測結(jié)果。
2.4 基于線條交點(diǎn)的評測模型
表格的復(fù)雜版面結(jié)構(gòu)可以用表格中水平和豎直線的交點(diǎn)來描述,如圖2是一個(gè)表格圖像,它的結(jié)構(gòu)可以用圖3所示的線條交點(diǎn)來描述,其中表格邊線缺失的情況用虛線補(bǔ)齊。
圖2
圖3
(1)表格版面結(jié)構(gòu)定位的評測算法思想。采用由粗到精的比對算法對表格結(jié)構(gòu)的定位性能進(jìn)行評測,將表格定位的處理結(jié)果與標(biāo)準(zhǔn)結(jié)果相比較,如果處理結(jié)果正確,那么它的表格定位的位置和標(biāo)準(zhǔn)結(jié)果應(yīng)該一致(實(shí)際算法考慮閾值范圍),否則存在識別錯(cuò)誤,我們以此為標(biāo)準(zhǔn)來判斷處理結(jié)果中表格是否被定位。確定了表格是否被定位以后,再根據(jù)表格定位區(qū)域的區(qū)域是否標(biāo)準(zhǔn)結(jié)果區(qū)域重合來判斷定位的精度。
(2)表格版面分析的評測算法思想。表格圖像經(jīng)過處理以后得到的版面結(jié)構(gòu)是一個(gè)單元格(由行線和列線圍成的的最小矩形區(qū)域)鏈表,基于單元格對版面分析的結(jié)果的描述是一個(gè)非常復(fù)雜的問題(單元格為二維結(jié)構(gòu),其合理處理結(jié)果表現(xiàn)為二維平面的可接受面積),所以通過直接比較單元格鏈表的方法來評測版面分析的結(jié)果好壞,實(shí)現(xiàn)起來比較困難,效率也很低。
通過大量的實(shí)踐和觀察,我們發(fā)現(xiàn)兩個(gè)規(guī)律:(1)線條交點(diǎn)可以確定單元格;(2)線條交點(diǎn)的關(guān)聯(lián)性可以判斷單元格的正確性。因此我們可以通過比較表格線條交點(diǎn)的關(guān)聯(lián)性來確定單元格匹配是否成功。算法的實(shí)現(xiàn)過程見流程圖4:
圖4 表格評測算法整體流程
3 表格圖像處理性能評測環(huán)境
首先,挑選了100頁樣本作為本次實(shí)驗(yàn)的數(shù)據(jù),并且對其進(jìn)行了詳細(xì)分類:
表1是根據(jù)圖像的效果進(jìn)行分類,表2是根據(jù)表格的數(shù)目進(jìn)行的分類:
表1 測試樣本分類統(tǒng)計(jì)表
表2 測試樣本分類統(tǒng)計(jì)
這些樣本圖像文件放在一個(gè)單獨(dú)的目錄TableImageSet中。
其次,我們對所選的100頁樣本的處理結(jié)果做了人工評測,因?yàn)闃颖緮?shù)目較小,所以得到的結(jié)果是準(zhǔn)確和有效的,將它作為評測系統(tǒng)的衡量標(biāo)準(zhǔn),來衡量自動評測系統(tǒng)的結(jié)果,由此可以得出本系統(tǒng)的可靠性和有效性。
該自動評測系統(tǒng)在VC6.0環(huán)境中開發(fā),運(yùn)行環(huán)境是Pentium4,CPU 1.80GHz。下面一節(jié)將對評測的結(jié)果進(jìn)行分析總結(jié)。
4 實(shí)驗(yàn)結(jié)果
我們以TableImageSet中的樣本集作為輸入數(shù)據(jù),以RTK7.0的表格定位與分析模塊為評測對象,用我們的程序?qū)ζ溥M(jìn)行性能評測。首先分析其表格版面結(jié)構(gòu)定位性能,得出表3的結(jié)果,然后針對定位正確的表格進(jìn)行結(jié)構(gòu)分析的評測,得出表4的結(jié)果。
這些評測數(shù)據(jù)不僅反映出表格處理系統(tǒng)的整體性能,還定量的給出了系統(tǒng)的錯(cuò)誤的所在,使開發(fā)人員可以根據(jù)錯(cuò)誤的發(fā)生情況,對系統(tǒng)進(jìn)行有針對性的改進(jìn)。
參考文獻(xiàn):
[1]C. Peterman, C.H. Chang, andH. Alam. A system for table understanding. InProceedings of the Symposiun on Document Image Understanding Technonogy(SDIUT'97),pp. 55-62, Annapolis, MD, April/May 1997.
[2](美)Mark Fewster &Dorothy Graham. 軟件測試自動化技術(shù)與實(shí)例詳解[M], 電子工業(yè)出版社.
[3]Jianying Hu,Ramanujan Kashi,Daniel Lopresti,George Nagy,Gordon Wilfong. "Why Table Ground-Truthing is Hard." ICDAR 2001(Djvu) pp.129-133.
[4]V. F. Margner, P.Karcher, A.K.Pawlowski. "On BenchMarking of Document Analysis System", August, 1997. Proceedings of 4th International Conference Document Analysis and Recognition, Ulm, Germany(ICDAR'97). pp. 331-336.
[5]G. Nagy, "Document image analysis: Automated performance evaluation," in Document Analysis s\Systems, A. L. Spitz and Dengel, eds., pp. 137-156, World Scientific, Singapore, 1995.
[6]Jing. Hu, R. Kashi, D. Lopresti and G. Wilfong, "Table Structure Recognition and Its Evaluation", SPIE Document Recognition and Retrieval VIII San Jose, California, January 2001.
[7]Jianyin Hu, Ram Kashi, Daniel Lopresti, Gordon Wilfong, "Medium-Independent Table Detection", in Proceedings of Document Recognition and Retrieval VII (IS&T/SPIE Electronic Imaging),volume 3967,California,USA,January 2000,pp.291-302.
關(guān)鍵詞:結(jié)構(gòu)化局部邊緣模式;文檔圖像;模式分類
目前,文檔圖像具有很多種模式形態(tài),其分類方法也多種多樣。在過去,人們比較常用的分類方法是光學(xué)字符識別系統(tǒng),該系統(tǒng)主要根據(jù)文本特征、結(jié)構(gòu)特征、混合特征三種方法對文檔進(jìn)行識別分類,但是該分類方法的分類速度比較慢,對所處理圖像解析度的要求比較高。因此,該方法逐漸被結(jié)構(gòu)化局部邊緣模式分類方法所替代。
1 結(jié)構(gòu)化局部邊緣模式下處理圖像分類的預(yù)備知識
文本管理工作主要包括:壓縮、管理、歸檔、文本分析等,在進(jìn)行文檔工作處理的時(shí)候,相對準(zhǔn)確的文檔類型信息能夠有效的提高文本檢索的速度以及工作人員的工作效率。文檔具有多種模式形態(tài),每種形態(tài)都有自己的獨(dú)特性以及形態(tài)之間的相似性。結(jié)構(gòu)化局部邊緣模式的使用,不僅可以實(shí)現(xiàn)對圖像分割模式的自由調(diào)節(jié),還能夠有效的提高文檔圖像特征提取的準(zhǔn)確性,在使用結(jié)構(gòu)化局部邊緣模式進(jìn)行文檔圖像特征提取的時(shí)候,采用的是圖像區(qū)塊之間重疊的方法,通過這種方式有效的確保圖像分割區(qū)域特征本身的連貫型性。
2 采用結(jié)構(gòu)化局部邊緣模式下,文檔圖像分類特征的提取
本文在對結(jié)構(gòu)化局部邊緣模式下文檔圖像分類處理的研究中,進(jìn)行分類對比采用的是HOG。結(jié)構(gòu)化局部邊緣系統(tǒng)通過LEP特征,根據(jù)圖像像素鄰域的邊緣方向進(jìn)行了相關(guān)的編碼。文檔圖像本身特征就比較明顯,例如影像圖片的像素?cái)?shù)值變化比較大;一般學(xué)術(shù)論文的格式比較規(guī)整且字?jǐn)?shù)比較多;灰度圖像之相似性比較大,沒有明顯的規(guī)律可循;表格文件的特征性比較明顯,橫線和豎線比較多;PPT幻燈片的圖像、文字等變化性比較明顯,但是在排版方面具有一定的規(guī)律可以遵循,為了方便結(jié)構(gòu)化局部邊緣模式在處理文檔圖像方面的研究工作,上述幾種圖像類型的邊緣信息都比較明顯。
3 結(jié)構(gòu)化局部邊緣模式和HOG的主要特征
3.1 模式分類框架
文中在進(jìn)行結(jié)構(gòu)化局部邊緣模式下,文檔圖像的分類處理研究中,還沒有形成一一個(gè)完整通用的基準(zhǔn)數(shù)據(jù)庫進(jìn)行相關(guān)的實(shí)驗(yàn)研究,并且受其它因素的限制也比較明顯。所以,本文在進(jìn)行處理研究的時(shí)候,通過綜合對比研究選取了含有5000張圖像并具有四種文檔圖像類別,每種類型都包含1250張圖像,類型包括:影像圖片、學(xué)術(shù)論文、PPT幻燈影片以及含有表格的文件。另外,在進(jìn)行文檔圖像處理研究時(shí),圖片都是隨機(jī)獲取的。
3.2 結(jié)構(gòu)化局部邊緣模式的特征描述
結(jié)構(gòu)化局部邊緣模式主要是利用計(jì)算機(jī)模擬技術(shù)對對視覺、圖像等進(jìn)行處理,在使用的過程中,根據(jù)圖片中重復(fù)出現(xiàn)的不同pixel,并將其按照不同的方向延伸成九宮格的形狀作為參考的重點(diǎn)。在模式計(jì)算的過程中,首先要獲取到原始的邊緣圖像,并建立一個(gè)3*3的鄰域窗口,在這一過程中,文本會被分為比較小的空間區(qū)塊,其計(jì)算方式為:結(jié)構(gòu)化局部邊緣模式(SLEP)=Ni/N,i=0,1,2,…31,其中結(jié)構(gòu)化邊緣模式的變化范圍是在0到31之間,Ni中的i代表的是pixel的數(shù)目,n代表的是piexl的總數(shù)目。
3.3 HOG的特征描述
HOG特征是目前人們比較常用的圖像特征提取方法,該方法在計(jì)算的時(shí)候選取的是320*256的圖像區(qū)域,在此基礎(chǔ)上,把區(qū)塊的大小劃分為32*32,其中九宮格的大小為16*16,將九宮格的每一格作為最基本地計(jì)算單元,然后進(jìn)行相關(guān)的串聯(lián)計(jì)算。方法步驟如下。第一,可以對圖像進(jìn)行卷積處理,目的是了解圖像中像素的梯度以及方向變化,一般將范圍值控制在[-1,0,1]或者是[1,0,-1]。第二,對每個(gè)格子進(jìn)行量化處理,角度量化的范圍值是[0,180],然后根據(jù)每個(gè)像素的模建立九維方向角直方圖。第三,把區(qū)塊內(nèi)部各格子之間的直方圖進(jìn)行串聯(lián)處理,然后組成36維直方圖的特征向量。第四,把所有的特征向量串聯(lián)在一起,就會形成最后的直方圖特征向量。
4 結(jié)構(gòu)化局部邊緣模式的處理分析
在對上述四種類型的圖像特征進(jìn)行信息提取研究以后,了解到在進(jìn)行圖像分析的過程中,圖像的解析度分別為:80*64,160*128,這組數(shù)據(jù)說明和HOG相比,結(jié)構(gòu)化局部邊緣模式在運(yùn)用過程中性能效果比較好,分辨率也比較高。這說明結(jié)構(gòu)化局部邊緣系統(tǒng)在不適用OCR系統(tǒng)的條件下,也具有高質(zhì)量的文檔圖像分辨率。當(dāng)圖像大小為80*64,文檔圖像的類別為影像照片以及規(guī)范化的學(xué)術(shù)論文的時(shí)候,SLEP測試效果要比HOG高0.1到1.6個(gè)百分點(diǎn),但是當(dāng)進(jìn)行表格文件處理的時(shí)候,百分點(diǎn)就會比HOG的百分點(diǎn)低,當(dāng)進(jìn)行PPT幻燈片測試的時(shí)候,百分點(diǎn)又會比HOG高,這表明,結(jié)構(gòu)化局部邊緣模式在文檔圖像處理的時(shí)候,使用整體效能比較高。當(dāng)圖像大小逐漸變大的時(shí)候,除表格文件的測試百分點(diǎn)比較低之外,其余也呈現(xiàn)逐漸增高的現(xiàn)象。上述研究表明,當(dāng)圖像文檔比較混亂的時(shí)候,梯度方向呈現(xiàn)混亂的狀態(tài),進(jìn)行文檔圖像、影片特征分類會比較方便,但是在進(jìn)行表格文檔處理的時(shí)候,使用HOG取得的效果會更加的明顯。
[參考文獻(xiàn)]
關(guān)鍵詞: 三維坐標(biāo); 多目視覺; 雙目交匯; 硅棒; 特征點(diǎn)
中圖分類號: TP 274.2文獻(xiàn)標(biāo)識碼: Adoi: 10.3969/j.issn.10055630.2013.02.001
引言硅棒的實(shí)際尺寸參數(shù)與硅棒本身的特征點(diǎn)提取密切相關(guān),獲取硅棒特征點(diǎn)的三維坐標(biāo)信息可有效反映硅棒尺寸參數(shù)和產(chǎn)品質(zhì)量,為產(chǎn)品的質(zhì)量監(jiān)控提供依據(jù)[1]。然而針對硅棒,無論是整體尺寸還是局部特征的檢測,國內(nèi)目前尚無相關(guān)儀器,在我國這些參數(shù)的檢測還主要是依靠人工完成[2]。人工檢測是一種非在線、接觸式的傳統(tǒng)檢測方式,采用直角尺、游標(biāo)卡尺、鋼板尺等工具進(jìn)行檢驗(yàn),檢測精確度和重復(fù)性受到檢測人員工作狀態(tài)干擾,很難保證統(tǒng)一標(biāo)準(zhǔn),總體上來說檢測速度和檢測精度不高;同時(shí)接觸式檢測過程中需反復(fù)搬動樣品不可避免地造成對樣品的二次傷害,效率低,儀器損耗大[2]。結(jié)合視覺成像技術(shù)和圖像處理技術(shù)出現(xiàn)的機(jī)器視覺檢測技術(shù),不僅摒棄了傳統(tǒng)檢測方法的不足,滿足了實(shí)時(shí)檢測要求,同時(shí)還具有非接觸、精度高等優(yōu)點(diǎn),是現(xiàn)場實(shí)時(shí)三維坐標(biāo)測量的首選方法之一[35]。國內(nèi)外關(guān)于三維坐標(biāo)的相關(guān)測量方法主要有:電子經(jīng)緯儀法和三坐標(biāo)測量機(jī)法[3]。坐標(biāo)測量機(jī)的測量精度可達(dá)微米級,但是龐大的機(jī)身、厚重的底座、復(fù)雜的操作以及昂貴的成本限制了其現(xiàn)場的應(yīng)用[4];經(jīng)緯儀、激光跟蹤儀便攜性好,但采用多點(diǎn)對準(zhǔn),效率低,不適合于現(xiàn)場在線檢測[5]。機(jī)器視覺檢測系統(tǒng)組建非常靈活,既可由單目視覺測量系統(tǒng)構(gòu)成,亦可選擇雙目甚至多目視覺測量系統(tǒng)搭建而成。因?yàn)閱文恳曈X測量三維空間坐標(biāo)測量不確定度偏差較大[4],所以選擇由四CCD構(gòu)成的多目視覺系統(tǒng),該多目視覺檢測系統(tǒng)中,相鄰的兩CCD構(gòu)成正交雙目交匯視覺測量子模塊系統(tǒng),基于雙目視覺原理的子模塊克服了單目視覺檢測的缺陷,精度更高。該多目機(jī)器視覺系統(tǒng)在保證較高精度的前提下,作為機(jī)器視覺前端采集系統(tǒng),實(shí)現(xiàn)了硅棒全范圍大尺寸輪廓檢測,檢測效率和速度較高。1硅棒坐標(biāo)檢測機(jī)器視覺系統(tǒng)組成典型的基于機(jī)器視覺的硅棒坐標(biāo)檢測系統(tǒng)組成如圖1所示:
圖1機(jī)器視覺的坐標(biāo)檢測系統(tǒng)組成
Fig.1The design of machine vision for coordinate detection system
硅棒坐標(biāo)測量系統(tǒng)主要包括上位機(jī)界面、數(shù)據(jù)采集模塊、圖像處理模塊、輸入輸出接口以及機(jī)械搭建平臺組成。上位機(jī)作為人機(jī)交互平臺負(fù)責(zé)數(shù)據(jù)顯示和存儲,總體管理數(shù)據(jù)采集模塊和圖像處理模塊。數(shù)據(jù)采集系統(tǒng)作為機(jī)器視覺檢測的核心之一完成硅棒輪廓信息圖像采集,涉及光源、鏡頭、CCD相機(jī)以及圖像采集卡,采集系統(tǒng)工作流程為:光源照射待測硅棒,CCD相機(jī)采集圖像信息經(jīng)過圖像采集卡將圖像信息轉(zhuǎn)換為數(shù)字信息送入上位機(jī)并實(shí)時(shí)保存起來。數(shù)據(jù)采集完成之后,圖像處理模塊讀取圖像通過相應(yīng)算法提取特征點(diǎn)最終計(jì)算特征點(diǎn)空間三維坐標(biāo)。圖1還可以看出整個(gè)數(shù)據(jù)采集模塊搭建在機(jī)械平臺上由執(zhí)行機(jī)構(gòu)驅(qū)動,不僅可以實(shí)現(xiàn)待測目標(biāo)的小范圍檢測,同時(shí)還可以配合機(jī)械平臺運(yùn)動,驅(qū)動數(shù)據(jù)采集系統(tǒng)實(shí)現(xiàn)待測物體的大范圍全尺寸檢測。2硅棒特征點(diǎn)三維坐標(biāo)檢測原理
2.1四目視覺全范圍檢測系統(tǒng)組成硅棒特征點(diǎn)坐標(biāo)視覺檢測技術(shù)基于四目視覺原理,整個(gè)四目視覺系統(tǒng)作為機(jī)器視覺檢測系統(tǒng)的數(shù)據(jù)采集模塊負(fù)責(zé)為后續(xù)圖像處理模塊提供硅棒圖像信息,采集的圖像質(zhì)量直接影響到后續(xù)圖像處理的難易程度和結(jié)果的計(jì)算精度。四目視覺原理如圖2所示:數(shù)據(jù)采集模塊由四臺CCD相機(jī)組成,分別在待測硅棒每個(gè)側(cè)面安裝一臺CCD面陣相機(jī),保持相機(jī)與硅棒待測面垂直放置,在自然光源照射下硅棒表面成像于與之垂直的CCD相機(jī)上,則相機(jī)分別獲得每個(gè)硅棒表面特征的圖像。該圖像可以通過一個(gè)四路camelink接口圖像采集卡或者2個(gè)雙路camelink接口圖像采集卡送入上位機(jī)進(jìn)行后續(xù)圖像處理。整個(gè)數(shù)據(jù)采集系統(tǒng)要實(shí)現(xiàn)的功能就是確保不降低系統(tǒng)檢測精度的前提下,維持盡量大的有效視場范圍,實(shí)時(shí)采集獲取清晰的硅棒圖像。
2.2四目視覺系統(tǒng)視場約束為了實(shí)現(xiàn)最優(yōu)檢測目的,必須保證待測硅棒在檢測過程中始終處于四目視覺系統(tǒng)的有效視場范圍內(nèi),若硅棒對應(yīng)于相機(jī)上像點(diǎn)的坐標(biāo)為(xi,yi),通過針孔模型透視變換公式就能得出某個(gè)特征點(diǎn)在有效視場內(nèi)的世界坐標(biāo)為OXWiYWiZWi。圖3為四目視覺系統(tǒng)有效視場示意圖,以四臺CCD交匯中心建立世界坐標(biāo)系。
圖2四目視覺系統(tǒng)組成
Fig.2The composition of the 4 CCDs
vision system圖3四目全范圍檢測原理及有效視場分析
Fig.3The principle and the analysis of effective
vision field for 4CCDs′ full range detection
如圖所示:四臺面陣相機(jī)型號相同,焦距f均為鏡頭中心到CCD靶面中心的距離,相鄰相機(jī)之間的基線長度均為B(B=O1O2=O2O3=O3O4=O4O1),O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4是分別以CCD相機(jī)各自的鏡頭中心建立相機(jī)坐標(biāo)系,以CCD1和CCD2光軸的交點(diǎn)為原點(diǎn)建立世界坐標(biāo)系OXWYWZW,O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4均位于OXWYWZW內(nèi),最終計(jì)算時(shí)必須將O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4這四個(gè)相機(jī)坐標(biāo)系轉(zhuǎn)換到同一個(gè)參考坐標(biāo)系OXWYWZW。假設(shè)CCD相機(jī)像平面平均尺寸為2Tx×2Ty,相鄰相機(jī)光軸夾角為2α,則四目視覺系統(tǒng)的有效視場為ABCDEFGH圍成的八邊形。為了準(zhǔn)確描述有效視場,在八邊形ABCDEFGH內(nèi)做內(nèi)切圓,內(nèi)切圓面積就反映有效視場的大小,采用內(nèi)切圓的半徑R對有效視場進(jìn)行描述。考慮Tx遠(yuǎn)遠(yuǎn)小于焦距f,則有效視場R可以采用如下近似公式描述:R=Bcosβ/2sinα=Bcos(arctan(Tx/f))/2sin45°≈22BTx/f(1)由式(1)可知:CCD相機(jī)間基線長度B、視場角β以及相機(jī)夾角α這三個(gè)參數(shù)不僅直接限制有效視場的大小,還會嚴(yán)重影響四目視覺系統(tǒng)的測量精度。引起測量精度的誤差包括相機(jī)本身參數(shù)(Tx、Ty)以及相機(jī)分布結(jié)構(gòu)參數(shù)、參數(shù)本身的測量誤差(B、f)[6],它們共同決定了機(jī)器視覺采集系統(tǒng)的精度。
2.3雙目交會原理如圖2可知:四目視覺系統(tǒng)中的任意相鄰的兩個(gè)CCD構(gòu)成雙目交匯視覺測量系統(tǒng),所以整個(gè)四目視覺系統(tǒng)可以看作四個(gè)雙目交匯視覺子系統(tǒng)組成,其中CCD1和CCD2構(gòu)成子系統(tǒng)1,CCD2和CCD3構(gòu)成子系統(tǒng)2,CCD3和CCD4構(gòu)成子系統(tǒng)3,CCD4和CCD1構(gòu)成子系統(tǒng)4。因?yàn)槊總€(gè)子系統(tǒng)光軸互相垂直,所以子系統(tǒng)基于正交雙目交匯視覺原理。正交雙目交匯測量比單目測量準(zhǔn)確度高,它的相機(jī)夾角2α=90°有效降低安裝誤差[7],保證基線長度,形成相對較大的有效視場利于實(shí)現(xiàn)大尺寸檢測,同時(shí)α=45°滿足α∈(40°-70°)放置時(shí)測量誤差最小要求[4]。以雙目交匯視覺子系統(tǒng)1為例:CCD1和CCD2分別滿足針孔成像模型:zc1 u
(3)其中矩陣M是由相機(jī)內(nèi)部參數(shù)(r1~r9)和相機(jī)外部參數(shù)(T1~T3)構(gòu)成的一個(gè)3×4的綜合矩陣。聯(lián)立式(2)和式(3)求解則可得到CCD1和CCD2的采集圖像上的公共特征點(diǎn)的三維坐標(biāo),即硅棒第1對棱邊上的特征點(diǎn)坐標(biāo),同理對于雙目交匯視覺子系統(tǒng)2、雙目交匯視覺子系統(tǒng)3、雙目交匯視覺子系統(tǒng)4可依次求得第2對、第3對、第4對棱邊上的特征點(diǎn)坐標(biāo),從而在保證精度前提下實(shí)現(xiàn)硅棒全范圍檢測目的。3硅棒特征點(diǎn)三維坐標(biāo)檢測方法的實(shí)現(xiàn)為了驗(yàn)證硅棒特征點(diǎn)三維坐標(biāo)視覺檢測系統(tǒng)的可行性,在實(shí)驗(yàn)室搭建了機(jī)器視覺檢測試驗(yàn)樣機(jī)進(jìn)行試驗(yàn),完成四目視覺采集系統(tǒng)的相機(jī)標(biāo)定實(shí)驗(yàn),同時(shí)以CCD1和CCD2構(gòu)成的正交雙目子系統(tǒng)為例進(jìn)行一對硅棒表面圖像的數(shù)據(jù)采集實(shí)驗(yàn),基于Visual Studio 2008平臺編寫核心圖像處理算法。
3.1標(biāo)定實(shí)驗(yàn)相機(jī)標(biāo)定是視覺測量過程中不可缺少的關(guān)鍵技術(shù),標(biāo)定通過針孔成像原理求取相機(jī)內(nèi)部屬性參數(shù)和外部位置參數(shù)從而確定空間坐標(biāo)系中物點(diǎn)和像點(diǎn)的對應(yīng)關(guān)系[8]。針對本文的多目視覺系統(tǒng)首先對每個(gè)相機(jī)進(jìn)行單目標(biāo)定。單目標(biāo)定選擇一種介于傳統(tǒng)標(biāo)定技術(shù)和自標(biāo)定技術(shù)之間的方法:張氏平面標(biāo)定法。標(biāo)定流程為:首先將自制一個(gè)大小為11×11標(biāo)準(zhǔn)棋盤格模板,每個(gè)棋盤格大小為10 mm×10 mm。該模板置于視覺系統(tǒng)有效視場內(nèi),改變模板位置多角度(不小于3個(gè))分別拍攝,拍攝完成后進(jìn)行角點(diǎn)檢測,單應(yīng)性矩陣求解和參數(shù)優(yōu)化,每個(gè)CCD獲得一個(gè)相應(yīng)的相機(jī)標(biāo)定文件calib_CCD_1.mat、calib_CCD_2.mat、calib_CCD_3.mat、calib_CCD_4.mat。這種標(biāo)定方法比傳統(tǒng)標(biāo)定簡單,算法計(jì)算量減少且精度高于自標(biāo)定方法。通過單目標(biāo)定得到X方向和Y方向有效焦距(ax,ay)、CCD靶面中心坐標(biāo)(u0,v0)以及徑向或者切向畸變等相機(jī)內(nèi)部參數(shù),由于切向畸變較小,此處忽略不計(jì),主要考慮徑向畸變參數(shù)(k1,k2),單目標(biāo)定結(jié)果見表1。單目標(biāo)定完成之后進(jìn)行立體標(biāo)定,分別獲得相機(jī)坐標(biāo)系O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4相對于世界坐標(biāo)系的旋轉(zhuǎn)矩陣R和平移矩陣T。立體標(biāo)定結(jié)果見表2。表1單目相機(jī)標(biāo)定結(jié)果
Tab.1The result of monocular camera calibration
CCD1CCD2CCD3CCD4(ax,ay)(1 537.644 971 864.834 93)(1 533.415 091 857.500 18)(1 535.344 071 860.932 01)(1 539.700 31 865.793 31)(u0,v0)(350.602 11272.778 93)(360.149 42285.268 16)(357.021 19279.775 49)(351.339 08288.441 09)(k1,k2)(-0.382 631.710 26)(-0.372 052.034 223)(-0.367 811.901 27)(-0.380 091.947 37)像素誤差(0.321 280.370 39)(0.275 690.223 16)(-0.332 810.201 27)(-0.339 610.291 27)
表2多目相機(jī)標(biāo)定結(jié)果
Tab.2The result of multicamera calibration
O1Xc1Yc1Zc1O2Xc2Yc2Zc2O3Xc3Yc3Zc3O4Xc4Yc4Zc4R10010.003 70.04310.002 90.004 310.003 70.040 3010-0.003 61-0.006 50.043 61-0.046 5-0.007 11-0.047 3001-0.004 50.066 81-0.003 90.061 71-0.006 50.057 91T0.242 81 000.229 00999.233 70.100 20.297 50.441 70.020 9-998.001 90.199 51 002.336 70.019 7
圖4硅棒圖像
Fig.4Images of silicon rods3.2圖像采集實(shí)驗(yàn)實(shí)驗(yàn)采用四個(gè)IMPERX面陣CCD相機(jī)、相機(jī)配接15 mm的標(biāo)準(zhǔn)鏡頭,兩個(gè)X64CL Prio圖像采集卡,兩個(gè)鏡頭基線距離為1 408.6 mm搭建實(shí)驗(yàn)樣機(jī),有效線視場為236.544 mm,將待測硅棒置于CCD交匯的有效視場范圍內(nèi),配置圖像采集卡輸出格式為Cameralink Base Mono #1,導(dǎo)入IPX_VGA210相機(jī).cfg配置文件,通過X64CL Prio圖像采集卡將一對像素為640×480黑白硅棒圖像實(shí)時(shí)送入上位機(jī)。其中正交雙目視覺子模塊1采集到的一對圖像如圖4所示。
3.3圖像處理特征點(diǎn)坐標(biāo)檢測視覺系統(tǒng)第二個(gè)核心組成是圖像處理模塊,該模塊通過完成對采集數(shù)據(jù)的后續(xù)圖像處理獲得目標(biāo)特征點(diǎn)的三維空間坐標(biāo),技術(shù)難點(diǎn)在于機(jī)器視覺數(shù)據(jù)采集模塊中CCD相機(jī)得到的是二維圖像信息,而系統(tǒng)最終要求是得到目標(biāo)特征點(diǎn)的空間三維坐標(biāo)。針對問題論文提出一種二維圖像上恢復(fù)特征興趣點(diǎn)三維坐標(biāo)的解決方法:首先提取待處理圖像上的特征興趣點(diǎn),建立特征興趣點(diǎn)對應(yīng)關(guān)系即同名點(diǎn)識別,接著通過同名點(diǎn)立體匹配獲取對應(yīng)點(diǎn)視差從而得到特征興趣點(diǎn)3D坐標(biāo)。
3.3.1Harris角點(diǎn)檢測論文以硅棒角點(diǎn)作為研究的特征興趣點(diǎn),采用一種基于灰度值相關(guān)的角點(diǎn)檢測算子:Harris算子進(jìn)行硅棒角點(diǎn)檢測。Harris角點(diǎn)檢測的目的是提取待測目標(biāo)的特征點(diǎn),依靠特征點(diǎn)來傳遞圖像所表征的參數(shù)信息,算法不受相機(jī)姿態(tài)及光照影響,檢測精度達(dá)到像素級別[9]。Harris算子數(shù)學(xué)表達(dá)形式為:M=G(S)gxgxgy
gxgygy(4)
I=Det(M)-k×Trace2(5)M為自相關(guān)聯(lián)系矩陣、Det(M)為自相關(guān)矩陣行列式的值,Trace為矩陣的跡,k為默認(rèn)常數(shù),取0.04。式(5)稱為Harris算法響應(yīng)函數(shù),該函數(shù)給出局部范圍內(nèi)的興趣值大小。Harris算法采用局部范圍內(nèi)的極大興趣值對應(yīng)的像素點(diǎn)作為特征點(diǎn),因此通過對算法中的門限閾值、局部鄰域大小、高斯窗口大小和高斯方差多次調(diào)整,保證在局部鄰域內(nèi)只留下最大極值點(diǎn)作為興趣點(diǎn),實(shí)現(xiàn)特征最優(yōu)角點(diǎn)的提取。
3.3.2特征點(diǎn)立體匹配特征點(diǎn)立體匹配就是在待匹配圖像上尋找標(biāo)準(zhǔn)圖像上每個(gè)特征點(diǎn)的同名點(diǎn),從而將不同圖像中原本獨(dú)立的特征興趣點(diǎn)聯(lián)系起來[1011],特征點(diǎn)匹配不是盲目進(jìn)行,它遵循一定約束條件,本文同名點(diǎn)匹配基于極線約束。極線約束規(guī)定了一幅圖像上任意一點(diǎn)在另一幅圖像上的對應(yīng)點(diǎn)只可能位于一條特定的極線上,通過該約束特征點(diǎn)匹配搜索空間從二維降為一維,減少計(jì)算量[10]。匹配流程為:首先在現(xiàn)有圖像中設(shè)定一個(gè)標(biāo)準(zhǔn)圖像,對于標(biāo)準(zhǔn)圖像中的特征點(diǎn)Pl,找出待匹配圖像中與其有最近歐氏距離的前兩個(gè)特征點(diǎn)Pr1和Pr2,計(jì)算兩個(gè)特征點(diǎn)中最近的距離Dmin與次近的距離Pcmin的比值,如果該比值小于匹配閾值,則表示待匹配圖像上歐氏距離最近的點(diǎn)是標(biāo)準(zhǔn)圖像中Pl特征最優(yōu)匹配點(diǎn)。其次以待匹配圖像中Pr1為特征點(diǎn),重復(fù)步驟1的過程,求取標(biāo)準(zhǔn)圖像中Pr1的候選匹配點(diǎn)P′l。最后如果Pl 和P′l是相同點(diǎn),則Pl 和Pr1匹配成功,否則棄之。重復(fù)這個(gè)流程,直到匹配完成。同名點(diǎn)匹配完成之后,由雙目視覺視差公式即可得出特征點(diǎn)3D坐標(biāo)。最后對采集系統(tǒng)拍攝的兩幅硅棒圖像進(jìn)行角點(diǎn)檢測及匹配算法驗(yàn)證,獲得了圖像中的4對公共角點(diǎn)3D點(diǎn)坐標(biāo)值,結(jié)果見表3。
表3特征點(diǎn)3D坐標(biāo)計(jì)算結(jié)果
Tab.3The calculation result of characteristic points′ 3D coordinatemm
特征角點(diǎn)X實(shí)測值X理論值Y實(shí)測值Y理論值Z實(shí)測值Z理論值153.59154-79.833-80.5-63.422-63263.32263-80.032-80.5-53.709-54353.6195480.20080.5-63.192-63463.2096379.90280.5-53.991-54
通過表3可以看出:理論計(jì)算結(jié)果和實(shí)際測量結(jié)果基本吻合,且實(shí)際測量精度明顯高于理論計(jì)算精度。4結(jié)論論文提出一種基于機(jī)器視覺的非接觸、實(shí)時(shí)硅棒特征點(diǎn)檢測技術(shù),搭建了多目視覺硅棒采集系統(tǒng)進(jìn)行圖像采集實(shí)驗(yàn),重點(diǎn)研究了多目視覺有效視場確定和正交雙目交匯視覺測量原理,基于Visual Studio 2008平成了硅棒角點(diǎn)特征提取以及同名角點(diǎn)立體匹配等后續(xù)圖像處理算法,整個(gè)檢測過程時(shí)間不超過0.5 min。實(shí)驗(yàn)結(jié)果表明,該技術(shù)可準(zhǔn)確快速獲取待檢測硅棒的特征點(diǎn)三維坐標(biāo),檢測精度可以達(dá)到像素級別,適合于硅棒參數(shù)的非接觸式高精度檢測。為下一步開展硅棒面形檢測研究奠定了基礎(chǔ)。參考文獻(xiàn):
[1]郭海霞,解凱.焦點(diǎn)檢測技術(shù)研究[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報(bào),2007,23(2):73-75.
[2]徐岳生,劉彩池,王海云,等.直拉硅的現(xiàn)狀與發(fā)展[C]∥中國有色金屬學(xué)會第六屆學(xué)術(shù)年會論文集.長沙:中南大學(xué)出版社,2005:62-69.
[3]彭凱,劉麗冰.雙攝像機(jī)光學(xué)三坐標(biāo)測量系統(tǒng)的研究[J].工藝與檢測,2008,10(9):115-117.
[4]彭凱,劉麗冰,劉書桂.基于雙相機(jī)的計(jì)算機(jī)視覺坐標(biāo)測量系統(tǒng)[J].光電工程,2008,35(7):95-98.
[5]管業(yè)鵬,童林夙.雙目立體視覺測量方法研究[J].儀器儀表學(xué)報(bào),2003,24(6):581-588.
[6]劉佳音,王忠立,賈云得.一種雙目立體視覺系統(tǒng)的誤差分析方法[J].光學(xué)技術(shù),2003,29(3):354-360.
[7]郭玉波,姚郁.雙目視覺測量系統(tǒng)結(jié)構(gòu)參數(shù)優(yōu)化問題研究[J].紅外與激光工程,2006,35(增刊):506-509.
[8]羅世民,李茂西.雙目視覺測量中三維坐標(biāo)的求取方法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(19):3622-3624.
[9]張春生.基于點(diǎn)特征匹配的SUSANHarris算子比較[J].西安科技大學(xué)學(xué)報(bào),2007,27(4):608-616.