- 相關(guān)推薦
淺談圖像仿射變換的應(yīng)用
摘 要:圖像的仿射變換是對圖像進行校正和修補的一種重要方式。本文討論了仿射變換的原理和性質(zhì),介紹了仿射變換的一些實際應(yīng)用,并對仿射變換的未來研究方向作出了展望。
關(guān)鍵詞:計算機技術(shù)發(fā)表,發(fā)表計算機技術(shù),計算機技術(shù)投稿
隨著數(shù)碼照相機、手機的越來越普及,人們越來越趨向于使用攝像頭取代傳統(tǒng)的掃描儀拍攝圖像,并對圖像中的文字或圖像本身進行識別。然而這種使用攝像頭拍到的圖像,一方面受拍攝角度的影響,存在透視扭曲,導(dǎo)致圖像發(fā)生形變;另一方面,由于圖像的實際場景本身存在形變,嚴重影響到圖像的識別。一種最常用的方法是通過采用仿射變換來對圖像進行一定程度的校正以方便人眼或機器的識別和配準。
1 .圖像的仿射變換
圖像可以看作是由成行列的像素點組成。因此可以通過建立坐標系,給每個像素點定一個坐標。仿射變換實際上就是坐標變換,即根據(jù)圖像變換的原理,得到變換前后圖像坐標間的映射關(guān)系。假設(shè)輸入圖像中,像素點的坐標是(x,y);輸出圖像中,像素點的坐標是( , )。為了表示仿射變換,需要引入齊次坐標,即用三維向量(x,y,1)表示二維向量(x,y),對于高維來說也是如此。按照這種方法,就可以用矩陣乘法表示變換。仿射變換可以統(tǒng)一表示為: 當矩陣的行列增加時,右下角的元素1不變其它部分用0填充,任何仿射變換都可以由上式變換而來。對 - 的不同取值,對應(yīng)著不同的變換類型: (1)平移,將每一點移動到(x+ax,y+by),變換矩陣為: (2)旋轉(zhuǎn)變換,將目標圖像繞原點順時針旋轉(zhuǎn)角度,變換矩陣為: (3)剪切變換,又稱“錯切變換”,相當于一個橫向剪切與一個縱向剪切的復(fù)合,變換矩陣為: (4)縮放變換,將每一點的橫左邊放大(縮小)至a倍、縱坐標放大(縮小)至b倍,變換矩陣為: 仿射變換可以看作是由平移、旋轉(zhuǎn)、剪切和縮放多個操作級聯(lián)而成。
2 仿射變換的應(yīng)用
仿射映射是實現(xiàn)識別的一個重要部分,以下是一些典型的應(yīng)用及其實現(xiàn)過程。
2.1 交通標志檢測
基于計算機視覺的道路交通標志識別系統(tǒng)(TSR)是智能交通系統(tǒng)(ITS)的重要組成部分。將仿射變換應(yīng)用于TSR,可以較好地解決場景圖中交通標志的變形問題,并通過對其進行形狀校正來提高交通標志檢測和識別的準確率。 以三角標志牌識別過程為例,具體步驟如下:
(1) 對圖片進行去噪和顏色分割的預(yù)處理;
(2) 利用顏色信息分割該交通標志,確定感興趣區(qū)域;
(3) 對感興趣區(qū)域進行二值化掃描,并找到感興趣區(qū)域的三個端點位置;
(4) 計算旋轉(zhuǎn)的角度,將感興趣區(qū)域圍繞最左邊的點(或者圖像邊緣的特征點)做旋轉(zhuǎn);
(5) 根據(jù)仿射變換式確定仿射矩陣,將斜三角變換成為標準三角。與此類似的應(yīng)用有車牌識別等。
2.2 文本圖像糾正
在一副圖像中進行文本檢測和定位,一般利用基于區(qū)域(利用文本區(qū)域獨特的梯度分布、紋理和顏色)的方法。 首先,假定文本和背景有強烈的對比,因此這些高梯度值被視為文本區(qū)域良好的候選域,通常以邊緣檢測或圖像梯度特征來定位文本域。然后,采用局域閥值處理方法二值化圖片。接著,進行抽取工作,即對二值化圖片中的候選域進行文本驗證,輸出字符。接下來的工作就由仿射變換來實現(xiàn)。根據(jù)文字的實際情況,計算其旋轉(zhuǎn)角度并調(diào)整圖像的立體傾斜。此方法最大的應(yīng)用是OCR文字識別軟件等。
2.3 衛(wèi)星圖像的配準
衛(wèi)星圖像由于距離和精確度的限制,很難對圖像的各個細節(jié)進行細致的描述,所以對衛(wèi)星圖像的匹配一般都是基于圖像邊緣信息的。首先,通過網(wǎng)絡(luò)數(shù)據(jù)或?qū)嶋H測量,建立衛(wèi)星圖(邊緣信息)數(shù)據(jù)庫作為模板。然后,對所拍的衛(wèi)星圖像進行快速多尺度小波變換來提取邊緣信息及關(guān)鍵點(如交點和拐點)。接著,利用仿射變換對邊緣信息圖像進行校正。最后,將衛(wèi)星圖像與數(shù)據(jù)庫中圖像進行關(guān)鍵特征點的配準。相關(guān)應(yīng)用有GPS定位、高空捕捉等。
2.4 醫(yī)學(xué)圖像配準
對于人體的醫(yī)學(xué)圖像配準,主要針對剛體。所謂剛體指物體內(nèi)部任意兩點間的距離保持不變,如人的頭部。在配準過程中,主要使用參數(shù)圖像配準方法,即基于標記點、主軸、灰度的配準。以基于標記點的配準為例,對同一個病人在同一時期不同時間進行2次大腦磁共振成像(MRI)檢測,得到a圖和b圖。首先,對a圖,識別并定位兩個以上的標記點(一般選輪廓上曲率的極值點、灰度的極值點或拐點等)。然后,對b圖進行同樣的處理。接著,對b圖進行仿射變換,調(diào)整其與a圖配準。最后,根據(jù)配準結(jié)果就可以看出來病人的病情發(fā)展情況。與此類似,對于人體骨骼的CT、MRI、X光圖都可以應(yīng)用仿射變換來實現(xiàn)圖像匹配。
2.5 人臉對齊 人臉識別技術(shù)是當前生物特征識別的熱點之一,在信息安全、視頻監(jiān)控、視頻跟蹤等領(lǐng)域有著廣泛的應(yīng)用前景。要完成人臉識別,一個重要的步驟就
【淺談圖像仿射變換的應(yīng)用】相關(guān)文章:
常用函數(shù)圖像03-11
圖像記憶的原理03-06
后羿射日典故09-29
后羿射日作文04-27
[優(yōu)選]常用函數(shù)圖像03-12
變換角度天地新作文06-07
后羿射日作文(精華)05-06
《荷花》仿寫02-27
《燕子》仿寫03-02