時間:2022-05-02 05:19:48
序論:在您撰寫計算機視覺論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
現(xiàn)階段,我國的市面上有很多不同的方法來進行機械零件尺寸的測量和研究,采取不同的測量辦法,得出的結果也有著精確度的差異。原始的測量方法是人們通過借助各種測量儀器,如萬能工具顯微鏡和三坐標測量機等,進行人工測量操作。這種方式存在著很多弊端,而計算機視覺檢測技術的應用則可以很好地解決這一問題。所謂視覺檢測就是檢測被測目標時,把圖像當作檢測和傳遞信息的手段或載體加以利用的檢測方法,其目的是從圖像中提取有用的信號,它是以現(xiàn)代光學為基礎,融光電子學、計算機圖像學、信息處理、計算機視覺等科學技術為一體的現(xiàn)代檢測技術。由于計算機視覺系統(tǒng)可以快速獲取大量信息,而且易于與設計信息及加工控制信息集成,基于視覺檢測技術的儀器設備能夠實現(xiàn)智能化、數(shù)字化、小型化、網(wǎng)絡化和多功能化,具備在線檢測、實時分析、實時控制的能力在軍事、工業(yè)、商業(yè)、醫(yī)學等領域得到廣泛關注和應用。
一、計算機視覺檢測技術含義
計算機的視覺又叫做機器視覺,通過利用計算機或者是其他的一些機械設備來幫助人們視線事物到圖片的過程,從而進行三維世界的感知活動。計算機的快速發(fā)展,離不開神經(jīng)心理學,心理學和認知科學方面的研究和發(fā)展,計算機視覺檢測技術的發(fā)展方向就是對周圍的三維空間進行感知和分析。一旦能夠擁有這種能力,計算機不僅能感知到周圍的總體環(huán)境,而且,還能夠具有對物體進行描述,識別理解和儲存的能力。
二、計算機視覺檢測的基本原理
要實現(xiàn)人工智能對視覺的計算機處理是很重要的方面在計算機視覺應用領域中如果要讓我們的計算機明白圖像的信息就必須經(jīng)過一系列的處理過程―――數(shù)字圖像處理.數(shù)字圖像的處理包括5個步驟:圖像預處理(去除噪聲)、分割處理分割后區(qū)域、測量、圖像判讀、圖像技術.根據(jù)抽象程度和處理方法的不同圖像技術可分為三個層次:圖像處理、圖像分析和圖像理解.這三個層次的有機結合也稱為圖像工程.而計算機視覺(Computer vision)則是用計算機實現(xiàn)人的視覺功能對客觀世界三維場景的感知、識別和理解.視覺檢測按其所處理的數(shù)據(jù)類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測.另外還有X射線檢測、超聲波檢測和紅外線檢測。
作為新興檢測技術計算機視覺檢測充分利用了計算機視覺研究成果采用像傳感器來實現(xiàn)對被測物體的尺寸及空間位置的三維測量能較好地滿足現(xiàn)代制造業(yè)的發(fā)展需求.與一般意義上的圖像處理相比計算機視覺檢測更強調(diào)精度、速度和無損性以及工業(yè)現(xiàn)場環(huán)境下的可靠性.例如基于三角法的主動視覺測量理具有抗干擾能力強、效率高、精度合適等優(yōu)點非常適合制造業(yè)生產(chǎn)現(xiàn)場的在線、非接觸產(chǎn)品檢測及生產(chǎn)監(jiān)控.對人類視覺感知能力的計算機模擬促進了計算機視覺技術的產(chǎn)生和發(fā)展制造業(yè)上獲取這些信息的目的有:(1)計算出觀察點到目標物體的距離;(2)得出觀察點到目標物體的運動參數(shù);(3)甚至可以判斷出目標物體的內(nèi)部特性;(4)推斷出目標物體的表面特征有時要求形成立體視覺。
三、亞像素檢測技術
隨著工業(yè)檢測等應用對精度要求的不斷提高,像素級精度已經(jīng)不能滿足實際檢測的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級精度的算法是在經(jīng)典算法的基礎上發(fā)展起來的,這些算法一般需要先用經(jīng)典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置?,F(xiàn)在的亞像素提取算法很多,如重心法、概率論法、解調(diào)測量法、多項式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運算量各不相同,他們的應用場合也是各不相同的。
邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測量是通過處理被測物體圖像中的邊緣而獲得物體的幾何參數(shù)的過程,邊緣的定位精度直接影響最終的測量結果。因此,圖像邊緣提取方法是檢測的基礎和關鍵之一。在視覺測量領域中,早期使用的都是像素級邊緣檢測方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測方法的精度可以達到像素級精度,即可以判斷出邊緣位于某個像素內(nèi),但不能確定邊緣在該像素內(nèi)的更精確的位置。如果一個像素對應的實際長度較大,就會產(chǎn)生較大的誤差,傳統(tǒng)的整像素邊緣檢測方法就不再適用。
四、計算機視覺檢測技術在機加工零件檢測中的應用要素與過程
(一)曲陣CCD相機
面陣CCD是本項目圖像采集系統(tǒng)中的主要設備之一,其主要功能是采集實驗圖像。該CCD相機主要由CCD感光芯片、驅動電路、信號處理路、電子接口電路和光學機械接口等構成。
(二)工業(yè)定焦鏡頭
在圖像測量系統(tǒng)中,鏡頭的主要作用是將目標聚焦在圖像傳感器的光敏面上。鏡頭的質量直接影響到圖像測量系統(tǒng)的整體性能,合理選擇并安裝光學鏡頭是圖像測量系統(tǒng)設計的重要環(huán)節(jié)。
(三)數(shù)字圖像采集卡
隨著數(shù)字信號處理技術和嵌入式處理器技術在圖像采集卡中的應用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發(fā)展。這類圖像采集卡不僅具有高速圖像采集功能,同時還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。
(四)標定板
為提高測量精度,需要進行攝像機標定。標定過程中,采用NANO公司的CBC75mm}.0型高精度標定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級,即圖形尺寸精度與圖形位置精度為。
(五)背光源
背光方式只顯示不透明物體的輪廓,所以這種方式用于被測物需要的信息可以從其輪廓得到的場合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。
五、結語
隨著計算機技術和光電技術的發(fā)展,已經(jīng)出現(xiàn)了一種新的檢測技術―基于計算機視覺的檢測技術,利用CCD攝像機作為圖像傳感器,綜合運用圖像處理等技術進行非接觸測量的方法,被廣泛地應用于零件尺寸的精密測量中。本文以面陣CCD為傳感器,研究了零件在線測量的方法,實現(xiàn)了零件尺寸的圖像邊緣亞像素定位測量,對面陣CCD在高精度測量方面的應用作了進一步的探索和研究,為面陣CCD在復雜零件尺寸高精度測量的實現(xiàn)打下了基礎。
摘要:隨著商品種類的不斷豐富和信息化管理手段的應用普及,條形碼作為現(xiàn)代生產(chǎn)、物流和銷售各環(huán)節(jié)的重要信息化手段之一,它的應用也日益廣泛,而且,隨著我國對食品和藥品安全問題的重視,條碼作為追溯碼也開始被用于食品藥品追溯領域。如何對條形碼中的信息進行提取就變得非常重要了。本文在這樣的背景下針對乳品企業(yè)的產(chǎn)品可追溯問題,設計了一套可用于乳品追溯的包裝條碼計算機視覺識別系統(tǒng)。
關鍵詞:條碼;乳品包裝;條碼識別;計算機視覺
本系統(tǒng)硬件部分采用面陣攝像機、工控機構成,軟件部分采用C#語言和OpenCV軟件進行開發(fā),采用EF Model(實體框架)作為程序框架,通過搭建好的視頻采集系統(tǒng),利用外觸發(fā)啟動攝像機采集圖像,經(jīng)過圖像預處理、識別區(qū)域的檢測和定位后,提取出待識別圖像,對于待識別圖像中的條碼和數(shù)字,分別采用相似邊距離方法進行一維碼識別、采用逐行掃描法進行二維碼識別,并利用模型匹配進行數(shù)字識別。
本系統(tǒng)可綜合識別條碼以及數(shù)字識別,實驗表明本系統(tǒng)具有較好的識別效率和識別精度,可以滿足一般條件下的包裝條碼計算機識別,并且已在乳品可追溯方面取得應用。
1 概述
在數(shù)不勝數(shù)的新型計算機科學技術出現(xiàn)之后,條形碼技術儼然已經(jīng)成為了最為經(jīng)濟實用的一種自動識別技術。隨著時代的不斷發(fā)展和用戶需求的不斷擴展,各種各樣的商品出現(xiàn)在我們生活中[1]。雖然條形碼的技術發(fā)展的爐火純青,但是隨著條形碼的不斷變化和創(chuàng)新,識別包裝條形碼技術已然成為我們現(xiàn)在需要不斷研究的課題。
條形碼的出現(xiàn)無疑給我們的生活帶來了方便,但τ謖飧隹燜俜⒄溝氖貝,對其識別的技術的效率還需要我們進行大量的研究和開發(fā)。這也是開發(fā)本系統(tǒng)的初衷。對于本系統(tǒng)來說,它既要滿足對條形碼的檢測,圖像提取,校正等功能的實現(xiàn),又要實現(xiàn)所有程序自動化的功能。該系統(tǒng)主要應用于對海河食品包裝的識別。該系統(tǒng)利用外觸發(fā)器,實現(xiàn)將視頻轉化到靜態(tài)圖片的功能,同時通過后臺處理快速地找到該靜態(tài)圖片中條形碼的位置并對提取的條形碼以圖片的形式存儲,然后對條形碼圖片進行識別。
2 條形碼定位
2.1 圖像采集
采集方式是利用相機和觸發(fā)器采取圖像,DirectX以流的方式讀取播放視頻。
2.2 圖像預處理[2]
OpenCV現(xiàn)在利用Mat類來表示圖像,在此基礎上進行圖像的灰度化處理[3],在灰度處理基礎上,進行圖像梯度化[4]。就是把圖像作為二維離散函數(shù)。梯度化過程就是對該函數(shù)求導的過程。圖像邊緣的確定大多都是通過圖像梯度化處理來實現(xiàn)的。梯度化方向[5],分水平方向梯度計算和垂直方向梯度計算,或者是振幅計算。在進行檢測前,還要使用Scharr算子先確定邊緣像素[6]的位置。接下來進行圖像二值化,所有的像素點的像素值設置為0或者255。最后,采用開運算算法進行形態(tài)化處理。
2.3 條碼檢測
本系統(tǒng)使用Vecor容器用于存放面積;findContours函數(shù)對二值圖像中的輪廓進行檢測;Point用來表示坐標為整數(shù)的二維點;Rect方法:用于提取旋轉的矩形圖案;angle檢查這個矩形的偏斜角度;將提取的矩形輪廓標記在圖片上并剪截下來進行保存。
2.4 二維碼提取
相對應一維碼,二維碼在譯碼之前需要先對二維碼進行分割,再進行邊緣檢測。采用區(qū)域增長的方法修正邊界。二維碼是正方形形態(tài),我們也要對其進行圖形區(qū)域的旋轉處理,利用Hough變換來進行處理利用二維圖像的投影變換。然后對拍攝的圖像進行Hough變換,根據(jù)4條邊界線進行位置旋轉。也可以使用仿射變換。即先對一個向量空間進行一次線性變換并根據(jù)該變化做出相對性的平移,使其變成另一個向量空間。該變化方法包括水平的平移、圖像的縮放、圖像的旋轉等功能。
2.5 數(shù)字定位方法
商品包裝上的條碼一般都是預印刷的,許多商品的生成日期和使用日期也需要入庫進行保存,但是由于條碼印刷成本較高,所以廠家通常采用的方式是以數(shù)字形式將商品的生成日期和使用日期印刷在包裝袋上。因而,本系統(tǒng)添加了數(shù)字識別功能。數(shù)字技術識別的主要核心字符分割技術:切割數(shù)字區(qū)域后,進行字符的切割,由于該圖像還是灰度圖像,所以我們在切割前還要進行一些圖像處理。具體過程:灰度拉伸、二值化、傾斜校正以及字符分割。圖像以海河牛奶的包裝袋為例。由于信息過多,一個條形碼無法將全部信息存儲,所以會在包裝正面的空白位置加些數(shù)字,以此來完善條形碼內(nèi)容不足的地方。
具體分割算法如圖1所示。將截取后的整個圖片進行自上而下的逐行對比,提取黑色的字符部分,直到整幅圖像完畢。已列為高度基準進行掃描,進行從左到右依次排查,直到全部圖片掃面完畢。由于印刷問題,數(shù)字區(qū)域可能有小圓點,采用的是比例方法運算將這些小點清除,把每個切割后的圖像的寬度均除以未切割前的圖像的寬度,設立一個最小的商值。如果小于該商值,將其以噪聲方式清除。最后對字符進行了加框和歸一化處理。上述所切割的圖像大小是根據(jù)字符的最高和最低的值進行的切割,所以我們得到的結果并不是很準確,我們要將每個字符再進行進一步的確定,所以要多進行幾次從第一個步驟到第三個步驟的運算。這樣我們得到的才是該字符的準確范圍。
3 條形碼識別
3.1 一維碼識別
一維碼儲存的信息是由條和空的寬度以及所在的位置來傳遞的。以EAN-13碼為例。一維條形碼的條和空的數(shù)量越多,它就越寬,儲存的數(shù)據(jù)量就越多,由于一維碼是由條和空組成的,將信息變化成二進制或者十進制的數(shù)字。
本系統(tǒng)對于一維碼識別采用的方法是相似邊距離方法,利用相似法識別一維碼[6]:根據(jù)算法進行字符的掃描和識別,定義:C1和C3表示相鄰條的寬度,C2和C4表示空的寬度,T表示整個字符的寬度,T1和T2為相似邊的距離。用算法取得值JTj(j=1,2)來進行T1與T2的歸一化處理。
3.2 二維碼識別
二維碼是按照一定的規(guī)律在平面上分布的黑色與白色相間的圖形記錄符號。識別二位碼[7]需先定位圖案,再是功能性數(shù)據(jù),識別由數(shù)據(jù)碼和糾錯碼共同組成的數(shù)據(jù)信息。
定位圖案:我們通常定位二維碼是根據(jù)左上角、右上角以及左下角三個位置定位的。以其中一個圖形為例,我們可以將其看作分別為7*7、5*5和3*3三個模塊。三個之間比例為1:1:3:1:1。掃描:用一個直線逐行掃描二維碼,該線被截為1:1:3:1:1時截取。誤差在0.5之間在列方向,也用相同的方法進行二維碼定位掃描。我們通常定位二維碼是根據(jù)圖上的三個位置定位的。
3.3 數(shù)字識別
數(shù)字識別[8]部分已經(jīng)超出了我們圖像處理的范圍依據(jù)了,屬于模式識別,由于我們已經(jīng)對圖片進行了分割,所以我們只需通過其特征進行分類與識別。采用的是逐像素取法方法[9],具體操作就是對圖片M行每行每列的依次查找,遇到的黑點時,將其像素值設為“1”,其他為“0”,全部掃描結束后,將提取的個數(shù)相同的像素,放在特征矩陣里。將特征信息,輸入到分類器中,進行分類處理,從而得出結果。再進行采取模塊匹配,事先做好海河包裝上的圖像中字符的圖像采集,然后建立一個圖片模板識別庫。當我們進行字符識別時,就將模板取出來依次對比,把與字符特征對比的結果的矢量求出加權距離。則最小的結果就是識別的結果。如圖2所示。
摘 要
近年來,經(jīng)濟的發(fā)展和人們生活水平的提升也使得人們的出行更加便捷,越來越多的人都是自己駕車出行,這樣導致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關注的重點問題。信息技術的發(fā)展推動了計算機視覺技術的出現(xiàn),為交通安全性的提升提供了一定的保障。本文主要對計算機視覺技術進行分析,進一步探討計算機視覺技術在智能交通系統(tǒng)中的應用。
【關鍵詞】計算機 視覺技術 智能交通 系統(tǒng) 應用
智能交通系統(tǒng)簡稱ITS,這是一種新型的交通管理系統(tǒng)。該系統(tǒng)主要結合了信息化技術、計算機技術以及數(shù)據(jù)傳輸技術等多種技術,用來對整個交通運輸體系進行管理,可以實現(xiàn)人、車、路的全面監(jiān)控和管理。計算機視覺藝術作為智能交通系統(tǒng)中的一個重要環(huán)節(jié),受到相關工作人員的高度重視。隨著計算機視覺技術的發(fā)展,不僅為交通行業(yè)的發(fā)展提供了更多的便捷,同時還能夠篩選道路交通的各種信息,進一步增強了智能交通系統(tǒng)的靈活性和準確性。
1 計算機視覺技術的概述
計算機視覺也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學、概率論、圖像處理理論以及人工智能理論等部分。計算機視覺技術主要是用二維投影圖像實現(xiàn)三維物體重構。這種技術的應用范圍比較廣泛,不僅應用于二維圖像識別方面,同時還用于三維物體的識別和重建上面。通過計算機視覺技術能夠獲取專業(yè)化的三維信息,對三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過計算機視覺技術的效果來確定三維運動中產(chǎn)生的各種參數(shù),這一過程對攝像機運動問題的關注程度較高;間接獲取的方式就是將單幅圖像和攝像機焦距相結合,來判斷被測量位置視覺上的信息。計算機視覺技術的關鍵就是實現(xiàn)特別匹配,在特殊情況下可以利用不同的攝像C同時收集運動信息,從而提高相關控制的精確度。
2 計算機視覺技術在智能交通系統(tǒng)中的應用
計算機視覺技術在智能交通系統(tǒng)中的應用可以實現(xiàn)道路交通的監(jiān)控,同時還能夠實現(xiàn)自動收費、智能導航等功能,主要應用有以下幾個方面的內(nèi)容。
2.1 交通監(jiān)控中對計算機視覺技術的應用
基于計算機視覺技術的交通監(jiān)控系統(tǒng)主要分為三個步驟,首先是對車輛和行人進行跟蹤和分割,其次是對車流量進行分析和計算,并且計算車輛的平均速度和道路上車輛的隊列長度,最后根據(jù)道路的交通狀況來規(guī)劃形式線路,從而有效緩解道路交通擁堵的現(xiàn)狀,方便人們減少出行時間。車輛和行人作為道路中運動的主要目標,在監(jiān)控場合下,需要對運動時間進行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據(jù)圖像中不同的運動用映射參數(shù)正確的表達,這樣可以將具有同樣映射參數(shù)的光流量進行分配,從而完成參數(shù)分割。計算機視覺在交通監(jiān)控中的應用主要是對車輛速度、車輛數(shù)目、車輛分類進行檢測。隨著計算機通信技術的發(fā)展,計算機視覺技術也是日新月異,基于計算機視覺的交通監(jiān)控系統(tǒng)具有較強的實時工作性,能夠快速的適應高度公路以及城市道路交通的監(jiān)控。
2.2 車輛導航中對計算機視覺技術的應用
實現(xiàn)車輛的智能導航是計算機視覺技術在智能交通中應用的典型案例。這種技術主要為駕駛人員提供道路信息和車輛運行狀況兩大信息。通過車輛智能導航系統(tǒng)的運行能夠對道路兩邊的界限進行有效的識別,將車輛引向規(guī)定的行駛車道,在車輛行駛過程中,該系統(tǒng)能夠自動檢測車輛與前方其他車輛之間的距離,從而提醒駕駛人員保持車輛的安全距離,最終實現(xiàn)安全導航駕駛。通過該系統(tǒng)的攝像機運動能夠識別其他車輛的行駛狀況,并且通過計算檢測點的方式計算車輛的模擬匹配點。車倆智能導航系統(tǒng)中就使用了計算機視覺技術,可以從中提取相關信息,計算車輛行駛的安全距離和速度。
2.3 計算機視覺技術用于車輛輔助駕駛
計算機視覺技術在車輛輔助駕駛中的應用主要是幫助駕駛人員對外界的變化做出反應。具體表現(xiàn)為車輛在市內(nèi)行駛時,計算機視覺技術的應用能夠識別周邊道路的標記,并且對交通標志、其他車輛和行人進行識別,然后篩選相關信息進行計算,讓駕駛人清楚外界的具體狀況,從而避開其他的車輛和行人,能夠從根本上減少交通事故的發(fā)生,增強車輛的安全運行。輔助駕駛的形式轉變?yōu)槿藱C交互的方式,一定程度上能夠滿足駕駛人員對信息的需求。
2.4 計算機視覺技術用于車輛智能收費
車輛收費是車輛在公共交通位置行駛中的一個關鍵環(huán)節(jié)。隨著科學技術的發(fā)展,車輛收費系統(tǒng)逐漸向著計算機技術的應用方向發(fā)展,計算機視覺技術在各地區(qū)交通發(fā)展中的應用是現(xiàn)代化交通發(fā)展的一個重要突破口。很多地區(qū)的智能化收費都是通過識別車牌的方式來實現(xiàn)收費,我國在車牌識別這方面僅僅限制于單目車牌和雙目車牌的識別,其中單目車牌識別的核心就是將車牌照位置作為核心部分,我國大部分地區(qū)都是將單目系統(tǒng)作為核心部分來使用。采用雙目系統(tǒng)對車牌進行識別,也可以對車輛的型號進行識別,通過大量的實踐發(fā)現(xiàn),雙目系統(tǒng)進行車牌識別的實用性較強。但是這種識別方式在實際應用過程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問題,尤其是車輛在高速路上行駛時,對于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實踐。
3 結束語
隨著計算機視覺技術的智能化發(fā)展,其在智能交通系統(tǒng)中的應用能夠解決多方面的問題。該技術的應用不僅能夠實現(xiàn)車輛的實時監(jiān)控,同時還能夠實現(xiàn)車輛導航以及車輛收費,幫助駕駛人員識別車輛行駛中存在的障礙物,這樣一來,可以增強車輛行駛的安全性,同時還能夠提高我國道路交通系統(tǒng)的整體管理水平。但是該技術應用中也存在不足之處,未來發(fā)展中需要降低視覺系統(tǒng)的價格,減少系統(tǒng)的尺寸,從而增強系統(tǒng)對車輛信息的處理速度,最終實現(xiàn)對道路交通的全面監(jiān)測。
摘 要:在科技的帶動下,計算機圖形學、計算機視覺與可視化技術得以快速發(fā)展,并被應用到各個領域,隨著它們的應用,極大的推動了現(xiàn)代社會發(fā)展。為進一步了解這些技術,充分發(fā)揮其應有作用,本文將對計算機圖形學、計算機視覺以及可視化技術展開研究,希望能為相關人士帶來有效參考。
關鍵詞:計算機圖形學;計算機視覺;可視化技術
計算機圖形學、計算機視覺以及可視化技術三者均是計算機領域重要組成部分,要做好計算機知識,就要先學好計算機圖形學,但計算機圖形學學習相對枯燥,尤其是算法教學難以理解,為解決這一問題,計算機視覺與可視化技術被應用到計算機圖形學中。可見,三者之間存在一定的聯(lián)系,因此,有必要對計算機圖形學、計算機視覺以及可視化技術展開研究。
1 計算機圖形學概述
1.1 計算機圖形學目的
所謂的計算機圖形學實際上就是怎樣利用計算機表示圖形,并利用計算機完成圖形計算與處理,而這一過程的實現(xiàn)需要得到相關算法的支持。學習計算機圖形學的目的是利用計算機技術為人們呈現(xiàn)既帶有美感又不缺真實的圖形(如下圖1所示),為實現(xiàn)這一目標,就需要按照圖形的要求創(chuàng)設合適的場景,并在一些光照模型的作用下,做好光照效果設計,在這一過程中需要計算機圖形學能夠與其他計算機技術相配合。經(jīng)過計算機圖形學出來的圖像,多會以數(shù)字圖像的方式展示出來,總的來說,計算機圖形學與圖像處理之間存在著一定的聯(lián)系[1]。計算機圖形學的涉及范圍相對寬泛,不僅有圖形硬件設計,還包括動畫制作,虛擬現(xiàn)實等多個部分。此外,計算機圖形學在動畫制作中的應用頻率也很高,如45分鐘一集的動畫影片中,85%的畫面都需要用算機圖形學來完成,由此可見,計算機圖形學的應用頻率極高,并在動畫制作中發(fā)揮著不可替代的作用。因此,應重視計算機圖形學的應用。
1.2 計算機圖形學應用
隨著計算機圖形學的發(fā)展,它被應用到各個領域中,并發(fā)揮著重要作用。首先,在計算機輔助設計與制造中的應用,這是計算機圖形學應用最多的領域,在計算機圖形學被應用以后,不僅可以設計出更精準的圖形,還能做好人機交互設計,強化修改能力。計算機圖形學還被應用到三維形體重建中,利用該技術可以將原理的二維信息轉化為三維信息,如在某次工程圖紙設計中就應用了計算機圖形學,經(jīng)過一系列的處理以后,三維形體逐漸形成,最終實現(xiàn)了重建。其次,在醫(yī)學領域中的應用。計算機圖形學在醫(yī)學領域中的應用多以計算可視化的形式展示出來,如在腦部手術中,醫(yī)生為看清患處真實情況,經(jīng)常需要利用在可視化技術的作用下將復雜的數(shù)據(jù)轉化為圖像,這時就體現(xiàn)了計算機圖形學在其中的應用[2]。再者,在計算機動畫中的應用,人們看到的動畫影片就是計算機圖形學作用的結果,以動畫人物的行走為例,為保證動畫人物的行走與自然人不存在過大差異,就需要應用大量的計算機技術,并在計算機圖形學的作用下完成設計。最后,在計算機藝術中的應用。計算機圖形學在計算機藝術中也有廣泛應用,它不僅可以用于藝術制作,很多場景都是通過計算機圖形學來完成的,現(xiàn)階段,一些人正在利用計算機圖形學創(chuàng)設人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標的實現(xiàn)就需要得到計算機圖形學的支持。
2 計算機視覺技術
2.1 計算機視覺技術含義
所謂的計算機視覺技術,實際上就是用計算機取代人眼做識別、跟蹤以及測量等,同時也兼顧圖形處理,其目的是讓圖像在計算機被處理以后更適于識別。對于計算機視覺技術來說,意在實現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實現(xiàn)人工智能系統(tǒng)設計[3]。計算機視覺是一種在相關理論與模型基礎上發(fā)展起來的視覺系統(tǒng),其主要構成部分有以下幾種:
(1)程序控制,這一點主要體現(xiàn)在機器人設計上;(2)事件檢測,多體現(xiàn)在圖像監(jiān)測上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫等方面。計算機視覺三個階段如圖2所示,通過觀察圖1可以發(fā)現(xiàn),計算機視覺存在于圖像處理始終,從早期處理直到后期結束都存在,最終實現(xiàn)了3D描述,可見,計算機視覺具有十分重要的作用[4]。
2.2 計算機視覺技術的應用
現(xiàn)階段,現(xiàn)代社會已經(jīng)進入信息化時代,計算機技術也被應用到各個領域,并發(fā)揮著重要作用。計算機視覺的應用促使計算機實現(xiàn)了智能化,在該技術的支持下,計算機可以像人一樣透過視覺看待世界萬物,且具有良好的適應能力,但這一目標的實現(xiàn)還需要很長時間,需要一系列的努力才能實現(xiàn)?,F(xiàn)階段,計算機視覺應用最多的就是車輛視覺導航,然而,這種導航還沒有實現(xiàn)完全自主導航,這也是需要進一步研究的地方。計算機視覺技術的適應性較好,特別適合在工業(yè)領域應用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運行,其整體效果也不會受到影響,再者,計算機視覺技術的嵌入性較好,成本相對較低,尤其適合在PC方案中使用,同時,具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計算機視覺技術總體效果較好,適合利用在各種工業(yè)環(huán)境中應用,因此,應重視計算機視覺技術的應用[5]。同時計算機視覺還被應用到移動機器人設計中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進而了解到人的存在。同樣,將計算機視覺應用到機器人設計上,可以自動檢測出正在行動的人或車輛,而無法檢測到靜止的人,之所以會出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。
3 可視化技術
3.1 可視化技術含義
可視化技術是一種綜合了計算機圖形學與圖像處理于一體的技術,它可以將復雜的數(shù)據(jù)轉化為圖像并在屏幕上展示出來。在可視化技術中,融合了以上兩種技術的特點,并在多個領域都有應用,隨著可視化技術的應用,不僅有效實現(xiàn)了數(shù)據(jù)表示,還強化了數(shù)據(jù)處理能力,更對數(shù)據(jù)決策分析有一定作用[6]?,F(xiàn)階段,虛擬現(xiàn)實技術已經(jīng)成為可視化技術主要發(fā)展方向。
3.2 可視化技術的應用
首先,在計算機圖形學教學中的應用,計算機圖形學相對枯燥,相關知識也很抽象,不便于學生理解,在計算機圖形學中最重要的部分是曲線曲面,而這些曲線曲面多是與數(shù)學模型有關,具有一定的抽象性,學生理解難度較大,以往教師只能通過一系列的公式演算幫助學生理解,盡管這樣依然難以讓學生掌握曲線變化情況,學生依舊無法正確理解。為減少這種情況的發(fā)生,可視化技術被應用到計算機圖形學教學中,教師將抽象的知識用動畫的形式展示出來,學生只要觀看動畫,拖動一定的控制點就可以了解到曲線變化情況,這樣一來不僅增加了教學趣味性,學生也可以隨意變動曲線,讓復雜的知識變得簡單,深化學生對計算機圖形學知識的深度理解,同時,利用可視化技術在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強學生的理解能力[7]。
其次,在醫(yī)學領域中的應用。醫(yī)學領域對于可視化技術的應用主要體現(xiàn)在放射治療與矯正手術上。通過可視化技術可以屏幕上看到手術整個過程,并將原來細節(jié)部位放大,手術醫(yī)生觀察的更加細致,手術成功幾率也會大幅度提升,患者生命也能得到保證(如圖3所示)。如在對某名患者進行身體檢查的過程中需要應用到可視化技術,由于通過檢查會獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對復雜,但在可視化技術下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經(jīng)過可視化技術的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計,80%的醫(yī)療檢查工作都是需要利用可視化技術。
地質勘探是我國最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測儀受多種因素影響也無法了解到實際礦藏情況,這就需要應用到可視化技術,在可視化技術的作用下,相關工作人員可以了解到地下有無礦藏,如果存在礦藏,相關工作人員也可以了解到礦藏所在位置與實際儲備量,進而為礦藏開采奠定基礎。如在地質勘探中,相關工作人員利用可視化技術做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質模型創(chuàng)建工作,同時在相關工作臺的影響下,還可以完成地形數(shù)據(jù)導入,進而生成一定的地形云點,如果其中存在錯誤,可視化技術也可以將其中的錯誤內(nèi)容刪除,這些都是可視化技術所帶來的好處[8]。由此可見,可視化技術已經(jīng)成為地質勘探中不缺少的技術。
最后,在氣象預報中的應用(如圖4所示)。利用可視化技術能夠將數(shù)據(jù)轉化為圖像,通過觀察圖像就可以了解到云層變化情況,同時也能了解到實際風力大小與風走向等,氣象預報人員就可以根據(jù)圖像做出精準分析,需要了解氣象變化的人也能了解到現(xiàn)實情況,如果氣象條件惡劣,相關工作人員也可以及時做出工作調(diào)整,減少危險事件的發(fā)生。據(jù)不完全統(tǒng)計,可視化技術在氣象預報中的應用頻率高達100%,由此挽回的經(jīng)濟損失高達13.2億元,可見,可視化技術在氣象預報中的應用十分有必要,因此,應重視可視化技術在氣象預報中的應用。
4 結語
通過以上研究得知,計算機圖形學、計算機視覺以及可視化技術三者各具特色,三者間也存在一定的關系,尤其是可視化技術綜合了前兩者的特點,并融合了其他技術,在很多領域中都有應用??梢暬夹g是現(xiàn)階段應用最多的一種技術,在計算機圖形學教學中也有應用,并發(fā)揮著不可替代的作用。本文分析了計算機圖形學、計算機視覺以及可視化技術的含義與應用,希望能為相關人士帶來有效參考,正確利用這些技術。
摘 要:用C、C++、Java等計算機語言編一個圖像識別程序,常常需要借助一些圖像處理的工具庫,OpenCV就是其中之一,使用OpenCV要比使用計算機應用軟件困難,需要前期復雜的準備工作,如果了解了OpenCV與其他圖像處理應用軟件的區(qū)別、學習OpenCV的基礎、運行環(huán)境、圖像操作原理以及OpenCV文檔包含的內(nèi)容,學習和使用OpenCV就會容易很多。
關鍵詞:圖像處理 OpenCV C
圖像識別技術已經(jīng)應用到生活中的許多方面。文字識別系統(tǒng),直接把圖片上的文字掃描成文本文檔格式。人臉識別技術已經(jīng)用到了智能手機之中,現(xiàn)在的手機解鎖可以直接使用人臉識別。指文圖像識別的應用更為廣泛,如辦理身份證、入學考試、駕照等用來確認身份。百度、Google、蘋果等公司研究的無人駕駛汽車,將該技術用于對障礙物、路標、行人及其他車輛的判斷。道路交通監(jiān)控系統(tǒng)中,系統(tǒng)自動檢索違規(guī)車輛,并對車輛的車牌等信息進行識別。通過車牌提取、圖像預處理、特征提取、車牌字符識別等技術,識別車輛牌號,目前,字母和數(shù)字的識別率可達96%,漢字的識別率可達95% [1-2]。所有的這些都用到了圖像識別功能,要編寫圖像識別程序使用OpenCV是一個不錯的選擇。
1 OpenCV簡介
OpenCV是Intel公司于1999年推出的一種面向圖像處理的開源計算機視覺庫,其中,OpenCV是Open Source Computer Vision Library的縮寫,如今由Willow Garage提供支持,其中包括了3個版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1現(xiàn)在很少使用外,其他兩個版本已經(jīng)有了很多改進的版本。OpenCV有開源的函數(shù)庫,可以滿足不同領域的圖像處理需求,使用時以函數(shù)調(diào)用的形式提供給用戶,也可以對其代碼進行改進,便于用戶實驗教學或程序開發(fā)使用。
2 OpenCV的特點
(1)開源。OpenCV是一個開源的圖像處理函數(shù)庫,無論是商業(yè)應用,還是做科學研究,完全是免費的,與Linux類似它的源代碼也是公開的,這樣程序的安全性就得到保障,OpenCV的函數(shù)庫是用C語言和C++語言進行編寫的,源代碼可讀性比較高,發(fā)現(xiàn)其中不足之可以自行進行修改,避免編譯后的可執(zhí)行文件出現(xiàn)漏洞。
(2)跨平臺。OpenCV是一個基于BSD許可(開源)發(fā)行的跨平臺計算機視覺庫,可以運行在Windows、Linux、Mac OS和嵌入式等操作系統(tǒng)上[3]。
(3)應用領域廣。OpenCV圖像處理可以使用到多個領域當中,包括生物醫(yī)學、工業(yè)、軍事安防、機器視覺、航空航天等。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測等方面得到了廣泛的應用,同時對于無人飛行器的視覺捕捉技術也有極大的幫助[4]。
(4)支持多種語言進行開發(fā)。OpenCV中包括了多種編程語言的接口,其中支持的編程語言包括C、C++、C#、Java、Python等。
3 OpenCV與圖像處理應用軟件
在計算機學習中也會學到一些其他的圖像處理軟件,如Photo Shop、Windows畫圖工具等在計算機中使用的圖像處理工具。在手機中有一個比較流行的軟件,在拍好照片后可以對個人照片進行智能美化,這些軟件都是應用軟件缺少編程需要的接口,這些軟件處理圖像后只是給出結果,無法取到程序處理所需要的中間參數(shù),只能局限于最后的結果展示,如果只是單純的圖像制作, Photo Shop類的圖像處理工具已經(jīng)足夠了。但是對于圖像識別、機器視覺等,需要對圖像內(nèi)容做出判斷,用類似于Photo Shop這樣的圖像處理軟件就無法完成了,因為無法集成到所編寫的程序當中。OpenCV是一個圖像處理函數(shù)庫,其中包涵了對于計算機操作系統(tǒng)和計算機語言編譯平臺支持的API接口以及源碼庫,可以在編寫的程序中去處理圖像,不但可以得到圖像處理后的結果,還可以對圖像中間的處理過程進行控制,可以對圖像中的內(nèi)容用自己編寫的程序代碼進行判定,實現(xiàn)識別操作。
4 學習OpenCV的基礎
C和C++語言在工科類專業(yè)中一般設置必修課程,C語言常作為一門基礎的編程語言來教,有的學生覺得C比較容易,有的學生感覺比較難,這個取決于每個人對計算機語言的理解能力與對計算機語言的興趣,C和C++的區(qū)別在于C++增加了類,支持面向對象編程。新版OpenCV函數(shù)庫是基于C++的,打開源代碼的文件夾可以看到許多以.cpp結尾的C++代碼文件,所以對于C和C++的掌握情況直接關系到對OpenCV的學習。
5 OpenCV的運行環(huán)境
在學習每種計算機語言之前都要對每種計算機語言的IDE(Integrated Development Environment,集成開發(fā)環(huán)境)進行安裝和配置,集成開發(fā)環(huán)境不只是用來編輯程序代碼,還包括了對代碼的編譯、調(diào)試與運行等。如Java語言,在Windows操作系統(tǒng)中Java語言最簡單的編輯環(huán)境是記事本,對于Java的編譯與運行需要用到命令窗調(diào)用所安裝JDK(Java Development Kit,Java開發(fā)包)中的編譯程序與運行環(huán)境,如果是集成的IDE,如Eclipse、MyEclipse等,點擊IDE上的運行或是調(diào)試按鈕,就可以在IDE中的結果輸出窗口上直接查看運行結果。OpenCV是用C和C++語言所編寫的圖像處理函數(shù)庫,它沒有自己獨立的IDE,所以它需要借助其他編程語言的IDE進行編寫和調(diào)用,如Microsoft Visual Studio、QT Creator等。
配置開發(fā)環(huán)境是學習OpenCV中重要的一步,但是這個過程相對于初學者來說有些復雜。首先,要從網(wǎng)上下載并安裝計算機語言的開發(fā)環(huán)境,如微軟的Visual Studio、QT集成開發(fā)環(huán)境等。其次,下載并安裝OpenCV的安裝包,安裝OpenCV是一個解壓的過程。下一步,就是對開發(fā)環(huán)境的配置,其中要對系統(tǒng)變量、包含目錄、附加依賴項進行配置。然后進行調(diào)試運行。在對開發(fā)環(huán)境配置時,為保證OpenCV庫與本地開發(fā)環(huán)境兼容性更好,最好使用CMaker(Cross Platform Make)在本地環(huán)境中對OpenCV源代碼重新編譯。
6 OpenCV中的Hello World
在學習C或是java語言時,常常會有一個重要的標志就是‘Hello World!’,標志著系統(tǒng)配置完成并且整個IDE環(huán)境運行正常,編譯系統(tǒng)成功的編譯了所寫的代碼,并且在操作系統(tǒng)中執(zhí)行成功。OpenCV中這個標志有所不同,它的‘Hello World!’是在IDE中寫好代碼后,調(diào)用OpenCV中的函數(shù)打開一幅代碼中指定的圖片并顯示到新建的窗口中,標志著IDE中的參數(shù)是正確的,這是進行圖像操作的重要一步。
7 OpenCV圖像像素操作
對于數(shù)值的計算是第一步一般輸出一個結果,在學任何一門計算機語言時會有一個很好的例子“計算器”,那圖像如何去表示?其實圖像是多個結果的一個集合,就像在C語言中打出星號所組成的菱形,每一個星號可以比喻成一個圖像中的像素點。對于圖像處理過程中常常見到的有3種:第一種,RGB圖像,彩色的圖像,每個像素點由3個數(shù)值表示。第二種,灰度圖像,像以前的黑白電視機,每個像素點由一個數(shù)值就可以表示。第三種,二值圖像,每個像素點由一個數(shù)值表示。在OpenCV中有多種方法可以對圖像進行操作,其中比較方便的就是利用cv::Mat類,對圖像進行打開、顯示、修改和保存,這也是進行圖像操作的重要一步。
8 OpenCV的文檔
大家在OpenCV官網(wǎng)提供的文檔中可以得到更多幫助。在OpenCV的文檔中包括了對組件結構的介紹,了解OpenCV的組件結構對學習OpenCV是十分有利的,該介紹包括了一系列的動態(tài)或靜態(tài)庫,如矩陣數(shù)組的定義、圖像處理模塊包含的內(nèi)容、視頻分析所需要的算法、基本的多視覺算法、外部特征的檢測類、物體的檢測類、UI類的使用、圖像算法的硬件加速等,在編寫代碼時可以查找其類中對象所包含成員和方法。一些OpenCV圖書所帶的光盤中或互聯(lián)網(wǎng)上網(wǎng)友提供的圖像處理代碼,由于編程使用的操作系統(tǒng)或編譯環(huán)境不同,有些代碼會包含未知的頭文件或者缺少頭文件,代碼本身并沒有錯誤,但總是編譯出錯,了解了這些知識后在編程時,有利于定位在程序中所引用的文件所屬的位置,從而有效地處理文件引用出現(xiàn)的問題。
無論對什么樣的物體進行識別,圖像識別過程基本是不變的,包括:圖像預處理、圖像分割,特征提取、判斷匹配、輸出結果。圖像預處理中會用到圖像的灰度化、圖像的二值化、去除圖像的噪聲等算法。特征提取中會用到圖像變換、圖像邊緣檢測等算法。判斷匹配中用到直方圖、投影等算法。圖像分割有3種:基于閾值的分割、基于區(qū)域分割、基于邊緣的分割[5]。在OpenCV的文檔中都詳細提供了基本算法類的定義與方法,通過OpenCV的代碼庫中的基本算法類或幾個基本算法類的組合可以實現(xiàn)以上所列算法的所有功能。
9 結語
據(jù)統(tǒng)計,一個人獲取的信息大約有75%來自視覺。在工業(yè)4.0的時代里機器也需要有自己的視覺系統(tǒng),基于圖像處理的機器視覺在人工智能領域會得到更廣泛的應用,如:無人駕駛汽車、智能機器人、智能安防系統(tǒng)等。OpenCV是一個進入這些行業(yè)的重要工具之一,圖像處理的學習過程是一個循序漸進的過程,希望學習者在OpenCV的基礎上提高對于圖像處理的認識及對圖像處理的技術水平。
摘 要: 在對比了傳統(tǒng)運動車輛實時檢測方法的基礎上,提出了一種新的G?C二重差分法,將視頻流中的某一當前幀與背景幀進行邊緣檢測,將兩幀的結果相減,得到梯度差分,再將此結果與背景顏色差分結果進行“或”運算,提高了車輛存在判斷的準確度,此算法可以準確檢測出路面運動車輛存在同時有效消除車輛陰影的影響,為后續(xù)車輛運動速度的實時檢測提供了有力保證。基于運動車輛檢測的結果,在VC環(huán)境下進行了編程實現(xiàn),自動檢測出運動車輛的實時速度,測試結果表明該算法效果很好。
關鍵詞: 計算機視覺; 車輛檢測; 速度檢測; 消除車輛陰影
0 引 言
計算機視覺(Computer Vision)主要研究如何運用照相機和計算機獲取被拍攝對象的數(shù)據(jù)與信息,形象的說,就是給計算機安裝上“眼睛”(照相機)和“大腦”(算法)。目前,計算機視覺技術的應用領域十分廣泛,其在道路交通管理中的應用更是取得了很好的效果。隨著科學技術的飛速發(fā)展,現(xiàn)代交通在經(jīng)濟發(fā)展中所起的作用越來越大,而交通現(xiàn)代化帶來的問題也越來越多,諸如交通擁擠、交通事故頻發(fā)、交通環(huán)境惡化等。在這樣的大背景下,智能交通系統(tǒng)(Intelligent Traffic System,ITS)作為一種強有力的交通管理手段應運而生,其高效率的管理特點使其成為當今世界道路交通管理的發(fā)展趨勢,而計算機視覺技術則是ITS的重要技術支持。
實時車輛運動速度檢測是ITS對交通實施監(jiān)測和管理的重要一環(huán),對車輛速度的檢測一方面可以監(jiān)控超速等違章問題,減少交通事故的發(fā)生,另一方面可以根據(jù)車速判斷道路擁擠程度,進而迅速采取措施,保證道路交通的安全和暢通,從而實現(xiàn)智能交通管理的目的。在上一代ITS中,實時車輛運動速度檢測的方法主要有線圈檢測、激光檢測、雷達檢測等,這些速度檢測方法多多少少都存在一定的問題,如容易受路基狀況、自然環(huán)境等的影響精度降低,而在新一代ITS中基于計算機視覺的車輛速度檢測法則大大提高了測速的精度,這有賴于計算機有一個“超強大腦”,即好的算法。
1 運動車輛的檢測
運動車輛的檢測是實時運動車輛速度檢測的基礎,使計算機能夠自動的把相機攝取的視頻里的靜止物體與運動物體區(qū)別開,并且自動提取出運動物體。所以,在研究實時車輛速度檢測算法前,先要研究運動車輛的檢測算法。
1.1 現(xiàn)有運動目標檢測方法比較
目前,常用的運動車輛實時檢測方法主要有幀間差分法和背景差分法。
1.2.2 預處理幀的顏色差分
由于無論車身像素值是否低于路面像素值,其梯度邊緣必然存在,而交通路面一般都很平坦,除了車道線外檢測不到邊緣,將當前幀與路面背景模型均進行邊緣檢測,再將兩個邊緣圖像按式(8)做差得到運動物體的邊緣梯度差分圖像:
3 實驗結果與分析
筆者用實際拍攝的視頻圖像對上述算法進行了試驗測試,實驗時模擬實際交通攝像機的安裝情況,使其固定不動,計算機處理的速度約為20 f/s。首先將視頻中的某一幀進行邊緣檢測,與背景做梯度差分,并與背景顏色差分的結果進行“或”運算,最后對圖像去噪并二值化,通過測試多種路況、天氣和光照條件,試驗結果顯示該算法可以在陽光充足、遇到物體陰影明顯的情況下準確地將運動車輛從視頻的背景中提取出來,并能準確檢測出車輛的速度,如圖3所示。
4 結 語
計算視覺的應用提高了智能交通系統(tǒng)的準確性,本文在對比了傳統(tǒng)運動車輛實時檢測方法的基礎上,提出了一種新的運動車輛實時速度檢測算法,此算法與傳統(tǒng)的算法相比,可以更加準確地檢測出路面運動車輛的存在,同時有效消除車輛陰影的影響,為后續(xù)車輛運動速度的實時檢測提供有力保證?;谶\動車輛檢測的結果,進行編程實現(xiàn),可以自動檢測出運動車輛的實時速度,測試結果表明該算法效果很好。
[摘 要]石材大板表面輪廓提取是石材加工生產(chǎn)過程中的重要步驟和關鍵工序。它對于實時優(yōu)化切割不規(guī)則石材以及優(yōu)化排版和下料具有決定性的作用,對于提高生產(chǎn)效率和石材利用率、節(jié)約石材資源具有重要意義。本文基于計算機視覺理論,研究了石材輪廓提取的算法。通過分析石材目標圖像的灰度、顏色和紋理等特征,提出了石材輪廓提取算法,較準確的提取出石材目標輪廓。
[關鍵詞]石材大板;輪廓提??;圖像處理
1、 引言
圖像處理是在線測量系統(tǒng)中很重要的一部分,本文就是利用圖像處理技術提取石材大板的輪廓信息,然后利用其目標點的間距最終求得石材大板尺寸。本文對圖像處理的相關算法進行研究,提取石材大板的輪廓信息,最終計算其尺寸。提取過程主要包括圖像預處理和圖像分割兩部分。圖像處理過程如圖1所示。
2、圖像處理
2.1 圖像預處理
通過CCD攝像機獲取的石材大板圖像在其傳輸、接收和處理的過程中,由于受多種因素的影響,如系統(tǒng)噪聲、曝光不足或過量、傳輸過程中的誤差以及人為因素等等,均會對石材大板圖像產(chǎn)生一定的噪聲干擾。噪聲會惡化圖像質量,有時會使提取的信息減少甚至淹沒某些有用特征,給分析帶來困難。因此,對圖像進行預處理是非常必要的,這樣可以去除噪聲,使其更接近真實圖像,更有利于對石材大板圖像進行后續(xù)處理。圖像預處理主要包括濾波和增強。
2.1.1 圖像灰度化
圖像的灰度化是圖像增強處理技術中一種非?;?、直接的圖像處理方法。圖像的增強用于調(diào)整圖像的對比度,為了獲得對后續(xù)計算機處理、分析過程更有利的圖像,需要對采集的原始圖像進行圖像增強,從而淡化背景,消除噪聲干擾,提高對比度,突出圖像中的重要細節(jié)[1]。
本文采用的是加權平均值法:R=G=B=aR+bG+cB??紤]到圖像的合理性,取a=0.11,b=0.59,c=0.30,即采用公式(1)進行灰度轉換:
其中:為轉換后的灰度圖像在點處的灰度值;、和分別為彩色圖像在點處的紅色分量值、綠色分量值和藍色分量值。
在OpenCV函數(shù)庫中,圖像的灰度化可以通過cvCvtColor(const CvArr* src,CvArr* dst,int code)函數(shù)實現(xiàn),其中src為原彩色圖像,dst為處理后的圖像,code為色彩空間轉換方式,在這里code定義為CV_RGB2GRAY。彩色石材大板圖像經(jīng)過式(1)轉換后,變成灰度圖像。圖2所示為4個彩色石材圖像灰度化后的結果。
2.1.2 圖像平滑
圖像的平滑處理技術即圖像的去噪聲處理,它是將輸入的圖像進行濾波去除噪聲。圖像平滑一是平滑非邊緣區(qū)域,二是使圖像邊緣得到保護。一個較好的平滑方法應該是既能消掉這些噪聲效應又不使圖像的邊緣輪廓和線條模糊。在濾波方法中,最常用的有均值濾波和中值濾波兩種,本文采用此兩種方法分別對石材大板平滑處理,效果如圖3所示。
這里僅選取了其中的一幅圖像進行處理。從圖中可以看出均值濾波和中值濾波對含有高斯噪聲的圖像都能夠有效地抑制噪聲的干擾,對含有椒鹽噪聲的圖像也能抑制部分噪聲。但通過比較明顯可以看出,,中值濾波在椒鹽噪聲處理方面的能力是均值濾波無法比擬的,因此,本文采用中值濾波對圖像進行濾波去噪。
2.2 圖像分割與邊緣檢測
圖像分割是圖像處理和計算機視覺中基本而關鍵的技術之一,其目的就是將目標物體與背景分離開來,為后續(xù)的處理提供堅實的基礎。圖像分割的方法主要包括閾值法、邊緣檢測法、區(qū)域跟蹤法等。本論文采用的是邊緣檢測法。
2.2.1 邊緣檢測
檢測石材大板邊緣是其輪廓提取的基礎。邊緣檢測實現(xiàn)的難點在于邊緣檢測的精度和抗噪聲的能力。邊緣檢測有很多算法,例如Roberts算子、Sobel算子、Prewitt算子、拉普拉斯算子等[2]。
(1)Roberts算子
Roberts算子采用的是對角方向相鄰的兩個像素之差。從圖像處理的實際效果來看,邊緣定位準,對噪聲敏感。Roberts算子是一種利用局部差分算子尋找邊緣的算子,該算子對具有陡峭邊緣且含噪聲少的圖像效果較好。
(2)Sobel算子
Sobel邊緣檢測算子是先做加權平均,再微分,然后求梯度。以下兩個卷積核形成了Sobel邊緣檢測算子,圖中的每個點都用這兩個核做卷積,其中一個對垂直邊緣影響最大,而另一個對水平邊緣影響最大。邊緣檢測算子的中心與中心像素相對應,進行卷積運算。兩個卷積核的最大值作為該點的輸出位。運算結果是一幅邊緣幅度圖像。在邊沿檢測中,Sobel算子對于像素的位置的影響做了加權,加權平均邊寬2像素,因此效果更好。Sobel算子都對噪聲具有很好的抑制能力,但仍然不能完全排除檢測出來的邊緣中存在虛假邊緣的情況。
(3)Prewitt算子
Prewitt算子與Sobel算子基本相同,只是沒有加權,所有系數(shù)全為1。Prewitt算子產(chǎn)生一幅邊緣強度圖像。
(4)拉普拉斯算子
拉普拉斯(Laplacian)算子是一種二階導數(shù)算子,對一個連續(xù)函數(shù), Laplacian算子是不依賴于邊緣方向的二階微分算子,對圖像中的階躍型邊緣點定位準確。該算子對噪聲非常敏感,它使噪聲成分得到加強。這兩個特性使得該算子容易丟失一部分邊緣的方向信息,造成一些不連續(xù)的檢測邊緣,同時抗噪聲能力比較差。
圖4為不同邊緣檢測算子對石材大板邊緣進行檢測的結果。
從圖4中可以看出,不同的邊緣檢測算法應用到石材大板圖像上會有不同的檢測效果,通過比較可以發(fā)現(xiàn)Sobel和Prewitt算子的處理效果相對較好。經(jīng)多次試驗比較,而且由于Sobel算子對于水平和垂直邊緣的檢測有更好的效果,因此效果相對較好。
2.2.2 圖像二值化
圖像的二值化處理就是將圖像上每點的灰度值變?yōu)?或者255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。在數(shù)字圖像處理中,二值化是一種簡單有效的方法。設定某一閾值,可以用將圖像的數(shù)據(jù)分成兩部分:大于的像素群和小于的像素群。因此圖像二值化可按公式(5)進行:
式中,是原始圖像中位于處像素的灰度;是二值化后該處的像素值,它只能取0或1。
圖5所示為用二值化方法提取的石材大板輪廓,通過這組圖像處理過程我們可以發(fā)現(xiàn),這類提取石材輪廓的方法適用于石材大板和圖像背景圖案有很大的區(qū)別的圖像,而且我們也可以看出這種方法的提取效果很好。
2.2.3 數(shù)學形態(tài)學處理
數(shù)學形態(tài)學(Mathematical Morphology)是由一組形態(tài)學的代數(shù)運算子組成的,它的基本運算有4個:膨脹(或擴張)、腐蝕(或侵蝕)、開啟和閉合,它們在二值圖像和灰度圖像中各有特點。數(shù)字圖像處理中的形態(tài)學處理是指將數(shù)字形態(tài)學作為工具從圖像中提取對于表達和描繪區(qū)域形狀有用處的圖像分量,比如邊界、骨架以及凸殼,還包括用于預處理或后處理的形態(tài)學過濾、細化和修剪等[3]。
本文采用的是閉運算,先膨脹,反復膨脹后得到需要的狀態(tài),如圖6(2)所示。很明顯邊界得到了擴張,于是逐步進行腐蝕,以恢復原始邊界,如圖6(3)所示。最后提取石材大板輪廓,如圖6(4)所示。輪廓提取是接下來計算石材大板尺寸的基礎,最終實現(xiàn)在線測量尺寸。
3、結論
本文介紹了石材大板在線測量系統(tǒng)的重要階段,先后介紹了圖像的灰度化處理、平滑處理、二值化、圖像分割和數(shù)學形態(tài)學處理的相關原理及算法,提取了石材大板的邊緣輪廓信息。本文的設計為石材領域的發(fā)展提供了一個創(chuàng)新點,將其應用到現(xiàn)有石材加工設備上可以實現(xiàn)石材加工自動化水平,解決了國內(nèi)石材企業(yè)針對不規(guī)則外型的石材大板不能進行實時測量的困擾,提高了生產(chǎn)效率和經(jīng)濟效益。
摘 要: 針對傳統(tǒng)四輪定位儀精度不高、操作復雜的問題,設計了一套基于圖像處理與計算機視覺的車輛四輪定位儀,給出了該儀器基于2D平面靶標的攝像機定標方法及攝像頭拍攝連續(xù)圖像的處理方法。最后分析了該車輛四輪定位儀的工作過程及工作原理,并與手工測量的車輛四輪定位參數(shù)進行了對比實驗,實驗結果表明基于圖像處理與計算機視覺的車輛四輪定位儀的設計理論和方法都是正確的。
關鍵詞: 計算機視覺; 攝像機定標; 圖像處理; 四輪定位
0 引 言
隨著汽車行駛速度的加快,影響車輛安全性的車輪定位參數(shù)就越發(fā)的重要。當車軸、轉向機構和車架發(fā)生磨損和變形[1]后,車輪定位將會失準從而影響車輛的安全性。但現(xiàn)有的四輪定位儀精度不高、操作復雜,嚴重的影響了車輪定位調(diào)校的效率[2?4]。
針對上述問題,設計了一套基于圖像處理與計算機視覺的車輛四輪定位儀。給出了該儀器基于2D平面靶標的攝像機定標方法及攝像頭拍攝連續(xù)圖像的處理方法,并分析了該四輪定位儀的工作原理,最后通過實驗證明了該儀器設計理論和測量方法的正確性。
1 基于2D平面靶標的攝像機定標
1.1 圖像坐標系、攝像機坐標系與世界坐標系
攝像機拍攝的圖像采用標準電視信號的形式存儲于計算機中,然后計算機使用數(shù)模板轉換為數(shù)字圖像。在圖1所示的直角坐標系[(u,v)]中,各像素的坐標[(u,v)]表示該像素在整個數(shù)組中的列數(shù)編碼和行數(shù)編碼。但并沒有物理單位能夠表示出該像素在整幅圖像中的具體位置,所以還需創(chuàng)建以物理單位為刻度的圖像坐標系。圖像坐標系以圖像內(nèi)一點作為坐標原點,其中[x]軸 與[u]軸平行,[y]軸與[v]軸平行,具體如圖1所示,[(u,v)]表示以像素作為單位的圖像坐標系,[(x,y)]表示以物理單位毫米作為單位的圖像坐標系,兩個坐標系均為圖像坐標系,但所采用的坐標單位不同。
攝像機的光心為[O]點,攝像機的光軸為[zc]軸,垂直于圖像平面,[xc]軸與圖像坐標系的[x]軸平行,[yc]軸與圖像坐標系的[y]軸平行。圖像坐標系的坐標原點為圖像平面和光軸的交點,[xc]軸,[yc]軸和[zc]軸與點[O]組成的坐標系即為攝像機坐標系,[OO1]即為攝像機焦距。
1.2 基于2D平面靶標的攝像機定標
由于3D立體靶標加工精度受到一定的限制且制作成本較高,此處采用2D平面靶進行攝像機定標[5]。在定標過程中,攝像機以多于兩個方位對同一個平面靶標進行拍攝,平面靶標和攝像機均能夠自由移動且無需知曉其運動參數(shù)。在定標過程中,攝像機內(nèi)部參數(shù)始終為定常數(shù),僅外部參數(shù)發(fā)生變化。
2 圖像處理
為了降低圖像的噪聲干擾,靶盤為黑底,上面有若干個白色圓斑,并以圓心作為特征點,為了取得特征點(白色橢圓中心)的二維圖像坐標,首先進行圖像閾值分割,然后完成邊緣檢測,最后尋找特征點坐標[6]。四輪定位系統(tǒng)工作中拍攝的靶盤圖像如圖3所示。
2.1 圖像閾值分割和邊緣檢測
根據(jù)實際觀測,將閾值設置為150,則閾值分割處理后的結果如圖4所示。
2.2 Hough變換求取橢圓參數(shù)
對于平面上的任意橢圓,設橢圓圓心為點[c,]在平面上任取一點[p,]則點[p]距橢圓上任意點的最大距離必然大于點[c]距橢圓上任意點的最大距離。根據(jù)橢圓的該性質,可以通過尋找平面內(nèi)距橢圓上任意點的最大距離數(shù)值最小的點來確定橢圓圓心,而且找到的這個最大距離的最小值即為橢圓的長軸長度。通過該方法,可以得到橢圓長、短軸長,橢圓圓心點橫、縱坐標和旋轉角度5個參數(shù)中的3個,剩下的2個橢圓參數(shù)就能夠通過Hough變換的方法求得,算法的具體實現(xiàn)步驟如下:
(1) 首先對需處理的圖像完成邊緣檢測,取得二值化的圖像邊緣輪廓,將邊緣輪廓圖上的各點數(shù)據(jù)存入數(shù)組[A;]
(2) 針對二維平面上的所有點,分別計算與上步中得到的數(shù)組[A]中點的距離,得到所有點與數(shù)組[A]中點的最大距離,在計算的最大距離中的最小值對應的點就是橢圓圓心的橫縱坐標[p,q,]該最大距離就是橢圓長軸的長度[a;]
(3) 將第一步中數(shù)組[A]所有點的數(shù)值與橢圓參數(shù)[p,q,a]代入橢圓方程[E,]橢圓方程為:
然后在二維空間內(nèi)對參數(shù)[b,θ]進行統(tǒng)計分析,得到一組峰值大于一定閾值的參數(shù)即為橢圓的參數(shù)。
2.3 特征點三維坐標求取
通過前面的分析可知,當靶盤上圓的實際大小與圖像上橢圓長、短軸尺寸都知道時,攝像機與圓心間的距離為:
式中:[F]表示攝像機鏡頭的焦距;[P]表示圓半徑;[A]表示橢圓長軸長度,[A=μ×N,][μ]表示像元尺寸,[N]表示圖像中橢圓長軸的長度,單位為像素。
根據(jù)式(3)世界坐標系與圖像坐標系的關系,可以通過求解該方程得到特征點坐標[(xw,yw,zw)。]此處選取測量靶盤中相距0.075 m的兩圓心的距離進行實驗,攝像機拍到的照片如圖6所示。
3 四輪定位儀的工作流程及原理
3.1 工作流程
基于圖像處理與計算機視覺的車輛四輪定位系統(tǒng)由兩臺數(shù)字攝相機、計算機主機和四個靶盤組成,具體如圖7所示。
攝像機僅能獲取單側靶盤的圖像,紅外線由特制的光源發(fā)射,靶盤接收到紅外線后,將其反射至高性能數(shù)字攝像機成像,攝像機依據(jù)獲取的圖像通過計算得出相機與目標之間的距離,然后將數(shù)據(jù)處理后就能夠得出車輪的定位參數(shù),車輪定位參數(shù)的測量流程具體如下:將汽車放置于舉升機上,使汽車進入攝像機的拍攝視角范圍;打開攝像機,固定方向盤后推動汽車行駛,然后拍攝行駛中的靶盤;根據(jù)攝像機拍攝到的圖像(三幅以上)計算出車輪的外傾角和前束角;將汽車整體固定使其無法前后移動,轉動方向盤,獲取車輪轉動過程中靶盤的圖像,然后計算出主銷后傾角和內(nèi)傾角。
3.2 建立測量基準平面?車身平面
在汽車行駛過程中,靶盤本身是傾斜的,車輛前輪兩個旋轉中心點即為汽車前輪定位平面;同樣,車輛后輪兩個旋轉中心點即為后輪定位平面。這兩個面作為整個四輪定位測量系統(tǒng)的基準平面,其優(yōu)點是該平面無需依賴于重力和重力傳感器。所以,在車輛行駛過程中,不論車輛是前后傾斜還是左右傾斜,都不會影響車輪定位參數(shù)的測量[7]。
3.3 汽車定位參數(shù)數(shù)學模型的建立
靶盤固定于車輪,所以可將靶盤和車輪當做一個剛體來分析,車輪的運動可分解為平動和旋轉兩個分運動。由于車輪的旋轉軸與車輪輪面垂直,所以可將車輪前束角和外傾角看作是車輪旋轉軸與各坐標軸間的夾角。
由于汽車前輪上安裝的兩靶盤是完全相同的,且其能夠與車輪共同當做一個剛體處理[8],汽車車輪運動驅動靶盤運動,將靶盤的運動分解成平移運動和旋轉運動,同時假設靶盤先平移后旋轉。在靶盤的旋轉過程中,車輪滾動一圈,則靶盤上所有白色圓心的運動軌跡均是圓。但在四輪定位儀的實際測量中,車輪滾動軌跡達不到一圈,靶盤圓心軌跡是一段弧,但仍能夠通過圓弧上任意三點求出軌跡圓心。在車輪的平動過程中,左右靶盤上同一位置的白色圓心的連線隨車輪平動形成前輪定位平面,后輪則形成后輪定位平面。
在汽車轉向過程中,車輪繞主銷旋轉,通過旋轉前后靶盤特征點的坐標變化就能夠得出主銷軸線本身與[X,Y,Z]軸間的夾角[α,β,γ,]進一步就可求出主銷后傾角和內(nèi)傾角,具體求解示意圖如圖9所示。
4 實 驗
為了驗證本文所設計的車輪定位儀的準確性,選取車輪外傾角和前束角進行了實驗。實驗通過車輪外傾角和前束角的變化,從四輪定位儀中輸出各定位參數(shù)的變化,同時選取手工測量作為對比數(shù)據(jù)。各組實驗數(shù)據(jù)如表2~表4所示。
5 結 論
針對傳統(tǒng)四輪定位儀精度不高、操作復雜這一問題,設計了一套基于圖像處理與計算機視覺的車輛四輪定位儀。給出了該儀器的設計方法并進行了測量精度實驗,實驗結果表明所設計的四輪定位儀操作簡單并具有較高的精度。但為了進一步提高儀器的測量精度,后續(xù)還要對圖像質量和圖像處理算法進行改進,并提高攝像機的定標精度。
時展日新月異,人們的生活也瞬息萬變。人們每天會接受到很多視覺信息,隨著時間的流逝,城市中的每一處光影、每一個街角,都定格著屬于它的美好?!耙?” (北京陌上花科技有限公司)人工智能計算機視覺引擎將AR(增強現(xiàn)實)和AI(人工智能)融合,會讓你眼中的世界完全不同,它更智能化、更懂你的需求,把你所看到的視覺信息經(jīng)過人工智能“大腦系統(tǒng)”處理后,通過AR展現(xiàn)和交互,帶給你更多全新的驚喜與感動。
小時候,我們都有過這樣的夢想:生活實景都變成游戲,隨時隨地看到的場景、人物、好看的好吃的好玩的都能動起來,穿越時空,虛擬和現(xiàn)實世界夢幻疊加?!耙?”將AR技術和人工智能技術深度結合,使用復雜的計算機視覺技術和深度學習算法,去理解場景,然后增強場景,幫你達成這個愿望。仿佛擁有一雙慧眼+超強大腦,而且這只是“衣+”暫時制定的一個小目標而已。
AR技術是通過計算機系統(tǒng)提供的信息疊加用戶對現(xiàn)實世界感知的技術,將虛擬的信息應用到真實世界,并將計算機生成的虛擬物體、場景或系統(tǒng)提示信息疊加到真實場景中,從而實現(xiàn)對現(xiàn)實的增強。更通俗一點的說法是,它是一種全新的人機交互技術,利用攝像頭、傳感器、實時計算和匹配技術,將真實的環(huán)境和虛擬的物體實時地疊加到同一個畫面或空間。用戶可以通過虛擬現(xiàn)實系統(tǒng)感受到在客觀物理世界中所經(jīng)歷的“身臨其境”的逼真性,還能突破空間、時間,以及其他客觀限制,感受到在真實世界中無法親身經(jīng)歷的體驗。
“衣+”是世界領先的人工智能計算機視覺引擎,致力于讓計算機看懂世界,屬于人工智能中的感知和認知智能,在圖像視頻中對場景、通用物體、商品、人臉的檢測、識別、理解、搜索及推薦均達到領先水平。陌上花自主研發(fā)的深層次多屬性深度學習網(wǎng)絡,是人工智能在云和端上計算的核心基礎。在國際頂級計算機視覺競賽ImageNet2015和ImageNet2016中,先后獲得五項和三項世界第一。
“衣+”技術團隊正在做這樣一個嘗試,利用AR技術結合人工智能大數(shù)據(jù)技術感知認知世界,并增強了交互方式,這將大大改變?nèi)藗兊纳?,將深度學習的人工智能科技和AR技術相結合應用到視頻、直播、時尚、購物、美食、出行、運動、旅行等生活體驗的各個方面,提供全生活場景智能服務,打造前所未有的智能視覺體驗。
增強現(xiàn)實技術,不僅展現(xiàn)了真實世界的信息,而且將虛擬的信息同時顯示出來,兩種信息相互補充、疊加。在視覺化的增強現(xiàn)實中,用戶利用AR設備,把真實世界與電腦圖形合成在一起。“衣+”AR技術結合人工智能,以計算機視覺技術為基礎實現(xiàn)感知認知,能將人眼看到的所有信息,包括商品、物體、食物、服飾、汽車、建筑等,都精準匹配出同款及相關商品。它的展現(xiàn)方式更加生動、立體、多樣化,能夠帶給用戶高品質、高時效、一站式的服務體驗。
“衣+”AR技術和人工智能的結合實現(xiàn)了對現(xiàn)實世界的感知和認知的能力,可以在圖像視頻中完成對場景、通用物體、商品、人臉的檢測、識別、理解、搜索等。如今,每個月有上億次的商品推薦通過“衣+”邊看邊買引擎來完成,幫助用戶搜索、識別他們所看到的物品。目前“衣+”支持服飾、3C數(shù)碼、商超、家居、日用品、交通工具等超過幾百類商品的檢測和識別。
通過對海量數(shù)據(jù)進行深度學習,“衣+”視覺引擎能夠檢測識別視頻或圖像中的商品,并通過分析商品特征,準確判斷商品類目等商品信息。在餐飲方面,當用戶用不同的手持終端對餐廳的食品進行拍攝后,餐廳的位置以及菜品的食材等將即刻呈現(xiàn)在手持終端上,使就餐體驗的科技含量越來越高。
此外,“衣+”利用技術手段可以實現(xiàn)對視頻和圖像中的物體的位置、名稱、運動軌跡、輪廓等屬性的實時分析。目前已支持超過10000類常用物體、大于400類室內(nèi)外場景的識別。
利用深度學習技術,“衣+”還可以在視頻、圖像中實現(xiàn)人臉關鍵點檢測,可用于相機、直播等多種娛樂場景。讓場景營銷變得更自然、更直觀、更有趣味?!耙?”人臉屬性識別,可以準確識別出人物的性別、年齡、種族、情緒、顏值、性感、時尚等屬性信息,平均準確率超過93%?;谏疃葘W習的人臉對比技術,實現(xiàn)人臉相似度測量,可用于人臉聚類、敏感人物監(jiān)控等場景。這一切,都是在人工智能計算機視覺搜索引擎中實時完成。
目前,AR技術越來越火熱,并將全面融入人們的日常生活。目前,“衣+”和阿里云、華為、優(yōu)酷土豆、微博、360、華數(shù)、京東、天貓魔盒、CIBN、英偉達、趣拍、花椒等數(shù)十家頂級機構深度合作,通過提供邊看邊買引擎、圖像視頻內(nèi)容分析引擎、人臉屬性分析引擎服務海量用戶,同時幫助用戶實現(xiàn)場景營銷、智能分析和內(nèi)容互動。AR技術與人工智能相融合的市場將快速增長?!耙?”也將不斷利用無處不在的AR技術和人工智能技術,創(chuàng)造一個智能世界,將生活中的美好愿望變?yōu)楝F(xiàn)實。
摘 要
在我國市場經(jīng)濟不斷發(fā)展的盛況下,我國科技發(fā)展水平也緊隨其后,成為世界上的科技強國之一。在計算機水平的不斷提高下,計算機視覺技術應運而生。其中,計算機視覺技術被應用與各個領域,并在各個領域都得到廣泛有效的應用,比如軍事領域、醫(yī)療領域、工業(yè)領域等。本文針對計算機視覺技術在交通領域中的應用進行分析。
【關鍵詞】計算機視覺 交通領域 探究
近年來,隨著科技水平的提高,計算機視覺技術逐漸被人們熟知并廣泛應用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領域中,也對計算機視覺技術進行研究完善,將計算機視覺技術應用在交通領域各個方面中,并取得了顯著的成效。
1 計算機視覺的概述及基本體系結構
1.1 計算機視覺概述
通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。
計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進行感知。
計算機視覺是一門綜合性學科,在各個領域都有所作為,已經(jīng)吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰(zhàn)性的研究。
1.2 計算機視覺領域基本體系結構
提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統(tǒng)框架。在此基礎上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統(tǒng)的基本體系結構,如圖1。
2 計算機視覺在交通領域的應用
2.1 牌照識別
車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。
2.2 車輛檢測
目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實際情況設置動態(tài)變化等技術提供支持。
2.3 統(tǒng)計公交乘客人數(shù)
城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統(tǒng)中,自動乘客計數(shù)技術是其關鍵技術。自動乘客計數(shù)技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點兩方面對客流分析,為城市公交調(diào)度進行合理的安排。
2.4 對車道偏離程度和駕駛員工作狀態(tài)判斷
交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關數(shù)據(jù)顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計算機視覺中車道偏離預警系統(tǒng)被研究開發(fā)并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據(jù)疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態(tài)進行判斷。此外,根據(jù)道路識別技術,對車輛行駛狀態(tài)進行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態(tài)的有效方法。
2.5 路面破損檢測
最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節(jié)省維護成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。
3 結論
本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現(xiàn)展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。
【摘要】由于計算機技術的不斷發(fā)展,計算機視覺技術也得到了很大的發(fā)展。從產(chǎn)生的時間來看,計算機視覺產(chǎn)生于上個世紀中葉,當時它的主要工作內(nèi)容是進行統(tǒng)計模式識別,較為簡單,目前為止已經(jīng)經(jīng)過了長時間的發(fā)展,工作內(nèi)容明顯增加,依然發(fā)展為一門獨立的學科,而且在多個領域都得到了廣泛的應用。對于人們的生活產(chǎn)生了很大的影響。本文主要是簡單介紹計算機視覺技術的發(fā)展歷程,并分析它在那些社會生產(chǎn)領域中得到了推廣以及應用。
【關鍵詞】計算機視覺技術 推廣 應用
在人工智能領域的研究中,計算機視覺是主要的研究對象之一,目前它已經(jīng)發(fā)展為一門獨立的科學學科,主要是對相關的理論以及技術進行研究,從而建立一個完善的人工信息系統(tǒng)。
一、計算機視覺技術的產(chǎn)生與發(fā)展歷程
計算機視覺產(chǎn)生于20世紀50年代,其當時主要的工作內(nèi)容為統(tǒng)計模式識別,尤其是需要進行分析二維圖像的特點和作用,例如對航空圖片進行研究、對顯微圖片進行分析等。直至60年代初,Roberts使用計算機從大量的數(shù)字圖像當中選取出棱柱體、長方體等物體的三維圖形,并且分析物體空間的主要特點。在70年代初期,視覺應用系統(tǒng)開始得到應用,然后過了幾十年之后,專家們已經(jīng)了解了機器視覺的特點,并且開設了對應的課程。到了80年代中期,計算機視覺已經(jīng)逐漸被人們應用與工作和生活當中。計算機技術的不斷發(fā)展,使得計算機視覺系統(tǒng)的實用性得以提升,現(xiàn)已被大量使用于機器人學、幾何計算等領域,直接影響著人們的生活。
二、計算機視覺技術的推廣與應用領域
2.1應用于工業(yè)生產(chǎn)領域
目前為止計算機視覺技術已經(jīng)普遍應用于工業(yè)生產(chǎn)領域中,除了在工業(yè)探傷、檢測方面得到了推廣,而且還在辦公以及生產(chǎn)自動化等各方面都得到了廣泛的應用。一般來說在工業(yè)生產(chǎn)中推廣計算機視覺技術,能夠在很大程度上提高自動化程度,從而提高產(chǎn)品生產(chǎn)的效率,同時還能防止人工的失誤,導致不必要的損失。
2.2應用于農(nóng)業(yè)生產(chǎn)領域中
從農(nóng)業(yè)生產(chǎn)領域的角度來看,計算機視覺技術的應用也越愛越普遍,一方面主要是利用該技術全程監(jiān)測農(nóng)作物的生產(chǎn)過程,已達到預防病害蟲的作用,另一方面利用該技術對農(nóng)產(chǎn)品進行檢測,以便對其進行分類與分級。由于在農(nóng)業(yè)生產(chǎn)領域中利用計算機視覺技術能夠實現(xiàn)自動化管理,因此能夠減少大量的勞動力,降低生產(chǎn)的人工成本,進一步提高管理生產(chǎn)效率。
2.3應用于社會公共安全領域中
社會公共安全是人們非常重視的一個問題,計算機視覺技術在這方面也得到了有效的應用,不僅應用于偵查、犯罪偵破工作中,而且還應用于指紋配比、人臉合成等工作中。應用這種技術能夠進一步提高犯罪案件的偵破效率,避免更多的犯罪行為發(fā)生,從而影響人們的正常生活。
2.4應用于視覺導航領域中
通過對計算機視覺技術進行長時間的研究后,當前已將之推廣于視覺導航領域中,主要是應用于太空探測、航天飛行等方面,在此基礎上還應用于巡航導彈制導、智能交通等方面。在視覺導航領域中,應用計算機視覺技術可以解放大量的勞動力,避免工作帶來的危險,而且還能有效提高工作效率。
2.5應用于人機交互領域中
一般來說在人機交互領域中應用計算機視覺技術,可以通過人的肢體語言、人臉表情進行測定,進一步分析人的意愿,從而按照要求認真完成指令,這樣不僅可以有效增加交互的方便性,而且還可以有效增加臨場感,具有其他技術不可替代的作用。
2.6應用于虛擬現(xiàn)實領域中
當前計算機視覺技術在虛擬現(xiàn)實領域中得到了推廣,利用這種技術可以進行不同的軍隊戰(zhàn)場場景模擬,在此基礎上還能對飛行員飛行、醫(yī)生手術等現(xiàn)場進行模擬。總之,利用這種技術能夠帶給人們一種身臨其境的感覺,從而進一步提高工作效率。
2.7應用于衛(wèi)星遙感領域中
從衛(wèi)星遙感領域的角度來看,計算機視覺技術的應用并不少見,不僅應用于礦藏勘探、資源探測等方面,而且還應用于氣象預報、自然災害監(jiān)測等方面。一般來說衛(wèi)星遙感涉及的信息量非常大,而且類別也很多,分析識別工作稍不注意,就會出現(xiàn)錯誤,而利用這種技術后,能夠快速、有效的進行信息的收集以及分析工作,進一步提高信息的準確性。
三、結語
計算機視覺技術發(fā)展到現(xiàn)在,已經(jīng)在多個領域得到應用與推廣,在虛擬現(xiàn)實、工農(nóng)業(yè)生產(chǎn)等眾多領域中隨處可見。而隨著社會的不斷進步,市場對于計算機視覺技術的需求也越來越大,具有很大的發(fā)展?jié)摿?。為了能夠滿足市場增長的需求,使計算機視覺技術得到更廣泛的應用,需要研發(fā)人員通過不斷的努力研制出更加完善的計算機視覺技術系統(tǒng),這是當前科研工作的主要課題。
摘要:該文基于OpenCV的計算機視覺技術進行研究,探討了視頻中計算機對運動物體視覺檢測的原理,并對OpenCV的應用情況進行說明,闡述了基于OpenCV的計算機視覺技術體系,最終重點敘述了計算機視覺三維模擬技術,以期能為相關工作提供參考。
關鍵詞:OpenCV;計算機視覺技術;三維模擬技術
21世紀是國際計算機技術高度發(fā)展的時代,人們生活中的每個角落都可以看到計算機技術的身影,尤其是現(xiàn)代計算機視覺技術和圖像處理功能發(fā)展更加迅猛,各技術分支也逐漸趨于成熟。計算機視覺技術主要指的就是利用智能計算機系統(tǒng)來代替人類的眼睛對現(xiàn)實三維世界進行辨識和理解,整個過程均是計算機自我學習的過程,而隨著這項技術研究的不斷深入,其不再僅僅包含計算機技術科學,同時還涉獵了包括生理學、神經(jīng)學、物理學、應用數(shù)學等多門學科,為人類科技的進步提供了有效的動力。
1 計算機對視頻中運動物體檢測的原理概述
在現(xiàn)代計算機技術基礎下,對視頻當中的運動物體檢測原理主要包括兩種,分別是從微觀和宏觀的角度出發(fā)。其中宏觀檢測技術指的是當計算機截取了視頻中的某一個圖像,其以整幅圖像為對象進行檢測;微觀檢測技術是指在截取圖像后,根據(jù)實際需求對某一區(qū)域內(nèi)的圖像內(nèi)容進行檢測。在計算機視覺技術實際應用時,其第一步就是對圖像的采集,第二步是對已經(jīng)采集的圖像進行預分析處理,如果采用宏觀檢測技術則對圖像整體進行分析;如果采用微觀檢測技術則首先將圖像進行分割,然后對分割后各圖像內(nèi)容中出現(xiàn)的運動物體影像進行分析。在圖像數(shù)據(jù)獲取過程中應用的是背景差分法,這一技術主要是將背景和運動物體進行分離提取,以獲取沒有背景圖像的運動物體影像數(shù)據(jù)。還可以利用幀間差分法,這種方法主要是對一個視頻圖像的逐幀畫面進行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結合起來就是一個物體在計算機視覺下的運動軌跡?,F(xiàn)代研究者更傾向于將背景和幀間差分法進行結合運用,這樣可以獲得無背景下的運動物體軌跡,進而提升計算機視覺系統(tǒng)捕捉數(shù)據(jù)的準確性。
2 OpenCV的應用概述
OpenCV是現(xiàn)代計算機視覺技術當中具有開源性的視覺庫,其最早是由俄羅斯Intel分公司所研發(fā),不僅高效,而且具有兼容的優(yōu)勢。同時與傳統(tǒng)IPL圖像處理系統(tǒng)相比,OpenCV所處理的圖像數(shù)據(jù)等級更高,例如在對運動物體進行特征跟蹤、目標分割、運動軌跡分析以及三維模型重建等方面都有著巨大的優(yōu)勢。
OpenCV本身編輯的源代碼是開放式的,編寫過程簡潔且方便,并且程序中大多數(shù)函數(shù)已經(jīng)通過了匯編的最優(yōu)化,使其能夠更加高效地被應用。在使用OpenCV的攝像機標定模塊已經(jīng)為用戶設計了實用性較強的接口,并且能夠支持Windows界面的操作平臺,使得這一技術的操作更加簡便。這一技術本身操作簡便,對于編程人員和檢驗人員個人技能素質要求并不高,視覺技術系統(tǒng)研發(fā)人員可以利用簡便的操作來檢驗其設想是否能夠實現(xiàn),這就使得現(xiàn)代計算機視覺技術開發(fā)團隊能夠形成更好的協(xié)作研發(fā)關系,進一步提升技術研究效率。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測等方面得到了廣泛的應用,同時對于無人飛行器的視覺捕捉技術也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強,編程人員可以根據(jù)自己的意愿對源代碼進行披露,并且國內(nèi)也已經(jīng)形成了規(guī)模較大的交流社區(qū),給更多同行業(yè)者提供答疑解惑的場所,進一步擴大了OpenCV的應用范圍。
3 基于OpenCV的計算機視覺技術
3.1 基于OpenCV下的運動物體檢測技術
在常規(guī)運動物體檢測技術下,均是直接通過圖像背景和運動物體的區(qū)分來實現(xiàn)運動物體的捕捉。而基于OpenCV下的運動物體檢測技術則不僅能夠針對于圖像背景的分離實現(xiàn)運動物體的觀察,還可通過物體本身特定的信息來進行檢測,主要包括形狀、輪廓以及顏色等。這樣就能夠實現(xiàn)在復雜的背景當中將特定的運動物體完整抽離出來。其基本流程包括:首先,對影像數(shù)據(jù)當中某一時間點的圖像進行捕捉,然后對這一視頻圖像的格式進行轉化;其次,對轉化格式后的視頻圖像進行早期處理,并將運動物體和復雜的背景區(qū)分開,降低周圍各環(huán)境因素對運動物體主體圖像的影響;第三,根據(jù)完成提取后的運動物體圖像進行辨識,然后再從視頻當中捕捉擁有相同特征的物體,并對該物體進行跟蹤識別。而這一過程的實質則在于先利用圖像捕捉技術對畫面進行截取,然后同時利用背景差分法和幀間差分法對圖像進行分割,逐幀地將運動物體完成提取出來,以供計算機進行視覺跟蹤處理。
3.2 基于OpenCV的圖像預處理技術
一般情況下,計算機視覺處理技術應用的環(huán)境情況較為復雜,大多數(shù)應用環(huán)境當中均有光照的變化,并且部分計算機視覺處理設備還需要在露天環(huán)境下進行工作,此時周圍環(huán)境中的風、溫度、光照、氣候以及運動物體數(shù)量等對視頻圖像的采集均有著極大的影響。環(huán)境因素會使圖像采集的質量大幅度降低,同時圖像當中的噪點問題也難以避免,而噪點是視覺捕捉和圖像處理當中最大的影響因素。因此,在基于OpenCV下的計算機視覺技術在捕捉視頻圖像之后先對其進行預處理,然后再由系統(tǒng)對運動物體進行分離、檢測和跟蹤。一般的預處理過程主要包括平滑度濾波、圖像填充、背景實時更新等。
1)圖像的平滑度濾波預處理技術
由于在實際計算機視覺捕捉過程中圖像噪點是難以避免的問題,以此在對圖像中運動物體進行檢測前,應該相對這些噪點進行預處理,降低環(huán)境噪聲對圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線性和非線性。其中線性處理方式就是通過計算機處理設備的簡單運算,對圖像當中的噪點進行直接清除,但這一技術使用后會造成截獲圖像模糊不清的情況,因此僅對噪點較少的圖像采用該處理方式;非線性濾波處理則是利用復雜的圖像處理運算,將截獲圖像當中的噪點無限縮小,使其不對圖像整體造成影響,并且可以有效保證圖像的局部調(diào)整,但這種處理方式在運算時速度沒有線性濾波處理快,因此需應用在噪點較多,圖像信息較復雜的處理當中。
2)圖像的填充預處理技術
這一處理技術在使用過程中運算速度較慢,主要是由于其需要對逐幀的圖像均進行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運動物體之后,利用計算機系統(tǒng)自身的邊緣檢測處理技術,對物體的輪廓進行辨識,并利用形態(tài)學上的漫水填充方式對運動物體周圍的噪點進行顏色填充,減小其對畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似,但這種處理技術主要是針對于噪點進行腐蝕和膨脹,使其在畫面當中所占比例擴大,但對運動物體本身不造成影響,這使運動物體和噪點之間的差異就會更加明顯,就可以將噪點的影響降到最低,但這種處理方法的效果和攝像機本身的性能、質量等有著密切的關聯(lián)。
3)背景的實時更新預處理技術
在進行運動物體和背景分離過程中,計算機系統(tǒng)需要對圖像上的背景元素進行辨識,并對其開展初始化處理,這樣就能夠為后期實時背景圖像的差異進行凸顯,以增加前景圖像的效果,降低噪點對圖像的影響。在運用這一技術時,首先要先對第一幀的圖像進行確定,并將第一幀圖像當中的背景圖像元素進行辨識,然后在后期圖像更新和運動物體檢測過程中對背景進行實時更新處理。在更新的過程中其流程主要包括:首先,系統(tǒng)要對所讀取的畫面進行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉變?yōu)閱瓮ǖ阑叶戎?;第三,對轉變后的圖像進行高斯平滑度濾波處理,將圖像當中的噪點進行去除;第四,采用形態(tài)學噪點填充技術對圖像當中的噪點進行二次處理,以獲得所需要更新的背景圖像。
3.3 前景運動物體的提取技術
在計算機視覺技術進行運動物體的檢測時,只有有效保障檢測流程的準確度,才能夠有效保障對前景運動物體的跟蹤效果。其主要分為兩大步驟,其一是對二值化后的圖像數(shù)據(jù)進行分割處理;其二是在圖像分析前對其進行充分的填充處理,保證前景圖數(shù)據(jù)的完整性。同時,在前景圖像提取的過程中也分為多個步驟,其包括:首先,對所提出的前景圖像和背景圖像進行差分處理;其次,將差分處理后的圖像二值化處理;第三,對背景當中前景物體的輪廓或邊緣進行辨識,根據(jù)前景圖像的輪廓對其進行填充。由于在實際操作過程中,攝像頭所處環(huán)境的變化較大,并且會在不同場所內(nèi)的不同角度捕捉畫面,因此就需要在前景圖像提取時有效提高背景圖像實時更新的效果。
利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開,從而使目標運動物體能夠呈現(xiàn)獨立化,并且閥值分割方式開展前要相對每個像素點進行確定,判斷其是否位于灰度值的范圍內(nèi)。而將該圖像的像素灰度和閥值進行對比后會出現(xiàn)兩種結果,分別是灰度值低于或高于閥值。在實際應用過程中,有效確定圖像的分割閥值T,就能夠降低環(huán)境當中光照因素對圖像質量的影響。
4 計算機視覺技術當中的三維重建技術
1)三維重建的視覺系統(tǒng)
計算機視覺技術在對圖像進行捕捉時可以視為是對大量的圖像信息進行處理,從攝像機的視覺角度出發(fā),其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數(shù)據(jù),而這種三維空間數(shù)據(jù)能夠提升對運動物體所處空間位置、距離等描述的準確性。在三維重建視覺系統(tǒng)工作過程中,其相對基本的圖像數(shù)據(jù)框架進行確定,然后利用一個坐標點建立2.5D圖像數(shù)據(jù),即以此點為視角能夠觀察到的圖像數(shù)據(jù),再將2.5D圖像數(shù)據(jù)進行整合從而建立三維圖像。
2)雙目視覺系統(tǒng)
當人體利用雙眼在不同角度、同一時間內(nèi)觀察同一個物體時,就可以利用算法來測量該物體和人體之間的距離,而這種方法也被稱為雙目立體感,其應用的原理主要是人體視覺差所帶來的影響。同時利用兩臺攝像機對同一圖像從不同角度進行觀察,就能夠獲得人體雙目觀察后的效果,因此這一三維重建技術也被稱為“雙目視覺系統(tǒng)”。兩臺不同的攝像機即可代表人體雙眼,其對圖像進行逐幀捕獲,但由于角度不同和環(huán)境影響因素的差異,因此造成了圖像差異,必須對其捕捉的圖像進行預處理。
3)三維重構算法
在計算機視覺技術中對于視頻流的采集主要依靠的是彩色攝像機、紅外攝像機、紅外接收攝像頭等設備。還可以利用微軟所提供的Kinect設備,在進行運動物體檢測前能夠對NUI進行初始化處理,將系統(tǒng)內(nèi)函數(shù)的參數(shù)設定為用戶信息深度圖、彩圖、骨骼追蹤圖等數(shù)據(jù)。在使用Kinect設備對視頻流進行打開時,其可以遵循三個步驟,其一是彩色和深度數(shù)據(jù)的處理;其二是根據(jù)數(shù)據(jù)的索引添加顏色信息,并將其引入到深度圖數(shù)據(jù)當中;其三是骨骼追蹤數(shù)據(jù)。
5 結束語
計算機視覺捕捉技術是現(xiàn)代計算機應用當中較為先進的內(nèi)容,其應用范圍較廣,對于運動物體的捕捉準確度較高,能夠有效推進現(xiàn)代計算機模擬技術的發(fā)展。
摘 要計算機視覺具有實時、客觀、無損的優(yōu)點,能對馬鈴薯的表面外部品質進行快速有效的檢測。本文闡述了應用計算機視覺技術對馬鈴薯進行外部品質檢測的必要性,并對基于計算機視覺的馬鈴薯的大小檢測、形狀檢測以及表面缺陷檢測的應用進行了研究。
【關鍵詞】計算機視覺技術 馬鈴薯外部品質 檢測
隨著計算機技術的不斷發(fā)展,計算機視覺技術應運而生并在工業(yè)自動化以及農(nóng)產(chǎn)品檢驗檢測等領域成功應用。其中,將計算機視覺技術用于以自動化采集和品級分級為代表的果蔬商品化處理具有非常廣闊的發(fā)展空間。我國政府將“農(nóng)產(chǎn)品深加工技術與設備研究開發(fā)”列為我國“十五”重大科技攻關項目的第一項,這標志著計算機視覺技術在果蔬外部品質檢測中會發(fā)揮越來越重要的作用。
馬鈴薯是世界上僅僅排在小麥、水稻和玉米之后的第四種主要農(nóng)作物,種植區(qū)域非常廣泛。馬鈴薯品質檢測是馬鈴薯深加工的一個關鍵步驟,目前,該檢驗過程多數(shù)采用人工檢測,不僅成本高、效率低,而且與檢驗員的專業(yè)素質有密切的關系,受到人為因素影響的程度較大,嚴重制約的馬鈴薯加工企業(yè)的發(fā)展。計算機視覺技術能對農(nóng)產(chǎn)品的某些特性變化和缺陷進行識別,具有客觀、無損害等特點。本文對基于計算機視覺的馬鈴薯外部品質檢測的應用進行了研究。
1 應用計算機視覺技術對馬鈴薯進行外部品質檢測的必要性
隨著“麥當勞”、“肯德基”的餐飲服務業(yè)的快速發(fā)展,炸薯條、炸薯片已經(jīng)成為一種休閑食品深受消費者的喜愛,推動了我國馬鈴薯產(chǎn)業(yè)的發(fā)展。然而,情況并不十分樂觀,與國外的馬鈴薯企業(yè)相比,我國馬鈴薯加工企業(yè)生產(chǎn)規(guī)模小、生產(chǎn)產(chǎn)品單一、技術設備落后、產(chǎn)品質量不高的現(xiàn)象導致我國的馬鈴薯產(chǎn)品銷售困難,經(jīng)濟效益逐漸下滑。
基于以上現(xiàn)狀,對馬鈴薯的加工研究還有很長的一段路程。企業(yè)要擴大生產(chǎn)規(guī)模,針對中國的消費趨勢與消費水平開發(fā)出新的馬鈴薯產(chǎn)品,從而提高我國馬鈴薯產(chǎn)品的競爭力。這就要求馬鈴薯加工企業(yè)要對馬鈴薯的加工技術進行創(chuàng)新,保證產(chǎn)品質量。其中,馬鈴薯外部品質檢測對馬鈴薯產(chǎn)品的最終品質起著決定性作用。當前的人工檢測方式已經(jīng)不再適應社會發(fā)展的要求,利用計算機視覺檢驗代替人工檢驗成為社會發(fā)展的必然趨勢,這是因為計算機視覺技術具有以下優(yōu)點:
(1)精度高,能夠進行定量測量。
(2)自動化程度高,一次就可完成包括大小、形狀、顏色以及缺陷在內(nèi)的檢測和分析,并能進行綜合識別。
(3)無損檢測,計算機視覺檢測過程不需要接觸產(chǎn)品,是通過傳感器掃面獲取圖像的,不會造成產(chǎn)品的損傷。
(4)信息量大,可對大量信息進行采集,對光譜的敏感范圍也很廣。
2 基于計算機視覺的馬鈴薯外部品質檢測的應用研究
2.1 馬鈴薯大小的檢測方法
馬鈴薯的大小檢測不僅影響馬鈴薯深加工的商業(yè)價值,在在遺傳和育種方面也有很高的應用價值。
利用計算機視覺技術對馬鈴薯大小的檢測步驟如下:先從攝像機中獲取馬鈴薯的圖像信息,在圖像信息的基礎上對馬鈴薯三維空間的幾何信息進行計算,并由此重建和識別馬鈴薯。而馬鈴薯物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系是由攝像機成像的幾何模型決定的,這些幾何參數(shù)成為攝像機參數(shù)。要想準確的獲取這些攝像機參數(shù),就必須將實驗與計算相結合,此過程成為系統(tǒng)定標。
系統(tǒng)定標的基本步驟:根據(jù)設定好的攝像機模型和特定的實驗條件包括形狀、尺寸等已知的定標參照物,經(jīng)過對馬鈴薯圖像的處理,并利用一系列的數(shù)學轉換和計算方法將攝像機模型的內(nèi)部和外部參數(shù)計算出來,從而建立照片與實物的聯(lián)系推算出馬鈴薯的真實尺寸。
2.2 馬鈴薯形狀的檢測方法
根據(jù)《中國馬鈴薯栽培學》中的知識,我們可以把馬鈴薯的塊莖形狀分為三類,分別是圓形、長筒形和橢圓形,除了這三種形狀,其余都是這三種形狀的變形。此次研究將馬鈴薯分為圓形、橢圓形和長筒形,并且采用橢圓的短長軸比來模擬馬鈴薯的縱橫直徑之間的關系。
2.2.1 馬鈴薯形狀特征參數(shù)的提取
將馬鈴薯橢圓的短長軸比R作為形狀特征參數(shù),并按照R的大小將馬鈴薯進行分類。當R小于0.67時,稱之為長筒馬鈴薯;當R大于0.85時,稱之為圓形馬鈴薯;當R介于0.67到0.85之間時,稱之為橢圓形馬鈴薯。
2.2.2 結果與分析
隨機抽取114塊馬鈴薯,對抽取的馬鈴薯進行正反兩面拍照,挑選清晰度最高的228張圖片。人工分類后進行計算機視覺分類,操作步驟具體如下:
(1)用DIPS預處理:B通道灰度化,中值濾波和Otsu分割;
(2)通過計算機視覺技術提取馬鈴薯圖片的短長軸比R;
(3)將人工分類與計算機視覺分類進行對比,并得出正確率。
根據(jù)圖表,我們可以看出在228張僅有兩張圖片被分類錯誤,正確率高達99.1%,而這兩個分類錯誤的馬鈴薯的短長軸比處于0.67周圍,分別為0.667604 , 0.67193和0.671887, 0.661063,又因為對馬鈴薯形狀的分類不需要類似工業(yè)生產(chǎn)那樣精密,所以,當正反兩面短長軸比接近時都可看作是橢圓形。
2.3 馬鈴薯的缺陷檢測
計算機視覺技術具有實時、客觀、無損的檢測特點,能對馬鈴薯的表面缺陷和某些特征要素進行快速檢測?;诖耍瑖鴥?nèi)外很多研究學者進行了大量的實驗研究,在1998年開發(fā)了利用PC機輔助的實時馬鈴薯檢測系統(tǒng),能夠對馬鈴薯的重量、顏色以及形狀進行快速檢測;2000年,相關研究者在此基礎上建立了計算機視覺檢測系統(tǒng),不僅能實現(xiàn)大小、形狀的檢測,還能對馬鈴薯表面的生長裂縫、機械裂縫、綠皮等表面缺陷進行檢測。當前對馬鈴薯表面缺陷進行檢測的主要計算機視覺技術包括缺陷分割法和缺陷識別法兩種方法。
3 結論
本文應用計算機視覺技術對馬鈴薯的大小、形狀和表面缺陷等外部品質進行了檢測,但是還未能實現(xiàn)利用計算機視覺技術對馬鈴薯的表面缺陷進行分類這一技術。因此,相關部門要加大研究力度,爭取早日完善計算機視覺技術,從而推動我國馬鈴薯加工企業(yè)快速高效的發(fā)展。
摘要:為解決通訊機殼部件測量中遇到的圓擬合和邊緣提取不準確的問題,提出了利用加權函數(shù)進行修正的方法。首先,針對圓擬合過程中容易受到干擾點影響的情況,提出采用雙平方形式的加權函數(shù)對圓擬合過程進行修正,去除了離群值較大的點,從而使圓擬合更準確。為了準確的定位邊緣,提出了利用三角形模糊隸屬函數(shù)作為加權函數(shù),對邊緣選取過程進行修正,從而達到準確提取邊緣的目的。同時,本文采用了魯棒性強的字符提取算法及支持向量機的字符檢測算法,實現(xiàn)了字符提取和識別。
關鍵詞:加權函數(shù);圓擬合;邊緣選??;字符檢測
通訊天線設備的電性能直接與設備的各個零部件的精度相關,通訊天線零部件的高精度是保障通信質量的基本條件。通訊機殼零部件的尺寸精度、幾何形狀精度、相互位置精度、表面粗糙度等都有嚴格規(guī)范和公差范圍。在檢測過程中不但要高精度地測量幾何尺寸、幾何形狀和相互位置精度,同時還要識別零部件表面的各種符號、數(shù)字和字母等。本文以通訊機殼零部件測量為例,以滿足精度、提高可靠性為目的,研究了基于單目計算機視覺條件下滿足亞像素精度的檢測方法,其關鍵檢測技術主要有標定技術、復雜輪廓的基元擬合技術、模糊測量技術和字符提取技術等。文中針對機殼部件測量中,存在圓擬合與邊緣提取不準確的問題,提出了利用加權函數(shù)進行修正的方法。該方法的基本思想是:圓擬合不準確主要是由于受到較大的離群點影響,因此采用一種雙平方模式的加權函數(shù)來去除這些離群點,從而得到準確的擬合圓。邊緣提取不準確也是由于提取到了不需要的邊緣,因此采用三角形模式的加權函數(shù)對不需要的邊緣進行抑制,只允許正確的邊緣輸出,從而達到正確檢測目的。檢測結果表明,所提出的方法能夠滿足測量要求。由于機殼部件表面的字符也要求識別,因此本文根據(jù)字符及其背景,選擇了魯棒性強的動態(tài)閥值分割算法和支持向量機分類器實現(xiàn)了字符的檢測和識別。
1 攝像機標定技術
本文采用傳統(tǒng)的攝像機標定方法,利用一個標定板與其圖像的對應約束關系來確定攝像機的內(nèi)參數(shù)和外參數(shù)。測量中,采用的是遠心相機模型。從三維空間坐標到二維圖像坐標的映射關系可以使用一個固定數(shù)量的參數(shù)來表示:
2 最小二乘法的加權擬合
由于部件的邊界點組成的輪廓會產(chǎn)生大量的數(shù)據(jù),而我們所關心的是確定部件輪廓的位置信息,因此需要將輪廓擬合成直線、圓、橢圓等基元,進而確定被測部件的形狀精度、相互位置精度等關鍵參數(shù)。本文提出一種圓擬合算法,該算法基于各個擬合點的權重值的大小對圓進行擬合,使得到圓更為精確。
3 模糊測量
相對于經(jīng)典標準的測量方法,模糊測量對邊緣選擇更加靈活。它可以依據(jù)圖像的對比度、位置、尺寸及灰度值等信息實現(xiàn)測量。
設模糊集合記為;并在[0,1]閉區(qū)間的特征函數(shù)稱為隸屬函數(shù),記為,它表示對于的隸屬程度,用它來描述“亦此亦彼”的模糊概念。在經(jīng)典集合論中,集合元素要么屬于或不屬于集合,該集合的邊界是清晰的。模糊集理論則允許有關集合元素模糊漸進評估,這就是通過隸屬函數(shù)來描述的。模糊集合的定義式為:
由于在圖像中的灰度值存在模糊性,其主要體現(xiàn)在物體的邊緣,因此適合用模糊理論對圖像邊緣的不確定性進行描述。對單一不確定性測量,在量化的區(qū)域內(nèi),包含準確的值,即在gray zone范圍內(nèi)[6]。對物體進行測量前,要選擇模糊隸屬函數(shù)。常用的有Triangular、S-curve function、Z-function和Pi-function四種。其他隸屬函數(shù)可由這四種組合而成[7]。在實際的測量中,由于光照等因素影響,常導致邊緣檢測不準確,進而影響測量結果,圖2(a)所示為由于檢測出多個邊緣,其測量結果有多個。
5 結論
本文研究了基于單目計算機視覺的機殼測量方法。針對測量中圓擬合不準確的問題,提出了圓擬合算法的改進,即對擬合過程中,先計算各個點的加權值,對大于指定值的視為離群點,將其忽略已達到去除離群點的目的,從而得到更準確的圓。對檢測到多個邊緣的問題,根據(jù)其正確的邊緣位置信息,設計相應的加權函數(shù),只選擇需要的邊緣輸出,從而得到正確的測量結果。加權函數(shù)的方法的優(yōu)點是使檢測結果更準確;其缺點是增加了計算量,從而使檢測時間加長。因此,對于檢測時間要求比較苛刻的場合,該方法還有進一步改進的空間。另外本文還根據(jù)檢測要求,運用動態(tài)閥值分割算法和SVM分類器對機殼表面的字符進行了提取和識別。