中文久久久字幕|亚洲精品成人 在线|视频精品5区|韩国国产一区

歡迎來(lái)到優(yōu)發(fā)表網(wǎng),期刊支持:400-888-9411 訂閱咨詢:400-888-1571股權(quán)代碼(211862)

購(gòu)物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

視覺(jué)算法培訓(xùn)范文

時(shí)間:2024-01-01 15:42:55

序論:在您撰寫(xiě)視覺(jué)算法培訓(xùn)時(shí),參考他人的優(yōu)秀作品可以開(kāi)闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

視覺(jué)算法培訓(xùn)

第1篇

關(guān)鍵詞:高校教師教育技術(shù)培訓(xùn);決策樹(shù)ID3算法;應(yīng)用

中圖分類號(hào):G451.2 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1002-0845(2012)10-0098-02

信息技術(shù)的迅猛發(fā)展引起了教育的深刻變革。為此,提高教師的信息素養(yǎng)已成為推動(dòng)我國(guó)高等教育信息化建設(shè)的必由之路。高教司于2000年發(fā)出的《關(guān)于開(kāi)展高校教師教育技術(shù)培訓(xùn)工作的通知》(高教司【2000】79號(hào))[1]中指出,“教育技術(shù)培訓(xùn)”是“新世紀(jì)教改工程”和“現(xiàn)代遠(yuǎn)程教育工程”的重要組成部分,是深化教學(xué)改革、提高教學(xué)質(zhì)量的重要舉措。

常熟理工學(xué)院自2001年6月開(kāi)始,對(duì)教師進(jìn)行教育技術(shù)培訓(xùn),2003年1月起申報(bào)江蘇省教育技術(shù)培訓(xùn)點(diǎn),次年申報(bào)成功。2007年,學(xué)校正式下發(fā)的《常熟理工學(xué)院講師等中級(jí)職稱資格條件》(常理工[2007]73號(hào))第二章第七條規(guī)定:教師申報(bào)教學(xué)系列、思政系列的中級(jí)職稱應(yīng)參加學(xué)?,F(xiàn)代教育技術(shù)培訓(xùn)并取得合格證書(shū)。近幾年來(lái),學(xué)校先后舉辦了十期教師教育技術(shù)中級(jí)培訓(xùn)班,共400多名中青年教師參加了培訓(xùn),極大地提高了教師的多媒體教學(xué)水平,加快了學(xué)校信息化建設(shè)的步伐。

一、高校教師教育技術(shù)培訓(xùn)存在的問(wèn)題

教師教育技術(shù)培訓(xùn)的研究對(duì)象是教學(xué)過(guò)程與教學(xué)資源,研究范疇包括對(duì)教學(xué)過(guò)程的設(shè)計(jì)以及教學(xué)資源的開(kāi)發(fā)、應(yīng)用、管理與評(píng)價(jià)。目前,各高校的教師教育技術(shù)培訓(xùn)工作雖已取得了一定的成績(jī),但從培訓(xùn)的實(shí)際效果來(lái)看,仍存在著一些問(wèn)題,主要表現(xiàn)在以下三個(gè)方面。

1.培訓(xùn)時(shí)間安排不夠合理

目前,教師教育培訓(xùn)基本采用集體面授的方式。由于參訓(xùn)教師自身所承擔(dān)的教學(xué)工作和科研任務(wù)比較繁重,很難抽出一段相對(duì)集中的時(shí)間來(lái)參加教育技術(shù)培訓(xùn)。為解決上述矛盾,高校通常會(huì)選擇利用寒暑假時(shí)間安排培訓(xùn),這需要犧牲培訓(xùn)教師和參訓(xùn)教師的許多休息時(shí)間,容易引發(fā)不滿情緒,嚴(yán)重影響了教師參訓(xùn)的積極性,極大地降低了培訓(xùn)效果。

2.培訓(xùn)內(nèi)容安排不科學(xué)

由于培訓(xùn)內(nèi)容是根據(jù)全校教師需求統(tǒng)一安排的,基本沒(méi)有考慮到參訓(xùn)教師自身所具備的知識(shí)層次、學(xué)科背景、思想意識(shí)等方面的差異,因此很難體現(xiàn)學(xué)科差別。各學(xué)科教師混合在一起集中學(xué)習(xí),導(dǎo)致理論知識(shí)講解過(guò)多而與教學(xué)實(shí)際聯(lián)系較少,參訓(xùn)教師難以從根本上真正掌握教育技術(shù)。

3.考核方式單一,培訓(xùn)評(píng)價(jià)體系不健全

目前,高校教師培訓(xùn)采取的考核方式往往比較單一,通常以參加理論考試或者提交相關(guān)論文、作業(yè)等作為培訓(xùn)的最終考核結(jié)果。此外,各級(jí)培訓(xùn)機(jī)構(gòu)大多未能及時(shí)地對(duì)培訓(xùn)過(guò)程做出評(píng)價(jià),同時(shí)缺少參訓(xùn)教師的自我評(píng)價(jià)環(huán)節(jié),因而不利于教育技術(shù)培訓(xùn)工作的后續(xù)支持和進(jìn)一步開(kāi)展。如此看來(lái),建立和完善培訓(xùn)評(píng)價(jià)體系顯得尤為重要,這也是建立教師培訓(xùn)長(zhǎng)效機(jī)制的關(guān)鍵所在。

二、分類技術(shù)與決策樹(shù)ID3 算法的相關(guān)理論

針對(duì)參訓(xùn)教師在知識(shí)層次、學(xué)科背景、思想意識(shí)等方面存在的差異,筆者提出了“先分類后培訓(xùn)”的思路。在培訓(xùn)正式開(kāi)始之前,可采用數(shù)據(jù)挖掘領(lǐng)域內(nèi)的分類技術(shù)對(duì)參訓(xùn)教師進(jìn)行分類,這樣有利于激發(fā)參訓(xùn)教師的積極性,從而增強(qiáng)他們運(yùn)用現(xiàn)代教育技術(shù)輔助教學(xué)的主動(dòng)性和自覺(jué)性。

1.分類

作為數(shù)據(jù)挖掘的重要任務(wù)之一,分類[4]就是要找出一個(gè)類別的概念描述或預(yù)測(cè)未來(lái)的數(shù)據(jù)趨勢(shì),它代表了這類數(shù)據(jù)的整體信息。分類的目的是為了構(gòu)造一個(gè)分類函數(shù)或分類模型(也稱分類器),該模型能夠把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定的類別中。

2.相關(guān)概念及定義

根據(jù)信息論中的有關(guān)定義,熵一般用于測(cè)量一個(gè)非葉節(jié)點(diǎn)的信息量的大小。若存在n個(gè)相同概率的消息,則每個(gè)消息的概率p是1/n,此時(shí)一個(gè)消息傳遞的信息量應(yīng)為-log2(p)=log2(n)。若給定的概率分布P=(p1, p2, … , pn),則由該分布傳遞的信息量稱為P的熵I(P)。

若一個(gè)記錄的集合T根據(jù)類別屬性的值被分成相互獨(dú)立的類C1,C2,…,Ck,則識(shí)別T的一個(gè)元素所屬哪一類所需要的信息量是INFO(T)=I(P),其中P是(C1, C2, … , Ck)的概率分布。

若先根據(jù)非類別屬性X的值將T分成集合T1,T2,…,Tn,則INFO(X, T)是在已得到X的值后確定T中一個(gè)元素的類別屬性時(shí)所需要的信息量,可通過(guò)確定Ti的加權(quán)平均值來(lái)得到,增益Gain(X,T)=INFO(T)-INFO(X, T)。

因此,可利用Gain(X, T)將屬性進(jìn)行排列,并可構(gòu)造一棵決策樹(shù),其中每一個(gè)節(jié)點(diǎn)在屬性中都是具有最大增益的一個(gè),從而不必考慮來(lái)自于根的路徑。

3.決策樹(shù)ID3算法

決策樹(shù)ID3算法[4]是由Quinlan首先提出來(lái)的。該算法是以信息論為基礎(chǔ)、以信息熵和信息增益度為衡量標(biāo)準(zhǔn)實(shí)現(xiàn)對(duì)數(shù)據(jù)的歸納分類的。給定一個(gè)非類別屬性C1,C2,…,Cn的集合、類別屬性C及記錄的訓(xùn)練集T之后,可以用ID3算法構(gòu)造一棵決策樹(shù),其中R是一個(gè)非類別屬性集合,具體算法如下:

若T為空,返回一個(gè)值為無(wú)效的單個(gè)節(jié)點(diǎn);

若T是由其他均為相同類別屬性值的記錄組成,返回一個(gè)帶有該值的單個(gè)節(jié)點(diǎn);

若R為空,則返回一個(gè)單節(jié)點(diǎn),其值為在T的記錄中找出的頻率最高的類別屬性值(這時(shí)將出錯(cuò),即對(duì)記錄進(jìn)行了誤分類),將R中屬性之間具有最大Gain(D, T)值的屬性賦給D;

第2篇

關(guān)鍵詞:汽車駕駛員 視覺(jué)特性 視覺(jué)-眼動(dòng)系統(tǒng) 應(yīng)用

0 引言

隨著車流量的增加,大量交通信號(hào)設(shè)施等因素使駕駛員的視覺(jué)環(huán)境變得更加復(fù)雜。在這種復(fù)雜的駕駛環(huán)境中,會(huì)嚴(yán)重影響駕駛員的視覺(jué),易于發(fā)生交通事故。因此,駕駛員需集中駕駛保持對(duì)交通環(huán)境的認(rèn)知以及理解處理后的視覺(jué)信息。擁堵的車輛和行人形成一個(gè)高度復(fù)雜的交通環(huán)境,為了行車安全,需要提供更多的視覺(jué)處理信息。

1、駕駛行為的視覺(jué)特性研究

視覺(jué)在“人-車-路”系統(tǒng)中起著關(guān)鍵性作用并在很大程度上影響著駕駛員的決定。對(duì)駕駛行為進(jìn)行分析及基于實(shí)時(shí)視覺(jué)分析被稱為EAP系統(tǒng)進(jìn)行研究。此系統(tǒng)針對(duì)駕駛員行為進(jìn)行分析并收集同步實(shí)用的可嵌入信息,如眼動(dòng)方向、軌跡跟蹤等。

在此框架中,提出了一個(gè)便于分析聚焦面積的司機(jī)駕駛情況,憑借區(qū)域和興趣進(jìn)行自動(dòng)檢測(cè)的新方法。目的是跟蹤工作自動(dòng)存儲(chǔ)的視頻區(qū)域(ROI)。這里主要研究基于一個(gè)最新研發(fā)實(shí)時(shí)可視化分析工具叫Eye Access Pilot(EAP)系統(tǒng)。這是一種新一代眼動(dòng)跟蹤分析且不受駕駛員干擾的EAP視覺(jué)系統(tǒng)。它是基于圖像處理和數(shù)值算法的實(shí)時(shí)系統(tǒng),目的是來(lái)確定駕駛員眼角度。為了設(shè)計(jì)一個(gè)能顯示駕駛員行為的預(yù)測(cè)模型,眼動(dòng)與駕駛員的行為相關(guān)性非常重要,能夠?qū)崿F(xiàn)對(duì)駕駛員準(zhǔn)確變更車道。EAP視覺(jué)系統(tǒng)使用圖像處理技術(shù),尤其是應(yīng)用數(shù)值算法來(lái)確定在多種實(shí)際駕駛條件下的駕駛員眼睛方位。

用于單眼視覺(jué)場(chǎng)景自動(dòng)感興趣區(qū)域跟蹤已付諸實(shí)施。采用固定在駕駛艙的模型具有一定的穩(wěn)定型,這些模式并不干擾駕駛員行為。應(yīng)用更具識(shí)別能力的模式以增強(qiáng)精確度的研究正在研究中。通過(guò)相關(guān)和定性不同駕駛員視覺(jué)行為的研究,結(jié)果通過(guò)EAP視覺(jué)系統(tǒng)獲得 ,尤其是自動(dòng)ROI跟蹤,可量化參數(shù)如軌道與視知覺(jué),被認(rèn)為是認(rèn)知模型的主要輸入。

2、視覺(jué)-眼動(dòng)系統(tǒng)在交通方面的應(yīng)用

2.1 使交通信息傳遞更準(zhǔn)確

一些學(xué)者測(cè)量了交通標(biāo)志在不同速度下的可視性和駕駛員的識(shí)別能力,還有人則測(cè)試了交通標(biāo)志的燈光亮度對(duì)用戶和駕駛員反應(yīng)時(shí)間的影響。目前對(duì)交通標(biāo)志的研究大多還局限在對(duì)標(biāo)志外觀尺寸、顏色搭配及設(shè)施結(jié)構(gòu)等方面,較少有從駕駛員在駕駛過(guò)程中自身特征如眼部運(yùn)動(dòng)特征的角度來(lái)研究。因此我們注重從駕駛員的角度出發(fā),研究駕駛員在行車過(guò)程中的眼部運(yùn)動(dòng)特征和視認(rèn)特性以及兩者間的聯(lián)系,完善交通標(biāo)志的設(shè)計(jì)設(shè)置,更好地發(fā)揮交通標(biāo)志的作用。

2.2 修正道路口通行能力

目前通常以飽和度法計(jì)算交叉口的通行能力,涉及到的飽和流率模型將道路要素,交通要素,周邊要素作為其主要影響因素,而忽視了駕駛員因素的影響。事實(shí)上,交叉通流率處于不同水平時(shí),駕駛員的視覺(jué)特性也會(huì)發(fā)生變化,當(dāng)交叉通流率增大時(shí),駕駛員的視覺(jué)特性由穩(wěn)定變?yōu)椴环€(wěn)定。應(yīng)用駕駛員在交叉口不同交通流率水平下的視覺(jué)-眼動(dòng)特性參數(shù),對(duì)飽和流率模能力而不是交叉口本身特性所決定的最大通行能力。只有交叉口的設(shè)計(jì)考慮了駕駛員因素找出趨于駕駛員行車安全的最大通行能力,設(shè)計(jì)方案的實(shí)施效果才能真正得到改善。

3、結(jié)語(yǔ)

當(dāng)前視覺(jué)-眼動(dòng)系統(tǒng)在交通方面的研究還主要是使用國(guó)外的儀器設(shè)備。隨著眼動(dòng)儀智能化的進(jìn)一步發(fā)展,硬件的小型化、低成本,眼動(dòng)在交通方面的應(yīng)用研究將會(huì)越來(lái)越廣泛,眼動(dòng)研究與對(duì)駕駛員的研究結(jié)合將會(huì)更為緊密。根據(jù)駕駛員的視覺(jué)特性,在今后的駕駛培訓(xùn)工作中應(yīng)該重視駕駛?cè)嗽谝曈X(jué)方面的特性,對(duì)目前的駕駛培訓(xùn)工作加以改進(jìn),提高駕駛?cè)艘曈X(jué)信息獲取能力,從而減少駕駛?cè)税l(fā)生交通事故的可能性,減少交通安全隱患,提高交通安全。

參考文獻(xiàn):

[1]鄧鑄.眼動(dòng)心理學(xué)的理論技術(shù)及應(yīng)用研究[J].南京師大學(xué)報(bào),社會(huì)科學(xué)版,2005,1

[2]馬勇,郭應(yīng)時(shí).基于眼動(dòng)分析的汽車駕駛員視覺(jué)搜索模式研究[D].長(zhǎng)安大學(xué):交通運(yùn)輸規(guī)劃與管理,2006,5

[3]范紅靜.駕駛員動(dòng)態(tài)視覺(jué)特性及對(duì)交叉口通行能力的影響研究[D].南京:東南大學(xué),2008.

第3篇

[關(guān)鍵詞]知識(shí)轉(zhuǎn)化 可視化技術(shù) 可視化展示 可視化繪制

[分類號(hào)]G354

1 可視化技術(shù)在知識(shí)轉(zhuǎn)化中的作用

野中郁次郎提出的經(jīng)典SECI模型將知識(shí)轉(zhuǎn)化區(qū)分為四種模式:社會(huì)化(socialization)、外化(Exter-nalization)、組合(Combination)、內(nèi)化(Internalization)。在社會(huì)化模式中,利用可視化技術(shù)能夠搭建便于觀察和模仿的溝通平臺(tái),實(shí)現(xiàn)隱性知識(shí)的分享與傳播;但由于沒(méi)有將隱性知識(shí)系統(tǒng)地表示出來(lái),因此可視化技術(shù)對(duì)社會(huì)化模式的支撐作用并不直接。鑒于可視化技術(shù)在豐富知識(shí)的表示方式的優(yōu)勢(shì)上,筆者認(rèn)為可視化技術(shù)在知識(shí)轉(zhuǎn)化中的作用主要體現(xiàn)在外化模式、組合化模式以及內(nèi)化模式當(dāng)中。

1.1 可視化技術(shù)在外化模式中的作用

外化模式是將隱性知識(shí)系統(tǒng)整理、清晰表達(dá)出來(lái)供他人分享和利用的過(guò)程,可視化技術(shù)能夠表達(dá)文字難以表示的隱性知識(shí)。野中郁次郎曾指出:“將隱性知識(shí)轉(zhuǎn)化為顯性知識(shí)意味著尋找表達(dá)難以表達(dá)的知識(shí)的方法。完成這一任務(wù)最強(qiáng)有力的管理工具之一是圖形方法”。在外化模式中可以采用的可視化技術(shù)包括:概念圖、認(rèn)知地圖、思維導(dǎo)圖以及視覺(jué)隱喻。概念圖對(duì)結(jié)構(gòu)化知識(shí)具有很強(qiáng)的表達(dá)能力;認(rèn)知地圖能夠高效表達(dá)因果知識(shí);頭腦風(fēng)暴過(guò)程中,利用思維導(dǎo)圖可以將參與人員的想法組織起來(lái),不僅能夠明確討論的方向、給出結(jié)論,而且能夠誘導(dǎo)思維、激發(fā)人們創(chuàng)造知識(shí);視覺(jué)隱喻則將知識(shí)表示為人類更易理解的事物??梢暬夹g(shù)在外化模式中的作用不僅體現(xiàn)在知識(shí)表示上,同時(shí)體現(xiàn)在知識(shí)評(píng)價(jià)上。根據(jù)圖形,參與人員能夠制定直觀的評(píng)價(jià)指標(biāo)和方法,快速完成知識(shí)評(píng)價(jià)。

1.2 可視化技術(shù)在組合化模式中的作用

組合化模式通過(guò)分類、重組、分析等手段將零散的顯性知識(shí)聚合在一起并從中提煉出新的顯性知識(shí)。隨著知識(shí)挖掘技術(shù)的日益成熟,組合化模式更傾向于利用知識(shí)挖掘技術(shù)來(lái)實(shí)現(xiàn),而可視化技術(shù)能夠支撐知識(shí)挖掘的完成??梢暬夹g(shù)不僅提供一定的布局算法將知識(shí)挖掘產(chǎn)生的數(shù)據(jù)、知識(shí)展示出來(lái)讓知識(shí)專家更為輕松地觀察和理解,而且還提供一定的交互機(jī)制來(lái)影響知識(shí)挖掘的過(guò)程,使得知識(shí)專家可以透過(guò)圖形化界面動(dòng)態(tài)、全面地操控知識(shí)挖掘的完成。因此,可視化技術(shù)對(duì)知識(shí)挖掘的作用不僅體現(xiàn)在挖掘結(jié)果上,而且體現(xiàn)在知識(shí)挖掘的整個(gè)過(guò)程。可視化技術(shù)與知識(shí)挖掘相結(jié)合,能夠充分發(fā)揮挖掘算法、布局算法、交互算法各自的優(yōu)勢(shì),從零散的顯性知識(shí)集合中發(fā)現(xiàn)不平凡的模式,提煉出新的顯性知識(shí)。

1.3 可視化技術(shù)在內(nèi)化模式中的作用

在內(nèi)化模式中,人們通過(guò)資料收集和整理、資料分析和利用、邊干邊學(xué)、在職培訓(xùn)、觀察學(xué)習(xí)、當(dāng)面交流等渠道學(xué)習(xí)顯性知識(shí),并通過(guò)記憶、消化、吸收等思維活動(dòng)將其轉(zhuǎn)化為個(gè)人的隱性知識(shí)。利用可視化技術(shù)支撐內(nèi)化模式的實(shí)現(xiàn),主要體現(xiàn)在知識(shí)導(dǎo)航和知識(shí)建構(gòu)兩個(gè)方面:一方面,可視化技術(shù)能夠提供直觀的知識(shí)導(dǎo)航工具,方便人們收集、組織和管理知識(shí)資源;另一方面,可視化技術(shù)能夠提供簡(jiǎn)易的知識(shí)建構(gòu)工具,支撐知識(shí)建構(gòu)的完成。常見(jiàn)的知識(shí)導(dǎo)航工具包括領(lǐng)域本體、專業(yè)敘詞表、知識(shí)分類表、知識(shí)地圖、領(lǐng)域思維導(dǎo)圖、個(gè)人思維導(dǎo)圖、領(lǐng)域概念圖、個(gè)人概念圖、文獻(xiàn)地圖、文獻(xiàn)聚類圖、文獻(xiàn)時(shí)間分布圖、文獻(xiàn)內(nèi)容直方圖、書(shū)架隱喻、教材隱喻和報(bào)紙隱喻等。知識(shí)建構(gòu)是對(duì)外部知識(shí)資源進(jìn)行主動(dòng)選擇、加工和處理,從而獲得自己理解意義的過(guò)程。

綜上,可視化技術(shù)通過(guò)豐富知識(shí)的表示方式,促進(jìn)外化模式、組合化模式以及內(nèi)化模式的完成,根據(jù)完成可視化表示的主體不同,可以將可視化技術(shù)在知識(shí)轉(zhuǎn)化中的作用區(qū)分為兩種不同機(jī)理:以人腦處理為中心的可視化繪制和以計(jì)算機(jī)處理為中心的可視化展示。

2 可視化繪制

可視化繪制是由人類借助一定的可視化技術(shù)工具將大腦中產(chǎn)生和擁有的知識(shí)以圖形化方式表示出來(lái),以關(guān)聯(lián)人腦中的知識(shí)結(jié)構(gòu)與知識(shí)庫(kù)存儲(chǔ)的知識(shí)結(jié)構(gòu),旨在產(chǎn)生更多的知識(shí)以增加人腦和知識(shí)庫(kù)的知識(shí)存量??梢暬L制流程,包括知識(shí)準(zhǔn)備、知識(shí)互動(dòng)以及圖形繪制三個(gè)步驟,分別形成個(gè)人知識(shí)空間、共享知識(shí)空間以及視覺(jué)對(duì)象空間。

2.1 個(gè)人知識(shí)空間

個(gè)人知識(shí)空間是單個(gè)知識(shí)工人擁有的知識(shí)構(gòu)成的知識(shí)空間,是通過(guò)長(zhǎng)期學(xué)習(xí)、不斷積累形成的。個(gè)人知識(shí)空間不僅包括人腦中的知識(shí),也包括個(gè)人計(jì)算機(jī)存儲(chǔ)的知識(shí)。在學(xué)習(xí)和工作中人們常常借助軟件工具將學(xué)習(xí)資料、工作文件保存管理起來(lái),并將個(gè)人體會(huì)、讀書(shū)筆記、讀后感想等各種想法、觀點(diǎn)、思路、總結(jié)等學(xué)習(xí)成果撰寫(xiě)成文檔存儲(chǔ)起來(lái)。這些文檔均是個(gè)人知識(shí)的體現(xiàn),反映特定人的知識(shí)結(jié)構(gòu)。人腦中產(chǎn)生和擁有的知識(shí)是可視化繪制的直接來(lái)源,但是這些知識(shí)只有通過(guò)長(zhǎng)期積累才能獲取的。就某一次的可視化繪制而言,知識(shí)準(zhǔn)備是臨時(shí)的,形成的個(gè)人知識(shí)空間反映的是臨時(shí)的個(gè)人知識(shí)結(jié)構(gòu);但實(shí)質(zhì)上,知識(shí)準(zhǔn)備是長(zhǎng)期的,包括個(gè)人以往所有的學(xué)習(xí)和工作總結(jié),是一個(gè)不斷積累、永元止境的過(guò)程。

2.2 共享知識(shí)空間

共享知識(shí)空間是由一群人參與討論、互相協(xié)作、相互評(píng)價(jià)、取長(zhǎng)補(bǔ)短、充分利用各自優(yōu)勢(shì)、自由發(fā)揮形成的動(dòng)態(tài)知識(shí)空間。共享知識(shí)空間可以是一次集體討論,可以是頭腦風(fēng)暴過(guò)程,也可以是協(xié)作學(xué)習(xí)過(guò)程。協(xié)作與對(duì)話是共享知識(shí)空間形成的關(guān)鍵。不同的人對(duì)知識(shí)的理解是不一樣的,每個(gè)人都有自己的認(rèn)知結(jié)構(gòu),只有通過(guò)協(xié)作才能達(dá)成共識(shí),形成統(tǒng)一的知識(shí)結(jié)構(gòu)。對(duì)話是協(xié)作不可或缺的環(huán)節(jié),參與互動(dòng)的人員之間需要溝通交流,只有通過(guò)對(duì)話才能保證協(xié)作的順利進(jìn)行。共享知識(shí)空間的形成是一次知識(shí)互動(dòng)完成的,而且不能復(fù)制,是參與人員的即興發(fā)揮。

2.3 視覺(jué)對(duì)象空間

視覺(jué)對(duì)象空間是由一組視覺(jué)對(duì)象及其屬性組成的空間,是由人類根據(jù)共享知識(shí)空間生成的知識(shí)結(jié)構(gòu),并且利用圖形軟件繪制而成的。視覺(jué)對(duì)象空間可以是一組概念圖、一組思維導(dǎo)圖或一組語(yǔ)義網(wǎng)絡(luò)圖或一組認(rèn)知地圖,也可以是一幅通過(guò)視覺(jué)隱喻形成的圖形。視覺(jué)對(duì)象空間的形成由繪圖軟件協(xié)助完成,繪圖軟件的設(shè)計(jì)應(yīng)簡(jiǎn)單易用,同時(shí)提供各類面板、記憶功能。實(shí)施繪制的人員可以是參與知識(shí)提取或知識(shí)建構(gòu)的知識(shí)工人,也可以是專門(mén)的知識(shí)工程師,還可以是善于利用繪圖軟件的計(jì)算機(jī)工程師,當(dāng)然也可以是幾個(gè)人員協(xié)作完成。

3 可視化展示

可視化展示是將抽象數(shù)據(jù)空間轉(zhuǎn)換為直觀視覺(jué)空間,以便人類利用強(qiáng)大視覺(jué)處理能力發(fā)現(xiàn)隱藏在抽象

數(shù)據(jù)空間中的模式和知識(shí)。可視化展示流程,包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)析取以及數(shù)據(jù)映射三個(gè)步驟,分別形成原始數(shù)據(jù)空間、可視化數(shù)據(jù)空間及視覺(jué)對(duì)象空間。

3.1 原始數(shù)據(jù)空間

原始數(shù)據(jù)空間是由需要進(jìn)行可視化展示的原始數(shù)據(jù)構(gòu)成的數(shù)據(jù)空間,是通過(guò)篩選、采集知識(shí)庫(kù)中的相關(guān)數(shù)據(jù)并進(jìn)行格式化、結(jié)構(gòu)化處理形成的。原始數(shù)據(jù)空間的形成通過(guò)自動(dòng)采集實(shí)現(xiàn),關(guān)鍵技術(shù)是信息抽取和自動(dòng)標(biāo)引。因?yàn)橹R(shí)庫(kù)中存取的知識(shí)數(shù)量巨大、內(nèi)容豐富、格式繁雜、結(jié)構(gòu)化程度不一,包括各種格式的Web文檔、文本文檔、多媒體文檔及數(shù)據(jù)庫(kù)表格。如何對(duì)這些文檔進(jìn)行格式轉(zhuǎn)換形成結(jié)構(gòu)化的數(shù)據(jù)源是數(shù)據(jù)準(zhǔn)備的關(guān)鍵任務(wù),對(duì)于Web文檔需要內(nèi)容解析,對(duì)于圖像型文本文檔需要文字識(shí)別,對(duì)于語(yǔ)音信息需要語(yǔ)音識(shí)別,對(duì)于數(shù)據(jù)庫(kù)表格需要進(jìn)行模式映射。因此,信息抽取和自動(dòng)標(biāo)引兩項(xiàng)技術(shù)十分重要。

3.2 可視化數(shù)據(jù)空間

可視化數(shù)據(jù)空間是由需要進(jìn)行可視化展示的數(shù)據(jù)集合構(gòu)成的數(shù)據(jù)空間,是利用模式識(shí)別、數(shù)據(jù)挖掘、知識(shí)挖掘等技術(shù)對(duì)原始數(shù)據(jù)空間進(jìn)行處理形成的特征數(shù)據(jù)空間,具有一定的模式結(jié)構(gòu),能夠直接映射到視覺(jué)對(duì)象空間??梢暬瘮?shù)據(jù)空間中的樹(shù)狀和網(wǎng)狀的數(shù)據(jù)結(jié)構(gòu)在計(jì)算機(jī)中可以以數(shù)據(jù)表形式存儲(chǔ),可以以XML文檔格式存儲(chǔ),計(jì)算時(shí)轉(zhuǎn)換為鏈表結(jié)構(gòu)或向量矩陣。

3.3 視覺(jué)對(duì)象空間

視覺(jué)對(duì)象空間是由一組視覺(jué)對(duì)象及其屬性構(gòu)成的用戶界面,是利用布局算法、填充算法、交互算法及優(yōu)化算法對(duì)可視化數(shù)據(jù)空間進(jìn)行映射和渲染形成的,直接呈現(xiàn)給用戶供其查看和操作。視覺(jué)對(duì)象可以是各種具有交互功能的圖形,如空間樹(shù)Space Tree、樹(shù)映射Treemap、大腦theBrain概念圖等。常用的視覺(jué)屬性包括位置、形狀、方向、色彩、紋理、灰度等級(jí)和尺寸等。在數(shù)據(jù)映射時(shí),常常將可視化數(shù)據(jù)空間的數(shù)據(jù)關(guān)系映射為整體的視覺(jué)對(duì)象,將每個(gè)數(shù)據(jù)元素映射為視覺(jué)對(duì)象的某個(gè)屬性。

4 可視化繪制和可視化展示對(duì)知識(shí)轉(zhuǎn)化的影響

4.1 可視化繪制對(duì)知識(shí)轉(zhuǎn)化的影響

可視化繪制利用圖形關(guān)聯(lián)人類的認(rèn)知模式和計(jì)算機(jī)中知識(shí)的表示方式,能幫助隱性知識(shí)外化和顯性知識(shí)內(nèi)化的完成,其對(duì)知識(shí)轉(zhuǎn)化的影響體現(xiàn)在以下方面:

?組織復(fù)雜的知識(shí)結(jié)構(gòu)。利用可視化技術(shù)可以組織復(fù)雜的知識(shí)結(jié)構(gòu),在一幅圖片中能夠描述大量的知識(shí)內(nèi)容以及知識(shí)內(nèi)容之間的關(guān)系;同時(shí),通過(guò)圖形的鏈接功能還可以關(guān)聯(lián)與知識(shí)節(jié)點(diǎn)相關(guān)的知識(shí)資源,為人類認(rèn)知模式的形成提供豐富的營(yíng)養(yǎng)來(lái)源。

?促進(jìn)人員之問(wèn)的協(xié)作。可視化繪制為人員之間的協(xié)作提供了簡(jiǎn)捷、高效的交流平臺(tái),充分利用了人類發(fā)散性思維和形象思維的優(yōu)勢(shì),刺激人員提出更多的觀點(diǎn);同時(shí),能夠更為全面地揭示人員之間的認(rèn)知差異,消除知識(shí)表示中的誤解和曲解。

?增強(qiáng)知識(shí)吸收的能力。新認(rèn)知模式的形成不僅需要新知識(shí),也需要舊知識(shí)。一方面,新經(jīng)驗(yàn)以原來(lái)的經(jīng)驗(yàn)為基礎(chǔ);另一方面,新經(jīng)驗(yàn)的進(jìn)入又會(huì)使原有的經(jīng)驗(yàn)發(fā)生一定改變。通過(guò)繪制圖形,能夠更為清晰地認(rèn)識(shí)新舊認(rèn)知模式之間的差異,促進(jìn)新認(rèn)知模式的形成。

4.2 可視化展示對(duì)知識(shí)轉(zhuǎn)化的影響

可視化展示充分利用計(jì)算機(jī)強(qiáng)大處理能力,將抽象數(shù)據(jù)直觀化和形象化,改善知識(shí)挖掘和知識(shí)導(dǎo)航的效果,促進(jìn)顯性知識(shí)的組織和利用,其對(duì)知識(shí)轉(zhuǎn)化的影響主要體現(xiàn)以下方面:

?快速定位資源??梢暬故灸軌蚪沂局R(shí)庫(kù)中復(fù)雜的結(jié)構(gòu)關(guān)系,能夠展示查詢擴(kuò)展的結(jié)構(gòu)關(guān)系,能夠?qū)⑴c查詢相關(guān)的知識(shí)文檔的相關(guān)度直觀地顯示出來(lái),能夠推薦相關(guān)的知識(shí)資源,為知識(shí)資源定位提供多種快捷、直觀的入口和途徑。

?識(shí)別隱藏模式??梢暬故咎峁┝擞^察數(shù)據(jù)的多種視圖,包括修剪、檢索、過(guò)濾和縮放等。修剪是將數(shù)據(jù)集合中的數(shù)據(jù)進(jìn)行修改或刪除;檢索是指通過(guò)檢索的方式定位數(shù)據(jù)源、中間結(jié)果或結(jié)果數(shù)據(jù)中的某些數(shù)據(jù)元素或集合;過(guò)濾是通過(guò)設(shè)定參數(shù)去除不符合要求的數(shù)據(jù);縮放是為用戶提供比例縮放、放大/縮小、導(dǎo)航/細(xì)節(jié)等功能。豐富的數(shù)據(jù)觀察方式便于識(shí)別隱藏的模式。

第4篇

關(guān)鍵詞:車輛檢測(cè); 碰撞預(yù)警; 單目視覺(jué); 智能車輛

中圖分類號(hào):TN919-34; TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1004-373X(2011)20-0053-04

Vision-based Rear-end Collision Warning System in Car

LI Fei1, ZHAO Ming-hui2, Ye Qing2,Liu Zunyang2

(1. Key Laboratory of Atmospheric Composition and Optical Radiation, Anhui Institute of Optics and Fine Mechanics, CAS, Hefei 230031, China;

2. Hefei Tongzhi Technological Development Co., Ltd., Hefei 230037, China;

3. State Key Laboratory of Pulsed Power Laser Technology, Electronic Engineering Institute of PLA, Hefei 230037, China)

Abstract: Rear-end collision warning is an important research topic of intelligent vehicle vision navigation system. A monocular camera based rear-end collision warning system in car was developed, which can be applied to the structuralization road environment. The front road is identified by a new edge detection algorithm from images captured by camera.. The front cars are detected according to the characteristics such as shade of grey, edge and symmetry. The danger degree is judged according to the distance between cars. Acoustic and ocular warning signals are given to drivers. Experiment was conducted in highway around HeFei. The experimental results show that the system can meet the requirements of real-time for vehicle driving and can fulfill tasks of detection and warning.

Keywords: car detection; collision warning; monocular vision; intelligent vehicle

0 引 言

基于計(jì)算機(jī)視覺(jué)的高速公路防撞系統(tǒng)是當(dāng)前智能交通管理系統(tǒng)研究的熱點(diǎn)之一。如何在多變的環(huán)境下快速準(zhǔn)確地從視頻圖像里檢測(cè)到車道和前方車輛是實(shí)現(xiàn)這類系統(tǒng)面臨的最關(guān)鍵問(wèn)題。近20年來(lái),國(guó)內(nèi)外很多研究人員對(duì)這個(gè)問(wèn)題進(jìn)行了大量研究,提出了多種多樣的實(shí)用算法并成功開(kāi)發(fā)了一些視覺(jué)系統(tǒng)。這些系統(tǒng)所采用的算法基本上可以分為基于雙目視覺(jué)的方法、基于運(yùn)動(dòng)的方法、基于外形的方法和基于知識(shí)的方法?;陔p目立體視覺(jué)的方法計(jì)算量大,需要特殊硬件支持[1];基于運(yùn)動(dòng)的方法,無(wú)法檢測(cè)靜止目標(biāo)且實(shí)時(shí)性差[2];基于外形的方法,因建立有效的培訓(xùn)樣本仍然是需要研究的問(wèn)題[3];基于知識(shí)的方法,在障礙物數(shù)量較少時(shí)效率較高,但復(fù)雜環(huán)境下錯(cuò)誤率有所增加[4]。

針對(duì)常規(guī)算法的不足,本文設(shè)計(jì)了一種精度高,穩(wěn)定性好的基于單目視覺(jué)的車載追尾預(yù)警系統(tǒng)。它利用一種新的邊緣檢測(cè)算法識(shí)別前方道路,然后利用陰影檢測(cè)與跟蹤相結(jié)合的方法識(shí)別前方車輛,接下來(lái)根據(jù)前后車距判斷其威脅等級(jí),最終向駕駛員提供相應(yīng)的聲光報(bào)警信號(hào)。

1 系統(tǒng)工作原理

系統(tǒng)硬件部分包括MCC-4060型CCD攝像機(jī)、VT-121視頻采集卡、GPS、PC-104工控機(jī)和顯示終端。GPS通過(guò)串口向工控機(jī)發(fā)送本車車速信息,安裝在車內(nèi)擋風(fēng)玻璃后的CCD攝像機(jī)將圖像幀通過(guò)視頻采集卡送入工控機(jī),經(jīng)過(guò)軟件的處理分析后,在顯示終端上標(biāo)注出前車障礙物和道路標(biāo)線,同時(shí)根據(jù)車速、間距等判斷危險(xiǎn)等級(jí),發(fā)出相應(yīng)的聲光報(bào)警信號(hào);

系統(tǒng)的軟件部分包括道路檢測(cè)、道路跟蹤、車輛檢測(cè)、車輛跟蹤、測(cè)距、決策和報(bào)警等模塊。當(dāng)車速達(dá)到60 km/h時(shí),系統(tǒng)開(kāi)始處理實(shí)時(shí)采集到的圖像序列。對(duì)于每一幀圖像,首先檢測(cè)并跟蹤圖像中的車道白線,然后在車道確定的感興趣區(qū)域內(nèi)檢測(cè)車輛。如果存在疑似障礙車輛,則啟動(dòng)車輛跟蹤,利用跟蹤信息進(jìn)一步排除虛警。在實(shí)現(xiàn)對(duì)障礙車輛穩(wěn)定跟蹤后,估算出兩車間距和相對(duì)運(yùn)動(dòng)速度,判定其威脅等級(jí),并發(fā)出相應(yīng)的報(bào)警信號(hào)。

2 系統(tǒng)關(guān)鍵技術(shù)

2.1 道路檢測(cè)

目前,車道線檢測(cè)算法主要適用于光照充足的環(huán)境下。由于車道線與路面之間對(duì)比度大,因此很容易利用各種常規(guī)邊緣檢測(cè)算子獲得清晰的車道輪廓信息,然后選取合適的閾值對(duì)圖像進(jìn)行二值化處理,最后采用Hough變換識(shí)別車道線[5-7]。然而在復(fù)雜光照環(huán)境下,圖像會(huì)受到各種光線直射和物體多次反射形成雜散光的干擾,圖像光強(qiáng)不能反映車道本身突變性質(zhì),導(dǎo)致無(wú)法正確檢測(cè)出車道。

本系統(tǒng)采用了一種利用光密度差得到車道標(biāo)線與路面反射率差,進(jìn)而進(jìn)行非線性邊緣檢測(cè),再進(jìn)行Hough變換的車道檢測(cè)算法[8]。此算法可以有效解決在復(fù)雜光照條件下的車道檢測(cè),也可以用于夜間的車道檢測(cè)。

另外,目前車道線的跟蹤研究主要采用固定區(qū)域法或者Kalman濾波法,根據(jù)前一幀車道線檢測(cè)的結(jié)果來(lái)劃分感興趣區(qū)域,以實(shí)時(shí)跟蹤車道線[9-11]。然而,固定區(qū)域法對(duì)2幀圖像的相關(guān)性依賴大,劃分感興趣區(qū)域大,實(shí)時(shí)性差;而Kalman濾波法劃分感興趣區(qū)域小,容易產(chǎn)生檢測(cè)誤差,而造成跟蹤誤差累積,跟蹤正確率不高。因此,本系統(tǒng)在跟蹤車道線時(shí)采用了一種融合固定區(qū)域法和Kalman濾波法劃分感興趣區(qū)域的新方法[12]。

一般來(lái)說(shuō),只將車道邊界線交點(diǎn)(即滅點(diǎn))以下、2車道線之間的區(qū)域作為感興趣區(qū)域,考慮到跨道行駛的車輛依然對(duì)本車有威脅,算法把兩車道線分別向兩側(cè)平移40個(gè)像素,使感興趣區(qū)域擴(kuò)展到可以覆蓋跨道車輛的范圍。

2.2 車輛檢測(cè)

圖像中包含車輛前方很大視野內(nèi)的物體,如道路、樹(shù)木、護(hù)欄、標(biāo)牌以及其他車輛,要從中準(zhǔn)確檢測(cè)出前方車輛是一項(xiàng)困難的工作,而本文的車輛檢測(cè)模塊會(huì)根據(jù)圖像背景自動(dòng)改變?cè)O(shè)置參數(shù),以適應(yīng)不斷變化的道路場(chǎng)景和光照條件。

要實(shí)現(xiàn)車輛的快速檢測(cè),首先需要根據(jù)車輛的基本特征進(jìn)行初步檢測(cè),將所有可能的疑似車輛區(qū)域從圖像中提取出來(lái),然后再根據(jù)其他特征對(duì)疑似區(qū)域進(jìn)行篩選排除。

2.2.1 車輛初步檢測(cè)

初步檢測(cè)采用的特征是車輛陰影,即一塊位于目標(biāo)車輛底部、灰度值明顯比附近路面區(qū)域低的區(qū)域。在一般環(huán)境條件下,大部分車輛都具有這一顯著特征。

車輛初步檢測(cè)的流程如圖1所示。車輛陰影和車道一樣具有灰度突變的特點(diǎn),因此可以調(diào)用車道檢測(cè)算法對(duì)圖2(a)中的原始圖像做二值化處理,得到圖2(b)中的邊緣二值化圖像。同時(shí)還要對(duì)原始圖像進(jìn)行灰度二值化,得到圖2(c)中的灰度二值化圖像。為提高檢測(cè)實(shí)時(shí)性,以本車附近路面區(qū)域的平均灰度作為二值化閾值。由于邊緣二值化圖像和灰度二值化圖像都包括了車輛的下底邊,將這兩幅圖像進(jìn)行“或”運(yùn)算,就可以得到如圖2(d)所示的車輛陰影圖像。

在陰影圖像中由下至上逐行搜索,尋找連續(xù)陰影點(diǎn)超過(guò)一定閾值的線段,并以此線段為底邊劃出一個(gè)矩形區(qū)域作為疑似車輛區(qū)域。為保證疑似區(qū)域包含車輛整體,矩形的寬度比線段稍寬,高度由寬度按比例給出。為避免重復(fù)搜索,將已搜索到的疑似區(qū)域內(nèi)陰影完全抹去。由于同一車輛的各個(gè)部分可能分別被檢測(cè)為疑似目標(biāo),因此還需要對(duì)各個(gè)相交的疑似區(qū)域進(jìn)行合并。由于前方車輛的遮擋,可能會(huì)將多個(gè)目標(biāo)認(rèn)定為一個(gè)目標(biāo),但是對(duì)本車的安全無(wú)影響。

2.2.2 篩選驗(yàn)證

如果單純采用陰影特征進(jìn)行車輛檢測(cè),在保證較低“漏警”率的同時(shí),也造成了較高的“虛警”率,因此還需要對(duì)疑似區(qū)域進(jìn)行篩選和驗(yàn)證。

對(duì)于結(jié)構(gòu)化道路,車輛寬度與車道寬度的比值應(yīng)該是大致固定的,那么當(dāng)攝像機(jī)的焦距、俯仰角等參數(shù)固定后,圖像上車道寬度(像素?cái)?shù))與車輛寬度(像素?cái)?shù))也滿足這個(gè)比例。根據(jù)之前檢測(cè)的車道方程,就可以計(jì)算出感興趣區(qū)域內(nèi)任意縱坐標(biāo)上車輛圖像寬度的范圍,并剔除寬度不在此范圍內(nèi)的疑似區(qū)域。

在以往的車輛驗(yàn)證方法中,最常用的是對(duì)稱性測(cè)度驗(yàn)證[13]。這種算法的計(jì)算量較大,且對(duì)于背景復(fù)雜,對(duì)稱度差圖像的驗(yàn)證效果不盡人意。為了解決這個(gè)問(wèn)題,該系統(tǒng)采用了一種基于邊緣二值化圖像,通過(guò)搜索車輛左右邊緣進(jìn)行驗(yàn)證的算法。

假設(shè)疑似區(qū)域的寬度為W,區(qū)域左邊緣的坐標(biāo)為(X1,Y1),右邊緣的水平坐標(biāo)為(X2,Y2)。Фㄒ搴數(shù):

Иg(u)=∑u+1x=u-1∑Y1y=Y1-W/2f(x,y)И

式中:f(x,y)為(x,y)點(diǎn)的灰度值。在區(qū)間(X1-W/4,X1+W/4)內(nèi)搜索g(u)的最大值點(diǎn),該點(diǎn)對(duì)應(yīng)的水平坐標(biāo)X1′就是車輛的左邊緣坐標(biāo)。同理也可以搜索到車輛的右邊緣X2′。如果左右邊緣的g(u)值均大于某閾值,那么就可以認(rèn)定該車輛確實(shí)存在。實(shí)驗(yàn)證明,該算法能排除掉大量的“虛警”區(qū)域并得到真實(shí)車輛的兩側(cè)邊緣。

2.3 車輛跟蹤

現(xiàn)關(guān)心的是前方車輛與本車相對(duì)的二維位置和速度,因此只需要使用卡爾曼濾波器預(yù)測(cè)橫坐標(biāo)x、橫向速度Vx、縱坐標(biāo)y、縱向坐標(biāo)Vy這四個(gè)狀態(tài)向量。此外由于x方向和y方向的狀態(tài)向量沒(méi)有直接聯(lián)系,所以可以將其分為兩組分別處理。

在車輛行駛過(guò)程中,由于顛簸或遮擋等原因,系統(tǒng)可能會(huì)將路牌、灌木叢等物體誤認(rèn)為是車輛檢測(cè)出來(lái),產(chǎn)生虛警。而這些虛警物體往往只能在連續(xù)數(shù)幀圖像中存在。如果不采取措施,系統(tǒng)就會(huì)時(shí)常產(chǎn)生短促的報(bào)警。當(dāng)圖像采樣間隔足夠短時(shí),相鄰幀內(nèi)同一車輛的位置會(huì)具有很大的相關(guān)性。

系統(tǒng)采用檢測(cè)與跟蹤相結(jié)合的方法,根據(jù)第n幀圖像獲得的信息,預(yù)測(cè)車輛在第n+1幀圖像中的位置等信息,并與n+1幀圖像中實(shí)際檢測(cè)到的結(jié)果進(jìn)行比對(duì)。如果二者匹配度最大且超出一定值,則認(rèn)定為同一車輛,繼續(xù)進(jìn)行跟蹤、報(bào)警,否則認(rèn)為此車已被遮擋或消失,暫時(shí)不做處理,數(shù)幀后被剔除出去。

2.4 測(cè)距報(bào)警

車間測(cè)距通常采用幾何投影模型,采用了一種簡(jiǎn)化的車距模型公式L×W=C,其中L為兩車間距,單位為m;W為圖像上目標(biāo)車輛處車道寬度,單位為pixel;C為常數(shù),Э賞ü事先的標(biāo)定獲得[14]。然而兩車間安全車距S采用文獻(xiàn)[15]推導(dǎo)的臨界安全車距公式動(dòng)態(tài)得到。

ИS=0.36Vr+0.33Vb+Vr(2Vb-Vr)259(1)И

式中:Vr為相對(duì)車速,由對(duì)測(cè)出車距求導(dǎo)得到相對(duì)車速后進(jìn)行卡爾曼濾波得到;Vb為本車車速,вGPS得到。

如果告警頻率過(guò)高,容易使駕駛員麻痹大意,過(guò)低可能使駕駛員來(lái)不及做出反應(yīng),因此該系統(tǒng)采用由遠(yuǎn)至近的┤段報(bào)警。

若車距d≥1.5S,判定為3級(jí)威脅,發(fā)出長(zhǎng)而緩的報(bào)警聲,提醒駕駛員前方有障礙物,但暫無(wú)危險(xiǎn);若車距S≤d≤1.5S,判定為2級(jí)威脅,發(fā)出較急促的報(bào)警聲,提醒駕駛員減速;若車距d≤S,判定為1級(jí)威脅,發(fā)出短而急的報(bào)警聲,提醒駕駛員制動(dòng);3種狀態(tài)下的告警聲差異很大,駕駛員可以很容易地根據(jù)報(bào)警聲判斷威脅等級(jí)。

3 試驗(yàn)結(jié)果

系統(tǒng)框架及所有算法在Borland C++ Builder 6環(huán)境下編譯完成。為了驗(yàn)證系統(tǒng)算法的可靠性和實(shí)時(shí)性,利用在合肥市環(huán)城高速公路上采集不同車型、不同路段、不同環(huán)境光下多組道路圖像作為測(cè)試序列,進(jìn)行了大量實(shí)驗(yàn)。

圖3為典型道路場(chǎng)景下的實(shí)驗(yàn)結(jié)果,圖3(a)為大型卡車;(b)為小型面包車;(c)為遠(yuǎn)距離處;(d)為近距離處的檢測(cè)結(jié)果。系統(tǒng)將檢測(cè)到的目標(biāo)用黑框標(biāo)記出來(lái)。

圖3 典型道路場(chǎng)景實(shí)驗(yàn)結(jié)果

可以看出,系統(tǒng)能夠檢測(cè)到本車道內(nèi)不同距離上的各種車型車輛。在高速公路上的實(shí)驗(yàn)結(jié)果表明,在最大車速100 km/h的情況下,系統(tǒng)在Celeron M 600 MHz處理器上的處理速度為8 j/s左右,也就是說(shuō)處理一幀圖像的時(shí)間內(nèi)車輛行駛3~4 m,基本滿足實(shí)時(shí)報(bào)警的要求。在一般光照條件下,系統(tǒng)正常報(bào)警的縱向距離超過(guò)200 m,視場(chǎng)角遠(yuǎn)遠(yuǎn)大于雷達(dá)(一般為±7°)。

為了驗(yàn)證單目視覺(jué)測(cè)距準(zhǔn)確性,在市內(nèi)道路上采集了前車與本車距離從5~100 m的一組圖像。對(duì)采集的圖像進(jìn)行處理后,根據(jù)公式推導(dǎo)出本車與前車距離以及實(shí)際距離見(jiàn)表1。表中數(shù)據(jù)顯示,單目視覺(jué)測(cè)距的相對(duì)誤差都在5%以內(nèi),可以滿足實(shí)際工作中測(cè)距告警的需要。

4 結(jié) 語(yǔ)

本文設(shè)計(jì)了一個(gè)基于單目視覺(jué)的汽車追尾預(yù)警系統(tǒng)。該系統(tǒng)采用了一種基于光密度差的道路檢測(cè)算法,并使用了一種以車輛陰影檢測(cè)為主、左右邊緣檢測(cè)為輔的車輛探測(cè)方法,同時(shí)采用了簡(jiǎn)單、實(shí)用的測(cè)距和報(bào)警方法。高速公路上的實(shí)驗(yàn)結(jié)果證明了該系統(tǒng)的實(shí)時(shí)性、魯棒性和準(zhǔn)確性。

該系統(tǒng)目前還沒(méi)有在雨霧天氣或缺少照明的夜間環(huán)境下進(jìn)行試驗(yàn),未來(lái)我們將針對(duì)這些使用環(huán)境對(duì)系統(tǒng)做進(jìn)一步改進(jìn)和優(yōu)化。

參考文獻(xiàn)

[1]BERTOZZI M, BROGGI A. Gold: a parallel real-time stereo vision system for generic obstacle and lane detection \. IEEE Trans. on Image Processing, 1998, 7 (1): 62-81.

[2] BARRON J, FLEET D, BEAUCHEMIN S. Performance of optical flow techniques \. Computer Vision, 1994, 12(1): 43-77.

[3]SUN Z,BEBIS G,MILLER R. On-road vehicle detection using gabor filters and support vector machines \. IEEE Digital Signal Processing,2002,2: 1019-1022.

[4] MAROLA G.. Using symmetry for detecting and locating objects in a picture \. Computer Vision. Graphics. and Image Processing, 1989,46(2): 179-195.

[5]沈`,李舜酩,柏方超,等.結(jié)構(gòu)化道路中車道線的單目視覺(jué)檢測(cè)方法[J].儀器儀表學(xué)報(bào),2010,31(2):397-402.

[6] CHARBONNIER P, DIEBOLT F, GUILLARD Y, et al.Road markings recognition using image processing \//Proceedings of IEEE Conference on Intelligent Transportation System. Boston, MA: IEEE,1997: 912-917.

[7]BROGGI A. Robust real-time lane and road detection in critical shadow conditions \// Proceedings of IEEE International Symposium on Computer Vision, Coral Gables. Florida: IEEE,1995:353-359.

[8]葉慶,趙明輝,李菲,等.復(fù)雜環(huán)境下的夜間車道檢測(cè)研究[J].安徽大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32(6):44-47.

[9]周欣,黃席樾,樊友平,等.汽車智能輔助駕駛系統(tǒng)中的單目視覺(jué)導(dǎo)航技術(shù)[J].機(jī)器人,2003,25(4):289-295.

[10]REDMILL K A, UPADHYA S, KRISHNAMURTHY A. A Lane Tracking System for Intelligent vehicle applications \.IEEE, 2001:273-279.

[11]JEONG Seung Gweon. Real-time lane detection for autonomous navigation \// Proceedings of 2001 IEEE Intelligent Transportation Systems Conference. Oakland, CA: IEEE, 2001: 508-513.

[12]葉慶,趙明輝,李菲,等.夜間車道線檢測(cè)與跟蹤算法研究[J].現(xiàn)代電子技術(shù),2009,32(13):155-158.

[13]ZIELKE T, BRAUCKMANN M, SEELEN WV.Intensity and edge based symmetry detection with an application to car following \. CVGIP:Image Understanding, 1993, 58(2): 77-190.

[14]劉燕,劉浩學(xué).基于計(jì)算機(jī)視覺(jué)的單目攝影縱向車距測(cè)量系統(tǒng)研究[J].公路交通科技,2004,21(9):103-106.

第5篇

關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);視線追蹤;應(yīng)用

增強(qiáng)現(xiàn)實(shí)(Augmented Reality簡(jiǎn)稱AR)技術(shù)是近年來(lái)的一個(gè)研究熱點(diǎn),有著廣泛的應(yīng)用前景。它是對(duì)現(xiàn)實(shí)世界的補(bǔ)充,使得虛擬物體從感官上成為周圍真實(shí)環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(shí)(Virtual Reality簡(jiǎn)稱VR)不同,增強(qiáng)現(xiàn)實(shí)只是實(shí)現(xiàn)對(duì)現(xiàn)實(shí)環(huán)境的增強(qiáng),加深了對(duì)現(xiàn)實(shí)環(huán)境的感受。在實(shí)際的AR體驗(yàn)中,因?yàn)槿说挠^察視線會(huì)不斷地變化,AR系統(tǒng)需要實(shí)時(shí)的根據(jù)用戶的視場(chǎng)重新建立位置坐標(biāo)系,進(jìn)行追蹤。而視線追蹤技術(shù)就是實(shí)時(shí)地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來(lái)確定虛擬物體在真實(shí)空間坐標(biāo)中的位置,并將它實(shí)時(shí)地顯示在顯示器中的正確位置。

一、視線追蹤技術(shù)及其特點(diǎn)

(一)視線追蹤技術(shù)概述。

視線追蹤也稱為眼動(dòng)追蹤,它被認(rèn)為是研究視覺(jué)信息加工的有效手段。利用專用設(shè)備來(lái)記錄學(xué)習(xí)者的眼球運(yùn)動(dòng)(Eve-Movement,簡(jiǎn)稱眼動(dòng))情況,可以作為分析學(xué)習(xí)者內(nèi)部心理活動(dòng)情況的依據(jù)。關(guān)于視線追蹤技術(shù)的研究己有較長(zhǎng)歷史,目前它己在多個(gè)領(lǐng)域得到廣泛應(yīng)用。例如用于圖片廣告研究(網(wǎng)頁(yè)評(píng)估、設(shè)計(jì)評(píng)估等)、動(dòng)態(tài)分析(航空航天、體育運(yùn)動(dòng)、汽車、飛機(jī)駕駛等)、產(chǎn)品測(cè)試(可用性測(cè)試)、場(chǎng)景研究(商場(chǎng)購(gòu)物、店鋪裝演、家居環(huán)境等)和人機(jī)交互等多個(gè)領(lǐng)域。此外,視線追蹤在智能計(jì)算機(jī)、智能家電、虛擬現(xiàn)實(shí)和數(shù)字游戲等領(lǐng)域也有很好的應(yīng)用前景。

在眼動(dòng)實(shí)驗(yàn)研究中,當(dāng)被試對(duì)視覺(jué)信息進(jìn)行提取時(shí),其注視時(shí)間、注視次數(shù)、注視點(diǎn)序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過(guò)對(duì)被試在學(xué)習(xí)過(guò)程中的實(shí)時(shí)眼動(dòng)信息進(jìn)行觀測(cè),可用于分析和引導(dǎo)其學(xué)習(xí)的依據(jù)。眼動(dòng)模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運(yùn)動(dòng)(pursuit movement)。其中,持續(xù)一段時(shí)間、相對(duì)穩(wěn)定的眼球運(yùn)動(dòng)稱為注視;眼球快速運(yùn)動(dòng)時(shí)導(dǎo)致視覺(jué)區(qū)域的聚焦點(diǎn)產(chǎn)生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個(gè)緩慢運(yùn)動(dòng)的目標(biāo),則稱為追隨運(yùn)動(dòng)。通過(guò)分析眼動(dòng)模式和相關(guān)參數(shù),可以獲得很多重要的信息。例如,眼跳速度會(huì)隨著疲倦程度的增加而降低,而隨著學(xué)習(xí)任務(wù)難度的增加而增加;眨眼速度和眼睛睜開(kāi)程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來(lái)確定學(xué)習(xí)者的學(xué)習(xí)精神狀態(tài),或?qū)ζ鋵W(xué)習(xí)過(guò)程進(jìn)行分析,從而采取相應(yīng)的學(xué)習(xí)策略或干預(yù)措施。

(二)視線追蹤系統(tǒng)的類型及其特點(diǎn)。

人眼的注視點(diǎn)主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點(diǎn)的精確位置。國(guó)內(nèi)外將視覺(jué)跟蹤技術(shù)按照借助的媒介分為硬件和軟件兩種。以硬件為基礎(chǔ)的視線跟蹤的基本工作原理是利用圖像處理技術(shù),通過(guò)攝像機(jī)攝入瞳孔反射的紅外線記錄視線變化,達(dá)到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機(jī),這種情形用戶使用較不舒適。通過(guò)軟件實(shí)現(xiàn)的視線跟蹤方法,對(duì)用戶沒(méi)有干擾,首先利用攝像機(jī)獲取頭部、臉部或眼睛圖像,再經(jīng)過(guò)軟件分析對(duì)視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。

人與計(jì)算機(jī)交互是研究人與計(jì)算機(jī)之間溝通的技術(shù),將視線跟蹤、語(yǔ)音識(shí)別、手勢(shì)輸入、感覺(jué)反饋等引入人機(jī)交互,提高了交互的自然性和高效性。視線追蹤技術(shù)同樣引發(fā)了人機(jī)交互系統(tǒng)的改革,鼠標(biāo)、觸控板的消失,及通過(guò)追蹤人眼視線,用眼神來(lái)操作電腦、輸入文字、玩游戲。

二、視線追蹤技術(shù)在AR增強(qiáng)現(xiàn)實(shí)研究中的應(yīng)用

(一)顯示技術(shù)。

AR的簡(jiǎn)單定義就是將計(jì)算機(jī)生成的虛擬數(shù)字信息疊加到現(xiàn)實(shí)的生活場(chǎng)景中。這個(gè)“疊加”是需要通過(guò)顯示設(shè)備作為中介來(lái)實(shí)現(xiàn)。

增強(qiáng)現(xiàn)實(shí)系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設(shè)備。目前,一般的增強(qiáng)現(xiàn)實(shí)系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個(gè)基本環(huán)節(jié)構(gòu)成:虛擬信息顯示通道、真實(shí)環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實(shí)系統(tǒng)所用的浸沒(méi)式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據(jù)其中真實(shí)環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學(xué)原理的光學(xué)透視式頭盔顯示器兩類。

光W透視技術(shù)是通過(guò)安裝在設(shè)備眼前的光學(xué)透鏡來(lái)呈現(xiàn)出真實(shí)和虛擬世界。首先計(jì)算機(jī)生成的虛擬信息經(jīng)過(guò)光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過(guò)透鏡又能直接看到現(xiàn)實(shí)場(chǎng)景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實(shí)現(xiàn)AR的效果。視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來(lái)捕捉獲取外部真實(shí)環(huán)境,計(jì)算機(jī)將數(shù)字模擬信息疊加到攝像機(jī)的視頻信號(hào)上,再將真實(shí)場(chǎng)景和虛擬場(chǎng)景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場(chǎng)更大,而且不受外界的強(qiáng)光干擾。不過(guò)一旦攝像機(jī)與用戶的視點(diǎn)不能保持完全重合,會(huì)產(chǎn)生一些偏差。

(二)跟蹤注冊(cè)技術(shù)。

基于計(jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)主要是指利用計(jì)算機(jī)視覺(jué)獲取真實(shí)場(chǎng)景的信息后,經(jīng)過(guò)圖像處理方面的知識(shí)來(lái)識(shí)別和跟蹤定位真實(shí)場(chǎng)景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊(cè)算法和基于自然特征點(diǎn)無(wú)標(biāo)志注冊(cè)算法?;谟?jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)的精度較高,但是對(duì)計(jì)算量非常大,而且算法復(fù)雜,對(duì)系統(tǒng)的要求非常高。

為了取長(zhǎng)補(bǔ)短,得到更加精確的注冊(cè)結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊(cè)方法。通常是先由跟蹤傳感器大概估計(jì)位置姿態(tài),再通過(guò)視覺(jué)法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺(jué)與電磁跟蹤結(jié)合、視覺(jué)與慣導(dǎo)跟蹤結(jié)合、視覺(jué)與GPS跟蹤結(jié)合等。

三、結(jié)論

在國(guó)外,增強(qiáng)現(xiàn)實(shí)早已在醫(yī)學(xué)、遙操作、制造與維修、可視化與教育培訓(xùn)、娛樂(lè)、軍事訓(xùn)練等領(lǐng)域取得了成功應(yīng)用。在國(guó)內(nèi),不少單位和個(gè)人對(duì)增強(qiáng)現(xiàn)實(shí)中的關(guān)鍵技術(shù)和算法進(jìn)行了研究,并且以牙科醫(yī)學(xué)、設(shè)備維修等許多背景得到了初步應(yīng)用研究。但國(guó)內(nèi)的研究目前仍多限于實(shí)驗(yàn)階段,與國(guó)外的應(yīng)用水平還有一定距離。

目前,隨著增強(qiáng)現(xiàn)實(shí)的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實(shí)感圖形繪制、調(diào)節(jié)現(xiàn)實(shí)、基于網(wǎng)絡(luò)的增強(qiáng)現(xiàn)實(shí)和針對(duì)戶外隨身增強(qiáng)現(xiàn)實(shí)系統(tǒng)的技術(shù)等等。其中涉及到的技術(shù)包括基于圖像的繪制(IBMR)、多通道信息融合、普適計(jì)算技術(shù)、顯示設(shè)備和跟蹤設(shè)備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過(guò)程的簡(jiǎn)化和設(shè)備成本的降低,增強(qiáng)現(xiàn)實(shí)會(huì)在越來(lái)越多的領(lǐng)域得到廣泛應(yīng)用。

參考文獻(xiàn):

[1]奚惠寧等.視線追蹤應(yīng)用技術(shù)的專利分析[J].電視技術(shù),2013(S2)。

第6篇

【關(guān)鍵詞】自動(dòng)分級(jí);機(jī)器視覺(jué);支持向量機(jī)

一、概述

烤煙是卷煙工業(yè)的原料,其煙葉質(zhì)量的好壞直接關(guān)系到煙草制品的工藝配方和生產(chǎn)質(zhì)量。烤煙煙葉分級(jí)方法是目前評(píng)判煙葉質(zhì)量的主要手段,其分級(jí)判斷的依據(jù)主要是煙葉的外觀特征,如顏色、長(zhǎng)度、厚度、油分、成熟度,殘損等。目前國(guó)內(nèi)外煙草行業(yè)對(duì)煙葉的分級(jí)和檢驗(yàn)都是依據(jù)分級(jí)標(biāo)準(zhǔn),以人工操作為主,憑借標(biāo)準(zhǔn)樣本依靠人的感官進(jìn)行的。這種傳統(tǒng)的人工檢驗(yàn)方法容易受人的因素影響,評(píng)級(jí)定價(jià)難以做到公平、公正。而且在我國(guó),每年煙葉收購(gòu)前,全國(guó)各地都會(huì)舉辦培訓(xùn)班,培訓(xùn)分級(jí)人員,并準(zhǔn)備大量的樣本發(fā)往各地,這樣必然造成人力、物力和財(cái)力的巨大消耗。機(jī)器視覺(jué)技術(shù)的發(fā)展和國(guó)家煙葉等級(jí)標(biāo)準(zhǔn)的定量化促進(jìn)了煙葉分級(jí)自動(dòng)化和智能化的應(yīng)用與發(fā)展,各種圖像處理算法和模式識(shí)別方法也被應(yīng)用于煙葉的自動(dòng)分級(jí)中,如2003年,張惠民等人根據(jù)提取的煙葉特征參數(shù),建立并優(yōu)化了烤煙煙葉分級(jí)系統(tǒng)的數(shù)學(xué)模型,構(gòu)造了符合烤煙煙葉等級(jí)空間分布的高斯隸屬函數(shù),采用模糊推理機(jī)制原理來(lái)實(shí)現(xiàn)煙葉分級(jí)。2011年,張樂(lè)明、劉劍君等以紅外光譜作為煙葉的特征,采用概率神經(jīng)網(wǎng)絡(luò)對(duì)11個(gè)等級(jí)的煙葉進(jìn)行分組和分級(jí)。

二、支持向量機(jī)基本原理

支持向量機(jī)(Support Vector Machine)簡(jiǎn)稱SVM,是由Vapnik于1995年一種新的機(jī)器學(xué)習(xí)技術(shù)。支持向量機(jī)方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性(即對(duì)特定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(即無(wú)錯(cuò)誤的識(shí)別任意樣本的能力)之間尋求最佳折中,以期獲得最好的推廣能力。

1.最優(yōu)分類面。SVM方法是從線性可分情況下的最優(yōu)分類面提出的。首先考慮二維兩類線性可分的情況,如圖1所示,圖中實(shí)心點(diǎn)和空心點(diǎn)分別表示兩類訓(xùn)練樣本,H為把兩類沒(méi)有錯(cuò)誤地分開(kāi)的分類線,H1、H2分別為各類樣本中離分類線最近的點(diǎn)且平行于分類線的直線。所謂最優(yōu)分類線就是要求分類線不但能將兩類無(wú)錯(cuò)誤地分開(kāi),而且要使兩類的分類間隔最大。

三、實(shí)驗(yàn)結(jié)果及分析

本文首先利用利用圖像采集裝置得到煙葉的原始圖像作為樣本并對(duì)煙葉圖像進(jìn)行了圖像預(yù)處理。然后根據(jù)煙葉的顏色、外形、紋理特征建立了煙葉分級(jí)的支持向量機(jī)識(shí)別模型;最后利用部分樣本進(jìn)行檢驗(yàn)。實(shí)驗(yàn)中樣本得到了較高的識(shí)別率。實(shí)驗(yàn)結(jié)果說(shuō)明了SVM分類器算法能夠較好地完成樣品集的分類,它是在基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論之上構(gòu)建最優(yōu)分割超平面,使得分類器能夠得到全局最優(yōu)化,并且在整個(gè)樣本空間的期望風(fēng)險(xiǎn)以某個(gè)概率滿足一定上界,在實(shí)際應(yīng)用中有較好的優(yōu)勢(shì)。

四、結(jié)論

支持向量機(jī)是是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的一種新型的機(jī)器學(xué)習(xí)方法。作為一種尚未成熟的技術(shù),支持向量機(jī)盡管在核函數(shù)的參數(shù)的構(gòu)造和選擇上缺乏相應(yīng)的理論指導(dǎo),但是由于它在解決小樣本學(xué)習(xí)問(wèn)題中的優(yōu)勢(shì),使其成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn),并且被廣泛地應(yīng)用于各行各業(yè)。本文將支持向量機(jī)的方法運(yùn)用于煙葉的自動(dòng)分級(jí)系統(tǒng)。取得了較好的分類效果。

參 考 文 獻(xiàn)

[1]閻瑞瓊,韓立群,陳晉東.計(jì)算機(jī)技術(shù)在煙葉檢測(cè)與分級(jí)領(lǐng)域的應(yīng)用[J].煙草科技.2001,154(3):13~15

[2]張惠民,韓立群,段正剛.基于圖像特征的煙葉分級(jí)[J].武漢大學(xué)學(xué)報(bào).2003(3)

[3]張樂(lè)明,申金媛,劉劍君,劉潤(rùn)杰.概率神經(jīng)網(wǎng)絡(luò)在煙葉自動(dòng)分級(jí)中的應(yīng)用[J].農(nóng)機(jī)化研究.2011(12)

第7篇

關(guān)鍵詞: 虛擬現(xiàn)實(shí); 雙目視差; 近距顯示; 視覺(jué)舒適度

中圖分類號(hào): TN27?34; TM417 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)01?0140?05

Abstract: The virtual reality technology developed rapidly, and has been widely used in many fields, but the traditional CAVE system is difficult to promote and popularize due to the large floor space, high cost and difficult installation and adjustment, therefore, the research and development of the portable CAVE system has great significance to the popularization and development of the virtual reality technology. According to the features of the portable CAVE system, the visual optical system was designed, the distortion correction of the projected image and random dot stereogram generation algorithm are studied, and the close range stereoscopic display system based on visual optical system adjustment was built. The subjective evaluation experiment of the visual comfort degree was designed and implemented to explore the relationship between the visual fatigue degree and parallax caused by the close range display. The visual comfort degree of the stereoscopic display system based on visual optical system was assessed. This technology provides a reference foundation for the study of the portable CAVE system, and has a certain practical significance to the development of the virtual reality technology and the study of the stereoscopic visual comfort degree.

Keywords: virtual reality; binocular disparity; close range display; visual comfort degree

0 引 言

近年恚虛擬現(xiàn)實(shí)技術(shù)發(fā)展迅速,已經(jīng)被廣泛應(yīng)用于軍事訓(xùn)練、醫(yī)學(xué)實(shí)習(xí)、娛樂(lè)游戲等諸多領(lǐng)域。傳統(tǒng)的虛擬現(xiàn)實(shí)顯示系統(tǒng)雖然技術(shù)成熟,但存在一些弊端,因此便攜式CAVE系統(tǒng)的概念應(yīng)運(yùn)而生。本文搭建了近距立體顯示原型系統(tǒng),通過(guò)主觀實(shí)驗(yàn),探究了便攜式CAVE系統(tǒng)中雙目視差的感知深度和單眼聚焦感知深度的差異,以及用戶可接受的視覺(jué)舒適范圍,對(duì)基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺(jué)舒適度進(jìn)行評(píng)估。

1 立體視覺(jué)舒適度的評(píng)估方法

1.1 刺激方法的選擇

為了避免視差的時(shí)間積累效應(yīng),實(shí)驗(yàn)采用雙刺激連續(xù)分級(jí)法。為控制實(shí)驗(yàn)過(guò)程中產(chǎn)生的習(xí)慣誤差,不同視差的立體圖按照隨機(jī)序列交替呈現(xiàn),且各視差出現(xiàn)的次數(shù)相等,整個(gè)序列中在前在后的機(jī)會(huì)相等。

實(shí)驗(yàn)的具體刺激方法是:將波紋中心在零視差處的刺激物記為基準(zhǔn)圖波紋中心在其他位置的刺激物記為待評(píng)估圖每次施測(cè)依次顯示三個(gè)刺激物,其順序?yàn)榛蛘咂淠康氖菑?qiáng)迫用戶改變雙眼的輻輳角度。每個(gè)刺激物顯示1.5 s,三個(gè)刺激物共顯示4.5 s,不同視差的待評(píng)估圖像隨機(jī)出現(xiàn)。被試者要獨(dú)立地進(jìn)行觀測(cè),選出其中一個(gè)與其他兩個(gè)波動(dòng)方向不同的刺激物,并對(duì)該過(guò)程的視覺(jué)舒適度進(jìn)行主觀評(píng)分。同一組圖像需隨機(jī)顯示兩次以便對(duì)評(píng)分結(jié)果進(jìn)行一致性檢查。

1.2 反應(yīng)指標(biāo)的選擇

反應(yīng)指標(biāo)的選擇應(yīng)依據(jù)以下原則:

(1) 無(wú)害性。所選取的反應(yīng)指標(biāo)不應(yīng)對(duì)被試者產(chǎn)生身體傷害,同時(shí)不能對(duì)被試者產(chǎn)生負(fù)面心理影響,阻礙實(shí)驗(yàn)的繼續(xù)進(jìn)行。

(2) 無(wú)干擾性。所選取的反應(yīng)指標(biāo)在測(cè)量過(guò)程中不能干擾被試者正常觀看圖像。

(3) 敏感性。所選反應(yīng)指標(biāo)應(yīng)該能夠有效地反應(yīng)出視覺(jué)舒適度和視覺(jué)疲勞程度。

根據(jù)分析,實(shí)驗(yàn)主要采用主觀評(píng)估方法對(duì)視覺(jué)舒適度進(jìn)行研究。主觀評(píng)價(jià)方法更適用于對(duì)視覺(jué)舒適度進(jìn)行綜合評(píng)價(jià)。舒適度的主觀評(píng)價(jià)方法[1]主要是讓被試者在觀看立體圖像前后根據(jù)自身的視覺(jué)狀況填寫(xiě)問(wèn)卷,并對(duì)問(wèn)卷的結(jié)果進(jìn)行統(tǒng)計(jì)分析。

1.3 主觀量表設(shè)計(jì)方法

主觀量是指用戶對(duì)客觀刺激產(chǎn)生的主觀度量,又稱心理量[2]。在視覺(jué)實(shí)驗(yàn)中,主觀評(píng)估方法需對(duì)被試者心理量進(jìn)行測(cè)量。主觀實(shí)驗(yàn)中的心理度量表主要包括:強(qiáng)迫選擇度量表、圖示度量表和數(shù)值度量表。

(1) 強(qiáng)迫選擇度量表。強(qiáng)迫選擇度量表是在主觀評(píng)估實(shí)驗(yàn)時(shí)主試者提供一些對(duì)立相反的詞語(yǔ)讓被試者做出選擇。強(qiáng)迫選擇度量表可以避免被試者受到他人的影響,但可能會(huì)使被試者產(chǎn)生抵觸情緒,因?yàn)榇蠖鄶?shù)人不愿意讓自己處于兩難選擇的境地。

(2) 圖示度量表。圖示度量表好比一個(gè)溫度計(jì),通常用一條直線表示,直線兩端具有相反程度的詞語(yǔ)。這條直線可以是水平的,也可以是垂直的。實(shí)驗(yàn)中被試者需在直線上做標(biāo)記,實(shí)驗(yàn)后主試者用標(biāo)尺對(duì)標(biāo)記進(jìn)行度量,將它轉(zhuǎn)換成數(shù)字并進(jìn)行統(tǒng)計(jì)。圖示度量表的數(shù)據(jù)統(tǒng)計(jì)工作較為復(fù)雜和繁瑣,本文實(shí)驗(yàn)的數(shù)據(jù)量巨大,因此圖示度量表并不適用。

(3) 數(shù)值度量表。在數(shù)值度量表中,被試者根據(jù)事先定義的數(shù)字等級(jí)進(jìn)行評(píng)定,一般為7級(jí)評(píng)分或5級(jí)評(píng)分。在視覺(jué)舒適度研究中,可設(shè)計(jì)度量表如下:非常舒適、舒適、一般、不舒適、非常不舒適。設(shè)定等級(jí)分值時(shí)可以考慮“非常不舒適”為-2分,“不舒適”為-1分,“一般”為0分,“舒適”為1分,“非常舒適”為2分;也可以考慮“非常不舒適”為1分,“不舒適”為2分,“一般”為3分,“舒適”為4分,“非常舒適”為5分。通常情況下不管哪種處理和分析得到的結(jié)果是等效的。

本文實(shí)驗(yàn)為了使被試者容易理解,考慮一般人的思維模式,將數(shù)值度量表等級(jí)設(shè)計(jì)為:“非常舒適”為1分,“舒適”為2分,“一般”為3分,“不舒適”為4分,“極不舒適”為5分。舒適度量表如表1所示。

2 近距立體顯示實(shí)驗(yàn)系統(tǒng)

2.1 目視光學(xué)系統(tǒng)

在便攜式CAVE系統(tǒng)中,需要利用目視光學(xué)系統(tǒng)調(diào)節(jié)用戶眼睛的調(diào)節(jié)距離,使人眼不再聚焦于屏幕上。本文實(shí)驗(yàn)的目的是研究經(jīng)過(guò)目視光學(xué)系統(tǒng)調(diào)節(jié)后的單眼調(diào)節(jié)距離和雙眼輻輳距離的差異對(duì)用戶視覺(jué)舒適度的影響。實(shí)驗(yàn)中需通過(guò)改變目視光學(xué)系統(tǒng)的屈光度來(lái)改變被試者單眼的調(diào)節(jié)距離。考慮到人眼作為自然界的最高級(jí)光學(xué)接收系統(tǒng),具有極強(qiáng)的自我適應(yīng)和調(diào)節(jié)能力,因此,本系統(tǒng)選用單片式目鏡即可滿足基本的成像要求。

2.2 隨機(jī)點(diǎn)立體圖的生成

隨機(jī)點(diǎn)立體圖像對(duì)的生成算法如下:

設(shè)基面為視差面為

(1) 將基面沿縱方向均分成塊,左邊第一塊區(qū)域?yàn)樵紖^(qū),其余各塊區(qū)域均為重復(fù)區(qū)域。重復(fù)間距為d必須小于瞳距。

(2) 在原始區(qū)內(nèi)畫(huà)一個(gè)隨機(jī)點(diǎn)

(3) 令得到一新的點(diǎn)如果點(diǎn)在面內(nèi),則令如果點(diǎn)不在面內(nèi),則令然后在處畫(huà)出這個(gè)新點(diǎn)。

(4) 重復(fù)上述步驟(2)、步驟(3),直到圖面上布滿適當(dāng)密度的隨機(jī)點(diǎn)為止。

2.3 投影圖像的畸變矯正

本系統(tǒng)應(yīng)采用側(cè)投影的方式,在這種情況下投影圖像會(huì)產(chǎn)生畸變,應(yīng)進(jìn)行投影圖像的畸變矯正。進(jìn)行投影圖像的畸變矯正的模型是將真實(shí)投影機(jī)的投影圖像變換為虛擬投影機(jī)的投影圖像,從而恢復(fù)原始圖像[5]。其基本過(guò)程是:根據(jù)透視變換原理,先計(jì)算出投影機(jī)圖像平面到投影平面的單映矩陣,再將投影機(jī)圖像平面上的所有像素點(diǎn)乘以這個(gè)單映矩陣后進(jìn)行顯示,那么屏幕上獲得的圖像就是校正后的圖像。

3 近距立體顯示系統(tǒng)的舒適度評(píng)估實(shí)驗(yàn)

3.1 實(shí)驗(yàn)?zāi)康募霸?/p>

本實(shí)驗(yàn)的主要目的是研究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的近距立體顯示系統(tǒng)中單眼感知深度(調(diào)節(jié)距離)和雙眼感知深度(輻輳距離)[5]的差異對(duì)用戶視覺(jué)舒適度的影響。

由式(8)可知,當(dāng)眼睛到屏幕的距離和瞳距一定時(shí),通過(guò)改變立體圖像對(duì)的水平視差可以改變被試者的雙眼感知深度(輻輳距離)。

3.2 被試者篩選及培訓(xùn)

篩選工具:數(shù)字化立體視覺(jué)檢查圖(立體視覺(jué)檢查卡、立體視銳度檢查卡)、瞳距測(cè)量尺。

本實(shí)驗(yàn)被試者的篩選流程如下:

第一步:詢問(wèn)被試者眼部的健康狀況、有無(wú)色盲、是否做過(guò)眼部手術(shù)、是否有眼部病史,如結(jié)膜炎、眼眶骨折等,篩選出眼睛健康且無(wú)病史的被試者。

第二步:進(jìn)行立體視覺(jué)測(cè)試,檢查被試者的雙目立體視覺(jué)是否正常,排除立體盲。

第三步:對(duì)立體視覺(jué)正常的被試者進(jìn)行立體視銳度測(cè)試,篩選出立體視銳度小于60 arcmin的被試者。

第四步:對(duì)被試者的年齡、性別、視力、瞳距、有無(wú)主觀實(shí)驗(yàn)經(jīng)驗(yàn)、是否從事立體視覺(jué)相關(guān)工作等基本信息進(jìn)行記錄[6]。

榱吮苊獗皇哉哂捎誆皇煜な笛榱鞒毯筒僮鞴程而影響實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,實(shí)驗(yàn)前需對(duì)被試者進(jìn)行相關(guān)培訓(xùn)和模擬練習(xí)。

首先,采用無(wú)偏向性的語(yǔ)氣向被試者講解實(shí)驗(yàn)?zāi)康?、評(píng)價(jià)類型、評(píng)價(jià)等級(jí)和時(shí)間限制等內(nèi)容,使被試者正確透徹地理解評(píng)判標(biāo)準(zhǔn),并向被試者展示舒適度明顯不同的若干立體圖像示例。

然后,讓被試者進(jìn)行模擬練習(xí),模擬練習(xí)的內(nèi)容與正式的實(shí)驗(yàn)過(guò)程類似。被試者連續(xù)觀看三組立體圖像后,用選擇器輸入差異圖像的編號(hào)并對(duì)該組立體圖像引起的視疲勞程度進(jìn)行評(píng)分,練習(xí)時(shí)間為3 min。

培訓(xùn)完成后,被試者即可進(jìn)行正式的主觀視覺(jué)舒適度評(píng)價(jià)實(shí)驗(yàn)。

3.3 實(shí)驗(yàn)過(guò)程

實(shí)驗(yàn)1:探究近距顯示引起的視覺(jué)疲勞與視差的關(guān)系

被試者佩戴屈光度為0的目視光學(xué)系統(tǒng),在距離屏幕0.6 m的位置觀察隨機(jī)出現(xiàn)的立體圖像,并進(jìn)行視覺(jué)任務(wù)測(cè)試和主觀舒適度評(píng)分。實(shí)驗(yàn)1設(shè)定刺激物的中心到被試者的距離(輻輳距離)分別為0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,3.75 m,且隨機(jī)出現(xiàn)。調(diào)節(jié)距離為0.6 m。

實(shí)驗(yàn)1共進(jìn)行36組小測(cè)試。每組測(cè)試會(huì)連續(xù)出現(xiàn)3幅立體圖像,被試者雙眼融像[7]后,可看到立體圖像出現(xiàn)正弦波紋的效果,被試者需選出一個(gè)與其他兩個(gè)正弦波動(dòng)方向不同的立體圖像,利用選擇器將它的編號(hào)輸入到主機(jī)系統(tǒng)中。然后對(duì)該組小測(cè)試產(chǎn)生的視覺(jué)疲勞癥狀進(jìn)行主觀評(píng)分。

時(shí)間安排及流程:三種位置(1,2,3)×6種輻輳距離(0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,3.75 m)×2種顯示序列(B?Xi?B或Xi?B?Xi)=36次施測(cè),每次施測(cè)時(shí)間為1 min×36次=36 min。

實(shí)驗(yàn)2:探究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體視覺(jué)舒適度

被試者隨機(jī)佩戴屈光度分別為的目視光學(xué)系統(tǒng),在距離屏幕0.6 m的位置依次進(jìn)行3個(gè)亞組的實(shí)驗(yàn),實(shí)驗(yàn)2中設(shè)定刺激物的中心到被試者的距離(輻輳距離)分別為0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,且隨機(jī)出現(xiàn)。人眼的調(diào)節(jié)距離分別為1.09 m,1.50 m,2.40 m。

實(shí)驗(yàn)2中每個(gè)亞組各進(jìn)行30組小測(cè)試。每組測(cè)試會(huì)連續(xù)出現(xiàn)3幅立體圖像,被試者雙眼融像后,可以看到立體圖像出現(xiàn)正弦波紋的效果,被試者需選出一個(gè)與其他兩個(gè)正弦波動(dòng)方向不同的立體圖像,利用選擇器將它的編號(hào)輸入主機(jī)中,然后對(duì)該組小測(cè)試產(chǎn)生的視覺(jué)疲勞癥狀進(jìn)行主觀評(píng)分。

時(shí)間安排及流程:3種透鏡度數(shù)×3種位置(1,2,3)×5種輻輳距離(0.79 m,0.94 m,1.15 m,1.50 m,2.14 m)×2種顯示序列(B?Xi?B或Xi?B?Xi)=90次施測(cè),每次施測(cè)調(diào)節(jié)時(shí)間為1 min×90+15 min間隔休息×2=120 min。

3.4 實(shí)驗(yàn)結(jié)果分析

(1) 近距顯示引起的視覺(jué)疲勞與視差絕對(duì)值[8]呈正相關(guān)

將實(shí)驗(yàn)1中24個(gè)被試者的舒適度主觀評(píng)分根據(jù)不同的輻輳距離進(jìn)行均值統(tǒng)計(jì)。當(dāng)視差取絕對(duì)值時(shí),視差絕對(duì)值和視覺(jué)舒適度主觀評(píng)分值經(jīng)過(guò)線性擬合后得到兩者的關(guān)系模型為:

視差絕對(duì)值和視覺(jué)舒適度主觀評(píng)分值的線性相關(guān)度為具體見(jiàn)圖2。實(shí)驗(yàn)結(jié)果表明,視覺(jué)舒適度的主觀評(píng)分與視差值呈線性關(guān)系,也就是說(shuō),對(duì)于近距立體顯示單眼聚焦和雙眼輻輳的不一致性所引起的視覺(jué)疲勞與立體視差值成正比關(guān)系。單眼聚焦和雙眼輻輳的差異越大,產(chǎn)生的視疲勞程度越大,這個(gè)結(jié)果與大部分研究結(jié)果相一致。

(2) 主觀舒適度與理論值的符合度基本一致

將實(shí)驗(yàn)2中24個(gè)被試者的視覺(jué)舒適度主觀評(píng)分根據(jù)不同的輻輳距離和調(diào)節(jié)距離進(jìn)行均值統(tǒng)計(jì),并將每個(gè)亞組的理論舒適度和實(shí)驗(yàn)獲得的主觀舒適度進(jìn)行比較。

目視光學(xué)系統(tǒng)的屈光度為0.75D,1.00D,1.25D的實(shí)驗(yàn)結(jié)果,如圖3~圖5所示。

實(shí)驗(yàn)結(jié)果表明,當(dāng)調(diào)節(jié)距離一定時(shí),分別為1.09 m,1.5 m,2.4 m,由輻輳距離的改變引起的視疲勞癥狀與理論計(jì)算得到的結(jié)果在總趨勢(shì)上大體一致。在基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中,輻輳距離越小,符合度越好。在相同視差條件下,經(jīng)過(guò)目視光學(xué)系統(tǒng)調(diào)節(jié)后產(chǎn)生更大的不適感。

(3) 視差舒適度曲線

將實(shí)驗(yàn)2中三個(gè)亞組的所有情況的視差值與主觀舒適度評(píng)分進(jìn)行綜合統(tǒng)計(jì),繪制舒適度曲線如圖6所示。

實(shí)驗(yàn)結(jié)果表明,基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中,視差絕對(duì)值越小,視覺(jué)舒適度越高。在同等視差條件下,非交叉視差的舒適度優(yōu)于交叉視差。與傳統(tǒng)立體顯示設(shè)備相比,舒適視域向非交叉視差方向偏移。

4 結(jié) 論

本文在充分了解雙目立體視覺(jué)原理、視差型立體顯示技術(shù)原理、立體顯示引起視覺(jué)疲勞的根本原因等理論知識(shí)的基礎(chǔ)上,搭建近距虛擬現(xiàn)實(shí)顯示系統(tǒng)原型作為實(shí)驗(yàn)系統(tǒng),設(shè)計(jì)實(shí)驗(yàn)研究了基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺(jué)舒適度問(wèn)題。對(duì)虛擬現(xiàn)實(shí)技術(shù)的發(fā)展和立體視覺(jué)舒適度的研究具有一定的實(shí)際意義。

參考文獻(xiàn)

[1] 張英靜,李素梅,衛(wèi)津津,等.立體圖像質(zhì)量的主觀評(píng)價(jià)方案[J].光子學(xué)報(bào),2012,41(5):602?607.

[2] KIM D, CHOI S, SOHN K. Visual comfort enhancement for stereoscopic video based on binocular fusion characteristics [J]. IEEE transactions on circuits and systems for video technology, 2013, 23(3): 482?487.

[3] 王飛,王晨升,劉曉杰.立體顯示技術(shù)的原理、體視因素和術(shù)語(yǔ)[J].工程圖學(xué)學(xué)報(bào),2010(5):69?73.

[4] 李志永.立體視覺(jué)基礎(chǔ)[J].現(xiàn)代電影技術(shù),2011(1):52?55.

[5] 顧郁蓮,蔡宣平.計(jì)算機(jī)立體視圖繪制技術(shù)[J].國(guó)防科技參考,1998,19(1):63?70.

[6] 敬萬(wàn)鈞.虛擬現(xiàn)實(shí)中的視覺(jué)系統(tǒng)與其實(shí)現(xiàn)技術(shù)[J].計(jì)算機(jī)應(yīng)用,1997,17(3):5?7.