增強現(xiàn)實(Augmented Reality,AR)是一個新韻研究領域,是一種通過將計算機產生的圖形、文字注釋等虛擬信息有機的融合到使用者所看到的真實世界景象中,對人的視覺系統(tǒng)進行景象增強或擴張的技術。Azuma是這樣定義增強現(xiàn)實的:虛實結合,實時交互,三維注冊。
增強現(xiàn)實的產生得益于六十年代以來計算機圖形學技術的迅速發(fā)展,實際上圖形學領域的虛擬現(xiàn)實技術(Virtual Reality,VR)就是AR技術的前身。增強現(xiàn)實系統(tǒng)的最終目標是要將計算機生成的虛擬環(huán)境和人所處的真實環(huán)境有機的合成起來,使它們看起來就像一個整體,并通過硬件和軟件系統(tǒng)的協(xié)調作用,使得身處其中的用戶可以以更加自然的方式與環(huán)境中的真實和虛擬物體進行三維實時交互。隨著硬件的發(fā)展和各種實際應用需要的出現(xiàn),AR技術不再僅僅局限于在視覺上對真實場景進行增強,實際上任何不能被人的感官所察覺但卻能被機器(各種傳感器)檢測到的信息,通過轉化,以人可以感覺到的方式(圖像、聲音、觸覺和嗅覺等)疊加到人所處的真實場景中,都能起到對現(xiàn)實的增強作用。
由于增強現(xiàn)實在虛擬現(xiàn)實與真實世界之間的溝壑上架起了一座橋梁。因此,增強現(xiàn)實的應用潛力是相當巨大的。例如:在軍事上,可以將計算機產生的虛擬信息(虛擬軍事目標、戰(zhàn)場環(huán)境信息、戰(zhàn)略部署信息等)疊加到戰(zhàn)場人員所看到的真實場景中,進行模擬戰(zhàn)術演練和戰(zhàn)術指導;可以利用疊加在真實場景中的圖形信息和文字注釋信息,以指導操作者對復雜設備進行操作、維護或者修理;在醫(yī)學上,可以將通過CT或MRI掃描獲得的人體透視三維圖形疊加在相應的身體部位,對手術過程進行指導可以將增強現(xiàn)實技術應用于游戲和電影電視畫面中的特技制作;以及可以利用增強現(xiàn)實系統(tǒng)的虛實結合技術進行輔助教學和進行高度專業(yè)化訓練等等。由于其在軍事、醫(yī)學、機械、設計、娛樂等領域的良好應用前景,增強現(xiàn)實技術的研究正受.到越來越廣泛的重視。
1、增強現(xiàn)實與虛擬現(xiàn)實的區(qū)別
與VR技術讓用戶完全沉浸在一個計算機生成的虛擬環(huán)境中不同,增強現(xiàn)實系統(tǒng)產生的是一副合成圖像,它是把計算機產生的虛擬物體或其它信息合成到用戶看到的真實世界景象中,起到景象增強或擴張的作用使用戶能以一種更自然的方式與真實和虛擬的混合世界交互,更好地完成任務。
AR技術與VR技術的一個明顯的區(qū)別在于兩者帶給用戶的沉浸感程度的差異。VR技術追求的是完全意義上的沉浸感,它包括人的視覺、聽覺、觸覺等身體感受完全處于系統(tǒng)控制之下。而AR技術所追求的目標恰好相反,它僅僅只是利用虛擬信息對真實景象進行增強,并不改變用戶身處真實環(huán)境這一客觀感受。這實際上也是由AR技術本身的應用背景所決定的:首先,真實環(huán)境中的信息過于復雜,其中很多信息是不可能通過建模來由計算機仿真的;其次,AR系統(tǒng)的目標是通過景象增強來輔助用戶更好的完成真實環(huán)境中的任務,使用戶仍然感覺處在真實的任務環(huán)境中,而不是處在一個完全與真實世界隔離的虛擬環(huán)境中,可以使身處其中的用戶在與環(huán)境中的物體交互起來更加自然。
無論AR還是VR系統(tǒng)都追求給身處其中的用戶一種沉浸感,不同之處在于前者偏重于真實世界,而后者偏重于虛擬景象。沉浸感實現(xiàn)的關鍵在于系統(tǒng)能夠通過各種傳感器的輸入來實時的跟蹤用戶的運動和姿態(tài)改變,并且相應的調整顯示在用戶眼前的景象。對于VR系統(tǒng),它的一個主要性能指標就是要求能夠產生與用戶運動姿態(tài)相一致的虛擬圖形輸出,也就是要使得用戶的運動姿態(tài)和虛擬景象顯示之間保持同步,由于人體本身的感官系統(tǒng)與眼前的虛擬圖形系統(tǒng)之間并沒有天然的聯(lián)系,為使兩者能夠協(xié)調一致,必須在兩者之間搭建一個人工橋梁——傳感器,由傳感器誤差等因素而造成的注冊錯誤反映在用戶角度是視覺系統(tǒng)與肌肉運動系統(tǒng)的感覺差異,由于人的視覺系統(tǒng)具有視覺暫留的特性,使得VR用戶可以逐漸克服和適應這種感覺差異所帶來的不適應性。對于AR系統(tǒng),它的主要性能指標是要求實時地檢測出回路中人的頭部位置和指向,以便能夠根據這些信息實時確定所要添加的虛擬信息在真實空間坐標中的映射位置,從而產生與用戶所看到的真實世界景象相匹配的虛擬圖形輸出。虛實景象注冊錯誤反映在用戶角度是我們欲融合為一個整體的兩個視覺通道景象視覺匹配上的誤差,而人眼對這種視覺上的誤差特別的敏感。正是由于人眼的高分辨率及人類視覺系統(tǒng)對差異的高敏感性,即使的微小的注冊誤差(像素級)都會使用戶感到明顯的虛實場景的不匹配。因此,與VR系統(tǒng)相比,AR系統(tǒng)對注冊精度提出了更高的要求。
從上面對虛擬現(xiàn)實和增強現(xiàn)實技術的分析和比較可以看出,兩者是具有一定共性,但存在本質上差別的兩個不同的概念。國內外的學者在對這兩個概念的關系及定義的理解上存在一定差異,1994年由Milgram等人提出的一種分類方法較好的說明了AR與VR之間的關系(如圖1所示)。
圖1 Milgram的VR和AR關系詮釋圖
2、增強現(xiàn)實的系統(tǒng)組成
一個完整的增強現(xiàn)實實用系統(tǒng)是由一組緊密聯(lián)結、實時工作的硬件部件協(xié)同實現(xiàn)的。下面我們來討論幾種典型的AR系統(tǒng)組成。
2.1 Monitor-based增強現(xiàn)實系統(tǒng)
在基于計算機顯示器的AR實現(xiàn)方案中,攝像機攝取的真實世界圖像輸入到計算機中,與計算機圖形系統(tǒng)產生的虛擬景象合成,并輸出到屏幕顯示器,用戶從屏幕上看到最終的增強場景圖片。它雖然不能帶給用戶多少沉浸感,但卻是一套最簡單使用的AR實現(xiàn)方案。由于這套方案的硬件要求很低,因此被實驗室中的AR系統(tǒng)研究者們大量采用。Monitor-based增強現(xiàn)實系統(tǒng)實現(xiàn)方案如圖2所示。
圖2 Monitor-based增強現(xiàn)實系統(tǒng)實現(xiàn)方案
2.2 Video see-through增強現(xiàn)實系統(tǒng)
頭盔式顯示器(Head-mounted displays-HMD)被廣泛應用于虛擬現(xiàn)實系統(tǒng)中,用以增強用戶的視覺沉浸感。增強現(xiàn)實技術的研究者們也采用了類似的顯示技術,這就是在AR中廣泛應用的穿透式HMD。根據具體實現(xiàn)原理又劃分為兩大類,分別是基于視頻合成技術的穿透式HMD(video see-through HMD)和基于光學原理的穿透式HMD(optical see-through HMD)。Video see-through增強現(xiàn)實系統(tǒng)實現(xiàn)方案如圖3所示。
圖3 Video see-through增強現(xiàn)實系統(tǒng)實現(xiàn)方案
2.3 Optical see-through增強現(xiàn)實系統(tǒng)
在圖2、圖3所示的兩套系統(tǒng)實現(xiàn)方案中,輸入計算機中的有兩個通道的信息,一個是計算機產生的虛擬信息通道,一個是來自于攝像機的真實場景通道。而在optical see-through HMD實現(xiàn)方案中去處了后者,真實場景的圖像經過一定的減光處理后,直接進入人眼,虛擬通道的信息經投影反射后再進入人眼,兩者以光學的方法進行合成。Optical see-through增強現(xiàn)實系統(tǒng)實現(xiàn)方案如圖4所示。
圖4 Optical See-through增強現(xiàn)實系統(tǒng)實現(xiàn)方案
2.4三種系統(tǒng)結構的性能比較
三種AR顯示技術實現(xiàn)策略在性能上各有利弊。在基于monitor-based和video see-through顯示技術的AR實現(xiàn)中,都通過攝像機來獲取真實場景的圖像,在計算機中完成虛實圖像的結合并輸出(如圖5所示)。整個過程不可避免的存在一定的系統(tǒng)延遲,這是動態(tài)AR應用中虛實注冊錯誤的一個主要產生原因。但這時由于用戶的視覺完全在計算機的控制之下,這種系統(tǒng)延遲可以通過計算機內部虛實兩個通道的協(xié)調配合來進行補償。而基于optical see-through顯示技術的AR實現(xiàn)中,真實場景的視頻圖像傳送是實時的,不受計算機控制,因此不可能用控制視頻顯示速率的辦法來補償系統(tǒng)延遲。
圖5 三種AR顯示技術實現(xiàn)原理示意圖
另外,在基于monitor-based和video See-through顯示技術的AR實現(xiàn)中,可以利用計算機分析輸入的視頻圖像,從真實場景的圖像信息中抽取跟蹤信息(基準點或圖像特征),從而輔助動態(tài)AR中虛實景象的注冊過程。而基于optical see-through顯示技術的AR實現(xiàn)中,可以用來輔助虛實注冊的信息只有頭盔上位置傳感器。
3、增強現(xiàn)實系統(tǒng)的性能指標
下面給出對于一個增強現(xiàn)實實用系統(tǒng),我們所關心的一些性能指標:
·低成本。為了使得AR系統(tǒng)得到廣泛的應用,在系統(tǒng)設計階段必須盡量壓縮系統(tǒng)成本。
·靜態(tài)AR應用中虛實景象的正確注冊。在靜態(tài)AR應用中,放置在真實場景中的虛擬物體,在用戶看來,無論從任意的角度觀察,都應該保持三維歐式空間的幾何一致性,除非用戶或其它物體與它發(fā)生交互作用。
·動態(tài)AR應用中虛實景象的正確注冊。在動態(tài)AR應用中,視頻圖像的刷新率起碼要達到15Hz,理想的情況要達到30Hz。要盡量減少系統(tǒng)的計算延時,因為如果虛擬物體的繪制速度跟不上用戶的運動速度,將直接導致人體視覺系統(tǒng)與運動系統(tǒng)的不匹配,給用戶造成一種虛擬物體在三維空間漂浮的感覺。
·視覺與觸覺的匹配一致性。視覺與觸覺感官的正確匹配將給人一種“所見即所感”體驗。要實現(xiàn)這一點,AR系統(tǒng)中視覺傳感器和觸覺傳感器的工作必須協(xié)調一致。當增強圖像中顯示用戶接觸到AR場景中的虛擬物體時,觸覺傳感器必須馬上相應的給人一種觸摸到物體的感覺,并且視覺和觸覺反應的發(fā)生必須在同一時間和,同一物體部位。
·虛實景象結合的緊密性。AR系統(tǒng)除了要完成圖形系統(tǒng)應用軟件中的虛擬物體相片渲染和生成功能,從自身特點出發(fā),由于AR場景中既有虛擬物體又有真實場景中的物體存在,虛擬物體和真實場景中的物體之問可能產生錯綜復雜的遮掩關系,這使得AR圖像生成時的光照和陰影處理變得格外復雜,光照的一致性是實現(xiàn)虛實景象緊密和有機結合的關鍵。
·用戶具有在AR場景中的充分自由度。AR系統(tǒng)中用戶充分運動自由度的實現(xiàn)有賴于三維交互手段的完善。理想情況下,AR用戶在3D增強場景中交互時應不受機械的限制;能夠觀察到增強場景中的任何虛實物體,不存在盲點;沒有運動方向和方式約束。
·盡量減少定標和運行時的用戶設置操作。在成像階段,為了實現(xiàn)從三維歐式空間到二維平面的映射,AR系統(tǒng)需要對相機進行定標。在系統(tǒng)運行開始和過程中,AR用戶還必須完成大量的交互設置操作,如:基準點的測量,3D空間里虛擬物體在真實場景中交互放置等。簡化這些操作將有利于AR技術的實用化發(fā)展。
需要強調的是,這些僅僅是對完全意義上的增強現(xiàn)實系統(tǒng)所提出的一些理想性能要求。正如前面我們在討論增強現(xiàn)實技術在軍事、醫(yī)學和娛樂等方面的應用背景時所提到的,大部分的AR應用從實際需要出發(fā),并不需要一定是完全意義上的增強現(xiàn)實系統(tǒng)。
4、 AR技術的現(xiàn)狀和發(fā)展方向
4.1現(xiàn)狀
目前大多數(shù)的AR應用是按照如下步驟進行的:首先是計算真實場景到攝像機的坐標系變換,AR系統(tǒng)通過各種傳感器(機械式、磁力式、光學式)測量相機相對于真實場景的姿態(tài)參數(shù)(位置和方向角);通過復雜的相機定標過程獲取相機的內部參數(shù)(焦距和像元的高寬比等),從而確定三維場景到二維成像平面的坐標系變換;最后通過測量定位,確定虛擬物體在真實場景三維歐式空間里的位置和方向,完成虛擬物體到真實場景的坐標系變換。通過上述步驟,可以得到各個坐標系之間的變換關系,至少在理論上能夠實現(xiàn)虛擬物體在真實場景中的繪制和融合。
從其自身實現(xiàn)原理出發(fā),上述傳統(tǒng)的AR實現(xiàn)方法存在必然的局限性。位置跟蹤和相機定標過程本身就極易出錯,這都將直接導致虛實注冊錯誤的發(fā)生。而且目前還沒有哪個位置傳感器能完全滿足AR應用系統(tǒng)的要求,總是存在這樣和那樣的不足。例如,機械式傳感器不靈活,因為要求有固定聯(lián)接,所以對工作空間的幅度有限制。磁力傳感器信號容易受周圍環(huán)境中其它磁場的干擾而發(fā)生畸變,其本身具有的延遲特性也可能影響虛實圖像的實時注冊。
相機定標也是一個復雜且煩瑣的過程。相機的內部參數(shù)可能隨著時間不斷變化,因此往往需要不斷的重新定標。變焦問題是相機定標中一個很頭疼的問題,普通攝像機鏡頭的焦距可能隨著縮放設置或相機自身的移動而隨時改變。由于很難實時獲得相機精確的縮放設置,因此鏡頭的焦距一旦變化,就需要重新定標。如果忽略系統(tǒng)的成本要求,可以采用高級的專用相機鏡頭,對鏡頭的每一級縮放設置預先定標。
上述位置跟蹤和相機定標過程可能產生的錯誤都將直接導致虛實注冊錯誤的發(fā)生。Durlach和Mavor得出結論,由于系統(tǒng)的不精確性和延遲,目前單一的跟蹤技術不可能很好的解決AR應用的位置跟蹤問題。一個很有希望的發(fā)展前景是采用兩極跟蹤策略,先用傳統(tǒng)的位置跟蹤技術進行注冊過程的粗定位,再利用基于圖像分析和計算機視覺的方法進行精確定位校正,通過兩種技術的結合最終完成虛實注冊的全過程。
4.2發(fā)展方向
由上述討論可見,為了創(chuàng)建和維護一幅虛實景象正確注冊的增強場景,需要知道系統(tǒng)的許多先驗知識(信息)。這些知識(信息)可能以多種方式呈現(xiàn),任何一個AR應用都需要以下的一條或更多的系統(tǒng)信息。
·攝像機相對于觀測場景的位置和方向角;
·相機的內部參數(shù);
·場景中基準點的位置坐標。
在以上討論的傳統(tǒng)的虛實注冊問題解決方法中,都忽略了一個重要的可利用工具——計算機視覺技術。計算機視覺研究中許多成熟的技術成果可用于AR中虛實注冊問題的解決,例如可以輔助我們提取場景的結構信息、相機的內部參數(shù)和相機相對于場景的姿態(tài)角。
計算機視覺技術和傳統(tǒng)傳感器技術相結合的方法,也是目前AR應用中一個主要的研究方向。例如在預先初始化的過程中確定了相機內部參數(shù)的情況下,采用計算機視覺技術與磁力傳感器相結合的方法,完成虛實注冊問題中的位置跟蹤問題。前者對于相臨兩幀之間變化過大或視覺遮擋的情況無能為力,這時就需要磁力傳感器的反饋數(shù)據來輔助場景中標識的定位。
上述提到的大多數(shù)AR應用有一個共同點,所有的場景都是定義在三維歐式空間中的,所有的虛實注冊任務都在3D環(huán)境中完成。從二維圖像中提取(生成)三維空間定義是一個極易發(fā)生錯誤的過程,如果根據實際應用的需要,可以對這個條件有所放松,即不要求所有的場景都有三維歐式空間定義,那么就有可能不必強調精確的定標和位置跟蹤。但由于此時不是工作在3D空間中,那么三維虛擬物體在場景中的放置和繪制就顯得比較困難。
有的AR應用為了繞開虛實注冊中的定標問題,嘗試引入仿射變換理論,即將觀測者和物體同處于一個坐標系下,這樣就不在需要相機內外部參數(shù)的先驗知識。研究如何將AR中的觸覺感知技術引入到AR應用中來,也是AR技術的一個新的研究領域。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.ezxoed.cn/
本文標題:增強現(xiàn)實技術及其應用