近幾年,增強(qiáng)現(xiàn)實(shí)已經(jīng)從一個(gè)新興技術(shù)發(fā)展為最熱門的交互技術(shù)之一。無論是前段時(shí)間世界杯節(jié)目的解說植入動(dòng)漫人物,還是眼下各種展會(huì)所能見到的很炫的、帶有神秘魔幻的汽車、工廠、建筑等,都像是在告知人們:AR是一項(xiàng)神奇的技術(shù)。今天就讓小編帶領(lǐng)大家一探究竟,梳理一下AR技術(shù)的實(shí)現(xiàn)方式。
AR技術(shù)
通過查閱相關(guān)資料,以及采訪一些AR廠商發(fā)現(xiàn):增強(qiáng)現(xiàn)實(shí)有多個(gè)重要的種類,比如說基于地理位置的,基于人臉識(shí)別的,基于圖形識(shí)別的,定點(diǎn)識(shí)別的,卡片識(shí)別的,體感AR技術(shù)等,并且每個(gè)種類自身又是一個(gè)寬泛的主題。隨著移動(dòng)網(wǎng)絡(luò)與設(shè)備的發(fā)展,在增強(qiáng)現(xiàn)實(shí)的實(shí)現(xiàn)方式上,目前主要有兩種:基于移動(dòng)設(shè)備實(shí)現(xiàn)的AR技術(shù)與基于計(jì)算機(jī)視覺AR技術(shù)。
基于移動(dòng)設(shè)備實(shí)現(xiàn)的AR技術(shù)
基于移動(dòng)設(shè)備實(shí)現(xiàn)的AR技術(shù),就是利用移動(dòng)設(shè)備(如智能手機(jī)、ipad等)的位置(GPS)、視野朝向(指南針)和方向(加速度傳感器/陀螺儀)數(shù)據(jù)來向真實(shí)場景添加注釋或者融入內(nèi)容的一門增強(qiáng)現(xiàn)實(shí)技術(shù)。相應(yīng)的應(yīng)用技術(shù)知道你的智能手機(jī)上的攝像頭觀察的是什么,你的方位,以及智能手機(jī)正面對(duì)哪一個(gè)方向。基于這些數(shù)據(jù),就可以把由集中式服務(wù)或者其他用戶已上傳的注釋覆蓋到你的攝像頭場景上。
AR 瀏覽器作為一項(xiàng)手機(jī)應(yīng)用產(chǎn)品,是基于移動(dòng)設(shè)備實(shí)現(xiàn)的AR技術(shù)的典型產(chǎn)物。從國外來看,Metaio 、Layar 、Wikitude和Augment作為較早涉足增強(qiáng)現(xiàn)實(shí)領(lǐng)域的企業(yè),其中,Metaio和Layar有許多相似之處,二者都有用戶規(guī)模在千萬級(jí)別的AR 瀏覽器,如junaio(魔眼,Metaio 的 AR 瀏覽器)推崇“手機(jī)用戶應(yīng)該能像瀏覽網(wǎng)頁一樣瀏覽生活”;從國內(nèi)看,已經(jīng)有一些廠商在積極探索移動(dòng)領(lǐng)域,代表性的廠商比如說成都微力互動(dòng)科技有限公司的天眼增強(qiáng)現(xiàn)實(shí)(AR)瀏覽器,蘇州夢(mèng)想人科技的【夢(mèng)想拍拍】、【夢(mèng)想點(diǎn)讀書】等產(chǎn)品。此外,AR瀏覽器向可穿戴設(shè)備的移植發(fā)展,比如Layar已經(jīng)移植到Google Glass,微力互動(dòng)天眼AR瀏覽器正在向vuzix smart glasses 智能眼鏡上移植。
圖 1 移動(dòng)終端增強(qiáng)現(xiàn)實(shí)技術(shù)的具體工作流程
移動(dòng)終端增強(qiáng)現(xiàn)實(shí)程序的工作流程(具體工作流程詳見圖1):
1、手持設(shè)備的攝像頭捕獲真實(shí)世界的視頻流。通俗地講,就是通過手持設(shè)備上的攝像頭(如智能手機(jī))可以獲得物理環(huán)境中的視頻;
2、運(yùn)用圖像處理軟件監(jiān)控視頻流中的圖像幀(幀數(shù)就是在1秒鐘時(shí)間里傳輸?shù)膱D片的量,也可以理解為圖形處理器每秒鐘能夠刷新幾次,通常用fps表示),通過跟蹤注冊(cè)算法捕捉到特征點(diǎn)(二維碼標(biāo)記或自然圖像特征標(biāo)記);
3、通過運(yùn)算檢測(cè)出特征點(diǎn)所在的平面和攝像頭的姿態(tài),在檢測(cè)出的平面上建立虛擬的三維坐標(biāo);
4、在虛擬的三維坐標(biāo)上實(shí)現(xiàn)虛擬目標(biāo)與真實(shí)世界的融合。隨著攝像頭姿態(tài)變化,攝像頭拍攝視角也發(fā)生變化。程序通過攝像頭姿態(tài)變化計(jì)算,實(shí)時(shí)更新虛擬目標(biāo)定位所需的三維坐標(biāo),使虛擬目標(biāo)與真實(shí)世界的三維空間中的變化一致,而達(dá)到融合疊加的效果。
上面敘述的工作過程比較抽象,對(duì)于用戶來說關(guān)心的是怎么使用,我以國內(nèi)微力互動(dòng)的天眼AR瀏覽器為例,詳細(xì)講解一下AR瀏覽器的工作過程:天眼分為識(shí)別圖AR功能和基于位置服務(wù)AR功能(LBS)。
識(shí)別圖AR功能:用戶打開天眼,點(diǎn)擊右上角的二維碼,掃描提供的二維碼進(jìn)入頻道,掃描識(shí)別圖片即可呈現(xiàn)出疊加在真實(shí)世界的AR信息(文字、圖片、視頻、模型、動(dòng)畫、聲音等),這些AR信息都是通過在天眼云平臺(tái)上傳與管理。
基于位置服務(wù)AR功能(LBS):打開天眼,點(diǎn)擊“街景信息”按鈕(也可以通過掃描二維碼)進(jìn)入實(shí)景導(dǎo)航。此時(shí),屏幕里呈現(xiàn)各個(gè)方位的導(dǎo)航浮屛,基于GPS和陀螺儀顯示出浮屛方位和距離用戶的距離,點(diǎn)擊浮屛進(jìn)入介紹頁面(聯(lián)系方式、網(wǎng)頁鏈接、圖片、跳轉(zhuǎn)到地圖、全景圖片等等),這些信息通過天眼云平臺(tái)上傳,在地圖上選取目標(biāo)地點(diǎn)和添加一些信息,即可通過天眼呈現(xiàn)出來。
基于移動(dòng)終端的AR技術(shù)最終呈現(xiàn)效果圖例
基于計(jì)算機(jī)視覺AR技術(shù)
從國外看,比較有代表性的是Google Ingress,是Google推出的一款增強(qiáng)現(xiàn)實(shí)游戲 Ingress ,別具新意地在 Google Map 的基礎(chǔ)上把游戲搬到了室外,此外位于洛杉磯的Specular Theory是一家可以為汽車企業(yè)提供網(wǎng)上“定制”汽車的服務(wù)。從國內(nèi)看,有代表性的廠商主要有:中視典的ARP-FITTING 虛擬試衣產(chǎn)品、增強(qiáng)現(xiàn)實(shí)眼鏡等。
另一個(gè)增強(qiáng)現(xiàn)實(shí)方式是使用由攝像頭捕獲的實(shí)際圖像內(nèi)容來確定攝像頭觀察的是什么,該技術(shù)被稱為計(jì)算機(jī)視覺(computer vision),通俗地講,是通過計(jì)算機(jī)通過視覺方法獲得三維世界的幾何特征和運(yùn)動(dòng)信息,然后對(duì)相應(yīng)信息存儲(chǔ)、分析與處理,最終實(shí)現(xiàn)對(duì)三維世界的認(rèn)識(shí)。計(jì)算機(jī)會(huì)處理每個(gè)視頻幀的每個(gè)像素,評(píng)估在時(shí)間和空間上該像素與相鄰的像素之間的關(guān)系,并識(shí)別圖案。此外,當(dāng)前計(jì)算機(jī)視覺技術(shù)還包括精確的面部識(shí)別算法、識(shí)別視頻中的活動(dòng)物體,以及識(shí)別熟悉的標(biāo)記(marker)或者使用一個(gè)非常強(qiáng)大的算法識(shí)別出特定的視覺圖案的能力。
利用計(jì)算機(jī)視覺可以通過物體的二維圖像信息獲得其三維形狀或位置等信息。三維信息可以從單鏡頭成像(單目成像)、雙鏡頭成像(雙目成像)或多鏡頭成像(多目成像)中獲得,目前雙鏡頭成像應(yīng)用的較多。
圖2 基于計(jì)算機(jī)視覺的AR技術(shù)工作流程
基于計(jì)算機(jī)視覺的AR技術(shù)工作流程(見圖2):
1、 通過攝像頭捕獲到現(xiàn)實(shí)世界的影像,具體地講,就是通過對(duì)目標(biāo)上特定光點(diǎn)(Marker)的監(jiān)視和跟蹤來完成運(yùn)動(dòng)捕捉的任務(wù),經(jīng)典的跟蹤算法有:CamShift算法、光流跟蹤以及粒子濾波算法;
2、 利用圖形識(shí)別技術(shù)(圖形識(shí)別技術(shù),即通過存儲(chǔ)的信息與當(dāng)前的信息進(jìn)行比較的加工過程,實(shí)現(xiàn)對(duì)圖像的再認(rèn)的技術(shù))如使用OpenCV開源庫(OpenCV是一個(gè)用于圖像處理、分析、機(jī)器視覺方面的開源函數(shù)庫),識(shí)別出影像中的相關(guān)興趣目標(biāo);
3、 從數(shù)據(jù)庫獲取與識(shí)別與目標(biāo)相匹配的相關(guān)信息。對(duì)場景中的目標(biāo)進(jìn)行識(shí)別的過程,就是確定目標(biāo)與先驗(yàn)知識(shí)中不同事物的相對(duì)應(yīng)過程,而圖像匹配則是把一個(gè)圖像區(qū)域從不同的拍攝時(shí)間攝取的相應(yīng)圖像中確定出來,并且找到它們的對(duì)應(yīng)關(guān)系;
4、 將影像與識(shí)別到的目標(biāo)和信息進(jìn)行融合(一般情況下,圖像融合由低到高分為三個(gè)
層次:數(shù)據(jù)級(jí)融合、特征級(jí)融合、決策級(jí)融合,目前多采用特征級(jí)融合),并疊加到圖像上。
同樣地,為了讓讀者進(jìn)一步的理解,以無人駕駛汽車AR應(yīng)用的實(shí)例,來說明采用計(jì)算機(jī)視覺技術(shù)的AR實(shí)現(xiàn)過程:1)車載攝像頭獲取道路的圖像序列(視頻);2)計(jì)算機(jī)對(duì)這些圖像進(jìn)行去噪等、消除光照變化影響等預(yù)處理;3)圖像處理,考慮到道路一般是兩條平行線,則提取出圖像中的直線這類特征,然后把直線包圍的區(qū)域(可能是道路)分割出來;4)接著計(jì)算機(jī)對(duì)該區(qū)域進(jìn)行識(shí)別,比如和數(shù)據(jù)庫中已假設(shè)好為"道路"的圖像進(jìn)行匹配,如果有相當(dāng)大程度的一致,則認(rèn)為該區(qū)域就是道;5)最后根據(jù)攝像頭和道路的姿態(tài)的關(guān)系,判斷出車輛和道路之間角度,然后通過方向盤控制車輛前進(jìn)方向和速度。
基于計(jì)算機(jī)視覺的增強(qiáng)現(xiàn)實(shí)技術(shù)既可以用于移動(dòng)設(shè)備,又可以用于非移動(dòng)設(shè)備。它既能夠用來增強(qiáng)基于位置和方向的增強(qiáng)現(xiàn)實(shí)方法,又能夠用來創(chuàng)建不會(huì)以任何方式依賴某個(gè)特定位置的增強(qiáng)現(xiàn)實(shí)應(yīng)用。計(jì)算機(jī)視覺算法能夠用來識(shí)別包裝材料、產(chǎn)品、衣服、藝術(shù)品,或者在其他環(huán)境中的很多圖案。
基于計(jì)算機(jī)視覺的AR技術(shù)最終效果圖例
事實(shí)上,無論是基于移動(dòng)設(shè)備的AR技術(shù),還是計(jì)算機(jī)視覺的AR技術(shù),兩者的工作原理是一樣的,不同之處在于采用的軟硬件平臺(tái)及算法不同,導(dǎo)致兩者的處理方式不同,最終呈現(xiàn)的效果也不同。
目前,國外媒體已經(jīng)將增強(qiáng)現(xiàn)實(shí)技術(shù)列為2014年15大科技發(fā)展趨勢(shì)之一,市場調(diào)查研究公司Juniper Research則預(yù)計(jì)增強(qiáng)現(xiàn)實(shí)相關(guān)應(yīng)用在2015年的全球下載量將高達(dá)14億次,較2010年增長超過100倍,同時(shí)移動(dòng)互聯(lián)網(wǎng)的增強(qiáng)現(xiàn)實(shí)收入將從2010年的不到200萬美元邁向15億美元。帶有增強(qiáng)現(xiàn)實(shí)元素的企業(yè)應(yīng)用程序收入將排在第三位,僅次于位置搜索和游戲。所以我們有理由相信隨著時(shí)間的推移,增強(qiáng)現(xiàn)實(shí)這門技術(shù)一定會(huì)大放異彩。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:增強(qiáng)現(xiàn)實(shí)實(shí)現(xiàn)方式探討
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839415980.html