-
當前位置:首頁 > 創(chuàng)意學院 > 技術(shù) > 專題列表 > 正文
視覺圖像處理(機器視覺圖像處理)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于視覺圖像處理的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、想了解一下關(guān)于機器視覺,圖象處理方面的知識
視覺圖象技術(shù)縱談
近年來,隨著多媒體技術(shù)的飛速發(fā)展,利用多媒體計算機處理視頻影象已成為現(xiàn)實。本畢業(yè)設(shè)計就是利用視頻/圖象采集卡與CCD攝像機所構(gòu)成的實時視頻采集系統(tǒng)實現(xiàn)實時監(jiān)控的設(shè)計。因此有必要先介紹一下有關(guān)視頻的基本知識和視頻/圖象采集卡的情況。
有關(guān)視頻的基本知識
根據(jù)三基色原理,在視頻領(lǐng)域利用R(紅)、G(綠)、B(藍)三色不同比例的混合來表現(xiàn)豐富多采的現(xiàn)實世界。首先,通過攝像機的光敏器件像CCD(電荷耦合器件),將光信號轉(zhuǎn)換成RGB三路電信號;其次,在電視機或監(jiān)視器內(nèi)部也使用RGB信號分別控制三支電子槍轟擊熒光屏以產(chǎn)生影象。這樣,由于攝像機中原始信號和電視機、監(jiān)視器中的最終信號都是RGB信號,因此直接使用RGB信號作為視頻信號的傳輸和記錄方式會獲得極高的信號質(zhì)量。但這樣做會極大地加寬視頻帶寬從而增加設(shè)備成本,且這也與現(xiàn)行黑白電視不兼容,因此,在實際應(yīng)用中不這樣做,而是按亮度方程Y=0.39R+0.5G+0.11B(PAL制)RGB信號轉(zhuǎn)換成亮度信號Y和兩個色差信號U(B-Y)、V(R-Y),形成YUV分量信號。此種信號利用人眼對亮度細節(jié)分辨率高而對色度細節(jié)分辨率低的特點,對U、V信號帶寬壓縮。U、V信號還可進一步合成一個色度信號C,進而形成Y/C記錄方式。由于記錄時對C信號采取降頻處理,因此也稱彩色降頻方式。Y和C又可進一步形成復合視頻(Composite),即彩色全電視信號,這種方式便于傳輸和電視信號的發(fā)射。將RGB信號轉(zhuǎn)換成YUV信號、Y/C信號直至composite信號的過程稱為編碼,逆過程則為解碼。由此可看出,由于轉(zhuǎn)換步驟的多少,視頻輸出質(zhì)量由YUV端口到Y(jié)/C端口到Composite端口依次降低。因此,在視頻捕捉或輸出時選擇合適的輸入、輸出端口可提高視頻質(zhì)量。另外,還應(yīng)提供同步信號以保證傳送圖象穩(wěn)定再現(xiàn)。
視頻影像是由一系列被稱為幀的單個靜止畫面組成。一般幀率在24-30幀/秒時,視頻運動非常平滑,而低于15幀/秒時就會有停頓感。在PAL制中,規(guī)定25幀/秒,每幀水平625掃描行(分奇數(shù)行、偶數(shù)行,即奇、偶兩場,因采用隔行掃描方式)。在每一幀中,電子束由左上角隔行掃至右下角后再跳回至左上角有一個逆程期,約占整個掃描時間的8%,因此625行中有效行只有576行,即垂直分辨率576點。按現(xiàn)行4:3電視標準,則水平分辨率為768點,這就是常見的一種分辨率768*576。另外,還有一種遵循CCIR601標準的PAL制,其分辨率為720*576。對于NTSC制,規(guī)定30幀/秒,525行/幀,隔行掃描,分奇、偶兩場,圖像大小720*486。由于PAL制與NTSC制處理方式不同,因此互不兼容。確定視頻每一幀時間位置及視頻片段持續(xù)時間,使用的是專門的標準時間編碼格式SMPTE時間碼,表示為“H:M:S:F”,即“時:分:秒:幀”。
PAL制與NTSC制一般都是模擬信號,視頻捕捉卡可完成對它的A/D轉(zhuǎn)換。視頻捕捉卡先對輸入視頻信號以4:2:2格式進行采樣,然后進行量化,一般對YUV(也即對RGB)各8bit量化,因而產(chǎn)生24位真彩。由于一幀圖象數(shù)字化后數(shù)據(jù)量很大,為節(jié)省存儲空間,還要對其進行壓縮處理。壓縮處理可分為有損壓縮和無損壓縮,而前者是以犧牲圖象細節(jié)為代價的。壓縮可由軟、硬件實現(xiàn),后者可實現(xiàn)實時壓縮,而前者往往要在分辨率、顏色深度、幀率等方面做出一些犧牲。選擇壓縮比時,壓縮比越高,圖象質(zhì)量越差。經(jīng)過上述過程,模擬視頻即變成數(shù)字視頻,而這一過程的逆過程即可實現(xiàn)數(shù)字視頻的解壓縮與回放。另外,利用某些視頻捕捉卡的輸入、輸出設(shè)置,能簡單地實現(xiàn)PAL制與NTSC制的轉(zhuǎn)換。
數(shù)字視頻經(jīng)解壓縮后,可送入顯示卡并在計算機的顯示器上顯示出來。為在計算機的顯示器上精確顯示數(shù)字視頻,必須使視頻顯示模式與數(shù)字視頻的類型相匹配。由于顯象管存在著顯示亮度信號的非線形,因此送入的圖象信號必須預先補償,這就是^ 校正,它只對中間色調(diào)產(chǎn)生影響。計算機顯示器的^ 一般為1.8,而PAL制圖象的^ 值大約也是1.8,影響不大;但NTSC制圖象的^ 值為2.2,如果不經(jīng)調(diào)整,顯示圖象就會發(fā)白。
視頻/圖象處理硬件的發(fā)展、分類與特點
視頻/圖象處理硬件的發(fā)展歷史
圖象與視頻是兩個既有聯(lián)系又有區(qū)別的概念:靜止的圖片稱為圖象(Image),運動的圖象稱為視頻(Video)。圖象的輸入要靠掃描儀、數(shù)字照相機或攝象機;而視頻的輸入只能是攝象機、錄象機、影碟機以及電視接收機等可以輸出連續(xù)圖象信號的設(shè)備。
圖象與視頻處理系統(tǒng)包括:圖象與視頻的輸入、輸出設(shè)備,通用的計算機和附加的 專用處理硬件卡。不同的應(yīng)用環(huán)境,所需要的硬件設(shè)備、軟件環(huán)境也不同。
數(shù)字圖象處理技術(shù)與圖象處理系統(tǒng)是七十年代末期形成的一個獨立學科,當時只能 處理靜止圖象,主要用于軍事、科研醫(yī)學等領(lǐng)域。圖象處理系統(tǒng)是為了加快處理速度而 設(shè)計的專用系統(tǒng),在中小型計算機控制下運行。這些系統(tǒng)的規(guī)模大,價格昂貴。
面向PC機的圖象處理系統(tǒng)是八十年代中后期開始出現(xiàn)的。它價格便宜,易于擴充, 軟件豐富,因此很快得到推廣,帶動了圖象處理技術(shù)的普及。近年來多媒體技術(shù)又使視 頻處理有了新的用武之地。由于現(xiàn)代的視頻處理系統(tǒng)也具有圖象處理功能,因此有時就 不再嚴格區(qū)分視頻與圖象處理硬件了。
概括起來,面向PC機的圖象、視頻處理系統(tǒng)的發(fā)展歷史已經(jīng)歷了三個階段:
第一代產(chǎn)品(1990年之前):專用圖象處理系統(tǒng)。
八十年代中期,PC機上開始有圖象卡。但由于當時主機和總線主頻低,磁盤速度、容量有限,因而限制了圖象卡的發(fā)展。這一時期的圖象卡功能單一,基本上只有圖象采集和簡單的處理功能。主要用于科學和實驗研究。
這一代圖象系統(tǒng)的突出特點是一定要有一個專用的圖象顯示器與圖象卡相連,用于顯示圖象,而圖形是通過顯示卡輸出到圖形顯示器的,因此不便實現(xiàn)圖形/圖象的同屏顯示。
這一時期圖象處理硬件價格昂貴,性能又不能滿足多媒體系統(tǒng)的要求(主要是沒有 壓縮功能),因此不能為多媒體系統(tǒng)所用。
第二代產(chǎn)品(1991—1995年):圖形/圖象顯示合一的多媒體系統(tǒng)。
在理論上,從位圖角度看,圖形與圖象是統(tǒng)一的,完全可以采用同一個顯示器;而在多媒體中包含視頻媒體也是多媒體系統(tǒng)設(shè)計的最初目標。
在技術(shù)上,推動這一進程的動力有兩個:一方面由于各種增強型VGA顯示控制器 和顯示卡的性能提高,使得PC機有了較高顯示分辨率,可以直接處理視頻信息了;同 時,顯示存儲器容量增加,價格下降,使得高分辨率圖形顯示卡迅速普及。另一方面是各種可編程的視頻控制芯片使視頻信號與圖形疊加變得非常容易。這些芯片有效地解決 了多制式彩色全電視信號的數(shù)字式鎖相和解碼技術(shù),以及視頻信號與圖形信號的窗口控 制,從而使視頻信號的輸入/輸出變得簡單,設(shè)計和調(diào)試變得容易。利用這些芯片推出的視頻卡,實現(xiàn)了VGA圖形與視頻信號的疊加。另外,這類卡上一般都有聲音輸入/輸出功能,沒必要再單獨配置聲卡了。
這一時期是多媒體視頻硬件發(fā)展最迅速的階段,圖形與圖象疊加問題的解決使圖象 系統(tǒng)真正為多媒體系統(tǒng)所用。各種采集卡、字幕疊加卡、壓縮/解壓縮卡、電影卡、電視卡層出不窮,迅速普及;各類標準如Video for Windows、MPEG-1、VCD1.1和VCD2.0的出臺,使得在PC機上看影音文件甚至電影成為現(xiàn)實;還有通過計算機收看電視節(jié)目的電視調(diào)諧卡(TV Tuner)、將VGA輸出信號編碼為電視信號的TV Coder等。
第三代產(chǎn)品(1996年之后):多種功能集成化的多媒體系統(tǒng)。
系統(tǒng)集成是現(xiàn)代技術(shù)的主要趨勢,多媒體本身就是技術(shù)集成的產(chǎn)物。近年來,多媒 體視頻硬件主要在兩個領(lǐng)域發(fā)展。第一是與網(wǎng)絡(luò)通信技術(shù)結(jié)合,由視頻采集卡附加網(wǎng)絡(luò) 通信卡構(gòu)成的多媒體視頻會議、S可視電話、視頻郵件、多媒體通信終端等。到本世紀末和下世紀初,基于寬帶多媒體通信網(wǎng)絡(luò)的交互式電視(ITV)、點播電視(VOD)以及遠程教育系統(tǒng)、遠程醫(yī)療診斷系統(tǒng)、遠程電子圖書館等新技術(shù)將付諸實施,通過交互電視的機頂盒(STB)實現(xiàn)網(wǎng)絡(luò)瀏覽、電視購物、收看VOD節(jié)目等,最終走向電視、電腦與電信的三電合一的目的。第二方面是與影視制作技術(shù)結(jié)合,構(gòu)成集壓縮/解壓縮、合成輸出、特技效果為一體的影視制作非線形編輯系統(tǒng)。視頻處理硬件最終將從高檔系統(tǒng)的選件轉(zhuǎn)變?yōu)闃藴氏到y(tǒng)的組件。
視頻/圖象處理硬件的分類與特點
采集功能是各種視頻卡的基本功能,對它進行擴充,可構(gòu)成各種檔次的視頻處理卡:從簡單視頻采集卡到專業(yè)圖象采集卡以及非線形編輯系統(tǒng)。
視頻采集卡
模擬圖象經(jīng)過采樣、量化以后轉(zhuǎn)換為數(shù)字圖象并輸入、存儲到幀存儲器的過程,叫做采集、數(shù)字化、獲取、捕獲、捕捉、抓取、抓幀等,因此視頻采集卡也稱捕獲卡、獲取卡、視頻輸入卡等。視頻采集的模擬視頻信號源可以是錄象機、攝象機、攝錄機、影碟機等,通過視頻采集卡可將錄象帶、激光視盤等上的圖象或現(xiàn)場的圖象輸入計算機。
視頻采集卡的工作方式可以是單幀采集或連續(xù)采集;可將采集的圖象序列放在內(nèi)存或磁盤上;可對圖象進行壓縮或不壓縮。
視頻輸出卡
對計算機的VGA顯示卡輸出的以RGB形式表示的視頻數(shù)據(jù)進行編碼,將其轉(zhuǎn)換成可供錄象機和電視機輸入和顯示的組合視頻信號的接口卡叫視頻輸出卡或編碼卡(TVCoder)。
視頻輸出卡有三種:
外置式VGA到TV視頻信號轉(zhuǎn)換器:其典型實例即為臺灣圓智Grand系列產(chǎn)品;
內(nèi)置式視頻信號編碼輸出卡:這類卡已經(jīng)很少見;
將編碼輸出與采集功能集成在一塊板上,構(gòu)成具有頻輸入/輸出功能的多功能卡:這類卡是當前的主流,主要用于各種非線性編輯系統(tǒng)。
壓縮/解壓縮卡
解壓卡:
解壓卡主要指能看VCD的MPEG解壓卡,俗稱“電影卡”。這種卡大都有音/視頻輸出端,具有動態(tài)視頻交互功能。
壓縮卡:壓縮卡主要是為制作影視節(jié)目和電子出版物用的。前者采用Motion-JPEG標準,壓縮比為5:1到7:1;后者采用MPEG壓縮,壓縮比為150:1到200:1。此外還有針對彩色或黑白靜止圖象壓縮的JPEG卡。
電視接收卡
電視卡有兩種:將高頻接收/調(diào)諧電路和視頻采集卡的功能集成在一塊板上,板上有外接天線插孔,插上天線就可收看電視;在視頻采集卡視頻輸入端接一個“高頻頭”。
高檔視頻卡(非線性編輯卡)
這種卡集成了視頻輸入/輸出、特技、壓縮及編輯加工等多種功能,主要用于影視節(jié)目后期制作的非線性編輯系統(tǒng)。
二、主動視覺焊縫圖像處理的主要步驟
濾波、增強、自適應(yīng)閾值二值化、邊緣提取。根據(jù)主動視覺焊縫圖像資料顯示,主動視覺焊縫圖像處理的主要步驟是濾波、增強、自適應(yīng)閾值二值化、邊緣提取。激光視覺跟蹤系統(tǒng)結(jié)構(gòu)激光器作為結(jié)構(gòu)光源,以預定的角度將激光條紋投影到傳感器下部的工作表面。
三、主動視覺焊縫圖像處理的主要步驟
所謂焊縫跟蹤就是在焊接時實時檢測出焊縫的偏差,并調(diào)整焊接路徑和焊接參數(shù),保證焊接質(zhì)量的可靠性。由于工件的加工誤差(工件間的尺寸差異、坡口的準備情況等)、裝夾精度以及焊接時的熱變形等因素的存在,以示教-再現(xiàn)方式工作的弧焊機器人在焊接時常常因為焊縫和示教軌跡有偏差而導致焊接質(zhì)量下降。所以焊縫跟蹤是保證焊接機器人焊接質(zhì)量的一個重要的方面。在機器人焊接所使用的傳感器中,電弧傳感器和視覺傳感器占有突出位置,其中電弧傳感器用得最多,而視覺傳感器則被認為是最有前途得焊縫跟蹤傳感器。
主動視覺焊縫跟蹤
目前主動視覺焊縫跟蹤研究的內(nèi)容主要有以下方面:
1、提高激光跟蹤的魯棒性,如適應(yīng)各種焊接接頭,和接頭尺寸變化等。
2、跟蹤中的快速穩(wěn)定的圖像處理方法。
3、傳感器的設(shè)計問題,例如激光和傳感器的角度。
4、焊縫跟蹤中的控制問題,主要為NN和Fuzzy及兩者結(jié)合方法。
被動視覺焊縫跟蹤
被動視覺傳感器所獲信息量大,接近人的視覺等突出優(yōu)點,受到了研究人員的廣泛關(guān)注。受機器視覺技術(shù)的大量成功應(yīng)用的啟發(fā),人們嘗試將被動視覺傳感應(yīng)用到各種焊接方法中,如 GTAW、GMAW 和 PAW 等。
四、圖像處理與計算機視覺入門看什么書
圖像處理與計算機視覺的書籍推薦photoshop及以下:
圖像處理,分析與機器視覺 第三版Sonka等著 艾海舟等譯
Image Processing, Analysis and Machine Vision
這本書是圖像處理與計算機視覺里面比較全的一本書了,幾乎涵蓋了圖像視覺領(lǐng)域的各個方面。中文版的個人感覺也還可以,值得一看。
數(shù)字圖像處理 第三版 岡薩雷斯等著
Digital Image Processing
數(shù)字圖像處理永遠的經(jīng)典,現(xiàn)在已經(jīng)出到了第三版,相當給力。我的導師曾經(jīng)說過,這本書寫的很優(yōu)美,對寫英文論文也很有幫助,建議購買英文版的。
計算機視覺:理論與算法 RichardSzeliski著
Computer Vision: Theory and Algorithm
微軟的Szeliski寫的一本最新的計算機視覺著作。內(nèi)容非常豐富,尤其包括了作者的研究興趣,比如一般的書里面都沒有的Image Stitching和Image Matting等。這也從另一個側(cè)面說明這本書的通用性不如Sonka的那本。不過作者開放了這本書的電子版,可以有選擇性的閱讀。
Multiple View Geometry in Computer Vision 第二版Harley等著
引用達一萬多次的經(jīng)典書籍了。第二版到處都有電子版的。第一版曾出過中文版的,后來絕版了。網(wǎng)上也可以找到電子版。
計算機視覺:一種現(xiàn)代方法 DAForsyth等著
Computer Vision: A Modern Approach
MIT的經(jīng)典教材。雖然已經(jīng)過去十年了,還是值得一讀。第二版已經(jīng)在今年(2012年)出來了,在iask上可以找到非常清晰的版本,將近800頁,補充了很多內(nèi)容。期待影印版。
Machine vision: theory,algorithms, practicalities 第三版 Davies著
為數(shù)不多的英國人寫的書,偏向于工業(yè)。
數(shù)字圖像處理 第四版 Pratt著
Digital Image Processing
寫作風格獨樹一幟,也是圖像處理領(lǐng)域很不錯的一本書。網(wǎng)上也可以找到非常清晰的電子版。
以上就是關(guān)于視覺圖像處理相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
視覺中國旗下網(wǎng)站(視覺中國旗下網(wǎng)站注冊)
上海城市垂直綠化景觀設(shè)計(上海城市垂直綠化景觀設(shè)計公司)