關(guān)于物體識別報告
關(guān)于物體識別報告
篇一:文字識別開題報告
太原理工大學(xué)信息工程學(xué)院
本科畢業(yè)設(shè)計(論文)開題報告
畢業(yè)設(shè)計(論文)題目
基于邊緣檢測的文字圖像識別
學(xué)生姓名
專 業(yè)
班 級
信息 導(dǎo)師姓名 報告日期07-1
指導(dǎo)教
師意見
簽字 年 月 日
專業(yè)(教
研室)主
任意見
年 月 日
系主任 意 見 年 月 日
1. 國內(nèi)外研究現(xiàn)狀及課題意義
文字圖像信息是人類獲取外界信息的主要來源,在近代科學(xué)研究、軍事技術(shù)、工農(nóng)業(yè)生產(chǎn)、醫(yī)學(xué)、氣象及天文學(xué)等領(lǐng)域中,人們越來越多的利用圖像信息來識別和判斷事物,解決實際問題。例如:由于空間技術(shù)的發(fā)展,人造衛(wèi)星拍攝了大量地面和空間的照片,人們要分析照片,獲得地球資源、全球氣象和污染情況等;在醫(yī)學(xué)上,醫(yī)生可以通過X射線分析照像,觀察到人體個部位的多次現(xiàn)象;在工廠,技術(shù)人員可以利用電視圖像管理生產(chǎn);生活中,交通管理部門也要利用文字圖像識別技術(shù)確定違章車輛的牌照,對其進(jìn)行監(jiān)督管理,由此可見文字圖像信息的重要性【1】。
獲得文字圖像信息非常重要,但更重要的是對文字圖像進(jìn)行處理,從中找到我們所需要的信息,因此在當(dāng)今科學(xué)技術(shù)迅速發(fā)展的時代,對文字圖像的處理技術(shù)提出了更高的要求,能夠更加快速準(zhǔn)確的獲得有用信息。
1.1國內(nèi)外研究現(xiàn)狀
20世紀(jì)20年代文字圖像處理首次得到應(yīng)用。20世紀(jì)60年代中期,電子計算機(jī)的發(fā)展得到普遍應(yīng)用,文字圖像處理技術(shù)也不斷完善,逐漸成為一個新興的科學(xué)。從70年代中期開始,隨著計算機(jī)技術(shù)和人工智能、思維科學(xué)研究的迅速發(fā)展,數(shù)字圖像處理技術(shù)也向更高、更深的層次邁進(jìn)。到了20世紀(jì)90年代,機(jī)器人技術(shù)已經(jīng)成為工業(yè)的三大支柱之一,人們已經(jīng)開始研究如何用計算機(jī)系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)來理解外部世界,這被稱為圖像理解活計算機(jī)視覺。很多國家,特別是發(fā)達(dá)國家投入更多的人力、物力道這項研究,取得了不少重要的研究成果。
數(shù)字圖像處理主要是為了修改圖形,改善圖像質(zhì)量,或是從圖像中提取有效信息,還有利用數(shù)字圖像處理可以對圖像進(jìn)行體積壓縮,便于傳輸和保存。目前,數(shù)字圖像處理主要應(yīng)用于通訊技術(shù)、宇宙探索遙感技術(shù)和生物工程等領(lǐng)域。數(shù)字圖像處理因易于實現(xiàn)非線性處理,處理程序和處理參數(shù)可變,故事一項通用性強(qiáng),精度高,處理方法靈活,信息保存、傳送可靠的圖像處理技術(shù)。主要用于圖像變換、測量、模式識別、模擬以及圖像產(chǎn)生。廣泛應(yīng)用在遙感、宇宙觀測、影像醫(yī)學(xué)、通信、刑偵及多種工業(yè)領(lǐng)域【2】。
1.2文字圖像識別面臨的問題
文字圖像識別的發(fā)展經(jīng)歷了三個階段:文字識別、圖像處理和識別、物體識別。現(xiàn)在對于文字圖像識別技術(shù)的研究,還面臨幾個問題,一是圖像數(shù)據(jù)量大,一般來說,要取得較高的識別精度,原始圖像應(yīng)具有較高的分辨率,至少應(yīng)大于64×64。二是圖像污
損,由于目標(biāo)環(huán)境的干擾、傳輸?shù)恼`差、傳感器的誤差、噪聲、背景干擾、變形等會污損圖像。三是準(zhǔn)確性,位移、旋轉(zhuǎn)、尺度變化、扭曲,和人類的視覺一樣,目標(biāo)和傳感器之間存在有位置的變化,因此,要求系統(tǒng)在目標(biāo)產(chǎn)生位移、旋轉(zhuǎn)、尺度變化、扭曲時,仍能夠正確識別目標(biāo)。四是實時性,在軍事領(lǐng)域的應(yīng)用中,大都要求系統(tǒng)能夠?qū)崟r的識別目標(biāo),這就要求系統(tǒng)有極快的出來速度和識別效率【3】。
1.3邊緣檢測處理文字圖像的優(yōu)勢
圖像的邊緣是圖像的基本特征,所謂邊緣是指其周圍像素灰度的階躍變化活屋頂變化的那些像素的集合。邊緣廣泛存在于物體與背景之間、物體與物體之間、基元與基元之間。從本質(zhì)上說,邊緣是圖像局部特性不連續(xù)性的反映,它標(biāo)志著一個區(qū)域的終結(jié)和另一個區(qū)域的開始,由于噪聲和模糊的存在,檢測到的邊界可能會變寬或在某些點處發(fā)生間斷,因此邊緣提取的首要任務(wù)是要檢測出圖像局部特性的不連續(xù)性,然后剔出某些邊界點或補(bǔ)充間斷點,并將這些邊緣像素連成完備的邊界【4】。
文字圖像的邊緣檢測大幅度地減少了數(shù)據(jù)量,并且剔除了可以認(rèn)為不相關(guān)的信息,
。保留了圖像重要的結(jié)構(gòu)屬性,提高了圖像處理的準(zhǔn)確性和實時性【5】
2.主要研究內(nèi)容
通過學(xué)習(xí)數(shù)字圖像處理和MATLAB軟件的應(yīng)用,了解邊緣檢測處理對文字圖像的理論基礎(chǔ)和過程,用MATLAB軟件對文字圖像進(jìn)行邊緣檢測。該課題在研究過程中主要要解決如何運用MATLAB語言實現(xiàn)對文字圖像進(jìn)行濾波、增強(qiáng)、檢測、和定位,把文字圖像中的有用信息和背景噪聲區(qū)分開,其中的關(guān)鍵在于MATLAB語句的編寫。
3.擬采用的研究思路(方法、技術(shù)路線、可行性論證等)
完成該論文,首先要學(xué)習(xí)數(shù)字圖像的獲取、變換、增強(qiáng)、復(fù)原、彩色處理、編碼、分割等基礎(chǔ)理論知識,然后繪制實現(xiàn)圖像分割的流程圖,編寫相應(yīng)的MATLAB程序,最后用MATLAB軟件進(jìn)行邊緣點分析和仿真。
因此,先根據(jù)研究內(nèi)容采用文獻(xiàn)檢索查閱文字圖像處理的現(xiàn)有成果和發(fā)展趨勢,然后再通過自行上機(jī)實踐進(jìn)一步研究,最終得出一些有用的結(jié)論。
4.設(shè)計工作安排及進(jìn)度
1-2周根據(jù)畢業(yè)設(shè)計題目和要求收集有關(guān)資料
3-5周復(fù)習(xí)鞏固該課題所需的專業(yè)知識,同時了解該課題,準(zhǔn)備寫論文的文獻(xiàn)資料
6-7周完成畢業(yè)論文的翻譯部分,進(jìn)一步了解相關(guān)知識
8周 對完成該課題制定初步設(shè)計方案和詳細(xì)計劃
9-10周 完成論文的緒論和基礎(chǔ)知識介紹部分
11-12周 完成論文的上機(jī)操作和實驗部分
13周 對論文進(jìn)行總結(jié)分析,得出研究結(jié)論,完成初稿
13-14周 對論文初稿進(jìn)行全面修改和整理
15周 論文答辯
5.參考文獻(xiàn)
1盛利元,李宏言,數(shù)字圖像處理實驗教學(xué)探索與實驗軟件研制,電氣電子教學(xué)學(xué)報,2006,27(3),75-82
2 田浩鵬,董怡彤,關(guān)于數(shù)字圖像處理技術(shù)的研究,北方經(jīng)貿(mào),2010,12,140-141 3 朱志剛,數(shù)字圖像處理,北京,電子工業(yè)出版社,1998,446
4 董東,圖像邊緣檢測方法簡介,試驗技術(shù)與試驗機(jī),2004,44(3、4),64-71
5 Lindeberg, Tony "Edge detection and ridge detection with automatic scale selection", International Journal of Computer Vision, 30, 2, pp 117--154, 1998
篇二:開題報告 人臉檢測與識別
畢業(yè)設(shè)計(論文)
開題報告
題 目:人臉檢測與識別系統(tǒng)設(shè)計
院系名稱: 電氣工程學(xué)院 專業(yè)班級:自動F0904
學(xué)生姓名:陳龍斌 學(xué) 號: 200948280407
指導(dǎo)教師: 吳翔教師職稱:講師
2013 年 03 月 02 日
開題報告填寫要求
1.開題報告(含“文獻(xiàn)綜述”)作為畢業(yè)設(shè)計(論文)答辯委
員會對學(xué)生答辯資格審查的依據(jù)材料之一。此報告應(yīng)在指導(dǎo)教師指
導(dǎo)下,由學(xué)生在畢業(yè)設(shè)計(論文)工作前期內(nèi)完成,經(jīng)指導(dǎo)教師簽
署意見及所在專業(yè)審查后生效。
2.開題報告內(nèi)容必須用黑墨水筆工整書寫或按教務(wù)處統(tǒng)一設(shè)
計的電子文檔標(biāo)準(zhǔn)格式(可從教務(wù)處網(wǎng)頁上下載)打印,禁止打印
在其它紙上后剪貼,完成后應(yīng)及時交給指導(dǎo)教師簽署意見。
3.“文獻(xiàn)綜述”應(yīng)按論文的格式成文,并直接書寫(或打。
在本開題報告第一欄目內(nèi),學(xué)生寫文獻(xiàn)綜述的參考文獻(xiàn)應(yīng)不少于15
篇(不包括辭典、手冊)。
4.有關(guān)年月日等日期的填寫,應(yīng)當(dāng)按照國標(biāo)GB/T 7408—94
《數(shù)據(jù)元和交換格式、信息交換、日期和時間表示法》規(guī)定的要求,
一律用阿拉伯?dāng)?shù)字書寫。如“2006年11月20日”或“2006-11-30”。
畢業(yè)設(shè)計(論文)開題報告
篇三:開題報告
玉溪師范學(xué)院
畢業(yè)設(shè)計(論文)開題報告
論文題目:基于視頻的運動目標(biāo)檢測與跟蹤方法研究——基于幀間差分的目標(biāo)檢測
學(xué) 院: 信息技術(shù)工程學(xué)院
專業(yè)班級:09通信工程一班
學(xué)生姓名:謝君芳
學(xué)生學(xué)號:2009093108
指導(dǎo)教師:樂應(yīng)英
2013年1月12日
基于視頻的運動目標(biāo)檢測與跟蹤方法研究
——基于幀間差分的目標(biāo)檢測
開題報告
一、 研究的背景和意義
在人們感知到的環(huán)境信息中,視覺信息占了很大的比重,其中動態(tài)視覺信息更是其主要組成部分。感知環(huán)境中的這些動態(tài)視覺信息己成為計算機(jī)視覺的一個重要的研究方向。在現(xiàn)實生活中,大量有意義的視覺信息都包含于運動之中。盡管人類視覺既能看見運動又能看見靜止的物體,但是在許多場合,比如航空和軍用飛機(jī)的制導(dǎo)、交通流量的監(jiān)測、重要場所的保安以及汽車的自動駕駛和輔助駕駛等等,人們往往對運動的物體更感興趣。
運動目標(biāo)檢測與跟蹤是近些年來圖像處理和計算機(jī)視覺領(lǐng)域的一個非常活躍的分支,是動態(tài)圖像分析的基礎(chǔ)。目標(biāo)的運動圖像序列提供了比目標(biāo)靜止時更多的有用信息,使得我們可以利用運動目標(biāo)檢測與跟蹤技術(shù)獲得比靜止圖像更有實用價值的信息。
運動目標(biāo)檢測和運動目標(biāo)跟蹤兩方面具有非常緊密的關(guān)系。作為運動目標(biāo)跟蹤的基礎(chǔ),運動目標(biāo)檢測是實時的在被監(jiān)視的場景中檢測運動目標(biāo),并將其提取出來。而運動目標(biāo)跟蹤是做為銜接運動目標(biāo)檢測和上層的目標(biāo)行為分析和理解的一個重要環(huán)節(jié)。所謂運動目標(biāo)跟蹤,就是在運動目標(biāo)檢測的基礎(chǔ)上,利用目標(biāo)有效特征,使用適當(dāng)?shù)钠ヅ渌惴ǎ谛蛄袌D像中尋找與目標(biāo)模板最相似的圖像的位置,簡單的說就是給目標(biāo)定位。在實際應(yīng)用中,運動目標(biāo)跟蹤不僅可以提供目標(biāo)的運動軌跡和準(zhǔn)確定位目標(biāo),為下一步的目標(biāo)行為分析與理解提供了可靠的數(shù)據(jù)來源,而且也可以為運動目標(biāo)檢測提供幫助。
綜上,對運動目標(biāo)檢測與跟蹤有關(guān)算法的研究具有重大的理論價值和意義。
二、 研究內(nèi)容和擬解決的關(guān)鍵問題
研究內(nèi)容:基于視頻的運動目標(biāo)檢測與跟蹤方法,即智能視頻監(jiān)控(IVS, Intelligent Visual Surveillance)借助計算機(jī)強(qiáng)大的計算能力和與視頻圖像處理、模式識別、人工智能等多項技術(shù)的結(jié)合,在不需要人為干預(yù)的情況下,實現(xiàn)對視頻場景中目標(biāo)進(jìn)行自動檢測、識別和跟蹤,并在此基礎(chǔ)上分析和判斷目標(biāo)的行為,給出對它們行為和動作的描述,自動發(fā)現(xiàn)可疑情況,實現(xiàn)系統(tǒng)對場景中的異常鑒別及自動報警功能。
而運動目標(biāo)的檢測是視頻監(jiān)控應(yīng)用中最為廣泛也是最為基礎(chǔ)的一部分,即是從圖像中檢測出各種可能的運動區(qū)域。目標(biāo)的跟蹤等后期分析依賴于目標(biāo)檢測的結(jié)果。主要是在給定的序列圖像中找到我們感興趣的運動目標(biāo),也就是“定位”問題。近幾十年來,人們對序列圖像中的運動目標(biāo)檢測技術(shù)做了大量的研究工作。歸納起來主要有以下幾種方法:幀間差分方法、背景減法、光流法。在這里我主要采用的方法是幀間差分方法。
運動目標(biāo)檢測就是從視頻序列圖像中利用圖像的時間和空間相關(guān)性檢測出兩幀圖像之間特征分量的變化,如灰度、紋理、邊緣等特征分量,從圖像中檢測出各種可能的運動區(qū)域。通過檢測出的可能運動區(qū)域,進(jìn)一步排除誤判區(qū)域即虛警消除,確定出準(zhǔn)確運動目標(biāo)。如陰影的消除主要為了防止投射在背景上的運動陰影所造成的目標(biāo)形狀扭曲、目標(biāo)連接和目標(biāo)數(shù)估計錯誤等影響,以便于更精確地提取運動目標(biāo);跈z測出的運動目標(biāo),提取目標(biāo)的灰度分布、紋理、形狀等特征,利用這些運動區(qū)域的特征對運動目標(biāo)進(jìn)行跟蹤。目標(biāo)檢測的結(jié)果必須要求可靠有效,具體表現(xiàn)在如下方面:適應(yīng)于不同的場景和光照條件;檢測可達(dá)到實時性的要求;運動目標(biāo)的信息檢測準(zhǔn)確完整。
近年來,國內(nèi)外研究人員致力于視頻運動目標(biāo)檢測方面的研究,提出了多種方法,在這里我主要研究的方法是基于時間差分法中的幀間差分方法。其原理主要是通過對序列圖像中相鄰幀做差分或“相減”運算,利用序列圖像中相鄰幀的強(qiáng)相關(guān)性進(jìn)行變化檢測,從而檢測出運動目標(biāo)。它通過直接比較相鄰幀對應(yīng)象素點的灰度值的不同,然后通過選取閾值來提取序列圖像中的運動區(qū)域。在序列圖像中,第k幀圖像fx(x,y)和第k+l幀圖像fk+1(x,y)之間的變化可用二值差分圖像D(x,y)表示,
當(dāng) |fk(x,y)-fk+1(x,y)|>T時, D(x,y)=1;否則等于0。式中T為差分圖像二值化的閾值。二值圖像中為“1"的部分
由前后兩幀對應(yīng)象素灰度值發(fā)生變化的部分組成,通常包括運動目標(biāo)和噪聲;為“0"的部分由前后兩幀對應(yīng)象素灰度值不發(fā)生變化的部分組成。
擬解決的關(guān)鍵問題:運動目標(biāo)檢測由于所處的實際處理環(huán)境不同,將會受到來自不同因素的影響,它們會不同程度地影響運動目標(biāo)檢測的準(zhǔn)確性和穩(wěn)定性,系統(tǒng)對不同環(huán)境的適應(yīng)性也存在很大的挑戰(zhàn),這些影響系統(tǒng)性能的因素包括:
(1)光線高密度的變化 由于現(xiàn)場光線高密度的變化將使得背景圖像也隨之發(fā)生變化,從而
很難將這些變化與圖像中由于前景目標(biāo)盼引入導(dǎo)致的變化加以區(qū)分。
(2)陰影和物體間的重疊遮蓋運動的前景目標(biāo)的陰影部分可能會造成背景中局部畫面亮度變化,另外運動的目標(biāo)之間,以及運動的目標(biāo)與背景之間的重疊遮蓋,都可能會改變檢測出來的運動目標(biāo)的形狀和其他特征。
(3)前景目標(biāo)與背景中物體相似 當(dāng)運動的前景目標(biāo)與背景中景物在顏色和形狀等外觀特征相似時,將增大從背景中分辨出前景目標(biāo)的難度。
(4)非靜態(tài)背景當(dāng)背景并不是靜態(tài)時,比如天空中運動的云塊,公路邊的建筑、樹,這些運動的背景有可能被當(dāng)成前景目標(biāo)進(jìn)行處理,這樣將增加運動目標(biāo)的檢測難度。
(5)運動目標(biāo)的高速運動 前景目標(biāo)的高速運動可能會導(dǎo)致許多不同的目標(biāo)頻繁在背景中出入,從而難以分辨哪些是真正的背景,哪些是前景目標(biāo),從而給運動目標(biāo)檢測增加難度。
對于上述在運動目標(biāo)檢測技術(shù)中存在的一些問題,我們小組的兩名成員通過比較各種不同的算法或技術(shù),對比其優(yōu)缺點,從而找到一種比較合適的算法或技術(shù)來較好的把他們的影響降到最低是我們的工作目標(biāo),在這里我主要研究的方法是基于幀間差分法的目標(biāo)檢測。
三、 研究方案及措施
針對此次畢業(yè)設(shè)計,我所實施的研究方案為:
1、首先在大量閱讀有關(guān)文獻(xiàn)與資料的同時加強(qiáng)自己C++編程能力的提高與OpenCV軟件的應(yīng)用;
【物體識別報告】相關(guān)文章:
物體的間隙教學(xué)反思03-19
植物體中物質(zhì)的運輸教案03-20
二年級上《觀察物體》知識點歸納12-05
三年級上冊第八單元《觀察物體》說課稿02-16
二年級最新數(shù)學(xué)《觀察物體》的知識點歸納02-15
清稅報告和清算報告模板02-15
empb報告02-16
報告格式要求04-04
心理報告格式06-01