視頻幀中的文本檢測與提取技術(shù)
隨著計算機(jī)和通信技術(shù)、寬帶網(wǎng)絡(luò)技術(shù)、音視頻壓縮技術(shù)以及計算機(jī)硬件技術(shù)的發(fā)展,圖像和視頻中的文本信息對索引、檢索及高層語義的自動理解等具有重要價值。本文主要研究如何從視頻幀中檢測、提取與識別人工添加的文本信息。論文的主要工作如下: 首先,根據(jù)文本的特征以及目前存在視頻圖像的文本定位和提取算法,實現(xiàn)了一種基于邊緣檢測的文本定位方法。實現(xiàn)主要流程包括:對選取的視頻幀圖像進(jìn)行灰度化處理、邊緣檢測、邊緣圖像二值化及數(shù)學(xué)形態(tài)學(xué)操作,最后定位文本區(qū)域。實驗表明該方法實現(xiàn)簡單,并且可以定位出大部分的文本區(qū)域,但當(dāng)圖像或視頻幀中背景本身包含了豐富的邊緣信息時,則定位文本區(qū)域就不夠準(zhǔn)確。 其次,對定位好的文本區(qū)域進(jìn)行提取與識別,本文應(yīng)用基于閾值分割方法來提取文本。在處理簡單或者單一背景色的文字圖像時,使用經(jīng)典的閾值分割算法中的最大類間方差法(OTSU),該方法計算簡單、穩(wěn)定有效。在復(fù)雜背景下提取文字時,本文使用了局部自適應(yīng)的閾值化方法。經(jīng)過實驗測試,得到了很好的分割效果。 最后,對提取出的文本進(jìn)行去噪聲等處理,最大限度地去除文本的背景,為OCR識別系統(tǒng)提供完整清晰的二值輸入文本圖像。經(jīng)“尚書七號”文字識別軟件對文本圖像進(jìn)行識別后,結(jié)果證明文字的正確識別率能達(dá)到80%左右。
請繼續(xù)閱讀相關(guān)推薦:畢業(yè)論文 應(yīng)屆生求職
畢業(yè)論文范文查看下載 查看的論文開題報告 查閱參考論文提綱
查閱更多的畢業(yè)論文致謝 相關(guān)畢業(yè)論文格式 查閱更多論文答辯
【視頻幀中的文本檢測與提取技術(shù)】相關(guān)文章:
實驗檢測技術(shù)在公路工程中的應(yīng)用11-22
論食品檢測中紅外光譜技術(shù)的運用11-20
樁基檢測技術(shù)在高層建筑工程中的應(yīng)用論文03-24
巖土工程中深基坑檢測技術(shù)的應(yīng)用探究論文03-17
計算機(jī)技術(shù)在建筑材料檢測中的應(yīng)用03-25
《檢測技術(shù)》課程教學(xué)中項目驅(qū)動教學(xué)法的應(yīng)用論文03-17
時政文本翻譯中的文化自主意識11-15
無人機(jī)檢測技術(shù)在橋梁檢測工程的應(yīng)用論文03-15
文本圖像信息隱藏技術(shù)研究提綱12-04
- 相關(guān)推薦