- 相關(guān)推薦
搜索引擎的研究與實(shí)現(xiàn)ASP+SQL論文
從小學(xué)、初中、高中到大學(xué)乃至工作,大家總免不了要接觸或使用論文吧,借助論文可以達(dá)到探討問題進(jìn)行學(xué)術(shù)研究的目的。你知道論文怎樣才能寫的好嗎?下面是小編整理的搜索引擎的研究與實(shí)現(xiàn)ASP+SQL論文,希望能夠幫助到大家。
目 錄
1、搜索引擎概述 1
1.1 搜索引擎的實(shí)現(xiàn)原理 1
1.1.1 從互聯(lián)網(wǎng)上抓取網(wǎng)頁 1
1.1.2 建立索引數(shù)據(jù)庫 1
1.1.3 在索引數(shù)據(jù)庫中搜索 1
1.1.4 對搜索結(jié)果進(jìn)行處理排序 1
1.2 重要中文搜索策略-中文分詞 2
1.2.1 什么是中文分詞 2
1.2.2 中文分詞技術(shù) 3
1.2.3 分詞中的難題 4
1.2.4 中文分詞的應(yīng)用 5
2、網(wǎng)絡(luò)蜘蛛基本原理 6
2.1 網(wǎng)站與網(wǎng)絡(luò)蜘蛛 6
2.2 內(nèi)容提取 7
2.3 更新周期 8
3、總體設(shè)計 10
3.1 需求分析 10
3.2 問題定義 10
3.3 總體設(shè)計 11
3.3.1 管理員部分實(shí)現(xiàn) 11
3.3.2 戶部分實(shí)現(xiàn) 11
3.3.3 幾個具體流程圖 12
4、數(shù)據(jù)庫設(shè)計 15
4.1 數(shù)據(jù)庫設(shè)計概述 15
4.2 創(chuàng)建sql server 2000數(shù)據(jù)庫 15
4.3 數(shù)據(jù)庫連接 15
4.3.1 建立數(shù)據(jù)庫的連接 15
4.3.2 執(zhí)行SQL語句 15
4.4 數(shù)據(jù)表的設(shè)計 15
4.5 E-R圖設(shè)計 16
4.5.1 用戶界面全局E-R圖 16
4.5.2 管理員界面全局E-R圖 17
5、各模塊詳細(xì)設(shè)計 18
5.1 站搜索模塊 18
5.2 分類目錄模塊 24
5.3 站登錄模塊 26
5.4 網(wǎng)站修改模塊 27
5.5 管理員登錄模塊 29
5.6 網(wǎng)站管理模塊 30
5.6.1 網(wǎng)站修改 31
5.6.2 網(wǎng)站刪除 32
5.7 網(wǎng)站審核模塊 32
5.8 分類管理模塊 32
5.8.1 分類添加 34
5.8.2 分類編輯 34
5.8.3 分類刪除 34
5.9 出系統(tǒng)模塊 34
6、系統(tǒng)功能測試 35
6.1 搜索測試 35
6.2 網(wǎng)站登錄測試 35
6.3 添加分類目錄-商業(yè) 36
6.4 刪除網(wǎng)站測試 37
6.5 測試總結(jié) 38
6.5.1 優(yōu)點(diǎn) 38
6.5.2 缺點(diǎn) 38
7、結(jié) 論 39
參考文獻(xiàn) 40
致 謝 41
搜索引擎的研究與實(shí)現(xiàn)
摘要:在理解搜索引擎實(shí)現(xiàn)原理的基礎(chǔ)上實(shí)現(xiàn)搜索引擎的基本功能,并對搜索引擎的實(shí)現(xiàn)機(jī)理進(jìn)行初步的研究尤其是對中文搜索引擎的研究。
通過對大型的網(wǎng)絡(luò)搜索引擎的實(shí)現(xiàn)的過程和實(shí)現(xiàn)原理的分析加強(qiáng)對搜索引擎這1復(fù)雜技術(shù)的理解和對其中使用的相關(guān)的技術(shù)進(jìn)行學(xué)習(xí)和研究,并理解網(wǎng)絡(luò)蜘蛛的工作原理和中文分詞的技術(shù)。并能自己開發(fā)搜索引擎—能夠?qū)崿F(xiàn)搜索和用戶個人網(wǎng)頁注冊這兩個搜索引擎的基本功能。
本設(shè)計的搜索引擎就是采用模糊搜索算法多關(guān)鍵字搜索策略實(shí)現(xiàn)搜索。模糊搜索就是將索引中內(nèi)容和標(biāo)題之中含有匹配的關(guān)鍵字的網(wǎng)頁搜索出來顯示在結(jié)果欄中,并建立相關(guān)的超鏈接。而多關(guān)鍵字搜索就是將搜索輸入的幾個關(guān)鍵字用空格或者非空格隔開的關(guān)鍵字替換成空格搜索出具有對應(yīng)關(guān)鍵字的網(wǎng)頁。
關(guān)鍵詞:中文搜索;研究;實(shí)現(xiàn)
Search engine research and its implementation
Abstract:In the understanding of the principles of search engines to implement a basis for the basic functions of search engines, and search engine mechanisms for the implementation of the initial research, in particular, the study of Chinese search engine. Through large network search engines process and the implementation of the principles of the implementation of the analysis of search engines to enhance the understanding of complex technical and related to the use of the technology study and research and understanding of the operating principles of the network spiders and Chinese sub-term technologies. And to develop my own search engines - users to implement personal web search and search engine registration two basic functions. The design is the use of search engines search algorithm more ambiguous word search strategy to implement search, the search engines to implement understanding principles. Search index is ambiguous, will contain matching content and the title of the show either in the web search results by column, and the establishment of related-links. And multi-word search is to search involving several key cells separated by blank space or non-replacement of the word into a blank space with the corresponding word search website.
Keyword:Chinese search;research;implementation
1、搜索引擎概述
1.1 搜索引擎的實(shí)現(xiàn)原理
搜索引擎的實(shí)現(xiàn)原理,可以看作4步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索→對搜索結(jié)果進(jìn)行處理和排序。
1.1.1 從互聯(lián)網(wǎng)上抓取網(wǎng)頁
利用能夠從互聯(lián)網(wǎng)上自動收集網(wǎng)頁的 網(wǎng)絡(luò)蜘蛛 程序,自動訪問互聯(lián)網(wǎng),并沿著任何網(wǎng)頁中的所有URL爬到其它網(wǎng)頁,重復(fù)這過程,并把爬過的所有網(wǎng)頁收集到服務(wù)器中。
1.1.2 建立索引數(shù)據(jù)庫
由索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息(包括網(wǎng)頁所在URL、編碼類型、頁面內(nèi)容包含的關(guān)鍵詞、關(guān)鍵詞位置、生成時間、大小、與其它網(wǎng)頁的鏈接關(guān)系等),根據(jù)1定的相關(guān)度算法進(jìn)行大量復(fù)雜計算,得到每1個網(wǎng)頁針對頁面內(nèi)容中及超鏈中每1個關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫。
1.1.3 在索引數(shù)據(jù)庫中搜索
當(dāng)用戶輸入關(guān)鍵詞搜索后,分解搜索請求,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。
1.1.4 對搜索結(jié)果進(jìn)行處理排序
所有相關(guān)網(wǎng)頁針對該關(guān)鍵詞的相關(guān)信息在索引庫中都有記錄,只需綜合相關(guān)信息和網(wǎng)頁級別形成相關(guān)度數(shù)值,然后進(jìn)行排序,相關(guān)度越高,排名越靠前。最后由頁面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁面內(nèi)容摘要等內(nèi)容組織起來返回給用戶。
【搜索引擎的研究與實(shí)現(xiàn)ASP+SQL論文】相關(guān)文章:
搜索引擎檢索子系統(tǒng)的設(shè)計與實(shí)現(xiàn)ASP+SQL11-23
網(wǎng)絡(luò)購物系統(tǒng)的設(shè)計與實(shí)現(xiàn)ASP+SQL03-08
購物網(wǎng)站的設(shè)計與實(shí)現(xiàn)ASP+SQL03-08
CPM搜索引擎的設(shè)計與實(shí)現(xiàn)03-08
新聞網(wǎng)系統(tǒng)設(shè)計與實(shí)現(xiàn)ASP+SQL11-23
基于ASP的網(wǎng)上銀行的設(shè)計與實(shí)現(xiàn)ASP+SQL03-08
網(wǎng)絡(luò)新聞發(fā)布系統(tǒng)的設(shè)計與實(shí)現(xiàn)ASP+SQL11-23
基于ASP的網(wǎng)絡(luò)辦公系統(tǒng)設(shè)計與實(shí)現(xiàn)ASP+SQL03-08