搜尋引擎的未來技術展望?

搜尋引擎經過幾年的發展和摸索,越來越貼近人們的需求,搜尋引擎的技術也得到了很大的發展。搜尋引擎的最新技術發展包括以下幾個方面:

方法/步驟

提高對使用者檢索提問的理解為了提高搜尋引擎對使用者檢索提問的理解,就必須有一個好的檢索提問語言,為了克服關鍵詞檢索和目錄查詢的缺點,已經出現了自然語言智慧答詢。使用者可以輸入簡單的疑問句,比如“how can kill virus of computer?”。搜尋引擎在對提問進行結構和內容的分析之後,或直接給出提問的答案,或引導使用者從幾個可選擇的問題中進行再選擇。自然語言的優勢在於,一是使網路交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來講,如果用關鍵詞查詢,多半人會用“virus”這個詞來檢索,結果中必然會包括各類病毒的介紹、病毒是怎樣產生的等等許多無效資訊,而用“how can kill virus of computer?”,搜尋引擎會將怎樣殺病毒的資訊提供給使用者,提高了檢索效率。

對檢索結果進行處理⒈基於連結評價的搜尋引擎基於連結評價的搜尋引擎的優秀代表是Google,它獨創的“連結評價體系”是基於這樣一種認識,一個網頁的重要性取決於它被其它網頁連結的數量,特別是一些已經被認定是“重要”的網頁的連結數量。這種評價體制與《科技引文索引》的思路非常相似,但是由於網際網路是在一個商業化的環境中發展起來的,一個網站的被連結數量還與它的商業推廣有著密切的聯絡,因此這種評價體制在某種程度上缺乏客觀性。⒉基於訪問大眾性的搜尋引擎基於訪問大眾性的搜尋引擎的代表是direct hit,它的基本理念是多數人選擇訪問的網站就是最重要的網站。根據以前成千上萬的網路使用者在檢索結果中實際所挑選並訪問的網站和他們在這些網站上花費的時間來統計確定有關網站的重要性排名,並以此來確定哪些網站最符合使用者的檢索要求。因此具有典型的趨眾性特點。這種評價體制與基於連結評價的搜尋引擎有著同樣的缺點。⒊去掉檢索結果中附加的多餘資訊有調查指出,過多的附加資訊加重了使用者的資訊負擔,為了去掉這些過多的附加資訊,可以採用使用者定製、內容過濾等檢索技術。

確定搜尋引擎資訊蒐集範圍⒈垂直主題搜尋引擎網上的資訊浩如煙海,網路資源以十倍速的增長,一個搜尋引擎很難收集全所有主題的網路資訊,即使資訊主題收集得比較全面,由於主題範圍太寬,很難將各主題都做得精確而又專業,使得檢索結果垃圾太多。這樣一來,垂直主題的搜尋引擎以其高度的目標化和專業化在各類搜尋引擎中佔據了一系席之地,比如像股票、天氣、新聞等類的搜尋引擎,具有很高的針對性,使用者對查詢結果的滿意度較高。作者認為,垂直主題有著極大的發展空間。⒉非www資訊的搜尋提供FTP等類資訊的檢索。⒊多媒體搜尋引擎多媒體檢索主要包括聲音、影象、視訊的檢索。關於圖片搜尋引擎的原理,《淺談圖片搜尋引擎的實現》中提出了具有跨時代意義設計思路。

提供更優化的檢索結果⒈純淨搜尋引擎這類搜尋引擎沒有自己的資訊採集系統,利用別人現有的索引資料庫,主要關注檢索的理念、技術和機制等。⒉元搜尋引擎許多的搜尋引擎,其收集資訊的範圍、搜尋機制、演算法等都不同,使用者不得不去學習多個搜尋引擎的用法。每個搜尋引擎平均只能涉及到整個www資源的30-50%(search engine watch資料),這樣導致同一個搜尋請求在不同搜尋引擎中獲得的查詢結果的重複率不足34%,而每一個搜尋引擎的查準率不到45%。元搜尋引擎(metasearch engining)是將使用者提交的檢索請求到多個獨立的搜尋引擎上去搜索,並將檢索結果集中統一處理,以統一的格式提供給使用者,因此有搜尋引擎之上的搜尋引擎之稱。它的主要精力放在提高搜尋速度、智慧化處理搜尋結果、個性搜尋功能的設定和使用者檢索介面的友好性上,查全率和查準率都比較高。比較成功的元搜尋引擎有metacrawler、dopile、ixquick、搜客等。⒊整合搜尋引擎整合搜尋引擎( All-in-One Search Page),亦稱為“多引擎同步檢索系統 ”(如百度)是在一個WWW頁面上鍊接若干種獨立的搜尋引擎,檢索時需點選或指定搜尋引擎,一次檢索輸入,多引擎同時搜尋,用起來相當方便。整合搜尋引擎無自建資料庫,不需研發支援技術,當然也不能控制和優化檢索結果。但整合搜尋引擎製作與維護技術簡單,可隨時對所連結的搜尋引擎進行增刪調整和及時更新,尤其大規模專業(如FLASH、MP3等)搜尋引擎整合連結,深受特定使用者群歡迎。⒋垂直搜尋引擎垂直搜尋引擎是相對通用搜索引擎的資訊量大、查詢不準確、深度不夠等提出來的新的搜尋引擎服務模式,通過針對某一特定領域、某一特定人群或某一特定需求提供的有一定價值的資訊和相關服務。其特點就是“專、精、深”,且具有行業色彩,相比較通用搜索引擎的海量資訊無序化,垂直搜尋引擎則顯得更加專注、具體和深入。

包含內容主題:網頁音樂(翻唱 MP3)影視(電影電視) ;視訊播客軟體 BT下載 ;硬體 ;圖片 ;桌布 ;相簿 ;小說 ;文學 ;文件(論文 ;述職報告 ;思想彙報 ;演講稿 ;入黨申請書 ;作文 ;個人簡歷 ;畢業論文法律論文經濟論文教育論文會計論文 ;計算機論文 ;畢業論文集 ;情書 ;調查報告 ;求職信 ;商業計劃書 ;實習報告 ;就職演說 ;自薦信 ;企劃方案企業管理年終總結) ;新聞(資訊) ;百科(知識 ;經驗) ;教育 ;人物 ;學校 ;專業論壇社群 ;部落格 ;詞典 ;翻譯 ;地圖 ;動漫 Flash ;遊戲 ;娛樂 ;笑話 ;汽車 ;家電手機 ;廣告 ;購物 ;商業黃頁房產 ;招聘 ;財經 ;股票基金法律 ;國學圖書政府 ;目錄 ;學術 ;程式碼 ;公交 ;實用查詢等幾十個分類。

相關問題答案