全球資訊網路 檢索工具

檢索工具種類
檢索工具分析
檢索工具之檢索功能分析
參考資料
黃恬儀  97.9.30

全球資訊網路檢索工具種類 (Visible Web Invisible Web Visible + Invisible Web)

WWW =? Wild Wild Web
數量超過幾十億、且使用自然語言、更多是為 invisible

網頁查詢工具 (Visible Web)

分類目錄單一檢索引擎多重檢索引擎特殊主題檢索引擎/入口網站

分類目錄

所收錄的網頁皆經過人為的篩選與評註,通常會根據主題加以分類,而主題的呈現是為層級式的

Yahoo!奇摩分類目錄Google 網頁目錄Google Directory

Librarians' Internet Index (by public librarians)、 Infomine (by university librarians)、 About.com (?)

單一檢索引擎
這是 WWW 上最常見的檢索工具,通常包括三個部份:搜尋器 (spider、robot、crawler)、索引工具、查詢工具

Learn the Net: How Search Engines Work

Yahoo !奇摩搜尋 [說明][範例 : 查詢 無線網路 ] [ 什麼是關鍵字廣告]

Google(中)Google(英) [說明] [範例 : 查詢 無線網路]

Google 的涵義 Google 是由英文字裡的「googol」而來,是美國數學家 Edward Kasner 的外甥 Milton Sirotta 隨便造的一個詞,代表 1 後面在加 100 個零的數字。Google 使用這個龐大的數字代表公司想征服網上無窮無盡資料的雄心。http://www.google.com/intl/zh-TW/profile.html

特色

Soople [說明] 友善的 Google search (非由 Google 提供)

Blog Search 查詢: 單車 環島、 Google 圖形查詢: girl with roses

更多 Google 產品More Google Products ( 地圖 瀏覽器 工具列 桌面 )

一些好玩的 Google 功能 Google Labs [ Google Audio Indexing (GAudi) Google Mars ]

logos

Exalead 特色 preview、narrow your search、wikipedia search

Ask.comMSN

多重檢索引擎 (Meta Search Engines)
此類工具並未建立自己的資料庫,而通常是將查詢同時傳送給多個單一索引資料庫檢索工具,再將由這些工具回送的查詢結果整理後混合顯示,dedup and sort。

利用數量不等、來源不同的單一檢索引擎,其呈現方式亦不同,但基本上是 quick and dirty、broad and shallow

1. Dogpile 利用包括 Google、Yahoo !、Ask 等檢索引擎,不可選擇。依據原始檢索引擎或相關性分別呈現資料,可與單一檢索引擎的結果進行比較 [範例 : 查詢 我在墾丁天氣晴 Wayward Kenting] 。

2. Vivisimo Clusty 運用特殊的群集 (cluster) 功能讓查詢更精確 [範例 : 查詢 我在墾丁天氣晴] 。

3. ZapMeta  查詢包括 Yahoo、Aol 及 Ask Jeeves 等 , [範例 : 查詢 我在墾丁天氣晴] 。

4. Kartoo visualized clustering, [範例 : 查詢 home deco] 。

Invisible Web 查詢工具
why
專屬使用權的網頁
需要密碼方能使用的網頁,例如 華爾街日報:論文剽竊在美大學引起軒然大波 ( 英文 --Wall Street Journal 須訂閱)

企業內部的主機網頁,利用防火牆、robots.txt 或 ”noindex”的meta tag 來阻止蒐尋引擎的 crawler 進入使用網頁

特殊格式的檔案
例如影像檔、聲音檔、程式檔、壓縮檔及PDF檔、Postscript 等。(隨著科技的進步,此項限制已逐漸消失)
動態網頁(dynamically generated web pages)通常於網址中會有一 ,是為非固定式網址
國家圖書館.期刊文獻中心 中華民國出版期刊指南系統 期刊網站瀏覽 http://readopac.ncl.edu.tw/cgi/ncl9/ncl9detail?632c36383730303732332c5a6668557a634f6a664b4a485a79697559532c32302c
關聯式資料庫(relational databases)
長庚大學 圖書館 資料庫查詢
University of Michigan Library OAIster
OAIster (oyster 同音)offers information that links to hidden digital resources such as the complete contents of books and articles, technical reports, preprints (unpublished works that have not yet been peer reviewed), white papers, images of paintings, movies and audio files of speeches. 最新收錄數量統計 [範例:查詢 fish images] [範例:查詢 Ang Lee]
已收錄入 Yahoo! CAP

NLM 提供專業人士使用 PubMed 、一般大眾 使用 MedlinePlus [範例:查詢 asthma] 查詢 Medline 資料庫

特殊資料查詢工具

網際網路圖書館的 Internet Archive

查詢保存的歷史性網頁、動畫、聲音及純文字資料
以長庚大學首頁為例 http://web.archive.org/web/*/www.cgu.edu.tw

blinkx 影像搜尋引擎, 利用 visual analysis 及 speech recognition 來分析影音 [範例:查詢 王建民高爾]

OPEN 政府出版資料回應網 (Official Publications Echo Network) [說明]

Visible + Invisible Web  查詢工具

Yahoo! 奇摩學術搜尋 http://tw.search.yahoo.com/academia [範例: 查詢 蓋斑鬥魚]

Scopus http://www.scopus.com/scopus/home.url

Google

Google Book Search [說明] [範例 : 查詢 into the wild紅樓夢]

早期 5大圖書館 (University of Michigan、Harvard University、Stanford University、Oxford University 及 New York Public Library) 簽訂合約,分年逐步將 圖書館中已無著作權問題之書籍 數位化。目前合作圖書館

可於一般之 Google 查詢,查詢結果點選後可看到部分頁數全文、書目資料、目錄、連線至付費的電子書及連線至書店購買等。

Google Scholar [說明] [範例:查詢 information retrieval]

包括學術性 peer-reviewed papers, theses, books, preprints, abstracts and technical reports, 顯示被引用次數並可連結至引用的文章。

CrossRef

Google 及其他學術性出版社 合作 ,最主要為提供參考文獻間的連結。基本上為由一般的 Google 查詢再過濾出參加此計畫的出版社資料 ,其範圍包括於 Google Scholar 中 。OpenURL and CrossRef

Yahoo! http://www.yahoo.com/

Yahoo! CAP (Content Acquisition Program) 計畫,包括收錄付費網頁 (未標示於查詢結果) 及 invisible web 的資料,後者收有 OAIster project、及來自 National Public Radio、Northwestern University、the Library of Congress、The New York Public Library、Project Gutenberg、UCLA 與 the National Science Digital Library 等計畫資料。

[範例: OAIster fish image]

  檢索工具指南

[回頁首]


檢索工具分析

資料索引及比對技術

Joe Barker What Makes a Search Engine Good?

[回頁首]


檢索工具之檢索功能分析 -- 以 Google Openfind 為例 [回頁首]


參考資料
Search Engine Watch http://searchenginewatch.com/

Sherman, Chris and Gary Price. The invisible Web:uncovering information sources search engines can’t see. Medford, New Jersey:Information Today, Inc., 2001. (ZA4450 S54 2001) <http://www.invisible-web.net/>

Greg R. Notess Search Engine Showdown : the Users' Guide to Web Searching