|
|
|
|
全球資訊網路檢索工具種類 (Visible Web 、Invisible Web 、Visible + Invisible Web)
WWW =? Wild Wild Web[回頁首]
數量超過幾十億、且使用自然語言、更多是為 invisible分類目錄、單一檢索引擎、多重檢索引擎、特殊主題檢索引擎/入口網站Invisible Web 查詢工具所收錄的網頁皆經過人為的篩選與評註,通常會根據主題加以分類,而主題的呈現是為層級式的單一檢索引擎Yahoo!奇摩分類目錄、Google 網頁目錄、Google Directory
Librarians' Internet Index (by public librarians)、 Infomine (by university librarians)、 About.com (?)
這是 WWW 上最常見的檢索工具,通常包括三個部份:搜尋器 (spider、robot、crawler)、索引工具、查詢工具多重檢索引擎 (Meta Search Engines)Learn the Net: How Search Engines Work
Yahoo !奇摩搜尋 [說明][範例 : 查詢 無線網路 ] [ 什麼是關鍵字廣告]
Google(中)、Google(英) [說明] [範例 : 查詢 無線網路]
Google 的涵義 Google 是由英文字裡的「googol」而來,是美國數學家 Edward Kasner 的外甥 Milton Sirotta 隨便造的一個詞,代表 1 後面在加 100 個零的數字。Google 使用這個龐大的數字代表公司想征服網上無窮無盡資料的雄心。http://www.google.com/intl/zh-TW/profile.html
Soople [說明] 友善的 Google search (非由 Google 提供)
Blog Search 查詢: 單車 環島、 Google 圖形查詢: girl with roses
更多 Google 產品、 More Google Products ( 地圖、 瀏覽器 、 工具列 、 桌面 )
一些好玩的 Google 功能 Google Labs [ Google Audio Indexing (GAudi) 、 Google Mars ]
Exalead 特色 preview、narrow your search、wikipedia search
此類工具並未建立自己的資料庫,而通常是將查詢同時傳送給多個單一索引資料庫檢索工具,再將由這些工具回送的查詢結果整理後混合顯示,dedup and sort。利用數量不等、來源不同的單一檢索引擎,其呈現方式亦不同,但基本上是 quick and dirty、broad and shallow。
1. Dogpile 利用包括 Google、Yahoo !、Ask 等檢索引擎,不可選擇。依據原始檢索引擎或相關性分別呈現資料,可與單一檢索引擎的結果進行比較 [範例 : 查詢 我在墾丁天氣晴 Wayward Kenting] 。
2. Vivisimo Clusty 運用特殊的群集 (cluster) 功能讓查詢更精確 [範例 : 查詢 我在墾丁天氣晴] 。
3. ZapMeta 查詢包括 Yahoo、Aol 及 Ask Jeeves 等 , [範例 : 查詢 我在墾丁天氣晴] 。
4. Kartoo visualized clustering, [範例 : 查詢 home deco] 。
whyVisible + Invisible Web 查詢工具專屬使用權的網頁University of Michigan Library OAIster需要密碼方能使用的網頁,例如 華爾街日報:論文剽竊在美大學引起軒然大波 ( 英文 --Wall Street Journal 須訂閱)特殊格式的檔案企業內部的主機網頁,利用防火牆、robots.txt 或 ”noindex”的meta tag 來阻止蒐尋引擎的 crawler 進入使用網頁
例如影像檔、聲音檔、程式檔、壓縮檔及PDF檔、Postscript 等。(隨著科技的進步,此項限制已逐漸消失)動態網頁(dynamically generated web pages)通常於網址中會有一 ?,是為非固定式網址國家圖書館.期刊文獻中心 中華民國出版期刊指南系統 期刊網站瀏覽 http://readopac.ncl.edu.tw/cgi/ncl9/ncl9detail?632c36383730303732332c5a6668557a634f6a664b4a485a79697559532c32302c關聯式資料庫(relational databases)長庚大學 圖書館 資料庫查詢OAIster (oyster 同音)offers information that links to hidden digital resources such as the complete contents of books and articles, technical reports, preprints (unpublished works that have not yet been peer reviewed), white papers, images of paintings, movies and audio files of speeches. 最新收錄數量統計 [範例:查詢 fish images] [範例:查詢 Ang Lee]
已收錄入 Yahoo! CAPNLM 提供專業人士使用 PubMed 、一般大眾 使用 MedlinePlus [範例:查詢 asthma] 查詢 Medline 資料庫
特殊資料查詢工具
網際網路圖書館的 Internet Archive查詢保存的歷史性網頁、動畫、聲音及純文字資料
以長庚大學首頁為例 http://web.archive.org/web/*/www.cgu.edu.twblinkx 影像搜尋引擎, 利用 visual analysis 及 speech recognition 來分析影音 [範例:查詢 王建民、高爾]
OPEN 政府出版資料回應網 (Official Publications Echo Network) [說明]
Yahoo! 奇摩學術搜尋 http://tw.search.yahoo.com/academia [範例: 查詢 蓋斑鬥魚]
Scopus http://www.scopus.com/scopus/home.url
Google Book Search [說明] [範例 : 查詢 into the wild、紅樓夢]
早期 5大圖書館 (University of Michigan、Harvard University、Stanford University、Oxford University 及 New York Public Library) 簽訂合約,分年逐步將 圖書館中已無著作權問題之書籍 數位化。目前合作圖書館
可於一般之 Google 查詢,查詢結果點選後可看到部分頁數全文、書目資料、目錄、連線至付費的電子書及連線至書店購買等。
Google Scholar [說明] [範例:查詢 information retrieval]
包括學術性 peer-reviewed papers, theses, books, preprints, abstracts and technical reports, 顯示被引用次數並可連結至引用的文章。
Google 及其他學術性出版社 合作 ,最主要為提供參考文獻間的連結。基本上為由一般的 Google 查詢再過濾出參加此計畫的出版社資料 ,其範圍包括於 Google Scholar 中 。OpenURL and CrossRef。
Yahoo! http://www.yahoo.com/
Yahoo! CAP (Content Acquisition Program) 計畫,包括收錄付費網頁 (未標示於查詢結果) 及 invisible web 的資料,後者收有 OAIster project、及來自 National Public Radio、Northwestern University、the Library of Congress、The New York Public Library、Project Gutenberg、UCLA 與 the National Science Digital Library 等計畫資料。
[範例: OAIster fish image]
資料收集
收錄資料種類:web pages ? 討論群組的討論 ? bbs ?
收錄資料的質與數量 (coverage and quality)
收錄資料的深度 -- 全文 或 部分全文? 全文索引 或 部分文字索引?
更新頻率:搜尋結果網頁的新穎性與網頁連結的有效性 (crawling intervals) ? Search Engine Showdown Search Engine Statistics: Freshness Showdown
資料索引及比對技術
搜尋結果的數量 ( 回收率 ) ? 與問題相關的比例有多少 ? (精確率)
搜尋引擎的特色:特殊檢索功能 ? 同音 (科林頓 or 柯林頓 )? 容錯 ? 多國語言 ?
是否容易使用 ? 是否有足夠的說明來協助你建立查詢策略 ?
結果顯示
是否包括摘要、檔案大小或日期、 相關性評分顯示 、查詢資料結果是否重覆 ?
是否足夠讓你判斷網頁與問題的相關性 (cluster, snapshot)?
排列是否合理 (paid listings, e.g.Yahoo !奇摩搜尋 什麼是關鍵字廣告, Google 廣告服務) ?
[回頁首]Joe Barker What Makes a Search Engine Good?
|
|
|
Boolean AND | 預設、無需加符號 | AND 或 & 或 + |
Boolean OR | 無 | ,或 OR 或 | |
Boolean NOT | - | NOT 或 ! 或 - |
phrase | "" | no |
proximity | no | 空格 |
truncation | no | no |
field search | link: site: | no |
natural language | yes | yes |
*Google 提供相似網頁查詢,可擴充查詢結果
Google 使用說明 http://www.google.com/intl/zh-TW/help.html
*Google ToolBar http://toolbar.google.com/
Search Engine Watch http://searchenginewatch.com/Sherman, Chris and Gary Price. The invisible Web:uncovering information sources search engines can’t see. Medford, New Jersey:Information Today, Inc., 2001. (ZA4450 S54 2001) <http://www.invisible-web.net/>
Greg R. Notess Search Engine Showdown : the Users' Guide to Web Searching