中華民國圖書館學會電子報No.762009年2月1日出刊哈伯的天空“i-Search”-----艾文-----在今天五花八門無奇不有的資訊市場上,不僅資訊的數量多,格式多,而且品質也參差不齊。譬如一部印刷版本的《亂世佳人》(又名《飄》)(GonewiththeWind),就有多種不同格式的複製品,諸如微縮成品(Microform),錄音帶/碟(AudioCassette/CD),DVD,電影等等。假如再加上由原著衍生出來的各種相關著作和成品,那就更數不清了。因此,一位想研究MargaretMitchell或原著的學者,即使編列一則書目也可能要費上十天半月。現在網際網上也有了「電子格式」的《亂世佳人》,有關該書的一切文獻,幾乎也都可以從網際網上檢索擷取。從事“i-Search”(網際網資訊檢索),說起來最簡單不過,但是,一旦認真的做起來,卻非常的不簡單,特別是想在網際網上找尋學術研究性一類較高品質的文獻,那就更非比尋常。學術研究性的文獻講求權威、品質、價值和可信性。而隨便地Google一下或百度一下或Yahoo一下,或可以獲得成千上萬條的引文(Citation),但是其中絕大多數都不一定和尋找的論題相關,也不一定都會符合權威、品質、價值和可靠的基本要求。除非具有大海撈針的毅力和恆心,否則,網上資訊搜索者面臨的困難將遠過於在紙本位資訊堆裏摸索。且不談資訊的權威、品質和價值,在資訊的可性度上,網際網資訊,特別是那些自由放任的「全球資訊網」(WorldWideWeb)上的網訊,就不如紙本位資訊。因為一般沒有組織的網訊都缺乏嚴密的品質管理。在本質上,這類電子資訊又都具有「恆變動能」(Dynamicofperpetualchanges)和不「定型」的先天特性。這些文獻的內容不僅可以常常改變和更新,甚至還會突然間消失不見。文獻的變換無常,表示內容的不穩定,表示它的不可信。所以一般從事學術研究的學者對網際網上發表流傳的電子文獻都心存懷疑,都不願予以引證。雖然印刷出版的文獻內容品質不一定優良,價值也不一定高,但是它們屬於「定型資訊」,“白底黑字”,凝固的內容卻絕對可信1,閱者相不相信或引不引用,那又是另外一回事。2000年「美國科學發展協會」(AmericanAssociationfortheAdvancementofScience)為響應「國際科技醫出版商協會」(InternationalAssociationofScientific,TechnicalandMedicalPublishers)的請求,而擬訂了“DefiningandCertifyingElectronicPublicationinScience”2明文規定凡欲出版在網際網上傳輸的文獻都必1資訊的“可信性”是“空口無憑”的反義詞,它與資訊的品質或價值無直接關係----筆者註2AAAS:“DefiningandCertifyingElectronicPublicationinScience”,AProposaltotheInternationalAssociationofSTMPublishers,OriginallyDraftedOctober1999;RevisedMarchandJune/July2000.AccessedDecember中華民國圖書館學會電子報No.762009年2月1日出刊須經過審查核准和明確鑑定。在網際網資訊環境中,類似的文章除需接受例行審查核准以外,還需另外符合下列各點要求:1.該文章必須公開可得。2.必須知照相關社群該文章的存在。3.必須具備長期取得該文章的檢索系統,絕對不能改變。4.除非法律上不可避免,不能將該文章撤除。5.該文章必須被明確識別,例如SICI3或DOI4。6.圖書目錄(詮釋資料)必須載有該文章的簡單訊息(譬如書目和摘要)。7.該文章必須受到長期保存及維護。設定這些條件,目的就是在凝固網上文獻的內容,使它們不能隨意地更改和變動,使它們能夠和印刷版本一樣,成為“貨真價實”的「資訊成品」(InformationProducts)。近年來,網際網上的電子圖書和期刊,在可靠性上已經有了絕對性的進步,因為它們之中的絕大部份都是印刷版本的複製成品。這些換湯不換藥的電子圖書和期刊文獻,帶給了資訊搜索者世紀性的方便,然而也帶給他(她)們史無前例的困惑和煩惱。此話又從何說起呢?我們都知道,在資訊組織上,電子格式的圖書和期刊遠比印刷版本優越,不僅它們的內容都經過專家學者細心地選擇和評審,並且,為了便利檢索追蹤,出版商還精心地組織,精心地撰寫摘要、編製索引、建立主題、設計關鍵字詞和時時更新目錄,此外,更精心地為重要內容片段及圖像等建立超連接(hyperlink)。然而,在另一方面,由於這類網上電子格式的複製版本也是出版商或供應商的重要財源。為了賺取最高利潤,他們便不惜將網上電子圖書或期刊的版權或專利,盡量兜售給各個不同的索引服務公司,因而造成網上電子資料庫之間相同圖書和期刊的嚴重重疊。而重疊的時段,又多參差不一,使資訊搜索者傷透了腦筋。我們且以商業訊息為主的ABI/INFORMGlobaldatabase(ProQuest)為例,該資料庫中列載的期刊就與EBSCOhost等電子資料庫中所列載的期刊有很多重疊(見下表)5:ABI/INFORMGlobale-TitleDuplicationsasRecordedon4/6/2007EBSCO45.02%Springer5.69%USGovt5.69%2006at,,謹供參考.中華民國圖書館學會電子報No.762009年2月1日出刊Blackwell5.21%EJS4.74%MUSE3.32%Wiley2.84%Sage2.37%SciDir1.90%Others*23.22%100.00%*Others包括OpenAccess和各獨立出版商、工商機構、或學術團體的出版期刊。假若從另外一個角度來看,前述這個例子也清楚地說明一件不容否認的事實:那就是由於網上資訊供應商和索引服務公司之間契約上的限制和約束,無一網上資料庫能夠全面涵蓋同一主題的全部期刊文獻(包括不同語言的期刊),因而使得同一主題的期刊被四分五裂地分列到各個不同的資料庫。這種同屬資訊跨越各資料庫的結果,資訊搜索者就不得不搜遍很多不同的資料庫6;除此之外,每種資料庫還有它們各自不同的檢索條件、獨特的網頁設計和與眾不同的檢索程序及方法。這些檢索方法上的不同,往往會使得很多資訊搜索者不知何從。最近一些付費的網上電子圖書也擺出了新花樣,譬如Taylor&Francis就將電子圖書全書或分章分節出售。7總之,天下沒有白吃的午餐,時下,幾乎所有比較著名的網上學術性電子期刊或電子圖書,都需付費(訂閱或Pay-for-view)。因此,資訊搜索者必須走進圖書館或與圖書館的網絡連上線,否則他(她)們將很難獲得較為重要和較為周全的網上電子圖書和期刊文獻。凡此種種,再再都說明網際網資訊檢索的困難和不簡單。除非資訊搜索者都能瞭解各類網際網上資訊資源的特質和熟悉搜索它們的基本技巧,不然的話,從事網際網資訊檢索就像瞎子摸象,會得不償失。從下期開始,我們準備對網際網上的各類資訊資源和檢索技巧做簡要的介紹。spacehubble@msn.com(01/20/09)6市場上的LinkResolver績效並不完全理想.7參看(12/28/08)