10.12.2009

[資訊組織][課前+課後心得]Metadata for all: Descriptive Standard & Metadata Sharing across Libraries, Archives, Museums




用拼圖來表達資訊組織最貼切了
各位有拼過拼圖吧?
不是誰有洞就給他補起來耶
還要看形狀的銜接以及顏色的差別
尤其是顏色,我們拼拼圖的時候,顏色是最主觀的。
總是把顏色相近的放在一塊,資訊組織亦同如此!
很主觀的將其資訊分類,成為一套屬於自己的資訊組織。
資訊組織是可以有性格的;反之,也是可以被權威所侷限的。
以下就是對資訊組織的一連串探討~


[課前心得]
隨著資訊技術與網路環境的發展,作為人類知識與文化典藏機構的圖書館、博物館與檔案館正面臨資訊時代的改變與服務角色的變遷。由於網際服務環境的發展,使得各館之間的界限顯得越來愈模糊,在民眾不用親自拜訪實體館藏下,期許能在各館之前得到更多的知識與服務,但在網路環境下更凸顯出各館的資源是獨立的梏梧。

從這篇可以得知,館與館之間的資源整合與分享,除了對各館文物權威的一種矜持外,技術上的整合也是一大困難。各館所使用的資料描述標準皆不同,主要在於Materials有它的特性在,例;圖書是一件單一的項目,但檔案是有層級性的項目,非常重視其全宗性與來源性;出版上,前者有正式的出版訊息,後者因為有些是公家機關的文件,不宜大量出版,僅供專家學者研究,故缺乏正式的出版訊息...等等因素。機構方面,前者是開放的,後者是封閉的,也造成館與館之間對於資料開放的程度上有所不一。關圖書館與檔案館就有這麼多複雜因素要考慮再加上博物館這個更帶有視覺化的文物,在資源描述的組織上以及其他因素上,可想而知會更加的複雜。

但反觀現在,三館不能在這樣獨立經營下去,尤其是圖書館面臨Google想營造出網路烏托邦之理念的衝擊下,任何資源都是免費(Google Books),再透過強大的搜尋引擎協助下,圖書館難以單打獨鬥。圖書館若能結合檔案館與博物館的話,文化產物會顯得更多彩多姿,對大眾而言會是新的吸引力,三方只要有各自訂立明確的目標相互合作推廣,可以增加對三館的利用度,進而使三館重新將社會地位提升,民眾對三館的認知也會有新的改觀。其實國外已經有在嘗試圖書館與博物館合作,甚至還與k12的學校合作,從這合作中進而改善他們的服務及項目,滿足更多樣化的用戶需求。

當然與其期待三館各自放下自己的權威矜持,將整合其資源與分享下,作者以資料類型來作描述且組織,而不是以機構來劃分制訂的想法確實好很多。也就是說三館可各自擁有各類型Materials當做該館的財產,可以透過以規定好哪些資料類型用哪些描述標準來自行組織,是互相流通的,而不是因各機構而特別制訂只有那領域下才能使用的描述,這樣一來可以使成本效益降低,並進而帶來資源分享的效益,不管是機構上的整合、還是類型上的整合,都是可以指日可待的。



[課後心得]
今天請來了台大的資訊組織的權威 - 藍教授,來到我們所上演講。

恩。。。跟上次一樣,我以為會講三館目前資訊組織的現況,畢竟教小蝶老師是給我們這篇文章,結果還是跟上禮拜一樣,PPT的主題跟文獻無關XDDDD


不過也因為這樣,讓我有機會認識更多的資訊組織另一面。這次藍教授的PPT主題是"建構描述性後設資料之理論框架:一個不成熟的個人觀點的分享",裡頭有許多藍教授以他歷年所飽讀的書籍中摘取了一堆大師的理論,這也回應了小蝶老師之前在課堂上所說的圖書資訊學提不出什麼可代表性的理論(沒有固定的,這可因人而異的),或許這些理論是資訊組織面的,亦或何嘗不是也可代表圖書資訊學的整體面呢~

這次藍教授用理論的角度,而不再是技術面去探討資訊組織,希望能用另一個角度重新找出資訊組織的定位。藍教授很喜歡把看到的各領域的理論拿來嘗試套入圖書資訊的領域,希望能藉由其他領域的觀點為圖資點注入新的活力。


一開始從 李嘉圖"恆等定理"開始講起並套用在資訊組織上,而讓他有了這個想法"如果進行資訊檢索所需花費的努力是一個常數的話,那不論採用前or後組合的方式,其所需的努力是等同的",也就是說讀者想要檢索的資料越精確詳細的話,會與其所付出的努力成正比!
這也讓我想起鋼金煉術士的等價交換 -> 要有什麼結果,就必須付出某些代價。


後來,我聽到了藍教授所說的資料庫採用主題詞,主題詞下再由通俗分類去補充,其實在老師說出這句之前我也有過這個想法,不過我的世面沒老師那麼廣,因此也問了老師是否有資料庫是有這樣的設計,因為早期我有修一門課叫做"資料庫檢索與實務",那堂課的作業讓我有機會把國內外的資料庫幾乎都用了一變,但每次都很容易與我們的認知相衝,當然這一部分也是檢索系統的演算問題,但是不能用自己所認知的概念去搜尋那確實還蠻不方便的。這也回應了老師所說的共同知識(mutual / common knowledge),也即使用者與我們之間所認知的知識是否一樣,透過此共同知識才可做出更好的資訊組織,亦能更貼近讀者的思維。

而後我也嘗試用我最近在商業周刊所看到的"長尾理論",理論如下:
1. 逐漸從專注於少數位於需求曲線頂端的熱門產品〈主流產品和市場〉,轉向曲線尾部為數眾多的利基市場。
2. 因為尾巴衡量的不僅是可供選擇的產品種類,也是受這些產品吸引的人們。
3. 一旦有了極為廣泛的產品選擇,又有過濾器去篩選這些選擇,需求曲線便變為平緩。
4. 所有的利基市場加總,可成為大市場
5. 長尾的三股力量: 生產、配銷,並幫我找到它
6. 它是80 20原則的反向思考


我一開始所承述的是,"假設主題詞是由專家所提供的是最主要的百分之20,但這些經專家給予而具有權威的主題詞並不貼近人為的思維時,是不是要考慮到剩下百分之80的主題詞之外比較通俗的詞彙,也就是大眾所賦予的分類。把長尾的三股力量套進來就是,先由大眾對這主題詞而去產生許多概念,再經由館員的配置(審核)在該主題詞之下,透過權威與同俗的主題詞結合時,會讓大眾能有更多的選擇,並幫助他們找到分類下所需的資料。

藍教授也嘗試我們去挑戰舊有的理論,透過長尾理論,可以打破原先的S. R. Ranganathan所提出的Prolegomena toLibrary Classification(London: LibraryAssociation, 1957)其中一項: The canon of parsimony 簡便性(p. 52)畢竟,我們總是認為資訊組織是要簡潔的,但其實我們所看到的許多網頁,都是亂中有序的,不見得是表面上簡潔的呈現。老師也提到有人曾經研究一個人所收到的資訊有限,但我認為那是指接收而非檢索途徑,當我們在檢索時行常不希望能有越多的主題詞彙讓我們選擇或參考呢,就如同小蝶老師在課堂上所提到的"無意中瀏覽的發現"(Serendiptious Browsing),讓我們突然想起某些關聯的概念時,是不是能激發出更多的所需的概念呢,這也是長尾的附帶價值阿!想想我們要是一直遵循這些舊有的理念時,而不嘗試做這突破時,是不是在人類對於資訊檢索便捷性這塊會失去有很大的突破性發展呢?畢竟現在技術要達到這塊不是問題,而且長尾理論也告訴我們善用這些尾巴可以創造出大市場,那在我們檢索途徑上照理說也會有重大的突破。當然這都只是假設。。。

然後,老師可能不太了解我意思,或是說我表達不夠好,而幫我修正了一下並提出另一個思維,就是通俗分類很廣,館員要把關,須從這些大量的通俗分類中,以80 20的原則篩選出百分之20來支援這個主題詞,其實這樣說也是沒有錯啦~就只是把我原先所認知的百分之80當成百分之百,再從這百分之百在再去80 20劃分。恩。。。有點繞口令,不過看的懂得人應該是知道我的意思吧。。。


然後,藍教授還有提到 圖書、目錄和目錄學階屬上層建設思想意識型態(階層級),可能是古時候的社會是中央集權的政權,教育及知識上也都是由貴族所掌握。那再看看現今的庶民社會,隨著Social Tagging的技術以及Folksonomy的出現,我們是不是要檢視這種為上層的設計分類是否可套用在現今的庶民文化,是否會有衝突?


對於資訊組織要注重"需要與必有的權衡(Sufficiency & Necessity)"


最小努力原則(Principle of Least Effort)
:
The principle of least effort is a crucial factor that affects whether a system of document representation will be used by users or not. If a system is not easy to use, users may not bother to use it. If users think that they have to spend a lot of effort to use it, they are not likely to accept it either.

使用原則(Utility Theory):
According to Cooper, utility is “simply a cover term for whatever the user finds to be of value about the system output, whether its usefulness, its entertainment or aesthetic value, or anything else”.

符號互動論(Symbolic Interactionism):
1. Human beings act toward things on the basis of the
meanings that the things have for them.
2. The meaning of such things is derived from, or arises out of, the social interaction that one has with one’s
fellows. -> the idea of significant others
3. The meanings are handled in, and modified through, an interpretative process used by the person in dealing with the things he encounters.


藍教授還提到Limits on Human Capacity for Processing Information:
Howard Resnikoff and James Dolby (1971, 1972) researched the statistical properties of information stores and access mechanisms to those stores. They found values in the range of 28.5:1 to 30:1 as the ratio of the size of one access level to another. (Cited in Bates, 2003).
也就是說人類的知識是否遵循一種規律 -> 30:1
何謂30:1,它的單位是字,即從資訊物件(from 標題 -> 目次 -> 正文)的層次比例是以30比1的方式去呈現。很特殊吧~你如果很閒的話,可以去翻每本書去數一下字,看是不是大致上符合這比例XD


Code modle vs. Inferential modle
前者是固定的解釋,基於共同知識;後者是用於個人的方式去解釋,進而產生無力論


最後,藍教授介紹我們一本書,叫做亂是一種新商機

在這網路發達的世代,無數的網頁資訊所呈現的就是一種亂,如何在亂之中找出其順序,我想這就是資訊組織新的方向,不在只是表面上的簡潔的組織,而是透過資訊組織的特性,將這亂整理成一個有秩序的亂,也就是所謂的亂中有序。這讓我想到三國演義中,曹仁所使用的八門金鎖陣,哪八門,休、生、傷、杜、景、死、驚、開,這陣看似雖亂,但有其順序,最後趙雲依照徐庶的指示而依其順序破解。我想資訊組織在這亂的世代,更顯得圖資背景的重要性,畢竟能在這龐大的亂中找到商機,也是我們的專長,更是我們的飯碗,顯示出我們是餓不死的圖資人。



參考資料:
1. 建構描述性後設資料之理論框架:一個不成熟的個人觀點的分享(Perspectives on the Theoretical
Foundations of Descriptive Metadata) - 藍文欽
2. 長尾理論 之長尾的三股力量 - 葉慶隆、蘇明雄
3. 第三十六回 玄德用計襲樊城‧元直走馬薦諸葛

參考文獻:
1. Metadata for All: Descriptive Standards & Metadata Sharing across Libraries, Arichives and Meseums - Mary W. Elings & Gunter Waibel

沒有留言:

張貼留言

搜尋此網誌