2008年10月6日 星期一

No Blames on Users(10/1)

我覺得Mu教授研究的這個問題很有趣,如何解決使用者與資訊提供者之間對於相同語意卻不同用詞、文字架構甚至不同文字間的互通問題。Mu教授的做法是,在同樣語言的檢索中,利用不一樣的演算法─LSI(Latent Semantic Indexing)來獲取相關概念上較為接近的詞彙,以建立檢索相同語意詞彙的可能性。一篇文章在經由LSI的分析後,便會分析出整篇文章所包含的詞彙,並將各詞彙賦予一個在距陣上的位置,藉由分析詞彙在距陣上的距離,以得知詞彙的相關性。

如果這項技術未來能取得更大的進展,勢必會對人類的知識傳播再造成一波衝擊。只要藉由搜尋引擎,便可以把相關語意的資訊全都集結起來,打破語言的隔閡,絕對會促進新知識產出的速度。雖然,高度結構化的資料庫系統仍是現行作為資訊檢索的唯一途徑,但一旦有技術可以在結構化的系統上發展出語意的連結,便可以改變現有的檢索效能,突破詞彙與語言結構的框架。

沒有留言: