« 韓国の歴史は五千年かぁ(嘆息) | トップページ | 西尾幹二というオタク »

2003.11.29

オントロジーのW3C規格化は無駄

 新しく取り上げるほどの社会的な話題はない。歴史的な話題にしてもいいのだが、趣向を変えてオントロジーの話を書く。とはいえ、この話題を書くのはためらうものがある。自分がこの分野にすでにロートルなので、たいした情報が提供できるわけではないからだ。が、どうせ私的なブログなのでメモがてらに書いてみよう。社会問題の話題を期待している読者がいたら、申し訳ない。一回休みである。
 W3Cに祀り上げらたティム・バーナーズ・リー(Timothy John Berners-Lee)だが、最近RDFを深化させた形でセマンティックWebを提唱している。ようは、RDF(Resource Description Framework )の上にオントロジーを載っけるのだ。ほぉ、そう来たかという感じもした。
 はてなさえブログブームに推されてRSSを付加するようになったので、RSSについては一般認知度が上がった。とはいえ、RSS標準化はなんだかな状態になっているので略語の解説すらできない。が、現状はとくにRSSのサマリー機能などが生きているわけでもないでこんなものだろう。
 技術的にはRSSのベースになるRDFが重要だが、ちとWeb上の用語事典をひいても要領を得ない。用語の直訳に肉付けて「提供する情報についてのメタデータ表現方法の枠組み」ということくらいか。ま、そんなところ。
 バーナーズリーがNeXTファンから出てきたように、RDFも歴史的にはApple由来なので(*1)、このあたりの80年代テクノロジーは歴史的に整理されたほうがいいが、オントロジーを含め、山形浩生にはできても浅田彰では無理だろう、ってな冗談をさておき、山形もチョムスキーのことなどまるで知らなかったようなので、言語学や言語哲学的な素養はなさそうだ。なんとなくだが山形はよしもとばななようにバロウズ(William S. Burroughs)に傾倒するからというわけではないが文系的な人なのだろう。センター試験以降の世代の文系/理系の対立はどうも表出差だけのようは文系のような気がするがと余談が長すぎ。それにしてもなぜ「バローズ」じゃないのだろうか。
 RDFのApple起源だが、MCF(Meta Content Framework)になる。日本ではどのように解説しているかこれもWeb上の用語事典をひいて要領を得ない。なんだ? それに奇っ怪なのだが、どの解説もcontentをcontentsとしているなぜなんだろう?って疑問に思うまでもなく孫引きのようだ。Webの情報というのは、てめーのことを棚に上げて言うと孫引きばっかでそれが実体化するというオントロジーがありそうだ、というのは話が端折りすぎ。MCFについては、An MCF Tutorialに詳しいが、こんなうち捨てられた技術に関心を持つのは私のような歴史家だけである(嘘)。MCFはNetscape Communicationsが買い取り、その後HTML同様XML化されて1999年2月にW3C勧告となった(*2)のだが、今の時点で振り返ると、HTMLは出来そこないのSGMLから出来たみたいなものだが、Netscape CommunicationsはMCFベースのHTMLを考案していたのではないだろうか。Webの歴史の定説はただ孫引きの実体化では?とも思うが、いずれにせよ、RDFがHTMLを食い破って復活しそうというわけだ。
 RDFはデータベース的に見て便利だが、さて、オントロジーとなると、そんなもの要るのか疑問な感じがする。悪態をたれると、あの馬鹿な認知心理学者や人工知能学者がマシンベースで博士論文でもふかそうっていうことかトホホ、君たち懲りないねという感じだが、それでもシソーラス程度のオントロジーの仕組みはWebに欲しいというのはわからないではない。
 と急いだが、オントロジーとはふざけた命名だが、提唱者っぽいTom Gruberは"Short answer: An ontology is a specification of a conceptualization. "と簡素に言っているので、意味はわかりやすい。概念の定式化とでも訳そうか。なぜ、「オントロジー」かという由来はよくわからん。


The word "ontology" seems to generate a lot of controversy in discussions about AI. It has a long history in philosophy, in which it refers to the subject of existence. It is also often confused with epistemology, which is about knowledge and knowing.
 In the context of knowledge sharing, I use the term ontology to mean a specification of a conceptualization. That is, an ontology is a description (like a formal specification of a program) of the concepts and relationships that can exist for an agent or a community of agents. This definition is consistent with the usage of ontology as set-of-concept-definitions, but more general. And it is certainly a different sense of the word than its use in philosophy.

 ま、哲学も知らない馬鹿が洒落で付けたということのようだが、"the subject of existence"という西洋人の発想に起点がある。これについては、私はうんざりするほど解説できるのだが、うざいのでパス。ただ、ちと関連で言うと、最近流行の「クオリア」についても結局は存在論に還元され、言語哲学的にナンセンスになるだろうと私は考えている。「りんごのクオリア」というとき、「りんご」という名辞を超越的に(外在・実在的に)措定できる阿呆でなければ、「りんご」の意味の充足はまさにその「クオリア」の集合にならざるをえず、なのにクオリアというのは個人の命名しがたい感触にして脳内のネットワークという洒落なので、結局独我論的な閉鎖でしかない。そこからは他者に通じる名辞としての「りんご」はどこからも発生しない。結局この問題はクオリアというのは「りんご」による言語ゲームの表出の一つであり、ま、こうしたネタで哲学的なエッセーを書くというライターの飯の種でしかない。と、くさし。
 「オントロジー」という洒落はどうでもよいが、分野としては、認知心理学者や人工知能学者の残党などに継承されているのか、工学的にはそう無意味でないツラはしている。わかりやすそうな「オントロジー工学:チュートリアル」を読むと、懐かしくてサイモンとガーファンクルじゃねーや、カッツとフォーダー(Katz&Fodor)(*3)でも歌ってしまいそうだ。"The structure of a semantic theory"(1964) 。古いなぁ。東京オリンピックだ。1957年以降の生成文法史の学習なんて知的廃棄物の山なんで、若い人たぁ、こんなもの系統だって勉強する必要はねーよとこれまで私的に言ってきたものだが、どうも了見が違うな。この廃棄物の山に埋もれて死んだ私のような屍を見せておかないと、つい装いを変えて再利用ってなことになりかねない。環境保護のリサイクルはいいけど、古典に裏付けのない工学的な知識の再利用は虻みたいなのが集まるだけだよ、とくさしだか嘆きだか自嘲だか。
 「オントロジー」なんて、なあんてことない生成意味論をマシンインプルメントに焼き直しているだけじゃんか。くだらないもほどがあるぜ、と思うけど、認知心理学者や人工知能学者の馬鹿たれどもはGB理論時代にprologでrewriting grammarのインプルメントをやっていたから、ま、理系っていうのはそんなものかと、くさす。が、なんとも荒涼とした風景だな。20年後にはミニマル主義理論の格整合性フィルタリングとかがインプルメントされるのだろう。とほほ。音声認識や自動翻訳すらできないのにタメのモデルはできるのだ。
 話をティム・バーナーズ・リー提唱のセマンティックWebに戻すと、ここでは、"Ontology vocabulary"とヘンテコな英語だが、それでも謙虚に「語彙」に着目していることがわかる。「オントロジー語彙」ということで、ようはシソーラスに徹していくわけなんだろうが…その先がちとわからん。
 「オントロジー語彙」になぜOWL(Web Ontology Language)(*4)が必要なのだろうか?という疑問を投げかけると、先日の電子メールは手紙かのように、法学の考え方が理解されていないってなことになるのだろうか。もちろん、オントロジーの定義通り、a specification of a conceptualizationなのだから、そのspecificationに言語が必要なのはわかる。わからないのは、実際論だ。たとえば、サンプルコードをみるほうが理解しやすいので、こうだ。

<owl:Class rdf:ID="Pasta">
<rdfs:subClassOf rdf:resource="#EdibleThing"/>
<owl:disjointWith rdf:resource="#Dessert"/>
<owl:disjointWith rdf:resource="#Fruit"/>
</owl:Class>

 Pasta(パスタ)クラスは#EdibleThing(食べ物)サブクラスで、#Dessert(デザート)まは#Fruit(フルーツ)とは異なる、というのだが、おまえ、阿呆? もちろん、サンプルなのはわかる。だが、こんな話ではディオゲネスは樽の中でいびきをかいているだけだ。私の疑問は、これっていうのは、現在のRSSがマシン出力であるように、OWLもマシン内部の問題ではないか。たとえば、_| ̄|○でぐぐるとヴィルヘルム・レームブルックの彫像が出てくるように、シソーラスはマシン内で勝手にやればいいのではないか。繰り返すが、Googleのように現実のマテリアルを使って、ディスクリプティブなシソーラスを作り上げるアルゴリズムを開発すればいいだけではないのか。
 ティム・バーナーズ・リーのモデルだと、未仕様とはいえ、「オントロジー語彙」の上に、Login、Proof、Trustと載せているが、このあたりは、悪しきチョムスキー主義者たちの弊害のような気がする。といっても、反米テロを支持するわけじゃないがってな洒落はさておき、実際のところチョムスキーのSyntaxとはモンタギュー文法(*5)の命題の記述、つまりLogicとほぼ等価だ(違うって言われそうだがね)。Proofはようするに真理値(またはmodal)になるだろう。Trustに来て世界知識となるのかもしれない。ま、空想めくが、それでもこのスキームに潜む真理探究の臭いがれいのユニーバーサリズムと同様に宗教臭くてたまらない。ゲド戦記の世界にはドラゴンが存在する。それをOWLで記述されてはたまらない。人間は死後復活することすらできなるではないか。
 もちろん、そんなことは言いがかりだ。冗談である。冗談でない点だけ言って終わりにすれば、シソーラスなどは特定の企業の情報サービス出力のリソースでいい。W3CがOASISにタメはるのはいいとして(ご勝手にどうぞである)、この手の研究に国が金を注ぎ込むのは無駄だと思う。

注記
*1:エージェントの開発にリキ入れていたビルアトキンソンBill Atkinsonがかんでいたか。
*2:http://www.w3.org/TR/NOTE-MCF-XML-970624/
*3:Katz, Jerrold J. and Jerry A. Fodor
*4:http://www.kanzaki.com/docs/sw/webont-owl.html
*5:http://www.lang.nagoya-u.ac.jp/~tonoike/semantics.html

|

« 韓国の歴史は五千年かぁ(嘆息) | トップページ | 西尾幹二というオタク »

「ネット」カテゴリの記事

コメント

馬場健太の思想心理学というブログで
貴ブログの盗用をしています。
全く同じ記事がありました。

投稿: | 2008.09.04 20:28

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: オントロジーのW3C規格化は無駄:

» セマンティック・ウェブの失敗とブログ司会者の必要性 [Proving grounds of the mad Internet]
セマンティック・ウェブ(Semantic Web)は一過性のbuzz wordかと思っていたら、次世代webの本命と見なされているようだ。近頃はブログが(RDF... [続きを読む]

受信: 2005.02.05 02:53

« 韓国の歴史は五千年かぁ(嘆息) | トップページ | 西尾幹二というオタク »