Googleを超えるWeb3.0技術 〜人工知能を持ったSemantic Webの世界

2008年8月16日のエントリーで、10年後のIT社会インフラのキーワードは、Wikiクラウド・コンピューティングメタバースメタデータではないか、そして、メタデータが10年後の電子空間の中で浮遊するコンテンツやオブジェクトを有機的に(=意味的に)繋げる有力なソリューション・タグになるのではないかという将来展望話を書いた。

現在のWeb2.0の時代には、お互いが繋がりあって知識を高めていくソーシャルネットワーク性が1つの重要な機能として喧伝されている。私が今書いているブログや参加しているSNSなどでは、まさに様々なネット上の人々との知識連携の高まりを体感している。
しかしながら、類似コンテンツや仲間を探す際には、あくまで過去のログの中の断片的なキ−ワード検索(単なる単語検索)により、類似エントリーを探し出してくるに留まっているのが現状だ。だから、自分が表現しようとした文章や主張内容の意味を推論して、その先を読んだ情報や仲間まで取ってきてくれる人工知能的な機能まであると助かるのだが・・・といつもつくづく思ったりする。

最近メタデータ株式会社の野村さんによる「ソーシャルとセマンティックの関係について」というエントリーが出された。そこでは、私も以前から関心を持っていた次世代のSemantic Webを動かす鍵となるメタデータについての詳細な解説もあったので、8月16日の自分のエントリーをリバイスするつもりでSemantic Webがもたらす新たなソーシャルネットワークがどのようなものなのか整理してみる。(野村さんの個人ブログ「野村直之の日記」はこちら

Googleのキーワード検索に対抗するため、米国のYahooやMicrosoftは、メタデータによる意味の関連付けを自動的に行うSemantic Webで次なるパラダイスを築こうとしている。Yahooは2008年5月15日に、Semantic Web業界標準をサポートした検索プラットフォーム「SearchMonkey」を一般公開し、Microsoftも2008年3月5日にSemantic Web関連機能を搭載したInternet Explorer8のベータ版をリリースしている。

これまでのWebの発展の歴史は、
1.ディレクトリ技術をベースにWorld Wide Webが普及したWeb1.0の時代(1990年〜2000年)、
2.キーワード検索技術を中心にソーシャルWeb(mixiFacebookといったSNSソーシャルブックマークやブログが作り出す有機的なコミュニティWeb)が普及したWeb2.0の時代(2000年〜2010年)と進化してきた。
そして、今後、
3.メタデータを自動生成・自動的にタグ付けされる知能度の高いSemantic Webが普及するWeb3.0の時代(2010年〜2020年)、更には、
4.Semantic検索が発展し人工知能Webが普及するWeb4.0の時代(2020年〜2030年)
に進化していくと言われている(詳細はセマンティックWeb概論を参照)。
まさに、今は、Web3.0の時代を牽引するSemantic Webのテイクオフに向けての胎動が始まっている時期と言えるのだろう。

現在のWeb2.0の時代においては、データの重要性に加えて、ユーザー参加、分類カテゴリもフォークソノミーという形でボトムアップに決めてゆくCGM(Consumer Generated Media)の流れが確立されてきている。しかしながら、そこでのオブジェクト間の関連付けはGoogleが主導してきたキーワード検索が中心で、AmazonのレコメンドサービスエンジンやYahoo Japanのインタレストマッチにしても、過去の履歴を傾向として平均化し「過去の総合点」で判断するに留まっているというところに限界があるのだという。ここではSEOのようなランクアップしやすいキーワードを意図的に埋め込むような操作が生じたり、自分が本当に知りたい意味を解釈した検索はできないなども問題が生じることになる。これがWeb2.0の限界と言うことになるのだろう。

Web3.0の時代に求められるのは、既存情報の過去の履歴をたどって、なるべくそれに沿った情報探求の経路を真似ることで過去の経験値を活かして、今まで知らなかった未知の有用な情報を自動的に取ってくる機能が求められる。Semantic Webでは、メタデータの自動付与やメタデータ間の自動的な関連付けにより、メタデータを活用した高精度の検索機能がエージェント・ソフトウェアの技術によって求められるのだろう。ユーザーがWebデータ形式などを知らなくてもトップダウン型で既存情報の分析結果のみがアウトプットされるようなソフトウェア技術が求められるということなのだろう。
そこでは、メタデータ(属性情報)やオントロジー(メタデータ間の関係を紐解く辞書)、推論ルールの業界全体での共通化メタデータではRDFオントロジーではOWL)は当然として、個々のソフトウェア開発では、検索すべき論理構造に当てはまるオントロジーを参照しながら、キーワード検索ではひっかかってこない情報を収集して分析・評価・選別できる仕組みを作っておくことが求められるという。

こうしてWeb3.0の時代には、上記のような洗練されたエージェント機能が、新しい有用な情報の候補を探し出し、個人やコミュニティを中心とした知識創造のサイクルが回っていくことが予想される。

複数人が共同してWebブラウザから簡単にWebページの発行・編集などが行なえ、閲覧者が簡単にページを修正したり、新しいページを追加したりできるWikiは、セマンティックWebの登場により、より自動化された知識創造の情報集合体に発展していくような気がする。
クラウドコンピューティングは、こうしたWeb上の有機的な知識創造を支えていく機構エンジンの役割を果たしてゆくのだろう。そして、クラウドコンピューティング機能の形態は、今のところの整理では2月3日エントリー「巨大なクラウド・インフラ企業に進化するAmazon.com」でも書いたように、アプリケーションを提供するSaaS(Software as a Service)、開発プラットフォームを提供するPaaS(Platform as a Service、ハードウエアなどのインフラを提供するIaaS(Infrastructure as a Service)の3種類があり、それぞれの得意分野に立った各種事業者がサービスを提供しているというのが現状なのだろう。

最後に、メタデータ株式会社の野村さんが提供するIE8アクセラレータの5WIH Mextractrのサイトを紹介しておきます。「人力でのキーワード抽出の手間が省け、Web閲覧・検索の時間を大幅に短縮できる。また、コピー&ペーストによる人力ミスなども防げる。そのうえで、ダイレクトにページにアクセスできるので、欲しい情報を確実に手に入れることができる」ということで、いち早く、Semantic Webの世界を体験してみたいと思う。
人気ブログランキングへにほんブログ村 IT技術ブログ IT技術評論・デジタル評論へRSS新着情報配信