言語は奥深いです。実に奥深い。
よく話すのですが検索エンジンの生クエリーを見ていると人間の多様性が浮き彫りになります。「iPod」というキーワードは「i-pod」「アイポッド」「愛ポッド」「ipof」など目で確認するだけでも50種類は軽くあります。Googleなど検索エンジンは学習により、基本形「iPod」になるべく集約してくれているので、最近だとあまりタイポは意識しなくなったかもしれません。
日本語は言語解析という意味では言語特性としても難しいのでチャレンジは多いと思っています。ひらがな、カタカナ、漢字、ローマ字が混在する形で使っていますし、英語のようにスペース分ちがないからです。2バイト文字を言語にもった国はどこもそれなりの苦労があるかもしれません。その頃も「英語はまだ楽なほうだよな〜」と思ったものです。
僕は個人的にセマンティックウェブの世界を信じるほうですが、上記のように日本語が抱える課題を考えると道のりは長いと思ってはいます。
同じようにセマンティックウェブの世界を信じて日々努力しているベンチャーがあって個人的に応援しています。Studio Ousiaという会社です。LinkifyというプロダクトのAPIを使ってウェブサイトやモバイルアプリに機能を組み込むことで、テキスト内のキーワードを自動的にリンク化し、検索する機能を簡単に組み込むことができます。
PCのウェブサイトでも組み込めるので早速このQuantum Leapブログでもやってみました。Javascriptを1行入れるだけなのであっという間にできました。で、ブログの文中に点線のリンクが出ているのがお分かりになると思います。
リンクをクリックするとWikiやGoogleなどへのリンクがポップアップで出てきます。ニュースサイトやブログオーナーは自身のAdSense(for Search)とリンクすることができるので、広告収入につなげることも可能です。
日本語解析をして、リンク化する技術もさることながら、なんでもかんでもリンク化してもダメ。そのバランスポイントを模索するのもテクノロジーの一部なのだと思います。全体のコンテキストが理解できて、初めてその中のどのキーワードが読者にとって一番意味があり興味があるか、という点ですね。
今後ますますスマホが情報収集の主たる端末になることを考えると、パッと目に入ったテキストをキーワードとして検索ができるのはとても便利だと思います。こういった取り組みは今後のウェブの利用をさらに進化させていく可能性があるかと思い大いに期待しています。何よりもとても実直に日本語解析に取り組んでいるので応援したいと思います。
Linkify
http://www.linkify.mobi/
Studio Ousia
http://www.ousia.jp/ja/
In USA you will notice U.S. everyplace, every city and 24/7. we tend to truly wish to serve you the foremost effective things with 100% satisfactions. it's very taxing to say once exactly got to be compelled to cash your check. usually it ought to very difficult to cash if it isn't official hours.
返信削除check cashing