ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ
              _/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
             _/_/ メールマガジン 『語ろうか、手話について』   _/_/
            _/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
No. 108                                             2005年 8月 3日発行
ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ

  こんにちは、職場の引っ越しが終わってホッとしているはずの徳田です。
  まだ、これを書いている時は準備している最中ですが、皆さんがこれを読む
時には、たぶん、無事に完了しているはず。今度の場所は20階。地震が来たら
怖そうだなぁ。

  自然言語処理シリーズを書いていて、結論に間違いがあることに気がついて
「ぁぁあぅぅ」って感じです。というわけで、あと2回ほどで最終回の予定で
したが、ちょっと最終回は先延ばしにします。

  それで、今週は、先日開催された手話学会で思ったことなどを絡めて、自然
言語処理学から見た手話研究について語ります。とは言っても、自然言語処理
学にも色々な流派があり、また、私は現在ドロップアウトしていますので、い
つものように偏見と独断を込めてお送りします。書いてあることは自然言語処
理学とうより、私の独断と思った方がいいかもしれません。

----------------------------------------------------------------------

  手話学会は、手話に関係していればなんでもあり、ということもあり、大会
発表の論文は多分に学際的、つまり、多方面の分野から出てきます。言語学が
多いのは当然として、工学、教育、歴史、社会科学はレギュラーメンバーで
す。手話学会に限定せずに、他の色々な文献を当たってみると、心理学や医学
で手話を扱った論文もそれなりにありますし、教育関係はアプローチの方法も
色々ですから、一言で、「手話」と言っても、とにかく色々あります。
  そんなわけで、手話学会に出ても、興味のある発表と、無い発表が、誰に出
もあるわけです。時々そうでない人もいるようですけど...

  私は自然言語処理学で、工学に所属しているので、工学関係なら興味あるん
だろう、と思われそうですが、そんなわけでもないんです。工学自体が幅広す
ぎ、ということもありますが、自然言語処理学は、どちらかというと、工学や
さらにその中の情報科学でも異端の存在で、言葉というわけわかめの現象を、
工学の客観性のあるきっちりした物差しで扱おうというわけですから、個人的
には言語学の方が興味があります。と言いつつ、最近の手話学会の言語学の発
表にはあまり興味がわかなかったりもします。

----------------------------------------------------------------------

  今年の手話学会では、工学関係では千葉大が頑張ってましたが、市川先生も
堀内先生も音声などの音関係が本来の専門です。自然言語処理学にも、音声は
一大分野として存在してはいるのですが、私は文字になった段階から興味があ
るので、音声からのアプローチはイマイチ食指が動きません。学生時代の私の
ボスのボスが音声の専門家なので、一応、一通り教科書レベルでは勉強したの
ですが、それ以上は何となく踏み込まなかったですね。音声まで行っちゃうと
文字よりもさらにわけわかめなんで、私の手に負えないってことが理由かな。

  言語学も、最近の手話学会で発表するような内容は、あまり興味がわきませ
ん。今年の場合ですと、市田先生の発表は、いかにも言語学らしい王道な内容
だと思いますが、私から見ると、あまりに細かすぎ。局所的な現象は、言語学
としては面白いのかもしれませんが、自然言語処理学からすると、まずは大部
分を処理できる一般的なルールを作って、次に特殊な事例を解決したいという
気持ちがあります。ですから、私が興味あるのは、網羅的な文法構築とか、辞
書の作成とか。その点で、いかにも言語学らしい、なんとかの場合の現象とか
は、そうなんだぁ、ぐらいの感心しか持てないんですよね。

  興味無いついでの話で、実は脳科学もあんまり興味がなかったりします。で
も、それこそBellugi先生の和訳書、「手は脳について何かを語るか」が刊行
された頃は、すごく興味があったのですが、最近はそれほどでもなく。
  というのは、当初、脳の解析を進めていけば、人間の思考方法がわかり、そ
れを計算機に応用することで、人間のやり方をそのままプログラムとして実現
できるのではないかと思っていたわけです。でも、何年も脳研究が進められて
現在どうなったかというと、せいぜい右脳と左脳の役割がわかったぐらい。
我々が知りたいのはニューロレベル、脳細胞の1個、1本レベルの話なんですよ
ね。そこまで到達するには、まだ何十年もかかりそうなので、興味を失いまし
た。今後、すごいfMRIが開発された時には、また夢中になるかもしれません
が。
  で、私はちょっと考え方を変えました。電卓が、人間とは違う方法で高速に
計算するように、言語処理も計算機で高速に処理する方法があるのではないか
と。得意な方法を延ばしてやることで、人間を越える言語処理能力が実現でき
れば、それはそれでOKじゃん! と考えています。昔は、構文解析過程は、人間
の短期記憶と関連しているのではないかとか、理屈付けをしていた時期もあり
ましたが、最近は、すっぱりやめてます。

----------------------------------------------------------------------

  手話の研究で多いのは分類物があります。日本手話と日本語対応手話の判別
とか、地域の手話の違いとか。分類は、一般化や網羅的構築につながるものが
多いので、それなりに注目していますが、最近は、おっこれは! と思うような
ものがないのが残念です。自然言語処理学的に言えば、それって個人辞書を
作っておいて処理段階で切り替えればいいだけだよなぁ、って思うことが多い
です。
  特にちょっと前、○○という単語は、A地域ではこれ、B地域ではこれ、と表
現が違います、という発表をいくつか見ましたが、これは典型的な辞書の切り
替えで解決できるパターンです。他にも、文法レベルでカスタマイズすれば乗
り切れるのではないかとか、自然言語処理学的には、あっさり解決するような
話が多いんですよね。

  最近、自然言語処理学的に、あれは解決済みだよなぁ、と思うのは、文法。
文法の網羅的構築には興味ありますが、実は、確率文法の学習というものが、
自然言語処理学にはありまして、これを使うと、自動的に文法が構築できるの
です。もちろん、この手品を使うためにはいくつかのトリックが必要で、解析
済みのコーパスが必要とか、最小レベルだけど高品質な文法セットが必要とか
品詞はただの記号列で後から解釈し直す必要があるとか、いくつか(中には致
命的な)デメリットはありますが、厳密でも精密な文法を作って処理が4割程度
しかできないものよりも、おおざっぱに99.9%をカバーする文法を作って、あ
との0.1%はトリックを使って処理する方が私としては有用だと思ってます。

  そんなわけで、先週、興味を持った今里先生の論文は、形態素解析というか
なりメタなレベルでの提案で、それを進めていけば、一気に精密な語彙構造が
得られそう、ということで、久しぶりにワクワクしました。

----------------------------------------------------------------------

  自然言語処理学が他分野の人から見て、いまいちと思うのは、計算機という
手段を用いて省力化をしながらも、辞書や資料作りは、とんでもない手作業を
必要とするところだと思います。
  これはかなりの部分事実で、たぶん、辞書を作る話だけでも、文系なら数本
の論文を書いてしまうのではないでしょうか。でも、自然言語処理学だと、辞
書の精密さを厳密には求めない代わりに、辞書構築は論文の実験の章にちょっ
と言及するだけ。あまり研究上は評価されません。本当は一番労力がかかって
いるところなんですけどね。労力がかかるけど、人間がなんとかできる範囲の
場合は「やればいいじゃん」って言われるのが自然言語処理。人間がなんとか
できない天文学的範囲になったら手を出さないのが自然言語処理。天文学的な
ものを人間の手に負えるようになる手法を思いついたら評価されるのが自然言
語処理。この感覚がしっくりくると、とてもいい学問です。

  でも、「手話だと、こういう特殊な文がありまして、解析が難しいです」な
んてゼミで言った時には「そんなのお前の品詞の設定が間違ってる。その品詞
を2種類にして解析すれば、せいぜいオーバーヘッドは2、3倍だろ。計算量が
2のn乗倍になるようなことになってから悩めよ」なんて言われるのが苦痛な人
は向かないでしょう。

----------------------------------------------------------------------

  自然言語処理学のいいところは、これでも工学の一派なので、最後には実験
をやって客観的な評価にまで持って行けることですね。数学なんかは、神がい
なくても数学は存在する、なんてことを言いますが、(つまり、誰がなんと言
おうと、数学的に正しいものは正しく、誰も文句がつけられない。)工学は実
験のデータがあれば、誰も文句をつけられません。だから、議論も実験の不備
とか、データが示していないところを考察になります。水掛け論にならないと
ころが気に入っています。

----------------------------------------------------------------------

  なんか、今回はいつもにまして、ダラダラと書きましたが、いくらかでも自
然言語処理シリーズに興味を持っていただけるといいんですが。

  では、次回の語ろうかをお楽しみに。

----------------------------------------------------------------------
このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して
発行しています。http://www.mag2.com/ (マガジンID: 0000038270)
----------------------------------------------------------------------
■登録/解除の方法
  メールマガジン「語ろうか、手話について」は、以下のURLよりいつでも
  登録/解除可能です。
    http://www.mag2.com/m/0000038270.htm
    http://www.rr.iij4u.or.jp/~tokudama/kataro/
■バックナンバーの参照
    http://www.rr.iij4u.or.jp/~tokudama/kataro/
    http://backno.mag2.com/reader/Back?id=0000038270
■掲示板
    http://www64.tcup.com/6411/tokudama.html
    補助的な情報を掲載しています。編集者への連絡はMailをお使い下さい。
■苦情、文句、提案、意見など
    Subjectに[kataro]を入れて、以下のアドレスまでMailをお送り下さい。
    個別には返事ができないかもしれませんので、ご了承下さい。
      tokudama@rr.iij4u.or.jp
======================================================================
○メールマガジン「語ろうか、手話について」(月1回以上 発行)

発行: 手話サークル活性化推進対策資料室
編集: 徳田昌晃
協力: 五里、おじゃまる子、くぅ(ヘッダ作成)
発行システム: インターネットの本屋さん『まぐまぐ』http://www.mag2.com/
マガジンID: 0000038270

■意見、文句、提案、投稿は、居住都道府県名と氏名(匿名可)を添えて
  tokudama@rr.iij4u.or.jpまで送って下さい。
■メールマガジン「語ろうか、手話について」は、著作権は徳田昌晃に所属し
  ますが、基本的には転載・複写自由です。有効にご活用下さい。
======================================================================