___________________________________
pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_p


    メールマガジン 「語ろうか、手話について」

No. 48 Rev.1                                        2002年 5月22日発行
pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_pq_p
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

  皆さん、こんにちは。暑くなったり、寒くなったり、よくわからない天気が
続きますが、いかがお過ごしでしょうか。

  最初に手話とは関係ないのですが、コンピュータウィルスの話を。これはと
てもすごい話だと思うのですが、私は、このメルマガを読んでいる人からは、
ほとんどウィルス付きのメールは送られてこないのです。発行者によっては、
かなりの数が送られてくるらしいのですが。でも、私の所属している手話サー
クルではウィルスが大流行です。ついでに、実はウィルスでないのに、ウィル
スであるといった偽情報(デマウィルス)も大流行です。

  ということで、そんな人のためにとても便利なサイトを紹介します。
  IPA セキュリティセンター
  http://www.ipa.go.jp/security/index.html

  普通はワクチンソフトを入れて定期的にメンテナンスをすれば、ウィルスに
かかることはありませんけど、すごいウィルスが発生したとか、本当か嘘かわ
からないメールが送られてきた時には、上記のページを見て下さい。

  個人的に、メールでの偽情報で思い出深いのが「AB型Rh-の血液型の人を探
しています」というのがありました。私が最初にこのメールを見たのはもう10
年ぐらい前で、その時は完全に嘘でした。でも、5年ぐらい前に本当に必要と
した人が病院のパソコンから発信したことがあって、その時は血液も集まった
そうですが、同時に病院のパソコンもパンクしたそうです。大事な話は電話を
使いましょう。最近流行しているjdbgmgr.exeのデマウィルス情報も、私に電
話で問い合わせした人がいて、そこでデマと言うことを教えてあげられたの
で、その人からはストップできました。ということで、道具はうまく使い分け
ましょう。

----------------------------------------------------------------------

 それでは、今日の本題。「自然言語処理学から見た手話」の第1回目です。

 でも、始める前に前口上を。

 「言語学」というと、すごく堅苦しく感じる人も多いと思います。なにか小
難しい学問、というイメージが一般的ではないでしょうか。先週見てきた通り
言語学の主流は、言語の構造を調べていくもので、それがさらに細分化されて
音韻論とか構文論とか語用論と呼ばれています。

  昨年の大阪の全通研学校は言語学がテーマでしたが、講義の後に、ほとんど
質問が出ませんでした。私は、さもありなん、と思っていました。だって、わ
かりにくかったですものね。難しいわけじゃないんです。わかりにくかったん
だと思うのです。だから、質問も少なかったのではないかと思います。

  でも、質問が少ない時の講義ほど、もったいないものはありません。他の全
通研講座の場合、例えば、介護保険の話とか、障害者支援の話とかになると、
皆さん、すごく面白い質問をしていますよね。実例研究なんかになると、家族
がいない場合はどうするのかとか、聴覚以外に阪神麻痺の場合の支援はどうす
るのかとか、とても具体的で、実践的にも役に立つような質問が出てくるじゃ
ないですか。それが、言語学の発表になるとシーンとしているのは、単に参加
者の人が言語学に慣れていないだけだと思うんですよね。

  そんな場合にとてもお勧めな質問があります。それが「それ、何の役に立つ
んですか?」です。これ意外と面白い質問なんですよ。この質問をして、さら
に訳のわからない答えをした人は、たぶんわかってない。私の経験からして、
地に足をついた学問はやってないですね。理解が中途半端とか、耳学問な人が
多い。逆に、この質問に対して、聞き手のレベルにあわせてこようとする人は
かなりできる人です。もしくは自分の信念を貫いた答えをする人。これもある
意味面白いです。例えば「面白いから!」と断言した人もいます。いやー、こ
れはこれでさわやかでしたね。私は、心の中で「どひゃー、なんて正直な人
だぁ。でも面白いから許すー」と叫んでました。学問なんて、面白いからやっ
ているという面は欠かせませんから。他には、実直に、通訳の際の具体的な場
面を例文に出して、その時にわかりやすい表現を作り出すことに使える、と説
明してくれた人もいます。最低だったのは、講演の内容を少し繰り返した後、
「これは説明するのが難しい」で終わった人。もう10年近く前の話ですが、
「あんたがわかってないだけなんじゃないの?」と疑問に思ったことを今でも
覚えています。

  ということで、必ずしも万人の納得する答えでなくてもいいとは思います。
単に楽しいから、という答えもありでしょうし、手話を覚えやすい方法や通訳
技術を向上させるヒントを探すためというのもありでしょう。昨年はお好み焼
きの手話表現の解説があったのですが、では、その2つの表現があるとして、
それが何の役に立つのか? 手話の勉強に役立つのか? 未知単語の表現の参考に
なるのか? それとも単なる知的好奇心を満足させるだけなのか? そういうふう
に突き詰めていくと、あぁ言語学ってそんなことなのね、なかなか面白いじゃ
ん、って感じてくれるのではないかなぁ、と思います。

  とにかく言語学だからと言って、あまり堅苦しく思うこともありません。そ
れに言語学にも色々ありますが、フィールドワーク的なものだと、方言を対象
にした研究があります。これは、皆さんも何かの時に話題にしませんか? 綺麗
な大阪弁はこうだ、とか、石川ではこう言うとか。もちろん、言語「学」のレ
ベルまで高めるには、先週述べたような音韻論や構文論の基本的な知識、いわ
ば分析の道具を持っていなければなりませんが、素人の直感でも結構面白さを
感じることはできると思います。ただ、その延長で学問を究めようとすれば、
いくつかのお約束ごとや流派を覚えなければなりませんが。
  例えば、鋸やかなづちがあれば、大工さんは家を建てられますが、素人では
棚を作るのがせいぜいでしょう。でも、棚を作ることも十分面白いじゃないで
すか。棚を作る面白さがわかれば、家を造る大工さんの話はとても面白いはず
です。

  そして、今回から始まる「自然言語処理学」で紹介するものは、電気マルノ
コに、エア釘打ち機みたいな道具です。少し重くて取り扱いには苦労しますけ
ど、使いこなせるようになれば、素人でもとてつもないことができる道具で
す。伝統的な大工仕事を懐かしむ人には、違和感があるかもしれませんけど、
こんな方法もあるんだって事をちょっと覗いてみて下さい。
  ちなみに、最近ちょっと見た(本屋でちょっとだけ「見た」だけで、「読ん
だ」のではないことにご注意)言語学の本を読んでいて、ふと思ったのですが
自然言語処理学が電気マルノコにエア釘打ち機なら、言語学は顕微鏡にピン
セットという感じがします。つまり後者は分析に向いているような印象を受け
ました。例え話をいつまでもやっていると、本筋からどんどんずれていくので
そろそろ本当に本題に入ります。

----------------------------------------------------------------------

  「手話は言語である」と唱えられたのは、そもそも、ろう運動の中で、ろう
者の社会的な地位向上の戦略的手法としてのことだと思います。そのため、学
術上、手話を扱った最初の分野が「言語学」であったことは、自然な流れでし
た。
  しかし、1つの現象に対して、普通は複数のアプローチがあります。No.43と
No.46でお話ししていた「脳」にしても、直接解剖する医学から、心の働きと
して解析する精神医学、脳の構造の再現から機能を解析する人工知能工学、動
物の脳との比較で解析する生物学、言語の働きから解析する言語学、人の成長
から解析する教育学など、様々なアプローチがなされています。手話も言語学
だけに独占させておくなんて、もったいない! こんな面白い研究テーマを他の
分野がほっておくはずがありません。ということで、今回から数回かけて、私
が所属していた自然言語処理学からの手話へのアプローチについて語っていき
ます。

  余談ですが、以下、情報処理業界の慣習に従って、「コンピュータ」のこと
を「計算機」と書きます。そうしないと、いまひとつ調子が出ないので、ご了
解ください。「計算機」といっても、電卓のようなちゃちなものではなく、普
通のパソコンから、ウン十億円するスーパーコンピュータまでのあらゆるコン
ピュータの総称であることを頭に留めておいてください。

----------------------------------------------------------------------

  自然言語処理学(Natural Language Processing:略してNL)とは、計算機で言
語を処理する学問です。計算機科学で「言語」というと、C++やJava、BASICの
ようなプログラミング言語が思い当たりますが、それと区別する意味で、日本
語や英語のような人間が使う言語を「自然言語」と呼んでいます。

  人間の言葉を計算機で扱う、というと非常に漠然としていますが、その漠然
さが自然言語処理学の特徴であるともいえます。一応、工学の、計算機科学の
人工知能分野に分類されていますが、内容は多分に学際的です。つまり、なん
でもありです。コンピュータ科学を基本として、言語学や数学、社会科学のテ
クニックを駆使する学問です。

  自然言語処理学の成果として、皆さんになじみがあるのは、ワープロの仮名
漢字変換やgooやGoogleといった情報検索システムでしょう。仮名漢字変換とは
MS-IMEやATOKのことです。このソフトを作るためには、計算機のプログラミン
グ技術が必要で、日本語を処理するために日本語文法の知識が必要で、古語や
流行語なども入力するためには民族学(というか一般社会常識)の知識も必要に
なってきて、打ち込みやすさは人間工学の成果が必要です。これらを全部ひっ
くるめて自然言語処理と呼んでいます。

  言語や社会といったあやふやなものを扱いながらも、基盤としてコンピュー
タで再現することを信条としているので、納得しやすい学問だと私は考えてい
ます。

  私が思うに、自然言語処理の目標は2つあります。

  1つは、人間の言語処理を計算機上に再現することで、人間の脳の働きや知
的活動を解明しようということです。少し大きな枠組みに、人工知能という分
野があります。これは計算機で知能を実現しようという学問です。知能という
のは、記憶したり、学習したり、発想するというような脳の活動を指しますが
自然言語処理は、特に言語を重要な拠点として、研究するわけです。再現する
ためには、原理を明らかにする必要があり、それがわかれば、脳の動きも解明
できるというわけです。
  人により、このあたりの考え方は温度差があり、以前の私のように「言語機
能 = 脳の活動」と考える人から、とりあえず言語活動が解明しやすそうだから
手始めに研究していると考える人まで様々です。
  まとめると、脳の中で言語がどのように動いているかの理屈を考え、それを
計算機上で再現することで立証しようとする研究です。

  もう1つは役に立つ言語処理機械を作るということ。これは車を作って早く
移動しようとか、トラックを作って物を沢山運ぼう、という考え方の延長で、
言葉を使う原理を解明することで、文章を代筆させたり、翻訳させたり、わか
りやすく書き直すような便利な機械を作ろうという目標です。元々、自然言語
処理は論文の翻訳をさせたいというアメリカのプロジェクトを源流としており
自然言語処理というと、この方面の研究がほとんどです。

  自然言語処理学では計算機を使います。計算機科学から発達した学問ですか
ら、当然とも言えますが、その理由は2つあると考えてます。1つは、理論を計
算機上で再現することで客観性を得ること。2つ目の理由は、その再現結果を
有用な道具として作り込むことです。私は自然言語処理という学問はそういう
ものだと考えています。

----------------------------------------------------------------------

  手話は言語学で研究されることが、今でも主流ではありますが、私が自然言
語処理学でやってみようと思ったのは、元々計算機科学を専攻していたことと
工学的な客観性がとても科学的であると思ったからです。

  科学的であるか、非科学的であるか。この言葉は特に理系の分野に主眼が置
かれて使われることが多いように感じます。数学、物理に代表される理系の分
野は客観性や再現性を重んじ、誰がなんと言おうと常に成り立つことを真実と
して発達してきた学問です。文系でも、法学の考え方は厳密ではありますが、
基準としているのが人間の感覚であるため、時代や文化的背景により異なる結
果を生み出します。その点、理系の考え方は、たとえ人間がいなくても、神が
存在しようとしまいと、成り立っている事象を真とみなす点がとてもいさぎよ
く感じます。
  自然言語処理は、文系と理系の両者の手法を持ちつつ、理系としての客観性
を持っています。私はそこに惚れ込みました。

  もっとも、理系といっても、実は千差万別です。数学のように論理の積み上
げによって構築していくようなほとんど人間の感情が入り込む余地がないよう
な学問もあれば、化学のように直感で実験して理屈を後付けするような学問も
あります。(誤解の内容に補足しますが、数学も最先端は直感的であり、化学
も計算ずくめな面があります。)私の所属していた工学、特に情報科学はコン
ピュータ上で現象を再現することにより真理を探究する学問です。その再現方
法が個人的な技術に依存することもありますし、評価段階で個人それぞれの感
性に左右されることもあります。つまり、すべて再現できる考えるのは危険な
ことです。

  「ラプラスの方程式」という話があります。これは、この世の中のものは全
て原子でできているわけだから、それらが全て把握できれば、計算を積み重ね
ていくことで全て将来がわかる、という話です。俗に決定論と呼ばれたりする
(哲学では決定という言葉が違う意味らしいので「俗に」です。)この話、正し
そうに思えるのですが、ほとんど否定されています。というのは、その計算量
が莫大であること、元の状態を把握することが難しいからです。天気予報を見
ればわかります。現在の天気予報では、超スーパーコンピューターによって現
在の気候から、明日の天気を計算して予測することがあります。でも、外れた
りします。これは気温、気圧、風の状態などの要因を正確に観測するのが難し
いこと、その精度がまだまだ予測するには荒いこと、そして要因不足がありえ
ること考えられます。さらに予測する計算式が正しいのかということも考えな
くてはなりません。

  脱線ついでにもう一つ。「バタフライ効果」という話もあります。ある蝶の
はばたきよって生じた風の動きが、地球の反対側に伝わるうちに台風になる、
こともありえるという例え話です。でも、複雑系という学問ができるぐらい、
次の動きを計算するというのは難しいことです。

  つまり、計算機による再現は完全ではないということです。理系といっても
完全な客観性というものはありえないということが言えます。しかし、少なく
とも私には計算機という道具は切れ味の鋭いナイフだと感じました。これを使
わない手はないということで、自然言語処理を選択しました。

----------------------------------------------------------------------

  話を元に戻して、自然言語処理学をもっとじっくり見ていきましょう。

  自然言語処理でやることは

             乗せる、解析する、変換する、生成する

この4つに集約されます。

  「乗せる」とは、言葉を計算機で扱えるようにすることです。元々計算機は
イギリスやアメリカが発祥の地ですから、英語しか使えませんでした。それを
色々な人が努力して、日本語が処理できるようになりました。でも、今でも文
字化けという混乱がたまに生じています。これは計算機と日本語の相性がいま
いちであることを示しています。
  手話を計算機に乗せるのは大変なことです。手話は文字がありませんから、
日本語のようにはいきません。ビデオをMPEGなどの動画で計算機に乗せている
という反論もあるかもしれませんが、動画は絵であり、記号としての分析がで
きません。そうすると、自然言語処理という技術が全く使えないのです。です
から、まず手話を記号にして、計算機に乗せる必要があります。

  手話の文字を作る。そういう試みは数多くあります。あまりにも昔からあり
すぎて、たぶん、一番最初に誰が考え出したかは誰にもわからないと思います
が、そんな中でも、アメリカのストーキー先生の研究は元祖だろうと言われて
います。ストーキー先生はアメリカの手話の構造を最初に研究した人と言われ
ており、手話単語を手の動き、位置、形に分解し、それらを記号として書き下
しました。ストーキー先生は、そこから手話が言語であることを示したのです
が、その話は今回は省略。(私もよく理解していないので。)そして、その、書
き下す方法は「ストーキーの表記法」と呼ばれています。しかし、これが大変
難しい。何が難しいかというと、表記に使う記号が英語のアルファベットでは
ないのです。手の形はA,B,Cという文字を使いますが、位置は[や数学の積集合
のような記号を使い、動きに至ってはふにゃふにゃとした線のような記号まで
あります。確かに手話を表現するのに、曲線を使うと楽なのですが、計算機に
は乗りません。そういう記号が入っていないからです。ですから、ストーキー
の表記法は、そのままでは計算機では使えません。

  絵文字といえば、サットン式表記法というものがあります。これは手や腕を
単純な線の組み合わせで表記する方法で、細かいところはちょいと注釈みたい
に細かく絵を描くことで記述する手話表記法です。メルマガでは絵をお見せで
きないので、興味のある方は日本手話研究所所報No.4(1990)を死にものぐるい
で探して見てください。実際に見ると、それほどたいしたことないと言えば、
そうなんですけど、単純な絵で手話を表記できるということを示したというこ
とでサットンという人は有名なようです。実はあんまりこの人のことを知らな
いので、この話はここまで。サットン式表記法も当然の事ながら、計算機には
乗りません。

----------------------------------------------------------------------

  計算機に乗せるには、記号化しなければなりません。それにはどうしたらい
いか。来週はその話から始めます。では、また来週。

----------------------------------------------------------------------
このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して
発行しています。http://www.mag2.com/ (マガジンID: 0000038270)
----------------------------------------------------------------------
■登録/解除の方法
  メールマガジン「語ろうか、手話について」は、以下のURLよりいつでも
  登録/解除可能です。
    http://www.mag2.com/m/0000038270.htm
    http://www.rr.iij4u.or.jp/~tokudama/kataro/
■バックナンバーの参照
    http://www.rr.iij4u.or.jp/~tokudama/kataro/
    http://backno.mag2.com/reader/Back?id=0000038270
■掲示板
    http://www64.tcup.com/6411/tokudama.html
    補助的な情報を掲載しています。編集者への連絡はMailをお使い下さい。
■苦情、文句、提案、意見など
    Subjectに[kataro]を入れて、以下のアドレスまでMailをお送り下さい。
    個別には返事ができないかもしれませんので、ご了承下さい。
      tokudama@rr.iij4u.or.jp
======================================================================
○メールマガジン「語ろうか、手話について」(週1回以上 発行)

発行: 手話サークル活性化推進対策資料室
編集: 徳田昌晃
協力: 五里、おじゃまる子、くぅ(ヘッダ作成)
発行システム: インターネットの本屋さん『まぐまぐ』http://www.mag2.com/
マガジンID: 0000038270

■意見、文句、提案、投稿は、居住都道府県名と氏名(匿名可)を添えて
  tokudama@rr.iij4u.or.jpまで送って下さい。
■メールマガジン「語ろうか、手話について」は、著作権は徳田昌晃に所属し
  ますが、基本的には転載・複写自由です。有効にご活用下さい。
======================================================================