ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ _/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/ _/_/ メールマガジン 『語ろうか、手話について』 _/_/ _/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/ No. 82 2002年 7月 3日発行 ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ☆ミ みなさん、こんにちは。 今年の東京の全通研学校のテーマは「言語」だそうで、昨年の大阪と同じで すね。でも、講演者が2人入れ替わっています。そのうちの1人が2日目の午後 の本名信行先生ですが、私は、この先生の話を10年ぐらい前に聞いて手話の言 語学の面白さにとりつかれました。今振り返ると、その時の話は体系的なもの ではなくて、面白トピックを羅列した内容でしたが、写像性とか動詞の変化形 など、今まで直感的に思っていたものを理屈で裏付けしていくことに知的興 奮を感じたし、だからこうなる、それを延長していけば、これもこうなる、と まるでパズルを解くような話は、当時の私にはとても斬新でした。私は昨年の 大阪に参加したので、今回は見送ったのですが、本名先生が来るなら参加申し 込みをしておけば良かったと少し後悔しております。もし、参加される方がい たら、どんな話だったか教えて下さい。 さて、難聴関係の話題を3つ。 その筋では超有名な「ほぼ日刊イトイ新聞」で、補聴器の話が始まりました。 http://www.1101.com/com_aid2002/index.html 少し調べてみたら、補聴器のメルマガというものが過去に発行されていて、 以下のURLでバックナンバーを読むことができます。 メルマガ「補聴器のおもて話☆そして、ちょっとウラ話」 http://backno.mag2.com/reader/Back?id=0000067582 それから「語ろうか」と同じメルマガ形式で、「難聴を治すぞ」というメル マガの発行が始まりました。 http://www.sf-dream.com/~nanchou/ 治る、治らないの話になると、すごく怪しげな分野に飛び込んでしまうことも あるのですが、今のところ、実直な体験記ですので、経験のない私には参考に なります。 以上、興味のある人は読んでみて下さい。 ---------------------------------------------------------------------- ずいぶん長いこと続けてきた「自然言語処理学から見た手話」ですが、よう やく意味解析まで来ました。 1. 乗せる 2. 解析 a. 形態素解析 b. 構文解析 c. 意味解析 <-- ようやくここです。 d. 文脈解析 3. 変換 4. 生成 当初は4番目の「生成」まで解説する予定だったのですが、現在の手話と自然 言語処理の研究は、前回お話しした構文解析のあたりで足踏み状態です。変換 の研究もいくつかあるのですが、そのためには構文解析や意味解析に、ある種 の大胆な仮定を設けなければならないので少し現実的ではなくなっています。 それに、自然言語処理学は、入力から出力までの流れがあるので、最初で引っ かかると後々結果が悪くなってしまいます。さらに、現在の自然言語処理学そ のものが、4と2のdについて、まだまだ未熟です。ということで、あと2回で意 味解析について解説したら、このシリーズは締めくくります。 と言いつつ、私の修士論文は、変換を扱ったものなので、そのうち紹介する かもしれません。前述したとおり、これも、ちと、ずるい方法で変換まで話を 持っていったので、今回のシリーズとしては、省略します。 ---------------------------------------------------------------------- 今回の話は、意味解析です。言葉の「意味」を扱います。前回までは意味を 扱っていなかったと言うことになります。これは結構重要なポイントです。な んかよくわからなかったかもしれませんが、よくよく見ていると、すごく単純 なことの繰り返しです。そこには知性もへったくれもありません。ただ、機械 的な繰り返しがあるだけです。(あのアルゴリズムを考え出した人にはすごい 知性がありますけど。) 現在実践的に使われている構文解析技術は、意味情報を組み込んで精度が高 くなっていますが、前回紹介した程度の技術でも、文法をうまく作れば、ほと んどの日本語は解析できるのです。日本を代表する仮名漢字変換ソフトである ATOKも10年ほど前は意味情報を使っていなかったと思われます。それでも結構 仮名漢字変換は出来ました。意味情報を使わずとも結構いいところまではいけ るんです。 しかし、だんだんと単純な解析では性能も頭打ちになり、やっぱり意味を扱 わないと性能向上も見込めないだろう、と考えられるようになってきました。 では、締めくくりとして、意味解析です。今の自然言語処理の流れとして、 意味解析ができれば、あとは成功したも同然という雰囲気があり、逆に言えば この段階に大きな壁があります。この壁を乗り越えれば、変換に大きく近づく ことになるでしょう。 手話を自然言語処理で扱うということは、最終的には自動翻訳機があること は明らかです。一般に機械翻訳と呼ばれている物です。人間が介在することな く、自動的に日本語から手話、手話から日本語に翻訳しようという物で、これ があれば、プライバシーが守られた通訳ができるという利点の一方で手話通訳 者も失業してしまうと言う、喜んでいいのか、悲しんでいいのかわからない代 物です。ただ、前回まで見てきた通り、まだ解析の当たりでマゴマゴしている 状態ですから、まだしばらくの間、通訳者の方も安心して仕事に専念して下さ い。 人間と計算機で、手話を扱うときの大きな差は何か? 私は「意味」だと思い ます。今まで見てきた通り、計算機は単語の意味を考えて処理していません。 確かに辞書や文法を作るときに、人間の知見が組み込まれているのは確かです が、計算機はその結果を単純に「処理」しているだけで、その動作は、とても 知的な活動には見えません。ただプログラムが動いているだけです。そこが人 間と計算機の大きな違いだと思います。 ---------------------------------------------------------------------- ちょっと脇にそれますが知性(知能)というものを考えるための有名な逸話を ご紹介します。 人工知能に批判的な哲学者、ジョン・サールという人は、「中国語の部屋問 題」(Chinese Room Argument)と呼ばれる問題を提起します。["Minds,Brains, and Programs," from The Behavioral and Brain Sciences, vol3 1980.]余 談ですが、あちらの人は、わけがわからないものを中国と結びつけたがるよう で、あまり中国語自体には意味はありません。 私は、この原典の論文は読んだことありませんが、ここで提唱されている問 題はあちこちで引用されており、読書量の少ない私でもあちこちで見かけるぐ らい有名です。たぶん、原著を読んでも、私には絶望的に難しいでしょうか ら、私の知る範囲で(つまり日本語文献の又聞きの範囲で)解説します。 ある架空の部屋を考えます。それは世間から隔離されていて、中に人が1人 だけいます。そして部屋に窓がついていて、そこから紙を受け渡すことができ ます。ここだけが外の世界との接点で、中の人とは直接話をしたり、中から外 または逆に外から中を見ることはできません。 ここで、その人に中国語が書かれた文章を渡します。すると、しばらくして 英語に翻訳された紙が出てくるのです。中の人は「中国語が書かれた紙を渡さ れたら英語にして出す」という使命を持っているというわけです。 ここで、普通なら、中の人は中国語と英語が理解できる人で、中国語が書か れた紙を渡されたら、それを翻訳しているだけだ、と考えることはできます。 しかし、サール氏は、こんなことを考えました。この中の人は英語しか使え なくても、もし、この部屋の中に膨大な単語を収録した中国語の辞書と、あら ゆる中国語を英語に翻訳する方法が書かれた本があれば、中の人は何も考えな くても翻訳できるのではないか、と。そうなれば、これは知的活動といえるの か? 単に作業をしているだけなんじゃないか? サール氏は、そういう疑問を投 げかけました。これが「中国語の部屋問題」というものです。 計算機が行っている翻訳は、まさにこれと同じです。データを元に、単純な 作業を淡々と続けるのが計算機です。もし、この部屋の中の人が知的活動をし ているのなら、計算機も知的だと言えるでしょう。でも、種明かしを見れば、 私達には中の人が知的な活動をしているとは思えません。辞書や本の読み方さ え知っていれば、子供でも、ロボットでもいいわけです。それは知能? 違うの ではないの? というのが、この問題に対する一般的見解です。 前回までで紹介してきた、構文解析は完全に手順化されています。結果を見 るとすごいことをしているようですが、その詳細を知った時、我々には計算機 自体に知性を感じる人はいないでしょう。でも、改めて考えてみると、翻訳す るのに知能が必要なんでしょうか? 辞書さえ充実すれば機械がやった方が守秘 義務も完全に守られるし、早いのではないの? とも思います。 ここから先は自然言語処理学屋でも意見がまちまちになっていきます。理解 しなくても翻訳ができればOKとするか、それとも理解してから翻訳をするべき なのか? 手話通訳でも心をくみ取って通訳すべき、という意見が多数ですが、 計算機に心を理解させるのはほとんど無理なわけで、そうなると理解なんかし なくても、翻訳できればいいじゃん、という立場も考えられるわけです。もち ろん、これは、心をつかんだと同じぐらいの質の高い翻訳が得られるアルゴリ ズムを開発できれば、という仮定付きの話ですが。逆に、知能を持っている人 間でも、わけのわからん通訳をしたり、間違えたりするわけです。今の研究の 流れは、人間の知能が解明できれば、知的活動が行える、つまり、翻訳ができ るようになる、という考え方が主流ですが、サール氏の問題提起を考えている と、知能なんか無くても、翻訳さえできればOKと言ってもいいのではないかと も思えてきます。心を込めた通訳は、心を込めた通訳と同じ結果を出せれば、 心を込めなくてもいいじゃん、というわけです。 さらに脇道にそれますが、この考え方を突き進めて、知能そのものを定義し ようとした人がいます。イギリスの大天才、アラン・チューリングという人で 彼が考え出したチューリングテストは、現在でも最も有効な知能存在識別テス トと考えられています。 このチューリングテストを行うには、2つのコンピュータをつなげて、チ ャットシステムを準備します。チャットとは文字での会話ができるソフトで す。最近はインターネットでもIRCやホームページでチャットができるので、 ご存じの方も多いでしょう。そういうものを作って、互いが直接見えないよう にします。会話は試験官Aと、被験者Bで行います。そして、会話は試験官Aが 主導的に進めていくのですが、10分ぐらい話してみて、十分会話が成り立てば 被験者Bには知能があると判定するわけです。ポイントは、被験者Bは人間では ないかもしれない、というところです。もしかしたら、プログラムかもしれま せん。試験官Aからは被験者Bは見えないようになっているので、よくできたプ ログラムが人間のふりをして、チャットで会話しているかもしれない。それぐ らいよくできたプログラムなら、知能を認めてやろう、というのがチューリン グテストの意義です。 このチューリングテストは、実際に大会が開かれるぐらい良く行われていて その結果を見ていると、プログラムも結構うまく会話するんですよ。さらに、 人間が会話しているのにプログラムだと思われたりすることもあって、人間の 知能もたいしたことないんじゃないかと思うこともあります。チューリングテ ストの不備と言うこともできますが。 そんなこんなで、知能に関する議論は、わずか30年ぐらいの歴史しか持たな い自然言語処理学ではありますが、深いものがあります。私は通訳に知能が必 要だとは思っていません。知能があれば、楽だとは思いますが、計算機科学の 歴史を見ると、電卓が計算の意味を考えずに答えを出すように、翻訳も意味を 考えなくても答えが出せるのではないかと思います。 ---------------------------------------------------------------------- だいぶ脇道にそれました。そろそろ本来の意味解析に戻りましょう。意味解 析の目的は、言葉の意味を同定することです。そのためには「意味」を厳密に 定義しなければなりません。意味って何でしょう? こういう時に広辞苑などの辞書を引いても、あまり役には立たないので、こ こは、次の3つの例文を読んで考えてみましょう。 1. グリーンピース a. グリーンピースは嫌いだから食べない b. グリーンピースが捕鯨の抗議行動をした 2. 手 a. やけどをして、手が痛い。 b. あいつとは、手を切りたい。 3. 米 a. ちょっと米を買ってきて。 b. 米は日本の文化だ。 「グリーンピース」「手」「米」すべて名詞ですが、aとbでは意味が違うこと は一目瞭然でしょう。でも、その違いは、それぞれ微妙に異なります。 1.の「グリーンピース」は食べ物の「グリーンピース」と、過激な環境保護 団体の「グリーンピース」の違いで、これは指し示している物が違います。 2.の「手」は、a.は人間の「手」そのものですが、b.の方は例えとして使わ れているだけで「手」でなくても構いません。例えば「縁」とか「関係」と言 い換えることができます。 3.の「米」は両方とも食べる「米」を表しています。しかし、a.の方は自分 が食べる「米」を表しているのに対して、b.の「米」は日本の主食としての抽 象的な意味での「米」を表しています。 1つの単語でも意味が異なることは、形容詞や動詞の方がわかりやすいかも しれません。ある調査では、動詞や形容詞の8割は複数の意味を持つという結 果が出ています。No.74や75では形容詞について、No.63の最後の方でちょっと だけ動詞についても、色々な意味があることを示しました。さらに、名詞でも 上述したように色々な意味があるのです。人間ならば、直感的にこの違いを把 握して、うまく翻訳することができますが、計算機ではどのようにすればそん なことができるのでしょうか? ---------------------------------------------------------------------- 字数がきたので、今週はここまでにします。 いよいよ、このシリーズも最終回。来週をお楽しみに。 ---------------------------------------------------------------------- このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して 発行しています。http://www.mag2.com/ (マガジンID: 0000038270) ---------------------------------------------------------------------- ■登録/解除の方法 メールマガジン「語ろうか、手話について」は、以下のURLよりいつでも 登録/解除可能です。 http://www.mag2.com/m/0000038270.htm http://www.rr.iij4u.or.jp/~tokudama/kataro/ ■バックナンバーの参照 http://www.rr.iij4u.or.jp/~tokudama/kataro/ http://backno.mag2.com/reader/Back?id=0000038270 ■掲示板 http://www64.tcup.com/6411/tokudama.html 補助的な情報を掲載しています。編集者への連絡はMailをお使い下さい。 ■苦情、文句、提案、意見など Subjectに[kataro]を入れて、以下のアドレスまでMailをお送り下さい。 個別には返事ができないかもしれませんので、ご了承下さい。 tokudama@rr.iij4u.or.jp ====================================================================== ○メールマガジン「語ろうか、手話について」(週1回以上 発行) 発行: 手話サークル活性化推進対策資料室 編集: 徳田昌晃 協力: 五里、おじゃまる子、くぅ(ヘッダ作成) 発行システム: インターネットの本屋さん『まぐまぐ』http://www.mag2.com/ マガジンID: 0000038270 ■意見、文句、提案、投稿は、居住都道府県名と氏名(匿名可)を添えて tokudama@rr.iij4u.or.jpまで送って下さい。 ■メールマガジン「語ろうか、手話について」は、著作権は徳田昌晃に所属し ますが、基本的には転載・複写自由です。有効にご活用下さい。 ======================================================================