NYTimesの記事を読んで考えた機械通訳と人間通訳者の大きな違い：文脈や行間、空気を読むのは「人対人」じゃないとダメだよね（今のところは）

投稿日 2022年9月21日
更新日 2022年10月18日
著者 Midori Yamamoto
カテゴリー AI
カテゴリー機械通訳・機械翻訳
カテゴリー通訳業の未来

先日こんな記事を読みました。

A Dad Took Photos of His Naked Toddler for the Doctor. Google Flagged Him as a Criminal.　-NY Times

記事の内容を簡単に説明すると、ある父親が息子の診察のために性器の写真をAndroid Phoneで撮りました。妻がその写真を自分のiPhoneに送り、それを医者に送りました。写真のなかには、患部がよく見えるようにするため父親の手が写りこんだものもありました。しかし、これがきっかけで、父親のAndroid Phoneは、10年分のメールや連絡先、写真などがGoogleによって削除されてしまいました。

Googleからの通知によると、父親のスマホには有害なコンテンツが存在し、それが児童虐待を含むグーグルのポリシーに対する違反となり、違法である可能性もあるとのことでした。

Googleはこの情報を警察にも連携したため、父親は警察の捜査の対象にもなりました。しかしのちに疑いは晴れました。

一方、Googleからの疑いは晴れることなく、削除されたものは戻ってきませんでした。

今回の事件は、Googleが2018年に開発した人工知能の判断による結果でした。

記者も確認したところ、確かに問題の写真には性器がはっきり写っていましたが、この場合は「病気の子どもを心配する親が撮った」という文脈が重要でした。

しかし、AIには目に見えない人の意図だったり、写真を共有している人たちの行動まで加味して判断するのは難しいのです。

……と、ポイントとなる部分を超ざっくり説明すると、こんな感じです。（実際はさまざまな方面の関係者の意見やAI技術についてなど、もっと盛りだくさんの記事です）

確かに、世界中からものすごい量の画像がアップロードされているので、その対応を機械的に行うのはわかります。効率はいいし、対応も例外なく一貫している。

さて、この記事を読んで「通訳者」としてAI（機械翻訳）と人間通訳者の違いを考えてみました。

通訳はそのうちAIにとって代わられる職業なのか？

現時点で感じるのは、機会が行う翻訳には、感情や文脈、空気をよんだり、行間を察知したり、表情や声色で感情を理解したり……という「人が直感的に感じること」の情報が欠けているかもしれないということです。

さらに、その人たちの共通の趣味や体験から発生する話題や冗談など「人間関係によって無言で理解されること」も機械にはまだわからないでしょう。

例えば、冗談で言う自虐ネタや悪口っぽいネタなどは、その場の雰囲気、言っている人の表情やキャラクターによって意味が変わってくると思います。言っていることは悪い内容でも、文脈や会話の流れのなかで「冗談かどうか？」を自然に判断するものです。

もし通訳者が言葉を機械的に訳したら、思わぬ誤解を生む可能性もあります。

また、人間であれば事前にクライアントに「ミーティングで達成したいゴール」を聞き取り、その目標が達成できるように訳し方を工夫することができます。熟練の通訳者なら文脈に合った最適な言葉をチョイスするだけでなく、声色、間合いなどの非言語情報を上手に活用することもできるのです。

通訳者は「効率」を追い求めて機械的に通訳するだけでいいのか？

そんな姿勢では、それこそAIに負けてしまいます。

通訳とは「ただ機械的に訳す」のではなく、「通訳を通じた人とのコミュニケーション構築だと思います。

人間の通訳者としてできること、人間じゃなきゃできないことの「質」をより高めていく。それが「通訳者の存在理由」ではないでしょうか。