訳すのは「私」ブログ

書いたもの、訳したもの、いただいたものなど(ときどき記事)

ホイト・ロング「機械翻訳とともに生きることを学んで」(『思想』2024年6月号)の冒頭試し読み

現在、刊行中のホイト・ロング「機械翻訳とともに生きることを学んで」(『思想』2024年6月号)の冒頭試し読みを公開いたします(本誌とは微妙に異なります)。

 

機械翻訳とともに生きることを学んで


ホイト・ロング


訳 秋草俊一郎

 

私は万能翻訳機に頼りすぎている。
地球を発つ前に、三八か国語を学習した。
いまやボタンひとつを押すだけで、
コンピュータが全部やってくれる。
――ホシ・サトウ『スタートレック――エンタープライズ』(二〇〇二)

 

最近のAIテクノロジーの発展、特にテキスト生成や画像生成技術の進歩は、人間の創造力が自律したものだという感覚を日々切り崩している。新しいテクノロジーはたいていオーバーに触れまわられるものだが、ニューラルネットワークによる大規模言語モデルが複雑な散文や詩、さらには物語の断片まで生成できるとなっては、もはや笑い話ではすまなくなってきた。進歩のたびごとに人間と機械が書くもののあいだにはしる不気味の谷は狭まり、後者が秘める社会・文化に対する影響への関心が高まっている。こうしたシステムが自分たちのしていることに自覚的かどうかは問題ではない。レイフ・ウェザビーとブライアン・ジャスティが警告するところによれば、技術が普及するにつれ、「その成果に異を唱える能力は衰え、彼我の存在意義のギャップは狭まっていく」という 。あまたの研究者が、コンピュータが書く文章を論じたり、文芸のことばや創作プロセスにおけるオリジナリティについての手垢まみれの通説を再検討したりして、未踏の地の理論化に乗り出している 。システムが視界から消え去り、「(まだ完了していないが)この強力なインデックス機械[生成AI]がわれらの社会通念のイコンに突っこまれていく真っ最中」の世の中で、「生成される表現に真実味が認められて疑わしきは罰せず」になってしまう前に、手を打たなくてはまずいのだ 。そしてそれは、ボタンひとつにかかっているのだ。


 本論文は、その存在の脅威が重大と見なされている新しい生成言語モデル群についてのものではない。その一癖ある親戚――かつては見果てぬ夢としてAI界を風靡したがとっくのむかしにその座から引きずり降ろされた分家――についてのものである。つまりは機械翻訳についてのものだ。文芸などの創作テキストに関して、人間とニューラル翻訳の差はいまだにありえないほど、時に笑ってしまうほど大きいように映る。いくらテクノロジーが言語モデリングの革新につれて進歩しても、ディナーのメニューやビジネスメールよりちょっとでも複雑なものを訳そうとすれば、批評家が即座にまちがいを指摘してくる 。結果、機械翻訳が理論の対象として真剣に取りあげられることはめったになかった。例外があるとすれば、文化の差に目をつむって、工学をごちゃごちゃした異言語間コミュニケーションや不可欠なはずの人間による解釈の微妙なあやの代わりにしようという試みで、これはナイーヴなまでに理想主義的かつ無機質だ。あるいはブライアン・レノンによる表現に耳を傾けてもいいかもしれない。レノンは一九五〇年代から六〇年代にかけての機械翻訳の盛衰を次のように言いあらわしている――「機械翻訳をめぐる物語は、文化からのコンピュータの独立を主張するだけでなく、コンピュータが文化を支配してしまうと主張する物語である」 。 この筋書きにあっては機械翻訳はかやの外になってしまう。なぜなら、本物の翻訳と見なされていないからだ。起点―目標言語間で等価表現を見つけるには、言語・文化の差のせいで生まれる意味論上のギャップをどこまで埋めるのかという点に関する個人的な、倫理的とも言える決定をともなうはずだ、という理解にもとづけばの話だが 。

 

理論家が「機械翻訳=協力者」という見解にこだわってきたように、機械翻訳というものが本来ハイブリッド技術だという考え方は、初期から――実のところそもそもの最初から――あったのだ。純粋な機械翻訳という夢が一九六六年の悪名高いALPAC報告書で潰えるはるか以前、この分野の先駆的研究者のひとり、イェホシュア・バー=ヒレルは機械翻訳と「ポストエディター」の共同作業を擁護した 。一九八〇年に、この分野の著名な研究者であり、純粋な機械翻訳を声高に批判していたマーティン・ケイが、「翻訳書記官【トランスレーション・アマニュアンシス】」を提案した。これは機械翻訳か、過去の翻訳のメモリ・バンクをもとにして翻訳の候補を提示し、人間の翻訳者を補助するインタラクティブなエディターである 。コンピュータが補助するテクノロジーが最終的には職業翻訳家にとってかわるというのが、機械翻訳について考えるうえでのテンプレートになり、二〇〇三年にダグラス・ロビンソンが「あらゆる翻訳者はサイボーグである」と宣言するにいたった。なぜならあらゆる翻訳は、純粋な機械翻訳という仮構の抽象概念と人間の翻訳とのあいだのどこかに存在するからだ 。このサイボーグ・ヴィジョンが受け入れられつつあるのは、少なくとも一部の領域とある種のテキストに関して、機械翻訳が現実に改良されたことと無関係ではない。機械翻訳がある種の環境のもとで「十分」なものになるとき――ここでの「十分」とは、ポスト・エディットにとって十分かもしれないし、ソース・テキストの要点を伝えるのに十分かもしれない――人間と機械の潜在的な「パートナーシップ」が有益なものになりはじめる。マイケル・クローニンも述べるように、実際、人間の創意工夫が「読めたものではない」機械翻訳を常に埋め合わせてくれるという期待が、オンライン翻訳サービスを正当化してきた結果、スマートフォンを持ち、ソーシャルメディアにアクセスできる人間ならだれでも機械翻訳とボタンひとつで触れあえるまでになった 。『スタートレック』が描いた未来がここにある――私たちはみなホシ・サトウさながら、機械翻訳を介助しながらそれとともに生きることを学びつつも、機械翻訳なしで生きることを忘れつつある。

 

 それは確かに存在する――ただしSFに出てくるテクノロジーみたいに完全なものでもなければ完全に馬鹿げたものでもなく、その不完全さからすら逃れられないという意味においてある【傍点二字】のである。広大な翻訳研究分野の研究者たちは長年このユビキタス性の持つ意味について研究してきた――機械翻訳ツールの職場環境への取り入れ、情報フロー管理やコンテンツ・ローカライゼーションのための多国籍企業による活用、(クラウドソーシング翻訳や共同翻訳のような新しいかたちの翻訳をサポートする)オンライン翻訳サービスがニュースやカルチャーのグローバルな流通に及ぼすインパクトなどなど 。翻訳業の対価に及ばざるをえないその悪影響を調査したり、機械翻訳エンコードされた言語をめぐるイデオロギーやテクノロジーの批判的リテラシーを涵養する術を模索する研究者もいる 。こうした研究を見てみると、翻訳理論家の機械翻訳に対する関心の低さが際立つ。文芸などの創作の機械翻訳が真剣に取りあげられ、ただ叩くための藁人形でなくなるには、どれぐらい出来がよくならなければならないのか? あるいは、質問を逆にしてみてもいい。テクノロジーの間隙が目につきやすいきわ【傍点二字】をあえて渡らないことで、どれだけ研究者からの口出しの機会を逃してしまうのか? 機械翻訳の研究を排除すれば、純粋な機械と純粋な人間という古臭い二分法から抜け出せなくなってしまう。ローレンス・ヴェヌティが翻訳研究に汚名を着せたり、排除しようとする人々に言うように、それは「社会闘争が起こりうる領域から撤退すれば現状を放棄することになる」のだ 。 


 機械翻訳がクローニンが言うような「純粋な、代筆のようなもの」としてイメージされている限り、社会闘争の現場として考えることは難しいだろう 。「代筆」とはつまり、「機械がソース言語のスクリプトをほかの言語で物理的に実行すること」であり、手書きや職人芸が連想される「自筆」と対になる概念だ  。この対は、テクノロジーの実際の使われ方を反映したものではない。それは、完全な翻訳かもと感じさせるようなそぶりはちらりとも見せない、ごたまぜの寄せ集めなのだ。それはまた、実際にどう動いているのかを反映したものでもない。アルゴリズムを使って人間をごちゃごちゃと学習しているのであり、それに著者性があるとすれば――ルイーズ・アムーアの言葉を借りるのなら――「アルゴリズムが世界に応じて、絶えず編集をつづけて修正し、書きなおす複数の選択肢」として読まれなくてはならない 。現実の機械翻訳の存在が、人間の翻訳と社会技術システムとのダイナミックな絡まりあいとしてあるのなら、機械翻訳が(万能翻訳機のなりそこないでしかないとしても)いかに言語間の交換を仲介しているのか関心をもつ研究上の動機としては十分だ。ヴェヌティが言うように、「どんな翻訳も原文への直接の、無媒介のアクセスを提供するものとは見なせない」のであれば、そしてあらゆる翻訳は「解釈行為であり、必然的に倫理的責任や政治的コミットメントをともなうもの」であるのなら、私たちは機械翻訳が仲介者として、そして同時にあらかじめ倫理的、政治的コミットメントにくるまれてしまっているものとして、翻訳という行為にいかに組みこまれてしまっているかを理解しようとしなければならない 。


 そのためにはテクノロジーと真正面から向きあわなくてはならない。すなわち、近年のニューラル・インスタンス化においてそれがどう機能するのかをまず把握しなくてはならない。本論文ではまず、テクノロジーとそれを支える翻訳の理論を概観する。それからテクノロジーの間隙が目につきやすいきわ【傍点二字】を検分するのだが、現在の機械翻訳がこうした間隙を晒しやすい場所と、うまく隠してしまえる場所について直観をやしなうために文学を一種の限界事例として用いる。これは、機械翻訳された文学テキストを詳細に、質的に分析することによってのみ可能である。それをここでは、日本語小説をいくつかサンプルにして機械翻訳研究者の評価メソッドを当てはめることでおこなう。この分析によって、機械翻訳の「誤り」をきめ細かくチェックすることができるようになる。これは、正解か不正解かの二元論、十分な翻訳なんてそもそも存在しないという本質主義を避け、代わりに翻訳の品質についてじっくり、文脈の中で評価しますよということだ。そして後者にこそ、「十分」という概念の余白が生まれる。機械翻訳のアウトプットをこんな風に読んでいると、翻訳になにができるのかのほうに関心がむく――翻訳がうまくいかない道筋なんて山ほど思う浮かぶにもかかわらずだ。


 本論文の最終セクションでは、ユビキタスで、今まで以上にアクセスしやすくなった機械翻訳の未来においてなにが文学テキストの「十分」な翻訳になりそうなのか、思弁的転回を加えたうえで考えてみたい。はっきり言って、機械が勝手に文学を翻訳するような未来ではない。しかし未来には――アラン・リウによれば――ニューラルネットワーク翻訳のおかげで「異種混交した「中間言語インテルリングア】」――純粋な比較対象のための、機械が生成してぱっと現れた、とりあえずの言語のかたち――を下敷きにした多言語テキストを分析する」ことができるようになるかもしれない 。私はこの主張を、もともとドイツ語、スペイン語、日本語で書かれた数百の小説の機械英訳を横断的に読むことで検証する。結果えられるのは、機械翻訳によって世界文学の現状を知るためのより直接的な手段だけではない。えられるのは未来なのだ。つまりは、人間の翻訳という営み【エージェンシー】とテクノロジーの物理的エージェンシーが溶けあう未来だ――そこでは文芸翻訳という仕事についてどう考えればいいか、機械翻訳がその仕事のためにできること/できないことと折り合いをつける術をどう学べばいいのかの双方について回答をえられるかもしれないではないか 。