この「講座」は、@nifty「翻訳フォーラム・アドバンスメント館(FTRAN2)」の第13会議室「翻訳JOB応援会議室」にて連載されているものを、著作者の許可を得てウェブ上に転載したものです。

この「講座」内容に関連する質疑応答は、@nifty「翻訳フォーラム・アドバンスメント館(FTRAN2)」の第13会議室「翻訳JOB応援会議室」にて受け付けております。

講座内容についてのご質問がある方は、どうぞ、上記会議室においでください。

6.2 原文の電子データ化

「2.3 翻訳に対する姿勢」や「3.9 仕事の仕方の工夫」でも書いたことですが、用語の統一は最低限の品質管理として必ず行うべきことであるにも関わらず、現実には実行されていない場合があります。訳抜けというのもまた、翻訳者として避けなければならない最低限の事柄ですが、現実にはよく発生することです。

注意力が足りない……たしかにそうでしょう。でも、翻訳者は人間なんですから、注意力に頼っていたのでは必ずミスが出ます。だいたい、このクライアントの指定訳語は「インターフェース」だったか「インタフェース」だったか、はたまた「インタフェイス」だったかなんて、そんなこと、いちいち気にしていたら肝心の翻訳作業自体に悪影響が出てしまいます。こういう機械的にできる部分は、なるべく機械にやらせましょう。そのほうがミスも減るし、本来的な品質である訳文の読みやすさなどのほうに自分のエネルギーを集中することができます。

機械……つまりコンピューターにやらせるわけです。そのためには、まず、原文が電子データとなっている必要があります。

★原文電子データ化のメリット

原文を電子データ化するとどのようなメリットがあるのでしょうか。

まず、訳抜けの心配が減ります。文章を1文訳しては1文削除していくという操作をしていけば、文章単位で訳抜けすることがなくなります。削除操作も、マクロなどで処理すれば面倒なことはありません。

また、専門用語について、訳語を決めた時点で一括置換をかけてしまえば、用語の統一を簡単に行えます。後ろの方は、原語の中に訳語が混じった形になるわけです。これも、マクロを活用すれば、後日利用するための用語集を作りながら一括置換することができます。sedやperl、マクロといったツールを活用すれば、このような用語集(支給されることもある)に登録してある用語をすべて、一括置換してしまうことも可能です。

視点の移動が少なくなるのもメリットです。紙原稿だとモニタと紙原稿の間で視点を往復させ、そのたびに、直前に読んでいた位置を探す必要があります。1回、2回ならどうということもない行為ですが、毎日、何百回となると、けっこう疲れるものです。

作業効率も高くなります。視点移動に必要な時間も節約できますし、用語統一のために訳文の前の方を検索してみる必要もなくなります。訳語が一括置換されていれば、その訳語をコピーすることにより入力の手間も減らせます。

★電子データ化の方法

最近では、電子データで翻訳原稿を受け取ることも多くなってきました。でも、まだまだ紙原稿で渡されることがよくあります。クライアント社内で作成された文章などは、電子データで渡して欲しいと思いますが、現実には、印刷されたものしか渡されないことも多いものです。

このような場合は、スキャナとOCRソフトを利用します。紙原稿をまず、スキャナで画像として取り込み、その後、OCRソフトでテキスト(電子データ)に変換するわけです。

★OCRソフト

最近のOCRソフトはかなりよくなっており、英語の認識率は十分に実用となるレベルに達しています。また、他の欧文文字についても、高い認識率を持つソフトが販売されています。日本語と英語(欧文文字)の認識エンジンが別々になっているソフトであれば、おそらく、英語については実用になるはずです。スキャナやモデムのおまけでついてくるソフトが役に立たないことが多いのは残念ですけどね。

一方、日本語の認識率は、お世辞にもいいとは言えません。現状では、日本語をOCR処理するのは現実的ではないと思います。また、その後の翻訳という作業を考えても、日英など、日本語から外国語への翻訳は、原稿に手を加えることで効率を上げることが非常に難しいので、原稿が電子データであることのメリットはあまりないと思います(日英では、わけのわからない日本語の意味を推測するのに長い時間が必要ですから)。

なお、OCRソフトはそれぞれに特徴があり、自分の仕事状況に合う、合わないがあったりします。まず、使っている人の評判を聞いてみましょう。主なOCRソフトは、翻訳フォーラムの電子会議室でもすでに取り上げられているはずです。過去ログを読んでから購入すれば、実用にならないソフトを購入してしまう失敗は避けられるでしょう。

OCRソフトで処理した場合、注意しなければならないことがあります。認識枠を自動設定とした場合、本来訳さなければならない部分に認識枠が設定されないことがあるのです。この部分は認識自体が行われないため、OCR処理した画面だけを見ていると、段落1つ、まるまる訳抜けしてしまうようなことが発生します。必ず紙原稿をときどき確認しながら作業を進めることをお勧めします。

OCRソフトによっては、処理した原稿を整形する場合もあります。私は、自分にとって一番満足できる結果が得られた、一行ごとに改行が入る形でテキストに落として秀丸のマクロで整形するという方法をとっています。

前のページ 次のページ

「二足の草鞋」目次トップページに戻る