翻訳ソフト DeepL 無料版をいろいろ使う

WEBで無料で使える翻訳ソフトはいろいろあって GooleDeepL が代表的なものかと思う。私の愛用は DeepL  ほんとうに自然な翻訳で早いし申し分ない。すでに使っておられる方々も多いと思うが、備誌録も兼ねて無料版活用メモを記しておく。

私は PC に余計なソフトをインストールしたくない方針なので DeepL アプリをインストールせずに DeepL のホームページ にアクセスして所定の Window にテキストやファイルを貼り付けたりして翻訳させて利用していた。他の WEB のページを読みながら翻訳したりするときに TAB を切り替えたりするのが面倒になりアプリをインストールしてみたた。これがすこぶる便利。今は2画面ディスプレイを使用していることもあり、使いよいと思う。

いろいろなところで話題にされているが、PDF ファイルのから英文をコピーして DeepL に貼り付けて翻訳する際に不要な改行が入ってしまって正確に翻訳されない。例えば、このようなコピペした文章を貼り付けると

f:id:PanariLab:20211206190756j:plain


こんなふうに改行を文の終わりと判定して重複して翻訳してしまう。

これを、不要な改行を削除して連続した文章として張り付けると

f:id:PanariLab:20211206190825j:plain

全く自然な文章にしてきれいに翻訳される。

このように改行を取り除くにいくつか方法があるようでアプリも発表されている。アプリをインストールしないで使うには、こちら

を利用すると良い。ホームページににアクセスしてテキストコピペすると改行を削除ししたテキストを生成してくれる。それをそのまま DeepL に翻訳することもできるようになっている。

他にも Crome を PDF Reader として使うと、テキストをコピペしても余分な改行が生成されないようである。Qiita の記事 

PDFの英語論文をコピペして翻訳するときに改行を簡単に取り除く方法
にくわしい。

DeepL では WORD、PowerPoint、PDF のファイルであればファイルごと一括して翻訳することができる。論文や資料などは PDF形式 となっていることが多い。PDF ファイルを翻訳させてみると画像、図表などもとの文書の形式を保ったまま翻訳されるので読みやすい。論文をまるごと翻訳することもできそうである。
また、WEB のページを翻訳するときには、コピペせずに PDF にプリントして翻訳すると便利である。Windows10 では 標準で PDF プリンタがあるのでそれを使う。WEB のページをプリントする際にリンクの階層(?)をたどってプリントするときの良い方法が見つからない。たとえば、ここ Amature Telescope Optics の記事はこのようにリンク階層がある。

f:id:PanariLab:20211207081849p:plain

これを Acrobat Pro では画像のように階層レベルを指定して WEB のリンク先を含めて一括 PDF 化ができる。

f:id:PanariLab:20211207082043j:plain

広告へのリンクがあったりして余計なものをプリントしてしまうので、リンク先のプリントの可否など個別に設定できると良いのだが。いまのところプリントしてファイルを結合するのが良いようだ。もう少し便利な TOOL があれば良いのだが。

 

無料版にはいろいろと制限がある。アプリや WEBの画面でテキストをペーストして翻訳するときは 5000 字となる。WORD、PowerPoint、PDF ファイルの一括翻訳は、月3ファイルまでとなっており、 WEB では明示されていないが1ファイルあたり 10万字以下となっている。いろいろやってみると PDF ファイルでは 50~60 ページくらいであった。ためしに 150 ページのファイルを翻訳させるとこのように表示される。

f:id:PanariLab:20211206194121p:plain

というわけで、全く当たり前の話であるが、小さいファイルは結合して、大きいファイルは分割して翻訳するということになる。

WEB ページを PDF でプリントしたものや、小さな論文・資料などはテーマごとにまとめてファイルを結合して翻訳する。ちなみに結合する PDF の文書の言語が違っていても自動検出して翻訳してくれる。大きなファイルは無料版の制限に合うように 50~60 ページに分割する。ページを節約するために、論文などの後ろのほうにある参考文献リストや索引などは削除する。

Free の PDF 操作ソフトでは、分割・結合できないのも多い。私はこれだけのために Acrobat の古いバージョンを後生大事に使っている。

 

実際に翻訳させてみると、もとの PDF のフォーマットを維持したままきれいに翻訳されるが、数式を無理やり翻訳してしまう。
こんな数式が

f:id:PanariLab:20211206190905p:plain

このように全く意味をなさない形に翻訳されてしまう。

f:id:PanariLab:20211206190923p:plain

これを避ける方法は無いようで、しいてあげれば、翻訳された PDF ファイルに元の文書から画像としてコピーして貼り付けるくらいだろうか。私は本のような形式でプリントするのでなければ、無理せずに元の文書を参照するようにしている。

このように無料版ではいろいろと制限がある。 DeepL の有料版の一番安い「Starter 月750円 」では
・コピペで翻訳する字数の制限なし
・ファイルの大きさが MAX 10MB、5ファイル
までとなっている。無料と比較するとそんなに増えた感じはしないが、PDF 1ファイルあたり 100万字とのことなので 500 ページの文書が翻訳できることになり、これは本一冊をまるごと翻訳できることになる。前述のファイルをまとめて翻訳させるということを活用すると 月750円 という有料版も視野に入れるべきかとも思う。