前回のエントリーにて、「Star Trader (Ares Nr.12) / SPI」のルールブックを「リライト」しているという話を書きました。この「リライト」について、具体的にどういう作業をしているのかを簡単に書いてみましょう。

まず元のルールブックをスキャナで取り込んで、これに若干の補正をかけます。そうすると、以下のような画像が出来上がります(もちろん実際にはもっと大きいサイズの画像です)。

moon Gamer

これをOCRソフトに読み込ませて、認識結果をテキストに出力します。上記でスキャンした画像を補正するのは、この認識精度を少しでも上昇させるためです。ただし、補正は自動処理でざっとかけるだけです。ここであまり手間をかけても時間がかかるばかりで、認識精度は大して上がりません(ちなみに使用しているソフトは『読んde!!ココ』。日本語をするOCRソフトでもっと良いものがあればぜひ教えてください)。

moon Gamer

補正をかけても結果はご覧の通り無惨なことに(下の画像はクリックすると拡大します)。まぁ、補正を全くかけないと、本当にどうしようもない結果にしかならないので、これでもまだマシな方だったりします。

moon Gamer

これを元画像を参照しながらコツコツと修正していきます(下の画像はクリックすると拡大します)。「読んde!!ココ」は、認識結果が表示されるテキストエディタ上で、各文字が元画像の位置を青いカーソルで表示してくれるのが便利です。この機能があるので、少しくらい認識結果が崩れても作業は行えます。

moon Gamer

テキストの修正はここまで。出力したテキストはワープロソフトで整形し、イラストや図表類を入れるなどの作業を行います。


ここまで根本的なリライト作業はあまりしないのだけれども、似たようなことなら、これまでもわりとよくやっていたりしあす。例えば、昨年プレイした「Here I Stand / GMT Games」の和訳ルールがそれです。

「Here I Stand」の和訳ルールは、クロノノーツにて公開されています。これがなかなかの力作なのですが、残念ながら誤変換や誤訳があちこちにありますし、文字も小さいので読みづらいことこの上ありません。ということで、昨年の2回目のプレイの前にこれをリライトしました。

例えば以下のような文章を…

moon Gamer

このようにインデントを多用して読みやすくしてみました。

moon Gamer

オリジナルの和訳ルールは全部で39ページありましたが、リライトした結果69ページにまで膨れあがりました。このため、目次があってもどこに何が書いてあるのかわかりづらくなったので、下のように各章ごとにインデクスを付けて管理するようにもしました。

moon Gamer

元文書は PDF で提供されていたので、テキスト部分だけを抽出するのは簡単にできました。が、抽出されたテキストが元文書と同じように並ばないページが何ページかあって、その修正にけっこう苦労したような記憶があります(例えば見開きのページで、左右のページの1行目が連結してしまうなど)。