Googleドライブを利用してPDF書類をテキストに変換する方法

こんにちは。
毎日Google先生にお世話になっている@OfficeTAKUです。

紙の文書をスキャナーで読み取って、テキスト化したい、という時はOCRソフトを利用します。

OCR、Optical Character Reader、その名の通り「光学式文字読み取り装置」ですね。

スキャナーを購入すると日本語OCRの簡易版が添付されていたりしますので、それを使って読み取りされた方も多いかもしれません。
製品を購入すると、各種ありますが安いもので3千円台から→日本語OCRソフト｜Amazon.co.jp

過去の経験からいくと、やはり認識率を高いソフトを利用しないと苦痛の方が大きくなるかもしれません。
予算があれば、しっかりとしたものを買った方が賢いと思います。

しかし、そんなに利用する機会はないけど、どうしてもいま必要という方は Googleドライブを利用してみてはいかがでしょう？

まず、前提としてGoogleアカウントを取得しておきましょう。

初期設定では、アップロードした原稿が図としてDocs(ワープロ文書）に貼り付けられてしまいます。
テキスト化するようにあらかじめ設定を変更しておきます。
ここでは、アップロード時に確認するように変更。

歯車の形の[設定]ボタンをクリック
[アップロード設定]をクリック
-[アップロードしたPDFファイルや画像をテキストに変換
-アップロード前に、毎回設定を確認する
にをクリックしチェックを入れる

A4,1ページの文書の場合、1ページ目に元原稿が図として貼り付けられています。

2ページ目以降にテキストが入力されています。

ほぼ100%認識。改行が削除されたことと、所々スペースが入ってきた位です。

書式が崩れ、ところどころ変換されない文字も見受けられます。
しかし、それほど誤変換もなくキレイな原稿であれば充分使用に堪えられそうです。

情報航海術 - Office TAKU -をもっと見る