Google

Googleドライブを利用してPDF書類をテキストに変換する方法

こんにちは。
毎日Google先生にお世話になっている@OfficeTAKUです。

紙の文書をスキャナーで読み取って、テキスト化したい、という時はOCRソフトを利用します。

OCR、Optical Character Reader、その名の通り「光学式文字読み取り装置」ですね。

スキャナーを購入すると日本語OCRの簡易版が添付されていたりしますので、それを使って読み取りされた方も多いかもしれません。
製品を購入すると、各種ありますが安いもので3千円台から→日本語OCRソフト|Amazon.co.jp

過去の経験からいくと、やはり認識率を高いソフトを利用しないと苦痛の方が大きくなるかもしれません。
予算があれば、しっかりとしたものを買った方が賢いと思います。

しかし、そんなに利用する機会はないけど、どうしてもいま必要という方は Googleドライブを利用してみてはいかがでしょう?

Googleドライブの日本語OCRを利用する方法

まず、前提としてGoogleアカウントを取得しておきましょう。

ログイン

  1. Googleドライブへログインします。
    (初回、チュートリアルの動画などが表示されますが、必要であれば目を通してみて下さい。)
  2. 画面右上の[Googleドライブにアクセス]をクリック
    Google Drive
  3. 下図のような画面が表示されたら、左下の[Continue to Google Drive]をクリック
    Google Drive

ファイルのアップロード設定

初期設定では、アップロードした原稿が図としてDocs(ワープロ文書)に貼り付けられてしまいます。
テキスト化するようにあらかじめ設定を変更しておきます。
ここでは、アップロード時に確認するように変更。

  1. 歯車の形の[設定]ボタンをクリック
  2. [アップロード設定]をクリック
    -[アップロードしたPDFファイルや画像をテキストに変換
    -アップロード前に、毎回設定を確認する
    にをクリックしチェックを入れるGoogle Drive

ファイルのアップロード

  1. 左サイドメニューの[アップロード]ボタンをクリック

    Google Docs

  2. ファインダー(ファイルを開くウインドウ)が開く。
  3. アップロードしたい原稿を選択し、[開く]ボタンをクリック。

    Google Drive

  4. [設定]画面が開きます。
  5. 先ほどの設定を確認し、[言語の選択]とのドロップダウンリストから[日本語]を選択します。
    Google Drive
  6. アップロードが完了すると、一覧にファイル名が表示されます。
    Google Drive
  7. ファイル名をクリックすると開くことができます。

OCR認識結果

A4,1ページの文書の場合、1ページ目に元原稿が図として貼り付けられています。
Google Drive

2ページ目以降にテキストが入力されています。

Wordを直接PDF化した原稿

ほぼ100%認識。改行が削除されたことと、所々スペースが入ってきた位です。
Google Drive

Wordから印刷した紙原稿をスキャナで読込みなおしたもの。

Mac イメージキャプチャを使用し、PDF 300dpi
利用した複合機はこちら 日本HP インクジェットプリンターー HP Photosmart Premium Fax All-in-One C309A

書式が崩れ、ところどころ変換されない文字も見受けられます。
しかし、それほど誤変換もなくキレイな原稿であれば充分使用に堪えられそうです。
Google Drive

ピックアップ記事

  1. [PPT] あなたのPowerPointプレゼンテーションを劇的に変えてしまうで…
  2. [Instagram] インスタグラムで勝手にレイバンサングラスの投稿がされたら…
  3. [レビュー] Lenovo Ideacentre 720 使えば手放したくなくな…
  4. 机からケーブルを落とさない NuAns WORKLIFE FOLDKEEPER …
  5. [レビュー] 『親子で学ぶ プログラミング超入門 ~Scratchでゲームを作ろ…

関連記事

  1. Facebook

    Facebook : Facebookページで日時指定投稿をする方法

    こんにちは。@OfficeTAKUです。Faceb…

  2. Web

    [WordPress] Jetpackでブログの更新情報をFacebook、Google+、Link…

    こんにちは。@OfficeTAKUです。ブログ記事の更新情…

  3. Google Doodle ロンドンオリンピック開会式 2012/7/27
  4. Google

    とても便利!Googolリーダーのブログロール作成機能

    みなさん、RSSリーダー (とは?)は何をお使いなのでしょうか?私…

  5. Facebook 近況アップデート画面
  6. Photo by Glen Carrie on Unsplash

    Web

    [WordPress] Jetpack パブリサイズ共有でのFacebookへの投稿を停止しました

    こんにちは。@OfficeTAKUです。ブログの更新をFa…

最近の記事

  1. Photo by Alex Litvin on Unsplash
  2. Photo by JESHOOTS.COM on Unsplash
  3. Photo by bruce mars on Unsplash
  4. Lenovo VR機器3種

人気の記事

  1. Photo by JESHOOTS.COM on Unsplash
  2. 芝寿し「冷凍寿し 小袖棒寿し 甘えび」
  3. Photo by rawpixel on Unsplash
  4. Photo by Kobu Agency on Unsplash
  1. iOS

    [iOS] iPhone アプリ「無料」という表示につられてインストールして自動…
  2. Mac ハングル入力

    Mac

    [Mac] Mac でハングルを入力する方法-macOS High Sierra…
  3. リボルテック ダンボー ミニ

    玩具

    リボルテック ダンボー ミニ (REVOLTECH DANBOARD mini…
  4. Web

    2018年7月 の人気記事はこれだ!月間 アクセス数 ベスト10
  5. Photo by Samuel Zeller on Unsplash

    Excel

    [Excel] エクセルで目標日までのカウントダウンを表示する
PAGE TOP