▷ 5,000円で始める自動化スマートホーム

【自動文字起こし】ソフト不要!自動で文字データを取得する画期的裏技!

配られた資料や文章が載った画像などから文字データだけを抜き取りたいなと思ったことが幾度となくあります。その際、元のデータを見ながら一文字一文字タイピングしていく作業を前に「どうにか効率化、自動化できないか」と悩んだ結果、非常に意外なところに味方がいたことがわかりました。これからは文字起こし、文章化も自動化の時代。いちいち入力に時間を取られる生活から一刻もはやく抜け出しましょう。

この記事を読んで分かること

  • 無料かつ自動で文字起こしができる手順を紹介
  • しっかりとした文字起こし機能を使いたい方へのおすすめソフトも!

文字を起こす面倒な作業は自動化して終わらせよう

文字を起こす上での悩み

以前音声入力で作業効率をあげる方法集中力の上がるテンポの音楽など様々な作業効率化を記事にしてきましたが、今回は「文字起こし」という作業の効率化。文字起こしが発生してしまうこと自体無くすのが最適ですが、いまだに「紙」や「画像化されたPDF」という非効率的な存在を扱う組織・個人はまだいらっしゃるもので、実際に何度も文字起こしを依頼されたことがあります。タイピングが少し早いからという謎の理由をつけられてお願いされる人もいるのではないでしょうか。ここでひとつ問題なのが、依頼者は総じて後々テキストで扱えるコンテンツを持っていないということ。簡単にいえば「紙が安心だから印刷した、元のデータはどっかにいってしまった」「添削して欲しいから紙で印刷した」という人ばかり。これをいちいち相手にしていたらいくら時間があっても足りません。(半分愚痴)

自動文字起こしにどういう機能があればいいか

それでは実際自動文字起こしをする上でどういう機能が必要かを考えてみましょう。何と言ってもまずは

画像を読み込ませるだけで、自動で文字を認識して抽出する機能

は大前提です。そして個人的にもう2つ必要だと思っているのが

自動で誤字脱字がないかのチェック
自動で半角を含む空白の削除

という点です。これは後々あわせてご紹介いたします。




文字認識機能とは

そもそも「文字認識機能」とは何かという点ですが、正しくは「光学文字認識」というものでその名の通り機械が文字を認識できるようになっているというもの。今まで人力でやっていたこと・苦労を救ってくれる技術です。詳しくみていきましょう。

OCR

光学文字認識、通称「OCR」とは簡単に言えば印刷されたものや画像から文字データを認識してひっぱってこれる技術と言っていいでしょう、読み取りの正確性には差があるものの現在多くのサービスでこのOCRが利用されています。

光学文字認識は、活字の文書の画像を文字コードの列に変換するソフトウェアである。

ウィキペディアより引用

OCR対応ソフト

今回ご紹介するのはあくまで無料で行う方法で限りなく精度が高まるようにツールを使っておりますが、限度があります。本格的に使っていきたいという方はOCR対応のソフトの購入を検討しましょう。
現在OCRに対応しているソフトで中でもAmazonの評価が高いソフトはこちらです。ご参考までに。




自動文字起こしをやってみよう!

それでは大変お待たせいたしました。今回使用するするのがこの3つ。

  1. Googleドキュメント
  2. 改行・空白・タブ削除ツール
  3. 日本語校正サポート

用意するものは

  1. 作業用のPC
  2. 文章を抜き取りたい画像

です。

Googleドキュメントを使って自動文字起こし

それでは作業に移りましょう。今回はこの記事の下書きをスクリーンショットしたものを読み取っていきたいと思います。

  • STEP.1
    GoogleDriveにアクセス
    自分のGoogleアカウントでログインしましょう。
  • STEP.2
    画像をアップロード
    文章を抜き取りたい画像をGoogleDriveにアップロードします。
  • STEP.3
    Googleドキュメントで開く
    アップロードしたファイルを右クリックして以下の要領で展開します。

  • STEP.4
    アップロード画像の下部を確認
    アップロードした画像の下に文字認識されたものがテキストとして自動入力されています。
  • STEP.5
    テキストをコピー
    添削用に使えるようここでテキストをコピーしておきましょう。

この段階で使えるという方は次の工程は飛ばしていただいても結構です。次の工程で偶然生まれてしまった空白および間違った日本語を訂正していきます。

注意

自動文字起こしはあくまで補助的な機能のため、精度は保証できかねます。以下の手順で限りなく精度を高めておりますが、万が一の責任は負いかねますのでご了承ください。文字認識精度が高いソフトはこちらから。

改行・空白・タブ削除ツールでよりすっきりとした文章に

ながらくGoogleドキュメントによる自動文字起こしを行っていて感じるデメリットとして「微妙な空白が入っている」ということが挙げられます。

その問題を解決するのが改行・空白・タブ削除ツールと呼ばれる優秀すぎるwebサービス。使い方は非常に簡単で入力すれば好みに応じて、改行・空白・タブを削除してくれるというもの。

このサービス1つだけで自動文字起こしによって生まれた余計な空白を消去することができました。このサービスはすごすぎます。

改行・空白・タブ削除ツール

日本語校正サポートで素敵な文章を仕上げよう!

せっかく文章を仕上げるのであれば、最後に正しい日本語、文章に仕上げておきたいですよね。日本語校正サポート様のページでは入力した文章をその場で自動チェックしてくれるサービスが備わっています。

先ほど自動文字起こしで抽出した文字をコピペ。すると

という風に修正箇所をわかりやすくマークアップしてくれ、修正理由とともに文章提案までしてくれるという神サービス。

日本語校正サポート

あとは自分の好みの文章に仕上げることで無事文字起こしならびに+α(日本語チェック)が終了します。お疲れ様でした。




自動化メディアで作業短縮を!

長い作業お疲れ様でした。慣れてくるとどんどん自動文字起こしができてくるので、ぜひ利用してみてください。また今回紹介したサービス単体でも使える場面が多いと思いますのでそちらも合わせて利用を検討されてみてはいかがでしょうか(というか無料なので使わない手はないですね)

自動化メディアでは日々作業短縮、自動化を目指して更新を行っております、ぜひ他の自動化にも遊びにいらしてください。それでは素敵な自動化ライフを。

引き続き自動化メディアをお楽しみください。