logo
PDF

[ウェブサービスレビュー]PDFに書き込まれた注釈テキストをオンラインで抽出--「Sumnotes」

  • このエントリーをはてなブックマークに追加
Sumnotes
内容:「Sumnotes」は、PDFに記入された注釈のテキストを抜き出して表示できるサービスだ。ローカルにPDFソフトがインストールされていなくとも、PDFに書き込まれた注釈をテキストデータとして抽出できるので、それらテキストを再利用したい場合に重宝する。

 「Sumnotes」は、PDFに記入された注釈のテキストを抜き出して表示できるサービスだ。ローカルにPDFソフトがインストールされていなくとも、PDFに書き込まれた注釈をテキストデータとして抽出できるので、それらテキストを再利用したい場合に重宝する。

「Sumnotes」トップページ
「Sumnotes」トップページ。ユーザー登録なしでは抽出可能な注釈の種類が限定されているので、必ず無料ユーザー登録を行ってから利用しよう

 使い方は、注釈が書き込まれたPDFをドラッグ&ドロップしてアップロードするだけ。すぐさま解析が実行され、注釈のテキストが表示される。日本語にも対応しており、注釈として書き込まれたテキストが、文字化けすることなく表示できる。

 抽出の対象となるのは、注釈として記入したノートとコメント、およびハイライト機能を使ってマーカーを塗ったテキストの2種類で、個別に表示をオン・オフすることもできる。試した限りでは線や矢印、円、長方形などの描画ツールに追記したコメントも抽出できるが、ユーザー登録をしていないと抽出されない場合があるので、必ず無料ユーザー登録をしてから利用しよう。

  • 今回はこのPDFファイルを対象に注釈の抽出を行う

  • 注釈は日本語でも問題なく抽出できる。ノートおよびコメントのほか、ハイライトをつけた箇所のテキストも抽出されるため、Acrobat Readerなどのソフトで注釈を表示した場合に比べて多くの件数が表示される

 抽出した注釈は、クリップボードへのコピーはもちろん、docファイルやテキストファイルに書き出したり、Evernoteに保存することもできる。無料プランでは最大50ページかつハイライト50カ所までという制限があり、上位の有料プランではこれら制限が段階的に解除される。

 本サービスの具体的な使い道としては、ローカルにPDFソフトがインストールされていない環境で、特定のノートやコメントを抽出する用途が考えられる。PDFの表示に対応したウェブサービスの中には、注釈の表示に対応していてもテキストのコピーが行えない場合がある。こうした場合に本サービスを利用すれば、例えば本文を置換するためのテキストがPDFの注釈として記入されている場合でも、わざわざ転記することなく一発で抽出できる。

 気をつけたいのが、オンラインで元のPDFと対比する機能がないため、すべての注釈が抽出できているかどうか確認する術がないこと。また抽出した注釈には作成者名が含まれていないため、複数メンバーで注釈を書き込んでいた場合、誰によるコメントなのか見分けがつかない。こうしたことから、注釈の見落としがないか網羅的にチェックする用途には不向きで、前述のように特定の注釈だけをテキストとして抽出する用途が主にならざるを得ない。こうした特徴を理解して使うぶんには、機能自体は他のサービスにあまりないだけに、重宝するシーンもありそうだ。

  • ハイライトをつけた箇所のテキストをオフにし、ノートおよびコメントだけを表示することも可能。もちろんその逆もできる

  • クリップボードへのコピーのほか、docファイルやテキストファイルなどへの書き出しにも対応する

  • テキストファイルに書き出したところ。今回試した限りではノートおよびコメント/ハイライトをつけた箇所の抽出表示とは連動せず、つねに全件が表示された

-PR-企画特集