WWDC 2010初日に公開されたウェブブラウザ「Safari 5」。基調講演では言及されなかったものの、1年ぶりのメジャーリリースということもあり、注目すべき新機能は多い。ここでは、そのなかからSafari ReaderとSafari Extension、HTML5に関連した機能を検証してみよう。
数ある新機能のうち、もっとも利用頻度が高くなりそうなものが「Safari Reader」だ。使い方はかんたん、スマートアドレスフィールドに表示された「リーダー」ボタンをクリックすればいい。わずかそれだけの作業で、ページの本文や図版、ハイパーリンクなどページのメインコンテンツを抽出し、読みやすく整形した画面を表示してくれるのだ。バナー広告を取り除く目的にも使用できるため、賛否両論を巻き起こす可能性はあるが、メールへの添付や印刷にも対応するなど、コンテンツにじっくり目を通したい読者には待望の機能といえる。
その「リーダー」ボタン、すべてのページに表示されるわけではない。たとえば、CNET Japanのトップページのように、複数行にまたがった文章が少ないページではスマートアドレスフィールドに変化はない。アップルジャパンのニュースリリースのように、省略すべき要素が少ないページも、「リーダー」ボタンは現れない。
処理は完全に自動化されているため、思いどおりに本文や図版が抽出されないこともある。たとえば、「富士通、個人向けPCの製品名称を変更--LIFEBOOKとESPRIMOで世界統一」の記事では、JPEG画像2点が省略されてしまう。
筆者が試したかぎり、本文は概ね正確に抽出されているようだが、注記など本文とは書体や色を変えて表示している文も別け隔てなく処理してしまう傾向を確認できた。たとえばCNET Japanの一部の記事には、本文末尾に「この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです」と薄いグレーの小さな文字の注記が入ることがある。しかし、抽出された文では本文と見分けがつかない。関連記事へのリンクといった有意な情報が省略されてしまうことも、ウェブの特性を考えればデメリットのほうが大きいだろう。
整形後のフォーマットだが、メールに添付されたファイルを確認したところ、プレインテキストとHTML+CSSで構成されていた。ソースを確認したところ、日本語テキストは「Content-Type: text/plain; charset=iso-2022-jp」として符号化され、HTMLメール非対応のメールクライアントで読めることもわかった。HTMLで書き出しておしまい、としないところにAppleの作り込みのよさが感じられる機能だ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力