Smart Communication Design Company
ホーム > ナレッジ > Blog > アクセシビリティBlog > 2009年12月 > 【アクセシブルなPDF】文字情報を含むことの重要性

アクセシビリティBlog

Webサイトのアクセシビリティを高めるための方法や国内外の関連情報など、さまざまな角度からWebアクセシビリティに関する話題をご提供していきたいと思います。

当Blogの更新情報は、Twitter経由でも配信しています。興味のある方はぜひ、@mlca11yをフォローしてください。当Blogへのご意見・ご質問は、Twitter経由でも受け付けております。

2009年12月1日

【アクセシブルなPDF】文字情報を含むことの重要性

アクセシビリティ・エンジニア 中村

本年10月19日のエントリー、PDFとセキュリティ設定では、PDFのアクセシビリティを確保するには、下記の3点が守られていることが理想的であると紹介いたしました。

今回はこの中から「表示されている文字を読むことができるPDF」について取り上げたいと思います。 アクセシブルなPDFを提供する上で重要なポイントは「PDF内の文字情報」です。スクリーン・リーダーなど音声読み上げ環境でPDFの内容を確認するには、PDF内に文字情報(このエントリー内で「文字情報」とは、コンピュータが判読・処理することが可能な文字データのことを指します。)が含まれている必要があります。次に上げるような、文字情報の含まれないPDFの場合は、何らかの対応が必要となります。

文字情報が含まれていないPDFの例

例1:紙資料から作成されたPDF

文字情報の含まれないPDFの代表例が紙資料をイメージスキャナで読み取り、読みとった画像データをそのままPDFとして保存したケースです。このような過程で作成されたPDFは、画面上では文字として読むことができますが、PDFに書かれた文字は画像と化しているため、音声読み上げ環境では文字情報として判読することができません。

例2:文字のアウトライン化が行われているPDF

広告やポスターなど、印刷物用に作成されたデータを元にPDFを出力した場合によく見られるのが文字のアウトライン化が行われたPDFです。文字のアウトライン化とは、異なる環境でも文字の形が崩れないよう文字を図形化することを指します。アウトライン化されたPDFは、文字が図形化されてしまっているため、スキャナから作成されたPDF同様スクリーン・リーダーは文字情報として判読することができません。

PDFに文字情報を含ませるには

例1:紙資料からのPDF作成

紙に出力する以前のデータが手元にある場合は、そのデータを元にPDFを出力するのが理想的です。それが難しい場合は「OCR(光学文字認識)」を利用し、画像化された文字を再び文字情報として判読可能にするのが一つの手段です。ただしOCRソフトのテキスト認識率は100%正確ではなく、文字を誤認識する事も往々あります。したがって、資料をイメージスキャナで読み取る際は、OCRソフトが正しく文字を識別しやすいよう、資料の文字部分と背景色のコントラスト比をはっきりさせる、適切な解像度の設定を行う、といった配慮を行うことが望まれます。

例2:文字のアウトライン化が行われているPDF

アウトライン化する前のデータがあれば、文字のアウトライン化をせずにPDF出力を行うことで文字情報を保持したままのPDFを出力することが可能です。それが難しい場合は紙資料からのPDF同様、OCRを利用するのが一つの手段のように思います。

文字情報の重要性

前回のエントリーでは「文書にアクセスできるPDF」としてスクリーン・リーダーからPDFへのアクセスを可能にするためのセキュリティ設定についてご紹介しました。しかし、たとえスクリーン・リーダーがPDFにアクセスできたとしても、PDF内に文字情報が含まれていなければスクリーン・リーダーはPDFから何も情報を取得することができません。これでは中身が空っぽのPDFを提供しているのと同じことになってしまいます。PDFのアクセシビリティを考える上では、PDFに文字情報をどれだけ正しく含ませることができるかが、非常に重要なポイントではないかと考えています。

次回は「正しい順序で情報を取得することができる」PDFについて取り上げたいと思います。

ミツエーリンクスでは、WCAG準拠JIS X 8341-3対応をはじめ、さまざまなWebアクセシビリティ関連サービスをご提供しています。是非アクセシビリティのページをご覧いただき、お気軽にお問い合わせください。

Pick Up