PDFの文字列をコピペするとおかしな文字列になる現象の回避方法。

最近では、WordやExcelからPDFファイルを作成できるようになりましたね。
そのWordで作成したPDFファイルのテキストをコピーして、テキストエディターやメールなどにペーストすると、不思議な現象が起こることがあります。

たとえば、「毎日暑い日が続きますが、ご自愛くださいませ。」と書いたPDFがあるとします。
(用意しましたよ。どうぞ! → おかしなPDF
このPDFをダウンロードし、Acrobat Reader等で開き、文章をコピーし、メモ帳を立ち上げて貼り付けてみてください。
不思議なことに「毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎」などと何度も繰り返された文章になります。
そもそもコピーするにも、文字列を選択するのがなんだか難しいです。

貼り付けた文章から必要なところだけ残して消せば済む話なんですが、正直少し使いづらいです。
この文章を貼り付けると「毎日暑い日が続きますが、ご自愛くださいませ。」と1回だけ貼り付けられるPDFの作り方を探しました。

「アクセシビリティ用のドキュメント構造タグ」 のチェックをはずそう

まずはできあがったPDFをご覧ください。
文章が1回だけ貼り付けられるPDF

1回だけ貼り付けることができました!
調べてもはっきりとした原因はよくわからなかったのですが、どうやらPDFファイルを保存する時のオプションを調整することで回避できるようです。

PDF作成時のオプション
作り方ですが、「PDF または XPS 形式で発行」のダイアログにある「オプション」をクリックすると右のようなウィンドウが開きます。
デフォルトで「アクセシビリティ用のドキュメント構造タグ」にチェックがついているのがわかります。
このチェックをはずした状態でPDFを作成してください。
うまくテキストのコピペができるPDFができるようになりました。

PDF化したファイルを使うのが自分だけならかまいませんが、他の人と共有するのならより使いやすいデータにしたいですよね。

cf. Word 2010でPDF化した文書のテキストコピーがおかしい。

[`evernote` not found]
LINEで送る

コメント for non-facebook user

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


お問合せはコチラ
RSS