スキャンしたPDFファイルが文字化けします。



◇-スキャンしたPDFファイルが文字化けします。-ぐみ(2004/4/26-10:56)No.131055
 ┣Re:スキャンしたPDFファイルが文字化けします。-テツヤ(2004/4/26-22:21)No.131137
 ┗Re:スキャンしたPDFファイルが文字化けします。-きつね(2004/4/26-22:52)No.131142
  ┗Re:スキャンしたPDFファイルが文字化けします。-きつね(2004/4/26-23:13)No.131143
   ┗Re:スキャンしたPDFファイルが文字化けします。-ぐみ(2004/4/27-11:43)No.131187
    ┗Re:スキャンしたPDFファイルが文字化けします。-kikuko(2004/4/27-14:02)No.131218
     ┗Re:スキャンしたPDFファイルが文字化けします。-ぐみ(2004/4/27-14:31)No.131225
      ┗Re:スキャンしたPDFファイルが文字化けします。-きつね(2004/4/27-19:19)No.131269
       ┗Re:スキャンしたPDFファイルが文字化けします。-ぐみ(2004/4/28-11:14)No.131364
        ┗Re:スキャンしたPDFファイルが文字化けします。-きつね(2004/4/28-18:29)No.131431

▲このページのトップに戻る
131055スキャンしたPDFファイルが文字化けします。ぐみ 2004/4/26-10:56

メーカー名:東芝
OS名:WindowsXP
パソコン名:DYNABOOK SS
ソフト関連:ソフトの使い方がわからない
--
スキャナで取り込んだPDFファイルをメイルに添付してアメリカに送信したところ、日本語部分のみ文字化けしたと云われました。
PDFファイルはひとつの画像ファイルのようなものという認識があったのですが、このようなことは起こりうるんでしょうか?
以前EXCELからPDFに変換したときに、フォントによって化けたりしたことはあったのですが、スキャンした文書でもフォントなど影響するのでしょうか?どなたか解決方法をご存知でしたら教えて頂けないでしょうか?
宜しくお願い致します。
ちなみに使っているバージョンは6.0です。

▲このページのトップに戻る
131137Re:スキャンしたPDFファイルが文字化けします。テツヤ 2004/4/26-22:21
記事番号131055へのコメント
>スキャナで取り込んだPDFファイル…日本語部分のみ文字化けした…
 ちょっと意味不明です。…ん…考え中…。
 「イメージスキャナーで何かを撮り込んでPDFファイルを作成した」?。
 とすると、そのイメージ部内の日本語は当然化けていない…?。周りの文書の日本語が化けている…?。
 「アクロバットのエディター」?は、HTMLと同じく文字セットの設定とか有るんじゃないでしょうか?。…無責任なアドバイスですいません…。


▲このページのトップに戻る
131142Re:スキャンしたPDFファイルが文字化けします。きつね 2004/4/26-22:52
記事番号131055へのコメント
>スキャナで取り込んだPDFファイルをメイルに添付してアメリカに送信したところ、日本語部分のみ文字化けしたと云われました。
>PDFファイルはひとつの画像ファイルのようなものという認識があったのですが、このようなことは起こりうるんでしょうか?
>以前EXCELからPDFに変換したときに、フォントによって化けたりしたことはあったのですが、スキャンした文書でもフォントなど影響するのでしょうか?どなたか解決方法をご存知でしたら教えて頂けないでしょうか?
>宜しくお願い致します。
>ちなみに使っているバージョンは6.0です。

スキャナはビットマップ画像を取り込む装置でありテキストデータを取り込む
装置ではありませんから「スキャナで取り込んだPDFファイル」という部分の
意味するところが良く分かりません。

印刷された文書をスキャンし→OCRソフトウェアでテキストデータ化し、
→それをPDFファイルに仕上げた、という意味でしょうか?
そうであると仮定してコメントします。

PDFでも、文字を画像として組み込んでしまうやり方ならば、読む人の
フォント環境に依存しません。その代わり、文字はビットマップ画像と
して組み込まれるので品質が劣りますし、拡大縮小した場合はビット
マップ画像の拡大縮小となるので更にそのアラが目立つようになります。
また、文字と見える部分を選択してコピーした場合でも、テキストデータ
ではないので、ワープロなどにコピーすることができません。

一般的に利用されている方法は、テキストとして組み込む方式です
(要するに何某のフォントで表示しなさいという情報と、テキストデータ)。
これだと、拡大縮小をしてもフォントはベクターフォント(TrueTypeと
同じ)なので、奇麗ですし、コピー保護をしていない場合なら、範囲
指定でテキストデータをコピーできます。
しかし、当然ながら、日本語環境のないPCでは読めません。

PDF Writerなどは個人で使用していないので、具体的にどう設定すれば
良いか助言できませんが、そういう設定があるかどうか探してみては?

あるいはフリーウェアのCutePDFを使えば、文字を画像としてPDFファイル
にしますので、環境に依存しません(当然、冒頭に書いた通り、テキスト
データを取り出すことはできなくなります)


▲このページのトップに戻る
131143Re:スキャンしたPDFファイルが文字化けします。きつね 2004/4/26-23:13
記事番号131142へのコメント
でも、、もし「印刷された文書」をネット経由で誰かに送付したいだけなら、
なにもPDFにしなくても、スキャナで画像として取り込んだままのものを送付
すれば、そもそも原理的に文字化けは発生しません。
そうした方が良いのでは?

それとも、OCRでテキストデータに変換して、それを(テキストデータとして)
PDFにすれば、画像として送付するよりファイルサイズが小さくなるから、
そうされたのでしょうか?
もしそうだとしても、テキストデータ化した段階でテキストデータを読める
環境でないとダメという条件がついてしまいますから、先のコメント通り、
結局は画像として送付することになるわけです
(その方法が、OCRで一旦テキストデータにした文字単位で再度画像にして
埋め込むか、OCRせずに全体を画像として埋め込むかの2通りはあるとしても)。

それならOCRせず、取り込んだ画像のままPDFファイルにまとめるか、
いっそPDFにせず、画像ファイルのまま送付すれば済む話の様に思えます
(複数ファイルになるのが困るならZIPやLHAで1ファイルにまとめられます)

画像ファイルをPDFにするにしても、画像データのまま送付するにしても、
単なる白黒印刷文書であれば、白黒2値か、16値程度のグレー画像のGIF、
または256値のグレー画像JPEGファイルにすれば、ファイルサイズを
抑えられます。


▲このページのトップに戻る
131187Re:スキャンしたPDFファイルが文字化けします。ぐみ 2004/4/27-11:43
記事番号131143へのコメント
テツヤさん、きつねさん、ありがとうございます。
わたしはいつも書類などをスキャンするときにはACROBATを使っているんです。
このやりかただと、自動的にOCRされてしまうんでしょうか?それとも設定方法があるんでしょうか?
いずれにしても、文字化けする原因としてはテキストデータ化されているために日本語環境のないマシンで化けるということが考えられるわけですね。
取り込んだ画像のままPDFファイルにまとめるにはどうすれば好いのでしょうか?
まだ使い始めたばかりで好くわかっていないため、へんな質問だったらごめんなさい。

▲このページのトップに戻る
131218Re:スキャンしたPDFファイルが文字化けします。kikuko 2004/4/27-14:02
記事番号131187へのコメント
ぐみさんは No.131187「Re:スキャンしたPDFファイルが文字化けします。」で書きました。
>テツヤさん、きつねさん、ありがとうございます。
>わたしはいつも書類などをスキャンするときにはACROBATを使っているんです。
>このやりかただと、自動的にOCRされてしまうんでしょうか?それとも設定方法があるんでしょうか?
>いずれにしても、文字化けする原因としてはテキストデータ化されているために日本語環境のないマシンで化けるということが考えられるわけですね。
>取り込んだ画像のままPDFファイルにまとめるにはどうすれば好いのでしょうか?
>まだ使い始めたばかりで好くわかっていないため、へんな質問だったらごめんなさい。

スキャナのメーカーと型番は何ですか?

▲このページのトップに戻る
131225Re:スキャンしたPDFファイルが文字化けします。ぐみ 2004/4/27-14:31
記事番号131218へのコメント
kikukoさんは No.131218「Re:スキャンしたPDFファイルが文字化けします。」で書きました。
>スキャナのメーカーと型番は何ですか?

キャノンのLiDE30です。

▲このページのトップに戻る
131269Re:スキャンしたPDFファイルが文字化けします。きつね 2004/4/27-19:19
記事番号131225へのコメント
Canon Lide 30そのものには、PDF出力する機能はなさそうですが、
ユーティリティとして配布されている、CanoScan Toolbox 4.1.3.3
にはPDF出力機能がありそうです。
これ(またはバージョン違いの同じユーティリティ)をご利用に
なっているのでしょうか?

・CanoScan Toolbox 4.1.3.3
 http://cweb.canon.jp/drv-upd/canoscan/cstb4133.html

このソフトウェアの挙動は、Lide 30を持っていない私には調べようが
ないのですが、「修正点」事項にOCRに関する記述が見られますから、
OCRしてからPDFにする機能を持っているらしいことが推測されます。

仮にOCRしてからPDF出力する機能があるにしても、OCRしないまま
(つまり画像のまま)PDFファイルにすることができるハズなので、
オプション設定をチェックされては?

試しに上記ツールをインストールしてみたところ、[ファイル]ボタン
でPDFファイルが作成できるようですが、それを使いましたか?
別途[OCR]ボタンもあることからこのツールはOCR機能を備えている
事も分かります。

その場合、ボタンを押した中にある[PDF設定]に「検索可能PDFを作成」
というチェックボックスがあります。
これにチェックすると、恐らく日本語や英語部分を内蔵されたOCR機能
でテキストデータに変換してからPDFファイルにすると思われます。
(逆にチェックを外せばOCRせずにそのまま画像としてPDFにするはず)

残念ながらこのツールはCanon製のスキャナあるいはこのツールが
想定しているTWAINでないと呼び出せないらしく、私が使用する
hpのスキャナのTWAINを選んでもTWAINソースが見つからないとか
言われてしまい動作しないので、OCRされたPDFファイルが出力される
のかどうかチェックできず、ここまでしか調べられません。

なお、別の方法で調べるなら、メールで送付したPDFを拡大縮小した
際に文字がいくらでも奇麗な輪郭を保つならそれはベクターフォント
であり、テキストデータであることが分かります。また、テキスト
部分を選択して、コピーし、メモ帳などへ貼り付けした時に、その
文書が貼り付けられるならそれはテキストデータであるということです。

▲このページのトップに戻る
131364Re:スキャンしたPDFファイルが文字化けします。ぐみ 2004/4/28-11:14
記事番号131269へのコメント
きつねさん、ありがとうございます。
メイルに添付したPDFを拡大縮小してみたところ、文字の輪郭はきれいなままでした。メモ帳に貼りつけてもみましたが、文書の貼りつけもできたのでテキストデータだったということですね。
これで、アメリカで文字化けした理由がわかりました。
教えていただいたツールもインストールしてみました。
検索可能PDFにチェックを入れたものと入れないもので二通りで同じ書類をスキャンしてみたものを、アメリカに送って確認してもらうことにします。
今まではACROBATのファイル→PDFを作成→スキャナでやっていたのですが、これからはこのツールを使ってやることにします。
いろいろとありがとうございました!


▲このページのトップに戻る
131431Re:スキャンしたPDFファイルが文字化けします。きつね 2004/4/28-18:29
記事番号131364へのコメント
>教えていただいたツールもインストールしてみました。
>検索可能PDFにチェックを入れたものと入れないもので二通りで同じ書類をスキャンしてみたものを、アメリカに送って確認してもらうことにします。

送付する前に自分で確認した方が二度手間にならなくて済むような
気がします。

それと、

>今まではACROBATのファイル→PDFを作成→スキャナでやっていたのですが、

というのであれば、Acrobat側の設定でOCRに絡む設定を有効/無効
にする設定があるような気もしますけど…。
それともそういう連携をした場合に、指定箇所がなくて、Lide30の
TWAINが勝手にOCR処理することにしてしまっているというならば、
どうしようもないのかも知れませんが。。どうなんでしょうね。

あと「なんでも自動的にやる方式」を使うと何が行なわれているか
分からないブラックボックスと化しますから、一度は基本的というか
原始的なやり方もマスターされた方がいいのでは。
・スキャナで画像をスキャンして画像ファイルを作成(1枚または複数枚)
・それをアクロバットのDistilerだったかWriterだったかに必要枚数登録
・現行の向き調整が必要なら登録した後に調整
・PDFファイルとして書き出し
というような方法でできるはずです。

A1.本ページは参考になりましたか? 又はアドバイスがありますか?
解決 参考になった 参考にならなかった アドバイスする

A2.何度目の訪問ですか?
初めて来た   数度目(2〜4) 5回以上来ている   管理人:

A3.何か一言どうぞ(アドレスは書くことができません)

A4.アドレスがあればどうぞ(1つまで)


↑↑↑↑よろしければ押してください↑↑↑↑

何か一言(本ページで参考になったならないを含めて残してあります)
◎:解決 ○:参考になった ×:参考にならなかった !:アドバイスあり

参考回数投稿日時何か一言
×初めて2004/07/07/(水) 19:10:44みずほインターベース証券の株価ボードだけ(他の表示画面は読める)が 文字化けして見えません。Win Me 使用 CC*ファイル削除再起動でも改善なしでした。MSIE6/WinMe