プレビューでの検索が出来ない

ダウンロードしてきたPDF(Spotlightでテキスト検索して見つかったファイル)をプレビューで開いて、PDFのテキスト検索の窓に、既にあることが確認されているテキストを入れて検索しようとすると、うまくゆくファイルとうまくゆかないファイルがあります。


  • うまくゆかない例:「索引作成中…」と出て「見つかりません」となってしまう あとは何を入れても同じ
  • うまくゆかない例:「索引作成中」さえも出てこないで「見つかりません」となってしまう あとは何を入れても同じ
  • うまくゆく例:「索引作成中…」と出て、あとはすべてうまく検索が可能(これは正常な場合)
  • うまくゆく例:うまくうゆかなかったPDFをプレビューで「別名で保存…」した後で開くと、すべてうまく検索が可能になった


またインスペクタでこれらのファイルを見ても、「このPDFの完全な権限があります」となっていて、相違点があるようには思えません。


今まで確認出来たのは以上です。


これらのファイルすべてをプレビューで検索可能にする方法はないものでしょうか?

iMac, Mac OS X (10.5.8), MacBookでも現象は同じ

投稿日 2010/04/17 18:50

返信
返信: 18

2010/04/17 19:17 MasaSGM880 への返信

検索が出来ないpdfファイルは、テキストになってますか?

pdf ファイルは,同じようにテキストが読めるようになっていても,ファイルとしては画像ファイルになっている場合もあります。非常に荒っぽくいえば,本のページを写真に撮ったものという感じ。この場合,プレビューでテキストを選べません。そういうファイルは、もちろん、テキストでの検索はそもそも無理です。インターネットの検索で引っかかるのは,検索ソフトで索引を自動で付けるなどいろいろ工夫しているためではないかと思います(このあたりは検索ソフトを開発する上での今一番活発な分野の一つです。もちろんこういうソフトはパソコン上で動かすようなことを想定している訳ではなく,グローバルに展開するようなサイトで使うことを想定しているものです。でも、もともとテキストの画像なら,そこからテキストを取り出すのは、OCRソフトを使えば比較的簡単ですから,それを検索するなどしているのではないかと思います。でもこれをプレビューなどの,コンシューマーのパソコンのソフトだけでやるのはいろいろ無理があるのではないかと思います)。pdfファイルがテキストになるのか画像になるのかは、pdfの作り方に依存するものですから,pdfになっている場合には利用者側ではどうにも出来ません。

2010/04/17 21:52 はに への返信

はに wrote:


pdf ファイルは,同じようにテキストが読めるようになっていても,ファイルとしては画像ファイルになっている場合もあります。


いや、保存し直すと検索できるんですから、それには該当しないと思います。


--


そのファイルに問題があるのだとすれば、具体例(URL など)があるともう少し検証できるんじゃないかと思います。あと、Spotlight 側の問題だとすれば、取り敢えずリセットしてみるとか。

2010/04/17 23:08 takano への返信

質問者ですが。追加情報を書かせていただきます。


書いているとおり、Spotlight でファイル内部のテキストが引っかかっている限り、ここで上げた例はすべて画像のPDF化などではありません。

ここで言っているのは、すべて有料の書籍だとか、大学などのサイトからダウンロードしてきた内容です。


たとえば

http://bell.kuee.kyoto-u.ac.jp/~hisakado/res.htmlの中程にある、アルゴリズムのハード化のリンクでダウンロード出来るPDFは、そのままではダメでも、保存すると検索が出来るようになりました。



もしかしたらプレビュー自体がおかしな状態になっている可能性もあります。

その際にはプレビューだけリセットってできますか?


やはりLeopard の再インストールしかないでしょうか?

でもおかしいのは、MacBookでも iMac G5でも同じ現象が出ていることなのですが…。

2010/04/18 02:47 MasaSGM880 への返信

縦組でPDFにテキスト化されているようです。

ですので一文字づつバラバラにしか検索できなかったです。


実際はどうかはわかりませんが、OCRで透明テキスト化PDFみたいなことして失敗すると、こんな感じになることもあるのかなぁと思ったりします。Windows持ってないので、やったことないですが…。


とまれ、横書きテキストを縦書きテキスト風に組み替えられていると思うのです(10.4の感想です)。



追記;


つまりOSX側の問題でなく、PDF作成時に縦組にされてしまっているということを言いたかったのです。


La Fomeraは、画像としてPDF化されているのか検索は不可でした。:


このメッセージは次により編集されています: お子様ランチ.

2010/04/18 02:34 お子様ランチ. への返信

皆様どうもありがとうございます。


こんな短時間で、これだけの有用な情報がいただけるなんて感激です。


他のファイルで調べてみると、ご指摘の通りのようです。


ダメ押しみたいで大変申し訳ないのですが、以下のFONのWebサイトにある、ダウンロード先についての下にある、例えば La Fomeraをクリックして取れるPDFではいかがでしょうか?


http://blog.fon.com/jp/archive/uncategorized/fonルーター%E3%80%80la-fonera-かんたんセットアップガイド%E3%80%80リ.html


これはAdobe Reader で開こうとするので、プレビューで開いてもダメ、別名で保存してから開いてもダメでした。


もしもLeopard ではどうしても解決できない問題であり、Snow Leopard にアップグレードするのが唯一の解決策だとしたら、それなりの覚悟をしなければならないもので。


あきらめが悪いようですが、どうか心中お察しください。


質問者より

2010/04/18 03:31 ni_ki への返信

すみません。


あせってしまい、大変失礼しました。


ここでの疑問点を一言で言えば、

テキストのちゃんと入ったどんなPDFファイルでも検索できるようする方法は、Leopard→ Snow Leopardへのアップグレードだけなのでしょうか 


ということです。Leopard上ではダメなファイルはダメなファイルとして検索できないままになってしまうのか、それとも何らかの操作をしてやれば、ちゃんと検索可能になるのか…。


もっと他の例も提示できればよかったのですが、有料でダウンロードしてきた本(すべて洋書です) はかなりのファイルがNGですが、ここで開示は出来ないので。


他にこのような例を見つけられた方、あるいは解決策をご存じの方は、是非とも教えてください。

2010/04/18 04:53 MasaSGM880 への返信

MasaSGM880 さんによる書き込み:


ここでの疑問点を一言で言えば、

テキストのちゃんと入ったどんなPDFファイルでも検索できるようする方法は、Leopard→ Snow Leopardへのアップグレードだけなのでしょうか

Snow Leopardにしても検索できない物は、存在するはずです。


1つ目に提示されたPDFはテキストが入っているので良いですが、2つ目のPDFはテキストが入っていない(文字の方をした図形。間違ってたらゴメンさいです)のでOCRでも使用すれば別ですが、今のところどのOSでも検索できないでしょう。1つ目のPDFはOSX10.5.8でもAdobe Readerを使用すれば検索できます。なので、プレビューとAdobe Readerの併用が良いのではないでしょうか。


結論的に書くと、このPDFの件では、「PDFの検索の問題が全て解決する」と思ってSnow Leopardにするのは「期待が大きすぎて危険」です。10.6.xがインストールされているMacで試してからの方が良いでしょう。

2010/04/18 05:21 MasaSGM880 への返信

今読んでいる文字は、私が一文字一文字キーボードから打って入れてます。これを”テキスト”と一般に呼んでます。

しかし、fonera_v01.pdfは同じキーボード入力の文字に見えますが、事実は文字に見えてキーボード入力されてない”ただの画像”なのです。

ただの画像で”キーボード入力されたテキスト”を検索できる道理は無いです。

したがってキーボード入力の”テキスト”ではないfonera_v01.pdfは、現状のままでは検索はできません。

ここをはっきり理解してください。


何らかの操作をしてやれば、ちゃんと検索可能になるのか…。



PDFをOCRソフトが読める形式に変換して、テキスト化すれば検索できる可能性はありそうですがこれも詳しく無いです。

2010/04/18 19:39 ni_ki への返信

皆さま、ありがとうございます。


ちょっと誤解を与えてしまったようですが、別にテキストと画像ファイルの意味というか区別を全く知らないわけではありません。


どうもせっかちで、Spotlight でテキスト検索して出てきたファイルを開いてそのままプレビュー検索できるPDFだと思い込んだのが、そもそもの間違いの元でした。


今回よくわかったのは、確かに画像のままで入っているPDFがある(しかも有料でダウンロードした某書籍データでも)こと、その場合はOCRで読んでみて変換するしかないかも…ということ、それとなぜかわかりませんが、その中間みたいな、一部の内部テキストが見つかるファイルもあること、プレビューで一度検索したファイルは二度目に開くときは索引が出来ているらしいこと(時間の短縮、ただしログイン期間中だけかも)、などがわかりました。


ダメなときは別の何かのエディタかUnixコマンドで開いてみて中身を確認してみるとか、異常にデカいファイルサイズで当たりを付けてOCRするのか(ちょっといい加減な言い方ですが)。めんどうですが、後で試してみることにします。Snow Leopard に上げることは今のところ意味が無いのでしないことにします。


世の中にはいろんなPDFファイルがあることが理解できただけで良かったとします。

2010/04/20 05:45 MasaSGM880 への返信

MasaSGM880 さんによる書き込み:


どうもせっかちで、

私もです^^;

Spotlight でテキスト検索して出てきたファイルを開いてそのままプレビュー検索できるPDFだと思い込んだのが、そもそもの間違いの元でした。

一見内容が違うように見えますが、検索問題では下記のような内容も有ります。

今回よくわかったのは、確かに画像のままで入っているPDFがある(しかも有料でダウンロードした某書籍データでも)こと、その場合はOCRで読んでみて変換するしかないかも…ということ、

出来るなら、このようなPDFは(特に)有料ではやめていただきたいところですが「全てのPDFをSpotlightで検索できるように」する法律を作る訳にもいかないので、難しいところです。(それにしてもFPGAって「再構成可能なLSI」のことだったんですね^^;)

2010/04/20 09:44 ni_ki への返信

一見内容が違うように見えますが、検索問題では下記のような内容も有ります。

/click.jspa?searchID=524124&objectType=2&objectID=100507569

Re: スマートフォルダからファイルが 消える


今回よくわかったのは、確かに画像のままで入っているPDFがある(しかも有料でダウンロードした某書籍データでも)こと、その場合はOCRで読んでみて変換するしかないかも…ということ、

出来るなら、このようなPDFは(特に)有料ではやめていただきたいところですが「全てのPDFをSpotlightで検索できるように」する法律を作る訳にもいかないので、難しいところです。(それにしてもFPGAって「再構成可能なLSI」のことだったんですね^^;)


いろいろとありがとうございます。 上のリンクも深い内容で皆様の投稿で盛り上がっていますね。

PDFの内部までは、今まで全く意識してなかったというか関心さえ持ってなかったので非常に参考になりました。でも私のような人も結構多いはず…。

OCRもどっかで試してみたいところですが…。


(FPGAは内部メモリーに書き込みすることでディジタル回路を構成する仕組みを持ったLSIが主流です(ってまた簡単に書いてしまって誤解を招くと困りますが)。 SRAMやフラッシュ・メモリを持ったタイプなら再書き込みできるので、出荷後に製品レベルや例えば携帯基地局の回路をリモートで変更することも可能です)

2010/04/18 00:58 MasaSGM880 への返信

ah.pdfというファイルですよね。10.5.8で試したところ「プレビュー」アプリケーションが文字順を正確に認識していませんでした。横長用紙に横書きで作成した物を、PDFにする際には縦用紙で作成したので、それを認識できていないようです。


文字を、選択してみると分かります。正確な文章方向へ選択出来ないです。


なので、一文字づつなら検索できました。

2010/04/18 02:47 MasaSGM880 への返信

MasaSGM880 さんによる書き込み:


ダメ押しみたいで大変申し訳ないのですが、以下のFONのWebサイトにある、ダウンロード先についての下にある、例えば La Fomeraをクリックして取れるPDFではいかがでしょうか?

ダウンロードしてみましたが、フォントが含まれていないので、文字が図形扱いなのではないでしょうか。

2010/04/18 05:24 お子様ランチ. への返信

お子様ランチ. さんによる書き込み:


PDFをOCRソフトが読める形式に変換して、テキスト化すれば検索できる可能性はありそうですがこれも詳しく無いです。

試したことがありますが、精度が問題でした^^;

例えば、ni_kiがm_kiなんかになると、どうにもなりません。

このスレッドはシステム、またはAppleコミュニティチームによってロックされました。 問題解決の参考になる情報であれば、どの投稿にでも投票いただけます。またコミュニティで他の回答を検索することもできます。

プレビューでの検索が出来ない

Apple サポートコミュニティへようこそ
Apple ユーザ同士でお使いの製品について助け合うフォーラムです。Apple Account を使ってご参加ください。