PDF ファイルを内容で検索したい

PDF ファイルが納められたフォルダに対して索引を作成し、Finder からファイルの内容に対してキーワード検索をしたいのですが、結果があまり思わしくありません。この問題に関して情報をご存じの方がおられましたらお教えくださいますと幸いです。
状況の詳細:
PDF ファイル(平均 200 kB 程度で、ほとんどが英語のテキスト)が 8000 個ほど入っているフォルダに対して「情報を見る」の「内容索引」のところで索引を作成させました。使用言語は日本語と英語を選択し、Power Mac G4 Cube (450 MHz, 600 MB RAM) でおよそ半日かけて終了しました。
その後、Finder の検索画面で「特定の場所」でこのフォルダを選択し、「内容が」の欄に、内容に含まれていることがわかっているキーワードを入力して検索させました。
しかし期待されたファイルがほとんど検索されませんでした。ごく少数ながら検索されたファイルがありますので、索引作成と検索機能そのものはともに正常に機能しているように見えます。
しかし明らかにそのキーワードを含んでいる PDF ファイル(Acrobat 上で同じキーワードで本文中を検索すればヒットする)の大多数が検索から漏れてしまいます。

投稿日 2003/02/19 11:01

返信: 17

2003/02/20 07:16 Community User への返信

野尻様、有益な情報をありがとうございました。状況が把握できました。こちらでできる対処としては、Acrobat のバッチ処理で RTF に書き出して、そちらに対して索引を作らせることぐらいでしょうか。
 実はかなり以前にも、OS X 版の Sherlock で PDF ファイルの内容検索ができないことに気付いてアップルにフィードバックしたことがあるのですが、音沙汰がありませんでした。しかしそのときはバージョンによって索引ができたりできなかったりすることには気付いていませんでした。アップル側の早急の対応を期待したいところです。

2003/02/25 12:55 Community User への返信

やや話がずれますが、finder検索つながりと言うことでご勘弁下
さい。
MSWord,EGWord,PageMaker
これらのソフトで作成したファイルに関しても、finderは「内容
で検索」を実行してくれません。
sherlock2までは可能だっただけに、この後退は残念です。
このまま切り捨てられることはないと思うのですが、一刻も早い
対応を望みます。

2003/02/28 09:22 Community User への返信

安食さんのご紹介下さったEasyFindを試してみました。
ありがとうございます、これは使えます!
拡張子については「ファイルタイプと拡張子のいい関係」という
クラシックアプリがありますので、そちらで調べることが出来ま
した。
apple社もこういう優れたfreewareをどんどん実装していって欲
しいですね。

2003/02/28 12:56 Community User への返信

stib さん、どうも申し訳ありません。
安食さんに、EasyFindに関して教えていただきたいことがあるんです。
Preferencesには「拡張子」のかわりに、「ファイルタイプ」(例えばEGWord
であれば、'EGD9'とか)を入力していますが、MSWordに限り検索出来ないよう
です。
'W8BN'もdocも試しているのですが・・・。
安食さんの環境では検索出来ますでしょうか。
#長引きそうでしたら他スレッドに移ります。

2003/03/01 13:38 Community User への返信

わざわざご丁寧にありがとうございます。
Word とAppleWaorks の文書を検索するかどうか、MSWD, cwk などの拡張子を入れて試みましたが、私の環境でも検索できません。サポートしていない(拡張子の間違いかも)のだと思います。pdf 文書内容を検索するときは、時間が余分にかかるため、私はpdf 単一で検索しています。
作者のサイトに久しぶりにいきましたが、まだ v. 2.6 は公開されていないようですね。小生が入手してから大分経ちます。来週後半に2回目の利用報告を作者にしますから、Word などの文書検索機能を将来実装する計画があるかどうか、papa4G さんに代わって尋ねましょうか?

2003/03/02 09:47 Community User への返信

ご親切にありがとうございます。
安食さんは作者の方とお知り合いなんですか。
Wordの検索機能をば、ぜひ実装してくださるよう、作者の
Grunenbergさんにお伝え下さい。よろしくお願いします。
私は国語の教師なのですが、新規に問題を作成したり、覚えて欲
しい用語がどんな大学で出題されているのか検索したりするのに
sherlock2は欠かせません。
特定の用語がどのレベルの学校で出題されているのかも、簡単に
わかります。
特殊な用途かも知れませんが、人文系で曖昧な検索をしたい時に
代わりの効かないsoftwareだったんです。
しかし、どうやらOSXで同等の機能は実装されそうもないですし、
EasyFindにはその分期待がかかります。
#検索機能設定ですが、「拡張子」ではなく、「探したいファイ
ルをドラッグして探させる」方式なら、文系の私でも簡単に設定
できます。
お願いばかりで申し訳ありませんが、そのこともお伝えいただけ
ると幸いです。

2003/03/04 17:26 Community User への返信

安食様
EasyFind のご紹介ありがとうございました。
残念ながら現行版(2.5)ではPDFの検索機能はまだ不十分なようで、やはりごく限られた数のファイルしかヒットしませんでした。
索引を作らなくても内容で検索できるというのは、たしかに利用環境によっては非常に便利そうですね。
ただ、数千のPDFファイルを対象にしている私の都合では索引があらかじめ作成されていないと時間がかかってしまってかなわないということもあり、できればFinderの検索機能がPDFに完全対応して、Sherlock2並の使い勝手を実現してくれればと願わされます。

2003/03/04 19:07 Community User への返信

> Grunenbergさんとは、お互い知り合いではないんですか。
EasyFind の愛用が初めてで、知り合いではないんですよ。メールの交換は4回ほどしかしていませんが、やり取りの内容から、お互いに好感は持ちあえていると印象を受けました。以下は、本日いただいた手紙の一部です。必要な箇所のみです。v. 2.6 については、後日ダウンロードしてみて下さい。当方で使いはじめた最も大きな理由は、Mac OS X 10.2 以前では、数字単位(例:文書番号など)の内容検索が私の環境では出来なかったためです。これについては、以前Apple Computer, Inc. へ要望を出したことがありました。Mac OS X 10.2 以降は、それが実現されてありがたく思っています。「探したいファイ ルをドラッグして探させる」方式については、 今回の回答内容を判断した上で、ということからまだリクエストしていませんが、以下のような説明ですので現行のままでよろしでしょうか?
From: Christian Grunenberg, Date: Tue Mar 4, 2003
Subject: Re: The 2nd report & a favour for EasyFind (Revised)
Hello,
> Are there any users who have desired the feature? He and I would
> like to eager for the implementation if it would be possible for you.
> BTW, can he ask you for EasyFind 2.6?
Version 2.6 will be released within the next few days (have been out of town a lot lately). But currently EasyFind just scans the data fork of files and treats the data as pure text. This may work with Word files but probably only with western languages (the Word file format is not documented and all available libraries to read Word documents are open-source and require a GNU license.
Finally, maybe he should have a look at DEVONthink & AntiWordService? ()
> He (a school teacher of Japanese language) asked me
> to send you his best regards.
Thanks ;-)
Ciao,
Criss...

2003/03/04 19:20 Community User への返信

> やはりごく限られた数のファイルしかヒットしませんでした。
ご希望に添わない面もあるようですね。間もなく 2.6 を公開される(papa4G さんへのご返事に書込み済)と思いますので、それを使用して具合を見ていただけますか?
後日、私の方でも(pdf ファイルは少ないですが)再度試みてみます。Grunenberg 氏の云われるdata fork of files and treats the data as pure text の制限の影響でしょうか...それと、彼はGNU 開発には関心がないとも云っていました。
Grunenberg 氏は、数日中に2.6を公開する予定だそうですが、ヨーロッパの人々には、期日/時間について、お互い多めにみましょう(国や地域により幅に相違あり)というのようなものがありますので、少し遅くなる場合もあるかもしれません。

2003/03/05 07:51 Community User への返信

作者の方への問い合わせをお世話様でした。
公開されたversion 2.6をさっそく使ってみました。
しかし残念ながら結果はやはりPDF検索には非対応でした。
窒素固定関連の仕事をしているので「nitrogen fixation」というフレーズを内容に含むファイルが多数あるのですが、このフレーズで検索をかけてもたった一つのファイルしかヒットしませんでした。
「But currently EasyFind just scans the data fork of files and treats the data as pure text. 」とのことですから致し方ありません。検索したフレーズがたまたまPDFファイルの冒頭にタイトルやキーワードとしてピュア・テキストで書き込まれていたファイルだけがヒットするのでしょう。

2003/03/05 09:53 Community User への返信

そうですね、使用には適していませんでした。
小生、以下の書類をダウンロードして、試してみました。内容を検索しませんでした。
"Eureka - A FINAL REPORT SUMMARY, Managing Nitrogen Fixation"... UWA196.pdf
"AgBioteck - Infosource" ... inf_nov99.pdf
コンソールにはこれが返されました;Mar 5 12:43:50 xxxxComputer /Applications/EasyFind.app/Contents/MacOS/EasyFind: kCGErrorIllegalArgument : CGSFlushSurface: Invalid surface
以前使用したpdf ファイルでは検索しますので、書類プロパティを調べたところ、クリエーターにより、検索できるものと出来ないものがあることに気が付きました。残念ですね。

2003/03/06 14:35 Community User への返信

安食さんのお骨折りに、大変感謝しています。
EasyFind2.6でもやはりMSWordは検索出来ないようですね。
問題の所在も理解できましたので、この問題に付いてはテクスト
保存書類を同時に作るなどして回避できると思います。
EasyFindは日本語解析(ATSUIでしたっけ?)を使っていないため
でしょうか、ワイルドカードが上手く機能してくれませんが、逆
に「どんな品詞でも探してくる」強力なツールででもあります。
「しかし」「そして」や「のである」などはこれまで検索出来な
かったので、大変重宝しています。
sherlock2と適宜使い分けながら、仕事をしていこうと思います。
よいソフトをご紹介頂いて、ありがとうございました。

2003/03/07 10:36 Community User への返信

そのPDF書類は持っていませんが、私のところではコンソールでは特にエラーは返されません。単に検索にかからないだけのようです。

このスレッドはシステム、またはAppleコミュニティチームによってロックされました。 問題解決の参考になる情報であれば、どの投稿にでも投票いただけます。またコミュニティで他の回答を検索することもできます。

PDF ファイルを内容で検索したい

Apple サポートコミュニティへようこそ
Apple ユーザ同士でお使いの製品について助け合うフォーラムです。Apple Account を使ってご参加ください。