勤め先の部門内ファイルサーバで、ずっとHyperEstraierによる検索システムを使用していたのですが、ここしばらく止めてしまっていました。 停止した直接のきっかけはサーバのクラッシュだったのですが、検索システムの再稼働を先延ばしにしていたのは、インデックス更新処理が止まらなくなるトラブルが起きていたからです。 インデックス更新処理トラブルの現象 現象としては、 ある特定のPDFファイル(とりあえず2つだけ)のxdoc2txtによるテキスト抽出処理が、CPUを使いきったまま停止しなくなる というものでした。 問題が生じるのは数百GByteは消費しているファイルサーバ中のたった2つのファイルですが、何しろ止まらないので、夜間にインデックス更新させようとしても翌朝更新処理が終わっていないことになります。 気付いた時点でxdoc2txtを強制終了するのですが、今度はそこから残りのインデックス更