Lucene/Solrを土台とする大規模なWeb検索向けフレームワークとして注目を集める「Apache Nutch」のメジャーアップデートがリリースされた。Hadoopやコンテンツ検出/分析用の軽量ツールキット「Tika」などとも統合できる。 Apache Software Foundation(ASF)のApache Nutchプロジェクトは6月19日、オープンソースのWeb検索ソフトウェア「Apache Nutch 1.1」を公開した。プロジェクトのWebサイトからソースコードとバイナリがダウンロードできる。 Apache Nutchは、「Apache Lucene」のサブジェクトとしてスタートしたWeb検索ソフトウェア。2010年4月、ASFのボードメンバーが新たに承認したトップレベルプロジェクト(TLP)の1つとなっている。 大規模なWeb検索向けに拡張性を持たせたフレームワークで