Follow Us.RSS

2008年8月28日(木)そうだ、ナマズがあるじゃないか!

  • ver1.1.20080828 では、Namazu で全文検索をすると埋め込みファイルがインデックスされてしまう問題を解決しました。

  • (2008年8月28日(木) 午後5時23分33秒 更新)
  • このエントリーをはてなブックマークに追加
    BuzzurlにブックマークBuzzurlにブックマーク

Namazu で全文検索

さまざまなサイトで広く利用されている日本語全文検索システムに Namazu があります。Namazu は HTML 上のリンクをたどるのではなく、サーバ上のファイルをくまなくインデックスします。

一方 CMONOS.JP の SSI 埋め込みファイルの拡張子が「.html」となっていたため、これまでは、CMONOS.JP の SSI 埋め込みファイルが Namazu によって通常の HTML ファイルとしてインデックスされてしまう問題がありました。そこで、SSI 埋め込みファイルの拡張子を Dreamweaver に倣い「.ssi」に変更しました。

この変更は非常に影響が大きいので、旧版からのユーザーは付属アップデータで必ずサイトをアップデートしてください。高度なカスタマイズがなされていない限り、関連するすべての設定および埋め込みファイルの拡張子を自動的に変更します。

今さらというかんじもしますが、テストがてらこのサイトにも Namazu による全文検索を導入してみました。左上のテキストボックスがサイト検索になっています。マニュアルを含め、すべての記事を検索できます。なかなか便利ですね。SSI によって埋め込まれているナビゲーション部分がインデックスされないので、より良好な検索結果を得られている気がします。

ところで、前述のように Namazu はサーバ上のファイルをくまなくインデックスしますので、何も設定しなければ、アクセス制限をかけたページや外部に告知していないページもすべて検索結果に表示してしまいますから、導入する場合はご注意ください。

インデックスを作成する際には「--exclude」オプションでインデックスされたくないパスを指定するとよいでしょう。CMONOS.JP のホームページメーカーでは、非公開記事フォルダ名の末尾に「.pending」が追加されますので、CMONOS.JP を運用しているサーバで Namazu による全文検索を導入する場合は「\.pending/」を含むパスを除外するよう設定してください。

更新情報

最近の記事

RSS

カレンダー

2008年9月
123456
78910111213
14151617181920
21222324252627
282930
2008年8月
12
3456789
10111213141516
17181920212223
24252627282930
31
2008年7月
12345
6789101112
13141516171819
20212223242526
2728293031
このページのトップへ