Namazu 2.0.X のインデックスは大きく分けると次の3種類に分類できます。
- A. 日本語インデックス (EUC-JP で構成)
- B. 英語インデックス (US_ASCII のみで構成されたもの)
- C. イリーガルインデックス
- ISO-8859-1 文字を含むインデックス。
- 日本語インデックスと互換性がない。未サポート。
- 現在の 2.3.X の UTF-8 インデックスとは皮肉なことに後方互換となっているが、2.3.X のインデックス形式は将来変更される可能があります。
A は日本語の文書を日本語で言語処理を行ってインデックスを作成したもの。
B は英語(US_ASCII)の文書からインデックスを作成したもの。
C は英語(ISO-8859-1)の文書を日本語以外(英語を含むISO-8859-1の言語)で言語処理を行ってインデックスを作成したもの。
- 日本語インデックスを用いて検索結果を表示するには、メッセージの表示言語は日本語でなければなりません。(漢字コードについては制限があります。)
- 英語インデックスを用いて検索結果を表示する場合は、メッセージの表示言語に制限はありません。(デフォルトでサポートしていない言語については、テンプレートおよびメッセージカタログを用意する必要はあります。)
- イリーガルインデックスを用いて検索結果を表示するには、メッセージの表示言語はISO-8859-1の言語でなければなりません。日本語はISO-8859-1ではありませんので、日本語を選択することはできません。
セコメントをする