mojix.org mojix.org
Zopeジャンキー日記

検索機能を加えました / full text search added :  コメント

MJSplitterを入れて見ましたが、READMEに書いてあるcharsetとdictset(?)を指定くださいということですが、何を指定すればいいんですか?

ご参考までですが、全部utf-8で指定しています(サイト)なので、euc-jpとか使っていません。

「text_charset」は、検索対象のテキストの文字コードです。ロバートの場合サイトがutf-8ということなので、utf-8でOKです。
「dic_charset」は、MeCabが使う辞書(ipadic)の文字コードです。デフォルトは、Linuxなどの場合euc-jp、Windowsならshift_jisだと思います。
Linuxなどの場合、インストール時のconfigureでipadicの文字コードをutf-8に変えることができます。その場合は文字コード変換が不要になるので、そのぶん高速になります(JapaneseCodecsなども不要になります)。

あたり。utf-8とeuc-jpで通りました。ありがとうございます。

ろば


スパムが多いため、現在コメントの受付を中止しています。ご了承ください。