MySQLにおけるfulltext index

以前書いた、「mysql+sennaにおいて、sennaのインデックスと他のインデックスを組み合わせてクエリーを実行」というのを一部実現しました。(やたら時間が開いてしまいました。。 )sennaのrev75に bindings/mysql/mysql-2ind.diff という小さなパッチをつけて…

はてなキーワードを高速に付与

sennaのsen_symクラスは、common prefix searchが可能です。この機能を使って(今更なのですが)Dartsと同じ手法ではてなキーワードを高速に付与するプログラムを作ってみました。hatenapo.c以下のような特徴があります。 任意のタイミングで付与対象のキーワ…

MySQLにおけるfulltext index

「実践ハイパフォーマンスMySQL」によれば、MySQLでは1つのクエリーを実行するとき1つのテーブルにつき1つのインデックスしか使用できません。match against条件によって全文検索を行う時は、殆どのケースでfulltext indexを使用することになります。 しかし…

unicode正規化

http://dev.razil.jp/svnweb/senna/checkout/trunk/util/unicode/README 検索に必要なので書きました。unicodeと言えばicu(http://ibm.com/software/globalization/icu)が定番ですが、 微妙に要件に合わないのでicuの出力をターゲットとして同様の正規化を行…