2005-01-01から1年間の記事一覧

はてなキーワードを高速に付与

sennaのsen_symクラスは、common prefix searchが可能です。この機能を使って(今更なのですが)Dartsと同じ手法ではてなキーワードを高速に付与するプログラムを作ってみました。hatenapo.c以下のような特徴があります。 任意のタイミングで付与対象のキーワ…

MySQLにおけるfulltext index

「実践ハイパフォーマンスMySQL」によれば、MySQLでは1つのクエリーを実行するとき1つのテーブルにつき1つのインデックスしか使用できません。match against条件によって全文検索を行う時は、殆どのケースでfulltext indexを使用することになります。 しかし…

unicode正規化

http://dev.razil.jp/svnweb/senna/checkout/trunk/util/unicode/README 検索に必要なので書きました。unicodeと言えばicu(http://ibm.com/software/globalization/icu)が定番ですが、 微妙に要件に合わないのでicuの出力をターゲットとして同様の正規化を行…