読者です 読者をやめる 読者になる 読者になる

Tritonnいれてみた

MySQLの勉強がてら、Tritonn入れてみました。
本家サイトの手順でインストールしました。
- RPMによるインストール方法
- 初めてのTritonn(チュートリアル)

FULLTEXTインデックス張ってますが、期待した結果が得られて無いです。
NGRAMだったから、正しかった。

$ mysql -ukuma8
mysql> use test
mysql> CREATE TABLE articles (id INT PRIMARY KEY, body TEXT) DEFAULT CHARSET utf8 ENGINE = MyISAM;
mysql> CREATE FULLTEXT INDEX fulltext_index ON articles(body);
mysql> SET NAMES utf8;
mysql> INSERT INTO articles (id, body) VALUES(1, "本日本を読みました");
mysql> INSERT INTO articles (id, body) VALUES(2, "日本誕生");
mysql> INSERT INTO articles (id, body) VALUES(3, "明日が誕生日です");
mysql> INSERT INTO articles (id, body) VALUES(4, "本州からでた");
mysql> SELECT * FROM articles WHERE MATCH(body) AGAINST("本");
+----+-----------------------------+
| id | body                        |
+----+-----------------------------+
|  1 | 本日本を読みました | 
|  2 | 日本誕生                | 
|  4 | 本州からでた          | 
+----+-----------------------------+
3 rows in set (0.00 sec)

mysql> SELECT * FROM articles WHERE body like '%本%';
+----+-----------------------------+
| id | body                        |
+----+-----------------------------+
|  1 | 本日本を読みました | 
|  2 | 日本誕生                | 
|  4 | 本州からでた          | 
+----+-----------------------------+
3 rows in set (0.00 sec)


show senna status\Gで表示される。
Encodingが、utf8からlatin1になったら、Mecabインデックスでもうまくいくようになった。
時間があるときに調査する。