當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

mysql 全文本检索的列_Mysql 全文本检索

發布時間：2023/12/10 数据库 18 豆豆

生活随笔收集整理的這篇文章主要介紹了 mysql 全文本检索的列_Mysql 全文本检索小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

mysql 全文索引

注意并非所有的引擎都支持全文檢索

mysql最常用的引擎 INnodb 和 myisam 后者支持全文檢索前者不支持

創建表的時候指定要檢索列 CREATE TABLE TEST_FULLTEXT(note_id int not null auto_increment,note_text text null, primaty key(note_id),FULLTEXT(note_text) )engine=myisam;

fulltext 索引某個列 fulltext(note_text) ，在某note_text列上建立全文索引

插入數據

然后用 match()指定列 Against()指定詞

如語句 select * from TEST_FULLTEXT where Match(note_text) Against('hello');

查找note_txt列中含有 hello詞的行返回的結果為兩行 note_text

'hello' was said by quester

quster say 'hello' to pp and he try again

- 注意搜索是不區分大小的除非使用 BINARY方式

既然這樣為什么不用 like語句呢再來看上面例子用like實現

select * from TEST_FULLTEXT where note_text like '%hello%';

返回的結果一樣為兩行

note_text

quster say 'hello' to pp and he try again

'hello' was said by quester

看采用全文搜索和like的返回結果使用全文搜索的返回結果是已經排好序的而 like的返回結果則沒有

排序主要是針對 hello出現在行的位置

全文結果中第一個詞和第三個詞 like則沒有按順序排

Mysql主要根據等級來進行排序

我們可以采用下面方式查看表中某一列在某一個詞的等級，繼續用上面的例子 select note_text, Match(note_text) Aginst('hello') as rannk from TEST_FULLTEXT

輸出如下： note_text rank

fhgjkhj 0

fdsf shi jian 0

quster say 'hello' to pp and he try again 1.3454876123454

huijia quba 0

'hello' was said by quester 1.5656454547876

等級的計算由 mysql 由根據行中詞的數目、唯一詞的數目、整個索引中詞的總數以及包含改詞行的數目計算出來不包含詞的行的等級為0 上面的結果中詞在前面的等級值要高于在后面的

使用查詢擴展

當你想要在note_text 中查找 pp時從上面知道只有一行如果用下面語句 select note_text from test_fulltext where match(note_text) against('pp');

返回結果是 note_text

quster say 'hello' to pp and he try again

如果采用擴展查詢，分為以下三部

1、先根據全文檢索查找到所有行如上面的返回結果只有一行

2、mysql檢索上面1的所以行，選擇有用的詞

3、mysql再次全文檢索，這一次還需要加上2中選擇出來的有用的詞作為against中的詞 select note_text from test_fulltext where match(note_text) against('pp' with query expansion);

返回結果 note_text

quster say 'hello' to pp and he try again

'hello' was said by quester

如pp本來有的行中含有 hello 所以hello也作為關鍵字

使用布爾查詢

即使沒有建立fulltext索引也能夠用，但是速度非常慢沒有50%規則 (參見下 50%規則介紹)

可以用包含特定意義的操作符，如 +、-、""，作用于查詢字符串上。查詢結果不是以相關性排序的。

如語句 select note_text from test_fulltext where match(note_text) against('hello -pp*' IN BOOLEAN MODE );

表示匹配hello但是不包含 pp的行結果為 note_text

'hello' was said by quester

全文檢索的一些說明和限制

1、只有MyISAM表支持

2、對大多數的多字節字符集適用，進行全文索引的列必須使用相同的字符集和校驗碼(collation)。

3、表意性語言，如漢語、日語沒有詞分界符(英語用空格隔開每個單詞)，全文分析器無法確定一個詞的開始和結尾，所以MySQL中的全文檢索不支持。

4、在自然語言檢索中，只能檢索被全文索引的那些列，如果要對索引的多列進行某一列的檢索，必須對這一列單獨建立全文索引。布爾檢索可以在非索引的列上進行，但會慢一些。

5、against后的參數必須是常量字符串。

6、索引沒有記錄關鍵詞在字符串中的位置，排序算法太單一。

7、如果索引不在內存中，檢索速度會很慢；如果是短語查詢，需要索引和數據都在內存中，否則速度會很慢，所以需要更大的key buffer。索引有碎片時也會很慢，所以需要更頻繁的optimize table操作。

8、全文索引對于insert、update、delete都很慢。如更改100個詞需要進行100次的索引操作而不是1次。

50% 規則如果一個詞出現在50%以上的行中，那么mysql將他作為一個非用詞忽略 50%規則不適用于布爾查詢

如果行數小于三行則不返回結果參考 50%規則

總結

以上是生活随笔為你收集整理的mysql 全文本检索的列_Mysql 全文本检索的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：集成spark_全面对比，深度解析 Ig
下一篇：首例“猫传人”新冠病例被证实：只因猫打了

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

数据库

mysql 全文本检索的列_Mysql 全文本检索

總結