mysql 전체 텍스트 인덱스란 무엇입니까?-MySQL 튜토리얼-php.cn

전체 텍스트 검색은 데이터베이스에 저장된 책이나 기사 전체에서 어떤 정보든 찾아내는 기술입니다. 필요에 따라 전문의 장, 절, 문단, 문장, 단어 등에 대한 정보를 얻을 수 있으며, 다양한 통계 및 분석도 수행할 수 있습니다. 전체 텍스트 인덱싱은 일반적으로 역인덱싱을 통해 구현됩니다.

%%PRE_BLOCK_0%%기존 테이블에 전체 텍스트 인덱스 생성

테스트 데이터 추가

%%PRE_BLOCK_7%%우리의 관성적 사고에 따르면 4개의 레코드가 표시되어야 하는데 결과는 다음과 같습니다. 레코드가 1개도 없고 아래 쿼리를 실행해야만 %%PRE_BLOCK_8%%

两种全文索引

总结

집

데이터 베이스

MySQL 튜토리얼

mysql 전체 텍스트 인덱스란 무엇입니까?

青灯夜游

Apr 23, 2023 pm 07:03 PM

mysql

MySQL에서 전체 텍스트 인덱싱은 데이터베이스에 저장된 책 전체 또는 기사 전체에서 어떤 정보를 찾아내는 기술입니다. 필요한 쿼리는 대부분 수치 비교, 범위 필터링 등을 통해 완성할 수 있습니다. 하지만 키워드 매칭을 통해 쿼리를 필터링하려면 원래의 정확한 수치 비교와 전체 텍스트가 아닌 유사성을 기반으로 한 쿼리가 필요합니다. 인덱싱은 이 시나리오를 위해 설계되었습니다.

mysql 전체 텍스트 인덱스란 무엇입니까?

이 튜토리얼의 운영 환경: windows7 시스템, mysql8 버전, Dell G3 컴퓨터.

전체 텍스트 검색은 데이터베이스에 저장된 책이나 기사 전체에서 어떤 정보든 찾아내는 기술입니다. 필요에 따라 전문의 장, 절, 문단, 문장, 단어 등에 대한 정보를 얻을 수 있으며, 다양한 통계 및 분석도 수행할 수 있습니다. 전체 텍스트 인덱싱은 일반적으로 역인덱싱을 통해 구현됩니다.

필요한 쿼리는 대부분 수치비교, 범위 필터링 등을 통해 완성할 수 있습니다. 하지만 키워드 매칭을 통해 쿼리를 필터링하려면 원래의 정확한 수치비교가 아닌 유사도 기반의 쿼리가 필요합니다. 전체 텍스트 인덱싱은 이 시나리오를 위해 설계되었습니다.

퍼지 일치를 달성하기 위해 like + %를 사용할 수 있는데 왜 전체 텍스트 인덱싱이 필요한가요? like + %는 텍스트가 상대적으로 작을 때 적합하지만, 대량의 텍스트 데이터를 검색하는 경우에는 상상할 수 없습니다. 많은 양의 데이터가 있는 경우 전체 텍스트 인덱싱은 +%보다 N배 더 빠를 수 있습니다. 속도는 일정하지 않지만 전체 텍스트 인덱싱에는 정확성 문제가 있을 수 있습니다. 전체 텍스트 인덱싱에 관심을 두지 않았을 수도 있지만 적어도 하나의 전체 텍스트 인덱싱 기술인 다양한 검색 엔진에 대해 잘 알고 있어야 합니다. 검색 엔진의 인덱스 개체는 매우 많은 양의 데이터이고 일반적으로 그 뒤에 관계형 데이터베이스가 없지만 전체 텍스트 인덱싱의 기본 원칙은 동일합니다.

버전 지원시작하기 전에 전체 텍스트 인덱스 버전, 스토리지 엔진 및 데이터 유형 지원에 대해 이야기해 보겠습니다.

이전 버전의 MySQL 5.6에서는 MyISAM 스토리지 엔진만 전체 텍스트를 지원했습니다. index;

MySQL 5.6 이상 버전, MyISAM 및 InnoDB 스토리지 엔진 모두 전체 텍스트 인덱스를 지원합니다.

전체 텍스트 인덱스는 필드의 데이터 유형이 char, varchar, text 및 해당 시리즈인 경우에만 구축할 수 있습니다.

전체 텍스트 인덱스를 테스트하거나 사용할 때는 먼저 MySQL 버전, 스토리지 엔진 및 데이터 유형이 전체 텍스트 인덱스를 지원하는지 확인해야 합니다.

전체 텍스트 인덱스 작업

인덱싱 작업은 검색만으로 수행할 수 있지만 여기서 다시 설명하겠습니다.

Create

테이블 생성 시 전체 텍스트 인덱스 생성

create table fulltext_test (
    id int(11) NOT NULL AUTO_INCREMENT,
    content text NOT NULL,
    tag varchar(255),    PRIMARY KEY (id),
    FULLTEXT KEY content_tag_fulltext(content,tag)  // 创建联合全文索引列
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

기존 테이블에 전체 텍스트 인덱스 생성

create fulltext index content_tag_fulltext    on fulltext_test(content,tag);

SQL을 통해 전체 텍스트 인덱스 생성 명령문 ALTER TABLE

alter table fulltext_test    add fulltext index content_tag_fulltext(content,tag);

수정

O를 수정하고 삭제하고 직접 다시 빌드하세요.

Delete

drop index content_tag_fulltext    on fulltext_test;

SQL 문 ALTER TABLE

alter table fulltext_test    drop index content_tag_fulltext;

전체 텍스트 인덱스 사용

및 일반적으로 사용됨 + % Different와 같은 퍼지 일치 사용의 경우 전체 텍스트 인덱스에는 자체 구문 형식이 있으며

select * from fulltext_test 
    where match(content,tag) against(&#39;xxx xxx&#39;);

match()에 지정된 열 함수는 전체 텍스트 인덱스에 지정된 열과 정확히 동일해야 합니다. 그렇지 않으면 오류가 보고됩니다. 전체 텍스트 인덱스는 키워드가 어떤 열에서 왔는지 기록하지 않기 때문에 전체 텍스트 인덱스를 사용할 수 없습니다. 열에 대한 전체 텍스트 인덱스를 사용하려면 해당 열에 대해 별도의 전체 텍스트 인덱스를 만듭니다.

테스트 데이터 추가

위의 지식을 바탕으로 전체 텍스트 인덱스를 테스트할 수 있습니다.

먼저 테스트 테이블을 생성하고 테스트 데이터를 삽입합니다

create table test (
    id int(11) unsigned not null auto_increment,
    content text not null,    primary key(id),
    fulltext key content_index(content)
) engine=MyISAM default charset=utf8;insert into test (content) values (&#39;a&#39;),(&#39;b&#39;),(&#39;c&#39;);insert into test (content) values (&#39;aa&#39;),(&#39;bb&#39;),(&#39;cc&#39;);insert into test (content) values (&#39;aaa&#39;),(&#39;bbb&#39;),(&#39;ccc&#39;);insert into test (content) values (&#39;aaaa&#39;),(&#39;bbbb&#39;),(&#39;cccc&#39;);

전체 텍스트 인덱스의 사용법에 따라 다음 쿼리를 실행합니다.

select * from test where match(content) against(&#39;a&#39;);select * from test where match(content) against(&#39;aa&#39;);select * from test where match(content) against(&#39;aaa&#39;);

우리의 관성적 사고에 따르면 4개의 레코드가 표시되어야 하는데 결과는 다음과 같습니다. 레코드가 1개도 없고 아래 쿼리를 실행해야만

select * from test where match(content) against(&#39;aaaa&#39;);

aaaa

레코드가 검색됩니다. 왜? 이 문제에는 여러 가지 이유가 있으며, 그 중 가장 일반적인 원인은 최소 검색 길이 때문입니다. 또한 전체 텍스트 인덱스를 사용할 경우 테스트 테이블에 최소 4개 이상의 레코드가 있어야 하며, 그렇지 않으면 예상치 못한 결과가 발생합니다.

MySQL의 전체 텍스트 인덱스에는 최소 검색 길이와 최대 검색 길이라는 두 가지 변수가 있습니다. 길이가 최소 검색 길이보다 작고 최대 검색 길이보다 큰 단어는 인덱스되지 않습니다. 일반인의 관점에서 보면, 단어에 대해 전체 텍스트 색인 검색을 사용하려면 단어의 길이가 위의 두 변수 범위 내에 있어야 합니다.

이 두 가지의 기본값은 다음 명령을 사용하여 볼 수 있습니다

show variables like &#39;%ft%&#39;;

可以看到这两个变量在 MyISAM 和 InnoDB 两种存储引擎下的变量名和默认值

// MyISAM
ft_min_word_len = 4;
ft_max_word_len = 84;

// InnoDB
innodb_ft_min_token_size = 3;
innodb_ft_max_token_size = 84;

可以看到最小搜索长度 MyISAM 引擎下默认是 4，InnoDB 引擎下是 3，也即，MySQL 的全文索引只会对长度大于等于 4 或者 3 的词语建立索引，而刚刚搜索的只有 aaaa 的长度大于等于 4。

配置最小搜索长度

全文索引的相关参数都无法进行动态修改，必须通过修改 MySQL 的配置文件来完成。修改最小搜索长度的值为 1，首先打开 MySQL 的配置文件 /etc/my.cnf，在 [mysqld] 的下面追加以下内容

[mysqld]innodb_ft_min_token_size = 1ft_min_word_len = 1

然后重启 MySQL 服务器，并修复全文索引。注意，修改完参数以后，一定要修复下索引，不然参数不会生效。

两种修复方式，可以使用下面的命令修复

repair table test quick;

或者直接删掉重新建立索引，再次执行上面的查询，a、aa、aaa 就都可以查出来了。

但是，这里还有一个问题，搜索关键字 a 时，为什么 aa、aaa、aaaa 没有出现结果中，讲这个问题之前，先说说两种全文索引。

两种全文索引

自然语言的全文索引

默认情况下，或者使用 in natural language mode 修饰符时，match() 函数对文本集合执行自然语言搜索，上面的例子都是自然语言的全文索引。

自然语言搜索引擎将计算每一个文档对象和查询的相关度。这里，相关度是基于匹配的关键词的个数，以及关键词在文档中出现的次数。在整个索引中出现次数越少的词语，匹配时的相关度就越高。相反，非常常见的单词将不会被搜索，如果一个词语的在超过 50% 的记录中都出现了，那么自然语言的搜索将不会搜索这类词语。上面提到的，测试表中必须有 4 条以上的记录，就是这个原因。

这个机制也比较好理解，比如说，一个数据表存储的是一篇篇的文章，文章中的常见词、语气词等等，出现的肯定比较多，搜索这些词语就没什么意义了，需要搜索的是那些文章中有特殊意义的词，这样才能把文章区分开。

布尔全文索引

在布尔搜索中，我们可以在查询中自定义某个被搜索的词语的相关性，当编写一个布尔搜索查询时，可以通过一些前缀修饰符来定制搜索。

MySQL 内置的修饰符，上面查询最小搜索长度时，搜索结果 ft_boolean_syntax 变量的值就是内置的修饰符，下面简单解释几个，更多修饰符的作用可以查手册

+ 必须包含该词
- 必须不包含该词
> 提高该词的相关性，查询的结果靠前
< 降低该词的相关性，查询的结果靠后
(*)星号 通配符，只能接在词后面

对于上面提到的问题，可以使用布尔全文索引查询来解决，使用下面的命令，a、aa、aaa、aaaa 就都被查询出来了。

select * test where match(content) against(&#39;a*&#39; in boolean mode);

总结

好了，差不多写完了，又到了总结的时候。

MySQL 的全文索引最开始仅支持英语，因为英语的词与词之间有空格，使用空格作为分词的分隔符是很方便的。亚洲文字，比如汉语、日语、汉语等，是没有空格的，这就造成了一定的限制。不过 MySQL 5.7.6 开始，引入了一个 ngram 全文分析器来解决这个问题，并且对 MyISAM 和 InnoDB 引擎都有效。

事实上，MyISAM 存储引擎对全文索引的支持有很多的限制，例如表级别锁对性能的影响、数据文件的崩溃、崩溃后的恢复等，这使得 MyISAM 的全文索引对于很多的应用场景并不适合。所以，多数情况下的建议是使用别的解决方案，例如 Sphinx、Lucene 等等第三方的插件，亦或是使用 InnoDB 存储引擎的全文索引。

几个注意点

使用全文索引前，搞清楚版本支持情况；
全文索引比 like + % 快 N 倍，但是可能存在精度问题；
如果需要全文索引的是大量数据，建议先添加数据，再创建索引；
对于中文，可以使用 MySQL 5.7.6 之后的版本，或者第三方插件。

【相关推荐：mysql视频教程】

위 내용은 mysql 전체 텍스트 인덱스란 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undress AI Tool

무료로 이미지를 벗다

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

라라벨 튜토리얼

1604

PHP 튜토리얼

1510

276

Related knowledge

PHP 컨테이너를 자동 구조로 만드는 방법은 무엇입니까? PHP 환경의 지속적으로 통합 된 CI 구성 방법 Jul 25, 2025 pm 08:54 PM

PHP 컨테이너가 자동 구성을 지원할 수 있도록 핵심은 CI (Continuous Integration) 프로세스를 구성하는 데 있습니다. 1. DockerFile을 사용하여 기본 이미지, 확장 설치, 종속성 관리 및 권한 설정을 포함하여 PHP 환경을 정의합니다. 2. Gitlabci와 같은 CI/CD 도구를 구성하고 .gitlab-ci.yml 파일을 통해 빌드, 테스트 및 배포 단계를 정의하여 자동 구성, 테스트 및 배포를 달성합니다. 3. PHPUNIT와 같은 테스트 프레임 워크를 통합하여 코드 변경 후 테스트가 자동으로 실행되도록합니다. 4. Kubernetes와 같은 자동 배포 전략을 사용하여 배포 .yaml 파일을 통해 배포 구성을 정의합니다. 5. Dockerfile 최적화 및 다단계 구조를 채택하십시오

PHP PHP 로그 수집 및 분석 도구로 로그 관리 시스템을 구축하는 방법 Jul 25, 2025 pm 08:48 PM

로깅 방법 선택 : 초기 단계에서는 PHP에 내장 Error_Log ()를 사용할 수 있습니다. 프로젝트가 확장되면 독백과 같은 성숙한 라이브러리로 전환하고 여러 처리기 및 로그 레벨을 지원하며 로그에 타임 스탬프, 레벨, 파일 줄 번호 및 오류 세부 정보가 포함되어 있는지 확인하십시오. 2. 디자인 저장 구조 : 소량의 로그를 파일에 저장할 수 있으며 많은 로그가 있으면 많은 분석이 있으면 데이터베이스를 선택하십시오. MySQL/PostgreSQL을 사용하여 구조화 된 데이터에 사용하십시오. Elasticsearch Kibana는 반 구조화/비 구조화에 권장됩니다. 동시에, 그것은 백업 및 정기적 인 청소 전략을 위해 공식화됩니다. 3. 개발 및 분석 인터페이스 : 검색, 필터링, 집계 및 시각화 기능이 있어야합니다. Kibana에 직접 통합되거나 PHP 프레임 워크 차트 라이브러리를 사용하여 단순성과 인터페이스의 용이성에 중점을 둔 자체 개발을 개발할 수 있습니다.

재무 데이터 저장을위한 MySQL 최적화 Jul 27, 2025 am 02:06 AM

MySQL은 재무 시스템에 최적화되어야합니다. 1. 1. 소수점 유형을 사용하여 정확성을 보장하기 위해 재무 데이터를 사용해야하며 시간대 문제를 피하기 위해 시간 필드에서 DateTime을 사용해야합니다. 2. 인덱스 디자인은 합리적이어야하며, 인덱스를 구축하기위한 필드의 자주 업데이트를 피하고 쿼리 순서로 인덱스를 결합하고 정기적으로 쓸모없는 색인을 청소하십시오. 3. 트랜잭션을 사용하여 일관성을 보장하고, 거래 세분성을 제어하고, 긴 트랜잭션과 비 코어 운영을 피하고, 비즈니스에 따라 적절한 격리 수준을 선택하십시오. 4. 시간별로 히스토리 데이터를 파티션하고, 콜드 데이터를 보관하고 압축 테이블을 사용하여 쿼리 효율성을 향상시키고 스토리지를 최적화합니다.

실시간 데이터 피드에 대한 MySQL 최적화 Jul 26, 2025 am 05:41 AM

tooptimizemysqlforreal-timedatafeeds, firstchoosetheeNnodBStorageEngineForTransactionsand-levellocking, usememoryorrocksdbfortemporaryData 및 partitionTime-seriesDatabyTime.second, INdexStraticalStralityApplyIndExowhere, Or OrdorMOMN, OR ORDOMUMANGS, ORORTORMOMNS.

클라우드 마이그레이션에 대한 MySQL 데이터베이스 비용-이익 분석 Jul 26, 2025 am 03:32 AM

MySQL이 클라우드로 이동할 가치가 있는지 여부는 특정 사용 시나리오에 따라 다릅니다. 비즈니스를 빠르게 출시 해야하는 경우 탄력적으로 확장하고 운영 및 유지 보수를 단순화하며 Go-Go-Go Pay-as-Go 모델을 수락 할 수있는 경우 클라우드로 이동하는 것이 그만한 가치가 있습니다. 그러나 데이터베이스가 오랫동안 안정되어 있으면 대기 시간에 민감하거나 규정 준수 제한이 있으면 비용 효율적이지 않을 수 있습니다. 비용 제어 키에는 올바른 공급 업체 및 패키지 선택, 합리적으로 리소스 구성, 예약 인스턴스 사용, 백업 로그 관리 및 쿼리 성능 최적화가 포함됩니다.

객체 수준의 권한으로 MySQL 보안 Jul 29, 2025 am 01:34 AM

TosecureMySQLeffectively,useobject-levelprivilegestolimituseraccessbasedontheirspecificneeds.Beginbyunderstandingthatobject-levelprivilegesapplytodatabases,tables,orcolumns,offeringfinercontrolthanglobalprivileges.Next,applytheprincipleofleastprivile

대형 MySQL 테이블을 관리하기위한 모범 사례 Aug 05, 2025 am 03:55 AM

대형 테이블을 다룰 때 MySQL 성능 및 유지 보수 가능성은 직면하고 구조 설계, 인덱스 최적화, 테이블 하위 테이블 전략 등을 시작해야합니다. 1. 기본 키 및 색인을 합리적으로 설계해야합니다. 자체 증가 정수를 기본 키로 사용하여 페이지 분할을 줄이는 것이 좋습니다. 오버레이 인덱스를 사용하여 쿼리 효율성을 향상시킵니다. 느린 쿼리 로그를 정기적으로 분석하고 유효하지 않은 인덱스를 삭제하십시오. 2. 파티션 테이블의 합리적 사용 : 시간 범위 및 쿼리 및 유지 보수 효율성을 향상시키기위한 기타 전략에 따른 파티션이지만 분할 및 절단 문제에주의를 기울여야합니다. 3. 분리 및 도서관 분리를 읽고 쓰고 쓰는 것을 고려하십시오 : 읽기 및 쓰기 분리는 메인 라이브러리의 압력을 완화시킵니다. 라이브러리 분리 및 테이블 분리는 많은 양의 데이터가있는 시나리오에 적합합니다. 미들웨어를 사용하고 거래 및 크로스 스토어 쿼리 문제를 평가하는 것이 좋습니다. 초기 계획과 지속적인 최적화가 핵심입니다.

컨텐츠 관리 시스템 (CMS) 용 MySQL 최적화 Jul 28, 2025 am 03:19 AM

ToimProveMySqlPerformanceForcmsPlatforms Wordpress, FirstImplementAcinglayerUsingLayerUsingPluginSlikerEdisorMemcached, enableMysqlQueryCaching (ifapplicable), anduSepageCingpluginstoservestaticfiles.second, 옵티미즈 QLConcepingInnodBuf

See all articles

mysql 전체 텍스트 인덱스란 무엇입니까?

create table fulltext_test ( id int(11) NOT NULL AUTO_INCREMENT, content text NOT NULL, tag varchar(255), PRIMARY KEY (id), FULLTEXT KEY content_tag_fulltext(content,tag) // 创建联合全文索引列 ) ENGINE=MyISAM DEFAULT CHARSET=utf8;
기존 테이블에 전체 텍스트 인덱스 생성

테스트 데이터 추가

两种全文索引

总结

핫 AI 도구

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제

mysql 전체 텍스트 인덱스란 무엇입니까?

create table fulltext_test ( id int(11) NOT NULL AUTO_INCREMENT, content text NOT NULL, tag varchar(255), PRIMARY KEY (id), FULLTEXT KEY content_tag_fulltext(content,tag) // 创建联合全文索引列 ) ENGINE=MyISAM DEFAULT CHARSET=utf8;기존 테이블에 전체 텍스트 인덱스 생성

테스트 데이터 추가

两种全文索引

总结

핫 AI 도구

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제

create table fulltext_test ( id int(11) NOT NULL AUTO_INCREMENT, content text NOT NULL, tag varchar(255), PRIMARY KEY (id), FULLTEXT KEY content_tag_fulltext(content,tag) // 创建联合全文索引列 ) ENGINE=MyISAM DEFAULT CHARSET=utf8;
기존 테이블에 전체 텍스트 인덱스 생성