从mongodb 2.4版开始,mongodb开始支持文本索引来搜索字符串内容。文本搜索使用词法技术通过删除字符串字词,如a
,an
等等来查找字符串字段中的指定单词。目前,mongodb支持大约15种语言。
最初,文本搜索是一个实验性功能,但从mongodb 2.4版开始,默认情况下启用配置。 但是,如果使用2.4之前版本的mongodb,则必须使用以下代码启用文本搜索 -
>db.admincommand({setparameter:true,textsearchenabled:true})
请考虑以下文档,其中包含帖子文字及其标签 -
{
"post_text": "enjoy the mongodb articles on h3 tutorials",
"tags": [
"mongodb",
"h3 tutorials"
]
}
我们将在post_text
字段上创建一个文本索引,以便可以在posts
的文本中搜索 -
>db.posts.ensureindex({post_text:"text"})
现在我们已经在post_text
字段上创建了文本索引,下面在其文本中搜索所有带有“h3
”一词的帖子。
>db.posts.find({$text:{$search:"h3"}})
上述命令返回以下结果文件,其文本中包含“h3
”一词 -
{
"_id" : objectid("595b99e2f6a6243715b3c316"),
"post_text" : "enjoy the mongodb articles on h3",
"tags" : [ "mongodb", "h3" ]
}
{
"_id" : objectid("595b99e2f6a6243715b3c317"),
"post_text" : "writing h3 tutorials on mongodb",
"tags" : [ "mongodb", "tutorial" ]
}
如果您使用旧版本的mongodb,则必须使用以下命令 -
>db.posts.runcommand("text",{search:" h3 "})
与正常搜索相比,使用文本搜索极大地提高了搜索效率。
要删除现有的文本索引,首先使用以下查询找到索引的名称 -
>db.posts.getindexes()
从上面的查询获取索引的名称后,运行以下命令。 这里,post_text_text
是索引的名称。
>db.posts.dropindex("post_text_text")