Полнотекстовый поиск

Поделись знанием:
Перейти к: навигация, поиск

Полнотекстовый поиск (англ. Full text searching, фр. Recherche en texte integral) — автоматизированный поиск документов, при котором поиск ведётся не по именам документов, а по их содержимому, всему или существенной части.[1]





Полнотекстовый индекс

Первые версии программ полнотекстового поиска предполагали сканирование всего содержимого всех документов в поиске заданного слова или фразы. При использовании такой технологии поиск занимал очень много времени (в зависимости от размера базы), а в интернете был бы невыполним. Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нём и тогда сразу же будет получен список документов, в которых они встречаются.

Реализации

MySQL

Полнотекстовые индексы в MySQL обозначаются как типом «FULLTEXT», который может применяться для столбцов типов «VARCHAR» и «TEXT». При массовом добавлении данных в таблицу с полями «FULLTEXT» индекс будет создаваться сразу, что замедлит работу, для избежания эффекта рекомендуется модернизировать поля уже после добавления.

Поиск выполняется с помощью функций MATCH() и AGAINST():

SELECT * FROM articles WHERE MATCH (title, body) AGAINST ('поиск');

При этом поисковая фраза должна быть написана слово в слово (т.е. «поиска», «поисковик» - невалидные варианты для примера выше)

Результат (жирным выделены найденные соответствия):

id title body
5 Регулярные выражения В большинстве реализаций регулярных выражений есть способ производить поиск фрагмента текста …
1 Полнотекстовой поиск Полнотекстовой поиск

См. также

Напишите отзыв о статье "Полнотекстовый поиск"

Ссылки

  • Бартунов О., Сигаев, Ф. [citforum.ru/database/postgres/fts/ Введение в полнотекстовый поиск в PostgreSQL].
  • Лебедев, Д., Юсов, О. [www.opennet.ru/base/dev/mysql_search.txt.html Полнотекстовый поиск в MySQL на PHP].
  • Петрухин, А. Н., Дворецкий, А. Ю. ЦИФРОВОЙ ПОИСК КАК ОСНОВА РЕАЛИЗАЦИИ СЛОВАРЯ ПОЛНОТЕКСТОВОЙ БАЗЫ ДАННЫХ // ВОПРОСЫ РАДИОЭЛЕКТРОНИКИ. — Москва: Центральный научно-исследовательский институт экономики, систем управления и информации «Электроника. — ISSN [www.sigla.ru/table.jsp?f=8&t=3&v0=0233-9950&f=1003&t=1&v1=&f=4&t=2&v2=&f=21&t=3&v3=&f=1016&t=3&v4=&f=1016&t=3&v5=&bf=4&b=&d=0&ys=&ye=&lng=&ft=&mt=&dt=&vol=&pt=&iss=&ps=&pe=&tr=&tro=&cc=UNION&i=1&v=tagged&s=0&ss=0&st=0&i18n=ru&rlf=&psz=20&bs=20&ce=hJfuypee8JzzufeGmImYYIpZKRJeeOeeWGJIZRrRRrdmtdeee88NJJJJpeeefTJ3peKJJ3UWWPtzzzzzzzzzzzzzzzzzbzzvzzpy5zzjzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzztzzzzzzzbzzzzzzzzzzzzzzzzzzzzzzzzzzzvzzzzzzyeyTjkDnyHzTuueKZePz9decyzzLzzzL*.c8.NzrGJJvufeeeeeJheeyzjeeeeJh*peeeeKJJJJJJJJJJmjHvOJJJJJJJJJfeeeieeeeSJJJJJSJJJ3TeIJJJJ3..E.UEAcyhxD.eeeeeuzzzLJJJJ5.e8JJJheeeeeeeeeeeeyeeK3JJJJJJJJ*s7defeeeeeeeeeeeeeeeeeeeeeeeeeSJJJJJJJJZIJJzzz1..6LJJJJJJtJJZ4....EK*&debug=false 0233-9950].
  • Симанкина, Н. И., Шипулина, К. В., Костарев, А. А., Окунев, А. Ф. [elibrary.ru/item.asp?id=22697228 РАЗРАБОТКА ПОДСИСТЕМЫ ПОЛНОТЕКСТОВОЙ ИНДЕКСАЦИИ И ПОЛНОТЕКСТОВОГО ПОИСКА ДЛЯ ПЛАТФОРМЫ ОБЛАЧНОГО КОНТЕНТ-РЕПОЗИТОРИЯ]. — 2014. — № 4 (27). — С. 92—96.
  • Филатов, В. О., Кравцов, И. В., Варфоломеев, А. Г. [rcdl.ru/doc/2006/paper_34_v1.pdf Информационная система для работы с полнотекстовыми базами данных исторических документов на основе технологии XML].
  • Зайцев, А. В. [www.codenet.ru/webmast/search/idx/ Методика создания индексных файлов для осуществления полнотекстового поиска в сети Интернет].
  • Колосов, А. П., Богатырев, М. Ю. [rcdl.ru/doc/2011/paper35.pdf Система полнотекстового поиска по длинным запросам].

Примечания

  1. [www.opengost.ru/iso/01_gosty/01140_gost_iso/0114020_gost_iso/1872-gost-7.73-96-sibid.-poisk-i-rasprostranenie-informacii.-terminy-i-opredeleniya.html Скачать ГОСТ 7.73-96 СИБИД. Поиск и распространение информации. Термины и определения]
К:Википедия:Статьи без источников (тип: не указан)

Отрывок, характеризующий Полнотекстовый поиск


Несмотря на привычку Балашева к придворной торжественности, роскошь и пышность двора императора Наполеона поразили его.
Граф Тюрен ввел его в большую приемную, где дожидалось много генералов, камергеров и польских магнатов, из которых многих Балашев видал при дворе русского императора. Дюрок сказал, что император Наполеон примет русского генерала перед своей прогулкой.
После нескольких минут ожидания дежурный камергер вышел в большую приемную и, учтиво поклонившись Балашеву, пригласил его идти за собой.
Балашев вошел в маленькую приемную, из которой была одна дверь в кабинет, в тот самый кабинет, из которого отправлял его русский император. Балашев простоял один минуты две, ожидая. За дверью послышались поспешные шаги. Быстро отворились обе половинки двери, камергер, отворивший, почтительно остановился, ожидая, все затихло, и из кабинета зазвучали другие, твердые, решительные шаги: это был Наполеон. Он только что окончил свой туалет для верховой езды. Он был в синем мундире, раскрытом над белым жилетом, спускавшимся на круглый живот, в белых лосинах, обтягивающих жирные ляжки коротких ног, и в ботфортах. Короткие волоса его, очевидно, только что были причесаны, но одна прядь волос спускалась книзу над серединой широкого лба. Белая пухлая шея его резко выступала из за черного воротника мундира; от него пахло одеколоном. На моложавом полном лице его с выступающим подбородком было выражение милостивого и величественного императорского приветствия.
Он вышел, быстро подрагивая на каждом шагу и откинув несколько назад голову. Вся его потолстевшая, короткая фигура с широкими толстыми плечами и невольно выставленным вперед животом и грудью имела тот представительный, осанистый вид, который имеют в холе живущие сорокалетние люди. Кроме того, видно было, что он в этот день находился в самом хорошем расположении духа.
Он кивнул головою, отвечая на низкий и почтительный поклон Балашева, и, подойдя к нему, тотчас же стал говорить как человек, дорожащий всякой минутой своего времени и не снисходящий до того, чтобы приготавливать свои речи, а уверенный в том, что он всегда скажет хорошо и что нужно сказать.
– Здравствуйте, генерал! – сказал он. – Я получил письмо императора Александра, которое вы доставили, и очень рад вас видеть. – Он взглянул в лицо Балашева своими большими глазами и тотчас же стал смотреть вперед мимо него.
Очевидно было, что его не интересовала нисколько личность Балашева. Видно было, что только то, что происходило в его душе, имело интерес для него. Все, что было вне его, не имело для него значения, потому что все в мире, как ему казалось, зависело только от его воли.
– Я не желаю и не желал войны, – сказал он, – но меня вынудили к ней. Я и теперь (он сказал это слово с ударением) готов принять все объяснения, которые вы можете дать мне. – И он ясно и коротко стал излагать причины своего неудовольствия против русского правительства.
Судя по умеренно спокойному и дружелюбному тону, с которым говорил французский император, Балашев был твердо убежден, что он желает мира и намерен вступить в переговоры.
– Sire! L'Empereur, mon maitre, [Ваше величество! Император, государь мой,] – начал Балашев давно приготовленную речь, когда Наполеон, окончив свою речь, вопросительно взглянул на русского посла; но взгляд устремленных на него глаз императора смутил его. «Вы смущены – оправьтесь», – как будто сказал Наполеон, с чуть заметной улыбкой оглядывая мундир и шпагу Балашева. Балашев оправился и начал говорить. Он сказал, что император Александр не считает достаточной причиной для войны требование паспортов Куракиным, что Куракин поступил так по своему произволу и без согласия на то государя, что император Александр не желает войны и что с Англией нет никаких сношений.