Онлайн-руководство разработчика NetCat
Модуль «Поиск по сайту» 12.2.1Начало работы с модулем 12.2.2Язык запросов 12.2.3Способы хранения индекса 12.2.4Интерфейс модуля в панели управления сайтом 12.2.5Области индексирования 12.2.6Области HTML-страниц 12.2.7Области поиска на сайте 12.2.8Индексирование по расписанию, запуск индексирования в фоновом режиме 12.2.9Правила индексирования 12.2.10Постановка задачи переиндексирования в очередь 12.2.11Интеграция модуля в макеты дизайна сайта 12.2.12Простая форма поиска 12.2.13Расширенная форма поиска 12.2.14Вывод результатов поиска 12.2.15Стилизация списка подсказок 12.2.16Расширенные настройки 12.2.17Разработка расширений модуля 12.2.18Обзор архитектуры модуля 12.2.19Обработчики документов различных типов 12.2.20Текстовые фильтры 12.2.21Анализаторы текста 12.2.22Корректировщики запросов 12.2.23Подключение других поисковых систем 12.2.24Решение проблем с поиском 12.2.25Решение проблем с индексированием 12.2.26Справочник API

Язык запросов

По умолчанию в модуле поиска в качестве поисковой системы используется библиотека Zend_Search_Lucene (http://framework.zend.com/manual/en/zend.search.lucene.html).

Данная библиотека поддерживает следующие возможности в языке запросов:

Логические выражения в запросе — AND (и), OR (или), NOT (не) с группировкой подзапросов:

родной AND ((город AND NOT Москва) OR деревня OR село OR посёлок)

Логические операторы должны быть набраны ЗАГЛАВНЫМИ буквами.

Вместо AND, OR и NOT можно использовать &&, || и ! соответственно.

По умолчанию, когда между словами отсутствует логический оператор, подразумевается оператор AND. Это можно изменить в настройках модуля (вкладка «Настройки» — «Общие»).

Поиск документов, не включающих определённое слово:

площадь -Красная

Не следует одновременно использовать логический запрос и оператор исключения «-», например, поиск по запросу площадь -Красная OR Революции может привести к появлению сообщения об ошибке в запросе.

Поиск документов, включающих определённое слово (когда в настройках модуля установлен логический оператор по умолчанию OR):

площадь +Красная Революции

(найдёт все документы, имеющее слово «красный», при этом выше в результатах поиска окажутся документы со словами «площадь» и «революции»; запрос эквивалентен логическому запросу «(площадь AND Красная) OR Революции)»

Поиск по полю:

title:магазин
title:(условия доставки OR обслуживания)

По умолчанию модулем поиска создаются поля title (заголовок страницы, взятый из соответствующего тэга), meta (содержимое META-тэгов description, keywords) и last_modified (содержит время обновления документа в формате ГГГГММДДччммсс).

Поиск документов, содержащих фразу:

"поиск по сайту"

Будут найдены все документы, в которых слова встречаются в указанном порядке. (Если слово «по» находится в списке стоп-слов, то будут также найдены документы, в которых встречаются последовательности «поиск сайта», «поиск для сайта» и т. д.)

Поиск документов, содержащих слова на определённом расстоянии друг от друга:

"Лев Толстой"~2

Будут найдены документы, в которых слова «Лев» и «Толстой» расположены не далее, чем в двух словах друг от друга — например, документы с фразами «Лев Толстой», «Лев Николаевич Толстой», «Толстой Лев» (а также «толстые львы»).

Поиск похожих слов («нечёткий поиск») с указанием степени схожести (от 0.1 до 0.9) или без него (если степень схожести не указана, применяется коэффициент 0.5):

тяжелый~ (найдет документы со словами «тяжелый», «тяжесть», «тяжко» и т.п.)
дом~0.6 (найдет документы, в которых есть слова, в которых 60% букв те же, что и в слове «дом», например «дот», «дам», «том»)

Возможность указать, что какое-либо слово в запросе имеет бо́льшую (или меньшую) важность:

купить^0.5 LCD телевизор^4

Поиск слов по шаблону (шаблон для подстановки одной буквы — ?, для любого количества символов — *):

нетк?т
авто*
гео*ский

По умолчанию поиск по шаблону отключен в настройках модуля, так как может создавать повышенную нагрузку на сервер.

Поиск по интервалу значений:

last_modified:[20100401000000 TO 20100402000000] (включает конечные значения интервала)
last_modified:{20100401000000 TO 20100402000000} (не включает конечные значения)
title:[картофель TO томат] (включает слова «картофель», «лук», «огурец», «томат» и т.п.)

По умолчанию поиск по интервалу значений отключен в настройках модуля.

Запрос с интервалом переписывается в логический запрос со всеми возможными значениями, поэтому может возникнуть ошибка «слишком много терминов в запросе» (по умолчанию — 2048).

Описание проекта