Онлайн-руководство разработчика NetCat
Модуль «Поиск по сайту» 13.2.1Начало работы с модулем 13.2.2Язык запросов 13.2.3Способы хранения индекса 13.2.4Интерфейс модуля в панели управления сайтом 13.2.5Области индексирования 13.2.6Области HTML-страниц 13.2.7Области поиска на сайте 13.2.8Индексирование по расписанию, запуск индексирования в фоновом режиме 13.2.9Правила индексирования 13.2.10Постановка задачи переиндексирования в очередь 13.2.11Интеграция модуля в макеты дизайна сайта 13.2.12Простая форма поиска 13.2.13Расширенная форма поиска 13.2.14Вывод результатов поиска 13.2.15Стилизация списка подсказок 13.2.16Расширенные настройки 13.2.17Разработка расширений модуля 13.2.18Обзор архитектуры модуля 13.2.19Обработчики документов различных типов 13.2.20Текстовые фильтры 13.2.21Анализаторы текста 13.2.22Корректировщики запросов 13.2.23Подключение других поисковых систем 13.2.24Решение проблем с поиском 13.2.25Решение проблем с индексированием 13.2.26Справочник API

Текстовые фильтры

Текстовые фильтры (наследуют nc_search_language_filter) обрабатывают текст как на этапе индексирования, так и при обработке поисковых запросов. Результатом применения цепочки фильтров является набор слов в том виде, в котором они подлежат индексированию (отсечены короткие и стоп-слова, слова приведены к одному регистру, находятся в базовой форме).

Например, если перед вами стоит задача организовать поиск текста на французском языке без учёта диакритических знаков (диакритические знаки не обязательны для заглавных букв, поэтому слова в верхнем регистре могут не находиться при поиске), вы можете создать текстовый фильтр:

<?php
class my_diacritics_filter extends nc_search_language_filter {
	public function filter(array $words) {
		foreach ($words as $i => $word) {
			$words[$i] = strtr($word, "ÀÂÇÈÉÊËÎÏÔÙÛÜŸ", "AACEEEEIIOUUUY");
		}
		
		return $words;
	}
}

Созданный фильтр необходимо добавить в список на вкладке «Настройки» — «Расширения», указав соответствующий язык и подобрав приоритет таким образом, чтобы фильтр находился между фильтрами nc_search_language_filter_case и nc_search_language_filter_analyzer (приоритет от 61 до 99).

Описание проекта