Онлайн-руководство разработчика NetCat
Модуль «Поиск по сайту» 12.2.1Начало работы с модулем 12.2.2Язык запросов 12.2.3Способы хранения индекса 12.2.4Интерфейс модуля в панели управления сайтом 12.2.5Области индексирования 12.2.6Области HTML-страниц 12.2.7Области поиска на сайте 12.2.8Индексирование по расписанию, запуск индексирования в фоновом режиме 12.2.9Правила индексирования 12.2.10Постановка задачи переиндексирования в очередь 12.2.11Интеграция модуля в макеты дизайна сайта 12.2.12Простая форма поиска 12.2.13Расширенная форма поиска 12.2.14Вывод результатов поиска 12.2.15Стилизация списка подсказок 12.2.16Расширенные настройки 12.2.17Разработка расширений модуля 12.2.18Обзор архитектуры модуля 12.2.19Обработчики документов различных типов 12.2.20Текстовые фильтры 12.2.21Анализаторы текста 12.2.22Корректировщики запросов 12.2.23Подключение других поисковых систем 12.2.24Решение проблем с поиском 12.2.25Решение проблем с индексированием 12.2.26Справочник API
Модуль «Интернет-магазин» 12.8.1Настройка модуля 12.8.2Настройка интернет-магазина 12.8.3Валюты 12.8.4Цены для разных групп пользователей 12.8.5Минимальная цена 12.8.6Способы доставки 12.8.7Способы оплаты 12.8.8Настройка шаблонов писем 12.8.9Бланки 12.8.10Скидки 12.8.11Сиюминутные скидки 12.8.12Купоны 12.8.13Редактирование заказов 12.8.14Статистика 12.8.15Компоненты товаров 12.8.16Варианты товаров 12.8.17Коллекции объектов 12.8.18Фильтр товаров 12.8.19Списки товаров 12.8.20Корзина 12.8.21Заказ 12.8.22Выгрузка предложений в Яндекс.Маркет 12.8.23Заказ на Маркете 12.8.24Выгрузка предложений в Товары@Mail.Ru 12.8.25Выгрузка товаров в Google Merchant 12.8.26Обмен данными с 1С 12.8.27Обмен данными с 1С 8-ой версии 12.8.28Обмен данными с 1С 7-ой версии 12.8.29Обмен данными с сервисом МойСклад 12.8.30Виджеты интернет-магазина 12.8.31Классы расчёта доставки 12.8.32Интернет-магазин <5.3 12.8.33Переход с прежней версии модуля 12.8.34Справочник API

Обзор архитектуры модуля

Процесс поиска состоит из двух этапов — сохранения в поисковом индексе (индексирования) и извлечения документов из него (собственно поиска).

I. Индексирование:

  • Скачивание документов с сайта.
  • Обработка полученных документов: извлечение данных, ссылок на другие документы:
    • чтение содержимого документа в зависимости от его формата;
    • принятие решения о том, следует ли индексировать данный документ (в зависимости от содержимого);
    • получение содержимого, подлежащего индексированию,
    • извлечение метаданных;
    • разбивка содержимого на слова, фильтрация стоп-слов, приведение слов к базовой форме для поиска с учётом морфологии языка.
  • Сохранение полученных данных в поисковом индексе.

II. Поиск: извлечение из поискового индекса документов, соответствующих запросу пользователя.

  • Приведение слов в запросе к базовой форме.
  • Выполнение запроса, сортировка результатов.
  • Попытка исправления запроса, если результаты не получены.

Модуль поиска состоит из следующих частей:

Поставщик службы поиска (интерфейс nc_search_provider). Обеспечивает хранение документов, полнотекстовый поиск по ним; также может управлять способом загрузки документов (служба поиска может реализовать получение документов самостоятельно) и планированием заданий переиндексирования. По умолчанию используется библиотека Zend_Search_Lucene; дополнительные свойства документа (такие как полный текст документа, его тип и т.п.) хранятся в СУБД в таблице Search_Document для увеличения быстродействия и удобства организации процесса переиндексирования.

Планировщик переиндексирования (nc_search_scheduler). Отвечает за запуск переиндексирования областей согласно расписанию.

Индексатор (по умолчанию — nc_search_indexer). Отвечает за обработку задачи переиндексирования: обеспечивает загрузку всех страниц, находящихся в очереди текущей задачи переиндексирования, обработку полученных данных и их сохранение в поисковом индексе.

Обработчики документов (интерфейс nc_search_document_parser). Обеспечивают извлечение данных из документов различных типов (например, HTML-документов, текстовых файлов и т.п.)

Анализаторы текста (наследуют абстрактный класс nc_search_language_analyzer). Обеспечивают приведение слов к базовой форме (морфологический анализ или стемминг).

Текстовые фильтры (наследуют абстрактный класс nc_search_language_filter). Отвечают за приведение слов во всех документах и поисковых запросах к нормальной (базовой) форме.

Корректировщики пользовательских запросов (наследуют абстрактный класс nc_search_language_corrector): орфографическая проверка введённого запроса или иные способы исправления запросов, не давших результатов.

Все части модуля, реализующие интерфейсы или наследуемые от указанных в списке абстрактных классов, могут быть заменены на пользовательские. Все эти интерфейсы и абстрактные классы расширяют интерфейс nc_search_extension.

За подключение расширений модуля отвечает класс nc_search_extension_manager. Когда модулю необходимо получить объект, реализующий какую-либо функциональность, происходит вызов метода nc_search_extension_manager::get($extension_interface, $context).

Объект $context (экземпляр класса nc_search_context) содержит дополнительные сведения о контексте операции, такие как MIME-тип документа и его язык. Менеджер расширений подбирает список подходящих под контекст расширений и возвращает их в виде объекта nc_search_extension_chain.

Расширения могут быть применены к исходным данным последовательно при помощи метода apply() (например, в случае текстовых фильтров); может быть взято расширение с высшим приоритетом (например, будет использован только один — первый — обработчик для каждого из типов документов).

Для добавления расширения необходимо написать класс, реализующий соответствующий интерфейс, и добавить его в панели управления модулем в список на вкладке «Настройки» — «Расширения», указав условия его использования (язык документа, тип документа, активная служба поиска).

Описание проекта