Онлайн-руководство разработчика NetCat
Модуль «Поиск по сайту» 12.2.1Начало работы с модулем 12.2.2Язык запросов 12.2.3Способы хранения индекса 12.2.4Интерфейс модуля в панели управления сайтом 12.2.5Области индексирования 12.2.6Области HTML-страниц 12.2.7Области поиска на сайте 12.2.8Индексирование по расписанию, запуск индексирования в фоновом режиме 12.2.9Правила индексирования 12.2.10Постановка задачи переиндексирования в очередь 12.2.11Интеграция модуля в макеты дизайна сайта 12.2.12Простая форма поиска 12.2.13Расширенная форма поиска 12.2.14Вывод результатов поиска 12.2.15Стилизация списка подсказок 12.2.16Расширенные настройки 12.2.17Разработка расширений модуля 12.2.18Обзор архитектуры модуля 12.2.19Обработчики документов различных типов 12.2.20Текстовые фильтры 12.2.21Анализаторы текста 12.2.22Корректировщики запросов 12.2.23Подключение других поисковых систем 12.2.24Решение проблем с поиском 12.2.25Решение проблем с индексированием 12.2.26Справочник API
Модуль «Интернет-магазин» 12.8.1Настройка модуля 12.8.2Настройка интернет-магазина 12.8.3Валюты 12.8.4Цены для разных групп пользователей 12.8.5Минимальная цена 12.8.6Способы доставки 12.8.7Способы оплаты 12.8.8Настройка шаблонов писем 12.8.9Бланки 12.8.10Скидки 12.8.11Сиюминутные скидки 12.8.12Купоны 12.8.13Редактирование заказов 12.8.14Статистика 12.8.15Компоненты товаров 12.8.16Варианты товаров 12.8.17Коллекции объектов 12.8.18Фильтр товаров 12.8.19Списки товаров 12.8.20Корзина 12.8.21Заказ 12.8.22Выгрузка предложений в Яндекс.Маркет 12.8.23Заказ на Маркете 12.8.24Выгрузка предложений в Товары@Mail.Ru 12.8.25Выгрузка товаров в Google Merchant 12.8.26Обмен данными с 1С 12.8.27Обмен данными с 1С 8-ой версии 12.8.28Обмен данными с 1С 7-ой версии 12.8.29Обмен данными с сервисом МойСклад 12.8.30Виджеты интернет-магазина 12.8.31Классы расчёта доставки 12.8.32Интернет-магазин <5.3 12.8.33Переход с прежней версии модуля 12.8.34Справочник API

Индексирование по расписанию, запуск индексирования в фоновом режиме

Для того чтобы на сайте работал поиск, необходимо вначале его проиндексировать. Изменения на сайте не будут учитываться в результатах поиска до тех пор, пока не будет произведено переиндексирование изменившихся страниц.

Индексирование может выполняться в двух режимах: в фоновом (запуск по расписанию или требованию через планировщик операционной системы или инструмент «Управление задачами» NetCat) или по запросу из панели управления модулем (в окне браузера).

Для индексирования в фоновом режиме необходимо настроить запуск индексатора в cron (предпочтительный способ) или в «Управлении задачами».

Настройка для запуска индексирования по расписанию через cron

В UNIX-совместимых операционных системах запуск задач производится через утилиту cron. Как правило, добавить задание для cron можно в панели управления хостингом (или, если этой возможности нет, через SSH-доступ).

Необходимо добавить запуск планировщика индексирования модуля поиска, например, каждую минуту (т.е. каждую минуту будет производиться поиск задач по индексированию сайтов):

php /путь/к/корню/сайта/netcat/modules/search/indexing/console.php

Индексирование «по частям» из cron

Некоторые сервера могут принудительно завершать скрипты, запущенные из консоли или cron, по превышении определённых лимитов нагрузки на процессор и/или времени работы скрипта. В этом случае предпочтительным вариантом является корректировка соответствующих настроек сервера; в случаях, когда это невозможно, используйте скрипт индексирования console_batch.php, который останавливается по превышению определённых критериев (объём выделенной памяти, время работы, количество проиндексированных документов с момента вызова скрипта — см. раздел «Расширенные настройки»). Для продолжения индексирования необходимо, чтобы скрипт был вызван повторно.

Данный способ не может использоваться, если в качестве поисковой библиотеки выступает Zend_Search_Lucene, поскольку для завершающих этапов индексирования может потребоваться большое количество времени, в течение которого принудительное завершение скрипта приведёт к повреждению индекса. Если вы вынуждены использовать данный способ переиндексирования, переключите модуль на хранение индекса в базе данных (см. раздел «Способы хранения индекса»).


Если на сервере небольшой лимит на время работы скрипта (меньше 30 секунд), для ускорения индексирования можно запускать скрипт переиндексирования чаще одного раза в минуту следующим образом (корректная работа данного способа не гарантируется на всех серверах):

# запуск каждой задачи раз в минуту
* * * * * php /путь/к/корню/сайта/netcat/modules/search/indexing/console_batch.php
* * * * * sleep 30 && php /путь/к/корню/сайта/netcat/modules/search/indexing/console_batch.php
# скрипт будет запущен раз в 30 секунд

Интервал запуска следует выбирать таким образом, чтобы он был как минимум на 10 секунд больше, чем значение параметра IndexerConsoleTimeThreshold.

Настройка для запуска индексирования по расписанию через «Управление задачами»

Если по какой-либо причине вы не можете добавить запуск планировщика индексирования напрямую в cron, добавьте задачу на странице «Управление задачами» панели управления (меню «Инструменты») со следующей ссылкой на скрипт:

/netcat/modules/search/indexing/netcat_cron.php?secret_key=XXXX

Вместо XXXX необходимо подставить значение, указанное на вкладке «Настройки» — «Системные» в поле «IndexerSecretKey».

Убедитесь, что в расписание cron на вашем сервере добавлен вызов скрипта netcat/admin/crontab.php, иначе индексирование не будет производиться.

Настройки индексирования для некоторых хостинг-провайдеров

SpaceWeb.ru

Скрипты на серверах SpaceWeb прерываются при превышении нагрузки на процессор: нагрузка на процессор более 10% в течение 20 секунд или нагрузка на процессор более 50% в течение 10 секунд.

В связи с этим рекомендуем производить индексирование только из cron «по частям», запуск скрипта — каждые 30 секунд (пример см. выше). Рекомендуемые значения расширенных настроек модуля поиска:

SearchProvider = nc_search_provider_index 
IndexerSaveTaskEveryNthCycle = 1
IndexerRemoveIdleTasksAfter = 480
IndexerTimeThreshold = 15
IndexerInBrowserSlowdownDelay = 0.1          # десятичный разделитель — точка!
IndexerConsoleTimeThreshold = 15
IndexerConsoleSlowdownDelay = 0.1
IndexerConsoleRestartHungTasks = 1
Описание проекта