Регистрация
Вход через соцсети
Восстановление пароля

опять по поводу поиска и ндексации на сайте

Новый топик
26.09.2008, 05:47
Ответить | Цитировать
Гость
Гость

Здравствуйте.
Проблема с модулем "Поиск по сайту".

При нажатии кнопки "Переиндексировать сайт" начинается индексация сайта, но не останавливается, т.е. скрипт запускается без конца. заветного слова DONE нету. Если остановить индексацию, то страницы индексируются, но в очень большом количестве, что приводит к выводу результата множество одинаковых страниц. На один запрос выдает результат 800 страниц, хотя на самом деле информация находиться на 3-х страницах. Что делать? где копать?

Конфиг:
INDEX_TABLE=71
PAGES_COUNT=20
ALLOWED_URLS=домен.ru
DISALLOWED_URLS=домен.ru/netcat/modules/,домен.ru/netcat_files/
START_URL=домен.ru/map/

01.04.2010, 13:13
Ответить | Цитировать
sparton
Шекера Евгений

Зарегистрирован:
2010-03-16
Сообщений: 141

У меня такая же проблема? Как решить?
При выдаче поиска - дубли страниц.
04.04.2010, 02:14
Ответить | Цитировать
DiGGy
DiGGy
DiGGy

Зарегистрирован:
2005-04-04
Сообщений: 1546

Модуль поиска реализован из двух частей:
1. Индексация сайта.
2. Вывод требуемых результатов.

Результаты п.1 можете посомтреть сделав полную выборку из таблицы компонента поиска // select * from MessaXX
Если в выборке дублирования страниц нет, то разбирайтесь уже непосредственно с компонентом поиска. Как именно он работает и по каким условиям можно посмотреть в компоненте поиска. Соотв-но вы можете данный компонент доделать под себя, задав нужные вам критерии отбора в sql-запросе.

Temet nosce...
05.04.2010, 15:39
Ответить | Цитировать
MipH
Спирин Дмитрий
MipH

Зарегистрирован:
2004-12-22
Сообщений: 252

В настройках модуля Поиска есть параметр INDEX_TABLE, он содержит идентификатор таблицы. Если равен, например, 60, то в БД есть таблица Message60, куда кладется поисковый индекс.

Это особенная таблица, отличается она тем, что у нее есть вот такие настройки:
Код:
  UNIQUE KEY `URL` (`URL`),

это я выдрал из SQL дампа.

Функционал поиска работает так, насколько я помню, на добавление УРЛов в бд, а когда они там уже есть (читай SQL возвращает ошибку, он делает что-то иное), то он вроде обновляет их.
Если индекса на поле нет, то таблица будет бесконечно заполняться =)

Удачи.

bbzone@gmail.com | bbz.ru | miph.info | miph.ru
Вы можете обратиться ко мне, если необходима разработка функционала на NetCat
198 196 2010-04-05 15:39:44 7551
Описание проекта