Издательский дом ООО "Гейм Лэнд"СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #28, МАРТ 2003 г.

RiSearch - замути свой поиск

Алексей Б. Беляев aka Alexys

Спецвыпуск Xakep, номер #028, стр. 028-032-2


Среди бесплатных поисковых систем одной из самых известных и простых в настройке "под себя" является RiSearch (http://risearch.org). На сайте доступны поисковые скрипты как на перле, так и на пхп (кому что ближе). Лично мне ближе перл, к тому же это наиболее универсальный язык программирования, так что будем рассматривать именно его.

Кто есть ху в RiSearch'е

Перед разбирательством с тем, кто есть ху, надо бы скачать скрипты. Лезь на сайт risearch.org и прям на первой странице найдешь ссылку на скачивание скриптов. В зиповом архиве будут лежать сами скрипты для индексации и самого поиска, англоязычный манн (хотя автор-то наш) и несколько файлов, нужных для кастомайзинга внешнего вида поиска. Чем хорош данный поисковик, так это тем, что ничего кроме поддержки CGI не нужно ему от сервака! Так что даже на большинстве free-хостов, где CGI поддерживается, все должно работать.

Размещение и назначение файлов

Движок RiSearch реализован в нескольких файлах - в 5 скриптах (config.pl, index.pl, search.pl, spider.pl, stat.pl) и шаблоне template.htm. Все остальное из архива имеет чисто вспомогательный характер и на работе движка не сказывается.

Перед тем как все это хозяйство выкладывать на удаленный сервак, очень рекомендую покастомайзить его на localhost'е, если последний имеется :). А если не имеется, то тогда непонятно, как ты собираешься смотреть на работу скриптов (хотя если есть shell-доступ, то можешь редактировать скрипты прямо на серваке, но это не лучший выход, лучше поставь Apache). Тем более, разобравшись с настройкой RiSearch'а локально, не составит проблем поменять пару строчек и сделать его под любой другой хост. Для примера будет взят локальный эккаунт со следующей конфигурацией (в память о сайте winfo.org :( ):

урл эккаунта (локальный) - winfo;

имя папки, где находится эккаунт, - winfo;

папка для html-доков - html;

для скриптов - cgi-bin;

путь к перлу, указываемый в начале скрипта, - #!/usr/bin/perl

После разборок с серваком лезь в папку, где находится локальный эккаунт твоего сайта, и закидывай в папку cgi-bin все скрипты (*.pl). Здесь же создай папки db и log, в которые будут заноситься все результаты индексации и статистика запросов соответственно. После аплоуда на юниховый сервак надо будет задать права для скриптов 755, а для папок - 777. Для чего нужны файлы, входящие в состав движка:

config.pl - скрипт, в котором записаны настройки хоста, такие как URL, путь к файлам, что индексировать и т.д.;

index.pl - индексатор файлов, натравливаемый на нужную папку;

search.pl - скрипт обработки поисковых запросов, отыскивает введенную юзером инфу среди ключевых слов;

spider.pl - типа index.pl, только индексирует по http, пробегая по всем линкам со страниц;

stat.pl - скрипт для просмотра статистики запросов, сделанных пользователями сайта;

Назад на стр. 028-032-1  Содержание  Вперед на стр. 028-032-3