Крутой поисковик!!!

PartizaneN

I speak PHP
Крутой поисковик!!!

Как по вашему должен выглядеть [ЦВЕТОМ=red]крутой[/ЦВЕТОМ] поиск по сайту(без БД)...
 

.des.

Поставил пиво кому надо ;-)
крутой поиск по сайту должен начинать искать и НАХОДИТЬ все что мне нужно даже без моего запроса! .. велением мысли так сказать! :)

КВТО!
 

Stepan96

Guest
Крутой поиск говоришь?
Он должен уметь
1. Поиск по всем словоформам
2. Релевантность
3. Должен понимать сложный язык запроса (например, расстояния между словами и др)
4. и т.д. и т.п.

Короче берешь и пишешь заново поисковую машину Яндекса

И напоследок: зачем тебе "крутой" поиск на сайте?
 

[VS]

Guest
Re: Крутой поисковик!!!

Автор оригинала: PartizaneN
Как по вашему должен выглядеть [ЦВЕТОМ=red]крутой[/ЦВЕТОМ] поиск по сайту(без БД)...
Не изобретай велосипед, нормально на PHP это не получится.
Ставь htDig/mnogosearch или делай через гугл.
 

PartizaneN

I speak PHP
2SeazoN он у меня есть, только не совсем крутой. (индексация на пхп и отсутствуют всякие навороты).
2 алл Мне интересно какой функцией лучше искать (я использую preg_match_all и выглядит это приблизительно следуюшим образом...
PHP:
 preg_match_all("/($word[0])(.*)($word[1])(.*)($word[2])(.*)($word[3])(.*)($word[4])(.*)($word[5])(.*)($word[6])(.*)/i",$ok,$ok);
. Пробовал stristr - не понравилось... Мне интересно, на какие функции должен опираться поиск.

2 [VS] Я конечно понимаю, что здесь пхп ограничен, но все-таки... Хотелось бы.... СВОЙ!!!
 

SeazoN

Guest
Тогда продумай индексацию материалов.
Храни скажем последние 200 СЛОВ поиска.

Каждый раз когда будешь чтото добавлять или не будет такого слова - запускай переиндексацию ентого раздела.
При новом слове - полный поиск :-(
 

[VS]

Guest
Автор оригинала: PartizaneN
2SeazoN он у меня есть, только не совсем крутой. (индексация на пхп и отсутствуют всякие навороты).
2 алл Мне интересно какой функцией лучше искать (я использую preg_match_all и выглядит это приблизительно следуюшим образом...
PHP:
 preg_match_all("/($word[0])(.*)($word[1])(.*)($word[2])(.*)($word[3])(.*)($word[4])(.*)($word[5])(.*)($word[6])(.*)/i",$ok,$ok);
. Пробовал stristr - не понравилось... Мне интересно, на какие функции должен опираться поиск.

2 [VS] Я конечно понимаю, что здесь пхп ограничен, но все-таки... Хотелось бы.... СВОЙ!!!
Пиши свой на С. На PHP оно либо нифига не будет делать, либо будет тормозить дико. Если сайт из 10 страниц то нормально может будет, но нафиг на таком сайте поисковик?
 

[VS]

Guest
Автор оригинала: SeazoN
Тогда продумай индексацию материалов.
Храни скажем последние 200 СЛОВ поиска.

Каждый раз когда будешь чтото добавлять или не будет такого слова - запускай переиндексацию ентого раздела.
При новом слове - полный поиск :-(
Индексация производится только при изменении контента. Если индексацию делать при запросах - то юзер не дождавшись результата закроет страницу.
 

Silent

Новичок
>либо будет тормозить дико. Если сайт из 10 страниц то нормально может будет

Тут ты ошибся примерно на три порядка. На 10000 страниц ничего тормозить не будет. Вот 100000 - это уже серьезно, хотя тоже будет работать.

>Ставь htDig/mnogosearch

А вот как раз mnogosearch будет тормозить. Не предназначены реляционные базы данных для таких задач.
 

SeazoN

Guest
Если индексацию делать при запросах - то юзер не дождавшись результата закроет страницу.
Согласен

Хехе, Silent наверное не врубился:
У человека сайт на файлах
(гы - хотел сказать "на танке" ;o)
И никакие mnogo-malo его "новостям", "гуестбуку", "обо мне", ну может быть "фотоальбому" не грозят.
 

Silent

Новичок
А какая разница как сделан сайт, если при индексации, к примеру, запрашивать страницу у сервера? Или у нас разное понимание того, что такое поисковик?

P.S. Я конечно имел в виду, что поисковик написан нормально, а не так как предлагает PartizaneN. То есть, отвечал я [VS], который постоянно убеждает всех, что на ПХП ничего работать не будет. Да будет оно работать. У меня уже возникает патологическое желание потратить пару дней и написать поиск на ПХП без использования баз данных.
 

[VS]

Guest
Автор оригинала: Silent
>либо будет тормозить дико. Если сайт из 10 страниц то нормально может будет

Тут ты ошибся примерно на три порядка. На 10000 страниц ничего тормозить не будет. Вот 100000 - это уже серьезно, хотя тоже будет работать.
Бред, с которым спорить бесполезно. Ты писал? наверное нет. Напиши и увидишь как будет тормозить.

>Ставь htDig/mnogosearch
А вот как раз mnogosearch будет тормозить. Не предназначены реляционные базы данных для таких задач.
Ню ню, mnogosearch будет тормозить с поиском, а твой php скрипт не будет.
Бросай программирование ...
 

[VS]

Guest
Автор оригинала: Silent
P.S. Я конечно имел в виду, что поисковик написан нормально, а не так как предлагает PartizaneN. То есть, отвечал я [VS], который постоянно убеждает всех, что на ПХП ничего работать не будет. Да будет оно работать. У меня уже возникает патологическое желание потратить пару дней и написать поиск на ПХП без использования баз данных.
Опять бред. Если будешь обо мне писать то чего я никогда не говорил - буду стирать все твои посты.
PHP не предназначен для индексирования, поиска по индексам и для многих других вещей, например для мат. методов. PHP жуткий тормоз в этом.

По поводу поиска - я писал поиск с индексацией на PHP. Где хранить индексы - в базе или нет - имхо не особо важно если меньше тысячи страниц.

При кол-ве страниц меньше 100 все нормально работало на выделенном сервере PIII866Mhz.
При количестве страниц за 1000 даже на этом выделенном сервере все жутко тормозило, больше 15 секунд на поиск.

Если учесть что одновременно несколько юзеров могут искать - то этот метод подходит только для сайтов где меньше 10 страниц, т.е. для сайтов где поиск нафиг не нужен.
 

Silent

Новичок
> PHP жуткий тормоз в этом.

Ну вот, опять. А говоришь, что не говорил. Если ты не смог написать хороший поиск на ПХП, это не означает, что и другие не смогут. Давай так, я больше не буду тут пока ничего писать, займусь лучше кодом. Для начала, без релевантности и словоформ (это можно сделать позже, если будут желающие). О скорости: я ожидаю, что для большинства запросов будет меньше секунды при количестве страниц порядка 10000 (или около 50-100 Мб).

P.S. Интересно, что ты сделаешь, когда поиск будет написан? Удилишь все свои посты?
 

[VS]

Guest
Автор оригинала: Silent
Ну вот, опять. А говоришь, что не говорил. Если ты не смог написать хороший поиск на ПХП, это не означает, что и другие не смогут. Давай так, я больше не буду тут пока ничего писать, займусь лучше кодом. Для начала, без релевантности и словоформ (это можно сделать позже, если будут желающие).
1.
PHP жуткий тормоз в этом.

То есть, отвечал я [VS], который постоянно убеждает всех, что на ПХП ничего работать не будет.

Сам найдешь различия?

2. Я очень сильно сомневаюсь что у тебя опыт в программировании больше чем у меня и что ты лучше меня знаешь как писать поиски и делать индексирование. Поэтому с твоей стороны писать что я не смог написать хороший поиск это хамство.

О скорости: я ожидаю, что для большинства запросов будет меньше секунды при количестве страниц порядка 10000 (или около 50-100 Мб).
Иди пиши, когда поймешь как ошибался, надеюсь тебе станет стыдно. Приведенные тобою числа подтверждают что ты понятия не имеешь о программировании и работе PHP скриптов.

P.S. Интересно, что ты сделаешь, когда поиск будет написан? Удилишь все свои посты?
Есть 2 варианта. Либо он не будет вообще написан, либо будет написан но не будет искать или будет страшно тормозить.
 

clevel

Новичок
а я поиск через fulltext search мускула реализовал - в чем проблема то?
 

[VS]

Guest
Автор оригинала: clevel
а я поиск через fulltext search мускула реализовал - в чем проблема то?
Если у тебя весь контент в базе - то проблем нет. Правда примитивный поиск будет.
 

redic

Guest
да о чем вы спорите
ну не верят люди что искать долго будет
ну и пусть не верят
если ему сказали а он не понял то лично я перестану настаивать
самому нервы дороже
 
Сверху