Анализатор слов на сайте....

bweb

Guest
Анализатор слов на сайте....

Может кто уже делал такое и может поделиться. Речь идет о скрипте, который анализирует страницу и говорит, что слово php используется на сайте 11 раз, слово язык используется на сайте 7 раз и т.д.
Вещица нужная для составления meta тегов.
 

Silex

unitecsys
Сначала из содержимого страницы регами вырезаешь все джаваскрипты, вырезаешь html-комментарии, затем strip_tags() - получится "чистый" текст (может, еще что-то забыл, но это уже сам увидишь). Далее вырезаем или заменяем на пробел (смотря по форматированию) все знаки препинания в тексте, а также слова менее 3-х букв (скорее всего, это предлоги и союзы, хотя можно и грамотнее - составить список таких слов и их уже вырезать). Оставшемуся делаем explode() в массив и каждый элемент приводим в нижний регистр. И, наконец, array_count_values() для полученного массива.

Вроде так.
 

bweb

Guest
Silex спасибо, но как написанно у меня в статусе я новичек и поэтому это для меня сильно сложно, вот если бы готовое.
 

Silex

unitecsys
bweb, что мешает тебе получить немного опыта на этой задаче, тем более что она имеет практическую ценность? Об открытии файла на чтение почитай в соответствующем разделе мануала, вопросы об использовании регулярных выражений постоянно обсуждаются на форуме для новичков, а все явно указанные выше функции сходу ищутся ов все том ж мануале. Для новичка самый максимум -день разбираться.
 

corda

Новичок
Есть уже готовый софт для таких вещей:
AS Keywords Generator
PagePromoter
META Tuner
 
Сверху