Разовая работа - скрипт фильтрации урлов

  • Автор темы vintoff
  • Дата начала

vintoff

Guest
Разовая работа - скрипт фильтрации урлов

Скрипт должен уметь:

Удалять дубликаты
Удалять дубликаты по домену
Удалять часть урла с начиная с символа(ов)
Удалять записи с кодами ответа 404,401,304,206 и другие
Фильтр урла - фильтровать линки по тексту в урле (одно или несколько слов).
Дописать что либо в начало линка (например link:)
Удалить что либо в начале линка (например www.)
Чекать на наличие в тексте страницы
Чекать на отсутствие в тексте страницы

Всё это должно максимально быстро работать в многопоточном режиме
Оставляйте для связи icq или e-mail. Или стучите в 274-549-152

Исполнение в течении 1-2 суток, не более.
 
Сверху