Перейти к содержимому


Комбайн.

Хотелось бы двигатся в сторону комбайна, а не только навороченого парсера. Что, по вашему для этого надо? Что дорабатывать в первую очередь?

П.С. Вопрос-есть перспектива написать мультиязычный (парсящий любой язык, а не только русский) парсер, блогов, но парссящий не тематические страницы, а тематические блоги целиком. И чуть более узкий в настройках. Имеет смысл?

Мой блог находят по следующим фразам

Категории Новости, инструменты. С тегами , , .

3 Комментариев

Оставайтесь на связи при разговоре, подпишитесь на рассылку RSS канала для комментариев на эту запись.

  1. mastersan said

    прикрути хороший дорген можно взять все функции с джако но только чтоб контент был с парсера а не маркова!

  2. 6yka said

    хотелось бы опцией автоматическую разбивку на файлы указанного размера, сохранение в тхт (переделывать и разбивать подзайобсо).
    + ссылка на источник опционально в ноиндекс,
    и ещё говорят вполне прокатывает тупо неактивная ссылка

  3. Полностью согласен с идеей парсить тематические блоги полностью, также необходимо добавить формат txt.

Некоторые HTML коды

(обязательно)

(обязательно)

или, ответ на эту запись через trackback.


Межкомнатные двери Софья Sofia: интернет- магазин. .