Вот версия 2.1. Изменений не особо много. Теперь сохраняется формат сохранения (в прошлой версии почему то забыл). Теперь программа запоминает последнюю конфигурацию. И, самое крупное,-есть генерация дорвеев. Теперь можно создавать дорвеи. Пока просто в шаблон подставляются название, текст статьи и ссылки на 10 следующих страниц. Дизайн настраивается. Есть пожелания по генерации доров-с удовольствием выслушаю на форуме .
Все вопросы по дорвею и шаблонам для него писать тут .
Список функций:
1.Парсинг по заданному слову или выражению. Результаты можно сортировать по дате публикации или по релевантности. При этом при сортировке по дате результаты более тематические.
2. Парсинг статей заданной категории. При этом парсятся только статьи указанной категории или метки.
3.Экспорт в отдельные html файлы, rss ленту или html файл для дальнейшего импорта в zebroid или WPT, или в формат из шаблона.
4.Парсить можно популярные блоги, блоги целиком(статьи и комментарии из блогов), записи из блогов, записи из микроблогов, коментарии из блогов и микроблогов, форумы, все блоги и форумы.
5.Можно парсить определенный сервис(livejournal и т.п.) или даже отдельный блог.
6. Функция замены слов в тексте.(Файл replace.txt в папке парсера. Для замены слова “пользователь” на “читатель” добавте туда строку “пользователь=читатель”, без кавычек.). Замена просиходит через регулярные выражения, что дает неограниченое пространство корректировки текста.
7.Рядом с каждой функцией есть знак вопроса, при нажатии на который вы получите краткую справку.
8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.(Присутствует с версии 1.1)
9.Добавлены стоп слова.(Файл stop_slova.txt в папке парсера. Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет. )
10.Можно парсить по собраному списку url статей, или запросов.
11. Можно указать лимит постов.
12. Есть предпросмотр постов позволяющий вручную отбирать подходящие посты. Показывает вид как в браузере, со ссылками и картинками, и чистый код стать который можно менять.
13. Автоматическая синонимизация текстов внутри парсера. Работает достаточно быстро и качественно. Есть синонимизация через сервер. Работает на очень неплохом уровне.
14. Автоматическое удаление указанных тегов.
15. Работа с прокси.
16. Поддержка профайлов. Это позволяет разбивать длинный парсинг на несколько этапов а также нет необходимости каждый раз настраивать парсер.
17. Можно разбивать текст на предложения и перемешивать. Это помогает уникализировать текст.
18.Опциональное добавление беклинка на источник, который в любом случе будет виден для поисковиков(даже если в парсере указать добавление к ссылкам).
19.Удобный и понятный интерфейс.
20.Сохранение последних настроек.
21.Встроенный генератор дорвеев
П.С. Спинным мозгом чувствую что где то напортачил, но лень проверять все. Оставляю это вам. =)
Мой блог находят по следующим фразам

За все спасибо, отдельное за дорген))
Ну да, напортачил…
Нужно писать не “лень проверять”, а “нет возможности проверить – сейчас уже отключат интернет и иликтричество за неуплату”
“Ну да, напортачил…”
Где?
“Нужно писать не “лень проверять”, а “нет возможности проверить – сейчас уже отключат интернет и эликтричество за неуплату”” Кстати вчера инет и впрям барахлил.
Нашел, где я напортачил. Ссылки в парсере без “.HTML” поэтому не пашут. И еще пара мелких багов. Вечером выложу исправленную версию.