Перейти к содержимому


Версия 1.9

Вышла версия парсера 1.9. В не добавлена онлайн синонимизация, которая быстрее и качественее чем сделанная мною. Надеюсь не зря старался.  Так же исправил несколько мелких багов. В ближайшее время версию 2.0 можете не ждать, т.к. хочу переделать архитектуру и интерфейс программы. Сделать несколько серьездных доработок.

Список функций:
1.Парсинг по заданному слову или выражению. Теперь результаты сортировать можно по дате публикации или по релевантности. При этом при сортировке по дате результаты более тематические.
2. Парсинг статей заданой категории. При этом парсятся только статьи указаной категории или метки.
3.Экспорт в отдельные html файлы, rss ленту или html файл для дальнейшего импорта в zebroid или WPT, или в формат из шаблона.
4.Парсить теперь можно популярные блоги, блоги целиком(статьи и комментарии из блогов), записи из блогов, записи из микроблогов, коментарии из блогов и микроблогов, форумы, все блоги и форумы.
5.Можно парсить определенный сервис(livejournal и т.п.) или даже отдельный блог.
6. Функция замены слов в тексте.(Файл replace.txt в папке парсера. Для замены слова “пользователь” на “читатель” добавте туда строку “пользователь=читатель”, без кавычек.)
7.Рядом с каждой функцией есть знак вопроса, при нажатии на который вы получите краткую справку.
8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.(Присутствует с версии 1.1)
9.Добавлены стоп слова.(Файл stop_slova.txt в папке парсера. Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет. )
10.Можно парсить по собраному списку url статей, или запросов.
11. Можно указать лимит постов.
12. Есть предпросмотр постов позволяющий вручную отбирать подходящие посты.
13. Автоматическая синонимизация текстов внутри парсера. Работает достаточно быстро и качественно.
14. Автоматическое удаление указанных тегов.
15. Работа с прокси.

Мой блог находят по следующим фразам

Категории Обновления парсера. С тегами , .

2 Комментариев

Оставайтесь на связи при разговоре, подпишитесь на рассылку RSS канала для комментариев на эту запись.

  1. 6yka said

    Сделай пожалуйста возможность сохранения в тхт файл, и желательно чтобы можно было указывать прямо в админке его имя.
    Или подскажи как в этой версии сделать сохранялку в тхт, ато я недошарил с этим шаблоном =)
    спасибо

  2. admin said

    напишите мне в icq-постараюсь помочь.

Некоторые HTML коды

(обязательно)

(обязательно)

или, ответ на эту запись через trackback.