Перейти к содержимому


Версия 2.0

Всего за 3 недели дошел до релиза версии 2.0. Изменено много, относительно интерфейса. Во первых программа менее громоздкая, настройки вынесены в отдельную форму. Теперь есть поддержка профилей. Тоесть можно сохранить файл проекта, в нем сохранится место сохранения, позиция при парсинге по запросу или по списку запросов, все настройки (запрос, метка, формат сохранения, нужно ли синонимизировать). Теперь можно один раз настроить проект и просто загружать профиль. (не забывайте что страница в базе сохраняется тоже. Если вы загрузили проект и хотите парсить сначала базы- в поле “страница базы” напишите “0″.) Длинный список запросов можно парсить в несколько заходов, сохраняя и загружая профиль. Положение в списке и страница базы сохраняются. Теперь есть еще одна функция уникализации-перемешивание. Эта функция перемешивает статью по предложениям. Я сам не проверял ее, поэтому используйте на свой страх и риск. Если кто то получит результаты-скажите мне. Теперь в замене внутри текста используются регулярные выражения. Скоро выложу мануал по регулярным выражениям, но уже сейчас там куда качественнее чем раньше убираются теги(чтоб новые шаблоны удаления тегов заработали удалите старые и рядом выберите подходящие заново). Теперь адрес сохранения показывается в главном окне, а при нажатии на это поле открывается папка сохранения. Теперь можно выбрать опцию добавления ссылки на источник. В конце статьи будет добавлена ссылка на страницу откуда взята статья. Вроде при этом яндекс легче к плагиату относится. Исправил немало багов. Категорически советую всем скачать! Эта версия на порядок лучше прошлой.

Список функций:
1.Парсинг по заданному слову или выражению. Теперь результаты сортировать можно по дате публикации или по релевантности. При этом при сортировке по дате результаты более тематические.
2. Парсинг статей заданой категории. При этом парсятся только статьи указаной категории или метки.
3.Экспорт в отдельные html файлы, rss ленту или html файл для дальнейшего импорта в zebroid или WPT, или в формат из шаблона.
4.Парсить можно популярные блоги, блоги целиком(статьи и комментарии из блогов), записи из блогов, записи из микроблогов, коментарии из блогов и микроблогов, форумы, все блоги и форумы.
5.Можно парсить определенный сервис(livejournal и т.п.) или даже отдельный блог.
6. Функция замены слов в тексте.(Файл replace.txt в папке парсера. Для замены слова “пользователь” на “читатель” добавте туда строку “пользователь=читатель”, без кавычек.). Замена просиходит через регулярные выражения, что дает неограниченое пространство корректировки текста.
7.Рядом с каждой функцией есть знак вопроса, при нажатии на который вы получите краткую справку.
8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.(Присутствует с версии 1.1)
9.Добавлены стоп слова.(Файл stop_slova.txt в папке парсера. Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет. )
10.Можно парсить по собраному списку url статей, или запросов.
11. Можно указать лимит постов.
12. Есть предпросмотр постов позволяющий вручную отбирать подходящие посты. Показывает вид как в браузере, со ссылками и картинками, и чистый код стать который можно менять.
13. Автоматическая синонимизация текстов внутри парсера. Работает достаточно быстро и качественно. Есть синонимизация через сервер. Работает на очень неплохом уровне.
14. Автоматическое удаление указанных тегов.
15. Работа с прокси.
16. Поддержка профайлов. Это позволяет разбивать длинный парсинг на несколько этапов а также нет необходимости каждый раз настраивать парсер.
17. Можно разбивать текст на предложения и перемешивать. Это помогает уникализировать текст.
18.Опциональное добавление беклинка на источник, который в любом случе будет виден для поисковиков(даже если в парсере указать добавление к ссылкам).
19.Удобный и понятный интерфейс.

Мой блог находят по следующим фразам

Категории Новости, Обновления парсера. С тегами , , , .

5 Комментариев

Оставайтесь на связи при разговоре, подпишитесь на рассылку RSS канала для комментариев на эту запись.

  1. 6yka said

    что-то я не вкурил, а как теперь выбрать формать сохранения? чтобы хтмл или тхт
    там теперь сombo 3 и все

  2. 6yka said

    а все соре, заработало
    глюк был только при первом запуске

  3. admin said

    Хорошо, что заработало.

  4. Админ а PHP версии нет чтоб устанавливать на хосте и напремую в корень копировать?

  5. admin said

    нет.

Некоторые HTML коды

(обязательно)

(обязательно)

или, ответ на эту запись через trackback.