Вышла версия 1.6.
Изменений 3. Есть пред просмотр постов, но в виде текста. То есть все теги видны. При этом все изменения в поле предпросмотра сохраняются. Программа сворачивается нажатием на кнопку. И разобрался с пустыми постами как смог. Теперь посты с кодом "b-text">"links" перестанут появятся. Периодическое сообщение об отсутствии результатов побороть не удалось, но я работаю.
Список функций:
1.Парсинг по заданному слову или выражению. Теперь результаты сортировать можно по дате публикации или по релевантности. При этом при сортировке по дате результаты более тематические.
2. Парсинг статей заданой категории. При этом парсятся только статьи указаной категории или метки.
3.Экспорт в отдельные html файлы, rss ленту или html файл для дальнейшего импорта в zebroid или WPT, или в формат из шаблона.
4.Парсить теперь можно популярные блоги, блоги целиком(статьи и комментарии из блогов), записи из блогов, записи из микроблогов, коментарии из блогов и микроблогов, форумы, все блоги и форумы.
5.Можно парсить определенный сервис(livejournal и т.п.) или даже отдельный блог.
6. Функция замены слов в тексте.(Файл replace.txt в папке парсера. Для замены слова “пользователь” на “читатель” добавте туда строку “пользователь=читатель”, без кавычек.)
7.Рядом с каждой функцией есть знак вопроса, при нажатии на который вы получите краткую справку.
8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.(Присутствует с версии 1.1)
9.Добавлены стоп слова.(Файл stop_slova.txt в папке парсера. Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет. )
10.Можно парсить по собраному списку url статей, или запросов.
11. Можно указать лимит постов.
12. Есть предпросмотр постов позволяющий вручную отбирать подходящие посты.
Мой блог находят по следующим фразам
9 Комментариев
Оставайтесь на связи при разговоре, подпишитесь на рассылку RSS канала для комментариев на эту запись.
Архив битый.
Ошибка данных в ‘msinet.ocx’. Файл испорчен.
setup.exe тоже не запускается – на несколько секунд появляется досовское окно, которое затем исчезает. WinXP SP3
Почему то ftp клиент глючил. Теперь все нормально. Файлы рабочие.
Да, теперь все работает. Спасибо за программу. Сижу, изучаю. На первый взгляд, отличная штука. Второй взгляд, думаю, от первого отличаться не будет;)
СДелайте чтоб посты сграбленные разбивались, а то попадаются по 10-20к )) Чтоб размер разбивки больших постов тоже настраивался. По поводу формата из шаблона – не понял как сделать чтоб писалось в 1 файл по оному шаблону, а не в отдельный
“СДелайте чтоб посты сграбленные разбивались” тоесть разбивались? Урезались? Можете сами указать максимальную и минимальную длину.
спасибо за труд.
пользуюсь.
“СДелайте чтоб посты сграбленные разбивались” тоесть разбивались? Урезались? Можете сами указать максимальную и минимальную длину.
Чтоб вместо 1 поста на 20 к знаков было 7-10(настраивалось) по 2-3 к с названием пост1, пост 2 например
Они будут не читабельны если пост пускай по концу предложения разделить. Не проще ли ограничить размер максимального поста и получать не длинные, но читаемые посты?
Ладно буду рукам такие разбивать их не более 10% от всей массы, а на читабельность грабленый контент почти весь очень плох, разнотемный получется