Я расскажу, насколько просто использовать alpha parser. Демо версию использовать точно так же, за исключением того момента, что некоторые функции недоступны в ней.
Скорость программы обеспечивается за счет централизованной базы расположенной на нашем сервере.
После запуска окно программы будет выглядеть следующим образом:
Для демо версии и для полной версии соответственно. Если кнопка или опция в демо версии серая-значит она доступна только в полной версии.
Для начала следует указать запрос по которому будут искаться статьи, и страницу базы(это нужно если вы хотите продолжить парсинг, при этом парсинг начнется не с нулевой страницы выдачи базы по запросу, а с указанной).
Затем выставьте опциональные функции, такие как:
“Убирать теги”-эта функция полностью убирает html теги(то есть картинки, скрипты и форматирование) при парсинге.
“Уникализировать”-простая функция уникализации путем подмены символов кириллицы на графически идентичные аналоги из латиницы, если таковые имеются. То есть символ “А” из кириллицы преобразуется в символ “A” латиницы. С точки зрения поисковых систем эти символы различны, а с точки зрения человека-одно и тоже. Символ меняется только если аналог из латиницы идентичен по виду, то есть символ “Ф” меняться на “F” НЕ БУДЕТ.
“Noindex ссылки”- добавлените тега <noindex > ко всем ссылкам в тексте. Уменьшает ссылочную массу на конечном сайте.
После выбора функций следует указать адрес сохранения конечного результата. Если адрес не указан, то парсер будет сохранять результаты в корневую (свою) папку.
Не забудьте указать формат экспорта данных. Агрегаторов rss лент сейчас существует большое множество самых разных. Во многих движках (wordpress к примеру) импорт из rss ленты встроен изначально. Поэтому именно формат rss был выбран для сохранения. Формат html файлов создает файлы, пригодные для дальнейшей ручной обработки.
Теперь надо нажать на “Старт” и подождать пару минут. Очень важно, что выходить из парсера во время работы при использовании rss ТОЛЬКО НАЖАТИЕМ НА КНОПКУ “Выход” И НИКАК ИНАЧЕ. Если этого не сделать то окончание rss записано не будет и это может привести ленту в негодность. Если такое произошло надо вручную дописать в конце файла ленты строки:
</channel>
</rss>
Вот и все.
Мой блог находят по следующим фразам
0 Комментариев
Оставайтесь на связи при разговоре, подпишитесь на рассылку RSS канала для комментариев на эту запись.