Знаете, что меня всегда напрягало в дорвеестроительстве? Сбор текстового контента для дорвеев. Способов конечно много — от скачивания электронных библиотек до скана(да, некоторые используют), но всё это скучно, нудно и отнимает время. Но совсем недавно в мои руки попал прекрасный парсер, который избавил меня от проблем с текстовкой для доров.
Можно спросить, а чего собственно особенного? Ну парсер, парсер. Мало ли их таких написано, и даже встроено в доргены? Да нет, не мало. Но вот универсальности и скорости работы нигде не хватает. Взять тот же парсер текста, встроенный в дорген DMI 3 Static (кстати отличный инструмент, до сих пор мой любимый) — он лично у меня постоянно зависает во время парсинга. Ну куда это годиться.
Функции парсера
Но давайте рассмотрим, чем так универсален парсер контета X-Parser и кому он может пригодиться. Пошли функции:
- Парсер сниппетов из выдачи ПС.
- Парсер url’ов из выдачи ПС (парсер ссылок).
- Парсер контента по списку ключевиков (парсер контента по ключевым словам).
- Парсер контента по списку урлов (парсер конкретной страницы).
- Парсер контента по списку доменов (парсер сайтов).
- Парсеры внутренних и внешних ссылок с указанного сайта.
Данная функция позволяет быстренько спарсить сниппеты из нужной вам поисковой системы по нужным вам запросам. Сниппеты, как правило, релевантны поисковому запросу, поэтому на выходе получается неплохой тематический контент, поэтому парсер сниппетов может вам пригодиться.
Отличный инструмент для сбора базы урлов по признаку/анализа выдачи по конкретным ключевым словам, фактически парсер выдачи поисковых систем Yandex, Google и прочих. Например, вы можете собрать все урлы из первой сотни выдачи Яндекса по ключевику “похудеть крайне быстро” и проанализировать — какие доры там торчат, и доры ли это вообще. Стоит помнить что поисковые системы сопротивляются парсингу урлов, Яндекс в меньшей степени, Google В большей, но несколько сотен первых доменов вытянуть не составляет проблем.
Самое вкусное, на мой взгляд. Вбиваете список ключевиков, по которым будут парситься сайты из выдачи, указываете количество мегабайт текста на ключевик, подключаете прокси при надобности, и контент начинает оперативно перетекать к вам на винт. Отличная функция, работает и не шуршит, отличный источник тематичного контента для ваших доров. Такой парсер текста необходим для каждого дорвейщика. Пример контента будет приложен ниже.
Парсит контент конкретных указанных страничек. Полезно использовать вместе с парсером url’ов, чтобы поглубже распарсить нужную вам тематику.
Тоже крайне вкусная штука. Парсит содержимое конкретно указанных сайтов/доменов. Для каждого домена можно указать необходимое кол-во текста в мегабайтах. Сайты при парсинге, как правило, не банят, поэтому можно свободно обходиться без прокси, а это, само собой, увеличивает скорость и продуктивность парсинга. Фактически, вы можете спарсить любые сайты. То есть это парсер сайтов на wordpress, dle и прочих cms.
Парсит соответствующие ссылки с указанных сайтов. Может пригодиться для анализа ваших/не совсем ваших сайтов.
UPDATE. Пока писался пост, автор прикрутил очень классную фишку. Теперь парсить контент удобно как для доров, так и для сателлитов, ибо присутствуют одноименные режимы парсинга. Для доров осталось всё по-старому, а вот для сателлитов парсер разбивает текст на статьи и навсегда решает проблему для контента ваших сателлитов. Примеры контента будут ниже.
UPDATE 2. Теперь парсер продается в 2х версиях LIGHT и PRO. Отличия вы можете посмотреть на официальной страничке парсера. Также изменилась ценовая политика и скидки — если вы скажете, что пришли от Карега — то Light версия будет стоить для вас 30$, а про версия — 50$.
На этом функции по парсингу закончены. Но автор софта всегда идет навстречу пожеланиям, и поможет вам что-нибудь реализовать под ваши нужды, если конечно понадобиться. Для дорвейщиков этот парсер обладает всеми функциями, чтобы контента хватило по горло. Идем далее.
Парсер поддерживает следующие поисковые системы: Яндекс(ru/eng), Google(ru/eng), Yahoo(eng), Bing(eng), Aol(eng), Altavista(eng).
Само собой, имеется поддержка парсинга через прокси, плюс имеется встроенный удобный прокси чекер. Вам нужно только указать путь к десятку прокси листов, чекер сам выдернет из них прокси, подходящие вам по параметрам + проверит их на бан в нужной вам поисковой системе.
Отмечу ещё одну приятную особенность. При парсинге текстовки, парсер разбивает текст на адекватные абзацы. Такой текст хорошо принимают на вход доргены, например тот же ДжакоПро отлично генерит доры с такой текстовкой.
Парсер текста написан на php (php парсер), требует минимальных настроек, а из модулей — только curl. Если что — автор или я поможем с установкой.
Примеры контента
Покупка парсера
Контакты автора:
- ICQ — 564234413
- email — tspcompany@ukr.net
Теперь парсер продается в 2х версиях LIGHT и PRO. Отличия вы можете посмотреть на официальной страничке парсера. Также изменилась ценовая политика и скидки — если вы скажете, что пришли от Карега — то Light версия будет стоить для вас 30$, а про версия — 50$.
Ну и напоследок. Да, этот универсальный парсер вполне может решить проблемы массовой добычи качественного контента для чего угодно. Но не стоит забывать, что это всего лишь инструмент, которым тоже стоит пользоваться с головой. Качество полученного текста с разных запросов и разных поисковых систем в разных тематиках может различаться в разы, помните это. Поэтому, при покупке через меня, настоятельно рекомендую обращаться за советами обращаться за советами.