Итак - начинаю цикл статей про начало доростроительства. Давно хотел начать, да Яндекс всё менял алгоритмы отдачи данных сервиса http://wordstat.yandex.ru/, а это главный источник ру ключевиков для нас. Рассмотрим принцип работы этого сервиса и парсера под него.

Итак, заходим на Вордстат, и вводим самый популярный ключевик той тематики, под которую мы хотим собрать базу. Например, в данный момент отлично конвертится Дейтинг траф (то есть знакомства) на партнерке Erolake, поэтому будем собирать дейтинг базу кеев. В поле Ключевые Слова и словосочетания вордстата вводим слово Знакомства. Появятся два столбика. Больше всего нас интересует левый столбик, в нем отображены все варианты интересующего нас запроса Знакомства. Цифры справа отображают сколько раз происходили поиски в яндексе по этому запросу.

Итак, первый способ напарсить базу ключевиков, это руками листать выдачу вордстата, и  копировать данные из левой колонки в txt файл. Конечно это долго и не эффективно. Нужно автоматизировать такой труд, для этого нам поможет прекрасный бесплатный десктопный парсер Магадан. Качаем его, пароль для него найдете на сайте автора.

magadan

Запускаем программу. Интерфейс достаточно прост. Слева поле для вводимых и введеных ключевиков. Две колонки, которую занимают большую часть экрана - отображение колонок из вордстата. Видите внизу поле Допустимый минимум? В этом поле мы назначаем какое минимальное количество запросов должно быть в месяц у какого-либо ключевика, чтобы он спарсился. Я ставлю этот параметр 70-80. Если оставите как по умолчанию - 0, то парсить будет ооочень долго. Три галочки сверху, начинающиеся со слова Сохранять не трогаем, во всяком случае у меня, если что-то из них убирать парсить начинает не полностью. Задержку скорости парсинга оставляем 10.

Итак, добавляем ключевик Знакомства в Очередь кеев на парсинг, в левом верхнем углу интерфейса программы. Нажимаем на иконку старта. Так как ключевик добавлен всего один, парсинг пройдет быстро. Результаты парсинга сохранятся в два файла:

  • family.txt - То что искали со словом знакомства, то есть варианты этого запроса(левая колонка выдачи вордстата)
  • similar.txt- Что ещё искали люди, искавшее слово Знакомства(правая колонка вордстата, я обычно не использую эти кеи)

Конечно этих кеев мало. Там где находится Очередь кеев на парсинг, ищем кнопку Загрузить ключевики из списка файлов (кнопка в виде папки), и добавляем family.txt, в очередь загрузятся ранее отпарсенные ключевики, нажимаем кнопку начать парсинг. В этот раз ключевиков спарсится на порядок больше, затем спарсенные ключевики опять стоит добавить, и ещё раз прогнать, и получится уже нечто похожее на базу. Как эту базу почистить, разбить на части, и как найти текстовку для дора - в следующей статье.

P.S. Последнее время Яндекс часто меняет форматы выдачи вордстата. Если у вас будет такая ситуация что Магадан резко перестаёт работать - ждите новую версию на сайте автора, обновления выходит достаточно быстро и регулярно.

Кстати, я всегда готов к обмену постовыми и открыт к диалогу. Также у вас есть возможность разместить на моем блоге интересный гостевой пост - по всем вопросам обращайтесь в контакты указанные выше.

Если вам понравился материал, советую вам подписаться на новые посты по RSS. Также вы можете следовать за мной в Твиттере Кстати, если вы хотите получать новые cтатьи на почту - воспользуйтесь формой ниже.

Подписаться на новые статьи по почте:

Тэги: , ,

Kareg

25 комментариев

 1 

Ну да … у меня так 2 парсера пиздатых здохло из-за смены выдачи….А магадан не очень, по карайней мере мне не понравился….Советую: пока ручками базу кеев собирать….да и по датингу шаровых баз в инете валяется полно, так что удачи в начинаниях! :)

апреля 9, 2009 at 11:32
 2 

Магадан фигня тема лучше другое использовать часто меняет форматы выдачи вордстата насчёт этого согласен у меня не получилось первый раз и за этого

апреля 9, 2009 at 14:51
 3 

2SeoMajor Спасибо -) Ну само собой в инете есть базы, но когда вполне рабочий парсер есть можно и самому пособирать. Ручками если только базы готовые поискать то да -) Я так составил себе отличную адалт базу в 70к+ кеев очищенную. Но вот именно по дейтингу что-то не видел ничего хорошего

апреля 9, 2009 at 16:29
 4 

2Май Ну нужно хоть немного обосновывать. Магадан фигня потому, что вордстат меняет выдачу? Думаю что он не виноват. Магадан - очень хорошее средство получить начальные базы, и заработать первые сто баксов. Там уже можно и платные базы прикупить. Вы советуете юзать другое. Что конкретно, поделитесь ссылкой =)

апреля 9, 2009 at 16:31
 5 

[...] предыдущем посте, мы парсили базу кеев для дорвея. Теперь нам нужно очистить эту базу от [...]

апреля 10, 2009 at 21:32
 6 

Где-то на блоге читал высказывание что Яша палит и соответственно банит доры как-раз по ключевикам, собранными с вордстата.

апреля 11, 2009 at 21:46
 7 

[...] в предыдущих постах мы собрали ключевики для дора,  очистили их от мусора и собрали тематичную [...]

апреля 14, 2009 at 16:17
 8 

Начинался я постов, буду пробовать, спасибо :)
Буду писать о первых шагах в блоге, обязатально отпишусь, кто был моим наставником и учителем :)

Респект правда! Пошёл парсить…

апреля 21, 2009 at 11:17
 9 

Ко мне не забывай заглядывать, мне ещё есть о чем написать -)

апреля 21, 2009 at 12:17
Dezmond
 10 

решил попробовать!теперь у меня после первого парсинга примерно 15к ключевиков,на которые ушло примерно часов 6-6,5!если я начну их парсить снова,у меня уйдет пару суток!теперь хочу услышать мнения по этому вопросу,а конкретно надо ли их парсить еще раз или этого достаточно?

апреля 21, 2009 at 20:11
 11 

Ты-то можешь мне в асю постучать, которая в контактах указана, я тебе свои базы дам :) В старой просто не сижу.

апреля 21, 2009 at 20:33
Петр
 12 

Каreg, подскажи чем парсить эти ключевики, потому что Магадан уже совсем не работает.

июля 13, 2009 at 18:46
 13 

Магадан отлично работает, вчера тока парсил кеи. На крайняк можно вордстатом вручную парсить:)

июля 21, 2009 at 14:15
 14 

Еще неплохой парсер от umaxsoft. Правда, в фришной версии нет пакетной загрузки. Вроде побыстрее Магадана. Сам на Semonitor-е парсю, но он платный.

сентября 3, 2009 at 21:37
 15 

а на кой так много ключевых слов, разве 30-50 штук мало?

октября 2, 2009 at 0:30
 16 

понравилась статья буду твоим рефом

октября 4, 2009 at 12:29
Rich
 17 

блин не пашет ввёл ключевик а он говарит что надо ввести ключевик в чём прикол))) помагите кто может

декабря 29, 2009 at 17:43
cox
 18 

Нажми ENTER

января 24, 2010 at 17:27
Lukos
 19 

Пытаюсь запустить magadan пишет ошибка при инициализации приложения (0xc0000135). В чем дело?

февраля 12, 2010 at 10:19
 20 

Обновите, и ознакомтесь с требованиями по софту у магадана, на офф его странице.

февраля 12, 2010 at 13:35
mikele65
 21 

Нужен Net Framework не ниже 2-го, скачать можно где угодно.

февраля 12, 2010 at 22:05
 22 

Спасибо за бесплатный декстопный парсер :)

марта 27, 2010 at 13:27
 23 

[...] 1. Всё очень просто и интуитивно понятно 2. Уже давно всё прекрасно расписал и показал Kareg на своём блоге [...]

июня 25, 2010 at 16:30
 24 

Эту программу уже нельзя скачать с сайта. на странице закачки выдает абру кадабру

июля 12, 2010 at 1:05
Ботан
 25 

не пизди… все замечательно скачивается

июля 13, 2010 at 22:32

Оставить комментарий

Имя (*)
E-mail (*)
URL
Сколько будет 4 + 8 ?

Ваш комментарий