Итак — начинаю цикл статей про начало доростроительства. Давно хотел начать, да Яндекс всё менял алгоритмы отдачи данных сервиса http://wordstat.yandex.ru/, а это главный источник ру ключевиков для нас. Рассмотрим принцип работы этого сервиса и парсера под него.
Итак, заходим на Вордстат, и вводим самый популярный ключевик той тематики, под которую мы хотим собрать базу. Например, в данный момент отлично конвертится Дейтинг траф (то есть знакомства) на партнерке Erolake, поэтому будем собирать дейтинг базу кеев. В поле Ключевые Слова и словосочетания вордстата вводим слово Знакомства. Появятся два столбика. Больше всего нас интересует левый столбик, в нем отображены все варианты интересующего нас запроса Знакомства. Цифры справа отображают сколько раз происходили поиски в яндексе по этому запросу.
Итак, первый способ напарсить базу ключевиков, это руками листать выдачу вордстата, и копировать данные из левой колонки в txt файл. Конечно это долго и не эффективно. Нужно автоматизировать такой труд, для этого нам поможет прекрасный бесплатный десктопный парсер Магадан. Качаем его, пароль для него найдете на сайте автора.
Запускаем программу. Интерфейс достаточно прост. Слева поле для вводимых и введеных ключевиков. Две колонки, которую занимают большую часть экрана — отображение колонок из вордстата. Видите внизу поле Допустимый минимум? В этом поле мы назначаем какое минимальное количество запросов должно быть в месяц у какого-либо ключевика, чтобы он спарсился. Я ставлю этот параметр 70-80. Если оставите как по умолчанию — 0, то парсить будет ооочень долго. Три галочки сверху, начинающиеся со слова Сохранять не трогаем, во всяком случае у меня, если что-то из них убирать парсить начинает не полностью. Задержку скорости парсинга оставляем 10.
Итак, добавляем ключевик Знакомства в Очередь кеев на парсинг, в левом верхнем углу интерфейса программы. Нажимаем на иконку старта. Так как ключевик добавлен всего один, парсинг пройдет быстро. Результаты парсинга сохранятся в два файла:
- family.txt — То что искали со словом знакомства, то есть варианты этого запроса(левая колонка выдачи вордстата)
- similar.txt- Что ещё искали люди, искавшее слово Знакомства(правая колонка вордстата, я обычно не использую эти кеи)
Конечно этих кеев мало. Там где находится Очередь кеев на парсинг, ищем кнопку Загрузить ключевики из списка файлов (кнопка в виде папки), и добавляем family.txt, в очередь загрузятся ранее отпарсенные ключевики, нажимаем кнопку начать парсинг. В этот раз ключевиков спарсится на порядок больше, затем спарсенные ключевики опять стоит добавить, и ещё раз прогнать, и получится уже нечто похожее на базу. Как эту базу почистить, разбить на части, и как найти текстовку для дора — в следующей статье.
P.S. Последнее время Яндекс часто меняет форматы выдачи вордстата. Если у вас будет такая ситуация что Магадан резко перестаёт работать — ждите новую версию на сайте автора, обновления выходит достаточно быстро и регулярно.