Сбор и обработка кейвордов

Собрать русские кейворды можно парсером вордстата Магадан. Сначала вводим в поле Ключевик один жирный кей по нужной тематике: знакомства, скачать пopнo, sms перехватчик и т.п. Нажимаем play и получаем список из нескольких сотен или тысяч тематических кейвордов. Далее загружаем этот список в очередь кеев на парсинг, нажимаем play еще раз, сворачиваем Магадан и идём гулять на несколько часов.

парсер кейвордов магадан

Английские кеи можно собрать парсером WordTracker'а от Xeonik'а, который представляет собой весьма деревянную софтину: каптча вводится только в ручную, настройки отсутствуют. В буржунете я не работаю и далее речь пойдёт о русских кеях.

парсер кейвордов wordtracker

После сбора кеев магаданом их нужно почистить от плюсиков, такая возможность есть в самом магадане. Далее можно отсортировать кеи по частоте в Excel'е, импортировав список в формате "С разделителями".

После этого перед нами встают проблемы удаления дублей, чистки от мусора, нарезки и перемешивания. С первой справляется сам Магадан, с двумя последними Red Button, но есть специальный софт для работы с кеями, в который включены эти и некоторые други функции. Я использую KeyWordKeeper 5'й версии. В нём чистка от мусора и выборка по вхождению слова осуществляются на одной странице.

сортировка кеев

Вот список для фильтрации мусора, непомню где взял:

детск
детьми
дети
девоч
малолет
школь
малолет
несовершенноле
несовершено
phpbb
ipb
vbulletin
send
thread
new topic
new
topic
bbs
add topic
minibbs
links html
html
forumdisplay
add message
send message
создать сообщение
inurl comments htm
blog
inurl comment php
inurl post htm
inurl addurl aspx
inurl comments html
inurl aska cgi
inurl post html
inurl guest asp
inurl gaestebuch php
inurl guest htm
inurl clip cgi
inurl addentry php
inurl submit html
inurl signgb php
inurl eintragen php
imgboard cgi
inurl submit asp
inurl kiboujoken htm
inurl default asp
inurl kbpost htm
inurl gaestebuch htm
inurl gastenboek php
inurl upb cgi
inurl gaestebuch html
inurl eintragen html
inurl gbook php
inurl add php
inurl eintragen pl
inurl addguest html
inurl fsguest html
inurl ktaiufo cgi
inurl sign html
inurl gb php
inurl guest php
inurl gbooksign asp
inurl guest html
inurl kniha php
inurl add htm
inurl addlink php
inurl signbook cfm
inurl guest cfm
inurl book php
inurl kakikomitai cgi
inurl epad cgi
inurl addguest cgi
inurl gastenboek html
kboard cgi
inurl submit php
inurl gbook html
inurl guest pl
inurl sign asp
inurl light cgi
inurl addlink html
inurl agregar htm
inurl mkakikomitai cgi
inurl form php
inurl petit cgi
inurl guest cgi
inurl joyful
board cgi

Если вы парсите не адалт-кеи, отфильтруйте еще и их, иначе Яндекс наложит фильтр и дор будет находиться только по адалт-запросам.

Гость аватар

Спасибо, щяс буду тестить парсер

Гость аватар

комрад! если у тебя в закромах остался парсер для вордтрекера, поделись пожалуйста на мыло.
а то линк не валидный в посте. :(

Tony аватар

и правда не валидный :( к сожалению у меня тоже не осталось

Гость аватар

Оллсаб отлично парсит вордтракер

Гость аватар

По поводу поста – согласен, щас без простыни текста трудно выбиться в топ, но думаю это актуально не только для морд, но и для внутряка.

Гость аватар

Сейчас пойду тестить парсеры, надеюсь под линукс будут работать.

Гость аватар

спасибо нашел кое что новое для себя, работаю с фармай пригодился твой дубовый парсер для вордтрекера, тока по твоей ссылке не находит, выкачал с google

Гость аватар

Отличный парсер, уже вторые сутки его тестирую.

Гость аватар

Что-то вордтрекер не парсит :(

Отправить комментарий

T
D
Z
t
z
U
Введите символы без пробелов в любом регистре.