x7blog (x7blog) wrote,
x7blog
x7blog

Альтернативный алгоритм поиска трастовых форумов

В данной статье, попробую рассказать о своем методе поиска трастовых доноров для прогона «белых» и не очень проектов с помощью XRumer'a. Замечу, что статья написана в рамках пятого конкурса статей от команды BotmasterLabs.

Что такое «Траст», думаю, объяснять не стоит это, и так всем понятно. Если коротко — это некий показатель авторитетности/важности страницы/сайта для поисковых систем. До 2014 года можно было смело говорить, что траст сайта, это 80% количество и качество(ТИЦ, PR, возраст и т.д) внешних ссылок(доноров) на наш сайт. Иными словами, чем больше на вас ссылались, тем качественнее ваш ресурс.

Что изменилось с тех пор: все больше поисковые системы говорят об отмене ссылочного ранжирования, все больше пишут о важности социальных составляющих сайта(лайки, упоминание ресурса в соцсетях и т.д), все больше заявляют о важности контента на сайте(ах).


По запросу в Google «seo top 10 google ranking 2015» берем первые 3 статьи:

http://seositecheckup.com/articles/top-10-tips-for-seo-survival-in-2015

http://www.halewebdevelopment.com/google-seo-ranking-factors-2015/

http://www.advancedwebranking.com/blog/seo-in-2015/

Если проанализировать очень коротко, имеем картину:

1) важно качество контента

2) важны социальные сигналы

3) бэклинки мертвы

4) mobile friendly

На сколько это достоверно, я, лично, судить не буду. Моя задача, сегодня, рассказать вам о том, как это можно использовать в «наших целях», а именно как эта информация поможет выбрать из вашей базы ссылок самые качественные доноры.

В своей работе, я использую XRumer для прогона «белых» страниц своих сайтов. Как правило, это очень маленькие(2000-3000 ссылок) тематические базы. После сбора базы использую стандартный механизм сортировки ресурсов по посещаемости.


Это, очень сильно помогает в работе, но есть маленькая причина, из-за которой, приходиться дополнительно проверять базу еще в «ручном» режиме. Эта причина и стала основой для разработки своего алгоритма поиска хороших, белых ресурсов.

В базе базах очень часто попадаются такие ресурсы как:

http://issa.nl/joomla/forum/index.php

Ресурс с довольно приличной посещаемостью — 300 чел онлайн, постоянно!!! Золотая жила. Но как бы не так, - все это XRumer работает. 99% постов оставлены софтом: от download тематики, до фармы. Контент форума растет как на дрожжах. Но, к сожалению, этот донор нам не подходит: заспамленость ресурса очень уж большая. Толку от него будет очень мало(особенно для «белого» прогона) — наш целевой пост очень быстро уйдет на дно.

Для того, чтобы фильтровать такие ресурсы, будем отталкиваться от тех простых правил «трастового донора», которые изложены выше, где-то упростив их, а где-то - расширив.

Я буду анализировать траст форума(донора) на основе исходного кода страницы. Никаких ТИЦ, PR, Alexa и прочих сложных цифр. Бред? - Возможно. Но, судя по всему, раз скоро отменять(уже отменили) ссылочное, то эти «количественные» показатели того самого ссылочного траста нам не нужны, а значит попробуем обойтись без них.)))

Далее, идет мнение автора статьи. В профессиональном плане, оно, возможно, ошибочное, но как частичная мера определение траста донора, более чем оправдана.

Как, уже написал, трастовость донора будем определять на основе исходного кода страницы донора(форума), а точнее, на основе нахождение на странице определенных элементов, которые так или иначе будут влиять на трастовость(по моему мнению) этой самой страницы. Для наглядности эксперимента введем некое количественное значение траста для каждого элемента.

Например:

Если на странице присутствует Виджет Facebook добавлю +5 баллов к трастовости(изначально 0 баллов) этой странице(читай форума). Зачем? А важность социальных сигналов(лайки, +1 и т.д), помните? Важный элемент? Думаю, ДА.

Еще пример:

Если на сайте установлена реклама от гугла или яндекса, я поставлю +10 этому сайту. О чем свидетельствует наличие рекламы на сайте? Правильно, о возможном наличие тематического трафика на сайте. Вспоминаем, что Яндекс берет в свою рекламную сеть сайты от 300 чел/сутки.

Думаю, сам алгоритм уже Вам понятен. Но, давайте, начнем с начала и с примерами и скринами. И так, к концу статьи, соберем внушительный список необходимых элементов.

Системы управления форумами.

Как мы знаем есть, бесплатные и платные системы управления контентом(ВАШ КО).

Список самых популярных форумных движков, если кто, из пользователей XRumer'a еще их не выучил)):

http://habrahabr.ru/sandbox/46674/

Меня, в первую очередь, интересуют именно платные системы управления форумом.
Самые популярные: IPB [Invision Power Board] , vBulletin, XenForo

О чем свидетельствует наличие платного движка под форум(под сайт и т.д)? Как правило(у нас — это, скорее , исключение:)), что человек, который заплатил за движок, будет его развивать, раскручивать и т. д. А, значит, траст такого форума(для меня лично), будет чуть выше, чем форума на бесплатном движке.

Ищем сайты на XenForo:

В Google вбиваем: powered by xenforo:


Ищем отличительные особенности данного движка:

https://xenforo.com/community/threads/web-hosting-forum-powered-by-xenforo.42440/

Меня интересует только : Forum software by XenForo

Значит, за наличие в коде страницы «Forum software by XenForo » я добавлю 10 баллов к трастовости форума.

Forum software by XenForo +10.

То же самое, делаю для двух других платных CMS:

Powered by vBulletin +10 баллов.

Powered By IP.Board +10 баллов.

Наличие рекламы на сайте

Про важность наличия рекламы, уже говорил: как правило, вебмастер размещает рекламу на ресурсе, если уже есть трафик. Большинство рекламных сетей(особенно контекст, тизера, CPA сети) довольно требовательны к площадкам.

Как искать нужные элементы на странице:

Хороший пример: http://www.adme.ru/. Ищем наличие Google Adwords в исходном коде страницы:

За наличие рекламы от гул поставлю +5 баллов трастовости форума:

Google Ads: pagead2.googlesyndication.com/pagead/js/adsbygoogle.js +5

для яндекса:

Yandex Ads: http://an.yandex.ru/ +5

Наличие виджетов социальных сетей

Опять же, очень важно их наличие. Социальные сигналы это и есть там мера «социальных сигналов» о котором там часто пишут в последнее время соешники.

Буду ставить по +1 за наличие каждого из виджетов для популярных соцсетей:

Виджет Одноклассников: connect.ok.ru +1

Google Plus Widget: apis.google.com/js/plusone.js +1

Twitter Widget: platform.twitter.com +1

Facebook Widget: connect.facebook.net +1

Вконтакте: vk.com/js/api/openapi.js +1

Кстати, как искать такие элементы подскажут сами соцсети, например для Вконтакте:

https://vk.com/dev/Community

Наличие социальных кнопок

Мало чем отличаются от виджетов по эффекту, просто, приведу примеры:

Кнопки Yandex : yastatic.net/share +5

Кнопки share42/share42 : share42/share42 +5

Кнопки share.pluso.ru : share.pluso.ru +5

Наличие счетчиков и рейтингов на сайте

Если вебмастер ставит счетчик на сайт, значит ему нужна статистика, а значит, есть вероятность, что ресурс, все таки, полезен форумчанам, а, значит — и нам.

Счетчик Liveinternet : counter.yadro.ru/ +3

Счетчик Mail.ru : top.mail.ru/counter +3

Google Analitics : google-analytics.com/ga.js +3

Yametrika : Ya.Metrika +3

Yandex Webmaster yandex-verification +3

Yandex ТИЦ кнопка yandex.ru/cy?base +10

Разметка микроформатами

Что это такое, можете почитать у самого Яндекса:

http://help.yandex.ru/webmaster/microformats/what-is-microformat.xml

http://help.yandex.ru/webmaster/schema-org/what-is-schema-org.xml

Я считаю, что грамотно размеченный сайт имеет довольно большой траст. Сейчас об микроформатах говорят очень многие.

Проверим наличие микроформатов на странице:

The Open Graph protocol : xmlns:og +7

Schema.org : itemtype +7

Mobile Friendly

Опять же, исходя из статей, в начале, важность разметки(адаптивность и т.д) страницы под мобильные телефоны и планшеты очень важна для сайта(форума).

Искать будем наличие МЕТА тега viewport .

Детали: http://frontender.com.ua/mobile-web/wtf-viewport/

Retina: target-densitydpi=device-dpi +10

240dpi: target-densitydpi=medium-dpi +10

160dpi: target-densitydpi=low-dpi +10

Мелочи

Сюда я добавлю, наличие на странице сервис проверки орфографии. Качество контента прежде всего, помните?

Проверка орфографии: orphus.ru +10

Вместо заключения

Автоматизация этого процесса, дело простое: идем по списку ссылок форумов и, при наличие тех или иных элементов, плюсуем баллы и записываем в Sqlite базу суммарное количество, предварительно удалив все форумы, которые отдают ошибки.
А архиве со статьей прикрепил простой скрипт, который многопоточно(curl multi request) все это делает. На скринах, прогон свежей базы от BotasterLabs.

В 100 потоков:

В 200 потоков:

Форумы(ссылки) в базе данных:

Страница выборки:

Страница управления сниппетами:


С помощью вот такого простого алгоритма, можно не только проверять свои ссылки на качество, но и проверять доноры на тематичность к вашей прощадке или, например, разбить базы ссылок на CMS и т.д.

Всем спасибо за внимание. Как вы считаете, какие еще внутренние факторы/элементы страницы, могут говорить о качестве прощадки?  Давайте обсудим.

Видео Демо(Смотреть в 720p в полный экран. Нет возможности снять в качестве получше):



Установка скрипта:
Содержимое папки Upload копировать в корень домена.

Технические требования:
PHP 5.4
PDO
Sqlite
PDO_Sqlite
Mb_string

Скачать Firestarter FORUM TRUST CHECKER v1.X+ Материалы Статьи

Tags: xrumer, парсинг, трафик
Subscribe

Posts from This Journal “xrumer” Tag

  • Автонаполняемые форумные дорвеи руками конкурентов

    В этой статье расскажу как создавать автонаполняемые тематические дорвеи с помощью XRumer абслютно без усилий . Мало того, нам для этого, не…

  • Xrumer 7 API

    Xrumer 7. Он был и остается одним из лучших инструментов в сфере серо-черного пиара своих сайтов в интернете. А мощный функционал и огромное…

  • Сеть трамплинов при помощи Xrumer 7

    Очень часто на вопрос «Как ставите в индекс свои сайты?» можно услышать «Используй трамплины». Но когда дело доходит…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 3 comments