Как Яндекс анализирует уникальный контент

Автор: | 09.08.2018

Посмотрим, как работает Яндекс сервис.

При размещении информации на сайте, необходимо сказать от этом Яндексу заранее, чтобы ее не скопировали. Тогда будут иметь в виду, что первый раз эта информация возникла на вашем сайте и сделают определенные настройки в модели запроса. При этом гарантий конечно же нет.

Начало

Тестирование по методу Альфа Яндекс изначально сделал в 2011 г. с лимитом для сайтов тИЦ>0. Конец тестирования – 2013 г. Теперь уникальной информацией все могли пользоваться в свободном доступе, сделали API.

Различные IT – специалисты не доверяли этой методике «Уникальной информации». Люди постоянно до сих пор говорят об этом, общаются в интернете на эти темы. Некоторые проделывали опыты для того, чтобы протестировать этот черный ящик, например, Игорь Бакалов сделал это.

Вообще не так уж и много информации, чтобы выйти на какой-то результат. Также и Яндексу вроде как нельзя не доверять, а узнать точно нельзя. Для этого специалисты на Миратекст сделали отправку информации в Яндекс Вебмастер автоматической. За это ненужно платить деньги. Необходимо просто сделать связь аккаунта на Миртекст с аккаунтом на Яндексе.

Какова же эффективность?

Все хорошо стало работать и обрабатывалось Яндексом. Но если просмотреть уже направленную информацию и узнать, насколько эффективны «Оригинальные тексты», что мы получим.

Не так уж и часто направляется такая информация в Яндекс. В течение 2-х лет и 2-х месяцев:

  • 2014: 7014 статей
  • 2015: 6924 статей
  • 2016: 778 статей

Около 15 тыс текстов получено Яндексом, которые можно проанализировать при помощи этого варианта.

Первый пункт – сверка на оригинальность

Для начала сверяем контент на оригинальность. Вначале он был оригиналом, а потом его могли скопировать – это нам необходимо.

Тут на помощь приходит Михаил Романов из content-watch.ru. В процессе сверки вернули:

  • 2014: 408 статей
  • 2015: 480 статей
  • 2016: 46 статей

При сверки не брали в счет главный доменный адрес, где находится информация, чтобы отыскать существующие копии информации.

Как оказалось 934 статьи (6%) из 15 тысяч статей неоригинальны, что не совсем ужасно.

Второй пункт – сверка местонахождения

Теоретически, в случае эффективной работы «Уникального контента», сайты исходники находятся выше скопированных сайтов. В лучшем случае местонахождения сайтов исходников должны располагаться в первых рядах. В самом начале нам было известен сайт, на котором располагается контента, т.к. направление уже завершенных текстов в Яндекс вебмастер совершается по API к соотнесенному сайту. Таким образом, сайт исходник мы знаем, а скопированный сайт получен, используя сверку с оригиналом. Необходимо узнать, который из сайтов выдается в поиске на первых местах – исходник или скопированный. Для этого нужно расчленить неоригинальные тексты – 934 текста за формы поиска по 8 слов. По этим формам сверить местонахождения обоих сайтов.

8 слов в данном случае хватит, чтобы в итогах запроса появился необходимый сайт. Если форма поиска содержит мало слов, то много будет поисков по одному тексту – это более определенная информация.

Чтобы было лучше понятно:

Наши сайты: site.com – исходник, site2.com – скопированный. Мы расчленили содержимое на формы поиска по 38 поисков на контент в 2000 знаков – 300 слов. Поэтому необходимо проанализировать 76 местонахождений: 38 для основного сайта и для скопированного сайта. Это проделываем по каждому тексту, т.е. разбить все на формы поиска:

  • 2014: 12555 запросов
  • 2015: 11984 запроса
  • 2016: 1026 запросов

Итого 21289 поисков. По обоим сайтам 42578 поисков, для обоих систем запроса 85156 поисков.

С местонахождениями выручает PR-CY.ru из line.pr-cy.ru. Вставить необходимую информацию и посмотреть на результат.

Третий пункт – аналитика

Здесь самое захватывающее. Но не так все просто.

Некоторые пользователи неверно управляли данным механизмом. При этом направляли приготовленные тексты в Яндекс, а вставляли их не на своем ресурсе, а на прочих. Это и объясняет отсутствие местонахождений у сайта-исходника, т.к. текст, который ищут, отсутствует. Но надо делать не так. По механизму Яндекс, направленная статья в «Уникальный контент» должна располагаться на ресурсе, куда и направляется информация. По-другому нет смысла.

Теперь надо еще раз проанализировать результаты, и пользоваться именно такие тексты, которые есть на сайте.

С итоге мы можем увидеть 7029 местонахождений это 33%. По усредненному показателю это примерно 150 текстов. Конечно же мало очень.

Полезная информация

У Яндекса исходных сайтов 5920, скопированных 3507; у Google исходных сайтов 7029, скопированных 2126.

Получается у Google показатели по тому, как он ищет исходники лучше, скопированные сайты меньше показываются. При этом Google не обладает механизмом «Уникальный контент». И у Google скопированные сайты чаще выходят за первые 100 найденных, у Яндекса они все равно там присутствуют.

Усредненные показатели: у Яндекса исходных сайтов – 3,91; скопированных 6,67. У Google исходный сайтов 1,53; скопированных сайтов 3,21.

Понятно, что согласно усредненным показателям системы запроса выдвигают те сайты, которые по сути авторы текстов. Здесь Google опять лучше Яндекса.

Важно понять, какой из сайтов лучше по выдаче – исходник или скопированные. Посмотрим на схемы согласно информации 7029 поисков:

Итого

Мы должны были решить задачу, какой сайт будет находится в поиске на лучшем месте, тот, что мы отправили в «Уникальный контент» или скопированный. Анализ с Google показан, чтобы сравнить с Яндексом.

Ответ – «Уникальный контент» в Яндексе налажен хорошо. Те сайты, которые относятся к авторским появляются выше, чем скопированные.

Яндекс разработал данные механизм для того, чтобы бороться с проблемой – быстрота индексации новых страниц. И механизм удачный. Google же обладает более высокой скоростью и без механизма определяет исходный вариант. Но остается вопрос, если текст не направлен в «Уникальный контент» и страница с новой информацией лучше проиндексировалась у скопированного сайта, как указать на оригинальный текст?

Как Яндекс анализирует уникальный контент: 1 комментарий

  1. Анастасия

    Вроде алгоритмы понятны. Но все равно интересен один вопрос. Где важнее быть на первых страницах в поиске со своим блогом: в яндексе или гугле?

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *