Обновлено 29.07.2017г. 09:18 (UTC+3)

Защита контента на сайте

Приветствую! Сегодня обсуждаем актуальный вопрос: способы защиты контента на сайте. Контент воруют, и делают это очень часто: чем интереснее ваши тексты (поведем речь именно о них), тем выше вероятность, что их украдут, убив уникальность страницы. Если это продолжается в больших масштабах – у поисковиков появятся претензии к сайту. Как избежать проблемы? Рассмотрим несколько способов. И, кстати, сразу отмечу, что 100% гарантии не дает ни один из них, однако весомую часть воров или парсеров все же удастся отпугнуть.


zashhita-kontenta-na-sajte Чтобы защитить контент, можно предпринять такие действия:

  • оповестить поисковики о новом контенте, указав авторские права на него;
  • настроить запрет на копирование;
  • установить скрипт, который будет добавлять ссылку на первоисточник при копировании текста;
  • использовать плагины (для популярных CMS);
  • пользоваться «методом Бурундука»;
  • применять кросспостинг;
  • устанавливать авторское право нотариально.

Оповещение поисковых систем

У Яндекса работает специализированный инструмент «Оригинальные тексты». Раньше он был доступен владельцам сайтов с ТИЦ не меньше 10, сейчас открыт для всех. Минимальный рекомендованный объем текста, который примут к рассмотрению, должен равняться 500 символам, максимальный – 32 тыс. символам. Размещаемый текст должен быть уникальным (нигде до этого не опубликованным в Сети).

Важно отметить, что Яндекс заранее предупреждает – не все параметры будут учтены. Аналогичный сервис от Google был закрыт в 2014 году. Он был предназначен для регистрации авторских прав в Сети через аккаунт на Google+, однако сервисом часто пользовались для «серой» оптимизации. Способ защиты контента в этой соцсети все же существует: нужно на странице с авторским текстом установить такой код: <a href="https://ссылка на ваш профиль в Google+">Google</a>

Настройка запрета на копипаст

Небольшой скрипт (найти варианты можно здесь, установленный в тело страницы, заблокирует контекстное меню и реакцию системы на нажатие правой кнопкой мыши. Но приготовьтесь, что:

  • поведенческие факторы ухудшатся, так как часть пользователей любит читать, выделяя текст и копируя для себя самое интересное. Если лишить их такой возможности – они уйдут;
  • опытные копипастеры все равно украдут контент, воспользовавшись «горячими клавишами» или переключившись в режим

Абсолютно невозможно копировать текст с рисунка или Flash-вставки. Но это тоже не всегда годится – поисковые системы в таких случаях тоже не «видят» контента, что не способствует продвижению. Тем более, что опытный копипастер сможет воспользоваться специальной программой, считывающей текст с рисунка. kakoj-kontent-na-sajte-nuzhno-zashhishhat

Использование плагинов и скриптов

Владельцы сайтов на WordPress могут воспользоваться плагинами BlogProtector, WP-CopyProtect, Cheaser CopyRight и другими. Если говорить о них в общем: они блокируют функцию выделения контента, убирают контекстное меню и/или добавляют к скопированному контенту ссылку на оригинал. Сказать, что эти способы защиты «детские» - не сказать ничего. Для копирования плагиатор воспользуется html версией, а добавляемую ссылку просто-напросто удалит

«Метод Бурундука»

Аналитик Алексей Жуков (более известный как Бурундук) несколько лет назад предложил авторский способ защиты контента. Это разбивка текста на уникальные предложения длиной максимум 100 символов. Предложения используются в качестве анкоров ссылок с размещением на бюджетных площадках. То есть, длинные тексты накапливают несколько десятков ссылок. Ссылочные сигналы при этом подкрепят контент страницы по разным уникальным предложениям, и с большой долей вероятности поисковая система воспримет текст как оригинал. Метод, как заранее понятно, «штучный» - никто не будет им пользоваться, если для сайта нужно несколько десятков или сотен уникальных текстов. dlinna-aknornyh-ssylok

Кросспостинг как способ защиты контента

Ссылки на страницы сайта, размещенные в социальных сетях, индексируются очень быстро – это факт. Если разместить анонс на новый контент в соцсетях сразу после его публикации – есть большая вероятность, что поисковый бот проведет индексацию быстрее, чем текст украдут. Это значит, что преимущественное право при разбирательствах будет за истинным владельцем контента.

Брендирование контента

Включение в текст названия и контактов магазина/компании, описание уникальных, свойственных только определенному бренду, преимуществ позволит повысить ценность такого контента для сайта и одновременно снизить его ценность в глазах копипастера. Те, кто ворую контент, меньше всего желают его обрабатывать и редактировать. Поэтому текст, «привязанный» к конкретному сайту, с большой долей вероятности останется нетронутым. Либо же его украдут и сделают дополнительную рекламу сайту, откуда скопипастили контент (сомнительное преимущество, правда).

Судебные разбирательства

Если есть факты, подтверждающие авторство, а личность копипастера установлена, можно попробовать отстоять свои права в суде. Дело затратное, долгое, оправдывает себя далеко не всегда и только в случае с контентом особой ценности (например, присвоенной кем-то научной статьей).

Уникальность нужно отслеживать

Если защитить авторские права невозможно, за них нужно бороться. Один из важных этапов при этом – своевременный мониторинг уникальности контента. Сервисы Copyscape и DMCA за несколько долларов в месяц будут в автоматическом режиме определять копипаст. Небольшие сайты можно отслеживать самостоятельно, используя сервисы проверки уникальности (например, text.ru – там есть услуга пакетной проверки).

При обнаружении копипаста нужно как минимум выйти на веб-мастера, который разместил ворованный контент на своем ресурсе и потребовать снять его с публикации. Как правило, в 50% случаев этого достаточно. Если не помогло – время писать жалобу в техподдержку поисковых систем, не забывая доказать собственные авторские права. Если все подтвердится, сайт вора ждет как минимум пессимизация или даже бан.

Фильтры поисковиков, отслеживающие уникальность

В Яндексе при использовании ресурсом неуникального контента (под эту категорию попадает также некачественный) сайт может попасть под фильтр АГС. Он способен удалить из поиска все страницы ресурса, оставив из нескольких сотен или тысяч всего десяток. Чтобы не попасть под фильтр, нужно наполнять страницы только авторскими текстами и добавлять их в сервис «Уникальные тексты».

Аналогичный фильтр Google называется «Панда». Попадание сайта под фильтр можно обнаружить по резкому падению трафика через 1-3 суток после очередного обновления. Профилактика та же – использование только уникального контента.

Иные мнения

Ряд специалистов по продвижению настаивают, что далеко не для всех ресурсов уникальность является ключевым фактором. Это очень сложная и спорная тема, которая нуждается в отдельном освещении. Но все же такое утверждение с оговорками имеет право на существование. Пример: раскрученный сайт на тему гаджетов, имеющий свое сообщество и постоянную аудиторию с отличными поведенческими факторами. Такой сайт копипастит новости из открытых источников и публикует их со ссылками на эти источники. Хоть контент и неуникальный, активность аудитории позволяет сайту не попадать под фильтры и находиться в ТОПе.

Опять-таки повторюсь: эта тема требует глубокого анализа, поэтому не воспринимайте пример как инструкцию к действию. У владельцев сайтов часто возникают проблемы, связанные с индексацией и ранжированием их сайта. Одной из известных причин может быть не уникальный контент на сайте.

Авторство контента от Яндекса

Я обратился к представителю Яндекс, с целью помочь лучше разобраться в этом вопросе.

  • Мы хотим, чтобы наш текст являлся авторским (первоисточником) для поисковой системы Яндекс. Есть ли способы гарантированного закрепления авторства?

Мы не закрепляем авторство текстов, не гарантируем позиций в результатах и неизменности результатов поиска при любых обстоятельствах.

  • Каким образом можно проверить является ли наш текст первоисточником (авторским, оригинальным)?

Не предоставляем подобного сервиса.

  • В случае, если наш текст скопировал другой вебмастер, каким образом поисковая система может помочь в аргументации доказательства авторства 3-им лицам (например в суде)?

Не участвуем в разбирательствах по таким вопросам и не выдаем каких-либо справок.

  • Если мы добавили контент в Яндекс.Вебмастер инструмент: «оригинальные тексты» и в тот же день другой вебмастер выполнит те же действия, будет ли для поисковой системы учитываться время первого добавления текста в определении первоисточника?

Именно поэтому для корректного учета заявки в Оригинальные тексты мы просим добавлять текст до публикации в интернете.

  • Если текст, который мы заказали у копирайтера и оплатили ему, он добавит в инструмент вебмастера «Оригинальные тексты» для своего сайта быстрей нас, как мы можем повлиять на факт учёта даты добавления поисковой системой?

В данный момент мы работаем над решением этой проблемы.

  • Будет ли договор с вебмастером являться доказательством мошеннических действий, вводящих в заблуждение поисковые алгоритмы, в случае воровства контента?

К сожалению, мы не можем выступить гарантом или регулятором подобных отношений. Правовая оценка подобных действий (нарушение договора об оказании услуг) должна производиться в соответствии с текущим законодательством.

  • Для определения авторства контента, учитывает ли поисковая система дату первой индексации его на странице? Дата добавление текста в вебмастер в сервис «оригинальные тексты» или дата первой индексации контента имеет для поисковой системы наивысший «вес»?

Мы не разглашаем таких подробностей устройства алгоритмов.

  • Как вы определяете Авторство и чем вы можете помочь в проблемах с воровством?

Наша поисковая система постоянно сканирует сайты и помещает в свою базу все доступные документы. Используя их мы формируем страницы поисковой выдачи, которые состоят из списка проиндексированных документов и на наш взгляд являются наиболее релевантными запросам пользователей. Мы не несём ответственности за содержимое проиндексированных сайтов и не решаем вопросы, связанные с воровством контента не в каком виде. Авторство определяется по закрытому алгоритму. Добавление текста в инструмент "Оригинальные тексты" не гарантирует закрепление авторства, но помогает работе алгоритма в определении первоисточника. Если вы найдёте сайт в поисковой выдаче, который полностью или частично скопировал ваш контент и ранжируется лучше вашего, то пришлите через форму обратной связи следующие данные:

  • дата и время поискового запроса;
  • url отображаемый в строке вашего браузера;
  • поисковый запрос, указанный в поисковой строке;
  • url сайта, скопировавшего контент;
  • url сайта с которого копировали контент.

Мы изучим ситуацию и разберёмся в причинах такой работы алгоритма. Этим вы поможете нам улучшать его работу и корректно определять первоисточник.

Общий вывод

Чтобы защитить контент на сайте, нужно как минимум:

  • готовить качественный авторский брендированный контент;
  • информировать о новых текстах поисковые системы;
  • применять кросспостинг;
  • отслеживать уникальность и своевременно реагировать на плагиат.

Технические средства защиты от плагиата можно использовать разве что для собственного успокоения.