Как узнать, кто ворует мой контент

Доброго времени суток, уважаемые читатели. Спешу поделиться с вами очень важной информацией, которая будет полезна абсолютно всем. Естественно, я не исключаю того, что кто-то из вас уже в курсе и давно пользуется, но, надеюсь, есть и те, кому моя информация будет полезна.

Как то так получилось, что до недавнего времени я все ломала голову, как же проверить, есть ли на других сайтах мои статьи. Приходилось вбивать какие-то длинные фразы из своих статей в строку поиска, копировать отдельные статьи в программу от адвего, пользоваться услугами инструмента copyscape, в котором ограниченное число запросов в месяц, а платный аккаунт стоит не дешево.

Все эти способы можно отнести к ручным доисторическим методам.

Т.е. каждый из этих инструментов оценивает по одному url или по одной статье.

Основное большинство программ создаются для вебмастеров, которые заказывают статьи у копирайтеров, и рассчитаны на то, что вебмастер получает статьи, вставляет в программу и спустя пару минут получает ответ – уникальна статья или нет.

У меня же (и у всех добросовестных владельцев сайтов) другая проблема, мы пишем статьи для своего блога и совершенно не защищены от того, что любой желающий без зазрения совести может их у нас своровать.

Представляете, сколько нужно времени, что бы хотя бы раз в месяц проверить все статьи блога в программе, которая на это не рассчитана. Ведь, если сегодня моей статьи нет где-то в рунете на другом сайте, то это не значит, что она не появится завтра.

Плагиатчики не дремлют, и каждый день создают сетки сплогов, которые автоматически воруют контент из наших RSS лент, в автоматическом режиме делают синонимайз (замену слов синонимами) и публикуют на своих ресурсах, созданных не для людей, а для продажи ссылок, для обмана поисковых систем.

А это значит, что нужен инструмент, который может просканировать весь мой блог, считать все мои статьи, и проверить каждую в отдельности на уникальность. И главное, чтобы у меня это не занимало более пяти минут. Да, такой инструмент найден.

Даже долго искать не пришлось. Это программа eTXT Антиплагиат. Придумана она была разработчиками проекта etxt.ru (биржа статей).

В общем, каждая уважающая себя фирма разрабатывает подобную программу, но мало кто (или может никто?) не задумывался сделать проверку не только по одному тесту или статье, а по всему сайту в целом. Ведь бывают не только недобросовестные рерайтеры с копирайтерами, но и недобросовестные вебмастера, ворующие статьи с сайтов.

Итак, ближе к делу. О всех достоинствах программы читаем на сайте разработчика, а также познаем в процессе использования. Я же вкратце расскажу о том, как проверить, есть ли в интернете ваши статьи на чужих сайтах.

Качаем программу с официального сайта на этой странице, устанавливаем на свой компьютер, открываем. В меню выбираем Операции – проверка сайта:

Etxt Антиплагиат

Открывается окно – проверка сайта. Внизу окна есть поля: Укажите адрес и максимальное кол-во страниц.

Проверка сайта на уникальность

Если хотите проверить весь сайт целиком, то рекомендую указать максимальное количество страниц на много больше, чем есть в реальности, потому что программа загружает не страницы, как таковые, а URL. И в программу попадают дубликаты страниц (например, с #more), архивы, ярлыки. В общем, все их вы увидите загруженными в окошке. В ручную отбирать целевые страницы необходимости нет, программа сама распознает канонические URL, надо только из выпадающего списка указать "Выбранные".

Выбор страниц для проверки

Но и тут все же просмотрите все выбранные страницы, например, для Blogger программа выбирает архивы, которые нет необходимости проверять на уникальность. Просто снимите галочки у тех страниц, которые не нужно проверять. Когда список страниц готов, выбираем режим проверки:

Запуск проверки статей на уникальность

Я пока проверила самым первым способом. Другие ещё не успела испробовать. Уникальность документов осуществляется с помощью шинглов. Я не сильна в теории шинглов, и даже не знаю, как точно их описать. Читая про них, я в целом понимаю, что это такое, но объяснить своим языком пока не готова. Кто захочет узнать больше о них, поищите в поисковиках. В общем, можно пока на этом не зацикливаться, достаточно знать, что шаг в три шингла, которым осуществляется проверка – достаточно надежен для проверки статей на уникальность.

Кто в этом понимает, может настроить программу по своему усмотрению. Я же пока не успела так глубоко изучить все возможности и настройки программы.

Итак, процесс проверки запущен. Если вы проверяете до пяти страниц, то в конце можно сравнить ваш текст с найденным дубликатом. Если страниц проверяете больше, то будут доступны только последние пять. Но в любом случае, в поле Журнал программа покажет все страницы сайтов, на которых был найден текст, пусть даже измененный.

Найденные совпадения

Дело остается за малым, разобраться с плагиатчиками.

Ещё несколько советов.

  • Если вы отдавали свою RSS ленту в различные рейтинги блогов, то вполне вероятно, могут быть найдены дубликаты с этих сайтов, а также с сайтов социальных сетей, где вы могли делать анонсы. В таком случае, понятно, что это не плагиат, и ссылка есть.
  • Если вы выкладываете в своем блоге куски какого-нибудь кода, то в полне вероятно, что такой же или очень похожий код будет найден на других сайтах. Статьи, в которых вы выкладываете код уникальность всегда ниже, чем у статей без кода.
  • Исключив первые два варианта, проверяя результаты, я определила для себя, что, начиная от 6-8% совпадений, уже стоит насторожиться и проверить найденный сайт. Даже при таком малом совпадении велика вероятность того, что вашу статью синонимизировали, и если это видит программа, то может увидеть и поисковая система. По крайней мере, я убедилась на личном опыте, что в интернете найдено очень много дубликатов моих статей, даже с очень маленьким процентом совпадений.

Очень хотелось бы обратиться к разработчикам программы с благодарностью. И надеждой, что программа так и останется в открытом доступе и всегда будет бесплатной.

И конечно же, хочется обратиться к тем личностям, которые воруют чужой контент: Я хочу, чтобы вам, хоть на несколько секунд, стало стыдно.

Удачи всем.

Как узнать, кто ворует мой контент: 55 комментариев

  1. Levchun

    Спасибо за ссылку на программу. Очень полезная вещь.
    Интересна, есть ли альтернативы и чем они отличаются (скорость работы, точность нахождения)?

  2. SEO-Дилетант'ка

    Я особо не искала, но в течении года, что общаюсь в блогосфере ничего подобного не встречала, и в поисковиках в топе ничего подобного не нашла, по крайней мере по тем запросам, которые мне пришли в голову. Так же, читала разные статьи по сравнению программ, тот же нулевой результат.

  3. Flee.lancer

    Катюша, вот ты любопытная!! Я этой программой 8 месяцев пользуюсь, а сайт проверить на ней не додумлась!! спасибочки

  4. SEO-Дилетант'ка

    Ничего себе, любопытная, 10 месяцев голову ломала (не проявляла любопытство), есть ли такая программа или нет. Только на днях удосужилась в поисковики залезть. Раньше, кроме адвего плагиатус вообще ничего не знала.

  5. Flee.lancer

    у я по сфере деятельности все плагиатусы сразу скачала, давно ещё. Ну вот теперь остался только этот))

  6. vataga_a

    Etxt пользовался давно, но тоже не рассматривал его с этой стороны. Я проверяю с шинглом 4, на мой взгляд 3 это слишком, например в Адвего по умолчанию вообще стоит 5.

  7. Olga

    Екатерина, спасибо! Сама на днях искала что-нибудь такое, но когда есть отзывы — приятней… Сразу нашла три дубля своей статьи, содранной в 100%, а программа пишет 15% совпадения… Что это может означать? Все три плагиатчика на ЖЖ, явно видно, что блоги для заработка. Может проще удалить свою статью? Но жалко… А три дубля — это уже слишком.
    А когда среди ворованных нашла свою автобиографическую статью — просто в шоке!!! Мужик пишет — я такая-сякая художница… Какой синонимайз? Содрано слово в слово, а программа пишет 23% совпадения…

  8. SEO-Дилетант'ка

    При анализе учитывается страница целиком, т.е. в расчет берутся слова из сайдбара, рекламные блоки (на жж их много), комментарии — все это складывается в единый текст, поэтому и получается такая уникальность.
    Конечно удалять сразу не стоит. Посмотрите для начала, показывают ли в результатах выдачи эти блоги ПС или толь ваш?

  9. Александр Екимов

    Уф…статья интересная. Вот только для себя не определил. А стоит ли искать сворованные статьи. Мой блог развлекательной тематики. Все статьи уникальные. Как то проверял популярные статьи, нашел ссылку на одном трастовом ресурсе, на которых публикует целая толпа народа всякий контент…в основном просто берут инфу с других блогов…попытался связаться с автором блога…так послали на 3 буквы…зол конечно был. Но потом подумал…да и похрен…жаловаться яндексу, хостеру? Так оказалось хостер сам владелец сайта =). А до яндекса руки не дошли…В итоге забил на проверку….

    А у вас какие цели для проверки? зачем искать сворованные статьи?

  10. Олеся-Fialka

    Екатерина, большое спасибо. Обязательно скачаю эту программу. Хотя и так знаю, что мои статьи бродят по интернету без указания авторства.
    Печально, что люди совсем перестали уважать чужой труд.

  11. Татьяна

    Мне кажется, что намного проще проверять программой с адвего http://advego.ru/plagiatus/top/p=46XsPEED36, там есть два вида проверки: обычная и глубокая, программу можно настраивать, но она и так хорошо работает, а для проверки сайта, отлично, без скачивания работает Истио http://istio.com/rus/site/analyz/ (простите за ссылочки, Вы можете их удалить, но я всегда пользуюсь этими двумя ресурсами как для анализа текстов, так и для проверки уникальности)

  12. SEO-Дилетант'ка

    Моя цель — заставить вора поставить на меня ссылку. С одной стороны, когда воруют — это очень хорошо, мои статьи расходятся по сети и их могут прочитать большее количество людей. Но с другой стороны, если человек берет чужую статью — он должен поставить ссылку на первоисточник.
    И второй аспект — это мое законное право. Все статьи — это мой интеллектуальный труд. Хоть в интернете сложно доказать авторство, в мире, и в нашей стране, плагиат — это уголовно наказуемое деяние. Представьте, если вы на прилавках магазина увидите книгу автора Васи Пупкина, откроете ее, а там будут стихи Пушкина. Так вот между моим блогом и этим примером нет никакой разницы.

  13. SEO-Дилетант'ка

    Что касается адвего, она совершенно не подходит для проверки целого сайта, поэтому сравнивать его с eTXT Антиплагиат — невозможно. А что касается второй ссылки, ее пришлось удалить, т.к. она была не правильная, Ссылка вела на несуществующий документ. Удалив часть ссылки пыталась найти на этом сайте инструмент для проверки сайта — ничего не нашла. Дайте правильную ссылку.

  14. Inna

    Я вчера сделала все точно по инструкции. У меня на блоге был список других блогов, так этот антиплагиат как начал сканировать и мой блог, и те блоги, которые входили в список моих блогов. Почему?

  15. DgoKer

    Я вот узнал. У меня ворует seogramota . ru. И что теперь делать? Ведь его блог намного круче и индекснуться статья может у него сначала, а потом у меня!

  16. Alekim

    Катя, понятно, что вы хотите заставить автора поставить на вас ссылки. Но. К сожалению, у многих мнение такое — раз в интернете, значит на халяву, значит можно стырить…А если автор просит ссылку поставить, да пошел он в попу…это все бесплатно. Жаловаться будешь? иди туда, куда я тебя послал ранее…
    Примерно вот такой ответ мне был дан, когда я попробовал сказать, что это моя работа…а еще знаете что самое смешное…так как у меня развлекательный блог, то я делаю различные подборки информации…к примеру, захожу на фотохостинг и делаю подборку, мол самые самые крутые фотки с такого то сайта…Статья всем нравится, …нравится так, что многие ее воруют…а когда говоришь, мол дружище…поставь ссылку, я чтобы отсобирать эти фотки постратил 4,5 часа и это я написал…А он мне отвечает…это не твое…это все того сайта,с которого ты делал подборку…..Вот такие неприятные пироги….
    Ну а так как я стараюсь вести блог с позтивом…то мне портит это все настроение…в общем забил на это.

    Хотя я вижу тут один +. Если не принимать все отсылки в эротические пешие путешествия близко к сердцу, искать свои статьи и просить всех ставить ссылки. То половина поставит…а это уже +

  17. Елена Саульченко

    Екатерина, каждый раз, зайдя к Вам блог, обязательно нахожу что-то интересное. Как сейчас, например. Спасибо.

    Я не думаю, что у меня воруют контент, но стало любопытно.
    Сразу же скачала эту программу и стала проверять свой блог на уникальность.

    Но что-то у меня почти в течении всей проверки фигурировало такое: «Не удалось загрузить страницу из запроса № …».

    Не подскажете, с чем это связано?

  18. Николай

    Спасибо за статью! Нашел свои статьи на других сайтах, правда не знаю как на это реагировать. Если копируют, значит интересно 🙂

  19. Евгения

    Понравилось, спасибо, проверила, в среднем 95% стало, а когда писала было 100%, но конкретных воров не нашла, кроме себя самой, дублировала немного себя на другом ресурсе

  20. Olga

    Сделала вывод — Гугл воров не поддерживает, в выдаче их нет. А вот Яндекс показывает…

  21. SEO-Дилетант'ка

    Alekim, конечно, я понимаю, что у многих другое мнение, я давно не расстраиваюсь из-за того, что мои статьи воруют. Вообще не расстраиваюсь, но я считаю — я должна защищать себя и свой блог. Это единственная движущая сила, которая заставляет меня искать и писать ворам. И поверьте, я этому не уделяю много времени. И потом, просто надо знать врага в лицо.

  22. SEO-Дилетант'ка

    Потому что я в статье написала, что он загружает не страницы, а адреса. Прочитайте, в статье об этом написано. После того, как программа все загрузит, надо просто отфильтровать только свои канонические страницы.

  23. SEO-Дилетант'ка

    У меня тоже она же (сеограмота) ворует. Я сама в раздумьях, что делать. Видать он для сапы страницы гинерил. Но видно, что они в таком качестве, что вряд ли ПС их примет за первоисточник.

  24. SEO-Дилетант'ка

    В общем, я на то и рассчитываю и к тому и стремлюсь, чтобы все статьи мои несли полезность.
    У меня тоже такое было в программе. Все ссылки не проверяла, но из тех, что проверила, во всех случаях был недоступен сам сайт, т.е. это не от программы зависит, а от хостинга, где находится сайт, который программа пытается проверить. В таком случае, надо попробовать проверить позже.

  25. DgoKer

    Ничего не делать. Я ему написал, но он сказал что это не его блог и вообще он в армию уходит )). Яндекс ответил по этому поводу:
    Поисковая система Яндекс является лишь зеркалом интернета, поэтому мы не правомочны разбираться в вопросах плагиата.
    Чтобы защитить свои авторские права, Вам надо, видимо, обратиться к хозяевам указанного сайта и к провайдеру, на сервере которого он находится. Если сайт прекратит свое существование, он будет удален из поисковой базы Яндекса автоматически.
    Тем не менее, мы уже работаем над алгоритмами, которые будут способны отличать текст источника от плагиата. Если у Вас есть пример, когда сайт, скопировавший контент, ранжируется лучше Вашего, пожалуйста, пришлите пример нам, он очень поможет.

    Так что нужно смотреть чтобы копипаст не ранжировался лучше твоего блога!

  26. SEO-Дилетант'ка

    Стандартное письмо Яндекс. Да, действительно, в подобных случаях, надо убедиться, что плагиатчик ранжируется выше, и после этого писать в Яндекс с реальными примерами, ссылками и скриншотами. А так, для яндекс дохлый номер. В одной из статей уже обсуждался подобный вопрос именно в комментариях. Посмотрите.

  27. Руслан

    Даже не думал, что так много у меня своровано статей. Особенно понравились статьи, где к глаголам добалена буква «а» и автор-женщина выдаёт себя за автора

  28. Oksana

    ну наконец-то такая программа появилась!
    спасибо за освещение.
    я уже замучилась. Копии статей появляются уже на следующий день после вывода!

  29. Геннадий Михайлюта

    Использовал адвего плагиатус . Хотя на сайте числюсь копирайтером, но там еще не работал, поэтому не использовал этой программы. Сегодня скачал. Неплохо! Спасибо!

  30. Arslawa

    Проверял тексты сайта как раз описанными в статье «доисторическими» методами (Адвего, в основном). Спасибо за ссылку на удобную и необходимую прогу.

  31. wert

    Программа действительно стоящая внимания. Если честно сказать я ей пользовался когда делал рерайт под заказ (проверял уникальность текста). Ещё есть утилита от «адвенго», принцип тот-же что и в ехт-плагиате.

  32. savinmusic

    Жаль.. Хорошо. что у меня и ПК тоже есть, можно на нём пользоваться программкой )

  33. ChaynikovaTV

    Два вопроса. Указала адрес своего блога (он на блоггере), а закачиваются страницы из вообе всех блогов — любых. По-моему из тех, что я читаю и читают меня о_О о_О
    А что она делает с изображениями?

  34. SEO-Дилетант'ка

    Программа закачивает только ссылки, которые находит на вашем блоге, т.е. не физические страницы, а именно ссылки. После того, как все будет загружено, можно применить фильтр, скрыв все, что не нужно проверять.
    А что она должна делать с изображениями? На уникальность она их не проверяет.

  35. Barracuda

    Спасибо за статью. Раньше проверял на уникальность программой Адвего Плагиатус. Программа от Etxt гораздо лучше. Сразу нашла, что у меня с сайта 2 статьи одна личность скопировала. Полносью от начала и до конца, никагого рерайта, просто копи-паст. У меня нет слов. У людей просто совести нет.

  36. Fader

    Да фиг сним что синимизировали, а то воруют просто так, голую статью без ссылки!!

  37. ZeroXor

    Да, жаль, что только под Windows. Но пользоваться буду все равно. Лучше поздно, чем никогда.

  38. Сергей Толкачев

    Попробовал программу — действительно находит статьи по тексту. Автору спвсибо за инфу. Только геморой это все. Где то в 1995 я наткнулся на цитату из Э. Лимонова — Победа халявы — неизбежна. Пожалуй от оказался пророком

  39. Ruslan_rv

    Хорошая прожка, пользуюею давненько, но проблема только в том что постоянно каптчу из яндекса нужно прописывать (

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *