Май 132013
 

О том, что тексты для сайтов следует проверять на уникальность, знают многие — но не все верно и глубоко понимают, для чего это следует делать и как адекватно интерпретировать результаты проверки. Итак, давайте разберемся.

unikalnost

Если вы — владелец сайта, вам жизненно необходимы уникальные тексты, и вот почему: поисковые роботы, обнаружив повтор (скопированную статью, копипаст), попросту выбросят ваш сайт из поиска — и то правда, зачем показывать пользователю несколько раз одно и то же. Такая политика поисковых систем приводит к тому, что информацию с тем же смыслом излагают разными словами — это и называется рерайтом. В идеале, разумеется, желательно даже в избитые темы стараться добавить нечто свежее, из персонального опыта, например. Но это уже лирика.

Если статьи вы заказываете копирайтеру (напрямую или через биржу), то перепроверять уникальность следует еще и для того, чтобы выяснить,  не обманул ли вас работник — написал ли он текст сам или скопировал у конкурентов.

Написанные собственноручно статьи тоже нелишне проверить: избитые фразы могут внезапно снизить уникальность — заодно и поймете, что некоторый процент совпадений не обязательно означает жульничество.

Не помешает перепроверять и уже размещенные статьи, чтобы убедиться, что их никто не спер — для этого в настройках программы можно исключить из поиска собственный сайт и поискать совпадения на других.

Но перейдем к практике: расскажу о программах, которыми для контроля уникальности статей пользуюсь сама.

antiplagiat

Advego Plagiatus скачать можно здесь.

Желательно сразу зайти в настройки (неприметная серая шестеренка по центру верхней панели) и установить размер шингла и размер фразы — 4. Это очень жесткие настройки: программа станет искать все совпадения любых 4 (и больше) слов подряд.

Полезно помнить, что обороты типа «в связи с тем, что» — уже снижают результат, хотя ничего преступного в их использовании нет. Добиваться вожделенных 100% да на глубокой проверке — не всегда имеет смысл, поисковики «любят» статьи от 85% уникальностью.

А всевозможные ухищрения для повышения этой цифры (особенно, если текст небольшой и любая фраза занимает в нем изрядный процент) могут негативно сказываться на читабельности и «человечности» статьи.

Его аналог — eTXT Антиплагиат — скачивается тут. Здесь у меня вовсе выставлено число слов в шингле = 3, для надежности. Действует он так же, но есть смысл иногда перепроверять статью обеими программами: определенные различия в результатах порой наблюдаются.

Существует и онлайн-проверка, которая действует по иному алгоритму: она ищет совпадения не по шинглам, и может «отлавливать» рерайт, даже если слова переставлены и изменены их окончания.

antiplagiatЯ стараюсь проверять двумя разными алгоритмами просто для самоуспокоения. Парадоксально, но очень часто там, где Адвего Плагиатус отыскивает до 20% совпадений (по часто употребляемым оборотам, скажем), проверка текст.ру может выдавать гордые 100% уникальности — поскольку ищет связанные между собой совпадения по всему тексту, а не локальные фразы.

Впрочем, это тоже не панацея: написать рерайт так, чтобы по всем программам он был 100% уникален — вполне реально. При этом грешно требовать от копирайтера идеальной уникальности в текстах юридических, медицинских, технических — переписать алгоритм технологического процесса или схему лечения без совпадений — попросту невозможно.

На картинках можно наглядно увидеть результаты проверки уникальности (в настройках выбрана глубокая проверка) первых двух абзацев данной статьи. Как видим, некоторые совпадения при проверке «по шинглам» бдительно вылавливаются, несмотря на то, что текст писан, как говорится — «из головы». При этом, если загнать всю статью — будет 100%, хотя те «пойманные» фразы никуда не делись. Проверка на рерайт же пройдена с честью.

antiplagiatТак что делаем выводы:

1) Помимо самого процента совпадений, нужно смотреть еще и на выделенные совпадения, прежде чем бить копирайтера.

2) Результаты проверки могут сильно отличаться при разной скорости соединения.

3) Добиться хороших цифр уникальности (>95%) на маленьком (меньше 1000 знаков) тексте, да еще и технической направленности — очень сложно.

4) Жизненной необходимости выкручивать именно круглые 100% — нет.

Есть еще вопросы по теме? Спросите в комментариях, отвечу.

Kate_Murphy

Комментарии:

 Leave a Reply

(надо)

(тоже надо)