Дубльований контент - проблеми та рішення

  1. Розглянемо деякі з найбільш поширених причин наявності дубльованого контенту:
  2. У загальному випадку, існує 3 види наслідків при наявності дубльованого контенту:
  3. Так що ж робити?

Багато сайтів «можуть похвалитися» дубльованим контентом

Багато сайтів «можуть похвалитися» дубльованим контентом. Здебільшого, це не є великою проблемою. Коли пошукові системи знаходять дубльований контент вони вибирають найбільш «підходящу» сторінку, щоб занести її в індекс, а інші дубльовані сторінки будуть ігноруватися. Комусь може здатися, що наявність дубльованого контенту не представляє великої небезпеки, однак, не все так просто як здається.

Розглянемо деякі з найбільш поширених причин наявності дубльованого контенту:

1. Партнерські програми

Якщо у вас є партнерська програма, швидше за все, ваші партнери використовують URL, який виглядає приблизно так: http://www.yoursite.ru?affid=123456. Пошукові системи будуть розглядати даний URL адреса як іншу сторінку, що відрізняється від http://www.yoursite.ru, і, відповідно, можуть зафіксувати на вашому сайті дубльовані сторінки.

2. Каталоги статей

Якщо ви поширюєте інформацію, розміщену на вашому сайті, через каталоги статей, ви створюєте дубльований контент на інших доменах. Майте на увазі, що пошукові системи виберуть одну копію сторінки для індексації і високого ранжирування, як першоджерело і, при певному збігу обставин, оригінальна стаття на вашому сайті може бути проіндексована пізніше з відповідними наслідками.

3. Адресна архітектура сайту з декількома варіантами URL параметрів

Часто буває, що сайт налаштований так, що при вказівці або не вказівка ​​певного параметра в URL, відбувається перенаправлення на одну й ту ж саму сторінку. Наприклад: при заході з цього URL адресою http://www.yoursite.ru/prod=1&type=7 може статися перенаправлення на http://www.yoursite.ru?type=7. В результаті, якщо пошукові систему знайдуть подібні посилання, то вони, ймовірно, можуть розцінити цю ситуацію, як дубльоване вміст.

4. Субдомени

На деяких доменах http://subdomain.yoursite.ru веб-майстри розташовують такий же зміст, як і на основному домені http://www.yoursite.ru, що призводить до дублювання.

5. Версія сайту з www і без

Зайти на ваш сайт можна як з приставкою www (http://www.yoursite.ru), так і без неї (http://yoursite.ru). Зазвичай, веб-майстри або самі налаштовують 301 редирект на будь-яку версію, або це вже зроблено (наприклад, при створення сайту на популярній CMS ). Але, якщо 301 редирект не налаштований, то пошукові системи можуть продублювати головну сторінку, а в разі одночасної проставляння хоча б двох зовнішніх посилань на одну і ту ж сторінку - пошукові системи продублюють і її.

Так в чому ж реальна небезпека дубльованого контенту? По-перше, якщо на вашому сайті є дуже багато дубльованого контенту, то пошукові системи можуть проіндексувати сайт в повному обсязі, а отже, сенс від таких сторінок практично пропадає. Google, зокрема, добре вміє оцінювати сайти на наявність дубльованого або не рідкість контенту. Він сканує всі сторінки сайту, але в пошук допускає тільки ті, які, на його думку, можуть нести якусь користь для користувачів. У інтертене присутні сайти з 100 000 сторінками, однак, в пошуковому індексі Гугла присутній 0%. Дані сторінки являють собою або крадений копіпаст, або генерований текст. В обох випадках, нічого корисного і нового для користувачів вони не уявляють, отже, в пошуку їм робити нічого. Інакше у вас можуть вийти шалені гроші бразильський серіал.

У загальному випадку, існує 3 види наслідків при наявності дубльованого контенту:

1. Пошукова система не може вибрати "правильну" копію сторінки для індексування. Прикладом може служити часта поява в індексі варіанти для друку. Як прищепило, в цьому випадку на сторінці не відображається реклама, зайвий код, отже, пошуковим машинам така сторінка подобатися більше, ніж її оригінальний варіант.

Рішення - заборона індексації подібного роду сторінок (найкраще за допомогою robots.txt).

2. Довгий індексування нових і переіндексування старих сторінок. Якщо пошукової робот приходить на ваш сайт, а там 1000 сторінок, половина з яких - дубльований контент, то роботу доводиться витрачати багато часу для сканування подібних сторінок, в результаті, з великою часткою ймовірності, ви отримаєте менше проіндексованих сторінок, ніж могли б.

3. Втрата посилального ваги. деякі посилання , Проставлені на дубльовані сторінки, не принесуть ніякої користі і їх вага буде витрачений на сторінках, які не потраплять в індекс. Якщо виключити дубльований контент, то контрольний вагу буде поширюватися тільки серед проіндексованих сторінок, в результаті чого відбудуться потенційні поліпшення в рейтингу цих сторінок.

Так що ж робити?

Всі перераховані вище проблеми мають рішення, але рішення багато в чому залежить від точного характеру вашої проблеми. Наприклад, якщо у вас виникли проблеми з партнерської посиланням, найпростішим рішенням є вимога від ваших партнерів розміщувати посилання з атрибутом rel = "nofollow". Звичайно, це неприємна ситуація, адже в цьому випадку ви втрачаєте контрольний вагу.

Для вирішення проблем на сайті необхідно закрити всі дублі сторінок за допомогою кореневого файлу robots.txt і налаштувати 301 редирект. НЕ використовуйте 302 редирект, або мета-теги (за винятком, коли ви не можете отримати доступ до файлів сервера для налаштування переадресації).

Ru?
Ru?
Так в чому ж реальна небезпека дубльованого контенту?
Так що ж робити?