 |
Публикувано на 18 Март 2008 от vessi
Представяме ви
Стони деГайтер е създател на Pole Position Marketing, която е една от водещите компании в сферата на SEO. Автор е на много статии, посветени на оптимизацията. Публикува материали в Search Engine Guide и има собствена месечна рубрика в Search Engine Land. Компанията е пионер в Destination Search Engine Marketing, чиято максима е "Да направим сайта ви предпочитана дестинация на търсещите информация"
Има два вида дублиране на съдържанието – съдържание, което се повтаря на няколко сайта и такова, което се дублира в рамките на един уеб сайт. Най-вероятно търсачките третират тези два вида по различен начин, както и различни стандарти за различните типове дублирания, в зависимост от конкретния случай.
Дублиране на няколко различни сайта
Нека първо разгледаме какво е положението при дублиране на съдържанието в няколко различни сайта. Съществуват две основни дублирания на съдържанието – дублиране на статии (новини) и дублиране на описания на продукти.
Най-често се получават съвпадения на описания на продукти в сайтовете за електронна търговия, в които към всеки предлаган артикул се добавя текста, предложен от производителя. Обикновено се променя само заглавието и мета описанието, без да се променя основния текст. Как постъпват търсачките в този случай, когато трябва да определят кой от многото сайтове, предлагащи това описание трябва да бъде по-напред от другите, когато всъщност текста е един и същ?
В този случай най-вероятно основна роля играе тежестта на сайта и входящите линкове към съответната статия. По презумпция сайтът с повече посетители, изградил си името през времето и имащ най-голяма популярност, ще бъде начело, независимо от това, че част от съдържанието в него се повтаря в още няколко не толкова добре познати електронни магазина.
От друга страна сайтът, който предлага по-различно, уникално, съдържание, е ,така да се каже, една крачка напред и обратните линкове и популярността му няма да са чак от такава голяма важност, въпреки че пак ще се вземат предвид при класирането. Независимо от това по-големите сайтове с дублиращо се съдържание имат шанс пак да се класират напред, но ако се появи сайт с едно или две нива под техните и предлага уникално съдържания, няма да бъде изключено класирането му в резултатите преди тях.
Уникалното съдържание е приоритет при търсачките и те отдават дължимото на сайтовете, в които се публикуваното.
При дублирането на статии или новини, което също се случва доста често, когато една и съща статия се публикува в различни сайтове от автора им за по-широк обхват на публиката, или от блогове, които препубликуват различни материали, ситуацията е малко по-различна, тъй като основния текст е много по-дълъг. Въпросът тук е как търсачките разбират кой е оригиналния източник.
Най-простият начин е чрез засичане на датата на публикуване на статията във всички източници. Ако търсачката е засякла съдържанието на сайт А преди появата му в сайт В, тя ще може да разбере кой е оригиналът. Обаче не винаги се индексира първо оригинала, ако другите сайтове се посещават от роботите по-често или самият сайт е нов. В този случай е възможно да се търси линк към автора на материала или неговото име. Ако роботът проследи сложения линк и той го отведе до дубликат на съдържанието, то той ще разбере, че това е оригинала. В случая не се разглежда откраднатото съдържание, в което няма обратен линк към автора или оригиналната статия.
Но какво става, когато е идентифициран оригиналния материал, към който има голямо количество обратни линкове? Логично е, този материал да се появи по-напред в резултатите от дубликатите в останалите сайтове. Но дали става така, все още не е ясно.
Дублиране на съдържанието вътре в сайта
Този тип дублиране се свързва с едно и също съдържание на няколко страници от един и същ уеб сайт. Този тип дублиране най-често получава "неодобрението" на търсачката, което означава, че тези страници не се класират добре в страниците с резултатите. Ако тези страници липсват, търсачката се отнася много по-благосклонно към дадения сайт.
И тук се появява проблема с описанията на включените към каталога на електронните магазини описания на продукти. Някои от тези сайтове генерират няколко URL-адреса за даден продукт, в зависимост от пътя, по който е минал потребителя. Ако всеки един продукт има три различни адреса, а каталогът съдържа 5 хил. продукта, то ще бъдат индексирани близо 15 хил. различни страници, което е голям проблем за търсачките. Когато роботът открие, че за дадения сайт са индексирани 10 хил. повече страници, той може да намали броя на посещенията към този сайт или дори да спре да го индексира, което може да доведе до неиндексиране на новите продукти, които в последствие ще бъдат добавени.
Дублиране от този тип може да доведе и до разпределяне на стойността на обратните линкове на много повече страници, отколкото всъщност съществуват. Освен това, ако има външни линкове към определен продукт, то те ще са към трите различни линка, което означава, че реалният линк няма да получи истинската си стойност.
Много хора ще разрешат този проблем като се забрани индексирането на различните версии на линка, освен тази, която те преценят, че е реалната. Това е решение само на проблема за индексирането, но не разрешава този с линкването към различните версии на страницата. А докато той съществува, съществува и объркването при оценяването й.
Най-доброто решение е да се намери начин за елиминиране и на двата случая. Основното, което може да се направи, е да не се оставя пътя, по който един потребител стига до дадената страница, да не определя URL-адреса. Нека да съществува само един линк към всеки един продукт.
Подобен е случаят с показването на един продукт в няколко категории. Например, ако посетите един каталог, в който търсите един продукт, включен в няколко категории, то когато кликнете върху някоя категория, ще ви се покаже кратко описание на продукта, заедно с описанията на останалите продукти. Когато последвате линка, тази информация ще ви бъде показана отново.
Не е много ясно как точно се възприема този тип дублиране от търсачките, но едва ли страниците ще получат нужната тежест. В този случай е добре да се добави уникално съдържание към всяка от категориите, което да бъде засечено от роботите. В най-добрия случай, те ще игнорират дублирането на описанията. Обаче проблемът с оценяването и честотата на индексиране на страницата си остава.
*Статията е съкратен вариант на оригинала "Theories in Duplicate Content Penalties".
Споделете статията:
|
 |