A duplikált tartalom kérdőjelei
Rengeteg a félreértés akörül, hogy a Google hogyan is kezeli a duplikált tartalmakat, de Patrick Stox célja, hogy egyszer s mindenkorra tisztázza ezeket a kérdéseket.
A duplikált tartalom körül számos legenda kering, melyek szerint a duplikáció büntetést von maga után, illetve, hogy a duplikált tartalmú oldalak egymással versenyeznek a találati listán, így gyengítve az oldalt. Sokan jobban félnek a duplikált tartalomtól, mint a fertőző linkektől!
A Google már évekkel ezelőtt szerette volna elejét venni ezeknek a pletykáknak, 2008-ban Susan Motka publikált is erről a Google Webmaster blogon:
„Nem létezik olyan dolog, hogy “duplikált tartalom büntetés”. Legalábbis nem úgy, ahogy azt sokan gondolják. Segítsétek úgy a webmestereket, hogy nem terjesztitek tovább a duplikált tartalom büntetésének mítoszát!”
Mi a duplikált tartalom?
„A duplikált tartalom általában olyan domainen belüli vagy domaineken átívelő tényleges szöveges blokkokra utal, amelyek teljesen megegyeznek egymással vagy érzékelhetően hasonlóak.”
A Google úgy kezeli a duplikált tartalmakat, hogy az könnyen büntetésnek tűnhet. Ezzel szemben, a duplikált tartalmak automatikusan szűrésre kerülnek a keresési találati oldalakon. Erről könnyen megbizonyosodhatunk, ha a &filter=0 paramétert hozzáírjuk az URL végéhez.
Ez a paraméter eltávolítja az automatikus szűrőt, így a találati listán megjelennek a duplikált oldalak is. Ha így többször is megjelenik egy oldalunk, az azt jelenti, hogy oldalaink tartalma azonos, vagy a Google szemében nagyon hasonló, így e két indexelt verzióból a kereső csak a relevánsabbat jeleníti meg. Azonban ez nem azt jelenti, hogy az oldalak szükségszerűen egymással versenyeznek vagy gyengítik az oldalt.
Duplikált tartalom az egész interneten
Matt Cutts szerint, az egész interneten található összes tartalom nagyjából 25-30%-ka megtalálható máshol is. Egy nemrég készített tanulmány ugyanerre az eredményre jutott, eszerint az oldalak 29%-kán található duplikált tartalom.
A Google gondolatai a duplikált tartalomról
Rengeteg bejegyzés született már a duplikált tartalmakról, most vázlatpontokban összeszedtük a legfontosabbakat:
- A duplikált tartalom nem jár közvetlen büntetéssel
- A Google tudja, hogy a felhasználók diverz információkra vágynak, nem szeretnék újra és újra ugyanazt a cikket elolvasni, ezért csak egy verziót mutat
- A keresőóriás úgy tervezte meg az algoritmusait, hogy a különböző oldalakon található duplikált tartalmakat egy csoportba szervezi, majd ebből a csoportból választja ki a “legerősebb” URL-t és azt jeleníti meg
- A duplikált tartalom nem jár következményekkel, de csak addig, amíg az a keresési eredmények manipulálására nem irányul
- A legrosszabb ami történhet egy ilyen jellegű szűrés után az, hogy az oldal egy kevésbé kívánt verziója jelenik meg a találatok között
- A Google megpróbálja megtalálni a tartalom eredeti forrását és azt mutatni
- Ha valaki a beleegyezés nélkül közli más tartalmát, a sértett kérvényt nyújthat be DMCA-nál annak törlésére
- Ne gátoljuk a hozzáférést a duplikált tartalmakhoz, ha a keresőbot nem fér hozzá az összes verzióhoz, nem is tudja kiválasztani közülük a legjobbat
Duplikációt okozó tényezők
- HTTP és HTTPS verzió is elérhető egyidejűleg
- www és www nélküli verzió
- URL paraméterek
- URL záró slashek ( / )
- .index oldalak
- Alternatív oldal verziók (pl.: m. ; print verziók)
- Fejlesztői aldomainek
- Pagináció
- Nyelvi verziók
Megoldások
- Ne tégy semmit, majd a Google elintézi: habár ezt a verziót nem ajánljuk, feljebb olvasható volt, hogy a Google csoportokba szervezi a duplikált tartalmakat, és különböző tényezők alapján dönt a megjelenítésről, ezzel megoldva a duplikációs problémákat helyettünk.
- Canonical címkék: ezek a címkék segítenek a keresőbot döntésében és kiválasztják a megfelelő verziót. Ha van beállítva canonical verzió, már nem beszélhetünk duplikációs problémáról
- 301-es átirányítás: megakadályozza a duplikált verziók megjelenését, ezzel oldva meg problémájukat
- Mondd meg a Google-nek, hogy kezelje az URL paramétereket: ezek beállításával, megmondhatjuk, melyik paraméter mit csinál, így a keresőbotoknak is iránymutatást adunk.
- Rel=”alternate”: ennek beállításával azonosíthatjuk az oldal alternatív verzióját, mint a mobilverzió vagy a különböző nyelvi változatok. Utóbbiak megkülönböztetésére a hreflang tag használata az ajánlott. Ezzel kapcsolatban John Mueller is elmondta; ezek használata nem befolyásolja pozitívan a helyezéseket, azonban segít abban, hogy a megfelelő verzió jelenhessen meg.
- Rel=”prev” és rel=”next”: a pagináció (oldalszámozás) használatához
Itt az ideje, hogy a duplikált tartalom büntetésről szóló legendák kikopjanak a köztudatból. Helyes információkkal kell dolgoznunk, máskülönben ez a mítosz még további 10 évig élni fog. Több módja is van, hogy irányítsuk a keresőbotok munkáját, azonban ha még ezekkel az eszközökkel nem is élünk, a Google akkor is segít rajtunk!