Elérési utak útvesztőjében a párhuzamosság problémája

A különböző CMS rendszerekre épülő webes környezetekben gyakran egymással párhuzamos URL címek mutatnak azonos tartalomra, vagyis különböző elérési utak jönnek létre. Mivel a Google keresőrobotjai így elérési szálakra bontva értékelik ugyanazt a tartalmat, a végső besorolásunk tekintetében bizony aggasztó visszaesést tapasztalhatunk.

A párhuzamos elérési utak problematikája

A fentebb említett probléma tovább bonyolódott a HTTPS protokollra való áttéréssel. Annak ellenére, hogy az átállás remek fejlemény, ezen a területen mégis okoz némi fejfájást. A klasszikus megoldás szerint adva van a „rel=canonical” tag, mellyel meghatározhatjuk, hogy az egymással párhuzamos elérési utak közül melyiket tekintse a Google mérvadónak. Azonban, ahogy azt a későbbiekben látni fogjuk, ez mégsem mindig jelent megoldást.

A probléma forrása

Számos módon jöhet létre olyan szituáció, amiben egy konkrét tartalom több elérési úttal rendelkezik. Ezek közül a két leggyakoribb eset, ha az oldal „www” előtaggal és nélküle is, illetve ha a HTTP és HTTPS protokoll alatt is elérhető. Így máris előáll négy elérési út, melyek közül egy ideális világban elviekben a „rel=canonical” implementálásával megválaszthatjuk az irányadót.

A gyakorlat azt mutatja, hogy a legtöbb általunk vizsgált weboldal alkalmazza a „rel=canonical” attribútumot. De bár ne tennék. Az általánosságban elterjedt helyzet ugyanis az, hogy a párhuzamos elérési utak mindegyike mérvadóként van megadva. Visszatérve az előbbi példára, ez azt eredményezni, hogy a négy versengő elérési út mindegyike arra szólítja fel a keresőmotorokat, hogy prioritásban kezeljék őket. A Google algoritmusai így pontosan ugyanazt teszik, mintha egyáltalán nem lennének „rel=canonical” sorok a kódban.

De miért?

A jelenségnek több oka is lehet. Az egyik forgatókönyv szerint a legtöbb webfejlesztő és SEO szakember különösebb tudatosság nélkül, kötelező formalitásként elhelyezi a „rel=canonical” taget minden HTML-ben. Anélkül, hogy különösebb fogalmuk lenne annak működéséről. Világos, hogy ezzel nem szűkült a tölcsér. Egy másik, inkább technikai magyarázat szerint a weboldalakat hajtó CMS-ek egy része egészen egyszerűen nem tudja jól kezelni a HTTP és HTTPS protokollok alatt egyszerre futtatott oldalakat. Kicsit pontosabban: a CMS nem tudja egy mérvadó elérési út alá sorolni a különböző protokollok alatt futó oldalakat.

A probléma megoldása

A HTTPS szabvány elhagyása inkább volna visszalépés mint megoldás. Így két út marad a kialakult helyzet megoldására. Egyfelől ha csak az emberi tényező a ludas, megoldás lehet a „rel=canonical” sorok helyes, átgondolt implementálása. Másfelől viszont – ha ez egyáltalán megoldható az adott körülmények között – érdemes lehet a 301-es átirányítás eszközéhez nyúlni. Ahogy azt John Mueller Google alkalmazott is megerősítette, a párhuzamos elérési utak átirányítással való felszámolás nemcsak a Google indexelési folyamatán gyorsít, de saját szerverünket is kisebb terhelésnek teszi ki.

Akárhogy is döntünk, a lényeg az, hogy valamilyen egzakt módon meg tudjuk határozni a domináns elérési utakat. Máskülönben minden egyéb erőfeszítésünk csak a remélt eredmények töredékét lesz képes hozni.

Közzététel dátuma: