Google poate depista conținutul duplicat înainte de indexare

Google poate depista conținutul duplicat înainte de indexare

 

John Mueller de la Google a dezvăluit pentru webmasteri în această săptămână că Googlebot este capabil să recunoască conținutul duplicat înainte de a fi accesat prin indexare.

A fost adresată o întrebare de către un proprietar al unui site, dacă și când Google ar considera o versiune franceză a unei pagini ca fiind un duplicat al versiunii în limba engleză.

Poate Google să determine când mai multe pagini au același conținut în diferite limbi? Dacă da, cum este văzut rezultatul în motoarele de căutare?

În răspunsul lui Mueller, el a arătat că, în unele cazuri, Google poate detecta când paginile împărtășesc același conținut fără a fi nevoite să acceseze cu indexuri paginile. Este ceva ce trebuie luat în considerare, mai ales când vine vorba de structura URL-urilor paginilor.

“Uneori observăm într-o manieră proactivă că ceva este probabil duplicat, chiar înainte de a-l indexa. Deci, acest lucru se întâmplă atunci când vedem că diferența, de exemplu, este în interiorul adresei URL undeva într-un loc în care am observat în general că conținutul afișat în această parte a adresei URL nu este atât de relevant pentru conținutul afișat pe pagină.

 

Așa ar putea fi si cazul unui parametru lingvistic pe care îl puteți seta pe orice tip de conținut și prin care am fi putut trece, doar încercând exemple de genul “limbă = engleză”, “limba = franceză”, “limba = germană, “… Dacă vom constata că toate aceste pagini arată conținutul în limba engleză, cu excepția poate” limba = spaniolă “care a ales versiunea spaniolă, atunci s-ar putea să presupunem că acest parametru de limbă este de fapt irelevant pentru această pagină, pagină care are într-adevar un conținut unic.”

Haideți să despicăm un pic firul și să privim lucrurile dintr-o perspectivă mai amplă. Uitați de alte limbi pentru o clipă. Acesta este un exemplu particular legat de limbi, dar ceea ce Mueller a avut de spus se poate aplica la conținutul de aceași limbă, de asemenea.

Ceea ce Mueller încearcă să spună de fapt este că, Google poate determina dacă conținutul de pe o pagină este duplicat dacă împarte aceași parametrii URL cu pagini ce nu se diferențiază între ele.

Evident, aceasta nu este o situație ideală, deoarece pot exista situații în care pagini cu conținut unic au parametrii URL identici cu paginile care sunt copii exacte.

Deținătorii de site-uri pot evita să se lovească de o astfel de problemă prin a publica conținut unic ce nu poate fi duplicat, fiind foarte atenți la felul în care paremetrii URL sunt generați de către site-urile lor.

Mueller recunoaște că nu întotdeauna este vina deținătorului de site, atunci când paginile sunt tratate drept duplicate, uneori Google are propriile sale “greșeli”.

 

 

Share this post


 

Close your account?

Your account will be closed and all data will be permanently deleted and cannot be recovered. Are you sure?