Contenido duplicado y el canonical link

Como desarrolladores, si seguimos buenas prácticas, deberíamos procurar que cada recurso (o llámalo documento, o página...) de nuestras webs tuviera una url única, que no hubiera más que una posibilidad de acceder a ese recurso.

Pero en ocasiones, en nuestras aplicaciones web, nos encontraremos con casos en los que un recurso es muy similar a otro en su contenido, por lo que muy posiblemente tendremos problemas de penalización por contenido duplicado con los buscadores.

Un ejemplo típico podría ser el de algún item que puede pertenecer a varias categorías. Depende del camino escogido podríamos tener urls diferentes, donde cambiaría el breadcrumb para poder volver atrás en la navegación y muy poco más. Imaginemos por ejemplo que ese item fuera una noticia, una ficha de un producto, un evento... el grueso del contenido sería el mismo y podría ser considerado contenido duplicado.

Aparte de otro problema muy habitual es el de los ids de sesión en las urls (jsessionid, phpsessid...). Si no ha cambiado la cosa, cada vez que un robot de los buscadores encuentra uno de esos identificadores diferente, se toma como una url distinta y el contenido como duplicado.

Pues ya hace bastante tiempo que podemos especificar una url como canónica para estos casos. Esto quiere decir, que le diremos a los buscadores cuál es la url buena del siguiente modo:


<link rel="canonical" href="http://mikillerapp.com/soy-una-url-que-mola" />

Esta una de esas pequeñas cosas con las que puedes mejorar el SEO de tus aplicaciones web en internet, seguramente lo más "complejo" para muchos casos sea decidir cuál es la url canónica e implementar su lógica.

En fin, yo escribiendo de algo relacionado con SEO... si un día lo hago de social (co)media o cosas de esas, llamad a la policía ;). De cualquier modo, si necesitas una mano en estas cuestiones, seguro que la gente de VGS tecnologías web pueden ayudarte.