7 minutos de lectura ( 1353 palabras)

Duplicar Artículos en Joomla: causas, errores más comunes, soluciones

Toda persona que tenga un sitio web Joomla tarde o temprano se enfrenta al problema de las páginas duplicadas. Así que vamos a echar un vistazo a este problema desde dentro, vamos a resolverlo, a ver cómo los motores de búsqueda reaccionan a ellas, y la manera de deshacerse de estos gemelos malvados.

Así, los duplicados de página son documentos idénticos, en sus sitios web, que están disponibles a través de diferentes URL. En realidad los duplicados de página son los puntos débiles de la mayoría de los CMS, no sólo de Joomla. Todas estas páginas son inofensivas hasta que se indexan por rastreadores. Lo más importante es observar la indexación y sin demora tomar medidas para eliminar estas páginas de los resultados, es mucho mejor pensar sobre la estructura del sitio con antelación y así evitar estas situaciones.

La razón principal de los duplicados es la estructura equivocada del sitio web. En primer lugar, es necesario reflexionar sobre la jerarquía de las categorías y elementos de menú. Si crea varias categorías con antelación esto puede evitar que las páginas duplicadas aparezcan en el futuro.

Vamos a echar un vistazo a la mayoría de los errores más frecuentes. Suponga que tiene la categoría "Noticias", y tiene varias subcategorías -. "Política", "Economía", etc, todas las materias que vinculan directamente a las categorías hijo. Si crea subcategorías de elementos de menú sólo como - "la política", los vínculos pueden ser como sigue (para material):

https://website.com/politics/23-material

https://website.com/1-newsi/politics/23-material

https://website.com/1-newsi/2-politics/23-material

https://website.com/index.php?option=com_content&task=view&id=23&Itemid=1

Y así sucesivamente y así sucesivamente, hay un montón de variantes posibles de la formación de una url, y todo esto sólo serán copias de una sola página. Esto es un ejemplo de cómo se supone que no debe hacerse. Es más, los motores de búsqueda pueden indexar técnicas de copia que están disponibles a través de enlaces "Imprimir", "PDF", "Enviar a un amigo".

Cuando acaba de iniciar un sitio web, necesita pensar sobre su estructura e identificar las principales categorías y subcategorías. Es importante que no se tenga que cambiar la estructura existente cuando crezca esta, que sólo tenga que añadir las categorías o subcategorías adicionales necesarias. La reestructuración de su sitio web en el momento culminante del desarrollo es un duro golpe, que puede durar varios meses. De hecho, algunas páginas (o todas ellas) cambian sus direcciones, lo que conducirá a la reducción inevitable de las posiciones en los resultados de búsqueda y de asistencia.

Así ¿Cómo los motores de búsqueda encuentran las páginas duplicadas?

La causa más común son las extensiones y componentes que los desarrolladores instalan en el sitio web con Joomla.  Un ejemplo - el módulo de noticias en la página principal se puede dar otra dirección. A veces, estos duplicados de página se pueden ver incluso en el mapa del sitio, por ejemplo, si tiene Xmap instalado.

Si el sitio ya está indexado, entonces no es tan difícil encontrar contenido duplicado, sólo tienes que copiar par de entradas únicas de la página e insertar estas, entre comillas, en la búsqueda de Google. Si su sitio no está indexado, se puede intentar con XENU (en caso de que su sitio web no sea muy grande), se encuentran todas las posibilidades en el sitio

¿Por qué necesitamos librarnos de las páginas duplicadas?

A los motores de búsqueda "no les gusta", y tratan de no indexar sitios web que tienen una gran cantidad de páginas idénticas porque su necesidad de búsqueda es de alguna manera cuestionable. Mientras que la optimización de páginas para determinadas palabras clave, las páginas más relevantes si que se seleccionanmás si más si y el contenido está optimizado para los motores de búsqueda. Si las páginas tienen duplicados, durante la actualización de la búscada, puede sustituir páginas relevantes con sus dobles (esto se acompaña con una fuerte caída en las posiciones y hundimientos de tráfico).

6 maneras de deshacerse de las páginas duplicadas

Cada objeto (sitio web) es único, vamos a echar un vistazo a la mayoría de los métodos populares que funcionan perfectamente bien en el 99% de los casos. Siéntase libre de elegir cualquiera de estas opciones o utilizar algunas de ellas en la instalación. Generalmente, estas soluciones se pueden aplicar a cualquier CMS.

Todos estos ejemplos son válidos si ha activado la norma SEF y la URL de redirección en la configuración general de Joomla.

 

1. StyleWare Plugin de Contenido Canonical

El plugin de contenido canonical resuelve el problema con varias direcciones URL de una página individual. Así que si tiene component/content/article/32-something.html y something.html, ambos serán indexados a una URL (something.html). Es un plugin impresionante que hace lo que se supone que ha de hacer.

 

2. Robots.txt para Joomla

Este archivo se incluye en el paquete básico de Joomla en el directorio raíz y se encuentra disponible a través del enlace yourwebsite.com / robots.txt. Da instrucciones a los buscadores sobre cómo será el index de la página. Con su ayuda se pueden cerrar algunas zonas del sitio web. Además, puede utilizar la instrucción siguiente para los datos por defecto en el archivo:

Disallow: /*? #each links that contains this sign will not be indexed *

Sólo es una línea que evita el almacenamiento de gran cantidad de fragmentos, como:

  • partes de la página para imprimir;
  • enlaces a feeds de rss;
  • los resultados de búsqueda en las páginas del sitio;
  • También se cerrará la página de paginación;
  • pueden existir otras opciones, dependiendo de las extensiones utilizadas.

Si se utiliza esta línea * o no, depende de usted. Tenga en cuenta que un archivo de robots demasiado grande se considera con permisos totalmente abiertos. Nota: la línea no debe cubrir algo importante como mapa del sitio, por lo tanto usted puede simplemente añadir Allow: /site_map. Puede leer más sobre mapa del sitio en la ayuda de Google.

 

3. Redireccionamiento 301

El redireccionamiento 301 es apropiado si ha cambiado las URL, pero todavía existen todos los documentos. En este caso, para la vinculación apropiada es necesario utilizar redirección 301 en el .htaccess. Los motores de búsqueda sabrán que el documento se ha trasladado a una nueva dirección. Este método le permite guardar tanto el rendimiento de su sitio web como el PR.

El redireccionamiento 301 se puede utilizar también para la página de doble unión. Un ejemplo muy conocido es el de los duplicados de la página principal de un sitio web Joomla, /index.php y el alias del menú Inicio, como: /home o /homepage, estos artículos se pueden unir muy fácilmente: abrir el archivo htaccess y escribir:

Redirect 301 /index.php http://site.com/

... o puede hacer la redirección 301 en el archivo índex de su plantilla:

<?php
if($_SERVER['REQUEST_URI'] == '/index.php') {
header("Location: /",TRUE,301);
exit();
}
?>

He aquí un ejemplo con clase de una URL del sitio web con y sin www

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.example.com$ [NC]
RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]

* example.com se debe de reemplazar por el nombre de su dominio.

En este blog podrás encontrar más formas de cómo usar redirección 301 (en inglés).

 

4. Robots Meta Tag

Una forma más sobre cómo prevenir duplicados en páginas de indexación - utilizando los robots meta tag:

<meta name="robots" content="noindex"/>

De momento esta opción es mucho mejor para Google, que utilizar las instrucciones de bloqueo en el archivo robots.txt. Por ejemplo, para cerrar la versión de la página para imprimir es necesario tomar la dirección URL, se puede abrir el archivo component.php en la raíz de la plantilla e introduzca la etiqueta ?Tmpl = component en <head> </ head>.

Para cerrar las páginas de resultados de búsqueda que puede utilizar el com_search estándar de la plantilla sólo tiene que añadir en el index.php la condición siguiente:

<?php if ($option == 'com_search') : ?>
<meta name="robots" content="noindex"/>
<?php endif; ?>

Pero en primer lugar es necesario especificar las variables:

$option = JRequest::getVar('option', null);

 

5. Eliminar las direcciones URL en el Panel del Webmaster

 

Una forma más para deshacerse de duplicados es eliminar de forma manual desde el panel de webmaster, de Google — https://www.google.com/webmasters/tools/home?hl=es"

 

6. X-Robots-Tag Titles

Google recomienda utilizar X-Robots-Tag como una alternativa a el 4 º método en este resumen de información.

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...

***

Como se puede ver hay un montón de maneras de cómo eliminar duplicados, aunque es necesario entender cómo funciona cada uno de ellos, para recoger la opción más adecuada para usted..

Artículo original: Duplicate Pages in Joomla: Causes, Most Commons Errors, Solutions
Autor: Alex Bulat
Traducción: Manuel Rubio
Miembro del: Equipo de Marketing y Difusión de Joomla! en español

0
Crear un Grupo de Usuarios de Joomla!
 

Comentarios

¿Ya està registrado? Ingresa Aquí
No hay comentarios por el momento. Sé el primero en enviar un comentario.

By accepting you will be accessing a service provided by a third-party external to https://magazine.joomla.org/