Documento oficial de Google para detectar spam en el buscador

en Noticias de Internet
TU PANEL DE CONTROL:
REGISTRAR
Wilkinsonpc Tienda Productos Servicios Recursos Gratuitos - Gratis Soporte Comunidad
Foros Qubitaria Ayuda de los Foros
Retroceder   Foros Comunidad : Noticias de Actualidad : Noticias de Internet
Noticias de Internet Noticias de Internet Noticias relacionadas directamente con Internet en el mundo

Documento oficial de Google para detectar spam en el buscador

Compartir

En junio de 2005 se comenzaron a tener las primeras noticias del laboratorio de evaluación de búsquedas, en el que personas de todo el mundo (incluidos países como España) contratadas por Google está realizando tareas de evaluación de la calidad de las búsquedas web, y de esta manera entrenar a los nuevos algoritmos que está continuamente creando la compañía para mejorar la calidad del buscador y, entre otras cosas, luchar contra el spam. Estas personas acceden a 'google.com/evaluation' (conocido como 'EWOQ'), en donde tienen un panel de control (ver vídeo) desde el cual realizan las valoraciones de determinadas consultas.

Estos días, en algunos blogs y foros (beussery.com, searchenginewatch.com) se ha tenido acceso a un documento oficial en el cual Google explica a estos colaboradores cómo funciona el panel de control de 'EWOQ', cómo se deben realizar las evaluaciones de las búsquedas, o cómo se deben marcar los sitios web que realizan spam en el buscador web. El documento estuvo disponible esta semana en este enlace, pero ha sido eliminado y durante unas horas lo podréis leer en este link de la caché de Google.

De su lectura, podemos descubrir que los evaluadores de calidad de Google deben entender primero la temática de cada búsqueda y posteriormente calificar cada uno de los enlaces que aparecen en la página de resultados, asignando a cada uno de ellos un valor del siguiente baremo: 'vital' (por ejemplo, es la página oficial de un determinado término buscado), 'useful' (páginas web con contenidos de alta calidad y exhaustivos), 'relevant' (páginas web menos exhaustivas que las 'useful', o que cubran solamente un determinado aspecto de la búsqueda), 'not relevant' (páginas web que, a pesar de que sí tienen que ver con la búsqueda realizada, no son útiles porque por ejemplo tienen información no actualizada), 'off topic' (páginas web que tienen muy poco que ver con la búsqueda realizada).

Además, en caso de que existan problemas técnicos con la página web enlazada, también deben comunicarlo a través de 'EWOQ', calificando el error como 'Page not found' (cuando accedemos a un error 404), 'Site Unavailable' (por ejemplo, el servidor caído), 'Blank page' (páginas completamente vacías), '403 Access Error' (acceso prohibido por ejemplo), 'Login Required' (cuando se nos pide registrarnos en el sitio web para acceder a la información), 'Encoding Error' (problemas con los juegos de caracteres), 'XML / HTML pages' (cuando solamente se ve el código HTML) o 'Server internal error' (cuando, por ejemplo, no funciona la Base de Datos).

Así mismo, los evaluadores deben comunicar a Google cuando se encuentren con páginas, dentro de los resultados, que están practicando spam para intentar engañar al buscador. De esta manera, deberán calificar a cada enlace como 'Not Spam', 'Maybe Spam' (el evaluador tiene sospechas) o 'Spam' (es un claro ejemplo de spam en Google). Para ayudar a estos colaboradores a detectar el spam, el documento oficial incluye en su capítulo 4 una detallada información para identificarlo.

Así, Google asegura que los webmasters que intentan engañar al buscador quieren conseguir tráfico web para de esta manera ganar dinero con la publicidad 'Pay-Per-Click' (PPC) o con programas de afiliados, aunque advierte de que muchos sitios web tienen estos sistemas de ingresos económicos, pero aportan información útil al usuario. Y hace una clasificación de 8 tipos de spam:

:: Páginas PPC. Simplemente se limitan a insertar anuncios de pago por click, pero sin aportar nada de información original al usuario. Pone como ejemplo páginas con búsquedas pero sin resultados (link-ejemplo), los blogs farsa (ver post sobre el tema), o los sitios web que copian literalmente las páginas de la Wikipedia o DMOZ acompañadas de anuncios.

:: Dominios aparcados. No todos, sino solamente aquellos que compran el dominio de un sitio web que en su momento tuvo enlaces de relevancia, que ha conseguido un buen posicionamiento en Google, pero que ahora no aporta nada de información y solamente se limita a mostrar publicidad, en muchas ocasiones con el propio programa de Google "AdSense en dominios 'aparcados'". Se recomienda a los evaluadores utilizar, para saber qué hubo antes en ese dominio, la famosa herramienta 'WayBackMachine'.

:: Meros afiliados. Se trata de sitios web que no ofrecen información original sobre productos, y simplemente son una pasarela para que el usuario pase al sitio web del fabricante del producto, y que copian la información creada por éste. Son generalmente afiliados de sitios populares como Amazon o eBay, aunque se recuerda que los sitios de comparación de precios no pueden ser considerados como spam porque ofrecen información útil. Una búsqueda en la que suelen aparecer muchos sitios web llevando a cabo este tipo de spam es 'oscommerce templates', en la que solamente unos pocos ofrecen plantillas de OsCommerce originales, y el resto se limita a copiar y enlazar.

:: Textos y enlaces ocultos. Es una táctica muy vieja (ver capítulo 'penalizaciones' de nuestro tutorial) y fácilmente detectada por los sistemas automatizados de Google. Sin embargo, se le recomienda a los evaluadores utilizar las opción "Ver código fuente" y "Deshabilitar JavaScript" del navegador web para encontrarlos.

:: Redirecciones JavaScript (también conocido como 'páginas doorway') son también viejos conocidos de los responsables del buscador web de Google.

:: Abuso de palabras clave, con las que el webmaster intenta engañar al buscador insertando keywords que no tienen nada que ver con la temática de la página web. Al evaluador se le recuerda que estas palabras clave excesivas pueden estar ocultas, y que también las puede encontrar en las URLs de las páginas.

:: 100% frame. Son páginas web en las que la totalidad de los contenidos que ve el usuario están insertados dentro de un frame, el cual no es reconocido por Google. De esta manera, Google indexa (y devuelve en sus búsquedas) una determinada información (optimizada para buscadores) y el usuario ve otra.

Fuente: Google Dirson
Compartir
  #1  
Creado: 15-Mar-2008, a las 10:13 Vistas: 795
Categoria: Noticias de Internet
Creado por: Nafer Nafer está desconectado (05-October-2007 | 3.524 Mensajes.)
Respuesta

Etiquetas
buscador, detectar, documento, google, spam


Temas Similares
» Google luchará contra el spam de su buscador 0
» Google luchará contra el spam de su buscador 0
» Chrome Notebook CR-48, así es el prototipo oficial de Google para Chrome OS 0
» Documento revela el gasto de las grandes compañías en Google 0
» Google adquiere Metaweb, compra posiblemente decisiva para su buscador 0
» Google Profiles en los resultados del buscador web para competir con los enlaces 0
» Usan el calendario de Google para distribuir spam hacia Outlook 0
» Blog oficial de Google para desarrolladores en español 0
» Google el buscador mas popular! 0
» Google lanza versión definitiva de buscador interno para el PC 0


Herramientas Buscar en Tema
Buscar en Tema:

Búsqueda Avanzada
Desplegado

Ir al Foro


» ComuniDAD
Inicio
Noticias de Actualidad
Apuntes, Monografias y Tareas
Telefonia, Celulares, TV, GPS, ISP, PDA
Programas Windows, Mac, Linux, etc.
Hardware, Electronica y Redes
Diseño Web y Programacion
Internet y Grandes Portales
Juegos, Consolas y Emuladores
Multimedia, Diseño y Animaciones
Peliculas, Series, Musica, Trailers, Videos, Parodias
Seguridad y Spyware
Salud, Bienestar, Familia y Esparcimiento
Economia, Negocios y Asuntos Legales
Hoteles, Viajes y Turismo
Mundo a Motor [Motos, Autos, etc]
Foros Generales (OFF TOPIC)
Calendario de Eventos
Administracion ComuniDAD



Ultimos Temas


La franja horaria es GMT -5. Ahora son las 01:20.


2010 ©
Powered by : vBulletin® Versión 3.8.8 Copyright ©2000 - 2019, Jelsoft Enterprises Ltd.
SEO by vBSEO 3.2.0
Sitemap 1 - Sitemap 2 - Sitemap 3 - Sitemap 4