Últimos comentarios
RSS
Últ. Comentarios
Viernes 31 Mar 2023




Cambios en la página Imprimir E-mail
Página WEB
Escrito por Administrador WEB   
Martes, 27 de Septiembre de 2011 23:30

systeminfo Desde hace algunas semanas la página está sufriendo múltiples ataques por parte de robots de spam. Con el objetivo de intentar asegurar la integridad del sitio y mantenerla limpia del indeseado spam, se han acometido varios cambios que pueden afectar a los usuarios.

Los principales cambios son los siguientes:

- A partir de ahora el registro de nuevos usuarios dispone de un sistema de códigos CAPTCHA.

- El servicio de comentarios en los artículos, que hasta ahora estaba abierto también para los usuarios no registrados, tanto en lectura como en escritura, dejara de estarlo en escritura y solo se podrá leer. Los usuarios que quieran escribir un comentario deberán estar registrados y haber iniciado sesión (logueado). El sistema de votos que tiene cada comentario sigue estando activado para los usuarios no registrados.

Los últimos días también se ha procedido en varias ocasiones a borrar manualmente una treintena de usuarios que habían creado los bots de spam. Es improbable pero podría ser que se hubiera borrado accidentalmente alguno de los usuarios "legales", si es así solo debeis volver a registraros. Si alguien quiere consultar algo puede mandar un mensaje a la administración de la página.

El sistema de CAPTCHA que hemos instalado es reCAPTCHA, un servicio gratuito de Google... y lo siento pero no me puedo resistir a comentar alguna particularidad de su funcionamiento.

Como curiosidad comentar que este servicio de Google ayuda a digitalizar libros y periódicos. ¿Cómo puede ser eso? Unos 200 millones de CAPTCHAs son resueltos por los seres humanos en todo el mundo cada día. Se tarda unos diez segundos en resolver cada uno. Individualmente no es mucho tiempo, pero en conjunto estos pequeños puzzles consumen más de 150.000 horas de trabajo cada día. ¿Y si pudiéramos hacer un uso positivo de este esfuerzo humano? reCAPTCHA hace exactamente eso, canalizando el esfuerzo empleado en la resolución de CAPTCHAs en línea para "leer" libros.

Para archivar el conocimiento humano y para que la información sea más accesible a todo el mundo, múltiples proyectos están digitalizando libros físicos que fueron escritos antes de la era del ordenador. Las páginas del libro se escanean y luego se transforman en texto usando "Optical Character Recognition" (OCR). La transformación en texto es útil porque el escaneado de un libro produce imágenes, que son difíciles de almacenar en dispositivos pequeños, caras para descargar y no se puede buscar texto. El problema es que OCR no es perfecto.

reCAPTCHA mejora el proceso de digitalización de libros mediante el envío a la Web en forma de CAPTCHAs de aquellas palabras que no pueden ser leídas por los ordenadores para que los seres humanos las descifren. Más específicamente, cada palabra que no puede ser leída correctamente por OCR se colocará en una imagen y se utilizará como un CAPTCHA. Pero si un equipo no puede leer este tipo de CAPTCHA, ¿cómo el sistema sabe la respuesta correcta al enigma? He aquí cómo: cada nueva palabra que no puede ser leída correctamente por OCR se le da a un usuario en conjunto con otra palabra para la cual ya se conoce la respuesta. Al usuario se le pide que lea las dos palabras. Si resuelve la palabra cuya respuesta es conocida el sistema asume que también es correcta la respuesta para la nueva. Después el sistema presenta la nueva imagen a otras personas para determinar, con mayor confianza, si la respuesta inicial fue correcta.

 

Lo sentimos, pero debido al aumento de SPAM solo los usuarios registrados están autorizados a añadir comentarios.


Banner