×

Recaptcha – Digitalización de textos, digitalizar libros viejos

Más de una vez habremos tenido que rellenar esos pequeños y fastidiosos cuadraditos con letras distorsionadas o borrosas que sirven para probar que no somos máquinas.El sistema es conocido como Captcha y el sistema fue creado para acabar con los programas automatizados que generan spam.Actualmente una de sus versiones más populares es el ReCaptcha, que pide a los navegantes que identifiquen dos palabras antes de por ejemplo registrarse en una web, modificar los datos o iniciar una descarga.Se calcula que se realizan a diario alrededor de 200 millones de ReCaptchas en todo el mundo.Si tenemos en cuenta que para resolver cada uno de ellos son necesarios unos 10 segundos, se invierten unas 150.000 horas en estas operación.¿Cómo convertirlo en algo útil?Luisvon Ahn, uno de los responsables de ReCaptcha, tuvo la brillante idea.Entre los grandes objetivos de hoy en día esta conseguir la digitalización de todos los libros y documentos creados antes de la era virtual.La forma más simple de hacerlo es a través del escaneo y el procesamiento de cada página para identificar su contenido pero las maquinas no siempre son capaces de interpretar todas las palabras en este tipo de documentos tan viejos.Solamente un ser humano lo puede hacer correctamente.Es aquí donde entra en juego la participación de los usuarios.¿Por qué no aprovechar los miles de usuarios que completan ReCaptcha para digitalizar libros viejos?Si utilizamos el tiempo que cada navegante gasta en resolver un Captcha para a la vez a digitalizar libros matamos dos pájaros de un tiro.¿Cómo se hace? La herramienta le presenta a los usuarios dos palabras, una que reconoce y otra que no.Primero el navegante tiene que ingresar correctamente la palabra que el sistema ya logró identificar, y si lo hace bien se pasa a una segunda etapa en la que el usuario debe reconocer el término que la herramienta aún no ha descifrado y ahí sí, hacer un verdadero trabajo útil.De esta manera, la comunidad online trabaja en la digitalización de textos sin ni siquiera saberlo.

Lea También