05/11/2008
Google ha incorporado una nueva función a su buscador, que le permite leer texto en imágenes. Esto permite, entre otras cosas, encontrar documentos escaneados y texto en formato PDF.
En efecto, el buscador ha mejorado considerablemente su función de reconocimiento de imágenes. Los documentos digitalizados y guardados como archivos gráficos aparecerán con mucha mayor frecuencia en los resultados de búsquedas. , y lo mismo ocurrirá con los archivos PDF.
"Anteriormente, los documentos digitalizados rara vez aparecían en la lista de resultados", escribe Evin Levey, gerente de producto en Google, en el blog oficial de la compañía.
"Ocasionalmente había elementos en el documento, que nos permitía indexarlo. Por ejemplo, el nombre del documento. La diferencia es que ahora podremos buscar directamente en todos los archivos PDF. Nuestra función de reconocimiento óptico de caracteres cambia las imágenes en palabras, que son indexadas en el buscador", indica Levey.
La nueva técnica tendrá gran relevancia para el periodismo investigativo y la ciencia, especialmente considerando que las autoridades y los científicos tienen una cierta tendencia a digitalizar documentos.
Encontrado en:
Diario Ti
viernes, 7 de noviembre de 2008
Suscribirse a:
Entradas (Atom)