La digitalización de documentos funciona igual de bien con la IA offline. La IA fuera de línea es una IA que se ejecuta localmente y que suele ser mejor que ChatGPT, fácil de usar y barata. Esto incluye el reconocimiento de textos e imágenes, así como búsquedas semánticas en esta información extraída. El escaparate ofrece detalles específicos.
¿Qué es la IA offline?
Puede que algunos entiendan mejor la "IA offline". Sin embargo, la IA sin conexión no tiene nada que ver con OpenAI y otros proveedores externos.
Una Inteligencia Artificial (IA) en línea corre en un propio ordenador. Esto puede ser una hardware comprada o una hardware alquilada. En línea significa que la IA no envía datos a terceros. La IA en línea puede acceder a Internet según sea necesario o comunicarse con otros sistemas de TI.
La AI en línea puede producir resultados significativamente mejores para muchos casos de uso, como la digitalización de documentos, en comparación con ChatGPT y otros servicios en la nube, por ejemplo. En las empresas a menudo se tratan miles de documentos. Los costos en los servicios en la nube suelen ser impredecibles y además caros para muchas solicitudes. La AI en línea ofrece una tarifa de costos razonable. El control total de los datos es un motivo también para no utilizar ChatGPT o Microsoft Azure para muchos.
La IA fuera de línea a menudo puede hacer más que ChatGPT, es más barata y ofrece un control total de los datos y opciones de acceso en línea.
¿Qué significa digitalizar documentos?
La digitalización significa el cambio de información analógica a digital. A menudo se trata del convertir de documentos en papel en imágenes digitales (archivos). Para ello, se escanea o fotografiará el documento en papel. Luego se evalúa la imagen resultante (también cuando se escanea se crea una imagen!).
Un documento del Consejo Europeo de Protección de Datos (CEPD) sirve de ejemplo para mostrar cómo la IA offline puede ayudar en la digitalización de documentos.

Las imágenes mostradas arriba representan las páginas de un documento PDF. Estas imágenes se crean escaneando o convirtiendo un documento PDF en páginas individuales.
Una vez escaneado (o fotografiado) el documento, se analiza mediante IA offline. Se determina el texto del documento que contiene. Los procesos más avanzados también reconocen las imágenes y su contenido.
La IA sin conexión puede utilizarse incluso para describir imágenes. Aquí tienes una captura de pantalla de una diapositiva sobre el tema de la IA sin conexión.

La IA offline tenía ahora la tarea de describir lo que representa la imagen. He aquí el resultado:
a black and white drawing of a man with horns, ikea manual, as a d & d monster, a an ai generated image
La IA offline también proporciona la traducción al alemán si se solicita:
Un dibujo en blanco y negro de un hombre con cuernos, manual de IKEA, como monstruo de D&D, una ilustración generada por IA
Si necesitas la versión en ucraniano, turco, español, italiano o polaco, la IA offline también puede ayudarte:
- Ucraniano: Чорно-біле малювання чоловіка з рогами, посібник IKEA, як монстр D&D, а також зображення, згенероване AI
- Turco: bir adamın kulakları olan siyah ve beyaz bir çizim, ikea kılavuzu, d&d canavarı olarak, bir ai oluşturulmuş görüntü
- Español: Un dibujo en blanco y negro de un hombre con cuernos, manual de IKEA, como un monstruo de D&D, una imagen generada por inteligencia artificial
- Italiano: disegno a matita nero e bianco di un uomo con corna, manuale Ikea, come mostro D&D, immagine generata da AI
- Polaco: rysunek czarno-biały mężczyzny z rogami, instrukcja IKEA, jako potwór D&D, obraz generowany przez AI
Las traducciones se verificaron con el patrón oro anterior, DEEPL, y se reproducen aquí sin cambios.
El siguiente paso podría ser reconocer secciones/bloques.

Los bloques mostrados en la ilustración se reconocieron y marcaron automáticamente. Sirven de etapa preliminar para un reconocimiento eficaz de la información de texto e imagen.
La siguiente ilustración muestra cuánta información pueden contener estos bloques.

Los fragmentos de texto mostrados fueron reconocidos automáticamente. Al usuario le quedan varias opciones disponibles. Las informaciones pueden ser encontradas tanto en el texto como con búsqueda estricta. La búsqueda estricta determina solo coincidencias para secciones que contienen el término completo de búsqueda. En lugar de un término de búsqueda, también pueden hacerse preguntas al documento. Al usuario sólo le aparecerá la máscara de búsqueda (campo de entrada) y los resultados al final. Las imágenes mostradas anteriormente solo se mostrarán a petición del usuario.
Consulta tus propios documentos: la IA sin conexión no sólo es mejor que ChatGPT, sino también más barata y con un control total de los datos.
También es posible, por ejemplo, encontrar páginas semánticamente similares para una página de documento dada.
En este ejemplo, se han encontrado las páginas que son visualmente similares a una página por defecto (1ª página arriba a la izquierda). En este ejemplo, existe similitud visual si el recuadro con fondo gris también aparece en otras páginas. Es el caso de las páginas 3 a 8 (de izquierda a derecha, de arriba abajo). Como contraejemplo, la página 2 también aparece como página de texto visualmente no similar.
Sin embargo, también se pueden realizar búsquedas semánticas de texto. Así, la búsqueda de documentos y sus páginas puede realizarse eficazmente con IA offline. Por ejemplo, en el documento PDF digitalizado antes mencionado se buscó "datos personales".
Algunos de los éxitos pueden verse aquí:

Por supuesto, la IA offline puede mostrar los hits directamente como texto. En este ejemplo, los resultados sólo se muestran en forma de capturas de pantalla.
Aquí se muestra un resultado detallado de esta consulta:

Sin mayor esfuerzo, también se encontraron aciertos que significan lo mismo pero utilizan una expresión diferente. La IA igualó automáticamente la confusión entre "personal" y "relacionado con la persona". Este ejemplo tan sencillo puede hacerse tan potente como se quiera.
Un ejemplo eficaz de búsqueda semántica es el asistente de preguntas y respuestas para el blog Dr. RGPD descrito en.
Búsqueda por similitud
¿Y si pudieras encontrar las imágenes semánticamente más parecidas para una imagen? Un oso es un oso, un gato es un gato. No importa si el respectivo animal (u objeto, si se trata de otras imágenes) es grande o pequeño, si está a la izquierda o en la parte superior de la imagen o si sólo se ve la cabeza o un plano completo.
El resultado es igualmente impresionante en las páginas de documentos:

A la derecha de la imagen, la página de un documento PDF para la que se buscan páginas similares. A la izquierda en la imagen, las páginas que tienen una similitud visual. La similitud aquí consiste en el flujo de texto, pero sobre todo en el bloque con fondo gris. Si las imágenes fueran visibles en la imagen inicial, se tendrían en cuenta. En cambio, se podrían haber encontrado documentos similares en función del texto que aparece en la imagen. Las posibilidades son infinitas.
Para concluir, un breve ejemplo de que las informaciones también pueden ser reconocidas en imágenes más complejas.
La imagen de entrada es la siguiente. Fue tomada con un teléfono móvil antiguo, en baja resolución y en malas condiciones de iluminación:

La AI offline no entrenada ha reconocido, marcado y extraído las siguientes informaciones en una Dreivierteilsekunde en un portátil:

Se reconocieron los detalles del núcleo y se devolvió su posición. Esto permitió reconocer correctamente el número de serie 49865 y casi correctamente el número A055247 (la "A" se reconoció como "4", que también es apenas reconocible para un ser humano).
Como puede ver, algunos detalles no se reconocen. Hay varias soluciones para esto:
- Gire automáticamente la imagen y vuelva a realizar el reconocimiento
- Comparación semántica de letras y números con IA fuera de línea y modelo de IA una vez entrenado
- Modelo de IA entrenado con ejemplos de fotos de neumáticos
- Si se dispone de muy pocos ejemplos para el entrenamiento: Genere sintéticamente cualquier número de ejemplos con IA offline + métodos convencionales (ruido, rotación de imágenes, reducción de calidad, …)
AI for your company
- Powerful and optimizable
- Full data control
- Fast proof of concept
- Inexpensive
Es es así posible no solo digitalizar documentos de texto (que pueden contener imágenes) con Inteligencia Artificial en Línea, sino también evaluar automáticamente fotos. En particular, esto podría ser interesante para las aseguradoras. Los ejemplos recopilados hasta ahora, a menudo cientos de miles, pueden utilizarse como datos de entrenamiento confidenciales para un sistema de Inteligencia Artificial en Línea. Si no hay suficientes datos de entrenamiento, se puede generar artificialmente dichos datos de entrenamiento. En este caso también se utiliza la Inteligencia Artificial en Línea y ya está ansiosa por ejecutarse durante horas en su servidor mientras disfruta del fin de semana o el descanso del fin de semana.
Conclusión
Con la inteligencia artificial en línea, se pueden digitalizar documentos de diferentes tipos. Los documentos escaneados o fotografiados se analizan con IA. Las informaciones del texto y la imagen se extraen con IA. Por ejemplo, las informaciones extraídas luego se pueden buscar semánticamente, resumir, traducir a una lengua más fácil o otras lenguas traducir.
También es posible realizar una búsqueda de similitudes con imágenes: se encuentran las imágenes más parecidas para una imagen de entrada. Esto se hace desde un punto de vista semántico y no comparando píxeles como se hacía "en el pasado".
Lo único que sigue haciendo falta para digitalizar es un buen escáner o un teléfono móvil con cámara, según la aplicación.
La IA fuera de línea mantiene los datos donde deben estar, es decir, en su empresa. La IA fuera de línea también ofrece la opción de obtener datos de Internet o comunicarse con sus otros sistemas informáticos.
Los resultados para muchos casos de uso son significativamente mejores de lo que ChatGPT puede llegar a ser. El multilingüismo tampoco es un problema, ni siquiera con los diccionarios propios de la empresa. Los términos especializados del sector de los seguros, la medicina o el derecho pueden tenerse debidamente en cuenta.
Mensajes clave
La inteligencia artificial sin conexión (offline) es una herramienta potente y accesible que puede digitalizar documentos de forma eficiente y segura, superando a las opciones en la nube como ChatGPT.
La IA puede analizar documentos, reconocer texto e imágenes, y responder preguntas sobre ellos, incluso sin conexión a internet.
La inteligencia artificial puede entender y extraer información de documentos y imágenes, incluso si son de baja calidad o contienen texto poco claro.
Se puede usar inteligencia artificial para digitalizar documentos de texto e imágenes, extraer información y realizar búsquedas semánticas, incluso con imágenes.



Me llamo Klaus Meffert. Soy doctor en informática y llevo más de 30 años dedicándome profesional y prácticamente a las tecnologías de la información. También trabajo como experto en informática y protección de datos. Obtengo mis resultados analizando la tecnología y el Derecho. Esto me parece absolutamente esencial cuando se trata de protección de datos digitales.
