Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

Escaparate de la IA offline: digitalización de documentos

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI

La digitalización de documentos funciona igual de bien con la IA offline. La IA fuera de línea es una IA que se ejecuta localmente y que suele ser mejor que ChatGPT, fácil de usar y barata. Esto incluye el reconocimiento de textos e imágenes, así como búsquedas semánticas en esta información extraída. El escaparate ofrece detalles específicos.

¿Qué es la IA offline?

Puede que algunos entiendan mejor la "IA offline". Sin embargo, la IA sin conexión no tiene nada que ver con OpenAI y otros proveedores externos.

Una Inteligencia Artificial (IA) en línea corre en un propio ordenador. Esto puede ser una hardware comprada o una hardware alquilada. En línea significa que la IA no envía datos a terceros. La IA en línea puede acceder a Internet según sea necesario o comunicarse con otros sistemas de TI.

La AI en línea puede producir resultados significativamente mejores para muchos casos de uso, como la digitalización de documentos, en comparación con ChatGPT y otros servicios en la nube, por ejemplo. En las empresas a menudo se tratan miles de documentos. Los costos en los servicios en la nube suelen ser impredecibles y además caros para muchas solicitudes. La AI en línea ofrece una tarifa de costos razonable. El control total de los datos es un motivo también para no utilizar ChatGPT o Microsoft Azure para muchos.

La IA fuera de línea a menudo puede hacer más que ChatGPT, es más barata y ofrece un control total de los datos y opciones de acceso en línea.

¿Qué significa digitalizar documentos?

La digitalización significa el cambio de información analógica a digital. A menudo se trata del convertir de documentos en papel en imágenes digitales (archivos). Para ello, se escanea o fotografiará el documento en papel. Luego se evalúa la imagen resultante (también cuando se escanea se crea una imagen!).

Un documento del Consejo Europeo de Protección de Datos (CEPD) sirve de ejemplo para mostrar cómo la IA offline puede ayudar en la digitalización de documentos.

Un documento PDF del Consejo Europeo de Protección de Datos (CEPD) como ejemplo (image was automatically translated).

Las imágenes mostradas arriba representan las páginas de un documento PDF. Estas imágenes se crean escaneando o convirtiendo un documento PDF en páginas individuales.

Una vez escaneado (o fotografiado) el documento, se analiza mediante IA offline. Se determina el texto del documento que contiene. Los procesos más avanzados también reconocen las imágenes y su contenido.

La IA sin conexión puede utilizarse incluso para describir imágenes. Aquí tienes una captura de pantalla de una diapositiva sobre el tema de la IA sin conexión.

Imagen de ejemplo para reconocer el contenido de una imagen mediante una IA sin conexión. Tomado de una presentación sobre el tema "Offline-AI" (image was automatically translated).

La IA offline tenía ahora la tarea de describir lo que representa la imagen. He aquí el resultado:

a black and white drawing of a man with horns, ikea manual, as a d & d monster, a an ai generated image

La IA offline también proporciona la traducción al alemán si se solicita:

Un dibujo en blanco y negro de un hombre con cuernos, manual de IKEA, como monstruo de D&D, una ilustración generada por IA

Si necesitas la versión en ucraniano, turco, español, italiano o polaco, la IA offline también puede ayudarte:

  • Ucraniano: Чорно-біле малювання чоловіка з рогами, посібник IKEA, як монстр D&D, а також зображення, згенероване AI
  • Turco: bir adamın kulakları olan siyah ve beyaz bir çizim, ikea kılavuzu, d&d canavarı olarak, bir ai oluşturulmuş görüntü
  • Español: Un dibujo en blanco y negro de un hombre con cuernos, manual de IKEA, como un monstruo de D&D, una imagen generada por inteligencia artificial
  • Italiano: disegno a matita nero e bianco di un uomo con corna, manuale Ikea, come mostro D&D, immagine generata da AI
  • Polaco: rysunek czarno-biały mężczyzny z rogami, instrukcja IKEA, jako potwór D&D, obraz generowany przez AI

Las traducciones se verificaron con el patrón oro anterior, DEEPL, y se reproducen aquí sin cambios.

El siguiente paso podría ser reconocer secciones/bloques.

Secciones reconocidas por la IA en el PDF (image was automatically translated).

Los bloques mostrados en la ilustración se reconocieron y marcaron automáticamente. Sirven de etapa preliminar para un reconocimiento eficaz de la información de texto e imagen.

La siguiente ilustración muestra cuánta información pueden contener estos bloques.

Bloques reconocidos automáticamente con IA en varias páginas de un documento PDF (extracto). Image was automatically translated.

Los fragmentos de texto mostrados fueron reconocidos automáticamente. Al usuario le quedan varias opciones disponibles. Las informaciones pueden ser encontradas tanto en el texto como con búsqueda estricta. La búsqueda estricta determina solo coincidencias para secciones que contienen el término completo de búsqueda. En lugar de un término de búsqueda, también pueden hacerse preguntas al documento. Al usuario sólo le aparecerá la máscara de búsqueda (campo de entrada) y los resultados al final. Las imágenes mostradas anteriormente solo se mostrarán a petición del usuario.

Consulta tus propios documentos: la IA sin conexión no sólo es mejor que ChatGPT, sino también más barata y con un control total de los datos.

También es posible, por ejemplo, encontrar páginas semánticamente similares para una página de documento dada.

En este ejemplo, se han encontrado las páginas que son visualmente similares a una página por defecto (1ª página arriba a la izquierda). En este ejemplo, existe similitud visual si el recuadro con fondo gris también aparece en otras páginas. Es el caso de las páginas 3 a 8 (de izquierda a derecha, de arriba abajo). Como contraejemplo, la página 2 también aparece como página de texto visualmente no similar.

Sin embargo, también se pueden realizar búsquedas semánticas de texto. Así, la búsqueda de documentos y sus páginas puede realizarse eficazmente con IA offline. Por ejemplo, en el documento PDF digitalizado antes mencionado se buscó "datos personales".

Algunos de los éxitos pueden verse aquí:

Documentos encontrados al buscar "datos personales" (image was automatically translated).

Por supuesto, la IA offline puede mostrar los hits directamente como texto. En este ejemplo, los resultados sólo se muestran en forma de capturas de pantalla.

Aquí se muestra un resultado detallado de esta consulta:

Un acierto en detalle: la búsqueda semántica ha compensado la imprecisión y muestra una probabilidad de acierto junto con un marcador en el texto (¡el original es una imagen!). Image was automatically translated.

Sin mayor esfuerzo, también se encontraron aciertos que significan lo mismo pero utilizan una expresión diferente. La IA igualó automáticamente la confusión entre "personal" y "relacionado con la persona". Este ejemplo tan sencillo puede hacerse tan potente como se quiera.

Un ejemplo eficaz de búsqueda semántica es el asistente de preguntas y respuestas para el blog Dr. RGPD descrito en.

Búsqueda por similitud

¿Y si pudieras encontrar las imágenes semánticamente más parecidas para una imagen? Un oso es un oso, un gato es un gato. No importa si el respectivo animal (u objeto, si se trata de otras imágenes) es grande o pequeño, si está a la izquierda o en la parte superior de la imagen o si sólo se ve la cabeza o un plano completo.

El resultado es igualmente impresionante en las páginas de documentos:

Búsqueda hacia atrás: se encuentran las copias visualmente más parecidas de una imagen (aquí: una página de un documento). Image was automatically translated.

A la derecha de la imagen, la página de un documento PDF para la que se buscan páginas similares. A la izquierda en la imagen, las páginas que tienen una similitud visual. La similitud aquí consiste en el flujo de texto, pero sobre todo en el bloque con fondo gris. Si las imágenes fueran visibles en la imagen inicial, se tendrían en cuenta. En cambio, se podrían haber encontrado documentos similares en función del texto que aparece en la imagen. Las posibilidades son infinitas.

Para concluir, un breve ejemplo de que las informaciones también pueden ser reconocidas en imágenes más complejas.

La imagen de entrada es la siguiente. Fue tomada con un teléfono móvil antiguo, en baja resolución y en malas condiciones de iluminación:

Imagen de una parte de un neumático en la que debe reconocerse el texto (image was automatically translated).

La AI offline no entrenada ha reconocido, marcado y extraído las siguientes informaciones en una Dreivierteilsekunde en un portátil:

Información reconocida sobre un neumático, cuadros delimitadores insertados automáticamente (image was automatically translated).

Se reconocieron los detalles del núcleo y se devolvió su posición. Esto permitió reconocer correctamente el número de serie 49865 y casi correctamente el número A055247 (la "A" se reconoció como "4", que también es apenas reconocible para un ser humano).

Como puede ver, algunos detalles no se reconocen. Hay varias soluciones para esto:

  • Gire automáticamente la imagen y vuelva a realizar el reconocimiento
  • Comparación semántica de letras y números con IA fuera de línea y modelo de IA una vez entrenado
  • Modelo de IA entrenado con ejemplos de fotos de neumáticos
  • Si se dispone de muy pocos ejemplos para el entrenamiento: Genere sintéticamente cualquier número de ejemplos con IA offline + métodos convencionales (ruido, rotación de imágenes, reducción de calidad, …)

AI for your company

Your AI can do more than ChatGPT.
Benefits:
  • Powerful and optimizable
  • Full data control
  • Fast proof of concept
  • Inexpensive
Free initial consultation:   Mail

Es es así posible no solo digitalizar documentos de texto (que pueden contener imágenes) con Inteligencia Artificial en Línea, sino también evaluar automáticamente fotos. En particular, esto podría ser interesante para las aseguradoras. Los ejemplos recopilados hasta ahora, a menudo cientos de miles, pueden utilizarse como datos de entrenamiento confidenciales para un sistema de Inteligencia Artificial en Línea. Si no hay suficientes datos de entrenamiento, se puede generar artificialmente dichos datos de entrenamiento. En este caso también se utiliza la Inteligencia Artificial en Línea y ya está ansiosa por ejecutarse durante horas en su servidor mientras disfruta del fin de semana o el descanso del fin de semana.

Conclusión

Con la inteligencia artificial en línea, se pueden digitalizar documentos de diferentes tipos. Los documentos escaneados o fotografiados se analizan con IA. Las informaciones del texto y la imagen se extraen con IA. Por ejemplo, las informaciones extraídas luego se pueden buscar semánticamente, resumir, traducir a una lengua más fácil o otras lenguas traducir.

También es posible realizar una búsqueda de similitudes con imágenes: se encuentran las imágenes más parecidas para una imagen de entrada. Esto se hace desde un punto de vista semántico y no comparando píxeles como se hacía "en el pasado".

Lo único que sigue haciendo falta para digitalizar es un buen escáner o un teléfono móvil con cámara, según la aplicación.

La IA fuera de línea mantiene los datos donde deben estar, es decir, en su empresa. La IA fuera de línea también ofrece la opción de obtener datos de Internet o comunicarse con sus otros sistemas informáticos.

Los resultados para muchos casos de uso son significativamente mejores de lo que ChatGPT puede llegar a ser. El multilingüismo tampoco es un problema, ni siquiera con los diccionarios propios de la empresa. Los términos especializados del sector de los seguros, la medicina o el derecho pueden tenerse debidamente en cuenta.

Mensajes clave

La inteligencia artificial sin conexión (offline) es una herramienta potente y accesible que puede digitalizar documentos de forma eficiente y segura, superando a las opciones en la nube como ChatGPT.

La IA puede analizar documentos, reconocer texto e imágenes, y responder preguntas sobre ellos, incluso sin conexión a internet.

La inteligencia artificial puede entender y extraer información de documentos y imágenes, incluso si son de baja calidad o contienen texto poco claro.

Se puede usar inteligencia artificial para digitalizar documentos de texto e imágenes, extraer información y realizar búsquedas semánticas, incluso con imágenes.

Acerca de

Sobre el autor
Me llamo Klaus Meffert. Soy doctor en informática y llevo más de 30 años dedicándome profesional y prácticamente a las tecnologías de la información. También trabajo como experto en informática y protección de datos. Obtengo mis resultados analizando la tecnología y el Derecho. Esto me parece absolutamente esencial cuando se trata de protección de datos digitales.

IA e inteligencia: ¿los humanos no somos también loros simbólicos?