Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.

Jetzt testen

sofort das Ergebnis sehen

DSGVO Website-Check
Externe Links sind mit dem Symbol Externer Link Symbol gekennzeichnet. Datenschutzinfo

KI-Wiki für Unternehmen & Behörden

0
Dr. DSGVO Newsletter erkannt: Erweiterte Funktionen verfügbar
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
Standardansicht: Dr. DSGVO Newsletter nicht erkannt. Erweiterte Funktionen nur für Abonnenten:
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
📖 Über dieses Dokument

Dieses Dokument vermittelt Wissen in strukturierter Form. Fachbegriffe werden direkt im Text erklärt – fahren Sie mit der Maus über unterstrichene Begriffe um eine Kurzerklärung zu sehen.

Komplexe Konzepte lassen sich schrittweise vereinfachen: Klicken Sie auf „Einfacher erklären" um eine zugänglichere Darstellung desselben Inhalts zu öffnen – von formaler Fachsprache bis zur anschaulichen Alltagsanalogie.

Definitionen, Theoreme, Algorithmen und Beispiele sind semantisch ausgezeichnet und aufeinander abgestimmt. Das Glossar in der Seitenleiste fasst alle Fachbegriffe des Dokuments alphabetisch zusammen.

Im Präsentationsmodus (⊞) wird jeder Inhaltsblock einzeln angezeigt – geeignet für Vorträge oder konzentriertes Lesen. Navigation per Pfeiltasten oder Klick in den Fortschrittsbalken.

📋 Inhaltsverzeichnis

KI-gestütztes Unternehmens-Wiki: Firmenwissen intelligent befragen statt endlos suchen

Ein KI-gestütztes Unternehmens-Wiki erschliesst Firmendokumente semantisch und beantwortet natürlichsprachliche Fragen präzise mit Quellenverweis. Der Artikel erklärt die RAG-Architektur, beleuchtet die Schwächen von Cloud-KI und zeigt, warum lokale KI datenschutzrechtlich und wirtschaftlich überlegen ist.

Das Problem mit klassischen Dokumentenmanagementsystemen
Ein neuer Mitarbeiter fragt: Wie handhaben wir eigentlich Reklamationen von Kunden aus dem B2B-Segment, die gleichzeitig Rahmenverträge und Einzelbestellungen haben? Die Antwort steckt irgendwo – in einem internen Leitfaden aus 2021, einem aktualisierten Anhang zum CRM-Handbuch und einer archivierten E-Mail-Konversation. Das klassische Dokumentenmanagementsystem liefert Trefferlisten. Eine moderne KI-gestützte Wissensdatenbank liefert die Antwort – präzise, kontextsensitiv, mit direktem Quellenverweis.

Was ist ein KI-Unternehmens-Wiki?

Ein KI-gestütztes Unternehmens-Wiki ist keine klassische Suchmaschine und auch kein starres Dokumentenarchiv. Es ist ein intelligentes System, das firmeneigene Dokumente, Datenbanken und Drittsysteme semantisch erschliesst und auf natürlichsprachliche Fragen präzise antwortet. Das System erkennt, dass Wie eskaliere ich einen Supportfall? und Was mache ich, wenn ein Ticket nicht weitergeht? dieselbe Antwort erfordern, auch wenn kein einziges Wort übereinstimmt.

Der entscheidende Unterschied zu herkömmlichen Suchwerkzeugen: Klassische Volltextsuche findet Dokumente, in denen das gesuchte Wort vorkommt. Das KI-Wiki findet Dokumente, die die gesuchte Bedeutung enthalten – auch wenn der Nutzer andere Wörter verwendet als der Autor des Dokuments. Das ist kein sprachlicher Trick, sondern ein fundamentaler technischer Unterschied, der den Alltag der Wissensarbeit grundlegend verändert.

RAG · Retrieval-Augmented Generation

KI Unternehmens-Wiki –
so funktioniert es

Firmendokumente und Systeme semantisch erschlossen – präzise Antworten mit Quellenverweis, vollständig lokal betrieben.

📄

PDF-Dokumente

Verträge, Berichte, Handbücher

📝

Word / Excel

Protokolle, Tabellen, Notizen

📊

PowerPoint

Präsentationen, Schulungen

🗄️

Datenbanken

SQL, intern, strukturiert

🔗

ERP / CRM

SAP, Salesforce, custom, iTWO

Top-Treffer
AGB_B2B.pdf
0.93
Rahmenvertrag.docx
0.81
Konditionen.xlsx
0.74
🔢

Embedding-Modell

Text → Bedeutungsvektor

🗄️

Vektordatenbank

Semantische Ähnlichkeitssuche

Lokal · 100 % intern
🧠

Sprachmodell (LLM)

Antwort auf Basis der Treffer

Antwort + Quellenverweis

Präzise · Nachvollziehbar · Belegt

💬

Natürliche Sprache

Fragen in Alltagssprache

📌

Quellennachweis

Datei, Seite, Abschnitt

🔒

100 % lokal

Daten verlassen nie das Haus

🏷️

Fachvokabular

Internes Wissen verstehen

⚖️

AI Act konform

Vollständige Transparenz

KI-Wiki für Unternehmen & Behörden.
  • Direkte Antworten statt Trefferlisten: Das System zitiert die relevante Passage aus dem Quelldokument und formuliert eine verständliche Antwort – keine Liste von Dokumenten, die der Nutzer selbst durchsuchen muss.
  • Quellentransparenz: Jede Antwort enthält den Verweis auf das Originaldokument (Dateiname, Seitenangabe). Vertrauen in die Antwort entsteht durch Nachvollziehbarkeit.
  • Firmenspezifisches Vokabular: Interne Begriffe, Produktnamen und Abkürzungen werden verstanden – das System muss nicht auf allgemeines Sprachverständnis beschränkt bleiben.
  • Multiformat-Unterstützung: PDF, Word, Excel, PowerPoint, Textdateien sowie Datenbankanbindungen werden unterstützt. Das Wissen steckt oft in unterschiedlichsten Formaten – das System erschliesst sie alle.
  • Systemintegration: Anbindung an ERP, CRM, Ticketsysteme oder andere Drittsysteme möglich. Das KI-Wiki wird zur zentralen Auskunftsschicht über alle vorhandenen Systeme.
  • Rollenbasierter Zugriff: Der Vertrieb sieht andere Dokumente als die Buchhaltung. Zugriffsrechte aus bestehenden Systemen lassen sich auf die KI-Ebene übertragen.
KI-Wiki ersetzt keine Dokumentenpflege
Das System ist so gut wie seine Quellen. Veraltete, widersprüchliche oder schlecht strukturierte Dokumente liefern entsprechend ungenaue Antworten. Ein KI-Wiki ist ein Werkzeug zur Erschliessung vorhandenen Wissens – kein Ersatz für gepflegte Dokumentationsprozesse.

Wie funktioniert das technisch? Drei Kernkonzepte

Das System basiert auf drei zusammenwirkenden Technologien: einem Large Language Model (LLM), einem Embedding-Modell und einer Vektordatenbank. Das Zusammenspiel dieser Komponenten wird als RAG bezeichnet.

Large Language Model (LLM): Das sprachliche Herzstück

Large Language Model (LLM)
Ein Large Language Model ist ein KI-Modell, das auf grossen Mengen menschlicher Texte trainiert wurde und dadurch gelernt hat, Sprache zu verstehen und zu erzeugen. Im Unternehmens-Wiki ist das LLM ausschliesslich für das Formulieren von Antworten zuständig. Es enthält selbst kein Firmenwissen – das Wissen liegt in den Quelldokumenten und wird zur Laufzeit abgerufen.
LLM ist kein Wissensspeicher
Das LLM enthält selbst kein Firmenwissen. Es ist das Sprachverstehens- und Formulierungswerkzeug. Für den lokalen Unternehmenseinsatz kommen Open-Source-Modelle wie Llama 3, Mistral, Qwen oder Gemma zum Einsatz, die auf normaler Server-Hardware betrieben werden können.

Embeddings und Embedding-Modelle: Wie Bedeutung zur Zahl wird

Embedding
Ein Embedding ist die mathematische Darstellung eines Textstücks als Vektor – eine Liste von mehreren hundert bis tausend Dezimalzahlen. Diese Zahlenreihe kodiert die Bedeutung des Textes, nicht seine Buchstaben. Texte mit ähnlicher Bedeutung erhalten ähnliche Vektoren, die im hochdimensionalen Raum nah beieinanderliegen.
Embedding von Texten
Wie Dokumente zu Vektoren (Zahlenreihen) werden.
Semantische Nähe ohne gemeinsame Wörter
Die Frage Wie lange gilt unsere Gewährleistung? und ein Vertragsabsatz mit dem Text Die gesetzliche Mängelgewährleistung beträgt 24 Monate ab Lieferung teilen kein einziges Wort – liegen aber semantisch sehr nah beieinander. Das Embedding-Modell erkennt diese inhaltliche Nähe und liefert den Vertragsabsatz als Treffer, obwohl eine klassische Schlüsselwortsuche keinen Treffer erzeugt hätte.
Fine-Tuning für firmenspezifisches Vokabular
Embedding-Modelle können auf firmenspezifisches Vokabular feinjustiert werden (Fine-Tuning), sodass interne Abkürzungen, Produktnamen oder Fachbegriffe korrekt eingebettet werden. Das ist besonders dann sinnvoll, wenn das Unternehmen stark von Standardvokabular abweichende Bezeichnungen verwendet.

Vektordatenbank: Das semantische Gedächtnis

Vektordatenbank
Eine Vektordatenbank speichert Embedding-Vektoren und beantwortet Ähnlichkeitsanfragen: Sie findet die gespeicherten Inhalte, die der Bedeutung einer Anfrage am nächsten liegen. Dazu berechnet sie die semantische Ähnlichkeit zwischen dem Anfrage-Vektor und allen gespeicherten Dokumentenvektoren. Bekannte Implementierungen sind pgvector (PostgreSQL-Erweiterung), Qdrant, Weaviate, Chroma und Milvus.
  • Vektor (Embedding): Die numerische Bedeutungsrepräsentation des Textabschnitts.
  • Originaltext (Chunk): Der Quelltext des Abschnitts, der dem LLM als Kontext übergeben wird.
  • Metadaten: Dateiname, Dokumenttyp, Datum, Seitennummer, Zugriffsrechte – Grundlage für Quellentransparenz und rollenbasierten Zugriff.

RAG: Retrieval-Augmented Generation

RAG (Retrieval-Augmented Generation)
RAG beschreibt die Architektur, in der LLM, Embedding-Modell und Vektordatenbank zusammenwirken: Relevante Textabschnitte aus einer Wissensbasis werden zur Laufzeit abgerufen (Retrieval) und dem Sprachmodell als Kontext für die Antwortgenerierung (Generation) übergeben. Das Modell erfindet dabei keine Fakten, sondern formuliert auf Basis der gelieferten Quellen.
RAG
So funktioniert RAG mit einer Vektordatenbank.
💬Nutzer-anfrage① Anfrage🔢Embedding-Modell② Vektorisierung🗄️Vektor-datenbank③ Retrieval🧠LLM④ GenerationAntwort +Quellverweis⑤ Ausgabe
RAG-Ablauf: Von der Nutzeranfrage bis zur quellenbasierten Antwort in fünf Schritten

Welche Dokumente und Datenquellen können eingebunden werden?

Ein modernes KI-Wiki ist nicht auf Dateien beschränkt. Es kann eine breite Palette an Quellen erschliessen – und besonders wertvoll wird es, wenn Informationen aus mehreren Systemen zusammenspielen.

Unterstützte Dokumentenformate und Datenquellen
KategorieBeispiele
DokumentenformatePDF (mit OCR), Word (.docx), Excel (.xlsx), PowerPoint (.pptx), Textdateien, Markdown, HTML, archivierte E-Mails
Relationale DatenbankenPostgreSQL, MySQL, MSSQL
ERP-SystemeSAP, Sage, Navision / Business Central
CRM-SystemeSalesforce, HubSpot, Zoho, Microsoft Dynamics
TicketsystemeJira, Freshdesk, Zendesk
Wikis und IntranetsConfluence, SharePoint
SchnittstellenREST-APIs beliebiger Drittsysteme
Semantische Konsolidierung über Systemgrenzen hinweg
Besonders wertvoll wird das System, wenn Daten aus verschiedenen Quellen zusammenfliessen. Ein Mitarbeiter fragt: Was hat Kunde Müller GmbH bei uns gekauft, welche offenen Tickets gibt es und was steht in unserem letzten Gesprächsprotokoll? Ohne KI-Konsolidierung wären dafür drei Systeme zu öffnen. Das KI-Wiki beantwortet diese Frage aus einer Oberfläche – weil es ERP, CRM und Dokumentenarchiv semantisch vereint. Auch wenn dasselbe Konzept in verschiedenen Systemen unterschiedlich benannt ist (ERP: Debitor, CRM: Kunde, Vertrag: Auftraggeber), erkennt das System die inhaltliche Gleichheit.

Warum Cloud-KI bei tausenden Dokumenten scheitert

Wer ein Unternehmens-Wiki auf Basis von Cloud-KI-Diensten aufbauen möchte, stösst schnell an strukturelle Grenzen – nicht nur technische, sondern auch wirtschaftliche und rechtliche.

Das Token-Problem: Was sind Token und warum kosten sie Geld?

Token
Ein Token ist die kleinste Verarbeitungseinheit eines Sprachmodells. Grob entspricht ein Token etwa 0,75 Wörtern im Englischen. Cloud-KI-Dienste rechnen sowohl eingehende Anfragen (Input-Token: System-Prompt, Kontext, Nutzerfrage) als auch ausgehende Antworten (Output-Token) ab. Bei RAG-Anwendungen ist der Kontext besonders umfangreich, da gefundene Dokumentenabschnitte vollständig übergeben werden.
Beispielrechnung: Token-Kosten bei 50 Mitarbeitern
Eine RAG-Anfrage mit 4.000 Input-Token und 500 Output-Token kostet bei einem aktuellen Cloud-Standardmodell (ca.-Werte 2025) ungefähr 1,4 Cent. Bei 50 Mitarbeitern mit je 20 Anfragen täglich sind das 1.000 Anfragen pro Tag – rund 14 Euro täglich oder ca. 3.500 Euro pro Jahr. Premium-Modelle liegen deutlich höher, sodass die Jahreskosten schnell in den fünfstelligen Bereich steigen.

Weitere Skalierungsprobleme

  • Kontextfenster-Grenzen: Auch bei grossen Kontextfenstern (128k Token) lässt die Qualität bei sehr langen Kontexten nach – bekannt als Lost-in-the-Middle-Phänomen.
  • Rate Limits: API-Anfragen werden gedrosselt; bei parallelen Nutzern entstehen Wartezeiten.
  • Datensouveränität: Dokumente verlassen das Unternehmen – mit allen datenschutzrechtlichen Konsequenzen.
  • Vendor Lock-in: Ändert der Anbieter Preise, Modelle oder AGB, ist das gesamte System betroffen.
Unkontrollierbare Modell-Updates
Anbieter wie OpenAI, Google oder Anthropic aktualisieren ihre Modelle regelmässig – auch durch stille Verbesserungen im Hintergrund. Als Kunde haben Sie darauf keinen Einfluss. Sorgfältig abgestimmtes Antwortverhalten kann nach einem Update plötzlich anders sein. Ältere Modellversionen werden deprecated und laufen aus. Bei lokaler KI liegt die Entscheidung über Updates vollständig beim Unternehmen.

Lokale KI: Datensicherheit als struktureller Vorteil

Lokal meint in diesem Kontext nicht zwingend den eigenen Serverraum. Es meint: Die KI-Infrastruktur läuft in einer Umgebung, die vollständig unter der Kontrolle des Unternehmens steht – ob on-premises, auf einer dedizierten VM beim Hosting-Anbieter oder in einer Private Cloud mit klarer Datentrennung. Kein Token der Firmendokumente wird an externe APIs gesendet.

Lokale KI vs. Cloud-KI
Cloud-KI
Einfacher Einstieg, keine Infrastruktur nötig. Kosten steigen linear mit Nutzung und sind schlecht planbar. Daten verlassen das Unternehmen. Modell-Updates durch Anbieter unkontrollierbar. Vendor Lock-in. DSGVO-Konformität erfordert AVV-Prüfung und Drittlandtransfer-Analyse.
Lokale KI
Höherer initialer Aufwand, dann fixe und planbare Infrastrukturkosten. Keine variablen Token-Kosten. Daten verbleiben vollständig im Unternehmen. Update-Entscheidungen liegen beim Unternehmen. Keine Abhängigkeit von Drittanbietern. DSGVO-Konformität ist architekturbedingt erfüllt.

DSGVO-Konformität ohne Kompromisse

Wer Firmendokumente an Cloud-KI-Dienste sendet, muss sich intensiv mit Auftragsverarbeitung (Art. 28 DSGVO) befassen sowie den Drittlandtransfer nach Art. 44 ff. DSGVO prüfen. Bei lokaler KI entfallen diese Fragen strukturell: Es gibt keinen Auftragsverarbeiter, keinen Drittlandtransfer und keine Nutzung für Modelltraining.

DSGVO-Konformität als Architekturmerkmal
Bei lokaler KI ist DSGVO-Konformität nicht das Ergebnis sorgfältiger Vertragsprüfung – sie ist das Ergebnis der Architektur. Es gibt schlicht keine Drittpartei, die Daten erhält. Für viele Branchen ist das nicht nur ein Vorteil, sondern eine Voraussetzung.
  • Kanzleien und steuerberatende Berufe (Mandantendaten, Berufsgeheimnis)
  • Medizinische Einrichtungen (Gesundheitsdaten nach Art. 9 DSGVO)
  • Unternehmen mit Betriebs- und Geschäftsgeheimnissen (§ 2 GeschGehG)
  • Öffentliche Stellen und Behörden
  • Unternehmen mit ISO 27001 oder ähnlichen Zertifizierungen
Know-how-Schutz nach GeschGehG
Firmenwissen ist ein Wettbewerbsvorteil. Preiskalkulationen, Entwicklungsdokumentationen, Kundenstrategien und interne Prozessbeschreibungen sind nach dem Gesetz zum Schutz von Geschäftsgeheimnissen (GeschGehG) schützenswert. Lokale KI eliminiert das Risiko einer unkontrollierten Weitergabe vollständig.
Lückenlose Revision und Auditierbarkeit
Bei lokaler KI ist vollständig dokumentierbar: Welche Dokumente wurden indexiert, wer hat welche Anfrage gestellt, welche Textabschnitte wurden für welche Antwort verwendet und welche Modellversion hat die Antwort generiert. Diese Nachvollziehbarkeit ist für Compliance-Anforderungen, interne Audits oder im Fall einer Datenschutzprüfung unschätzbar wertvoll. Cloud-Dienste bieten häufig keine vergleichbare Transparenz.

EU AI Act: Lokale KI macht Compliance leichter

Der EU AI Act (Verordnung (EU) 2024/1689) tritt seit August 2024 schrittweise in Kraft und reguliert KI-Systeme nach Risikoklassen. Für ein Unternehmens-Wiki sind vor allem Transparenzpflichten und – bei hochrisikorelevanten Bereichen wie HR-Entscheidungsunterstützung oder kritischer Infrastruktur – Konformitätsdokumentation relevant.

  • Erklärbarkeit strukturell erfüllt: Antworten basieren auf nachweisbaren Quelltexten. Die verwendeten Dokumentenabschnitte sind protokollierbar, das eingesetzte Modell ist bekannt und unveränderlich.
  • Konformitätsdokumentation vollständig möglich: Modellname und -version, Trainingsgrundlage, verarbeitete Datenkategorien sowie Zugriffsberechtigungen und Protokollierung sind bei lokaler KI vollständig dokumentierbar – bei Cloud-Diensten oft nicht.
  • Keine stillen Modell-Wechsel: Bei Cloud-Diensten kann der Anbieter das zugrunde liegende Modell jederzeit wechseln. Bei lokaler KI bleibt das Modell stabil – Updates werden geplant, getestet und kontrolliert eingespielt.

Praxisbeispiele: Wer profitiert besonders?

Branchen und Anwendungsfälle
Mittelständische Produktionsunternehmen
Technische Dokumentationen, Wartungsanleitungen, Zertifikate und Qualitätsprotokolle sind oft über Jahre gewachsen und schwer zu durchsuchen. Das KI-Wiki macht dieses Wissen sofort zugänglich – auch für neue Mitarbeiter in der Produktion, ohne Einarbeitungszeit in komplexe Ablagesysteme.
Kanzleien und Beratungsunternehmen
Urteile, Gutachten, Musterverträge und interne Präzedenzfälle bilden einen enormen Wissensschatz. Der schnelle, präzise Zugriff ohne manuelle Suche spart täglich wertvolle Zeit – und reduziert das Risiko, relevante Präzedenzfälle zu übersehen.
Handel und Vertrieb
Produktdatenblätter, Preislisten, Lieferbedingungen und Kundenverträge in einem semantisch durchsuchbaren System – der Vertrieb findet jede Information in Sekunden, auch im laufenden Kundengespräch, ohne das Gespräch unterbrechen zu müssen.
Öffentliche Verwaltung
Verwaltungsvorschriften, Bescheide, interne Leitfäden und Gesetzestexte sind komplex und zahlreich. KI-gestützte Suche entlastet Sachbearbeiter, reduziert Fehler und verkürzt die Einarbeitungszeit neuer Mitarbeiter erheblich.
HR und People Management
Arbeitsverträge, Betriebsvereinbarungen, Onboarding-Unterlagen und Schulungsmaterial – das KI-Wiki beantwortet Mitarbeiterfragen schnell und konsistent, auch ausserhalb der HR-Sprechzeiten. Standardanfragen werden automatisch beantwortet, HR-Teams können sich auf komplexere Anliegen konzentrieren.
IT-Abteilungen und Support
Systemdokumentationen, Konfigurationsanleitungen, bekannte Fehlerlösungen und Eskalationsprozesse sind oft über verschiedene Systeme verstreut. Das KI-Wiki konsolidiert dieses Wissen und macht es für alle Supportmitarbeiter sofort abrufbar – besonders wertvoll bei personellen Wechseln oder Urlaubsvertretungen.

Implementierung: Was ist zu beachten?

Der Aufbau eines KI-Unternehmens-Wiki ist kein Standardprojekt von der Stange. Die folgenden Überlegungen helfen, typische Fehler zu vermeiden und den Aufwand realistisch einzuschätzen.

Für viele mittelständische Szenarien reicht pgvector als PostgreSQL-Erweiterung als Vektordatenbank vollkommen aus – ohne zusätzliche Infrastruktur. So wird die Erweiterung installiert und aktiviert.
Mit einem Pilotbereich starten
Es empfiehlt sich, das KI-Wiki zunächst für einen klar abgegrenzten Dokumentenbereich einzuführen – z. B. das HR-Onboarding oder die technische Produktdokumentation. Dort lässt sich die Qualität gut beurteilen und das System iterativ verbessern, bevor der gesamte Dokumentenbestand eingebunden wird.

Fazit

Wissen ist das wertvollste Asset eines Unternehmens. Lokale KI ist nicht die Kompromisslösung – sie ist die bessere Wahl.

Ein KI-gestütztes Unternehmens-Wiki ist keine Science-Fiction und kein Luxus für Grosskonzerne. Die Kombination aus RAG-Architektur, lokalem LLM und Vektordatenbank liefert das Beste aus beiden Welten: die Intelligenz moderner KI und die vollständige Kontrolle über die eigenen Daten. Cloud-KI mag für einzelne Experimente praktisch sein – für unternehmensweiten, dokumentenintensiven Einsatz ist sie zu teuer, zu intransparent und zu riskant. Ihr Wissen bleibt bei Ihnen. Und es wird endlich so zugänglich, wie es sein sollte.

Interesse an einem eigenen KI-Wiki?
Wir konzipieren und implementieren KI-gestützte Wissensdatenbanken für mittelständische Unternehmen – lokal, datenschutzkonform und ohne laufende Token-Kosten.
Quellen und weiterführende Links
[DSGVO Art. 28]
Europäisches Parlament, Rat der Europäischen Union (2016). Datenschutz-Grundverordnung – Art. 28 Auftragsverarbeiter. dr-dsgvo.de. https://dr-dsgvo.de/artikel-28-dsgvo-gesetz-auftragsverarbeiter/
[EU AI Act 2024]
Europäisches Parlament, Rat der Europäischen Union (2024). Verordnung (EU) 2024/1689 über künstliche Intelligenz (AI Act). Amtsblatt der Europäischen Union. https://eur-lex.europa.eu/legal-content/DE/TXT/?uri=CELEX:32024R1689
[GeschGehG 2019]
Bundesrepublik Deutschland (2019). Gesetz zum Schutz von Geschäftsgeheimnissen (GeschGehG). Bundesgesetzblatt. https://www.gesetze-im-internet.de/geschgehg/
[Es et al. 2023]
Shahul Es, Jithin James, Luis Espinosa-Anke, Steven Schockaert (2023). RAGAS: Automated Evaluation of Retrieval Augmented Generation. arXiv Preprint. DOI: 10.48550/arXiv.2309.15217. https://arxiv.org/abs/2309.15217
[pgvector]
Andrew Kane. pgvector – Open-source vector similarity search for Postgres. GitHub. https://github.com/pgvector/pgvector
Open-Source-Projekt, aktiv gepflegt
📚 Glossar
  • Auftragsverarbeitung (Art. 28 DSGVO)
    Rechtliche Anforderung, wenn ein Unternehmen personenbezogene Daten durch einen Dritten verarbeiten lässt. Erfordert einen schriftlichen Auftragsverarbeitungsvertrag (AVV).
  • Chunks
    Textabschnitte, in die ein Dokument für die Indexierung aufgeteilt wird. Die optimale Grösse hängt vom Dokumenttyp ab – typisch sind 300 bis 800 Wörter mit Überlappung.
  • deprecated
    Abkündigung: Der Anbieter stellt den Betrieb einer Modellversion zu einem festgelegten Datum ein. Kunden müssen migrieren, ob sie wollen oder nicht.
  • Drittlandtransfer nach Art. 44 ff. DSGVO
    Übermittlung personenbezogener Daten in Länder ausserhalb der EU/des EWR (z. B. USA, UK), die gesondert gerechtfertigt werden muss.
  • Embedding-Modell
    Wandelt Text in einen hochdimensionalen Zahlenvektor um, der die semantische Bedeutung des Textes kodiert.
    Definition ansehen ↗
  • EU AI Act (Verordnung (EU) 2024/1689)
    EU-weite KI-Verordnung, die seit August 2024 schrittweise in Kraft tritt. Sie reguliert KI-Systeme nach Risikoklassen und stellt Transparenz- und Dokumentationspflichten.
  • Large Language Model (LLM)
    Ein KI-Modell, das auf enormen Mengen menschlicher Texte trainiert wurde und Sprache verstehen sowie erzeugen kann.
    Definition ansehen ↗
  • Private Cloud
    Cloud-Umgebung, die ausschliesslich für ein Unternehmen betrieben wird – im Gegensatz zur Public Cloud, bei der Infrastruktur geteilt wird.
  • RAG
    Retrieval-Augmented Generation – Architekturmuster, bei dem ein LLM zur Antwortgenerierung relevante Textabschnitte aus einer Wissensbasis abruft.
    Definition ansehen ↗
  • RAGAS
    Retrieval-Augmented Generation Assessment – Framework zur systematischen Messung der Qualität von RAG-Systemen anhand von Metriken wie Faithfulness, Answer Relevancy und Context Recall.
  • semantisch erschliesst
    Bedeutungsbasierte Verarbeitung von Text – das System versteht den Sinn einer Frage, nicht nur ihre Schlüsselwörter.
  • semantische Ähnlichkeit
    Gemessen z. B. als Cosine Similarity – der Winkel zwischen zwei Vektoren im Vektorraum. Ein Winkel von 0° bedeutet identische Bedeutung, 90° bedeutet unverwandt.
  • Vektordatenbank
    Spezialdatenbank zum Ablegen und effizienten Suchen von Embedding-Vektoren nach semantischer Ähnlichkeit.
    Definition ansehen ↗

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

  • Erstberatung inkl. Machbarkeitsaussagen
  • Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
  • KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de

Wer schreibt hier?
Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die IT Logic GmbH, berät Kunden und bietet Webseiten-Checks sowie optimierte & sichere Lösungen an (mit und ohne KI).
Bitte nutzen Sie bei Verwendung meiner Ergebnisse die Quellenangabe oder verlinken Sie gut wahrnehmbar auf diesen Artikel:
Quelle: Klaus Meffert, Dr. DSGVO Blog, Link: https://dr-dsgvo.de/ki-wiki-fuer-unternehmen-behoerden
Einen Kurzlink oder eine Bestätigung für Ihre Quellenangabe erhalten Sie kurzfristig auf Anfrage. Ein Teilen oder Verteilen dieses Beitrags ist natürlich ohne weiteres möglich und gewünscht.

Schreiben Sie einen Kommentar

Ihre Mail-Adresse wird nicht veröffentlicht.

Kassenbons automatisch auswerten: Wie KI und OCR zusammenarbeiten