Was ist ein KI-Unternehmens-Wiki und wie unterscheidet es sich von herkömmlichen Suchmaschinen?

Ein KI-Unternehmens-Wiki ist ein intelligentes System, das firmeneigene Dokumente semantisch erschließt und auf natürlichsprachliche Fragen präzise antwortet. Im Gegensatz zu Suchmaschinen, die nur nach Schlüsselwörtern suchen, versteht das Wiki die Bedeutung der Frage und liefert eine Antwort mit Quellenverweis.

Welche Vorteile bietet ein lokales KI-Wiki gegenüber Cloud-basierten Lösungen?

Ein lokales KI-Wiki bietet datenschutzrechtliche Vorteile, da die Daten nicht das Unternehmen verlassen. Zudem ermöglicht es eine vollständige Kontrolle über die Infrastruktur und trägt zur Einhaltung von Vorschriften wie der DSGVO und dem EU AI Act bei.

Wie funktioniert die Retrieval-Augmented Generation (RAG)-Architektur im KI-Wiki?

Die RAG-Architektur kombiniert ein Sprachmodell (LLM) mit einer Vektordatenbank. Das LLM nutzt die Vektordatenbank, um relevante Dokumente zu finden und eine präzise Antwort zu generieren, die mit dem Originaldokument verknüpft ist und somit eine hohe Quellentransparenz gewährleistet.

Welche Arten von Dokumenten kann das KI-Wiki verarbeiten?

Das KI-Wiki unterstützt eine Vielzahl von Dokumentenformaten, darunter PDF, Word, Excel, PowerPoint sowie Textdateien und Datenbanken. Es ist so konzipiert, dass es Wissen aus unterschiedlichsten Quellen erschließt.

Wie funktioniert die Technologie hinter dem KI-Wiki?

Das KI-Wiki basiert auf der RAG-Architektur, die ein Large Language Model (LLM), ein Embedding-Modell und eine Vektordatenbank kombiniert. Diese Komponenten arbeiten zusammen, um relevante Informationen aus der Wissensbasis abzurufen und zu generieren.

Welche Datenquellen können neben Dokumenten integriert werden?

Neben klassischen Dokumentenformaten kann das KI-Wiki auch Daten aus ERP-, CRM-, Ticketsystemen und sogar über REST-APIs von Drittsystemen integrieren. Dies ermöglicht eine umfassende Konsolidierung von Informationen.

Warum ist eine lokale KI-Lösung für Unternehmen vorteilhafter als Cloud-basierte Dienste?

Lokale KI-Lösungen bieten volle Kontrolle über das Modell, die Trainingsdaten und die Protokollierung, was für die Einhaltung von Vorschriften wie der DSGVO unerlässlich ist. Zudem bleiben die Daten im Unternehmen und sind nicht von den Bedingungen des Cloud-Anbieters abhängig.

In welchen Branchen kann ein KI-gestütztes Unternehmens-Wiki besonders nützlich sein?

Das Wiki ist besonders in Branchen mit umfangreichen Dokumentationen wie der Produktion, Recht, Handel und Verwaltung von Vorteil. Es ermöglicht einen schnellen und präzisen Zugriff auf Informationen, was Zeit spart und Fehler reduziert.

Kategorien: Datenschutz und Künstliche Intelligenz

📖 Über dieses Dokument

Dieses Dokument vermittelt Wissen in strukturierter Form. Fachbegriffe werden direkt im Text erklärt – fahren Sie mit der Maus über unterstrichene Begriffe um eine Kurzerklärung zu sehen.

Komplexe Konzepte lassen sich schrittweise vereinfachen: Klicken Sie auf „Einfacher erklären" um eine zugänglichere Darstellung desselben Inhalts zu öffnen – von formaler Fachsprache bis zur anschaulichen Alltagsanalogie.

Definitionen, Theoreme, Algorithmen und Beispiele sind semantisch ausgezeichnet und aufeinander abgestimmt. Das Glossar in der Seitenleiste fasst alle Fachbegriffe des Dokuments alphabetisch zusammen.

Im Präsentationsmodus (⊞) wird jeder Inhaltsblock einzeln angezeigt – geeignet für Vorträge oder konzentriertes Lesen. Navigation per Pfeiltasten oder Klick in den Fortschrittsbalken.

📋 Inhaltsverzeichnis

Was ist ein KI-Unternehmens-Wiki?
Wie funktioniert das technisch? Drei Kernkonzepte
Large Language Model (LLM): Das sprachliche Herzstück
Embeddings und Embedding-Modelle: Wie Bedeutung zur Zahl wird
Vektordatenbank: Das semantische Gedächtnis
RAG: Retrieval-Augmented Generation
Welche Dokumente und Datenquellen können eingebunden werden?
Warum Cloud-KI bei tausenden Dokumenten scheitert
Das Token-Problem: Was sind Token und warum kosten sie Geld?
Lokale KI: Datensicherheit als struktureller Vorteil
DSGVO-Konformität ohne Kompromisse
EU AI Act: Lokale KI macht Compliance leichter
Praxisbeispiele: Wer profitiert besonders?
Implementierung: Was ist zu beachten?
Fazit

KI-gestütztes Unternehmens-Wiki: Firmenwissen intelligent befragen statt endlos suchen

Ein KI-gestütztes Unternehmens-Wiki erschliesst Firmendokumente semantisch und beantwortet natürlichsprachliche Fragen präzise mit Quellenverweis. Der Artikel erklärt die RAG-Architektur, beleuchtet die Schwächen von Cloud-KI und zeigt, warum lokale KI datenschutzrechtlich und wirtschaftlich überlegen ist.

Das Problem mit klassischen Dokumentenmanagementsystemen

Ein neuer Mitarbeiter fragt: Wie handhaben wir eigentlich Reklamationen von Kunden aus dem B2B-Segment, die gleichzeitig Rahmenverträge und Einzelbestellungen haben? Die Antwort steckt irgendwo – in einem internen Leitfaden aus 2021, einem aktualisierten Anhang zum CRM-Handbuch und einer archivierten E-Mail-Konversation. Das klassische Dokumentenmanagementsystem liefert Trefferlisten. Eine moderne KI-gestützte Wissensdatenbank liefert die Antwort – präzise, kontextsensitiv, mit direktem Quellenverweis.

Was ist ein KI-Unternehmens-Wiki?

Ein KI-gestütztes Unternehmens-Wiki ist keine klassische Suchmaschine und auch kein starres Dokumentenarchiv. Es ist ein intelligentes System, das firmeneigene Dokumente, Datenbanken und Drittsysteme semantisch erschliesst und auf natürlichsprachliche Fragen präzise antwortet. Das System erkennt, dass Wie eskaliere ich einen Supportfall? und Was mache ich, wenn ein Ticket nicht weitergeht? dieselbe Antwort erfordern, auch wenn kein einziges Wort übereinstimmt.

Der entscheidende Unterschied zu herkömmlichen Suchwerkzeugen: Klassische Volltextsuche findet Dokumente, in denen das gesuchte Wort vorkommt. Das KI-Wiki findet Dokumente, die die gesuchte Bedeutung enthalten – auch wenn der Nutzer andere Wörter verwendet als der Autor des Dokuments. Das ist kein sprachlicher Trick, sondern ein fundamentaler technischer Unterschied, der den Alltag der Wissensarbeit grundlegend verändert.

RAG · Retrieval-Augmented Generation

KI Unternehmens-Wiki –
so funktioniert es

Firmendokumente und Systeme semantisch erschlossen – präzise Antworten mit Quellenverweis, vollständig lokal betrieben.

📄

PDF-Dokumente

Verträge, Berichte, Handbücher

📝

Word / Excel

Protokolle, Tabellen, Notizen

📊

PowerPoint

Präsentationen, Schulungen

🗄️

Datenbanken

SQL, intern, strukturiert

🔗

ERP / CRM

SAP, Salesforce, custom, iTWO

Top-Treffer

AGB_B2B.pdf

0.93

Rahmenvertrag.docx

0.81

Konditionen.xlsx

0.74

🔢

Embedding-Modell

Text → Bedeutungsvektor

🗄️

Vektordatenbank

Semantische Ähnlichkeitssuche

Lokal · 100 % intern

🧠

Sprachmodell (LLM)

Antwort auf Basis der Treffer

✅

Antwort + Quellenverweis

Präzise · Nachvollziehbar · Belegt

💬

Natürliche Sprache

Fragen in Alltagssprache

📌

Quellennachweis

Datei, Seite, Abschnitt

🔒

100 % lokal

Daten verlassen nie das Haus

🏷️

Fachvokabular

Internes Wissen verstehen

⚖️

AI Act konform

Vollständige Transparenz

KI-Wiki für Unternehmen & Behörden.

Direkte Antworten statt Trefferlisten: Das System zitiert die relevante Passage aus dem Quelldokument und formuliert eine verständliche Antwort – keine Liste von Dokumenten, die der Nutzer selbst durchsuchen muss.
Quellentransparenz: Jede Antwort enthält den Verweis auf das Originaldokument (Dateiname, Seitenangabe). Vertrauen in die Antwort entsteht durch Nachvollziehbarkeit.
Firmenspezifisches Vokabular: Interne Begriffe, Produktnamen und Abkürzungen werden verstanden – das System muss nicht auf allgemeines Sprachverständnis beschränkt bleiben.
Multiformat-Unterstützung: PDF, Word, Excel, PowerPoint, Textdateien sowie Datenbankanbindungen werden unterstützt. Das Wissen steckt oft in unterschiedlichsten Formaten – das System erschliesst sie alle.
Systemintegration: Anbindung an ERP, CRM, Ticketsysteme oder andere Drittsysteme möglich. Das KI-Wiki wird zur zentralen Auskunftsschicht über alle vorhandenen Systeme.
Rollenbasierter Zugriff: Der Vertrieb sieht andere Dokumente als die Buchhaltung. Zugriffsrechte aus bestehenden Systemen lassen sich auf die KI-Ebene übertragen.

KI-Wiki ersetzt keine Dokumentenpflege

Das System ist so gut wie seine Quellen. Veraltete, widersprüchliche oder schlecht strukturierte Dokumente liefern entsprechend ungenaue Antworten. Ein KI-Wiki ist ein Werkzeug zur Erschliessung vorhandenen Wissens – kein Ersatz für gepflegte Dokumentationsprozesse.

Wie funktioniert das technisch? Drei Kernkonzepte

Das System basiert auf drei zusammenwirkenden Technologien: einem Large Language Model (LLM), einem Embedding-Modell und einer Vektordatenbank. Das Zusammenspiel dieser Komponenten wird als RAG bezeichnet.

Large Language Model (LLM): Das sprachliche Herzstück

Large Language Model (LLM)

Ein Large Language Model ist ein KI-Modell, das auf grossen Mengen menschlicher Texte trainiert wurde und dadurch gelernt hat, Sprache zu verstehen und zu erzeugen. Im Unternehmens-Wiki ist das LLM ausschliesslich für das Formulieren von Antworten zuständig. Es enthält selbst kein Firmenwissen – das Wissen liegt in den Quelldokumenten und wird zur Laufzeit abgerufen.

LLM ist kein Wissensspeicher

Das LLM enthält selbst kein Firmenwissen. Es ist das Sprachverstehens- und Formulierungswerkzeug. Für den lokalen Unternehmenseinsatz kommen Open-Source-Modelle wie Llama 3, Mistral, Qwen oder Gemma zum Einsatz, die auf normaler Server-Hardware betrieben werden können.

Embeddings und Embedding-Modelle: Wie Bedeutung zur Zahl wird

Embedding

Ein Embedding ist die mathematische Darstellung eines Textstücks als Vektor – eine Liste von mehreren hundert bis tausend Dezimalzahlen. Diese Zahlenreihe kodiert die Bedeutung des Textes, nicht seine Buchstaben. Texte mit ähnlicher Bedeutung erhalten ähnliche Vektoren, die im hochdimensionalen Raum nah beieinanderliegen.

Semantische Nähe ohne gemeinsame Wörter

Die Frage Wie lange gilt unsere Gewährleistung? und ein Vertragsabsatz mit dem Text Die gesetzliche Mängelgewährleistung beträgt 24 Monate ab Lieferung teilen kein einziges Wort – liegen aber semantisch sehr nah beieinander. Das Embedding-Modell erkennt diese inhaltliche Nähe und liefert den Vertragsabsatz als Treffer, obwohl eine klassische Schlüsselwortsuche keinen Treffer erzeugt hätte.

Fine-Tuning für firmenspezifisches Vokabular

Embedding-Modelle können auf firmenspezifisches Vokabular feinjustiert werden (Fine-Tuning), sodass interne Abkürzungen, Produktnamen oder Fachbegriffe korrekt eingebettet werden. Das ist besonders dann sinnvoll, wenn das Unternehmen stark von Standardvokabular abweichende Bezeichnungen verwendet.

Vektordatenbank: Das semantische Gedächtnis

Vektordatenbank

Eine Vektordatenbank speichert Embedding-Vektoren und beantwortet Ähnlichkeitsanfragen: Sie findet die gespeicherten Inhalte, die der Bedeutung einer Anfrage am nächsten liegen. Dazu berechnet sie die semantische Ähnlichkeit zwischen dem Anfrage-Vektor und allen gespeicherten Dokumentenvektoren. Bekannte Implementierungen sind pgvector (PostgreSQL-Erweiterung), Qdrant, Weaviate, Chroma und Milvus.

Vektor (Embedding): Die numerische Bedeutungsrepräsentation des Textabschnitts.
Originaltext (Chunk): Der Quelltext des Abschnitts, der dem LLM als Kontext übergeben wird.
Metadaten: Dateiname, Dokumenttyp, Datum, Seitennummer, Zugriffsrechte – Grundlage für Quellentransparenz und rollenbasierten Zugriff.

RAG: Retrieval-Augmented Generation

RAG (Retrieval-Augmented Generation)

RAG beschreibt die Architektur, in der LLM, Embedding-Modell und Vektordatenbank zusammenwirken: Relevante Textabschnitte aus einer Wissensbasis werden zur Laufzeit abgerufen (Retrieval) und dem Sprachmodell als Kontext für die Antwortgenerierung (Generation) übergeben. Das Modell erfindet dabei keine Fakten, sondern formuliert auf Basis der gelieferten Quellen.

So funktioniert RAG mit einer Vektordatenbank.

RAG-Ablauf: Von der Nutzeranfrage bis zur quellenbasierten Antwort in fünf Schritten

Welche Dokumente und Datenquellen können eingebunden werden?

Ein modernes KI-Wiki ist nicht auf Dateien beschränkt. Es kann eine breite Palette an Quellen erschliessen – und besonders wertvoll wird es, wenn Informationen aus mehreren Systemen zusammenspielen.

Unterstützte Dokumentenformate und Datenquellen

Kategorie	Beispiele
Dokumentenformate	PDF (mit OCR), Word (.docx), Excel (.xlsx), PowerPoint (.pptx), Textdateien, Markdown, HTML, archivierte E-Mails
Relationale Datenbanken	PostgreSQL, MySQL, MSSQL
ERP-Systeme	SAP, Sage, Navision / Business Central
CRM-Systeme	Salesforce, HubSpot, Zoho, Microsoft Dynamics
Ticketsysteme	Jira, Freshdesk, Zendesk
Wikis und Intranets	Confluence, SharePoint
Schnittstellen	REST-APIs beliebiger Drittsysteme

Semantische Konsolidierung über Systemgrenzen hinweg

Besonders wertvoll wird das System, wenn Daten aus verschiedenen Quellen zusammenfliessen. Ein Mitarbeiter fragt: Was hat Kunde Müller GmbH bei uns gekauft, welche offenen Tickets gibt es und was steht in unserem letzten Gesprächsprotokoll? Ohne KI-Konsolidierung wären dafür drei Systeme zu öffnen. Das KI-Wiki beantwortet diese Frage aus einer Oberfläche – weil es ERP, CRM und Dokumentenarchiv semantisch vereint. Auch wenn dasselbe Konzept in verschiedenen Systemen unterschiedlich benannt ist (ERP: Debitor, CRM: Kunde, Vertrag: Auftraggeber), erkennt das System die inhaltliche Gleichheit.

Warum Cloud-KI bei tausenden Dokumenten scheitert

Wer ein Unternehmens-Wiki auf Basis von Cloud-KI-Diensten aufbauen möchte, stösst schnell an strukturelle Grenzen – nicht nur technische, sondern auch wirtschaftliche und rechtliche.

Das Token-Problem: Was sind Token und warum kosten sie Geld?

Token

Ein Token ist die kleinste Verarbeitungseinheit eines Sprachmodells. Grob entspricht ein Token etwa 0,75 Wörtern im Englischen. Cloud-KI-Dienste rechnen sowohl eingehende Anfragen (Input-Token: System-Prompt, Kontext, Nutzerfrage) als auch ausgehende Antworten (Output-Token) ab. Bei RAG-Anwendungen ist der Kontext besonders umfangreich, da gefundene Dokumentenabschnitte vollständig übergeben werden.

Beispielrechnung: Token-Kosten bei 50 Mitarbeitern

Eine RAG-Anfrage mit 4.000 Input-Token und 500 Output-Token kostet bei einem aktuellen Cloud-Standardmodell (ca.-Werte 2025) ungefähr 1,4 Cent. Bei 50 Mitarbeitern mit je 20 Anfragen täglich sind das 1.000 Anfragen pro Tag – rund 14 Euro täglich oder ca. 3.500 Euro pro Jahr. Premium-Modelle liegen deutlich höher, sodass die Jahreskosten schnell in den fünfstelligen Bereich steigen.

Weitere Skalierungsprobleme

Kontextfenster-Grenzen: Auch bei grossen Kontextfenstern (128k Token) lässt die Qualität bei sehr langen Kontexten nach – bekannt als Lost-in-the-Middle-Phänomen.
Rate Limits: API-Anfragen werden gedrosselt; bei parallelen Nutzern entstehen Wartezeiten.
Datensouveränität: Dokumente verlassen das Unternehmen – mit allen datenschutzrechtlichen Konsequenzen.
Vendor Lock-in: Ändert der Anbieter Preise, Modelle oder AGB, ist das gesamte System betroffen.

Unkontrollierbare Modell-Updates

Anbieter wie OpenAI, Google oder Anthropic aktualisieren ihre Modelle regelmässig – auch durch stille Verbesserungen im Hintergrund. Als Kunde haben Sie darauf keinen Einfluss. Sorgfältig abgestimmtes Antwortverhalten kann nach einem Update plötzlich anders sein. Ältere Modellversionen werden deprecated und laufen aus. Bei lokaler KI liegt die Entscheidung über Updates vollständig beim Unternehmen.

Lokale KI: Datensicherheit als struktureller Vorteil

Lokal meint in diesem Kontext nicht zwingend den eigenen Serverraum. Es meint: Die KI-Infrastruktur läuft in einer Umgebung, die vollständig unter der Kontrolle des Unternehmens steht – ob on-premises, auf einer dedizierten VM beim Hosting-Anbieter oder in einer Private Cloud mit klarer Datentrennung. Kein Token der Firmendokumente wird an externe APIs gesendet.

Lokale KI vs. Cloud-KI

Cloud-KI

Einfacher Einstieg, keine Infrastruktur nötig. Kosten steigen linear mit Nutzung und sind schlecht planbar. Daten verlassen das Unternehmen. Modell-Updates durch Anbieter unkontrollierbar. Vendor Lock-in. DSGVO-Konformität erfordert AVV-Prüfung und Drittlandtransfer-Analyse.

Lokale KI

Höherer initialer Aufwand, dann fixe und planbare Infrastrukturkosten. Keine variablen Token-Kosten. Daten verbleiben vollständig im Unternehmen. Update-Entscheidungen liegen beim Unternehmen. Keine Abhängigkeit von Drittanbietern. DSGVO-Konformität ist architekturbedingt erfüllt.

DSGVO-Konformität ohne Kompromisse

Wer Firmendokumente an Cloud-KI-Dienste sendet, muss sich intensiv mit Auftragsverarbeitung (Art. 28 DSGVO) befassen sowie den Drittlandtransfer nach Art. 44 ff. DSGVO prüfen. Bei lokaler KI entfallen diese Fragen strukturell: Es gibt keinen Auftragsverarbeiter, keinen Drittlandtransfer und keine Nutzung für Modelltraining.

DSGVO-Konformität als Architekturmerkmal

Bei lokaler KI ist DSGVO-Konformität nicht das Ergebnis sorgfältiger Vertragsprüfung – sie ist das Ergebnis der Architektur. Es gibt schlicht keine Drittpartei, die Daten erhält. Für viele Branchen ist das nicht nur ein Vorteil, sondern eine Voraussetzung.

Kanzleien und steuerberatende Berufe (Mandantendaten, Berufsgeheimnis)
Medizinische Einrichtungen (Gesundheitsdaten nach Art. 9 DSGVO)
Unternehmen mit Betriebs- und Geschäftsgeheimnissen (§ 2 GeschGehG)
Öffentliche Stellen und Behörden
Unternehmen mit ISO 27001 oder ähnlichen Zertifizierungen

Know-how-Schutz nach GeschGehG

Firmenwissen ist ein Wettbewerbsvorteil. Preiskalkulationen, Entwicklungsdokumentationen, Kundenstrategien und interne Prozessbeschreibungen sind nach dem Gesetz zum Schutz von Geschäftsgeheimnissen (GeschGehG) schützenswert. Lokale KI eliminiert das Risiko einer unkontrollierten Weitergabe vollständig.

Lückenlose Revision und Auditierbarkeit

Bei lokaler KI ist vollständig dokumentierbar: Welche Dokumente wurden indexiert, wer hat welche Anfrage gestellt, welche Textabschnitte wurden für welche Antwort verwendet und welche Modellversion hat die Antwort generiert. Diese Nachvollziehbarkeit ist für Compliance-Anforderungen, interne Audits oder im Fall einer Datenschutzprüfung unschätzbar wertvoll. Cloud-Dienste bieten häufig keine vergleichbare Transparenz.

EU AI Act: Lokale KI macht Compliance leichter

Der EU AI Act (Verordnung (EU) 2024/1689) tritt seit August 2024 schrittweise in Kraft und reguliert KI-Systeme nach Risikoklassen. Für ein Unternehmens-Wiki sind vor allem Transparenzpflichten und – bei hochrisikorelevanten Bereichen wie HR-Entscheidungsunterstützung oder kritischer Infrastruktur – Konformitätsdokumentation relevant.

Erklärbarkeit strukturell erfüllt: Antworten basieren auf nachweisbaren Quelltexten. Die verwendeten Dokumentenabschnitte sind protokollierbar, das eingesetzte Modell ist bekannt und unveränderlich.
Konformitätsdokumentation vollständig möglich: Modellname und -version, Trainingsgrundlage, verarbeitete Datenkategorien sowie Zugriffsberechtigungen und Protokollierung sind bei lokaler KI vollständig dokumentierbar – bei Cloud-Diensten oft nicht.
Keine stillen Modell-Wechsel: Bei Cloud-Diensten kann der Anbieter das zugrunde liegende Modell jederzeit wechseln. Bei lokaler KI bleibt das Modell stabil – Updates werden geplant, getestet und kontrolliert eingespielt.

Praxisbeispiele: Wer profitiert besonders?

Branchen und Anwendungsfälle

Mittelständische Produktionsunternehmen

Technische Dokumentationen, Wartungsanleitungen, Zertifikate und Qualitätsprotokolle sind oft über Jahre gewachsen und schwer zu durchsuchen. Das KI-Wiki macht dieses Wissen sofort zugänglich – auch für neue Mitarbeiter in der Produktion, ohne Einarbeitungszeit in komplexe Ablagesysteme.

Kanzleien und Beratungsunternehmen

Urteile, Gutachten, Musterverträge und interne Präzedenzfälle bilden einen enormen Wissensschatz. Der schnelle, präzise Zugriff ohne manuelle Suche spart täglich wertvolle Zeit – und reduziert das Risiko, relevante Präzedenzfälle zu übersehen.

Handel und Vertrieb

Produktdatenblätter, Preislisten, Lieferbedingungen und Kundenverträge in einem semantisch durchsuchbaren System – der Vertrieb findet jede Information in Sekunden, auch im laufenden Kundengespräch, ohne das Gespräch unterbrechen zu müssen.

Öffentliche Verwaltung

Verwaltungsvorschriften, Bescheide, interne Leitfäden und Gesetzestexte sind komplex und zahlreich. KI-gestützte Suche entlastet Sachbearbeiter, reduziert Fehler und verkürzt die Einarbeitungszeit neuer Mitarbeiter erheblich.

HR und People Management

Arbeitsverträge, Betriebsvereinbarungen, Onboarding-Unterlagen und Schulungsmaterial – das KI-Wiki beantwortet Mitarbeiterfragen schnell und konsistent, auch ausserhalb der HR-Sprechzeiten. Standardanfragen werden automatisch beantwortet, HR-Teams können sich auf komplexere Anliegen konzentrieren.

IT-Abteilungen und Support

Systemdokumentationen, Konfigurationsanleitungen, bekannte Fehlerlösungen und Eskalationsprozesse sind oft über verschiedene Systeme verstreut. Das KI-Wiki konsolidiert dieses Wissen und macht es für alle Supportmitarbeiter sofort abrufbar – besonders wertvoll bei personellen Wechseln oder Urlaubsvertretungen.

Implementierung: Was ist zu beachten?

Der Aufbau eines KI-Unternehmens-Wiki ist kein Standardprojekt von der Stange. Die folgenden Überlegungen helfen, typische Fehler zu vermeiden und den Aufwand realistisch einzuschätzen.

Für viele mittelständische Szenarien reicht pgvector als PostgreSQL-Erweiterung als Vektordatenbank vollkommen aus – ohne zusätzliche Infrastruktur. So wird die Erweiterung installiert und aktiviert.

Mit einem Pilotbereich starten

Es empfiehlt sich, das KI-Wiki zunächst für einen klar abgegrenzten Dokumentenbereich einzuführen – z. B. das HR-Onboarding oder die technische Produktdokumentation. Dort lässt sich die Qualität gut beurteilen und das System iterativ verbessern, bevor der gesamte Dokumentenbestand eingebunden wird.

Fazit

Wissen ist das wertvollste Asset eines Unternehmens. Lokale KI ist nicht die Kompromisslösung – sie ist die bessere Wahl.

Ein KI-gestütztes Unternehmens-Wiki ist keine Science-Fiction und kein Luxus für Grosskonzerne. Die Kombination aus RAG-Architektur, lokalem LLM und Vektordatenbank liefert das Beste aus beiden Welten: die Intelligenz moderner KI und die vollständige Kontrolle über die eigenen Daten. Cloud-KI mag für einzelne Experimente praktisch sein – für unternehmensweiten, dokumentenintensiven Einsatz ist sie zu teuer, zu intransparent und zu riskant. Ihr Wissen bleibt bei Ihnen. Und es wird endlich so zugänglich, wie es sein sollte.

Interesse an einem eigenen KI-Wiki?

Wir konzipieren und implementieren KI-gestützte Wissensdatenbanken für mittelständische Unternehmen – lokal, datenschutzkonform und ohne laufende Token-Kosten.

Quellen und weiterführende Links

[DSGVO Art. 28]

Europäisches Parlament, Rat der Europäischen Union (2016). Datenschutz-Grundverordnung – Art. 28 Auftragsverarbeiter. dr-dsgvo.de. https://dr-dsgvo.de/artikel-28-dsgvo-gesetz-auftragsverarbeiter/

[EU AI Act 2024]

Europäisches Parlament, Rat der Europäischen Union (2024). Verordnung (EU) 2024/1689 über künstliche Intelligenz (AI Act). Amtsblatt der Europäischen Union. https://eur-lex.europa.eu/legal-content/DE/TXT/?uri=CELEX:32024R1689

[GeschGehG 2019]

Bundesrepublik Deutschland (2019). Gesetz zum Schutz von Geschäftsgeheimnissen (GeschGehG). Bundesgesetzblatt. https://www.gesetze-im-internet.de/geschgehg/

[Es et al. 2023]

Shahul Es, Jithin James, Luis Espinosa-Anke, Steven Schockaert (2023). RAGAS: Automated Evaluation of Retrieval Augmented Generation. arXiv Preprint. DOI: 10.48550/arXiv.2309.15217. https://arxiv.org/abs/2309.15217

[pgvector]

Andrew Kane. pgvector – Open-source vector similarity search for Postgres. GitHub. https://github.com/pgvector/pgvector

Open-Source-Projekt, aktiv gepflegt

📚 Glossar

Auftragsverarbeitung (Art. 28 DSGVO)
Rechtliche Anforderung, wenn ein Unternehmen personenbezogene Daten durch einen Dritten verarbeiten lässt. Erfordert einen schriftlichen Auftragsverarbeitungsvertrag (AVV).
Chunks
Textabschnitte, in die ein Dokument für die Indexierung aufgeteilt wird. Die optimale Grösse hängt vom Dokumenttyp ab – typisch sind 300 bis 800 Wörter mit Überlappung.
deprecated
Abkündigung: Der Anbieter stellt den Betrieb einer Modellversion zu einem festgelegten Datum ein. Kunden müssen migrieren, ob sie wollen oder nicht.
Drittlandtransfer nach Art. 44 ff. DSGVO
Übermittlung personenbezogener Daten in Länder ausserhalb der EU/des EWR (z. B. USA, UK), die gesondert gerechtfertigt werden muss.
Embedding-Modell
Wandelt Text in einen hochdimensionalen Zahlenvektor um, der die semantische Bedeutung des Textes kodiert.
Definition ansehen ↗
EU AI Act (Verordnung (EU) 2024/1689)
EU-weite KI-Verordnung, die seit August 2024 schrittweise in Kraft tritt. Sie reguliert KI-Systeme nach Risikoklassen und stellt Transparenz- und Dokumentationspflichten.
Large Language Model (LLM)
Ein KI-Modell, das auf enormen Mengen menschlicher Texte trainiert wurde und Sprache verstehen sowie erzeugen kann.
Definition ansehen ↗
Private Cloud
Cloud-Umgebung, die ausschliesslich für ein Unternehmen betrieben wird – im Gegensatz zur Public Cloud, bei der Infrastruktur geteilt wird.
RAG
Retrieval-Augmented Generation – Architekturmuster, bei dem ein LLM zur Antwortgenerierung relevante Textabschnitte aus einer Wissensbasis abruft.
Definition ansehen ↗
RAGAS
Retrieval-Augmented Generation Assessment – Framework zur systematischen Messung der Qualität von RAG-Systemen anhand von Metriken wie Faithfulness, Answer Relevancy und Context Recall.
semantisch erschliesst
Bedeutungsbasierte Verarbeitung von Text – das System versteht den Sinn einer Frage, nicht nur ihre Schlüsselwörter.
semantische Ähnlichkeit
Gemessen z. B. als Cosine Similarity – der Winkel zwischen zwei Vektoren im Vektorraum. Ein Winkel von 0° bedeutet identische Bedeutung, 90° bedeutet unverwandt.
Vektordatenbank
Spezialdatenbank zum Ablegen und effizienten Suchen von Embedding-Vektoren nach semantischer Ähnlichkeit.
Definition ansehen ↗

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

Erstberatung inkl. Machbarkeitsaussagen
Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de