- Semantische Suche: Statt reiner Stichwortsuche sucht das System nach inhaltlich ähnlichen Texten mittels Vektorisierung.
- Aktuelle Wissensbasis: Neue oder geänderte Dokumente können je nach Quellentyp automatisch oder manuell synchronisiert werden.
- Einsatz in Assistenten: Aktivieren Sie Wissensdatenbanken bei Assistenten, um unternehmensspezifisches Wissen in Antworten einzubeziehen (siehe Globale Assistenten).
Übersicht der Wissensdatenbanken
Auf der Seite Wissensdatenbanken sehen Sie alle angelegten Wissensdatenbanken in einer Tabelle:| Spalte | Bedeutung |
|---|---|
| Name | Bezeichnung der Wissensdatenbank |
| Dokumente | Anzahl der Dokumente über alle Quellen dieser Wissensdatenbank |
| Status | Gesamtstatus: grün = in Ordnung, orange = Verarbeitung läuft, rot = Fehler |
- Bearbeiten (Stift-Icon): Wissensdatenbank öffnen, Name/Beschreibung und Quellen verwalten.
- Löschen (Papierkorb-Icon): Wissensdatenbank inklusive aller Quellen und Dokumente entfernen.
Wissensdatenbank erstellen und bearbeiten
Neue Wissensdatenbank anlegen
Klicken Sie auf Neue Wissensdatenbank. Sie werden zur
Bearbeitungsansicht weitergeleitet.
Name und Beschreibung setzen
Vergeben Sie einen Namen und optional eine Beschreibung (z. B. Zweck
und Inhalt). Klicken Sie auf Speichern, damit die Wissensdatenbank
angelegt wird.
Datenquellen hinzufügen
Erst nach dem Speichern können Sie unter Neue Quelle erstellen Quellen
anlegen. Wählen Sie den Typ der Datenquelle und klicken Sie auf Quelle
anlegen. Anschließend konfigurieren Sie die Quelle (siehe Abschnitt
Datenquellen und Quellentypen).
Wissensdatenbank einem Assistenten zuweisen
Aktivieren Sie die Wissensdatenbank bei einem oder mehreren Globale
Assistenten. Die Berechtigung, welche Nutzer auf
welche Wissensdatenbank zugreifen können, wird über die Assistenten
gesteuert.
Datenquellen und Quellentypen
Eine Wissensdatenbank kann mehrere Quellen haben. Jede Quelle hat einen Quellentyp, der beim Anlegen festgelegt wird und nicht mehr geändert werden kann.Verfügbare Quellentypen
| Typ | Beschreibung | Limit pro Wissensdatenbank |
|---|---|---|
| Manueller Upload | Dokumente per Drag & Drop oder Dateiauswahl hochladen | 1 Quelle |
| Lokaler Ordner | Ordnerpfad auf dem Host-System (z. B. Freigabeordner) | unbegrenzt |
| GitHub | Inhalte aus einem GitHub-Repository (Branch, Pfad, Dateiendungen) | unbegrenzt |
| WebDAV | Freigabe über WebDAV (URL, Benutzer, Passwort, Ordner, Tiefe) | unbegrenzt |
Allgemeine Konfiguration jeder Quelle
- Ihr Name für die Datenquelle: Ein frei wählbarer Anzeigename (z. B. „GitHub 1”, „WebDAV Rechtstexte”).
- Verbindung testen: Bei GitHub, WebDAV und lokalem Ordner prüft der Button Zugangsdaten und Erreichbarkeit. Bei Fehlern erscheint ein roter Status „Fehler” in der Konfiguration.
- Synchronisierung: Nur bei Quellen mit externem Zugriff (nicht bei Manueller Upload):
- Intervall: Manuell, jede Stunde, jeden Tag, jede Woche oder jeden Monat.
- Jetzt synchronisieren: Startet einen sofortigen Sync.
Manueller Upload
- Pro Wissensdatenbank ist nur eine Quelle vom Typ „Manueller Upload” möglich. Ist das Limit erreicht, erscheint „Manueller Upload (Limit erreicht)” und die Option ist deaktiviert.
- Dokumente: Ziehen Sie Dateien in den Drag-&-Drop-Bereich oder klicken Sie auf Hochladen und wählen Sie Dateien aus.
- Es gibt kein Synchronisationsintervall – Inhalte werden nur durch manuelles Hochladen ergänzt.
- Ausgewählte Dokumente: Liste der hochgeladenen Dateien mit Status:
- Fertig (grün): Erfolgreich verarbeitet und eingebettet.
- In Bearbeitung (orange): Verarbeitung läuft noch.
- Fehler (rot): Verarbeitung fehlgeschlagen (z. B. ungültiges Format).
- Einzelne Dokumente können über das Papierkorb-Icon aus der Quelle entfernt werden.
Lokaler Ordner
Dokumente werden aus einem lokalen Ordner gelesen, der dem Container als Volume bereitgestellt wird. Der Freigabeordner, den Sie in der UI angeben, ist ein Unterordner innerhalb des Container-Basisverzeichnisses/data/Data/KnowledgebaseDocuments.
| Einstellung | Pflicht | Beschreibung |
|---|---|---|
| Freigabeordner | Ja | Unterordner innerhalb des Basisverzeichnisses (z. B. /meine-dokumente). Alle Dateien in diesem Ordner und dessen Unterordnern werden rekursiv eingelesen. |
- Verbindung testen prüft, ob der Ordner im Container existiert und lesbar ist.
- Versteckte Dateien (mit
.oder~beginnend) sowie Symlinks werden automatisch übersprungen.
Lokaler Ordner einrichten
Technische Anleitung: Docker-Compose-Volumes konfigurieren, Netzwerk-Shares
(SMB/NFS) einbinden, typische Fehler beheben.
GitHub
Dokumente werden aus einem GitHub-Repository geladen.| Einstellung | Pflicht | Beschreibung |
|---|---|---|
| Repository | Ja | Format owner/repo (z. B. varios-ai/docs). |
| Zugriffstoken | Ja | Personal Access Token (Classic oder Fine-grained) mit Lesezugriff auf das Repository. Links: „Fine-grained Token erstellen (empfohlen)” bzw. „Classic Token erstellen”. |
| Branch | Ja | Branch zum Synchronisieren (Standard: main). |
| Pfad im Repository | Nein | Unterpfad im Repo (z. B. /docs). / = Wurzel. |
| Rekursiv | Nein | Wenn aktiviert, werden Unterordner einbezogen. |
| Dateiendungen | Nein | Kommagetrennte Liste (z. B. md,txt,json,yaml,yml,pdf,docx). Nur diese Erweiterungen werden verarbeitet. |
| Maximale Dateigröße (Bytes) | Nein | Obergrenze pro Datei. Hinweis in der UI: 10 MB = 10485760, 50 MB = 52428800, 100 MB = 104857600. |
| GitHub URL | Nein | API-Basis-URL (Standard: https://api.github.com). Nur bei GitHub Enterprise anpassen. |
- Verbindung testen prüft Repository, Token und Branch.
- Mögliche Fehler: ungültiges Repository-Format, Authentifizierung fehlgeschlagen, unzureichende Berechtigungen, Repository/Branch nicht gefunden, API-Ratenlimit.
WebDAV
Dokumente werden von einem WebDAV-Server (z. B. Nextcloud, ownCloud) geholt.| Einstellung | Pflicht | Beschreibung |
|---|---|---|
| Domain | Ja | Vollständige URL des WebDAV-Servers (z. B. https://www.your-domain.de). Schema und Host müssen gesetzt sein. |
| Benutzer | Ja | Benutzername für die Anmeldung. |
| Passwort | Ja | Passwort für die Anmeldung. |
| Freigabeordner | Ja | Pfad zum Ordner auf dem WebDAV-Server (z. B. / für Wurzel oder /Dokumente/Wissen). |
| Ordnertiefe | Ja | Wie viele Unterordnerebenen ab dem Freigabeordner durchsucht werden (mindestens 1). |
- Verbindung testen prüft URL und Anmeldung. Typische Fehler: Authentifizierung fehlgeschlagen, Schema/Host nicht gesetzt.
Status und Fehlerbehandlung
Status der Wissensdatenbank (Übersichtsliste)
- Grün: Keine Fehler, alle Quellen in Ordnung bzw. Dokumente verarbeitet.
- Orange: Mindestens eine Quelle oder Dokumente sind „In Bearbeitung” (z. B. Sync oder Embedding läuft).
- Rot: Mindestens eine Quelle oder Dokumente haben den Status „Fehler”.
Status einer Quelle (in der Bearbeitungsansicht)
- Keine Fehler: Konfiguration und Verbindung sind in Ordnung.
- Fehler: Verbindungstest oder letzter Sync fehlgeschlagen (z. B. falsche Zugangsdaten, Ordner nicht erreichbar).
- Synchronisierung: Sync läuft gerade.
Dokumentenstatus (pro Quelle)
- Fertig: Dokument wurde erfolgreich eingelesen und eingebettet.
- In Bearbeitung: Verarbeitung oder Embedding läuft noch.
- Fehler: Verarbeitung fehlgeschlagen (z. B. Dateiformat, Größe, Lesefehler).
Bei rotem Status der Wissensdatenbank
In der Übersicht auf Bearbeiten klicken und die Quellen prüfen. Quelle
mit rotem Konfigurationsstatus öffnen (Bearbeiten-Icon).
Quelle prüfen
Verbindung testen ausführen. Fehlermeldung lesen (z. B. falscher Pfad,
ungültiger Token, WebDAV-Login). Einstellungen korrigieren und
Speichern.
Kurzüberblick: Was Sie beachten sollten
- Quellentyp vor dem Anlegen wählen – er ist danach nicht änderbar.
- Manueller Upload: Nur eine solche Quelle pro Wissensdatenbank; Dokumente nur manuell hochladen.
- Lokaler Ordner: Pfad und Leseberechtigung auf dem Host/Container prüfen; bei Bedarf Volumes korrekt mounten.
- GitHub: Token mit ausreichenden Rechten (Repository lesen); ggf. Ratenlimits beachten.
- WebDAV: URL inkl. Schema (z. B.
https://), Benutzer und Passwort korrekt; Freigabeordner und Ordnertiefe passend setzen. - Synchronisierung: Nur bei GitHub, WebDAV und lokalem Ordner – Intervall wählen oder manuell synchronisieren.
- Berechtigungen: Zugriff auf Wissensdatenbanken wird über die Zuweisung zu Globale Assistenten gesteuert.
