Zum Hauptinhalt springen
Startseite > “Admin-Menü” > “Wissensdatenbanken”
Mit VARIOS AI können Sie leistungsfähige Vektordatenbanken auf Basis des Retrieval-Augmented-Generation-Ansatzes (RAG) erstellen – wir nennen sie Wissensdatenbanken. Über verschiedene Datenquellen (z. B. manueller Upload, GitHub, WebDAV, lokaler Ordner) werden Dokumente eingespielt, als Embeddings gespeichert und per semantischer Suche nutzbar gemacht. Wissensdatenbanken können einem oder mehreren Assistenten zugewiesen werden. Die Vorteile:
  • Semantische Suche: Statt reiner Stichwortsuche sucht das System nach inhaltlich ähnlichen Texten mittels Vektorisierung.
  • Aktuelle Wissensbasis: Neue oder geänderte Dokumente können je nach Quellentyp automatisch oder manuell synchronisiert werden.
  • Einsatz in Assistenten: Aktivieren Sie Wissensdatenbanken bei Assistenten, um unternehmensspezifisches Wissen in Antworten einzubeziehen (siehe Globale Assistenten).

Übersicht der Wissensdatenbanken

Auf der Seite Wissensdatenbanken sehen Sie alle angelegten Wissensdatenbanken in einer Tabelle:
SpalteBedeutung
NameBezeichnung der Wissensdatenbank
DokumenteAnzahl der Dokumente über alle Quellen dieser Wissensdatenbank
StatusGesamtstatus: grün = in Ordnung, orange = Verarbeitung läuft, rot = Fehler
Aktionen pro Zeile:
  • Bearbeiten (Stift-Icon): Wissensdatenbank öffnen, Name/Beschreibung und Quellen verwalten.
  • Löschen (Papierkorb-Icon): Wissensdatenbank inklusive aller Quellen und Dokumente entfernen.
Über das Suchfeld können Sie nach dem Namen filtern. Die Liste ist paginiert („Vorherige” / „Nächste”).
Beim Löschen einer Wissensdatenbank werden alle zugehörigen Quellen und Dokumente unwiderruflich gelöscht. Entfernen Sie die Wissensdatenbank ggf. zuerst von allen Assistenten.

Wissensdatenbank erstellen und bearbeiten

1

Neue Wissensdatenbank anlegen

Klicken Sie auf Neue Wissensdatenbank. Sie werden zur Bearbeitungsansicht weitergeleitet.
2

Name und Beschreibung setzen

Vergeben Sie einen Namen und optional eine Beschreibung (z. B. Zweck und Inhalt). Klicken Sie auf Speichern, damit die Wissensdatenbank angelegt wird.
3

Datenquellen hinzufügen

Erst nach dem Speichern können Sie unter Neue Quelle erstellen Quellen anlegen. Wählen Sie den Typ der Datenquelle und klicken Sie auf Quelle anlegen. Anschließend konfigurieren Sie die Quelle (siehe Abschnitt Datenquellen und Quellentypen).
4

Wissensdatenbank einem Assistenten zuweisen

Aktivieren Sie die Wissensdatenbank bei einem oder mehreren Globale Assistenten. Die Berechtigung, welche Nutzer auf welche Wissensdatenbank zugreifen können, wird über die Assistenten gesteuert.

Datenquellen und Quellentypen

Eine Wissensdatenbank kann mehrere Quellen haben. Jede Quelle hat einen Quellentyp, der beim Anlegen festgelegt wird und nicht mehr geändert werden kann.
Quellentyp ist fest: Der Typ einer Quelle (z. B. GitHub, WebDAV) kann nachträglich nicht geändert werden. Für einen anderen Typ müssen Sie eine neue Quelle anlegen und ggf. die alte löschen.

Verfügbare Quellentypen

TypBeschreibungLimit pro Wissensdatenbank
Manueller UploadDokumente per Drag & Drop oder Dateiauswahl hochladen1 Quelle
Lokaler OrdnerOrdnerpfad auf dem Host-System (z. B. Freigabeordner)unbegrenzt
GitHubInhalte aus einem GitHub-Repository (Branch, Pfad, Dateiendungen)unbegrenzt
WebDAVFreigabe über WebDAV (URL, Benutzer, Passwort, Ordner, Tiefe)unbegrenzt

Allgemeine Konfiguration jeder Quelle

  • Ihr Name für die Datenquelle: Ein frei wählbarer Anzeigename (z. B. „GitHub 1”, „WebDAV Rechtstexte”).
  • Verbindung testen: Bei GitHub, WebDAV und lokalem Ordner prüft der Button Zugangsdaten und Erreichbarkeit. Bei Fehlern erscheint ein roter Status „Fehler” in der Konfiguration.
  • Synchronisierung: Nur bei Quellen mit externem Zugriff (nicht bei Manueller Upload):
    • Intervall: Manuell, jede Stunde, jeden Tag, jede Woche oder jeden Monat.
    • Jetzt synchronisieren: Startet einen sofortigen Sync.
Nach dem Speichern einer Quelle zeigt die Oberfläche Konfiguration (Status: Keine Fehler / Fehler) und Dateien (Anzahl Dokumente, Status Fertig / In Bearbeitung / Fehler). Über die Icons können Sie die Quelle neu laden, löschen oder bearbeiten.

Manueller Upload

  • Pro Wissensdatenbank ist nur eine Quelle vom Typ „Manueller Upload” möglich. Ist das Limit erreicht, erscheint „Manueller Upload (Limit erreicht)” und die Option ist deaktiviert.
  • Dokumente: Ziehen Sie Dateien in den Drag-&-Drop-Bereich oder klicken Sie auf Hochladen und wählen Sie Dateien aus.
  • Es gibt kein Synchronisationsintervall – Inhalte werden nur durch manuelles Hochladen ergänzt.
  • Ausgewählte Dokumente: Liste der hochgeladenen Dateien mit Status:
    • Fertig (grün): Erfolgreich verarbeitet und eingebettet.
    • In Bearbeitung (orange): Verarbeitung läuft noch.
    • Fehler (rot): Verarbeitung fehlgeschlagen (z. B. ungültiges Format).
  • Einzelne Dokumente können über das Papierkorb-Icon aus der Quelle entfernt werden.
Unterstützte Formate entnehmen Sie der Anwendung (z. B. PDF, DOCX, TXT, MD). Sehr große Dateien können abhängig von der Konfiguration ausgeschlossen werden.

Lokaler Ordner

Dokumente werden aus einem lokalen Ordner gelesen, der dem Container als Volume bereitgestellt wird. Der Freigabeordner, den Sie in der UI angeben, ist ein Unterordner innerhalb des Container-Basisverzeichnisses /data/Data/KnowledgebaseDocuments.
EinstellungPflichtBeschreibung
FreigabeordnerJaUnterordner innerhalb des Basisverzeichnisses (z. B. /meine-dokumente). Alle Dateien in diesem Ordner und dessen Unterordnern werden rekursiv eingelesen.
  • Verbindung testen prüft, ob der Ordner im Container existiert und lesbar ist.
  • Versteckte Dateien (mit . oder ~ beginnend) sowie Symlinks werden automatisch übersprungen.

Lokaler Ordner einrichten

Technische Anleitung: Docker-Compose-Volumes konfigurieren, Netzwerk-Shares (SMB/NFS) einbinden, typische Fehler beheben.

GitHub

Dokumente werden aus einem GitHub-Repository geladen.
EinstellungPflichtBeschreibung
RepositoryJaFormat owner/repo (z. B. varios-ai/docs).
ZugriffstokenJaPersonal Access Token (Classic oder Fine-grained) mit Lesezugriff auf das Repository. Links: „Fine-grained Token erstellen (empfohlen)” bzw. „Classic Token erstellen”.
BranchJaBranch zum Synchronisieren (Standard: main).
Pfad im RepositoryNeinUnterpfad im Repo (z. B. /docs). / = Wurzel.
RekursivNeinWenn aktiviert, werden Unterordner einbezogen.
DateiendungenNeinKommagetrennte Liste (z. B. md,txt,json,yaml,yml,pdf,docx). Nur diese Erweiterungen werden verarbeitet.
Maximale Dateigröße (Bytes)NeinObergrenze pro Datei. Hinweis in der UI: 10 MB = 10485760, 50 MB = 52428800, 100 MB = 104857600.
GitHub URLNeinAPI-Basis-URL (Standard: https://api.github.com). Nur bei GitHub Enterprise anpassen.
  • Verbindung testen prüft Repository, Token und Branch.
  • Mögliche Fehler: ungültiges Repository-Format, Authentifizierung fehlgeschlagen, unzureichende Berechtigungen, Repository/Branch nicht gefunden, API-Ratenlimit.

WebDAV

Dokumente werden von einem WebDAV-Server (z. B. Nextcloud, ownCloud) geholt.
EinstellungPflichtBeschreibung
DomainJaVollständige URL des WebDAV-Servers (z. B. https://www.your-domain.de). Schema und Host müssen gesetzt sein.
BenutzerJaBenutzername für die Anmeldung.
PasswortJaPasswort für die Anmeldung.
FreigabeordnerJaPfad zum Ordner auf dem WebDAV-Server (z. B. / für Wurzel oder /Dokumente/Wissen).
OrdnertiefeJaWie viele Unterordnerebenen ab dem Freigabeordner durchsucht werden (mindestens 1).
  • Verbindung testen prüft URL und Anmeldung. Typische Fehler: Authentifizierung fehlgeschlagen, Schema/Host nicht gesetzt.

Status und Fehlerbehandlung

Status der Wissensdatenbank (Übersichtsliste)

  • Grün: Keine Fehler, alle Quellen in Ordnung bzw. Dokumente verarbeitet.
  • Orange: Mindestens eine Quelle oder Dokumente sind „In Bearbeitung” (z. B. Sync oder Embedding läuft).
  • Rot: Mindestens eine Quelle oder Dokumente haben den Status „Fehler”.

Status einer Quelle (in der Bearbeitungsansicht)

  • Keine Fehler: Konfiguration und Verbindung sind in Ordnung.
  • Fehler: Verbindungstest oder letzter Sync fehlgeschlagen (z. B. falsche Zugangsdaten, Ordner nicht erreichbar).
  • Synchronisierung: Sync läuft gerade.

Dokumentenstatus (pro Quelle)

  • Fertig: Dokument wurde erfolgreich eingelesen und eingebettet.
  • In Bearbeitung: Verarbeitung oder Embedding läuft noch.
  • Fehler: Verarbeitung fehlgeschlagen (z. B. Dateiformat, Größe, Lesefehler).
1

Bei rotem Status der Wissensdatenbank

In der Übersicht auf Bearbeiten klicken und die Quellen prüfen. Quelle mit rotem Konfigurationsstatus öffnen (Bearbeiten-Icon).
2

Quelle prüfen

Verbindung testen ausführen. Fehlermeldung lesen (z. B. falscher Pfad, ungültiger Token, WebDAV-Login). Einstellungen korrigieren und Speichern.
3

Sync ggf. erneut anstoßen

Bei GitHub/WebDAV/lokalem Ordner Jetzt synchronisieren klicken. Anschließend die Dokumentenliste prüfen (Filter „Fehler”, ggf. einzelne Dokumente entfernen oder erneut einbetten, falls die UI das anbietet).

Kurzüberblick: Was Sie beachten sollten

  • Quellentyp vor dem Anlegen wählen – er ist danach nicht änderbar.
  • Manueller Upload: Nur eine solche Quelle pro Wissensdatenbank; Dokumente nur manuell hochladen.
  • Lokaler Ordner: Pfad und Leseberechtigung auf dem Host/Container prüfen; bei Bedarf Volumes korrekt mounten.
  • GitHub: Token mit ausreichenden Rechten (Repository lesen); ggf. Ratenlimits beachten.
  • WebDAV: URL inkl. Schema (z. B. https://), Benutzer und Passwort korrekt; Freigabeordner und Ordnertiefe passend setzen.
  • Synchronisierung: Nur bei GitHub, WebDAV und lokalem Ordner – Intervall wählen oder manuell synchronisieren.
  • Berechtigungen: Zugriff auf Wissensdatenbanken wird über die Zuweisung zu Globale Assistenten gesteuert.
Die Berechtigung, welche Nutzer Zugriff auf welche Wissensdatenbank haben, wird über die Assistenten gesteuert. Weisen Sie die Wissensdatenbank nur solchen Assistenten zu, für die der Inhalt bestimmt ist.