Kiara Logo KIara
Features Use Cases Architektur What's New Wiki Kontakt

What's New

Entwicklungschronik — neue Features, Verbesserungen und Meilensteine

18.–20. April 2026

Geteilte UI-Bibliothek und robuste Ausfall-Erholung

Chat-UI und Admin-UI teilen sich jetzt eine gemeinsame Grundlage — und Qdrant-Ausfälle werden sauber abgefangen

  • Shared UI-Bibliothek — sechs Sprints haben Chat-UI und Admin-UI auf eine gemeinsame Basis gehoben: einheitliche Farben und Themes, zentrale Benachrichtigungen, Modals mit Fokus-Falle, wiederverwendbare Tabellen und Formulare. Ergebnis: konsistentes Aussehen, weniger Duplikate, bessere Barrierefreiheit
  • Chat-Bausteine teilen — die Chat-Oberfläche und der Admin-Chat nutzen intern dieselbe Komponenten-Bibliothek. Neue Chat-Features erscheinen künftig automatisch in beiden UIs
  • Qdrant-Ausfälle überstehen — fällt die Vektordatenbank während eines Indexierungs-Laufs aus, pausiert der Worker jetzt kontrolliert und nimmt die Arbeit nach der Erholung wieder auf, statt den ganzen Job abzubrechen
  • Dichtere Security-Masken — der Qdrant-API-Key wird in den Admin-Einstellungen nicht mehr angezeigt, LDAP-Fehlerpfade geben keine Rückschlüsse mehr auf gültige Benutzer preis
Versionen 0.0.1+347 bis 0.0.1+357
14.–17. April 2026

Sicherheits-Offensive und PostgreSQL-only

BugScan Run 3, komplette SQLite-Entfernung, Cloud-Audit ohne Zeitheuristik

  • BugScan Run 3 — eine dritte, noch breiter angesetzte Code-Analyse hat 406 Befunde zusammengetragen und Schritt für Schritt abgearbeitet: SSRF-Guards, Path-Traversal-Fixes, Race-Condition-Härtung, TOCTOU-Schutz, StartTLS Fail-Secure und viele kleinere Verbesserungen
  • SQLite endgültig entfernt — Überreste aus der SQLite-Ära sind komplett ausgebaut: Konnektor-Dialog, Backup-Pfade, Doku und Wiki sprechen jetzt ausschließlich PostgreSQL
  • Cloud-Audit zuverlässiger — die Zuordnung von anonymisierten Anfragen zum Cloud-Aufruf lief bisher über Zeitheuristik. Jetzt wird eine eindeutige Korrelations-ID mitgeführt, die auch bei parallelen Requests sauber matcht
  • Stärkerer Wizard und ERP-Sync — Wizard-Geheimnisse landen verschlüsselt in der Datenbank, der ERP-Graph-Sync ist idempotent und übersteht Fehler beim Halbzustand sauber
Versionen 0.0.1+335 bis 0.0.1+346
12.–14. April 2026

Code-Qualitätsoffensive und ColBERT-Aufräumer

Systematische Bug-Jagd, saubere Testsuite und ein Modellwechsel ohne Altlasten

  • BugScan Run 2 — systematische Code-Analyse auf vier Schweregraden hat rund 300 Findings aufgedeckt und rund 260 davon automatisch behoben. Schwerpunkt: Eingabe-Validierung, Race-Conditions, sichere Textausgabe im Frontend
  • Testsuite wieder bei null Fehlern — von 132 auf 0 fehlschlagende Tests. Die Admin-UI-Selbstdiagnose läuft erstmals wieder vollständig grün
  • ColBERT-Modellwechsel ohne Altlasten — wird das ColBERT-Modell umgestellt, räumt Kiara jetzt die alten Daten selbst auf. Bei Unsicherheit lässt sich der Cleanup manuell anstoßen — mit Dry-Run-Vorschau im Admin-UI oder per CLI
  • Tracing ein-/ausschalten per Klick — im Traces-Tab gibt es einen Toggle, der das OpenTelemetry-Tracing umschaltet und den Dienst automatisch neu startet. Kein Config-Editieren mehr
  • Weniger Overhead in der Suche — die Keyword-Suche hat doppelt überzogen und mehr Kandidaten geladen als nötig. Jetzt ist die Menge passend zur Ergebnisgröße
Versionen 0.0.1+324 bis 0.0.1+334
8.–11. April 2026

Stabilere Admin-UI, eigener Installer und Wiki-Fundament

Weniger Glitches in der Admin-UI — und ein Installer, der endlich zum Produkt passt

  • Admin-UI Robustheit — Polling, Button-Sperren und Tab-Wechsel sind zentralisiert. Doppelklicks lösen keine doppelten Aktionen mehr aus, Tabs verlieren beim Wechseln keine Daten mehr, und Fehler aus dem Backend landen sichtbar in Benachrichtigungen statt lautlos zu verschwinden
  • Härter gegen XSS — alle Textausgaben im Admin-Bereich werden kontextabhängig escapet, inline-JavaScript wurde flächendeckend durch sichere Event-Delegation ersetzt
  • Eigener Appliance-Installer — der Debian-Installer ist durch einen schlanken Dialog-Assistenten ersetzt: Festplatte wählen, Tastaturlayout, Zeitzone, Sprache — fertig. Funktioniert komplett offline mit lokalen Paketquellen
  • LLM-Wiki-Fundament — das Gerüst für automatisch generierte Wiki-Seiten aus den eigenen Datenquellen wird angelegt. Die Entwicklung läuft mittlerweile eigenständig weiter
Versionen 0.0.1+306 bis 0.0.1+323
5.–7. April 2026

Pipeline-Baukasten und Ausfallsicherheit

Kiara lernt, mit ausgefallenen Backends umzugehen — ohne Chat-Abstürze

  • Graceful Degradation — fällt ein Backend (Ollama, Datenbank, LDAP) aus, zeigt Kiara ein gelbes Warning-Banner im Chat statt zu crashen. Erholt sich der Dienst, verschwindet die Meldung von selbst. Optionale E-Mail an den Admin bei Ausfall
  • Ingestion als Baukasten — die Datei-Verarbeitung ist in eigenständige Module zerlegt: Loader (25+ Dateiformate), Hash-Management und Pipeline-Steuerung lassen sich einzeln testen und erweitern
  • Schnellere Integritätsprüfung — ein Engpass mit hunderten Datenbank-Abfragen ist behoben, die Prüfung läuft jetzt um ein Vielfaches schneller
  • Saubereres Chat-Streaming — Metriken, Audit-Einträge und Cloud-Routing werden einheitlich geloggt, unabhängig vom gewählten Backend
Versionen 0.0.1+289 bis 0.0.1+305
4.–5. April 2026

Trace Explorer, Late Chunking und ColBERT

Drei neue Retrieval-Verfahren und vollständige Observability

  • Trace Explorer — neuer System-Subtab mit Wasserfall-Ansicht, Vergleichsmodus, Histogramm (P50/P95/P99), 7 Filter-Felder, CSV/JSON-Export. Per-Pipeline Tracing, optionaler OTLP-Exporter
  • Chat-UI Debug-Modus — Trace-Timing-Bar zeigt Retrieval-, Reranking- und Generierungsdauer pro Antwort
  • Late Chunking — Embedding auf Dokumentebene: der vollständige Text wird verarbeitet, Chunk-Vektoren anschließend aus Token-Positionen extrahiert. Kontextreichere Embeddings ohne größere Chunks
  • ColBERT Multi-Vector Retrieval — 4. Retrieval-Quelle: jedes Token bekommt einen eigenen Vektor, Ähnlichkeit per MaxSim über alle Token-Paare. Eigene Qdrant-Collections, Circuit-Breaker in der Pipeline
Versionen 0.0.1+283 bis 0.0.1+288
2.–3. April 2026

Prompt-Defense, Contextual Retrieval und Testsuite auf 0 Failures

Dreischichtiger Angriffsschutz, intelligenteres Chunking und eine saubere Testsuite

  • Prompt-Injection-Defense — dreistufiger Schutz (Input-Sanitizing, Context-Tagging, System-Prompt-Hardening) für alle Chains. Audit-Logging mit Severity-Klassifikation, eigener Compliance-Subtab
  • Contextual Retrieval — vor dem Embedding wird jeder Chunk durch ein LLM mit Kontext angereichert. Konfigurierbar pro Datenquelle, mit Prompt-Versionierung und Integritätsprüfung
  • Prompt-Versionierung — History-Tabelle mit SHA256-Hashes, Rollback auf frühere Versionen, History-Ansicht in der Admin-UI
  • Anonymizer als Bibliothek — Kernlogik als eigenständiges Subpackage extrahiert, alle Importpfade über Compat-Shims erhalten
  • Testsuite auf 0 Failures — von 829 auf 0 Failures: 3934 Tests bestehen, asyncio-Migration in 31 Dateien
  • DS-Zugriffskontrolle in Elasticsearch — terms-Filter direkt in ES statt Post-Query-Filterung
Versionen 0.0.1+257 bis 0.0.1+282
31. März – 1. April 2026

LLM-Backend-Abstraktion, Wiki-Guides und Datenschutz-Steuerung

Einheitliche Backend-Architektur und umfassende Dokumentation

  • LLM-Backend-Abstraktion — einheitliches LLMBackend-Interface für alle Chains (RAG, Unchained, Rewriter, Agent). Dependency Injection statt eigener Backend-Erzeugung, Shared Cloud-Routing mit automatischer Anonymisierung
  • Restriction-Level pro Datenquelle — dreistufiges Datenschutz-Modell (public/anonymize/blocked) steuert, welche Daten an Cloud-Backends gesendet werden. Trusted-Flag pro Backend für vertrauenswürdige Anbieter
  • Wiki-Guides mit Inhalt — 9 ausführliche Guide-Seiten (Benutzerverwaltung, Datenquellen, Jobs, VektorDB, KI, Tools, Compliance, System, Admin-Chat)
  • Guided Workflows im Admin-Chat — 4 Setup-Assistenten (LLM-Backend, Datenquelle, Ingestion, Ersteinrichtung) führen schrittweise durch die Konfiguration
  • Integritäts-Tab Redesign — ExpandableTable mit Detail-Renderern, Collection-Rebuild (Snapshot/Drop/Restore), Multi-Modell-Checks
  • File-Size als Single Source of Truth — Dateigrößen ausschließlich in file_hashes, denormalisierte Spalten entfernt
Versionen 0.0.1+236 bis 0.0.1+257
29.–30. März 2026

Integritätsprüfung, System-Monitor und Cloud-Embeddings

Neue Diagnose-Werkzeuge und Infrastruktur

  • Integritätsprüfung — neuer System-Subtab mit 5 Konsistenz-Checks, 3 Repair-Funktionen (ds_ids-Sync, Orphan-Cleanup, Metadaten-Rekonstruktion), Background-Thread mit Fortschrittsanzeige
  • System-Monitor — ersetzt den Health-Tab: Live-SSE-Stream (CPU, RAM, Swap, Load, Netzwerk, Plattenplatz), Chart.js-Diagramme mit History (1h bis 1 Jahr), Service-Management und Journal-Fehler
  • Cloud-Embedding-Provider — OpenAI und Voyage AI als Embedding-Backends neben Ollama, mit Probe-Embedding-Test und Batch-Limits
  • Appliance-ISO — bootfähiges Installationsimage via Debian live-build, First-Boot-Wizard mit 10 Schritten, Qdrant als native Binary, Kiara-Branding im Bootscreen
  • Admin-Chat Bugfix-Sprint — 13 Fixes (LDAP-Fehlertoleranz, atomare User-Deaktivierung, Session-Invalidierung bei Passwort-Reset, crash-sichere DS-Löschung)
Versionen 0.0.1+223 bis 0.0.1+235
27.–29. März 2026

Admin-Chat und Wiki

Die Admin-UI wird konversationell — und dokumentiert sich selbst

  • Admin-Chat — Kiara verwalten per natürlicher Sprache: Datenquellen konfigurieren, Jobs steuern, Backends prüfen, Netzwerk-Diagnosen ausführen — alles im Chat statt über Formulare. 155+ Funktionen in 24 Kategorien, mit automatischer Tool-Auswahl durch den ReAct-Agent
  • Bestätigungs- und Wizard-System — destruktive Operationen erfordern explizite Bestätigung, mehrstufige Konfigurationen führen Schritt für Schritt durch die Parameter
  • Netzwerk-Diagnose — der Assistent kann beim Anbinden neuer Datenquellen selbstständig Verbindungsprobleme analysieren: Ping, Portscan, DNS-Lookup, SMB-Discovery, WebDAV-Check, HTTP-Check und Traceroute — direkt aus dem Chat heraus
  • Cloud-Backend-Kompatibilität — Admin-Chat funktioniert mit Ollama, Anthropic und OpenAI, inklusive Extended Thinking mit Live-Stream
  • Wiki und API-Katalog — integriertes Dokumentationssystem mit auto-generiertem API-Katalog (155+ Funktionen mit curl-Beispielen und Self-Check), kontextabhängiger Hilfe-Button in jedem Tab
  • Nachrichten-Persistenz — Chat-Verläufe mit Tool-Calls, Thinking-Blöcken und Usage-Daten werden gespeichert und beim Reload identisch dargestellt
Versionen 0.0.1+207 bis 0.0.1+222
23.–27. März 2026

Query-Expansion, Dashboard-Redesign und WebDAV-Browser

Intelligentere Suche und mehr Übersicht

  • Query-Expansion — LLM-basierte Suchbegriff-Erweiterung: Synonyme und Übersetzungen (DE/EN) werden automatisch generiert, mit Live-Anzeige im Chat
  • Dashboard komplett überarbeitet — 4 neue Widgets (KI-Backends nach Kategorie, Datenquellen nach Typ, VektorDB Größe+Chunks nach Modell, Jobs mit Live-Status)
  • WebDAV Verzeichnis-Browser — PROPFIND-basiertes Verzeichnis-Listing ohne Mount, analog zum bestehenden SMB-Browser
  • DB-Management Summenzeile — Gesamt-Chunks je Collection und Embedding-Modell auf einen Blick
  • KI-Backends Tabelle — Design an ExpandableTable angepasst (Header, Borders, Hover-Schatten, Kompakte-Ansicht)
  • Markdown-Tabellen im Chat — Pipe-Syntax mit Alignment wird korrekt gerendert
  • Embedding-Dimension bei Downtime — Fallback las gecachte Dimension nur bei bestandenem Health-Check, jetzt korrekt auch bei unerreichbarem Ollama
Versionen 0.0.1+188 bis 0.0.1+206
21. März 2026

Chat-UX-Offensive und Agent-Verbesserungen

Polierter Chat, robusterer Agent

  • Copy-Buttons — Code-Blöcke und gesamte Antworten mit einem Klick kopierbar, Clipboard-Fallback für HTTP-Verbindungen
  • Markdown-Headings im Chat — Überschriften (h1–h6) werden korrekt gerendert statt als Plaintext
  • Scroll-Verhalten — Auto-Scroll stoppt bei manuellem Hochscrollen und springt nicht mehr zurück
  • Thinking-Blöcke repariert — Ollama 0.18 liefert Reasoning-Content in einem neuen Feld statt als XML-Tags, alle drei Streaming-Pfade angepasst
  • Agent Tool-Call-Retry — bei Backend-Fehlern wiederholt der Agent Suchen automatisch (3 Versuche), fehlgeschlagene Calls blockieren nicht mehr die Loop-Detection
  • Hybrid-Retrieval Metadata-Filter — Dateityp- und Verzeichnis-Filter wirken jetzt auf alle drei Retrieval-Pfade (Vektor, BM25/ES, Graph), nicht nur auf die Vektorsuche
  • Separate Sessions — Chat-UI und Admin-UI verwenden getrennte Session-Cookies, gleichzeitiges Arbeiten in beiden Oberflächen möglich
  • Chat-Titel editierbar — Stift-Button in der History zum Umbenennen von Chats
  • Einzel-Job-Löschung — beendete Jobs können direkt aus dem Jobs-Tab gelöscht werden
Versionen 0.0.1+177 bis 0.0.1+186
18.–19. März 2026

Security-Audit und Härtung

Umfassendes Security-Audit mit 49 Findings — systematisch abgearbeitet

  • Security-Audit — 5 parallele Audit-Agenten, 49 Findings identifiziert und klassifiziert, interner Audit-Report
  • Path-Traversal-Fix — Backup-Restore-Endpoint gegen Directory-Traversal-Angriffe abgesichert
  • Session-Token-Hashing — Tokens werden als SHA-256-Hash in der DB gespeichert statt im Klartext
  • Cloud-API-Key-Verschlüsselung — API-Keys werden mit Fernet in YAML, ai_config und ki_backends verschlüsselt
  • DOMPurify integriert — Defense-in-Depth gegen XSS in Chat und Audit-Detailansicht
  • systemd-Hardening — ProtectHome, PrivateTmp, NoNewPrivileges für alle 4 Units
  • Auth-Tiering — saubere Trennung: Admin-Endpoints für Admins, Chat-Endpoints für User
  • GitHub-Readiness — Dual-Repo-Architektur mit automatischem Export-Filter für sensible Inhalte
  • 56 Security-Regressionstests — Backup-Traversal, Session-Invalidierung, Input-Limits, SQL-Härtung
Versionen 0.0.1+164 bis 0.0.1+176
17.–18. März 2026

PostgreSQL-Backend, Cache-Architektur und Code-Qualität

Skalierung nach oben und nach innen

  • PostgreSQL-Backend — CLI-Migrationskommando (kiara migrate-db), automatisches SQL-Rewriting, manuelle Konvertierungen in 30 Dateien
  • Cache-Tabellen-Architektur — 3 Cache-Tabellen mit vorberechneten JSON-Payloads, API-Endpoints lesen 1-2 SELECTs statt N+1-Queries, anlassbezogener und periodischer Refresh
  • VektorDB Datei-Management — neuer DB-Management-Tab mit Datenquellen-Matrix, Datei-Detailansicht, selektive Löschung mit Orphan-Prüfung
  • pgvector restlos entfernt — 7 Dateien gelöscht, Factory+HealthCheck+Frontend bereinigt, ~2400 Zeilen weniger
  • 5 Refactoring-Iterationen — 35+ Magic Values zentralisiert, Template-Method-Patterns, Cloud-Adapter-Basisklasse, 6 grosse Funktionen dekomponiert, ~80 Dateien überarbeitet
  • Jobs-Tab Flicker-Fix — In-place DOM-Patch statt vollem Re-Render bei Polling, expandierte Detail-Bereiche bleiben stabil
  • Ingestion-UX — Modell-Dropdown dient als Filter und Ingestion-Auswahl, Overlay-Bestätigung statt Modal
Versionen 0.0.1+152 bis 0.0.1+163
14.–16. März 2026

ERP-Konnektor-Schicht, Code-Qualität und DEB-Paketierung

Enterprise-Integration und Deployment

  • ERP-Konnektor-Schicht — neue Plugin-Architektur für ERP-Systeme: Odoo-Konnektor (XML-RPC, verifiziert gegen 322 Auftraege, 104k Produkte), Connection-Registry mit Fernet-Verschlüsselung, 8 Admin-API-Endpoints
  • Qdrant source_key-Feld — KEYWORD-Index für exakte Pfad-Matches (O(1) statt Full Scan bei 3,8 Millionen Punkten)
  • Embedding-Modell-Filter — neues Dropdown im Datenquellen-Tab zur Filterung nach Embedding-Modell
  • Pipeline-Dekomposition — die zentrale 470-Zeilen-Funktion wurde auf 65 Zeilen reduziert und in 9 testbare Einzelfunktionen aufgeteilt
  • DEB-Paketierung für Zielsysteme — Ubuntu 24.04-kompatibel, mit Auto-Start, Client-CLAUDE.md für KI-gestützte Administration auf Zielsystemen, und automatischer IP-Erkennung im Post-Install
Versionen 0.0.1+144 bis 0.0.1+151
11.–13. März 2026

Worker-Service, Such-Tab und IMAP-Turbo

Architektur-Meilenstein und neue Suchfunktionen

  • Worker-Service-Separation — die Ingestion läuft jetzt als eigener Systemdienst (Kiara-worker), unabhängig vom Web-Interface, mit Graceful Shutdown und Auto-Resume
  • Audit-Trail-Redesign — vollständige DSGVO-Nachvollziehbarkeit: der exakte Prompt, die vollständige KI-Antwort und alle Tool-Calls werden aufgezeichnet, mit Vollbild-Detailansicht und Druckfunktion
  • Neuer Such-Tab — die Wissensbasis ist direkt durchsuchbar: Text-Suche (Elasticsearch) und semantische Suche (Qdrant) mit Filtern nach Datenquelle, Dateityp, Verzeichnis und Datum, Ergebnisse direkt als Kontext an den Chat übergebbar
  • IMAP Batch-Fetch — E-Mails werden in 50er-Batches heruntergeladen statt einzeln (50x weniger Roundtrips), mit automatischem Reconnect bei Verbindungsverlust
  • Paralleler IMAP-Scan — Mail-Download läuft im Hintergrund, während die Verarbeitung bereits auf gecachten Dateien startet
  • Auto-Wait bei Backend-Ausfall — die Pipeline wartet auf Backend-Recovery statt abzubrechen
  • VektorDB-Management — dynamische Modell-Spalten zeigen Chunks pro Embedding-Modell
Versionen 0.0.1+132 bis 0.0.1+143
9.–10. März 2026

Backend-Warmup, parallele Tool-Calls und intelligentere Suche

Performance und Robustheit auf einem neuen Level

  • Backend-Warmup vor Ingestion — KI-Modelle werden vor der Verarbeitung "aufgewaermt", damit der erste Request nicht minutenlang dauert
  • Parallele Agent-Tool-Calls — der Agent fuehrt jetzt mehrere Suchen gleichzeitig aus statt nacheinander — deutlich schnellere Antworten
  • n:m Chunk-Datenquellen-Beziehung — identische Dateien in mehreren Datenquellen werden nur einmal gespeichert, aber allen zugeordnet
  • Array-basierter Pre-Filter — Datenquellen-Berechtigungen direkt in der Vektorsuche statt nachgelagertem Filter (0 MB statt 160 MB RAM pro Anfrage)
  • Content-basierte Hash-Invalidierung — E-Mail-Resync erkennt Änderungen am Dateiinhalt, nicht nur am Zeitstempel
  • Audit-Trail vollständig — alle Chat-Modi loggen jetzt lueckenlos in die Audit-Datenbank
  • Agent Final-Rerank — gesammelte Suchergebnisse werden vor der Antwort nochmals bewertet und irrelevante Chunks entfernt
  • Tilde-Datei-Filter — Office-Lock-Dateien (~$doc.docx) werden herausgefiltert, bevor sie die Pipeline stoeren
Versionen 0.0.1+114 bis 0.0.1+131
6.–8. März 2026

Kontext-Limits, Ingestion-Monitoring und Backend-Management

Mehr Kontrolle, mehr Transparenz

  • Globales Chunk-Cap — schuetzt vor Kontextfenster-Überlauf bei vielen Suchergebnissen (konfigurierbar, Default 80 Chunks)
  • Agent Final-Prompt editierbar — der Instruktions-Prompt der Agent-Antwort ist jetzt über die Admin-UI anpassbar
  • Per-File Ingestion-Monitoring — für jede einzelne Datei sichtbar: Parser, Chunk-Strategie, Chunk-Anzahl, Dauer, Status und Fehlermeldungen
  • Live-Dateiname — während der Verarbeitung wird die aktuelle Datei unter dem Fortschrittsbalken angezeigt
  • Config-Changelog — Audit-Trail für alle Konfigurationsänderungen
  • Multi-Embedding-Modell-Management — modellspezifisches Failover mit Health-Cache, CLI mit --embedding-model
  • Circuit-Breaker — die Pipeline bricht nach 10 aufeinanderfolgenden Infrastrukturfehlern automatisch ab, statt sinnlos weiterzuarbeiten
  • DDU Pre-flight Check — vor der Dokumentenverarbeitung wird geprüft, ob das OCR-Backend erreichbar ist
Versionen 0.0.1+98 bis 0.0.1+113
4.–5. März 2026

Thinking-Modus, Elasticsearch und Agent-Intelligenz

Kiara denkt jetzt laut — und durchsucht besser

  • Thinking-Modus — die KI zeigt live ihren Denkprozess (Chain of Thought), ein-/ausschaltbar per Toggle
  • Elasticsearch als Hybrid-Suche — neben BM25 jetzt auch Elasticsearch für hochperformante Keyword-Suche mit Fuzziness-Kontrolle
  • Agent-Loop-Detection — der Agent erkennt, wenn er sich im Kreis dreht, und bricht sinnlose Wiederholungen ab
  • Parent-Document-Retrieval — bei kleinen Dokumenten werden automatisch alle Chunks geladen, nicht nur die besten Treffer
  • Temperature-Slider — steuert die Kreativität der KI im Unchained-Modus
  • Sibling-Chunk-Expansion — benachbarte Textabschnitte werden automatisch mitgeladen für vollständigeren Kontext
  • BM25 Hybrid-Search endlich verdrahtet — die Keyword-Suche war implementiert aber nicht aktiv — jetzt werden z.B. Rechnungen nach Firmenname gefunden
Versionen 0.0.1+84 bis 0.0.1+97
2.–3. März 2026

Agentic RAG, Exchange Online und Datenquellen-Filter

Die KI lernt, selbstständig zu handeln

  • Backend-agnostisches Agentic RAG — der Agent-Modus funktioniert jetzt mit allen drei LLM-Backends (Ollama, Anthropic, OpenAI), jedes mit nativer Tool-Use-Integration
  • Exchange Online-Konnektor — Microsoft 365 Postfächer via OAuth2/Entra ID als Datenquelle
  • Multi-Select Datenquellen-Filter — mehrere Datenquellen im Chat gezielt auswählbar, einzelne Quellen per NOT-Toggle ausschließbar
  • Verbindungstest vor dem Speichern — Datenquellen-Verbindungen lassen sich direkt im Formular testen
  • Content-basierte Dateierkennung — auch .log, .conf und andere Textdateien ohne Standardendung werden jetzt erkannt und indexiert
  • Cloud-Backend-Fehler-Feedback — explizite Fehlermeldungen statt stiller Fallbacks
  • HashStore-Migration — Datei-Hashes in einer dedizierten Datenbank statt JSON für schnellere Verarbeitung großer Datenmengen
Versionen 0.0.1+56 bis 0.0.1+83
28. Februar – 1. März 2026

Job-Queue, Anonymisierung und drei Chat-Modi

Kiara wird zum Enterprise-Tool

  • Persistente Job-Queue — Ingestion-Auftraege überleben Service-Neustarts, mit Cron-Scheduling, Pause/Resume und detaillierter Historie
  • Drei Chat-Modi — Standard (RAG-gestützte Antworten), Unchained (freies LLM ohne Dokumentenkontext) und Agent (ReAct-Loop mit Tool-Use — die KI kann aktiv suchen und rechnen)
  • Anonymisierungsmodul — Aho-Corasick-Engine für 50.000+ Entitaeten, DSGVO-konforme Pseudonymisierung, LLM-basierte PII-Erkennung als vierte Schutzschicht
  • Cloud-KI-Backends — Anthropic Claude und OpenAI GPT als alternative LLM-Backends, mit Budget-Tracking und Audit
  • Cross-Encoder-Reranking — Suchergebnisse werden mit einem spezialisierten Modell nachsortiert für präzisere Antworten
  • Token-Anzeige im Chat — Live-Anzeige der Kontextfenster-Auslastung
  • Kontextfenster-Slider — steuert, wie viel Kontext die KI verarbeiten soll (1K–40K Tokens)
  • LLM-Backend-Auswahl — direkt im Chat waehlbar, welches KI-Modell antworten soll
  • System-Selbsttest — automatisierte Test-Suite direkt aus der Admin-UI startbar
Versionen 0.0.1+34 bis 0.0.1+55
26.–27. Februar 2026

Plugin-System, Web-Crawler und das grosse Rebranding

Ein historischer Meilenstein — aus OpenRAG wird Kiara

  • Rebranding zu Kiara — "KI-Assistenz für Retrieval und Analyse" — neuer Name, neues Branding, 361 Dateien aktualisiert
  • Plugin-Architektur für Konnektoren — Datenquellen-Konnektoren sind jetzt als Plugins erweiterbar, mit automatischer Erkennung und datengetriebener Admin-UI
  • Web-Crawler-Plugin — Websites als Datenquelle: BFS-Crawling mit robots.txt-Respekt, Sitemap-Parsing und HTML-zu-Markdown-Konvertierung
  • MCP-Server — Kiara spricht jetzt das Model Context Protocol — Integration mit VS Code, Claude Desktop und Cursor möglich
  • Multi-Backend-Verwaltung — beliebig viele KI-Backends (Ollama, Anthropic, OpenAI) mit automatischem Failover und Round-Robin
Versionen 0.0.1+18 bis 0.0.1+33
24.–25. Februar 2026

Wissensgraph, drei VectorDB-Backends und E-Mail-Indexierung

Kiara wird deutlich leistungsfähiger

  • GraphRAG-Wissensgraph — Kiara erkennt jetzt Zusammenhänge zwischen Entitaeten (Kunden, Lieferanten, Auftraege) und nutzt diese als dritte Retrieval-Quelle neben Vektor- und Keyword-Suche
  • E-Mail-Indexierung — IMAP-Postfächer als Datenquelle: Mails und Anhaenge werden automatisch verarbeitet
  • SQL-Datenbanken — MSSQL, PostgreSQL, MySQL und SQLite als Wissensquellen anbindbar
  • ERP-Integration — erste Anbindung an Unternehmensdaten (Auftraege, Lagerbestand, Kunden)
  • Dokumenten-Workflows — automatische Zusammenfassungen, Template-basierte Reports, Export als PDF/DOCX
  • DSGVO-Compliance-Dashboard — Verarbeitungsverzeichnis, Datenschutz-Folgenabschätzung und Audit-Trail
  • Automatische Chunk-Strategie — Kiara erkennt, ob ein Dokument Prosa, Tabelle, Code oder E-Mail ist, und passt die Verarbeitung entsprechend an
  • Deep Document Understanding — optionaler layout-aware PDF-Parser mit OCR für gescannte Dokumente
Versionen 0.0.1+12 bis 0.0.1+17
21.–23. Februar 2026

Projektstart: Kiara erblickt das Licht der Welt

Die erste Version der Unternehmens-KI-Plattform geht an den Start

  • RAG-Engine mit Hybrid-Retrieval — Dokumente werden intelligent durchsucht, nicht nur per Stichwort, sondern auch nach Bedeutung
  • Web-Chat-Interface auf Port 8501 — Unternehmensdaten lassen sich direkt im Browser abfragen
  • Admin-Dashboard auf Port 8502 — volle Kontrolle über Datenquellen, Status und Konfiguration
  • Multi-Datenquellen — lokale Verzeichnisse, SMB-Netzlaufwerke und WebDAV (Nextcloud) als Wissensquellen
  • Live-Fortschrittsanzeige bei der Dokumentenverarbeitung
  • Multi-Embedding-Modell-Architektur — verschiedene KI-Modelle für verschiedene Einsatzzwecke
  • Konfigurierbares Prompt-Template — der Charakter der KI lässt sich an das Unternehmen anpassen
  • .deb-Paketierung — einfache Installation auf Ubuntu/Debian-Systemen
Versionen 0.0.1+1 bis 0.0.1+11
Kiara Logo KIara

KI-Assistenz für Retrieval und Analyse

Features Use Cases Architektur What's New Wiki Kontakt Impressum Datenschutz

© 2026 Kiara. Open Source unter AGPL-3.0-Lizenz.