What's New — Kiara

11. Mai 2026

Codequalitäts-Offensive: Linter, Quality-Gate und reproduzierbare Builds

Eine Woche systematische Investition in Entwickler-Werkzeuge — Tests werden schneller verlässlich, Abhängigkeiten endlich gepinnt

Ruff als Linter und Formatierer — Kiara nutzt jetzt Ruff für statische Code-Analyse: F821-Funde, Bugbear-, SIM- und RUF-Regeln werden automatisch geprüft, der Formatierer hält den Stil über die gesamte Codebasis konsistent
Pre-commit-Hook installierbar — vor jedem Commit laufen Lint, Format-Check und Smoke-Tests gegen die geänderten Dateien. Fehler werden gefangen, bevor sie ins Repository wandern
CI-Quality-Gate auf Gitea — neuer Workflow .gitea/workflows/quality.yml prüft jeden Push und Pull-Request: Linter, Format, Compile-Check, Smoke-Tests und Test-Collection (6548 Tests). Runtime-venv und Dev-Tool-venv sind sauber getrennt
Dependency-Single-Source — pyproject.toml ist jetzt die führende Quelle für alle Runtime-Dependencies, requirements.txt wird daraus generiert. Drift zwischen verschiedenen Manifest-Dateien wird vom Quality-Gate verhindert
Reproduzierbare Lockfiles — Runtime- und Dev-Abhängigkeiten sind in requirements.lock gepinnt, inklusive CPU-only Torch/Torchvision. Deploy-, Debian- und ISO-Installationspfade nutzen alle dieselbe Lockfile — gleiche Versionen auf Entwicklungs-, Test- und Produktionssystem
Lokales Docling entfernt — die schwergewichtige Docling-Bibliothek ist aus der KIara-Runtime ausgebaut, Document-Understanding läuft jetzt ausschließlich gegen Remote-DDU-Backends. Schlankeres Paket, schnellerer Start, weniger transitive Abhängigkeiten

Versionen 0.0.1+453 bis 0.0.1+460

3.–4. Mai 2026

Crash-Forensik: kein toter Worker bleibt mehr unsichtbar

Wenn ein Hintergrund-Prozess stirbt, weiß Kiara jetzt warum — mit Stack-Trace, OOM-Korrelation und Netzlaufwerks-Diagnose

Worker-Death-Watcher — ein neuer Systemdienst beobachtet alle 5 KIara-Services parallel. Stirbt ein uvicorn-Sub-Worker (vorher unsichtbar, weil OnFailure-Hooks nur bei Master-Tod greifen), persistiert der Watcher einen vollständigen Kontext-Snapshot: dmesg-Tail, CIFS-Mounts, cgroup-Memory-Stats und journal-Tail
Faulthandler und Coredump-Pipeline — bei fatalen Signalen (SIGSEGV, SIGABRT, SIGBUS) wird ein Multi-Thread-Stack-Trace in journald geschrieben. Per SIGUSR1 lässt sich der Stack hängender Worker live abrufen, ohne den Prozess zu beenden — entscheidend für CIFS-D-State-Diagnose
CIFS-Korrelation und OOM-Erkennung — der Watcher erkennt heuristisch, ob ein Worker an einem hängenden Netzlaufwerk gestorben ist (reason=cifs_unreachable_correlation) oder vom Linux-OOM-Killer beendet wurde, und protokolliert das strukturiert
Frontend-Beacon — reißt ein SSE-Chat-Stream im Browser ab, sendet die Chat-UI eine Diagnose-Nachricht ans Backend. Damit landen auch client-seitige Stream-Probleme im System-Log statt nur als "Netzwerkfehler" beim Anwender
Drei Audit-Runs — Cursor-Persistenz überlebt jetzt SIGKILL und OOM, der Watcher-Thread terminiert nach fünf konsekutiven Fehlern für systemd-Restart, KV-Injection im Beacon ist blockiert. 77 neue Tests sichern die Audit-Findings ab
Postinst-Integration — der Watcher wird beim apt install automatisch aktiviert und gestartet, kein manuelles Enable mehr nötig

Versionen 0.0.1+446 bis 0.0.1+452

1.–2. Mai 2026

Reranking auf festem Fundament und durchgängige Traces

Cross-Encoder-Reranking läuft jetzt verlässlich, der Trace-Explorer zeigt die volle Aufruf-Hierarchie

Reranking voll funktional — sentence-transformers ist von Optional-Extra zu Core-Dependency aufgestiegen, ein Eager-Import-Check beim Start verhindert, dass Reranking-Features ohne funktionierenden Cross-Encoder aktiv werden. Torch wird CPU-only installiert — ~1.5 GB CUDA-Wheels gespart, schlankeres ISO
Deploy schützt HuggingFace-Cache — rsync mit --delete hat bisher bei jedem Deploy den Modell-Cache geleert, der Reranker meldete bis zum nächsten Lazy-Load "degraded". Der .cache-Pfad ist jetzt vor dem Delete-Sweep geschützt
Einheitliche Trace-Hierarchie — Spans aus dem Tool-Pfad (Hybrid-, Semantic-, Keyword-, Graph- und ColBERT-Retrieval, RRF-Fusion, Rerank) starteten bisher als eigene Root-Traces, weil der OpenTelemetry-Kontext beim Wechsel in den Worker-Thread verloren ging. Jetzt teilen sich alle Spans einer Chat-Anfrage eine trace_id — der Wasserfall im Trace-Explorer zeigt rund 15 verschachtelte Children unter agent_query
Strukturiertes Backend-Error-Logging — LLM-Backend-Fehler (Ollama 503, Anthropic-Rate-Limits, Tool-Adapter-Crashes) landen jetzt mit vollem Traceback in system_events und sind im Admin-UI System-Log-Tab nach Mode (agent / standard / rewriter / unchained) filterbar. Frontend zeigt weiterhin verständliche Meldungen, Admins haben aber endlich die Diagnose-Daten
Spezialisierte Retrieval-Optimierungen toggelbar — die Rechnungsnummern-Gruppierung des Agenten ist jetzt im KI-Retrieval-Tab unter "Spezialisierte Optimierungen" ein- und ausschaltbar (für A/B-Tests)
WebDAV-Service-Hardening — systemd-Units der KIara-Dienste durften /etc/davfs2 nicht beschreiben, WebDAV-Ingestion brach mit "Read-only file system" ab. Der Pfad ist jetzt in ReadWritePaths aller fünf Units

Versionen 0.0.1+435 bis 0.0.1+445

25.–30. April 2026

BugScan Run 4: 262 verifizierte Bugs systematisch geheilt

Die vierte und bislang gründlichste Code-Analyse — 15 Modul-Scans, Block-für-Block-Aufräumen über alle Schichten

BugScan Run 4 — zwei parallele Analyse-Agenten (Codex GPT-5.5 xhigh und Claude Opus) haben 299 Roh-Findings produziert, daraus wurden 262 verifizierte Bugs konsolidiert und als Gitea-Issues angelegt. Anschließend Block für Block abgearbeitet: Datenintegrität, Retrieval-Korrektheit, Tool-Berechtigungen, Backup-Manifeste, Graph-Konsistenz
Daten- und Retrieval-Härtung — semantische Suche entfernt spekulativen Total-Fallback und ist fail-closed; Sibling-Expansion respektiert das Kontext-Cap; graph_edges ist pro source_id/target_id/relation/source jetzt eindeutig (ERP-Import idempotent); SQL-Inkrementalfilter kapselt SELECTs als Subquery gegen ORDER-BY-Injection
SSRF- und DNS-Rebinding-Schutz — ein zentraler http_pinning-Helper schützt Webcrawler und DDU-Backend vor TOCTOU-Angriffen: DNS-Auflösung passiert einmal, die aufgelöste IP wird für den gesamten Request gepinnt. Plus: Redirect-Ziele werden nach httpx-Follow erneut gegen Domain-Scope und SSRF-Allowlist geprüft
OnlyOffice und Backup gehärtet — Editor-Konfigurationen werden serverseitig erzeugt und JWT-signiert (#1098); OnlyOffice-Callbacks für Save-Status laden den Speicherstand nur vom konfigurierten Document-Server (#1123); Backup-Restore mit force=True kann Manifest- und SHA256-Prüfungen nicht mehr umgehen (#1109)
Admin-Aktionen mit Bestätigungs-Pflicht — HTTP-Routen für AdminFunctions mit requires_confirmation führen nicht mehr direkt aus, sondern liefern einen Confirmation-Token. ToolRegistry nutzt die tools.permissions-Matrix autoritativ für alle nicht eingebauten Tools (#1117)
LDAP-Gruppen über objectSid identifiziert — cn/name/dn sind jetzt nur noch aktualisierbare Anzeige-Attribute, die technische Identifizierung läuft über die unveränderliche objectSid. Umbenannte Gruppen behalten ihre ACL-Bindungen
Auto-Fix-Batches Medium/Low — 98 weitere Issues über 134 Dateien direkt gefixt, plus zwei Selbsttest-Sanierungs-Sprints (72 → 0 Failures und nochmals 37 → 0 Failures). 5574 Tests grün

Versionen 0.0.1+392 bis 0.0.1+434

24.–25. April 2026

Content-Security-Policy strikt: kein inline-JavaScript mehr

Das Admin-UI nutzt jetzt durchgängig sichere Event-Delegation — strikte CSP als Default

Staged Strict-CSP-Rollout — Request-spezifische Nonces und ein konfigurierbares Gate ermöglichen, die Content-Security-Policy schrittweise schärfer zu stellen. Vorher war unsafe-inline aktiv, jeder XSS-Vektor direkt ausnutzbar. Jetzt sind inline-Skripte nur noch mit gültiger Nonce erlaubt
Migration von inline-Events — repo-weiter Umbau von onclick="..."-Attributen auf ein data-action-Dispatcher-Pattern. Welle 2 hat in vier Batches 11 Module finalisiert (Chat, KI-Modelle, Datenquellen, Jobs, LDAP, Testsuite, Compliance, ...); Welle 3 lief mit acht parallelen Agenten über UI-Core und Admin-Core
Observation und Default-Flip — Welle 4 schaltete die strikte CSP zuerst in den Report-Only-Modus, damit verbliebene Verstöße im Browser sichtbar wurden, ohne den Betrieb zu blockieren. Welle 5 hat csp_strict=true als Default gesetzt — die strikte Policy ist jetzt der Normalfall
ExpandableTable-Root-Cause — der interactive-cell-Guard hatte einen Bug: Klicks auf Toggle-Buttons in Tabellen-Zellen lösten Expand-Animationen aus statt der Toggle-Aktion. Root-Cause-Fix beseitigt eine ganze Klasse von UI-Flicker-Problemen in den Admin-Tabs
Wiki-Template-Reststyles entfernt — vier Wiki-Guides hatten inline-Styles im Markup, die unter strikter CSP nicht mehr erlaubt sind. Die Regeln sind jetzt sauber in wiki.css

Versionen 0.0.1+379 bis 0.0.1+391

21.–24. April 2026

CSRF-Defense-in-Depth, ERP-Graph-Sync und strukturiertes System-Log

Mehr Schutz an der Web-Auth, ein robusterer Wissensgraph und Security-Events in der Datenbank

Admin-System-Log — ein neuer Sub-Tab unter System zeigt strukturierte kiara.security-Events aus der neuen system_events-Tabelle. Vorher lebten Security-Logs nur in Dateien, jetzt sind sie filterbar, durchsuchbar und überleben Log-Rotation. Grundlage für viele spätere Diagnose-Verbesserungen
CSRF-Defense-in-Depth V18 — Synchronizer-Token gegen Cross-Site-Request-Forgery plus Origin-Validation für state-ändernde Requests. Post-Implementation-Scan fand sechs Spec-Abweichungen, die direkt gefixt wurden; Medium-Followups schliessen 6 weitere Edge-Cases mit dedizierter Test-Abdeckung
ERP-Graph-Sync V28 — idempotente Schema-Migration für graph_edges.source und Node-/Edge-Chunk-Junctions, bulkbasierte Upserts. Drei Follow-up-Cluster (15 Issues) härten die Heuristiken, fügen 19 neue Tests hinzu und reparieren einen Test-Pfad, den der erste Implementations-Scan übersehen hatte
Connector-Browse vereinheitlicht — Local-, SMB- und WebDAV-Konnektoren teilen sich jetzt eine zentrale list_directory-Capability, der Admin-Chat und der Web-Picker sind fail-closed abgesichert, WebDAV-Pfad-Behandlung normalisiert (#1278)
Selbsttest-Sprint — 72 Failures auf 0 reduziert, mit 11 echten Prod-Bugs aus Schema-Drift und int-vs-bool-Mismatches als Nebenbeute. 5574 Tests grün
BugScan Run 4 vorbereitet — Prompts für die kommende Code-Analyse-Welle wurden auf die neue ui_core-Struktur und SharedUI-Namen umgestellt — die Voraussetzung für die 262 verifizierten Bugs in der Folgewoche

Versionen 0.0.1+358 bis 0.0.1+378

18.–20. April 2026

Geteilte UI-Bibliothek und robuste Ausfall-Erholung

Chat-UI und Admin-UI teilen sich jetzt eine gemeinsame Grundlage — und Qdrant-Ausfälle werden sauber abgefangen

Shared UI-Bibliothek — sechs Sprints haben Chat-UI und Admin-UI auf eine gemeinsame Basis gehoben: einheitliche Farben und Themes, zentrale Benachrichtigungen, Modals mit Fokus-Falle, wiederverwendbare Tabellen und Formulare. Ergebnis: konsistentes Aussehen, weniger Duplikate, bessere Barrierefreiheit
Chat-Bausteine teilen — die Chat-Oberfläche und der Admin-Chat nutzen intern dieselbe Komponenten-Bibliothek. Neue Chat-Features erscheinen künftig automatisch in beiden UIs
Qdrant-Ausfälle überstehen — fällt die Vektordatenbank während eines Indexierungs-Laufs aus, pausiert der Worker jetzt kontrolliert und nimmt die Arbeit nach der Erholung wieder auf, statt den ganzen Job abzubrechen
Dichtere Security-Masken — der Qdrant-API-Key wird in den Admin-Einstellungen nicht mehr angezeigt, LDAP-Fehlerpfade geben keine Rückschlüsse mehr auf gültige Benutzer preis

Versionen 0.0.1+347 bis 0.0.1+357

14.–17. April 2026

Sicherheits-Offensive und PostgreSQL-only

BugScan Run 3, komplette SQLite-Entfernung, Cloud-Audit ohne Zeitheuristik

BugScan Run 3 — eine dritte, noch breiter angesetzte Code-Analyse hat 406 Befunde zusammengetragen und Schritt für Schritt abgearbeitet: SSRF-Guards, Path-Traversal-Fixes, Race-Condition-Härtung, TOCTOU-Schutz, StartTLS Fail-Secure und viele kleinere Verbesserungen
SQLite endgültig entfernt — Überreste aus der SQLite-Ära sind komplett ausgebaut: Konnektor-Dialog, Backup-Pfade, Doku und Wiki sprechen jetzt ausschließlich PostgreSQL
Cloud-Audit zuverlässiger — die Zuordnung von anonymisierten Anfragen zum Cloud-Aufruf lief bisher über Zeitheuristik. Jetzt wird eine eindeutige Korrelations-ID mitgeführt, die auch bei parallelen Requests sauber matcht
Stärkerer Wizard und ERP-Sync — Wizard-Geheimnisse landen verschlüsselt in der Datenbank, der ERP-Graph-Sync ist idempotent und übersteht Fehler beim Halbzustand sauber

Versionen 0.0.1+335 bis 0.0.1+346

12.–14. April 2026

Code-Qualitätsoffensive und ColBERT-Aufräumer

Systematische Bug-Jagd, saubere Testsuite und ein Modellwechsel ohne Altlasten

BugScan Run 2 — systematische Code-Analyse auf vier Schweregraden hat rund 300 Findings aufgedeckt und rund 260 davon automatisch behoben. Schwerpunkt: Eingabe-Validierung, Race-Conditions, sichere Textausgabe im Frontend
Testsuite wieder bei null Fehlern — von 132 auf 0 fehlschlagende Tests. Die Admin-UI-Selbstdiagnose läuft erstmals wieder vollständig grün
ColBERT-Modellwechsel ohne Altlasten — wird das ColBERT-Modell umgestellt, räumt Kiara jetzt die alten Daten selbst auf. Bei Unsicherheit lässt sich der Cleanup manuell anstoßen — mit Dry-Run-Vorschau im Admin-UI oder per CLI
Tracing ein-/ausschalten per Klick — im Traces-Tab gibt es einen Toggle, der das OpenTelemetry-Tracing umschaltet und den Dienst automatisch neu startet. Kein Config-Editieren mehr
Weniger Overhead in der Suche — die Keyword-Suche hat doppelt überzogen und mehr Kandidaten geladen als nötig. Jetzt ist die Menge passend zur Ergebnisgröße

Versionen 0.0.1+324 bis 0.0.1+334

8.–11. April 2026

Stabilere Admin-UI, eigener Installer und Wiki-Fundament

Weniger Glitches in der Admin-UI — und ein Installer, der endlich zum Produkt passt

Admin-UI Robustheit — Polling, Button-Sperren und Tab-Wechsel sind zentralisiert. Doppelklicks lösen keine doppelten Aktionen mehr aus, Tabs verlieren beim Wechseln keine Daten mehr, und Fehler aus dem Backend landen sichtbar in Benachrichtigungen statt lautlos zu verschwinden
Härter gegen XSS — alle Textausgaben im Admin-Bereich werden kontextabhängig escapet, inline-JavaScript wurde flächendeckend durch sichere Event-Delegation ersetzt
Eigener Appliance-Installer — der Debian-Installer ist durch einen schlanken Dialog-Assistenten ersetzt: Festplatte wählen, Tastaturlayout, Zeitzone, Sprache — fertig. Funktioniert komplett offline mit lokalen Paketquellen
LLM-Wiki-Fundament — das Gerüst für automatisch generierte Wiki-Seiten aus den eigenen Datenquellen wird angelegt. Die Entwicklung läuft mittlerweile eigenständig weiter

Versionen 0.0.1+306 bis 0.0.1+323

5.–7. April 2026

Pipeline-Baukasten und Ausfallsicherheit

Kiara lernt, mit ausgefallenen Backends umzugehen — ohne Chat-Abstürze

Graceful Degradation — fällt ein Backend (Ollama, Datenbank, LDAP) aus, zeigt Kiara ein gelbes Warning-Banner im Chat statt zu crashen. Erholt sich der Dienst, verschwindet die Meldung von selbst. Optionale E-Mail an den Admin bei Ausfall
Ingestion als Baukasten — die Datei-Verarbeitung ist in eigenständige Module zerlegt: Loader (25+ Dateiformate), Hash-Management und Pipeline-Steuerung lassen sich einzeln testen und erweitern
Schnellere Integritätsprüfung — ein Engpass mit hunderten Datenbank-Abfragen ist behoben, die Prüfung läuft jetzt um ein Vielfaches schneller
Saubereres Chat-Streaming — Metriken, Audit-Einträge und Cloud-Routing werden einheitlich geloggt, unabhängig vom gewählten Backend

Versionen 0.0.1+289 bis 0.0.1+305

4.–5. April 2026

Trace Explorer, Late Chunking und ColBERT

Drei neue Retrieval-Verfahren und vollständige Observability

Trace Explorer — neuer System-Subtab mit Wasserfall-Ansicht, Vergleichsmodus, Histogramm (P50/P95/P99), 7 Filter-Felder, CSV/JSON-Export. Per-Pipeline Tracing, optionaler OTLP-Exporter
Chat-UI Debug-Modus — Trace-Timing-Bar zeigt Retrieval-, Reranking- und Generierungsdauer pro Antwort
Late Chunking — Embedding auf Dokumentebene: der vollständige Text wird verarbeitet, Chunk-Vektoren anschließend aus Token-Positionen extrahiert. Kontextreichere Embeddings ohne größere Chunks
ColBERT Multi-Vector Retrieval — 4. Retrieval-Quelle: jedes Token bekommt einen eigenen Vektor, Ähnlichkeit per MaxSim über alle Token-Paare. Eigene Qdrant-Collections, Circuit-Breaker in der Pipeline

Versionen 0.0.1+283 bis 0.0.1+288

2.–3. April 2026

Prompt-Defense, Contextual Retrieval und Testsuite auf 0 Failures

Dreischichtiger Angriffsschutz, intelligenteres Chunking und eine saubere Testsuite

Prompt-Injection-Defense — dreistufiger Schutz (Input-Sanitizing, Context-Tagging, System-Prompt-Hardening) für alle Chains. Audit-Logging mit Severity-Klassifikation, eigener Compliance-Subtab
Contextual Retrieval — vor dem Embedding wird jeder Chunk durch ein LLM mit Kontext angereichert. Konfigurierbar pro Datenquelle, mit Prompt-Versionierung und Integritätsprüfung
Prompt-Versionierung — History-Tabelle mit SHA256-Hashes, Rollback auf frühere Versionen, History-Ansicht in der Admin-UI
Anonymizer als Bibliothek — Kernlogik als eigenständiges Subpackage extrahiert, alle Importpfade über Compat-Shims erhalten
Testsuite auf 0 Failures — von 829 auf 0 Failures: 3934 Tests bestehen, asyncio-Migration in 31 Dateien
DS-Zugriffskontrolle in Elasticsearch — terms-Filter direkt in ES statt Post-Query-Filterung

Versionen 0.0.1+257 bis 0.0.1+282

31. März – 1. April 2026

LLM-Backend-Abstraktion, Wiki-Guides und Datenschutz-Steuerung

Einheitliche Backend-Architektur und umfassende Dokumentation

LLM-Backend-Abstraktion — einheitliches LLMBackend-Interface für alle Chains (RAG, Unchained, Rewriter, Agent). Dependency Injection statt eigener Backend-Erzeugung, Shared Cloud-Routing mit automatischer Anonymisierung
Restriction-Level pro Datenquelle — dreistufiges Datenschutz-Modell (public/anonymize/blocked) steuert, welche Daten an Cloud-Backends gesendet werden. Trusted-Flag pro Backend für vertrauenswürdige Anbieter
Wiki-Guides mit Inhalt — 9 ausführliche Guide-Seiten (Benutzerverwaltung, Datenquellen, Jobs, VektorDB, KI, Tools, Compliance, System, Admin-Chat)
Guided Workflows im Admin-Chat — 4 Setup-Assistenten (LLM-Backend, Datenquelle, Ingestion, Ersteinrichtung) führen schrittweise durch die Konfiguration
Integritäts-Tab Redesign — ExpandableTable mit Detail-Renderern, Collection-Rebuild (Snapshot/Drop/Restore), Multi-Modell-Checks
File-Size als Single Source of Truth — Dateigrößen ausschließlich in file_hashes, denormalisierte Spalten entfernt

Versionen 0.0.1+236 bis 0.0.1+257

29.–30. März 2026

Integritätsprüfung, System-Monitor und Cloud-Embeddings

Neue Diagnose-Werkzeuge und Infrastruktur

Integritätsprüfung — neuer System-Subtab mit 5 Konsistenz-Checks, 3 Repair-Funktionen (ds_ids-Sync, Orphan-Cleanup, Metadaten-Rekonstruktion), Background-Thread mit Fortschrittsanzeige
System-Monitor — ersetzt den Health-Tab: Live-SSE-Stream (CPU, RAM, Swap, Load, Netzwerk, Plattenplatz), Chart.js-Diagramme mit History (1h bis 1 Jahr), Service-Management und Journal-Fehler
Cloud-Embedding-Provider — OpenAI und Voyage AI als Embedding-Backends neben Ollama, mit Probe-Embedding-Test und Batch-Limits
Appliance-ISO — bootfähiges Installationsimage via Debian live-build, First-Boot-Wizard mit 10 Schritten, Qdrant als native Binary, Kiara-Branding im Bootscreen
Admin-Chat Bugfix-Sprint — 13 Fixes (LDAP-Fehlertoleranz, atomare User-Deaktivierung, Session-Invalidierung bei Passwort-Reset, crash-sichere DS-Löschung)

Versionen 0.0.1+223 bis 0.0.1+235

27.–29. März 2026

Admin-Chat und Wiki

Die Admin-UI wird konversationell — und dokumentiert sich selbst

Admin-Chat — Kiara verwalten per natürlicher Sprache: Datenquellen konfigurieren, Jobs steuern, Backends prüfen, Netzwerk-Diagnosen ausführen — alles im Chat statt über Formulare. 155+ Funktionen in 24 Kategorien, mit automatischer Tool-Auswahl durch den ReAct-Agent
Bestätigungs- und Wizard-System — destruktive Operationen erfordern explizite Bestätigung, mehrstufige Konfigurationen führen Schritt für Schritt durch die Parameter
Netzwerk-Diagnose — der Assistent kann beim Anbinden neuer Datenquellen selbstständig Verbindungsprobleme analysieren: Ping, Portscan, DNS-Lookup, SMB-Discovery, WebDAV-Check, HTTP-Check und Traceroute — direkt aus dem Chat heraus
Cloud-Backend-Kompatibilität — Admin-Chat funktioniert mit Ollama, Anthropic und OpenAI, inklusive Extended Thinking mit Live-Stream
Wiki und API-Katalog — integriertes Dokumentationssystem mit auto-generiertem API-Katalog (155+ Funktionen mit curl-Beispielen und Self-Check), kontextabhängiger Hilfe-Button in jedem Tab
Nachrichten-Persistenz — Chat-Verläufe mit Tool-Calls, Thinking-Blöcken und Usage-Daten werden gespeichert und beim Reload identisch dargestellt

Versionen 0.0.1+207 bis 0.0.1+222

23.–27. März 2026

Query-Expansion, Dashboard-Redesign und WebDAV-Browser

Intelligentere Suche und mehr Übersicht

Query-Expansion — LLM-basierte Suchbegriff-Erweiterung: Synonyme und Übersetzungen (DE/EN) werden automatisch generiert, mit Live-Anzeige im Chat
Dashboard komplett überarbeitet — 4 neue Widgets (KI-Backends nach Kategorie, Datenquellen nach Typ, VektorDB Größe+Chunks nach Modell, Jobs mit Live-Status)
WebDAV Verzeichnis-Browser — PROPFIND-basiertes Verzeichnis-Listing ohne Mount, analog zum bestehenden SMB-Browser
DB-Management Summenzeile — Gesamt-Chunks je Collection und Embedding-Modell auf einen Blick
KI-Backends Tabelle — Design an ExpandableTable angepasst (Header, Borders, Hover-Schatten, Kompakte-Ansicht)
Markdown-Tabellen im Chat — Pipe-Syntax mit Alignment wird korrekt gerendert
Embedding-Dimension bei Downtime — Fallback las gecachte Dimension nur bei bestandenem Health-Check, jetzt korrekt auch bei unerreichbarem Ollama

Versionen 0.0.1+188 bis 0.0.1+206

21. März 2026

Chat-UX-Offensive und Agent-Verbesserungen

Polierter Chat, robusterer Agent

Copy-Buttons — Code-Blöcke und gesamte Antworten mit einem Klick kopierbar, Clipboard-Fallback für HTTP-Verbindungen
Markdown-Headings im Chat — Überschriften (h1–h6) werden korrekt gerendert statt als Plaintext
Scroll-Verhalten — Auto-Scroll stoppt bei manuellem Hochscrollen und springt nicht mehr zurück
Thinking-Blöcke repariert — Ollama 0.18 liefert Reasoning-Content in einem neuen Feld statt als XML-Tags, alle drei Streaming-Pfade angepasst
Agent Tool-Call-Retry — bei Backend-Fehlern wiederholt der Agent Suchen automatisch (3 Versuche), fehlgeschlagene Calls blockieren nicht mehr die Loop-Detection
Hybrid-Retrieval Metadata-Filter — Dateityp- und Verzeichnis-Filter wirken jetzt auf alle drei Retrieval-Pfade (Vektor, BM25/ES, Graph), nicht nur auf die Vektorsuche
Separate Sessions — Chat-UI und Admin-UI verwenden getrennte Session-Cookies, gleichzeitiges Arbeiten in beiden Oberflächen möglich
Chat-Titel editierbar — Stift-Button in der History zum Umbenennen von Chats
Einzel-Job-Löschung — beendete Jobs können direkt aus dem Jobs-Tab gelöscht werden

Versionen 0.0.1+177 bis 0.0.1+186

18.–19. März 2026

Security-Audit und Härtung

Umfassendes Security-Audit mit 49 Findings — systematisch abgearbeitet

Security-Audit — 5 parallele Audit-Agenten, 49 Findings identifiziert und klassifiziert, interner Audit-Report
Path-Traversal-Fix — Backup-Restore-Endpoint gegen Directory-Traversal-Angriffe abgesichert
Session-Token-Hashing — Tokens werden als SHA-256-Hash in der DB gespeichert statt im Klartext
Cloud-API-Key-Verschlüsselung — API-Keys werden mit Fernet in YAML, ai_config und ki_backends verschlüsselt
DOMPurify integriert — Defense-in-Depth gegen XSS in Chat und Audit-Detailansicht
systemd-Hardening — ProtectHome, PrivateTmp, NoNewPrivileges für alle 4 Units
Auth-Tiering — saubere Trennung: Admin-Endpoints für Admins, Chat-Endpoints für User
GitHub-Readiness — Dual-Repo-Architektur mit automatischem Export-Filter für sensible Inhalte
56 Security-Regressionstests — Backup-Traversal, Session-Invalidierung, Input-Limits, SQL-Härtung

Versionen 0.0.1+164 bis 0.0.1+176

17.–18. März 2026

PostgreSQL-Backend, Cache-Architektur und Code-Qualität

Skalierung nach oben und nach innen

PostgreSQL-Backend — CLI-Migrationskommando (kiara migrate-db), automatisches SQL-Rewriting, manuelle Konvertierungen in 30 Dateien
Cache-Tabellen-Architektur — 3 Cache-Tabellen mit vorberechneten JSON-Payloads, API-Endpoints lesen 1-2 SELECTs statt N+1-Queries, anlassbezogener und periodischer Refresh
VektorDB Datei-Management — neuer DB-Management-Tab mit Datenquellen-Matrix, Datei-Detailansicht, selektive Löschung mit Orphan-Prüfung
pgvector restlos entfernt — 7 Dateien gelöscht, Factory+HealthCheck+Frontend bereinigt, ~2400 Zeilen weniger
5 Refactoring-Iterationen — 35+ Magic Values zentralisiert, Template-Method-Patterns, Cloud-Adapter-Basisklasse, 6 grosse Funktionen dekomponiert, ~80 Dateien überarbeitet
Jobs-Tab Flicker-Fix — In-place DOM-Patch statt vollem Re-Render bei Polling, expandierte Detail-Bereiche bleiben stabil
Ingestion-UX — Modell-Dropdown dient als Filter und Ingestion-Auswahl, Overlay-Bestätigung statt Modal

Versionen 0.0.1+152 bis 0.0.1+163

14.–16. März 2026

ERP-Konnektor-Schicht, Code-Qualität und DEB-Paketierung

Enterprise-Integration und Deployment

ERP-Konnektor-Schicht — neue Plugin-Architektur für ERP-Systeme: Odoo-Konnektor (XML-RPC, verifiziert gegen 322 Auftraege, 104k Produkte), Connection-Registry mit Fernet-Verschlüsselung, 8 Admin-API-Endpoints
Qdrant source_key-Feld — KEYWORD-Index für exakte Pfad-Matches (O(1) statt Full Scan bei 3,8 Millionen Punkten)
Embedding-Modell-Filter — neues Dropdown im Datenquellen-Tab zur Filterung nach Embedding-Modell
Pipeline-Dekomposition — die zentrale 470-Zeilen-Funktion wurde auf 65 Zeilen reduziert und in 9 testbare Einzelfunktionen aufgeteilt
DEB-Paketierung für Zielsysteme — Ubuntu 24.04-kompatibel, mit Auto-Start, Client-CLAUDE.md für KI-gestützte Administration auf Zielsystemen, und automatischer IP-Erkennung im Post-Install

Versionen 0.0.1+144 bis 0.0.1+151

11.–13. März 2026

Worker-Service, Such-Tab und IMAP-Turbo

Architektur-Meilenstein und neue Suchfunktionen

Worker-Service-Separation — die Ingestion läuft jetzt als eigener Systemdienst (Kiara-worker), unabhängig vom Web-Interface, mit Graceful Shutdown und Auto-Resume
Audit-Trail-Redesign — vollständige DSGVO-Nachvollziehbarkeit: der exakte Prompt, die vollständige KI-Antwort und alle Tool-Calls werden aufgezeichnet, mit Vollbild-Detailansicht und Druckfunktion
Neuer Such-Tab — die Wissensbasis ist direkt durchsuchbar: Text-Suche (Elasticsearch) und semantische Suche (Qdrant) mit Filtern nach Datenquelle, Dateityp, Verzeichnis und Datum, Ergebnisse direkt als Kontext an den Chat übergebbar
IMAP Batch-Fetch — E-Mails werden in 50er-Batches heruntergeladen statt einzeln (50x weniger Roundtrips), mit automatischem Reconnect bei Verbindungsverlust
Paralleler IMAP-Scan — Mail-Download läuft im Hintergrund, während die Verarbeitung bereits auf gecachten Dateien startet
Auto-Wait bei Backend-Ausfall — die Pipeline wartet auf Backend-Recovery statt abzubrechen
VektorDB-Management — dynamische Modell-Spalten zeigen Chunks pro Embedding-Modell

Versionen 0.0.1+132 bis 0.0.1+143

9.–10. März 2026

Backend-Warmup, parallele Tool-Calls und intelligentere Suche

Performance und Robustheit auf einem neuen Level

Backend-Warmup vor Ingestion — KI-Modelle werden vor der Verarbeitung "aufgewaermt", damit der erste Request nicht minutenlang dauert
Parallele Agent-Tool-Calls — der Agent fuehrt jetzt mehrere Suchen gleichzeitig aus statt nacheinander — deutlich schnellere Antworten
n:m Chunk-Datenquellen-Beziehung — identische Dateien in mehreren Datenquellen werden nur einmal gespeichert, aber allen zugeordnet
Array-basierter Pre-Filter — Datenquellen-Berechtigungen direkt in der Vektorsuche statt nachgelagertem Filter (0 MB statt 160 MB RAM pro Anfrage)
Content-basierte Hash-Invalidierung — E-Mail-Resync erkennt Änderungen am Dateiinhalt, nicht nur am Zeitstempel
Audit-Trail vollständig — alle Chat-Modi loggen jetzt lueckenlos in die Audit-Datenbank
Agent Final-Rerank — gesammelte Suchergebnisse werden vor der Antwort nochmals bewertet und irrelevante Chunks entfernt
Tilde-Datei-Filter — Office-Lock-Dateien (~$doc.docx) werden herausgefiltert, bevor sie die Pipeline stoeren

Versionen 0.0.1+114 bis 0.0.1+131

6.–8. März 2026

Kontext-Limits, Ingestion-Monitoring und Backend-Management

Mehr Kontrolle, mehr Transparenz

Globales Chunk-Cap — schuetzt vor Kontextfenster-Überlauf bei vielen Suchergebnissen (konfigurierbar, Default 80 Chunks)
Agent Final-Prompt editierbar — der Instruktions-Prompt der Agent-Antwort ist jetzt über die Admin-UI anpassbar
Per-File Ingestion-Monitoring — für jede einzelne Datei sichtbar: Parser, Chunk-Strategie, Chunk-Anzahl, Dauer, Status und Fehlermeldungen
Live-Dateiname — während der Verarbeitung wird die aktuelle Datei unter dem Fortschrittsbalken angezeigt
Config-Changelog — Audit-Trail für alle Konfigurationsänderungen
Multi-Embedding-Modell-Management — modellspezifisches Failover mit Health-Cache, CLI mit --embedding-model
Circuit-Breaker — die Pipeline bricht nach 10 aufeinanderfolgenden Infrastrukturfehlern automatisch ab, statt sinnlos weiterzuarbeiten
DDU Pre-flight Check — vor der Dokumentenverarbeitung wird geprüft, ob das OCR-Backend erreichbar ist

Versionen 0.0.1+98 bis 0.0.1+113

4.–5. März 2026

Thinking-Modus, Elasticsearch und Agent-Intelligenz

Kiara denkt jetzt laut — und durchsucht besser

Thinking-Modus — die KI zeigt live ihren Denkprozess (Chain of Thought), ein-/ausschaltbar per Toggle
Elasticsearch als Hybrid-Suche — neben BM25 jetzt auch Elasticsearch für hochperformante Keyword-Suche mit Fuzziness-Kontrolle
Agent-Loop-Detection — der Agent erkennt, wenn er sich im Kreis dreht, und bricht sinnlose Wiederholungen ab
Parent-Document-Retrieval — bei kleinen Dokumenten werden automatisch alle Chunks geladen, nicht nur die besten Treffer
Temperature-Slider — steuert die Kreativität der KI im Unchained-Modus
Sibling-Chunk-Expansion — benachbarte Textabschnitte werden automatisch mitgeladen für vollständigeren Kontext
BM25 Hybrid-Search endlich verdrahtet — die Keyword-Suche war implementiert aber nicht aktiv — jetzt werden z.B. Rechnungen nach Firmenname gefunden

Versionen 0.0.1+84 bis 0.0.1+97

2.–3. März 2026

Agentic RAG, Exchange Online und Datenquellen-Filter

Die KI lernt, selbstständig zu handeln

Backend-agnostisches Agentic RAG — der Agent-Modus funktioniert jetzt mit allen drei LLM-Backends (Ollama, Anthropic, OpenAI), jedes mit nativer Tool-Use-Integration
Exchange Online-Konnektor — Microsoft 365 Postfächer via OAuth2/Entra ID als Datenquelle
Multi-Select Datenquellen-Filter — mehrere Datenquellen im Chat gezielt auswählbar, einzelne Quellen per NOT-Toggle ausschließbar
Verbindungstest vor dem Speichern — Datenquellen-Verbindungen lassen sich direkt im Formular testen
Content-basierte Dateierkennung — auch .log, .conf und andere Textdateien ohne Standardendung werden jetzt erkannt und indexiert
Cloud-Backend-Fehler-Feedback — explizite Fehlermeldungen statt stiller Fallbacks
HashStore-Migration — Datei-Hashes in einer dedizierten Datenbank statt JSON für schnellere Verarbeitung großer Datenmengen

Versionen 0.0.1+56 bis 0.0.1+83

28. Februar – 1. März 2026

Job-Queue, Anonymisierung und drei Chat-Modi

Kiara wird zum Enterprise-Tool

Persistente Job-Queue — Ingestion-Auftraege überleben Service-Neustarts, mit Cron-Scheduling, Pause/Resume und detaillierter Historie
Drei Chat-Modi — Standard (RAG-gestützte Antworten), Unchained (freies LLM ohne Dokumentenkontext) und Agent (ReAct-Loop mit Tool-Use — die KI kann aktiv suchen und rechnen)
Anonymisierungsmodul — Aho-Corasick-Engine für 50.000+ Entitaeten, DSGVO-konforme Pseudonymisierung, LLM-basierte PII-Erkennung als vierte Schutzschicht
Cloud-KI-Backends — Anthropic Claude und OpenAI GPT als alternative LLM-Backends, mit Budget-Tracking und Audit
Cross-Encoder-Reranking — Suchergebnisse werden mit einem spezialisierten Modell nachsortiert für präzisere Antworten
Token-Anzeige im Chat — Live-Anzeige der Kontextfenster-Auslastung
Kontextfenster-Slider — steuert, wie viel Kontext die KI verarbeiten soll (1K–40K Tokens)
LLM-Backend-Auswahl — direkt im Chat waehlbar, welches KI-Modell antworten soll
System-Selbsttest — automatisierte Test-Suite direkt aus der Admin-UI startbar

Versionen 0.0.1+34 bis 0.0.1+55

26.–27. Februar 2026

Plugin-System, Web-Crawler und das grosse Rebranding

Ein historischer Meilenstein — aus OpenRAG wird Kiara

Rebranding zu Kiara — "KI-Assistenz für Retrieval und Analyse" — neuer Name, neues Branding, 361 Dateien aktualisiert
Plugin-Architektur für Konnektoren — Datenquellen-Konnektoren sind jetzt als Plugins erweiterbar, mit automatischer Erkennung und datengetriebener Admin-UI
Web-Crawler-Plugin — Websites als Datenquelle: BFS-Crawling mit robots.txt-Respekt, Sitemap-Parsing und HTML-zu-Markdown-Konvertierung
MCP-Server — Kiara spricht jetzt das Model Context Protocol — Integration mit VS Code, Claude Desktop und Cursor möglich
Multi-Backend-Verwaltung — beliebig viele KI-Backends (Ollama, Anthropic, OpenAI) mit automatischem Failover und Round-Robin

Versionen 0.0.1+18 bis 0.0.1+33

24.–25. Februar 2026

Wissensgraph, drei VectorDB-Backends und E-Mail-Indexierung

Kiara wird deutlich leistungsfähiger

GraphRAG-Wissensgraph — Kiara erkennt jetzt Zusammenhänge zwischen Entitaeten (Kunden, Lieferanten, Auftraege) und nutzt diese als dritte Retrieval-Quelle neben Vektor- und Keyword-Suche
E-Mail-Indexierung — IMAP-Postfächer als Datenquelle: Mails und Anhaenge werden automatisch verarbeitet
SQL-Datenbanken — MSSQL, PostgreSQL, MySQL und SQLite als Wissensquellen anbindbar
ERP-Integration — erste Anbindung an Unternehmensdaten (Auftraege, Lagerbestand, Kunden)
Dokumenten-Workflows — automatische Zusammenfassungen, Template-basierte Reports, Export als PDF/DOCX
DSGVO-Compliance-Dashboard — Verarbeitungsverzeichnis, Datenschutz-Folgenabschätzung und Audit-Trail
Automatische Chunk-Strategie — Kiara erkennt, ob ein Dokument Prosa, Tabelle, Code oder E-Mail ist, und passt die Verarbeitung entsprechend an
Deep Document Understanding — optionaler layout-aware PDF-Parser mit OCR für gescannte Dokumente

Versionen 0.0.1+12 bis 0.0.1+17

21.–23. Februar 2026

Projektstart: Kiara erblickt das Licht der Welt

Die erste Version der Unternehmens-KI-Plattform geht an den Start

RAG-Engine mit Hybrid-Retrieval — Dokumente werden intelligent durchsucht, nicht nur per Stichwort, sondern auch nach Bedeutung
Web-Chat-Interface auf Port 8501 — Unternehmensdaten lassen sich direkt im Browser abfragen
Admin-Dashboard auf Port 8502 — volle Kontrolle über Datenquellen, Status und Konfiguration
Multi-Datenquellen — lokale Verzeichnisse, SMB-Netzlaufwerke und WebDAV (Nextcloud) als Wissensquellen
Live-Fortschrittsanzeige bei der Dokumentenverarbeitung
Multi-Embedding-Modell-Architektur — verschiedene KI-Modelle für verschiedene Einsatzzwecke
Konfigurierbares Prompt-Template — der Charakter der KI lässt sich an das Unternehmen anpassen
.deb-Paketierung — einfache Installation auf Ubuntu/Debian-Systemen

Versionen 0.0.1+1 bis 0.0.1+11