Kiara Logo KIara
Architektur What's New Wiki Kontakt

What's New

Entwicklungschronik — neue Features, Verbesserungen und Meilensteine

11. Mai 2026

Codequalitäts-Offensive: Linter, Quality-Gate und reproduzierbare Builds

Eine Woche systematische Investition in Entwickler-Werkzeuge — Tests werden schneller verlässlich, Abhängigkeiten endlich gepinnt

  • Ruff als Linter und Formatierer — Kiara nutzt jetzt Ruff für statische Code-Analyse: F821-Funde, Bugbear-, SIM- und RUF-Regeln werden automatisch geprüft, der Formatierer hält den Stil über die gesamte Codebasis konsistent
  • Pre-commit-Hook installierbar — vor jedem Commit laufen Lint, Format-Check und Smoke-Tests gegen die geänderten Dateien. Fehler werden gefangen, bevor sie ins Repository wandern
  • CI-Quality-Gate auf Gitea — neuer Workflow .gitea/workflows/quality.yml prüft jeden Push und Pull-Request: Linter, Format, Compile-Check, Smoke-Tests und Test-Collection (6548 Tests). Runtime-venv und Dev-Tool-venv sind sauber getrennt
  • Dependency-Single-Source — pyproject.toml ist jetzt die führende Quelle für alle Runtime-Dependencies, requirements.txt wird daraus generiert. Drift zwischen verschiedenen Manifest-Dateien wird vom Quality-Gate verhindert
  • Reproduzierbare Lockfiles — Runtime- und Dev-Abhängigkeiten sind in requirements.lock gepinnt, inklusive CPU-only Torch/Torchvision. Deploy-, Debian- und ISO-Installationspfade nutzen alle dieselbe Lockfile — gleiche Versionen auf Entwicklungs-, Test- und Produktionssystem
  • Lokales Docling entfernt — die schwergewichtige Docling-Bibliothek ist aus der KIara-Runtime ausgebaut, Document-Understanding läuft jetzt ausschließlich gegen Remote-DDU-Backends. Schlankeres Paket, schnellerer Start, weniger transitive Abhängigkeiten
Versionen 0.0.1+453 bis 0.0.1+460
3.–4. Mai 2026

Crash-Forensik: kein toter Worker bleibt mehr unsichtbar

Wenn ein Hintergrund-Prozess stirbt, weiß Kiara jetzt warum — mit Stack-Trace, OOM-Korrelation und Netzlaufwerks-Diagnose

  • Worker-Death-Watcher — ein neuer Systemdienst beobachtet alle 5 KIara-Services parallel. Stirbt ein uvicorn-Sub-Worker (vorher unsichtbar, weil OnFailure-Hooks nur bei Master-Tod greifen), persistiert der Watcher einen vollständigen Kontext-Snapshot: dmesg-Tail, CIFS-Mounts, cgroup-Memory-Stats und journal-Tail
  • Faulthandler und Coredump-Pipeline — bei fatalen Signalen (SIGSEGV, SIGABRT, SIGBUS) wird ein Multi-Thread-Stack-Trace in journald geschrieben. Per SIGUSR1 lässt sich der Stack hängender Worker live abrufen, ohne den Prozess zu beenden — entscheidend für CIFS-D-State-Diagnose
  • CIFS-Korrelation und OOM-Erkennung — der Watcher erkennt heuristisch, ob ein Worker an einem hängenden Netzlaufwerk gestorben ist (reason=cifs_unreachable_correlation) oder vom Linux-OOM-Killer beendet wurde, und protokolliert das strukturiert
  • Frontend-Beacon — reißt ein SSE-Chat-Stream im Browser ab, sendet die Chat-UI eine Diagnose-Nachricht ans Backend. Damit landen auch client-seitige Stream-Probleme im System-Log statt nur als "Netzwerkfehler" beim Anwender
  • Drei Audit-Runs — Cursor-Persistenz überlebt jetzt SIGKILL und OOM, der Watcher-Thread terminiert nach fünf konsekutiven Fehlern für systemd-Restart, KV-Injection im Beacon ist blockiert. 77 neue Tests sichern die Audit-Findings ab
  • Postinst-Integration — der Watcher wird beim apt install automatisch aktiviert und gestartet, kein manuelles Enable mehr nötig
Versionen 0.0.1+446 bis 0.0.1+452
1.–2. Mai 2026

Reranking auf festem Fundament und durchgängige Traces

Cross-Encoder-Reranking läuft jetzt verlässlich, der Trace-Explorer zeigt die volle Aufruf-Hierarchie

  • Reranking voll funktional — sentence-transformers ist von Optional-Extra zu Core-Dependency aufgestiegen, ein Eager-Import-Check beim Start verhindert, dass Reranking-Features ohne funktionierenden Cross-Encoder aktiv werden. Torch wird CPU-only installiert — ~1.5 GB CUDA-Wheels gespart, schlankeres ISO
  • Deploy schützt HuggingFace-Cache — rsync mit --delete hat bisher bei jedem Deploy den Modell-Cache geleert, der Reranker meldete bis zum nächsten Lazy-Load "degraded". Der .cache-Pfad ist jetzt vor dem Delete-Sweep geschützt
  • Einheitliche Trace-Hierarchie — Spans aus dem Tool-Pfad (Hybrid-, Semantic-, Keyword-, Graph- und ColBERT-Retrieval, RRF-Fusion, Rerank) starteten bisher als eigene Root-Traces, weil der OpenTelemetry-Kontext beim Wechsel in den Worker-Thread verloren ging. Jetzt teilen sich alle Spans einer Chat-Anfrage eine trace_id — der Wasserfall im Trace-Explorer zeigt rund 15 verschachtelte Children unter agent_query
  • Strukturiertes Backend-Error-Logging — LLM-Backend-Fehler (Ollama 503, Anthropic-Rate-Limits, Tool-Adapter-Crashes) landen jetzt mit vollem Traceback in system_events und sind im Admin-UI System-Log-Tab nach Mode (agent / standard / rewriter / unchained) filterbar. Frontend zeigt weiterhin verständliche Meldungen, Admins haben aber endlich die Diagnose-Daten
  • Spezialisierte Retrieval-Optimierungen toggelbar — die Rechnungsnummern-Gruppierung des Agenten ist jetzt im KI-Retrieval-Tab unter "Spezialisierte Optimierungen" ein- und ausschaltbar (für A/B-Tests)
  • WebDAV-Service-Hardening — systemd-Units der KIara-Dienste durften /etc/davfs2 nicht beschreiben, WebDAV-Ingestion brach mit "Read-only file system" ab. Der Pfad ist jetzt in ReadWritePaths aller fünf Units
Versionen 0.0.1+435 bis 0.0.1+445
25.–30. April 2026

BugScan Run 4: 262 verifizierte Bugs systematisch geheilt

Die vierte und bislang gründlichste Code-Analyse — 15 Modul-Scans, Block-für-Block-Aufräumen über alle Schichten

  • BugScan Run 4 — zwei parallele Analyse-Agenten (Codex GPT-5.5 xhigh und Claude Opus) haben 299 Roh-Findings produziert, daraus wurden 262 verifizierte Bugs konsolidiert und als Gitea-Issues angelegt. Anschließend Block für Block abgearbeitet: Datenintegrität, Retrieval-Korrektheit, Tool-Berechtigungen, Backup-Manifeste, Graph-Konsistenz
  • Daten- und Retrieval-Härtung — semantische Suche entfernt spekulativen Total-Fallback und ist fail-closed; Sibling-Expansion respektiert das Kontext-Cap; graph_edges ist pro source_id/target_id/relation/source jetzt eindeutig (ERP-Import idempotent); SQL-Inkrementalfilter kapselt SELECTs als Subquery gegen ORDER-BY-Injection
  • SSRF- und DNS-Rebinding-Schutz — ein zentraler http_pinning-Helper schützt Webcrawler und DDU-Backend vor TOCTOU-Angriffen: DNS-Auflösung passiert einmal, die aufgelöste IP wird für den gesamten Request gepinnt. Plus: Redirect-Ziele werden nach httpx-Follow erneut gegen Domain-Scope und SSRF-Allowlist geprüft
  • OnlyOffice und Backup gehärtet — Editor-Konfigurationen werden serverseitig erzeugt und JWT-signiert (#1098); OnlyOffice-Callbacks für Save-Status laden den Speicherstand nur vom konfigurierten Document-Server (#1123); Backup-Restore mit force=True kann Manifest- und SHA256-Prüfungen nicht mehr umgehen (#1109)
  • Admin-Aktionen mit Bestätigungs-Pflicht — HTTP-Routen für AdminFunctions mit requires_confirmation führen nicht mehr direkt aus, sondern liefern einen Confirmation-Token. ToolRegistry nutzt die tools.permissions-Matrix autoritativ für alle nicht eingebauten Tools (#1117)
  • LDAP-Gruppen über objectSid identifiziert — cn/name/dn sind jetzt nur noch aktualisierbare Anzeige-Attribute, die technische Identifizierung läuft über die unveränderliche objectSid. Umbenannte Gruppen behalten ihre ACL-Bindungen
  • Auto-Fix-Batches Medium/Low — 98 weitere Issues über 134 Dateien direkt gefixt, plus zwei Selbsttest-Sanierungs-Sprints (72 → 0 Failures und nochmals 37 → 0 Failures). 5574 Tests grün
Versionen 0.0.1+392 bis 0.0.1+434
24.–25. April 2026

Content-Security-Policy strikt: kein inline-JavaScript mehr

Das Admin-UI nutzt jetzt durchgängig sichere Event-Delegation — strikte CSP als Default

  • Staged Strict-CSP-Rollout — Request-spezifische Nonces und ein konfigurierbares Gate ermöglichen, die Content-Security-Policy schrittweise schärfer zu stellen. Vorher war unsafe-inline aktiv, jeder XSS-Vektor direkt ausnutzbar. Jetzt sind inline-Skripte nur noch mit gültiger Nonce erlaubt
  • Migration von inline-Events — repo-weiter Umbau von onclick="..."-Attributen auf ein data-action-Dispatcher-Pattern. Welle 2 hat in vier Batches 11 Module finalisiert (Chat, KI-Modelle, Datenquellen, Jobs, LDAP, Testsuite, Compliance, ...); Welle 3 lief mit acht parallelen Agenten über UI-Core und Admin-Core
  • Observation und Default-Flip — Welle 4 schaltete die strikte CSP zuerst in den Report-Only-Modus, damit verbliebene Verstöße im Browser sichtbar wurden, ohne den Betrieb zu blockieren. Welle 5 hat csp_strict=true als Default gesetzt — die strikte Policy ist jetzt der Normalfall
  • ExpandableTable-Root-Cause — der interactive-cell-Guard hatte einen Bug: Klicks auf Toggle-Buttons in Tabellen-Zellen lösten Expand-Animationen aus statt der Toggle-Aktion. Root-Cause-Fix beseitigt eine ganze Klasse von UI-Flicker-Problemen in den Admin-Tabs
  • Wiki-Template-Reststyles entfernt — vier Wiki-Guides hatten inline-Styles im Markup, die unter strikter CSP nicht mehr erlaubt sind. Die Regeln sind jetzt sauber in wiki.css
Versionen 0.0.1+379 bis 0.0.1+391
21.–24. April 2026

CSRF-Defense-in-Depth, ERP-Graph-Sync und strukturiertes System-Log

Mehr Schutz an der Web-Auth, ein robusterer Wissensgraph und Security-Events in der Datenbank

  • Admin-System-Log — ein neuer Sub-Tab unter System zeigt strukturierte kiara.security-Events aus der neuen system_events-Tabelle. Vorher lebten Security-Logs nur in Dateien, jetzt sind sie filterbar, durchsuchbar und überleben Log-Rotation. Grundlage für viele spätere Diagnose-Verbesserungen
  • CSRF-Defense-in-Depth V18 — Synchronizer-Token gegen Cross-Site-Request-Forgery plus Origin-Validation für state-ändernde Requests. Post-Implementation-Scan fand sechs Spec-Abweichungen, die direkt gefixt wurden; Medium-Followups schliessen 6 weitere Edge-Cases mit dedizierter Test-Abdeckung
  • ERP-Graph-Sync V28 — idempotente Schema-Migration für graph_edges.source und Node-/Edge-Chunk-Junctions, bulkbasierte Upserts. Drei Follow-up-Cluster (15 Issues) härten die Heuristiken, fügen 19 neue Tests hinzu und reparieren einen Test-Pfad, den der erste Implementations-Scan übersehen hatte
  • Connector-Browse vereinheitlicht — Local-, SMB- und WebDAV-Konnektoren teilen sich jetzt eine zentrale list_directory-Capability, der Admin-Chat und der Web-Picker sind fail-closed abgesichert, WebDAV-Pfad-Behandlung normalisiert (#1278)
  • Selbsttest-Sprint — 72 Failures auf 0 reduziert, mit 11 echten Prod-Bugs aus Schema-Drift und int-vs-bool-Mismatches als Nebenbeute. 5574 Tests grün
  • BugScan Run 4 vorbereitet — Prompts für die kommende Code-Analyse-Welle wurden auf die neue ui_core-Struktur und SharedUI-Namen umgestellt — die Voraussetzung für die 262 verifizierten Bugs in der Folgewoche
Versionen 0.0.1+358 bis 0.0.1+378
18.–20. April 2026

Geteilte UI-Bibliothek und robuste Ausfall-Erholung

Chat-UI und Admin-UI teilen sich jetzt eine gemeinsame Grundlage — und Qdrant-Ausfälle werden sauber abgefangen

  • Shared UI-Bibliothek — sechs Sprints haben Chat-UI und Admin-UI auf eine gemeinsame Basis gehoben: einheitliche Farben und Themes, zentrale Benachrichtigungen, Modals mit Fokus-Falle, wiederverwendbare Tabellen und Formulare. Ergebnis: konsistentes Aussehen, weniger Duplikate, bessere Barrierefreiheit
  • Chat-Bausteine teilen — die Chat-Oberfläche und der Admin-Chat nutzen intern dieselbe Komponenten-Bibliothek. Neue Chat-Features erscheinen künftig automatisch in beiden UIs
  • Qdrant-Ausfälle überstehen — fällt die Vektordatenbank während eines Indexierungs-Laufs aus, pausiert der Worker jetzt kontrolliert und nimmt die Arbeit nach der Erholung wieder auf, statt den ganzen Job abzubrechen
  • Dichtere Security-Masken — der Qdrant-API-Key wird in den Admin-Einstellungen nicht mehr angezeigt, LDAP-Fehlerpfade geben keine Rückschlüsse mehr auf gültige Benutzer preis
Versionen 0.0.1+347 bis 0.0.1+357
14.–17. April 2026

Sicherheits-Offensive und PostgreSQL-only

BugScan Run 3, komplette SQLite-Entfernung, Cloud-Audit ohne Zeitheuristik

  • BugScan Run 3 — eine dritte, noch breiter angesetzte Code-Analyse hat 406 Befunde zusammengetragen und Schritt für Schritt abgearbeitet: SSRF-Guards, Path-Traversal-Fixes, Race-Condition-Härtung, TOCTOU-Schutz, StartTLS Fail-Secure und viele kleinere Verbesserungen
  • SQLite endgültig entfernt — Überreste aus der SQLite-Ära sind komplett ausgebaut: Konnektor-Dialog, Backup-Pfade, Doku und Wiki sprechen jetzt ausschließlich PostgreSQL
  • Cloud-Audit zuverlässiger — die Zuordnung von anonymisierten Anfragen zum Cloud-Aufruf lief bisher über Zeitheuristik. Jetzt wird eine eindeutige Korrelations-ID mitgeführt, die auch bei parallelen Requests sauber matcht
  • Stärkerer Wizard und ERP-Sync — Wizard-Geheimnisse landen verschlüsselt in der Datenbank, der ERP-Graph-Sync ist idempotent und übersteht Fehler beim Halbzustand sauber
Versionen 0.0.1+335 bis 0.0.1+346
12.–14. April 2026

Code-Qualitätsoffensive und ColBERT-Aufräumer

Systematische Bug-Jagd, saubere Testsuite und ein Modellwechsel ohne Altlasten

  • BugScan Run 2 — systematische Code-Analyse auf vier Schweregraden hat rund 300 Findings aufgedeckt und rund 260 davon automatisch behoben. Schwerpunkt: Eingabe-Validierung, Race-Conditions, sichere Textausgabe im Frontend
  • Testsuite wieder bei null Fehlern — von 132 auf 0 fehlschlagende Tests. Die Admin-UI-Selbstdiagnose läuft erstmals wieder vollständig grün
  • ColBERT-Modellwechsel ohne Altlasten — wird das ColBERT-Modell umgestellt, räumt Kiara jetzt die alten Daten selbst auf. Bei Unsicherheit lässt sich der Cleanup manuell anstoßen — mit Dry-Run-Vorschau im Admin-UI oder per CLI
  • Tracing ein-/ausschalten per Klick — im Traces-Tab gibt es einen Toggle, der das OpenTelemetry-Tracing umschaltet und den Dienst automatisch neu startet. Kein Config-Editieren mehr
  • Weniger Overhead in der Suche — die Keyword-Suche hat doppelt überzogen und mehr Kandidaten geladen als nötig. Jetzt ist die Menge passend zur Ergebnisgröße
Versionen 0.0.1+324 bis 0.0.1+334
8.–11. April 2026

Stabilere Admin-UI, eigener Installer und Wiki-Fundament

Weniger Glitches in der Admin-UI — und ein Installer, der endlich zum Produkt passt

  • Admin-UI Robustheit — Polling, Button-Sperren und Tab-Wechsel sind zentralisiert. Doppelklicks lösen keine doppelten Aktionen mehr aus, Tabs verlieren beim Wechseln keine Daten mehr, und Fehler aus dem Backend landen sichtbar in Benachrichtigungen statt lautlos zu verschwinden
  • Härter gegen XSS — alle Textausgaben im Admin-Bereich werden kontextabhängig escapet, inline-JavaScript wurde flächendeckend durch sichere Event-Delegation ersetzt
  • Eigener Appliance-Installer — der Debian-Installer ist durch einen schlanken Dialog-Assistenten ersetzt: Festplatte wählen, Tastaturlayout, Zeitzone, Sprache — fertig. Funktioniert komplett offline mit lokalen Paketquellen
  • LLM-Wiki-Fundament — das Gerüst für automatisch generierte Wiki-Seiten aus den eigenen Datenquellen wird angelegt. Die Entwicklung läuft mittlerweile eigenständig weiter
Versionen 0.0.1+306 bis 0.0.1+323
5.–7. April 2026

Pipeline-Baukasten und Ausfallsicherheit

Kiara lernt, mit ausgefallenen Backends umzugehen — ohne Chat-Abstürze

  • Graceful Degradation — fällt ein Backend (Ollama, Datenbank, LDAP) aus, zeigt Kiara ein gelbes Warning-Banner im Chat statt zu crashen. Erholt sich der Dienst, verschwindet die Meldung von selbst. Optionale E-Mail an den Admin bei Ausfall
  • Ingestion als Baukasten — die Datei-Verarbeitung ist in eigenständige Module zerlegt: Loader (25+ Dateiformate), Hash-Management und Pipeline-Steuerung lassen sich einzeln testen und erweitern
  • Schnellere Integritätsprüfung — ein Engpass mit hunderten Datenbank-Abfragen ist behoben, die Prüfung läuft jetzt um ein Vielfaches schneller
  • Saubereres Chat-Streaming — Metriken, Audit-Einträge und Cloud-Routing werden einheitlich geloggt, unabhängig vom gewählten Backend
Versionen 0.0.1+289 bis 0.0.1+305
4.–5. April 2026

Trace Explorer, Late Chunking und ColBERT

Drei neue Retrieval-Verfahren und vollständige Observability

  • Trace Explorer — neuer System-Subtab mit Wasserfall-Ansicht, Vergleichsmodus, Histogramm (P50/P95/P99), 7 Filter-Felder, CSV/JSON-Export. Per-Pipeline Tracing, optionaler OTLP-Exporter
  • Chat-UI Debug-Modus — Trace-Timing-Bar zeigt Retrieval-, Reranking- und Generierungsdauer pro Antwort
  • Late Chunking — Embedding auf Dokumentebene: der vollständige Text wird verarbeitet, Chunk-Vektoren anschließend aus Token-Positionen extrahiert. Kontextreichere Embeddings ohne größere Chunks
  • ColBERT Multi-Vector Retrieval — 4. Retrieval-Quelle: jedes Token bekommt einen eigenen Vektor, Ähnlichkeit per MaxSim über alle Token-Paare. Eigene Qdrant-Collections, Circuit-Breaker in der Pipeline
Versionen 0.0.1+283 bis 0.0.1+288
2.–3. April 2026

Prompt-Defense, Contextual Retrieval und Testsuite auf 0 Failures

Dreischichtiger Angriffsschutz, intelligenteres Chunking und eine saubere Testsuite

  • Prompt-Injection-Defense — dreistufiger Schutz (Input-Sanitizing, Context-Tagging, System-Prompt-Hardening) für alle Chains. Audit-Logging mit Severity-Klassifikation, eigener Compliance-Subtab
  • Contextual Retrieval — vor dem Embedding wird jeder Chunk durch ein LLM mit Kontext angereichert. Konfigurierbar pro Datenquelle, mit Prompt-Versionierung und Integritätsprüfung
  • Prompt-Versionierung — History-Tabelle mit SHA256-Hashes, Rollback auf frühere Versionen, History-Ansicht in der Admin-UI
  • Anonymizer als Bibliothek — Kernlogik als eigenständiges Subpackage extrahiert, alle Importpfade über Compat-Shims erhalten
  • Testsuite auf 0 Failures — von 829 auf 0 Failures: 3934 Tests bestehen, asyncio-Migration in 31 Dateien
  • DS-Zugriffskontrolle in Elasticsearch — terms-Filter direkt in ES statt Post-Query-Filterung
Versionen 0.0.1+257 bis 0.0.1+282
31. März – 1. April 2026

LLM-Backend-Abstraktion, Wiki-Guides und Datenschutz-Steuerung

Einheitliche Backend-Architektur und umfassende Dokumentation

  • LLM-Backend-Abstraktion — einheitliches LLMBackend-Interface für alle Chains (RAG, Unchained, Rewriter, Agent). Dependency Injection statt eigener Backend-Erzeugung, Shared Cloud-Routing mit automatischer Anonymisierung
  • Restriction-Level pro Datenquelle — dreistufiges Datenschutz-Modell (public/anonymize/blocked) steuert, welche Daten an Cloud-Backends gesendet werden. Trusted-Flag pro Backend für vertrauenswürdige Anbieter
  • Wiki-Guides mit Inhalt — 9 ausführliche Guide-Seiten (Benutzerverwaltung, Datenquellen, Jobs, VektorDB, KI, Tools, Compliance, System, Admin-Chat)
  • Guided Workflows im Admin-Chat — 4 Setup-Assistenten (LLM-Backend, Datenquelle, Ingestion, Ersteinrichtung) führen schrittweise durch die Konfiguration
  • Integritäts-Tab Redesign — ExpandableTable mit Detail-Renderern, Collection-Rebuild (Snapshot/Drop/Restore), Multi-Modell-Checks
  • File-Size als Single Source of Truth — Dateigrößen ausschließlich in file_hashes, denormalisierte Spalten entfernt
Versionen 0.0.1+236 bis 0.0.1+257
29.–30. März 2026

Integritätsprüfung, System-Monitor und Cloud-Embeddings

Neue Diagnose-Werkzeuge und Infrastruktur

  • Integritätsprüfung — neuer System-Subtab mit 5 Konsistenz-Checks, 3 Repair-Funktionen (ds_ids-Sync, Orphan-Cleanup, Metadaten-Rekonstruktion), Background-Thread mit Fortschrittsanzeige
  • System-Monitor — ersetzt den Health-Tab: Live-SSE-Stream (CPU, RAM, Swap, Load, Netzwerk, Plattenplatz), Chart.js-Diagramme mit History (1h bis 1 Jahr), Service-Management und Journal-Fehler
  • Cloud-Embedding-Provider — OpenAI und Voyage AI als Embedding-Backends neben Ollama, mit Probe-Embedding-Test und Batch-Limits
  • Appliance-ISO — bootfähiges Installationsimage via Debian live-build, First-Boot-Wizard mit 10 Schritten, Qdrant als native Binary, Kiara-Branding im Bootscreen
  • Admin-Chat Bugfix-Sprint — 13 Fixes (LDAP-Fehlertoleranz, atomare User-Deaktivierung, Session-Invalidierung bei Passwort-Reset, crash-sichere DS-Löschung)
Versionen 0.0.1+223 bis 0.0.1+235
27.–29. März 2026

Admin-Chat und Wiki

Die Admin-UI wird konversationell — und dokumentiert sich selbst

  • Admin-Chat — Kiara verwalten per natürlicher Sprache: Datenquellen konfigurieren, Jobs steuern, Backends prüfen, Netzwerk-Diagnosen ausführen — alles im Chat statt über Formulare. 155+ Funktionen in 24 Kategorien, mit automatischer Tool-Auswahl durch den ReAct-Agent
  • Bestätigungs- und Wizard-System — destruktive Operationen erfordern explizite Bestätigung, mehrstufige Konfigurationen führen Schritt für Schritt durch die Parameter
  • Netzwerk-Diagnose — der Assistent kann beim Anbinden neuer Datenquellen selbstständig Verbindungsprobleme analysieren: Ping, Portscan, DNS-Lookup, SMB-Discovery, WebDAV-Check, HTTP-Check und Traceroute — direkt aus dem Chat heraus
  • Cloud-Backend-Kompatibilität — Admin-Chat funktioniert mit Ollama, Anthropic und OpenAI, inklusive Extended Thinking mit Live-Stream
  • Wiki und API-Katalog — integriertes Dokumentationssystem mit auto-generiertem API-Katalog (155+ Funktionen mit curl-Beispielen und Self-Check), kontextabhängiger Hilfe-Button in jedem Tab
  • Nachrichten-Persistenz — Chat-Verläufe mit Tool-Calls, Thinking-Blöcken und Usage-Daten werden gespeichert und beim Reload identisch dargestellt
Versionen 0.0.1+207 bis 0.0.1+222
23.–27. März 2026

Query-Expansion, Dashboard-Redesign und WebDAV-Browser

Intelligentere Suche und mehr Übersicht

  • Query-Expansion — LLM-basierte Suchbegriff-Erweiterung: Synonyme und Übersetzungen (DE/EN) werden automatisch generiert, mit Live-Anzeige im Chat
  • Dashboard komplett überarbeitet — 4 neue Widgets (KI-Backends nach Kategorie, Datenquellen nach Typ, VektorDB Größe+Chunks nach Modell, Jobs mit Live-Status)
  • WebDAV Verzeichnis-Browser — PROPFIND-basiertes Verzeichnis-Listing ohne Mount, analog zum bestehenden SMB-Browser
  • DB-Management Summenzeile — Gesamt-Chunks je Collection und Embedding-Modell auf einen Blick
  • KI-Backends Tabelle — Design an ExpandableTable angepasst (Header, Borders, Hover-Schatten, Kompakte-Ansicht)
  • Markdown-Tabellen im Chat — Pipe-Syntax mit Alignment wird korrekt gerendert
  • Embedding-Dimension bei Downtime — Fallback las gecachte Dimension nur bei bestandenem Health-Check, jetzt korrekt auch bei unerreichbarem Ollama
Versionen 0.0.1+188 bis 0.0.1+206
21. März 2026

Chat-UX-Offensive und Agent-Verbesserungen

Polierter Chat, robusterer Agent

  • Copy-Buttons — Code-Blöcke und gesamte Antworten mit einem Klick kopierbar, Clipboard-Fallback für HTTP-Verbindungen
  • Markdown-Headings im Chat — Überschriften (h1–h6) werden korrekt gerendert statt als Plaintext
  • Scroll-Verhalten — Auto-Scroll stoppt bei manuellem Hochscrollen und springt nicht mehr zurück
  • Thinking-Blöcke repariert — Ollama 0.18 liefert Reasoning-Content in einem neuen Feld statt als XML-Tags, alle drei Streaming-Pfade angepasst
  • Agent Tool-Call-Retry — bei Backend-Fehlern wiederholt der Agent Suchen automatisch (3 Versuche), fehlgeschlagene Calls blockieren nicht mehr die Loop-Detection
  • Hybrid-Retrieval Metadata-Filter — Dateityp- und Verzeichnis-Filter wirken jetzt auf alle drei Retrieval-Pfade (Vektor, BM25/ES, Graph), nicht nur auf die Vektorsuche
  • Separate Sessions — Chat-UI und Admin-UI verwenden getrennte Session-Cookies, gleichzeitiges Arbeiten in beiden Oberflächen möglich
  • Chat-Titel editierbar — Stift-Button in der History zum Umbenennen von Chats
  • Einzel-Job-Löschung — beendete Jobs können direkt aus dem Jobs-Tab gelöscht werden
Versionen 0.0.1+177 bis 0.0.1+186
18.–19. März 2026

Security-Audit und Härtung

Umfassendes Security-Audit mit 49 Findings — systematisch abgearbeitet

  • Security-Audit — 5 parallele Audit-Agenten, 49 Findings identifiziert und klassifiziert, interner Audit-Report
  • Path-Traversal-Fix — Backup-Restore-Endpoint gegen Directory-Traversal-Angriffe abgesichert
  • Session-Token-Hashing — Tokens werden als SHA-256-Hash in der DB gespeichert statt im Klartext
  • Cloud-API-Key-Verschlüsselung — API-Keys werden mit Fernet in YAML, ai_config und ki_backends verschlüsselt
  • DOMPurify integriert — Defense-in-Depth gegen XSS in Chat und Audit-Detailansicht
  • systemd-Hardening — ProtectHome, PrivateTmp, NoNewPrivileges für alle 4 Units
  • Auth-Tiering — saubere Trennung: Admin-Endpoints für Admins, Chat-Endpoints für User
  • GitHub-Readiness — Dual-Repo-Architektur mit automatischem Export-Filter für sensible Inhalte
  • 56 Security-Regressionstests — Backup-Traversal, Session-Invalidierung, Input-Limits, SQL-Härtung
Versionen 0.0.1+164 bis 0.0.1+176
17.–18. März 2026

PostgreSQL-Backend, Cache-Architektur und Code-Qualität

Skalierung nach oben und nach innen

  • PostgreSQL-Backend — CLI-Migrationskommando (kiara migrate-db), automatisches SQL-Rewriting, manuelle Konvertierungen in 30 Dateien
  • Cache-Tabellen-Architektur — 3 Cache-Tabellen mit vorberechneten JSON-Payloads, API-Endpoints lesen 1-2 SELECTs statt N+1-Queries, anlassbezogener und periodischer Refresh
  • VektorDB Datei-Management — neuer DB-Management-Tab mit Datenquellen-Matrix, Datei-Detailansicht, selektive Löschung mit Orphan-Prüfung
  • pgvector restlos entfernt — 7 Dateien gelöscht, Factory+HealthCheck+Frontend bereinigt, ~2400 Zeilen weniger
  • 5 Refactoring-Iterationen — 35+ Magic Values zentralisiert, Template-Method-Patterns, Cloud-Adapter-Basisklasse, 6 grosse Funktionen dekomponiert, ~80 Dateien überarbeitet
  • Jobs-Tab Flicker-Fix — In-place DOM-Patch statt vollem Re-Render bei Polling, expandierte Detail-Bereiche bleiben stabil
  • Ingestion-UX — Modell-Dropdown dient als Filter und Ingestion-Auswahl, Overlay-Bestätigung statt Modal
Versionen 0.0.1+152 bis 0.0.1+163
14.–16. März 2026

ERP-Konnektor-Schicht, Code-Qualität und DEB-Paketierung

Enterprise-Integration und Deployment

  • ERP-Konnektor-Schicht — neue Plugin-Architektur für ERP-Systeme: Odoo-Konnektor (XML-RPC, verifiziert gegen 322 Auftraege, 104k Produkte), Connection-Registry mit Fernet-Verschlüsselung, 8 Admin-API-Endpoints
  • Qdrant source_key-Feld — KEYWORD-Index für exakte Pfad-Matches (O(1) statt Full Scan bei 3,8 Millionen Punkten)
  • Embedding-Modell-Filter — neues Dropdown im Datenquellen-Tab zur Filterung nach Embedding-Modell
  • Pipeline-Dekomposition — die zentrale 470-Zeilen-Funktion wurde auf 65 Zeilen reduziert und in 9 testbare Einzelfunktionen aufgeteilt
  • DEB-Paketierung für Zielsysteme — Ubuntu 24.04-kompatibel, mit Auto-Start, Client-CLAUDE.md für KI-gestützte Administration auf Zielsystemen, und automatischer IP-Erkennung im Post-Install
Versionen 0.0.1+144 bis 0.0.1+151
11.–13. März 2026

Worker-Service, Such-Tab und IMAP-Turbo

Architektur-Meilenstein und neue Suchfunktionen

  • Worker-Service-Separation — die Ingestion läuft jetzt als eigener Systemdienst (Kiara-worker), unabhängig vom Web-Interface, mit Graceful Shutdown und Auto-Resume
  • Audit-Trail-Redesign — vollständige DSGVO-Nachvollziehbarkeit: der exakte Prompt, die vollständige KI-Antwort und alle Tool-Calls werden aufgezeichnet, mit Vollbild-Detailansicht und Druckfunktion
  • Neuer Such-Tab — die Wissensbasis ist direkt durchsuchbar: Text-Suche (Elasticsearch) und semantische Suche (Qdrant) mit Filtern nach Datenquelle, Dateityp, Verzeichnis und Datum, Ergebnisse direkt als Kontext an den Chat übergebbar
  • IMAP Batch-Fetch — E-Mails werden in 50er-Batches heruntergeladen statt einzeln (50x weniger Roundtrips), mit automatischem Reconnect bei Verbindungsverlust
  • Paralleler IMAP-Scan — Mail-Download läuft im Hintergrund, während die Verarbeitung bereits auf gecachten Dateien startet
  • Auto-Wait bei Backend-Ausfall — die Pipeline wartet auf Backend-Recovery statt abzubrechen
  • VektorDB-Management — dynamische Modell-Spalten zeigen Chunks pro Embedding-Modell
Versionen 0.0.1+132 bis 0.0.1+143
9.–10. März 2026

Backend-Warmup, parallele Tool-Calls und intelligentere Suche

Performance und Robustheit auf einem neuen Level

  • Backend-Warmup vor Ingestion — KI-Modelle werden vor der Verarbeitung "aufgewaermt", damit der erste Request nicht minutenlang dauert
  • Parallele Agent-Tool-Calls — der Agent fuehrt jetzt mehrere Suchen gleichzeitig aus statt nacheinander — deutlich schnellere Antworten
  • n:m Chunk-Datenquellen-Beziehung — identische Dateien in mehreren Datenquellen werden nur einmal gespeichert, aber allen zugeordnet
  • Array-basierter Pre-Filter — Datenquellen-Berechtigungen direkt in der Vektorsuche statt nachgelagertem Filter (0 MB statt 160 MB RAM pro Anfrage)
  • Content-basierte Hash-Invalidierung — E-Mail-Resync erkennt Änderungen am Dateiinhalt, nicht nur am Zeitstempel
  • Audit-Trail vollständig — alle Chat-Modi loggen jetzt lueckenlos in die Audit-Datenbank
  • Agent Final-Rerank — gesammelte Suchergebnisse werden vor der Antwort nochmals bewertet und irrelevante Chunks entfernt
  • Tilde-Datei-Filter — Office-Lock-Dateien (~$doc.docx) werden herausgefiltert, bevor sie die Pipeline stoeren
Versionen 0.0.1+114 bis 0.0.1+131
6.–8. März 2026

Kontext-Limits, Ingestion-Monitoring und Backend-Management

Mehr Kontrolle, mehr Transparenz

  • Globales Chunk-Cap — schuetzt vor Kontextfenster-Überlauf bei vielen Suchergebnissen (konfigurierbar, Default 80 Chunks)
  • Agent Final-Prompt editierbar — der Instruktions-Prompt der Agent-Antwort ist jetzt über die Admin-UI anpassbar
  • Per-File Ingestion-Monitoring — für jede einzelne Datei sichtbar: Parser, Chunk-Strategie, Chunk-Anzahl, Dauer, Status und Fehlermeldungen
  • Live-Dateiname — während der Verarbeitung wird die aktuelle Datei unter dem Fortschrittsbalken angezeigt
  • Config-Changelog — Audit-Trail für alle Konfigurationsänderungen
  • Multi-Embedding-Modell-Management — modellspezifisches Failover mit Health-Cache, CLI mit --embedding-model
  • Circuit-Breaker — die Pipeline bricht nach 10 aufeinanderfolgenden Infrastrukturfehlern automatisch ab, statt sinnlos weiterzuarbeiten
  • DDU Pre-flight Check — vor der Dokumentenverarbeitung wird geprüft, ob das OCR-Backend erreichbar ist
Versionen 0.0.1+98 bis 0.0.1+113
4.–5. März 2026

Thinking-Modus, Elasticsearch und Agent-Intelligenz

Kiara denkt jetzt laut — und durchsucht besser

  • Thinking-Modus — die KI zeigt live ihren Denkprozess (Chain of Thought), ein-/ausschaltbar per Toggle
  • Elasticsearch als Hybrid-Suche — neben BM25 jetzt auch Elasticsearch für hochperformante Keyword-Suche mit Fuzziness-Kontrolle
  • Agent-Loop-Detection — der Agent erkennt, wenn er sich im Kreis dreht, und bricht sinnlose Wiederholungen ab
  • Parent-Document-Retrieval — bei kleinen Dokumenten werden automatisch alle Chunks geladen, nicht nur die besten Treffer
  • Temperature-Slider — steuert die Kreativität der KI im Unchained-Modus
  • Sibling-Chunk-Expansion — benachbarte Textabschnitte werden automatisch mitgeladen für vollständigeren Kontext
  • BM25 Hybrid-Search endlich verdrahtet — die Keyword-Suche war implementiert aber nicht aktiv — jetzt werden z.B. Rechnungen nach Firmenname gefunden
Versionen 0.0.1+84 bis 0.0.1+97
2.–3. März 2026

Agentic RAG, Exchange Online und Datenquellen-Filter

Die KI lernt, selbstständig zu handeln

  • Backend-agnostisches Agentic RAG — der Agent-Modus funktioniert jetzt mit allen drei LLM-Backends (Ollama, Anthropic, OpenAI), jedes mit nativer Tool-Use-Integration
  • Exchange Online-Konnektor — Microsoft 365 Postfächer via OAuth2/Entra ID als Datenquelle
  • Multi-Select Datenquellen-Filter — mehrere Datenquellen im Chat gezielt auswählbar, einzelne Quellen per NOT-Toggle ausschließbar
  • Verbindungstest vor dem Speichern — Datenquellen-Verbindungen lassen sich direkt im Formular testen
  • Content-basierte Dateierkennung — auch .log, .conf und andere Textdateien ohne Standardendung werden jetzt erkannt und indexiert
  • Cloud-Backend-Fehler-Feedback — explizite Fehlermeldungen statt stiller Fallbacks
  • HashStore-Migration — Datei-Hashes in einer dedizierten Datenbank statt JSON für schnellere Verarbeitung großer Datenmengen
Versionen 0.0.1+56 bis 0.0.1+83
28. Februar – 1. März 2026

Job-Queue, Anonymisierung und drei Chat-Modi

Kiara wird zum Enterprise-Tool

  • Persistente Job-Queue — Ingestion-Auftraege überleben Service-Neustarts, mit Cron-Scheduling, Pause/Resume und detaillierter Historie
  • Drei Chat-Modi — Standard (RAG-gestützte Antworten), Unchained (freies LLM ohne Dokumentenkontext) und Agent (ReAct-Loop mit Tool-Use — die KI kann aktiv suchen und rechnen)
  • Anonymisierungsmodul — Aho-Corasick-Engine für 50.000+ Entitaeten, DSGVO-konforme Pseudonymisierung, LLM-basierte PII-Erkennung als vierte Schutzschicht
  • Cloud-KI-Backends — Anthropic Claude und OpenAI GPT als alternative LLM-Backends, mit Budget-Tracking und Audit
  • Cross-Encoder-Reranking — Suchergebnisse werden mit einem spezialisierten Modell nachsortiert für präzisere Antworten
  • Token-Anzeige im Chat — Live-Anzeige der Kontextfenster-Auslastung
  • Kontextfenster-Slider — steuert, wie viel Kontext die KI verarbeiten soll (1K–40K Tokens)
  • LLM-Backend-Auswahl — direkt im Chat waehlbar, welches KI-Modell antworten soll
  • System-Selbsttest — automatisierte Test-Suite direkt aus der Admin-UI startbar
Versionen 0.0.1+34 bis 0.0.1+55
26.–27. Februar 2026

Plugin-System, Web-Crawler und das grosse Rebranding

Ein historischer Meilenstein — aus OpenRAG wird Kiara

  • Rebranding zu Kiara — "KI-Assistenz für Retrieval und Analyse" — neuer Name, neues Branding, 361 Dateien aktualisiert
  • Plugin-Architektur für Konnektoren — Datenquellen-Konnektoren sind jetzt als Plugins erweiterbar, mit automatischer Erkennung und datengetriebener Admin-UI
  • Web-Crawler-Plugin — Websites als Datenquelle: BFS-Crawling mit robots.txt-Respekt, Sitemap-Parsing und HTML-zu-Markdown-Konvertierung
  • MCP-Server — Kiara spricht jetzt das Model Context Protocol — Integration mit VS Code, Claude Desktop und Cursor möglich
  • Multi-Backend-Verwaltung — beliebig viele KI-Backends (Ollama, Anthropic, OpenAI) mit automatischem Failover und Round-Robin
Versionen 0.0.1+18 bis 0.0.1+33
24.–25. Februar 2026

Wissensgraph, drei VectorDB-Backends und E-Mail-Indexierung

Kiara wird deutlich leistungsfähiger

  • GraphRAG-Wissensgraph — Kiara erkennt jetzt Zusammenhänge zwischen Entitaeten (Kunden, Lieferanten, Auftraege) und nutzt diese als dritte Retrieval-Quelle neben Vektor- und Keyword-Suche
  • E-Mail-Indexierung — IMAP-Postfächer als Datenquelle: Mails und Anhaenge werden automatisch verarbeitet
  • SQL-Datenbanken — MSSQL, PostgreSQL, MySQL und SQLite als Wissensquellen anbindbar
  • ERP-Integration — erste Anbindung an Unternehmensdaten (Auftraege, Lagerbestand, Kunden)
  • Dokumenten-Workflows — automatische Zusammenfassungen, Template-basierte Reports, Export als PDF/DOCX
  • DSGVO-Compliance-Dashboard — Verarbeitungsverzeichnis, Datenschutz-Folgenabschätzung und Audit-Trail
  • Automatische Chunk-Strategie — Kiara erkennt, ob ein Dokument Prosa, Tabelle, Code oder E-Mail ist, und passt die Verarbeitung entsprechend an
  • Deep Document Understanding — optionaler layout-aware PDF-Parser mit OCR für gescannte Dokumente
Versionen 0.0.1+12 bis 0.0.1+17
21.–23. Februar 2026

Projektstart: Kiara erblickt das Licht der Welt

Die erste Version der Unternehmens-KI-Plattform geht an den Start

  • RAG-Engine mit Hybrid-Retrieval — Dokumente werden intelligent durchsucht, nicht nur per Stichwort, sondern auch nach Bedeutung
  • Web-Chat-Interface auf Port 8501 — Unternehmensdaten lassen sich direkt im Browser abfragen
  • Admin-Dashboard auf Port 8502 — volle Kontrolle über Datenquellen, Status und Konfiguration
  • Multi-Datenquellen — lokale Verzeichnisse, SMB-Netzlaufwerke und WebDAV (Nextcloud) als Wissensquellen
  • Live-Fortschrittsanzeige bei der Dokumentenverarbeitung
  • Multi-Embedding-Modell-Architektur — verschiedene KI-Modelle für verschiedene Einsatzzwecke
  • Konfigurierbares Prompt-Template — der Charakter der KI lässt sich an das Unternehmen anpassen
  • .deb-Paketierung — einfache Installation auf Ubuntu/Debian-Systemen
Versionen 0.0.1+1 bis 0.0.1+11
Kiara Logo KIara

KI-Assistenz für Retrieval und Analyse

Architektur What's New Wiki Kontakt Impressum Datenschutz

© 2026 Kiara. Open Source unter AGPL-3.0-Lizenz.