What's New
Entwicklungschronik — neue Features, Verbesserungen und Meilensteine
18.–20. April 2026
Geteilte UI-Bibliothek und robuste Ausfall-Erholung
Chat-UI und Admin-UI teilen sich jetzt eine gemeinsame Grundlage — und Qdrant-Ausfälle werden sauber abgefangen
- Shared UI-Bibliothek — sechs Sprints haben Chat-UI und Admin-UI auf eine gemeinsame Basis gehoben: einheitliche Farben und Themes, zentrale Benachrichtigungen, Modals mit Fokus-Falle, wiederverwendbare Tabellen und Formulare. Ergebnis: konsistentes Aussehen, weniger Duplikate, bessere Barrierefreiheit
- Chat-Bausteine teilen — die Chat-Oberfläche und der Admin-Chat nutzen intern dieselbe Komponenten-Bibliothek. Neue Chat-Features erscheinen künftig automatisch in beiden UIs
- Qdrant-Ausfälle überstehen — fällt die Vektordatenbank während eines Indexierungs-Laufs aus, pausiert der Worker jetzt kontrolliert und nimmt die Arbeit nach der Erholung wieder auf, statt den ganzen Job abzubrechen
- Dichtere Security-Masken — der Qdrant-API-Key wird in den Admin-Einstellungen nicht mehr angezeigt, LDAP-Fehlerpfade geben keine Rückschlüsse mehr auf gültige Benutzer preis
Versionen 0.0.1+347 bis 0.0.1+357
14.–17. April 2026
Sicherheits-Offensive und PostgreSQL-only
BugScan Run 3, komplette SQLite-Entfernung, Cloud-Audit ohne Zeitheuristik
- BugScan Run 3 — eine dritte, noch breiter angesetzte Code-Analyse hat 406 Befunde zusammengetragen und Schritt für Schritt abgearbeitet: SSRF-Guards, Path-Traversal-Fixes, Race-Condition-Härtung, TOCTOU-Schutz, StartTLS Fail-Secure und viele kleinere Verbesserungen
- SQLite endgültig entfernt — Überreste aus der SQLite-Ära sind komplett ausgebaut: Konnektor-Dialog, Backup-Pfade, Doku und Wiki sprechen jetzt ausschließlich PostgreSQL
- Cloud-Audit zuverlässiger — die Zuordnung von anonymisierten Anfragen zum Cloud-Aufruf lief bisher über Zeitheuristik. Jetzt wird eine eindeutige Korrelations-ID mitgeführt, die auch bei parallelen Requests sauber matcht
- Stärkerer Wizard und ERP-Sync — Wizard-Geheimnisse landen verschlüsselt in der Datenbank, der ERP-Graph-Sync ist idempotent und übersteht Fehler beim Halbzustand sauber
Versionen 0.0.1+335 bis 0.0.1+346
12.–14. April 2026
Code-Qualitätsoffensive und ColBERT-Aufräumer
Systematische Bug-Jagd, saubere Testsuite und ein Modellwechsel ohne Altlasten
- BugScan Run 2 — systematische Code-Analyse auf vier Schweregraden hat rund 300 Findings aufgedeckt und rund 260 davon automatisch behoben. Schwerpunkt: Eingabe-Validierung, Race-Conditions, sichere Textausgabe im Frontend
- Testsuite wieder bei null Fehlern — von 132 auf 0 fehlschlagende Tests. Die Admin-UI-Selbstdiagnose läuft erstmals wieder vollständig grün
- ColBERT-Modellwechsel ohne Altlasten — wird das ColBERT-Modell umgestellt, räumt Kiara jetzt die alten Daten selbst auf. Bei Unsicherheit lässt sich der Cleanup manuell anstoßen — mit Dry-Run-Vorschau im Admin-UI oder per CLI
- Tracing ein-/ausschalten per Klick — im Traces-Tab gibt es einen Toggle, der das OpenTelemetry-Tracing umschaltet und den Dienst automatisch neu startet. Kein Config-Editieren mehr
- Weniger Overhead in der Suche — die Keyword-Suche hat doppelt überzogen und mehr Kandidaten geladen als nötig. Jetzt ist die Menge passend zur Ergebnisgröße
Versionen 0.0.1+324 bis 0.0.1+334
8.–11. April 2026
Stabilere Admin-UI, eigener Installer und Wiki-Fundament
Weniger Glitches in der Admin-UI — und ein Installer, der endlich zum Produkt passt
- Admin-UI Robustheit — Polling, Button-Sperren und Tab-Wechsel sind zentralisiert. Doppelklicks lösen keine doppelten Aktionen mehr aus, Tabs verlieren beim Wechseln keine Daten mehr, und Fehler aus dem Backend landen sichtbar in Benachrichtigungen statt lautlos zu verschwinden
- Härter gegen XSS — alle Textausgaben im Admin-Bereich werden kontextabhängig escapet, inline-JavaScript wurde flächendeckend durch sichere Event-Delegation ersetzt
- Eigener Appliance-Installer — der Debian-Installer ist durch einen schlanken Dialog-Assistenten ersetzt: Festplatte wählen, Tastaturlayout, Zeitzone, Sprache — fertig. Funktioniert komplett offline mit lokalen Paketquellen
- LLM-Wiki-Fundament — das Gerüst für automatisch generierte Wiki-Seiten aus den eigenen Datenquellen wird angelegt. Die Entwicklung läuft mittlerweile eigenständig weiter
Versionen 0.0.1+306 bis 0.0.1+323
5.–7. April 2026
Pipeline-Baukasten und Ausfallsicherheit
Kiara lernt, mit ausgefallenen Backends umzugehen — ohne Chat-Abstürze
- Graceful Degradation — fällt ein Backend (Ollama, Datenbank, LDAP) aus, zeigt Kiara ein gelbes Warning-Banner im Chat statt zu crashen. Erholt sich der Dienst, verschwindet die Meldung von selbst. Optionale E-Mail an den Admin bei Ausfall
- Ingestion als Baukasten — die Datei-Verarbeitung ist in eigenständige Module zerlegt: Loader (25+ Dateiformate), Hash-Management und Pipeline-Steuerung lassen sich einzeln testen und erweitern
- Schnellere Integritätsprüfung — ein Engpass mit hunderten Datenbank-Abfragen ist behoben, die Prüfung läuft jetzt um ein Vielfaches schneller
- Saubereres Chat-Streaming — Metriken, Audit-Einträge und Cloud-Routing werden einheitlich geloggt, unabhängig vom gewählten Backend
Versionen 0.0.1+289 bis 0.0.1+305
4.–5. April 2026
Trace Explorer, Late Chunking und ColBERT
Drei neue Retrieval-Verfahren und vollständige Observability
- Trace Explorer — neuer System-Subtab mit Wasserfall-Ansicht, Vergleichsmodus, Histogramm (P50/P95/P99), 7 Filter-Felder, CSV/JSON-Export. Per-Pipeline Tracing, optionaler OTLP-Exporter
- Chat-UI Debug-Modus — Trace-Timing-Bar zeigt Retrieval-, Reranking- und Generierungsdauer pro Antwort
- Late Chunking — Embedding auf Dokumentebene: der vollständige Text wird verarbeitet, Chunk-Vektoren anschließend aus Token-Positionen extrahiert. Kontextreichere Embeddings ohne größere Chunks
- ColBERT Multi-Vector Retrieval — 4. Retrieval-Quelle: jedes Token bekommt einen eigenen Vektor, Ähnlichkeit per MaxSim über alle Token-Paare. Eigene Qdrant-Collections, Circuit-Breaker in der Pipeline
Versionen 0.0.1+283 bis 0.0.1+288
2.–3. April 2026
Prompt-Defense, Contextual Retrieval und Testsuite auf 0 Failures
Dreischichtiger Angriffsschutz, intelligenteres Chunking und eine saubere Testsuite
- Prompt-Injection-Defense — dreistufiger Schutz (Input-Sanitizing, Context-Tagging, System-Prompt-Hardening) für alle Chains. Audit-Logging mit Severity-Klassifikation, eigener Compliance-Subtab
- Contextual Retrieval — vor dem Embedding wird jeder Chunk durch ein LLM mit Kontext angereichert. Konfigurierbar pro Datenquelle, mit Prompt-Versionierung und Integritätsprüfung
- Prompt-Versionierung — History-Tabelle mit SHA256-Hashes, Rollback auf frühere Versionen, History-Ansicht in der Admin-UI
- Anonymizer als Bibliothek — Kernlogik als eigenständiges Subpackage extrahiert, alle Importpfade über Compat-Shims erhalten
- Testsuite auf 0 Failures — von 829 auf 0 Failures: 3934 Tests bestehen, asyncio-Migration in 31 Dateien
- DS-Zugriffskontrolle in Elasticsearch — terms-Filter direkt in ES statt Post-Query-Filterung
Versionen 0.0.1+257 bis 0.0.1+282
31. März – 1. April 2026
LLM-Backend-Abstraktion, Wiki-Guides und Datenschutz-Steuerung
Einheitliche Backend-Architektur und umfassende Dokumentation
- LLM-Backend-Abstraktion — einheitliches LLMBackend-Interface für alle Chains (RAG, Unchained, Rewriter, Agent). Dependency Injection statt eigener Backend-Erzeugung, Shared Cloud-Routing mit automatischer Anonymisierung
- Restriction-Level pro Datenquelle — dreistufiges Datenschutz-Modell (public/anonymize/blocked) steuert, welche Daten an Cloud-Backends gesendet werden. Trusted-Flag pro Backend für vertrauenswürdige Anbieter
- Wiki-Guides mit Inhalt — 9 ausführliche Guide-Seiten (Benutzerverwaltung, Datenquellen, Jobs, VektorDB, KI, Tools, Compliance, System, Admin-Chat)
- Guided Workflows im Admin-Chat — 4 Setup-Assistenten (LLM-Backend, Datenquelle, Ingestion, Ersteinrichtung) führen schrittweise durch die Konfiguration
- Integritäts-Tab Redesign — ExpandableTable mit Detail-Renderern, Collection-Rebuild (Snapshot/Drop/Restore), Multi-Modell-Checks
- File-Size als Single Source of Truth — Dateigrößen ausschließlich in file_hashes, denormalisierte Spalten entfernt
Versionen 0.0.1+236 bis 0.0.1+257
29.–30. März 2026
Integritätsprüfung, System-Monitor und Cloud-Embeddings
Neue Diagnose-Werkzeuge und Infrastruktur
- Integritätsprüfung — neuer System-Subtab mit 5 Konsistenz-Checks, 3 Repair-Funktionen (ds_ids-Sync, Orphan-Cleanup, Metadaten-Rekonstruktion), Background-Thread mit Fortschrittsanzeige
- System-Monitor — ersetzt den Health-Tab: Live-SSE-Stream (CPU, RAM, Swap, Load, Netzwerk, Plattenplatz), Chart.js-Diagramme mit History (1h bis 1 Jahr), Service-Management und Journal-Fehler
- Cloud-Embedding-Provider — OpenAI und Voyage AI als Embedding-Backends neben Ollama, mit Probe-Embedding-Test und Batch-Limits
- Appliance-ISO — bootfähiges Installationsimage via Debian live-build, First-Boot-Wizard mit 10 Schritten, Qdrant als native Binary, Kiara-Branding im Bootscreen
- Admin-Chat Bugfix-Sprint — 13 Fixes (LDAP-Fehlertoleranz, atomare User-Deaktivierung, Session-Invalidierung bei Passwort-Reset, crash-sichere DS-Löschung)
Versionen 0.0.1+223 bis 0.0.1+235
27.–29. März 2026
Admin-Chat und Wiki
Die Admin-UI wird konversationell — und dokumentiert sich selbst
- Admin-Chat — Kiara verwalten per natürlicher Sprache: Datenquellen konfigurieren, Jobs steuern, Backends prüfen, Netzwerk-Diagnosen ausführen — alles im Chat statt über Formulare. 155+ Funktionen in 24 Kategorien, mit automatischer Tool-Auswahl durch den ReAct-Agent
- Bestätigungs- und Wizard-System — destruktive Operationen erfordern explizite Bestätigung, mehrstufige Konfigurationen führen Schritt für Schritt durch die Parameter
- Netzwerk-Diagnose — der Assistent kann beim Anbinden neuer Datenquellen selbstständig Verbindungsprobleme analysieren: Ping, Portscan, DNS-Lookup, SMB-Discovery, WebDAV-Check, HTTP-Check und Traceroute — direkt aus dem Chat heraus
- Cloud-Backend-Kompatibilität — Admin-Chat funktioniert mit Ollama, Anthropic und OpenAI, inklusive Extended Thinking mit Live-Stream
- Wiki und API-Katalog — integriertes Dokumentationssystem mit auto-generiertem API-Katalog (155+ Funktionen mit curl-Beispielen und Self-Check), kontextabhängiger Hilfe-Button in jedem Tab
- Nachrichten-Persistenz — Chat-Verläufe mit Tool-Calls, Thinking-Blöcken und Usage-Daten werden gespeichert und beim Reload identisch dargestellt
Versionen 0.0.1+207 bis 0.0.1+222
23.–27. März 2026
Query-Expansion, Dashboard-Redesign und WebDAV-Browser
Intelligentere Suche und mehr Übersicht
- Query-Expansion — LLM-basierte Suchbegriff-Erweiterung: Synonyme und Übersetzungen (DE/EN) werden automatisch generiert, mit Live-Anzeige im Chat
- Dashboard komplett überarbeitet — 4 neue Widgets (KI-Backends nach Kategorie, Datenquellen nach Typ, VektorDB Größe+Chunks nach Modell, Jobs mit Live-Status)
- WebDAV Verzeichnis-Browser — PROPFIND-basiertes Verzeichnis-Listing ohne Mount, analog zum bestehenden SMB-Browser
- DB-Management Summenzeile — Gesamt-Chunks je Collection und Embedding-Modell auf einen Blick
- KI-Backends Tabelle — Design an ExpandableTable angepasst (Header, Borders, Hover-Schatten, Kompakte-Ansicht)
- Markdown-Tabellen im Chat — Pipe-Syntax mit Alignment wird korrekt gerendert
- Embedding-Dimension bei Downtime — Fallback las gecachte Dimension nur bei bestandenem Health-Check, jetzt korrekt auch bei unerreichbarem Ollama
Versionen 0.0.1+188 bis 0.0.1+206
21. März 2026
Chat-UX-Offensive und Agent-Verbesserungen
Polierter Chat, robusterer Agent
- Copy-Buttons — Code-Blöcke und gesamte Antworten mit einem Klick kopierbar, Clipboard-Fallback für HTTP-Verbindungen
- Markdown-Headings im Chat — Überschriften (h1–h6) werden korrekt gerendert statt als Plaintext
- Scroll-Verhalten — Auto-Scroll stoppt bei manuellem Hochscrollen und springt nicht mehr zurück
- Thinking-Blöcke repariert — Ollama 0.18 liefert Reasoning-Content in einem neuen Feld statt als XML-Tags, alle drei Streaming-Pfade angepasst
- Agent Tool-Call-Retry — bei Backend-Fehlern wiederholt der Agent Suchen automatisch (3 Versuche), fehlgeschlagene Calls blockieren nicht mehr die Loop-Detection
- Hybrid-Retrieval Metadata-Filter — Dateityp- und Verzeichnis-Filter wirken jetzt auf alle drei Retrieval-Pfade (Vektor, BM25/ES, Graph), nicht nur auf die Vektorsuche
- Separate Sessions — Chat-UI und Admin-UI verwenden getrennte Session-Cookies, gleichzeitiges Arbeiten in beiden Oberflächen möglich
- Chat-Titel editierbar — Stift-Button in der History zum Umbenennen von Chats
- Einzel-Job-Löschung — beendete Jobs können direkt aus dem Jobs-Tab gelöscht werden
Versionen 0.0.1+177 bis 0.0.1+186
18.–19. März 2026
Security-Audit und Härtung
Umfassendes Security-Audit mit 49 Findings — systematisch abgearbeitet
- Security-Audit — 5 parallele Audit-Agenten, 49 Findings identifiziert und klassifiziert, interner Audit-Report
- Path-Traversal-Fix — Backup-Restore-Endpoint gegen Directory-Traversal-Angriffe abgesichert
- Session-Token-Hashing — Tokens werden als SHA-256-Hash in der DB gespeichert statt im Klartext
- Cloud-API-Key-Verschlüsselung — API-Keys werden mit Fernet in YAML, ai_config und ki_backends verschlüsselt
- DOMPurify integriert — Defense-in-Depth gegen XSS in Chat und Audit-Detailansicht
- systemd-Hardening — ProtectHome, PrivateTmp, NoNewPrivileges für alle 4 Units
- Auth-Tiering — saubere Trennung: Admin-Endpoints für Admins, Chat-Endpoints für User
- GitHub-Readiness — Dual-Repo-Architektur mit automatischem Export-Filter für sensible Inhalte
- 56 Security-Regressionstests — Backup-Traversal, Session-Invalidierung, Input-Limits, SQL-Härtung
Versionen 0.0.1+164 bis 0.0.1+176
17.–18. März 2026
PostgreSQL-Backend, Cache-Architektur und Code-Qualität
Skalierung nach oben und nach innen
- PostgreSQL-Backend — CLI-Migrationskommando (kiara migrate-db), automatisches SQL-Rewriting, manuelle Konvertierungen in 30 Dateien
- Cache-Tabellen-Architektur — 3 Cache-Tabellen mit vorberechneten JSON-Payloads, API-Endpoints lesen 1-2 SELECTs statt N+1-Queries, anlassbezogener und periodischer Refresh
- VektorDB Datei-Management — neuer DB-Management-Tab mit Datenquellen-Matrix, Datei-Detailansicht, selektive Löschung mit Orphan-Prüfung
- pgvector restlos entfernt — 7 Dateien gelöscht, Factory+HealthCheck+Frontend bereinigt, ~2400 Zeilen weniger
- 5 Refactoring-Iterationen — 35+ Magic Values zentralisiert, Template-Method-Patterns, Cloud-Adapter-Basisklasse, 6 grosse Funktionen dekomponiert, ~80 Dateien überarbeitet
- Jobs-Tab Flicker-Fix — In-place DOM-Patch statt vollem Re-Render bei Polling, expandierte Detail-Bereiche bleiben stabil
- Ingestion-UX — Modell-Dropdown dient als Filter und Ingestion-Auswahl, Overlay-Bestätigung statt Modal
Versionen 0.0.1+152 bis 0.0.1+163
14.–16. März 2026
ERP-Konnektor-Schicht, Code-Qualität und DEB-Paketierung
Enterprise-Integration und Deployment
- ERP-Konnektor-Schicht — neue Plugin-Architektur für ERP-Systeme: Odoo-Konnektor (XML-RPC, verifiziert gegen 322 Auftraege, 104k Produkte), Connection-Registry mit Fernet-Verschlüsselung, 8 Admin-API-Endpoints
- Qdrant source_key-Feld — KEYWORD-Index für exakte Pfad-Matches (O(1) statt Full Scan bei 3,8 Millionen Punkten)
- Embedding-Modell-Filter — neues Dropdown im Datenquellen-Tab zur Filterung nach Embedding-Modell
- Pipeline-Dekomposition — die zentrale 470-Zeilen-Funktion wurde auf 65 Zeilen reduziert und in 9 testbare Einzelfunktionen aufgeteilt
- DEB-Paketierung für Zielsysteme — Ubuntu 24.04-kompatibel, mit Auto-Start, Client-CLAUDE.md für KI-gestützte Administration auf Zielsystemen, und automatischer IP-Erkennung im Post-Install
Versionen 0.0.1+144 bis 0.0.1+151
11.–13. März 2026
Worker-Service, Such-Tab und IMAP-Turbo
Architektur-Meilenstein und neue Suchfunktionen
- Worker-Service-Separation — die Ingestion läuft jetzt als eigener Systemdienst (Kiara-worker), unabhängig vom Web-Interface, mit Graceful Shutdown und Auto-Resume
- Audit-Trail-Redesign — vollständige DSGVO-Nachvollziehbarkeit: der exakte Prompt, die vollständige KI-Antwort und alle Tool-Calls werden aufgezeichnet, mit Vollbild-Detailansicht und Druckfunktion
- Neuer Such-Tab — die Wissensbasis ist direkt durchsuchbar: Text-Suche (Elasticsearch) und semantische Suche (Qdrant) mit Filtern nach Datenquelle, Dateityp, Verzeichnis und Datum, Ergebnisse direkt als Kontext an den Chat übergebbar
- IMAP Batch-Fetch — E-Mails werden in 50er-Batches heruntergeladen statt einzeln (50x weniger Roundtrips), mit automatischem Reconnect bei Verbindungsverlust
- Paralleler IMAP-Scan — Mail-Download läuft im Hintergrund, während die Verarbeitung bereits auf gecachten Dateien startet
- Auto-Wait bei Backend-Ausfall — die Pipeline wartet auf Backend-Recovery statt abzubrechen
- VektorDB-Management — dynamische Modell-Spalten zeigen Chunks pro Embedding-Modell
Versionen 0.0.1+132 bis 0.0.1+143
9.–10. März 2026
Backend-Warmup, parallele Tool-Calls und intelligentere Suche
Performance und Robustheit auf einem neuen Level
- Backend-Warmup vor Ingestion — KI-Modelle werden vor der Verarbeitung "aufgewaermt", damit der erste Request nicht minutenlang dauert
- Parallele Agent-Tool-Calls — der Agent fuehrt jetzt mehrere Suchen gleichzeitig aus statt nacheinander — deutlich schnellere Antworten
- n:m Chunk-Datenquellen-Beziehung — identische Dateien in mehreren Datenquellen werden nur einmal gespeichert, aber allen zugeordnet
- Array-basierter Pre-Filter — Datenquellen-Berechtigungen direkt in der Vektorsuche statt nachgelagertem Filter (0 MB statt 160 MB RAM pro Anfrage)
- Content-basierte Hash-Invalidierung — E-Mail-Resync erkennt Änderungen am Dateiinhalt, nicht nur am Zeitstempel
- Audit-Trail vollständig — alle Chat-Modi loggen jetzt lueckenlos in die Audit-Datenbank
- Agent Final-Rerank — gesammelte Suchergebnisse werden vor der Antwort nochmals bewertet und irrelevante Chunks entfernt
- Tilde-Datei-Filter — Office-Lock-Dateien (~$doc.docx) werden herausgefiltert, bevor sie die Pipeline stoeren
Versionen 0.0.1+114 bis 0.0.1+131
6.–8. März 2026
Kontext-Limits, Ingestion-Monitoring und Backend-Management
Mehr Kontrolle, mehr Transparenz
- Globales Chunk-Cap — schuetzt vor Kontextfenster-Überlauf bei vielen Suchergebnissen (konfigurierbar, Default 80 Chunks)
- Agent Final-Prompt editierbar — der Instruktions-Prompt der Agent-Antwort ist jetzt über die Admin-UI anpassbar
- Per-File Ingestion-Monitoring — für jede einzelne Datei sichtbar: Parser, Chunk-Strategie, Chunk-Anzahl, Dauer, Status und Fehlermeldungen
- Live-Dateiname — während der Verarbeitung wird die aktuelle Datei unter dem Fortschrittsbalken angezeigt
- Config-Changelog — Audit-Trail für alle Konfigurationsänderungen
- Multi-Embedding-Modell-Management — modellspezifisches Failover mit Health-Cache, CLI mit
--embedding-model
- Circuit-Breaker — die Pipeline bricht nach 10 aufeinanderfolgenden Infrastrukturfehlern automatisch ab, statt sinnlos weiterzuarbeiten
- DDU Pre-flight Check — vor der Dokumentenverarbeitung wird geprüft, ob das OCR-Backend erreichbar ist
Versionen 0.0.1+98 bis 0.0.1+113
4.–5. März 2026
Thinking-Modus, Elasticsearch und Agent-Intelligenz
Kiara denkt jetzt laut — und durchsucht besser
- Thinking-Modus — die KI zeigt live ihren Denkprozess (Chain of Thought), ein-/ausschaltbar per Toggle
- Elasticsearch als Hybrid-Suche — neben BM25 jetzt auch Elasticsearch für hochperformante Keyword-Suche mit Fuzziness-Kontrolle
- Agent-Loop-Detection — der Agent erkennt, wenn er sich im Kreis dreht, und bricht sinnlose Wiederholungen ab
- Parent-Document-Retrieval — bei kleinen Dokumenten werden automatisch alle Chunks geladen, nicht nur die besten Treffer
- Temperature-Slider — steuert die Kreativität der KI im Unchained-Modus
- Sibling-Chunk-Expansion — benachbarte Textabschnitte werden automatisch mitgeladen für vollständigeren Kontext
- BM25 Hybrid-Search endlich verdrahtet — die Keyword-Suche war implementiert aber nicht aktiv — jetzt werden z.B. Rechnungen nach Firmenname gefunden
Versionen 0.0.1+84 bis 0.0.1+97
2.–3. März 2026
Agentic RAG, Exchange Online und Datenquellen-Filter
Die KI lernt, selbstständig zu handeln
- Backend-agnostisches Agentic RAG — der Agent-Modus funktioniert jetzt mit allen drei LLM-Backends (Ollama, Anthropic, OpenAI), jedes mit nativer Tool-Use-Integration
- Exchange Online-Konnektor — Microsoft 365 Postfächer via OAuth2/Entra ID als Datenquelle
- Multi-Select Datenquellen-Filter — mehrere Datenquellen im Chat gezielt auswählbar, einzelne Quellen per NOT-Toggle ausschließbar
- Verbindungstest vor dem Speichern — Datenquellen-Verbindungen lassen sich direkt im Formular testen
- Content-basierte Dateierkennung — auch .log, .conf und andere Textdateien ohne Standardendung werden jetzt erkannt und indexiert
- Cloud-Backend-Fehler-Feedback — explizite Fehlermeldungen statt stiller Fallbacks
- HashStore-Migration — Datei-Hashes in einer dedizierten Datenbank statt JSON für schnellere Verarbeitung großer Datenmengen
Versionen 0.0.1+56 bis 0.0.1+83
28. Februar – 1. März 2026
Job-Queue, Anonymisierung und drei Chat-Modi
Kiara wird zum Enterprise-Tool
- Persistente Job-Queue — Ingestion-Auftraege überleben Service-Neustarts, mit Cron-Scheduling, Pause/Resume und detaillierter Historie
- Drei Chat-Modi — Standard (RAG-gestützte Antworten), Unchained (freies LLM ohne Dokumentenkontext) und Agent (ReAct-Loop mit Tool-Use — die KI kann aktiv suchen und rechnen)
- Anonymisierungsmodul — Aho-Corasick-Engine für 50.000+ Entitaeten, DSGVO-konforme Pseudonymisierung, LLM-basierte PII-Erkennung als vierte Schutzschicht
- Cloud-KI-Backends — Anthropic Claude und OpenAI GPT als alternative LLM-Backends, mit Budget-Tracking und Audit
- Cross-Encoder-Reranking — Suchergebnisse werden mit einem spezialisierten Modell nachsortiert für präzisere Antworten
- Token-Anzeige im Chat — Live-Anzeige der Kontextfenster-Auslastung
- Kontextfenster-Slider — steuert, wie viel Kontext die KI verarbeiten soll (1K–40K Tokens)
- LLM-Backend-Auswahl — direkt im Chat waehlbar, welches KI-Modell antworten soll
- System-Selbsttest — automatisierte Test-Suite direkt aus der Admin-UI startbar
Versionen 0.0.1+34 bis 0.0.1+55
26.–27. Februar 2026
Plugin-System, Web-Crawler und das grosse Rebranding
Ein historischer Meilenstein — aus OpenRAG wird Kiara
- Rebranding zu Kiara — "KI-Assistenz für Retrieval und Analyse" — neuer Name, neues Branding, 361 Dateien aktualisiert
- Plugin-Architektur für Konnektoren — Datenquellen-Konnektoren sind jetzt als Plugins erweiterbar, mit automatischer Erkennung und datengetriebener Admin-UI
- Web-Crawler-Plugin — Websites als Datenquelle: BFS-Crawling mit robots.txt-Respekt, Sitemap-Parsing und HTML-zu-Markdown-Konvertierung
- MCP-Server — Kiara spricht jetzt das Model Context Protocol — Integration mit VS Code, Claude Desktop und Cursor möglich
- Multi-Backend-Verwaltung — beliebig viele KI-Backends (Ollama, Anthropic, OpenAI) mit automatischem Failover und Round-Robin
Versionen 0.0.1+18 bis 0.0.1+33
24.–25. Februar 2026
Wissensgraph, drei VectorDB-Backends und E-Mail-Indexierung
Kiara wird deutlich leistungsfähiger
- GraphRAG-Wissensgraph — Kiara erkennt jetzt Zusammenhänge zwischen Entitaeten (Kunden, Lieferanten, Auftraege) und nutzt diese als dritte Retrieval-Quelle neben Vektor- und Keyword-Suche
- E-Mail-Indexierung — IMAP-Postfächer als Datenquelle: Mails und Anhaenge werden automatisch verarbeitet
- SQL-Datenbanken — MSSQL, PostgreSQL, MySQL und SQLite als Wissensquellen anbindbar
- ERP-Integration — erste Anbindung an Unternehmensdaten (Auftraege, Lagerbestand, Kunden)
- Dokumenten-Workflows — automatische Zusammenfassungen, Template-basierte Reports, Export als PDF/DOCX
- DSGVO-Compliance-Dashboard — Verarbeitungsverzeichnis, Datenschutz-Folgenabschätzung und Audit-Trail
- Automatische Chunk-Strategie — Kiara erkennt, ob ein Dokument Prosa, Tabelle, Code oder E-Mail ist, und passt die Verarbeitung entsprechend an
- Deep Document Understanding — optionaler layout-aware PDF-Parser mit OCR für gescannte Dokumente
Versionen 0.0.1+12 bis 0.0.1+17
21.–23. Februar 2026
Projektstart: Kiara erblickt das Licht der Welt
Die erste Version der Unternehmens-KI-Plattform geht an den Start
- RAG-Engine mit Hybrid-Retrieval — Dokumente werden intelligent durchsucht, nicht nur per Stichwort, sondern auch nach Bedeutung
- Web-Chat-Interface auf Port 8501 — Unternehmensdaten lassen sich direkt im Browser abfragen
- Admin-Dashboard auf Port 8502 — volle Kontrolle über Datenquellen, Status und Konfiguration
- Multi-Datenquellen — lokale Verzeichnisse, SMB-Netzlaufwerke und WebDAV (Nextcloud) als Wissensquellen
- Live-Fortschrittsanzeige bei der Dokumentenverarbeitung
- Multi-Embedding-Modell-Architektur — verschiedene KI-Modelle für verschiedene Einsatzzwecke
- Konfigurierbares Prompt-Template — der Charakter der KI lässt sich an das Unternehmen anpassen
- .deb-Paketierung — einfache Installation auf Ubuntu/Debian-Systemen
Versionen 0.0.1+1 bis 0.0.1+11