Eine KI-gestützte serverlose Rechnungsverarbeitungsplattform, die automatisch Schlüsseldaten aus hochgeladenen Rechnungen extrahiert und sie intelligent nach Ausgabenkategorien klassifiziert. Entwickelt mit Azure KI-Services (Form Recognizer und OpenAI), .NET Azure Functions, Next.js und Cosmos DB verarbeitet das System PDF- und Bilddateien in 3-5 Sekunden mit 95%+ Genauigkeit.
Hauptfunktionen
- Intelligente Datenextraktion - Extrahiert automatisch Lieferanteninformationen, Rechnungsnummern, Daten, Beträge, Währung und Einzelposten mit dem vortrainierten Modell von Azure Form Recognizer
- KI-gestützte Klassifizierung - Verwendet Azure OpenAI zur Kategorisierung von Rechnungen in Geschäftsausgabenkategorien (IT-Services, Marketing, Bürobedarf usw.) mit Konfidenzwerten und Begründungen
- Drag-and-Drop-Upload - Einfache, intuitive Benutzeroberfläche mit Unterstützung für PDF-, PNG- und JPG-Formate
- Echtzeit-Verarbeitung - Komplette Verarbeitungspipeline läuft in 3-5 Sekunden pro Rechnung ab
- Strukturierte Speicherung - Rechnungsdaten in Cosmos DB gespeichert, Originaldateien in Azure Blob Storage erhalten
- Verarbeitungs-Dashboard - Alle verarbeiteten Rechnungen anzeigen, suchen und filtern mit detaillierter Ansicht
- Kostenoptimierte Architektur - Serverlose Architektur mit automatischer Skalierung und Pay-per-Use-Preismodell (weniger als 5 $/Monat für Demo-Nutzung)
Tech Stack
Backend:
- .NET Azure Functions (Isolated Worker Process)
- Azure Form Recognizer (Document Intelligence)
- Azure OpenAI Service
- Azure Blob Storage mit SAS-Token-Sicherheit
- Azure Cosmos DB (Serverless-Modus)
Frontend:
- Next.js mit App Router
- React
- TypeScript für Typsicherheit
- Tailwind CSS für responsives Design
Architektur-Highlights
Die Plattform implementiert eine vollständig serverlose, mehrschichtige Architektur:
Verarbeitungspipeline:
- Benutzer lädt Rechnung (PDF/PNG/JPG) über Drag-and-Drop-Oberfläche hoch
- Datei in Azure Blob Storage mit organisierter Ordnerstruktur gespeichert
- Azure Function orchestriert den Verarbeitungsworkflow
- Form Recognizer extrahiert strukturierte Daten (Lieferant, Beträge, Daten, Einzelposten)
- Azure OpenAI klassifiziert die Rechnung in Ausgabenkategorien mit Begründung
- Ergebnisse in Cosmos DB gespeichert, Originaldatei in Blob Storage erhalten
- Dashboard zeigt verarbeitete Rechnungen mit vollständigen Metadaten an
Wichtige technische Entscheidungen:
- Serverlose Architektur: Null Infrastrukturmanagement, automatische Skalierung, Pay-per-Use-Preismodell
- Isolated Worker Process: Modernes .NET Functions-Modell mit besserer DI- und Middleware-Unterstützung
- Polling-Strategie: Synchrone Benutzererfahrung trotz asynchroner KI-Service-Verarbeitung
- SAS-Token: Sicherer, zeitlich begrenzter Blob Storage-Zugriff für KI-Services
- Service-Layer-Muster: Saubere Trennung der Belange mit dedizierten Services für jede Azure-Ressource
- Typsicherheit: TypeScript-Frontend + C#-Backend für Fehlerkennung zur Compile-Zeit
Gelöstes Problem
Manuelle Rechnungsdateneingabe ist mühsam, zeitaufwändig und fehleranfällig. Unternehmen erhalten Rechnungen in verschiedenen Formaten per E-Mail, und jemand muss manuell Lieferanteninformationen, Beträge, Daten extrahieren und Ausgaben für Buchhaltungszwecke kategorisieren.
Diese Plattform demonstriert, wie KI diesen Workflow automatisieren kann, während hohe Genauigkeit (95%+) beibehalten wird und transparente, überprüfbare Entscheidungsfindung durch die Begründungsfähigkeiten des Sprachmodells bereitgestellt wird.
Implementierungs-Herausforderungen
Asynchrone KI-Verarbeitung: Form Recognizer verwendet asynchrones Polling, aber Benutzer erwarten schnelle Antworten. Lösung: Implementierte Polling mit exponentiellem Backoff in der Azure Function, um synchrone Benutzererfahrung zu erhalten, während die Verarbeitung in 3-5 Sekunden abgeschlossen wird.
Vielfältige Rechnungsformate: Rechnungen variieren stark in Layout und Struktur. Lösung: Nutzung des vortrainierten Modells von Form Recognizer, das auf Tausende globaler Rechnungsformate trainiert wurde und 95%+ Genauigkeit out of the box erreicht.
Konsistente Klassifizierung: Ausgaben ohne vordefinierte Regeln zu kategorisieren ist herausfordernd. Lösung: Entwickelte Sprachmodell-Prompts, die als „Experten-Buchhalter" agieren, mit strukturierter JSON-Ausgabe einschließlich Kategorie, Konfidenzwert und Begründung für Transparenz.
Kostenmanagement: KI-Services können im großen Maßstab teuer sein. Lösung: Verwendung serverloser Preismodelle, Cosmos DB Serverless-Modus, Nutzung kostenloser Tiers und Implementierung effizienter Prompts, um Demo-Kosten unter 5 $/Monat zu halten.
Sicherer KI-Zugriff: Form Recognizer benötigt Dateizugriff, ohne Blobs öffentlich zugänglich zu machen. Lösung: Generierte zeitlich begrenzte SAS-Token für sicheren, temporären Zugriff während der Verarbeitung.
Was ich gelernt habe
- Serverlose Architekturmuster: Aufbau wirklich zustandsloser, automatisch skalierender Anwendungen mit Cold-Start-Optimierung und kostenbewusstem Design
- Prompt Engineering: Erstellung produktionsreifer Prompts für konsistentes KI-Verhalten mit strukturierten Ausgaben und Begründungsanforderungen
- Azure KI-Integration: Arbeit mit mehreren KI-Services, Umgang mit asynchronen Operationen, Interpretation von Konfidenzwerten und Implementierung von Fehlerbehandlung
- .NET Isolated Functions: Moderne Azure Functions-Entwicklung mit verbesserter DI- und Middleware-Unterstützung
- Next.js App Router: Server Components, Streaming und der Paradigmenwechsel vom Pages Router
- Vorteile der Typsicherheit: Fehler zur Compile-Zeit über den gesamten Stack mit TypeScript und C# erkennen
Zukünftige Erweiterungen
- Batch-Verarbeitung über Azure Queue Storage
- Duplikaterkennung mit Content-Hashing
- Export nach CSV, Excel oder Buchhaltungssoftware-APIs
- Mehrstufige Genehmigungsworkflows
- Custom Form Recognizer-Modelltraining für unternehmensspezifische Formate
- Analytics-Dashboard für Ausgaben-Insights und Trends
- Belegverarbeitung (zusätzlich zu Rechnungen)
- Mehrsprachige Unterstützung
- Azure AD B2C-Authentifizierung und RBAC



