Logo
Smart Invoice Automation Dashboard mit verarbeiteten Rechnungen

Smart Invoice Automation

azureaiserverlessnext.js.nettypescriptc#document-processingcosmos-db

Eine KI-gestützte serverlose Rechnungsverarbeitungsplattform, die automatisch Schlüsseldaten aus hochgeladenen Rechnungen extrahiert und sie intelligent nach Ausgabenkategorien klassifiziert. Entwickelt mit Azure KI-Services (Form Recognizer und OpenAI), .NET Azure Functions, Next.js und Cosmos DB verarbeitet das System PDF- und Bilddateien in 3-5 Sekunden mit 95%+ Genauigkeit.

Hauptfunktionen

  • Intelligente Datenextraktion - Extrahiert automatisch Lieferanteninformationen, Rechnungsnummern, Daten, Beträge, Währung und Einzelposten mit dem vortrainierten Modell von Azure Form Recognizer
  • KI-gestützte Klassifizierung - Verwendet Azure OpenAI zur Kategorisierung von Rechnungen in Geschäftsausgabenkategorien (IT-Services, Marketing, Bürobedarf usw.) mit Konfidenzwerten und Begründungen
  • Drag-and-Drop-Upload - Einfache, intuitive Benutzeroberfläche mit Unterstützung für PDF-, PNG- und JPG-Formate
  • Echtzeit-Verarbeitung - Komplette Verarbeitungspipeline läuft in 3-5 Sekunden pro Rechnung ab
  • Strukturierte Speicherung - Rechnungsdaten in Cosmos DB gespeichert, Originaldateien in Azure Blob Storage erhalten
  • Verarbeitungs-Dashboard - Alle verarbeiteten Rechnungen anzeigen, suchen und filtern mit detaillierter Ansicht
  • Kostenoptimierte Architektur - Serverlose Architektur mit automatischer Skalierung und Pay-per-Use-Preismodell (weniger als 5 $/Monat für Demo-Nutzung)

Tech Stack

Azure .NET C# Azure Functions Next.js TypeScript React Tailwind CSS Cosmos DB Blob Storage OpenAI

Backend:

  • .NET Azure Functions (Isolated Worker Process)
  • Azure Form Recognizer (Document Intelligence)
  • Azure OpenAI Service
  • Azure Blob Storage mit SAS-Token-Sicherheit
  • Azure Cosmos DB (Serverless-Modus)

Frontend:

  • Next.js mit App Router
  • React
  • TypeScript für Typsicherheit
  • Tailwind CSS für responsives Design

Architektur-Highlights

Die Plattform implementiert eine vollständig serverlose, mehrschichtige Architektur:

Verarbeitungspipeline:

  1. Benutzer lädt Rechnung (PDF/PNG/JPG) über Drag-and-Drop-Oberfläche hoch
  2. Datei in Azure Blob Storage mit organisierter Ordnerstruktur gespeichert
  3. Azure Function orchestriert den Verarbeitungsworkflow
  4. Form Recognizer extrahiert strukturierte Daten (Lieferant, Beträge, Daten, Einzelposten)
  5. Azure OpenAI klassifiziert die Rechnung in Ausgabenkategorien mit Begründung
  6. Ergebnisse in Cosmos DB gespeichert, Originaldatei in Blob Storage erhalten
  7. Dashboard zeigt verarbeitete Rechnungen mit vollständigen Metadaten an

Wichtige technische Entscheidungen:

  • Serverlose Architektur: Null Infrastrukturmanagement, automatische Skalierung, Pay-per-Use-Preismodell
  • Isolated Worker Process: Modernes .NET Functions-Modell mit besserer DI- und Middleware-Unterstützung
  • Polling-Strategie: Synchrone Benutzererfahrung trotz asynchroner KI-Service-Verarbeitung
  • SAS-Token: Sicherer, zeitlich begrenzter Blob Storage-Zugriff für KI-Services
  • Service-Layer-Muster: Saubere Trennung der Belange mit dedizierten Services für jede Azure-Ressource
  • Typsicherheit: TypeScript-Frontend + C#-Backend für Fehlerkennung zur Compile-Zeit

Gelöstes Problem

Manuelle Rechnungsdateneingabe ist mühsam, zeitaufwändig und fehleranfällig. Unternehmen erhalten Rechnungen in verschiedenen Formaten per E-Mail, und jemand muss manuell Lieferanteninformationen, Beträge, Daten extrahieren und Ausgaben für Buchhaltungszwecke kategorisieren.

Diese Plattform demonstriert, wie KI diesen Workflow automatisieren kann, während hohe Genauigkeit (95%+) beibehalten wird und transparente, überprüfbare Entscheidungsfindung durch die Begründungsfähigkeiten des Sprachmodells bereitgestellt wird.

Implementierungs-Herausforderungen

Asynchrone KI-Verarbeitung: Form Recognizer verwendet asynchrones Polling, aber Benutzer erwarten schnelle Antworten. Lösung: Implementierte Polling mit exponentiellem Backoff in der Azure Function, um synchrone Benutzererfahrung zu erhalten, während die Verarbeitung in 3-5 Sekunden abgeschlossen wird.

Vielfältige Rechnungsformate: Rechnungen variieren stark in Layout und Struktur. Lösung: Nutzung des vortrainierten Modells von Form Recognizer, das auf Tausende globaler Rechnungsformate trainiert wurde und 95%+ Genauigkeit out of the box erreicht.

Konsistente Klassifizierung: Ausgaben ohne vordefinierte Regeln zu kategorisieren ist herausfordernd. Lösung: Entwickelte Sprachmodell-Prompts, die als „Experten-Buchhalter" agieren, mit strukturierter JSON-Ausgabe einschließlich Kategorie, Konfidenzwert und Begründung für Transparenz.

Kostenmanagement: KI-Services können im großen Maßstab teuer sein. Lösung: Verwendung serverloser Preismodelle, Cosmos DB Serverless-Modus, Nutzung kostenloser Tiers und Implementierung effizienter Prompts, um Demo-Kosten unter 5 $/Monat zu halten.

Sicherer KI-Zugriff: Form Recognizer benötigt Dateizugriff, ohne Blobs öffentlich zugänglich zu machen. Lösung: Generierte zeitlich begrenzte SAS-Token für sicheren, temporären Zugriff während der Verarbeitung.

Was ich gelernt habe

  • Serverlose Architekturmuster: Aufbau wirklich zustandsloser, automatisch skalierender Anwendungen mit Cold-Start-Optimierung und kostenbewusstem Design
  • Prompt Engineering: Erstellung produktionsreifer Prompts für konsistentes KI-Verhalten mit strukturierten Ausgaben und Begründungsanforderungen
  • Azure KI-Integration: Arbeit mit mehreren KI-Services, Umgang mit asynchronen Operationen, Interpretation von Konfidenzwerten und Implementierung von Fehlerbehandlung
  • .NET Isolated Functions: Moderne Azure Functions-Entwicklung mit verbesserter DI- und Middleware-Unterstützung
  • Next.js App Router: Server Components, Streaming und der Paradigmenwechsel vom Pages Router
  • Vorteile der Typsicherheit: Fehler zur Compile-Zeit über den gesamten Stack mit TypeScript und C# erkennen

Zukünftige Erweiterungen

  • Batch-Verarbeitung über Azure Queue Storage
  • Duplikaterkennung mit Content-Hashing
  • Export nach CSV, Excel oder Buchhaltungssoftware-APIs
  • Mehrstufige Genehmigungsworkflows
  • Custom Form Recognizer-Modelltraining für unternehmensspezifische Formate
  • Analytics-Dashboard für Ausgaben-Insights und Trends
  • Belegverarbeitung (zusätzlich zu Rechnungen)
  • Mehrsprachige Unterstützung
  • Azure AD B2C-Authentifizierung und RBAC

Lesen Sie den detaillierten Build-Prozess →