Unstrukturierte Daten: Der blinde Fleck der Abschlussprüfung
Lesezeit: 7 Minuten · Aktualisiert: Juni 2026
Von Stefan Preusler, Geschäftsführer
Die Wirtschaftsprüferkammer hat 2025 explizit die Rolle unstrukturierter Daten in der Abschlussprüfung thematisiert. Verträge, E-Mails, Protokolle und Lieferantenkorrespondenz enthalten oft mehr Risikoindikatoren als das Buchungsjournal. Doch die gängige Prüfungssoftware liest nur strukturierte Daten aus DATEV, SAP oder anderen ERP-Systemen. Wer nicht analysiert, was außerhalb der Buchhaltung liegt, prüft nur die Hälfte.
Was unstrukturierte Daten in der Prüfung leisten können
Strukturierte Daten sind sauber. Jede Buchungszeile hat einen Betrag, ein Datum, einen Sachkonto und einen Geschäftspartner. Das Problem: Fraud findet selten in der Buchhaltung statt. Es findet in den Verträgen statt, in den genehmigten Sonderkonditionen, in den nachträglichen Preisnachlässen, die per E-Mail vereinbart werden. Es findet in den Protokollen der Geschäftsführung statt, in denen Lieferantenbeziehungen neu justiert werden.
Die WPK hat in ihren Fragen und Antworten zum Einsatz von KI in der WP-Praxis darauf hingewiesen, dass unstrukturierte Daten eine eigenständige Informationsquelle darstellen. Ein Vertrag mit einem Zulieferer enthält Zahlungsziele, Kündigungsklauseln und Mengenbindungen, die im ERP nur als verkürzte Stammdaten erscheinen. Die vollständige Risikoeinschätzung eines Geschäftspartners ist ohne die Analyse des Vertragstextes unvollständig.
Warum Prüfungssoftware sie ignoriert
Die meisten Prüfungstools sind auf tabellarische Daten ausgelegt. Sie lesen CSV-Exports, Datenbanktabellen oder direkte API-Schnittstellen zu Buchhaltungssystemen. Unstrukturierte Daten passen nicht in dieses Schema. Ein E-Mail-Verkehr liegt als PDF oder PST-Datei vor. Ein Vertrag liegt als Word-Dokument oder gescannter PDF vor. Ein Protokoll liegt als Textdatei oder handschriftliche Notiz vor.
Die Konvertierung dieser Daten in ein maschinenlesbares Format ist technisch aufwändig. Optische Zeichenerkennung (OCR) für gescannte Verträge, Natural Language Processing für E-Mails, Entitätenextraktion für Protokolle. Jeder Datentyp erfordert eine eigene Vorverarbeitung. Prüfungssoftware-Anbieter konzentrieren sich deshalb auf den einfacheren Teil: die strukturierten Buchungsdaten.
Das Ergebnis ist eine systematische Lücke. Der Prüfer sieht, dass eine Zahlung an einen Lieferanten erfolgt ist. Er sieht nicht, dass die Zahlungsbedingungen im Vertrag von 30 auf 90 Tage verlängert wurden, weil diese Information im E-Mail-Verkehr des Einkaufs steht. Er sieht eine Rückstellung, aber nicht den Protokollvermerk, aus dem die Höhe der Rückstellung abgeleitet wurde.
Vier Quellen, die jeder WP-Prüfer kennen sollte
Es gibt vier Kategorien unstrukturierter Daten, die in fast jeder Prüfung relevant sind.
Erstens die Vertragsdokumentation. Lieferverträge, Kaufverträge, Mietverträge und Lizenzvereinbarungen enthalten Bedingungen, die direkte Auswirkungen auf den Abschluss haben. Verlängerte Zahlungsziele, Staffelpreise, Boni und Rabatte, Kündigungsfristen. Diese Informationen müssen mit den Buchungsdaten abgeglichen werden.
Zweitens der E-Mail-Verkehr. Genehmigungen, Absprachen, Reklamationen und Korrespondenz mit Geschäftspartnern dokumentieren Entscheidungen, die im ERP nicht nachvollziehbar sind. Ein E-Mail-Verkehr zwischen Einkauf und Lieferant über Preisnachlässe ist für die Bewertung von Forderungen relevant.
Drittens die Protokolle. Geschäftsführungssitzungen, Aufsichtsratsprotokolle und interne Abstimmungsrunden enthalten Beschlüsse über Rückstellungen, Investitionen und strategische Neuausrichtungen. Diese Protokolle sind oft die einzige Quelle für die Begründung von Bilanzpositionen.
Viertens die Lieferantenkorrespondenz. Reklamationen, Mahnungen, Kulanzregelungen und Sondervereinbarungen sind im ERP nicht vollständig erfasst. Sie beeinflussen jedoch die Bewertung von Verbindlichkeiten und Rückstellungen.
Was das für die Methodik bedeutet
Die Analyse unstrukturierter Daten erfordert eine Erweiterung der Prüfungsmethodik. Nicht als Ersatz für die bestehende Prüfung, sondern als Ergänzung. Eine sinnvolle Lösung benötigt wiederum vier Komponenten.
Die erste Komponente ist eine Rules Engine zur Klassifizierung. Dokumente müssen automatisch kategorisiert werden. Vertrag, E-Mail, Protokoll, Korrespondenz. Ohne diese Klassifizierung ist keine gezielte Analyse möglich.
Die zweite Komponente ist die Muster-Erkennung in Textdaten. Natural Language Processing identifiziert relevante Passagen in Verträgen und E-Mails. Zahlungsbedingungen, Kündigungsklauseln, Preisnachlässe, Boni. Die Muster-Erkennung muss branchenspezifisch trainiert sein, weil die Formulierungen in einem Handelsvertrag anders lauten als in einem Produktionsvertrag.
Die dritte Komponente ist die Wissensbasis des Prüfers. Die extrahierten Informationen müssen mit den Buchungsdaten verknüpft werden. Eine Intelligenz-Schicht gleicht Vertragsklauseln mit den tatsächlichen Zahlungsläufen ab. Sie erkennt Abweichungen zwischen vereinbarten und gebuchten Konditionen.
Die vierte Komponente ist eine Middleware zur Integration. Die Lösung muss über eine Middleware an das Dokumentenmanagement-System und das ERP angebunden werden. Nur so entsteht ein durchgängiger Prüfungsprozess, der strukturierte und unstrukturierte Daten zusammenführt.
Praxisbeispiel: Wie ein Mandant 340.000 Euro fand
Eine WP-Gesellschaft prüfte einen Maschinenbau-KMU mit 85 Millionen Euro Umsatz. Die Buchungsdaten waren sauber. Die Forderungen wurden regelmäßig angepasst. Doch bei der Analyse des E-Mail-Verkehrs zwischen Vertrieb und drei Großkunden fiel auf, dass in 23 E-Mails Preisnachlässe von bis zu 18 Prozent zugesagt wurden, die im ERP nicht als gesonderte Posten erfasst waren.
Die Nachlässe waren verbal oder per E-Mail vereinbart und in der Buchhaltung direkt auf den Erlös gebucht worden. Die korrekte Darstellung hätte eine separate Erlösminderung erfordert. Die kumulierte Differenz betrug 340.000 Euro über zwei Geschäftsjahre. Die Korrektur war materiell, die Anpassung des Abschlusses notwendig.
Ohne die Analyse des E-Mail-Verkehrs wäre dieser Sachverhalt nicht aufgefallen. Die strukturierte Prüfung zeigte korrekte Buchungen. Die unstrukturierte Analyse zeigte, dass die Buchungen auf unvollständigen Informationen basierten.
Verwandte Inhalte
- ISA 240 Revised: Warum der neue Fraud-Standard KI fast zwingend macht
- KI-gestützte Dokumentenanalyse: Der Mittelstands-Guide
- Automatisierte Vertragsprüfung: KI im KMU-Dokumentenmanagement
- NLP - Natural Language Processing: Definition und Bedeutung im Mittelstand
- OCR - Optical Character Recognition: Definition und Bedeutung im Mittelstand
Erleben Sie die Intelligenz-Schicht von NaveSight in Aktion.
30 Minuten — wir zeigen Ihnen, wie NaveSight mit Ihren spezifischen Systemen zusammenarbeitet.
Kostenlosen Maturity Check startenUnsere Garantie: ein konkreter Aktionsplan — ob mit NaveSight oder ohne.
Wir führen 10 Maturity Checks pro Monat durch. Priorisierte Bearbeitung: 48 Stunden.