Gastbeitrag: Vermeiden Sie Fehler beim digitalen Auslesen von Rechnungen!

Die semantische Erkennung und Extraktion von Zahlungsdaten ist eine feine Sache. Wenn sie funktioniert. Da eine manuelle Kontrolle und Korrektur wertvolle Zeit kostet, ist vor allem eines wichtig: eine hohe und konstante Erkennungsquote. Obwohl moderne Semantik-Lösungen Daten unabhängig von ihrer Position im Dokument extrahieren können, gibt es natürlich trotzdem einige Standards, die das Auslesen erleichtern.

Wie eine perfekt aufbereitete Rechnung aussehen sollte, wird im folgenden Text beschrieben.

Im Wesentlichen gilt es eine einfache Leitlinie zu beachten: Eine Rechnung sollte so aufgesetzt und formuliert sein, dass sie jeder Leser schnell und ohne Probleme versteht.

Ganz konkret lassen sich daraus folgende Standards ableiten:

1.) Daten des Rechnungsstellers in Textform angeben

Um den Absender einer Rechnung richtig identifizieren zu können, müssen verschiedene Punkte beachtet werden: Zum einen ist es wichtig, dass der Firmenname in Textform vorliegt und nicht nur als Logo auf dem Dokument platziert ist.
Zum anderen sollten Adressdaten, also Name und Anschrift, nicht durch andere Angaben, wie z.B. die Telefonnummer, unterbrochen werden.

2.) Daten des Rechnungsstellers richtig positionieren

Darüberhinaus ist es von zentraler Bedeutung, die Adresse des Rechnungsstellers an der richtigen Stelle im Dokument zu platzieren.
Dafür bieten sich zwei Positionen an: das Adressfenster oder die Fußzeile.
Im Adressfenster sollte der Absender in einer Zeile, klein am oberen Rand des Fensters stehen und der Empfänger in der Form „Anrede, Name, Straße bzw. Postfach (falls vorhanden) und Stadt mit Postleitzahl“ darunter, in jeweils getrennten Zeilen.
Wird der Absender in der Fußzeile angegeben, sollten Name, Straße, Postleitzahl und Stadt entweder bündig untereinander oder in einer Linie positioniert sein.

3.) Plakative Überschriften einfügen

Je prominenter erwähnt wird, dass es sich um eine Rechnung handelt, desto besser.
Im Idealfall sollte im Dokument eine Überschrift platziert sein, die das Wort „Rechnung“ enthält oder entsprechende Formulierungen wie z.B. „Liquidation“.

4.) Eindeutige Schlüsselwörter verwenden

Sämtliche Daten sollten in der Form „Schlüsselwort: Wert“ angegeben werden, wie z.B. „Rechnungsnummer: 234561“.
Dabei ist es wichtig darauf zu achten, dass die Schlüsselwörter eindeutig sind, wie z.B. „Rechnungsnummer“, „Kundennummer“ oder „Auftragsnummer“.
Allgemeine Begriffe wie „Belegnummer“ oder „Vorgangsnummer“ sollten vermieden werden.
Für eine automatische Erkennung ist es auch von Vorteil, wenn die Daten nicht in tabellarischer Form angegeben werden, sondern in einer Linie als Paare aus „Schlüsselwort: Wert“.

organize.me Beispiel-Rechnung

https://www.organize.me – Beispiel: Optimale Rechnungsgestaltung

5.) Rechnungsbetrag klar kennzeichnen

Der zu bezahlende Betrag sollte deutlich erkennbar sein, z.B. durch die Verwendung von Begriffen wie „Gesamtsumme“ oder „Rechnungsendbetrag“.
Sind in einer Rechnung auch Vorauszahlungen oder Rabatte enthalten, sollte explizit erwähnt werden, welcher Betrag zu bezahlen ist, etwa „bezahlen Sie 10,89 € bis zum 31.3.2016“.

6.) Gesamte Rechnung mit einer Druckmethode erstellen

Die Ausgangsbasis einer semantischen Analyse ist immer eine Texterkennung.
Entscheidend für die Qualität dieser Erkennung ist unter anderem die Tatsache, ob bekannt ist, mit welcher Druckmethode ein Dokument erstellt wurde.
Entsprechend ist es von Vorteil, wenn das gesamte Dokument einheitlich gedruckt wird.
Es sollte also vermieden werden, die eigentliche Rechnung z.B. mit einem Nadeldrucker auf vorbedruckte Blätter (z.B. mit Briefkopf) zu drucken, die wiederum mit einer anderen Methode, z.B. einem Laserdrucker, erstellt wurden.

Über den Autor

Jürgen Oesterle arbeitet als Senior Semantic Analyst bei organize.me, einem FinTech Start-up aus München, das u.a. eine eigene Semantik-Lösung für Business-Kunden, wie z.B. Banken, entwickelt hat. Er verfügt über mehr als 20 Jahre Erfahrung in der Entwicklung von semantischen Lösungen. Vor seinem Start bei organize.me im Jahr 2014 war er als Senior Computational Linguist und Software Developer bei Microsoft tätig.