Mit welchen Daten trainieren und testen wir unsere Modelle?
Künstliche Intelligenz entdeckt wiederkehrende Muster und sucht deshalb in möglichst großen Mengen von strukturierten, semistrukturierten und unstrukturierten Daten nach signifikanter Ähnlichkeit. Unsere Trainings dienen dazu, Muster auch in heterogenen, fehlerhaften oder „regelwidrigen“ Dokumenten zu entdecken. Für diesen Lernprozess sind historische Daten ideal, also reale Dokumente wie Bestellungen, Lieferscheine und Rechnungen, zu denen die gültigen Lösungen bekannt sind.
Die gelernte Mustererkennung wird dann mit unbekannten Daten getestet, die idealerweise aus dem Unternehmen stammen, in dem die Modelle arbeiten sollen. So werden unternehmenstypische Vorschriften, vertragliche Abmachungen oder interne Regeln gleich hinzugelernt.
Sich Neues selbst beibringen – die allmähliche Selbstverbesserung ist der größte Vorzug des Machine Learnings gegenüber jeder manuellen Programmierung. Wir optimieren daher unsere KI-Systeme in regelmäßigen Abständen anhand neuer Datenbestände. Das Schöne daran: Das Lernen erfolgt im Hintergrund, während die KI im Vordergrund unverdrossen weiter automatisch ihre Arbeit tut.