Für die einzelnen Rechenmodelle der Predictive Analytics gibt es verschiedene statistische und semantische Verfahren. Einige dieser Verfahren sind auch für künstliche Intelligenzen erlernbar, sodass sich damit selbst große Datenmengen automatisiert bearbeiten lassen. Hier eine Auswahl der besonders verbreiteten und häufigen Verfahren, mittels derer aus Datenbeständen Voraussagen abgeleitet werden:
Entscheidungsdiagramm
Über eine Kette von Ja-/Nein-Fragen wird ein Diagramm durchlaufen. Dieses endet in der Regel in einer Entscheidung wie „Kund:in kauft Produkt“ oder „Kund:in kauft Produkt nicht“.
Lineare Regression
Die Lineare Regression versucht, den Einfluss eines oder mehrerer Faktoren auf eine bestimmte Variable zu erklären. Eine solche Variable kann beispielsweise der Erfolg von Leads sein. Der Idealwert wäre hier 100 Prozent für 100 Prozent zu einem Abschluss führende Leads. Ein Faktor, der diesen Erfolg möglicherweise beeinflusst, könnte die Höhe des Marketingbudgets sein.
Im Idealfall gibt es eine ganz klare Abhängigkeit und somit die Möglichkeit, eine Regressionsgerade zu erstellen. Damit ließe sich dann für jede Höhe des Marketingbudgets der Erfolg der davon abhängigen Leads vorhersagen.
Logistische Regression
Wie bei der Linearen Regressionsanalyse wird auch hier nach einem statistischen Zusammenhang zwischen einer abhängigen und einer oder mehreren weiteren Variablen gesucht. Die abhängige Variable hat aber nur zwei mögliche Ausprägungen. Am Ende steht also beispielsweise die Frage: Wirken sich Produktpreis und Produktbekanntheit auf die Abverkaufszahlen aus – ja oder nein?
Lineare Diskriminanzanalyse
Hier wird nach einer oder mehreren mathematischen Funktionen gesucht, die eine Datenmenge besonders plausibel in unterschiedliche Stichprobengruppen aufteilt. Gesucht wird beispielsweise eine Funktion des Ressourcen-Aufwandes für Leads. Alle geprüften Leads oberhalb der Funktion sind erfolgreich. Alle geprüften Leads unterhalb der Funktion sind negativ (nicht mit Verkauf abgeschlossen). Die Funktion beschreibt dann perfekt den Unterschied zwischen erfolgreichen und nicht erfolgreichen Leads.
Random Forest
Ein Random Forest ist ein „Wald“ (Forest) aus vielen Entscheidungsbäumen mit Ja/Nein-Entscheidung. Jedes Item der Stichprobe durchläuft nacheinander alle Entscheidungsbäume des Random Forest. Erhält es hierbei insgesamt mehr „Ja“-Ergebnisse, ist auch das Gesamtergebnis „Ja“, ansonsten „Nein“.
Naive Bayes
Dieses semantische Verfahren wird zur Analyse von Texten angewendet, beispielsweise um anhand von Auffälligkeiten oder der Häufung bestimmter Wörter zu unterscheiden zwischen wertvollen und wertlosen Texten im Sinne der Fragestellung. Nach diesem Verfahren arbeiten beispielsweise Spam-Filter, die Anfragen von Kund:innen von automatisierten Werbe-Mails unterscheiden sollen.