Ein Random Forest Modell ist ein moderner Ansatz des „Machine Learnings“ zur Klassifizierung. Er besteht in der Regel aus 500 verschiedenen, nicht-korrelierten Entscheidungsbäumen.

Ein Entscheidungsbaum ist ein hierarchisches „baumartiges“ Modell von aufeinanderfolgenden Entscheidungen. Ausgehend von seiner Wurzel folgt er verschiedenen „Ästen“ bzw. Vergabelungen, denen – basierend auf verschiedenen Entscheidungsregeln – gefolgt wird. Am Ende des Baums, den „Blättern“, erfolgt letztendlich die Klassifizierung in verschiedene Zustände. Ein Problem mit einem einzelnen Entscheidungsbaum ist, dass die Vorhersage entweder zu 100 Prozent richtig oder zu 100 Prozent inkorrekt ist.

Daher umfasst ein Random Forest 500 verschiedene Entscheidungsbäume. Jeder dieser Bäume besteht aus einer unterschiedlichen Kombination von Parametern und Entscheidungsregeln. Zur finalen Klassifizierung gibt jeder einzelne Baum seine „Entscheidung“ ab und der Prozentsatz der Bäume mit derselben Klassifizierung wird errechnet. Anstelle einer Klassifizierung eines einzelnen Baums tritt so die „demokratische“ Mehrheitsentscheidung aller Bäume.

Video: Prof. Ambrósio erklärt den Ausdruck Random Forest (Englisch)