Un modelo de Random Forest es un método moderno del «machine learning» para la clasificación. Por lo general se compone de 50 árboles de decisiones distintos no correlacionados.
Un árbol de decisiones es un modelo jerárquico con «forma de árbol» compuesto de decisiones sucesivas. Partiendo de su raíz, sigue diferentes «ramas» o bifurcaciones en función de distintas reglas de decisión. Al final del árbol, en las «hojas», se produce la clasificación en diferentes estados. Un problema con un único árbol de decisiones es que la predicción es o cien por cien correcta, o cien por cien incorrecta.
Por eso, un Random Forest consta de 500 árboles de decisiones distintos. Cada uno de ellos se compone de una combinación distinta de parámetros y reglas de decisión. Para la clasificación final, cada uno de los árboles da su «decisión» y se calcula el porcentaje de los árboles con la misma clasificación. De este modo, en lugar de una clasificación de un solo árbol se toma la decisión «democrática» de la mayoría de todos los árboles.
Vídeo: El Prof. Ambrósio explica la expresión Random Forest (inglés).


