Machine LearningPros y Contras Modelos de Clasificación

Os mostramos una tabla con los pros y contras de los modelos de clasificación, tanto en python como en R.

Modelo de Clasificación
Pros
Contras
Regresión Logística
Enfocado a la probabilidad, nos da información sobre la importancia estadística de las características
Los supuestos de la regresión logística, más enfocado a la probabilidad que la clasificación
KNN
Es simple y por lo tanto fácil de aprender, eficiente y rápido.
Se necesita elegir el número de vecinos K
SVM
Fácil desempeño, sus resultados no se ven afectados por valores atípicos y al sobreajuste
No es el apropiado para problemas no lineales. No es la mejor opción para una gran cantidad de variables
Kernel SVM
Alto rendimiento en problemas no lineales, valores atípicos y el sobreajuste no le afecta tanto como a otros algoritmos
No es la mejor opción para una modelo con un gran número de variables, demasiado complejo. Tanto en la explicación como en la compresión
Naive Bayes
Eficiente, con enfonque probabilístico. No se ve sesgado por valores atípicos.
Basado en el supuesto que todas las variables tienen la misma relevancia estadística
Árbol de decisión para la clasifcación
Interpretable. No necesita escalado de valores, es apto para problemas lineales como no lineales
Resultados deficientes en conjunto de datos demasiados pequeños, poder tener sobreajuste en el modelo con facilidad
Bosques aleatorios para la Clasificación
Potencia y precisión, buen rendimiento en muchos tipos de problemas, incluidos no lo lineales
No es interpretable. Podemos tener sobreajuste con facilidad. Necesario elegir el número de árboles a crear

Entradas recomendadas