Machine LearningPros y Contras Modelos de Clasificación
Os mostramos una tabla con los pros y contras de los modelos de clasificación, tanto en python como en R.
Modelo de Clasificación | Pros | Contras |
---|---|---|
Regresión Logística | Enfocado a la probabilidad, nos da información sobre la importancia estadística de las características | Los supuestos de la regresión logística, más enfocado a la probabilidad que la clasificación |
KNN | Es simple y por lo tanto fácil de aprender, eficiente y rápido. | Se necesita elegir el número de vecinos K |
SVM | Fácil desempeño, sus resultados no se ven afectados por valores atípicos y al sobreajuste | No es el apropiado para problemas no lineales. No es la mejor opción para una gran cantidad de variables |
Kernel SVM | Alto rendimiento en problemas no lineales, valores atípicos y el sobreajuste no le afecta tanto como a otros algoritmos | No es la mejor opción para una modelo con un gran número de variables, demasiado complejo. Tanto en la explicación como en la compresión |
Naive Bayes | Eficiente, con enfonque probabilístico. No se ve sesgado por valores atípicos. | Basado en el supuesto que todas las variables tienen la misma relevancia estadística |
Árbol de decisión para la clasifcación | Interpretable. No necesita escalado de valores, es apto para problemas lineales como no lineales | Resultados deficientes en conjunto de datos demasiados pequeños, poder tener sobreajuste en el modelo con facilidad |
Bosques aleatorios para la Clasificación | Potencia y precisión, buen rendimiento en muchos tipos de problemas, incluidos no lo lineales | No es interpretable. Podemos tener sobreajuste con facilidad. Necesario elegir el número de árboles a crear |