Big Data Con Python 2 9
Big Data Con Python 2 9
Capítulo 6
Técnicas de minería de datos ......................205
6.1 Técnicas de minería de datos .............................. 205
6.2 Clustering ................................................................ 207
6.2.1 Clustering numérico (k-medias)........................................209
6.2.2 Clustering conceptual (COBWEB) .................... 210
6.2.3 Clustering probabilístico (EM) ..........................................214
6.3 Reglas de asociación ............................................. 217
6.4 Predicción numérica ............................................. 220
6.4.1 Predicción no lineal con árboles de regresión ................220
6.4.2 Estimador de núcleos.........................................................225
6.4.2.1 Aplicación a problemas multivariantes ................................................ 228
6.4.2.2 Aplicación a problemas de clasificación ............................................... 229
6.5 Clasificación ........................................................... 231
6.5.1 Tabla de decisión ................................................................231
6.5.2 Árboles de decisión ............................................................233
6.5.3 Reglas de clasificación .......................................................245
6.5.4 Clasificación bayesiana ......................................................251
6.5.5 Aprendizaje basado en ejemplares ..................................257
6.5.5.1 Algoritmo de los k-vecinos más próximos........................................... 258
6.5.5.2 Algoritmo k-estrella................................................................................. 260
6.5.5.3 Probabilidad de transformación para los atributos permitidos........ 261
6.5.5.4 Combinación de atributos ...................................................................... 262
6.5.5.5 Selección de los parámetros aleatorios ................................................. 262
6.5.5.6 Clasificación de un ejemplo ................................................................... 264
6.5.6 Máquinas de vectores de soporte (SVM) ........................265
6.5.6.1 SVM lineal................................................................................................. 266
6.5.6.2 SVM lineal de margen blando (soft margin) ......................................... 270
6.5.6.3 SVM no lineal. Funciones kernel ............................................................ 272
6.5.6.4 Clasificación multiclase .......................................................................... 276
6.5.7 Redes de neuronas .............................................................277
6.5.7.1 Estructura de las redes de neuronas ..................................................... 278
6.5.7.2 Proceso de entrenamiento (retropropagación) .................................... 279
6.5.8 Lógica borrosa (fuzzy logic) ...............................................281
6.5.9 Técnicas genéticas: algoritmos genéticos
(genetic algorithms) ....................................................................282
10
E-Books & Papers for Statisticians