Introduccion a la mineria de datos

Autor: Hernandez Orallo, Ramirez Quintana y otros

ISBN: 8420540919

Editorial: Pearson

Edición: 1

Páginas: 680

Formato: 25x19.5

Cant. tomos: 1

Año: 2008

Idioma: España

Origen: México

Disponibilidad.: No Disponible

Gs 648.000
La minería de datos es una etapa, si bien la más importante, de lo que se ha venido llamando el proceso de extracción de conocimiento a partir de datos. Este proceso consta de varias fases e incorpora diferentes técnicas de los campos del aprendizaje automático, la estadística, las bases de datos, los sistemas de toma de decisión, la inteligencia artificial y otras áreas de la informática y de la gestión de información. Este manual describe el proceso de extracción de conocimiento a partir de datos.

Explica, de una manera metodológica y pragmática, el proceso en su conjunto, sus motivaciones y beneficios, estableciendo conexiones con las disciplinas relacionadas y los sistemas con los que debe integrarse.

Contrasta y despliega, mediante numerosos ejemplos realizados en paquetes de minería de datos, las técnicas que se requieren en cada fase del proceso: técnicas de preparación y almacenes de datos, técnicas propias de extracción de modelos (clasificación, agrupamiento, regresión, asociación, etc. y técnicas de evaluación y difusión del conocimiento extraído.

Discurre apoyándose en numerosos ejemplos prácticos y utilizando herramientas de minería de datos como SPSS Clementine, WEKA y otras, ilustrando cada técnica con las diferentes implementaciones que de ella proporciona cada sistema.

Está dirigido a profesionales involucrados en el análisis de los sistemas de información o en la toma de decisiones de su organización o de sus clientes, así como a estudiantes universitarios en titulaciones de ingeniería, informática, empresariales o biomédicas que cursen asignaturas de "análisis de datos", "extracción de conocimiento", "aprendizaje automático" o, cómo no, "minería de datos", o bien que quieran complementar su formación estadística con la perspectiva del proceso de extracción de conocimiento mediante la generación de modelos a partir de bases de datos.
Prefacio
Motivación y objetivos del libro
Destinatarios
Organización e itinerarios
Terminología
Agradecimientos

PARTE I: INTRODUCCIÓN

Capítulo 1. ¿Qué es la minería de datos?
1.1. Nuevas necesidades
1.2. El concepto de minería de datos
Ejemplos
1.3. Tipos de datos
1.4. Tipos de modelos
1.5. La minería de datos y el proceso de descubrimiento de conocimiento en bases de datos
1.6. Relación con otras disciplinas
1.7. Aplicaciones
1.8. Sistemas y herramientas de minería de datos

Capítulo 2. El proceso de extracción de conocimiento
2.1. Las fases del proceso de extracción de conocimiento
2.2. Fase de integración y recopilación
2.3. Fase de selección, limpieza y transformación
2.4. Fase de minería de datos
2.5. Fase de evaluación e interpretación
2.6. Fase de difusión, uso y monitorización

PARTE II: PREPARACIÓN DE DATOS

Capítulo 3. Recopilación
Almacenes de datos
3.1. Introducción
3.2. Necesidad de los almacenes de datos
3.3. Arquitectura de los almacenes de datos
3.4. Carga y mantenimiento del almacén de datos
3.5. Almacenes de datos y minería de datos

Capítulo 4. Limpieza y transformación
4.1. Introducción
4.2. Integración y limpieza de datos
4.3. Transformación de atributos
Creación de características
4.4. Discretización y numerización
4.5. Normalización de rango: escalado y centrado
4.6. Otras transformaciones

Capítulo 5. Exploración y selección
5.1. Introducción
El contexto de la vista minable
5.2. Exploración mediante visualización
5.3. Sumarización, descripción, generalización y pivotamiento
5.4. Selección de datos
5.5. Lenguajes, primitivas e interfaces de minería de datos

PARTE III: TÉCNICAS DE MINERÍA DE DATOS

Capítulo 6. El problema de la extracción de patrones
6.1. Introducción
6.2. Tareas y métodos
6.3. Minería de datos y aprendizaje inductivo
6.4. El lenguaje de los patrones
Expresividad
6.5. Breve comparación de métodos

Capítulo 7. Modelización estadística paramétrica
Tomás Aluja y Pedro Delicado
7.1. Concepto de modelización estadística
7.2. Modelo de regresión
7.3. Modelos de regresión sobre componentes incorrelacionados
7.4. Modelos de regresión con variables categóricas
7.5. Análisis de los residuos
7.6. Ejemplo: aplicación a los datos SERVO
7.7. Modelos lineales generalizados
7.8. Análisis discriminante
7.9. Sistemas, aplicabilidad y recomendaciones de uso

Capítulo 8. Modelización estadística no paramétrica
Pedro Delicado y Tomás Aluja
8.1. Introducción
8.2. Regresión no paramétrica
8.3. Discriminación no paramétrica
8.4. Conclusiones, aplicabilidad y sistemas

Capítulo 9. Reglas de asociación y dependencia
9.1. Introducción
9.2. Reglas de asociación
9.3. Reglas de dependencias
9.4. Reglas de asociación multinivel
9.5. Reglas de asociación secuenciales
9.6. Aprendizaje de reglas de asociación con sistemas de minería de datos

Capítulo 10. Métodos bayesianos
José A. Gámez Martín, Ismael García Varea y José M. Puerta Callejón
10.1. Introducción
10.2. Teorema de Bayes e hipótesis MAP
10.3. Naïve Bayes
10.4. Redes bayesianas
10.5. Aprendizaje de redes bayesianas
10.6. Clasificadores basados en redes bayesianas
10.7. Tratamiento de datos desconocidos
10.8. Sistemas

Capítulo 11. Árboles de decisión y sistemas de reglas
11.1. Introducción
11.2. Sistemas por partición: árboles de decisión para clasificación
11.3. Sistemas de aprendizaje de reglas por cobertura
11.4. Poda y reestructuración
11.5. Árboles de decisión para regresión, agrupamiento o estimación de probabilidades
11.6. Aprendizaje de árboles de decisión híbridos
11.7. Adaptación para grandes volúmenes de datos
11.8. Sistemas, aplicabilidad y recomendaciones de uso

Capítulo 12. Métodos relacionales y estructurales
12.1. Introducción
12.2. Programación lógica y bases de datos
12.3. Programación lógica inductiva
12.4. Programación lógica inductiva y minería de datos
12.5. Otros métodos relacionales y estructurales
12.6. Sistemas

Capítulo 13. Redes neuronales artificiales
Emilio Corchado y Colin Fyfe
13.1. Introducción
13.2. El aprendizaje en las redes neuronales artificiales
13.3. Aprendizaje supervisado en RNA
13.4. Aprendizaje no supervisado en RNA
13.5. Sistemas, aplicabilidad y recomendaciones de uso

Capítulo 14. Máquinas de vectores soporte
Xavier Carreras, Lluís Márquez y Enrique Romero
14.1. Introducción
14.2. Máquinas de vectores soporte para clasificación binaria
14.3. Justificación teórica
14.4. Aplicaciones de las máquinas de vectores soporte
14.5. Extensiones y temas avanzados
14.6. Paquetes software y recomendaciones de uso
Anexo. Optimización con restricciones lineales

Capítulo 15. Extracción de conocimiento con algoritmos evolutivos y reglas difusas
María José del Jesus, Pedro González y Francisco Herrera
15.1. Introducción
15.2. Computación evolutiva
15.3. Algoritmos evolutivos para la extracción de conocimiento
15.4. Lógica difusa
15.5. Lógica difusa en minería de datos
15.6. Sistemas evolutivos difusos en minería de datos
15.7. Ejemplos
15.8. Sistemas software
15.9. Conclusiones

Capítulo 16. Métodos basados en casos y en vecindad
Pedro Isasi
16.1. Introducción
16.2. Técnicas para agrupamiento
16.3. Técnicas para dasificación
16.4. Métodos de vecindad con técnicas evolutivas
16.5. Otros métodos y aplicabilidad

PARTE IV: EVALUACIÓN, DIFUSIÓN Y USO DE MODELOS

Capítulo 17 Técnicas de evaluación
17.1. Introducción
17.2. Evaluación de clasificadores
17.3. Evaluación de modelos de regresión
17.4. Comparación de técnicas de aprendizaje
17.5. Evaluación basada en complejidad de la hipótesis
El principio MDL
17.6. Evaluación de modelos de agrupamiento
17.7. Evaluación de reglas de asociación
17.8. Otros criterios de evaluación

Capítulo 18 Combinación de modelos
18.1 Introducción
18.2. Métodos de construcción de multiclasificadores
18.3. Métodos de fusión
18.4. Métodos híbridos

Capítulo 19. Interpretación, difusión y uso de modelos
19.1. Introducción
19.2. Extracción de reglas comprensibles
19.3. Visualización posterior
19.4. Intercambio y difusión de modelos: estándares de representación
19.5. Integración con la toma de decisiones
19.6. Actualización y revisión de modelos

PARTE V: MINERÍA DE DATOS COMPLEJOS

Capítulo 20. Minería de datos espaciales, temporales, secuenciales y multimedia
20.1. Introducción
20.2. Minería de datos espaciales
20.3. Minería de datos temporales
20.4. Extracción de patrones secuenciales
20.5. Minería de datos multimedia

Capítulo 21 Minería de web y textos
21.1. Introducción
21.2. Minería web
21.3. Minería del contenido de la web
21.4. Minería de la estructura de la web
21.5. Minería de uso web
21.6. Sistemas de minería de web y textos

PARTE VI: IMPLANTACIÓN E IMPACTO DE LA MINERÍA DE DATOS

Capítulo 22. Implantación de un programa de minería de datos
22.1. Introducción
22.2. ¿Cuándo empezar? Necesidades y objetivos de negocio
22.3. Formulación del programa: fases e implantación
22.4. Integración con las herramientas y proyectos de la organización
Introducción a la Minería de Datos
22.5. Recursos necesarios

Capítulo 23. Repercusiones y retos de la minería de datos
23.1. Impacto social de la minería de datos
23.2. Cuestiones éticas y legales
23.3. Escalabilidad
Minería de datos distribuida
23.4. Tendencias futuras

APÉNDICES

Apéndice A. Sistemas y herramientas de minería de datos
Vicent Estruch Gregori
Librerías
Suites
Herramientas específicas

Apéndice B. Datos de ejemplo
Tabla resumen
Referencias bibliográficas

Índice analítico
No hay enlaces disponible
Libros Relacionados