Producto añadido correctamente al carrito

Cantidad
Total
Continuar comprando

Realizar pago

Ciencias exactas

Suscribete a nuestro newsletter

Ciencia de datos. Técnicas analíticas y aprendizaje estadístico en un enfoque práctico Ver más grande

Ciencia de datos. Técnicas analíticas y aprendizaje estadístico en un enfoque práctico

Nuevo

Autores: Varios
Editorial: Alfaomega Colombiana
Edición: Primera, 2018
Formato: Libro
Rústica, 17x24 cm
445 páginas
Peso: 0.705 Kg
ISBN: 9789587784251

Más detalles

Advertencia: ¡Últimos artículos en inventario!


COP$ 102.000

Más

Reseña. Ciencia de datos. Técnicas analíticas y aprendizaje estadístico en un enfoque práctico

Este libro ofrece una visión general de las técnicas de minería de datos ilustradas en aplicaciones, permitiendo entender los conceptos y algoritmos sobre los que se basan y analizar sus resultados tras su aplicación en diversos casos prácticos.
 
Se refuerza el carácter práctico del libro con un formato de tutorial, en el que se dispone de conjuntos de datos sobre los que se irán aplicando las diferentes técnicas explicadas, de manera que el alumno pueda generar los resultados. Se ilustran en detalle la aplicación y análisis de técnicas de extracción de conocimiento sobre dominios complejos seleccionados, facilitando una traslación directa de los procedimientos a otros campos de aplicación de interés para el lector.
 
Se plantean las familias de técnicas más importantes que permiten aprender la estructura de los datos con el fin de aplicarlas a problemas de clasificación, predicción numérica y agrupamiento, así como los criterios de evaluación que posibilitan la comparación de los resultados generados por métodos alternativos. Las técnicas avanzadas se plantean como extensiones de estos principios básicos que permiten su aplicación a situaciones más complejas, como datos organizados en estructuras no lineales (vectores de soporte, redes neuronales o conjuntos de clasificadores), o su aplicación a secuencias de datos (filtrado y predicción, segmentación o agrupamiento de series).
 
Por último, se han elegido dominios novedosos de alto interés que requieren técnicas avanzadas y una metodología de análisis detallada, como procesado de series temporales en Internet de las Cosas, o datos geolocalizados que permiten hacer regresión espacial.

Contenido. Ciencia de datos. Técnicas analíticas y aprendizaje estadístico en un enfoque práctico

Prefacio
 
Capítulo 1
Introducción
1.1 Introducción
1.2 Los datos
1.3 Etapas en los procesos de big data
1.4 Minería de datos
1.5 Estructura de un proyecto de análisis de datos
1.6 Aplicaciones
1.6.1 Marketing
1.6.2 Compañías de seguros
1.6.3 Banca
1.6.4 Telecomunicaciones
1.6.5 Medicina
1.6.6 Industria farmacéutica
1.6.7 Biología
1.6.8 Minería de textos
1.6.9 Minería de datos web
1.6.10 Redes sociales
1.7 Modelos y tareas
1.7.1 Tareas descriptivas
1.7.1.1 Agrupamiento
1.7.1.2 Correlaciones y factorizaciones
1.7.1.3 Reglas de asociación
1.7.1.4 Dependencias funcionales
1.7.2 Tareas predictivas
1.7.2.1 Clasificación
1.7.2.2 Clasificación suave
1.7.2.3 Categorización
1.7.2.4 Preferencias o priorización
1.7.2.5 Regresión
1.8 Métodos y técnicas
1.8.1 Técnicas algebraicas y estadísticas
1.8.2 Técnicas bayesianas
1.8.3 Técnicas basadas en conteos de frecuencias y tablas de contingencia
1.8.4 Técnicas basadas en árboles de decisión y sistemas de aprendizaje de reglas
1.8.5 Técnicas relacionales, declarativas y estructurales
1.8.6 Técnicas basadas en redes neuronales artificiales
1.8.7 Técnicas basadas en núcleo y máquinas de soporte vectorial
1.8.8 Técnicas estocásticas y difusas
1.8.9 Técnicas basadas en casos, en densidad o distancia
 
Capítulo 2
Análisis estadístico de datos
2.1 Introducción
2.2 Análisis de una variable. Estadística descriptiva e inferencia
2.2.1 Estadísticos de variable continua
2.2.2 Histograma
2.2.3 Estadísticos de variables nominales
2.3 Contrastes de hipótesis
2.3.1 Distribuciones de probabilidad
2.3.1.1 Distribución normal
2.3.2 Inferencia
2.3.3 Evaluación de hipótesis
2.4 Análisis de relaciones entre variables.Evaluación de hipótesis
2.4.1 Relación entre variables nominales-nominales
2.4.2 Relaciones numéricas-nominales
2.4.2.1 Comparación de dos medias
2.4.2.2 Análisis de la varianza
2.4.3 Relaciones numéricas-numéricas
 
Capítulo 3
Introducción al lenguaje R. Lectura, procesado y visualización de datos: data wrangling
3.1 Carga y transformaciones de datos
3.1.1 Estructura básica de datos
3.1.2 Lectura de fichero
3.2 Estadística descriptiva
3.2.1 Variables categóricas
3.2.2 Correlación
3.2.2.1 Visualización
3.2.3 Test de hipótesis
3.2.4 Representación de datos
 
Capítulo 4
Predicción y clasificación con técnicas numéricas
4.1 Técnicas numéricas de predicción
4.1.1 Regresión lineal
4.1.1.1 Regresión lineal simple
4.1.1.2 Regresión lineal múltiple
4.1.1.3 Regresión lineal ponderada localmente
4.1.1.4 Atributos nominales
4.1.2 Evaluación del modelo de regresión
4.1.2.1 Error de regresión y selección de variables
4.1.3 Regresión no lineal
4.1.3.1 Transformaciones sencillas
4.1.3.2 Otras transformaciones
4.1.4 Ejemplos de regresión lineal
4.2 Técnicas numéricas de clasificación
4.2.1 Clasificación mediante regresión lineal
4.2.2 Clasificación mediante regresión logística
4.2.3 Clasificación bayesiana
4.2.3.1 Clasificación bayesiana de atributos numéricos
4.2.3.2 Clasificación bayesiana con atributos nominales
4.2.4 Ejemplos de clasificación bayesiana
 
Capítulo 5
Predicción y clasificación con R
5.1 Regresión
5.1.1 Regresión lineal
5.1.2 Selección de atributos
5.1.3 Regresión no lineal
5.1.4 Regresión de atributos no continuos
5.1.5 Modelos lineales generalizados
5.2 Algoritmos de clasificación
5.2.1 Detección de valores atípicos
5.2.2 LDA, Linear Discriminant Analysis
5.2.3 Clasificadores probabilísticos
5.2.3.1 Naive bayesiano
5.2.3.2 Redes bayesianas
 
Capítulo 6
Técnicas de minería de datos
6.1 Técnicas de minería de datos
6.2 Clustering
6.2.1 Clustering numérico (k-medias)
6.2.2 Clustering conceptual (COBWEB)
6.2.3 Clustering probabilístico (EM)
6.3 Reglas de asociación
6.4 Predicción numérica
6.4.1 Predicción no lineal con árboles de regresión
6.4.2 Estimador de núcleos
6.4.2.1 Aplicación a problemas multivariantes
6.4.2.2 Aplicación a problemas de clasificación
6.5 Clasificación
6.5.1 Tabla de decisión
6.5.2 Árboles de decisión
6.5.3 Reglas de clasificación
6.5.4 Clasificación bayesiana
6.5.5 Aprendizaje basado en ejemplares
6.5.5.1 Algoritmo de los k-vecinos más próximos
6.5.5.2 Algoritmo k-estrella
6.5.5.3 Probabilidad de transformación para los atributos permitidos
6.5.5.4 Combinación de atributos
6.5.5.5 Selección de los parámetros aleatorios
6.5.5.6 Clasificación de un ejemplo
6.5.6 Máquinas de vectores de soporte (SVM)
6.5.6.1 SVM lineal
6.5.6.2 SVM lineal de margen blando (soft margin)
6.5.6.3 SVM no lineal. Funciones kernel
6.5.6.4 Clasificación multiclase
6.5.7 Redes de neuronas
6.5.7.1 Estructura de las redes de neuronas
6.5.7.2 Proceso de entrenamiento (retropropagación)
6.5.8 Lógica borrosa (fuzzy logic)
6.5.9 Técnicas genéticas: algoritmos genéticos (genetic algorithms)
 
Capítulo 7
Técnicas de minería de datos en R
7.1 Agrupamiento. Clustering
7.1.1 Agrupamiento jerárquico
7.1.2 Número óptimo de agrupaciones
7.1.3 Agrupamiento por particionamiento
7.1.4 Agrupamiento basado en modelos
7.1.5 Agrupamiento borroso (fuzzy)
7.1.6 Otras técnicas de agrupamiento
7.1.7 Representación y análisis de las clases
7.1.8 Validación de resultados
7.2 Clasificación
7.2.1 Selección de atributos
7.2.2 Reducción de la dimensionalidad
7.2.3 Árboles de decisión
7.2.3.1 RPART (Recursive Partitioning and Regression Trees)
7.2.3.2 Árboles de inferencia condicional, CTREE
7.2.3.3 C5.0
7.2.4 Metaalgoritmos
7.2.4.1 AdaBoost (ADAptative BOOSTing)
7.2.4.2 GBM (Gradient Boosting Machine)
7.2.4.3 Random forest
7.2.5 SVM, máquinas de vectores de soporte
7.2.6 K vecinos próximos. k-NN (k-Nearest Neighbors)
7.2.7 Redes de neuronas artificiales
 
Capítulo 8
Internet de las cosas y análisis de series temporales
8.1 Internet de las cosas
8.2 Thinger.io IoT
8.2.1 Hardware
8.2.2 Configuración de la plataforma
8.2.3 Software del dispositivo
8.2.4 Visualización y exportación de la información
8.3 Series temporales
8.3.1 Predicción con series temporales
8.3.1.1 Predicción lineal (autorregresión)
8.3.1.2 Error de predicción
8.3.1.3 Predicción no lineal
8.3.2 Análisis y descomposición de series
8.3.2.1 Tendencia y estacionariedad
8.3.2.2 Modelos ARMA/ARIMA
8.4 Análisis de series con R
8.4.1 Componentes de la serie temporal
8.4.2 Modelos de predicción
8.4.3 Detección de anomalías
 
Capítulo 9
Análisis de datos espaciales
9.1 Introducción
9.1.1 Datos de tipo espacial
9.1.2 Latitud, longitud
9.1.3 La clase de datos Spatial en RStudio
9.1.4 Datos
9.2 Tipos de datos
9.2.1 Creación de objetos SpatialPoints
9.2.2 Creación de objetos SpatialGrid
9.3 Visualización de datos espaciales
9.4 Análisis estadístico (interpolación)
9.4.1 Análisis exploratorio de datos
9.4.1.1 Crear grid Ávila-Madrid
9.4.2 Interpolación IDW (Inverse Distance Weighted)
9.4.2.1 Presentación de resultados IDW
9.4.3 Correlación espacial (variograma)
9.4.3.1 Selección modelo de variograma
9.4.3.2 Presentación de resultados
 
Bibliografía