Análisis de datos ecológicos y ambientales

Autor: Javier Rodríguez Barrios

ISBN: 9788490524817

Editorial: Díaz de Santos

Edición: 1

Páginas: 320

Formato: 30x21x1.8

Cant. tomos: 1

Año: 2020

Idioma: España

Origen: España

Disponibilidad.: Disponible

Gs 453.600
Aplicaciones con el programa R
Cantidad:
Uno de los retos de mayor relevancia para las ciencias ambientales y para la ecología, consiste en comprender las relaciones que presentan los organismos y su entorno. En la actualidad se cuenta con algunas herramientas numéricas y estadísticas de mucha precisión y fiabilidad, pero el desafío está en cómo abordar la variabilidad de escenarios del ambiente, al igual que su efecto sobre los diferentes atributos de las especies. La complejidad del análisis radica en que es posible contar con numerosas variables representadas por diversos organismos y/o por atributos de su ambiente abiótico. Es así como se requiere contar con herramientas que permitan presentar y analizar los patrones, ya sea de forma tabular (matricial) o gráfica (visualización de los datos). En este orden de ideas, la estadística multivariada ofrece formas de abordar la complejidad de este tipo de análisis. El siguiente reto consiste en seleccionar la mejor técnica o grupo de ellas que se ajusten a los patrones multivariados de nuestros datos, así como la elección de una herramienta o programa estadístico, dentro de diversas opciones disponibles. El presente libro, titulado Análisis de Datos Ecológicos y Ambientales. Aplicaciones con el Programa R, propone una estructura organizada, partiendo de las generalidades del programa R, continuando con la exploración y visualización de datos multivariados, incluidas las estandarizaciones y las transformaciones de las variables, para luego implementar técnicas de ordenación y de clasificación multivariada que, a su vez, finalizan en pruebas de hipótesis paramétricas y permutaciones (no paramétricas), todo ello con la aplicación del programa R, debido a su gran flexibilidad, solidez y trayectoria contrastada para guiarnos en este tipo de escenarios. Sumado a ello se podrá acceder a todos los códigos y bases de datos utilizadas en los diferentes ejemplos y ejercicios propuestos. Este documento no se enfoca en los aspectos matemáticos de las técnicas multivariadas, sino en la aplicación de la herramienta computacional para el análisis y la visualización de datos, que soportan investigaciones en temas ecológicos y ambientales.
Prefacio ..................................................................................................................... V
Sobre el autor.......................................................................................................... VII
1. Conceptos básicos.................................................................................................. 1
Introducción .......................................................................................................................................... 1
1.1. Etapas del ANDEA ...................................................................................................................... 2
1.2. Requisitos. .................................................................................................................................. 4
1.3. Objetivos .................................................................................................................................... 5
1.4. Tipos de datos. ........................................................................................................................... 5
1.5. Generalidades del análisis de datos........................................................................................... 6
Ejercicios propuestos........................................................................................................................ 7
2. Generalidades de R y RStudio.................................................................................. 9
Introducción .......................................................................................................................................... 9
2.1. Programa R y sus ventajas en el análisis de datos..................................................................... 9
2.2. Programa RStudio .................................................................................................................... 10
2.3. Tutoriales de R Y RStudio ......................................................................................................... 10
2.3.1. Tutorial rápido de R .......................................................................................................... 10
2.3.2. Motor de búsqueda de R (Rseek). .................................................................................... 10
2.3.3. Otros sitios de utilidad ...................................................................................................... 11
2.3.4. Opciones gráficas.............................................................................................................. 12
Ejemplo 1. NOCIONES DE RSTUDIO ....................................................................................... 14
Ejemplo 2. DATOS CON VARIABLES ALEATORIAS .................................................................. 29
Ejercicios propuestos...................................................................................................................... 31
3. Conceptos básicos de matrices en R ......................................................................33
Introducción ........................................................................................................................................ 33
3.1. Resumen estadístico de datos con múltiples variables........................................................... 34
3.1.1. Medias............................................................................................................................... 34
3.1.2. Varianzas ........................................................................................................................... 35
3.1.3. Covarianzas ....................................................................................................................... 35
3.1.4. Resumen estadístico ......................................................................................................... 36
3.2. Correlaciones ........................................................................................................................... 36
3.3. Distancias ................................................................................................................................. 36
3.4. Valores y vectores propios ....................................................................................................... 38
Ejemplo 1. APLICACIONES DE MATRICES EN RSTUDIO. 40
Ejemplo 2. APLICACIONES DE MATRICES EN RSTUDIO.......................................................... 44
Ejemplo 3. APLICACIONES DE MATRICES EN RSTUDIO.......................................................... 52
Ejercicios propuestos...................................................................................................................... 60
4. Figuras exploratorias multivariadas......................................................................63
Introducción ........................................................................................................................................ 63
4. Utilidad de R en la exploración de datos .................................................................................... 63
4.2. Figuras exploratorias................................................................................................................ 64
Ejemplo 1. GRÁFICAS EXPLORATORIAS.................................................................................. 65
~ X ~
Javier Rodríguez-Barrios
~ X ~
4.1. Gráficas de pares (pairplot)...................................................................................................... 66
4.2. Gráfica de elipses..................................................................................................................... 69
4.3. Figuras Coplot .......................................................................................................................... 70
4.4. Splom para variables categorizadas......................................................................................... 72
4.5. xyplot para variables continuas y factores .............................................................................. 73
4.6. Histogramas de frecuencia ... 73
4.7. Histogramas de densidad......................................................................................................... 75
4.8. Figuras quantil-quantil (QQ-plots)........................................................................................... 76
4.9. Diagramas de dispersión (plot y xyplot) .................................................................................. 77
4.10. Figuras de Cajas (Boxplots) .................................................................................................... 79
4.11. Figuras circulares (Pie Chart) ................................................................................................. 81
4.12. Gráficas de columnas o barras, con desviaciones estándar.................................................. 82
Ejemplo 2. GRÁFICAS EXPLORATORIAS MULTIFACTORIALES ................................................ 84
4.13. Gráficas de columnas o barras............................................................................................... 84
4.14. Gráficos de tiras..................................................................................................................... 86
Ejercicios propuestos...................................................................................................................... 88
5. Transformaciones y Estandarizaciones..................................................................89
Introducción ........................................................................................................................................ 89
Ejemplo 1. TRANSFORMACIONES GENERALES ....................................................................... 90
5.1. Criterios generales en las transformaciones y las estandarizaciones...................................... 91
5.1.1. Transformaciones monotónicas o simples .................................................................... 92
5.1.2. Suavizamiento de Beals (beals smoothing) ...................................................................... 93
5.1.3. Relativizaciones o estandarizaciones................................................................................ 93
5.1.4. Paquetes de R que integran transformaciones ................................................................ 94
Ejemplo 2. TRANSFORMACIONES Y ESTANDARIZACIONES .................................................... 96
5.2. Regla de abultamiento de Mosteller y Tukey (1977)............................................................. 101
Ejemplo 3. REGLA DE ABULTAMIENTO................................................................................. 102
5.3. Ley de potencias de Taylor (Taylor, 1961) ............................................................................. 105
Ejemplo 4. LEY DE POTENCIAS DE TAYLOR ........................................................................... 107
5.4. Transformación poder de Box-Cox (1964)............................................................................. 111
Ejemplo 5. LEY DE PODER DE BOX-COX. ............................................................................... 112
Ejemplo 6. LEY DE PODER DE BOX-COX. ............................................................................... 115
Ejercicios propuestos.................................................................................................................... 117
6. Análisis de Ordenación.......................................................................................119
Introducción ...................................................................................................................................... 119
6.1. Análisis de componentes principales (PCA o PCA) ................................................................ 119
6.1.1. Elementos principales de un PCA ................................................................................... 120
Ejemplo 1. PCA CON VARIABLES AMBIENTALES .................................................................. 121
Ejemplo 2. PCA CON VARIABLES AMBIENTALES Y BIOLÓGICAS .......................................... 128
Ejercicios propuestos.................................................................................................................... 137
6.2. Análisis de Factores (AF) ........................................................................................................ 138
Ejemplo 3. AF CON VARIABLES AMBIENTALES ..................................................................... 139
Ejercicios propuestos.................................................................................................................... 143
6.3. Análisis de escalamiento multidimensional (MDS y NMDS).................................................. 144
6.3.1. Escalamiento multidimensional métrico (MDS) ............................................................. 144

~ XI ~
ANÁLISIS DE DATOS ECOLÓGICOS Y AMBIENTALES
~ XI ~
6.3.2. Escalamiento multidimensional no métrico (NMDS)...................................................... 144
Ejemplo 4. MDS o PCoA CON VARIABLES BIOLÓGICAS........................................................ 145
Ejemplo 5. NMDS CON DATOS DE PRESENCIA-AUSENCIA................................................... 147
Ejercicios propuestos.................................................................................................................... 151
6.4. Análisis de correspondencia simple (CA)............................................................................... 153
6.5. Análisis de correspondencia dirigido (DCA)........................................................................... 153
6.6. Análisis de correspondencia múltiple (MCA)......................................................................... 155
6.7. El análisis factorial de datos mixtos (FAMD).......................................................................... 155
6.8. Análisis factorial múltiple (MFA)............................................................................................ 155
Ejemplo 6. CA CON VARIABLES BIOLÓGICAS Y AMBIENTALES ............................................ 156
Ejercicios propuestos.................................................................................................................... 166
Ejemplo 7. MCA CON DATOS DE PECES ............................................................................... 167
6.9. Análisis canónicos sin restricciones....................................................................................... 178
6.9.1. Análisis de redundancia (RDA)........................................................................................ 178
6.9.2. Análisis de Correspondencia Canónica (CCA) ................................................................. 178
6.9.3. Análisis de correlación canónica (CCoA)......................................................................... 179
EJEMPLO 8. RDA CON MICROALGAS.................................................................................... 181
EJEMPLO 9. ACC CON MICROALGAS .................................................................................... 194
Ejercicios propuestos.................................................................................................................... 199
7. Análisis de Clasificación .......................................................................................201
Introducción ...................................................................................................................................... 201
7.1. Medidas de asociación (modo Q y modo R). ......................................................................... 201
7.1.1. Coeficientes de similitud modo Q. .............................................................................. 202
7.1.2. Coeficientes de distancia modo Q............................................................................... 203
7.1.3. Coeficientes de dependencia Modo R......................................................................... 205
7.1.4. Escogencia del coeficiente de asociación o similitud. .................................................... 205
Ejemplo 1. ANÁLISIS PARA DATOS DE PRESENCIA - AUSENCIA ........................................... 207
Ejemplo 2. ANÁLISIS PARA DATOS DE ABUNDANCIA210
Ejemplo 3. ANÁLISIS PARA DATOS AMBIENTALES ............................................................... 214
Ejercicios propuestos.................................................................................................................... 216
7.2. Análisis de clúster jerárquico (CLA)........................................................................................ 217
7.2.1. Tipología de los CLA. ....................................................................................................... 217
(a) Técnicas exclusivas vs. No exclusivas .............................................................................. 217
(b) Técnicas secuenciales vs. Simultáneas............................................................................ 217
(c) Jerárquicos vs. No jerárquicos......................................................................................... 217
(d) Aglomerativos vs. Divisivos.............................................................................................. 218
(e) Politéticos vs. Monotéticos.............................................................................................. 218
(f) Probabilísticos vs. No probabilísticos............................................................................... 218
7.2.2. Selección del coeficiente de similitud o de disimilitud (distancias). .............................. 219
7.2.3. Métodos de agrupación jerárquica................................................................................. 219
(1) Unión simple .................................................................................................................... 219
(2) Unión completa ............................................................................................................... 219
(3) Promedio aritmético no ponderado (UPGMA) ............................................................... 219
(4) Promedio aritmético ponderado (WPGMA).................................................................... 219
(5) Centroide no ponderado (UPGMC) ................................................................................. 219
~ XII ~
Javier Rodríguez-Barrios
~ XII ~
(6) Centroide ponderado (WPGMC) ..................................................................................... 220
(7) Mínima varianza de Ward ............................................................................................... 220
7.2.4. Evaluación del mejor método de agrupación jerárquica................................................ 220
7.2.5. Clústeres no jerárquicos ................................................................................................. 220
(1) Partición por K-Medias.................................................................................................... 221
(2) Clúster de enlace completo............................................................................................. 221
(3) Clústeres Probabilísticos .................................................................................................. 221
7.2.6. Clústeres basados en modelos........................................................................................ 221
Ejemplo 4. CLÚSTER PARA DATOS DE ABUNDANCIA........................................................... 222
Ejemplo 5. CLÚSTER PARA DATOS DE PRESENCIA - AUSENCIA............................................ 239
Ejercicios propuestos.................................................................................................................... 247
7.3. Análisis Discriminante Lineal (LDA)........................................................................................ 249
Ejemplo 6. ANÁLISIS DISCRIMINANTE LINEAL CON VARIABLES MORFOMÉTRICAS ............ 250
7.4. Prueba T2 de Hotelling (1931)................................................................................................ 262
Ejemplo 7. T2 DE HOTELLING CON VARIABLES MORFOMÉTRICAS ....................................... 263
7.5. Análisis de Varianza Multivariado (MANOVA)....................................................................... 270
7.5.1. Matrices SSCP .................................................................................................................. 270
7.5.2. Estadísticos de la MANOVA ............................................................................................ 270
7.5.3. Supuestos de la MANOVA............................................................................................... 270
Ejemplo 8. MANOVA CON VARABLES MORFOMÉTRICAS..................................................... 271
Ejercicios propuestos.................................................................................................................... 275
7.6. Cuándo utilizar cada técnica de clasificación......................................................................... 276
8. Diseños multivariados no paramétricos ..............................................................277
Introducción ...................................................................................................................................... 277
8.1. Análisis de disimilitud (MANTEL) ........................................................................................... 277
8.2. Variables ambientales con máxima correlación (BIOENV) .................................................... 278
8.3. Análisis de permutación multirrespuesta (MRPP)................................................................. 279
8.4. Análisis de similitud (ANOSIM) .............................................................................................. 280
8.5. Análisis de Varianza Multivariante Permutacional - PERMANOVA ....................................... 281
8.6. Especies indicadoras Esp.Ind ............................................................................................... 281
8.6.1. Utilidad del método. ....................................................................................................... 282
8.6.2. Paquete Indicspecies....................................................................................................... 282
Ejemplo 1. MANTEL Y BIOENV CON DATOS DE MICROALGAS.............................................. 283
Ejemplo 2. PERMUTACIONES CON VARIABLES MORFOMÉTRICAS ...................................... 290
Ejemplo 3. ESPECIES INDICADORAS CON DATOS DE MICROALGAS ..................................... 298
Ejercicios propuestos.................................................................................................................... 301
Bibliografía. ....................................................................................................................................... 303

~ XIII ~
ANÁLISIS DE DATOS ECOLÓGICOS Y AMBIENTALES
~ XIII ~
Figuras
Figura 1. Imagen de la plataforma gráfica con comandos de R............................................................ 10
Figura 2. Imagen de motor de búsqueda de utilidades de R ................................................................ 11
Figura 3. Representaciones de curvas de nivel en mapas realizados con R. ........................................ 12
Figura 4. Representaciones tridimensionales en R ............................................................................... 12
Figura 5. Imagen de motor de búsqueda de utilidades de R ................................................................ 64
Figura 6. Regla de Mosteller y Tukey. Las flechas indican el sentido en que debe realizar la
transformación, en el caso de que la figura de dispersión apunte a uno de sus sentidos. . 101
Figura 7. (a) La dispersión original de los datos muestra un abultamiento hacia el cuadrante IV, que
exige transformaciones de raíces en la variable y o potencias cuadradas y cúbicas en la
variable x. (b) Variables linealizadas posterior a la transformación .................................... 101
Figura 8. Procedimiento resumido para hallar las componentes principales a partir de una tabla de
datos de campo o matriz de datos crudos (tomado de Herrándo, 2005 com. Pers.)....... 120
Figura 9. En el AF se construyen factores que presentan alta relación con las variables medidas (Xi),
pero ninguna relación entre ellos. Además, se observa que cada variable presenta su factor
único (residual). Tomado de Legendre & Legendre (1998). ................................................ 138
Figura 10. (a) Ordenación normal CA de las observaciones en el que la distribución de los datos es
unimodal invertida (efecto de herradura o de arco), (b) segmentación del eje 1 en cuatro
partes, realizada en el DCA. Los escores de las observaciones son centrados en cero para cada
segmento para visualizar un gradiente más claro a lo largo de este gradiente. Las flechas y
las líneas punteadas representan al movimiento de cada segmento para reescalar las
observaciones. Modificado de McCune et al. (2002)........................................................... 154
Figura 11. Tabla de contingencia (frecuencias), mostrando los descriptores (presencia/ausencia = 0/1),
usados para comparar a dos sitios (Objetos X1 y X2). Donde a es el número de taxones
presentes en los dos objetos (1), d son los descriptores ausentes (0), b y c representan la
presencia para cada objeto. d es utilizado solo en coeficientes simétricos (p= a + b + c + d). p
es el número total de taxones.............................................................................................. 202
Figura 12. La distancia entre los objetos (ej. sitios) x1 y x2, se calcula como la hipotenusa de un triángulo
rectángulo............................................................................................................................. 203
Figura 13. Escogencia de una medida de asociación entre objetos (modo Q), usando bases de datos con
especies y no especies (descriptores físicos, químicos, geológicos, etc.). Algunos coeficientes
(Si) y distancias (Di) son detallados en el texto anterior y todos han sido tomados de Legendre
y Legendre (1998)................................................................................................................. 206
Figura 14. Escogencia de una medida de asociación entre variables o descriptores (modo R), usando
bases de datos con especies y no especies (descriptores físicos, químicos, geológicos, etc.).
Algunos coeficientes (Si) y distancias (Di) son detallados en el texto anterior y todos han sido
tomados de Legendre y Legendre (1998). ........................................................................... 206
Figura 15. Clasificación de las técnicas de agrupación basadas en 5 propiedades. ............................. 218
~ XIV ~
Javier Rodríguez-Barrios
~ XIV ~
Tablas
Tabla 1. Términos comunes en estadística, referidos a una investigación sobre el contenido de
amoniaco en las excretas de serpientes de cascabel. ............................................................... 2
Tabla 2. Valores hipotéticos para datos multivariados........................................................................... 6
Tabla 3. Datos hipotéticos de abundancia de órdenes de insectos en diferentes localidades ubicadas
en dos tipos de ecosistemas. ................................................................................................... 34
Tabla 4. Transformaciones generales de variables. .............................................................................. 91
Tabla 5. Transformaciones propuestas por McCune y Grace (2002) y comandos en R para ejecutarlas.
Donde xij es la variable u observación sin transformar y bij es la variable u observación
transformada. ........................................................................................................................ 95
Tabla 6. Aplicación de los métodos de ordenación comparación indirecta más utilizados ............... 119
Tabla 7. Resumen de las diferencias entre las técnicas CCA y el RDA ................................................ 179
No hay enlaces disponible
Libros Relacionados