El siguiente es un ejemplo de uso práctico del paquete agriCensData para analizar datos de abundancia de cobertura (Onofri et al. 2019).
Ejemplo 1. Análisis de datos de abundancia de cobertura registrados visualmente
El conjunto de datos
El conjunto de datos se refiere a un experimento de campo con el objetivo de comparar las capacidades de control de malezas de nueve herbicidas post-emergentes contra Sorghum halepense en maíz. Tres semanas después del tratamiento, se registró visualmente la abundancia de cobertura de S. halepense en seis clases, utilizando el método de Braun-Blanquet. Los límites de las clases se muestran como L (límite inferior) y U (límite superior). El midPoint representa el centro de cada clase. Cada registro del conjunto de datos representa una parcela de campo.
En primer lugar, necesitamos leer los datos en R. Como el conjunto de datos está contenido en el paquete complementario ‘agriCensData’, primero debemos cargar este paquete, asumiendo que ya ha sido instalado en el sistema (como se muestra aquí). Junto con este paquete, también cargamos todos los demás paquetes necesarios.
Plot Herbicide L U midPoint
1 1 A 0.1 5 2.55
2 2 A 0.1 5 2.55
3 3 A 5.0 25 15.00
4 4 A 5.0 25 15.00
5 5 B 0.1 5 2.55
6 6 B 0.1 5 2.55
Un ajuste tradicional de ANOVA
Aunque realmente hemos recopilado los datos asignando cada parcela a una clase de abundancia de cobertura, podríamos estar tentados a usar el punto medio de esa clase como la variable dependiente. Dado que este punto medio es un número real, podríamos ajustar un modelo tradicional de ANOVA. Podemos encontrar los promedios correspondientes utilizando el paquete emmeans (Lenth 2016). En el artículo, no realizamos comparaciones de pares. Si deseas hacerlo de todos modos, puedes hacerlo utilizando el mismo paquete, como se muestra a continuación.
mod.aov <-lm(midPoint ~ Herbicide, data = BBsurvey)means <-emmeans(mod.aov, ~ Herbicide) means
Herbicide emmean SE df lower.CL upper.CL
A 8.78 5.5 27 -2.51 20.1
B 8.78 5.5 27 -2.51 20.1
C 8.15 5.5 27 -3.14 19.4
D 8.15 5.5 27 -3.14 19.4
E 1.30 5.5 27 -9.99 12.6
F 26.25 5.5 27 14.96 37.5
G 8.78 5.5 27 -2.51 20.1
H 8.15 5.5 27 -3.14 19.4
I 56.25 5.5 27 44.96 67.5
Confidence level used: 0.95
cld(means, Letter = LETTERS, sort = F)
Herbicide emmean SE df lower.CL upper.CL .group
A 8.78 5.5 27 -2.51 20.1 A
B 8.78 5.5 27 -2.51 20.1 A
C 8.15 5.5 27 -3.14 19.4 A
D 8.15 5.5 27 -3.14 19.4 A
E 1.30 5.5 27 -9.99 12.6 A
F 26.25 5.5 27 14.96 37.5 A
G 8.78 5.5 27 -2.51 20.1 A
H 8.15 5.5 27 -3.14 19.4 A
I 56.25 5.5 27 44.96 67.5 B
Confidence level used: 0.95
P value adjustment: tukey method for comparing a family of 9 estimates
significance level used: alpha = 0.05
NOTE: If two or more means share the same grouping symbol,
then we cannot show them to be different.
But we also did not show them to be the same.
Usando este enfoque (el ANOVA tradicional), hemos evitado el problema de la censura al pretender que las observaciones son más confiables de lo que realmente son.
Un modelo de supervivencia
El conjunto de métodos que lidian con datos censurados se conoce generalmente como análisis de supervivencia, ya que los datos relacionados con la supervivencia de individuos a menudo están censurados. Obviamente, podemos usar el análisis de supervivencia con todo tipo de datos censurados, incluso cuando no tienen nada que ver con la supervivencia de individuos.
Para ajustar un modelo de supervivencia, necesitamos cargar el paquete survival (Therneau 1999) y utilizar la función survereg() de este paquete. Sus argumentos son similares a los utilizados por la función lm(), con la única diferencia de que el método anterior utiliza límites de intervalo como la variable dependiente, sin necesidad de imputación. Argumentamos que esto respeta mucho más la forma en que se recopilaron los datos.
library(survival)mod.surv <-survreg(Surv(L, U, type ="interval2") ~ Herbicide, dist ="gaussian", data = BBsurvey)means.surv <-emmeans(mod.surv, ~ Herbicide) cld(means.surv, Letters = LETTERS, sort = F)
Herbicide emmean SE df lower.CL upper.CL .group
A 6.76 3.68 26 -0.818 14.33 AB
B 6.76 3.68 26 -0.818 14.33 AB
C 5.90 3.63 26 -1.561 13.37 A
D 5.90 3.63 26 -1.561 13.37 A
E 1.27 3.25 26 -5.417 7.96 A
F 25.02 4.01 26 16.783 33.26 B
G 6.76 3.68 26 -0.818 14.33 AB
H 5.90 3.63 26 -1.561 13.37 A
I 57.34 3.77 26 49.581 65.09 C
Confidence level used: 0.95
P value adjustment: tukey method for comparing a family of 9 estimates
significance level used: alpha = 0.05
NOTE: If two or more means share the same grouping symbol,
then we cannot show them to be different.
But we also did not show them to be the same.
Como señalamos en el artículo principal (Onofri et al. 2019), el análisis de supervivencia estima medias con una mayor precisión que el ANOVA tradicional.