Teorema del Límite Central

El siguiente código en el software R nos brinda una forma sencilla para comprobar el teorema del límite central, explícitamente para verificar la distribución muestral de la media muestral. Como puede ver tiene distintas opciones de escoger la distribución, sin necesidad de asumir la normalidad, pero las variables x_i si deben ser independientes e identicamente distribuidas. Los resultados son asombrosos para quien nunca hizo la prueba bajo simulación ya que, incluso bajo la distribución poblacional más sesgada, no se rechaza que  la media muestral (promedio) se distribuya como una distribución normal con un nivel de significancia =0.05 .

# http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/nortest/html/00Index.html
# el link anterior es para pruebas de normalidad
install.packages("nortest")
library("nortest")

N=500
n=30
#x=rnorm(N,0,1000)
#x=rpois(N, lambda=3)
#x=rbinom(N, 20, .2)
#x=rgamma(N, shape=50/2, rate = 1, scale = 2) # chi cuadrado con k=5
x=rgamma(N, shape=1, rate = 1, scale = 2) # gamma se rechaza
#x=rgamma(N, shape=1, rate = 1, scale = 5) # exponencial con media 5 se rechaza
#x=runif(N)
#x=rweibull(n=200,shape=2.1,scale=1.1)
mex=c()
w=0
for (i in 1:1000){
mex[i]=mean(sample(x,n,replace=FALSE))
#setdiff() para comparar dos muestras podria implementarse un codigo para que no se repitan las muestras
#aunque primero tendria que ordenarse las muestra para aplicar esta función
}
layout(matrix(1:2,1,2))
layout.show(2)
hist(x,main="Histograma de la población")
hist(mex,main="Histograma del promedio")
lillie.test(mex) # prueba de kolgomorov

Redes para la ciencia

Eduard Punset nació en Barcelona – España, es abogado, economista y comunicador científico. Se preocupa por transmitir el conocimiento científico de diversos aspectos de nuestras vidas a las personas no muy dedicadas a la ciencia ayudandonos a entender diversas situaciones del día a día a través de explicaciones científicas. Para los interesados en conocer más acerca de él y de la valiosa información que brinda con cada oración que emite, pueden revisar el link de su programa redes en:

http://www.redesparalaciencia.com/6542/redes/redes-115-los-genes-que-regulan-la-personalidad

Además pueden ver su revista en:

http://www.eduardpunset.es/revista-redes

Ejemplo inicial de grados de libertad

Para los estadísticos o ingenieros estadísticos el término de “grados de libertad” es muy conocido, incluso en la mayoría de los libros de estadística y probabilidad es muy utilizado pero no dejan un concepto claro sobre el mismo, siendo uno de los más conocidos “el número de variables menos el número de parámetros a estimar”. En forma práctica presento uno de los ejemplos primarios para entender este concepto: Asumiendo que  x_i\sim N(\mu,\sigma^2), sabemos que \overline{x}\sim N(\mu,\frac{\sigma^2}{n})  y por lo tanto \frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1) . Bajo el supuesto que conocemos los parámetros \mu y \sigma^2  se puede notar que el estadístico z=\frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{n}}}  se obtienen a partir de n variables independientes  x_i. Es decir, como vimos en nuestro curso de algebra lineal, la dimensión de el espacio dimensional es n. Por otro lado supongamos que desconocemos el valor de \sigma^2 , el cual sería estimado con s^2 , ahora para calcular el valor de s^2 se utilizan n desviaciones respecto a la media y es fácil verificar que las n desviaciones no son independientes sino, por lo contrario, la última desviación depende de las n-1 desviaciones restantes ya que la suma de las n desviaciones tiene que ser igual a 0. Esto produce la pérdida de un grado de libertad y por lo tanto, nuestro estadístico t=\frac{\overline{x}-\mu}{\frac{s}{\sqrt{n}}} tiene n-1 grados de libertad. En conclusión, cuando se calcula un estadístico con la necesidad de estimar k parámetros, el número de grados de libertad es n-k. En otras palabras mientras más obligaciones tengas en tu vida, tienes menos grados de libertad. “Y alguien que tiene demasiadas enamoradas casi no tiene grados de libertad porque no va a tener la libertad de movilizarse por donde desee sino que va a tener que evadir la concurrencia a ciertas zonas, para que no lo pillen, perdiendo poco a poco más grados de libertad.”  Espero que hayan disfrutado y se incentiven a interpretar su significado tanto en las pruebas de hipótesis multivariadas, regresión, muestreo y otros.