Francisco HV: Probabilidad y Estadística

viernes, 21 de noviembre de 2014

Probabilidad y Estadística

Astrid Porras Arias

Francisco Herrera Varela

Distribución continuas

Las distribuciones de probabilidad son idealizaciones de los polígonos de frecuencias. En el caso de una variable estadística continua consideramos el histograma de frecuencias relativas, y se comprueba que al aumentar el número de datos y el número de clases el histograma tiende a estabilizarse llegando a convertirse su perfil en la gráfica de una función.

http://recursostic.educacion.es/descartes/web/materiales_didacticos/distribuciones_probabilidad/dist_c1.gif

http://recursostic.educacion.es/descartes/web/materiales_didacticos/distribuciones_probabilidad/dist_c2.gif

http://recursostic.educacion.es/descartes/web/materiales_didacticos/distribuciones_probabilidad/dist_c3.gif

http://recursostic.educacion.es/descartes/web/materiales_didacticos/distribuciones_probabilidad/dist_c4.gif

Las distribuciones de probabilidad de variable continua se definen mediante una función y=f(x) llamada función de probabilidad o función de densidad.
Así como en el histograma la frecuencia viene dada por el área, en la función de densidad la probabilidad viene dada por el área bajo la curva, por lo que:
El área encerrada bajo la totalidad de la curva es 1.
Para obtener la probabilidad p(a£X£b) obtenemos la proporción de área que hay bajo la curva desde a hasta b.
La probabilidad de sucesos puntuales es 0, p(X=a)=0

Distribución Normal

Entre las distribuciones probabilísticas de variable continua, la más ampliamente utilizada es la llamada distribución normal, cuya representación gráfica tiene una forma muy conocida en el ámbito de la estadística y las ciencias naturales: la campana de Gauss.

Concepto y función de probabilidad

Dado un experimento de variable aleatoria continua X, se llama distribución normal a aquella que queda perfectamente descrita por su media aritmética y su desviación típica s. Las distribuciones normales, también llamadas gaussianas, se denotan por la expresión N (, s).

La gráfica de una distribución normal es la conocida campana de Gauss.

La función de densidad de la distribución normal sigue la ecuación que determina la conocida campana de Gauss, cuya expresión matemática es la siguiente:

Media y desviación típica

Una función de densidad asociada a una distribución normal se caracteriza por dos parámetros complementarios:

La media , que corresponde al punto en el que la función de distribución alcanza un máximo.

La desviación típica s, que señala la anchura de la distribución.

La función que describe una distribución normal presenta puntos de inflexión en las abscisas: - s y + s, donde se modifica la concavidad de la curva. Finalmente, en los valores de la variable estadística que tienden a -¥ y +¥, la función tiende a cero.

Tipificación de la variable

El cálculo de las probabilidades asociadas a una distribución normal por medio de integrales resulta, en general, complejo. Por ello, suele utilizarse una función de distribución de apoyo cuya media es 0 y cuya desviación típica es la unidad.Tal función se denomina distribución normal tipificada, y se expresada como N (0,1).

Se llama tipificación a la operación consistente en cambiar de una variable aleatoria X a otra variable Z de distribución tipificada, por medio de la expresión siguiente:

Tabla de tipificación

La distribución normal tipificada tiene por ecuación de su función de densidad:

Distribución Ji-cuadrada

La distribución ji-cuadrado tiene muchas aplicaciones en inferencia estadística , por ejemplo en el test ji-cuadrado y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta deregresión lineal, a través de su papel en la distribución t , y participa en todos los problemas de análisas de varianza , por su papel en la distribución F , que es la distribución del cociente de dos variables aleatorias de distribución ji-cuadrada e independientes.

Tabla de distribución Ji cuadrada

En realidad la distribución ji-cuadrada es la distribución muestral de S² . O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X² . Si se elige una muestra de tamaño n de una población normal con varianza , el estadístico:

donde n es el tamaño de la muestra, S² la varianza muestral y la varianza de la población de donde se extrajo la muestra.

Las distribuciones X² no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha. Cuando n>2, la media de una distribución X² es n-1 y la varianza es 2(n-1).

La Distribución T de Student

En la generalidad de los casos, no disponemos de la desviación standard de la población, sino de una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos calcular Z.

En estos casos calculamos el estadístico T:

T=μ−xs

con

s=∑(x−xi)2n−1−−−−−−−−−−√

donde S es la desviación standard muestral, calculada con n-1 grados de libertad.

Nótese que utilizamos S, la Desviación Standard de una Muestra, en lugar de μ, la Desviación Standard de la Población.

El estadístico T tiene una distribución que se denomina distribución T de Student, que está tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calculó la desviación standard. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación standard de la población, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad.

La distribución T es mas ancha que la distribución normal tipificada Para un número de grados de libertad pequeño. Cuando los grados de libertad tienden a infinito, la distribución T tiende a coincidir con la distribución normal standard. Es decir, en la medida que aumentemos el número de observaciones de la muestra, la desviación standard calculada estará mas próxima a la desviación standard de la población y entonces la distribución T correspondiente se acerca a la distribución normal standard. El uso de la distribución T presupone que la población con que estamos trabajando tiene una distribución normal.

Distribución de Promedios Muestrales

Para comprender que significa distribución de promedios muestrales, vamos a suponer que realizamos un experimento con bombos como los usados en la lotería. Colocamos un número muy grande de bolas blancas en un bombo blanco, en cada una de las cuales figura un dato X. Este bombo representa la población de observaciones X, y tiene media m y varianza s2. Supongamos que a continuación hacemos los siguiente:

1) Tomamos una muestra de n=10 bolas blancas.

2) Calculamos la media y la anotamos en una bola azul.

3) Colocamos la bola azul en un segundo bombo de color azul.

4) Devolvemos las bolas blancas a su bombo y le damos vueltas.

5)Repetimos toda la operación muchas veces hasta que el bombo azul esté lleno de bolas azules.

Entonces, los números del bombo azul forman una población de promedios muestrales. Esta es una población derivada de la anterior, y tiene la misma media o promedio que la distribución original, pero su varianza es un enésimo de la varianza de la distribución original:

V(X−−)=σ2n

En el caso del bombo azul, si denominamos σ2m a la varianza y μ_m a la media, tenemos:

μm=μyσ2m=σ210

No hay comentarios:

Publicar un comentario

Suscribirse a: Enviar comentarios (Atom)