Probabilidad y Estadística
Astrid Porras Arias
Francisco Herrera Varela
Distribución continuas
Las distribuciones de probabilidad son
idealizaciones de los polígonos de frecuencias. En el caso de una variable
estadística continua consideramos el histograma de frecuencias relativas, y se
comprueba que al aumentar el número de datos y el número de clases el
histograma tiende a estabilizarse llegando a convertirse su perfil en la
gráfica de una función.
Las distribuciones de probabilidad de variable continua se definen
mediante una función y=f(x) llamada función de
probabilidad o función de densidad.
Así como en el histograma la frecuencia viene dada por el área, en la función
de densidad la probabilidad viene dada por el área bajo la curva, por lo que:
El área encerrada bajo la totalidad de la curva es 1.
Para obtener la probabilidad p(a£X£b) obtenemos la proporción de área que hay
bajo la curva desde a hasta b.
La probabilidad de sucesos puntuales es 0, p(X=a)=0
Distribución Normal
Entre las distribuciones
probabilísticas de variable continua, la más ampliamente utilizada es la
llamada distribución normal, cuya representación gráfica tiene una forma muy
conocida en el ámbito de la estadística y las ciencias naturales: la campana de
Gauss.
Concepto y función de
probabilidad
Dado un experimento de variable aleatoria continua X, se llama distribución normal a aquella que queda perfectamente
descrita por su media aritmética
y su desviación típica s. Las distribuciones
normales, también llamadas gaussianas, se denotan por la expresión N (
, s).

La gráfica de una distribución normal es la
conocida campana de Gauss.
La función de densidad de la distribución
normal sigue la ecuación que determina la conocida campana
de Gauss, cuya expresión matemática es la siguiente:

Media y desviación típica
Una función de densidad asociada a una
distribución normal se caracteriza por dos parámetros complementarios:
La media
, que corresponde al punto en el que
la función de distribución alcanza un máximo.
La desviación típica s, que señala la anchura de la distribución.
La función que describe una distribución
normal presenta puntos de inflexión en las abscisas:
- s y
+ s,
donde se modifica la concavidad de la curva. Finalmente, en los valores de la
variable estadística que tienden a -¥ y +¥, la función tiende a cero.
Tipificación de la variable
El cálculo de las probabilidades asociadas a
una distribución normal por medio de integrales resulta, en general, complejo.
Por ello, suele utilizarse una función de distribución de apoyo cuya media es 0
y cuya desviación típica es la unidad.Tal función se denomina distribución normal tipificada, y se expresada como N
(0,1).
Se llama tipificación a la
operación consistente en cambiar de una variable aleatoria X a otra variable Z
de distribución tipificada, por medio de la expresión siguiente:

Tabla de tipificación
La distribución normal tipificada tiene por
ecuación de su función de densidad:

Distribución
Ji-cuadrada
La distribución ji-cuadrado tiene muchas
aplicaciones en inferencia estadística , por ejemplo en el test ji-cuadrado y
en la estimación de varianzas. También está involucrada en el problema de
estimar la media de una población normalmente distribuida y en el problema de
estimar la pendiente de una recta deregresión lineal, a través de su papel en
la distribución t , y participa en todos los problemas de análisas de varianza
, por su papel en la distribución F , que es la distribución del cociente de
dos variables aleatorias de distribución ji-cuadrada e independientes.
Tabla de distribución Ji cuadrada
En realidad la distribución ji-cuadrada es la
distribución muestral de S² . O sea que si se extraen todas las muestras
posibles de una población normal y a cada muestra se le calcula su varianza, se
obtendrá la distribución muestral de varianzas.
Para estimar la varianza poblacional o la
desviación estándar, se necesita conocer el estadístico X² . Si se elige una
muestra de tamaño n de una población normal con varianza , el estadístico:
donde n es el tamaño de la muestra, S² la
varianza muestral y la varianza de la población de donde se extrajo la
muestra.
Las distribuciones X² no son simétricas.
Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a
la derecha. Cuando n>2, la media de una distribución X² es n-1 y la varianza
es 2(n-1).


La Distribución T de Student
En la generalidad de los casos, no disponemos de la desviación standard de la
población, sino de una estimación calculada a partir de una muestra extraída
de la misma y por lo tanto no podemos calcular Z.
En estos casos calculamos el estadístico T:
T=μ−xs
con
s=∑(x−xi)2n−1−−−−−−−−−−√

donde S es la desviación standard muestral, calculada con n-1 grados
de libertad.
Nótese que utilizamos S, la Desviación Standard de una Muestra, en lugar de
μ, la Desviación Standard de la Población.
El estadístico T tiene una distribución que se denomina distribución T de
Student, que está tabulada para 1, 2, 3, ... etc. grados de libertad de la
muestra con la cual se calculó la desviación standard. La distribución T
tiene en cuenta la incertidumbre en la estimación de la desviación standard
de la población, porque en realidad la tabla de T contiene las distribuciones
de probabilidades para distintos grados de libertad.
La distribución T es mas ancha que la distribución normal tipificada Para un
número de grados de libertad pequeño. Cuando los grados de libertad tienden a
infinito, la distribución T tiende a coincidir con la distribución normal
standard. Es decir, en la medida que aumentemos el número de observaciones de
la muestra, la desviación standard calculada estará mas próxima a la
desviación standard de la población y entonces la distribución T
correspondiente se acerca a la distribución normal standard. El uso de la
distribución T presupone que la población con que estamos trabajando tiene
una distribución normal.
Distribución de Promedios Muestrales
Para comprender que significa distribución de promedios muestrales, vamos a
suponer que realizamos un experimento con bombos como los usados en la
lotería. Colocamos un número muy grande de bolas blancas en un bombo blanco,
en cada una de las cuales figura un dato X. Este bombo representa la
población de observaciones X, y tiene media m y varianza s2. Supongamos que a
continuación hacemos los siguiente:
1) Tomamos una muestra de n=10 bolas blancas.
2) Calculamos la media y la anotamos en una bola azul.
3) Colocamos la bola azul en un segundo bombo de color azul.
4) Devolvemos las bolas blancas a su bombo y le damos vueltas.
5)Repetimos toda la operación muchas veces hasta que el bombo azul esté lleno
de bolas azules.
Entonces, los números del bombo azul forman una población de promedios
muestrales. Esta es una población derivada de la anterior, y tiene la misma
media o promedio que la distribución original, pero su varianza es un enésimo
de la varianza de la distribución original:
V(X−−)=σ2n
En el caso del bombo azul, si denominamos σ2m a
la varianza y μm a la media, tenemos:
μm=μyσ2m=σ210
No hay comentarios:
Publicar un comentario