Último día de clases en el que damos los dos últimos temas de la asignatura. En este primero le dedicamos más tiempo puesto que hay que entender diferentes términos para su posterior aplicación. Primero definimos una serie de términos:
- Población de estudio. Conjunto de individuos que queremos investigar.
- Muestra. Conjunto de individuos que participan.
- Tamaño muestral (n). Número de individuos de la muestra.
- Inferencia estadística. Extrapolación de los datos de la muestra sobre la población de estudio.
- Técnicas de muestreo. Procedimientos que permiten elegir muestras.
- Muestreo probabilístico o aleatorio. Ténica de muestreo al azar, quedando asociado a un error aleatorio.
El proceso de inferencia estadística
A partir de una población de estudio queremos conocer un parámetro (variable). De la población hacemos una selección aleatoria para obtener una muestra. De la muestra si podemos sacar la variable, llamada estimador. El estimador lo extrapolamos a la población y obtenemos el parámetro.
Error estándar
El error estándar trata de medir la variabilidad de los valores del estimador respecto a la población.
- Para una media:
- Para una proporción:
$$e=\sqrt { \frac { p\cdot \left( 1-p \right) }{ n } } $$
s= desviación típica
n= tamaño de la muestra
p= proporción del estimador
Mientras mayor sea el tamaño de la muestra, menor será el tamaño del error estándar.
Intervalos de confianza
Trata de conocer el parámetro a partir de un nivel de confianza, asegurándonos que la población está dentro de ese intervalo.
$$I.C. parámetro=p\pm z (e.estándar)$$
z=nivel de confianza.
- Nivel de confianza 68%, z=1.
- Nivel de confianza 95%, z=2.
- Nivel de confianza 99%, z=3.
Mientras mayor sea la confianza menor será la precisión.
Cálculo para proporciones:
$$I.C.parámetro=p\pm z\sqrt { \frac { p\cdot \left( 1-p \right) }{ n } } $$
EJERCICIO
En un centro de salud se pretende realizar un estudio sobre tabaquismo, para lo que se selecciona una muestra de 337 pacientes. Los enfermeros del centro de salud encontraron que en total en la muestra había 83 fumadores habituales. Se pide que calculemos el intervalo de confianza al 95 y al 99% para la proporción de tabaquismo en el total de población del centro de salud.
n=337
83 fumadores
$$p=\frac { 83 }{ 337 } =0,24$$
Para 95%
$$I.C.=0,24\pm 2\sqrt { \frac { 0,24\left( 1-0,24 \right) }{ 337 } } $$
=0,284; =0,196
Resultado: población entre 19,6% y 28,4% es fumador con I.C. del 95%
Para 99%
$$I.C.=0,24\pm 3\sqrt { \frac { 0,24\left( 1-0,24 \right) }{ 337 } } $$
=0,3 ; =0,18
Resultado: población entre 18% y 30% es fumador con I.C. del 99%
Muestreo Probabilístico
Para tomar una muestra se sigue una técnica de muestreo aleatorio. Según se utilice el azar, utilizaremos un tipo u otro.
- Aleatorio simple. Sorteo entre todos los individuos de la población de estudio.
- Aleatorio sistemático. Según un intervalo. Saco un número al azar y empieza a contar con los intervalos.
- Estratificado. Forzar a subgrupos, dentro del subgrupo escojo al azar.
- Conglomerado. Se divide a la población en subgrupos. Se selecciona al azar los subgrupos.
Muestreo No Probabilístico
- Por cuotas. El investigador selecciona según la variable que le interese.
- Accidental. Sobre individuos disponibles en ese momento.
- Conveniencia. El investigador decide la muestra.
Tamaño de la Muestra
Se tarta de calcular el tamaño mínimo muestral:
$$n=\frac { { Z }^{ 2 }\cdot { S }^{ 2 } }{ { e }^{ 2 } } $$
El resultado obtenido lo comprobaremos, si cumple la siguiente fórmula se trata del tamaño de la muestra.
$$n>n\cdot \left( n-1 \right) $$
Si ocurre:
$$n<n\cdot \left( n-1 \right) $$
Necesitamos obtener el tamaño de la muestra con la siguiente fórmula:
$$n'=\frac { n }{ 1+\frac { n }{ N } } $$
Para calcular el tamaño de una muestra cuando queremos estimar una proporción.
$$n=\frac { N\cdot { Z }^{ 2 }\cdot p\left( 1-p \right) }{ \left( N-1 \right) { e }^{ 2 }+{ Z }^{ 2 }\cdot p\left( 1-p \right) } $$
EJERCICIO REALIZADO EN CLASE
23.200 estudiantes US. Se quiere conocer cuántos estudiantes utilizan preservativo en sus relaciones sexuales. Por un estudio previo se conoce que el 62% lo utilizaba. Calcula el tamaño muestral con confianza de 95% con margen de error de 3%.
- Aplicamos la formula:
$$n=\frac { N\cdot { Z }^{ 2 }\cdot p\left( 1-p \right) }{ \left( N-1 \right) { e }^{ 2 }+{ Z }^{ 2 }\cdot p\left( 1-p \right) } $$
- Los valores a sustituir:
- N=23.200
- Z=2
- p=0,62
- e=0,03
$$n=\frac { 23.200\cdot { 2 }^{ 2 }\cdot 0,62\left( 1-0,62 \right) }{ \left( 23.200-1 \right) { 0,03 }^{ 2 }+{ 2 }^{ 2 }\cdot 0,62\left( 1-0,62 \right) } =1002$$
Solución: tamaño de la muestra 1002.
Solución: tamaño de la muestra 1002.
No hay comentarios:
Publicar un comentario