BOLIVIA - ENCUESTA DE HOGARES-2005
ID del Estudio | BOL-INE-EH-2005 |
Año | 2005 |
País | BOLIVIA |
Productor(es) | INSTITUTO NACIONAL DE ESTADÍSTICA - MINISTERIO DE PLANIFICACIÓN PARA EL DESARROLLO |
Financiamiento | TESORO GENERAL DE LA NACIÓN - TGN - Salarios de planta BASKET FUND - BF - Salarios de consultores y otros |
Colección(es) | |
Metadatos | Documentación en PDF |
Creado el | Jan 07, 2015 |
Última modificación | Jun 01, 2017 |
Visitas a la página | 611715 |
Descargas | 0 |
Muestreo
Procedimiento de muestreo
DISEÑO MUESTRAL
El diseño muestral para la Encuesta de Hogares 2005 está basado en el contexto de diseños muestrales probabilísticos, estratificados, por conglomerado y multiétapicos. La selección de la muestra se llevó a cabo dentro de estratos fila y estratos estadísticos, respectivamente.
Las unidades seleccionadas en la primera etapa, están referidas en la literatura del diseño muestral como Unidades Primarias de Muestreo (UPM). Cada UPM está construida en base a las áreas de enumeración censal identificada y utilizada en el Censo Nacional de Población y Vivienda del 5 septiembre de 2001. Éstos son generalmente sectores censales o fusión de dos sectores censales.
Las unidades seleccionadas dentro de cada UPM seleccionada se llaman unidades de segunda etapa o Unidades Secundarias de Muestreo (USM); unidades seleccionadas en la tercera etapa se denominan Unidades Terciarias de Muestreo (UTM). En general, las unidades seleccionadas en la última etapa en un diseño multiétapico se llaman Unidades Últimas de Muestreo (UUM).
TAMAÑO
El tamaño muestral fue obtenido por requisitos de confiabilidad, establecidos por el coeficiente de variación (CV). El CV es una medida relativa del error muestral y es calculada como el error muestral (desviación estándar) con respecto al valor esperado de la característica o variable dada. El CV especificado para el nivel de desempleo anual para el país, dada una tasa de desempleo abierto de 6%, es 7 por ciento de coeficiente de variación. El 7% de CV está basado en el requisito que una diferencia de 0.2 por ciento en la tasa de desempleo durante años consecutivos y es significativo al nivel 0.8. El CV especificado para el nivel de desempleo anual para los 9 departamentos, dada una tasa de desempleo abierto de 6 por ciento, es 8% de CV.
Debido al uso de un diseño muestral bietápico en área urbana y trietápico en área rural, la determinación del tamaño de la muestra es complejo, ya que incorpora un análisis de precisión de las variables de estudio, tanto en las Unidades Primarias de Muestreo (UPM) como las Unidades Secundarias de Muestreo (USM) y Unidades Terciarias de Muestreo (UTM), respectivamente. En este caso, se suma la dificultad asociada al hecho de que la infraestructura del diseño muestral es de propósitos múltiples y, por lo tanto, considera la posibilidad de que otras variables estén bien medidas. En este contexto, la determinación del tamaño de la muestra, trata, en primer lugar, de ser compatible con los niveles de estimación o dominios de estudio y la importancia de los estratos definidos, y con las principales variables que son objeto de estimación.
En ese entendido, el problema consiste en determinar el tamaño de muestra óptimo considerando las recomendaciones sobre tópico de tamaño de muestra que se dan en el manual sobre Encuestas de Población Económicamente Activa de la Organización Internacional de Trabajo (OIT) y el Mapa de Pobreza generado en base a la información Censal de 1992 y 2001, respectivamente. El tamaño de muestra óptimo para estimar las proporciones multinomiales, en este caso, la Condición o Estrato de Pobreza, es equivalente a la construcción de intervalos de confianza simultáneos para la variable pobreza que se ajusta a una distribución multinomial debido que está compuesto por 5 categorías (1. Necesidades Básicas Satisfechas; 2. Umbral de pobreza; 3. Pobreza Moderada; 4. Indigencia; 5. Marginalidad).
Distintos autores (Quesenberry y Hurts, 1964; Goodman, 1965; Tortora, 1978; Medina, 1998) han analizado procedimientos para determinar el tamaño de muestra necesario para proporciones multinomiales. El procedimiento consiste en dividir una muestra de tamaño n en k (5) categorías exhaustivas y mutuamente excluyentes. Fijando el error máximo deseado por e = 0,00936 para la incidencia verdadera de pobreza, con un nivel de confianza del 95% de confianza y la notación utilizada por Tortora, el tamaño de muestra preliminar está dado:
Número de personas: 9869,65
Número de viviendas: 2780,91
Tamaño de muestra: 4260,564 (4260)
Conforme a los cálculos habituales, se aconsejaría elegir 9869.65 (aproximadamente 9870) personas, situación que representa el 58% del número de selecciones sugeridas a partir del procedimiento propuesto por Tortora.
En una primera aproximación se trató de fijar un tamaño de muestra, en términos del total de viviendas, que resultase compatible con la obtención de un error de muestreo de baja magnitud en las estimaciones. El tamaño se fijó suponiendo un Muestreo Aleatorio Simple (MAS) de viviendas, el cual se ajustó por un factor que da cuenta del efecto de diseño (Deff) en el tamaño, al muestrear por conglomerados (sectores censales) en lugar de viviendas.
Otro de los aspectos necesarios a considerar en la determinación del tamaño de la muestra, es la cobertura de la encuesta, con el propósito de identificar viviendas donde no se hizo la encuesta continua de hogares de 2003 - 2004.
Desviaciones del diseño muestral
La correspondencia entre las unidades efectivamente encuestadas y la muestra seleccionada fue la misma, esto es, no se registraron desviaciones del diseño muestral de la encuesta.
Tasa de respuesta
Empezando con las estimaciones insesgadas de una muestra probabilística, diferentes tipos de estimación y procedimientos de ajuste (tales como la de no entrevista) pueden aplicarse con la convicción razonable de que la exactitud global de las estimaciones mejorará. En la muestra de la Encuesta de Hogares durante cualquier año dado, no todas las unidades responden la encuesta generando la NO RESPUESTA que constituye una fuente potencial del sesgo.
La tasa de no respuesta en la Encuesta de Hogares 2005 fue de 3.8 por ciento.
Expansores / Ponderadores
CONSTRUCCIÓN Y USO DE FACTORES DE EXPANSIÓN MUESTRAL
El factor de expansión se define como el valor recíproco de la fracción de muestreo o la inversa de la probabilidad con que fue seleccionada cada vivienda en la muestra o el factor de expansión se puede comprender o interpretar como la cantidad de personas en la población que representa una persona en la muestra. Este puede ser distinto para cada persona, y esa diferencia proviene del hecho que la muestra no es autoponderada.
PROCEDIMIENTO DE ESTIMACIÓN INSESGADO
Una muestra probabilística se define como una muestra que tiene una probabilidad distinta de cero y conocida de selección para cada unidad muestral (vivienda particular). Con las muestras probabilísticas pueden obtenerse estimadores insesgados. Un estimador insesgado de la población total para cualquier característica o variable investigada en la encuesta puede obtenerse multiplicando el valor de esa característica por cada unidad muestral (persona o vivienda) por el recíproco de la probabilidad con que esa unidad fue seleccionada y sumando los productos de todas las unidades muestrales (Hansen, 1953).
Empezando con las estimaciones insesgadas de una muestra probabilística, diferentes tipos de estimación y procedimientos de ajuste (tales la de no entrevista) puede aplicarse con la convicción razonable de que la exactitud global de las estimaciones mejorará. En la muestra de la Encuesta de Hogares durante cualquier año dado, no todas las unidades responden la encuesta generando la no - respuesta que constituye una fuente potencial del sesgo. La tasa de no respuesta en promedio es de 6 a 7 puntos porcentuales aproximadamente en el MECOVI.
Otros factores, donde ocurren errores ocasionales en el procedimiento de selección de muestra, la vivienda o la omisión de personas por los encuestadores, también puede introducir el sesgo. Estas omisiones de viviendas o personas pueden ser consideradas como una probabilidad igual a cero de selección. Estas dos excepciones no restringen la probabilidad de seleccionar cada unidad, en la Encuesta de Hogares. Si todas las unidades en la muestra tienen la misma probabilidad de selección, la muestra se llama autoponderada, y los estimadores insesgados pueden ser calculados multiplicando la muestra total por el recíproco de esta probabilidad. La mayoría de las muestras a nivel de estratos en la Encuesta de Hogares son aproximadamente autoponderadas.
FACTOR DE EXPANSIÓN DE BASE
La muestra designada para el diseño muestral es de 355 UPM con 12 viviendas por UPM en el área urbana y tanto en el área rural, respectivamente haciendo un total de 4260 viviendas particulares seleccionadas con probabilidades iguales a la inversa del estrato, denominados factores de expansión básicos (o factores de expansión base). Aproximadamente todas las personas de la muestra dentro del mismo estrato tienen la misma probabilidad de selección.
Como primer paso, en el procedimiento de estimación, los valores brutos de las unidades de viviendas de la muestra son multiplicadas por los factores de expansión base. Cada persona en la misma unidad de vivienda recibe el mismo factor de expansión base.
AJUSTE DE FACTORES DE EXPANSIÓN ESPECIAL
Algunas Unidades Secundarias de Muestreo (USM) son submuestreados en la “Unidad de Muestreo del INE” en el caso del área rural, porque su tamaño observado es más grande que lo esperado de 135 unidades de viviendas en promedio por UPM a nivel nacional.
Si estas desviaciones son bastante grandes para afrontar la realización exitosa de la asignación del personal de trabajo de campo. Cuando estas situaciones ocurren, una segunda etapa de muestreo son implementadas para mantener manejable el operativo de campo. Esta segunda etapa de muestreo se llama submuestreo de campo. El submuestreo de campo ocurre cuando una UPM consta de más de 3 segmentos censales identificados para la entrevista de áreas extensas de terreno en el área rural.
Las USMs son las unidades muestrales seleccionadas después de la primera etapa de muestreo para la Encuesta de Hogares, en la teoría la mayoría de las USMs constan de un conglomerado geográficamente compacta de viviendas particulares. El uso de conglomerado de segmentos baja los costos de viaje para el personal de trabajo de campo. El conglomerando logra aumentos ligeros de la varianza dentro de la UPM de las estimaciones para algunas características de fuerza de trabajo, pobreza y otras puesto que el informante dentro de un conglomerado compacto tiende a tener características similares. Entonces, el factor de expansión es el inverso de la fracción de muestreo o la probabilidad de selección de un segmento (USM).
Normalmente, las Unidades Últimas de Muestreo - UUMs son identificadas después de la operación del listado de viviendas o la actualización cartográfica. El personal de la oficina central selecciona un submuestreo sistemático de UUM con arranque aleatorio para reducir el número de unidades de viviendas actualizadas a un número manejable, de un promedio de 135 a 12 unidades de viviendas en cada UPM seleccionado. El factor de expansión se define como el inverso de la fracción de muestreo o la probabilidad de selección de una vivienda (UUM o UTM).
AJUSTE POR NO - RESPUESTA
Ocurre la no - respuesta cuando las viviendas u otras unidades de observación que se han seleccionado para la inclusión en una encuesta no reportan todos o algunos de los datos. Esta pérdida para obtener los resultados completos de todas las unidades seleccionados que puede levantarse de diferentes fuentes, mientras dependiendo de la situación de la encuesta. Hay dos tipos de no - respuesta:
- Ítem de no - respuesta
- La unidad de no - respuesta completa.
La unidad de no - respuesta completa se refiere a la perdida de recolectar cualquier dato en la encuesta de una unidad muestral. Por ejemplo, no pueden obtenerse los datos de una vivienda elegible en la encuesta debido a la ausencia del informante, los caminos intransitables, la negativa para participar en la entrevista, o disponibilidad del informante por otras razones. Este tipo de no - respuesta en la Encuesta de Hogares se llama Tipo A de no - entrevista.
Históricamente, era entre 4 y 5 por ciento de las unidades elegibles en un año dado de Tipo A de no - entrevistadas. Recientemente, la proporción de tipo A ha subido a entre 6 y 7 por ciento. El ítem de no - respuesta ocurre cuando una unidad encuestado tiene inexactitudes o se niega a proporcionar algunos ítems (preguntas) específicos de información. Se discuten procedimientos para tratar con este tipo de no - respuesta en el acápite correspondiente denominado el proceso de imputación. En el proceso de estimación de la Encuesta de Hogares, los factores de expansión de todas las viviendas entrevistadas se ajustan para considerar viviendas ocupadas de la muestra para que ninguna información que se obtuvo debido a la unidad de no - respuesta (Tipo A de no - entrevista o cobertura). Aumentando los factores de expansión de unidades muestrales entrevistadas para considerar para unidades de la muestra elegibles que no se han entrevistado, se asume que las unidades entrevistadas son similares a las unidades de no - entrevistado con respecto a sus características demográficas y socio-económicas. Esto puede o no puede ser verdad.
Los resultados de los sesgo de no - respuesta cuando las unidades de no - respuesta difieren en importancia con respecto a aquellos que responden a la encuesta o a los ítems particulares.
Como en toda encuesta, la Encuesta de Hogares 2005 registró una proporción o tasa de hogares “sin respuesta”, lo que obligó a estimar coeficientes de corrección como paso previo al cálculo de los factores de expansión finales. Los coeficientes de corrección por “no respuesta” se estimaron a nivel de las UPM, de esta manera se mantiene el peso o la contribución específica de cada una de ellas. Este criterio se consideró el más adecuado debido a que generalmente los hogares de estratos altos son los que más rechazan las encuestas y, por ende, no sería acertado aplicar un factor de ajuste por “no respuesta” a nivel de ámbitos mayores a la UPM pues ello introduce una distorsión, es decir, traería como efecto el diluir o subestimar la contribución de los estratos altos.
Grupo A Grupo B
En este nivel de análisis, los registros del archivo o la base de datos para todos los individuos en la misma vivienda por UPM tienen el mismo factor de expansión, puesto que los ajustes que se discutieron hasta ahora sólo dependen de las características de la vivienda.
FACTORES DE EXPANSIÓN DESPUÉS Factores de expansión después del ajuste de no - entrevista
A la realización del procedimiento de ajuste de no - respuesta, el factor de expansión para cada una de las personas entrevistados es:
(Factor de expansión base) x (Factor de expansión especial) x (Factor de ajuste de no - entrevista)
En este nivel de análisis, los registros del archivo o la base de datos para todos los individuos en la misma vivienda por UPM tienen el mismo factor de expansión, puesto que los ajustes que se discutieron hasta ahora sólo dependen de las características de la vivienda.