Estimadores de calibración
Autor | Andrés Gutiérrez Rojas |
Páginas | 355-391 |
Cap´ıtulo 10
Estimadores de calibraci´on
La calibraci´on [como proceso] se ha establecido como un importante instru-
mento metodol´ogico en la producci´on de grandes masas de estad´ısticas. La
mayor´ıa de agencias estad´ısticas han desarrollado software especialmente
dise˜nado para calcular las ponderaciones resultantes, usualmente calibra-
das a la informaci´on auxiliar disponible en registros administrativos y otras
fuentes precisas.
Carl-Erik S¨arndal (2008)
El proceso de calibraci´on es el tema principal de los m´as recientes art´ıculos pu-
blicados acerca de estimaci´on en poblaciones finitas y muestreo. Este fen´omeno se
presenta debido a que la calibraci´on provee una forma sistem´atica para la incor-
poraci´on de la informaci´on auxiliar en la etapa de estimaci´on en una encuesta. Un
estimador de calibraci´on es aquel estimador lineal que tiene la agradable propiedad
de la representatividad bajo cualquier dise˜no de muestreo; aunque el t´ermino cali-
braci´on es nuevo, hay autores que coinciden en afirmar que han usado calibraci´on
desde mucho tiempo atr´as, antes de conocer este proceso con ´este nombre.
Como S¨arndal (2007) afirma, el ´ıtem m´as importante en la calibraci´on, como pro-
ceso sistem´atico de estimaci´on, es la existencia de informaci´on auxiliar. Si no hay
informaci´on auxiliar no hay nada a lo que se pueda calibrar, y por tanto no habr´an
estimadores de calibraci´on que aplicar. Como se ver´a a lo largo del cap´ıtulo, los
estimadores generales de regresi´on pueden arrojar los mismos resultados que los
estimadores de calibraci´on; sin embargo, el esp´ıritu y la esencia de su aplicaci´on
tienen direcciones marcadamente diferentes.
¿Pero qu´e es un estimador de calibraci´on? ¿cu´al es su esencia?. A continuaci´on
una breve descripci´on de este m´etodo:
1. Suponga que se tiene acceso a un vector de informaci´on auxiliar, xk=
(x1k, x2k, . . . , xpk), de pvariables auxiliares y conocido para los individuos
seleccionados en la muestra.
2. Adem´as, por registros administrativos u otras fuentes de confianza, se tiene
el conocimiento del total del vector de informaci´on auxiliar tX=Pk∈Uxk.
355
356 10. Estimadores de calibraci´on
3. El prop´osito del estudio es estimar el total de la caracter´ıstica de inter´es
usando la informaci´on dada por xkk∈S.
4. Aunque el estimador de Horvitz-Thompson es insesgado, se requiere que las
estimaciones cumplan con la siguiente restricci´on dada por
X
k∈S
wkxk=tX
y conocida como ecuaci´on de calibraci´on.
5. La idea consiste en buscar estos pesos wktan cercanos como sea p osible al
inverso de la probabilidad de inclusi´on del k-´esimo elemento dk= 1/πk
Aunque el concepto de calibraci´on es nuevo en la teor´ıa de muestreo, la esencia del
m´etodo y el esp´ıritu pr´actico de obtener estimaciones que a justen exactamente con
totales conocidos no es nuevo. De hecho, este m´etodo se ha utilizado, y algunos
investigadores lo est´an utilizando, sin saber que se llama calibraci´on. Este fue el
caso de Deming & Stephan (1940) quienes abordaron este tema utilizando tablas
de contingencia con estimaciones internas y totales marginales conocidos. Ellos
fueron los pioneros del proceso iterativo de ajuste proporcional o IPFP, por
sus siglas en ingl´es.
10.1 IPFP
Suponga que existen dos variables cualitativas que dividen la poblaciones en sub-
grupos poblacionales. Por un lado una variable permite dividir la poblaci´on en H
subgrupos poblacionales, U1·, . . . , Uh·, . . . , UH·, y por otro lado una variable que
permite dividir la poblaci´on en Gsubgrupos p oblacionales, U·1, . . . , U·g, . . . , U·G.
Como resultado la poblaci´on se particiona en H×Gsubgrupos p oblacionales como
lo muestra la siguiente tabla.
Tabla 10.1: Distribuci´on de la poblaci´on en la tabla de contingencia.
U11 ··· U1g· · · U1GU1·
.
.
..
.
..
.
..
.
.
Uh1··· Uhg · · · UhG Uh·
.
.
..
.
..
.
..
.
.
UH1··· UHg · ·· UHG UH·
U·1··· U·g· · · U·GU
Los tama˜nos de los subgrupos poblacionales se definen as´ı: Nhg = #Uhg ,Nh·=
#Uh·,N·g= #U·g. N´otese que se tiene que
N=
H
X
h=1
Nh·=
G
X
g=1
N·g.(10.1.1)
Adem´as de esto, los totales de las celdas de la tabla de contingencia siguen la
siguiente relaci´on:
10.1. IPFP 357
Tabla 10.2: Distribuci´on de los tama˜nos poblacionales en la tabla de contingencia.
N11 ··· N1g· · · N1GN1·
.
.
..
.
..
.
..
.
.
Nh1··· Nhg · · · NhG Nh·
.
.
..
.
..
.
..
.
.
NH1··· NHg · ·· NHG NH·
N·1··· N·g· · · N·GN
Despu´es de la recolecci´on y observaci´on de los datos en la encuesta, se tiene la
estimaci´on definitiva de los totales de cada una de las celdas internas y de las
celdas marginales. As´ı, ˆ
Nhg corresponde a la estimaci´on de Nhg ,ˆ
Nh·corresponde
a la estimaci´on de Nh·,N·gcorresponde a la estimaci´on de N·gy por ´ultimo, ˆ
N
corresponde a la estimaci´on de N. De est´a manera, es posible utilizar el estimador
de Horvitz-Thompson, definiendo
N·g=X
k∈U
zhk Nh·=X
k∈U
zgk.
Donde,
zhk =(1 si k∈Uh·
0 en otro caso zgk =(1 si k∈U·g
0 en otro caso
Al utilizar el estimador de Horvitz-Thompson se garantiza el insesgamiento y se
tiene la relaci´on dada por la siguiente tabla
Tabla 10.3: Distribuci´on de los tama˜nos poblacionales estimados en la tabla de
contingencia.
ˆ
N11 ··· ˆ
N1g··· ˆ
N1Gˆ
N1·
.
.
..
.
..
.
..
.
.
ˆ
Nh1··· ˆ
Nhg ··· ˆ
NhG ˆ
Nh·
.
.
..
.
..
.
..
.
.
ˆ
NH1··· ˆ
NHg · · · ˆ
NHG ˆ
NH·
ˆ
N·1··· ˆ
N·g··· ˆ
N·Gˆ
N
Hasta el momento, se ha cumplido con el objetivo de estimar las celdas internas
y las marginales de la tabla de contingencia. Sin embargo, suponga que, debido
a registros administrativos u otras fuentes de confianza, es posible tener acceso a
los totales de las celdas marginales tanto por columnas como por filas. Es decir,
suponga que N·g,g= 1, . . . , G yNh·,g= 1, . . . , G son conocidos.
Bajo el anterior supuesto, es posible construir un algoritmo que a juste las estima-
ciones de las celdas internas y que tenga la agradable propiedad que, finalizado
Para continuar leyendo
Solicita tu prueba