Modelos Lineales Generalizados - Modelos Estadísticos lineales - Libros y Revistas - VLEX 742107145

Modelos Lineales Generalizados

AutorCristian Fernando Téllez Piñerez/Mario Alfonso Morales Rivera
Páginas173-195
Cap´
ıtulo 6
Modelos Lineales Generalizados
Los modelos lineales generalizados (MLGs) proporcionan una aproximaci´on
unificada a la mayor´ıa de los procedimientos usados en estad´ıstica aplicada.
El nombre se debe a que ellos generalizan los modelos lineales basados en
el supuesto de distribuci´on normal para la variable respuesta. Al igual que
los modelos lineales cl´asicos, tratados en los cap´ıtulos 1 y 4 los MLGs tienen
aplicaci´on en todas las disciplinas del saber. Nelder & Wedderburn (1972)
presentaron por primera vez el t´ermino en un art´ıculo que, sin lugar a dudas,
es uno de los m´as importantes publicados en el ´area de estad´ıstica, por su gran
impacto en la forma como se aplica esta disciplina. Desde entonces, poco a
poco los modelos lineales generalizados se han ido cono ciendo y usando am-
pliamente. Sin embargo, los textos y cursos de estad´ıstica se concentran en el
modelo lineal normal, esto es desafortunado porque los estudiantes quedan con
una visi´on muy restringida de las posibilidades de aplicaci´on de la estad´ıstica
en su ´area de trabajo, esta situaci´on ha motivado la inclusi´on del presente
cap´ıtulo en este texto.
La genialidad de Nelder & Wedderburn (1972) consisti´o en darse cuenta (y
demostrar) que muchos de los m´etodos estad´ısticos ampliamente usados en
la ´epoca, aparentemente desligados unos de otros, tales como la regresi´on li-
neal m´ultiple, el an´alisis probit, el an´alisis de datos provenientes de ensayos
de diluci´on usando la distribuci´on binomial (realizados por Fisher), los mode-
los logit para proporciones, los modelos log-lineales para conteos, los modelos
de regresi´on para datos de sobrevivencia, entre otros, se pod´ıan tratar con
un marco te´orico unificado y que las estimaciones de m´axima verosimilitud
para los par´ametros de esos modelos pod´ıan obtenerse por el mismo algoritmo
conocido como ınimos cuadrados ponderados iterativos (MCPI).
Los desarrollos te´oricos en modelos lineales cl´asicos parten del supuesto que la
variable respuesta tiene distribuci´on normal, cuando un fen´omeno en estudio
genera datos para los cuales no es razonable la suposici´on de normalidad, como
por ejemplo cuando la respuesta es categ´orica, una proporci´on o un conteo,
173
174 Modelos lineales
obviamente la respuesta no es normal y no es recomendable analizar los datos
suponiendo normalidad. Otro supuesto de los modelos lineales cl´asicos es el de
homogeneidad de la varianza, situaci´on que no se verifica cuando la respuesta
es, por ejemplo, una variable aleatoria de poisson, distribuci´on donde la media
y la varianza son iguales, es decir, en este modelo un cambio en la media
necesariamente implica cambio en la varianza.
Los modelos lineales generalizados son excelentes para modelar datos en condi-
ciones de no normalidad y varianza no constante. Espec´ıficamente deber´ıamos
considerar usar los MLGs cuando la variable respuesta es: conteos expresa-
dos como proporciones, conteos que no son proporciones, respuestas binarias,
tiempos de sobrevida donde la varianza se incrementa con la media.
En este cap´ıtulo se definen los modelos lineales generalizados, se estudian sus
propiedades, la estimaci´on de sus par´ametros, los m´etodos para hacer inferen-
cia sobre estos y los m´eto dos para diagnosticar la bondad del ajuste de los
datos al modelo.
6.1 Definici´on de un modelo lineal
generalizado
Como se dijo en la Introducci´on a este cap´ıtulo, los modelos lineales generaliza-
dos son una extensi´on de los mo delos lineales cl´asicos estudiados en el cap´ıtulo
1. En este contexto se cuenta con un vector yde nobservaciones que es la
realizaci´on de un vector aleatorio Y, cuyas componentes est´an independien-
temente distribuidas con vector de medias µy varianza constante. La parte
sistem´atica del mo delo es una especificaci´on para el vector µen t´erminos de un
umero peque ˜no de par´ametros desconocidos β1,· ·· , βp, que hay que estimar
de los datos. En el caso de los modelos lineales ordinarios se especifica que µi,
las componentes del vector de medias, tienen la forma
E(Yi) = µi=
p
X
j=1
xijβj; para i= 1,. . . , n
donde xij es el valor de la j´esima covariable para la observaci´on i. Las
ecuaciones anteriores se pueden escribir en forma matricial como en (1.22).
La parte sistem´atica del mo delo asume que los valores de las covariables se
conocen sin error. Adicionalmente, para efectos de hacer inferencia se supone
que los errores, definidos como e=Yµ, siguen una distribuci´on normal con
varianza constante σ2.
En un modelo lineal generalizado (MLG) se hacen las siguientes generaliza-
ciones:
1. La componente aleatoria se supone perteneciente a la familia expon encial
de distribuciones, de la cual hace parte la distribuci´on normal.
M.A. Morales C.F. Tellez

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR