Modèle gee statistique

Thall, cos et Vail, S.C. (1990), «certains modèles de covariance pour les données de comptage longitudinal avec surdispersion», biométrie, 46, 657-671. Allison, P. D. (2009). Modèles de régression des effets fixes (applications quantitatives dans les sciences sociales). SAGE. Les paramètres β k {displaystyle beta _ {k}} sont estimés en résolvant U (β) = 0 {displaystyle U (beta) = 0} et sont généralement obtenus via l`algorithme Newton – Raphson. La structure de variance est choisie pour améliorer l`efficacité des estimations de paramètres. Le Hessian de la solution aux GEEs dans l`espace de paramètres peut être utilisé pour calculer des estimations d`erreurs standard robustes.

Le terme «structure de variance» désigne la forme algébrique de la matrice de covariance entre les résultats, Y, dans l`échantillon. Exemples de spécifications de structure de variance incluent l`indépendance, échangeables, autorérégressive, stationnaire m-dépendante, et non structuré. La forme d`inférence la plus populaire sur les paramètres de régression GEE est le test de Wald utilisant des erreurs standard naïves ou robustes, bien que le test de score soit également valide et préférable lorsqu`il est difficile d`obtenir des estimations de l`information dans le cadre de l`hypothèse alternative. Le test du rapport de vraisemblance n`est pas valide dans ce paramètre car les équations d`estimation ne sont pas nécessairement des équations de vraisemblance. La sélection du modèle peut être effectuée avec l`équivalent GEE du critère d`information Akour (AIC), le quasi-AIC (QIC). [5] comme nous l`avons vu dans une présentation précédente, une solution possible est d`inclure des effets aléatoires spécifiques au sujet dans le raccord du modèle. Cette méthode est appelée un modèle mixte linéaire généralisé (GLMM). Les GLMMs requièrent des hypothèses paramétriques; Si vous êtes comme moi (Kellie), en supposant que tout est gaussien probablement vous rend mal à l`aise. QIC et la statistique QICu connexe peuvent être utilisées pour comparer les modèles GEE, c`est-à-dire pour la sélection du modèle. QICu se rapproche de QIC lorsque le modèle GEE est correctement spécifié.

QICu, défini comme Q + 2p, ajoute une pénalité (2p) à la quasi-probabilité (Q), où p est le nombre de paramètres dans le modèle. Les modèles n`ont pas besoin d`être imbriqués afin d`utiliser QIC ou QICu pour les comparer. Notez que QICu ne doit pas être utilisé pour sélectionner une structure de corrélation de travail. GEE est une méthode semi-paramétrique: alors que nous imposons une certaine structure sur le processus de génération de données (linéarité), nous ne spécifions pas entièrement sa distribution. L`estimation (beta) est purement un exercice d`optimisation. $ $ Psi big (E (y_ {IJ} | eta_{i}) big) = mu + eta_{i} $ $ Wald les intervalles de confiance basés sur les statistiques et les tests d`hypothèses pour les paramètres; se rappellent qu`ils dépendent de la normalité asymptotique de l`estimateur et de leur matrice de covariance estimée. Cette méthode a également été explorée ou étendue pour les données corrélées avec une taille de grappe non Ignorable par Benhin et coll. et Cong et coll. [82, 83]. De plus, une méthode plus efficace appelée WCR modifié (MWCR) a été proposée par Chiang et Lee, où les sujets de taille minimale des grappes ont été échantillonnés aléatoirement à partir de chaque grappe, puis les modèles GEE pour les données équilibrées ont été appliqués pour l`estimation en incorporant les corrélation intra-cluster; ainsi, le MWCR pourrait être un moyen plus efficace d`analyse [84]. Mais le MWCR n`est pas toujours satisfaisant et Pavlou et coll. ont reconnu les conditions suffisantes de la structure des données et le choix de la structure de corrélation «de travail», ce qui a permis la cohérence des estimations du MWCR [85].

De plus, Wang et coll. ont élargi le travail susmentionné aux données longitudinales groupées, qui sont recueillies en tant que mesures répétées sur des sujets survenant en grappes, avec une taille potentielle de grappes informatives [45]. Les exemples incluent des études de santé de sujets provenant de plusieurs hôpitaux ou familles. Avec l`adoption et la comparaison du GEE, du WCR et du CWGEE, l`auteur a affirmé que le CWGEE était recommandé en raison de la performance comparable avec le WCR et de l`absence de calcul intensif de Monte Carlo en termes de taux de couverture bien conservés et de puissance souhaitable Propriétés, tandis que les modèles GEE ont entraîné une inférence non valide en raison des estimations de paramètres biaisées via des études de simulation approfondies et l`application de données réelles d`une étude de la maladie parodontale [45].

Comments are closed, but trackbacks and pingbacks are open.