Idioma :
SWEWE Membre :Login |Registre
Cercar
Comunitat enciclopèdia |Enciclopèdia Respostes |Enviar pregunta |Coneixement de vocabulari |Pujar coneixement
Anterior 1 Pròxim Seleccioneu Pàgines

Taula de contingència

Taula de contingència és de les dades d'observació en dues o més propietats (variables qualitatives) de classificació que figuren en les taules de freqüència

Breu introducció

Típicament, si la població d'individus pot ser classificat dues propietats de A i B, A té r nivells A1, A2, ..., Ar, B és C els nivells B1, B2, ..., Bc, extreu de la població de grandària n conjunt de mostres que nij individus pertanyents a classificar els atributs Ai i Bj, nij freqüència coneguda, la r × c 1 nij r files s'ordenen en una taula de contingència c columnes bidimensional, conegut com taules r × c. Si hi ha més de dos atributs considerats, també d'acord amb un procediment similar per fer taula de contingència, anomenada taula de contingència multidimensionals.Interpretació

Contingència quadre d'anàlisi de taula

Compta amb una

Observacions realitzades per dos o més atributs (variables qualitatives) de classificació que figuren a la taula de freqüències. Per exemple, una mostra aleatòria de 1.000 persones per gènere (home o dona), i la visió del color (ceguesa normal o color) dues categories d'atributs, obtenir dues files de la taula de dues de contingència (taula 1), també conegut com 2 × 2 taules o quatre reixetes taules.

Característiques febrer

Típicament, si la població d'individus pot ser classificat dues propietats de A i B, A té r nivells A1, A2, ..., Ar, B ha с nivells B1, B2, ..., Bc, extret de la població de grandària n El disseny de la mostra que nij caiguda en el nivell de la categoria Ai i Bj, nij freqüència coneguda, la r × с mesos nij (i = 1,2, ..., r, j = 1,2, ..., с) estan disposats en una fila r с columna de la taula de contingència bidimensional (Taula 2), denominat r × с taules.

Característiques març

Si hi ha més de dos atributs considerats, també d'acord amb un procediment similar per fer taula de contingència, anomenada taula de contingència multidimensionals. Atès que el valor d'una propietat o variables qualitatives són discrets, de manera que les àrees d'anàlisi de taula de contingència multidimensionals que pertanyen a una anàlisi multivariant discret, anàlisi de taula de contingència en l'aplicació de les estadístiques, sobretot en la medicina, la biologia i les ciències socials, hi ha aplicacions importants.

Les preguntes bàsiques

Taula de contingència

Anàlisi de taules de contingència que el problema bàsic és que l'investigat determinar si l'associació entre els atributs, és a dir, la independència. Igual que en l'exemple anterior, la pregunta és: si una persona és cega al color del seu gènere? Al r × с taula, termes de pi ·, · pj i pij denoten la població d'individus que pertanyen a la classe Ai, Bj i pertany a la classe pertanyen Ai, Bj probabilitat (pi ·, p · j va dir probabilitat marginal, pij dit probabilitat reixeta), "A, B dues propietats no associades" hipòtesi es pot expressar com H0: pij = pi · p · j, (i = 1,2, ..., r, j = 1,2, ..., с) paràmetres desconeguts pij, pi, p · · j estimació de màxima versemblança (veure estimació puntual), respectivament, i van ser files i columnes, i (conjuntament, les vores i)

És la mida de la mostra. Segons K. Pearson (1904) prova de bondat d'ajust o prova de raó de versemblança (veure prova d'hipòtesis), quan h0 es manté, i tot pi ·> 0 i p · j> 0, l'estadística

La distribució asimptòtica de graus de llibertat (r-1) (с-1) de la distribució Ⅹ, on EIJ = ni · n · j / n es diu s'espera freqüències. Quan n és prou gran, i cada cel · la de la taula són hores menys EIJ, pot en conseqüència h0 per a la prova: Si el valor Ⅹ prou gran com per rebutjar la hipòtesi H0, és a dir, que A i B estan associats. Davant dels problemes de la visió de color, havia Feu clic a la inspecció per determinar el sexe i l'existència d'una correlació entre la percepció dels colors.

Cal assenyalar

Si la mida de la mostra n no és gran, la distribució asimptòtica del mètode anterior no es basa en el cas. Referent a això, la situació a la taula de quatre vegades, RA Fisher (1935) va proposar una per a la prova exacta de tots els n. La idea és que les vores de la fixa i les condicions, depenent de la distribució hipergeométrica (veure distribució de probabilitat) es pot calcular mitjançant l'observació de la freqüència de probabilitat condicional arbitrària d'una disposició particular. Observació de la freqüència real apareix arranjament, i més dels seus signes associats que mostren totes les possibles permutacions de les probabilitats condicionals es calculen i es va afegir, si el resultat va ser significativament menor que un nivell donat, a continuació, determina si la columna associada taula

Penseu en la possibilitat de l'existència de dues propietats associades a rebutjar H0.

Índex

Quan es determina que existeix una relació entre les variables, es pot utilitzar per descriure una varietat d'indicadors quantitatius del seu grau d'associació. Per exemple, el general r × с taula, poseu-vos en contacte amb el número següent indica les columnes disponibles.

R × с en forma general, en particular en l'anàlisi de la taula de multi-dimensional, sense rellevància (és a dir, la independència) de la hipòtesi és rebutjada, sovint també d'avaluar posteriorment suposició. Per exemple, la forma tridimensional, pot ser necessari considerar si una variable és independent de les altres dues variables. Independència parcial d'una prova tan gran de la mostra segueix sent mètode de prova Ⅹ disponible. Però en el cas multidimensional, la correlació entre les variables pot ser bastant complex. Molts assumeixen que la probabilitat d'una representació directa de gelosia és inconvenient. Un mètode consisteix a seguir un model estadístic lineal, la probabilitat de la cèl · lula (o d'una freqüència desitjada) expressat com el logaritme dels principals efectes de les variables i l'ordre de la interacció dels paràmetres desconeguts, com ara una forma lineal. Aquest model s'anomena el model log-lineal, en aquest model, la suposició d'independència de les variables és equivalent a la suposició que la interacció zero. A més, pot utilitzar el model log-lineal, basat en la freqüència observada, les diverses ajust del model específic, i l'estimació dels paràmetres desconeguts. Mètodes d'estimació generalment utilitzant el mètode de màxima versemblança. No obstant això, a causa de les equacions similars sovint sense representació explícita, en general es requereix mètode iteratiu per calcular la càrrega de treball pesada. Per tant, l'anàlisi de taules de contingència multidimensionals només en l'ús de l'ordinador d'alta velocitat moderna creixent popularitat de la caixa abans d'aconseguir un més desenvolupat, i aconseguir gradualment el nivell d'ús pràctic.


Anterior 1 Pròxim Seleccioneu Pàgines
Usuari Revisió
Sense comentaris encara
Vull comentar [Visitant (18.191.*.*) | Login ]

Idioma :
| Comproveu el codi :


Cercar

版权申明 | 隐私权政策 | Drets d'autor @2018 Coneixement enciclopèdic del Món