miércoles, 29 de marzo de 2017

Tablas de contingencia y aspectos de ellas.



La tabla de contingencia

La tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurará el número de casos o individuos que poseen un nivel de uno de los factores o características analizadas y otro nivel del otro factor analizado.







SEXO

HOMBRE
MUJER
MARGINAL
FUMA
SI
n11
n12
n1.
NO
n21
n22
n2.
MARGINAL
n.1
n.2
N

    donde:
          nij = número de observaciones que tienen el atributo i y j               
          ni. = número de individuos que tienen el atributo i (marginal i)                  
         n.j = número de individuos que tienen el atributo j (marginal j)

La tabla de contingencia se define por el número de atributos o variables que se analizan conjuntamente y el número de modalidades o niveles de los mismos. El ejemplo propuesto es una tabla de contingencia 2x2, ya que tiene dos atributos (FUMA Y SEXO) y cada uno de ellos tiene dos niveles. Si quisiéramos analizar conjuntamente tres variables nominales, como por ejemplo, Fumar, Sexo y Edad, y esta última variable tuviera tres niveles (<20 años, de 20 a 40 años, >40 años), obtendríamos tres tablas como la anterior, una para cada modalidad de edad y la tabla de contingencia tendría una dimensión 3×2×2.

             Las tablas de contingencia tienen dos objetivos fundamentales:

1)      Organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores (variables cualitativas). 






SEXO

HOMBRE
MUJER
MARGINAL
FUMA
SI
65
58
123
NO
43
67
110
MARGINAL
108
125
233

En esta tabla se puede observar en primer lugar que de los 233 individuos de los que se tiene información 108 son hombres y 125 son mujeres. Asimismo se sabe que 123 de ellos fuman y 110 no. La tabla de contingencia nos permite tener información cruzada sobre ambas variables: de los 108 hombres, 65 fuman y 43 no, mientras que en el caso de las mujeres, 58 fuman y 67 no. 


CORRELACIONES

La correlación trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.

Tipos de correlación:

1.- Correlación directa
La correlación directa se da cuando al aumentar una de las variables la otra aumenta.
La recta correspondiente a la nube de puntos de la distribución es una recta creciente.

2.- Correlación inversa
La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.

3.- Correlación nula
La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.


Grados de correlación:

El grado de correlación indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:

1. Correlación fuerte
La correlación será fuerte cuanto más cerca estén los puntos de la recta.
2. Correlación débil
La correlación será débil cuanto más separados estén los puntos de la recta.



Analisis de datos cualitativos,  Consultado el 28 de marzo de 2017, en   https://www.uam.es/personal_pdi/economicas/eva/pdf/tab_conting.pdf

Agrupacion de datos en SPSS