Practica del Coeficiente de Pearson Aplicado a Excel.
El término “correlación” literalmente
significa relación mutua; de este modo, el análisis de correlación mide e
indica el grado en el que los valores de una variable se relacionan con los
valores de otra.
Más exactamente, el análisis que se ocupa de medir la relación entre una
sola variable independiente y la variable dependiente se llama análisis de
correlación simple.
Muchos son los casos que se pueden mencionar como ejemplos en los que
puede existir una relación posible entre dos variables podrían ser:
- ¿Tienden a tener mayor escolaridad
las personas con altos ingresos, en comparación con las de bajos ingresos?
- ¿Puede el éxito en el trabajo
pronosticarse a partir de las calificaciones obtenidas en los exámenes de
selección?
- ¿Entre mayor preparación se tenga
tus habilidades de liderazgo serán mayores?
Este grado o intensidad de relación entre dos variables continuas, se
resume mediante un coeficiente de correlación que se conoce como “r de Pearson”
en honor del matemático Karl Pearson (el mismo del coeficiente que mide la
asimetría). Dicha técnica es válida solamente si es posible establecer los
siguientes supuestos:
•
La relación entre las dos variables es lineal
•
Ambas variables son variables aleatorias
•
Los valores observados (muestreados) de cada variable son independientes de los
demás valores observados de esa variable
• Las distribuciones
condicionales de cada variable, dados los diferentes valores de la otra
variable, son distribuciones normales.
Para calcular el
coeficiente de Pearson se usa la siguiente fórmula:
El coeficiente de correlación así calculado presenta dos propiedades que
establecen la naturaleza de la relación entre dos variables, estas son:
•
Su signo (+ ó – ), este es igual al de la pendiente de una recta que podría
“ajustarse” a los datos si éstos se graficaran en el llamado diagrama de
dispersión y que se muestra en el ejemplo más adelante
• Su magnitud, ésta
indica qué tan cerca están de la “recta” los puntos que en el diagrama de
dispersión resultan de graficar los valores de las dos variables analizadas.
Por ejemplo, los
valores próximos a -1.00 ó +1.00 indican que los valores están bastante cerca
de la recta o sobre ella, mientras que los valores próximos a
0 sugieren mayor
dispersión dando lugar a la siguiente interpretación:
Para obtener los datos
en Excel haremos uso del siguiente archivo: