Coeficiente de correlación de Pearson

Definición del coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson, también conocido como prueba estadística R de Pearson, mide la fuerza entre las diferentes variables y sus relaciones. Siempre que se realice una prueba estadística entre las dos variables, siempre es una buena idea que la persona que realiza el análisis calcule el valor del coeficiente de correlación para saber qué tan fuerte es la relación entre las dos variables.

El coeficiente de correlación de Pearson devuelve un valor entre -1 y 1. La interpretación del coeficiente de correlación es la siguiente:

  • Si el coeficiente de correlación es -1, indica una fuerte relación negativa. Implica una perfecta relación negativa entre las variables.
  • Si el coeficiente de correlación es 0, indica que no hay relación.
  • Si el coeficiente de correlación es 1, indica una fuerte relación positiva. Implica una perfecta relación positiva entre las variables.

Un valor absoluto más alto del coeficiente de correlación indica una relación más fuerte entre las variables. Por tanto, un coeficiente de correlación de 0,78 indica una correlación positiva más fuerte en comparación con un valor de, por ejemplo, 0,36. De manera similar, un coeficiente de correlación de -0,87 indica una correlación negativa más fuerte en comparación con un coeficiente de correlación de, por ejemplo, -0,40.

En otras palabras, si el valor está en el rango positivo, entonces muestra que la relación entre las variables está correlacionada positivamente, y ambos valores disminuyen o aumentan juntos. Por otro lado, si el valor está en el rango negativo, entonces muestra que la relación entre las variables está correlacionada negativamente, y ambos valores irán en la dirección opuesta.

Fórmula del coeficiente de correlación de Pearson

La fórmula del coeficiente de correlación de Pearson es la siguiente,

Dónde,

  • r = coeficiente de Pearson
  • n = número de pares del stock
  • ∑xy = suma de productos de las existencias emparejadas
  • ∑x = suma de las puntuaciones x
  • ∑y = suma de las puntuaciones y
  • ∑x2 = suma de las puntuaciones x al cuadrado
  • ∑y2 = suma de las puntuaciones y al cuadrado

Explicación

Paso 1: averigüe el número de pares de variables, que se denota con n. Supongamos que x consta de 3 variables: 6, 8, 10. Supongamos que y consta de 3 variables correspondientes 12, 10, 20.

Paso 2: enumere las variables en dos columnas.

Paso 3: averigua el producto de xey en la tercera columna.

Paso 4: averigüe la suma de los valores de todas las variables xy todas las variables y. Escriba los resultados al final de la 1ª y 2ª columna. Escribe la suma de x * y en la tercera columna.

Paso 5: averigüe x2 e y2 en las columnas 4 y 5 y su suma en la parte inferior de las columnas.

Paso 6: Inserta los valores encontrados arriba en la fórmula y resuélvela.

r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)

= 0,7559

Ejemplo de coeficiente de correlación de Pearson R

Puede descargar esta plantilla de Excel del coeficiente de correlación de Pearson aquí - Plantilla de Excel del coeficiente de correlación de Pearson

Ejemplo 1

En este ejemplo, con la ayuda de los siguientes detalles en la tabla de las 6 personas que tienen una edad diferente y diferentes pesos que se dan a continuación para el cálculo del valor de Pearson R

Solución:

Para el cálculo del coeficiente de correlación de Pearson, primero calcularemos los siguientes valores,

Aquí el número total de personas es 6 entonces, n = 6

Ahora el cálculo del Pearson R es el siguiente,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622-82618) / (√ [43680-40804] * [170190- 167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Por tanto, el valor del coeficiente de correlación de Pearson es 0,35

Ejemplo # 2

Hay 2 acciones: A y B. Los precios de sus acciones en días particulares son los siguientes:

Descubra el coeficiente de correlación de Pearson a partir de los datos anteriores.

Solución:

Primero, calcularemos los siguientes valores.

El cálculo del coeficiente de Pearson es el siguiente,

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0.5
  • = -0,9088

Por tanto, el coeficiente de correlación de Pearson entre las dos acciones es -0,9088.

Ventajas

  • Ayuda a saber qué tan fuerte es la relación entre las dos variables. No solo la presencia o ausencia de la correlación entre las dos variables se indica mediante el coeficiente de correlación de Pearson, sino que también determina el grado exacto en que esas variables están correlacionadas.
  • Con este método, se puede determinar la dirección de la correlación, es decir, si la correlación entre dos variables es negativa o positiva.

Desventajas

  • El coeficiente de correlación de Pearson R no es suficiente para establecer la diferencia entre las variables dependientes y las independientes, ya que el coeficiente de correlación entre las variables es simétrico. Por ejemplo, si una persona está tratando de conocer la correlación entre el estrés alto y la presión arterial, entonces se puede encontrar el valor alto de la correlación que muestra que el estrés alto causa la presión arterial. Ahora, si se cambia la variable, el resultado, en ese caso, también será el mismo, lo que muestra que el estrés es causado por la presión arterial, lo que no tiene sentido. Por lo tanto, el investigador debe conocer los datos que utiliza para realizar el análisis.
  • Con este método no se puede obtener la información sobre la pendiente de la línea, ya que solo indica si existe alguna relación entre las dos variables o no.
  • Es probable que el coeficiente de correlación de Pearson se malinterprete, especialmente en el caso de datos homogéneos.
  • En comparación con los otros métodos de cálculo, este método requiere mucho tiempo para llegar a los resultados.

Puntos importantes

  • Los valores pueden ir desde el valor +1 hasta el valor -1, donde el +1 indica la relación positiva perfecta entre las variables consideradas, el -1 indica la relación negativa perfecta entre las variables consideradas y un valor 0 indica que no existe relación existe entre las variables consideradas.
  • Es independiente de la unidad de medida de las variables. Por ejemplo, si la unidad de medida de una variable está en años mientras que la unidad de medida de la segunda variable está en kilogramos, incluso entonces, el valor de este coeficiente no cambia.
  • El coeficiente de correlación entre las variables es simétrico, lo que significa que el valor del coeficiente de correlación entre Y y X o X e Y seguirá siendo el mismo.

Conclusión

El coeficiente de correlación de Pearson es el tipo de coeficiente de correlación que representa la relación entre las dos variables que se miden en el mismo intervalo o en la misma escala de razón. Mide la fuerza de la relación entre las dos variables continuas.

No solo establece la presencia o ausencia de correlación entre las dos variables, sino que también determina el grado exacto en que esas variables están correlacionadas. Es independiente de la unidad de medida de las variables donde los valores del coeficiente de correlación pueden oscilar entre el valor +1 y el valor -1. Sin embargo, no es suficiente decir la diferencia entre las variables dependientes y las independientes.