Covarianza vs correlación

Diferencia entre covarianza y correlación

La covarianza y la correlación son dos términos exactamente opuestos entre sí, ambos se utilizan en estadísticas y análisis de regresión, la covarianza nos muestra cómo las dos variables varían entre sí mientras que la correlación nos muestra la relación entre las dos variables y cómo se relacionan .

La correlación y la covarianza son dos conceptos estadísticos que se utilizan para determinar la relación entre dos variables aleatorias. La correlación define cómo un cambio en una variable afectará a la otra, mientras que la covarianza define cómo dos elementos varían juntos. ¿Confuso? Profundicemos más para comprender la diferencia entre estos términos estrechamente relacionados.

¿Qué es la covarianza?

La covarianza mide cómo se mueven dos variables entre sí y es una extensión del concepto de varianza (que indica cómo varía una sola variable). Puede tomar cualquier valor de -∞ a + ∞.

  • Cuanto mayor sea este valor, más dependiente es la relación. Un número positivo significa covarianza positiva y denota que existe una relación directa. Efectivamente, esto significa que un aumento en una variable también conduciría a un aumento correspondiente en la otra variable siempre que las demás condiciones permanezcan constantes.
  • Por otro lado, un número negativo significa covarianza negativa que denota una relación inversa entre las dos variables. Aunque la covarianza es perfecta para definir el tipo de relación, es mala para interpretar su magnitud.

¿Qué es la correlación?

La correlación es un paso por delante de la covarianza, ya que cuantifica la relación entre dos variables aleatorias. En términos simples, es una medida unitaria de cómo cambian estas variables entre sí (valor de covarianza normalizado).

  • A diferencia de la covarianza, la correlación tiene un límite superior e inferior en un rango. Solo puede tomar valores entre +1 y -1. Una correlación de +1 indica que las variables aleatorias tienen una relación directa y fuerte.
  • Por otro lado, la correlación de -1 indica que hay una fuerte relación inversa y un aumento en una variable conducirá a una disminución igual y opuesta en la otra variable. 0 indica que los dos números son independientes.

Fórmula de covarianza y correlación

Expresemos estos dos conceptos matemáticamente. Para dos variables aleatorias A y B con valores medios como Ua y Ub y desviación estándar como Sa y Sb respectivamente:

Efectivamente, la relación entre los 2 se puede definir como:

Tanto las correlaciones como la covarianza encuentran aplicación en los campos del análisis estadístico y financiero. Dado que la correlación estandariza la relación, es útil en la comparación de dos variables. Esto ayuda al analista a idear estrategias como el comercio de pares y la cobertura no solo para obtener rendimientos eficientes en la cartera, sino también para salvaguardar estos rendimientos en términos de movimientos adversos en el mercado de valores.

Infografía de correlación vs covarianza

Veamos la principal diferencia entre correlación y covarianza.

Diferencias clave

  • La covarianza es un indicador del grado en el que dos variables aleatorias cambian entre sí. La correlación, por otro lado, mide la fuerza de esta relación. El valor de correlación está limitado en la parte superior por +1 y en la parte inferior por -1. Por tanto, es un rango definido. Sin embargo, el rango de covarianza es indefinido. Puede tomar cualquier valor positivo o negativo (en teoría, el rango es de -∞ a + ∞). Puede estar seguro de que una correlación de .5 es mayor que .3 y el primer conjunto de números (con la correlación como .5) son más dependientes entre sí que el segundo conjunto (con la correlación como .3). Interpretar tal resultado sería será muy difícil a partir de los cálculos de covarianza.
  • El cambio de escala afecta la covarianza. Por ejemplo, si el valor de dos variables se multiplica por constantes similares o diferentes, esto afecta la covarianza calculada de estos dos números. Sin embargo, aplicando el mismo mecanismo de correlación, la multiplicación por constantes no cambia el resultado anterior. Esto se debe a que un cambio de escala no afecta la correlación.
  • A diferencia de la covarianza, la correlación es una medida libre de unidades de la interdependencia de dos variables. Esto facilita la comparación de los valores de correlación calculados entre 2 variables cualesquiera, independientemente de sus unidades y dimensiones.
  • La covarianza se puede calcular para solo 2 variables. La correlación, por otro lado, se puede calcular para múltiples conjuntos de números. Otro factor que hace que la correlación sea deseable para los analistas en comparación con la covarianza.

Tabla comparativa de covarianza vs correlación

BaseCovarianzaCorrelación
SentidoLa covarianza es un indicador del grado en que dos variables aleatorias son dependientes entre sí. Un número más alto denota una mayor dependencia.La correlación es un indicador de cuán fuertemente están relacionadas estas 2 variables siempre que otras condiciones sean constantes. El valor máximo es +1 que denota una relación dependiente perfecta.
RelaciónLa correlación se puede deducir de la covarianzaLa correlación proporciona una medida de covarianza en una escala estándar. Se deduce dividiendo la covarianza calculada con la desviación estándar.
ValoresEl valor de la covarianza se encuentra en el rango de -∞ y + ∞.La correlación está limitada a valores entre el rango -1 y +1.
EscalabilidadAfecta la covarianzaLa correlación no se ve afectada por un cambio en las escalas o la multiplicación por una constante.
UnidadesLa covarianza tiene una unidad definida, ya que se deduce de la multiplicación de dos números y sus unidades.La correlación es un número absoluto sin unidades entre -1 y +1 que incluye valores decimales.

Conclusión

La correlación y la covarianza están estrechamente relacionadas entre sí y, sin embargo, difieren mucho. La covarianza define el tipo de interacción, pero la correlación define no solo el tipo sino también la fuerza de esta relación. Por esta razón, la correlación se denomina a menudo el caso especial de covarianza. Sin embargo, si uno debe elegir entre los dos, la mayoría de los analistas prefieren la correlación, ya que no se ve afectada por los cambios en las dimensiones, ubicaciones y escala. Además, dado que está limitado a un rango de -1 a +1, es útil hacer comparaciones entre variables en todos los dominios. Sin embargo, una limitación importante es que ambos conceptos miden la única relación lineal.