Regresión de mínimos cuadrados

Definición del método de regresión por mínimos cuadrados

Un método de regresión por mínimos cuadrados es una forma de análisis de regresión que establece la relación entre la variable dependiente e independiente junto con una línea lineal. Esta línea se conoce como la "línea de mejor ajuste".

El análisis de regresión es un método estadístico con la ayuda del cual se pueden estimar o predecir los valores desconocidos de una variable a partir de los valores conocidos de otra variable. La variable que se utiliza para predecir la variable de interés se llama variable independiente o explicativa y la variable que se predice se llama variable dependiente o explicada.

Consideremos dos variables x e y. Estos se trazan en un gráfico con valores de x en el eje x, valores de y en el eje y. Estos valores están representados por los puntos en el siguiente gráfico. Se traza una línea recta a través de los puntos, conocida como la línea de mejor ajuste.

El objetivo de la regresión por mínimos cuadrados es asegurar que la línea trazada a través del conjunto de valores proporcionados establezca la relación más cercana entre los valores.

Fórmula de regresión de mínimos cuadrados

La línea de regresión bajo el método de mínimos cuadrados se calcula utilizando la siguiente fórmula:

ŷ = a + bx

Dónde,

  • ŷ = variable dependiente
  • x = variable independiente
  • a = intersección con el eje y
  • b = pendiente de la recta

La pendiente de la línea b se calcula usando la siguiente fórmula:

O

Intersección en Y, 'a' se calcula usando la siguiente fórmula:

Línea de mejor ajuste en la regresión de mínimos cuadrados

La línea de mejor ajuste es una línea recta trazada a través de una dispersión de puntos de datos que representa mejor la relación entre ellos.

Consideremos el siguiente gráfico en el que se traza un conjunto de datos a lo largo de los ejes xey. Estos puntos de datos se representan mediante puntos azules. Se trazan tres líneas a través de estos puntos: una verde, una roja y una azul. La línea verde pasa por un solo punto y la línea roja pasa por tres puntos de datos. Sin embargo, la línea azul pasa por cuatro puntos de datos y la distancia entre los puntos residuales y la línea azul es mínima en comparación con las otras dos líneas.

En el gráfico anterior, la línea azul representa la línea de mejor ajuste ya que se encuentra más cerca de todos los valores y la distancia entre los puntos fuera de la línea a la línea es mínima (es decir, la distancia entre los residuos a la línea de mejor ajuste - también conocidas como sumas de cuadrados de residuos). En las otras dos líneas, la naranja y la verde, la distancia entre los residuos y las líneas es mayor en comparación con la línea azul.

El método de mínimos cuadrados proporciona la relación más cercana entre las variables dependientes e independientes al minimizar la distancia entre los residuos y la línea de mejor ajuste, es decir, la suma de los cuadrados de los residuos es mínima bajo este enfoque. De ahí el término "mínimos cuadrados".

Ejemplos de línea de regresión de mínimos cuadrados

Apliquemos estas fórmulas en la siguiente pregunta:

Puede descargar esta plantilla de Excel de regresión de mínimos cuadrados aquí - Plantilla de Excel de regresión de mínimos cuadrados

Ejemplo 1

Los detalles relacionados con la experiencia de los técnicos en una empresa (en varios años) y su calificación de desempeño se proporcionan en la siguiente tabla. Con estos valores, calcule la calificación de desempeño de un técnico con 20 años de experiencia.

Solución -

Para calcular los mínimos cuadrados primero calcularemos la intersección con el eje Y (a) y la pendiente de una línea (b) de la siguiente manera:

La pendiente de la recta (b)

  • b = 6727 - [(80 * 648) / 8] / 1018 - [(80) 2/8]
  • = 247/218
  • = 1,13

Intersección en Y (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

La línea de regresión se calcula de la siguiente manera:

Sustituyendo 20 por el valor de x en la fórmula,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

La calificación de desempeño para un técnico con 20 años de experiencia se estima en 92,3.

Ejemplo # 2

Ecuación de regresión de mínimos cuadrados con Excel

La ecuación de regresión de mínimos cuadrados se puede calcular usando Excel mediante los siguientes pasos:

  • Insertar tabla de datos en Excel.

  • Inserte un gráfico de dispersión utilizando los puntos de datos.

  • Inserte una línea de tendencia dentro del gráfico de dispersión.

  • En las opciones de la línea de tendencia: seleccione la línea de tendencia lineal y seleccione Mostrar ecuación en el gráfico.

  • La ecuación de regresión de mínimos cuadrados para el conjunto dado de datos de Excel se muestra en el gráfico.

Por lo tanto, se calcula la ecuación de regresión de mínimos cuadrados para el conjunto dado de datos de Excel. Utilizando la ecuación, se pueden realizar predicciones y análisis de tendencias. Las herramientas de Excel también proporcionan cálculos de regresión detallados.

Ventajas

  • El método de análisis de regresión de mínimos cuadrados es el más adecuado para modelos de predicción y análisis de tendencias. Se utiliza mejor en los campos de la economía, las finanzas y los mercados de valores, donde el valor de cualquier variable futura se predice con la ayuda de las variables existentes y la relación entre las mismas.
  • El método de mínimos cuadrados proporciona la relación más cercana entre las variables. La diferencia entre las sumas de cuadrados de los residuos a la línea de mejor ajuste es mínima con este método.
  • El mecanismo de cálculo es simple y fácil de aplicar.

Desventajas

  • El método de mínimos cuadrados se basa en establecer la relación más cercana entre un conjunto de variables dado. El mecanismo de cálculo es sensible a los datos y, en caso de valores atípicos (datos excepcionales), los resultados pueden tender a afectar de manera importante.
  • Este tipo de cálculo es el más adecuado para modelos lineales. Para las ecuaciones no lineales, se aplican mecanismos de cálculo más exhaustivos.

Conclusión

El método de mínimos cuadrados es uno de los métodos más utilizados para modelos de predicción y análisis de tendencias. Cuando se calcula correctamente, ofrece los mejores resultados.