Fórmula de valores atípicos

La fórmula de valores atípicos proporciona una herramienta gráfica para calcular los datos que se encuentran fuera del conjunto de distribución dado, que puede ser el lado interno o externo, según las variables.

¿Qué es la fórmula de valores atípicos?

Un valor atípico es el punto de datos de la muestra o observación dada o en una distribución que debe quedar fuera del patrón general. Una regla de uso común que dice que un punto de datos se considerará un valor atípico si tiene más de 1,5 IQR por debajo del primer cuartil o por encima del tercer cuartil.

Dicho de otra manera, los valores atípicos bajos estarán por debajo de Q1-1.5 IQR y los valores atípicos altos estarán debajo de Q3 + 1.5IQR

Es necesario calcular la mediana, los cuartiles que incluyen IQR, Q1 y Q3.

La fórmula de valores atípicos se representa de la siguiente manera,

La fórmula para Q1 = ¼ (n + 1) th término La fórmula para Q3 = ¾ (n + 1) th término La fórmula para Q2 = Q3 - Q1

Cálculo paso a paso de valores atípicos

Se deben seguir los pasos a continuación para calcular el valor atípico.

  • Paso 1: Primero calcule los cuartiles, es decir, Q1, Q2 e intercuartil
  • Paso 2: ahora calcula el valor Q2 * 1.5
  • Paso 3: Ahora reste el valor Q1 del valor calculado en el Paso 2
  • Paso 4: Aquí agregue Q3 con el valor calculado en el paso2
  • Paso 5: Cree el rango de los valores calculados en Step3 y Step4
  • Paso 6: Organice los datos en orden ascendente
  • Paso 7: compruebe si hay valores por debajo o por encima del rango creado en el Paso 5

Ejemplo

Considere un conjunto de datos de los siguientes números: 10, 2, 4, 7, 8, 5, 11, 3, 12. Debe calcular todos los valores atípicos.

Solución:

Primero, necesitamos ordenar los datos en orden ascendente para encontrar la mediana que será Q2 para nosotros.

2, 3, 4, 5, 7, 8, 10, 11, 12

Ahora, dado que el número de observaciones es impar, que es 9, la mediana estaría en una quinta posición, que es 7 y lo mismo será Q2 para este ejemplo.

Por lo tanto, el cálculo de Q1 es el siguiente:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 será - 

Q1 = 2.5 término

Esto significa que Q1 es el promedio de la 2da y 3ra posición de las observaciones que es 3 y 4 aquí y un promedio de las mismas es (3 + 4) / 2 = 3.5

Por lo tanto, el cálculo de Q3 es el siguiente:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 será - 

Q3 = 7.5 término

Esto significa que Q3 es el promedio de la séptima y octava posición de las observaciones, que es 10 y 11 aquí y un promedio de las mismas es (10 + 11) / 2 = 10.5

Ahora, los valores atípicos bajos estarán por debajo de Q1-1.5IQR y los valores atípicos altos estarán debajo de Q3 + 1.5IQR

Entonces, los valores son 3.5 - (1.5 * 7) = -7 y el rango superior es 10.5 + (1.5 * 7) = 110.25.

Dado que no hay observaciones por encima o por debajo de 110,25 y -7, no tenemos valores atípicos en esta muestra.

Ejemplo de fórmula de valor atípico en Excel (con plantilla de Excel)

Puede descargar esta plantilla de Excel de fórmula de valor atípico aquí - Plantilla de Excel de fórmula de valor atípico

Las clases de coaching creativo están considerando recompensar a los estudiantes que se encuentran en el 25% superior. Sin embargo, quieren evitar valores atípicos. Los datos son para los 25 estudiantes. Utilice la ecuación de valores atípicos para determinar si hay un valor atípico.

Solución:

A continuación se proporcionan datos para calcular el valor atípico

El número de observaciones aquí es 25 y nuestro primer paso sería convertir los datos sin procesar anteriores en orden ascendente.

La mediana será -

El valor mediano = ½ (n + 1)

= ½ = ½ (26)

= 13º término

El Q2 ​​o la mediana es 68,00

Que es el 50% de la población.

Q1 será -

Q1 = ¼ (n + 1) th término

= ¼ (25 + 1)

= ¼ (26)

= 6.5th término que es equivalente al séptimo término

El Q1 es 56,00, que es el 25% inferior

Q3 será -

Finalmente, Q3 = ¾ (n + 1) th término

= ¾ (26)

= 19,50 término

Aquí se debe tomar el promedio que es de los términos 19 y 20 que son 77 y 77 y el promedio de los mismos es (77 + 77) / 2 = 77.00

 El tercer trimestre es 77, que es el 25% superior

Bajo alcance

Ahora, los valores atípicos bajos estarán por debajo de Q1-1.5IQR y los valores atípicos altos estarán debajo de Q3 + 1.5IQR

Alto rango -

Entonces, los valores son 56 - (1.5 * 68) = -46 y el rango superior es 77 + (1.5 * 68) = 179.

No hay valores atípicos.

Relevancia y usos

Es muy importante conocer la fórmula de valores atípicos, ya que podría haber datos que se desviarían por dicho valor. Tome un ejemplo de las observaciones 2, 4, 6, 101 y ahora, si alguien toma un promedio de estos valores, será 28,25, pero el 75% de las observaciones se encuentran por debajo de 7 y, por lo tanto, sería una decisión incorrecta con respecto a las observaciones de esta muestra.

Se puede notar aquí que 101 parece claramente delinear y si esto se elimina, entonces el promedio sería 4, lo que dice acerca de los valores u observaciones que se encuentran dentro del rango de 4. Por lo tanto, es muy importante realizar este cálculo para evitar cualquier uso indebido que conduzca a la información de los datos. Estos son ampliamente utilizados por estadísticos de todo el mundo siempre que realizan investigaciones.