Cómo determinar la variación de productos no estándar. Cómo calcular la varianza en Excel usando la función disp.v

Los principales indicadores generalizadores de variación en las estadísticas son las dispersiones y las desviaciones estándar.

Dispersión esto media aritmética desviaciones al cuadrado de cada valor característico del promedio general. La varianza generalmente se denomina cuadrado medio de las desviaciones y se denota por  2. Dependiendo de los datos de origen, la varianza se puede calcular utilizando la media aritmética simple o ponderada:

 varianza no ponderada (simple);

 varianza ponderada.

Desviación estándar esta es una característica generalizadora de los tamaños absolutos variaciones signos en conjunto. Se expresa en las mismas unidades de medida que el atributo (en metros, toneladas, porcentaje, hectáreas, etc.).

La desviación estándar es la raíz cuadrada de la varianza y se denota por :

 desviación estándar no ponderada;

 desviación estándar ponderada.

La desviación estándar es una medida de la confiabilidad de la media. Cuanto menor sea la desviación estándar, mejor refleja la media aritmética a toda la población representada.

El cálculo de la desviación estándar va precedido del cálculo de la varianza.

El procedimiento para calcular la varianza ponderada es el siguiente:

1) determinar la media aritmética ponderada:

2) calcular las desviaciones de las opciones del promedio:

3) eleva al cuadrado la desviación de cada opción del promedio:

4) multiplicar los cuadrados de las desviaciones por pesos (frecuencias):

5) resumir los productos resultantes:

6) la cantidad resultante se divide por la suma de los pesos:

Ejemplo 2.1

Calculemos la media aritmética ponderada:

Los valores de las desviaciones de la media y sus cuadrados se presentan en la tabla. Definamos la varianza:

La desviación estándar será igual a:

Si los datos de origen se presentan en forma de intervalo serie de distribución , primero debe determinar el valor discreto del atributo y luego aplicar el método descrito.

Ejemplo 2.2

Muestremos el cálculo de la varianza para una serie de intervalos utilizando datos sobre la distribución del área sembrada de una finca colectiva según el rendimiento del trigo.

La media aritmética es:

Calculemos la varianza:

6.3. Cálculo de la varianza mediante una fórmula basada en datos individuales.

Técnica de cálculo variaciones complejo y con grandes valores de opciones y frecuencias puede resultar engorroso. Los cálculos se pueden simplificar utilizando las propiedades de dispersión.

La dispersión tiene las siguientes propiedades.

1. Reducir o aumentar los pesos (frecuencias) de una característica variable un cierto número de veces no cambia la dispersión.

2. Disminuir o aumentar cada valor de una característica en la misma cantidad constante A no cambia la dispersión.

3. Disminuir o aumentar cada valor de una característica un cierto número de veces. k respectivamente reduce o aumenta la varianza en k 2 veces y desviación estándar  en k una vez.

4. La dispersión de una característica con respecto a un valor arbitrario es siempre mayor que la dispersión con respecto a la media aritmética por cuadrado de la diferencia entre los valores promedio y arbitrarios:

Si A 0, entonces llegamos a la siguiente igualdad:

es decir, la varianza de la característica es igual a la diferencia entre el cuadrado medio de los valores característicos y el cuadrado de la media.

Cada propiedad se puede utilizar de forma independiente o en combinación con otras al calcular la varianza.

El procedimiento para calcular la varianza es simple:

1) determinar media aritmética :

2) eleva al cuadrado la media aritmética:

3) elevar al cuadrado la desviación de cada variante de la serie:

incógnita i 2 .

4) encuentra la suma de cuadrados de las opciones:

5) dividir la suma de los cuadrados de las opciones por su número, es decir determinar el cuadrado promedio:

6) determinar la diferencia entre el cuadrado medio de la característica y el cuadrado de la media:

Ejemplo 3.1 Se dispone de los siguientes datos sobre la productividad de los trabajadores:

Hagamos los siguientes cálculos:

La dispersión en estadística se define como la desviación estándar de los valores individuales de una característica al cuadrado de la media aritmética. Un método común para calcular las desviaciones al cuadrado de las opciones del promedio y luego promediarlas.

En el análisis estadístico económico, se acostumbra evaluar la variación de una característica utilizando con mayor frecuencia la desviación estándar, es decir, la raíz cuadrada de la varianza.

(3)

Caracteriza la fluctuación absoluta de los valores de una característica variable y se expresa en las mismas unidades de medida que las opciones. En estadística, a menudo existe la necesidad de comparar la variación de diferentes características. Para tales comparaciones, se utiliza una medida relativa de variación, el coeficiente de variación.

Propiedades de dispersión:

1) si restas cualquier número de todas las opciones, la variación no cambiará;

2) si todos los valores de la opción se dividen por cualquier número b, entonces la varianza disminuirá b^2 veces, es decir

3) si calcula el cuadrado promedio de las desviaciones de cualquier número con una media aritmética desigual, entonces será mayor que la varianza. Al mismo tiempo, por un valor bien definido por cuadrado de la diferencia entre el valor medio c.

La dispersión se puede definir como la diferencia entre la media al cuadrado y la media al cuadrado.

17. Variaciones grupales e intergrupales. Regla de suma de varianza

Si una población estadística se divide en grupos o partes según la característica que se está estudiando, entonces se pueden calcular los siguientes tipos de dispersión para dicha población: grupo (privado), promedio grupal (privado) e intergrupal.

varianza total– refleja la variación de una característica debido a todas las condiciones y causas que operan en una población estadística determinada.

variación del grupo- igual al cuadrado medio de las desviaciones de los valores individuales de una característica dentro de un grupo de la media aritmética de este grupo, llamada media de grupo. Sin embargo, la media del grupo no coincide con la media general de toda la población.

La variación grupal refleja la variación de un rasgo únicamente debido a condiciones y causas que operan dentro del grupo.

Promedio de variaciones de grupo- se define como la media aritmética ponderada de las varianzas del grupo, siendo los pesos los volúmenes del grupo.

Varianza intergrupal- igual al cuadrado medio de las desviaciones de los promedios grupales del promedio general.

La dispersión intergrupal caracteriza la variación de la característica efectiva debido a la característica de agrupación.

Existe una cierta relación entre los tipos de dispersiones considerados: la dispersión total es igual a la suma de la dispersión promedio grupal e intergrupal.

Esta relación se llama regla de suma de varianzas.

18. Series dinámicas y sus componentes. Tipos de series temporales.

Fila en estadísticas- Se trata de datos digitales que muestran el cambio de un fenómeno en el tiempo o el espacio y permiten realizar una comparación estadística de los fenómenos tanto en el proceso de su desarrollo en el tiempo como en diversas formas y tipos de procesos. Gracias a esto, es posible detectar la dependencia mutua de los fenómenos.

En estadística, el proceso de desarrollo del movimiento de los fenómenos sociales a lo largo del tiempo se suele denominar dinámica. Para mostrar la dinámica se construyen series dinámicas (cronológicas, temporales), que son series de valores que varían en el tiempo de un indicador estadístico (por ejemplo, el número de condenados durante 10 años), ordenados en orden cronológico. Sus elementos constitutivos son los valores digitales de un indicador determinado y los períodos o momentos en el tiempo a los que se refieren.

La característica más importante de las series dinámicas.- su tamaño (volumen, magnitud) de un fenómeno particular logrado en un período determinado o en un momento determinado. En consecuencia, la magnitud de los términos de la serie dinámica es su nivel. Distinguir niveles inicial, medio y final de la serie dinámica. Nivel de entrada muestra el valor del primero, el final, el valor del último término de la serie. nivel intermedio representa el rango de variación cronológica promedio y se calcula dependiendo de si la serie dinámica es interválica o momentánea.

Otra característica importante de la serie dinámica.- el tiempo transcurrido desde la observación inicial hasta la final, o el número de dichas observaciones.

Existen diferentes tipos de series temporales; se pueden clasificar según los siguientes criterios.

1) Dependiendo del método de expresión de los niveles, las series dinámicas se dividen en series de indicadores absolutos y derivados (valores relativos y medios).

2) Dependiendo de cómo los niveles de la serie expresen el estado del fenómeno en determinados momentos (al inicio de mes, trimestre, año, etc.) o su valor en determinados intervalos de tiempo (por ejemplo, por día, mes, año, etc.) etc.), distinguen entre series de dinámica de momento y de intervalo, respectivamente. Las series de momentos se utilizan relativamente raramente en el trabajo analítico de los organismos encargados de hacer cumplir la ley.

En teoría estadística, la dinámica se distingue según otros criterios de clasificación: según la distancia entre niveles, con niveles iguales y niveles desiguales en el tiempo; dependiendo de la presencia de la tendencia principal del proceso en estudio: estacionaria y no estacionaria. Al analizar series de tiempo, se parte de lo siguiente; los niveles de la serie se presentan en forma de componentes:

Y t = TP + E (t)

donde TP es un componente determinista que determina la tendencia general de cambio en el tiempo o tendencia.

E (t) es un componente aleatorio que provoca fluctuaciones en los niveles.

Dispersión en las estadísticas se encuentra como los valores individuales de la característica al cuadrado de . Dependiendo de los datos iniciales, se determina mediante fórmulas de varianza simple y ponderada:

1. (para datos no agrupados) se calcula mediante la fórmula:

2. Varianza ponderada (para series de variación):

donde n es la frecuencia (repetibilidad del factor X)

Un ejemplo de cómo encontrar varianza

Esta página describe un ejemplo estándar de búsqueda de varianza; también puede consultar otros problemas para encontrarla.

Ejemplo 1. Los siguientes datos están disponibles para un grupo de 20 estudiantes por correspondencia. Es necesario construir una serie de intervalos de la distribución de la característica, calcular el valor promedio de la característica y estudiar su dispersión.

Construyamos una agrupación de intervalos. Determinemos el rango del intervalo usando la fórmula:

donde X max es el valor máximo de la característica de agrupación;
X min – valor mínimo de la característica de agrupación;
n – número de intervalos:

Aceptamos n=5. El paso es: h = (192 - 159)/ 5 = 6,6

Creemos una agrupación de intervalos.

Para más cálculos, construiremos una tabla auxiliar:

X'i es la mitad del intervalo. (por ejemplo, la mitad del intervalo 159 – 165,6 = 162,3)

Determinamos la altura promedio de los estudiantes utilizando la fórmula del promedio aritmético ponderado:

Determinemos la varianza usando la fórmula:

La fórmula de dispersión se puede transformar de la siguiente manera:

De esta fórmula se deduce que la varianza es igual a la diferencia entre el promedio de los cuadrados de las opciones y el cuadrado y el promedio.

Dispersión en series de variación. con intervalos iguales usando el método de los momentos se puede calcular de la siguiente manera usando la segunda propiedad de dispersión (dividiendo todas las opciones por el valor del intervalo). Determinando la varianza, calculado mediante el método de los momentos, utilizando la siguiente fórmula es menos laborioso:

donde i es el valor del intervalo;
A es un cero convencional, para lo cual conviene utilizar la mitad del intervalo de mayor frecuencia;
m1 es el cuadrado del momento de primer orden;
m2 - momento de segundo orden

(si en una población estadística una característica cambia de tal manera que solo hay dos opciones mutuamente excluyentes, entonces dicha variabilidad se llama alternativa) se puede calcular mediante la fórmula:

Sustituyendo q = 1- p en esta fórmula de dispersión, obtenemos:

Tipos de variación

varianza total Mide la variación de una característica en toda la población bajo la influencia de todos los factores que causan esta variación. Es igual al cuadrado medio de las desviaciones de los valores individuales de una característica x del valor medio general de x y puede definirse como varianza simple o varianza ponderada.

caracteriza la variación aleatoria, es decir Parte de la variación se debe a la influencia de factores no contabilizados y no depende del factor-atributo que forma la base del grupo. Dicha dispersión es igual al cuadrado medio de las desviaciones de los valores individuales del atributo dentro del grupo X de la media aritmética del grupo y puede calcularse como dispersión simple o como dispersión ponderada.

De este modo, medidas de varianza dentro del grupo variación de un rasgo dentro de un grupo y está determinada por la fórmula:

donde xi es el promedio del grupo;
ni es el número de unidades del grupo.

Por ejemplo, las variaciones intragrupo que es necesario determinar en la tarea de estudiar la influencia de las calificaciones de los trabajadores en el nivel de productividad laboral en un taller muestran variaciones en la producción en cada grupo causadas por todos los factores posibles (estado técnico del equipo, disponibilidad de herramientas y materiales, edad de los trabajadores, intensidad laboral, etc.), salvo diferencias en la categoría de cualificación (dentro de un grupo todos los trabajadores tienen las mismas cualificaciones).

El promedio de las varianzas dentro del grupo refleja el azar, es decir, la parte de la variación que se produjo bajo la influencia de todos los demás factores, con excepción del factor de agrupación. Se calcula mediante la fórmula:

Caracteriza la variación sistemática de la característica resultante, que se debe a la influencia del factor-signo que forma la base del grupo. Es igual al cuadrado medio de las desviaciones de las medias grupales de la media general. La varianza entre grupos se calcula mediante la fórmula:

La regla para sumar varianza en las estadísticas.

De acuerdo a regla de sumar variaciones la varianza total es igual a la suma del promedio de las varianzas dentro del grupo y entre grupos:

El significado de esta regla. es que la varianza total que surge bajo la influencia de todos los factores es igual a la suma de las varianzas que surgen bajo la influencia de todos los demás factores y la varianza que surge debido al factor de agrupación.

Usando la fórmula para sumar varianzas, puede determinar la tercera varianza desconocida a partir de dos varianzas conocidas y también juzgar la fuerza de la influencia de la característica de agrupación.

Propiedades de dispersión

1. Si todos los valores de una característica se reducen (aumentan) en la misma cantidad constante, entonces la dispersión no cambiará.
2. Si todos los valores de una característica se reducen (aumentan) el mismo número de veces n, entonces la varianza disminuirá (aumentará) correspondientemente n^2 veces.

Tipos de dispersiones:

varianza total caracteriza la variación de una característica de toda la población bajo la influencia de todos aquellos factores que provocaron esta variación. Este valor está determinado por la fórmula.

donde es la media aritmética general de toda la población objeto de estudio.

Varianza promedio dentro del grupo indica una variación aleatoria que puede surgir bajo la influencia de cualquier factor no contabilizado y que no depende del factor-atributo que forma la base de la agrupación. Esta varianza se calcula de la siguiente manera: primero, se calculan las varianzas para grupos individuales (), luego se calcula la varianza promedio dentro del grupo:

donde n i es el número de unidades en el grupo

Varianza intergrupal(varianza de las medias grupales) caracteriza la variación sistemática, es decir diferencias en el valor de la característica estudiada que surgen bajo la influencia del signo del factor, que es la base de la agrupación.

¿Dónde está el valor promedio para un grupo separado?

Los tres tipos de varianza están relacionados entre sí: la varianza total es igual a la suma de la varianza promedio dentro del grupo y la varianza entre grupos:

Propiedades:

25 Medidas relativas de variación

Coeficiente de oscilación

Desviación lineal relativa

Coeficiente de variación

Coef. Osc. oh refleja la fluctuación relativa de los valores extremos de una característica alrededor del promedio. Rel. lin. apagado. caracteriza la proporción del valor promedio del signo de desviaciones absolutas del valor promedio. Coef. La variación es la medida de variabilidad más común utilizada para evaluar la tipicidad de los promedios.

En estadística, las poblaciones con un coeficiente de variación superior al 30-35% se consideran heterogéneas.

    Regularidad de las series de distribución. Momentos de distribución.

Indicadores de forma de distribución. En las series de variación existe una conexión entre frecuencias y valores de una característica variable: con un aumento en la característica, el valor de la frecuencia primero aumenta hasta un cierto límite y luego disminuye. Estos cambios se denominan

patrones de distribución.

La forma de la distribución se estudia utilizando indicadores de asimetría y curtosis. Al calcular estos indicadores, se utilizan momentos de distribución.

El momento de k-ésimo orden es el promedio de los k-ésimos grados de desviación de los valores variantes de una característica de algún valor constante. El orden del momento está determinado por el valor de k. Al analizar series de variación, uno se limita a calcular los momentos de los primeros cuatro órdenes. Al calcular momentos, se pueden utilizar frecuencias o frecuencias como pesos. Dependiendo de la elección del valor constante, se distinguen los momentos inicial, condicional y central.

Indicadores de forma de distribución: Asimetría .

(As) indicador que caracteriza el grado de asimetría de la distribución. Por lo tanto, con asimetría negativa (del lado izquierdo) .

. Con asimetría positiva (del lado derecho)

,

Los momentos centrales se pueden utilizar para calcular la asimetría. Entonces: 3 donde µ

- – momento central de tercer orden. curtosis (E ) A

,

caracteriza la pendiente de la gráfica de la función en comparación con la distribución normal con la misma intensidad de variación:

    donde μ 4 es el momento central de cuarto orden.

Ley de distribución normal

Expectativa - desviación estándar

La distribución normal es simétrica y se caracteriza por la siguiente relación: Xav=Me=Mo

La curtosis de una distribución normal es 3 y el coeficiente de asimetría es 0.

La curva de distribución normal es un polígono (línea recta simétrica en forma de campana)

    Tipos de dispersiones. La regla para sumar variaciones.

La esencia del coeficiente empírico de determinación.

    Si la población original se divide en grupos según alguna característica significativa, entonces se calculan los siguientes tipos de varianzas:

Varianza total de la población original:

    donde es el valor promedio general de la población original; f es la frecuencia de la población original. La dispersión total caracteriza la desviación de los valores individuales de una característica del valor promedio general de la población original.

Variaciones dentro del grupo:

    donde j es el número del grupo; es el valor promedio en cada j-ésimo grupo; Las variaciones dentro del grupo caracterizan la desviación del valor individual de un rasgo en cada grupo del valor promedio del grupo. De todas las varianzas dentro del grupo, el promedio se calcula usando la fórmula:, donde es el número de unidades en cada j-ésimo grupo.

Varianza intergrupal:

La dispersión intergrupal caracteriza la desviación de los promedios grupales del promedio general de la población original. Regla de suma de varianza

es que la varianza total de la población original debe ser igual a la suma de las varianzas entre grupos y el promedio de las varianzas dentro del grupo: Coeficiente empírico de determinación.

    muestra la proporción de variación en la característica estudiada debido a la variación en la característica de agrupación y se calcula mediante la fórmula:

Método de contar desde un cero condicional (método de momentos) para calcular el valor promedio y la varianza

El cálculo de la dispersión por el método de los momentos se basa en el uso de la fórmula y las propiedades de dispersión 3 y 4.

(3. Si todos los valores del atributo (opciones) aumentan (disminuyen) en algún número constante A, entonces la varianza de la nueva población no cambiará.

4. Si todos los valores del atributo (opciones) se incrementan (multiplican) K veces, donde K es un número constante, entonces la varianza de la nueva población aumentará (disminuirá) K 2 veces).

Obtenemos una fórmula para calcular la dispersión en series de variación con intervalos iguales utilizando el método de los momentos:

A - cero condicional, igual a la opción con la frecuencia máxima (la mitad del intervalo con la frecuencia máxima)

    El cálculo del valor medio por el método de los momentos también se basa en el uso de las propiedades del promedio.

Una observación de muestra es una observación en la que no se examinan y estudian todas las unidades de la población original, sino solo una parte de las unidades, mientras que el resultado del examen de una parte de la población se aplica a toda la población original. La población de la cual se seleccionan las unidades para su posterior examen y estudio se llama general y todos los indicadores que caracterizan esta totalidad se llaman general.

Los posibles límites de desviaciones del valor promedio muestral del valor promedio general se denominan error de muestreo.

El conjunto de unidades seleccionadas se llama selectivo y todos los indicadores que caracterizan esta totalidad se llaman selectivo.

La investigación de muestras incluye las siguientes etapas:

Características del objeto de estudio (fenómenos económicos de masas). Si la población es pequeña, no se recomienda el muestreo; es necesario un estudio exhaustivo;

Cálculo del tamaño de la muestra. Es importante determinar el volumen óptimo que permitirá que el error de muestreo esté dentro del rango aceptable al menor costo;

Selección de unidades de observación teniendo en cuenta los requisitos de aleatoriedad y proporcionalidad.

Evidencia de representatividad basada en una estimación del error de muestreo. Para una muestra aleatoria, el error se calcula mediante fórmulas. Para la muestra objetivo, la representatividad se evalúa mediante métodos cualitativos (comparación, experimento);

Análisis de la población muestral. Si la muestra generada cumple con los requisitos de representatividad, entonces se analiza mediante indicadores analíticos (promedio, relativo, etc.)

Según la encuesta por muestreo, los depositantes se agruparon según el tamaño de su depósito en el Sberbank de la ciudad:

Definir:

1) alcance de la variación;

2) tamaño promedio de los depósitos;

3) desviación lineal promedio;

4) dispersión;

5) desviación estándar;

6) coeficiente de variación de las cotizaciones.

Solución:

Esta serie de distribución contiene intervalos abiertos. En tales series, se supone convencionalmente que el valor del intervalo del primer grupo es igual al valor del intervalo del siguiente, y que el valor del intervalo del último grupo es igual al valor del intervalo del el anterior.

El valor del intervalo del segundo grupo es igual a 200, por lo tanto, el valor del primer grupo también es igual a 200. El valor del intervalo del penúltimo grupo es igual a 200, lo que significa que el último intervalo también tiene un valor de 200.

1) Definamos el rango de variación como la diferencia entre el valor mayor y menor del atributo:

El rango de variación en el tamaño del depósito es de 1000 rublos.

2) El tamaño promedio de la contribución se determinará utilizando la fórmula del promedio aritmético ponderado.

Primero determinemos el valor discreto del atributo en cada intervalo. Para ello, utilizando la fórmula de la media aritmética simple, encontramos los puntos medios de los intervalos.

El valor medio del primer intervalo será:

el segundo - 500, etc.

Ingresemos los resultados del cálculo en la tabla:

Monto del depósito, frote.Número de depositantes, fMitad del intervalo, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

El depósito medio en el Sberbank de la ciudad será de 780 rublos:

3) La desviación lineal promedio es la media aritmética de las desviaciones absolutas de los valores individuales de una característica del promedio general:

El procedimiento para calcular la desviación lineal promedio en la serie de distribución de intervalos es el siguiente:

1. Se calcula la media aritmética ponderada, como se indica en el apartado 2).

2. Las desviaciones absolutas de la media se determinan:

3. Las desviaciones resultantes se multiplican por frecuencias:

4. Calcula la suma de las desviaciones ponderadas sin tener en cuenta el signo:

5. La suma de las desviaciones ponderadas se divide por la suma de frecuencias:

Es conveniente utilizar la tabla de datos de cálculo:

Monto del depósito, frote.Número de depositantes, fMitad del intervalo, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

La desviación lineal promedio del tamaño del depósito de los clientes de Sberbank es de 203,2 rublos.

4) La dispersión es la media aritmética de las desviaciones al cuadrado de cada valor de atributo de la media aritmética.

El cálculo de la varianza en una serie de distribución de intervalos se realiza mediante la fórmula:

El procedimiento para calcular la varianza en este caso es el siguiente:

1. Determine la media aritmética ponderada, como se muestra en el párrafo 2).

2. Encuentre desviaciones del promedio:

3. Eleva al cuadrado la desviación de cada opción del promedio:

4. Multiplicar los cuadrados de las desviaciones por los pesos (frecuencias):

5. Resuma los productos resultantes:

6. La cantidad resultante se divide por la suma de los pesos (frecuencias):

Pongamos los cálculos en una tabla:

Monto del depósito, frote.Número de depositantes, fMitad del intervalo, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000


¿Te gustó el artículo? Compártelo
Arriba