2.2.2 Medidas de tendencia central, de dispersión y de concentración

MEDIDAS DE TENDENCIAL A PARTIR DE DATOS NO AGRUPADOS: LA MEDIA, LA MEDIANA, LA MODA, LA MEDIA PONDERADA, LA GEOMÉTRICA
     Las medidas de tendencia central son también frecuentemente usadas para comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido por un grupo de vendedores de una zona comparado con el promedio de ventas otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de una sucursal, comparado con el promedio de reclamos de otra sucursal.
Otras características generales de las medidas de tendencia central son las siguientes:
  •     Permiten apreciar qué tanto se parecen lo grupos entre sí.
  •     Son valores que se calculan para un grupo de datos y que se utiliza para describirlos de alguna manera
  •       Normalmente se desea que el valor sea representativo de todos los valores incluidos en el grupo.
  •    Es el valor más representativo o típico de un grupo de datos, no es el valor más pequeño o el más grande, sino un valor que está en algún punto intermedio del grupo, más exactamente,     se acerca a estar al centro de todos los valores, por ello se les llama medidas de tendencia central.
  •    Se utilizan como mecanismo para resumir una característica de un grupo de datos en particular.         
  •   También para comparar un grupo de datos contra otro. 
            El cálculo de las medidas de tendencia central se hace mediante fórmulas, las cuales cambian según como se encuentren los datos del grupo con el que se va a trabajar, esto es si están como Datos no agrupados o como Datos agrupados (Distribuciones de frecuencias).
Un campo fundamental de la estadística es el de las llamadas medidas de centralización y de dispersión, que son las que se usan para resumir o describir una colección más o menos numerosa de datos numéricos. En inglés las medidas de centralización se denominan averages e incluyen lo que en castellano llamamos media, mediana y moda, a las que en conjunto suele denominarse «promedios»  (Tapia Granados 2001).
Las medidas de tendencia central que se van a tratar en esta unidad son:
  •                  Media Aritmética
  •                  Mediana
  •                 Moda
  •                  Media Geométrica
  •                  Media Armónica
                         Media aritmética
 La media es un concepto estadístico básico que representa en un valor las características que presenta una variable de un conjunto de datos, y sólo puede usarse con variables cuantitativas. La media puede considerarse un concepto base para la comprensión de variable aleatoria y sus distribuciones, ya que la distribución se caracteriza principalmente por las medidas de tendencia central y de dispersión, siendo frecuentemente la media uno de los parámetros de las distribuciones. (Estrella 2016).
La media aritmética, o promedio aritmético, es la suma de los valores del grupo de datos dividida entre la cantidad de valores. Su fórmula se puede describir de la siguiente manera:

                          MEDIANA
   Es el valor del elemento central del conjunto. Para encontrar la mediana, primero arreglar los valores del conjunto de acuerdo a su magnitud; es decir, arreglar los valores del más pequeño al más grande o del más grande al más pequeño y después localizar el valor central, es decir, el número de valores sobre la mediana es el mismo que el número de valores debajo de la mediana. Si el número de valores en un conjunto de datos no agrupados es par, no hay mediana verdadera.

                                              MODA
También llamada modo o promedio típico de un conjunto de valores; la moda es el valor el cual ocurre más frecuentemente en el conjunto. Si un valor es seleccionado al azar del conjunto dado, un valor modal es el valor más probable a ser seleccionado. Así, la moda es generalmente considerada como el valor más típico en una serie de datos la cual es llamada, por esa razón, UNIMODAL.
Un conjunto pequeño de datos en el que no se repiten valores medidos carece de moda. Cuando dos valores no adyacentes son casi iguales en cuanto a frecuencias máximas asociadas con ellos, la distribución se llama BIMODAL, aquéllas con varias modas se llaman multimodales.

                           En el presente ejemplo existe una moda Unimodal  la cual es 10, ya que dentro de las variables el número que se repite es el 10.
 R// La Moda de los minutos de atraso al examen de matemáticas de los estudiantes de primer nivel de economía de la Universidad Técnica de Machala es 10.
                              MEDIA GEOMÉTRICA
La media geométrica G, de un conjunto de valores es la raíz n-ésima del producto de los valores de dicho conjunto: Si hay dos valores, la raíz cuadrada del producto de estos dos; si son tres, es la raíz cúbica del producto de los tres valores. La fórmula general es:

      3.3. COMPARACIÓN ENTRE MEDIA, MEDIANA Y MODA
  • Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
  • En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la mediana está hacia la derecha de la moda y la media más a la derecha. Es decir Mo < Me < x.
  • En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir, x < Me < Mo.
  • Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor medida de posición, debido a que está siempre entre la media y la moda. La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media.
  • La selección de la media, la mediana o la moda, depende de la aplicación. Por ejemplo, se habla del salario promedio (media); el precio mediano de una casa nueva.
3.4. MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS
Los estudios estadísticos permiten hacer inferencias de una característica de una población a partir de la información contenida en una muestra. Los métodos numéricos que describen a los conjuntos de observaciones tienen como objetivo dar una imagen mental de la distribución de frecuencias.
Una vez localizado el centro de la distribución de un conjunto de datos, lo que procede es buscar una medida de dispersión de los datos.
La dispersión o variación es una característica importante de un conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos.
Existen diversas medidas de dispersión, algunas de ellas son:
            • Rango
            • Desviación estándar
            • Varianza
        A continuación, se explican cada una de ellas.
                 RANGO: El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos. Hay 2 maneras de expresar ésta medida:
  •   La diferencia entre los valores mayores y menor.   
  •  Los valores mayor y menor del grupo. 
  •          DESVIACION ESTANDAR: La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
                      VARIANZA: Encontramos varianza, que es como la mayor parte de los textos científicos en castellano se refieren a la media aritmética de los cuadrados de las desviaciones de cada valor respecto de la media aritmética de los datos (por lo que a veces también se denomina desviación cuadrática media). La desviación estándar es la raíz cuadrada de la varianza. En algunos textos en castellano se ve variancia en vez de varianza, pero esta grafía se usa muy poco, pese a ser la recomendada por la Real Academia.
      La varianza es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética, es decir, es el promedio de las desviaciones de la media elevadas al cuadrado.

3.5. MEDIDAS DE TENDENCIA CENTRAL CON DATOS AGRUPADOS.

                            MEDIA ARITMÉTICA
                    Es una medida de localización central.
                     Datos agrupados
Los datos obtenidos normalmente se organizan en distribución de frecuencias. Es el producto de cada valor diferente por el número de veces que ha ocurrido y sumando después los productos así obtenidos. (Tapia Granados, La estadística y el castellano. La terminología estadística en la nueva edición del Diccionario de uso 2001) Su fórmula es:

                                        MEDIANA
         Es el valor que queda en la parte central de un grupo de observaciones arregladas en orden de magnitud.
        Datos agrupados
Cuando los datos se han organizado en una distribución de frecuencias, la mediana (MD) es el conjunto de n observaciones que se determina mediante la fórmula:

                 MODA
Valor o clase que tiene la mayor frecuencia en un conjunto de observaciones. La moda puede no existir o no ser única en caso de que exista. Una distribución con moda única se dice unimodal. Si los datos tienen exactamente dos modas, se dice que son datos bimodales; si tienen más de dos modas, son multimodales.
Datos agrupados
La moda puede deducirse de una distribución de frecuencias o de un histograma a partir de la siguiente fórmula:

                                  LA MEDIA GEOMÉTRICA
      La media geométrica G, de un conjunto de valores es la raíz n-ésima del producto de los valores de dicho conjunto: Si hay dos valores, la raíz cuadrada del producto de estos dos; si son tres, es la raíz cúbica del producto de los tres valores. La fórmula general es:

3.6. MEDIDAS DE DISPERSIÓN DE DATOS AGRUPADOS
                                        Rango
                            El rango de un grupo de números es la diferencia entre el número mayor y el menor del grupo.

                                        Varianza
                             De una distribución de frecuencia la varianza puede ser obtenida de la fórmula.

                                       Desviación Estándar
                              La desviación estándar se define como:

                   Coeficiente de variación
La variación real o dispersión determinada a partir de la desviación estándar  u otra medida de dispersión, es llamada la dispersión absoluta.
Si la dispersión absoluta es la desviación estándar  el promedio, la dispersión relativa se llama coeficiente de variación o coeficiente de dispersión.

3.7. TEOREMA DE CHESBYSHEV
El teorema de Chebyshev en honor del matemático ruso del XIX, P. L Chebyshev.
Definición. (Teorema de Chebyshev) Si µ y  son la media y la desviación estándar de una variable aleatoria X, entonces para cualquiera constante positiva  la probabilidad es al menos 1 -  1/k al cuadrado que x asumirá un valor dentro de k desviaciones estándar de la media; simbólicamente.

Comentarios

Entradas populares de este blog

1.1 Idea popular de estadística

1.3.1 Constructos, variables e hipótesis

Sociedad Sagrada y Sociedad Secular