Media, mediana, moda y distribución de una serie de datos





Cualquier estudio estadístico incluye generalmente los siguientes apartados: 
1. Especificación de las cuestiones a las que hay que responder con el estudio. 
2. Ordenación y recuento de datos.
3. Presentación de estos datos en una tabla.
4. Construcción de uno o más diagramas en los que se representa gráficamente esta serie de datos. 

5. Finalmente, los matemáticos deducen los parámetros que nos permiten caracterizar el conjunto completo de datos a partir de unos pocos valores.

I. Construir la tabla que corresponde a una serie de datos
En estadística, el término población significa el conjunto completo de individuos sobre el que estamos recogiendo los datos, es decir, realizando el estudio.
Dentro de esta población, estudiamos una característica que llamamos variable estadística. Principalmente, se estudian variables cuantitativas, es decir, variables que toman valores numéricos.
Una variable cuantitativa puede ser:

discreta, cuando el número de valores que puede tomar es limitado o finito;
—o continua, si la variable puede tomar infinitos valores, todos los comprendidos entre dos números dados.
Cuando la variable estadística X es discreta, para cada valor de X contamos el número de veces que se repite este valor en la población. A este número lo llamamos frecuencia absoluta. Con los valores de la variable y de la frecuencia absoluta de cada uno de ellos construimos una tabla como la siguiente:

Cuando la variable estadística X es continua, agrupamos los valores en clases o intervalos. Las clases son intervalos semiabiertos . Su anchura o amplitud es el número y su centro, también llamado marca de clase, es el valor medio .
Para cada clase, contamos el número de veces en que el valor de la variable X es mayor que o igual a y menor que : esta es la frecuencia absoluta de dicha clase. Construimos con estos valores una tabla como la siguiente:

Notas:
—cuando el número total de datos n = f1 + f2 + ... + fp es demasiado grande, tratamos la variable discreta como si fuera una variable continua;
—cuando agrupamos los valores por clases, tratamos que los intervalos sean de la misma anchura o amplitud, y que esta no sea demasiado grande. Sin embargo, a menudo los límites de los intervalos dan problemas; esta es la razón de que el primer y el último intervalo sean, o bien abiertos, o de amplitud diferente a los demás.
II. Representar una serie de datos
Para representar una variable estadística discreta usamos un diagrama o gráfico de barras (en el que la altura de cada barra es proporcional a la frecuencia absoluta) o un diagrama de sectores (en el que cada sector es proporcional a dicha frecuencia absoluta).
Por ejemplo, supongamos que al preguntar a 60 individuos sobre su profesión hemos obtenido los resultados siguientes: 8 obreros, 23 ejecutivos, 15 autónomos, 11 docentes y 3 de otras profesiones.
Para representar esta serie en un diagrama de sectores, tenemos que calcular la amplitud del ángulo que corresponde a cada sector. Para el sector “obreros” el ángulo es: (360 : 60) x 8 = 48, es decir, 48°.
Procedemos igual para los demás sectores, con lo que dibujamos el siguiente diagrama de sectores:

Para representar una variable estadística continua, dibujamos un histograma. Un histograma está formado por rectángulos adosados cuya área es proporcional a la frecuencia absoluta de la clase correspondiente.
Si las clases son de la misma amplitud, la altura de los rectángulos es proporcional a dicha frecuencia. Si las clases son de diferentes amplitudes, representamos la más pequeña, y a continuación, para una clase de amplitud k veces mayor, dibujamos un rectángulo cuya base sea k veces la del primer rectángulo, procediendo igual para las demás clases.
Si unimos los puntos medios de las bases superiores de los rectángulos de un histograma, obtenemos el polígono de frecuencias.
III. Calcular la media
Cuando la variable es discreta y el total de datos es n, podemos recoger estos en una tabla como la siguiente:

donde .
La media de X se obtiene así:
.
Cuando la variable es continua y el total de datos es n, construimos una tabla de este tipo:

Para calcular la media de esta serie, usamos la fórmula anterior, introduciendo el centro del intervalo , o marca de clase, en lugar de los valores de .
Así la media de X es:
, donde .
IV. Propiedades de la media
Cuando mediante operaciones básicas cambiamos los valores de una serie de datos, no siempre es necesario calcular de nuevo la media.
Tenemos en cuenta las siguientes propiedades:
—si es la media de los valores la media de los valores , entonces la media de los valores suma es ;
—si k es cualquier número real y la media de los valores , entonces la media de los valores suma es ;
—si es cualquier número real y la media de los valores , entonces la media de los valores producto es .
V. Calcular la mediana
La mediana es el valor que divide a una serie de valores, escritos en orden creciente, de tal forma que la mitad de los valores son menores o iguales que él y la otra mitad, mayores o iguales que él.
Para hallarla, escribimos en orden creciente la lista de valores, repitiendo cada uno de ellos tantas veces como aparezca. Se pueden producir entonces dos situaciones:
—si el número total de valores es un número impar, la mediana es el valor que ocupa la posición ;
—si el número total de valores es un número par, la mediana es el centro del intervalo formado por los valores que ocupan las posiciones .
Cuando la serie viene agrupada en intervalos, hallamos gráficamente la mediana utilizando el polígono de frecuencias acumuladas. Para cada clase , hallamos el valor de la frecuencia absoluta acumulada, es decir, el número de veces que aparece un valor menor que . A continuación, representamos los puntos sobre un sistema de coordenadas xy, obteniendo de esta forma el polígono de frecuencias acumuladas.
La mediana es la coordenada del punto cuya coordenada es .
VI. Otros parámetros
Los matemáticos dicen a veces que hay tantos parámetros estadísticos como estadísticos. Sin llegar tan lejos, además de la media y la mediana, podemos calcular los parámetros siguientes:
—los valores límites, es decir, los valores mayor y menor de la serie;
—el rango, que es igual a la diferencia entre los valores límites de la serie, es decir, ;
—la moda (o clase modal), que es el valor (o clase) de la serie para el que se da la mayor frecuencia absoluta.
Nota: un parámetro no es muy útil por sí solo. Lo que habitualmente hacemos con una serie de datos es cotejar varios parámetros.
Recuerda
La media de X es el valor: .
La mediana es el número que divide a la serie de tal forma que la mitad de los datos son menores o iguales que él y la otra mitad, mayores o iguales que él.

No hay comentarios:

Publicar un comentario

Entradas populares

Me gusta

Seguidores