Los grandes inventos y descubrimientos

Calcular frecuencias relativas acumuladas

Hemos preguntado a cada uno de los miembros de dos grupos cuál es su deporte favorito.

Resulta difícil comparar directamente las respuestas, porque la población de los dos grupos es diferente: en la primera encuesta hemos preguntado a 141 individuos, mientras que en la segunda hemos preguntado a 445. En este tipo de situaciones manejamos las frecuencias relativas.

I. Calcular las frecuencias relativas
Ejemplo: observemos de nuevo la encuesta anterior. Para poder comparar los resultados de la misma, calculamos las frecuencias relativas de cada uno de los deportes en cada uno de los dos grupos. Para ello, dividimos cada cantidad (que es la frecuencia o frecuencia absoluta) entre la población total de dicho grupo.
Estos son los resultados obtenidos (redondeados a las centésimas 0,01):

Podemos comprobar que la suma de las frecuencias relativas en cada caso es igual a 1 (en la primera tabla no sale exactamente 1, sino 0,99 a causa del redondeo).
Definición: en un estudio estadístico, la frecuencia relativa de un determinado valor o de una clase es el cociente entre su frecuencia absoluta y el total de la población. A menudo este cociente se expresa como un porcentaje.
II. Calcular las frecuencias relativas acumuladas
Ejemplo: se ha clasificado a los internautas españoles mayores de 18 años según cinco rangos de edad. Los resultados han sido los siguientes:

Queremos calcular la proporción de internautas que son mayores de 35 años.
En este caso, la característica que está siendo estudiada (la edad) es cuantitativa, y los rangos de edad aparecen en orden creciente. Observando la tabla podemos ver que el 55% (23 + 32 = 55) de los individuos de la población son menores de 35 años. Podemos decir que la frecuencia relativa acumulada del rango de edad 25 < x < 34 es el 55%.
Las frecuencias relativas acumuladas se calculan igual que las frecuencias absolutas acumuladas.
A continuación, se presenta la tabla completa con las frecuencias relativas acumuladas, en orden creciente:

Para las frecuencias relativas acumuladas crecientes, los valores van incrementándose hasta llegar al 100 (si las frecuencias están expresadas en %) o al 1 (si las frecuencias no están expresadas en %, sino en tantos por uno).
Definición: para una característica cuantitativa, la frecuencia relativa acumulada creciente de un valor v es la suma de las frecuencias relativas de los valores menores o iguales que v.
Nota: en el ejemplo presentado al principio de este artículo (la encuesta sobre el deporte preferido), no podemos calcular frecuencias acumuladas, ni absolutas ni relativas, ya que la característica estudiada es cualitativa, no cuantitativa.

Calcular frecuencias acumuladas

Si en un estudio estadístico los datos son muy variados, podemos agruparlos en clases. De todas formas, tanto si los datos son discretos como si están agrupados en clases, ¿qué significa calcular las frecuencias acumuladas?

I. Cuando los datos son discretos
Hemos recogido y agrupado en esta tabla la edad de los asistentes a un campamento de verano:

Estamos interesados en la edad de cada individuo. El carácter de este estudio es, por lo tanto, la edad. La edad es un carácter cuantitativo.
La población que estamos estudiando está formada por 55 individuos:

7 + 10 + 15 + 13 + 10 = 55
10 participantes tienen 13 años. Podemos decir que la frecuencia de la modalidad “13” es 10.
1. Calcular frecuencias acumuladas crecientes
Podemos observar que hay 17 (7 + 10 = 17) personas que tienen 13 años o menos. Podemos decir entonces que el valor de la frecuencia acumulada para la modalidad “13”, es 17.
También podemos comprobar que 32 (7 + 10 + 15) personas tienen 14 años o menos. La frecuencia acumulada de la modalidad “14” es 32.
Por lo tanto, podemos calcular la frecuencia acumulada de cada una de las modalidades que presenta el carácter “edad”. En la tabla siguiente podemos observar todas las frecuencias acumuladas de forma ordenada:

Nota: la suma de las primeras cuatro frecuencias es igual a 45 (7 + 10 + 15 + 13). Pero también podemos obtener 45 sumando dos cantidades: la que está justo encima de 45 (es decir, 32) con la que hay a su izquierda (13): 45 = 32 + 13. Si usamos esta técnica, resulta muy sencillo completar todas las frecuencias acumuladas de la tabla. Observa:

Definición: para un carácter cuantitativo, la frecuencia acumulada de un valor o modalidad v es la suma de las frecuencias de cada una de las modalidades que tienen un valor menor o igual a v.
2. Calcular frecuencias acumuladas decrecientes
También podemos observar que hay 23 (13 + 10 = 23) personas que tienen 15 años o más. Esto nos permite definir y calcular las frecuencias acumuladas decrecientes mostradas en esta tabla:

Nota: la suma de las tres últimas frecuencias es 38 (15 + 13 + 10). La cantidad 38 también la podemos obtener sumando el número que se encuentra justo debajo del 38 (es decir, el 23) y el que se encuentra a su izquierda (el 15). Para completar la tabla cómodamente, empezamos por la última frecuencia (10) y vamos subiendo. Observa:

Definición: para un carácter cuantitativo, la frecuencia acumulada decreciente de una modalidadv es la suma de cada una de las frecuencias de aquellas modalidades que tienen un valor mayor o igual a v.
3. Representar frecuencias acumuladas en un diagrama o gráfico de barras
Podemos representar las frecuencias acumuladas de esta serie de datos mediante un diagrama de barras:

También podríamos representar de la misma forma las frecuencias acumuladas decrecientes.
II. Cuando los datos están agrupados en clases o intervalos
Entrevistamos a 120 personas acerca de la cantidad de tiempo que dedican al día a ver la televisión. Lo más probable es que obtengamos una gran variedad de respuestas diferentes (tales como 2 h, 2 h 30 min, etc.). Por este motivo vamos a agrupar las respuestas en intervalos de tiempo (llamados clases), de manera que aquellas personas que hayan visto la televisión 2 h o más de 2 h pero menos de 3 h las vamos a agrupar en la clase 2 ≤t < 3.
Aquí tenemos los resultados:

Ahora completamos la tabla incluyendo las frecuencias acumuladas y las frecuencias acumuladas decrecientes:

Podemos representar las frecuencias acumuladas o las frecuencias acumuladas decrecientes mediante un diagrama de barras, tal como lo hicimos con los datos discretos. En el diagrama, podríamos llamar a la última clase: 4 ≤ t < 5.

Frecuencia y muestreo

En cualquier periódico que leamos, nos encontramos algún escrutinio o recuento de datos, con porcentajes y comentarios. ¿Pero son fiables estos escrutinios? Vamos a ver las nociones en que se basan (frecuencia y simulación) y a especificar las limitaciones de sus resultados.
I. Tener la distribución de frecuencias de una serie de datos

Comenzamos con una serie de datos, cuyos valores y frecuencias absolutas, fi, aparecen recogidos en una tabla similar a la siguiente:

Para cada valor xi, calculamos su frecuencia relativa hi.
Se halla dividiendo la frecuencia absoluta fi de ese valor entre el número total de datos n de la población estudiada, es decir:

.
Construimos una tabla con los valores de la serie de datos y sus frecuencias relativas, similar a la siguiente:

Lo que habitualmente manejamos es la frecuencia relativa acumulada, que para un determinado valor de X se obtiene sumando su frecuencia relativa con las frecuencias relativas de todos los valores anteriores a él. Dicha frecuencia relativa acumulada la expresamos en valor decimal o en tanto por ciento. La frecuencia relativa acumulada del último valor de la serie debe ser igual a 1, que equivale al 100%.

II. Fluctuación de las muestras
Cuando queremos conocer la proporción p de una característica en una población numerosa, supervisar uno a uno cada individuo de la población es un proceso largo y costoso, así que tomamos una muestra.
Tomar una muestra de tamaño n de la población significa tomar n individuos, o repetir el experimento n veces bajo las mismas condiciones en las que medimos la característica que estamos estudiando.
La serie de datos formada por los n resultados obtenidos es una muestra de tamaño n.
Este método no puede proporcionar el valor exacto de p, ya que diferentes muestras pueden dar diferentes proporciones.
Si tenemos varias muestras, podemos observar estas diferencias en la distribución de frecuencias. Esto es lo que llamamos fluctuación y para observarla, basta con tomar dos muestras.
III. Interpretación de un escrutinio de datos
Como acabamos de ver, con una única muestra no podemos saber la proporción exacta p de una característica en una población completa.
No obstante, si respetamos ciertas condiciones, la proporción observada pe para esa muestra es un buen valor aproximado de la proporción p.
Estas condiciones son las siguientes:
—los individuos de la muestra deben ser elegidos aleatoriamente;
—los individuos se deben devolver a la población (o repetir el experimento en idénticas condiciones);
—el tamaño n de la muestra debe ser bastante grande; se tiene que cumplir que

.
Cumpliéndose estas condiciones, podemos asegurar que en el 93% de los casos (de las muestras observadas) se cumple que:

, lo que significa que pe es un valor aproximado de p con una imprecisión o error absoluto de

.
IV. Simulación de un experimento
Un experimento aleatorio es un experimento cuyo resultado es impredecible a priori, depende de la suerte.
Simular un experimento aleatorio significa sustituir el experimento real por otro también aleatorio que nos proporcione resultados similares a los del real.
Simulamos un experimento cuando el experimento original es difícil de reproducir, bien porque sea demasiado costoso, bien porque llevaría demasiado tiempo o bien porque sería muy difícil de observar.
Simulando varias veces un experimento (por ejemplo, tomando varias muestras), podremos sacar conclusiones de la distribución de frecuencias y de la fluctuación.
Para simular un experimento podemos usar la tecla

de una calculadora o una hoja de cálculo (Excel, por ejemplo, tiene la función RAND).
En una calculadora, esta tecla o función proporciona un número aleatorio con unas 10 cifras decimales.
Ejemplo:
Hemos metido 35 prendas rojas y 65 verdes en una caja. El experimento consiste en extraer 10 prendas de la caja, reemplazando cada vez la prenda extraída. ¿Cómo podemos simular este experimento? Usando una calculadora, activamos 10 veces la función

obteniendo 10 números decimales. Observamos las dos primeras cifras de la parte decimal de cada número. Si el número que forman esas dos cifras está comprendido entre 1 y 35, consideramos que hemos extraído una prenda roja, de lo contrario consideramos que la prenda extraída ha sido verde. De esta manera podemos simular nuestro experimento tantas veces como queramos.
Recuerda
—La frecuencia relativa hi de un valor perteneciente a una serie de datos viene dada por el cociente entre la frecuencia absoluta fi de dicho valor y el tamaño n de la población:

.
—La proporción observada pe de una característica en una muestra de tamaño n es un valor aproximado de la proporción p de dicha característica en la población total, y cuya imprecisión es

.
—Si nuestra calculadora tiene la tecla

, pulsándola podemos simular experimentos aleatorios.

Calcular frecuencias relativas

Muchas veces no es posible interpretar directamente una tabla de datos estadísticos. Al representarlos en un gráfico, podemos distinguir visualmente la distribución de los datos. El cálculo de las frecuencias relativas nos muestra la distribución numérica de los datos.

I. Las frecuencias relativas en su forma decimal
1. Definición

La frecuencia relativa de una modalidad de un carácter determinado, es el resultado de dividir la frecuencia absoluta de esa modalidad entre la frecuencia total (la suma de todas las frecuencias absolutas).

2. Ejemplo
En un campamento de verano, los jóvenes son encuestados acerca de cuáles de las siguientes actividades son sus favoritas: fútbol, ping-pong, tiro con arco, vela y bicicleta de montaña. La tabla de abajo muestra los resultados de la encuesta.

Calculamos la frecuencia total: 48 + 35 + 15 + 112 + 40 = 250.
Obtendremos la frecuencia relativa dividiendo cada una de las frecuencias entre la frecuencia total: 48 : 250 = 0,192; 35 : 250 = 0,14; 15 : 250 = 0,06; 112 : 250 = 0,448 y 40 : 250 = 0,16.

Notas:
—una frecuencia relativa es siempre un valor comprendido entre 0 y 1;
—el resultado de la suma de todas las frecuencias relativas, en una tabla estadística, es 1. Podemos comprobarlo con la tabla de arriba: 0,192 + 0,14 + 0,06 + 0,448 + 0,16 = 1;
—en el caso de que al calcular una frecuencia relativa, la división no sea exacta, tal como ocurre en el ejemplo de abajo, siempre podemos redondear el resultado. No obstante debemos tener en cuenta que la suma de estos valores aproximados nunca dará 1, debido al error de redondeo.

Calculamos las frecuencias relativas, redondeando a las centésimas: 7 : 30 = 0,23; 22 : 30 = 0,73 y 1 : 30 = 0,03.
La suma no es 1: 0,23 + 0,73 + 0,03 = 0,99.
II. La frecuencia relativa en forma de porcentaje
1. Recordemos los porcentajes

El número

también puede ser escrito como a%.
Ejemplo:

.
2. Ejemplo

Observa de nuevo el ejemplo que hemos estudiado sobre las actividades favoritas de los jóvenes en un campamento. Las frecuencias relativas pueden ser expresadas en forma de porcentaje. Obtenemos así la siguiente tabla:

Notas:
—una frecuencia relativa, expresada como porcentaje, siempre toma valores situados entre 0% y 100%;
—la suma de todos los porcentajes es igual a 100%. Podemos comprobarlo en el ejemplo de arriba: 19,2% + 14% + 6% + 44,8% + 16% = 100%;
—si se trata de frecuencias relativas redondeadas, los porcentajes también lo serán. Por lo tanto, la suma de sus valores, que son aproximados, nunca será el 100%. Si volvemos al ejemplo del estudio del color de los ojos, tendríamos que: 23% + 73% + 3% = 99%.

Los grandes inventos y descubrimientos

Calcular frecuencias relativas acumuladas

jueves, 16 de mayo de 2013

Calcular frecuencias acumuladas

Frecuencia y muestreo

Calcular frecuencias relativas

Entradas populares

Me gusta

Seguidores