Las distribuciones de frecuencias
En estadística, la distribución de frecuencias es una tabla en la que se agrupan los diferentes valores de una muestra en filas y en cada columna se muestra un tipo de frecuencia de cada valor. Por lo tanto, la distribución de frecuencias sirve para mostrar todos los tipos de frecuencias de un conjunto de datos.
Construcción de una tabla de frecuencias de datos agrupados
Paso 1. Orden de los datos
Ordene todas las observaciones de menor a mayor
Paso 2. Determine el rango o recorrido
El rango o recorrido (R) se define como la variación numérica de la variable, es el recorrido que toma la variable desde el valor más pequeño hasta el valor más alto.
Se calcula mediante la siguiente ecuación: R= [Ls – Li]
Donde, R: rango o recorrido.
Li: límite inferior (menor valor de la variable).
Ls: límite superior (mayor valor de la variable).
Paso 3. Determine el número de intervalos o clases
El número de intervalos (m) se define de forma convencional, procurando mantenerse entre 5 y 20 intervalos o clases.
Sin embargo, para evitar caer en los extremos, es posible obtener una aproximación usando la fórmula propuesta por Sturges (Martínez, 2007), la cual es: m= 1+ 3,3*log(n)
Donde n es el número total de datos. En caso de que se analice la totalidad de elementos de la población, ésta se representa por N.
Paso 4. Calcule la amplitud del intervalo de clase
La amplitud de los intervalos (C) no es necesaria que sea igual para todos; sin embargo, con el objeto de simplificar y volverlo más funcional, es conveniente que todos los intervalos tengan igual amplitud.
Para el cálculo de la amplitud del intervalo se toma el cociente entre la amplitud del rango (AR) y el número de intervalos (m) que se considere más adecuado, teniendo en cuenta que este resultado (C) debe ser una cantidad exacta. C = AR / m
Paso 5. Determine los límites de los intervalos de clase de la distribución de frecuencias
Al construir los intervalos, cada uno de ellos está determinado por dos extremos: límite inferior (li ) y límite superior ( ls ).
Para el primer intervalo, el límite inferior es igual al límite inferior del rango Li y el límite superior de este intervalo se conforma sumando la amplitud (C) al límite inferior.
El segundo intervalo parte del límite superior del primer intervalo y se le suma la amplitud para obtener el límite superior. Este proceso se repite para el total de intervalos en los cuales se agrupó el conjunto de datos
La organización de los datos obtenidos en una investigación mediante tablas de frecuencias no es suficiente para analizar el comportamiento de la variable. En la mayoría de los casos, las tablas ofrecen varias opciones de ser abordadas, es decir, posibilitan distintas entradas por medio de filas o columnas. Para una comprensión más efectiva del comportamiento de la variable, se hace útil el empleo de gráficas, dado que éstas permiten describir rápidamente las características del grupo.
Para representar el comportamiento de una variable se pueden usar varios tipos de gráficas, entre ellas están los histogramas, polígonos, ojivas, diagramas de barras y circulares (Berenson, Levine y Krehbiel, 2006).
Histogramas
El histograma de frecuencias está conformado por un conjunto de rectángulos distribuidos en un plano cartesiano. Los histogramas representan variables cuantitativas continuas.
En el plano cartesiano, sobre el eje horizontal se distribuyen los intervalos de la variable y sobre el eje vertical se ubican las frecuencias.
La base de los rectángulos está determinada por la amplitud del intervalo, y la altura de cada rectángulo corresponde a la frecuencia que presenta cada intervalo (Martínez, 2007).
Polígono de frecuencias
El polígono de frecuencias es un conjunto de líneas sobre un plano cartesiano que representan el comportamiento de la característica en la población. Al igual que el histograma, el polígono se aplica a la variable cuantitativa continua.
Se construye de forma similar al histograma. En el eje horizontal se ubican las marcas de clase y en el eje vertical las frecuencias absolutas o relativas. De esta forma es posible construir el polígono de frecuencias absolutas o relativas, dependiendo de las frecuencias utilizadas
Ojivas o polígonos de frecuencias acumuladas
La ojiva representa el comportamiento acumulado de las unidades de investigación en relación a la variable analizada. Al igual que en los polígonos, las ojivas pueden ser construidas con las frecuencias absolutas o relativas
Diagrama de barras
El diagrama de barras es de las gráficas más utilizadas en los diferentes tipos de informes debido a que dan a conocer de forma fácil y sencilla las características de un grupo de elementos de una muestra o una población, especialmente cuando están asociadas a variables
cualitativas o cuantitativas discretas.
El diagrama de barras consiste en líneas gruesas que constituyen rectángulos de anchura variable que representan los valores que toma la variable, y de longitud definida por las frecuencias absolutas o relativas. Las barras se construyen de forma horizontal o vertical y cada
una puede ser representada con frecuencias absolutas o relativas.
Diagrama circular
El diagrama circular se fundamenta en la distribución de un círculo por fracciones que representan de forma proporcional los porcentajes de la característica objeto de análisis. Se usa para representar variables de tipo cualitativas o cuantitativas discretas.
Si el número de categorías sobre las cuales se está realizando la distribución de los porcentajes es superior a 4, no se recomienda la construcción del diagrama circular y, en su defecto, se debe usar el diagrama de barras.
El diagrama circular se construye tomando los 360° de la circunferencia y se divide conforme a las frecuencias relativas de la característica.