Qué es la marca de clase en estadística (y cómo se obtiene)

¿Qué es la marca de clase en las estadísticas?

En las estadísticas se usa lo que se conoce como marc de clase o punto medio. Se trata entonces de ese valor que está ubicado justo en el centro de la clase. Esta marca de clase es la que se encarga de representar todos los demás valores que aparecen en esa misma categoría. Es muy común su uso en lo que es el cálculo de parámetros. Por ejemplo en la desviación estándar o en lo que es la media aritmética. 

Comprendemos pues que la marca de clase es el punto medio que todo intervalo debe tener. Muy utilizado en los procedimientos que se hacen con la idea de poder encontrar la variación que hay en cualquier conjunto de datos que se ordenan por grupos según su clase. Esto es lo que permite que se pueda comprender la distancia que existe entre el centro y los datos determinados. 

Cómo se obtiene la marca de clase en las estadísticas

La marca de clase viene siendo el valor central que se toma como representación de toda la clase en general. Por esta razón se trata de un valor con mucha relevancia en los datos estadísticos, por lo tanto hay que saber calcularla de forma correcta.

Lo primero que hay que tener en claro es que el procedimiento no es para nada complejo. Se comienza sumando todos los límites que tienen los intervalos. Matemáticamente este procedimiento lo podemos representar como se muestra a continuación: 

xi = (Límite inferior + Límite superior) /2

En esta representación podemos notar como la expresión xi viene representando la marca de la clase  i-ésima.

Pasos para obtener la marca de clase

Ejercicio de ejemplo

Tomando el conjunto de datos que se muestran a continuación, crea una distribución de frecuencias que sea representativa y en la que se pueda conseguir la marca de clase que corresponde. 

246 332 298 304 276 389 289 234 253 292
367 320 307 282 311 297 297 313 304 330
267 391 317 305 290 301 293 312 272 312
315 351 346 337 303 265 278 278 373 272
308 276 366 391 298 290 307 221 271 344

Se puede notar que el dato que tiene el mayor valor en sus números es el 391 y el que tiene un valor menor es el 221. De todo esto también se puede ver que el rango es entonces 391 – 221 = 170.

Lo primero es hacer una distribución de frecuencias de donde se obtendrá la marca de  clase, para esto existen dos métodos. 

Método 1

Se comienza eligiendo sólo 5 clases las cuales deben tener el mismo tamaño numérico. Estas clases se puede elegir de las siguiente manera: 

206 – 245
246 – 285
286 – 325
326 – 365
366 – 405

Cada uno de estos datos se encuentra dentro de una clase, las mismas son disjuntas y les corresponde el mismo valor. Esta es una de las formas de poder encontrar la marca de clase en un conjunto de datos. 

Método 2

La otra manera en la que se puede dar con la marca de clase es tomando en consideración los datos como si fueran parte de lo que se conoce como una variable continua.Esta variable puede alcanzar alguno de los valores reales, cualquiera de ellos. 

Con este segundo método las clases se pueden tomar de la siguiente manera: 

205-245, 245-285, 285-325, 325-365, 365-405

Sin embargo esta es una manera de representación de datos en la que podemos encontrar ciertas ambigüedades en lo que se consideran como las fronteras. Es decir que, por ejemplo, tomando el caso del número 245, nos podríamos encontrar con la siguiente pregunta: ¿Pertenece a la primera o a la segunda clase?

Entonces, con la idea de poder evitar ese tipo de interrogantes, podemos hacer una convención con los puntos extremos. Así el intervalo (205, 245], vendría siendo parte de la primera clase y el (245, 285], pertenecen a la segunda clase. Se continuaría con el mismo orden en todos los demás intervalos que queden.

(205 – 245]
(245 – 285]
(285 – 325]
(325 – 365]
(365 – 405]

Solución final 

Al tener ya las clases definidas, se puede continuar entonces haciendo el cálculo de la frecuencia y podemos representarlo con una tabla como la que se muestra a continuación: 

Clase Frecuencia
(205 – 245] 2
(245 – 285] 12
(285 – 325] 23
(325 – 365] 8
(365 – 405] 5

Una vez obtenida la distribución de la frecuencia de los datos, entonces podemos continuar por dar con las marcas de clases que pertenecen a cada intervalo. 

Esto se obtiene de la siguiente manera:

x1=(205+ 245)/2=225

x2=(245+ 285)/2=265          

x3=(285+ 325)/2=305

x4=(325+ 365)/2=345

x5=(365+ 405)/2=385

¿Cómo saber cuántas clases se deben considerar?

Lo primero que debemos tomar en cuenta es que cantidad de clases deseamos tomar y luego poder elegir bien los límites de clase que tendrán. Además debemos considerar que las clases se deben tomar de la forma en que más convengan.

Siempre sabiendo que si se toma un número que sea pequeño, entonce puede que se oculte alguna información importante. De lo contrario, si se toma un número grande, puede que se estén generando demasiados datos que no sean necesarios. 

Entonces, tomando en cuenta todo esto debemos tomar en cuenta los siguientes aspectos: 

  • Se debe tomar en cuenta cuántos datos se an a considerar.
  • Hay que saber de qué tamaño es el rango que pertenece a la distribución. Esto quiere decir que hay que conocer la diferencia que existe entre la observación que sea de mayor tamaño y la de menor tamaño. 

Teniendo esto claro, es decir, una vez que las clases ya están definidas, entonces se cuenta cuántos datos aparecen en cada una de las clases. Este dato es lo que se conoce como frecuencia de clases y se representa por fi. 

Conociendo todos estos aspectos importantes, lo que se busca es no perder datos  o dar alguna información que no sea útil. Es por esto que lo que se necesita es un valor en el cual se pueda representar toda la clase de la que forme parte. Esto es la verdadra marca de clase. 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *