domingo, 22 de junio de 2014

Definiciones y un poco de Historia


Descubriendo Estadística

Definición de Estadística: La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la Investigación científica.

Comenzaremos ahora a investigar sobre los orígenes de esta disciplina:

Historia de la Estadística

La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas, etc.

La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas.

Es difícil conocer los orígenesde la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.

Actividad1

Teniendo en cuenta la introducción propuesta sobre la Historia de la Estadística,  realizar las siguientes actividades:


  1.  ¿En qué año comienza la época moderna de la Estadística?
  2.  Investigue sobre el surgimiento de la Estadística en Argentina.
  3.  Confeccione una  sopa de letras con pueblos y personajes relacionados con la historia de la Estadística.
  4. Finalmente te propongo una reflexión sobre la importancia de la Estadística en nuestra sociedad 

  Comenzaremos ahora a transitar los primeros pasos de la Estadística descriptiva

Estadística Descriptiva, Primeros Pasos

Los invito a reflexionar sobre algunas cuestiones en el siguiente vídeo:




Análisis de la Información
Como ya sabemos, la Estadística es la rama de la Matemática que recolecta, clasifica y relaciona datos para interpretar y utilizar la información que éstos aportan o para hacer predicciones respecto de ciertos fenómenos.
Nuestros primeros pasos a seguir en el estudio de la Estadística Descriptiva, los podemos plasmar en el siguiente cuadro conceptual:



Los datos se clasifican en datos numéricos y datos no numéricos.

El propósito del análisis de un determinado fenómeno o de una investigación científica es estudiar alguna característica de la población.

Esa característica es la variable. Si la variable se mide a partir de datos numéricos, se denomina variable cuantitativa; en cambio si se mide a partir de datos no numéricos, es una variable cualitativa.

Por ejemplo, la cantidad de hermanos y la duración en horas de uso de una batería son variables cuantitativas; la bebida preferida por un grupo de personas y los programas de televisión más vistos son variables cualitativas.


La Estadística Descriptiva es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la Población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.

Conceptos básicos

Comenzaremos a trabajar sobre conceptos básicos:  

Temas a desarrollar


Ø  Estadística unidimensional. Terminología básica. Carácter estadístico cualitativo y cuantitativo. Distribuciones discretas.
Ø  Recuento de datos. Construcción e interpretación de tablas de frecuencias, diagramas de barras y de sectores.
Ø  Cálculo e interpretación de la media aritmética, la mediana y la moda de una distribución discreta con pocos datos.

Ø  Aplicaciones de la estadística en la vida cotidiana. Aplicaciones de la estadística en la ciencia. 

Objetivos

Adquirir las destrezas necesarias para realizar una lectura comprensiva de los textos y recursos utilizados en el aprendizaje del área.


ü  Emplear con precisión el vocabulario específico y los conceptos fundamentales del área. 
ü  Utilizar adecuadamente y con sentido crítico los distintos recursos tecnológicos (calculadoras, programas informáticos e Internet) de forma que supongan una ayuda en el aprendizaje y en las aplicaciones instrumentales de la Matemática.
ü  Utilizar los métodos y procedimientos estadísticos estudiados para obtener conclusiones a partir de datos recogidos en el mundo de la información.

ü  Aplicar con soltura y adecuadamente las herramientas matemáticas adquiridas a situaciones de la vida diaria.  

Desarrollo:

Para organizar los datos, comenzamos clasificando y ordenando las variables de interés, para ello les propongo analizar el siguiente vídeo:




Distribución de Frecuencia

Luego de clasificar y ordenar las variables de interés, la distribución de frecuencia es un método que facilitará dicha organización para su interpretación.

Como primer paso se ordenan los datos en forma creciente o decreciente, siendo la diferencia entre el mayor valor y el menor, el rango de dicha distribución.


Aquí distinguimos los siguientes conceptos:

Frecuencia absoluta: es el número de veces que se repite cada valor de la variable. Lo simbolizamos como fi.

Frecuencia relativa: es el cociente entre el valor observado (frecuencia absoluta) y el número total de datos (n). Lo simbolizamos como fr., esta relación la expresamos según la siguiente fórmula: fr = fi / n

Frecuencia porcentual: es el número que surge al multiplicar por 100 el valor de cada frecuencia relativa y nos da una idea del porcentaje de dicho valor sobre el total de la muestra.

Comenzaremos ahora a desarrollar ejemplos para aplicar cada concepto nuevo:

Ejemplo de variable cuantitativa:

La nota de los alumnos de un curso son las siguientes: 8, 7, 4, 3, 5, 5, 2, 3, 10, 9, 9, 10, 6, 6, 5, 4, 2, 7, 7, 7, 6, 6, 9, 2, 2, 6, 6, 5, 1, 8, 8, 9, 2, 1, 3, 5, 5, 10.

Primero ordenamos los datos, en orden creciente
1, 1, 2, 2, 2, 2, 2, , 3, 3, 3, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10.

Siendo el número total de datos: n= 38

Para ordenar de una forma más adecuada los datos, se usa una tabla estadística y establecemos la frecuencia de los distintos valores:

Tabla estadística
Nota: en la fila inferior se calculan los totales, es decir la sumatoria (∑) de cada columna. Al trabajar con números decimales necesariamente se deben redondear los valores, nosotros trabajaremos con tres decimales. Así el total de la frecuencia absoluta tendrá valor 1 según el concepto teórico, pero por lo general la suma se aproxima a ese valor, en este caso nos da 1,001.

Ejemplo de variable cualitativa[1]:

Se realiza el recuento de datos de la variable “color de buzo de preferencia”. La muestra consideró 60 alumnos. La siguiente tabla muestra los datos obtenidos:


Una buena forma de realizar el conteo es usando palotes cada vez que se repita el valor de la variable, como de muestra en la figura de la derecha.

Actividad 2:
Diseña un problema tomando como base datos obtenidos de tu curso, clasifica el tipo de variable y confecciona una tabla estadística para calcular las frecuencias estudiadas.



[1] Ejemplo de UNIDAD 1: ESTADÍSTICA DESCRIPTIVA PARTE 1 Contenidistas: Dr. Carlos Lac Prugent, Mg. Diana Atar. U1 Licenciatura en la Enseñanza de la Matemática 2012 ENSEÑANZA DE LA ESTADÍSTICA, Universidad Caece.

Representación gráfica y Medidas Características

El análisis de la información, agrupada en las tablas estadísticas es más útil y comprensible si se los refleja a través de representaciones gráficas.

Los gráficos más habituales son los siguientes, que utilizaremos en un caso u otro, así como pueden hacerse con frecuencias absolutas o con frecuencias relativas.

Gráfico de columnas o barras: Constituido por columnas verticales u horizontales rectangulares de igual ancho y del mismo color o trazado, que: conservan igual distancia de separación entre sí, y la altura de las barras es proporcional a las frecuencias.

Gráfico de sectores circulares: Se usa para representar variables en porcentajes, o cifras absolutas cuando el número de variables no es demasiado grande.
Para realizar el gráfico “a mano” es necesario sacar el ángulo que corresponde a cada variable. Continuemos con el ejemplo de la variable “color de buzo de preferencia”

Histogramas

En el caso de variable Continua, se utilizan intervalos cuya amplitud debe ser igual en todos los casos, siempre que esto sea posible. Se construye dibujando barras contiguas que tienen como base la amplitud del intervalo y como alturas las frecuencias respectivas.
Si representa a una variable discreta, como es este caso, es conveniente que los rectángulos no estén “pegados”.


Actividad 3:


Medidas características


Tenemos la representación en forma de tabla de una distribución de frecuencias, hemos visto alguna de sus representaciones gráficas más características, pero todavía no es suficiente.

Por un lado las tablas pueden ser muy complejas para su interpretación y no resumen adecuadamente la información. Por otro lado, es difícil comparar dos distribuciones distintas.

Además con las gráficas pueden hacerse distorsiones y manipulaciones en:

-Alteración de las escalas.
-Inicio de las escalas
-Mantenimiento de la proporcionalidad de líneas.

Utilizaremos dos tipos de medidas, que llamaremos características:

Medidas centrales: Estas medidas, deben su nombre a la situación particular de distribuciones simétricas. Informan sobre los valores centrales de un conjunto de datos. Veremos las principales.


Media aritmética: es el promedio aritmético de un conjunto de datos que resulta de la suma de todos los valores obtenidos de la variable, dividido el número total de datos.

Podemos definir, entonces matemáticamente a la media aritmética de la siguiente manera:

Moda: es el valor de variable que se presenta el mayor número de veces, o sea, el valor más frecuente.

Mediana: es el valor del conjunto de datos que se sitúa justamente en el centro de la muestra. Un 50% son inferiores y el otro 50% son superiores a ella.

Medidas de dispersión: Nos darán valores de cuan dispersos están los datos respecto de los valores centrales.

Rango: Es la diferencia entre el mayor y el menor valor que toma la variable, por lo que su valor queda expresado en las mismas unidades que la variable.

Cuanto mayor es el rango, mayor es el campo de variación de la variable. Como sólo depende de valores extremos, si éstos están muy alejados de los restantes, puede conducir a una falsa impresión de la dispersión.

Por otra parte, es insuficiente ya que de todo el conjunto de datos sólo utiliza dos: el más grande y el más chico

Varianza: Es una medida para calcular la desviación o dispersión promedio de los datos res- pecto a su media aritmética y obtener un valor representativo de todos los desvíos.
La varianza o variancia es la suma de las desviaciones, con respecto a la media aritmética, elevadas al cuadrado y dividida por el número de observaciones.

Desviación estándar: La desviación o desvío estándar es la raíz cuadrada positiva, de la varianza.

Características del desvío estándar:

  •   Es la medida de dispersión más utilizada.
  •   Queda expresado en las mismas unidades que la variable.
  •   Es un número mayor o igual que cero.
  •  Si es cero, significa que todos los valores son iguales a la media aritmética y por lo tanto, no hay dispersión
Finalmente, les propongo una visita sobre algunos ejercicios resueltos, antes de realizar la actividad 4

Actividad 4: se recomienda realizar la actividad en grupos para reflexionar sobre las distintas conclusiones a que arriban los mismos




sábado, 21 de junio de 2014

Recursos para el desarrollo de las actividades

Uso de la calculadora:

Si bien en el mercado existe una gran variedad de calculadoras, es interesante ver al menos, el uso de algunas funciones estadísticas básicas (como las propuestas anteriormente), en un modelo estándar:



Actividad 5: para practicar y afianzar el uso de la calculadora realice los siguientes ejercicios:

I) Los siguientes datos representan la cantidad de horas por semana, que un grupo de personas le dedica a la actividad física.


42313
62334
71032
63436

a) Construya una tabla de frecuencias
b) Calcule media, moda y mediana
c) Calcule varianza y desvío estándar

II) El número de automóviles que hay en los hogares de un grupo de personas encuestadas al azar, viene dado en la siguiente tabla:

N° de automóviles
0
1
2
3
4
N° de personas
15
22
10
2
1

a) Halle la media y la desviación típica de esa distribución
b) En otro grupo, la media fue de 2,1 y el desvío estándar de 0,92. Calcule el coeficiente de variación de ambos grupos y establezca conclusiones.  
c) En ambos casos grafique distribución de frecuencias.


Por lo general existen situaciones donde la cantidad de datos es grande, y requieren el análisis de distintas variables de la misma población.




A continuación veremos un tutorial para trabajar en Excel: 



Antes de comenzar con la actividad final, haremos un recorrido a modo de resumen de todo lo transitado en este camino:




Actividad 6
Resolver los siguientes ejercicios utilizando Excel, corroborar los resultados y elaborar conclusiones en cada caso.