Se refiere a un conjunto de métodos para manejar la

23/08/2011 7 Variables: son las características o lo que se estudia de cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, es...

3 downloads 475 Views 1MB Size
23/08/2011

Diana Cobos del Angel



Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.

23/08/2011

Diana Cobos

2

1

23/08/2011



Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.

23/08/2011

Diana Cobos



3

Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos. DESCRIBIR

23/08/2011

Diana Cobos

4

2

23/08/2011



Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas. INFERIR

23/08/2011

 

Diana Cobos

5

El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee. Los métodos estadísticos han encontrado aplicación en:        

Gobierno Negocios Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual.

23/08/2011

Diana Cobos

6

3

23/08/2011



23/08/2011

Diana Cobos



23/08/2011

Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de …

7

Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.

Diana Cobos

8

4

23/08/2011



Se clasifica en dos categorías:  Finita: es aquella que incluye una cantidad

limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.

23/08/2011

Diana Cobos

9

 Infinita: es aquella que incluye un gran conjunto

de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.

23/08/2011

Diana Cobos

10

5

23/08/2011



Muestra:  es un conjunto de mediciones u

observaciones tomadas a partir de una población.  es un subconjunto de la población.

23/08/2011



Diana Cobos

11

Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado.

23/08/2011

Diana Cobos

12

6

23/08/2011



Variables:  son las características o lo que se estudia de cada

individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ... 

Datos:  son los valores que toma la variable en cada caso.

23/08/2011



Diana Cobos

13

Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej:  Sexo: f/m.  Hábito de fumar: Fumador/No fumador  Color de ojos: negro, azul, marrón, …  Religión: católica, evangélica, …  Estado civil: soltero, casado, divorciado,…

23/08/2011

Diana Cobos

14

7

23/08/2011



Cuantitativos: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos:  Peso  Edad  Estatura  Presión  Humedad  Intensidad de un sismo  Cantidad de hermanos

23/08/2011



Diana Cobos

15

Tipos de variables cuantitativas:  Discretas: es aquella que solo puede tomar un

número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos.  Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo: cantidad de líquido contenido en un recipiente.

23/08/2011

Diana Cobos

16

8

23/08/2011

  

Conclusiones erróneas debido a que los datos son numéricamente insuficientes. Representaciones gráficas engañosas (escalas). Datos muestrales no representativos:  Muestra que no incluye a elementos de toda la población.  Ciertas categorías de personas no responden correctamente.  Respuestas voluntarias (sesgadas).

23/08/2011

Diana Cobos



23/08/2011

17

Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.

Diana Cobos

18

9

23/08/2011



Formas de organizar los datos:  Un arreglo: es la forma más sencilla de organizar los datos

en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.  Poco práctica cuando se tiene una gran cantidad de datos.

23/08/2011

Diana Cobos

19

 Una distribución de frecuencias: es un arreglo de los

datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.

Clase

23/08/2011

Pto. Medio

Diana Cobos

fi

Fi

fri

FRi

20

10

23/08/2011



La Distribución de Frecuencias:  Se recomienda su uso cuando se tienen

grandes cantidades de datos (n).  Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.  Para definir la cantidad de intervalos de clase (k), se puede usar: ▪ La regla de Sturges: k = 1 + 3.3log(n) ▪ k = n

23/08/2011

Diana Cobos



La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.



La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.



Los límites de las clases deben tener una cifra significativa más que los datos en bruto.

23/08/2011

Diana Cobos

21

22

11

23/08/2011



Determinar:  Punto medio = (Li+Ls)/2.  Frecuencia absoluta de la clase (fi).

 Frecuencia acumulada de la clase (Fi).  Frecuencia relativa de la clase (fri): ▪ fri = fi/n  Frecuencia relativa acumulada de la clase (FRi).

23/08/2011

Diana Cobos

23

A continuación se presentan las calificaciones de 60 estudiantes que presentaron examen de admisión en cierta universidad en el año 2011: 23 80 52 41 60 34

60 77 10 71 78 67

79 81 64 83 89 17

32 95 75 54 76 82

57 41 78 64 84 69

74 65 25 72 48 74

52 92 80 88 84 63

70 85 98 62 90 80

82 55 81 74 15 85

36 76 67 43 79 61

a) Construya una distribución de frecuencias. b) Qué puede concluir de estos datos. 23/08/2011

Diana Cobos

24

12

23/08/2011

 

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos. Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:  Histogramas.  Polígono de frecuencias.  Ojiva o Polígono de frecuencias acumuladas.

23/08/2011

Diana Cobos

25

Histograma

23/08/2011

Diana Cobos

26

13

23/08/2011

Histograma y Polígono de Frecuencias

23/08/2011

Diana Cobos

27

Diana Cobos

28

Ojiva

23/08/2011

14

23/08/2011



Para datos cualitativos se usan:  Curvas  Barras

 Sectores

23/08/2011

Diana Cobos

29

Barras

Barras

23/08/2011

Diana Cobos

30

15

23/08/2011

Curvas

23/08/2011

Diana Cobos

31

Sectores, torta o circular

23/08/2011

Diana Cobos

32

16

23/08/2011

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.  Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen. 

23/08/2011



Diana Cobos

33

Las medidas de tendencia central más importantes son:  Media: Aritmética y Aritmética ponderada.  Mediana.  Moda.  Percentiles  Cuartiles

23/08/2011

Diana Cobos

34

17

23/08/2011



Para datos no agrupados: n

X 

x i 1

i

n

Para datos agrupados: k

X

m f

i i

i 1

n

Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases 23/08/2011

Diana Cobos

35

Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.  Divide al conjunto de datos en dos partes iguales. 

23/08/2011

Diana Cobos

36

18

23/08/2011



Para datos no agrupados:  Si n es impar: posición donde se ubica la mediana

es igual a (n+1)/2.  Si n es par: (n+1)/2 no es entero, por lo tanto la

mediana será igual al promedio de las dos posiciones centrales.

23/08/2011

Diana Cobos



37

Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2. n 1  F ( xm1 ) Md  Lm  2 Cm f ( xm ) Donde:

23/08/2011

Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.

Diana Cobos

38

19

23/08/2011



Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.



Un conjunto de datos puede ser unimodal, bimodal o multimodal.



Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.

23/08/2011

Diana Cobos

 

Para datos no agrupados: es simplemente la observación que más se repite. Para datos agrupados:

Mo  Lim  Donde:

23/08/2011

39

1 Cm 1   2

Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).

Diana Cobos

40

20

23/08/2011

Cuando los datos son sesgados es mejor emplear la Md

23/08/2011



Diana Cobos

41

El 100p-ésimo percentil de un conjunto de datos es un valor de “y” situado de modo que el 100p% del área bajo la distribución de frecuencia relativa para los datos queda a la izquierda del 100p-ésimo percentil y 100(1p)% del área queda a la derecha. (0<=p<=1)

23/08/2011

Diana Cobos

42

21

23/08/2011



Ejemplo: Si su calificación en un concurso de ingeniería industrial estuvo en el 84º percentil entonces el 84% de las calificaciones fueron inferiores a la suya y el 16% fueron mayores.



La mediana es el 50º percentil. El 25º percentil, la mediana y el 75º percentil se denominan cuartil inferior QI, cuartil medio m y cuartil superior QS, repectivamente, de un conjunto de datos.

23/08/2011



Diana Cobos

43

Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.

23/08/2011

Diana Cobos

44

22

23/08/2011



Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.

23/08/2011

   

Diana Cobos

45

Rango. Varianza. Desviación Típica. Coeficiente de variación.

23/08/2011

Diana Cobos

46

23

23/08/2011

Rango (amplitud o recorrido):  Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.  Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión. 23/08/2011

Diana Cobos

47

Casi no se emplea debido a que depende únicamente de dos valores.  No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.  Notación: R 

23/08/2011

Diana Cobos

48

24

23/08/2011

Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.  Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.  Notación: s2, 2, var(X) 

23/08/2011

Diana Cobos



49

Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.

 x  x  n

Para datos NO agrupados:

s2 

2

i

i 1

n n

s2  23/08/2011

Diana Cobos

x i 1

n

2 i

x

2

50

25

23/08/2011

Para datos agrupados en una distribución de frecuencias: k

s2 

 m i 1

n k

s  2

23/08/2011

 x   fi 2

i

m i 1

2 i

 fi

n

 x 

2

Diana Cobos

 

51

Es la raíz cuadrada de la varianza. Notación: s, .

s  s2

23/08/2011

Diana Cobos

52

26

23/08/2011



 

Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes. No tiene dimensiones. Notación: CV

s CV  100% x

23/08/2011

Diana Cobos

53

Probabilidad y Estadística para Ingeniería y Ciencias. WILLIAM MENDENHALL Y TERRY SINCICH Pearson-Prentice Hall. (1997). 4ª. Edición. 

Probabilidad y Estadística para Ingenieros. Walpole, Myers, Myers y Ye. Pearson/Prentice Hall. (2007). 8a. Edición 

23/08/2011

Diana Cobos

54

27