TABLAS Y FORMULAS - Academia MAT

Tablas y Fórmulas Estadísticas 3 MEDIDAS DE VARIABILIDAD Datos sin agrupar Datos agrupados Variancia de una muestra s ( ) n x ix x i n 2 2 1 1 1 = − ∑...

87 downloads 746 Views 97KB Size
Tablas y Fórmulas Estadísticas

TABLAS Y FORMULAS ESTADISTICAS

Carlo Magno Araya Profesor de Estadística Sede de Occidente Universidad de Costa Rica

1

Tablas y Fórmulas Estadísticas MEDIDAS DE POSICION Datos sin agrupar

Datos agrupados

Promedio aritmético de muestras k n

∑ xi fi

∑ xi

x=

x =

i =1

∑ fi

n

i =1

Promedio ponderado n

Mediana

∑ x i wi

x=

i=1 k

i =1 n

∑ wi

n   - F i-1  2 *c M e = Li +  f   i  

i =1

Mediana para n impar

M e = X  n +1     2 

Moda

 d1  *c M o = Li +   d 1+ d 2  d 1 = f i − f i −1 d 2 = f i − f i +1

Mediana para n par

Percentiles

X  n + X  n Me =

  +1 2 

   2

2

 m.n  - F i-1   100 *c P m = Li +  fi    

Percentiles

Pm = X 

m   100 ( n + 1)   

Media geométrico

n x g = x 1 . x 2 .... x n

Media armónica xa =

n n

∑ i=1

1 xi

2

Tablas y Fórmulas Estadísticas MEDIDAS DE VARIABILIDAD Datos sin agrupar Datos agrupados Variancia de una muestra 1 k 1 n 2 2 ∑ ( xi − x ) 2 . f i s = sx2 = x − x ∑( i ) x n − 1 i =1 n − 1 i =1 2  n   x n ∑   1  2  i =1 i   2 sx = ∑ xi − n − 1 i =1 n     

2  k    ∑ xi f i   k  i=1   1  sx2 = . ∑ x2 f  n - 1 i=1 i i n    

Variancia de la población

1 N 2 σ x2 = ∑ ( xi − µ ) N i =1 2  N   N  ∑ xi      1 σ x2 = .  ∑ xi2 - i=1  N i=1 N     

Coeficiente de variación de una población

CV x =

σx * 100 µ

σ 2x =

2 1 k ∑ xi − µ . f i N i =1

(

)

2  k    ∑ xi f i   k  i=1   1 σ 2x = .  ∑ xi2 f i  N i=1 N    

Coeficiente de variación de una muestra sx CV x = * 100 x

Desviación media k

n

∑ | xi - x|. f i

∑ | xi - x| D. M.=

i=1

D. M.=

n

i=1

k

∑ fi

i=1

Medida de variabilidad para muestras pareadas s2d =

1  n 2 . ∑ di n -1 i=1 

di = X 1i - X 2i

Variancia para variables dicotómicas σ 2 = PQ

$$ s 2 = pq

3

Tablas y Fórmulas Estadísticas INDICE DE PRECIOS Relativo simple de precios p I = n ⋅ 100 p0

Agregado simple de precios k

∑ pn

i =1 k

I=

⋅ 100

∑ p0

i =1

Promedio de los relativos simples de precios k  p  ∑ n  i =1 p 0  I = ⋅ 100 k

Laspeyres

I PL =

Laspeyres

I QL =

Índices de precios ponderados Paasche

∑ pn q o ⋅ 100 ∑ po q o

I PP =

∑ pn q n ⋅ 100 ∑ po q n

Índices de cantidades ponderados Paasche

∑ po q n ⋅ 100 ∑ po q o

I QP =

∑ pn q n ⋅ 100 ∑ pn q o

Indice de precio de Fischer

 ∑ pn q0   ∑ pn qn    ⋅ 100 I PF =   ∑ p0 q0   ∑ p0qn 

4

Tablas y Fórmulas Estadísticas MUESTREO ALEATORIO SIMPLE Población finita Población infinita Variancia del promedio

N - n s 2x . N -1 n N - n σ 2x 2 = . σx N -1 n

s2x =

s2x =

σ 2x =

s2x n

σ 2x n

Variancia de una proporción

s 2p$ =

$$ N - n pq . N -1 n

s2p$ =

$$ pq n

PQ N - n PQ . σ 2p$ = n N -1 n Tamaño de muestra para la estimación De un promedio y una proporción poblacional

σ 2p$ =

n1 n= n 1+ 1 N n1 n= n 1+ 1 N

 Zα / 2 σ   donde n1 =  d 

2

 Z α / 2 PQ   donde n1 =   d  

Z σ n =  α/2   d 

2

2

 Z α / 2 PQ   n =   d  

2

Intervalos de confianza para el promedio cuando la variancia de la población es conocida

σx N -n σx * Li = x ± Zα /2* N -1 n n Intervalos de confianza para el promedio cuando la variancia de la población es desconocida y n≤ ≤30 N - n sx sx * Li = x ± t α / 2(n-1)gl * Li = x ± t α / 2(n-1)gl * N -1 n n Li = x ± Z α / 2 *

Intervalos de confianza para una proporción si np>5 y nq>5 $$ N -n pq $$ pq * Li = p$ ± Z α / 2 * $ ± Zα / 2* = p L i N -1 n n

5

Tablas y Fórmulas Estadísticas ESTADISTICO PARA PRUEBA DE HIPOTESIS Promedios Para un promedio: variancia conocida

Proporciones Para una proporción

x-µ

Zc =

Zc =

σ

p$ - P PQ n

n

Para un promedio: variancia desconocida x-µ tc =

Diferencia de proporciones p$ 1 − p$ 2 p$ 1 q$1 p$ 2 q$ 2 + n1 n2

Zc =

s n

Diferencia de dos promedios: variancia Otra alternativa de cálculo: x1 x 2 conocida − x1 - x 2

Zc =

σ 12 n1

+

Zc =

σ 22 n2

n1

 1 1 p(1 − p) −   n1 n 2 

p=

Diferencia de dos promedios: variancia desconocida x1 - x 2 *k k= tc = donde ( n1 - 1) S 12 + ( n2 - 1) S 22 Estadístico de prueba de independencia y de homogeneidad Ji-Cuadrada 2

r

(Oij - E ij )2

c

χ =∑ ∑ i=1 j=1

E ij =

E ij

Ni N j N

n2

x1 + x 2 n1 + n2

n1 n2 ( n1 + n2 - 2) n1 + n 2

Estadístico de prueba para muestras pareadas

tc =

d Sd / n

6

Tablas y Fórmulas Estadísticas ANALISIS DE REGRESION LINEAL SIMPLE Constante de regresión

Coeficiente regresión lineal n

n

a = y − bx

b=

i=1

i=1

Intervalos de confianza para el promedio de y dado un x0

(

n

n

i=1

i=1

i=1

n

Intervalos de confianza para una observación de y dado un x0

x0 - x 1 + Li = y$ ± t α / 2(n-2)gl * S e n SC x Error estándar de estimación n

i=1 2

  n ∑ xi2 -  ∑ xi  i=1  i=1 n

)

2

(

x0 - x 1 1+ + n SC x

Li = y$ ± tα / 2(n-2)gl * S e

Suma de cuadrados de x

2 ∑ yi - a ∑ y i - b ∑ xi yi

Se =

n

n ∑ xi yi - ∑ xi ∑ yi

n

SC x = ∑ xi2 -

 n   ∑ xi   i=1 

2

n i=1 n-2 Inferencia sobre la constante y coeficiente de regresión Intervalos de confianza Estadístico de prueba de hipótesis a 1 x2 tc = a ± t ( n− 2 ) gl S e + 1 x2 n SCx + Se n SC x

Se

b ± t ( n−2 ) gl

tc =

SC x

b Se /

SC x

ANALISIS DE CORRELACION LINEAL SIMPLE Coeficiente de correlación lineal n

n

n

i=1

i=1

i=1

n ∑ xi yi - ∑ xi ∑ y i r=

2  n n   n ∑ xi2 -  ∑ x i   i=1    i=1 

2  n  n   *  n ∑ y i2 -  ∑ yi   i=1    i=1 

Estadístico para prueba de hipótesis sobre Coeficiente de correlación parcial r12 − r13 r23 el coeficiente de correlación tc =

r−ρ 2

1− r n−2

r12.3 =

(1 − r )(1 − r ) 2 13

2 23

)

2

7

Tablas y Fórmulas Estadísticas MUESTREO ALEATORIO ESTRATIFICADO Afijación de la muestra proporcional

Afijación de la muestra óptima o Neyman     Nhσh   = n ⋅ nh  L   ∑ Nhσ h  h=1 

Nh

nh = n ⋅

L

∑ Nh h=1

Promedio aritmético estratificado

y st =

Proporción estratificada

L 1 L ∑ N h yh = ∑ Wh xh N h=1 h =1 N Wh = h N

Variancia del promedio estratificada

p$ st =

Variancia de la proporción estratificada

l

l

Var ( y st ) = ∑ Wh2 ⋅Var ( yh )

y =1

Tamaño de la muestra para proporciones

Tamaño de la muestra para la estimación de la media de la población

1 Wh2 sh2 1 V = ∑ − ∑ Wh sh2 n wh N

( )

Var ( p$ st ) = ∑ Wh2 ⋅Var p$ h

y =1

Wh2 sh2 ∑ wh n= 1 W 2 s2 V+ ∑ h h N wh

L 1 L ∑ N h p$ h = ∑ Wh p$ h N h=1 h =1

Proporcional: n=

∑ Wh ph qh n0 n0 = donde n V 1+ 0 N

Optimo supuesto:

n0

n= 1+

n0

1 ∑ Wh ph qh NV

(∑ W =

h

ph qh V

)

2

8

Tablas y Fórmulas Estadísticas MUESTREO POR CONGLOMERADOS Estimación del promedio

Estimación de una proporción

A

A

∑ yi

y =

∑ ai

i=1 A

i =1 A

p$ =

∑ mi

∑ mi

i=1

i =1

MODELOS DE CRECIMIENTO Modelo aritmético

Modelo geométrico

N t = N 0 (1 + rt )

N t = N 0 (1+ r )

t

1 N - N0 r= ⋅ t t N0

N  r= t  No

1/ t

-1

Modelo exponencial N t = N 0 e rt

 1  r = ln  N t  t  N0 

DISTRIBUCIONES DE PROBABILIDADES Distribución binomial  n f ( x ) =   p x q n − x x=0, 1,..., n  x

Distribución de Poisson x −λ

f ( x) =

Distribución hipergeométrica  D  N − D     x  n − x   f ( x) = N   n

x=0, 1, 2,..., min(n,D)

f

λe

x!

x=0, 1,...

Distribución geométrica ( x ) = q x −1 p x=1, 2,...

TEOREMA DE BAYES P( A) P( D / A) P( A D ) = P( A) P( D / A) + P( B) P( D / A) TECNICAS DE CONTEO Combinaciones

Permutaciones

n Pr =

n! (n − x)!

nCr =

n! r!(n − x)!

9

Tablas y Fórmulas Estadísticas 10 ANALISIS DE VARIANCIA A UNA VIA: DISEÑO COMPLETAMENTE ALEATORIZADO Media total

Suma de cuadrados total

r

r

c

SCT = ∑ ∑ ( xij − x ) 2

∑ ∑ xij

x=

c

i =1 j =1

i =1 j =1

n

Suma de cuadrados de los tratamientos

c

SCTR = ∑ rj ( x j − x ) j =1

2

Suma del cuadrado de error

r

c

SCE = ∑ ∑ ( xij − x j ) 2 i =1 j =1

Prueba para diferencias entre pares de medias Diseños balanceados Diseños no balanceados Criterio de Tukey

Diferencia mínima significativa

T = qα , c , n − c

CME R

DMS J , K =

1 1  + (CME ) Fα , c −1,n − c  rj rk 

Diferencia mínima significativa

DMS =

2( CME ) Fα ,1,n − c r ANALISIS DE VARIANCIA A DOS VÍAS: DISEÑO ALEATORIZADO EN BLOQUES

Suma de cuadrados de bloques r

SCBL = ∑ ci ( xi − x ) 2 i =1

Suma de cuadrados del error

SCE = SCT − SCTR − SCBL

Tablas y Fórmulas Estadísticas 11 PRUEBAS NO PARAMETRICAS Prueba U de Mann-Whitney

n1 ( n1 + 1) − ∑ R1 2

U1 = n1n2 +

Media y desviación estándar de la distribución muestral para la prueba U de Mann-Whitney

µu =

n2 ( n2 + 1) − ∑ R2 2

U 2 = n1n2 +

n1n2 ( n1 + n2 + 1)

σu = Valor Z para normalizar la prueba U de Mann-Whitney

Z=

n1n2 2

12

Prueba de independencia ChiCuadrada

U i − µu

2 χ obs

σu

rc

( Oi − E i ) 2

i =1

Ei

=∑

Coeficiente de correlación de Spearman Desviación normal para la prueba de rangos de Spearman

rs = 1 −

6∑ di2

(

Z = rs n − 1

)

n n2 − 1

Prueba de Kruskal-Wallis

12  Ri2  K= ∑  − 3( n + 1) n( n + 1)  ni  Valor crítico para la prueba de Kruskal-Wallis

Ck =

 n( n + 1)  χα , k −1   12   2

1 1  +   ni n j 