Herramientas Estadisticas para el Control de Procesos

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA INGENIERÍA EN INDUSTRIAS FORESTALES

HERRAMIENTAS ESTADISTICAS PARA EL CONTROL DE PROCESOS

IIN NG G.. E ED DU UA AR RD DO OD DIIA AZZ

LLIIC C .. D DA AN NIIE ELL R RU UIIZZ

CONTENIDO

Pag

INTRODUCCION

1

CAPITULO I

3

CONTROL DE CALIDAD

3

Objetivos

3

Introducción

3

Conceptos de calidad

4

Control de calidad

5

Principios del Control de Calidad

7

Funciones del Control de Calidad

8

Costos de Calidad CAPITULO II

10 15

MEJORAMIENTO CONTINUO E INNOVACIÓN

15

Investigaciones estadísticas

16

La Estadística en lo Analítico y en lo Enumerativo

17

Elementos Básicos sobre Variación

19

Clasificación de Procesos

22

El experimento de Deming

27

CAPITULO III. LA TEORIA MUESTRAL Necesidad de Muestreo Tipos de Muestreo Distribuciones Muestrales 1. Distribución muestral de medias 2. Distribución muestral para la diferencia de medias 3. Distribución muestral de proporciones y diferencias 4. Distribución muestral de varianzas Tamaño de la muestra

35 35 36 37 40 41 47 51 54 56

CAPITULO IV CONTROL ESTADISTICO DEL PROCESO Objetivos Introducción Métodos Estadísticos Cartas de control Diagrama Causa-Efecto Diagrama de Pareto Gráfico de corridas Histogramas de Frecuencia Análisis de Regresión

61 61 61 62 62 64 75 76 79 80 81

Ajustes de Curvas BIBLIOGRAFIA

94

INTRODUCCION

El presente trabajo representa un breve, general e introductorio tratado sobre herramientas estadísticas aplicables al control de procesos, como un material de apoyo dirigido a los gerentes. Es de hacer notar que este papel de trabajo está sujeto a revisión y que cualquier sugerencia al respecto será muy bien aceptada. Así mismo, es conveniente señalar que los autores no pretenden reclamar la autoría de algunos trabajos a los cuales se hace referencia, dado que los mismos son productos de congresos, seminarios, lecturas, cursos y de su experiencia profesional. De esta forma, lo original de este escrito consiste en haberlos recopilados y en presentarlos de una forma resumida como una guía de estudio. Este texto difiere de las publicaciones comunes de estadística y/o control de calidad porque su principal propósito es, además de conceptualizar el control de calidad, mostrar cómo aplicar la teoría estadística a problemas derivados de la experiencia del campo laboral. La estadística descriptiva, per sé no resuelve los problemas de producción y los métodos

estadísticos son herramientas que

ayudan a mejorar el proceso, dando objetividad a las observaciones y no servirían si no son utilizados apropiadamente. De esta forma, se dará mayor importancia a los hechos que a los conceptos abstractos, utilizando

cifras derivadas de

observaciones reales, aceptando como confiable la información proveniente de la distribución normal hacia la cual tiende las observaciones cuando son grandes.

Los métodos estadísticos constituyen un medio efectivo para controlar la calidad en el proceso de producción; sin embargo, "lo importante no es el conocimiento de los métodos estadísticos sino más bien la actitud mental hacia su utilización",(Kume, 1992; p.9)).

CAPITULO I. EL CONTROL DE LA CALIDAD

OBJETIVOS: Conocer los conceptos básicos aplicados en el control de calidad y familiarizar al lector con los principios, funciones y los costos que la calidad implica.

INTRODUCCIÓN: La finalidad de todo proceso industrial es la reproducción del prototipo de un producto. Cuando el producto está bien diseñado y se fabrica cumpliendo las normas establecidas, el mismo llenará las expectativas para el cual fue elaborado y para el usuario. En consecuencia, se hace necesario que todos los productos se fabriquen ajustados a las normas, el control de calidad interviene para asegurar el fiel cumplimiento de estas normas por el producto. Lógicamente no hay dos productos iguales, por lo que la calidad varía continuamente, dependiendo del nivel de refinamiento técnico alcanzado. Puesto que la calidad es variable, va en contraposición a la uniformidad y en la práctica esta situación se obvia llegando a la transacción entre ambos, estableciendo

límites

para

definir

las

variaciones

con

respecto

a

las

especificaciones cualitativas permisibles y tolerables en el producto final, sin desmedro del principio de normalización.

Sin embargo existen elementos perturbadores que impiden que la producción se ajuste lo mejor posible a las especificaciones cualitativas, tales como: 1.- Irregularidad en las máquinas 2.- Imprecisiones humanas 3.- Errores de los instrumentos de control 4.- Condiciones ambientales 5.- Otros La desviación cualitativa del producto representa un aumento de los costos puesto que implica un gasto extra de materia prima o de tiempo y trabajos para realizar las correcciones de los defectos del producto acabado. Este aumento de los costos de producción sumados a los retrasos de la producción, la disminución del prestigio de la empresa, etc. son hechos graves como para

no estudiarlos atentamente y buscar las medidas correctivas

necesarias.

El diseño de este trabajo bibliográfico va orientado a proporcionar los conocimientos mínimos necesarios que permitan comprender las técnicas estadísticas, metodología e interpretación y análisis de resultados. Para ello es necesario basarse en fundamentos de estadísticas matemáticas, así como en matemáticas avanzadas; sin embargo, la mayoría de las aplicaciones descritas sólo requieren de conocimientos aritméticos.

2.-

CONCEPTO DE CALIDAD

Calidad es la aptitud de un producto para satisfacer una necesidad al menor costo posible.

La calidad de un producto implica dos aspectos fundamentales: a.

Calidad del Diseño:

Es el grado de concordancia entre el diseño y el fin para el cual fue creado; en la medida que las características previstas, los materiales y las formas concebidas por el diseñador cumplen con las necesidades del usuario.

b.

Calidad del Producto:

Es el grado de concordancia entre el producto y sus especificaciones. Siendo el grado en el que el proceso de manufactura y mano de obra han reproducido el producto lo más cercano del diseño original.

3.-

CONTROL DE CALIDAD:

Es el proceso mediante el cual se miden las características de un producto, se comparan los valores con las normas establecidas y se adoptan las medidas correctivas convenientes cuando no se ajustan a las normas.

La definición previa de Calidad tiene varias implicaciones y una de ellas es que con el sólo control estadístico no es posible alcanzar la satisfacción del consumidor, por lo tanto para alcanzar esta calidad se requiere además: 1.

Una adecuada investigación de mercado (calidad de investigación del mercado).

2.

Un producto con un diseño acorde (calidad de diseño).

3.

Un producto fiel al diseño del prototipo (calidad de fabricación o concordancia).

4.

Un producto al alcance del consumidor oportunamente (calidad de distribución).

5.

Un producto con adecuados componentes de reemplazo (calidad de servicio). De esta forma la calidad es una resultante de todos estos elementos

mencionados, que para ser alcanzada requiere de un control total de la calidad. Entre estos controles se pueden establecer (ver figura 1): Control Dinámico de la Calidad: Realizado estrictamente sobre el proceso de fabricación. Control Estático de la Calidad: Aplicado a los productos semi-elaborados y productos terminados.

ENTRADA MATERIA PRIMA

PROCESO DE FABRICACION

CONTROL DINAMICO

CONTROL ESTATICO

FIGURA 1. GRAFICO DE LOS TIPOS DE CONTROL

PRODUCTO FINAL

PRINCIPIOS DEL CONTROL DE CALIDAD 1. Con el control de calidad no se obtiene calidad del producto; ésta es una característica inherente al producto mismo. Esto es evidente, para obtener un buen nivel de calidad hay que fabricarlo puesto que el control de calidad no agrega calidad a los productos. 2. El equipo productor es el responsable directo de la calidad del producto de acuerdo a las directrices que el control de calidad establece. 3. No resuelve problemas de fabricación, sólo da las razones para estudiarlos. Es muy importante que el equipo productor sepa qué problemas existen y en qué sentido se manifiestan para lograr un buen nivel de calidad en la fabricación. 4. Las decisiones deben tomarse sobre la base de datos reales, la confiabilidad de los datos registrados es el punto inicial para todo análisis e interpretación de resultado. 5. Los datos deben ser compatibles y estar dispuestos de manera tal, que permitan su análisis. Esto permitirá el empleo de algunas herramientas estadísticas de las cuales el control de calidad hace uso. 6. El control de calidad debe ser activo, debe prevenir la ocurrencia de errores o defectos, mantener regulados y bajo control los procesos, evitar el desperdicio, el reproceso, las devoluciones y tomar las medidas correctivas oportunamente.

FUNCIONES DEL CONTROL DE CALIDAD: Antes de iniciar la fabricación de un producto, se requiere fijar las especificaciones de lo que se va a hacer. Después, viene la manufactura real de este producto y finalmente la comprobación para verificar si está de acuerdo con lo especificado. Al pensar en todos los puntos relacionados con la calidad es conveniente hacerlo en término de estas tres funciones: Especificación, fabricación e inspección. El control de calidad estadístico debe ser considerado como un grupo de herramientas, que pueden influir en las decisiones relacionadas con estas funciones. Mientras más personas existan en cargos de supervisión de inspección, de supervisión de producción, de ingeniería de métodos, de ingeniería de diseño y de nivel gerencial, que comprendan los principios básicos de control de calidad estadístico, mayor será la probabilidad de emplear efectivamente estas técnicas en una organización. Entre las funciones básicas del control de calidad relacionadas con las funciones de especificar, fabricar e inspeccionar un producto tenemos: 1. Intervenir en la estipulación de

la calidad de diseño mediante la

realización de normas de control, preparación de prescripciones etc. Esta no es una función exclusiva de control de calidad, pues intervienen otros departamentos, pero jamás debe realizarse un diseño sin la intervención del departamento de control de calidad. 2. Ejercer el control dinámico de la calidad mediante el control durante el proceso de fabricación, con el propósito de obtener productos de acuerdo al diseño, evitando la fabricación de piezas defectuosas.

3. Ejercer el control estático de la calidad mediante el establecimiento del control de entrada y de salida con el propósito de vigilar el producto terminado o la materia prima para otros sectores de la planta.

TAREAS ESPECIFICAS DE UN PROGRAMA DE CONTROL DE CALIDAD A continuación figuran tareas específicas que pueden cumplirse como parte de un programa de control de calidad. a. Determinar las condiciones que deben cumplir los diseños, los proyectos y las especificaciones para satisfacer las normas de calidad y a su vez verificar que se cumplan los procedimientos establecidos. b. Planificar las herramientas, los instrumentos de medición y el equipo de control necesario para medir las características del producto. Así mismo verificar que los instrumentos de medición estén calibrados. c. Establecer procedimientos de control de calidad, basados en la estadística sobre las operaciones de fabricación, así como

para las

piezas, materiales y muestreos de recepción. d. Crear un sistema para inscribir en un registro los defectos en materia de calidad y para inscribir datos sobre seguimiento de las medidas correctoras adoptadas, igualmente recoger las informaciones que puedan proporcionar mejoras al proceso de fabricación. e. Proporcionar formación para el personal de inspección, de pruebas, etc. f. Establecer los costos de control de calidad.

COSTOS DE CALIDAD Cada uno de los departamentos de una organización debe ser capaz de justificar su existencia midiendo sus costos y comparándolos con la contribución que aporta al cumplimiento de los objetivos de la compañía y a la obtención de beneficios. El departamento de control de calidad no es una excepción. Por consiguiente, es importante determinar el costo general del control de calidad. Mejorar el nivel de calidad de un producto hace que el costo de producción del mismo se eleve, lógicamente se convierte en un aspecto que debe ser estudiado detenidamente. En la práctica siempre hay un nivel de rechazos óptimo para un proceso dado, por lo que carece de sentido esforzarse por reducir los rechazos. Por lo tanto la calidad de un producto debe ser controlada a una tolerancia dada y para cierto nivel de rechazos, para obtener la relación de compromiso requerida, pretender mejorar la calidad más allá de este nivel es, hacer la producción anti-económica. El costo total del control de calidad bien puede ser analizado o determinado, agrupando los costos en cuatro categorías (ver figura 2) .

CATEGORIAS DE COSTOS DE CALIDAD

COSTO DE PREVENCION

COSTO DE EVALUACION

DEFECTOS DENTRO DE LA ORGANIZACION

Figura 2: CATEGORIAS DE COSTOS DE CALIDAD

DEFECTOS FUERA DE LA ORGANIZACION

1.

Prevención.- Los costos de prevención son los de planificación y

aplicación del programa de calidad antes de la fabricación del producto. A continuación se dan ejemplos de tareas que pueden clasificarse como de prevención de defectos. a) Revisión del diseño. b) Programas de formación y titularización de trabajadores. c) Calificación de proveedores antes de la subcontratación. d) Medios mecánicos para el control de calidad, incluido el diseño de equipos y herramientas especiales. e) Control de los procesos para asegurar que los procesos de fabricación corresponden a las tolerancias establecidas para el producto. 2. Costo de evaluación. Los costos de evaluación son los gastos en que se incurre para medir la conformidad del producto con las normas; incluidas las inspecciones y pruebas. A continuación se dan ejemplos de tareas cuyo costo puede incluirse en esta categoría: a)

Inspección y prueba de las piezas y materiales suministrados por

proveedores. b)

Inspección y prueba de materiales, piezas, montajes parciales o

productos completos fabricados en la empresa. c)

Costo de los productos destruidos o dañados para realizar pruebas

que destruyen en material o determinan su período de vida.

d)

Calibración y conservación de instrumentos y equipos de medición.

e)

Compilación, registro y comunicación de datos sobre cuestiones de

calidad. 3. Defectos dentro de la organización.- Los defectos dentro de la organización son aquellos que se producen antes de la expedición (o mientras el producto sigue perteneciendo a la compañía productora). Estos costos son el resultado de productos defectuosos (productos que no cumplen las normas). Entran en esta categoría los costos siguientes: a) Sustitución de piezas defectuosas. b) Costos de reparación. c) Costos de recepción y trámite de las quejas. d) Responsabilidad del fabricante por los peligros que puede suponer el producto, generalmente en forma de litigios o costo del seguro de responsabilidad civil. e) Pérdida de pedidos futuros o daño para la reputación de la empresa por los defectos comprados por los clientes. 4.-Defectos fuera de la organización: Se incluyen en esta categoría los costos relacionados con los defectos que se revelan una vez que el producto es propiedad del cliente. Se incluyen los siguientes costos: a) Sustitución de piezas defectuosas. b) Costos de reparación. c) Costos de recepción y trámites de reclamos. d) Costos legales y/o seguros. e) Pérdida de futuros pedidos y daños a la reputación de la empresa.

Los costos de prevención y evaluación constituyen los costos directos del control de calidad. Por otra parte tenemos a los costos por defectos, tanto dentro como fuera de la organización, que serían los costos indirectos. (ver figura 3). A medida que los costos directos se reducen, aumenta el número de defectos y a medida que aumenta el nivel de éstos, aumenta el costo por defectos. Los costos totales del control de calidad son la suma de los costos directos y de los costos por defectos o costos indirectos. En el valor mínimo de la curva de costos totales, se sitúa la combinación óptima de esfuerzos.

COSTOS POR CONCEPTO DE CALIDAD

COSTOS TOTALES

COSTOS INDIRECTOS

COSTOS DIRECTOS

AUMENTO DE DEFECTOS NIVEL DE DEFECTOS DEL PRODUCTO

FIGURA 3. INCIDENCIA DE LOS COSTOS SOBRE LA CALIDAD.

El control de la calidad debe efectuarse sin perder de vista los costos que implica y los beneficios que de su aplicación se deriven. Generalmente el control total de la calidad conduce a una reducción paulatina de los costos totales de la calidad en una empresa haciendo énfasis en la prevención de la ocurrencia de defectos más que en cualquier otro caso. Los costos de prevención representan el 5% del costo total de la calidad, en contraste con los costos por fallas, los cuales alcanzan

entre el 70 y 80%

aproximadamente. Los costos de inspección representan entre el 15 y 25%.

CAPITULO II CALIDAD TOTAL. MEJORAMIENTO CONTINUO E INNOVACIÓN El quinto de los 14 postulados de Deming, también conocido como el padre del concepto de calidad total, aboga por la mejoría constante y continua de todos los procesos de planificación, producción y servicio. El mejoramiento continuo disminuye el desperdicio, disminuye costos y aumenta la productividad y crea condiciones para el disfrute del trabajo. Mejorar continuamente e innovar en las organizaciones de las que formamos parte, es contribuir a la construcción de un mundo mejor. ESTADISTICA SEGÚN FEDERER (1973).

Es la ciencia que se ocupa de la caracterización, el desarrollo y la aplicación de técnicas para: 1. El diseño estadístico de una investigación, bien sea un experimento comparativo, una encuesta por muestreo, un estudio de observación o un estudio de construcción de un modelo estocástico. 2. El resumen de los hechos de investigación 3. Las inferencias que se pueden formular a partir de los hechos de la investigación, sobre la población bajo estudio.

INVESTIGACIONES ESTADÍSTICAS.

Los estudios estadísticos de carácter empírico se pueden clasificar de acuerdo a la finalidad que persiguen en dos tipos: Estudios Enumerativos: Aquellos en los cuales se estudia un marco específico con la finalidad de actuar sobre los elementos que lo conforman. (Inferencia Estadística). Estudios Analíticos: Aquellos en los cuales el objetivo es actuar sobre el sistema de causas o proceso que produjo los elementos del marco estudiado. (Diseño Estadístico). La figura que se presenta en la página siguiente ilustra este proceso

UNIVERSO MARCO Unidad

Características

nos interesamos en

X, Y, . . ., Z

SISTEMA DE CAUSAS Cuya medición u observación genera:

Población de valores Observados o medidos De la característica

...

Población Multivariante

ó

Y ...

(X,Y,...,Z) Z

X

Procesos y características de calidad.

SISTEMA

Red interdependiente de componentes que actúan conjuntamente para lograr el fin del sistema Actividad de la organización Donde se identifican: 1) Entradas

Proceso A

2) Actividades de transformación y 3) Salidas

Proceso B Característica X . . Característica Z

Proceso K

Propiedades de las entradas, actividades de transformación y salidas que otorgan a estas carácter distintivo

Esquema de un proceso. E (entradas) Personas Métodos Ambiente Equipos Servicios Materiales

Proceso P

S (Salidas) Personas Métodos Ambiente Equipos Servicios Materiales

VARIACION. Fenómeno que se manifiesta en la incapacidad de un sistema, proceso, persona, etc. para reproducir exactamente un comportamiento dado, aún bajo condiciones aparentemente semejantes. ELEMENTOS BASICOS SOBRE VARIACION. ( Joiner & Gaudard). •

La variación es causal

•

Hay distintos tipos de variación

•

La eliminación o atenuación de cada tipo de causa demanda de acciones radicalmente distintas

•

Un sistema es estable cuando solo obedece a causas comunes

•

La cantidad de variación se puede medir estadísticamente

Causas comunes: •

Multitud de factores que siempre están presentes y que contribuyen en diversos grados a cambios pequeños y aparentemente aleatorios en el resultado de un proceso.

•

Su agregación resulta en lo que podemos denominar la variación del sistema.

Causas especiales: •

Factores que actúan esporádicamente sobre el sistema agregando variación adicional sobre la variación del sistema.

•

Manifestaciones extremas

•

Causas asignables.

Causas distintas requieren acciones Distintas. •

Asunto crítico

•

La diferencia más importante es entre causas comunes y causas especiales

•

Estrategia para eliminar causas especiales:

-

Obtener datos oportunos

-

Prestar atención a señales de posibles causas especiales

-

Investigar su origen

-

Tomar previsiones para que lo malo no recurra

-

Tomar previsiones para que lo bueno siga ocurriendo

•

Estrategia para mejorar un sistema de causas comunes:

-

Todos los datos son importantes

-

Conocimiento íntimo del sistema

Interferencias Innecesarias. •

Ajustes innecesarios efectuados para compensar o “corregir” la variación del sistema y que agregan más variación. (ver experimento de Deming).

•

Exacerbar en lugar de mejorar

•

Tratar todo como si fuera el resultado de causas especiales (querer explicar todo)

•

Errores comunes:

-

Examinar las últimas cifras

-

Suponer que todo lo bueno o malo se debe a la actuación de las personas Los gráficos y figuras que se muestran a continuación ilustran estos

procedimientos:

OTRA VISUALIZACIÓN DEL MEJORAMIENTO NIVEL Y / O VARIABILIDAD

CLASIFICACION DE PROCESOS

1. Estado Ideal. Proceso bajo control Estadístico y Producción conforme al 100%.

2. Estado de Caos. Proceso fuera de control Estadístico y Producción conforme menor del 100%.

4. Próximo al Estado del Caos. Proceso fuera del Control Estadístico y producción conforme al 100%

5. Próximo al Estado Ideal. Proceso bajo control Estadístico y producción Conforme menor del 100%.

Experimento de Deming.

“ Una función de los métodos estadísticos es la de diseñar experimentos y utilizar la experiencia relevante de forma que resulte

eficaz. Cualquier intento de utilizar la experiencia

relevante sin un plan que se base en la teoría, es disfrazar la racionalización de una decisión que ya ha sido tomada.1

EXPERIMENTO DE SIMULACIÓN

Zk 0 Blanco

1

Deming. Fuera de la crisis. 1984. p. 312

X

Posición de la esfera, resultante en el lanzamiento K esimo

Reglas para ajustar el embudo. Se pretende que al dejar caer la esfera a través del embudo, coincida con el blanco

Regla No. 1.- Mantener el embudo fijo apuntando al blanco en todos los lanzamientos. Regla No. 2.- Desplazar el embudo a una distancia – z k de su última posición para el lanzamiento (k + 1). Regla No. 3.- Desplazar el embudo a una distancia – z k del blanco para el lanzamiento (k + 1) ésimo. Regla No. 4.- Colocar el embudo sobre la posición que ocupó La esfera en el último lanzamiento.

En las próximas páginas se observa el efecto gráficamente.

CAPITULO III. TEORIA MUESTRAL

La teoría de muestreo se refiere al estudio de las relaciones que existen entre un colectivo o población y las muestras que se extraen de las mismas. El estudio de las muestras permite hacer estimaciones de características desconocidas de la población (tales como media, desviación típica, proporciones, etc). Estas estimaciones se hacen a partir del conocimiento de las características de las muestras (media, desviación típica, proporción, etc). Las características o medidas obtenidas de una muestra se llaman estadísticos; y las medidas correspondientes a la población parámetros. Cuando una medida muestral o estadístico es utilizada como representante de una característica poblacional o parámetro se denomina estimador. Ventajas de la utilización de las muestras 1) El costo es menor y se puede obtener un mejor rendimiento del dinero invertido. 2) Se obtiene una disminución notable del tiempo necesario para alcanzar la información Cuando una muestra posee 30 o más datos se denomina grandes muestras y si la muestra tiene menos de 30 observaciones se denomina pequeñas muestras.

Se denomina muestreo al procedimiento utilizado para elegir una muestra

Necesidad del Muestreo. 1. Población Infinita 2. Población uniforme 3. Proceso de investigación destructiva 4. Economía de costos 5. Calidad Muestreo con o sin reemplazamiento: •

Con reemplazamiento cuando un elemento de la población puede ser escogido varias veces para formar parte de la muestra

•

Sin reemplazamiento cuando un elemento de la población solo puede ser seleccionado una sola vez para formar parte de la muestra. Población: es una colección de todos los elementos que estamos

estudiando y acerca de los cuales se intenta extraer conclusiones. Puede ser infinita o finita. Muestra: Una parte de la población o un subconjunto del conjunto de unidades obtenidas con el objeto de investigar las propiedades de la población. Muestreo estadístico: Es un enfoque sistemático para seleccionar unos cuantos elementos (una muestra) de un grupo de datos (población) a fin de hacer algunas inferencias sobre el grupo total. Desde el punto de vista matemático, podemos describir las muestras y las poblaciones

mediante

medidas como la media, la moda, la desviación estándar, etc. No es mas que el procedimiento a través del cual se obtienen las muestras.

Tipos de muestreo Muestreo de juicio o no probabilístico. (opinático). Se basa en el conocimiento de la población por parte de alguien, quien hace a la muestra representativa, dependiendo de su intención, por lo tanto es subjetiva. Probabilístico (Errático): Todos los elementos de la población tienen la posibilidad de pertenecer a la muestra. Muestreo Aleatorio: 1.

Muestreo aleatorio simple

2.

Muestreo Sistemático.

3.

Muestreo Estratificado

4.

Muestreo por Conglomerado

Muestreo de juicio: A través

del conocimiento y la opinión personal,

basada en la experiencia del investigador, se identifican los elementos de la población que van a formar parte de la muestra. Una muestra seleccionada por muestreo de juicio

se basa en el conocimiento de la población por parte de

alguien. Por ejemplo, un guardabosques tomará una muestra de juicio si decide con antelación que parte de una gran zona reforestada deberá recorrer para estimar el total de metros de madera que pueden cortarse. En ocasiones el muestreo de juicio sirve de muestra piloto para decidir cómo seleccionar después una muestra aleatoria. Muestreo aleatorio: Cuando se conoce la

probabilidad de que un

elemento de la población figure o no en la muestra, puede ser:

Muestreo Aleatorio Simple (Irrestrictamente Aleatorio): Un muestreo es aleatorio cuando cada elemento de la población tiene la misma probabilidad de ser escogido para formar parte de la muestra. Este tipo de muestreo evita que la muestra sea sesgada evitando por lo tanto que se realice una mala inferencia estadística. Por ejemplo, supóngase que un investigador quiera estimar

el módulo de ruptura promedio

de un material determinado

formado por una población de tamaño N = 500; por ser ensayos destructivos este quiere seleccionar una muestra de tamaño n = 10 que le permita realizar la inferencia, ahora bien el criterio que usó el investigador para seleccionar dicha muestra fue el de tomar 10 materiales que estaban más próximos a él; evidentemente esta muestra no es representativa de la población, se dice que esta sesgada, por lo que la inferencia estadística que se realice será errónea. Por lo tanto, una muestra se dice que esta sesgada cuando los elementos seleccionados tenían mayor probabilidad de pertenecer a la misma. La forma más fácil de realizarlo es usando números aleatorios, para esto se puede recurrir a una tabla o a un generador de números aleatorios. Actualmente, se recurre a computadora. Muestreo Sistemático o Secuencial. Los elementos se seleccionan de la población con un intervalo uniforme en el tiempo, en el orden o en el espacio. Por ejemplo, supongamos que se quiere estudiar una determinada característica de un producto fabricado en serie y se decide seleccionar a cada veinte producto hasta formar la muestra, para esto se escoge un punto aleatorio de arranque en los primeros veinte productos y luego se escoge cada vigésimo producto hasta completar la muestra. Una de las ventajas de este muestreo es cuando los elementos presentan un patrón secuencial, tal vez

requiera menos tiempo y algunas veces cuesta menos que el método de muestreo aleatorio. Muestreo Estratificado. Para aplicar el muestreo estratificado, se divide la población en grupos homogéneos, llamados estratos, los cuales son heterógeneos entre si. Después se recurre a uno de dos métodos posibles: a)

Se selecciona al azar en cada estrato un número especificado

de elementos correspondientes a la proporción del estrato de la población total b)

Se extrae al azar un número igual de elementos de cada

estrato y damos un peso a los resultados de acuerdo a la proporción del estrato en la población total El muestreo estratificado es adecuado cuando la población ya está dividida en grupos de diferentes tamaños y queremos reconocer este hecho. La ventaja de las muestras estratificadas, es que cuando se diseñan bien, reflejan más exactamente las características de la población de donde se extrajeron que otras clases de muestreo. Muestreo por Conglomerado. En el muestreo por conglomerados, se divide la población en grupos o conglomerados de elementos heterogéneos, pero homogéneos con respecto a los grupos entre si. Un procedimiento bien diseñado, de muestreo por conglomerados, puede producir una muestra más precisa a un costo mucho menor que el de un simple muestreo aleatorio. Se usa el muestreo estratificado cuando cada grupo presenta una pequeña variación en su interior, pero existe una amplia variación entre ellos. Se usa el muestreo por conglomerado en el caso contrario, cuando

hay considerable variación dentro de cada grupo pero los grupos son esencialmente semejantes entre sí. DISTRIBUCIONES MUESTRALES 1 Distribución muestral de medias 2 Distribución muestral para diferencias de medias 3 Distribución muestral de proporciones y diferencias 4 Distribución muestral de varianzas Se define la distribución muestral de un estadístico (distribución de muestreo) en una población, como la distribución de probabilidad de todos los posibles valores que un estadístico puede asumir para cierto tamaño de la muestra. Específicamente, se trabajará con las distribuciones muestrales para: medias, proporciones y varianzas. Una distribución muestral es una distribución de probabilidad de un estadístico muestral calculado a partir de todas las muestras posibles de tamaño n, elegidas al azar en una población determinada. Si la población es infinita, tenemos que concebir la distribución muestral como una distribución muestral teórica, ya que es imposible sacar todas las muestras aleatorias posibles de tamaño n de una población infinita. Si la población es finita y moderada se puede construir una distribución muestral experimental, sacando todas las muestras posibles de un tamaño dado, calculando para cada muestra el valor del estadístico que nos interesa. Ejemplo, supongamos que se tiene una población de tamaño N = 10 y queremos extraer con reemplazamiento todas las muestras posibles de tamaño n = 5, para esto se utiliza la relación Nn , es decir, 105 = 100000 muestras de tamaño n = 5.

En cambio, si el muestreo es sin reemplazamiento, el número de muestras de tamaño n = 5 viene dado por la combinatoria:

 N N! 10! 10.9.8.7.6.5!   = = = = 252 muestras. n  n!(N − n)! 5!(10−5)1 5!.5.4.3.2.1

En el caso anterior la distribución muestral para un estadístico determinado, la v media aritmética ( X )viena dada por:

:

muestra 1

→ X1

muestra 2

→ X2

M muestra 252 → X 252

Por lo tanto, X1 , X 2 , X 3 , K , X 252 conforman la distibución muestral de medias.

Se puede hacer una aproximación experimental de distribuciones muestrales basadas en poblaciones infinitas o finitas grandes, sacando un número de muestras aleatorias y siguiendo el mismo procedimiento anterior. 1) DISTRIBUCIÓN MUESTRAL DE MEDIAS: Es la distribución de probabilidad de todas las medias posibles de

las

muestras, para un tamaño n determinado. Ver ejemplo, anterior. Esta distribución de probabilidad tiene asociados (parámetros) tales como la media µ X y

desviación estándar σ X . Para calcular, estos parámetros de la distribución muestral de medias se utilizan las siguientes relaciones:

µX = µ σX =

σ N −n para poblaciones finitas − N 1 n

σX =

σ para poblaciones infinitas n

La expresión

σ

X

=

σ n

Es la desviación estándar de la distribución muestral de medias, se le llama error típico o estándar de la media y nos indica la diferencia promedio entre los diversos valores de X y µ . Como se observa, a medida que el tamaño de la muestra aumenta este error disminuye, las diversas medias muestrales se hacen más uniforme en su valor, y en consecuencia, cualquier media muestral es una buena estimación de la media poblacional µ. Anteriormente se mostró la manera de calcular la media y la desviación estándar de la distribución de las medias muestrales. Ahora se va a distinguir dos situaciones: a)

Muestreo en una población distribuida normalmente: Si X es la

media de la muestra aleatoria de tamaño n, tomada de una población distribuida

rmalmente, con media muestral de X

µ

σ y desviación típica

n

, entonces la distribución

está normalmente distribuida. Para hallar la probabilidad asociada

a X , se transforman los valores de X

a valores de la distribución normal

estandarizada, mediante la fórmula:

Z=

X-µ σ/ n

Ejemplo: Cierta marca de neumáticos tiene una vida útil media de 21.000 Km con una desviación típica de 800 Km. a. suponiendo que las vida útil de los neumáticos están distribuidas normalmente. ¿Cuál es la probabilidad de que un neumático cualquiera dure menos de 20.900 Km? b. ¿Cuál es la probabilidad de que la vida útil media de 64 neumáticos sea inferior a 20.900 Km?

Solución: 1. Como la variable X = vida útil de los neumáticos, está distribuida normalmente. Entonces la probabilidad de que un neumático cualquiera dure menos de 20.900 km se calcula de la forma siguiente:

Estandarización

20.900 21.000

-0,13

0

20.900 − 21.000   P ( X ≤ 20.900) = P Z ≤  = P(Z ≤ −0,13) =0,4483 800   Es decir, el porcentaje de que un neumático tenga una vida útil menor que 20.900 Km es de 44,83 %. Para calcular esta probabilidad, se recurre a una tabla de distribución normal estandarizada. 2. Si se seleccionan todas las muestras posibles de tamaño 64 de la población de neumáticos, entonces por lo anteriormente mencionado esta distribución muestral de medias es normal, con media y desviación típica igual a 21.000 Km y 100 Km respectivamente. Luego la probabilidad de que la vida útil media de 64 neumáticos sea inferior a 20.900 Km se calcula de la forma siguiente:

 20.900 − 21.000  P ( X ≤ 20.900) = P Z ≤  = P(Z ≤ −1) = 0,1587 800 / 64  

Por lo que el porcentaje de que la vida útil media de 64 neumáticos sea inferior a 20.900 Km es de 15,87 %.

b) Distribución en poblaciones que no están distribuidas normalmente. Existen métodos que se pueden emplear cuando se necesita hacer inferencia sobre este tipo de población. Una solución usada con frecuencia es que se extraiga una muestra grande. Una vez extraído ese n grande, el investigador puede utilizar el Teorema del Límite Central,

el cual se enuncia a

continuación: “sin tomar en cuenta la forma funcional de la población de donde se extrae la muestra, la distribución de medias muestrales, calculadas con muestras de tamaño n extraídas de una población con media µ y desviación estándar σ, se aproxima a una distribución normal con media µ y desviación σ / n , cuando n aumenta. Si n es grande, la distribución de las medias muestrales puede aproximarse mucho a una distribución normal”. Este teorema expresa que sin tomar en cuenta la forma de la población que se está estudiando, se puede seguir empleando la teoría normal para obtener inferencias sobre la media poblacional a condición de que obtengamos una muestra grande, porque la distribución muestral de X será aproximadamente normal cuando n sea grande. Generalmente, muchos investigadores consideran que a partir de n = 30 se puede usar el teorema del Límite Central. Ejemplo: Una empresa emplea 1500 personas. La cantidad promedio gastada durante un año determinado, en servicios médicos personales por empleados fue de 25,75 $ y la desviación estándar de 5,25 $. ¿Cuál es la probabilidad de que una muestra de 100 empleados arroje una media comprendida entre 25 y 27 $?. En este problema no se específica si la población es normal, pero como el tamaño de la muestra n = 100 > 30 podemos aplicar el teorema del límite central, por lo

que la distribución muestral de X es aproximadamente normal y por lo tanto podemos hallar su probabilidad, esto es:  25 − 25,75 27 − 25,75   = P(− 1,48 ≤ Z ≤ 2,46 ) =0.9237 P (25 ≤ X ≤ 27) = P ≤Z≤ 5 , 25 / 100 5 , 25 / 100   Es decir, se tiene un porcentaje del 92,37 % de que el promedio de gastos médicos por empleado durante un año este entre 25 y 27 $. está distribuido según la distribución t de Student con v = n1 + n2 –2 grados de libertad. c) Distribución t de student: Esta distribución permite realizar inferencias sobre medias poblacionales cuando se desconoce la varianza de la población con muestras de tamaño n < 30. En consecuencia para hallar la probabilidad asociada a t transformamos los valores t (de la distribución normal) a valores de la distribución normal estandarizada mediante la siguiente fórmula:

t=

X-µ S/

n

Para hallar la probabilidad asociada a t se usa la tabla de distribución de Student. Características de la distribución t: a) tiene forma de campana como la distribución normal, solo que es más ancha en las colas (mayor área)

b) los grados de libetad vienen dados por: v = n-1 c) Se aproxima a la normal a medida que aumentan los grados de libertad. Ejemplo: Considerando el ejemplo anterior, con

µ = 25, 75 $ y σ

desconocida. ¿Cuál es la probabilidad de que una muestra de 20 empleados, con una desviación de 5 $, arroje una media comprendida entre 25 y 27 $ ?. Solución: Como n < 30

y

σ es desconocida, se tienen pequeñas

muestras, por lo que se utiliza la distribución t de Student:     25 − 25,75 X − µ 27 − 25,75   P (25 ≤ X ≤ 27) = P ≤ ≤ = P(− 1,12 ≤ t ≤ 1,12 ) = 0,72 S  5 / 20 5 / 20    n  

Es decir, se tiene una probabilidad de 0,72 (72 %) de que la media de gastos médicos por empleado para una muestra de tamaño n = 20 está entre 25 y 27 $. 2) DISTRIBUCIÓN MUESTRAL PARA LA DIFERENCIA DE MEDIAS

(

X 1 − X 2 ).-

A veces interesa hacer inferencias sobre la diferencia poblacional de medias µ1 - µ2, o saber si es razonable concluir que dos medias poblacionales no

son iguales, considerando que se tienen sendas muestras para las poblaciones 1 y 2, respectivamente, donde: Entonces, la diferencia de las medias muestrales X 1 − X 2 , estima a

µ1 -

µ2. La forma funcional de la distribución muestral de X 1 − X 2 depende de la forma funcional de las poblaciones donde se extraen las muestras tomando en cuenta: •

Si ambas poblaciones son normales la distribución muestral de la diferencia de medias es normal.

•

Si una o ambas de las poblaciones no es normal, la distribución muestral de las diferencias de medias X 1 − X 2 es normal si n1 + n2 – 2 >30 (grandes muestras), este resultado se deduce del teorema del límite central.

En estos casos, los parámetros que definen esta distribución muestral de las diferencias de medias vienen dados por:

µ X − X = µ1 − µ 2 1

2

σ X −X 1

σ 12 σ 2 2 = + n1 n2

El cual se aplica para dos casos específicos dependiendo de la muestra: a) Para grandes muestras, cuando v = n1+n2 - 2 > 30, se trabaja con la distribución normal. En estos casos, estandarizando la diferencia medias muestrales, se tiene:

de

Z=

( X 1 − X 2 ) − ( µ1 − µ 2 )

σ 12 σ 2 2 + n1 n2

Ejemplo: La siguiente tabla nos muestra información del tiempo medio en minutos que tarda un cliente en ser atendido en dos bancos:

Banco A

Banco B

σ A2 = 3 min µ A = 14 min n A = 20

σ B2 = 5 min µ B = 13 min nB = 13

Hallar la probabilidad de que la diferencia media entre los dos bancos no exceda de 2 minutos. Solución: como los grados de libertad 20 + 13 –2 =33 – 2=31 > 30, se tienen grandes muestras se trabaja con la distribución normal:

     ( X A − X B ) − (µ A − µB ) 2 − (µ A − µ B )  1   = P Z ≤ P ( X A − X B ≤ 2) = P ≤  = P(Z ≤ 1,37) =  0,73  3 5   σ A2 σ B2  + +  20 13  n n A B  0, 9146 Existe un 91,46 % que la diferencia media entre los dos bancos no exceda de 2 minutos.

b) Para pequeñas muestras, Cuando v = n1 + n2 –2 < 30, se trabaja con la Distribución t de Student. Por lo tanto, el valor viene dado por:

t=

( X 1 − X 2 ) − ( µ1 − µ 2 ) 2

Sp

+

n1

Sp

2

n2

donde: 2

Sp

2

(n − 1) S1 + (n 2 − 1) S 2 = 1 n1 + n 2 − 2

2

Ejemplo: Considerando los ingresos mensuales de empleados de dos empresas, se tiene información de dos muestras mediante la siguiente tabla: Empresa 1 S12 = 400000000 Bs

µ1 = 180000 Bs n1 = 20

Empresa 2 S 22 = 342250000 Bs

µ 2 = 210000 Bs n 2 = 10

Hallar la probabilidad de que la diferencia de medias muestrales sea a lo menos 3500.

Solución: : como los grados de libertad 20 + 10 –2 =30 – 2=28 < 30, se tienen pequeñas muestras se trabaja con la distribución t de Student:

   ( X − X ) − (µ − µ ) A B 1 2 ≥ P ( X 1 − X 2 ≥ 3500) = P 2 2  Sp Sp +  n1 n2  donde S p2 =

   3500 + 30000 33500    = P(t ≥ 4,43)  = P t ≥ 7564,10  381437500 381437500   +  20 10 

19..400000000 + 9.342250000 = 381437500 28

Entonces para v = 28 gl y usando la tabla t de Student:

P ( Xˆ 1 − Xˆ 2 ≥ 3500) = P(t ≥ 4,43) = 0,99 Es decir, la probabilidad de que la diferencia media de los salarios sea mayor que 3500 es del 0,99. ) 3). DISTRIBUCIÓN DE UNA PROPORCION MUESTRAL ( P ).Se define una proporción poblacional como el cociente:

p=

número de casos favorables total de casos

Por ejemplo: si de una población de N = 50, empleados de una empresa, 15 de ellos no cumplen con su horario de trabajo, la proporción de empleados que no cumplen horario con relación al total, viene dado:

P = 15/50 = 0,3; es decir, el 30 % de los empleados no cumplen su horario. La proporción muestral ( pˆ ), se define como:

pˆ =

número de casos favorables tamaño de la muestra

Ejemplo: Si se toma una muestra aleatoria de tamaño n = 1000 y 425 personas satisfacen un evento, entonces p = 425 / 1000 = 0,425. Esto significa que el 42,5 % de las personas satisfacen dicho evento. La distribución de una proporción muestral, se define de una manera análoga a a la distribución de media, o sea: Muestra 1---- pˆ1 Muestra 2---- pˆ 2 Muestra 3---- pˆ 3 Muestra X---- pˆ k De esta forma: pˆ1 , pˆ 2 , pˆ 3 ,..., pˆ k corresponden a la distribución de una proporción muestral. De acuerdo a lo expuesto, la distribución muestral de proporciones corresponde a una distribución de probabilidad de todas las proporciones posibles de las muestras, para un tamaño n determinado. Los parámetros que definen esta distribución vienen dados por:

µ pˆ = µ p = P N −n N −1

σX =

p.q n

σX =

p.q para poblacione s infinitas n

para poblacione s finitas

Para el cálculo de probabilidades relativa a proporciones, se trabaja de manera análoga al caso de la distribución muestral de medias. Ejemplo: Un encuestador sabe que en cierta área el 20 % está a favor de las emisiones en bonos. Considerando una muestra de 64 personas, hallar la probabilidad de que la proporción muestral difiera de la proporción real a lo sumo en un 0,06. Solución: p = 0.20 proporción de personas de la población que están a favor de la emisión

pˆ = proporción de personas de la muestra que están a favor de la emisión entonces nos están pidiendo la siguiente probabilidad:   P ( pˆ − p ≤ 0,06) = P −   

0,06 pˆ − p ≤ ≤ 0,2.0,8 p.q n 64

  0,06  = P(− 0,27 ≤ Z ≤ 0,27 ) = 0,20 4 0,2.0,8   64 

4) DISTRIBUCIÓN MUESTRAL DE VARIANZAS. Con esta distribución, se estudia las probabilidades relativas a la varianza de una población. De esta forma, la distribución muestral de varianzas, viene dada por todas las posibles varianzas de las muestras para un tamaño de muestra n

determinado. Para encontrar probabilidades relativas a varianzas se usa la distribución χ2 (chi cuadrado), para ello se transforman los valores S2 (varianzas muestrales) a valores de χ2 mediante la siguiente relación: χ2 = (n - 1). S2 / σ2 para v = n - 1 (grados de libertad). Nota: El único requisito para usar la distribución chi cuadrado es que la población esté distribuida normalmente Ejemplo: En una empresa, la desviación estándar del sueldo de los empleados es de Bs. 75000, correspondiente a valores distribuidos normalmente. Para un nuevo estudio se escogen 17 empleados cuyos salarios se muestran a continuación:

SUELDOS 156000 174000 175000 269000 185000 320000 200000 260000 225000 158000

162000 298000 450000 364000 300000

Se desea conocer si estos resultados muestran consistencia con respecto a la desviación, en cuanto a la variabilidad del sueldo de los empleados de dicha empresa.

Solución: Cuando se habla de variabilidad nos referimos a la varianza ó desviación estándar, por lo que debemos calcular la desviación muestral, esto es S = 87325,99 Bs. Por lo tanto:  (n − 1) S 2 16.(87325,99) 2   = P χ 2 > 21,69 = 0,15 . P( S > (87325,99) ) = P > 2 5625000000   σ 2

2

(

)

Los resultados muestran consistencia ya que es más probable que la varianza muestral para muestras de tamaño n = 17 estén por debajo de Bs. 87325,99 5) DISTRIBUCIÓN F DE FISHER. Cuando se quiere estudiar la relación entre las varianzas de dos poblaciones distribuidas normalmente se usa la distribución F de Fisher. Es decir, dadas dos muestras aleatorias independientes de tamaño n1 y n2 de dos S 2M poblaciones independientes, la distribución muestral de la razón F = 2 Sm

(razón

de varianzas) se conoce como distribución de Fisher, suponiendo que las varianzas poblacionales son iguales ( σ21 = σ22 ). Donde:

S M2 : es la varianza mayor S m2 : es la varianza menor con (v1 , v 2 ) donde v1 = n 1 − 1 grados de libertad del numerador v 2 = n 2 - 1 grados de libertad del denominador

Ejemplo: Considerando que las varianzas poblacionales de dos poblaciones son iguales,

σ21 = σ22 , n1= 6 y n2 = 10, hallar la probabilidad de que la razón

de las varianzas muestrales no exceda a 3,48. Solución: Cuando se quieren comparar las varianzas muestrales de

dos poblaciones se utiliza la distribución F de Fisher, por lo tanto, F =

S12 S 22

con v1 = 5 y v2=9 grados de libertad.También la probabilidad pedida viene dada por:  S12  P 2 ≤ 3,48  = P(F ≤ 3,48) = 1 − P( F > 3,48) = 1 − 0,05 = 0,95  S2 

Nótese que aún cuando las varianzas de las poblaciones son iguales, la probabilidad de que la razón de las varianzas de las muestras exceda a 3,48 es de 0,05 suponiendo tamaños de muestras de n1 = 6 y n2 = 10.

Tamaño de la Muestra. La clave del problema estriba en escoger una muestra cuyo selección garantice la representatividad de la población objeto de estudio. En los estudios socio-económicos, una muestra de un 30% de la población, tiene un elevado nivel de representatividad (Ramírez 1995); sin embargo, esta representatividad depende mayormente, del tipo de muestreo. Obviamente, que el trabajar con muestras, por muy confiables que sean, no se obtiene el 100% de exactitud, sin embargo, ese pequeño error que acompaña siempre a los estudios por muestreo,

es compensado con el tiempo y costo ahorrado al trabajar con grupos pequeños en vez de toda la población.

•

Determinación del Tamaño de la Muestra en una población infinita, cuando

se utilizan proporciones:

 Zα  n= 2  ∈ 

2

   .p.q  

Donde:

n: Tamaño de la muestra Zα/2: Valor teórico en función del nivel de confianza. Para 99 %, Zα/ 2 es igual a 2,56 y para el 95% a Zα/2 le corresponde 1,96

ε: error de muestreo p: Número de veces que se produce un evento en % q: Es el porcentaje complementario de p Ejemplo: Opinión de los electores sobre gestión de gobierno. Se realizó un estudio piloto de 150 electores donde 60 opinan favorablemente. ¿A cuantas personas es necesario encuestar si se desea un nivel de confiabilidad de 99 % y un error de muestreo +/- 1.5%?. Entonces se tiene:

 Zα  n= 2  ∈ 

2

   .p.q  

El valor de p viene dado por:

p = 60 / 150 X 100 = 40%, por lo tanto q = 100 - 40 = 60%.

2

 2,56  De esta forma se tiene: n =   . 0,4. 0,6 = 6.991 .  0,015 

Es necesario

encuestar a 6.991 personas para alcanzar cierta confiabilidad en los resultados.

En el caso de una Población Infinita con 95 % de Confiabilidad. Utilizando el ejemplo anterior, se tiene: 2

 1,96  n=  . 0,4. 0,6 = 4098  0,015  Al bajar el coeficiente o el nivel de confiabilidad, también baja el tamaño de la muestra. •

En el caso de que no exista un Estudio Piloto. A los valores de p y q se les asigna el valor de 50% a cada uno y es lo que se denomina Condiciones desfavorables de muestreo. En el caso del ejemplo citado el tamaño de la muestra viene determinado de la siguiente manera: 2

 1,96  n=  . 0,5. 0,5 = 4.268  0,015  Esto quiere decir que habrá que encuestar a 4.268 personas.

• En el caso de poblaciones finitas, el modelo matemático difiere con el de las poblaciones infinitas:

n=

Z α/2 .p.q.N ∈2 (N − 1) + Z α/2 .p.q

Donde: N es el tamaño de la población y n el tamaño de la muestra.

Se puede aplicar en el siguiente caso: Conocer la opinión de los miembros de un sindicato, ante un nuevo contrato colectivo. Compuesto por 3.257 obreros. Cuántas obreros se deben entrevistar

para obtener un nivel de

confianza de 99 % y un error de muestreo de +/- 3%, en condiciones desfavorables? 2,562 . 0,5 . 0,5. 3257 n= = 1.168 0,032 (3257 − 1) + 2,562.0,5.0,5

Se requieren encuestar a 1.168 obreros, para lograr cierto grado de Confianza.

• Determinación del Tamaño de la Muestra en una población para medias. En este caso se utiliza la relación:

 Zα.σ   n= 2   ∈   

2

Ejemplo: Se quiere estudiar la vida útil media de una marca de neumáticos. Si sabe por estudios anteriores que la desviación estándar es de 800 Km . Determinar el tamaño de la muestra requerido para un nivel de confianza del 95 %, fijando un error de 40. Sustituyendo los valores se tiene 2

2

 1,96. 800   1568  n=  =  = 1536,64 ≈ 1537 neumáticos  40   40 

En conclusión, la validez en la investigaciones de negocios, está muy relacionada con la confiabilidad del muestreo y una muestra confiable está en función del tipo de población a estudiar ( finitas o infinitas); asi mismo, en cuanto al nivel de confiabilidad, ésta será mayor si la muestra es mayor y en relación al error de muestreo, éste será menor cuando la muestra es mayor. Para determinar el tamaño de la muestra de una forma mas rápida y práctica, se han diseñado las Tablas de Harvard, las cuales permiten calcular, rapidamante el tamaño de la muestra a tomar, en función del error de muestreo, niveles de confiabilidad y posibles valores de p y q. Para profundizar en este aspecto de muestreo, se recomienda consultar los textos especializados en estas áreas. Pues una vez determinado el tamaño de la muestra el paso siguiente que se plantea es lo relacionado al tipo de muestreo que se va a utilizar para escoger los elementos que integran a la muestra y ésto es un amplio e interesante tema a tratar.

CAPITULO IV EL CONTROL ESTADÍSTICO DEL PROCESO

OBJETIVOS: Conocer los métodos estadísticos utilizados en el control de procesos y aplicar las herramientas específicas para cada caso, con la finalidad de detectar y corregir posibles fallas. 1.

INTRODUCCION:

La estadística descriptiva y la inferencial así como la teoría de probabilidades, tienen un campo

muy amplio de aplicación en la industria,

especialmente en el control de la calidad y en el análisis de procesos. En los procesos de producción se generan simultáneamente grandes volúmenes de información cuantitativa y cualitativa a través de las cuales se pueden controlar los costos, la producción y la calidad, es decir, lo que significa el control de gestión administrativa de la compañía. La recopilación, presentación y análisis de este flujo de información permite a la gerencia conocer los resultados y establecer controles y así mismo comparar los resultados obtenidos con lo deseado, pudiendo establecer acciones correctivas cuando se observen discrepancias significativas entre ellos.

El Control

Estadístico de la Calidad es el conjunto de acciones

orientadas a cumplir con las metas de calidad previamente establecidas, utilizando para ello las técnicas estadísticas aplicables al menor costo posible.

Lo importante del Control de Calidad es que constituye una herramienta muy eficaz para incrementar la productividad, permitiendo elevar el nivel técnico de la empresa, incrementando la producción y reduciendo los costos de operación. De esta forma, el propósito del control de la calidad es fijar la calidad normal, mantener y mejorar el nivel, la uniformidad y la

confiabilidad de la calidad

garantizando ésta y reduciendo los costos de fabricación, suministrar productos a la satisfacción del cliente aumentando los beneficios. Como se observa, el control de calidad involucra el proceso total de: comercialización, investigación, desarrollo, producción, transporte, instalación y mercadeo, sin soslayar todas aquellas funciones tendientes a maximizar el beneficio. 2.

METODOS ESTADISTICOS:

Este control moderno de la calidad implica el uso de métodos estadísticos, siendo denominado

Control Estadístico de la Calidad cuya aplicación es

ampliamente utilizada en diferentes áreas tales como: análisis de procesos, control de procesos, investigación, desarrollo, etc. En función de ello se puede establecer una estructura basada en: Ingeniería de Control de Calidad: Encargada del planeamiento de calidad de una empresa. Ingeniería en Control de Procesos: Supervisa la aplicación adecuada del sistema del control de calidad en la fabricación. Ingeniería de equipos de información: Diseña y desarrolla el equipo para la inspección y el ensayo.

Entre los métodos estadísticos de mayor uso se tienen: a.

Gráficas de control.

b.

Distribución de frecuencia, histogramas y diagramas de pareto.

c.

Distribuciones estadísticas.

d.

Ensayo de significación.

e.

Inspección por muestreo.

f.

Diseño de experimento y análisis de la varianza.

En el cuadro que a continuación se presenta se resume las diferentes áreas de control y las técnicas utilizadas en cada una de ellas:

CONTROL TAREA Planeamiento de la CONTROL DE NUEVOS calidad del producto y proceso, standard, DISEÑOS costos, especificaciones del proceso, confiabilidad. MATERIA PRIMA

Controles de recepción y almacenamiento, economía y costos.

PRODUCTO Y PROCESO

Control del producto desde su fabricación, establecer correctivos, servicios.

Investigaciones y ensayo ESTUDIOS ESPECIALES para mejorar la calidad.

TECNICAS UTILIZADAS Análisis de la función producto, pruebas ambientales, prototipo, evaluación , estándares de calidad, análisis de materia prima, inspección, entrenamiento, almacenamiento y transporte. Evaluación de proveedores, instrumentos de medición , entrenamiento, muestreo, especificaciones, características de calidad, lotes rechazados y aceptados, análisis estadísticos, etc. Control de procesos, productos terminados, control de herramientas, mantenimiento, personal, condiciones ambientales, inspección, cartas de control, muestreo, planos, auditoría, defectos, empaque y despacho, servicios. Gráficas. distribución de frecuencias, diagramas de fallas, análisis de pareto, diferentes métodos estadísticos, pruebas de hipótesis, distribución t, chi cuadrado, análisis de la varianza, correlaciones y regresiones, análisis secuencial.

El análisis de procesos no viene a ser más que la aplicación de métodos científicos al reconocimiento y a la formulación de problemas y al desarrollo de procedimientos para resolverlos. Esto significaría: la especificación matemática del problema

para

una

situación

física

determinada

y

realizar

el

análisis

pormenorizado para obtener los modelos matemáticos, lo cual conduciría a la síntesis y presentación de los resultados para asegurar su comprensión y posible aplicación. El análisis estadístico desempeña un papel importante en el estudio de los procesos. El método de encontrar las causas de los productos con defectos, es lo que se denomina Diagnóstico del Proceso. Para reducir el número de productos defectuosos la primera acción es la de hacer un diagnóstico correcto para determinar las causas de los defectos. Existen muchos métodos para hacer un diagnóstico correcto, algunos basados en la intuición y otros en la experiencia. En este trabajo se recurrirá al análisis estadístico de los datos; la forma estadística de considerar las cosas y el uso de los métodos estadísticos constituye un medio muy valioso para hacer las observaciones. 1. CARTAS DE CONTROL. De acuerdo con E.L. Grant (Statistical Quality Control) la calidad medida de un producto manufacturado, está siempre sujeta a una cierta variación fortuita. Algún sistema estable de causas fortuitas es inherente a cualquier esquema particular de producción e inspección. La variación propia de este modelo estable es inevitable, pero las razones para la variación fuera de este modelo estable pueden ser descubiertas y corregidas.

La carta control desarrollada por Shewhart (Economic Control of Quality of Manufatured Product.) es un dispositivo gráfico para detectar modelos no naturales de variación en los datos resultantes de procesos repetitivos, lo cual permite fijar un criterio para detectar deficiencias en el control estadístico. En estas cartas los puntos muestreados son representados gráficamente de una forma secuencial y posteriormente

unidos por una línea facilitando la interpretación

visual.

FIGURA 7.GRAFICA DE CONTROL

Las pruebas más comunes para modelos no naturales son las pruebas de inestabilidad, las cuales permiten determinar si el sistema de causas está cambiado, comúnmente se les designa como las zonas A, B, y C. Como referencia a estas zonas, el modelo de variación observado se dice que es no natural o que el proceso está fuera de control si ocurre uno o más de los siguientes eventos: 1.- Un sólo punto cae fuera del límite de control. Por ejemplo más allá de la zona A. 2.- Dos de tres puntos sucesivos, caen en la zona B o más allá 3.- Cuatro de cinco puntos sucesivos caen en la zona B o más allá 4.- Ocho puntos sucesivos caen en la zona C o más allá Estas pruebas se aplican separadamente a ambas mitades de la Carta Control. Las cartas más comúnmente usadas son: Carta X, la Carta R, la Carta p, y la carta c; las dos primeras tratan con datos de medición, mientras que las dos últimas tratan con datos de atributos. (Enumeración). FÓRMULAS PARA LAS CARTAS DE CONTROL:

Carta _ X

Distribución Normal

R

Normal

p

Binomial p

c

Poisson

Línea Central _ X R

Límite superior de control (LSC) _ X + A2 R D4 . R

p + 3√p (1-p) / n c

c+3 √c

Límite inferior de control (LIC) _ X - A2 R D3 . R.

p - 3√p (1-p) / n c-3 √c

Las constantes A2 , D3 y D4

están tabuladas (ver anexo), mientras que

las cantidades X, R, p, y c se calculan de los datos suministrados.

Planes de Muestreo: El muestreo de aceptación puede ser de dos tipos: muestreo lote por lote también denominado muestreo por atributos y muestreo de producción continuo o muestreo variable. Los primeros se refieren a los casos donde cada espécimen es clasificado simplemente como defectuoso o no defectuoso; en los planes variables se refiere a los casos en los cuales una medida es tomada y registrada numéricamente en cada espécimen inspeccionado. El plan de muestreo por atributos que se efectúa en base de lote, está definido por tres elementos: el tamaño del lote (N), el tamaño de la muestra (n) y el número de aceptación A³.

Ejemplo:

La tabla que se exhibe a continuación muestra los valores codificados de la resistencia a la compresión de bloques de concreto.

VALORES CODIFICADOS DE LA RESISTENCIA A LA COMPRESIÓN DE BLOQUES DE CONCRETO Número de la Muestra

X1

X2

X3

X4

X5

Media Rango (X) (R)

01

11.1

9.4

11.2

10.4

10.1

10.44

1.8

02

9.6 10.8

10.1

10.8

11.0

10.46

1.4

03

9.7 10.0

10.0

9.8

10.4

9.98

0.7

04

10.1

8.4

10.7

9.4

11.0

9.82

2.6

05

12.4 10.0

10.7

10.1

11.3

10.90

2.4

06

10.1 10.2

10.2

11.2

10.1

10.36

1.1

07

11.0 11.5

11.8

11.0

11.3

11.32

0.8

08

11.2 10.0

10.9 11.2

11.0

10.86

1.2

09

10.6 10.4

10.5

10.5

10.9 10.58

0.5

10

8.3 10.2

9.8

9.5

9.8

9.52

1.9

10.2

11.4

10.56

1.5

11

10.6

9.9 107

12

10.8 10.2

10.5

8.4

9.9

9.96

2.4

13

10.7 10.7

10.8

8.6

11.4

10.44

2.8

14

11.3 11.4

10.4

10.6 11.1

10.96

1.0

15

11.4 11.2

11.4

10.1 11.6

11.14

1.5

16

10.1 10.1

9.7

9.8 10.5

10.04

0.8

17

10.7 12.8

11.2

11.2 11.3

11.44

2.1

18

11.9 11.9

11.6

12.4 12.4

11.84

1.0

19

10.8 12.1

11.8

9.4 11.6

11.14

2.7

20

12.4 11.1

10.8

11.0 11.9

11.44

1.6

10.66

1.59

Promedio

De la tabla anterior tenemos que:

_ _ 213.20 X = ∑ X/K = --------------- = 20 31.8 R= ∑ R/K = ---------------- = 20

10.66

1.56 _

De acuerdo a las fórmulas establecidas, para la Carta X:

LSC =

_ X + A2 . R

LSC =

10.66 + (0.58) (1.59) = 11.558

LIC =

10.66 - (0.58) (1.59) = 9.74

FIGURA 8. CARTA X

Igualmente para la Carta R: LSC = D4 . R = (2.12) (1.59) = 3.37 LIC = D3 . R = (0) (1.59) = 0

FIGURA 9. CARTA R

Si tratamos con datos de enumeración como por ejemplo el número de fusibles defectuosos escogidos en muestras de tamaño 50, tomados en tiempos al azar durante el proceso de producción; podemos emplear la Carta p.

Número de muestra 1............................. 2............................. 3............................ 4............................ 5............................ 6............................ 7............................ 8............................ 9............................ 10......................... 11......................... 12......................... 13......................... 14......................... 15......................... 16......................... 17........................ 18......................... 19........................ 20........................ 21....................... 22....................... 23....................... 24....................... 25....................... 26....................... 27...................... 28...................... 29...................... 30..................... 31..................... 32..................... 33..................... 34..................... 35..................... 36.................... 37.................... 38................... 39................... 40...................

Número de defectuosos

Fracción defectuosa (p)

2 1 2 0 2 3 4 2 0 3 0 1 2 2 3 5 1 2 3 1 1 1 4 2 2 4 1 3 3 2 3 6 2 3 2 3 1 0 2 0

0.04 0.02 0.04 0.00 0.04 0.06 0.08 0.04 0.00 0.06 0.00 0.02 0.04 0.04 0.06 0.10 0.02 0.04 0.06 0.02 0.02 0.02 0.08 0.04 0.04 0.08 0.02 0.06 0.06 0.04 0.06 0.12 0.04 0.06 0.04 0.06 0.02 0.00 0.04 0.00 Promedio.....................

0.042

De esta tabla de valores se comprueba: p=

∑ p/K

1.68 =  = 0.042 40

Aplicando la Ecuación correspondiente LSC = p + 3 √ p (1- p) / n LSC = 0.042 + 3 √(0.042) (0.958) /50 = 0.127 LIC = 0.042 - 3

√(0.042) (0.958) /50

= - 0.043

Como el LIC resulta un valor negativo y debido a que la fracción defectuosa es una cantidad no negativa, este límite se toma como cero, lo cual hace a los límites de control asimétricos con respecto a la línea central.

FIGURA 10. CARTA p

Si interesa determinar el número de defectos por unidad, la Distribución de Poisson y una carta C sería lo más apropiado. A continuacción se presentan los datos tabulados del número de defectos observados en una junta soldada, realizando cada conteo en una sola junta, soldándose 8 juntas por hora. Número de muestra Fecha Tiempo de la muestra 1................. Julio 18 8:00 A.M 2................. 9:05 A.M. 3................. 10:10 A.M. 4................. 11:00 A.M. 5................. 12:30 PM. 6................. 1:35 P.M. 7................. 2:20 P.M. 8................. 3:30 P.M.

Nºde defectos (c) 2 4 7 3 1 4 8 9

9.................. Julio 19 10................ 11................. 12................. 13................ 14................ 15................. 16.................

8:10 A.M. 9:00 A.M. 10:05 A.M. 11:15 A.M. 12:25 P.M. 1:30 P.M. 2:30 P.M. 3:40 P.M.

17................ Julio 20 18................ 19................ 20................ 21................ 22................ 23................ 24................

8:00 A.M. 8:55 A.M. 10:00 A.M. 11:00 A.M. 12:25 P.M. 1:30 P.M. 2:20 P.M. 3:30 P.M.

6 4 3 9 7 4 7 12

..............

144

Total...................................

5 3 7 11 6 4 9 9

Del cuadro anterior y aplicando las ecuaciones correspondientes tenemos: 144 c= ∑ c/K =  = 6 24 _ _ LSC = c + 3 √c LSC = 6 + 3 LIC= 6 - 3

√ 6 = 13.35

√6 =

- 1.35

FIGURA 11. GRAFICA DE CONTROL En esa gráfica no se presentan puntos por encima del LSC; igualmente, el mismo patrón aparece cada medio día; este patrón recurrente sugiere un factor de fatiga que debe ser tomado en cuenta

2. DIAGRAMA DE CAUSA EFECTO Es una representación gráfica de la relación entre un efecto y todas las posibles causas que influyen en él, permitiendo identificarlas y clasificarlas para su análisis. Es llamado también diagrama de Ishikawa o Espina de Pescado. (Ver figura en la página siguiente).

CAUSAS METODOS

MAQUINAS

EFECTO MATERIALES

CALIDAD

MANO DE OBRA

MEDICIONES

FIGURA 12. DIAGRAMA CAUSA-EFECTO

Ejemplo Después de haberse realizado un análisis de las principales causas que originan bobinas desviadas en el laminador tandem 1, se encontró que manchas contaminantes afectaba en gran proporción los resultados de calidad. El equipo de trabajo realizó un estudio utilizando el diagrama causaefecto el cual se presenta a continuación:

CAUSAS METODOS FALTA DE COORDINACION

EFECTO

MAQUINAS FUGA DE ACEITE

FALTA DE SECADOR DE COMUNIC. BANDAS

EXPERIENCIA DEL PERSONAL OPERACION DE EMULSION

MANO DE OBRA

MATERIAL DE DECAPADO

ACEITE

EXTRATOR DE GASES

CRITERIOS NO UNIFORMES

MATERIALES

PERMANANENCIA DEL MATERIAL DE ALMACENAMIENTO AUSENCIA DE INSTRUENTOS DE MEDICION

FALTA DE EQUIPOS SENSIBLES AL MATERIAL MOJADO

FILTRO DE EMULSION

CALIBRACION DEL SECADOR EN FUNCION DEL ANCHO DE BANDA

MANCHAS CONTAMINANTES

FALTA DE EQUIPO DETECTOR DE MANCHAS

MEDICIONES

FIGURA 13. REPRESENTACIÓN GRAFICA DEL EJEMPLO

3. DIAGRAMA DE PARETO a. Es un gráfico de barras que jerarquiza los problemas, condiciones o las causas de éstos, por su importancia e impacto siguiendo un orden descendente de izquierda a derecha. b. Es utilizado cuando se necesita determinar el orden de importancia de los problemas o condiciones a fin de seleccionar el punto de inicio para la solución de dichos problemas o la identificación de la causa fundamental de ellos.

FIGURA 14. DIAGRAMA DE PARETO

Ejemplo Defectos encontrados en una inspección 1.- Presencia de óxido 2.- Falta de identificación. 3.- Manchas de aceite. 4.- Mala ubicación.

FIGURA 14. REPRESENTACIÓN GRAFICA DEL EJEMPLO

4. GRAFICO DE CORRIDAS Es una representación gráfica mediante líneas del comportamiento de una variable en un proceso durante un período determinado, es utilizado cuando se necesita mostrar las tendencias de puntos observados, dentro de un período de tiempo especificado.

FIGURA 15. MODELO DE GRAFICO DE CORRIDAS PASOS PARA LA ELABORACIÓN DE UN GRAFICO DE CORRIDAS: 1. Determinar la variable del proceso a medir. 2. Establecer la escala a utilizar en los ejes: a. El eje horizontal X , representa el período de tiempo y b. El eje vertical Y, representa los valores de la variables del proceso.

3. Indicar con puntos los valores encontrados en cada una de las mediciones y proceder a unir dichos puntos mediante el uso de líneas. 4. Calcular el promedio de los valores. 5. Representar en el gráfico el promedio determinado trazando una línea horizontal. 6. Interpretar el gráfico resultante. 5. HISTOGRAMA DE FRECUENCIA Es una gráfica de barras que muestra la frecuencia con que ocurre una determinada característica que es objeto de observación. Es utilizada comúnmente cuando se requiere mostrar la distribución de los datos y representar la variación propia de un proceso.

FIGURA 15. MODELO DE HISTOGRAMA

6. ANÁLISIS DE REGRESION En muchas situaciones que se presentan a menudo en el campo de la ciencia, la ingeniería o las ciencias económicas nos encontramos con el problema de la relación entre dos variables numéricas. Por ejemplo, la relación entre la temperatura de un paciente y el número de pulsaciones por minuto o la relación entre el costo de un producto y el costo de la mano de obra para fabricarlo. Muchas veces existen ecuaciones matemáticas que nos permiten calcular una variable conociendo el valor de otra de la cual depende. En general, cuando se nos presentan dos variables numéricas X e Y, podemos encontrar distintos tipos de relación entre ellas. Puede ocurrir que entre ellas no exista ningún tipo de relación. En tal caso, la variación de una de ellas no genera una variación correlativa en la otra. Variación correlativa significa que cada vez que X aumenta, Y debe aumentar si hay correlación positiva o cada vez que X aumenta, Y debe disminuir en caso de correlación negativa. Pero si cada vez que X varía, Y puede aumentar o disminuir al azar en cualquie grado y proporción, entonces significa que no hay ninguna correlación entre ambas:

Variable Y

Ninguna correlación 50 45 40 35 30 25 20 15 10 5 0 0

2

4

6 Variable X

8

10

12

Cuando hay una relación funcional entre X e Y, es decir Y=F(X), la correlación entre ambas es perfecta. Supongamos que medimos el valor de Y para un determinado valor de X, y que dicho valor de X lo podemos fijar con exactitud (En general, esto no va a ser cierto). La ecuación de la función nos da un valor de Y para ese valor de X. El valor de Y medido y el valor de Y calculado con la ecuación, en general, no van a coincidir. Si repitiéramos la medición de Y muchas veces para el mismo valor de X, tendríamos una serie de valores que son diferentes del valor calculado. Pero si seguimos este proceso, obtendremos una población de valores de Y cuyo promedio sí va a coincidir con el valor calculado. Es decir, la relación funcional expresada por la ecuación matemática se cumple para los promedios de los X e Y medidos, porque la mediciones individuales están sujetas al error experimental o error de medición. Veámoslo con un ejemplo. Si dejamos caer una pelotita desde el borde de una mesa, la distancia que recorre desde el borde hasta tocar el suelo se puede calcular por medio de la ecuación siguiente:

Y = f (t ) =

1 ⋅ g ⋅t2 2

g Aceleracion Gravitatoria

Hay una relación funcional no lineal entre la altura Y desde la cual cae la pelotita y el tiempo t que tarda en caer, expresada por la ecuación anterior. Si dejamos caer la pelotita midiendo con un cronómetro el tiempo que tarda en llegar al suelo y medimos también la distancia recorrida (la altura de la mesa), los valores resultantes de la medición seguramente no cumplen con esa relación. Esto lo podemos verificar reemplazando t en la ecuación por el tiempo obtenido con el cronómetro. El valor resultante Y seguramente no va a coincidir con nuestra medición de la altura de la mesa. Si repetimos esto muchas veces, las mediciones de tiempo y distancia realizadas en cada ocasión, en general, no van a cumplir la relación. Pero si promediamos todas la mediciones de tiempo y luego reemplazamos t en la ecuación por este promedio, la distancia calculada con la

ecuación sí va a coincidir con el promedio de todas las mediciones de altura de la mesa. Entre las dos posibilidades extremas, la de no tener ninguna relación entre las variables y la de tener una relación funcional, hay infinitas situaciones intermedias, en las cuales hay un cierto grado de correlación entre ambas:

Variable Y

Hay alguna correlación 50 45 40 35 30 25 20 15 10 5 0 0

2

4

6

8

10

12

Variable X

En muchos problemas prácticos de la industria y de la economía se trata de conocer en forma empírica la relación entre dos variables, de tal manera que si se tiene un valor de la variable X se pueda obtener por cálculo o en forma gráfica el valor de la variable Y, sin importar si existe una verdadera relación funcional entre ambas variables. Por ejemplo, supongamos que tenemos una grupo muy grande de personas de sexo masculino, de edad entre 30 y 40 años. Se nos presenta el problema de relacionar las variables peso y estatura, de tal manera que, conociendo la estatura en metros de un individuo del grupo, podamos calcular su peso en Kg. Entre ambas variables no existe una relación funcional. Esto lo vemos

fácilmente si tomamos algunos individuos cuya estatura sea la misma, por ejemplo, 1,75 mts. y medimos el peso de cada una. Resulta claro que las mediciones van a ser diferentes, una pesará 73 Kg., otra 79 Kg., etc. y estas diferencias no se deben al error de medición, sino a diferencias reales en el peso de las personas:

Gráfico de peso vs. altura 130

Peso de personas de 1,75 mts.

120 Peso (Kg.)

110 100 90 80 70 60 50 40 1,60

1,70

1,80

1,90

2,00

2,10

Altura (m ts.)

Quiere decir que para un determinado valor de la variable estatura podemos encontrar múltiples valores de la variable peso, lo cual niega la existencia de relación funcional. No obstante, existe un importante grado de correlación entre ambas variables, porque sabemos que a medida que aumenta la estatura de las personas dentro del grupo, el peso tiende a aumentar. ¿Cómo podemos hacer, entonces, para estimar el peso de una persona conociendo su estatura? Para ello, vamos a suponer un procedimiento hipotético: Tomamos del grupo un número muy grande de personas que miden exactamente 1,65 mts., las pesamos y promediamos los resultados. Repetimos el procedimiento para grupos

que miden 1,70 mts., 1,75 mts., etc. y luego representamos gráficamente los promedios de peso en función de dichas alturas:

Regresión del peso sobre la altura 130 120 Peso (Kg.)

110 100 90 80 70 60 50 40 1,60

1,70

1,80

1,90

2,00

2,10

Altura (m ts.)

La representación resultante se denomina Regresión del peso sobre la altura, y a la ecuación correspondiente Ecuación de Regresión. Una vez hecho esto, disponemos de una forma sencilla de estimar el peso de una persona del grupo conociendo la altura: con la misma entramos al gráfico y obtenemos el valor de Y correspondiente. Este valor Y es el promedio de los pesos de las personas del grupo que miden una altura X, y sólo nos sirve como una estimación (aproximación) del peso real de la persona cuyo peso deseamos conocer. También podemos utilizar la ecuación de regresión para calcular el peso. La forma de la representación gráfica puede ser una recta u otro tipo de curva. Cuando es una recta decimos que es una regresión lineal, y de ahora en mas nos referiremos a este tipo de regresiones.

El procedimiento real para obtener la regresión utiliza un método que se conoce como Método de los Cuadrados Mínimos. Se toma una muestra aleatoria de personas del grupo que cubran todo el rango de alturas y a cada una se le mide el peso y la altura. Si representamos estos puntos en un gráfico, veremos que se agrupan aproximadamente alrededor de una recta imaginaria, que representa los puntos de la regresión. Parece lógico pensar que la recta de la regresión debe pasar muy cerca de los puntos experimentales (las mediciones que realizamos). Si hacemos pasar esta recta imaginaria por el punto correspondiente a uno de los individuos la estamos alejando, probablemente, de los otros puntos. Es decir que, la recta de regresión debe pasar a una distancia óptima de los puntos experimentales, de tal manera que esté lo mas cerca posible de todos ellos. Esto es lo que se trata de hacer con el método de los cuadrados mínimos. Entonces, tenemos una serie de valores de la variable X, para cada uno de los cuales se mide la variable Y:

X X1 X2 X3 X4 X5 X6 etc.

Y Y1 Y2 Y3 Y4 Y5 Y6

La ecuación de la recta de regresión será de la forma: Y R = a + bX Si ingresáramos en esta ecuación los valores X1 , X2 , X3 , etc. obtendríamos los valores de Y de la regresión: Y1R , Y2R , Y3R , etc. Las diferencias entre estos valores calculados y los valores Y medidos se denominan residuos:

(Y (Y (Y

) −Y ) −Y )

R 1

− Y1

R 2

2

R 3

3

............... etc. Si elevamos las diferencias o residuos al cuadrado y sumamos estos cuadrados, obtenemos una cantidad denominada suma de cuadrados alrededor de la regresión:

∑ (Y

R

i

)

[

− Yi = ∑ ( a + b ⋅ X i ) − Yi

]

De todas las rectas posibles que pasan por los puntos representados en el gráfico, la recta de regresión debe ser la que haga mínima esa suma de cuadrados. Observemos que en dicha suma de cuadrados conocemos los valores Xi , Yi (Son la mediciones que realizamos) y deseamos conocer a y b, que son los coeficientes de la ecuación de regresión. Para obtenerlos se calcula el mínimo de la suma de cuadrados y de las ecuaciones resultantes se despejan las fórmulas de ambos coeficientes, que son como sigue:

b=

n∑ X i ⋅ Yi − ∑ X i ⋅ ∑ Yi n∑ X 2 −

(∑ X )

2

i

a = Y −b⋅ X donde X =

∑X n

i

Y=

∑Y

i

n

Son los promedios de Xi e Yi respectivamente y n es el número de pares de observaciones Xi , Yi

.

De esta forma, ¿Cómo podemos conocer cual es el

grado de vinculación entre ambas variables? Para ello, calculamos el Coeficiente de Correlación, que es un número real entre 0 y 1 que nos da el grado de correlación entre dos variables X e Y. Cuando este coeficiente es 0, la correlación entre ambas variables no existe; cuando es 1, hay una correlación perfecta, es decir, tenemos una relación funcional entre ambas. El coeficiente de correlación es el cociente entre la Covarianza y las desviaciones standard de X e Y:

R=

Cov( X , Y ) s X ⋅ sY

=

∑( X

∑( X

i

i

)(

− X ⋅ Yi − Y

−X

)

) ⋅ ∑ (Y − Y ) 2

i

2

AJUSTES DE CURVAS.

Cuando se quiere estudiar la relación entre recurrir a dos tipos de modelos:

variables se puede

a) Modelo Determinístico, la relación viene definida a través de una fórmula. Por ejemplo, sea y = x2, entonces se dice que y está en función de x, donde y se conoce como variable dependiente y x variable independiente. La característica fundamental de este modelo es que para un valor particular de x siempre obtenemos el mismo resultado en y, esto significa que la relación entre las variables es perfecta. Ver gráfica. y 10 8 6 4 2 0 -4

-3

-2

-1

0

1

2

3

4

b) Modelo Probabilistico, la relación entre las variables no es perfecta, ya que debido a una perturbación aleatoría (ruido) a veces para un mismo valor de la variable independiente x se obtienen valores diferentes para y. En este caso, no se obtiene una curva sino un diagrama de dispersión. Considerando el ejemplo anterior, y = x2 + ε donde ε es un ruido. Ver gráfica.

10 8 6 4 2 0 -4

-3

-2

-1

0

1

2

3

4

Por tanto, los modelos probabilísticos son útiles cuando se realizan investigaciones del tipo experimental donde a pesar de mantener fijo los valores de la variable independiente ocurren fluctuaciones debido fundamentalmente a errores de medición, de los equipos, etc. En el presente trabajo estamos interesados en este tipo de modelos. A continuación mencionamos los modelos de ajustes más usados: Regresión simple: Se define como la curva que optimiza (minimiza), mediante el método de los mínimos cuadrados, los saltos o fluctuaciones de los datos. Es decir, es la curva que mejor ajusta los valores del diagrama de dispersión convirtiendo el modelo probabilístico en un modelo determinístico con la finalidad de realizar predicciones. De igual forma, la curva de regresión permite modelar la tendencia de los valores. Los modelos de regresión simple vienen definidos por y = f(x)+ε. A continuación veamos los distintos modelos con su respectivo ajuste o curva de regresión:

Modelos Probabilísticos a) Lineal:

Curva de Regresión yˆ = aˆx + bˆ (línea recta)

y = ax + b + ∈

18

18

16

16

14

14 12

12

10

10

8

8

6

6

4

4

2

2

0 0

0 0

2

4

6

2

4

6

b) Polinómico: orden dos:

y = ax 2 + bx + c + ∈

(parábola)

yˆ = aˆx 2 + bˆx + cˆ

30

30

25

25 20

20

15

15

10

10

5

5

0 0

0

orden tres:

y = ax 3 + bx 2 + cx + d + ∈

2

4

6

yˆ = aˆx 3 + bˆx 2 + cˆx + dˆ

800

800 700 600 500

700 600 500 400

400 300 200 100 0

300 200 100 0

0

5

10

0

2

4

6

8

10

c) Logarítmico:

y = aLn( x) + b + ∈

yˆ = aˆLn( x) + bˆ

12 14

10

12

8

10

6

8

4

6

2

4 2

0 0

2

4

6

8

10

0 0

2

6

8

10

ˆ

y = ax b + ∈

d)Potencial:

4

yˆ = aˆx b

140

120

120 100

100 80

80

60

60

40

40

20

20

0 0

2

4

6

8

10

0 0

2

4

6

8

10

ˆ

yˆ = aˆe bx

y = ae bx + ∈

e) Exponencial:

1,00

1,00 0,90 0,80

0,90

0,70 0,60

0,70

0,50

0,50

0,40 0,30

0,40

0,20 0,10

0,20

0,80 0,60

0,30 0,10

0,00 0

2

4

6

8

10

0,00 0

2

4

6

8

10

El procedimiento en un análisis de regresión consiste en calcular los estimadores ( aˆ , bˆ, cˆ y dˆ ) que definen la curva que mejor ajusta los datos. En la actualidad, existen paquetes estadísticos que permiten calcular los estimadores y la curva de regresión directamente, sin necesidad de realizar los cálculos manualmente. (Excell, Statgraph, SSPS y otros).

REGRESION MULTIPLE: Existen diferentes modelos de regresión múltiple, pero uno de los que tiene más uso es el modelo lineal. Cuando la variable respuesta o dependiente de un modelo probabilístico está en función de dos o más variables se dice que es un modelo de regresión múltiple, esto es:

y = f(x1, x2, ...,xn) + ε .

Regresión múltiple lineal.

Modelo probabilístico:

y =a1x1 +a2x2 +...+anxn +b+∈

Modelo determinístico:

yˆ = aˆ1 x1 + aˆ 2 x 2 + ... + aˆ n x n

Todo modelo de regresión simple

puede representarse en el plano

Cartessiano (bidimensional) puesto que se requiere de un eje para representar la variable independiente (x) y otro para las observaciones (y). Para el caso de regresión múltiple solamente hay una representación espacial, cuando se tienen dos ejes para las variables independientes (x1 y x2) y otro para las observaciones (y), es decir, modelos de la forma y = f(x1, x2). Ver gráfica.

y

En el espacio la ecuación de regresión, viene dada por un plano

Plano de regresió n

x2

x1

Para modelos donde el número de variables independientes es igual o mayor que 3, es imposible realizar una representación gráfica, No obstante la ecuación de regresión se le llama hiperplano.

BIBLIOGRAFIA

1. ARVELO, Francisco. 525 Problemas. Probabilidad, Estadística, Matemática, Control de Calidad. Ed. Litexto, Caracas. 2. ADAM, E. y EBERT, R.(199

Adminisración de la Producción y las

Operaciones. Prentice Hall, U.S.A. 3. AZORIN, Francisco.(1972) Curso de Muestreo y sus Aplicaciones. Aguilar Madrid. 4. BOWXER, A. Lieberman (1986), G. Estadística para Ingenieros. Prentice Hall, México. 5. COCHRAN, William (1964). Sampling Techhiques, John Wiley Sons.USA. 6. DELNU. Servicios Gerenciales S.R.L (1980).

Prácticas de Control de

Calidad. Caracas. 7. DIAZ, Eduardo (1994). Aplicaciones Prácticas de la Estadística en el Control de la Calidad. UNEG. 8. GARCIA, Silvio.(1989) Control Estadístico de la Calidad. Folleto Mocarpel, 9. GUERRA , J. y SEVILLA E.(1992) Introducción al análisis estadístico para procesos. Habana.

10. ISHIKAWA, kaoru (1991). Qué es Control de Calidad. Norma.

11.KUME,

Hitoshi.(1992)

Herramientas

Estadísticas

Básicas

para

el

mejoramiento de la calidad. Editorial Norma. Colombia. 12. MENDENHALL, William (1997). Probabilidad Y Estadística para Ingeniería. Prentice Hall. 13. MILLER, Irwin.(1986) Probabilidad y Estadística para Ingenieros. Irwin México Prentice-hall Hispanoamericana.

Herramientas Estadisticas para el Control de Procesos

Recommend Documents