El gradiente y el método de los multiplicadores de Lagrange.
Wilman García David Fernández Arenas
Licenciatura en Matemáticas y Física. Universidad de Antioquia.
Resumen: En este trabajo se presenta un conjunto de conceptos como lo son: campo vectorial, gradiente, derivada direccional, y el método de los multiplicadores de Lagrange para obtener máximos y/o mínimos de funciones sometidas a ciertas restricciones; se busca que sea visto desde un punto de vista intuitivo, haciendo uso histórico de la noción de campo vectorial con el fin de reconocer su importancia en el desarrollo de la física, de igual manera se presentan notas históricas del concepto de gradiente y la relación existente entre éstos dos últimos. Por otra parte se intenta dar una visualización del resultado del método de los multiplicadores de Lagrange, con el fin de ofrecer una mayor claridad y detalles, para entender dicho concepto se han restringido las funciones a R2 y R3, y no se han tratado demostraciones rigurosas. Por ultimo se pretende tratar de relacionar dichos temas con algunas cuestiones de la geometría vectorial tales como vectores libres, de posición. Nota: cuando se indique un punto en negrita se hace referencia a un conjunto de puntos por ejemplo x puede indicar la terna ordenada (x, y, z). Para comenzar a hablar del gradiente y los multiplicadores de Lagrange es bueno tomar en cuenta algunas consideraciones previas, como lo son algo de historia y lo referente al operador diferencial nabla. El gradiente fue denotado Δ por Hamilton en 1846, hacia 1870 se denoto ∇ la letra delta invertida, que se llamó “atled”. En 1871 Maxwell escribió “la cantidad ∇P es un vector”. El nombre de “pendiente” como se conocía en un principio pasó de uso y se reemplazó por la de “gradiente”; se refiere a la palabra grado, el peralte de un camino o una superficie. El nombre de (nabla apareció impreso por vez primera en 1901 en Vector Analysis, un libro para uso de estudiantes de matemáticas y física. Ahora bien en cuanto al operador nabla ∇ ≡
para el caso de una superficie de
en coordenadas cartesianas, ∇ no es un vector, sino un operador, puede considerarse como un vector simbólico; así si ϕ es un campo escalar, entonces ϕ∇ es un operador, por tanto colocando ∇ a la izquierda da operadores, mientras que aplicado a la derecha ∇ϕ da la importante función vectorial llamada gradiente, por lo tanto a la derecha entrega funciones vectoriales o escalares, en el caso de tener ϕ una función real definida en un conjunto abierto S de , el gradiente de ϕ designado por ∇ϕ o por gradϕ, es una función vectorial definida por ∇ϕ =(D1 ϕ(x),…,Dn ϕ(x)) donde D1 ,D2,… Dn son las derivadas parciales; a lo anterior se le conoce como campo gradiente de ϕ, pero entonces surge un nuevo concepto a tratar aunque de manera algo vaga, el de campo vectorial, para conocer algo acerca de éste remitámonos nuevamente a un poco de historia, el concepto de campo, entendido como campo de vectores, tuvo un gran
2
impacto en el desarrollo de las bases conceptuales de la física y la ingeniería, es realmente una de las ideas que supusieron un avance significativo en la historia del pensamiento humano. Es la noción que permite describir de modo sistemático las influencias sobre objetos y entre objetos que están separados espacialmente. La idea de campo comenzó con el concepto de Newton de campo gravitacional en este caso, dicho campo describe la atracción de un cuerpo o grupo de cuerpos sobre otro. Análogamente el campo eléctrico producido por un objeto o grupo de objetos cargados crea una fuerza sobre otro objeto cargado eléctricamente. El uso de campos vectoriales para describir este tipo de fuerzas ha conducido a una misma comprensión mas profunda de las fuerzas atractivas y repulsivas en la naturaleza. Sin embargo fue el monumental descubrimiento de las ecuaciones de Maxwell que describen la propagación electromagnética, las que consolidaron el concepto de campo en el pensamiento científico. Este ejemplo es especialmente interesante teniendo en cuenta que los campos se pueden propagar. El contraste entre campos electromagnéticos que se pueden propagar y el campo gravitacional que implica una acción a distancia, ha originado gran interés entre los filósofos de la ciencia. La idea de Einstein es que la gravitación puede describirse en términos de las propiedades métricas del espacio-tiempo y que en esta teoría los campos asociados también pueden propagarse, exactamente como el campo electromagnético, proporcionando por lo tanto una profunda evidencia filosófica de que la versión de Einstein de la gravitación debería ser correcta. La idea de campo también se usa en ingeniería para describir sistemas elásticos e interesantes propiedades micro-estructurales de los materiales, con la teoría de la física moderna, el concepto de campo se usa para describir partículas elementales, además es una herramienta fundamental en los esfuerzos de los físicos teóricos modernos para unificar la gravedad con la mecánica cuántica de las partículas elementales. “Es imposible imaginar un marco teórico moderno que no incorpore algún tipo de concepto de campo como ingrediente central. En las aplicaciones matemáticas a la física y a ciertas ramas de la ingeniería como la mecánica de fluidos por ejemplo, se maneja con frecuencia el concepto de campo vectorial.”1 Ahora matemáticamente un campo vectorial no es otra cosa que una función vectorial definida en un cierto conjunto. Por ejemplo si a cada punto x de la atmosfera asignamos un vector V(x) que representa la velocidad del viento, queda definido un campo vectorial. Si V(x) se expresa en función de sus tres componentes de una cierta base por ejemplo { derecha para R3, entonces se define una función vectorial:
1
Cálculo Vectorial, Jerrald E. Marsden, Anthony J. Tromba.
3
base ortonormal
Las componentes V1, V2, V3, son tres funciones reales por lo tanto un estudio de los campos vectoriales equivale en cierto sentido al de estudiar en este caso ternas de funciones reales. Para distinguir entre campos vectoriales y funciones reales, a estas ultimas se les suele llamar campos escalares. Por ejemplo la temperatura en cada punto de la atmosfera define un campo escalar. Uno de los modelos físicos más útiles de campo vectorial se presenta al considerar el movimiento de un fluido. A cada punto x (o partícula del fluido) atribuimos un vector V(x) que representa la velocidad de aquella partícula. Naturalmente el campo puede o no cambiar con el tiempo. El flujo estacionario V(x) esta completamente determinado por x y no depende del tiempo. En problemas físicos que incluyan campos vectoriales es importante conocer no solamente el vector V(x) en cada punto x, sino también como varia dicho vector al pasar de un punto a otro. Para estudiar este cambio disponemos del mecanismo de la diferenciación parcial que puede aplicarse a los componentes de V. en general las derivadas parciales de estos componentes dependerán de la elección de la base con relación a la que los componentes han sido determinados. Por eso las derivadas parciales son un tanto insatisfactorias para describir ciertas magnitudes físicas, mientras que ciertas combinaciones de derivadas parciales, como la divergencia, el rotacional, entre otras, se usan para describir mejor el comportamiento de los campos vectoriales, la divergencia de un campo vectorial por ejemplo es un campo escalar que en el uso de una corriente de fluido, mide la proporción en la que el fluido fluye del entorno inmediato a cada punto. Ahora retomando nuevamente el campo gradiente este es un ejemplo claro de la relación existente de un campo vectorial con el estudio de la derivación parcial. Si ϕ es una función (un campo escalar) definida en un conjunto abierto de Rn, el gradiente de ϕ, designado por gradϕ, y definida por la relación anterior gradϕ(x) = (D1 ϕ(x),…,Dn ϕ(x)) en cada punto x de S en que existan las derivadas parciales. Interpretaciones del campo gradiente. Para el caso de R3, se tiene una interesante interpretación. Sea c una constante y consideremos el conjunto de superficies en donde ϕ(x)=c si alguna de estas superficies tiene un plano tangente en a= (a1, a2, a3) la ecuación de dicho plano esta dada por esto significa que ∇ϕ (a) es normal al plano en el punto a. Por tanto el plano tangente existe siempre que ∇ϕ (a)≠ .
4
El campo escalar ϕ cuyo gradiente es ∇ϕ se llama función potencial del campo vectorial ∇ϕ. Las correspondientes distintas superficies se denominan superficies equipotenciales (o superficies de nivel) ahora si se trata de campos bidimensionales cada conjunto de superficies son ahora conjuntos de curvas planas que se llaman curvas equipotenciales o de nivel. Las superficies o curvas de nivel dependiendo del caso son ortogonales al vector gradiente en cada punto a en el que ∇ϕ ≠ 0. De forma geométrica el gradiente evaluado en un punto es un vector que se encuentra normal a una superficie en el espacio a la cual se le esta estudiando en dicho punto, bien sea (x,y) o de coordenadas(x,y,z); por ejemplo: supóngase que se considera la temperatura en un lugar determinado, la cual se define a través de un campo escalar de tal manera que en cualquier punto (x,y,z) la temperatura esta dada por T(x,y,z). Asumiendo que no varia con respecto al tiempo. Ahora el gradiente en un punto (x,y,z), y la magnitud de este nos dará cuan rápido se calienta un fluido en una dirección cuya temperatura este regida por la función T(x,y,z). Otro ejemplo interesante es el relacionado con una montaña en la cual su altura en un punto (x,y) esta definida por un campo escalar H(x,y), el gradiente de H, en ese punto estará en la dirección del punto a mayor grado de inclinación, la magnitud del gradiente nos mostrará que tan empinada se encuentra la pendiente. Con respecto a la física ya antes mencionado el gradiente posee bastantes aplicaciones especialmente en electromagnetismo y mecánica de fluidos. En particular existen muchos campos vectoriales que pueden escribirse como el gradiente de una función potencial escalar, uno de ellos por ejemplo es el campo electrostático que deriva del potencial eléctrico . Ahora bien todo campo que pueda escribirse como el gradiente de un campo escalar, se denomina potencial conservativo o irrotacional. Asi por ejemplo una fuerza conservativa deriva de la energía potencial , y como ya antes mencionado los gradientes también aparecen en procesos de difusión que verifican ciertas leyes como la de Fourier para la temperatura. Así por ejemplo, el flujo de calor de un material es proporcional al gradiente de temperatura siendo k una constante de conductividad térmica. He aquí la grafica de algunos campos gradientes en R3 y de una taraza en particular asociada a la función potencial del campo sobre una pequeña región del espacio, funciones que utilizaremos posteriormente:
5
Figura 1 ∇ f(x,y,y) f(x,y,y)=xz +yz xz +yz=3
Figura 1.1
6
∇ g(x,y,z) g(x,y,z)= x^2+z^2-2 x^2+z^2=2
Figura 1.2
∇ h(x,y,z) h(x,y,z)= yz-2 yz=2
Las pequeñas flechas de colores representan el campo gradiente evaluado en algunos puntos y la superficie representa una superficie de nivel de la función que se esta tratando. En los ejemplos anteriores se ha tratado el gradiente y algo relacionado con la dirección es por ello que se hace necesario mencionar algunas cuestiones sobre la derivada direccional, es decir como es la variación de determinada función con respecto a una dirección especifica, en una función de dos variables cuando estamos hablando de derivadas parciales de , estamos indicando solamente como esta variando la función en dirección del vector respectivamente pero surge la pregunta como esta variando en otras direcciones. Es fácil mostrar que esta variación esta dada por: Donde de un vector unitario en la dirección de
representa la variación de la función en la dirección de esta relación anterior se deducen varias cosas:
a) El máximo valor de la derivada direccional esta dado por ‖ ∇f(x,y) ‖ b) El mínimo será entonces -‖ ∇f(x,y) ‖
7
De lo dicho anteriormente podemos sacar algunas conclusiones previas o más bien algunas propiedades que verifica el vector gradiente: Es ortogonal a las superficies escalares. Apunta en la dirección en que la derivada direccional es máxima. Se anula en los puntos críticos (máximos, mínimos y puntos silla).
Esta última propiedad mencionada no es más que una extensión a la definición de punto crítico de una variable, para el caso de dos variables que se dice si existe en todos los puntos de 2 algún subconjunto de R el punto (x0 , y0) es un punto crítico de f si una de las siguientes condiciones se cumple:
i) ii) Es decir que
es un punto crítico si
no existe.
Hasta este punto hemos hablado de campo vectorial, derivada direccional, gradiente y puntos críticos, entremos ahora en una segunda parte, una pequeña introducción a lo que se denomina el método de los multiplicadores del Lagrange. MÉTODO DE LOS MULTIPLICADORES DE LAGRANGE Cuando se quiere determinar los máximos o mínimos de una función sometida a una o mas restricciones por ejemplo el de encontrar la distancia mínima que hay de una superficie y el origen no siempre es posible resolver la restricción para alguna de las variables en términos de las otras, pero se puede seguir un método para determinar dichos puntos máximos o mínimos ; dicho procedimiento se denomina Método de los Multiplicadores de Lagrange en honor al matemático francés Joseph L. Lagrange y consiste en lo siguiente: Si un campo escalar conjunto de condiciones entonces escalares
8
tiene un extremo relativo cuando esta sometido a un siendo m
Para el caso de funciones de dos variables cuyas primeras derivadas parciales son continuas, si tiene un extremo relativo en el punto sujeta a la condición y ∇ g≠ 0, entonces existe una constante λ talque:
El método de los multiplicadores de Lagrange nos permite encontrar los puntos Que optimizan (producen máximos y/o mínimos) una función dada .
, sujeta a la restricción
Esta idea es esencialmente la extensión natural del método usual para funciones de una variable, buscar máximos o mínimos entre sus puntos críticos, es decir los puntos en donde . Este caso consideramos . Es claro que , así basta buscar valores en los cuales , es decir Para la demostración de la validez del método para funciones de dos variables puede observarse en: “El CALCULO 7 ed.” Dicha demostración esta basada en algunas concepciones geométricas que se presentan a continuación: Antes de comenzar con algún ejemplo ilustrativo es conveniente tener en cuenta algunas observaciones acerca del método: La condición del método de Lagrange es una condición necesaria pero no suficiente, para la determinación de puntos máximos o mínimos. El método es valido si el numero de condiciones m, es menor que el numero de variables n. Por ejemplo en una variable la condición es necesaria pero no suficiente para que f posea un máximo o un mínimo en , por ejemplo la función
9
Es tal que
sin embargo el origen no es punto de máximo ni de mínimo para .
Figura 2
Figura 2.1
Considérese la función sujeta a la restricción función . Encontrar los máximos y/o mínimos de
, es decir considérese la
Aplicando el método de los multiplicadores de Lagrange, es decir encontrar un λ tal que:
Para hallar dicho punto hay que considerar lo siguiente:
Ahora bien tenemos lo siguiente
pero en este punto tenernos 3 variables y solo dos
ecuaciones por lo que introducimos una nueva ecuación restricción, así obtenemos un sistema de ecuaciones:
10
que no es más que la
Resolviendo el sistema encontramos los valores para λ =±1 y función no tiene ni máximo ni mínimo sobre esta restricción.
sin embargo la
Figura 3
Veamos otro ejemplo: encontrar la distancia mínima en el plano de la función
. Aquí surge
una pregunta ¿Cuál es la función a optimizar?, la función a optimizar es una función distancia dada por:
11
Sometida a la restricción de
Tenemos que:
Luego el sistema esta dado por:
Resolviendo el sistema encontramos los puntos
,
este λ en economía
tiene una interpretación especial. Luego un
que a su vez representa una curva de nivel sobre el plano
, obsérvese nuevamente que la curda de nivel de la función es tangente a la restricción en el punto si consideramos toda la circunferencia completa es decir .
12
Desde el punto de vista grafico:
Figura 4
Figura 4.1
Figura 4.2 Gráficamente vemos que la curva de nivel de la función que se va a optimizar es precisamente tangente a la curva de nivel de la restricción, la figura 4.1 muestra una el primer octante sobre el cual se visualizan las funciones, con en el fin de mayor claridad.
Veamos ahora con el ejemplo anterior una forma algo intuitiva de mostrar que realmente las curvas son tangentes en este punto.
13
Consideremos la traza de la función =2 es decir bastante simple de estas curva esta dada por: Es
claro
que
un
una parametrización
vector
tangente
esta
dado
por
. Ahora bien tenemos que el gradiente de en términos de esta parametrización: luego mencionado.
luego el gradiente es ortogonal a la curva de nivel como ya antes se había
Similarmente para la restricción sea dada por
tenemos que una simple parametrización consisten en:
luego un conjunto de ecuaciones paramétricas que me representan dicha función esta de manera que
y además el gradiente de
términos de esta parametrización viene dada por
luego
en
nuevamente
vemos que el gradiente es ortogonal a la curva de nivel. Ahora bien existe un punto en que el cual son paralelos y mediante las relaciones anteriores esto implica que también lo sean luego las dos curvas en este punto son tangentes entre si. Teniendo en cuenta las restricciones que y sean diferentes del vector nulo. Por otra parte el hecho que:
Indican que se esta encontrando un punto sobre el cual el vector gradiente es múltiplo escalar del vector , por lo que si tomamos el producto punto entre los dos vectores obtenemos que:
Siendo θ el ángulo entre dichos vectores pero dado que los vectores son paralelos entonces tenemos que el ángulo formado entre ellos es 0° ó 180° por lo tanto dicho producto punto queda determinado por:
Ó
14
Y retomando la derivada direccional que: El máximo valor de la derivada direccional esta dado por ‖ ∇f(x,y) ‖ El mínimo será entonces -‖ ∇f(x,y) ‖ análogamente estamos encontrando, como esta variando la función en la dirección del vector ∇g(x,y) y dicha variación estará relacionada con las expresiones anteriores. Para el caso de dos restricciones se esta considerando que:
Análogamente en el caso de una restricción se considera un vector múltiplo escalar de otro ahora aquí se esta considerando al como una combinación lineal de los gradientes de y se busca un punto en donde dicha relación se cumpla, a modo de ejemplo tomado de “El CALCULO 7 ed.” Aunque el objetivo en este caso es ver un poco la forma gráfica del problema, considérese el siguiente conjunto de restricciones ,y y se busca optimizar la función sobre dichas restricciones.
Por lo tanto tenemos que:
Luego el sistema de ecuaciones queda determinado por:
Y resolviendo el sistema encontramos los puntos (1, 2, 1); (-1, -2, -1); (-1,- 2, -1); (-1, 2, 1) los cuales nos entregan un máximo y un mínimo son respectivamente (1, 2, 1) y (-1,- 2, -1), en donde , para tratar de hacer un poco mas claros se tratara de
15
mostrar el caso para el punto (1, 2, 1), pero recuérdese que por algo de simetría en el problema es análogo el análisis para el punto (-1, -2, -1). Gráficamente:
Figura 5
Figura 6
16
Figura 5.1
Figura 6.1
Figura 7
Figura 8
17
Figura 7.1
Figura 8.1
Las figuras 5, 5.1, 6, 6.1, 7, 7.1 hacen referencia a los gradientes:
Y a las superficies de nivel respectivamente. Ahora surge una pregunta como es posible graficar los vectores gradientes evaluados en un punto, una idea algo intuitiva que intenta dar respuesta, consiste en ver al gradiente evaluado en un punto como un vector en R 3 el cual tiene un origen móvil dado por el punto ,ya partir de allí graficar un vector de posición determinado por el gradiente evaluado en dicho punto, siguiendo este procedimiento podríamos hallar varios vectores representativos y hacernos a una idea de cómo se comporta el campo gradiente en algunos puntos, aunque graficar esto en el espacio es algo complicado similarmente podemos aplicar el procedimiento en el plano siendo allí mucho mas sencillo.
z
∇ f(x0, y0, z0) (x0, y0, z0) Y
Figura 9 x
Desde un punto de vista mas geométrico es el de tratar al vector gradiente como un vector libre en el espacio, si tomamos el punto de coordenadas , considerándolo como el punto terminal del vector de posición , a dicho vector le podemos sumar el vector gradiente evaluado en dicho punto obteniendo así un nuevo vector de posición determinado por ya que la suma de un vector libre mas un vector de posición es un nuevo vector de posición, así el vector queda determinado mediante la siguiente relación:
18
Luego el gradiente de la función obteniendo así:
puede ser despejado de la relación anterior
Lo cual indica la diferencia de dos vectores de posición la cual esta definida y es un nuevo vector libre, recuérdese que la suma de dos vectores de posición no esta definida, por lo tanto seguimos acorde con la teoría considerando el vector gradiente evaluado en un punto como un vector libre, por lo cual conociendo el gradiente evaluado en un punto, graficarlo es fácil:
Figura 10
19
Por ultimo consideremos nuevamente el problema de optimización sometido a las dos restricciones analíticamente se ha encontrado que efectivamente el se puede expresar como combinación lineal de los vectores , una forma de mostrarlo geométricamente es haciendo referencia a lograr encontrar un plano, ¿cual plano será? , veamos: tenemos claramente que <2, 0, 2> y <0, 2, 1> son Linealmente independientes por lo tanto forman una base que genera un espacio consideremos dicho espacio como el plano que forman los dos vectores, fácilmente se puede llegar a que la ecuación del plano esta dada por: y se puede comprobar que los puntos asociados a los vectores de posición con los que podemos graficar están efectivamente contenidos en dicho plano.
Figura 11
Figura 11.1
Las figuras 11 y 11.1 muestran el plano generado por los dos vectores <2, 0, 2> y <0, 2, 1> y el vector <1, 3, 3>, y una perspectiva del grafico muestra que los tres vectores efectivamente están sobre un mismo plano por lo tanto cualquiera de ellos es combinación lineal del resto.
20
Bibliografía: Marsden, Jerrold Eldon, Tromba, Anthony J. Calculo vectorial. - 5. Ed. Pearson Educación. España. 2004 Apóstol, Tom M. Análisis matemático: introducción moderna al cálculo superior. - 01.ED, Reverte. España. 1950. Apóstol, Tom M. Calculo con funciones de varias variables y algebra lineal con aplicaciones a las ecuaciones diferenciales y a las probabilidades: v2. - 2. ed. Reverte. España. 1975. Leithold, Louis. El calculo. - 7. Ed. Oxford University Press. Mexico. 1998 Caicedo Contreras, José Francisco. Calculo avanzado: introducción, Universidad Nacional de Colombia. Bogotá. 2005. Phillips, Henry Bayard. Análisis vectorial. Uteha. Mexico. 1956
21