Hasta ahora hemos estado estudiando funciones que dependían de una sola variable independiente, pero en muchos casos de la vida real aparecen funciones que dependen de más de una variable, como por ejemplo
- El área de un triángulo depende de dos factores que son su base y su altura.
- El volumen que ocupa un gas perfecto depende de dos factores que son su presión y su temperatura.
- El capital de una inversión depende de el tiempo y el tipo de interés.
- El camino recorrido por un cuerpo en un movimiento de caída libre depende de multitud de factores entre los que cabe destacar: el tiempo que dure la caída, el área de la sección transversal del cuerpo, la latitud del lugar, la altura sobre el nivel del mar, la presión del aire, la temperatura del aire, etc.
Estas dependencias se expresan con funciones de varias variables. En este capítulo analizaremos las derivadas este tipo de funciones, en particular funciones de en y de en , aunque los resultados se pueden generalizar fácilmente para funciones de en .
Función de varias variables
Definición 12.1 (Función de varias variables) Una función de variables de un conjunto en un conjunto , es una relación que asocia a cada tupla un único elemento de que se denota , y se llama imagen de mediante .
Cuando , entonces se dice que es una función real de variables reales o bien un campo escalar.
Ejemplo 12.1
- El área de un triángulo es la función real de dos variables reales
Gráfica de una función de dos variables
La representación gráfica cartesiana de una función de dos variables es una superficie del espacio real donde cada punto de la superficie tiene coordenadas , siendo .
Ejemplo 12.2 La función que mide el área de un triángulo de base y altura tiene la siguiente representación gráfica:
Y la función tiene la siguiente representación gráfica que simula las ondas que produce una gota de agua al caer sobre un líquido.
Conjunto de nivel de una función de varias variables
Visualizar la gráfica de una función de dos variables no es fácil, sobre todo si se representa en un papel que, a fin de cuentas, es un plano en dos dimensiones. Un recurso bastante habitual para entender el comportamiento de una función de dos variables son las curvas de nivel, que consisten en representar en el plano euclídeo los puntos que tienen la misma imagen.
Definición 12.2 (Conjunto de nivel) Dada una función de variables , se llama conjunto de nivel de al conjunto
Ejemplo 12.3 Si y , el conjunto de nivel de que incluye al punto es
que es la circunferencia del plano real centrada en el origen y de radio .
Ejemplo 12.4 La siguiente gráfica representa algunas de las curvas de nivel de la función .
Las curvas de nivel se utilizan en muchas aplicaciones como por ejemplo en los mapas topográficos, donde cada curva representa los puntos que están a la misma altura sobre el nivel del mar, o en los mapas meteorológicos, donde cada curva representa los puntos con la misma presión atmosférica.
Límites de funciones de varias variables
El concepto de límite de una función de una variable se puede extender fácilmente a funciones de varias variables, pero antes necesitamos introducir, desde un punto de vista topológico, el concepto equivalente a un entorno de un punto en la recta real, en espacios de mayor dimensión.
Definición 12.3 (Entorno de un punto en el plano real) Dado un punto del plano , se llama entorno de a cualquier disco abierto con . El número se conoce como radio del entorno.
Para cualquier el conjunto se llama entorno reducido de .
Geométricamente, un entorno de de radio está formado por todos los puntos interiores del círculo de radio centrado en .
De manera similar se define un entorno en el espacio real.
Definición 12.4 (Entorno de un punto en el espacio real) Dado un punto del espacio , se llama entorno de a cualquier bola abierta con . El número se conoce como radio del entorno.
Para cualquier el conjunto se llama entorno reducido de .
Geométricamente, un entorno de de radio está formado por todos los puntos interiores de la esfera de radio centrado en .
Definición 12.5 (Límite de una función de varias variables) Dada una función de variables definida en un entorno reducido del punto , se dice que es el límite de en el punto , si para cada existe un tal que si , entonces , y en tal caso, se denota
Ejemplo 12.5 Veamos que el límite de la función en es .
Dado , como
Por tanto, si tomamos , se tiene que si , entonces
En el caso de una función de una variable , vimos que para que existiese el límite de la función en el punto , bastaba con ver que existía el límite por la izquierda (cuando nos aproximamos a con valores menores que ) y el límite por la derecha (cuando nos aproximamos a con valores mayores que ) y que eran iguales. Sin embargo, para funciones de varias variables esto no es así, ya que para demostrar la existencia del límite es necesario probar que el límite existe cuando nos acercamos a por cualquier posible trayectoria en , y todos los límites coinciden.
Ejemplo 12.6 El límite de la función en no existe, ya que si nos aproximamos a tomando puntos de la recta , tenemos
que nos da un límite distinto para cada , es decir, para cada dirección de aproximación obtenemos un límite distinto.
La estrategia de calcular el límite a lo largo de las trayectorias rectas que pasan por el punto no garantiza la existencia del límite, aún cuando todos los límites existan y sean iguales.
Ejemplo 12.7 Para la función , si nos aproximamos a tomando los puntos de la recta , se tiene
Por tanto, el límite existe y vale cuando nos aproximamos a siguiendo trayectorias rectas. Sin embargo, existen otras trayectorias de aproximación donde el límite no existe, como por ejemplo, la trayectoria .
Por consiguiente, no existe el límite de en .
Afortunadamente, el álgebra de límites visto en la Proposición 6.2 también es válido para funciones de varias variables.
Ejemplo 12.8 El límite de la función en el punto es
Continuidad de funciones de varias variables
Una vez definido el límite de una función de varias variables, el concepto de continuidad se extiende de manera natural a funciones de varias variables.
Definición 12.6 Dada una función de variables , se dice que es continua en el punto si
Ejercicio 12.1 Hemos visto en el Ejemplo 12.5 que el límite de la función en es . Sin embargo, esta función no está definida en , por lo que es discontinua en este punto.
Funciones parciales
Definición 12.7 (Función parcial) Dada una función de variables , se llama función parcial -esima de a cualquier función que resulta de fijar todas las variables de como constantes, excepto la variable , es decir:
con constantes.
Ejemplo 12.9 Si consideramos la función del área de un triángulo
y fijamos el valor de la base , entonces el área del triángulo ya sólo depende de la altura y se convierte en una función de una sola variable, que es la función parcial:
con constante.
Derivadas parciales
Al igual que vimos cómo calcular la variación de una función de una variable, tiene sentido medir la variación de una función de varias variables con respecto a cada una de sus variables.
Sea una función de varias variables en . Si estamos en el punto y nos movemos una cantidad en la dirección del eje , entonces, al mantenerse la coordenada constante, pasaremos desde el punto al punto , y la variación que experimenta la función será
La variación relativa que experimenta la función con respecto a la variable vendrá dada por el cociente
Si en lugar de medir la variación de una función con respecto a una variable en un intervalo, medimos la variación en un punto, es decir, cuando tiende a 0, entonces obtenemos una tasa de variación instantánea:
Al valor del límite, cuando existe, también se le conoce como derivada parcial de con respecto a la variable en el punto , y mide la tasa de variación instantánea de en el punto cuando el punto se mueve en la dirección del eje .
Del mismo modo, si estamos en el punto y nos movemos una cantidad en la dirección del eje , manteniendo la coordenada constante, pasaremos desde el punto al punto , y la tasa de variación instantánea de la función en ese punto viene dada por el límite
que cuando existe se conoce como derivada parcial de con respecto a la variable en el punto , y mide la tasa de variación instantánea de en el punto cuando el punto se mueve en la dirección del eje .
El concepto de derivada parcial puede extenderse fácilmente para funciones de variables.
Definición 12.8 (Derivada parcial) Dada una función de variables , se dice que es derivable parcialmente con respecto a la variable en el punto si existe el límite
En tal caso, al valor del límite se le llama derivada parcial de en con respecto a la variable , y se denota
Interpretación geométrica de la derivada parcial
Geométricamente, define una superficie. Si se corta esta superficie con el plano de ecuación (es decir, si se fija como una constante), la intersección de este plano con la superficie es una curva plana cuya pendiente en el punto es la derivada parcial de con respecto a en el punto .
Como se puede observar, la definición de derivada para funciones de una variable es un caso particular de esta definición para .
Al medir la variación de con respecto a la variación de una sola de sus variables en un punto , el resto de las variables se pueden considerar como constantes y, en tal caso, podemos ver a como una función parcial -ésima
La derivada parcial de con respecto a puede calcularse derivando esta función:
Para derivar parcialmente con respecto a una variable , se deriva como si la única variable fuese , tratando el resto de las variables como constantes.
Ejemplo 12.10 En la ecuación de estado de los gases perfectos, el volumen es una función que depende de dos variables
donde mide la temperatura, la presión y y son constantes.
La tasa de variación instantánea que experimenta el volumen con respecto a la presión viene dada por la derivada parcial de con respecto a .
Para calcular esta derivada parcial se fija como constante y se deriva como si la única variable fuese :
Del mismo modo, la tasa de variación instantánea del volumen con respecto a la temperatura es:
Vector gradiente
Definición 12.9 (Vector gradiente) Dada una función de variables , se llama gradiente de , y se escribe , a la función que a cada punto le asigna el vector cuyas componentes son las derivadas parciales de en ,
Más adelante se mostrará que vector gradiente en un punto dado tiene la misma magnitud y dirección que la velocidad máxima de variación de la función en ese punto. De este modo, indica la dirección de máximo crecimiento de la función, mientras que indica la dirección de máximo decrecimiento.
Ejemplo 12.11 Al calentar una superficie la temperatura (en ºC) en cada punto (en m) de dicha superficie viene dada por la función:
La dirección en la que más rápidamente aumenta la temperatura nos la da el vector gradiente
Si estamos, por ejemplo, en el punto dicha dirección será
y su magnitud
Recta normal y plano tangente a una superficie
Ya se ha visto que para una función de dos variables , es la pendiente de la recta tangente a la superficie de en en su intersección con el plano , y que es la pendiente de la recta tangente a la superficie de en en su intersección con el plano . Estas dos rectas tangentes definen, en realidad, un plano tangente a la superficie de en el punto .
Si tomamos los vectores y en las direcciones de estas dos rectas tangentes, su producto vectorial será normal a la superficie.
Usando este vector podemos construir la ecuación de la recta normal a la superficie de .
Definición 12.10 (Recta normal a la superficie de una función de dos variables) Dada una función de dos variables con derivadas parciales continuas en el punto se define la recta normal a la superficie de en el punto como la recta de ecuación
Para obtener la ecuación del plano tangente a la superficie de también podemos usar este vector normal a la superficie, ya que cualquier punto del plano debe cumplir la ecuación
Definición 12.11 (Plano tangente a la superficie de una función de dos variables) Dada una función de dos variables con derivadas parciales continuas en el punto se define el plano tangente a la superficie de en el punto como el plano de ecuación
Ejemplo 12.12 La recta normal a la superficie de la función en el punto tiene ecuación
Y el plano tangente a la superficie de en tiene ecuación
La existencia de las derivadas parciales de una función de dos variables en un punto no garantiza la existencia de la recta normal y el plano tangente en ese punto.
Ejemplo 12.13 La función
Cuando esta función es constante y vale por lo que su derivada parcial con respecto a es . Del mismo modo, cuando esta función es constante y vale por lo que su derivada parcial con respecto a también se anula . Sin embargo, esta función no tiene plano tangente en el punto como se puede apreciar en la Figura 12.1.
Diferenciabilidad
En el capítulo de derivadas de funciones de una variable se definió el diferencial de una función como la aplicación lineal y se vió cómo el diferencial puede utilizarse para aproximar la variación de en un entorno de . La misma idea puede generalizarse a funciones de varias variables.
Definición 12.12 (Diferencial total) Dada una función de variables , se define el diferencial total de la función en el punto como
Ejemplo 12.14 Dada la función , su gradiente es , y en el punto vale , por lo que el diferencial total de en es
Definición 12.13 (Función diferenciable de dos variables) Dada una función de dos variables , se dice que es diferenciable en el punto si
con y cuanto .
Si una función de dos variables es diferenciable en un punto , podemos usar el diferencial total como una aproximación de la variación que experimenta la función en cualquier punto en un entorno de , ya que cuando , es decir,
Si en la ecuación anterior reescribimos y , se tiene que
de donde se deduce que
Si se observa bien, el lado derecho de esta igualdad es la ecuación del plano tangente a la superficie de en el punto . De esta manera, si una es diferenciable en podemos aproximar el valor de la función en cualquier punto de un entorno de , como el valor del plano tangente en ese punto. El error en la aproximación es que tiende a cuando se aproxima a . Además, dado que y cuando , la cantidad se aproxima a mucho más rápidamente que o se aproximan a , por lo que el plano tangente a la superficie de en el punto dará muy buenas aproximaciones de en un entorno cercano de .
Ejemplo 12.15 Veamos que la función es diferenciable en cualquier punto
De modo que, tomando y , se tiene que
y, además y cuando , por lo que la función es diferenciable en .
Así pues, podemos utilizar el plano tangente que calculamos en el Ejemplo 12.12 para aproximar la función en un entorno del punto . Por ejemplo, la aproximación de en es
El concepto de función diferenciable se generaliza de manera natural para funciones de variables.
Definición 12.14 (Función diferenciable) Dada una función de n variables , se dice que es diferenciable en el punto si
con cuando .
En general, demostrar que una función es diferenciable en un punto puede ser una tarea complicada, pero afortunadamente, el siguiente teorema proporciona una condición suficiente para que una función sea diferenciable.
Teorema 12.1 Si una función de variables tiene derivadas parciales continuas en un entorno de , entonces es diferenciable en .
Prueba. Veremos la demostración en el caso de una función de dos variables .
Como en los dos primeros términos de esta expresión se mantiene constante , podemos considerar la función parcial que resulta de fijar el valor de a , de manera que . Entonces, como existe en el intervalo , por el teorema del valor medio (Teorema 7.6), existe un valor tal que
Del mismo modo, como en se mantiene constante , podemos considerar la función parcial que resulta de fijar , de manera que . Al igual que antes, como existe en el intervalo , por el teorema del valor medio, existe otro valor tal que
Por tanto, la expresión inicial se puede reescribir como
Si ahora definimos
se tiene que
Finalmente, como las derivadas parciales de son continuas en un entorno de , cuando y , se tiene que , y , de manera que, y , por lo que se concluye que es diferenciable en .
Esta demostración puede generalizarse fácilmente a funciones de variables.
Regla de la cadena
En el Teorema 7.2 vimos cómo calcular la derivada de una composición de dos funciones de una variable real. Una función de varias variables también puede componerse con otras funciones, y en particular, resulta interesante estudiar la derivada de la composición de una función vectorial con una función de varias variables.
Si es una función de variables y es una función vectorial en , entonces es posible componer con , de manera que es una función real de variable real.
Teorema 12.2 (Regla de la cadena) Si es una función de variables diferenciable y es una función vectorial en diferenciable, entonces
Prueba. Como es diferenciable se tiene que
con cuando .
Entonces, tomando se tiene
Y tomando el límite cuando se concluye
ya que cuando , y por tanto, , por lo que
Ejemplo 12.16 Si se toma el campo escalar del plano real y la función vectorial del mismo plano, entonces
y
por lo que
Se puede llegar al mismo resultado, sin aplicar la regla de la cadena, derivando directamente la función compuesta
de manera que
La regla de la cadena para la composición de una función vectorial con una función de varias variables permite obtener fácilmente el álgebra de derivadas para funciones reales de una variable real:
Por ejemplo, para deducir la derivada de la suma se toma la función de dos variables y la función vectorial , de manera que aplicando la regla de la cadena se tiene
Y para deducir derivada del producto, tomando , se tiene
Derivación implícita
Hasta ahora hemos estado trabajando con funciones de varias variables explícitas, es decir, de la forma , pero también es posible definir una función de varias variables de manera implícita mediante una ecuación de la forma , donde .
Ejemplo 12.17 La ecuación define la esfera de radio 1 centrada en el origen. Esta ecuación no define una función implícita ya que si despejamos se tiene que , que no es una función ya que asigna dos imágenes a cada punto . Sin embargo, si se toma sólo la raíz positiva, la ecuación anterior define de manera implícita la función que corresponde a la semiesfera positiva de radio 1 centrada en el origen.
El teorema siguiente nos proporciona las condiciones suficientes para que una ecuación como la anterior defina de manera implícita a una de sus variables como función de las otras.
Teorema 12.3 (Teorema de la función implícita) Si es una función de variables definida sobre un entorno abierto del punto y tal que
- Todas las derivadas parciales de son continuas en el entorno de .
- .
Entonces la ecuación define a como una función de en el entorno de .
Cuando una ecuación define de manera implícita una de sus variables como función de las otras, no siempre es posible obtener la forma explícita de esa función, por lo que necesitamos saber cómo calcular la derivada de estas funciones en forma implícita.
Teorema 12.4 Si define a implícitamente como función derivable de , entonces
Prueba. Si la ecuación define a como una función de , es decir, , entonces, tomando y aplicando la regla de la cadena se tiene
de donde se deduce
Ejemplo 12.18 La ecuación define a la circunferencia de radio 1 centrada en el origen de coordenadas, que también puede expresarse como
Si se piensa en como función implícita de , es decir, , se tiene
Podría llegarse al mismo resultado, despejando de la ecuación de la circunferencia,
Si se toma la raíz positiva, que corresponde a la semicircunferencia superior, la derivada vale
que coincide con el resultado de la derivación implícita, teniendo en cuenta que .
Derivada direccional
Hemos visto que para una función de dos variables , es la tasa de variación instantánea de con respecto a en el punto , es decir, cuando nos desplazamos desde el punto en la dirección del eje , y que es la tasa de variación instantánea de con respecto a en el punto , es decir, cuando nos desplazamos desde el punto en la dirección del eje .
Pero, ¿qué pasa si nos movemos en cualquier otra dirección?
La tasa de variación instantánea de en un punto en la dirección de un vector unitario cualquiera se conoce como derivada direccional.
Definición 12.15 (Derivada direccional) Dada una función de variables , un punto y un vector unitario en , el límite
cuando existe, se llama derivada direccional de en el punto en la dirección de .
Obsérvese que las derivadas parciales son las derivadas direccionales en las direcciones de los vectores coordenados.
El siguiente teorema nos permitirá calcular derivadas direccionales de manera más sencilla, sin necesidad de calcular el límite anterior.
Teorema 12.5 Si es una función de variables cuyas derivadas parciales existen en un punto y es un vector unitario en , entonces
Prueba. Si se considera un vector unitario , la función vectorial cuya trayectoria pasa por , dirigida por , tiene ecuación
que para , pasa por con velocidad .
Así, la tasa de variación de en el punto en la dirección de es
En el caso de una función de dos variables , la derivada direccional da la tasa de variación de en el punto cuando empezamos a cambiar e en la dirección del vector .
Ejemplo 12.19 Dada la función , su vector gradiente es
de manera que la derivada direccional en el punto , en la dirección del vector unitario es
Para calcular la derivada direccional en la dirección de un vector no unitario , basta con convertirlo en unitario mediante la transformación
Teorema 12.6 Si es una función de variables cuyas derivadas parciales existen en un punto entonces la dirección de máximo crecimiento de es la del vector gradiente .
Prueba. Como se ha visto, para un vector unitario
donde es el ángulo que forma con el vector gradiente .
Teniendo en cuenta que , para cualquier vector se cumple
Además, si tiene la misma dirección y sentido que el gradiente, se tiene
Por tanto, el crecimiento máximo de un campo escalar se produce en la dirección y sentido del gradiente.
Del mismo modo, si tiene la misma dirección y sentido opuesto al gradiente, se tiene
Por tanto, el decrecimiento máximo de un campo escalar se produce en la dirección y sentido opuesto al gradiente.
Teorema 12.7 Sea el conjunto de nivel de una función de varias variables que incluye a un punto . Si es un vector tangente a una trayectoria que circule por en , entonces
Es decir, el vector gradiente de en es normal a en , siempre que no sea nulo.
Prueba. Si se considera una trayectoria a lo largo del conjunto de nivel que pase por , de modo que , entonces
que es constante para cualquier , y al aplicar la regla de la cadena se tiene
de modo que, cuanto , se tiene
Según el resultado anterior, la recta normal a una línea en un punto , tiene ecuación
Ejemplo 12.20 Dado el campo escalar , y el punto , resulta que el conjunto de nivel que pasa por , para el que es la circunferencia de radio 1 centrada en el origen. Así pues, tomando como vector normal el gradiente de , , que en el punto vale , la recta normal a la circunferencia en es
que se trata de la recta vertical , que coincide con el eje .
Y la recta tangente a la circunferencia en es
Derivadas de segundo orden
Las derivadas parciales de una función son, a su vez, funciones de varias variables que muchas veces pueden volverse a derivar parcialmente con respecto a alguna de sus variables.
Definición 12.16 (Derivadas parciales de segundo orden) Si una función tiene derivada parcial con respecto a la variable en un conjunto , entonces podemos derivar de nuevo parcialmente con respecto a la variable . Esta segunda derivada, cuando existe, se llama derivada parcial de segundo orden de con respecto a las variables y , y se nota
De forma análoga se definen las derivadas de orden superior.
Ejemplo 12.21 La función de dos variables tiene cuatro derivadas parciales de segundo orden, que son:
En el ejemplo anterior se aprecia que las derivadas cruzadas de segundo orden y coinciden. El siguiente teorema establece bajo qué condiciones el orden de derivación no importa.
Teorema 12.8 (Igualdad de las derivadas cruzadas) Si es una función de variables tal que sus derivadas parciales y existen y son continuas en un conjunto abierto , entonces para cualquier
Prueba. Por la definición de derivada parcial se tiene
Si se considera la función en el intervalo , como es derivable, es derivable, y por el teorema del valor medio, existe un valor tal que
de manera que, sustituyendo en la expresión anterior, se tiene
Finalmente, como , , y como es continua, se concluye que
Una consecuencia del teorema es que, al calcular una derivada parcial de segundo orden que cumpla lo anterior, ¡el orden en que se realicen las derivadas parciales no importa!
Matriz hessiana
Definición 12.17 (Matriz hessiana) Dada una función de variables , para la que existen todas sus derivadas parciales de segundo orden en un punto , se define la matriz hessiana de en , y se nota , como la matriz cuadrada cuyos elementos son
Al determinante de esta matriz se le llama hessiano de en , y se nota .
Ejemplo 12.22 Consideremos de nuevo la función de dos variables . Su matriz hessiana es
En el punto la matriz vale
Y el hessiano en dicho punto vale
Si el teorema de la igualdad de las derivadas cruzadas se cumple para todas las derivadas parciales de segundo orden, entonces la matriz hessiana es simétrica..
Extremos
Definición 12.18 (Máximo y mínimo relativos) Dada una función de variables , se dice que un punto es un máximo relativo de si existe un valor tal que
Del mismo modo se dice que un punto es un mínimo relativo de si existe un valor tal que
A los máximos y mínimos de se les conoce como extremos relativos de .
Para determinar los extremos de una función de varias variables utilizaremos sus derivadas, de forma parecida a como lo hicimos para funciones de una variable.
Proposición 12.1 Si es una función de variables, con derivadas parciales, que tiene un extremo relativo en el punto , entonces
Prueba. Tomando la trayectoria que pasa por con la dirección y sentido del gradiente,
la función nunca decrece ya que
y sólo se anula si .
Así pues, si , entonces no puede ser un máximo ya que siguiendo la trayectoria de desde se encontrarían puntos en los que la imagen de es mayor que en . Del mismo modo, siguiendo la trayectoria opuesta a se encontrarían puntos en los que la imagen de es menor que la imagen en , por lo que tampoco puede ser un mínimo.
A los puntos donde se anula el vector gradiente, se les denomina puntos críticos.
Ejemplo 12.23 Para el campo escalar , resulta evidente que sólo tiene un mínimo en el origen ya que
En este punto se cumple, .
Puntos de silla
No todos los puntos críticos son extremos. Si se considera, por ejemplo, el campo escalar , su gradiente es
que sólo se anula en el punto . Sin embargo, este punto no es un mínimo relativo ya que los puntos del eje tienen imágenes , y tampoco es un máximo relativo ya que los puntos del eje tienen imágenes . Este tipo de puntos que anulan el gradiente pero que no son extremos, se conocen como puntos de silla.
De la fórmula de Taylor de segundo grado para un campo escalar en un punto se deduce que
De manera que si es un punto crítico de , como , se tiene que
Por tanto, el signo de coincide con el signo del término cuadrático .
Se pueden dar cuatro posibilidades:
- Definido positivo: .
- Definido negativo: .
- Indefinido: para algún y para algún .
- Semidefinido: Cualquier otro caso distinto de los anteriores.
Así pues, dependiendo el signo de , se tiene
Teorema 12.9 Dado un punto crítico de una función de variables que tiene matriz hessiana , se cumple
- Si es definido positivo entonces tiene un mínimo relativo en .
- Si es definido negativo entonces tiene un máximo relativo en .
- Si es indefinido entonces tiene un punto de silla en .
En el caso de que sea semidefinido, no se puede obtener ninguna conclusión y hay que recurrir a derivadas parciales de orden superior.
En el caso particular de una función de dos variables se tiene
Teorema 12.10 Dado un punto crítico de una función de dos variables que tiene matriz hessiana , se cumple
- Si y entonces tiene un mínimo relativo en .
- Si y entonces tiene un máximo relativo en .
- Si entonces tiene un punto de silla en .
Prueba. Tomando un vector unitario cualquiera , la derivada direccional de en es
Y la derivada direccional de segundo orden es
(1) Aplicando el teorema de la igualdad de las derivadas cruzadas.
Completando el cuadrado de esta última expresión se tiene que
Si y , como y son continuas en un entorno de , se tiene que y para en un entorno de . Por tanto, observando la expresión anterior, podemos concluir que en un entorno de , es decir, la curva que interseca la superficie de con el plano que pasa por en la dirección de es cóncava hacia arriba. Como esto esto es cierto para cualquier dirección , la gráfica de queda por encima del plano tangente en en un entorno de , y por tanto, tienen un mínimo local en .
Del mismo modo, y , podemos concluir que en un entorno de , es decir, la curva que interseca la superficie de con el plano que pasa por en la dirección de es cóncava hacia abajo. Como esto esto es cierto para cualquier dirección , la gráfica de queda por debajo del plano tangente en en un entorno de , y por tanto, tienen un máximo local en .
Finalmente, si los dos sumandos de la expresión de la derivada direccional de segundo orden anterior tienen signo distinto, y el signo de la derivada direccional dependerá de la dirección del vector , por lo que puede haber direcciones donde y la curva que interseca la superficie de con el plano que pasa por en la dirección de sea cóncava hacia arriba, y direcciones donde y la curva que interseca la superficie de con el plano que pasa por en la dirección de sea cóncava hacia abajo, de manera que tiene un punto de silla en .
Ejemplo 12.24 Dado el campo escalar , se tiene que su gradiente vale
que se anula en los puntos , , y .
La matriz hessiana vale
y el hessiano vale
Así pues, se tiene
- Punto : Punto de silla.
- Punto : y Mínimo relativo.
- Punto : y Máximo relativo.
- Punto : Punto de silla.
Extremos condicionados
En ocasiones es interesante calcular los extremos relativos de una función de varias variables no en todo su dominio, sino en los puntos que cumple una o varias ecuaciones, como por ejemplo, calcular los extremos de la función para los puntos que cumplen la ecuación . Cuando es posible despejar una de las variables de la ecuación y expresarla como una función explícita de la otra, se puede sustituir esa variable en y obtener una función de una variable, de manera que se pueden obtener sus extremos como se vio en el capítulo de derivadas de funciones de una variable.
Ejemplo 12.25 Si consideramos la misma función del ejemplo anterior , para calcular sus extremos relativos sujetos a la restricción , podemos sustituir en la fórmula de la función y se obtiene
que es, en realidad, una función de una variable . Si calculamos su derivada y la igualamos a 0, se obtienen los puntos críticos . Como la segunda derivada es , se tiene que por lo que la función tiene un máximo local en , y por lo que la función tiene un mínimo local en .
Ahora bien, cuando no es posible despejar una de las variables de la restricción , la cosa se complica. Afortunadamente, existe otro procedimiento para calcular los extremos de una función de varias variables sujeto a una o varias restricciones. A continuación explicamos el fundamento de este método para funciones de dos variables, aunque puede generalizarse para funciones de más de dos variables.
Multiplicadores de Lagrange
Dada una función de dos variables , si se quieren obtener los extremos de esta función sujetos a la restricción , en realidad, se trata de encontrar los extremos relativos de entre los puntos que están en la curva de nivel . Si dibujamos en el plano la curva de nivel de la ecuación junto a las curvas de nivel de , el problema se reduce a encontrar el menor y el mayor valor de para el que la curva de nivel se corta con la curva de nivel .
Ejemplo 12.26 La siguiente gráfica muestra las curvas de nivel de la función del ejemplo anterior junto a la curva de nivel de la restricción .
Como se aprecia en la gráfica el mayor valor de la curva de nivel de que se corta con la recta es aproximadamente y ocurre en el punto , y el menor valor de la curva de nivel de que se corta con la recta es aproximadamente y ocurre en el punto .
En el ejemplo anterior se observa que los valores extremos se obtienen donde las curvas de nivel de la función y de la restricción son tangentes, y por tanto, sus vectores gradientes en los puntos de tangencia tendrán la misma dirección, es decir, si es un punto donde las curvas de nivel son tangentes, se tiene que
Al número de esta ecuación se le llama multiplicador de Lagrange, y este resultado da lugar al siguiente procedimiento para obtener los extremos de una función de varias variables con restricciones.
Teorema 12.11 (Multiplicadores de Lagrange) Dada una función de variables , los extremos relativos de sujetos a la restricción , si , son los puntos que cumplen las ecuaciones
Prueba. Daremos la prueba para 3 variables. Supongamos que tiene un máximo relativo en el punto de la superficie definida por . Si consideramos una trayectoria con ecuación que esté sobre la superficie que define y tal que , la función tendrá un extremo relativo en , y por tanto . Pero, por otro lado, aplicando la regla de la cadena a la composición de y se tiene
y en se cumple que
de donde se deduce que es ortogonal a vector tangente a la trayectoria de en . Pero como la trayectoria de está inscrita en la superficie de nivel de nivel , por el Teorema 12.7, si entonces también es ortogonal a , por lo que y deben ser paralelos, es decir,
Para dimensiones mayores la demostración es similar.
Ejemplo 12.27 Veamos cuáles son los extremos relativos de la función sobre los puntos de la circunferencia .
Tomando , podemos expresar la circunferencia mediante la ecuación . Los extremos relativos de condicionados por , deben cumplir la ecuación de los multiplicadores de Lagrange
de donde se deduce que deben cumplir las ecuaciones
Resolviendo el sistema se obtienen cuatro soluciones en los puntos , , y , y si evaluamos en cada uno de estos puntos se tiene
por lo que se concluye que tiene máximos relativos en y , donde la función vale , y mínimos relativos en y , donde la función vale .
Polinomios de Taylor de funciones de varias variables
Ya se vio cómo aproximar funciones de una variable mediante polinomios de Taylor. Esto también se puede generalizar a la aproximación de funciones de varias variables mediante polinomios de varias variables.
Aproximación lineal de una función de varias variables
Si es un punto del dominio de una función de variables y un vector en , la fórmula de Taylor de primer grado de alrededor del punto es
donde
es el polinomio de Taylor de primer grado de en el punto , y es el resto de taylor para el vector , y mide el error cometido en la aproximación.
Se cumple que
Para una función de dos variables y , teniendo en cuenta que para un punto cualquiera , el vector , el polinomio de Taylor de en el punto , puede expresarse
que coincide con el plano tangente a en .
Ejemplo 12.28 Dado el campo escalar , su gradiente es
y el polinomio de Taylor de primer grado en el punto es
Este polinomio, permite aproximar el valor de cerca del punto .
Por ejemplo
Aproximación cuadrática de una función de varias variables
Si es un punto del dominio de una función de variables y un vector, la fórmula de Taylor de segundo grado de alrededor del punto es
donde
es el polinomio de Taylor de segundo grado de en el punto , y es el resto de taylor para el vector .
Se cumple que
lo que indica que el resto es mucho más pequeño que el cuadrado del módulo de , y por tanto, la aproximación cuadrática es mejor que la lineal.
Si es un campo escalar de dos variables y , el polinomio de Taylor de en el punto , puede expresarse
Ejemplo 12.29 Dado el campo escalar , su gradiente es
y su matriz hessiana es
Por tanto, el polinomio de Taylor de segundo grado en el punto es
Y la aproximación cuadrática en el mismo punto de antes es
que es mejor que la aproximación lineal.