7  Derivadas de funciones

En la mayoría de los problemas reales, las magnitudes que intervienen están relacionadas mediante ecuaciones o funciones. Para construir estos modelos matemáticos resulta imprescindible entender cómo varían unas magnitudes con respecto a las otras. En este capítulo abordamos el concepto de derivada, que surge de estudiar cómo varía una función cuando cambia la variable de la que depende. El concepto de derivada, junto al de integral, son los dos pilares fundamentales del Análisis Matemático, sobre los que se sostienen la mayor parte de las aplicaciones en Ciencia e Ingeniería.

7.1 El concepto de derivada

7.1.1 Tasa de variación media

Definición 7.1 (Incremento) Dada una función y=f(x), se llama incremento de f en un intervalo [a,b] a la diferencia entre el valor de f en cada uno de los extremos del intervalo, y se nota

Δy=f(b)f(a).

Cuando f es la función identidad y=x, se cumple que

Δx=Δy=f(b)f(a)=ba,

y por tanto, el incremento de x en un intervalo es la amplitud del intervalo. Esto nos permite escribir el intervalo [a,b] como [a,a+Δx].

Definición 7.2 (Tasa de variación media) Dada una función y=f(x), se llama tasa de variación media de f en el intervalo [a,a+Δx], al cociente entre el incremento de y y el incremento de x en dicho intervalo, y se escribe

TVM(f,[a,a+Δx])=ΔyΔx=f(a+Δx)f(a)Δx.

Ejemplo 7.1 Consideremos la función y=x2 que mide el área de un cuadrado de chapa metálica de lado x.

Si en un determinado instante el lado del cuadrado es a, y sometemos la chapa a un proceso de calentamiento que aumenta el lado del cuadrado una cantidad Δx, ¿en cuánto se incrementará el área del cuadrado?

Δy=f(a+Δx)f(a)=(a+Δx)2a2==a2+2aΔx+Δx2a2=2aΔx+Δx2.

¿Cuál será la tasa de variación media del área en el intervalo [a,a+Δx]?

TVMf[a,a+Δx]=ΔyΔx=2aΔx+Δx2Δx=2a+Δx.

Variación que experimenta el area de un cuadrado al variar el lado

7.1.2 Interpretación geométrica de la tasa de variación media

La tasa de variación media de f en el intervalo [a,a+Δx] es la pendiente de la recta secante a f en los puntos (a,f(a)) y (a+Δx,f(a+Δx)).

Gráfica de la recta secante a una función en dos puntos.

7.1.3 Tasa de variación instantánea

En muchas ocasiones, es interesante estudiar la tasa de variación que experimenta una función, no en intervalo, sino en un punto.

Conocer la tendencia de variación de una función en un instante puede ayudarnos a predecir valores en instantes próximos.

Definición 7.3 (Tasa de variación instantánea y derivada) Dada una función y=f(x), se llama tasa de variación instantánea de f en un punto a, al límite de la tasa de variación media de f en el intervalo [a,a+Δx], cuando Δx tiende a 0, y se denota

TVI(f,a)=limΔx0TVM(f,[a,a+Δx])=limΔx0ΔyΔx==limΔx0f(a+Δx)f(a)Δx

Cuando este límite existe, se dice que la función f es derivable en el punto a, y al valor del mismo se le llama derivada de f en a, y se nota como

f(a) o bien dfdx(a)

Ejemplo 7.2 Consideremos de nuevo la función y=x2 que mide el área de un cuadrado de chapa metálica de lado x.

Si en un determinado instante el lado del cuadrado es a, y sometemos la chapa a un proceso de calentamiento que aumenta el lado del cuadrado, ¿cuál es la tasa de variación instantánea del área del cuadrado en dicho instante?

TVI(f(a))=limΔx0ΔyΔx=limΔx0f(a+Δx)f(a)Δx==limΔx02aΔx+Δx2Δx=limΔx02a+Δx=2a.

Así pues, f(a)=2a, lo que indica que la tendencia de crecimiento el área es del doble del valor del lado.

El signo de f(a) indica la tendencia de crecimiento de f en el punto a:

  • f(a)>0 indica que la tendencia es creciente.
  • f(a)<0 indica que la tendencia es decreciente.

7.1.4 Interpretación geométrica de la tasa de variación instantánea

La tasa de variación instantánea de f en el punto a es la pendiente de la recta tangente a f en el punto (a,f(a)).

Gráfica de la recta tangente a una función en un punto.

Aproximación de la recta secante a la recta tangente en un punto.

7.2 Diferenciabilidad

Definición 7.4 (Función derivable) Dado un intervalo IR, una función f:IR y un punto aI, se dice que f es diferenciable o derivable en a, si existe el límite

limxaf(x)f(a)xa

En tal caso, al valor del límite se le llama derivada de f en a y se denota f(a).

Se dice que f es diferenciable en el intervalo I, si f es diferenciable en todos los puntos de I.

Nota

Si en la definición anterior llamamos h=xa, resulta

f(a)=limxaf(x)f(a)xa=limh0f(a+h)f(a)h, que es otra definición equivalente de la derivada de f en a.

Definición 7.5 (Función derivada) Dado un intervalo IR y una función f:IR, se define la función derivada de f, y se denota f, a la función cuyo dominio es el conjunto de los puntos de I donde f es diferenciable y el valor de f es el valor de la derivada en cada uno de esos puntos.

Nota

La notación f(a) para la derivada de f se debe a Lagrange, pero también es común en Ciencias e Ingenierías utilizar la notación de dfdx debida a Leibniz. En esta última notación df y dx se conocen como diferenciales de f y x, y representan variaciones infinitesimales de f y x respectivamente.

Ejemplo 7.3 Sea f(x)=Id(x)=x la función identidad. Entonces, para cualquier aR, se tiene que

limxaf(x)f(a)xa=limxaxaxa=limxa1=1.

Por tanto, Id(x) es diferenciable en todo R y Id(a)=a.

Con la notación de Leibniz, el cálculo de la derivada es, si cabe, más sencillo, pues se puede obtener algebraicamente,

dfdx=dxdx=1.

Sea ahora f(x)=x2. Entonces, para cualquier aR, se tiene que

limxaf(x)f(a)xa=limxax2a2xa=limxa(xa)(x+a)xa=limxax+a=2a.

Por tanto, f(x) es diferenciable en todo R y f(a)=2a.

Ejemplo 7.4 Sea la función f(x)=|x|. Veamos si f es diferenciable en 0. Para ello calculamos los límites laterales.

limx0f(x)f(0)x0=limx0|x|x=limx0xx=1,limx0+f(x)f(0)x0=limx0+|x|x=limx0+xx=1,

Por tanto, como los límites laterales no coinciden, f no es diferenciable en 0.

Definición 7.6 (Recta tangente a la gráfica de una función) Dado un intervalo IR, una función f:IR y un punto aI, si f es diferenciable en a, se define la recta tangente a la gráfica de f en a como la recta que pasa por el punto (a,f(a)) con pendiente f(a), es decir, la recta con ecuación

y=f(a)+f(a)(xa)

Definición 7.7 (Recta normal a la gráfica de una función) Dado un intervalo IR, una función f:IR y un punto aI, si f es diferenciable en a, se define la recta normal a la gráfica de f en a como la recta que pasa por el punto (a,f(a)) y es perpendicular a la recta tangente a la gráfica de f en a, es decir, la recta con ecuación

y=f(a)1f(a)(xa)

Ejemplo 7.5 Dada la función y=f(x)=x2, la recta tangente a f en 1 es

y=f(1)+f(1)(x1)=1+2(x1)=2x1,

y la recta normal es

y=f(1)1f(1)(x1)=112(x1)=x2+32.

Teorema 7.1 Dado un intervalo IR, una función f:IR y un punto aI, si f es diferenciable en a entonces f es continua en a.

Prueba. Sea xI y xa. Entonces

limxaf(x)f(a)=limxaf(x)f(a)xa(xa)=limxaf(x)f(a)xalimxaxa=f(a)0=0.

Así pues,

limxaf(x)f(a)=0limxaf(x)limxaf(a)=0limxaf(x)=limxaf(a)=f(a), y, por tanto, f es continua en a.

Precaución

El recíproco de este teorema no es cierto, es decir, pueden existir funciones continuas en un punto que no sean derivables en ese punto, como por ejemplo la función f(x)=|x| que es continua en 0 pero, como se ha visto, no es derivable en 0.

7.3 Álgebra de derivadas

Proposición 7.1 Dado un intervalo IR y dos funciones f,g:IR, si f y g son diferenciables en aI, entonces

  1. f+g es diferenciable en a y (f+g)(a)=f(a)+g(a).

  2. fg es diferenciable en a y (fg)(a)=f(a)g(a).

  3. cf es diferenciable en a y (cf)(a)=cf(a) cR.

  4. fg es diferenciable en a y (fg)(a)=f(a)g(a)+f(a)g(a).

  5. Si g(c)0, fg es diferenciable en a y (fg)(a)=f(a)g(a)f(a)g(a)g(a)2.

Prueba. Veamos la demostración de cada caso usando la definición de derivada.

  1. Derivada de la suma de funciones. (f+g)(a)=limxa(f+g)(x)(f+g)(a)xa=limxaf(x)+g(x)f(a)g(a)xa=limxaf(x)f(a)xa+g(x)g(a)xa=limxaf(x)f(a)xa+limxag(x)g(a)xa=f(a)+g(a).

  2. Derivada de la resta de funciones. Se prueba del mismo modo que la suma.

  3. Derivada del producto de una función por un escalar. (cf)(a)=limxa(cf)(x)(cf)(a)xa=limxacf(a)cf(a)xa=limxac(f(x)f(a))xa=climxaf(x)f(a)xa=cf(a).

  4. Derivada del producto de funciones. (fg)(a)=limxa(fg)(x)(fg)(a)xa=limxaf(x)g(x)f(a)g(a)xa=limxaf(x)g(x)f(a)g(x)+f(a)g(x)f(a)g(a)xa=limxa(f(x)f(a))g(x)+f(a)(g(x)g(a))xa=limxaf(x)f(a)xalimxag(x)+limxaf(a)limxag(x)g(a)xa=f(a)g(a)+f(a)g(a).

  5. Derivada del cociente de funciones. (fg)(a)=limxa(f/g)(x)(f/g)(a)xa=limxaf(x)/g(x)f(a)/g(a)xa=limxaf(x)g(a)f(a)g(x)g(x)g(a)xa=limxaf(x)g(a)f(a)g(x)(xa)g(x)g(a)=limxaf(x)g(a)f(a)g(a)+f(a)g(a)f(a)g(x)(xa)g(x)g(a)=limxa1g(x)g(a)(f(x)f(a)xag(a)f(a)g(x)g(a)xa)=limxa1g(x)g(a)(limxag(a)limxaf(x)f(a)xalimxaf(a)limxag(x)g(a)xa)=f(a)g(a)f(a)g(a)g(a)2, ya que g(a)0 y como g es continua en a al ser derivable en a, también se puede afirmar que existe un δ>0 tal que g(x)0 x(aδ,a+δ)I, por lo que limxa1g(x)g(a)=1g(a)2.

Ejemplo 7.6 Veamos cuál es la función derivada de la función racional f(x)=x22x+1x.

f(x)=(x22x+1)x(x22x+1)xx2=((x2)(2x)+1)x(x22x+1)x2==(2x2)x(x22x+1)x2=2x22xx2+2x1x2=x21x2x0.

7.4 Regla de la cadena

El resultado anterior permite calcular la derivada de cualquier función algebraica. A continuación se presenta otro importante resultado que nos permitirá calcular la derivada de una composición de funciones.

Teorema 7.2 (Regla de la cadena) Dados dos intervalos I,JR y dos funciones f:IR y g:JR tales que f(I)J, si f es diferenciable en en a y g es diferenciable en f(a), entonces gf es diferenciable en a y (gf)(a)=g(f(a))f(a).

Prueba. Sea

h(y)={g(y)g(f(a))yf(a)si yJ y yf(a)g(f(a))si y=f(a)

Veamos que h es continua en f(a). Como g es diferenciable en f(a), se tiene que limxf(a)g(x)g(f(a))xf(a)=g(f(a)), de modo que para cualquier ε>0 existe δ>0 tal que si xJ{f(a)} y |xf(a)|<δ, entonces |g(x)g(f(a))xf(a)g(f(a))|<ε. Así pues, si yJ, yf(a) y |yf(a)|<δ entonces |h(y)g(f(a))|<ε, y si y=f(a), entonces |yf(a)|=0<δ y |h(y)g(f(a))|=|g(f(a))g(f(a))|=0<ε. Por consiguiente, h es continua en f(a) y limyf(a)h(y)=h(f(a))=g(f(a)).

Por otro lado, de la definición de h se tiene que g(y)g(f(a))=h(y)(yf(a)) yJ, de manera que si xI{a} y y=f(x)J entonces

(gf)(a)=limxagf(x)gf(a)xa=limxag(f(x))g(f(a))xa=limxah(f(x))(f(x)f(a))xa=limxah(f(x))limxaf(x)f(a)xa=h(f(a))f(a)=g(f(a))f(a).

Nota

La demostración es mucho sencilla usando la notación diferencial de Leibniz para la derivada. Si y=g(z) y z=f(x), entonces

dydx=dydzdzdx=g(z)f(x)=g(f(x))f(x).

Ejemplo 7.7 Si g(x)=sen(x) y f(x)=x2, entonces gf(x)=sen(x2) y, aplicando la regla de la cadena, su derivada vale

(gf)(x)=g(f(x))f(x)=cos(g(x))2x=cos(x2)2x.

Por otro lado, fg(x)=(sin(x))2 y, de nuevo aplicando la regla de la cadena, su derivada vale

(fg)(x)=f(g(z))g(z)=2g(x)cos(x)=2sen(x)cos(x).

7.4.1 Derivada de la función inversa

La regla de la cadena nos permite calcular la derivada de la función inversa de una función.

Teorema 7.3 (Derivada de la función inversa) Dado un intervalo IR y una función f:IR continua e inyectiva en I, y sea J=f(I) y f1:JR la función inversa de f. Si f es diferenciable en aI y f(a)0, entonces f1 es diferenciable en f(a) y

(f1)(f(a))=1f(a).

Prueba. Como f es continua en I, J=f(I) es un intervalo. Como además f es inyectiva, necesariamente f es monótona. Sea la función g(y)=yf(a)f1(y)a yJ{f(a)}. g está bien definida pues f1 es inyectiva, y además, si yf(a) entonces f1(y)f1(f(a))=a, por lo que el denominador no se anula. Veamos que limyf(a)g(y)=f(a).

Como f es diferenciable en a, es decir, f(a)=limxaf(x)f(a)xa, para cualquier ε>0 existe δ>0 tal que si |xa|<δ entonces |f(x)f(a)xaf(a)|<ε.

Por otro lado, como f es continua en I, f1 es continua en J, y en particular en f(a), es decir, limyf(a)f1(y)=f1(f(a))=a, de manera que para cualquier δ>0 existe δ>0 tal que si yJ{f(a)} y |yf(a)|<δ entonces |f1(y)a|<δ, y por tanto,

|f(f1(y))f(a)f1(y)af(a)|<ε|yf(a)f1(y)af(a)|<ε|g(y)f(a)|<εlimyf(a)g(y)=f(a).

Como además

f1(y)f1(f(a))yf(a)=f1(y)ayf(a)=1yf(a)f1(y)a=1g(y),

y como limyf(a)1g(y)=1f(a), finalmente se tiene que

(f1)(f(a))=limyf(a)f1(y)f1(f(a))yf(a)=limyf(a)1g(y)=1f(a).

Nota

De nuevo, podemos realizar la demostración del teorema de manera más sencilla utilizando la notación de diferencial de Leibniz.

dxdy=1dy/dx=1f(x)

Precaución

Si en las condiciones del teorema anterior quitamos la condición f(a)0, el resultado no es cierto y f1 no es diferenciable en f(a). Vamos a probarlo por reducción al absurdo. Supongamos que f(a)=0, entonces, aplicando la regla de la cadena, se tiene

(f1f)(a)=(f1)(f(a))f(a)=(f1)(f(a))0=0.

Pero, por otro lado, (f1f)(a)=Id(a)=1, lo que supone una contradicción, por lo que f1 no puede ser derivable en f(a).

Corolario 7.1 Dado un intervalo IR y una función f:IR inyectiva en I, y sea J=f(I) y f1:JR la función inversa de f. Si f es derivable en I y f(x)0 xI, entonces f1 es derivable en I y yJ,

(f1)(y)=1f(f1(y))

Prueba. Si f es diferenciable en I entonces es continua en I y se puede aplicar el teorema anterior.

Ejemplo 7.8 La inversa de la función exponencial y=f(x)=ex es el logaritmo neperiano x=f1(y)=lny, de modo que, aplicando el teorema anterior, la función derivada del logaritmo es (f1)(y)=1f(x)=1ex=1elny=1y.

Ejemplo 7.9 Si nN es par, la función f(x)=xn xR+ es inyectiva y derivable, con f(x)=nxn1>0 xR+. Por tanto, la función f1(y)=yn es derivable en R+ y yR+,

(f1)(y)=1f(f1(y))=1f(yn)=1n(yn)n1=1n(y1/n)n1=1ny11n=1ny1n1.

Por otro lado, si nN es impar, la función f(x)=xn xR es inyectiva y derivable, con f(x)=nxn10 x0. Por tanto, la función f1(y)=yn es derivable en R{0} y, al igual que antes, yR+,

(f1)(y)=1ny1n1.

7.5 Derivadas implícitas

Hasta hora siempre hemos trabajado con funciones de la forma y=f(x) donde la variable y depende de la variable x según la función f(x). Esta representación se conoce como explícita, por que la variable dependiente y aparece despejada en el lado izquierdo de la igualdad. Sin embargo, como ya se vió en la , una una función real de variable real es una relación formada por pares (x,y)R×R, de modo que también se puede representar de manera intensiva mediante una ecuación F(x,y)=0, que cumplen los puntos de la función y solo ellos.

Ejemplo 7.10 La función y=x2 también se puede expresar implícitamente mediante la ecuación yx2=0.

Precaución

El problema de la representación implícita es que no toda ecuación en x e y define una función. Por ejemplo, la ecuación y2x=0 no define una función, ya que si se despeja y de la ecuación se obtiene y=±x, que no es una función ya que para cualquier valor de x>0, y puede tomar dos valores, lo cual no está permitido en una función.

Dada una ecuación F(x,y)=0, que define implícitamente y como función de x, si y es derivable en un punto (x0,y0), se puede calcular la derivada mediante el siguiente procedimiento:

  1. Calcular la derivada de las expresiones de ambos lados de la ecuación. F(x,y)=0. En el cálculo de estas derivadas hay que tener en cuenta que y es una función que depende de x y aplicar la regla de la cadena para derivarla.

  2. Reescribir la ecuación de manera que los términos donde aparezca y queden a un lado de la ecuación y el resto al otro.

  3. Sacar y factor común en el lado de la ecuación donde aparezca.

  4. Resolver la ecuación para y.

  5. Sustituir x=x0, y=y0.

Ejemplo 7.11 Dada la ecuación eyx2=0 que define a y como función implícita de x, veamos cómo calcular su derivada en el punto (1,0) implícitamente

(eyx2)=0eyy2x=0eyy=2xy=2xey.

Sustituyendo x=1 e y=0, se tiene y(1)=21e0=2.

En este caso, es posible obtener la representación explícita de la función, ya que eyx2=0ey=x2y=ln(x2)=2ln(x). Si calculamos su derivada explícitamente, se tiene y=2x, y para x=1 se tiene y(1)=21=2, que coincide con el resultado anterior.

Aún cuando la ecuación F(x,y)=0 no defina implícitamente a y como función de x, es posible utiliza el procedimiento anterior para estudiar la tasa de variación instantánea de y con respecto a x en un punto (x0,y0) que cumpla la ecuación.

Ejemplo 7.12 La ecuación x2xy+y2=1 no define a y como función explícita de x, ya que para x=0 se obtienen dos posibles valores de y, 020y+y2=1y2=1y=±1. No obstante, en el punto (0,1), se puede calcular la tasa de variación instantánea de y con respecto a x,

(x2xy+y2)=1(x2)(xy)+(y2)=02x(1y+xy)+2yy=02xyxy+2yy=0y(x+2y)=2x+yy=2x+yx+2y,

y sustituyendo x=0, y=1 se tiene y(0)=20+10+21=12.

Si dibujamos la gráfica de los puntos que cumplen la ecuación, se puede comprobar que la recta tangente a la gráfica en el punto (0,1) tiene pendiente 1/2.

Recta tangente a la curva implícita x2xy+y2=1 en el punto (0,1).

7.6 Teorema del valor medio y aplicaciones

Teorema 7.4 (Extremo interior) Dado un intervalo IR y una función f:IR con un extremo relativo en un punto interior aI, si f es diferenciable en a, entonces f(a)=0.

Prueba. Supongamos que f tiene un máximo relativo en aI. Por ser a un punto interior de I, existe un δ>0 tal que el entorno (aδ,a+δ)I y f(x)<f(a) x(aδ,a+δ).

Supongamos ahora que f(a)>0. Como f(a)=limxaf(x)f(a)xa, existe un 0<δ<δ tal que f(x)f(a)xa>0 x(aδ,a+δ){a}. Por tanto, si x(a,a+δ), f(x)f(a)>0 de donde se deduce que f(x)>f(a) lo que contradice que f tenga un máximo relativo en a. Así que no puede ser f(c)>0.

Del mismo modo se puede probar que no puede ser f(a)<0. Por lo que necesariamente tiene que ser f(a)=0.

Si f tiene un mínimo relativo en a, la demostración es análoga.

Precaución

El resultado anterior no es cierto si el punto a no es interior de I. Para verlo, basta considerar f(x)=x x[0,1]. Se observa que f tiene un máximo relativo en 1, pero f(1)0.

Corolario 7.2 Dado un intervalo IR y una función f:IR con un extremo relativo en un punto aI, entonces f(a) no existe o f(a)=0.

Ejemplo 7.13 La función f(x)=|x| tiene un mínimo relativo en 0 que es un punto interior de R. Sin embargo, f(0) no existe.

Definición 7.8 (Punto crítico) Dado un intervalo IR y una función f:IR, se dice que a es un punto crítico o punto singular de f, si f(a)=0.

Gráficamente, los puntos críticos son puntos donde la tangente a la gráfica de la función es horizontal.

Como veremos más adelante, los puntos críticos juegan un papel clave en la determinación de los extremos relativos de una función.

Teorema 7.5 (Rolle) Dada una función f:[a,b]R continua en [a,b] y diferenciable en (a,b), si f(a)=f(b), entonces f tiene al menos un punto crítico en (a,b), es decir, existe c(a,b) tal que f(c)=0.

Prueba. Como f es continua en [a,b], por el f alcanza el máximo y el mínimo en [a,b]. Si existe c(a,b) tal que f alcanza el máximo o el mínimo en c, por el teorema anterior se tiene f(c)=0. En caso contrario, si no existe c(a,b) tal que f alcanza el máximo o el mínimo en c, entonces f alcanza el máximo o el mínimo en los extremos del intervalo, pero como f(a)=f(b), se deduce que que f es constante en [a,b] y, por tanto, f(x)=0 x(a,b).

Teorema 7.6 (Valor medio) Dada una función f:[a,b]R continua en [a,b] y diferenciable en (a,b), entonces existe c(a,b) tal que

f(c)=f(b)f(a)ba.

Prueba. Sea g(x) la recta secante a f en los puntos (a,f(a)) y (b,f(b)). Entonces g(x)=f(a)+TVM(f,[a,b])(xa)=f(a)+f(b)f(a)ba(xa). Si tomamos la función que mide la distancia entre f y g, es decir, x[a,b]

h(x)=f(x)g(x)=f(x)f(a)+f(b)f(a)ba(xa),

h es continua en [a,b] por ser la diferencia de dos funciones continuas en ese intervalo, también es derivable en (a,b) al ser f y g derivables en el intervalo. Además

h(a)=f(a)f(a)+f(b)f(a)ba(aa)=0,h(b)=f(a)f(b)+f(b)f(a)ba(ba)=0.

Por tanto, aplicando el teorema de Rolle, existe c(a,b) tal que f(c)=0. Como

h(x)=f(x)f(b)f(a)ba x(a,b),

en particular se tiene

h(c)=f(c)f(b)f(a)ba=0f(c)=f(b)f(a)ba.

7.6.1 Estudio del crecimiento de una función

La principal aplicación de la derivada es el estudio del crecimiento de una función mediante el signo de la derivada.

Teorema 7.7 (Signo de la derivada) Dado un intervalo IR y una función f:IR diferenciable en I, entonces:

  1. f es creciente en I si y sólo si f(x)0 xI.
  2. f es decreciente en I si y sólo si f(x)0 xI.

Prueba. Probaremos solo el primer apartado, ya que el segundo se prueba de forma análoga.

Supongamos que f es creciente en I y sea aI. Si xI y x>a, por ser f creciente, f(x)>f(a), por lo que f(x)f(a)xa0. Y si x<a, f(x)<f(a), por lo que también se tiene f(x)f(a)xa0. Así pues, f(a)=limxaf(x)f(a)xa0.

Para ver el otro sentido de la implicación, supongamos que f(x)0 xI, y sean a,bI con a<b. Aplicando el teorema del valor medio a f en el intervalo [a,b], se tiene que existe c(a,b) tal que f(c)=f(b)f(a)ba0, y como ba>0, se tiene que f(b)f(a)>0 por lo que f(b)>f(a) y, por tanto, f es creciente en I.

Ejemplo 7.14 La función f(x)=x3 es creciente en todo R ya que xR f(x)0.

Advertencia

Una función puede ser creciente o decreciente en un intervalo y no tener derivada.

Ejemplo 7.15 Consideremos la función f(x)=x42x2+1. Su derivada f(x)=4x34x está definida en todo R y es continua.

Estudio del crecimiento de una función.

7.6.2 Determinación de los extremos relativos de una función

Como consecuencia del resultado anterior, la derivada también sirve para determinar los extremos relativos de una función.

Teorema 7.8 (Criterio de la primera derivada) Sea una función f:[a,b]R continua en [a,b] y derivable en (a,c)(c,b) para un punto c(a,b).

  1. Si existe un δ>0 tal que (cδ,c+δ)[a,b] y f(x)0 y x(cδ,c) y f(x)0 x(c,c+δ), entonces f tiene un máximo relativo en c.
  2. Si existe un δ>0 tal que (cδ,c+δ)[a,b] y f(x)0 y x(cδ,c) y f(x)0 x(c,c+δ), entonces f tiene un mínimo relativo en c.

Prueba. Demostraremos solo el caso de un máximo, ya que el otro caso es análogo. Para ver que f tiene un máximo local en c basta con probar que si x(cδ,c+δ) entonces f(x)f(c).

Si x(cδ,c) entonces f(x)0. Aplicando el teorema del valor medio a f en el intervalo [x,c] se tiene que existe u(x,c) tal que f(u)=f(c)f(x)cx0, y como cx>0 se concluye que f(c)f(x)0, y por tanto, f(x)f(c).

Y si Si x(c,c+δ) entonces f(x)0. Aplicando de nuevo el teorema del valor medio a f en el intervalo [c,x] se tiene que existe v(c,x) tal que f(v)=f(x)f(c)xc0, y como xc>0 se concluye que f(x)f(c)0, y por tanto, f(x)f(c).

Ejemplo 7.16 Consideremos de nuevo la función f(x)=x42x2+1. Su derivada f(x)=4x34x está definida en todo R y es continua.

Estudio de los extremos de una función
Precaución

El recíproco de las implicaciones del teorema anterior no tiene por qué ser cierto. Por ejemplo, la función

f(x)={2x4+x4sen(1x)si x0,0si x=0.

tiene un mínimo relativo y absoluto en x=0, pero su derivada toma valores positivos y negativos en cualquier entorno de 0.

Teorema 7.9 (Darboux) Dada una función f:[a,b]R, si f es diferenciable en [a,b] y f(a)<k<f(b), entonces existe c(a,b) tal que f(c)=k.

Prueba. Definimos g(x)=k(xa)f(x) x[a,b]. g es diferenciable en [a,b] al serlo f y g(x)=kf(x) x[a,b]. Por tanto, g es continua en [a,b], y entonces tiene un máximo y un mínimo relativos en [a,b].

Por otro lado, g(a)=kf(a)>0, de manera que g no tiene un máximo relativo en a, y g(b)=kf(b)<0, de manera que g tampoco tiene un máximo relativo en b. Por tanto, g alcanza el máximo relativo en un punto c(a,b), y por el teorema del extremo interior, g(c)=0, de donde se deduce que kf(c)=0, y f(c)=k.

7.6.3 Determinación de los extremos absolutos de una función

Ya se vió, por el , que una función continua en un intervalo cerrado [a,b] alcanza el máximo y el mínimo absolutos en ese intervalo. Así pues, para encontrar los extremos absolutos de una función f derivable en [a,b], basta con seguir el siguiente procedimiento:

  1. Calcular los puntos críticos de f.
  2. Calcular los valores de f en los puntos críticos.
  3. Calcular el valor de f en los extremos del intervalo, a y b.
  4. El máximo absoluto será el mayor de los valores obtenidos en los pasos 2 y 3, y el mínimo absoluto será el menor de los valores obtenidos en esos mismos pasos.

Ejemplo 7.17 Veamos cuáles son los extremos absolutos de la función f(x)=x42x2+1 en el intervalo [0,2]. Seguiremos el procedimiento anterior para la determinación de los extremos absolutos.

  1. En el se vió que f tenía tres puntos críticos en 1, 0 y 1. El punto crítico en 1 se puede descartar al no pertenecer al intervalo [0,2].

  2. El valor de la función en los puntos críticos del intervalo [0,2] son f(0)=1 y f(1)=0.

  3. El valor de la función en los extremos del intervalo [0,2] es f(0)=1 y f(2)=9.

  4. El máximo absoluto de f en [a,b] es max{f(0),f(1),f(2)}=max{1,0,9}=9 y el mínimo absoluto es min{f(0),f(1),f(2)}=max{1,0,9}=0.

7.6.4 Otras aplicaciones del teorema del valor medio

Además del estudio del crecimiento de una función y de la determinación de sus extremos relativos, el teorema del valor medio tiene otras muchas aplicaciones como las que se enumeran a continuación.

7.6.4.1 Localización de raíces

Si una función g es la derivada de otra función f, el teorema de Rolle nos asegura que entre dos raíces cualesquiera de f existe al menos una raíz de g.

Ejemplo 7.18 La función g(x)=cos(x) es la derivada de la función f(x)=sen(x), de manera que, entre dos raíces cualesquiera de sen(x) existe al menos una raíz de cos(x).

7.6.4.2 Desigualdades

El teorema del valor medio se puede usar en la obtención de desigualdades tales como xsen(x)x, donde la igualdad se da para x=0 y la desigualdad se cumple para x>0.

Ejemplo 7.19 Sea f(x)=sen(x) cuya derivada es f(x)=cos(x) xR. Aplicando el teorema del valor medio a f en el intervalo [0,x] para x>0, se tiene que sen(x)sen(0)x0=cos(c) para algún c(0,x). Como sen(0)=0 y 1cos(x)1 xR, se tiene sen(x)=cos(c)x para algún c(0,x), de lo que se deduce que xsen(x)x.

7.6.4.3 Estimación de errores

Otra interesante aplicación es el cálculo aproximado del valor de una función en un punto c(a,b), si se conoce el valor de la función en a y b.

Ejemplo 7.20 Veamos cómo calcular 105 de manera aproximada. Para ello tomamos la función f(x)=x que es derivable en todo R con derivada f(x)=12x. Aplicando el teorema del valor medio en el intervalo [100,105] se tiene que 105100105100=12c para algún c(100,105).

Por otro lado, como f es creciente, se tiene que 10=100<c<121=11. Así pues, se tiene

105100105100=12c10510=52c5211<10510<521010.22<105<10.25.

7.7 Estudio de la concavidad de una función

Como se ha visto, la derivada de una función puede utilizarse para estudiar el crecimiento de la función en un intervalo, de manera que si la función es dos veces derivable en el intervalo, es decir, si existe la derivada de la derivada de la función, la segunda derivada puede utilizarse para estudiar el crecimiento de la primera, y esto permite estudiar la concavidad de la función.

Teorema 7.10 (Criterio de la segunda derivada) Dado un intervalo IR abierto y una función f:IR dos veces diferenciable en I. Entonces,

  1. f es cóncava hacia arriba en I, si y sólo si, f(x)0 xI.
  2. f es cóncava hacia abajo en I, si y sólo si, f(x)0 xI.

Prueba. Daremos un prueba informal del primer apartado, ya que el segundo se prueba de manera análoga por simetría, ya que si f es cóncava hacia abajo, f es cóncava hacia arriba.

Si f es cóncava hacia arriba en I, para cualquier a,bI con a<b, la pendiente de la recta tangente en (a,f(a)) es menor que la pendiente de la recta tangente en (b,f(b)), por lo que las pendientes crecen. Como la pendiente de la recta tangente es la derivada, se concluye que f es creciente en I y, por tanto, f(x)0 xI.

Ejemplo 7.21 La función f(x)=x2 tiene segunda derivada f(x)=2>0 y por tanto es cóncava en todo R.

Advertencia

Una función puede ser cóncava hacia arriba o hacia abajo en un intervalo y no tener derivada.

Ejemplo 7.22 Consideremos de nuevo la función f(x)=x42x2+1. Su segunda derivada f(x)=12x24 está definida en todo R y es continua.

Estudio de la concavidad de una función.

7.8 Interpretación cinemática de la derivada

7.8.1 Movimiento rectilíneo

Cuando una función f(t) describe la posición de un objeto móvil sobre la recta real en el instante t, tomando como referencia el origen de coordenadas O y el vector unitario i=(1), se puede representar la posición P del móvil en cada instante t mediante un vector OP=xi donde x=f(t).

Interpretación cinemática del movimiento rectilíneo.

En este contexto, si se toman los instantes t=t0 y t=t0+Δt, ambos del dominio I de f, el vector

vm=f(t0+Δt)f(t0)Δt

que se conoce como velocidad media del espacio recorrido por f entre los instantes t0 y t0+Δt.

Ejemplo 7.23 Un vehículo realiza un viaje de Madrid a Barcelona. Sea f(t) la función que da la posición el vehículo en cada instante t. Si el vehículo parte de Madrid (km 0) a las 8 y llega a Barcelona (km 600) a las 14 horas, entonces la velocidad media del vehículo en el trayecto es

vm=f(14)f(8)148=60006=100 km/h.

Siguiendo en este mismo contexto del movimiento rectilíneo, la derivada de f en el instante t=t0 es el vector

v=f(t0)=limΔx0f(t0+Δt)f(t0)Δt,

que se conoce, siempre que exista el límite, como velocidad instantánea o simplemente la velocidad del espacio recorrido por f en el instante t0.

Es decir, la derivada de la posición respecto del tiempo, es un campo de vectores que recibe el nombre de velocidad a lo largo de la trayectoria f.

Siguiendo con el ejemplo anterior, lo que marca el velocímetro en un determinado instante sería el módulo del vector velocidad en ese instante.

Nota

También tiene sentido pensar en f(t) como una función que mide otras magnitudes como por ejemplo la temperatura de un cuerpo, la concentración de un gas, la cantidad de un compuesto en una reacción química o el precio de las acciones de una compañía en cada instante t.

7.8.2 Generalización al movimiento curvilíneo

La derivada como velocidad a lo largo de una trayectoria en la recta real puede generalizarse a trayectorias en cualquier espacio euclídeo Rn.

Para el caso del plano real R2, si f(t) describe la posición de un objeto móvil en el plano en el instante t, tomando como referencia el origen de coordenadas O y los vectores coordenados {i=(1,0),j=(0,1)}, se puede representar la posición P del móvil en cada instante t mediante un vector OP=x(t)i+y(t)j cuyas coordenadas

{x=x(t)y=y(t)tIR

se conocen como funciones coordenadas de f y se escribe f(t)=(x(t),y(t)).

Interpretación cinemática del movimiento curvilineo.

7.8.2.1 Velocidad en una trayectoria curvilínea en el plano

En este contexto de una trayectoria f(t)=(x(t),y(t)) en el plano real R2, para un instante t=t0, si existe el vector

v=limΔt0f(t0+Δt)f(t0)Δt,

entonces f es derivable en el instante t=t0 y el vector v=f(t0) se conoce como velocidad de f en ese instante.

Como f(t)=(x(t),y(t)),

f(t)=limΔt0f(t0+Δt)f(t0)Δt=limΔt0(x(t0+Δt),y(t0+Δt))(x(t0),y(t0))Δt=limΔt0(x(t0+Δt)x(t0)Δt,y(t0+Δt)y(t0)Δt)==(limΔt0x(t0+Δt)x(t0)Δt,limΔt0y(t0+Δt)y(t0)Δt)=(x(t0),y(t0)).

luego

v=x(t0)i+y(t0)j.

Ejemplo 7.24 Dada la trayectoria f(t)=(cos(t),sen(t)), tR, cuya imagen es la circunferencia de centro el origen de coordenadas y radio 1, sus funciones coordenadas son x(t)=cos(t), y(t)=sen(t), tR, y su velocidad es

v=f(t)=(x(t),y(t))=(sen(t),cos(t).

En el instante t=π/4, el móvil estará en la posición f(π/4)=(cos(π/4),sen(π/4))=(2/2,2/2) y se moverá con una velocidad v=f(π/4)=(sen(π/4),cos(π/4))=(2/2,2/2).

Trayectoria de la circunferencia.

Obsérvese que el módulo del vector velocidad siempre será 1 ya que |v|=(sen(t))2+(cos(t))2=1.

7.9 Recta tangente a una trayectoria

7.9.1 Recta tangente a una trayectoria en el plano

Los vectores paralelos a la velocidad v se denominan vectores tangentes a la trayectoria f en el instante t=t0, y la recta que pasa por P=f(t0) dirigida por v es la recta tangente a f cuando t=t0.

Definición 7.9 (Recta tangente a una trayectoria) Dada una trayectoria f sobre el plano real R2, se llama recta tangente a f en t=t0 a la recta de ecuación

l:(x,y)=f(t0)+tf(t0)=(x(t0),y(t0))+t(x(t0),y(t0))=(x(t0)+tx(t0),y(t0)+ty(t0)).

Ejemplo 7.25 Se ha visto que para la trayectoria f(t)=(cos(t),sen(t)), tR, cuya imagen es la circunferencia de centro el origen de coordenadas y radio 1, en el instante t=π/4 la posición del móvil era f(π/4)=(2/2,2/2) y su velocidad v=(2/2,2/2), de modo que la recta tangente a f en ese instante es

l:X=f(π/2)+tv=(22,22)+t(22,22)=(22t22,22+t22).

De la ecuación vectorial de la recta tangente a f para t=t0, se obtiene que sus funciones cartesianas son

s{x=x(t0)+tx(t0)y=y(t0)+ty(t0)tR,

y despejando t en ambas ecuaciones e igualando se llega a la ecuación cartesiana de la recta tangente

xx(t0)x(t0)=yy(t0)y(t0),

si x(t0)0 e y(t0)0, y de ahí a la ecuación en la forma punto-pendiente

yy(t0)=y(t0)x(t0)(xx(t0)).

Partiendo de la ecuación vectorial de la tangente del ejemplo anterior l=(22t22,22+t22), su ecuación cartesiana es

x2/22/2=y2/22/2y2/2=2/22/2(x2/2)y=x+2.

7.9.2 Recta normal a una trayectoria en el plano

Se ha visto que la recta tangente a una trayectoria f cuando t=t0 es la recta que pasa por el punto el punto P=f(t0) dirigida por el vector velocidad v=f(t0)=(x(t0),y(t0)). Si en lugar de tomar ese vector se toma como vector director el vector w=(y(t0),x(t0)), que es ortogonal a v, se obtiene otra recta que se conoce como recta normal a la trayectoria f cuanto t=t0.

Definición 7.10 (Recta normal a una trayectoria) Dada una trayectoria f sobre el plano real R2, se llama recta normal a f en t=t0 a la recta de ecuación

l:(x,y)=(x(t0),y(t0))+t(y(t0),x(t0))==(x(t0)+ty(t0),y(t0)tx(t0)).

Su ecuación cartesiana es

xx(t0)y(t0)=yy(t0)x(t0),

y su ecuación en la forma punto pendiente

yy(t0)=x(t0)y(t0)(xx(t0)).

Importante

La recta normal es perpendicular a la recta tangente ya que sus vectores directores son ortogonales.

Ejemplo 7.26 Siguiendo con el ejemplo de la trayectoria f(t)=(cos(t),sen(t)), tR, la recta normal en el instante t=π/4 es

l:(x,y)=(cos(π/2),sen(π/2))+t(cos(π/2),sen(π/2))=(22,22)+t(22,22)=(22+t22,22+t22),

y su ecuación cartesiana es

x2/22/2=y2/22/2y2/2=2/22/2(x2/2)y=x.

Tangente y normal a la trayectoria de una circunferencia.

7.9.3 Rectas tangente y normal a una función

Un caso particular de las recta tangente y normal a una trayectoria son la recta tangente y normal a una función de una variable real. Si se tiene la función y=f(x), xIR, una trayectoria que traza la gráfica de f es g(t)=(t,f(t))tI, y su velocidad es g(t)=(1,f(t)), de modo que la recta tangente para t=a es

xa1=yf(a)f(a)yf(a)=f(a)(xa),

y la recta normal es

xaf(a)=yf(a)1yf(a)=1f(a)(xa),

Ejemplo 7.27 Dada la función y=f(x)=x2, la trayectoria que dibuja la gráfica de esta función es g(t)=(t,t2) y su velocidad es g(t)=(1,2t), de modo que en el punto (1,1), que se alcanza en el instante t=1, la recta tangente es

x11=y12y1=2(x1)y=2x1,

y la recta normal es

x12=y11y1=12(x1)y=x2+32.

7.9.4 Recta tangente a una trayectoria en el espacio

El concepto de recta tangente a una trayectoria en el plano real puede extenderse fácilmente a trayectorias en el espacio real R3.

Si f(t)=(x(t),y(t),z(t)), tIR, es una trayectoria en el espacio real R3, entonces el móvil que recorre esta trayectoria en el instante t=t0, ocupará la posición P=(x(t0),y(t0),z(t0)) y tendrá una velocidad v=f(t)=(x(t),y(t),z(t)), de manera que la recta tangente a f en ese instante será

l:(x,y,z)=(x(t0),y(t0),z(t0))+t(x(t0),y(t0),z(t0))==(x(t0)+tx(t0),y(t0)+ty(t0),z(t0)+tz(t0)),

cuyas ecuaciones cartesianas son

xx(t0)x(t0)=yy(t0)y(t0)=zz(t0)z(t0),

siempre que x(t0)0, y(t0)0 y z(t0)0.

Ejemplo 7.28 Dada la trayectoria del espacio f(t)=(cos(t),sen(t),t), tR, en el instante t=π/2, la trayectoria pasará por el punto

f(π/2)=(cos(π/2),sen(π/2),π/2)=(0,1,π/2),

con una velocidad

v=f(π/2)=(sen(π/2),cos(π/2),1)=(1,0,1),

y la tangente en ese punto es

l:(x,y,z)=(0,1,π/2)+t(1,0,1)=(t,1,t+π/2).

Gráfica de la tangente a una trayectoria en el espacio.

Ejemplo interactivo

7.10 Polinomios de Taylor

7.10.1 Aproximación de una función mediante un polinomio

Una aplicación muy útil de la derivada es la aproximación de funciones mediante polinomios.

Los polinomios son funciones sencillas de calcular (mediante sumas y productos), que tienen muy buenas propiedades:

  • Están definidos en todos los números reales.
  • Son funciones continuas.
  • Son derivables hasta cualquier orden y sus derivadas son continuas.

En esta sección veremos cómo aproximar una función f(x) mediante un polinomio p(x) cerca de un valor x=a.

7.10.1.1 Aproximación mediante un polinomio de grado 0

Un polinomio de grado 0 tiene ecuación p(x)=c0, donde c0 es una constante.

Como el polinomio debe valer lo que la función en el punto a, debe cumplir

p(a)=c0=f(a).

En consecuencia, el polinomio de grado 0 que mejor aproxima a f en un entorno de a es

p(x)=f(a).

Gráfica del polinomio de Taylor de grado 0

7.10.1.2 Aproximación mediante un polinomio de grado 1

Un polinomio de grado 1 es una recta y tiene ecuación

p(x)=c0+c1x,

aunque también puede escribirse

p(x)=c0+c1(xa).

De entre todos los polinomios de grado 1, el que mejor aproxima a f en entorno de a será el que cumpla las dos condiciones siguientes:

  • p y f valen lo mismo en a: p(a)=f(a),
  • p y f tienen la misma tasa de crecimiento en a: p(a)=f(a).

Esta última condición nos asegura que en un entorno de a, p y f tienen aproximadamente la misma tendencia de crecimiento, pero requiere que la función f sea derivable en a.

Imponiendo las condiciones anteriores tenemos

  • p(x)=c0+c1(xa)p(a)=c0+c1(aa)=c0=f(a),
  • p(x)=c1p(a)=c1=f(a).

Así pues, el polinomio de grado 1 que mejor aproxima a f en un entorno de a es

p(x)=f(a)+f(a)(xa),

que resulta ser la recta tangente a f en el punto (a,f(a)).

Gráfica del polinomio de Taylor de grado 1

7.10.1.3 Aproximación mediante un polinomio de grado 2

Un polinomio de grado 2 es una parábola y tiene ecuación

p(x)=c0+c1x+c2x2,

aunque también puede escribirse

p(x)=c0+c1(xa)+c2(xa)2.

De entre todos los polinomio de grado 2, el que mejor aproxima a f en entorno de a será el que cumpla las tres condiciones siguientes:

  • p y f valen lo mismo en a: p(a)=f(a),
  • p y f tienen la misma tasa de crecimiento en a: p(a)=f(a).
  • p y f tienen la misma curvatura en a: p(a)=f(a).

Esta última condición requiere que la función f sea dos veces derivable en a.

Imponiendo las condiciones anteriores tenemos

  • p(x)=c0+c1(xa)+c2(xa)2p(a)=c0=f(a),
  • p(x)=c1+2c2(xa)p(a)=c1+2c2(aa)=c1=f(a),
  • p(x)=2c2p(a)=2c2=f(a)c2=f(a)2.

Así pues, el polinomio de grado 2 que mejor aproxima a f en un entorno de a es

p(x)=f(a)+f(a)(xa)+f(a)2(xa)2.

Gráfica del polinomio de Taylor de grado 2

7.10.1.4 Aproximación mediante un polinomio de grado n

Un polinomio de grado n tiene ecuación

p(x)=c0+c1x+c2x2++cnxn,

aunque también puede escribirse

p(x)=c0+c1(xa)+c2(xa)2++cn(xa)n.

De entre todos los polinomio de grado n, el que mejor aproxima a f en entorno de a será el que cumpla las n+1 condiciones siguientes:

  • p(a)=f(a),
  • p(a)=f(a),
  • p(a)=f(a),
  • p(n(a)=f(n(a).

Las sucesivas derivadas de p valen

p(x)=c0+c1(xa)+c2(xa)2++cn(xa)n,p(x)=c1+2c2(xa)++ncn(xa)n1,p(x)=2c2++n(n1)cn(xa)n2,p(n(x)=n(n1)(n2)1cn=n!cn.

Imponiendo las condiciones anteriores se tiene

  • p(a)=c0+c1(aa)+c2(aa)2++cn(aa)n=c0=f(a),
  • p(a)=c1+2c2(aa)++ncn(aa)n1=c1=f(a),
  • p(a)=2c2++n(n1)cn(aa)n2=2c2=f(a)c2=f(a)2,
  • p(n(a)=n!cn=f(n(a)=cn=f(n(a)n!.

Definición 7.11 (Polinomio de Taylor de orden n para f en el punto a) Dada una función f, n veces derivable en x=a, se define el polinomio de Taylor de orden n para f en a como

pf,an(x)=f(a)+f(a)(xa)+f(a)2(xa)2++f(n(a)n!(xa)n==i=0nf(i(a)i!(xa)i,

o bien, escribiendo x=a+h

pfn(a+h)=f(a)+f(a)h+f(a)2h2++f(n(a)n!hn==i=0nf(i(a)i!hi.

Importante

El polinomio de Taylor de orden n para f en a es el polinomio de orden n que mejor aproxima a f alrededor de a, ya que es el único que cumple las n+1 condiciones anteriores.

Ejemplo 7.29 Vamos a aproximar la función f(x)=logx en un entorno del punto 1 mediante un polinomio de grado 3.

La ecuación del polinomio de Taylor de orden 3 para f en el punto 1 es

pf,13(x)=f(1)+f(1)(x1)+f(1)2(x1)2+f(1)3!(x1)3.

Calculamos las tres primeras derivadas de f en 1:

f(x)=logxf(1)=log1=0,f(x)=1/xf(1)=1/1=1,f(x)=1/x2f(1)=1/12=1,f(x)=2/x3f(1)=2/13=2.

Sustituyendo en la ecuación del polinomio se tiene

pf,13(x)=0+1(x1)+12(x1)2+23!(x1)3=23x332x2+3x116.

Gráfica del polinomio de Taylor del logaritmo

7.10.2 Polinomio de Maclaurin de orden n

La ecuación del polinomio de Taylor se simplifica cuando el punto en torno al cual queremos aproximar es el 0.

Definición 7.12 (Polinomio de Maclaurin de orden n para f) Dada una función f, n veces derivable en 0, se define el polinomio de Maclaurin de orden n para f como

pf,0n(x)=f(0)+f(0)x+f(0)2x2++f(n(0)n!xn==i=0nf(i(0)i!xi.

Ejemplo 7.30 Vamos a aproximar la función f(x)=senx en un entorno del punto 0 mediante un polinomio de grado 3.

La ecuación del polinomio de Maclaurin de orden 3 para f es

pf,03(x)=f(0)+f(0)x+f(0)2x2+f(0)3!x3.

Calculamos las tres primeras derivadas de f en 0:

f(x)=senxf(0)=sen0=0,f(x)=cosxf(0)=cos0=1,f(x)=senxf(0)=sen0=0,f(x)=cosxf(0)=cos0=1.

Sustituyendo en la ecuación del polinomio obtenemos

pf,03(x)=0+1x+02x2+13!x3=xx36.

Gráfica del polinomio de Maclaurin del seno

7.10.3 Polinomios de Maclaurin de funciones elementales

La siguiente tabla recoge los polinomios de Taylor de orden n de algunas funciones elementales habituales.

f(x) pf,0n(x)
ex 1+x+x22!+x33!++xnn!=i=0nxii!
log(1+x) xx22+x33+(1)n1xnn=i=0n(1)i1xii
sen(x) xx33!+x55!+(1)kx2k1(2k1)!=i=0k(1)ix2i1(2i1)! si n=2k o n=2k1
cos(x) 1x22!+x44!+(1)kx2k(2k)!=i=0k(1)ix2i(2i)! si n=2k o n=2k+1
arctg(x) xx33+x55+(1)kx2k1(2k1)=i=0k(1)ix2i1(2i1) si n=2k o n=2k1

7.10.4 Resto de Taylor

Los polinomios de Taylor permiten calcular el valor aproximado de una función cerca de un valor a, pero siempre se comete un error en dicha aproximación.

Definición 7.13 (Resto de Taylor) Si f es una función para la que existe el su polinomio de Taylor de orden n en a, pf,an, entonces se define el resto de Taylor de orden n para f en a como

rf,an(x)=f(x)pf,an(x).

El resto mide el error cometido al aproximar f(x) mediante pf,an(x) y permite expresar la función f como la suma de un polinomio de Taylor más su resto correspondiente:

f(x)=pf,an(x)+rf,an(x).

Esta expresión se conoce como fórmula de Taylor de orden n para f en a. Se pude demostrar, además, que

limh0rf,an(a+h)hn=0,

lo cual indica que el resto rf,an(a+h) es mucho menor que hn.

Teorema 7.11 (Forma de Lagrange del resto de Taylor) Si f es una función tal que f(n+1(t) es continua en un intervalo que incluye a a y x, entonces

Rf,an(x)=f(n+1(c)(n+1)!(xa)n+1

para algún c entre a y x.

La forma de Lagrange del resto de Taylor permite, en muchas ocasiones, dar una cota de las aproximaciones realizadas mediante un polinomio de Taylor.

Ejemplo 7.31 Dada la función f(x)=cos(x) el polinomio de MacLaurin de cuarto grado de f es

Pf,04(x)=1x22+x44!.

Sustituyendo en x=0.1 se tiene que cos(0.1)Pf,02(0.1)=10.122+0.144!=0.9950041667.

Para obtener una cota del error cometido, aplicando el teorema anterior se tiene que

Rf,04(0.1)=f5(c)5!0.15=sen(c)5!0.15 con c[0,0.1].

Como |sen(x)|1 xR, se tiene que

|Rf,04(0.1)|0.155!=8.3108,

que es una cota del error cometido en la aproximación.