Vous êtes sur la page 1sur 65

Apunte Matemáticas 4.

2014
Manuel Arenas, Sergio Muñoz
2014

Índice
1. Derivación en varias variables 3
1.1. Introducción y repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Lı́mites y continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Guı́a 1 Matemáticas 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4. Derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2. Extremos de funciones 14
2.1. Extremos en el interior del dominio . . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Guı́a 2 Matemáticas 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3. Extremos en bajo restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3. Diagonalización 22
3.1. Una introducción indirecta mediante Cadenas de Markov . . . . . . . . . . . 22
3.2. Valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.3. Diagonalización de matrices con valores propios reales . . . . . . . . . . . . . 28
3.4. Guı́a 3 Matemáticas 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4. Números Complejos 36
4.1. Forma polar o trigonométrica de un número complejo: . . . . . . . . . . . . . 37
4.2. Potencias de números complejos. . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3. Polinomios y números complejos . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4. Guı́a 4 Matemáticas 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5. Diagonalización y números complejos . . . . . . . . . . . . . . . . . . . . . . 44

5. Ecuaciones diferenciales 48
5.1. Ecuaciones diferenciales ordinarias de primer orden . . . . . . . . . . . . . . 48
5.1.1. Ejemplos de Ecuaciones lineales homogéneas . . . . . . . . . . . . . . 49
5.1.2. El método de separación de variables para resolver algunas EDO . . . 51
5.2. Solución general EDO Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3. Guı́a 5 Matemáticas 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

1
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

6. Apéndice 62

A. Polinomios de coeficientes reales 62

2
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

1. Derivación en varias variables


1.1. Introducción y repaso
El objetivo es extender la noción de derivada y sus aplicaciones a las funciones de varias
variables y varias componentes, es decir
Definir el concepto función diferenciable para funciones de la forma f : A ⊆ Rn → R y


de la forma F : A ⊆ Rn → Rm
Determinar qué es, en tal caso, la derivada de tales funciones.
Aprovechar derivadas para extender a funciones entre vectores las aproximaciones afi-
nes, estudios de máximos y mı́nimos, y relacionarlo con integrales.
Fijamos nomenclatura:
Si m > 1, decimos que f~ : I ⊆ R → Rm es una curva en Rm .
Si n > 1, decimos que f : A ⊆ Rn → R es una función real de varias variables.


Si n > 1 y m > 1, decimos que F : A ⊆ Rn → Rm es una función vectorial de varias
variables.
Ya vimos en el curso anterior cómo derivar curvas, que tienen una única variable, deri-
vando componente a componente, y su derivada era un vector de Rm si la curva iba de un
subconjunto de R a Rm formado por  las dervadas
 de cada componente, es decir, si m > 1
f1 (t)
 f2 (t) 
y f~ : I ⊆ R → Rm con f~(t) =  .. , entonces su derivada en un punto c ∈ I es
 
 . 
fm (t)
d f1 (t)
 
 dt 
 
 d f (t) 
   2 
D f~ (c) =   dt 

 .. 
 . 
d fm (t)
 
dt
También vimos las derivadas parciales de funciones reales de varias variables: dada f :
n
R → R con n > 1, con variables x1 , x2 , . . . , xn , entonces para cada i ∈ {1, 2, . . . , n} la
derivada parcial i-ésima de f en un punto ~c de su dominio es
∂f f (~c + t~ei ) − f (~c)
(~c) = lı́m
∂xi t→0 t
donde ~ei es el i-ésimo vector de la base canónica de Rn .
La idea era derivar respecto de xi asumiendo constantes las demás variables.

3
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Ejemplo 1.1. Para f : R2 → R con f (x, y) = x2 cos(y), sus derivadas parciales son

∂f ∂f
= 2x cos(y) = −x2 sen(y)
∂x ∂y

Pero aunque tener las derivadas parciales de una función real de varias variables nos
puede decir la tendencia de la función a cambiar al perturbar una variable dejando fijas las
demás, ello es insuficiente para analizar cómo varı́a la función si sus variables cambian de
manera coordinada: por ejemplo, si para un punto ~c queremos saber la variación (derivada)
cuando las variables se mueven en torno a ~c en una recta L : ~x = ~c + td,~ t ∈ R, donde d~ 6= ~0
es el vector dirección de la recta, es decir, d~ k L.
En ese caso se considera la derivada direccional con dirección d,~ dada por
 
f ~c + td~ − f (~c)
lı́m
t→0 t

Pero si todo funciona bien, y es lo que vamos a aclarar luego, dado que d~ se escribe como
combinación lineal de los vectores de la base canónica de Rn , {~e1 , ~e2 , . . . , ~en }, puede esperarse
que la derivada direccional se escriba como la respectiva combinación lineal de las derivadas
parciales, esto es, si d~ = a1~e1 + a2~e2 + · · · + an~en , la derivada direccional con dirección d~
debiera ser
∂f ∂f ∂f
a1 (~c) + a2 (~c) + · · · + an (~c)
∂x1 ∂x2 ∂xn
Note que esa expresión es el producto punto
 
∂f ∂f ∂f
, , ..., • (a1 , a2 , . . . , an )
∂x1 ∂x2 ∂xn
n
y definiendo el gradiente de la función real  de varias variables f : R →  R con n > 1, con
∂f ∂f ∂f
variables x1 , x2 , . . . , xn , como ∇f (~c) = (~c), (~c), . . . , (~c) , tendrámos que la
∂x1 ∂x2 ∂xn
derivada direccional, si todo sale bien, serı́a

∇f (~c) • d~ (1)

En este sentido, el gradiente serı́a un análogo de la derivada para funciones reales de


varias variables, pero no basta, ya que hace falta que las derivadas direccionales se puedan
expresar realmente según la expresión (1), que veremos luego.
Una utilidad inicial de la validez de la expresión (1) es que indica las direcciones en que
las derivadas direccionales son nulas o de valor máximo, sólo respecto de su ángulo con el
gradiente:

4
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Proposición 1.1. Si la expresión (1) representa a las derivadas direccionales de f : I ⊆


Rn → R en algún punto ~c ∈ I, entonces:
Las derivadas direccionales son nulas si su dirección es perpendicular al gradiente.

La derivada direccional de valor máximo es la paralela al gradiente.


La razón de ello es consecuencia de la caracterización del producto punto respecto del
coseno del ángulo:

∇f (~c) • d~ = ∇f (~c) · d~ cos(α)

con α dado por el ángulo entre el gradiente y d. ~


La proposición anterior indica que si se requiere saber cómo hacer variar linealmente las
variables de modo de obtener la mayor variación de la función, basta considerar la dirección
del gradiente.
Una ilustración simple serı́a saber en qué dirección moverse en una lámina con tempera-
turas distribuidas de modo no uniforme pero constante, de modo de que en cada punto haya
que dirigirse hacia las mayores temperaturas.
Pero para sustentar la noción de derivada en funciones, relaes y vectorias, de varias
variables, necesitamos saber algo de lı́mites y continuidad en varias variables.

1.2. Lı́mites y continuidad


En una variable estudiábamos lı́mites laterales para analizar la existencia de lı́mites
porque hay una sola dirección y dos sentidos por las cuales, en una recta, se llega a un
punto.
Con más dimensiones, hay además infinitas direcciones, no necesariamente rectas, diversos
caminos, por los que se puede llegar a un punto, lo que complica el definir lı́mites.
Formalmente:
Definición 1.1. f : A ⊆ Rn → R tiene lı́mite L ∈ R hacia ~c ∈ A ssi

∀ > 0∃δ > 0∀~x ∈ A 0 < ~x − ~c < δ ⇒ |f (~x) − f (~c)| < 



F~ : A ⊆ Rn → R tiene lı́mite P ∈ R hacia ~c ∈ A ssi

− →

 
∀ > 0∃δ > 0∀~x ∈ A 0 < ~x − ~c < δ ⇒ F (~x) − F (~c) < 

Las definiciones son, salvo el cambio de valor absoluto por módulo de vectores, totalmente
análogas a la definción formal de lı́mite para funciones con una sola variable y con imágenes
en R.
La complicación es que ~x − ~c → 0 debe ocurrir para todo vector ~x, no sólo para algunas
trayectorias.

5
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

2 x2 − y 2
Ejemplo 1.2. Para f : R \ {(0, 0)} → R dada por f (x, y) = 2 , no existe lı́m f (x, y),
x + y2 (x,y)→(0,0)
ya que tomando primero un eje coordenado y luego el otro, se tiene:

x2 − 0
lı́m f (x, y) = lı́m =1
(x,0)→(0,0) (x,0)→(0,0) x2 + 0

0 + y2
lı́m f (x, y) = lı́m = −1
(0,y)→(0,0) (0,y)→(0,0) 0 − y 2

De todos modos, es bueno saber que también existe una noción de continuidad para los
casos agradables:

Proposición 1.2. f : A ⊆ Rn → R es continua en p~ ∈ A ssi f (~p) = lı́m f (~x)


x→~
~ p


− →
− →

F : A ⊆ Rn → Rm es continua en p~ ∈ A ssi F (~p) = lı́m F (~x)
x→~
~ p

La buena noticia es que:

Proposición 1.3. 1. Los polinomios de varias variables son continuos en su dominio.

2. Suma, ponderación por un número real, y producto de funciones reales de varias va-
riables continuas son también funciones continuas.

3. Valor absoluto de funciones reales de varias variables continuas es continuo.

4. Composición de funciones continuas es función continua.

5. Para funciones reales de varias variables, cociente de continuas es continua mientras


no se anule el denominador.

6. Las funciones vectoriales son continuas ssi cada componente es continua.

7. Para funciones vectoriales (curvas o bien de varias variables) su módulo es continuo.

8. Para funciones vectoriales (curvas o bien de varias variables) su producto punto y


produto cruz son continuos.

Ejemplo 1.3. 1. lı́m (x2 + 3xy 3 ) = 22 + 3 · 2 · 13 = 10 ya que es polinomio.


(x,y)→(2,1)

p r √
2. lı́m (x + y) = lı́m (x + y) = 8 ya que es composición de una función
(x,y)→(3,5) (x,y)→(3,5)
continua, la raı́z cuadrada, con un polinomio.

En funciones reales de varias variables, como las imágenes son números reales, podemos
usar :

6
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Proposición 1.4. Dadas f : A ⊆ Rn → R, g : A ⊆ Rn → R, h : A ⊆ Rn → R y L ∈ R, se


cumplen:

1. Si lı́m |f (~x)| = 0, entonces lı́m f (~x) = 0


x→~c
~ x→~c
~

2. Si lı́m f (~x) = L, entonces lı́m |f (~x)| = |L|


x→~c
~ x→~c
~

3. (Nula por Acotada) Si lı́m f (~x) = 0 y ∀~x ∈ A (|g(~x)| < K) para algún K > 0, entonces
x→~c
~
lı́m f (~x) · g(~x) = 0
x→~c
~

4. (Teorema de Sandwich) Si lı́m f (~x) = L = lı́m g(~x) y ∀~x ∈ A (f (~x) ≤ h(~x) ≤ g(~x)),
x→~c
~ x→~c
~
entonces lı́m h(~x) = L
x→~c
~

x2 y
Ejemplo 1.4. lı́m =0
(x,y)→(0,0) x2 + y 2

Solución: Para todo (x, y) 6= (0, 0) se cumple:


2 2
xy
= |y| x
x2 + y 2 x2 + y 2

Pero lı́m |y| = 0 ya que es valor absoluto de un polinomio, por lo que es continua.
(x,y)→(0,0)
x2 2

Además, para todo (x, y) 6= (0, 0) se cumple 2
≤ 1, de modo que lı́m |y| x =
x + y2 (x,y)→(0,0) x2 + y 2
0 ya que es Nula por Acotada.
x2 y

Luego lı́m 2 = 0, y por lo tanto
(x,y)→(0,0) x + y 2

x2 y
lı́m =0
(x,y)→(0,0) x2 + y 2

(También se puede usar Teorema de Sandwich) 

 2
 xy si (x, y) 6= (0, 0)
2
Ejemplo 1.5. La función f : R → R dada por f (x, y) = x2 + y 2 es
0 si (x, y) = (0, 0)

2
continua en R .

Solución: Sea (x, y) ∈ R2 . Como es función dada por casos, analizamos por casos:

Si (x, y) 6= (0, 0), como x2 y y x2 +y 2 son continuas ya que son polinomios, y x2 +y 2 6= 0,


obtenemos que su cociente es continuo y, por tanto, f es continuo en (x, y).

7
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Si (x, y) = (0, 0), como f (0, 0) = 0 y por ejemplo anterior sabemos que lı́m f (x, y) =
(x,y)→(0,0)
x2 y
lı́m = 0 = f (0, 0), entonces f es continua en (0, 0).
(x,y)→(0,0) x2 + y 2

Por lo tanto, f es continua en R2 . 

8
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

1.3. Guı́a 1 Matemáticas 4.


Los ejercicios marcados con asterisco (∗) serán realizados en ayudantı́a.
1. Calcule la derivada direccional en el punto dado con dirección dada.
√ √
a) (∗) f (x, y) = x2 + y 2 − x cos(πy) − y sen(πx), ~v = (2/ 5, 1/ 5) en (−1, 2).
b) f (x, y) = ex cos(y), ~v = (4/5, 3/5) en (0, π/2).
c) f (x, y, z) = x2 + y 2 − z 2 ,~v = (1/3, 2/3, 2/3) en (1, 2, 2).

2. Encuentre la dirección en que la función f dada decrece más rápidamente en el punto


dado.

a) (∗) f (x, y) = ln(x2 + y 2 ) en (2, −4).


b) f (x, y) = x3 − xy 2 cos(xy) en (π, 1).
c) f (x, y) = xy en (e, ln(2)), donde e = 2, 7182... es tal que ln(e) = 1.
d ) f (x, y, z) = x cos(z) + yxz en (2, −1, π).

3. (Lı́mites) Demuestre que los siguientes lı́mites no existen:


x2 x2 + sen2 (y) xy 2
a) lı́m d) lı́m f ) (∗) lı́m
(x,y)→(0,0) x2 + y 2 (x,y)→(0,0) 2x2 + y 2 (x,y)→(0,0) x2 + y 4
xy
b) (∗) lı́m 2x2 y
(x,y)→(0,0) x + y 2
2 g) lı́m
(x,y)→(0,0) x4 + y 2
6x3 y y4
c) lı́m e) lı́m
(x,y)→(0,0) x4 + y 4 (x,y)→(0,0) x4 + 3y 4

4. (Continuidad) Demuestre en cada caso la continuidad en cada punto de R2 de f : R2 →


R con
cos(xy)
a) (∗) f (x, y) =
1 + x2 + y 2
 2
 3xy si (x, y) 6= (0, 0)
b) (∗) f (x, y) = x2 + y 2
0 si (x, y) = (0, 0)

 13xy
p si (x, y) 6= (0, 0)
c) f (x, y) = x2 + y 2
0 si (x, y) = (0, 0)

 2 2
 6x y + 5xy si (x, y) 6= (0, 0)
d ) f (x, y) = x2 + y 2
0 si (x, y) = (0, 0)

9
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

1.4. Derivación
Daremos una definición que cubre desde las funciones reales de variable real hasta las
funciones vectoriales de varias variables, y que coincide con las nociones previas de derivación.
En varias variables se habla de función diferenciable y de su diferencial, en vez de función
derivable y su derivada.
Primero veamos una forma útil de considerar derivadas de funciones reales de una variable
real:
Dada f : A ⊆ R → R, sabemos que f es derivable en c ∈ A con derivada f 0 (c) ∈ R ssi
f (x) − f (c)
f 0 (c) = lı́m .
x→c x−c
Pero ello equivale a que

f (x) − f (c) − f 0 (c) · (x − c)


0 = lı́m ,
x→c x−c
lo que significa que el error de aproximar en el codominio (imágenes) a f (x) por la función
afı́n (desplazamiento de función lineal, recta tangente) T (x) = f (c) + f 0 (c) · (x − c) (c fijo,
x variable) tiende a 0 más rápido de lo que tiende a 0 la resta x − c, porque se tiene

f (x) − T (x)
0 = lı́m
x→c x−c
Note que T (c) = f (c), es decir, sus gráficas coinciden en (c, f (c)).
Más aún, dado m ∈ R y la función afı́n g(x) = f (c) + m · (x − c), entonces

f (x) − g(x)
0 = lı́m ssi f es derivable en c y m = f 0 (c)
x→c x−c
Por eso se dice que la derivada da la pendiente de la recta tangente, que es la recta que
mejor aproxima a la gráfica de la función en las cercanı́as del punto de tangencia (c, f (c)).
Ahora a varias variables.

Definición 1.2 (Función afı́n). Diremos que una función de Rn en Rm es función afı́n si es
la suma entre un vector fijo de Rm con una función (transformación) lineal de Rn en Rm .
Considerando los vectores como matrices columna, una función afı́n g : Rn → Rm en
forma matricial cumple g (~x) = ~a + M · ~x donde ~a ∈ Rm y M es una matriz de m × n.

Definición 1.3 (Función diferenciable). Sea F : A ⊆ Rn → Rm , con m, n ∈ N, y sea ~c ∈ A


tal que F es continua en ~c.
Diremos que F es diferenciable en ~c ssi existe una matriz Mm×n tal que

F (~x) − F (~c) − M · (~x − ~c)
0 = lı́m
x→~c
~ ||~x − ~c||

En tal caso, M es llamada diferencial de F en ~c y se denota D(F )(~c)

10
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Habitualmente no se pide que una función sea continua para ver si es diferenciable en el
punto, sino que se demuestra que “diferenciable implica continua”, pero lo que eso significa
es que no puede ocurrir que una función sea, a la vez, diferenciable y no continua en un
punto.
La diferencial de una función diferenciable es única, y se tiene:
Proposición 1.5. Sea F : A ⊆ Rn → Rm diferenciable en ~c ∈ A. Entonces la función afı́n
T : Rn → Rm dada por T (~x) = F (~c) + D(F )(~c) · (~x − ~c) es la única función afı́n que cumple
T (~c) = F (~c) y
F (~x) − T (~x)
0 = lı́m
x→~c
~ ||~x − ~c||
En suma, T es la mejor aproximación afı́n a F en un entorno de ~c.
Antes de sacar provecho de este concepto, veamos una forma simple de determinar la
matriz D(F )(~c) y de saber cuando existe.
Definición 1.4 (Matriz jacobiana). Sea F : A ⊆ Rn → Rm de la forma
 
f1 (~x)  
  x1
 f2 (~x)   x2 
   
F (~x) =   donde ~
x = .
 .. 
   
 . 
 ..  xn
fm (~x)
(las funciones f1 , f2 hasta fm son las funciones componentes de F )
La matriz jacobiana de F en ~c es, si existe,
 
∂f1 (~c) ∂f1 (~c) ∂f1 (~c)
 ∂x1 ···
 ∂xs ∂xn  
 ∂f2 (~c) ∂f2 (~c) ∂f2 (~c) 
 
 ··· 
 ∂x1 ∂x s ∂xn 
 . .. .. .. 
 .. . . . 
 
 ∂fm (~c) ∂fm (~c) ∂fm (~c) 
···
∂x1 ∂xs ∂xn m×n

Proposición 1.6. Sea F : A ⊆ Rn → Rm diferenciable en ~c ∈ A. Entonces D(F )(~c) es la


matriz jacobiana de F en ~c.
A veces la matriz jacobiana puede existir, pero sin que la función sea diferenciable.
La proposición anterior implica que si una función es diferenciable en un punto, al menos
deben existir todas las derivadas parciales de todas sus componentes.
Proposición 1.7 (Condición suficente para diferenciabilidad). Sea F : A ⊆ Rn → Rm y sea
~c ∈ A tal que las derivadas parciales de todas sus funciones componentes son continuas en
un entorno de ~c.
Entonces F es diferenciable en ~c.

11
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Puede pasar que las derivadas parciales no sean continuas y aún ası́ la función sea dife-
renciable.
Proposición 1.8. 1. Suma de funciones diferenciables es diferenciable y su diferencial
es la suma de las diferenciales.

2. Cualquier ponderado de una función diferenciable por un escalar es diferenciable y la


diferencial del ponderado es el ponderado de la diferencial.

3. En funciones diferenciables reales de varias variables, el producto es diferenciable, y su


diferencial sigue la regla del producto.

4. En funciones diferenciables reales de varias variables, el cociente es diferenciable donde


no se anule el denominador, y su diferencial sigue la regla del cociente.
Observación 1.1. Veamos cómo responde por los casos ya vistos, asumiendo que un vector
de R1 o matriz de 1 × 1 es simplemente el número que indica.
∂f1 (~c)
1. Si n = m = 1, la matriz jacobiana, su diferencial D(F )(~c), es simplemente , que
∂x1
es la derivada normal de f = f1 en c = ~c respecto de la única variable x = x1 .

2. Si n > 1 y m = 1, la función es una curva en Rm y su matriz jacobiana, su diferencial


D(F )(~c), es  
∂f1 (~c)
 ∂x1   0 
  f1 (c)
 ∂f2 (~c) 
 
 f 0 (c) 
 2 
=  .. 
 
 ∂x1 
 .   . 
 ..  0
 
 ∂fm (~c)  fm (c)

∂x1 m×1

que es la derivada de la curva en c = ~c respecto de su única variable x = x1 , por lo que


las derivadas parciales son las derivadas normales de las componentes, que es lo que
ya conocemos.

3. Si n > 1 y m = 1, se trata de una función real de varias variables cuya única compo-
nente es F = f1 , y su matriz jacobiana, su diferencial D(F )(~c), es
   
∂f1 (~c) ∂f1 (~c) ∂f1 (~c) ∂F (~c) ∂F (~c) ∂F (~c)
··· = ···
∂x1 ∂xs ∂xn 1×n ∂x1 ∂xs ∂xn

que es muy similar al gradiente de F en ~c, salvo que es una matriz fila y no columna,
es decir, no tiene forma de vector.
Incluso recordamos que para derivadas direccionales hacı́amos producto punto de ∇F
~ son vectores de Rn , entonces
con el vector dirección, pero recordemos que, si ~v y w

12
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

~v • w~ = M · ~v donde M es la matriz transpuesta de ~v (es decir, ~v vista como matriz


fila), por lo que podemos considerar ∇(F ) como la matriz jacobiana de F , su diferencial.
4. Finalmente, si n > 1 y m > 1, la matriz jacobiana, la deiferencial de F , es la matriz
cuyas filas son los gradientes de las componentes de F .
Proposición 1.9. Una función vectorial de varias variables es diferenciable ssi todas sus
componentes (funciones reales de varias variables) son diferenciables.
Proposición 1.10 (Regla de la cadena). Si F : A ⊆ Rn → Rm es diferenciable en ~c y
G : B ⊆ Rm → Rk es diferenciable en ~a = F (~c), entonces G ◦ F es diferenciable en ~c y
D(G ◦ F )(~c) = D(G)(~a) · D(F )(~c)
Es decir, la diferencial (matriz jacobiana) de G ◦ F es el producto de las diferenciales
(matrices jacobianas) de G y de F .
Observación 1.2. En el caso de n = 1 y m = 1, acostumbramos a graficar F : A ⊆ R2 → R
en R3 como el conjunto
  M de puntos (x, y, F (x, y)) y el dominio como el conjunto de puntos
x
(x, y, 0) donde ∈ A.
y  
x0
La función afı́n T para F diferenciable en ~c = es
y0
          
x x0 ∂F x0 ∂F x0 x − x0
T =F + ·
y y0 ∂x y0 ∂y y0 y − y0
       
x x ∂F x0 ∂F x0
Considerando z = T , z0 = T , p = , q = , tenemos que lo
y y ∂x y0 ∂y y0
anterior se puede escribir como
z = z0 + p(x − x0 ) + q(y − y0 )
es decir, la
  gráfica
 de la función afı́n T es un plano que contiene al punto (x0 , y0 , z0 ) =
x0
x0 , y0 , F , y se llama plano tangente a la gráfica de F en ~c.
y0

13
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Entonces una recta L(t) = ~c + td,~ d~ 6= ~0, en R2 se reinterpreta en el plano XY de R3 , y


la composición γ(t) = F (L(t)) es una función de una variable en una variable, y en R3 su
grafica resulta de intersectar la gráfica M de F con el plano vertical P que corta al plano
XY en la curva dada por L (P es paralelo a d~ y al eje Z). Es una función de una variable
en una variable dibujada en ese plano vertical.
Más aún, en ese plano vertical, la derivada (vector tangente) de la curva γ(t) = F (L(t))
en 0 está contenida en el plano tangente a la gráfica.
Básicamente, cuando F es diferenciable todos los vectores tangentes asociados a las de-
rivadas direccionales están contenidos en el plano tangente.
Si consideramos máximos y mı́nimos locales de F (cimas y fosas de su gráfica) deben
ser máximos y mı́nimos de F (L(t)) para cada dirección d, ~ es decir, todas las derivadas
direccionales deben ser 0, lo que equivale a que ∇F = (0, 0).

2. Extremos de funciones
Se trata de determinar los máximos y mı́nimos, locales y globales, de funciones reales de
varias variables. Se buscar saber cuánto valen y dónde ocurren tales valores extremos.

Definición 2.1 (Extremos locales y globales). Para f : A ⊆ Rn → R, con n > 1:

1. diremos que f posee un máximo global en ~c ∈ A ssi ∀~x ∈ A (f (~x) ≤ f (~c))

2. diremos que f posee un mı́nimo global en ~c ∈ A ssi ∀~x ∈ A (f (~x) ≥ f (~c))

3. diremos que f posee un máximo local en ~c ∈ A ssi existe R > 0 tal que

∀~x ∈ A ( ||~x − ~c|| < R ⇒ f (~x) ≤ f (~c))

4. diremos que f posee un mı́nimo local en ~c ∈ A ssi existe R > 0 tal que

∀~x ∈ A ( ||~x − ~c|| < R ⇒ f (~x) ≥ f (~c))

En este curso consideraremos dominios como regiones sencillas, acotadas o no, con curvas
continuas como borde (o “frontera”) si los hay, y con un interior y un exterior de ese borde,
como en la imagen

14
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

2.1. Extremos en el interior del dominio

Definición 2.2. Sea F : A ⊆ Rn → R.

1. Los puntos del interior de A donde ∇(F )(~c) = ~0 son los puntos estacionarios de la
función.

2. Los puntos del interior de A donde F no es diferenciable (aunque exista ∇(F )) son los
puntos singulares de F .

3. Los puntos crı́ticos del interior de A son los puntos estacionarios y los puntos singulares
de F .

Proposición 2.1. Los máximos y mı́nimos locales de F : A ⊆ Rn → R en el interior de A


ocurren en los puntos crı́ticos de del interior de A.

Para clasificar puntos estacionarios, usaremos un criterio que extiende el criterio de las
segundas derivadas, para lo cual necesitamos las derivadas parciales segundas, que tienen
sentido porque las derivadas parciales de F son también funciones reales de tantas variables
como F :

Definición 2.3. Las derivadas parciales segundas de F : A ⊆ Rn → R son

∂ 2F
 
∂ ∂F
=
∂xi ∂xj ∂xi ∂xj

para cada par i, j de naturales entre 1 y n


∂ 2F ∂ 2F
Cuando i = j, se abrevia a por
∂xi ∂xi ∂x2i

15
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

n ∂ 2F
Proposición 2.2. Sea F : A ⊆ R → R diferenciable en el interior de A. Si
∂xi ∂xj
∂ 2F
y son continuas en ~c perteneciente al interior de A, entonces en ese punto son
∂xj ∂xi
iguales.

Acá sólo daremos el criterio para funciones de dos variables en una, pese a que existe un
criterio para más variables:

Proposición 2.3 (Criterios de derivadas parciales segundas). Si F : A ⊆ R2 → R tiene


drivadas parciales segundas en un entorno de ~c, y ∇(F )(~c) = ~0, entonces para
 2 
∂ F ∂ 2F
 ∂x2 (~c) ∂x2 ∂x1 
(~c)
1
D = det  2
 
2

 ∂ F ∂ F 
(~c) 2
(~c)
∂x1 ∂x2 ∂x2

donde la martiz es llamada matriz Hessiana, se cumple:


∂ 2F
1. Si D > 0 y (~c) < 0, entonces F tiene un máximo local en ~c.
∂x21
∂ 2F
2. Si D > 0 y (~c) > 0, entonces F tiene un mı́nimo local en ~c.
∂x21
3. Si D < 0 entonces F no tiene máximo local ni mı́nimo local en ~c. (punto silla, vea
imagen)

4. Si D = 0, el criterio no responde.

16
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

2.2. Guı́a 2 Matemáticas 4.


Los ejercicios marcados con asterisco (∗) serán realizados en ayudantı́a.
1. Demuestre que las siguientes funciones son diferenciables en todo su dominio y escriba
su diferencial como matriz:

d ) (∗) F (x, y) = x2 − y 2 , x + y

a) f (x, y) = 5x + 7y + xy
b) f (x, y) = 4x2 y 3 + ey e) F (x, y, z) = ln(1 + x2 + y 2 + z 2 ), z cos(exy )


c) (∗) f (x, y) = y sen(x) + x3 + 5 f ) F (x, y, z) = (2x + 3y, z − 5y, 3x + 4y)



 p x|y|

si (x, y) 6= (0, 0)
2. (∗) Demuestre que la función f (x, y) = x2 + y 2 es continua

0 si (x, y) = (0, 0)
pero no diferenciable en (p, 0) si p 6= 0, pero es continua y diferenciable en (0, 0)

3. Encuentre las derivadas parciales que se indican usando la regla de la cadena.


∂u ∂u
a) (∗) Sea u = x2 − y 2 con x = 3r − s e y = r + 2s. Encuentre y .
∂r ∂s
∂u ∂u
b) Sea u = 3x2 + xy con x = 2r − 3s e y = r−1 + s2 . Encuentre y .
∂r ∂s
∂u ∂u
c) Sea u = tan(3x + y) con x = r2 es e y = sen(rs). Encuentre y .
∂r ∂s
∂u ∂u
d) Sea u = yex + xey con x = cos(t) e y = sen(t). Encuentre y .
∂r ∂s
p du
e) Sea u = x2 + y 2 + z 2 con x = tan(t), y = cos(t) y z = sen(t). Encuentre
dt
2 2
f) Sea u = x2 + ey +z con x = r cos(θ) sen(φ), y = r sen(θ) sen(φ) y z = r cos(φ).
∂u ∂u ∂u
Encuentre , y .
∂r ∂θ ∂φ
∂z ∂z
g) (∗) Sea z = exy con x = ln(u2 + v 2 ) e y = arctan(u/v). Calcule y .
∂u ∂v
4. Encuentre la ecuación del plano tangente a la gráfica de la función z = f (x, y) en el
punto P . Escriba la ecuación del plano en la forma ax + by + cz = d.

a) f (x, y) = 3x2 + 5y 2 en (0, 0). c) (∗) f (x, y)  = ln(x2 + y 2 ) en


2, −4, ln(20) .
b) f (x, y) = 2(x − 3)2 + 4(y + 1)2 + 12 d ) f (x, y) = x3 − xy 2 cos(xy) en
en (1, 1). (π, 1, π 3 + π).

17
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

5. (ADICIONAL: Diferencial total, propagación de errores. ref: Purcell et al “Cálculo”


Pearson, Novena edición, sección 12.7)

a) Use la diferencial total (o error de aproximación por función afı́n) y calculadora,


para aproximar el valor de la función respecto de un punto de coordenadas simples:

1) (∗) f (0,99, 1,02) si f (x, y) = 2x2 y 3 3) g(2,03, 2,98)


2) h(−1,98, 3,96) si h(x, y) = ln(x2 y) si g(x, y) = x2 − 5xy + y

b) (∗) “El radio y la altura de un cono circular recto se miden con errores de a lo
más 2 % y 3 % respectivamente. Use diferenciales para estimar el error porcentual
máximo en el volumen calculado (véase el ejemplo 4)” (ese ejemplo se realizará en
ayudantı́a)
c) “Al determinar la gravedad especı́fica de un objeto se ve que su peso en el aire
es A = 36 libras, mientras que su peso en el agua es W = 20 libras, con un
posible error de 0,02 libras en cada medición. Determine, aproximadamente, el
A
error máximo posible al calcular su gravedad especı́fica S, donde S = .”
(A − W )
∂ 2f ∂ 2f ∂ 2f ∂ 2f
6. (∗) Sea f : R3 → R con f (x1 , x2 , x3 ) := x51 x72 x93 . Calcule , , , y
∂x21 ∂x22 ∂x1 ∂x2 ∂x2 ∂x1
verifique que las últimas dos son iguales.
∂ 2f ∂ 2f ∂ 2f ∂f
7. Sea f : R3 → R con f (x, y, z) := xzeyz . Calcule , , , y verifique
∂x2 ∂y 2 ∂x∂y ∂y∂x
que las últimas dos son iguales.
∂ 2f ∂ 2f
8. La ecuación en derivadas parciales + = 0 es muy importante y se llama
∂x2 ∂y 2
Ecuación de Laplace (indague). Determine cuales de las siguientes funciones satisface
la ecuación de Laplace:

a) f (x, y) = x3 − 3xy 2 b) f (x, y) = ex (cos(y) + sen(y))

9. Encuentre todos los puntos crı́ticos de las siguientes funciones y en cada caso determine
si se trata de un punto silla, un máximo local, un mı́nimo local, o un punto degenerado
(es decir, con Hessiana de determinante nulo). El dominio de todas las funciones es
todo R2 .

a) f (x, y) = 6 − 3x2 − y 2 d ) (∗) f (x, y) = x3 − 3xy + y 2


b) f (x, y) = xy e) f (x, y) = x4 + y 2 − 8x2 − 6y + 16
c) f (x, y) = 3x + 12y − x3 − y 3 f ) f (x, y) = 2x4 + y 4 − 2x2 − 2y 2 + 3

18
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

2.3. Extremos en bajo restricciones


Recordemos que en este curso, el borde del dominio de una función real de varias variables,
si existe, debe ser una curva simple.
No siempre hay tal borde, como en el caso de la función f (x, y) = ln(1 − x2 − y 2 ), cuyo
dominio máximo es {(x, y) ∈ R2 | x2 + y 2 < 1} que es el interior de la circunferencia unitaria
de centro el origen.
Una curva simple en el plano o el espacio puede describirse por su parametrización, como
se hizo con intergales de lı́nea o de trayectoria, y en tal caso el problema de encontrar los
extremos de una función en el borde de su dominio o en alguna restricción dada por una
curva en su dominio se reduce a componer la función con la parametrización, obteniéndo una
función de una variable, y luego buscando sus extremos con métodos de cursos anteriores,
con una sola variable (el parámetro de la curva)

Ejemplo 2.1. Determine, mediante parametrización de la restricción, los valores máximos


y mı́nimos de f : R2 → R dada por f (x) = x2 + 2y 2 sobre la circunferencia x2 + y 2 = 1

Sea R : [0, 2π[ → R2 la función R(t) = cos(t), sen(t) . Entonces su recorrido



Solución:
en R2 es la circunferencia x2 + y 2 = 1 y es inyectiva (se recorre una sola vez).
Luego, el problema planteado se reduce a determinar los extremos de la función (F ◦ R) :
[0, 2π[ → R de una sola variable, dada por

(F ◦ R)(t) = cos2 (t) + 2 sen2 (t)

Se tiene:
d (F ◦ R)
(t) = 2 cos(t) sen(t) = sen(2t)
dt
π 3π
y por tanto los cambios de crecimiento ocurren en , π y . Además se debe analizar en 0,
2 2
dado que la curva es cerrada. Aplicando técnicas de una variable, encontramos que (F ◦ R)
π 3π
tiene mı́nimos locales en 0 y π, y máximos locales en y en .
2 2
Volviendo a la función original, se obtiene que F sobre x2 + y 2 = 1 posee los siguientes
extremos:

1. mı́nimo en R(0) = (1, 0) con valor F (1, 0) = 1

2. mı́nimo en R(π) = (−1, 0) con valor F (−1, 0) = 1


π 
3. máximo en R = (0, 1) con valor F (0, 1) = 2
2
 

4. máximo en R = (0, 1) con valor F (0, −1) = 2
2

19
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Hay una forma más eficaz de realizar lo anterior si la restricción dada por una curva del
dominio (sea su borde o no) no es fácilmente parametrizable, o incluso aunque lo sea:
Una curva puede ser considerada como la curva de nivel de una cierta función, es decir, el
conjunto de valores de las variables que realizan un valor constante dado de la función (todos
los puntos que tienen una imagen dada). Por ejemplo, la recta x + y = 3 en R2 puede ser
vista como la curva de nivel de valor constante 3 de la función g(x, y) = x + y. Ello equivale,
geométricamente, a intersectar la gráfica de z = g(x, y) con el plano horzontal z = 3: la
curva en R2 corresponde a proyectar tal intersección sobre el plano XY de R3 , y traducir de
vuelta a R2 .
Es lo mismo que se hace en mapas topográficos, vea imagen

En fin, la idea es que al proyectar la curva de nivel sobre el dominio de la función original,
obtenemos una curva, y se tiene n resultado interesante:
Proposición 2.4. El gradiente de una función es perpendicular a cada curva de nivel
En la imagen se muestra una curva de nivel de una función g(x, y) para algún valor
constante k, y un punto (p, q) tal que g(p, q) = k (un punto de la curva de nivel), y se
muestra la recta tangente a la curva en ese punto, y el gradiente de g en el mismo punto,
que es perpendicular a la curva en tal punto (es perpendicular a la tangente en el punto)

20
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Note que una curva, que en este contexto será llamada también un restricción, siempre
puede considerarse como una curva de nivel de la forma h(x, y) = 0, ya que si se trata de
g(x, y) = k, k constante, entonces basta tomar h(x, y) = g(x, y) − k.
Para determinar los extremos de una función sobre una curva, o dicho de otro modo,
sujeta a una restricción en su dominio
Damos el método para dos variables y una restricción, que es fácil de ampliar a dominios
con más dimensiones y a más de una restricción:

Proposición 2.5 (Método de multiplicadores de Lagrange, con dos variables). Si F : A ⊆


R2 → R, y F posee extremos cuando sus variables están sujetas a la restricción g(x, y) = 0,
entonces deben existir x0 , y0 , λ con

1. F poseee un extremo en (x0 , y0 )

2. Se cumplen simultáneamente
(
∇F (x0 , y0 ) = λ∇g(x0 , y0 )
(2)
g(x0 , y0 ) = 0

Basta con ordenar las imágenes de esos punto por F : el mayor será el mı́nimo de F sujeto
a g = 0, y el mayor será el máximo de F sujeto a g.

Rehaciendo el ejemplo 2.1 por Método de multiplicadores de Lagrange:

Ejemplo 2.2. Determine, usando Método de Lagrange, los valores máximos y mı́nimos de
f : R2 → R dada por f (x) = x2 + 2y 2 sobre la circunferencia x2 + y 2 = 1

Solución: Considerando g(x, y) = x2 + y 2 − 1, tenemos que la restricción x2 + y 2 = 1


corresponde a g(x, y) = 0. Entonces, por las igualdades (2) de la Proposición2.5, se deben
encontrar x, y, λ con

(2x, 4y) = λ (2x, 2y)


x2 + y 2 = 1

2x = λ2x

Luego 4y = λ2y y se tiene que, x = 0 o λ = 1.

 2
x + y2 = 1

1. Si x = 0, entonces y = ±1, es decir, se obtienen los puntos (±1, 0)

2. Si λ = 1, entonces 4y = 2y, de donde y = 0 y por tanto x = ±1, es decir, se obtienen


los puntos (0, ±1)

21
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Teniendo cuatro puntos, basta evaluar F en ellos para saber los extremos:

F (1, 0) = 1 F (−1, 0) = 1 F (0, 1) = 2 F (−1, 0) = 2

de donde F tiene máximos de valor 2 en (0, ±1) y mı́nimos de valor 1 en (±1, 0) 

Si hay más variables, las condiciones (2) de la Proposición2.5 simplemente se extienden


a tantas variables como se requiera.
Respecto de que haya más de una restricción, en R2 no tiene mucho sentido porque
la intersección de curvas es, o bien un segmento de curva en común, o un punto, pero en
tres o más dimensiones, cada restricción puede ser una superficie, y su intersección ser una
curva, por ejemplo. En tal caso, las condiciones (2) de la Proposición2.5 quedarı́an, para tres
restricciones g1 = 0, g2 = 0 y g3 = 0:



 ∇F (~x) = λ1 ∇g1 (~x) + λ2 ∇g2 (~x) + λ3 ∇g3 (~x)

g (~x) = 0
1


 g2 (~x) = 0

g3 (~x) = 0

3. Diagonalización
Diagonlización consiste, básicamente, en que determinadas funciones lineales, o más bien
sus matrices, pueden resultar en matrices diagonales (con ceros fuera de la diagonal) que
son de comportamiento notablemente bueno en toda la operatoria matricial y de funciones
lineales. Veremos que ello se relaciona con el que exista una base para el dominio de la función
lineal de tal modo que para cada vector de la base existe un número tal que la imagen del
vector es el mismo pero ponderado por dicho número. Eso simplifica mucho el trabajo con
la función lineal.
Más adelante esto nos ayudará a resolver sistemas de ecuaciones diferenciales.

3.1. Una introducción indirecta mediante Cadenas de Markov


Las cadenas de Markov representan secuencias de estados posibles de una situación,
expresados como las probabilidades de que cada estado ocurra, y donde hay una regla fija
que relaciona las probabilidades de un estado con las probabilidades del estado siguiente.
Podemos representar cada estado como un vector o matriz columna con las probabili-
dades de cada situación posible, dadas por números entre 0 y 1, de modo que la suma de
las probabilidades sea 1, lo que indica que en cada estado necesariamente alguna de las
alternativas debe ocurrir.
El paso de un estado a otro conlleva la posible alteración de las probabilidades del estado
según que se realice alguna de las alternativas, lo que configura el nuevo estado. Para ello

22
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

usamos una matriz de transición. Habitualmente la matriz se obtiene mediante reglas que
indican las probabilidades de que ocurra alguna de las alternativas dado que en el estado
anterior haya ocurrido esa u otra de las alternativas, por lo que se trata de probabilidades
condicionales.

Ejemplo 3.1 (Del texto “Álgebra Lineal con aplicaciones” de W. Nicholson, MacGraw-Hill).
Un zorro caza en tres territorios, A, B y C. Nunca caza dos dı́as seguidos en el mismo
territorio. Si caza en A, al dı́a siguiente caza en C. Si caza en B o en C, existe el doble de
probabilidad de que cace en A al dı́a siguiente de que lo haga en los otros dos territorios.
La idea es que la matriz se forma tomando cada columna con las probabilidades de que
cace en uno de los territorios el dı́a siguiente, dado que cazó en A (primera columna) o en
B (segunda columna), o en C (tercera columna), con los territorios del dı́a siguiente como
filas. Por ello, cada columna debe sumar 1 (se asume que no hay otras acciones que las de
cazar en A, B o C) y por ello se obtiene:
 
0 2/3 2/3
P = 0 0 1/3
1 1/3 0
que debe interpretarse como

Hoy en A Hoy en B Hoy en C


Luego en A 0 2/3 2/3
Luego en B 0 0 1/3
Luego en C 1 1/3 0

porque
  como caza en C al dı́a siguiente si hubiera cazado en A, la primera columna debe ser
0
0.
1
Para la segunda columna, es decir, si come en B, como no vuelve a comer en B, la
segunda fila de esa columan es 0, y como la probabilidad de comer en  A será
 el doble de la
2/3
probabilidad de comer en C, la columna, que debe sumar 1, resulta  0 . Análogamente
1/3
se obtiene la tercera columna.
Dada una situación inicial, por ejemplo, que el zorro pueda  cazaren cualquiera de los
1/3
tres territorios con igual probabilidad, es decir, con estado inicial 1/3, el estado siguiente

1/3
se obtendrı́a como resultado de que cace por primera vez en alguno de los tres territorios,
aplicando las reglas o matriz de transición, y tal estado siguiente serı́an las probabilidades
de que cace la próxima vez en los otros territorios.

23
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

En este caso, con el estado inicial equiprobable, se tendrı́a que el siguiente estado serı́a
     
0 2/3 2/3 1/3 4/9
0 0 1/3 · 1/3 = 1/9
   
1 1/3 0 1/3 4/9

Ello indica que la siguiente vez que cace, la probabilidad de que lo haga en A es de 4/9, de
que lo haga en B es 1/9, y de que lo haga en C es 4/9. Puede notarse el efecto de las reglas
(matriz de transición) ya que la probabilidad de cazar en B bajó a la tercera parte, pese a
que inicialmente las probabilidades eran iguales para los tres territorios.
Si representamos el estado inicial por S0 , y los siguientes por S1 , S2 , etcétera, se cumple:

S1 = P · S0 S2 = P · S1 = P 2 · S0 S3 = P · S2 = P 3 · S0 · · ·

de modo que lo relevante son las potencias de la matriz.


Si sigue cazando unas cuantas veces más, estos serán los estados, comenzando con el
estado inicial:
         
1/3 4/9 10/27 34/81 94/243
1/3 , 1/9 ,  4/27  , 13/81 ,  34/243  ,
1/3 4/9 13/27 34/81 115/243
Algo notable es que las probabilidades de A y C se mantienen muy semejantes, con C
ligeramente más probable, mientras que las probabilidades de B están entre 1/9 y 1/7.

Puede ocurrir que al seguir tomando estados, estos tiendan a estabilizarse, es decir,
a rondar cada vez más cerca algún estado “lı́mite”, lo que depende más de la matriz de
transición que de el estado inicial.
Definición 3.1. Un estado estable de una cadena de Markov con matriz de transición P es
un estado S tal que P · S = S
El problema serı́a saber cómo determinar si existe ese estado estable y cuál es en tal caso.
Basta notar lo siguiente: si existe el estado estable Sm×1 para Pm×m , se cumple, con 0m×1
matriz columna nula, y e Im×m la matriz identidad:

S =P ·S ssiI · S = P · S I · S − P · S = (I − P ) · S = 0m×1

notando que la última igualdad corresponde a un sistema homgéneo de m ecuaciones lineales


con matriz (I − P ) y con S como solución. Un detalle es que S debe ser un estado de la
cadena de Markov, por lo que sus coeficinetes deben estar entre 0 y 1, y sumar 1.
Ejemplo 3.2 (Continuación del Ejemplo
 3.1). Volviendo a los territorios de caza del zorro,
0 2/3 2/3
con matriz de transición 0 0 1/3 Se resuelve (I − P ) · S = 0m×1 , es decir, se busca
1 1/3 0

24
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

        
x   0 2/3 2/3 x 0
1 0
S = y  tal que  − 0 0 1/3 · y  = 0 Por ello, usando reducción
0 1
z 1 1/3 0 z 0
por filas de la matriz, se tiene:
   
  0 2/3 2/3 1 −2/3 −2/3
1 0
− 0 0 1/3 =  0 1 −1/3
0 1
1 1/3 0 −1 −1/3 1
   
1 −2/3 −2/3 1 0 −8/9
∼ 0 1 −1/3 ∼ 0 1 −1/3
0 −1 1/3 0 0 0
 
x
De donde S = y  debe cumplir

z
8 1
1 =x + y + z ∴x= z ∴y= z
9 3
 
8
1  
cuya solución es, recordando que debe ser un estado de la cadena de Markov S = 3
20
9
que es el estado estable de la caza de este zorro.
Ello significa que, por ejemplo, si conocemos esta situación y queremos, por ejemplo,
filmar al zorro, es más probable encontrarlo, a la larga, en el territorio C o en el A, que en
el B.

Pasaremos ahora a generalizar el problema de encontrar la matriz S, dejando de lado las
cadenas de Markov y los estados de probabilidades.

3.2. Valores y vectores propios


Sea f : Rn → Rn una función lineal con matriz A = [f ] respecto de las bases canónicas.
Sabemos que f queda completamente determinado por A.
Definición 3.2 (Valores y vectores propios). Sea f : Rn → Rn una función lineal. Se dice
que ~v ∈ Rn es un vector propio de f para el valor propio λ ∈ R ssi
f (~v ) = λ~v

con ~v 6= ~0.
En términos matriciales, si An×n es una matriz, se dice que ~v ∈ Rn (como matriz colum-
na) es un vector propio de A para el valor propio λ ∈ R ssi
A · ~v = λ~v

25
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

En las cadenas de Markov, el estado estable correspondı́a a encontrar un vector propio


de la matriz de transición, supuesto que 1 es un valor propio de ella.
Dado que una función lineal de Rn a Rn se representa por su matriz, basta trabajar la
versión matricial.

Proposición 3.1. Para n ∈ N, con n > 1, si λ es valor propio de An×n , entonces el conjunto
de los vectores propios de A para λ, agregando el vector ~0, es un subespacio vactorial de Rn .

Para determinar valores y vectores propios, usamos una estrategia similar a la realizada
para determinar el estado estable de una cadena de Markov:

Proposición 3.2. Sea An×n con n > 1. Entonces

1. λ ∈ R es un valor propio de A ssi det (λIn − An×n ) = 0

2. Si λ ∈ R es un valor propio de A, entonces los vectores propios de A para λ son las


soluciones no nulas del sistema de ecuaciones lineales

(λIn − An×n ) ~v = 0n×1

donde n es la matriz identidad de n × n.

Demostración. 1. Se tiene que

λ ∈ R es un valor propio de A
ssi existe ~v ∈ Rn con ~v 6= ~0 y A~v = λ~v = λIn · ~v
ssi existe ~v ∈ Rn con ~v 6= ~0 y (λIn − An×n ) ~v = 0n×1
ssi el sistema de ecuaciones lineales (λIn − An×n ) ~v = 0n×1 tiene solución no nula
ssi (λIn − An×n ) noes invertible
ssi det (λIn − An×n ) = 0

2. Se deduce del desarrollo anterior.

Definición 3.3. El polinomio caracterı́stico de una matriz An× es cA (λ) = det (λIn − An×n )

Proposición 3.3. El polinomio caracterı́stico de una matriz n × n es un polinomio mónico


de grado n y los valores propios de la matriz son los ceros de su polinomio caracterı́stico.
 
0 1
Ejemplo 3.3. Encuentre los valores y vectores propios de la matriz A =
3 2

26
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Solución:
  Como se deben encontrar los valores de λ ∈ R y vectores respectivos ~v =
x
∈ R2 tales que A~v = λ~v , se encuentran primero los valores propios λ tales que
y
det (λI − A) = 0 (3)
  de 2 × 2, y con ellos los respectivos valores propios ~v que cumplan
con I la identidad
0
(λI − A) ~v =
0
Entonces se resuelve la ecuación 3, es decir, se encuentran los ceros del polinomio carac-
terı́stico de A:
 
λ −1
0 = det (λI − A) = det = λ2 − 2λ − 3 = (λ + 1)(λ − 3)
−3 (λ − 2)
de modo que la ecuación caracterı́stica de A es CA (λ) = (λ + 1)(λ − 3) y los valores
propios de A son λ1 = −1 y λ2 = 3.

  λ1 = −1 lo valores propios se obtienen


Para   de resolver el sistema homogéneo (A + I) ~v =
0 1 1
, es decir, se reduce la matriz
0 3 3
   
1 1 1 1

3 3 0 0
   
x 1
de donde los vectores propios ~v = para λ1 = −1 son ~v = t ,t∈R
y −1
Para
  λ2 = 3 lo valores propios se obtienen
 de resolver
 el sistema homogéneo (A − 3I) ~v =
0 −3 1
, es decir, se reduce la matriz
0 3 −1
   
−3 1 −3 1

3 −1 0 0
   
x 1
de donde los vectores propios ~v = para λ2 = 3 son ~v = t ,t∈R
y 3

   
1 1
Note que los valores propios y forman una base de R2 , lo que no siempre
−1 3
ocurre.
Si la matriz es de 2 × 2, el polinomio caracterı́stico es cuadrático, pero si la matriz de de
mayor tamaño, el polinomio tendrá mayor grado y se vuelve más difı́cil determinar sus cero
(o raı́ces).
Se recomienda repasar el capı́tulo de polinomios de los cursos de primer año, que se
adjunta como apéndice enA. De ese modo, se pueden buscar valores y vectores propios de
matrices n × n con n > 3 si se saben suficientes de sus ceros. Note en especial el Ejemplo
A.2.

27
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

3.3. Diagonalización de matrices con valores propios reales


En el caso de cadenas de Markov, las potencias de una matriz eran relevantes para ver
la evolución del sistema.
Si la matriz hubiese sido “diagonal”, es decir, fuera de su diagonal sólo hubiera ceros, las
potencias habrı́an sido simples:
 
a1 1 0 · · · 0
 0 a2 2 · · · 0 
Proposición 3.4. Si la matriz An×n es diagonal, con A =  .. .. , entonces
 
.. . .
 . . . . 
0 0 · · · an n
k
 
(a1 1 ) 0 ··· 0
 0 (a2 2 )k · · · 0 
para cada k ∈ N la matriz potencia k-ésima es Ak =  .
 
.. .. .. 
 .. . . . 
0 0 · · · (an n )k

Pero también es simple si la matriz es de la forma A = P · D · P −1 para una matriz


invertible Pn×n y una matriz diagonal Dn×n :

Proposición 3.5. Dadas Dn×n y Pn×n , con P invertible, entonces para todo k ∈ N se cumple
k
P · D · P −1 = P · Dk · P −1

Demostración. Dados D, P y k como en el enunciado, se tiene


k
P · D · P −1 = P · D · P −1 · P · D · P −1 · . . . · P · D · P −1
  
| {z }
k veces
= |P · D · P −1 · P · D · {z
P −1 · . . . · P · D · P −1}
k veces
 

= P · D · In · D · . . . · In · D · P −1
| {z }
k veces
k −1
=P ·D ·P

(o mejor, por inducción)


 
2 0 0
Ejemplo 3.4. La matriz A = 1 2 −1 cumple
1 3 −2
       −1
2 0 0 1 0 0 2 0 0 1 0 0
1 2 −1 = 1 1 1 · 0 1 0  · 1 1 1
1 3 −2 1 1 3 0 0 −1 1 1 3

28
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Luego
     −1 3
1 0 0 2 0 0 1 0 0
3
A =  1 1 1 · 0
  1 0  · 1 1 1 
1 1 3 0 0 −1 1 1 3
   3  −1
1 0 0 2 0 0 1 0 0
= 1 1
 1 · 0 1
  0  · 1 1 1
1 1 3 0 0 −1 1 1 3
     −1
1 0 0 8 0 0 1 0 0
= 1 1 1 · 0 1 0  · 1 1 1
1 1 3 0 0 −1 1 1 3
     
1 0 0 8 0 0 1 0 0
= 1 1 1 · 0 1 0  · −11 3/2 −1/2
1 1 3 0 0 −1 0 −1/2 1/2
 
8 0 0
= 7 2
 −1
7 3 −2

Observación 3.1. Pero, ¿cómo saber cuales matrices, si existen, son P y D?


Veamos:
Si existen tales P y D para A, entonces A = P · D · P −1 , es decir, A · P = P · D con D
diagonal y si c1 , c2 , . . . cn son las n columnas de P y a1 1 , a2 2 . . . an n son los elementos en
la diagonal de D, entonces

A · P = A · c1 A · c2 · · · A · cn

Donde A · ci es la columna i-ésima de A · P , porque la cada columna de A · P se obtiene de


multiplicar A por la respectiva columna de P .  
d1 1 0 · · · 0
 0 d2 2 · · · 0 
Por otra parte, y por la misma razón, como D =  .. , entonces las
 
.. . . ..
 . . . . 
0 0 ··· dn n
columnas de P · D son
     
d1 1 0 0
 0  d2 2   .. 
c1 ·  ..  = d1 1 c1 , c2 ·  ..  = d2 2 c2 , ··· cn ·  .  = d n n cn ,
     
 .   .   0 
0 0 dn n

Ahora, como A · P = P · D, entonces las respectivas columnas deben coincidir, esto es:

A · c1 = d1 1 c1 , A · c2 = d2 2 c2 , ··· A · cn = d n n cn

29
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Es decir, las columnas de P deben ser vectores propios de A, con los respectivos valores
propios como los elementos de D, en el orden correspondiente.
Notemos que como P está formada por columnas que son vectores propios de A y co-
mo además P debe ser invertible, necesariamente esos n vectores propios son linealmente
independientes, es decir, son una base de Rn .
Definición 3.4 (Matriz diagonalizable). Una matriz An×n se dice “diagonalizable” ssi exis-
ten matrices Pn×n y Dn×n con P invertible y D matriz diagonal.
Proposición 3.6 (Condición para que una matriz sea diagonalizable). Una matriz An×n es
“diagonalizable” ssi posee una base formada por vectores propios.
Demostración. Ya fue probado en la Observación 3.1
Ejemplo 3.5. Continuando el Ejemplo 3.4, verifiquemos la Proposición 3.6:
 
2 0 0
1. Buscamos los valores propios de A = 1 2 −1
1 3 −2
     
λ 0 0 2 0 0 (λ − 2) 0 0
0 = det (λI3 − A) = det  0 λ 0  − 1 2 −1 = det  −1 (λ − 2) 1 
0 0 λ 1 3 −2 −1 −3 (λ + 2)
 
(λ − 2) 1
= (λ − 2) (λ − 2)(λ + 2) + 3 = (λ − 2) λ2 − 4 + 3
 
= (λ − 2) det
−3 (λ + 2)
= (λ − 2)(λ2 − 1) = (λ − 2)(λ − 1)(λ + 1)
de modo que los valores propios de A son 2, 1 y −1.
2. Determinamos ahora los vectores propios respectivos:
     
x x x
a) Para λ = 2, buscamos vectores y  ∈ R3 tales que A · cdot y  = 2 y , para
z z z
lo cual reducimos (2I3 − A):
   
0 0 0 1 0 −1
(2I3 − A) = −1 0 1 ∼ 0 1 −1
−1 −3 4 0 0 0
luego
x−z =0 y−z =0
       
x z 1 1
por lo que y  = z  = z 1, ası́ que podemos usar 1 como la primera
z z 1 1
columna de P .

30
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

     
x x x
b) Para λ = 1, buscamos vectores y  ∈ R3 tales que A · y  = y , para lo
z z z
cual reducimos (I3 − A):
   
−1 0 0 1 0 0
(I3 − A) = −1 −1
 1 ∼ 0 1 −1
−1 −3 3 0 0 0
luego

x=0 y−z =0
       
x 0 0 0
por lo que y  = z  = z 1, ası́ que podemos usar 1 como la segunda
z z 1 1
columna de P .
     
x x x
3
c) Para λ = −1, buscamos vectores y ∈ R tales que A · cdot y = − y ,
    
z z z
para lo cual reducimos (−I3 − A):
   
−3 0 0 1 0 0
(−I3 − A) = −1 −3 1 ∼ 0 1 −1/3
−1 −3 1 0 0 0
luego
z
x=0 y− =0
3
       
x 0 0 0
por lo que y  =  y  = y 1, ası́ que podemos usar 1 como la tercera
z 3y 3 3
columna de P .
   
2 0 0 1 0 0
Finalmente, D = 0 1 0
  yP = 1 1
 1, como ya sabı́amos.
0 0 −1 1 1 3
 
0
Un detalle: para la tercera columna de P se podrı́a haber usado 1/3, lo que no
1
altera a la igualdad A = P · D · P1 , como se puede verificar fácilmente.

Proposición 3.7. 1. Vectores propios correspondientes a valores propios diferentes son


linealmente independientes.

31
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

2. Si An×n tiene n valores propios distintos, entonces A es diagonalizable.


Pero no siempre hay n valores propios distintos para una matriz An×n :
 
0 1 1
Ejemplo 3.6. Diagonalizar, si es posible, la matriz A = 1 0 1
1 1 0
Solución:
1. Los valores propios se obtienen de los ceros del polinomio caracterı́stico:
   
λ −1 −1 (λ + 1) −(λ + 1) 0
0 = det −1
 λ −1 = det  −1 λ −1 
usando fila 2
−1 −1 λ 0 −(λ + 1) (λ + 1)
 
= (λ + 1) λ(λ + 1) − (λ + 1) + (λ + 1) − (λ + 1)

= (λ + 1) (λ + 1)(λ − 1) − (λ + 1) = (λ + 1)(λ + 1)(λ − 2)

Por lo que los valores propios de A son −1 (repetido dos veces, por lo que se dice que
su multiplicidad algebraica es 2) y 2 (con multiplicidad algebraica 1)

2. Determinando los vectores propios:


 
−1 −1 −1
a) Para λ = −1 la matriz del sistema homogéneo a reducir es −1 −1 −1.
−1 −1 −1
Luego:
   
−1 −1 −1 1 1 1
−1 −1 −1 ∼ 0 0 0
−1 −1 −1 0 0 0
       
x −y − z −1 −1
por lo que y  =  y  = y  1  + z  0 , de modo que hay dos
z z    0  1
−1 −1
vectores propios para λ = −1,  1  y  0 
0 1
 
2 −1 −1
b) Para λ = 2 la matriz del sistema homogéneo a reducir es −1 2 −1. Luego:
−1 −1 2
   
2 −1 −1 1 0 −1
−1 2 −1 ∼ 0 1 −1
−1 −1 2 0 0 0

32
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

     
x z 1
por lo que y  = z  = z 1, de modo que un vector propio para λ = 2 es
  z z 1
1
1.
1
   
−1 0 0 −1 −1 1
3. Luego, con D =  0 −1 0 y P =  1 0 1 se cumple A = P · D · P −1 ,
0 0 2 0 1 1
como se puede verificar.

No siempre una matriz será diagonalizable:


 
1 1
Ejemplo 3.7. La matriz A = no es diagonalizable.
0 1
Solución: Al buscar valores propios, se tiene:
 
(λ − 1) −1
0 = det = (λ − 1)2
0 (λ − 1)

por lo que el único valor


 propio
 es 1 con multiplicidad algebraica 2. En ese caso, la matriz
1 0
diagonal debiera ser , pero entonces, de ser diagonalizable, existirı́a P2×2 invertible
0 1
tal que :
     
1 1 1 0 −1 1 0
=P· · P−1 = P · P = I2 =
0 1 0 1 0 1

lo que no es cierto.
De paso, para el único valor propio λ = 1, los vectores propios son las soluciones del
sistema homogéneo de matriz (I2 − A), es decir:
 
0 −1
(I2 − A) =
0 0
     
x x 1
es decir, son los vectores = =x , de modo que no hay dos vectores propios
y 0 0
linealmente independientes, es decir, no hay una base de R2 formada por vectores propios,
lo que confirma que A no es diagonalizable, según la Proposición 3.6.


33
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Proposición 3.8. Si An×n es diagonalizable con matriz diagonal D, entonces los polinomios
caracterı́sticos de A y de D coinciden.

Recuerde que At es la transpuesta de A, es decir, la matriz que intercambia las filas de


A con sus columnas.

Proposición 3.9. An×n es diagonalizable ssi At es diagonalizable.

Algo que reduce trabajo al calcular la inversa de P :

Proposición 3.10. Si A es diagonalizable con P y D como en Definición3.4, y las columnas


de P son unitarias (de módulo 1) entonces P −1 = P t .

Una matriz cuadrada es “simétrica” si es igual a su transpuesta.

Proposición 3.11. Toda matriz simétrica de coeficientes reales es diagonalizable y sus va-
lores propios son reales.

Pronto veremos qué hacer con matrices con valores propios complejos.

34
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

3.4. Guı́a 3 Matemáticas 4.


Los ejercicios marcados con asterisco (∗) serán realizados en ayudantı́a.

Multiplicadores de Lagrange
1. Use, en cada caso, el Método de Multiplicadores de Lagrange para determinar extremos
de la función dada sujeta ala o las restricciones dadas:

a) f (x, y) = x2 − y 2 con x2 + y 2 = 1
b) f (x, y) = 2x + y con x2 + 4y 2 = 1
c) (∗) f (x, y) = xy con 9x2 + y 2 = 4
d ) f (x, y, z) = x + 3y + 5z con x2 + y 2 + z 2 = 1
e) (∗) f (x, y, z) = x − y + 3z con x2 + y 2 + 4z 2 = 4
f ) f (x, y, z) = xyz con x2 + 2y 2 + 3z 2 = 6
g) f (x, y, z) = x + 2y con x + y + z = 1 y con y 2 + z 2 = 4
h) (∗) f (x, y, z) = 3x − y − 3z con x + y − z = 0 y con x2 + 2z 2 = 1
i ) f (x, y, z) = yz + xy con xy = 1 y con y 2 + z 2 = 1

2. Use todos los modos adecuados para determinar los extremos de:

a) (∗) f (x, y) = 2x2 + 3y 2 − 4x − 5 con x2 + y 2 ≤ 16


b) f (x, y) = e−xy con x2 + 4y 2 ≤ 1

Valores y vectores propios, diagonalización


Determine los valores y vectores propios de la matriz, en cada caso, y luego determine si
la matriz es diagonalizable y, de serlo, encuentre las matrices P y D:
     
3 1 2 −4 3 −2
1. 3. 5.
5 −1 −1 −1 2 −2
     
1 2 2 1 1 3
2. 4. 6. (∗)
3 2 4 −1 3 4
   
2 0 0 7 0 −4
7. (∗) 1 2 −1. 2 es un valor propio. 9. 0 5 0 , 5 es un valor propio.
1 3 −2 5 0 −2
 
0 1 1
8. 1 0 1, 2 es un valor propio
1 1 0

35
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

4. Números Complejos
La ecuación x2 + 1 = 0, no tiene solución en R. Construiremos un cuerpo C que contenga
las soluciones de dicha ecuación y que respete las propiedades de la suma y multiplicación
operaciones de R. Sean i y −i dichas soluciones. Queremos que ai = ia, a(bi) = abi. para
todos a, b ∈ R. Dado z = a + bi, a se llama la parte real de z y se anota Re(z) y b se
llama la parte imaginaria de z y se anota Im(z), notando que la parte imaginaria es el
número real que multiplica a i. Se cumple

a + ib = c + id ⇐⇒ a = c ∧ b = d.

Por ello, todo complejo z = a + bi (forma algebraica o cartesiana) se escribe también como
el par ordenado z = (a, b), lo que permite su graficación en un plano coordenado con eje
horizontal con partes reales y eje vertical con partes imaginarias.
Definición 4.1. Definimos en C:
Suma de complejos: si (a + bi) ∈ C y (c + di) ∈ C, definimos su suma por

(a + bi) + (c + di) = (a + c) + (b + d)i

Producto de complejos: si (a + bi) ∈ C y (c + di) ∈ C, definimos su producto por

(a + bi) · (c + di) = (ac − bd) + (ad + bc)i

Observación 4.1. Como queremos que la suma y el producto se comporten en general como
en R, salvo que el elemento nuevo, i, cumpla i2 = −1, entonces la suma se comporta igual
que “agrupar términos semejantes”, considerando que i no es “semejante” a ningún número
real, y la multiplicación sigue la distributividad, agrupación de términos semejantes, y la
propiedad básica de i:

(a + bi) · (c + di) = a(c + di) + bi(c + di) = ac + adi + bci + bidi = ac + adi + bci + bdi2
= ac + (ad + bc)i − bd = (ad − bc) + (ad + bc)i

La suma es asociativa, conmutativa, existe neutro: 0 + 0i, opuesto −(a + bi) = −a − bi. El
producto es asociativo, conmutativo, existe elemento uno: 1 + 0i, inverso de z = a + bi 6= 0
a − bi
es z −1 = 2 (verifique multiplicando).
a + b2
Definición 4.2. Para cada z = a + bi ∈ C, se definen
el conjugado de z como el complejo z = a − bi, y

el módulo de z como el número real no negativo |z| = a2 + b 2 .
Proposición 4.1. 1. |z| ≥ 0, |z| = 0 ⇐⇒ z = 0.

36
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

2. |z|2 = zz.
3. z = z, z + z = 2Re(z), Re(z) ≤ |z|.
4. z + z 0 = z + z 0 , |z| = |z|
5. zz 0 = zz 0 , |zz 0 | = |z||z 0 |,
6. |z + z 0 | ≤ |z| + |z 0 |.
z
Proposición 4.2. Si z 6= 0, entonces z −1 = .
|z|2
3 − 2i
Ejemplo 4.1. Escriba en la forma cartesiana a + bi el complejo .
4 + 5i
Solución: Como queremos que a, b ∈ R, debemos usar la propiedad de que |z| > 0 si
|z| =
6 0 para z = 4 + 5i. Tenemos ası́ que
3 − 2i 3 − 2i 4 − 5i 12 − 8i − 15i + 10i2 2 − 23i 2 23
= · = = = − i
4 + 5i 4 + 5i 4 − 5i 16 + 25 41 41 41
2 23 3 − 2i
Luego − i es la forma cartesiana de . 
41 41 4 + 5i

4.1. Forma polar o trigonométrica de un número complejo:


Sea z = a + bi ∈ C, con z 6= 0. Como z se puede interpretar como un punto en un
plano cartesiano, sea α el ángulo que forma el semieje positivo de las X con la recta que une
(0, 0) con (a, b) medido en sentido contrario a los punteros del reloj, como en trigonometrı́a
y vectores.
a a b b
Luego cos(α) = √ = , y sen(α) = √ = , es decir,
2
a +b 2 |z| 2
a +b 2 |z|

a = |z| cos(α) b = |z| sen(α)

Definición 4.3 (Forma polar de un complejo). La “forma polar” o trigonométrica de z es

z = |z| (cos(α) + i sen(α))

donde α es un ángulo medido en sentido antihorario respecto del semieje positivo horizontal
tal que

a = |z| cos(α) b = |z| sen(α)

el ángulo α se llama el “argumento de z” y se anota arg(z) si α ∈ [0, 2π[.


Si z = 0, su forma polar es z = 0 · (cos(α) + i sen(α)) para cualquier α ∈ R.
Se abrevia (de modo matemáticamente correcto) a |z| (cos(α) + i sen(α)) como |z| · eiα .

37
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile


Ejemplo 4.2. Encuentre la forma polar del complejo z = 1 − 3i.

√ q √ 3
Solución: Sea z = 1 − 3i. Entonces |z| = 1 + (− 3) = 2. Además sen(α) = − √ ,
2 2
2
1 π
y cos(α) = √ y α está en el cuarto cuadrante, ası́ que podrı́amos usar α = − , pero
2 3
π 5π √
por periodicidad, mejor usamos 2π − = . Luego la forma polar de z = 1 − 3i es
     3 3
5π 5π 5π
z = 2 cos + i sen = 2 · ei 3 . 
3 3

Proposición 4.3. Para todos z = |z| · eiα ∈ C, y w = |w| · eβ ∈ C. Entonces

1. z · w = |z| · |w| · ei(α+β)

2. z −1 = |z|−1 · e−α si z 6= 0
z |z| i(α−β)
3. = ·e si w 6= 0
w |w|
z
Ejemplo 4.3. Escriba en la forma cartesiana a + bi el complejo , donde z = 4 · ei5π/12 y
w
1 π/4
w = ·e .
2
π π
Solución: Sean α = 5 , y β = . Luego
12 4
z |z| i(α−β) 4 i(5π/12−π/4)
= ·e = 1 ·e
w |w| 2
√ !
 π   π  3 1 √
= 8 · eiπ/6 = 8 cos + i sen =8 + i = 4 3 + 4i
6 6 2 2

4.2. Potencias de números complejos.


Teorema 4.1 (Teorema de de Moivre). Sea z = |z| · eiα ∈ C, entonces para cada n ∈ Z se
cumple

z n = |z|n · einα

Demostración. Inducción sobre n si n ∈ N, y la Propiedad4.3(2) si n ∈ Z.

Ejemplo 4.4. Probar que para cada para de enteros n, k ∈ Z:

38
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

1. z n · z k = z n+k

2. i3 = −i, i4 = 1, y i4k+n = in
Solución:
1. Considerando la forma polar y la Proposición4.1:

z n = |z|n · einα
z k = |z|k · eikα

por lo cual

z n · z k = |z|n · einα · |z|k · eikα = |z|n+k · einα+ikα = |z|n+k · eiα(n+k) = z n+k


 

2. De ejercicio.


4.3. Polinomios y números complejos


Note que si f (x) ∈ R[x], puede que f (x) no tenga raı́ces reales, como por ejemplo,
f (x) = x2 + 1 ∈ R[x].
Podemos considerar polinomios de coeficientes complejos C[x], y como R ⊂ C (todo
real es un complejo, pero hay complejos no reales), también consideramos R[x] ⊂ C[x]
(todo polinomio de coeficientes relaes es un polinomio de coeficientes complejos, pero hay
polinomios de coeficientes complejos no reales).
Como C es un cuerpo, casi todo lo que sabı́amos sobre polinomios en R[x] sigue siendo
válido en C[x], sobre operaciones, grado, coefiente principal, división de polinomios, raı́ces y
factores, y multiplicidad. Vea Apéndice A.
Veamos algunas consecuencias importantes de trabajar en C[x] y cómo influye en R[x]:
Teorema 4.2. Teorema Fundamental del Algebra. Si p(x) ∈ C[x] (en particular, si
p(x) ∈ R[x]) es un polinomio de grado positivo, entonces p(x) tiene a lo menos una raı́z en
C.
Proposición 4.4. 1. Todo polinomio de grado positivo y de coeficientes reales o complejos
tiene tantas raı́ces reales o complejas como sea su grado, sean distintas o no.

2. Todo polinomio de grado n > 0 y de coeficientes reales o complejos se escribe en C[x]


como an (x−α1 )(x−α2 ) · · · (x−αn ) donde an es su coeficciente principal y α1 , . . . , αn ∈
C son sus raı́ces.

3. Todo polinomio de grado positivo y de coeficientes reales, que tenga una raı́z compleja
no real, tiene al conjugado de tal raı́z como otra de sus raices.

39
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

4. Si z = a + bi ∈ C con b 6= 0 (complejo no real) entonces (x − z)(x − z) = (x − a)2 + b2 ∈


R[x] que es polinomio cuadrático de coeficientes reales pero sin raı́ces reales (aunque
(x − z) ∈ C[x] y (x − z) ∈/ R[x]).

5. Todo polinomio de grado n > 0 y de coeficientes reales, que tenga alguna raı́z compleja,
se escribe en R[x] como

an (x − β1 ) · · · (x − βk ) · (x − a1 )2 + (b1 )2 · · · (x − ah )2 + (bh )2
 

donde an es su coeficiente principal y β1 , . . . , βk son sus raı́ces reales, y donde sus raı́ces
complejas no reales, en pares conjugados, son (a1 + i · b1 ), . . . , (ah + i · bh ). Además
n = k + 2h.

40
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

4.4. Guı́a 4 Matemáticas 4.


Los ejercicios marcados con asterisco (∗) serán realizados en ayudantı́a.

Números complejos
1. Describa con un dibujo los siguiente conjuntos:

a) (∗) A = {z ∈ C | |z − 2 − i| = 2}
b) B = {z ∈ C | 1 ≤ |z| ≤ 2}
c) C = {z ∈ C | Re(z) + Im(z) = 5}
1
d ) D = {z ∈ C | ≤ |z| ≤ 4, Im(z) ≥ 0}
10
e) E = {z ∈ C | |z − c| + |z + c| = 2a, c < a} para a, c ∈ R
f ) F = {z ∈ C | |z| ≤ 1}
1
g) (∗) G = {z ∈ C | ∈ F }, donde F es el conjunto descrito en ı́tem anterior.
z
2. Escriba en la forma a + bi los siguientes números complejos.

−1 + i −3 − 3i
a) (∗) √ c)
3+i 1−i
√ √
−1 − i 2 + 2i
b) √ d) √
3−i 3 + 2i

3. Calcule el módulo de los siguientes complejos:



−1 + 5i (−3 − 3i)
a) √ c) (∗) · (4 + 9i)
3 + 7i 1−i
√ √ √
− 2−i 2 + 2i −11 + 18i
b) √ d) √ · √
3 − 4i 3 + 2i 3 + 5i

4. Describa con un dibujo los siguiente conjuntos:

a) (∗) A = {z ∈ C | |z − 5 − 2i| = 3} b) B = {z ∈ C | 1 ≤ |z − 3| ≤ 2}

5. Escriba en la forma trigonómetrica o polar los siguientes números complejos:



−1 + i −1 − i c) (− 3 − i)(1 − i)
a) (∗) √ b) √
3+i 3−i

6. . Utilize la fórmula de De Moivre para calcular la potencia indicada. Expresar el resul-


tado en coordenadas cartesianas.

41
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile


a) (1 + i)5 f ) 4(1 − 3i)3
b) (∗) (2 + 2i)6     10
5π 5π
c) (−1 + i)10 g) (∗) cos + i sen
4 4
d ) (1 − i)12
√   π   π 8
e) 2( 3 + i)7 h) 2 cos + i sen .
2 2

7. Calcule las raı́ces que se especifican, represéntelas en el plano complejo, y exprese cada
una de las raı́ces en forma cartesiana.
4π 5π
a) (∗) Raı́ces cuadradas de 5 · ei 6 d ) Raı́ces quintas de 32 · ei 6
π 125 √
b) Raı́ces cuadradas de 16 · ei 3 e) Raı́ces cúbicas de − (1 + 3i)
2
4π √
c) (∗) Raı́ces cuartas de 16 · ei 3 f ) Raı́ces cúbicas de −4 2(1 − i).

8. Hallar todas las soluciones de las siguientes ecuaciones.

a) x4 − 1 = 0 c) x3 + 1 = 0 e) x4 − 81 = 0
b) (∗) x4 + 1 = 0 d ) x5 + 243 = 0 f ) x3 + 64i = 0
√ √ !1/3
2 2
9. Encuentre todos los números complejos que satisfacen la ecuación z+2i = − + i .
2 2

Polinomios y complejos
1. (∗) Determine un polinomio p ∈ R[x] de grado 3 que cumpla p(0) = 2, p(1) = p(−i) =
0. Muestre que es p es el único que cumple lo pedido.

2. Determine un polinomio p ∈ C[x] de grado a lo más 3 que cumple p(0) = 1, p(1) = 0,


p(i − 1) = 4 y p(2) = 1 + i. Muestre que es único.

3. Demuestre que no existen polinomios en R[x] que tengan exactamente a 1, 2 e i por


raı́ces.

4. (∗) Si (1 + 2i) es raı́z del polinomio p(x) = x3 + 2x2 − 3x + 20, encuentre todas las
demás raı́ces y factorice totalmente a p(x).

5. Determine todas las raı́ces del polinomio p(x) = 2x5 + x4 + 10x3 + 5x2 + 8x + 4 si tanto
i como −2i son raı́ces de él.

6. Determine todos los polinomios de grado 4 en R[x] que tengan a 1 + i como raı́z de
multiplicidad 2.

42
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

7. (∗) Factorice completamente a x4 − 5x3 + 4x2 + 3x + 9 en C y luego en R. Recuerde


el teorema sobre raı́ces racionales...

8. Determine todas las raı́ces racionales de:

a) 3x4 − 10x3 − 3x2 + 8x − 2 1 3 1 2 1


b) x + x −
3 3 9

9. (∗) Factorice completamente,


√ primero en C[x] y luego en R[x], al polinomio x4 +7x2 −8
sabiendo que −2i 2 es una de sus raı́ces.

10. Descomponga totalmente el polinomio x5 − x en C[x] y en R[x].

11. Determine un polinomio de coeficientes reales que sea mónico de grado 5 y tenga a 2
por raı́z de multiplicidad 3 y tenga a 1 + 2i como raı́z de multiplicidad 1. Demuestre
que el polinomio obtenido es único.

12. Encuentre todas las raı́ces de

x4 − 4x3 + x2 + 12x − 12

13. Determine un polinomio de √ coeficientes reales, de grado 4, que tenga a 2 como raı́z de
1 3
multiplicidad 2 y a − + i como raı́z de multiplicidad 1, y que evaluado en 0 resulte
2 2
9.

43
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

4.5. Diagonalización y números complejos


Si una matriz de coeficientes reales tiene valores propios complejos, no se pueden encontrar
vectores propios en Rn para ellos, ası́ que, como en polinomios, hay que subir a Cn , es decir,
a n-tuplas de complejos, notando que Rn ⊂ Cn , dado que R ⊂ C.
Hay que notar que, al igual que Rn como e.v. sobre R (los escalares son reales) entonces
Cn es e.v. sobre C (los escalares son complejos, lo que incluye el que sean reales), con suma
coordenada a coordenada y ponderando por escalar a cada coordenada.
1. El conjunto (1, 0), (0, 1) es la base canónica de C2 , ya que si (z, w) ∈

Ejemplo 4.5.
C2 (es decir, z ∈ C y w ∈ C), entonces (z, w) = z(1, 0) + w(0, 1), por lo que genera
C2 , y si (0, 0) = z(1, 0) + w(0, 1), entonces (0, 0) = (z, w), es decir, ambos escalares
complejos son nulos, z = w = 0, por lo que es l.i.

2. El conjunto (1, 2 + i) (3 − i, i) también es base, lo que puede verificar de modo directo
o viendo que el vector (1, 2 + i) no es un ponderado (por un complejo) de (3 − i, i)
(siguen valiendo casi todas las propiedades de dimensión, l.i., l.d., generador y base)
También consideramos matrices con coeficientes complejos, llamadas obviamente matrices
complejas, con las operaciones habituales, a las que se agregan la conjugación de una matriz
(es decir, se conjuga cada uno de sus coeficientes), lo que denotamos por A para una matriz
compleja A. Recuerde que toda matriz real es también matriz compleja.
Determinante, inversa, operaciones fila, todo ello funciona igual que en el caso real.
Como antes, los vectores de Cn los podemos ver también como matrices columna (o fila),
por lo que las operaciones matriciales se replican en vectores.
A la transpuesta de una matriz, ahora se agrega una operación compuesta, la transpuesta
conjugada, que será útil:
t
Definición 4.4. Si An×m es matriz compleja, su transpuesta conjugada es A∗ = A
Ejemplo 4.6.
 
 ∗ 3 −2i
3 1−i 2+i
= 1 + i 5 − 2i
2i 5 + 2i −i
2−i i

Proposición 4.5. Sean A y B matrices complejas. Entonces:


1. Si A es matriz real, entonces A = A y A∗ = At .

2. A = A.

3. (A∗ )∗ = A.

4. Si A + B está bien definida, entonces (A + B) = A + B y (A + B)∗ = A∗ + B ∗ .

5. Si A · B está bien definida, entonces (A · B) = A · B y (A · B)∗ = A∗ · B ∗ .

44
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

6. Si λ ∈ C, entonces (λA) = λA y (λA)∗ = λA∗


Diagonalicemos una matriz real con valores propios complejos:
 
2 3
Ejemplo 4.7. Diagonalizar A =
−3 2
Solución:
1. Valores propios:
 
(λ − 2) −3
0 = det(λI − A) = = (λ − 2)2 + 9 = (λ − 2 − 3)(λ − 2 + 3)
3 (λ − 2)
por lo que sus valores propios son λ1 = 2 + 3i y λ2 = 2 − 3i
2. Vectores propios de λ1 = 2 + 3i.
Un vector propio de A para λ1 es un vector (z, w) ∈ C2 no nulo que es solución del
sistema
     
(λ1 − 2) −3 z 0
· =
3 (λ1 − 2) w 0
 
(λ1 − 2) −3
y para determinar los vectores propios, reducimos la matriz :
3 (λ1 − 2)
     
(2 + 3i − 2) −3 3i −3 3i −3
= ∼
3 (2 + 3i − 2) 3 3i f2 + i · f1 0 0
de modo que (z, w) cumple 3i · z − 3w = 0, es decir, w = i · z, por lo que (z, w) = z(1, i).
Luego, los valores propios de λ1 son generados por (1, i).
Verificando (opcional):
           
2 3 1 2 + 3i 2 + 3i 2 + 3i 1
· = = = = (2 + 3i)
−3 2 i −3 + 2i i(3i + 2) i(2 + 3i) i
 
(λ2 − 2) −3
3. Para determinar los vectores propios de λ2 , reducimos la matriz :
3 (λ2 − 2)
     
(2 − 3i − 2) −3 −3i −3 −3i −3
= ∼
3 (2 − 3i − 2) 3 −3i f2 + i · f1 0 0
de modo que (z, w) cumple −3i · z − 3w = 0, es decir, w = −i · z, por lo que (z, w) =
z(1, −i). Luego, los valores propios de λ1 son generados por (1, −i).
Verificando (opcional):
           
2 3 1 2 − 3i 2 − 3i 2 − 3i 1
· = = = = (2 − 3i)
−3 2 −i −3 − 2i −i(−3i + 2) −i(2 − 3i) −i

45
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

   
2 + 3i 0 1 1
4. Postulamos las matrices D = y P = para que cumplan
0 2 − 3i i −i
A = P · D · P −1 . Para verificar, necesitamos P −1 , y su cálculo usa el mismo método ya
conocido de reducir la matriz ampliada con la identidad :
   
 1 1 | 1 0 1 1 | 1 0
P |I = ∼ i
i −i | 0 1 f2 − if1 0 −2i | −i 1 f2
  2
1 i
1 1 | 1 0 f 1 − f 2 1 0 | 2 − 2 
!
 = I | P −1

∼ 1 i ∼
0 1 |  1 i 
2 2 0 1 |
2 2
 
1 i
−1
2 −2
por lo que P =  1 i 

2 2
5. Verificando:
 
1 i
2 −2
   
1 1 2 + 3i 0
P · D · P −1 = · · 
i −i 0 2 − 3i 1 i 

  2 2
1 i
  −   
2 + 3i 2 − 3i  2 2 2 3
= · = =A
−3 + 2i −3 − 2i  1 i  −3 2
2 2

Recordemos que habı́a una forma simple de evitar el cálculo de P −1 , que era transponer
P si en sus columnas eran vectores propios unitarios.
En el caso de vectores y matrices complejas, es similar, pero conjugando adecuadamente:
p
Definición 4.5. 1. La norma estándar en C2 es ||(z1 , z2 )|| = h(z1 , z2 ), (z1 , z2 )i para
z, w ∈ C, donde el producto interno canónico 1 h(z1 , z2 ) (w1 , w2 )i se define por
 
 w1
h(z1 , z2 ) (w1 , w2 )i = z1 z2 ·
w2
1
El producto interno generaliza al producto punto.

46
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

p
2. La norma estándar en Cn es ||(z1 , · · · , zn )|| = h(z1 , · · · , zn ), (z1 , · · · , zn )i para z, w ∈
C, donde el producto interno canónico h(z1 , · · · , zn ), (w1 , · · · , wn )i se define por
 
w
  .1 
h(z1 , · · · , zn ), (w1 , · · · , wn )i = z1 · · · zn ·  .. 
wn

Note que considerando a los vectores de Cn como matrices fila, se cumple hA, Bi = A·B ∗ ,
por lo que la transpuesta conjugada cumple su papel.
Ejemplo 4.8. La norma de (1 + i, 2 + 3i) es
v  
u
p u  1 + i
||(1 + i, 2 + 3i)|| = h(1 + i, 2 + 3i), (1 + i, 2 + 3i)i = t 1 + i 2 + 3i · 
u 
2 + 3i
q p
= (1 + i)(1 + i) + (2 + 3i)(2 + 3i) = |1 + i|2 + |2 + 3i|2
√ √
= 2 + 13 = 15
Proposición 4.6. Si A, B y C son vectores (matrices) de Cn y z ∈ C, entonces se cumplen:
1. hA + B, Ci = hA, Ci + hB, Ci y hA, B + Ci = hA, Bi + hA, Ci
2. hzA, Bi = zhA, Bi y hA, zBi = zhA, Bi
3. hA Bi = hB, Ai
4. hA, Ai ≥ 0, y hA, Ai = 0 ssi A = ~0
5. ||A|| ≥ 0, y ||A|| = 0 ssi A = ~0
6. ||zA|| = |z| · ||A||
Proposición 4.7. Si A es diagonalizable y la matriz P está formada por vectores propios
unitarios en el orden adecuado para la matriz diagonal D con los valores propios en la
diagonal, entonces A = P · D · P ∗
Definición 4.6. Se dice que una matriz A es Hermı́tica (o de Hermite) si A∗ = A.
Una propiedad útil para quienes toman cursos del tipo de Fisicoquı́mica, es:
Proposición 4.8. Una matriz compleja H es hermı́tica ssi hH · Z, W i = hZ, HW i
Proposición 4.9. Si H es matriz hermı́tica, entonces
1. Los valores propios de H son reales.
2. Vectores propios correspondientes a valores propios distintos son ortogonales, es decir,
su producto interno canónico es nulo.

47
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

5. Ecuaciones diferenciales
5.1. Ecuaciones diferenciales ordinarias de primer orden
Definición 5.1. Son ecuaciones que buscan por solución a funciones, y la ecuación a cumplir
vincula a la función, su variable, y la derivada de la función respecto de dicha variable. Se
dy
escriben de modo abreviado como = H(x, y) donde H(x, y) es una expresión (en realidad
dx
es una función en dos variables) y donde se espera que y sea función derivable de x, lo que se
denota y = y(x) dado que no se conoce a la función y, pero se quiere indicar que es función
de x.

Observación 5.1. Las integrales indefinidas son un caso simple de este tipo de EDO ya que
Z
dy
g(x) dx = y(x) + C ssi = g(x) y se tendrı́a H(x, y) = g(x)
dx
Observación 5.2. Una ecuación diferencial de primer orden tiene infinitas soluciones. Pero
si imponemos una condición inicial, entonces la solución es única. Se habla de un problema
de valores iniciales o problema de Cauchy.
Escribiremos un problema de Cauchy como

 dy
= H(x, y)
dx
y(x ) = y
0 0

donde x0 pertenece a algún intervalo en el que la EDO y sus soluciones tengan sentido,
y para y0 arbitrario.

Ejemplo 5.1. Escriba la situación siguiente como un problema de Cauchy y resuélvalo:


dy
Encuentre la única solución y(x) de la ecuación diferencial = 2x + x2 sujeta a la
dx
condición inicial y(0) = 1.

Solución: El problema de Cauchy indicado es



 dy
= 2x + x2
dx
y(0) = 1

y para resolverlo notamos que la EDO es simplemente una expresión para primitivas de
2x + x2 , es decir,
Z Z
y(x) = (2 + x )dx = (ex ln(2) + x2 )dx
x 2

2x x3
= + + k, k ∈ R
ln(2) 3

48
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

20 03 1
Entonces para k ∈ R se debe tener 1 = y(0) = + +k = + k, es decir,
ln(2) 3 ln(2)
1
k =1− , por lo que la solución es
ln(2)

2x x3 1
y(x) = + +1−
ln(2) 3 ln(2)


Definición 5.2. 1. Diremos que una ecuación diferencial de primer orden es lineal si se
puede escribir como:
dy
= g(x)y + h(x),
dx
donde g y h son funciones que dependen sólo de la variable independiente x.

2. Diremos que una ecuación diferencial lineal de primer orden es homogénea si la pode-
dy
mos escribir como: = g(x)y
dx
Observación 5.3. Note que una EDO lineal homogénea siempre admite como solución a la
función constante de valor 0.

Las ecuaciones diferenciales se usan para describir modelos matemáticos de situaciones


reales. Antes de resolver ecuaciones diferenciales veremos algunos ejemplos.

5.1.1. Ejemplos de Ecuaciones lineales homogéneas


Ejemplo 5.2. Decaimiento radioactivo Se considera una muestra de material que tiene
N (t) átomos de un isótopo radiactivo en el momento t. Se ha observado que una fracción
constante de estos átomos radioactivos decae espontáneamente durante cada unidad de tiem-
po en proporci’on a la cantidad N (t). Para conseguir un modelo para N (t) se usa la ecuación
dN
diferencial = −k · N , donde k > 0 es una constate positiva, y el signo negativo indica
dt
explı́tamente que N decrece al aumentar t. Si N0 es el número de átomos radioactivos pre-
sentes en la muestra en un instante t0 , se tiene que la evolución del proceso es descrita por
el problema de Cauchy: 
 dN
= −k · N
dt
N (t ) = N > 0
0 0

donde asumimos que N > 0 dado el contexto. Note que el tiempo t se puede medir de forma
relativa, esto es, podemos asumir que t = 0 es el instante en que se comienza a observar la
desintegración, por ejemplo, u otro instante arbitrario pero fijo para el modelo.

49
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Ejemplo 5.3. Crecimiento exponencial Sea P (t) > 0 el tamaño de una población en un
instante t (medido en años) con tasa de natalidad β y tasa de mortandad δ, ambas constantes
en este modelo. Se tiene que la razón de cambio con respecto al tiempo es proporcional al
tamaño de la población, es decir, su crecimiento está descrito por la ecuación diferencial:
dP
= k · P , donde k = β − δ > 0 es la tasa de crecimiento anual. Si P0 es la biomasa
dt
bacteriana inicial al iniciarse el proceso de crecimiento (o algún instante predeterminado
pero fijo), se tiene que la evolución del proceso es descrita por el problema de Cauchy:

 dP
=k·P
dt
P (0) = P > 0
0

Acá asumimos que k > 0 porque se trata de crecimiento, pero usamos −k cuando se trata
de decrecimiento (mantenemos en esta sección k > 0 para explicitar crecimiento o decreci-
miento).

Ejemplo 5.4. Eliminación de medicamentos Suponga que se sabe que la cantidad A(t) >
de cierto medicamento en la corriente sanguı́nea, medido por el exceso sobre el nivel natural
de la misma, disminuye a una razón de cambio proporcional a la cantidad excedente actual.
dA
Esto es, = −kA donde k > 0 se denomina constante de eliminación del medicamento.
dt
Si A0 es la cantidad inicial (tiempo relativo a ese instante) de medicamento, se tiene que la
evolución del proceso es descrita por el problema de Cauchy:

 dA
= −k · A
dt
A(0) = A > 0
0

Ejemplo 5.5 (Un caso de EDO lineal no homogénea). Ley de enfriamiento de Newton
Consideremos el cambio de temperatura de un objeto que se enfrı́a. La ley de enfrı́amiento de
Newton considera que la velocidad del cambio de temperatura es directamente proporcional
a la diferencia de temperatura del objeto y del medio que lo rodea. Además, se supone que el
medio que rodea al cuerpo tiene una temperatura constante Ta .
La ley de enfrı́amiento de Newton afirma que la función que asigna la temperatura T (t)
de un objeto en el tiempo t es solución del problema de Cauchy:

 dT
= −k(T − Ta )
dt
T (0) = T
0

donde k > 0 es un coeficiente de conductividad térmico que depende de cada objeto y T0 es


la temperatura inicial del objeto.

50
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

5.1.2. El método de separación de variables para resolver algunas EDO


Definición 5.3. Una EDO se dice de variables separables si se puede escribir de la forma
dy
= g(x) · h(y)
dx
dy
Proposición 5.1. Una EDO separable = g(x) · h(y) se puede resolver por medio de
dx
Z Z
1
dy = g(x)dx
h(y)
dy 1 dy
Demostración. Note que = g(x) · h(y) ssi = g(x) y como además y es (o debe
dx h(y) dx
ser) función de x entonces
Z Z
1 dy
g(x) dx = dx
h(y) dx
!!
u = y(x)
pero realizando un cambio de variable dy
∴ du = y 0 dx = dx
Z dx
1
= du
h(u)
 1 
que entrega funciones que, al derivar respecto de u, dan ,
 h(u) 
 1 
lo que equivale a que al derivar respecto de y den
h(y)
Z
1
= dy
h(y)

Ejemplo 5.6. Un cultivo de bacterias Streptococcus A recién inoculadas (un grupo común
de microorganismos que causa inflamación séptica en la garganta) contiene 100 células. Al
revisar el cultivo 60 minutos después, se determina que hay 450 células.
1. Determine el número de células presentes en cualquier tiempo t (medido en minutos),
suponiendo que el crecimiento es exponencial.

2. ¿Cúal es el tiempo de duplicación de esta bacteria? (el tiempo de duplicación es el


tiempo que se requiere para que el número de células se duplique).
Solución:
dP
1. Crecimiento exponencial significa que = kP (t), k > 0, donde P (t) es el número
dt
de células en el instante t. Se trata de una EDO de variables separables, y se tiene

51
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Z Z
dP
= k dt, es decir, ln(|P (t)|) = kt + C, para algún C ∈ R. Por otra parte, el
P
contexto indica que P (t) > 0, por lo cual |P (t)| = P (t), es decir, ln(P (t)) = kt + C.
Pero considerando t = 0 como el momento de la inoculación, se sabe que ln(100) =
0 + C, es decir, C = ln(100), de donde P (t) = ekt+ln(100) = 100ekt .
Pero también sabemos que P (60) = 450, es decir, 450 = 100ek60 4, 5 = e60k de donde
ln(4, 5)
k= > 0.
60
ln(4,5)
t
Por lo tanto P (t) = 100e 60 o mejor
p
60
t
P (t) = 100 4, 5

2. Sean t, τ ∈ R. Entonces P (t) se duplica al transcurrir un tiempo τ ssi P (t+τ ) = 2P (t),


p (t+τ ) p t p t p τ
es decir, 100 60 4, 5 = 2 · 100 60 4, 5 , que equivale a 100 60 4, 5 · 60 4, 5 =
p t p τ
2 · 100 60 4, 5 y como la exponencial no es cero, simplificando se obtiene 60 4, 5 =
60 ln(2)
2, y ası́ τ = ∼ 27, 65. De paso, eso significa que el tiempo de duplicación
ln(4, 5)
es invariante, no depende del instante t a partir del cual quiero que se duplique la
población.
Luego el tiempo de duplicación para este cultivo de Streptococcus A es cerca de 28
minutos.


Ejemplo 5.7 (Ley de enfriamiento de Newton en medidas anglosajonas). Una taza de


café instantáneo recién servida tiene una temperatura de 180o F . Después de dos minutos
de permanecer en una sala a 70o F , el café se enfrı́a hasta 165o F .

1. Determine la función solución.

2. ¿En qué tiempo t el café llega a una temperatura de 120o F .?

Solución:
1. Es un problema de la ley de enfriamiento de Newton, en que la temperatura ambiente
(se asume constante) es Ta = 70◦ F y efectivamente el café se enfrı́a, es decir, se tiene
T (t) > 70, en cada instante t medido en minutos desde que se sirvió la taza de café,
por lo que se requiere de una constante k > 0 con la cual se cumpla el problema de
Cauchy 
 dT
= −k(T − 70)
dt
T (0) = 180

52
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

y adicionalmente se sabe que T (2) = 165◦ .


Z Z
dT
Como la EDO es de variables separables, entonces = −k dt, es decir,
T − 70
ln(T − 70) = C − kt, C ∈ R o mejor,

T (t) = 70 + eC e−kt

Pero 180 = T (0) = 70 + eC e0 de donde eC = 110 y por tanto T (t) = 70 + 110ekt para
todo t ∈ R.
  r 
2k 1 95 95
Además 165 = T (2) = 70 + 110e de donde k = ln = ln . Luego
2 110 110
√ 95 
t·ln
T (t) = 70 + 110 · e 110

o mejor
r t
95
T (t) = 70 + 110 , para cada t ∈ R
110
2. Sea t ∈ R. Entonces
r t
95
120 = T (t) = 70 + 110
110
50

ln 110
⇔t= q  ∼ 10, 76
95
ln 110

Ejemplo 5.8. Se llama vida media τ de un isótopo al tiempo que se requiere para
que la mitad de la cantidad inicial se desintegre en otros elementos, es decir τ = t cuando
1 ln(2)
N (t) = N (0). Pruebe que τ = .
2 k
Observación 5.4. Recordemos que en los ejemplos (5.2), (5.3) y (5.4) tenı́amos una ecua-
ción del tipo:
dy
= −ky, con k > 0 e y > 0
dt
y aplicando el método de separación de variables tenemos
Z Z
dy
= −k dt
y
como y > 0,
ln(|y|) = ln(y) = −kt + C

53
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

para algún C ∈ R. Por lo tanto,

y(t) = e−kt+C = e−kt · eC = eC · e−kt

Para t = 0 se obtiene y(0) = eC y la solución de la ecuación resulta ser

y(t) = y(0)e−kt .

Ejemplo 5.9 (Ley de enfriamiento de Newton). Recordemos dicha ley.

dT
= −k(T − Ta ), k > 0
dt
Rescribamosla como
1
dT = −kdt
T − Ta
Como se trata de enfriamiento se tiene que T (t) > Ta ,
Z Z
1
dT = −kdt
T − Ta
Luego
ln(|T − Ta |) = ln(T − Ta ) = −kt + C

T (t) − Ta = ekt+C = e−kt · eC


Para t = 0 se tiene eC = T (0) − Ta , luego,

T (t) = Ta + e−kt (T (0) − Ta )

Notemos que
lı́m T (t) = Ta ,
t→+∞

es decir, a medida que transcurre el tiempo, la temperatura del objeto converge a la tem-
peratura del medio que lo rodea. La rapidez de dicha convergencia depende el coeficente de
conductividad térmica k.

Ejemplo 5.10. Recordemos la Ecuación logı́stica,que se presentó al inicio del curso de


Matemáticas I, que indica cómo crece una población sujeta a restricciones externas de espacio
o alimento. Inicialmente crece exponencialmente y luego se va frenando hasta llegar a un
lı́mite. Pero la ecuación que establece el modelo indica que la rapidez de crecimiento en cada
instante t es proporcional al tamaño actual de la población P y proporcional a la diferencia
entre el tamaño máximo M y la población actual, es decir, el crecimiento está descrito por
la ecuación diferencial:
dP
= kP (M − P ), k > 0
dt

54
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

donde k es la velocidad de crecimiento de la población (sin contar la limitación externa


M ). Si P (0) es la población inicial la evolución del proceso está descrita por el problema de
Cauchy:
dP
(
= kP (M − P )
dt
P (0) = P0 > 0.
Supongamos que M > P. Para aplicar el método de separación de variable usemos
1
dP = kdt.
P (M − P )
Por método de fracciones parciales
 
1 1 1 1
= +
P (M − P ) M P M −P
Luego Z   Z
1 1 1
+ dP = kdt
M P M −P
Como P > 0 y M − P > 0 se tiene que
  Z
1
ln(P ) − ln(M − P ) = kdt
M
Es decir,  
P
ln = kM t + C
M −P
De donde
P
= ekM t+C = ekM t · eC
M −P
P0
Usando la condición inicial P (0) = P0 , obtenemos que eC = luego
M − P0
P P0 ekM t
=
M −P M − P0
Finalmente la función solución es
M P0
P (t) =
P0 + (M − P0 )e−kM t
Notemos que si la población inicial P0 < M, entonces P (t) < M para todo t > 0 y
lı́m P (t) = M,
t→+∞

dP
Como = kP (M − P ) > 0 a medida que transcurre el tiempo, la población crece en forma
dt
regular a una población lı́mite finito M cuando t → +∞.
Si P0 > M, un análisis similar demuestra que P (t) decrece en forma regular a una
población lı́mite finito M cuando t → +∞.

55
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Ejemplo 5.11. Supongamos que en el instante t = 0, la mitad de una población de 100 mil
personas ha escuchado un rumor y que el número de P (t) de personas que lo han escuchado
crece a razón de 1000 personas por dı́a. Si P (t) satisgace la ecuación logı́stica
dP
= kP (100 − P )
dt
(con P en miles de personas y t en dı́as), determine el número de personas que han escuchado
el rumor después de 30 dı́as.
Solución: Necesitamos determinar el valor de la constante k. Sabemos que P (0) = 50 y
0
P (0) = 1 luego 1 = k50(100 − 50). y k = 0,0004, luego la ecuación diferencial queda
dP
= 0,0004P (100 − P )
dt
Por separación de variables tenemos
Z Z
1
dP = 0,0004tdt
P (100 − P )
Por método de fracciones parciales
 
1 1 1 1
= +
P (100 − P ) 100 P 100 − P
Luego Z   Z
1 1 1
+ dP = 0,0004dt
100 P 100 − P
y   Z
ln(P ) − ln(100 − P ) = 0,04dt

Es decir,  
P
ln = 0,04t + C
100 − P
Cuando t = 0, P (0) = 50 luego, C = 0, De donde
P
= e0,04t
100 − P
Finalmente la función solución es
100e0,04t
P (t) =
1 + e0,04t
Por lo tanto, el número de personas que han escuchado el rumor después de 30 dı́as es P (30)
que es aproximadamente 76,85 miles de personas. 

56
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Ejemplo 5.12. La vida media de la morfina en el torrente sanguı́neo humano es de tres


horas. Si inicialmente hay 0,4 mg de morfina en el torrente sanguı́neo, halle la ecuación
para la cantidad de morfina presente en el torrente sanguı́neo después de t horas.
3 t
Resp. y(t) = 0,4 .
2
¿Cuándo llegará la cantidad por debajo de 0.01 mg?

Ejemplo 5.13. Un espécimen de carbón de leña encontrado en Stonehenge contiene el 63 %


de carbono 14 con respecto de una muestra de carbón actual. ¿Cuál es la edad de la muestra
? Resp: Aproximadamente 3800 años.

Ejemplo 5.14. El radio se desintegra exponencialmente. Su vida media es de 1620 años.


¿Cuánto tiempo tardará una muestra de 50 gr. en reducirse a 5gr ?

Ejemplo 5.15. Un asado de 5 kilos que inicialmente está a 25 o C se coloca en un horno


que está a 400 o C. Al cabo de 10 minutos el asado está a 100 o C. ¿Cuántos minutos más
dT
tardará para llegar a 150 o C? La ecuación diferencial que representa esta situación es =
dt
−k(T − Ta ), k > 0 donde Ta es la temperatura ambiente.

Ejemplo 5.16. Propagación de una epidemia. La razón a la que se propaga una epidemia
en una comunidad es directamente proporcional a la cantidad de residentes que han sido
infectados y al número de residentes propensos a la enfermedad que no han sido infectados. Si
Q(t) es la cantidad de residentes que ha sido infectado en el instante t, t medido en semanas,
dQ
la ecuación diferencial que describe la propagación de la epidemia es = kQ(M − Q) que
dt
corresponde a una ecuación logı́stica. Encuentre Q(t) si la comunidad tiene 2000 personas
propensos a la enfermedad, si 500 personas tenı́an la enfermedad inicialmente y habı́a 855
personas infectadas al final de la primera semana.

Teorema 5.1 (Existencia y unicidad de solución de un problema ). Dado el problema de


Cauchy (o de valor inicial)

 dy
= H(x, y)
dx
y(x ) = y
0 0

∂H
si tanto H como son funciones continuas en un rectángulo abierto R = {(x, y) ∈ R2 |
∂y
a < x < b, c < y < d} que contiene a (x0 , y0 ), entonces existe una única solución y = f (x)
del problema, con f definida en un intervalo ]x0 − δ, x0 + δ[ ⊆ ]a, b[.

57
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

5.2. Solución general EDO Lineales


dy
Observación 5.5. Para resolver una EDO Lineal de la forma = g(x)y + h(x), se sigue
dx
el siguiente método:
R
1. Determinamos un factor integrante de la “forma” µ(x) = e −g(x) dx 2 y notamos que,
por regla de la cadena,
R
Z 0
0 −g(x) dx

µ (x) = e · −g(x) dx = µ(x) · − g(x) = −µ(x)g(x)

2. Multiplicamos la EDO Lineal por µ(x) y al reordenar

dy dy 0
µ(x) · h(x) = µ(x) − µ(x)g(x)y = µ(x) + µ0 (x)y = µ(x)y
dx dx
Z
3. Entonces µ(x)y se obtiene de µ(x) · h(x) dx, de donde se despeja y obtiene y.

dy 2y
Ejemplo 5.17. Resolver = + x2 cos(x), con x > 0.
dx x
Solución: La EDO es Lineal, ası́ que aplicamos el método anterior:
2
1. En este caso, g(x) = y h(x) = x2 cos(x).
x
R
2. Buscamos un factor integrante de la “forma” e −g(x) dx , pero
−2
Z Z
−g(x) dx = dx = −2 ln |x| + C = −2 ln(x) + C( ya que x > 0)
x

Elegimos factor integrante µ(x) = e−2 ln(x) = x−2 .

3. Entonces

µ(x)h(x) = x−2 · x2 cos(x) = cos(x) y por otra parte


dy dy 2
µ(x)h(x) = µ(x) − µ(x)g(x)y = x−2 − x−2 y
dx dx x
−2 dy −3 −2
0
=x − 2x y x y
dx
d x−2 y
Luego = cos(x), x > 0
dx
2
Note que el efecto de la constante de integración es producir ponderadores no negativos para µ(x), de
la forma eC como al resolver crecimiento exponencial o decaimiento radioactivo, y que no son relevantes.

58
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Z
−2
4. Entonces x y + C = cos(x) dx, de donde x−2 y = sen(x) + C, C ∈ R, de donde
obtenemos las soluciones

y = x2 sen(x) + Cx2 , x > 0, C ∈ R.

En caso de que se trate de un problema de valor inicial (o de Cauchy) con y(x0 ) = y0 , x0 > 0,
ello determina la constante C. 

59
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

5.3. Guı́a 5 Matemáticas 4.


Los ejercicios marcados con asterisco (∗) serán realizados en ayudantı́a.

Diagonalización y números complejos


1. Diagonalice las siguientes matrices, indicando las matrices P y D resultantes. Verifique
que se cumple A = P · D · P −1 o, usando vectores propios unitarios para las columnas
de P , que A = P · D · P ∗
   
1 −1 1 −i
a) (∗) A = d) A =
1 1 i 1
   
2 −3 i 2
b) A = e) (∗) A =
3 2 2 i
   
1 1 1 −i
c) A = f) A =
i i i −1

Ecuaciones diferenciales ordinarias de primer orden



dy
= x sen(2x)


dx

1. Encuentre la única solución del problema de Cauchy: π 

y
 =0
6
2. (∗) La vida media de la morfina en el torrente sanguı́neo humano es de tres horas. Si
inicialmente hay 0, 4 mg de morfina en el torrente sanguı́neo, halle la ecuación para la
cantidad de morfina presente en el torrente sanguı́neo después de t horas.
¿Cuándo llegará la cantidad por debajo de 0.01 mg?

3. Un espécimen de carbón de leña encontrado en Stonehenge contiene el 63 % de carbono


14 con respecto de una muestra de carbón actual. ¿Cuál es la edad de la muestra ?
Resp: Aproximadamente 3800 años.

4. El radio se desintegra exponencialmente. Su vida media es de 1620 años. ¿Cuánto


tiempo tardará una muestra de 50 gr. en reducirse a 5gr ?

5. (∗) Un asado de 5 kilos que inicialmente está a 25 o C se coloca en un horno que


está a 400 o C. Al cabo de 10 minutos el asado está a 100 o C. ¿Cuántos minutos más
tardará para llegar a 150 o C? La ecuación diferencial que representa esta situación es
dT
= −k(T − Ta ), k > 0 donde Ta es la temperatura ambiente.
dt
6. La razón a la que se propaga una epidemia en una comunidad es directamente propor-
cional a la cantidad de residentes que han sido infectados y al número de residentes

60
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

propensos a la enfermedad que no han sido infectados. Si Q(t) es la cantidad de residen-


tes que ha sido infectado en el instante t, t medido en semanas, la ecuación diferencial
dQ
que describe la propagación de la epidemia es = kQ(M −Q) que corresponde a una
dt
ecuación logı́stica. Encuentre Q(t) si la comunidad tiene 2000 personas propensos a la
enfermedad, si 500 personas tenı́an la enfermedad inicialmente y habı́a 855 personas
infectadas al final de la primera semana.

7. Resuelva las siguientes EDO Lineales, tengan o no valores iniciales:

a) y 0 = y + ex .
−2y
b) (∗) y 0 = + 3x.
x
c) (x + 1)2 y 0 = −3(x + 1)y + 2.
d ) tan(x)y 0 − 2y = 2a.
e) xy 0 + y(x cot(x) + 1) = cot(x).
f ) x2 y 0 + (x2 + 2x)y = 1.
g) xy 0 + 2y = 4x2 , y(1) = 4.
h) xy 0 − 3y = x3 , y(1) = 0.
i ) (∗) xy 0 + (x − 2)y = 3x3 e−x , y(0) = 1.
j ) y 0 − 2y = 4x, y(0) = 1.
k ) y 0 − 2xy = 1, y(a) = b.
l ) y 0 + cos(x)y = cos(x), y(π) = 0.
m) (∗) x ln(x)y 0 + y = 2 ln(x).
n) (x2 + 1)y 0 − 2xy = x2 + 1, y(1) = π.
ñ) y 0 + 2xy = 2x.
o) y 0 + cot(x)y = 3 sen(x) cos(x).
p) x(x + 1)y 0 − y = 2x2 (x + 1).
q) xy 0 − y = x sen(x).

61
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

6. Apéndice
A. Polinomios de coeficientes reales
Definición A.1. Consideremos el cuerpo R de los números reales. Una expresión de la forma
n
X
n
a0 + a1 x + · · · + an x , abreviada ai xi donde n es un entero no negativo y a0 , a1 , ..., an son
i=0
elementos en R, la llamaremos un polinomio con coeficientes en R, en la indeterminada
x.

Denotaremos por R[x] al conjunto formado por todos los polinomios con coeficientes en
R, y utilizaremos los sı́mbolos f (x), g(x), p(x), q(x), P (x), Q(X), ...,etc., para denotar los
elementos de R[x].
n
X m
X
Definición A.2. Sean p(x) = ai xi y q(x) = bi xi elementos en R[x]. Diremos que
i=0 i=0
p(x) = q(x), si y sólo si n = m y ai = bi para todo i ≥ 0.
En el conjunto R[x] se definen las siguientes operaciones que originan dos nuevos poli-
nomios: n
X
(p + q)(x) = (ai + bi )xi + bn+1 xn+1 + · · · bm xm si n ≤ m.
i=0
k
X
2 n+m
(pq)(x) = c0 + c1 x + c2 x + · · · + cn+m x , donde ck = ai bk−i .
i=0

Comentario. Notar que algebraicamente se tiene que (p + q)(x) = p(x) + q(x) y que
(pq)(x) = p(x)q(x).
El polinomios cero o polinomio nulo es aquel cuyos coeficientes son, todos ellos, cero.
n
X
Definición A.3. Si p(x) = ai xi es un polinomio en R[x] y an 6= 0. Entonces an se
i=0
llama coeficiente supremo o principal de p(x) y se llama el grado de p(x) al número
n. En otras palabras, grado de p(x) = n ⇔ n es el mayor entero no negativo tal que
an 6= 0. Denotaremos n = gr(p) o n = gr(p(x)). Si el coeficiente supremo es 1 se dice que el
polinomio es mónico. No definiremos el grado del polinomio cero.

Podemos observar que para un polinomio f (x) en R[x], se tiene la equivalencia: f (x) 6=
0 ⇔ gr(f (x)) ≥ 0.

Lema A.1. Si f (x), g(x) son elementos distintos de cero en R[x], entonces
i) gr(f + g) ≤ max{gr(f ), gr(g)}
ii) gr(f (x)g(x)) = gr(f (x)) + gr(g(x)).

62
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Demostración Parte i) de ejercicio. Probemos parte ii) Sean f (x) = a0 +a1 x+· · ·+an xn
y g(x) = b0 + b1 x + · · · + bm xm en R[x] con an 6= 0 y bm 6= 0. De la definición de producto
obtenemos que f (x)g(x) = c0 + c1 x + · · · + cn+m xn+m donde cn+m = an bm 6= 0. Por lo tanto
gr(f (x)g(x)) = n + m = gr(f (x)) + gr(g(x)).
Teorema A.1. (Algoritmo de Euclides o Algoritmo de la División) Dados dos poli-
nomios h(x) y p(x) en R[x] con p(x) 6= 0, entonces existen únicos polinomios q(x) y r(x) en
R[x] tales que h(x) = p(x)q(x) + r(x) donde r(x) = 0 o gr(r) < gr(h). El polinomio r(x) se
llama resto y q(x) cuociente de la división de h(x) por p(x).

Demostración: Existencia: Si h(x) = 0, o gr(h) > gr(p) tomando q(x) = 0 y


r(x) = h(x) se tiene el algoritmo. Sea h(x) 6= 0, y gr(h) ≤ gr(p). La demostración la
haremos por inducción sobre el grado de h(x).
Si gr(h) = 0, entonces gr(p) = 0. Sea h(x) = a, p(x) = b, a 6= 0, b 6= 0. Como R es cuerpo
entonces existe b−1 ∈ R y se tiene a = b(b−1 a) + 0.
Supongamos que el algoritmo es válido cuando el dividendo tiene grado < n. Sea h(x)
Xn Xt
de grado n, h(x) = ai xi con an 6= 0 y p(x) = bi xi , con bt 6= 0. S.P.G supongamos que
i=0 i=0
t ≤ n.
Consideremos el polinomio S(x) = h(x) − an b−1 t−1 x
n−t
p(x) (se obtiene del primer paso de
la división de h(x) por p(x)) y tenemos:
n−1
X t−1
X n−1
X Xt−1
i n −1 n−t t −1 n−t i i −1 n−t
S(x) = ai x +an x −an bt−1 x bt x −an bt−1 x [ bi x ] = ai x −an bt−1 x [ bi x i ]
i=0 i=0 i=0 i=0
Luego gr(S) ≤ max{gr(xn−1 ), gr(xn−t · xt−1 )} = n − 1.
Por lo tanto S(x) = h(x) − an b−1 t−1 x
n−t
p(x) es un polinomio de grado menor que n y
−1 n−t
por hipótesis de inducción: h(x) − an bt−1 x p(x) = p(x)q1 (x) + r1 (x) con r1 (x) = 0 o
gr(r1 < gr(p). Sea q(x) = an b−1 t−1 x
n−t
+ q1 (x) y se tiene que el algoritmo vale para h(x).
Luego por P.I.C. el algoritmo vale para polinomios de grado n, con n ∈ N.
Unicidad: Sean h(x) = p(x)q(x) + r(x) = p(x)q1 (x) + r1 (x) con r(x) = 0 o bien
gr(r) < gr(p), y r1 (x) = 0 o bien gr(r1 ) < gr(p).
Supongamos que q1 (x) 6= q(x). Entonces p(x)[q1 (x)−q(x)] = r(x)−r1 (x). con gr(r−r1 ) <
gr(p).
Por otro lado gr(p[q1 −q]) = gr(p)+gr(q1 −q) ≥ gr(p). Contradicción. Luego q1 (x) = q(x)
y también r(x) = r1 (x).
Nota: Si el divisor g(x) es de la forma x − c (de grado uno) la división se hace con un
método conocido como Método de Ruffini: Se escriben los coeficientes de f (x) en orden
decreciente llenando con 0 si no aparece xi . Por ejemplo divida x4 + 3x3 − 2x2 + 3 por x + 2.
Sol:
1 3 −2 0 3
−2 −2 −2 8 −16
1 1 −4 8 | −13 = resto
Luego r(x) = −13 y q(x) = 8 − 4x + x2 + x3 .

63
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

Definición A.4. Sea f (x) un polinomio de grado ≥ 1 con coeficientes en R y α un número


tal que f (α) = 0, entonces se dice que α es una raı́z de f (x).

Definición A.5. Sean f (x), g(x) en R[x] con g(x) 6= 0. Diremos que g(x)divide a o es
un divisor de f (x) (se denota g(x) | f (x)), si existe un polinomio h(x) ∈ R[x] tal que
f (x) = g(x)h(x).

Proposición A.1. Sea f (x) un polinomio de grado ≥ 1 con coeficientes en R y α ∈ R.


Entonces α es una raı́z de f (x) si y sólo si existe un polinomio q(x) en R[x] tal que f (x) =
(x − α)q(x), es decir, (x − α) | f (x)

Demostración: Por el algoritmo de Euclides, sabemos que existen polinomios q(x) y r(x)
tales que f (x) = (x − α)q(x) + r(x) donde r(x) = 0 o gr(r) < gr(x − α) = 1. Ası́ r(x) = 0
o gr(r) = 0, lo cual implica que r(x) = a0 ∈ R. Dado que α es una raı́z de f (x), obtenemos
que 0 = f (α) = (α − α)q(α) + r(α) = r(α). Por lo tanto a0 = 0 y f (x) = (x − α)q(x).
Recı́procamente, tenemos que f (α) = (α − α)q(α) = 0 · q(α) = 0. Por lo tanto α es raı́z de
f (x).
Observación: De la proposición anterior se deduce que si f (x) es un polinomio de grado
mayor o igual a 1 con coeficientes en R y α1 ∈ R es una raı́z de f (x), entonces existe un
polinomio q1 (x) en R[x] tal que f (x) = (x − α1 )q1 (x), donde gr(q1 (x)) = gr(f (x)) − 1, y
si α2 ∈ R es una raı́z de q1 (x), luego de f (x), se tiene que q1 (x) = (x − α2 )q2 (x), y ası́,
f (x) = f (x) = (x − α1 )(x − α2 )q2 (x) con gr(q2 (x)) = gr(f (x)) − 2. Como gr(f (x)) es un
entero no negativo, este proceso continua hasta obtener a lo más gr(f (x)) raı́ces reales.
Si f (x) tiene grado n, puede tener a lo más n raı́ces y si todas ellas están en R se tiene
que
f (x) = an (x − α1 )(x − α2 ) · · · (x − αn )
donde an es el coeficiente principal de f (x).
Si f (x) tiene solamente algunas raı́ces reales, digamos t raı́ces reales con t < n entonces

f (x) = (x − α1 )(x − α2 ) · · · (x − αt )q(x)

con gr(q(x)) = n − t y q(x) sin raı́ces reales.

Ejemplo A.1. Dado f (x) = x4 − 4 encuentre todas las raı́ces reales de f (x).
√ √
Solución: x4 − 4 = (x2 − 2)(x2 + 2) = (x − 2)(x + 2)(x2 + 2).
x2 + 2 no tiene raı́ces reales pues ∆ = b2 − 4ac = 0 −
√ 4 · 1√· 2 = −8 < 0.
4
Luego las únicas raı́ces reales de f (x) = x − 4 son 2, − 2.
−1
Ejemplo A.2. Sabiendo que es raı́z de f (x) = 4x3 − 5x − 2 encuentre las otras dos
2
raı́ces.

64
Mate 4 Manuel Arenas / Sergio Muñoz F. Ciencias/UChile

1
Solución: Al dividir f (x) por x + da como cuociente q(x) = 4x2 − 2x − 4.
2
1 1
Luego f (x) = (x + )(4x − 2x − 4) = (x + ) · 2 · (2x2 − x − 2) = (2x + 1)(2x2 − x − 2).
2
2 √ 2 √
1 + 17 1 − 17
Las raı́ces de 2x2 − x − 2 son y . Luego las 3 raćes reales de f (x) =
√ √4 4
−1 1 + 17 1 − 17
4x3 − 5x − 2 son , y .
2 4 4
Además, por la observación
√ anterior se tiene
√ que
1 + 17 1 − 17
2x2 − x − 2 = 2(x − )(x − ).
4 4 √ √
2 1 + 17 1 − 17
De donde, f (x) = (2x + 1)(2x − x − 2) = 2(2x + 1)(x − )(x − ).
4 4
Definición: Diremos que una raı́z α ∈ R de un polinomio no constante f (x) ∈ R[x],
tiene mutiplicidad m ≥ 1, si existe un polinomio q(x) ∈ R[x] tal que f (x) = (x − α)m q(x)
con q(α) 6= 0.

Ejemplo A.3. Determine el valor de k para que el polinomio p(x) = x3 − kx2 + 48x − 36 ∈
R[x], tenga una raı́z real de multiplicidad 2.

Solución: Si a es raı́z de multiplicidad 2, entonces p(x) = (x − a)2 q(x) con q(a) 6= 0. Al


dividir p(x) por (x − a)2 = x2 + 2ax + a2 da un cuociente q(x) = x − (k + 2a) y un resto
r(x) = (2ak + 3a2 + 48)x + (ka2 + 2a3 − 36). Luego r(x) = 0 si y solo si 2ak + 3a2 + 48 = 0
−96a − 108
y ka2 + 2a3 − 36 = 0. Resolviendo el sistema queda k = . Notemos que a 6= 0,
a2
pues si fuera cero, entonces 0 = p(0) = −36. Lo que es una contradicción. Además q(a) =
12 12 a2 + 12
a − ( + 2a) = −a − =− 6= 0, dado que a2 + 12 > 0.
a a a
A continuación enunciaremos una forma de encontrar las posibles raı́ces racionales de un
polinomio, que no probaremos aquı́ pero que puede consultarse en Fraleigh: A first course in
Abstrac Algebra.

Proposición A.2. Sea h(x) = an xn + · · · + a0 ∈ Z[x], a0 , an 6= 0. Si un número racional


p
es raı́z de h(x) entonces p divide a a0 y q divide a an , como enteros.
q

65