Vous êtes sur la page 1sur 14

METODOS ITERATIVOS

Trata de resolver un problema (como una ecuación o un sistema de


ecuaciones) mediante aproximaciones sucesivas a la solución, empezando
desde una estimación inicial.

Considere el problema de encontrar una raíz a una ecuación cuadrática, por


ejemplo:

f(x) = x2 − x − 2 = 0

Un método directo para resolverlo es aplicar la fórmula general

Un método iterativo consta de los siguientes pasos:

1. inicia con una solución aproximada.

2. ejecuta una serie de cálculos para obtener o construir una mejor


aproximación partiendo de la aproximación semilla. La fórmula que permite
construir la aproximación usando otra se conoce como ecuación de
recurrencia.

Esta aproximación contrasta con los métodos directos, que tratan de resolver el
problema de una sola vez (como resolver un sistema de ecuaciones Ax=b
encontrando la inversa de la matriz A). Los métodos iterativos son útiles para
resolver problemas que involucran un número grande de variables (a veces del
orden de millones), donde los métodos directos tendrían un coste prohibitivo
incluso con la potencia del mejor computador disponible.

Ventajas y Desventajas

Un elemento en contra que tienen los métodos iterativos sobre los métodos
directos es que calculan aproximaciones a la solución. Los métodos iterativos se
usan cuando no se conoce un método para obtener la solución en forma exacta.
También se utilizan cuando el método para determinar la solución exacta
requiere mucho tiempo de cálculo, cuando una respuesta aproximada es
adecuada, y cuando el número de iteraciones es relativamente reducido.
Puntos fijos atractivos

Si una ecuación puede ponerse en la forma f(x) = x, y una solución x es un punto


fijo atractivo de la función f, entonces puede empezar con un punto x1 en la
base de atracción de x, y sea xn+1 = f(xn) para n ≥ 1, y la secuencia {xn}n ≥ 1
convergerá a la solución x.

Sistemas lineales

En el caso de un sistema lineal de ecuaciones, las dos clases principales de


métodos iterativos son los métodos iterativos estacionarios y los más generales
métodos del subespacio de krylov

Métodos iterativos estacionarios

Los métodos iterativos estacionarios resuelven un sistema lineal con un


operador que se aproxima al original; y basándose en la medida de error (el
residuo), desde una ecuación de corrección para la que se repite este proceso.
Mientras que estos métodos son sencillos de derivar, implementar y analizar, la
convergencia normalmente sólo está garantizada para una clase limitada de
matrices.

Métodos del subespacio de Krylov

Los métodos del subespacio de Krylov forman una base ortogonal de la


secuencia de potencias de la matriz por el residuo inicial (la secuencia de
Krylov). Las aproximaciones a la solución se forman minimizando el residuo en
el subespacio formado. El método prototípico de esta clase es el método del
gradiente conjugado. Otros métodos son el método del
residuo mínimo generalizado y el método del gradiente biconjugado.

Convergencia

Dado que estos métodos forman una base, el método converge en N


iteraciones, donde N es el tamaño del sistema. Sin embargo, en la presencia de
errores de redondeo esta afirmación no se sostiene; además, en la práctica N
puede ser muy grande, y el proceso iterativo alcanza una precisión suficiente
mucho antes. El análisis de estos métodos es difícil, dependiendo de lo
complicada que sea la función del espectro del operador.
Pre condicionante

El operador aproximativo que aparece en los métodos iterativos estacionarios


puede incorporarse también en los métodos del subespacio de Krylov, donde
se pasan de ser transformaciones del operador original a un operador mejor
condicionado. La construcción de precondicionadores es un área de
investigación muy extensa.

El método Jacobi es el método iterativo para resolver sistemas de ecuaciones


lineales más simple y se aplica

sólo a sistemas cuadrados, es decir a sistemas con tantas incógnitas como


ecuaciones.

1. Primero se determina la ecuación de recurrencia. Para ello se ordenan las


ecuaciones y las incógnitas. De la ecuación i se despeja la incógnita i. En
notación matricial se escribirse como:

x = c + Bx (1)

Donde x es el vector de incógnitas.

2. Se toma una aproximación para las soluciones

3. Se itera en el ciclo que cambia la aproximación

xi+1 = c + Bxi (2)


RAIZ DE UNA ECUACION

Se conoce como raíz (o cero) de un polinomio o de una función (definida sobre


un cierto cuerpo algebraico) f(x) a todo elemento x perteneciente al dominio de
dicha función tal que se cumpla:

.𝑓(𝑥) = 0

Por ejemplo, dada la función:

𝑓(𝑥) = x 2 − 6x + 8

Planteando y resolviendo la ecuación:

0 = x2 - 6x + 8

Se tiene que 2 y 4 son raíces ya que f(2) = 0 y f(4) = 0

 Dado el caso de que tanto el dominio como la imagen de la función sean


los números reales (denominadas funciones reales) entonces los puntos
en los que el gráfico corta al eje de las abscisas es una interpretación
gráfica de las raíces de dicha función.
 El teorema fundamental del álgebra determina que todo polinomio en
una variable compleja y de grado n tiene n raíces (contando sus
multiplicidades). Aun así, Las raíces de los polinomios reales no son
necesariamente reales; algunas de ellas, o incluso todas, pueden ser
complejas.
 Una función trascendente como por ejemplo sin(𝑥) posee una infinidad
de raíces, concretamente cualquier xn = nπ, n∈ 𝑍 es raíz de esa función.
En cambio la función ez no se anula nunca sobre los números complejos.
 El número de raíces de una función holomorfa o una función analítica es
un conjunto numerable sin puntos de acumulación.
 Uno de los problemas no resueltos más interesantes de la matemática
moderna es encontrar las raíces de la función zeta de Riemann.
 La resolución numérica de ecuaciones no lineales es la utilización de un
método numérico para encontrar raíces de una función de manera
aproximada.
RAÍCES SIMPLES Y MÚLTIPLES

Dada una función f que tiene una raíz r entonces se puede escribir dicha función
como:

𝑓(𝑥) = (𝑥 − 𝑟)𝑓 1 (x)

Entonces se dice que:

 La raíz es simple si f1(r) ≠ 0


 La raíz es múltiple si f1(r) = 0, en este último caso la raíz se dice de

orden n, siendo , cuando se puede escribir:

𝑓(𝑥) = (𝑥 − 𝑟)n fn(x), con fn (r) ≠ 0

Con la definición anterior, pueden existir ceros múltiples de orden no finito. Por
ejemplo la función definda como:

1
𝑓(𝑥) = {exp⁡(− 𝑥2
), 𝑥>0
0, 𝑥=0

Tiene un cero múltiple en x=0, ya que:

1
exp (− 𝑥 2 ) /𝑥 𝑛 , 𝑥 > 0⁡
𝑓(𝑥) = (𝑥 − 0)𝑓1 ⁡(𝑥)⁡⁡⁡⁡⁡⁡⁡⁡⁡𝑓(𝑥) = { , n⁡∈ 𝑁
0, 𝑥 = 0

Como n puede tomarse tan grande como se quiera en la expresión anterior, se


sigue que esa función no tiene un cero de orden finito.

EJEMPLOS
METODOS DE INTERVALO

Los métodos de los intervalos utilizan una propiedad muy importante,


consistente en el hecho del cambio de signo de una función en inmediaciones
de una raíz.
Se llaman métodos de los intervalos porque se necesitan como mínimo dos
valores que forman un intervalo que encierra la raíz.

MÉTODO GRÁFICO.

El método de la aproximación gráfica es el método más sencillo pero el menos


indicado, debido a que solo vas a ir dando valores a la incógnita de una función
hasta llegar al punto más cercano de la raíz.

Para este Método no hay formula alguna solo se utiliza la ecuación desea, por
ejemplo f(x)= x3+2x2+10x-20=0, y se le daría valor a x hasta llegar al resultado
deseado.

Aquí se pondrá un ejemplo de como llevar acabo la aproximación gráfica:

f(x)= x3+2x2+10x-20=0

x f(x)
4 68

3 37
2 12
1 -7
MÉTODO DE BISECCIÓN.

Este método es el más sencillo de todos. Se basa en un sentido natural del


hombre que podría traducirse así: como el punto c esta entre a y b se podría
decir que el punto c esta en el medio de a y b, es evidente que el punto más
sencillo de ubicar dentro del intervalo (a, b) es exactamente en el punto medio.

Si bien la puesta en marcha de este método es muy fácil de llevar a cabo, el


número de cálculos que se debe realizar para alcanzar la precisión deseada
suele ser muy elevado.

Ahora hay que determinar en que sub-intervalo esta la raíz para eso se hace lo
siguiente

a) si f(xi)*f(xs)<0

Entonces la raíz esta en el primer sub-intervalo y xs = xr

b) si f(xi)*f(xs)>0

Entonces la raíz se encuentra en el segundo sub-intervalo y xi=xr

c) si f(xi)*f(xs)=0 ó f(xs)*f(xr)=0

Entonces xr es la raíz

Después se calcula el error aproximado (Ea%=100(xr(valor actual)-xr(valor


anterior)))

xr (valor actual)

Se vuelve a calcular la siguiente aproximación siguiendo el mismo proceso, una


y otra vez hasta que el error sea mínimo.
MÉTODO DE FALSA POSICIÓN.

Este método también conocido como Regula-Falsi corresponde a realizar una


interpolación lineal entre los puntos a y , se busca, en la recta que pasa por los
puntos [a; f(a)] y [b; f(b)], el punto c tal que su imagen f(c) se anule . En esta
expresión aparece la relación (b - a)/ (f (b) – f(a)) que es equivalente al inverso
de la derivada de primer orden de la función f. La ecuación resultante es:

La velocidad de convergencia de ese método es muy superior a la del método


de la bisección cuando ambos puntos están lejos de la solución. Sin embargo su
eficiencia ya no es tan evidente cuando un punto esta distante de la solución y
el otro esta muy cercano a ella. Cabe señalar además, de uno de los principales
defectos de este método es que en la mayoría de los casos, uno de los limites
del intervalo es utilizando como punto de apoyo y solamente el otro se ve
afectado por el procedimiento de cálculo, afectando así la velocidad de
convergencia.
Realice las siguientes evaluaciones para determinar en qué subintervalo está la
raíz:

a) Si f(xl)f(xr) < 0, entonces la raíz se encuentra dentro del subintervalo inferior


o izquierdo. Por lo tanto, haga xu = xr y vuelva al paso 2.

b) Si f(xl)f(xr) > 0, entonces la raíz se encuentra dentro del subintervalo


superior o derecho. Por lo tanto, haga xl = xr y vuelva al paso 2.

c) Si f(xl)f(xr) = 0, la raíz es igual a xr; termina el cálculo.


METODO DEL PUNTO FIJO

El Método de Punto Fijo (también conocido como iteración de punto fijo), es


otro método para hallar los ceros de f(x). Para resolver f(x) = 0, se reordena en
una forma equivalente:

f(x) = 0
x - g(x) = 0
x = g(x)

Observe que si c es un cero de f(x), f(c)=0 y c=g(c). (Siempre que se tenga


c=g(c) se dice que c es un punto fijo de la función g). Para aproximar un cero
de f se utiliza la iteración de punto fijo (1) xn+1 = g(xn) , n = 0, 1, 2, 3, . . .
donde x0 es una aproximación inicial del cero de f.

Ejemplo.

f(x) = x2 - 2x - 3 = 0, tiene dos ceros. x = 3 y x = -1

Supóngase que se reordena para lograr la forma equivalente:

Si se comienza con x0 = 4 y se itera con la iteración de punto fijo (1), los valores
sucesivos de x son:

parece que los valores convergen a x = 3.


Otro reordenamiento de f(x) = 0 es :

Si nuevamente se comienza con x0 = 4, los valores sucesivos de x son:

parece que ahora x converge al otro cero de f, x = -1.

Considérese un tercer reordenamiento

Comenzando de nuevo con x0 = 4 se obtiene:

x0 = 4
x1 = 6.5
x2 = 19.625
x3 = 191.070

resulta evidente que las iteraciones son divergentes.


La diferencia en el comportamiento de los tres reordenamientos se puede
apreciar considerando las gráficas en los tres casos. El punto fijo de x = g(x) es
la intersección de la recta y = x, y la curva y = g(x). En la figura se presentan los
tres casos. Se comienza en el eje x con x0, se efectúa un desplazamiento vertical
hacia la curva, luego uno horizontal hacia la recta y = x, luego uno vertical hacia
la curva y nuevamente una horizontal hacia la recta. Este proceso se repite
hasta que los puntos en la curva convergen a un punto fijo o bien divergen.
Parece que los diferentes comportamientos dependen de que la pendiente de
la curva sea mayor, menor o de signo opuesto a la pendiente de la recta (que es
igual a 1)

Cuando se tiene la ecuación f(x) = 0, existen muchas formas de reordenarla en


la forma x = g(x), por ejemplo para la ecuación anterior x2-2x-3 = 0 otras
alternativas son:

**
EJEMPLOS

1.- Comprobar que se cumplen las condiciones del teorema del punto fijo
para las siguientes funciones, encontrando un intervalo que cumpla las
condiciones.

a) g(x) = +

Esta función está definida en el intervalo [-2, + ¥ [.

g'(x) = Þ |g'(x)| < 1 Û 1 < 2 Û >Û

Û x+2 > Û x > -

luego |g'(x)| < 1 "x Î ] - , + ¥ [. Además g(-) = Î ] - , + ¥ [

Como la función + es creciente g(x) Î ] - , + ¥ [ "x Î ] - , + ¥ [.

Podemos pues elegir intervalos I Ì ] - , + ¥ [.

Fijando por ejemplo I = ] 0 , 100 [ tenemos:

a) Para todo x Î [0 , 100] Þ g(x) Î [0 , 100] por ser la función + creciente.

b) g(x) es continua en [0 , 100].

c) g(x) es derivable en ] 0 , 100[ y cumple: |g'(x)| £ g'(0) = < 1 para todo x


en ] 0 , 100[

luego en [ 0 , 100] existe un único punto fijo.


|g'(x)| < 1 Û 2 < x2 Û x > ó x < - Û

ÛxÎ],+¥[óxÎ]-¥,-[

Como la función g(x) es decreciente y g(- ) = 1 - Ï ] - ¥ , - [ este intervalo no


puede cumplir la primera condición.

Tomamos el intervalo [ , + ¥ [. Evidentemente g(x) es continua en él y además


es decreciente, es decir, < Þ g( )> g( ). Nos interesa conocer el
punto donde g(x) =

luego "x Î [ , 2( + 1)] se cumplirá:

como g() = 1 + Î [ , 2( + 1)]

g(2( + 1)) = Î [ , 2( + 1)] y ser g(x) decreciente

g(x) Î [ , 2( + 1)] "x Î [ , 2( + 1)]

Podemos pues elegir intervalos I Ì ] , 2( + 1)[.

Fijando por ejemplo I = ] 3/2 , 4 [ tenemos:

a) Para todo x Î [3/2 , 4] como g(3/2) = 7/3 Î I y g(4) = 3/2 Î I y la función g(x) es
decreciente se verifica que g(x) Î [3/2 , 4].

b) g(x) es continua en [3/2 , 4]

c) g(x) es derivable en ] 3/2 , 4[ y cumple: |g'(x)| £ g'(3/2) = 8/9 < 1 para todo x
en ] 3/2 , 4[

luego en [3/2 , 4] existe un único punto fijo.

Vous aimerez peut-être aussi