AN ALISIS MATEM ATICO

155
AN ´ ALISIS MATEM ´ ATICO Adalberto Garc´ ıa-M´ aynez y Cervantes 1 2012 1 Instituto de Matem´ aticas U.N.A.M.

Transcript of AN ALISIS MATEM ATICO

ANALISIS MATEMATICO

Adalberto Garcıa-Maynez y Cervantes 1

2012

1Instituto de Matematicas U.N.A.M.

Indice general

Prologo I

1. Estructuras Numericas 2

2. Espacios Metricos y Seudo-Metricos 17

3. Convergencia y Continuidad 36

4. Compacidad 45

5. Diferenciacion de Funciones de una Variable 62

6. Sucesiones y Series 75

7. Integracion de Riemann-Stieltjes 827.1. Funciones de variacion acotada . . . . . . . . . . . . . . . . . . . 827.2. Propiedades generales . . . . . . . . . . . . . . . . . . . . . . . . 897.3. Integracion con integradores crecientes . . . . . . . . . . . . . . . 98

8. Diferenciacion de Varias Variables 1248.1. Antecedentes de Algebra Lineal . . . . . . . . . . . . . . . . . . . 124

Bibliografıa 150

i

Prologo

Este texto proviene de mis notas de cursos de Analisis que impartı en laFacultad de Ciencias de la UNAM a lo largo de veinte anos. Solo desarrollo elprograma basico de los dos primeros cursos de esta materia, si bien decidı en-riquecerlas con un estudio mas detallado de los espacios metricos y con uncapıtulo introductorio sobre campos ordenados.

No es facil dar una definicion precisa de esta area de las matematicas. Sinembargo podrıamos decir que la medula del Analisis Matematico radica en el es-tudio de los lımites y la convergencia, conceptos que he definido intuitivamenteen el inicio del segundo capıtulo.

La diferencia entre Calculo y Analisis es mas sutil; tal vez podrıamos decirque en el cumulo de temas comunes de estas dos materias, las demostracionesdel Analisis son mas ambiciosas y mas profundas que las del Calculo. Podrıamostambien comentar que el Calculo se interesa mas en hallar algoritmos concretospara la solucion de los problemas, sin insistir tanto en su efectividad.

En todos los cursos que he impartido de Analisis Matematico, he tenidoalumnos que me han ayudado a corregir o aumentar mis notas. A todos ellos lesenvıo mi mas profundo agradecimiento. Destaco, desde luego, a Araceli Reyes, aquien debo la version final. Tambien hicieron aportaciones importantes JaninaOvalle, Isaac Ortigosa y mi alumno doctoral Ruben Mancio.

Como toda obra humana es perfectible, me gustarıa que se me permitiesehacer correcciones y aumentar temas que se adecuen a los cambiantes programasde la materia que pueda haber en el futuro.

Adalberto Garcıa MaynezEnero de 2012Instituto de Matematicas UNAM[[email protected]]

1

Capıtulo 1

Estructuras Numericas

En muchas ramas de la matematica es relevante el estudio de la convergen-cia. Los objetos de estudio se engloban en un conjunto con cierta estructura quenos permite entender la cercanıa entre sus elementos.

Los conjuntos estructurados mas frecuentes son los espacios topologicos ylos mas utiles ejemplos de ellos son los espacios metricos. Con la ayuda de losespacios metricos podemos medir distancias entre puntos, entre conjuntos o en-tre funciones.

Mas aun, podemos considerar sucesiones y analizar su comportamiento co-mo si se tratara de una pelıcula en movimiento. Este es el fondo de la teorıa deconvergencia y si tratamos de dar una definicion breve del Analisis Matematico(sea real o complejo) dirıamos que es el estudio de la convergencia en ciertosespacios topologicos.

Sin embargo, en nuestro caso, nos avocaremos al estudio de la convergenciaen espacios metricos.

Recordaremos, para empezar nuestro estudio, algunos conceptos de la Teorıade Conjuntos.

Si A y B son conjuntos, debemos distinguir la membresıa de la inclusion:A ∈ B significa que A es uno de los miembros de B y A ⊆ B quiere decir que ca-da miembro de A es miembro de B. En la axiomatica, no se permite que A ∈ ByB ∈ A se cumplan a la vez y, por tanto, nunca es verdadero el enunciado A ∈ A.

Dos conjuntos A, B son identicos si y solo si tienen la misma membresıa, esdecir, si y solo si A ⊆ B y B ⊆ A. Todo enunciado P que se expresa mediantemembresıas o inclusiones tiene un lado opuesto ¬P y exactamente uno de losdos enunciados P , ¬P es verdadero. Por ejemplo, el enunciado:

P : Todo rectangulo es paralelogramo.

tiene como opuesto:

2

Capıtulo 1. Estructuras Numericas 3

¬P : Existe un rectangulo que no es paralelogramo.

Claramente, en este caso, el enunciado verdadero es P .

En otro ejemplo, si consideramos el enunciado:

P : Todo primo es impar.

su opuesto es:

¬P : Existe un primo par.

en este caso el unico enunciado verdadero es ¬P .

Una variable proposicional es una coleccion de enunciados Px en los quela variable x toma valores en un conjunto fijo E. Denotamos x|Px al conjuntocuyos miembros son aquellos y solo aquellos miembros x ∈ E para los cuales elenunciado es verdadero. Por ejemplo, si A y B son conjuntos dados, podemosdefinir nuevos conjuntos A ∪B, A ∩B y A−B mediante las formulas:

A ∪B = x|x ∈ A o x ∈ B

A ∩B = x|x ∈ A y x ∈ B

A−B = x|x ∈ A y ¬(x ∈ B)

Los valores de x se toman en un conjunto universal E que contiene a todoslos conjuntos que nos interesan.

Podemos tambien construir los conjuntos A, B, A,B, (A,B) y A×B.Por ejemplo, A consta de un solo miembro, a saber A, por lo que si A tienemas de un elemento, podemos inferir que A 6= A. Analogamente, B tienea B como su unico elemento. Si A 6= B, A,B es el conjunto que tiene comounicos elementos a A y a B y recibe el nombre de pareja no ordenada deconjuntos . La definicion de (A,B) es mas delicada:

(A,B) = A , A,B cuando A 6= B, y

(A,A) = A .

(A,B) recibe el nombre de pareja ordenada de los conjuntos A,B. Claramente,si A 6= B, tenemos (A,B) 6= (B,A).

En general, si A, B, C, D son conjuntos, tenemos (A,B) = (C,D) si y solosi A = C y B = D. Finalmente, el producto cartesiano A×B se define como:

A×B = x|x = (a, b) para ciertas a ∈ A y b ∈ B .

Capıtulo 1. Estructuras Numericas 4

Una relacion R entre A y B es un subconjunto de A × B. El dominio(dom(R)) y codominio (codom(R)) de R se definen como:

dom(R) = x|x = a en donde a ∈ A y para cierta b ∈ B, se cumple (a, b) ∈ R .

codom(R) = x|x = b en donde b ∈ B y para cierta a ∈ A, se cumple (a, b) ∈ R .

Una relacion R entre A y B es una funcion si siempre que (a, b), (a, b′) ∈ Rcon a ∈ A, b, b′ ∈ B se tiene b = b′. En este caso, el unico elemento b tal que(a, b) ∈ R se denota como R(b).

Por ejemplo, la relacion R entre numeros enteros:

R = x|x = (m,n), n es divisor de m

no es funcion, pues (6, 3) y (6, 2) son miembros de R y sin embargo 2 6= 3. Pero,

S =x|x = (m,m2 − 3m+ 2)

sı es una funcion. En una funcion como S se presenta el caso (a, b), (a′, b) ∈ Scon a 6= a′, por ejemplo (1, 0) ∈ S y (2, 0) ∈ S.

El sımbolo f : A → B significa que f es una funcion entre A y B, condom(f) = A. Si tambien se cumple que codom(f) = B, diremos que f es unafuncion suprayectiva . Si siempre que (a, b), (a′, b) ∈ f implica que a = a′,diremos que f es una funcion inyectiva .

Una operacion binaria en un conjunto A es una funcion:

ϕ : A×A→ A.

En terminos intuitivos, una operacion binaria ϕ asigna a cada pareja ordenada(a, a′) de elementos de A un elemento a′′ tambien en A. En lugar de escribira′′ = ϕ(a, a′), se suele escribir a′′ = aϕa′. Las operaciones aritmeticas +,−,×,÷son claros ejemplos de operaciones binarias en conjuntos numericos.

Una operacion binaria ϕ en un conjunto A es una operacion conmutativasi aϕa′ = a′ϕa para cualesquiera a, a′ ∈ A y es una operacion asociativa siaϕ(a′ϕa′′) = (aϕa′)ϕa′′ para cualesquiera a, a′, a′′ ∈ A. Por ejemplo, la sumao multiplicacion entre los numeros enteros son operaciones conmutativas y aso-ciativas. Sin embargo, la sustraccion − no es conmutativa ni asociativa, pues,por ejemplo 5− 3 6= 3− 5 y (1− 2)− 3 6= 1− (2− 3).

Sea ϕ una operacion binaria en un conjunto A. Diremos que un elementoe ∈ A es elemento identico para ϕ si aϕe = eϕa = a para cada a ∈ A.Claramente, si existe un elemento identico para ϕ, este debe ser unico.

Capıtulo 1. Estructuras Numericas 5

Si ϕ es una operacion binaria con elemento identico e en un conjunto A y sia ∈ A, a′ ∈ A es un elemento inverso para a si aϕa′ = a′ϕa = e.

Si R es una relacion entre A y B, y S es una relacion entre B y C, se define:

S R = x|x = (a, c), en donde a ∈ A, c ∈ C y para cierta b ∈ Bse cumple (a, b) ∈ R y (b, c) ∈ S .

Llamamos a S R la composicion de R con S. Es importante notar que,en general, S R 6= R S y que la composicion de dos funciones es siempre unafuncion.

Si R es una relacion entre A y B y si C ⊆ A, se denota como R[C] al conjuntox| para cierta c ∈ C, (c, x) ∈ R. Definimos tambien la relacion inversa deR como:

R−1 = x|x = (b, a); b ∈ B, a ∈ A, (a, b) ∈ R

Dejamos al lector la demostracion de las siguientes propiedades:

Teorema 1.1. Sean R, S, T relaciones entre subconjuntos de un conjunto uni-versal U . Sean A, B, C ⊆ U . Entonces:

1. R (S T ) = (R S) T ;

2. (R S)−1 = S−1 R−1;

3. A ⊆ B ⇒ R[A] ⊆ R[B];

4. R[A ∪B] = R[A] ∪R[B];

5. R[S[B]] = (R S)[B];

6. Si R es funcion, entonces:

R−1[A ∩B] = R−1[A] ∩R−1[B].

R−1[A−B] = R−1[A]−R−1[B].

Procedemos ahora a definir el concepto de grupo.

Un conjunto G con una operacion binaria : G×G→ G es un grupo si secumplen las siguientes propiedades:

1. Para cualesquiera a, b, c ∈ G se cumple a (b c) = (a b) c.

2. Existe e ∈ G elemento identico.

3. Cada a ∈ G admite un inverso b.

Capıtulo 1. Estructuras Numericas 6

Si unicamente se cumplen las propiedades 1 y 2, diremos que (G, ) es unmonoide , como es el caso de los numeros enteros con la multiplicacion. Encualquier grupo G se cumplen las leyes de cancelacion:

1. a b = a c ⇒ b = c;

2. b a = c a ⇒ b = c

Estas leyes implican la unicidad de los inversos y la ley de inversion (ab)−1 =b−1 a−1.

Un grupo (G, ) es un grupo abeliano si la operacion es conmutativa,es decir, si a b = b a para cualesquiera a, b ∈ G. Por ejemplo, los numerosenteros con la suma forman un grupo abeliano.

Mas tarde en este curso tendremos la oportunidad de adquirir muchos ejem-plos de grupos abelianos y no abelianos. Podemos definir con facilidad los gruposde permutaciones:

Sea X un conjunto y sea P(X) el conjunto de funciones biyectivas (es decir,inyectivas y suprayectivas) de X sobre X. Dotemos a P(X) con la operacionbinaria de la composicion. Entonces P(X) es un grupo y si X tiene tres o maselementos, P(X) no es abeliano.

A partir de un conjunto X y de un grupo abeliano (G,+), podemos definirun grupo abeliano F (X,G) en donde:

F (X,G) = f |f : X → G .

Dadas f1, f2 ∈ F (X,G), se define f1 + f2 ∈ F (X,G) mediante la formula(f1 + f2)(x) = f1(x) + f2(x), x ∈ X. Dejamos al lector los detalles de la de-mostracion.

El concepto de campo sera fundamental en este curso.

Un conjunto E con dos operaciones binarias +, • es un campo si se cumplenlas siguientes propiedades:

1. (E,+) es un grupo abeliano con identico 0 ∈ E.

2. (E − 0 , •) es un grupo abeliano con identico 1 6= 0.

3. Para cualesquiera a, b, c ∈ E, se cumple la ley distributiva:

a • (b+ c) = a • b+ a • c

El unico inverso aditivo de un elemento a ∈ E se denota como −a y el unicoinverso multiplicativo de un elemento a ∈ E − 0 se representa como a−1. El

Capıtulo 1. Estructuras Numericas 7

producto a • b−1 se representa como ab .

Resumimos en un Teorema las propiedades basicas de los campos.

Teorema 1.2. Sea (E,+, •) un campo. Entonces se cumplen las siguientesafirmaciones:

1. Para cada a ∈ E, a • 0 = 0 • a = 0.

2. Si a, b ∈ E son arbitrarios, a•(−b) = (−a)•b = −a•b y (−a)•(−b) = a•b.

3. Si a, b, c, d ∈ E y si b 6= 0 6= d, entonces

a

b+c

d=ad+ bc

bd;a

b• cd

=a • cb • d

;a

b=a • db • d

Demostracion. 1) Tenemos

a • 0 = a • (0 + 0) = a • 0 + a • 0

Tambien, a•0+0 = a•0. Usando la ley de cancelacion para la suma obtenemosa • 0 = 0.

2) 0 = a•0 = a•(b+(−b)) = a•b+a•(−b). Tambien 0 = a•b+(−a•b). Usan-do nuevamente la ley de cancelacion para la suma, obtenemos a• (−b) = −a• b.Analogamente se prueba que (−a) • b = −a • b.

Tenemos (−a) + a = 0 = (−a) + −(−a). Por tanto, a = −(−a) para cadaa ∈ E. Reemplazando a por −a en la formula a • (−b) = (−a) • b, obtenemos(−a) • (−b) = a • b. Dejamos al lector la demostracion de 3).

Definimos la exponenciacion en un campo E.

Sea a ∈ E y n un numero natural. Entonces se define an como a • a • a · · · • a︸ ︷︷ ︸n veces

.

Definimos tambien a−n como (a−1)n y a0 = 1. Expresamos en un Teorema lastres leyes de los exponentes. Dejamos al lector su demostracion.

Teorema 1.3. Sea E un campo, sean a, b ∈ E y sean m,n numeros enteros.Entonces

1. am+n = am • an

2. (am)n = amn

3. (a • b)n = an • bn

Un subconjunto A de un campo E se llama conjunto inductivo si siempreque x ∈ A, tambien x + 1 ∈ A. El Principio de Induccion establece que elunico subconjunto inductivo de N que contiene a 1, es el propio N.

Capıtulo 1. Estructuras Numericas 8

En muchos teoremas matematicos se pueden construir enunciados Pn paracada natural n. Si podemos probar que el conjunto A = n|Pn es verdadero es inductivo y si 1 ∈ A, entonces, por el Principio de Induccion, todos losenunciados Pn son verdaderos. Como aplicacion de este concepto, probaremosel Teorema del Binomio . Consideremos el triangulo de Pascal

1 fila 01 1 fila 1

1 2 1 fila 21 3 3 1 fila 3

1 4 6 4 1 fila 41 5 10 10 5 1 fila 5

· · · · · · · · · · · · ·Para construir una nueva fila, digamos la fila n + 1 cuando conocemos la

fila n, escribimos abajo de cada dos elementos consecutivos la suma de ellos yanadimos el numero 1 al principio y al final. Ası, la fila 6 del triangulo de Pascalsera 1 6 15 20 15 6 1.

Denotemos a los n+ 1 terminos de la fila n como:(n0

) (n1

) (n2

) (n3

)· · ·

(nn

)Ası: (

60

)= 1

(61

)= 6

(62

)= 15

(63

)= 20(

64

)= 15

(65

)= 6

(66

)= 1

El Teorema del Binomio establece que si a, b son elementos de un campo Ey si n es un numero natural, entonces:

(a+ b)n =

(n0

)anb0+

(n1

)an−1b1+

(n2

)an−2b2+ · · ·+

+

(n

n− 1

)a1bn−1+

(nn

)a0bn.

Pongamos esta formula como un enunciado Pn. Claramente P1 es verdadero.Probemos que la validez de Pn implica la de Pn+1. Por el metodo de construcciondel triangulo de Pascal, tenemos:(

nk

)+

(n

k + 1

)=

(n+ 1k + 1

).

Por tanto,

Capıtulo 1. Estructuras Numericas 9

(a+ b)n+1 = (a+ b)n(a+ b)

=

(n0

)an+1b0+

(n1

)anb1+ · · ·+

(nn

)abn+

+

(n0

)anb1+

(n1

)an−1b2+ · · ·+

(nn

)a0bn+1

=

(n0

)an+1b0+

[(n0

)+

(n1

)]anb1+

+

[(n1

)+

(n2

)]an−1b2+ · · ·+

(nn

)a0bn+1

=

(n+ 1

0

)an+1b0+

(n+ 1

1

)anb1+ · · ·+

(n+ 1n+ 1

)a0bn+1

(Notese que

(n0

)=

(nn

)= 1 para cada n ∈ N)

Hemos probado entonces que tambien Pn+1 es verdadero.

Mediante el uso de factoriales, podemos calcular el valor de:(nk

)0 ≤ k ≤ n,

sin desarrollar el triangulo de Pascal.

El factorial del numero natural n, n! se define como el producto de todoslos naturales del 1 al n. Ası:

1! = 1

2! = 1 · 2 = 2

3! = 1 · 2 · 3 = 6

4! = 1 · 2 · 3 · 4 = 24

... =...

n! = 1 · 2 · 3 · · · (n− 1) · n.

Definimos para cada n ∈ N y cada k ∈ 1, 2, 3, · · · , n:(nk

)′=

n!

k!(n− k)!

El lector puede probar la formula(nk

)′+

(n

k + 1

)′=

(n+ 1k + 1

)′

Capıtulo 1. Estructuras Numericas 10

Por tanto, si el enunciado Pn establece que(nk

)=

(nk

)′para cada k ∈ 1, 2, · · · , n, con ayuda de las formulas(

nk

)+

(n

k + 1

)=

(n+ 1k + 1

)(nk

)′+

(n

k + 1

)′=

(n+ 1k + 1

)′podemos probar que cada Pn es verdadero. Si definimos 0! = 1 y

(nk

)=

n!k!(n−k)! para cada k ∈ 0, 1, 2, · · · , n, podemos escribir el Teorema del Binomio

en su formula tradicional:

(a+ b)n = an + nan−1b+n(n− 1)

2an−2b2 +

n(n− 1)(n− 2)

6an−3b3 + · · ·

Observese que(nk

)=

1

k!· n!

(n− k)!=

1

k!n(n− 1) · · · (n− k + 1)

El conjunto de los numeros reales R con sus dos operaciones +, · es el ejem-plo mas comun de campo. Esta tambien el subcampo Q de R que consiste delos numeros racionales a

b , en donde b es natural y a es entero. Otro ejemplo decampo sumamente conocido es el de los numeros complejos C.

Podemos visualizar C como el plano R× R con las operaciones:

(x, y) + (x′, y′) = (x+ x′, y + y′)

(x, y) · (x′, y′) = (xx′ − yy′, xy′ + x′y).

El identico aditivo es (0, 0) y el multiplicativo (1, 0). El elemento i = (0, 1)tiene la curiosa propiedad i2 = (−1, 0), ası que la ecuacion x2 + 1 = 0 tienesolucion en el campo C aunque no la tenga en R.

El llamado Teorema Fundamental del Algebra establece que todo poli-nomio monico con coeficientes complejos:

f(x) = xn + a1xn−1 + a2x

n−2 + · · ·+ an,

a1, a2, · · · an ∈ C, puede factorizarse completamente en la forma:

f(x) = (x− α1)(x− α2)(x− α3) · · · (x− αn)

Capıtulo 1. Estructuras Numericas 11

en donde α1, α2, α3, · · · , αn ∈ C. La demostracion de este teorema no es deltodo simple y no la presentamos en este texto.

Una diferencia esencial entre R y C es que R es ordenado y C no lo es.Aclaremos este concepto:

Un campo E es un campo ordenado si existe un subconjunto P ⊆ E conlas siguientes propiedades:

1. Para cada x ∈ E, exactamente uno de los tres siguientes enunciados esverdadero: x ∈ P , x = 0, −x ∈ P

2. Si x, y ∈ P , tambien x+ y ∈ P y xy ∈ P .

De las propiedades 1 y 2 deducimos que 1 ∈ P , pues si −1 ∈ P , tendrıamos(−1) · (−1) = 1 ∈ P , contradiciendo 1.

Si x, y ∈ E, decimos que x < y (x es menor que y) si y−x ∈ P . La expresiony > x es equivalente a x < y. x ≤ y significa que x < y o x = y. Los elementosde P son llamados elementos positivos y los de −P = −x|x ∈ P son ele-mentos negativos. Claramente E = P ∪ 0 ∪ (−P ) es una particion de E.

Incluimos en un Teorema las principales propiedades de un campo ordenado.Nuevamente dejamos al lector las demostraciones.

Teorema 1.4. Sea E un campo ordenado con positivos P . Se tiene:

1. 1 es positivo.

2. a < b, c ≤ d ⇒ a+ c < b+ d.

3. a < b, d positivo ⇒ ad < bd.

4. 0 ≤ a < b, 0 ≤ c < d ⇒ 0 ≤ ac < bd.

5. Si a es positivo, entonces a < 1 ⇔ 1 < 1a .

6. a > 1, n ∈ N ⇒ an−1 < an.

7. 0 < a < 1, n ∈ N ⇒ an−1 > an.

8. Si b y d son positivos, entonces ab <

cd ⇔ ad < bc.

Probemos por induccion la llamada desigualdad de Bernoulli.

Teorema 1.5. Sean E un campo ordenado, a ∈ E un elemento mayor o iguala −1 y n un numero natural. Entonces:

(1 + a)n ≥ 1 + na.

Capıtulo 1. Estructuras Numericas 12

Demostracion. La desigualdad es obviamente cierta si n = 1.

Suponiendo la validez de (1 + a)n ≥ 1 + na, tenemos:

(1 + a)n+1 = (1 + a)n(1 + a)

≥ (1 + na)(1 + a)

= 1 + na+ a+ na2

= 1 + (n+ 1)a+ na2

≥ 1 + (n+ 1)a.

De manera que la desigualdad se cumple para cada natural n.

Otra desigualdad importante es:

Teorema 1.6. Para cada natural n se cumple:

2−n+1 ≤ 1

n.

Dejamos al lector su demostracion.

Probemos ahora que el campo de numeros complejos C no es ordenado. Silo fuera, tendrıamos exactamente una de las tres propiedades siguientes: 1) i espositivo,2) i = (0, 0),3) −i es positivo.

Claramente 2) es falso. Si i > (0, 0), tendrıamos:

i2 = (−1, 0) = −(1, 0)

positivo. Por tanto, el identico multiplicativo (1, 0) y su inverso aditivo −(1, 0)son ambos positivos, una contradiccion. Por razones similares, −i tampocopuede ser positivo.

Si E es un campo ordenado y si a, b ∈ E satisfacen a < b, definimos:

(a, b) = x|a < x < b ,

[a, b) = x|a ≤ x < b ,

(a, b] = x|a < x ≤ b ,

[a, b] = x|a ≤ x ≤ b .

Los intervalos de la forma (a, b) se llamaran intervalos abiertos ; los de laforma [a, b] se llamaran intervalos cerrados .

Capıtulo 1. Estructuras Numericas 13

Si A ⊆ E no es vacıo, un elemento x ∈ E es cota superior de A si secumple a ≤ x para cada a ∈ A. Analogamente, x es cota inferior de A six ≤ a para cada a ∈ A. Decimos que A es acotado superiormente si A poseecotas superiores.

Un elemento x ∈ E es supremo de A si x es cota superior de A y para cadacota superior y de A, se tiene x ≤ y. Un conjunto acotado superiormente puedeno tener supremo, pero si lo tiene, este debe ser unico. Los conceptos acotadoinferiormente e ınfimo se definen de manera similar.

Una sucesion decreciente [a1, b1] ⊇ [a2, b2] ⊇ · · · de intervalos cerrados en uncampo ordenado E recibe el nombre de sucesion anidada . E es un campoarquimidiano si para cada a > 0 y cada x ∈ E, existe un numero natural ntal que na > x. Finalmente, E es un campo completo si cada subconjunto deE acotado superiormente, tiene un supremo.

Dos campos ordenados E1, E2 con positivos P1, P2 son isomorfos si existeuna biyeccion ϕ : E1 → E2 tal que para cada pareja x, y ∈ E1 se tiene:

ϕ(x+ y) = ϕ(x) + ϕ(y),

ϕ(x · y) = ϕ(x) · ϕ(y).

Enunciamos sin demostracion el siguiente Teorema:

Teorema 1.7. Todo campo ordenado completo es isomorfo a R. Por tanto, Res el unico campo ordenado completo salvo isomorfismos.

El campo Q de los numeros racionales no es completo. En efecto, bastaconsiderar A =

x ∈ Q|x <

√2

. Este conjunto no tiene supremo en Q. Sinembargo, Q es arquimidiano.

Probemos el siguiente importante Teorema.

Teorema 1.8. Un campo ordenado E es completo si y solo si E es arquimidianoy si cada sucesion anidada de intervales cerrados tiene interseccion no vacıa.

Demostracion. ⇒] Probemos que cada campo ordenado completo E es arqui-midiano.

Sean a ∈ E, a > 0 y x ∈ E. Debemos probar que x no es cota superior delconjunto L = na|n ∈ N. Si, por el contrario, x es cota superior de L y si λ0

es el supremo de L, tenemos:

λ0 − a < λ0

y, por tanto, λ0 − a no puede ser cota superior de L. Esto significa que existen ∈ N tal que λ0−a < na. Por tanto, λ0 < (n+ 1)a. Sin embargo, (n+ 1)a ∈ L.

Capıtulo 1. Estructuras Numericas 14

Esta contradiccion implica que L no es acotado superiormente.

Por lo tanto, existe n ∈ N tal que na > x y E es arquimidiano. Consideremosahora una sucesion anidada [an, bn]|n ∈ N de intervalos cerrados en E. Porhipotesis an ≤ bm para cada pareja n,m de numeros naturales.

Esto implica que el conjunto A = an|n ∈ N esta acotado superiormentey que cada bm es cota superior de A. Por hipotesis A tiene un supremo λ yclaramente am ≤ λ ≤ bm para cada m ∈ N; es decir,

λ ∈∞⋂m=1

[am, bm].

⇐] Sea L un subconjunto no vacıo de E acotado superiormente.

Entonces existe b1 ∈ E tal que x ≤ b1 para cada x ∈ L. Si b1 ∈ L, claramenteb1 es supremo de L.

Supongamos entonces que b1 /∈ L y escojamos un punto a1 ∈ L. Sea y1 =a1+b1

2 el punto medio del intervalo [a1, b1]. Si y1 es cota superior de L, pongamosa2 = a1, b2 = y1. Si y1 no es cota superior de L, existe a2 ∈ L tal que y1 < a2.Definamos en este caso b2 = b1.

Inductivamente, supongamos construidos intervalos:

[a1, b1] ⊇ [a2, b2] ⊇ · · · ⊇ [an, bn],

en donde b1, b2, · · · bn son cotas superiores de L, a1, a2, · · · , an ∈ L y

bk − ak ≤ 2−k+1(b1 − a1)

para cada k = 1, 2, · · · , n.

Sea yn = an+bn2 el punto medio del intervalo [an, bn]. Si yn es cota superior

de L, pongamos an+1 = an y bn+1 = yn. Si yn no es cota superior de L, existean+1 ∈ L tal que yn < an+1. En este caso pongamos bn+1 = bn.

De esta forma podemos construir una sucesion anidada de intervalos cerra-dos:

[an, bn]n∈Nen donde cada bn es cota superior de L, cada an ∈ L y

bn − an ≤ 2−n+1(b1 − a1)

para cada n ∈ N. Por hipotesis el conjunto:

∞⋂n=1

[an, bn]

Capıtulo 1. Estructuras Numericas 15

es no vacıo y por la propiedad arquimidiana de E, este conjunto consta de soloun elemento.

En efecto, si λ, µ ∈⋂∞n=1[an, bn], con λ < µ y si n ∈ N es tal que:

n >b1 − a1

µ− λ,

entonces, por el Teorema 1.6:

2−n+1(b1 − a1) ≤ 1

n(b1 − a1) < µ− λ ≤ bn − an ≤ 2−n+1(b1 − a1)

una contradiccion. Sea pues λ ∈ E el unico elemento de⋂∞n=1[an, bn]. Probare-

mos que λ es el supremo de L.

Si λ no fuera cota superior de L, existirıa x ∈ L con λ < x. Nuevamente,por la propiedad arquimidiana de E, existe n ∈ N tal que:

2−n+1(b1 − a1) < x− λ

Pero:bn − λ ≤ bn − an ≤ 2−n+1(b1 − a1) < x− λ

una contradiccion. Finalmente, si λ no fuera el supremo de L, existirıa µ ∈ E,cota superior de L, con µ < λ. Sea n ∈ N tal que 2−n+1(b1 − a1) < λ− µ. Portanto:

λ− an ≤ bn − an ≤ 2−n+1(b1 − a1) < λ− µ

y an > µ, una contradiccion. Ası, λ es el supremo de L.

Si E es un campo ordenado, E contiene como subcampo ordenado a losracionales , es decir, al conjunto

Q =mn|n > 0,m, n son enteros

.

Probemos la densidad de Q en E; es decir, el hecho de que cada intervaloabierto en E intersecta a Q:

Teorema 1.9. Sea E un campo ordenado arquimidiano y sea (a, b) un intervaloabierto arbitrario en E. Entonces

(a, b) ∩Q 6= ∅

Demostracion. Sin perdida de generalidad podemos suponer que b > 0, pues sib ≤ 0, podemos trabajar con el intervalo (−b,−a). Si m

n ∈ (−b,−a), entonces−mn ∈ (a, b) y hemos terminado.

Capıtulo 1. Estructuras Numericas 16

Debemos probar entonces que (a, b) ∩ Q 6= ∅ con la hipotesis adicional deque b > 0.

Aplicamos dos veces la propiedad arquimidiana y hallamos naturales n, ktales que 1

n < b − a y k ≥ nb. Si tomamos k mınimo con esta propiedad, tene-

mos k − 1 < nb, es decir, k−1n < b.

Necesariamente a < k−1n pues k−1

n ≤ a implicarıa que:

k

n=k − 1

n+

1

n< a+ (b− a) = b,

una contradiccion con k ≥ nb. Por tanto, k−1n ∈ (a, b) ∩ Q y la demostracion

esta completa.

Capıtulo 2

Espacios Metricos y Seudo-Metricos

Gran parte del Analisis Matematico se desarrolla en espacios vectoriales, es-pacios normados o espacios seudo-metricos, en los cuales podemos medir distan-cias entre puntos, entre conjuntos o entre funciones. Esto facilita notablementela teorıa de convergencia.

Empezaremos con algunas definiciones.

Definicion 2.1. Sea (V,+) un grupo conmutativo y sea F un campo. Decimosque V es un espacio vectorial sobre F si existe una funcion ϕ : F × V → Vla cual satisface las siguientes condiciones:

i) ϕ(α, v + v′) = ϕ(α, v) + ϕ(α, v′), α ∈ F , v, v′ ∈ V .

ii) ϕ(α+ β, v) = ϕ(α, v) + ϕ(β, v), α, β ∈ F , v ∈ V .

iii) ϕ(αβ, v) = ϕ(α,ϕ(β, v)), α, β ∈ F , v ∈ V .

iv) ϕ(1, v) = v, v ∈ V .

Normalmente se escribe αv en lugar de ϕ(α, v). Ası, la propiedad iii) puedereescribirse como (αβ)v = α(βv). Denotamos con el sımbolo 0 al elemento identi-co del grupo (V,+).

Los ejemplos mas usados de espacios vectoriales son los espacios euclidianosRn (n ∈ N) con la suma vectorial:

(x1, x2, ..., xn) + (y1, y2, ..., yn) = (x1 + y1, x2 + y2, ..., xn + yn)

y la multiplicacion por escalares:

α(x1, x2, ..., xn) = (αx1, αx2, ..., αxn).

Una forma rapida de construir espacios vectoriales es la siguiente:

Sea X un conjunto y F un campo. Considerese el conjunto V = ϕ(X,F ) queconsta de todas las funciones de X en F . Dadas f, g ∈ V , se define f + g ∈ Vcon la formula:

17

Capıtulo 2. Espacios Metricos y Seudo-Metricos 18

(f + g)(x) = f(x) + g(x) para cada x ∈ X.

Si α ∈ F , f ∈ V , definimos:

(αf)(x) = αf(x) para cada x ∈ X.

Mas tarde estudiaremos con mas detalle los espacios vectoriales.

Definimos a continuacion el concepto de norma en un espacio vectorial sobreel campo R.

Definicion 2.2. Sea V un espacio vectorial sobre R. Una norma en V es unafuncion φ : V → R que satisface las siguientes propiedades:

i) φ(v) ≥ 0 para cada v ∈ V .

ii) φ(v) = 0 si y solo si v = 0

iii) φ(αv) = |α|φ(v) para cada α ∈ R.

iv) φ(v + v′) ≤ φ(v) + φ(v′) para cada pareja v, v′ ∈ V .

Esta ultima propiedad recibe el nombre de desigualdad triangular en V .

Se suele escribir ||v|| en lugar de φ(v). Ası, la propiedad iv) se expresa como||v + v′|| ≤ ||v||+ ||v′||.

Definiremos a continuacion el concepto de producto interior en un espaciovectorial sobre R o sobre C.

Definicion 2.3. Sea V un espacio vectorial sobre el campo F , donde F = R oF = C. Un producto interior sobre V es una funcion B : V × V → F sujetaa las siguientes condiciones:

i) B(v, w) = B(w, v) para cada v, w ∈ V .

ii) B(v, w1 + w2) = B(v, w1) +B(v, w2) para cada v, w1, w2 ∈ V .

iii) B(v, αw) = B(αv,w) = αB(v, w) para cada α ∈ F y v, w ∈ V .

iv) B(v, v) ≥ 0 para cada v ∈ V y B(v, v) = 0 si y solo si v = 0

Usualmente se escribe v · w en lugar de B(v, w). Ası, la propiedad iii) seescribe como:

v · (αw) = (αv) · w = α(v · w) para cada α ∈ F y v, w ∈ V

Cada producto interior da lugar a una norma, como veremos a conti-nuacion.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 19

Teorema 2.4. Sea V un espacio vectorial sobre R o sobre C con productointerior. Para cada v ∈ V , defınase:

φ(v) = ||v|| =√v · v

Entonces φ es una norma sobre V .

Demostracion. Las propiedades i), ii) y iii) en la definicion 2.2 son evidentes.Para probar la desigualdad triangular, demostraremos primero:

Lema 2.5. (Desigualdad de Cauchy-Schwarz) Si v, w ∈ V son arbitrarios,entonces |v · w| ≤ ||v|| ||w||.

Esta desigualdad es evidente (y se convierte en igualdad) si existe un escalarλ ∈ F tal que v = λw o si w = 0. Supongamos entonces que este no es el caso.Tenemos entonces que ||v − λw|| > 0 para cada λ ∈ F . Como

||v − λw||2 = (v − λw) · (v − λw) = v · v − 2λ(v · w) + λ2(w · w)

tenemos, escogiendo λ = v·ww·w ,

v · v − 2(v · w)2

w · w+( v · ww · w

)2(w · w) > 0,

o bien, v · v − (v·w)2

w·w > 0 o (v · v)(w · w) > (v · w)2.

Pero v · v = ||v||2 y w · w = ||w||2. Por tanto, ||v|| ||w|| > |v · w|.

Con ayuda de la desigualdad de Cauchy-Schwarz, podemos probar la de-sigualdad triangular, llamada tambien la desigualdad de Minkowsky:

Sean v, w ∈ V arbitrarios. Entonces:

||v+w||2 = (v+w) · (v+w) = v · v+ 2(v ·w) +w ·w = ||v||2 + 2(v ·w) + ||w||2.

Por el Lema 2.5, v · w ≤ ||v|| ||w||. Por tanto,

||v + w||2 ≤ ||v||2 + 2||v|| ||w||+ ||w||2 = (||v||+ ||w||)2

es decir, ||v + w|| ≤ ||v||+ ||w||.

Pasemos ahora a definir los conceptos de seudo-metrica y el de metrica.

Definicion 2.6. Sea X un conjunto. Una funcion d : X × X → R es unaseudo-metrica en X si d satisface las siguientes propiedades:

i) 0 ≤ d(a, b) = d(b, a) para cada (a, b) ∈ X ×X.

ii) d(a, a) = 0 para cada a ∈ X.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 20

iii) (Desigualdad triangular)

d(a, c) ≤ d(a, b) + d(b, c) para cada (a, b, c) ∈ X ×X ×X

Una seudo-metrica d en X es una metrica si d satisface la propiedad adi-cional:

iv) d(a, b) = 0 implica que a = b.

Una forma sencilla de construir seudo-metricas es la siguiente:

Sea X un conjunto y g : X → R una funcion arbitraria. Dados a, b ∈ X,defınase:

dg(a, b) = |g(a)− g(b)|.

Resulta ademas que dg es metrica si y solo si g es inyectiva.

Otro ejemplo se obtiene a partir de una norma en un espacio vectorial.Sea V un espacio vectorial sobre R o sobre C y sea || · || una norma en V .

Defınase:d(v.w) = ||v − w||, v, w ∈ V.

De hecho d es una metrica en V .Partiendo del producto interior usual en Rn:

(v1, v2, ..., vn) · (w1, w2, ..., wn) = v1w1 + v2w2 + · · ·+ vnwn,

podemos construir la metrica pitagorica:

d((v1, v2, ..., vn), (w1, w2, ..., wn)) =√

(v1 − w1)2 + (v2 − w2)2 + · · ·+ (vn − wn)2

En efecto, d es la metrica asociada a la norma ||v|| =√v · v en Rn. Para

n = 1, obtenemos la metrica usual en R: d(x, y) = |x− y|, x, y ∈ R.

Definicion 2.7. Un espacio (seudo)-metrico es una pareja (X, d), en dondeX es un conjunto y d es una (seudo)-metrica en X.

Observemos que si (X, d) es un espacio seudo-metrico y A ⊆ X, entoncesdA = d|A×A : A × A → R es una seudo-metrica en A. Decimos entonces que(A, dA) es un subespacio de (X, d).

A continuacion probamos que el producto de dos espacios seudo-metricos sepuede seudo-metrizar de al menos tres maneras distintas:

Teorema 2.8. Sean (X1, d1), (X2, d2) espacios (seudo)-metricos. DefinamosX = X1 ×X2, y consideremos las tres siguientes funciones de X ×X → R:

d((a1, a2), (b1, b2)) = maxd1(a1, b1), d2(a2, b2)

d′((a1, a2), (b1, b2)) =√d1(a1, b1)2 + d2(a2, b2)2

Capıtulo 2. Espacios Metricos y Seudo-Metricos 21

d′′((a1, a2), (b1, b2)) = d1(a1, b1) + d2(a2, b2)

Entonces d, d′ y d′′ son (seudo)-metricas en X y se cumplen las desigual-dades:

d((a1, a2), (b1, b2)) ≤ d′((a1, a2), (b1, b2)) ≤ d′′((a1, a2), (b1, b2)) ≤ 2d((a1, a2), (b1, b2)).

Demostracion. Probaremos unicamente las desigualdades triangulares de d, d′

y d′′, dado que las otras propiedades son inmediatas.

Consideremos tres puntos (a1, a2), (b1, b2), (c1, c2) ∈ X1 × X2 y llamemosλ = d1(a1, b1), µ = d1(b1, c1), ν = d1(c1, a1), λ′ = d2(a2, b2), µ′ = d2(b2, c2),ν′ = d2(c2, a2). Sabemos, por las propiedades triangulares de d1 y d2, que ν ≤λ+µ y ν′ ≤ λ′+µ′. Como d((a1, a2), (b1, b2)) = maxλ, λ′, d((b1, b2), (c1, c2)) =maxµ, µ′ y d((c1, c2), (a1, a2)) = maxν, ν′ y como

maxλ, λ′+ maxµ, µ′ ≥ maxλ+ µ, λ′ + µ′ ≥ maxν, ν′,

concluimos que d satisface la propiedad triangular.

En cuanto a d′′, tenemos:

d′′((a1, a2), (b1, b2))+d′′((b1, b2), (c1, c2)) = λ+λ′+µ+µ′ ≥ ν+ν′ = d′′((a1, a2), (c1, c2)).

Para probar que d′ satisface la propiedad triangular, usamos la desigualdadde Minkowsky con los vectores (λ, λ′) y (µ, µ′):

d′((a1, a2), (c1, c2)) =√ν2 + ν′2

≤√

(λ+ µ)2 + (λ′ + µ′)2

≤√λ2 + λ′2 +

√µ2 + µ′2

= d′((a1, a2), (b1, b2)) + d′((b1, b2), (c1, c2)).

La ultima parte del enunciado se obtiene de las desigualdades

maxa, b ≤√a2 + b2 ≤ a+ b ≤ 2maxa, b,

en donde a y b son numeros reales mayores o iguales a cero.

Otro ejemplo interesante de espacio metrico es el cubo de Hilbert Iω, esdecir, el conjunto de todas las sucesiones xnn en el intervalo cerrado I = [0, 1].La metrica en Iω se define mediante la formula:

d(xnn, ynn) =

∞∑i=1

2−i|xi − yi|.

Dejamos al lector los detalles de la demostracion.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 22

Definicion 2.9. Sean (X, d) un espacio seudo-metrico, p ∈ X, A ⊆ X conA 6= ∅ y sea ε > 0. El disco con centro en p y radio ε , con respecto a laseudo-metrica d, denotado por V dε (p), se define como:

(a) V dε (p) = x ∈ X| d(p, x) < ε.

El disco basado en un subconjunto A, con la seudo-metrica d, de radio ε,denotado por V dε (A), se define como:

(b) V dε (A) =⋃ V dε (p) | p ∈ A.

Definicion 2.10. Un subconjunto A de un espacio seudo-metrico (X, d) esabierto ( o d-abierto si se considera mas de una seudo-metrica) si para cadap ∈ A, podemos hallar un numero positivo εp tal que V dεp(p) ⊆ A.

Observacion 2.11. Para cada subconjunto no vacıo A de un espacio seudo-metrico (X, d) y cada ε > 0, V dε (A) es abierto. En particular, V dε (p) es abiertopara cada p ∈ X.

Demostracion. Tomemos un elemento arbitrario p ∈ V dε (A). Entonces existe unelemento a ∈ A tal que p ∈ V dε (a). Tomando εp = ε − d(a, p) y x ∈ V dεp(p),tenemos:

d(p, x) < εp = ε− d(a, p),

Por tanto,d(a, x) ≤ d(a, p) + d(p, x) < ε,

es decir, x ∈ V dε (a) ⊆ V dε (A). Hemos probado entonces que V dεp(p) ⊆ V dε (A) y,

por tanto, V dε (A) es abierto.

Es conveniente expresar la negacion de ser abierto:

Observacion 2.12. Un subconjunto A de un espacio seudo-metrico (X, d) noes abierto si y solamente si existe un punto p ∈ A tal que para cada ε > 0 setiene V dε (p)

⋂(X −A) 6= ∅ .

De las dos observaciones anteriores 2.11 y 2.12, tenemos:

Corolario 2.13. Los conjuntos ∅ y X son siempre abiertos.

Teorema 2.14. (a) Toda interseccion finita de conjuntos abiertos en un es-pacio seudo-metrico (X, d) es tambien abierta.

(b) Toda union arbitraria (finita o infinita) de conjuntos abiertos en un espacioseudo-metrico (X, d) es tambien abierta.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 23

Demostracion. (a) Sean V1, V2, ..., Vn abiertos. Sin⋂i=1

Vi = ∅, la interseccion

es abierta por el corolario 2.13. Sin⋂i=1

Vi 6= ∅, escojamos p ∈n⋂i=1

Vi en for-

ma arbitraria. Por hipotesis, existen n numeros positivos ε1, ε2, ..., εn tales queV dεi(p) ⊆ Vi para cada i = 1, 2, ..., n. Si ε = mınε1, ε2, ..., εn, entonces V dε (p) ⊆n⋂i=1

V dεi(p) ⊆n⋂i=1

Vi y hemos terminado.

(b) Sea Vi | i ∈ J una coleccion arbitraria de conjuntos abiertos en X y esco-jamos un punto arbitrario p ∈ ∪Vi | i ∈ J. Existe entonces un ındice i0 ∈ J talque p ∈ Vi0 . Como Vi0 es abierto, existe εp > 0 tal que V dεp(p) ⊆ Vi0 . Claramente

Vi0 ⊆ ∪Vi | i ∈ J y, por tanto, V dεp(p) ⊆ ∪Vi | i ∈ J.

Corolario 2.15. Un subconjunto no vacıo A de un espacio seudo-metrico (X, d)es abierto si y solamente si A puede expresarse como una union de conjuntosde la forma V dε (p), con p ∈ X y ε > 0.

Ejemplo 2.16. Sea X un conjunto y d(a, b) = 1 si a 6= b y d(a, a) = 0 paracada a, b ∈ X. Ası, d recibe el nombre de metrica discreta en X. Entoncescada subconjunto A ⊆ X es abierto.

Definicion 2.17. Sean A,B subconjuntos no vacıos de un espacio seudo-metri-co (X, d). Definimos la distancia d(A,B), entre los conjuntos A y B con laformula:

d(A,B) = ınfd(a, b)| a ∈ A, b ∈ B.

Observacion 2.18. A∩B 6= ∅ implica obviamente que d(A,B) = 0. Sin embargopuede suceder simultaneamente que A ∩ B = ∅ y d(A,B) = 0. Por ejemplo,tomemos los conjuntos ajenos:

A = (x, y) ∈ R2| xy = 0,

B = (x, y) ∈ R2| xy = 1.

El lector verificara que para cada ε > 0 pueden hallarse puntos aε ∈ A y bε ∈ Btales que d(aε, bε) < ε. Por tanto, d(A,B) = 0.

Definicion 2.19. Sean A,B subconjuntos no vacıos de un espacio seudo-metri-co (X, d) y sea p ∈ X.

(1) A y B son conjuntos cercanos si d(A,B) = 0.

(2) p es punto de adherencia de A si p y A son conjuntos cercanos, esdecir, si para cada ε > 0, tenemos V dε (p) ∩A 6= ∅.

Definicion 2.20. Un subconjunto H de un espacio seudo-metrico (X, d) escerrado si X −H es abierto.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 24

Observacion 2.21. En todo espacio seudo-metrico (X, d) existen por lo menosdos subconjuntos que son abiertos y cerrados a la vez, a saber, ∅ y X. Si d es lametrica discreta, todo subconjunto de X es abierto y cerrado a la vez. Si d es lametrica usual en R, tenemos que cualquier intervalo [a, b] = x ∈ R| a ≤ x ≤ bes cerrado pero no es abierto.

Ademas en (R, d), los intervalos de la forma [a, b) = x ∈ R| a ≤ x < b ode la forma (a, b] = x ∈ R| a < x ≤ b no son ni abiertos ni cerrados. El lectordebe justificar cada una de estas afirmaciones.

Definicion 2.22. Sea A un subconjunto arbitrario de un espacio seudo-metricoX. La cerradura de A , denotada por A−, se define como:

A− = x ∈ X| x es punto de adherencia de A.

Teorema 2.23. (1) Para cada A ⊆ X, A− es un conjunto cerrado que con-tiene a A y esta contenido en cualquier conjunto cerrado que contenga aA.

(2) A ⊆ X es cerrado si y solo si A = A−.

Demostracion. (1) Es claro que siempre A ⊆ A−. Para probar que A− escerrado, probaremos que X − A− es abierto. Escojamos un punto arbitrariop ∈ X −A−.Como p y A no son cercanos, entonces existe un numero ε tal que:

V dε (p) ∩A = ∅.

Mas aun, tenemos V dε (p) ∩ A− = ∅. En efecto, si existiera un punto q ∈V dε (p) ∩ A− y tomamos δ > 0 tal que V dδ (q) ⊆ V dε (p) (usese la observacion2.11), debe existir un punto r ∈ V dδ (q) ∩ A. Pero entonces r ∈ V dε (p) ∩ A, unacontradiccion. Por tanto V dε (p) ⊆ X − A− y X − A− es abierto. Si K ⊆ Xes un cerrado que contiene a A y si p ∈ A−, necesariamente p ∈ K, pues delo contrario existirıa un numero ε > 0 tal que Vε(p) ⊆ X − K y, por tanto,Vε(p) ∩A = ∅, una contradiccion.

(2) Es consecuencia inmediata del inciso (1).

Teorema 2.24. (Propiedades basicas de los cerrados). Sea (X, d) un es-pacio seudo-metrico. Entonces:

(1) ∅ y X son ambos cerrados.

(2) Toda union finita de cerrados es cerrada.

(3) Toda interseccion arbitraria (finita o infinita) de cerrados en (X, d) escerrada.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 25

Demostracion. (2) SeanA1, A2, ..., An subconjuntos cerrados deX. Por la primeraley de DeMorgan, tenemos:

X −n⋃i=1

Ai =

n⋂i=1

(X −Ai).

Por hipotesis, cada X − Ai es un conjunto abierto. Por el teorema 2.14 inciso

(a),n⋂i=1

(X −Ai) es tambien abierto. Por tanto,n⋃i=1

Ai es un conjunto cerrado.

(3) Sea Hi | i ∈ J una familia arbitraria de subconjuntos cerrados de X.Por la segunda ley de DeMorgan, tenemos:

X −⋂Hi | i ∈ J =

⋃X −Hi | i ∈ J.

Por hipotesis, cada X − Hi es un conjunto abierto. Usando el teorema 2.14inciso (b), deducimos que

⋃X −Hi | i ∈ J es tambien abierto y, por tanto, el

conjunto⋂Hi | i ∈ J es cerrado.

Definicion 2.25. Sea A un subconjunto arbitrario de un espacio seudo-metrico(X, d) y sea p ∈ X.

(1) p es un punto interior de A si existe ε > 0 tal que V dε (p) ⊆ A.

(2) p es un punto exterior de A si existe ε > 0 tal que V dε (p) ∩A = ∅.

(3) p es un punto frontera de A si p no es punto interior ni exterior de A, esdecir, si para todo ε > 0, se tiene:

V dε (p) ∩A 6= ∅ y V dε (p) ∩ (X −A) 6= ∅.

Definicion 2.26. Definimos el interior de A como:

A0 = p ∈ X| p es punto interior de A,

el exterior de A como:

Ae = p ∈ X| p es punto exterior de A,

y la frontera de A como:

FrA = p ∈ X | p es punto frontera de A.

Teorema 2.27. (a) p es punto interior de A si y solo si p /∈ (X −A)−

. Portanto A0 = X − (X −A)

−.

(b) El conjunto A0 es siempre abierto, esta contenido en A y contiene acualquier conjunto abierto contenido en A.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 26

(c) p es punto exterior de A si y solo si p /∈ A−. Por tanto, Ae = X −A−.

(d) El conjunto Ae es siempre abierto, es ajeno a A y contiene a cualquierconjunto abierto ajeno a A.

(e) p es punto frontera de A si y solo si p ∈ A− y p ∈ (X −A)−

. Por tanto,FrA = A− ∩ (X −A)−.

(f) El conjunto FrA es siempre cerrado y

FrA = X − (A0 ∪Ae) = A− −A0.

Demostracion. (a) Sea p ∈ A0. Existe entonces un numero ε > 0 tal queV dε (p) ⊆ A o, lo que es lo mismo, V dε (p) ∩ (X − A) = ∅. Por tanto, p noes cercano a X −A, es decir, p /∈ (X −A)

−.

Recıprocamente, si p /∈ (X −A)−

, p pertenece al conjunto abierto W =X − (X −A)

−y, por tanto, existe un numero ε > 0 tal que V dε (p) ⊆W . Clara-

mente W ⊆ A por lo que V dε (p) ⊆ A, es decir, p es un punto interior de A.

(b) Como (X −A)−

es cerrado (teorema 2.23) y A0 = X − (X −A)−

, con-cluimos que A0 es abierto. Claramente A0 ⊆ A. Si V es abierto y V ⊆ A, paracada p ∈ V existe un numero εp > 0 tal que V dεp(p) ⊆ V . De donde V dεp(p) ⊆ A

y V ⊆ A0.Dejamos al lector la demostracion del resto del teorema.

Corolario 2.28. El conjunto A ⊆ X es abierto si y solo si A = A0. Ademas,los conjuntos A−A0 y A−−A tienen ambos interior vacıo y FrA = (A−A0)∪(A− −A). Sin embargo, no necesariamente (FrA)0 = ∅.

La prueba de este corolario de deja como ejercicio para el lector.

Teorema 2.29. Sean A,B subconjuntos arbitrarios de un espacio seudo-metrico(X, d). Entonces:

(1) (A ∪B)− = A− ∪B− y A ⊆ B implica A− ⊆ B−.

(2) (A ∩B)0 = A0 ∩B0 y A ⊆ B implica A0 ⊆ B0.

(3) A− −B− ⊆ (A−B)− y la inclusion inversa no es necesariamente cierta.

(4) FrA = Fr(X −A).

(5) Fr(A∪B) ⊆ FrA∪FrB y la inclusion inversa no es necesariamente cierta.

(6) FrA ∪ FrB = Fr(A ∪B) ∪ Fr(A ∩B) ∪ (FrA ∩ FrB).

Capıtulo 2. Espacios Metricos y Seudo-Metricos 27

Demostracion. (1) Ambos conjuntos (A ∪ B)− y A− ∪ B− son cerrados ycontienen aA∪B. Segun el teorema 2.23 inciso (1), (A∪B)− ⊆ A−∪B−. Laimplicacion C ⊆ D ⇒ C− ⊆ D− es evidente. Por lo tanto, de A ⊆ A∪By B ⊆ A∪B, deducimos que A− ⊆ (A∪B)− y B− ⊆ (A∪B)−. Entonces,A− ∪B− ⊆ (A ∪B)− y ambos conjuntos A− ∪B−, (A ∪B)− coinciden.

(2) Usando el inciso (a) del teorema 2.23 y el inciso (1) de este teorema 2.29,tenemos:

(A ∩B)0 = X − [X − (A ∩B)]−

= X − [(X −A) ∪ (X −B)]−

= X − [(X −A)− ∪ (X −B)−]

= [X − (X −A)−] ∩ [X − (X −B)−]

= A0 ∩B0.

La implicacion C ⊆ D ⇒ C0 ⊆ D0 es obvia.

(3) Tomemos un punto p ∈ A− − B−. Debemos probar que p es punto deadherencia de A − B. Sea ε > 0. Como p /∈ B−, existe ε′ > 0 tal queV dε′ (p) ∩ B = ∅. Si ε′′ = mınε, ε′, debemos tener V dε′′(p) ∩ A 6= ∅, puesp ∈ A−. Como V dε′′(p) ⊆ V dε′ (p) ⊆ X −B, tenemos:

∅ 6= V dε′′(p) ∩A = V dε′′(p) ∩ (A−B) ⊆ V dε (p) ∩ (A−B).

p es entonces un punto de adherencia de A−B, es decir:

p ∈ (A−B)−.

(4) Basta usar la formula FrC = C−∩(X−C)− tomando C = A y C = X−A,sucesivamente.

(5) Tomemos un punto p ∈ Fr(A ∪ B). Si p ∈ FrA, no tenemos mas quedemostrar. Debemos probar entonces que p /∈ FrA implica p ∈ FrB. Porel inciso (f) del teorema 2.27 tenemos p ∈ A0 o p ∈ Ae. Pero es imposibleque p ∈ A0, ya que:

A0 ⊆ (A ∪B)0 ⊆ X − Fr(A ∪B).

Por tanto, tenemos p ∈ Ae, es decir, p /∈ A−.En forma analoga, deducimos que p /∈ B0. Por tanto,

p ∈ Fr(A ∪B) ⊆ (A ∪B)− = A− ∪B− = A− ∪B0 ∪ FrB

y entonces p ∈ FrB.

(6) Usando los incisos (4) y (5) de este teorema 2.29, tenemos:

Fr(A ∩B) = Fr[X − (A ∩B)] = Fr[(X −A) ∪ (X −B)]

⊆ Fr(X −A) ∪ Fr(X −B) = FrA ∪ FrB.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 28

Por tanto, los tres conjuntos del lado derecho en la formula enunciada en(6) estan contenidos en FrA ∪ FrB.

Bastara probar entonces la inclusion:

FrA ∪ FrB ⊆ Fr(A ∪B) ∪ Fr(A ∩B) ∪ (FrA ∩ FrB).

o bien la inclusion:

(FrA− FrB) ∪ (FrB − FrA) ⊆ Fr(A ∪B) ∪ Fr(A ∩B).

Por simetrıa, basta probar que:

(FrA− FrB) ⊆ Fr(A ∪B) ∪ Fr(A ∩B).

Sea p ∈ FrA− FrB y supongamos que p /∈ Fr(A ∪B).

Probemos que p ∈ Fr(A ∩ B). Como p ∈ FrA ⊆ A− ⊆ (A ∪ B)− yp /∈ Fr(A∪B), tenemos que p ∈ (A∪B)0. La hipotesis p ∈ FrA implica quep /∈ A0 y, por tanto, p /∈ (A∩B)0. Falta probar entonces que p ∈ (A∩B)−.

Si p /∈ (A∩B)−, el abierto X−(A∩B)− contendrıa a p y estarıa contenidoen X − (A ∩ B) = (X − A) ∪ (X − B). Por tanto, el abierto V = (A ∪B)0− (A∩B)− contendrıa a p y estarıa contenido en (A∪B)− (A∩B) =(A−B) ∪ (B −A).

Por otro lado, la hipotesis p /∈ FrB implica que p /∈ B− o p /∈ (X − B)−.Si p /∈ B−, p pertenece al abierto V − B− el cual esta contenido enA − B ( ya que V ⊆ (A − B) ∪ (B − A) ). Pero este abierto es ajeno aX − A, contradiciendo la hipotesis p ∈ FrA. Si p /∈ (X − B)−, el abiertoV − (X−B)− contiene a p y esta contenido en B−A, lo cual nuevamentecontradice la hipotesis de que p ∈ FrA.

Deducimos entonces que p ∈ (A ∩B)− y la demostracion esta completa.

Definicion 2.30. Sean (X, d) un espacio seudo-metrico, A ⊆ X y p ∈ X.Decimos que p es punto de acumulacion de A si para cada ε > 0 tenemos(V dε (p)−p)∩A 6= ∅. Esta ultima afirmacion es equivalente a p ∈ (A−p)−.(Vease la definicion 2.19 inciso (2)).

El conjunto derivado de A , denotado por Aa, se define como:

Aa = p ∈ X | p es punto de acumulacion de A.

Teorema 2.31. Sea (X, d) un espacio seudo-metrico y sea A ⊆ X. Entonces:

(a) A− −A ⊆ Aa ⊆ A−.

(b) A− = A ∪Aa.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 29

(c) A es cerrado si y solo si A ⊇ Aa. Por tanto, Aa = ∅ implica que A escerrado.

Demostracion. (a) Sea p ∈ A− − A y ε > 0. Entonces (V dε (p) − p) ∩ A =V dε (p) ∩A 6= ∅ (pues p ∈ A−). Por tanto, p ∈ Aa y A− −A ⊆ Aa.

La inclusion Aa ⊆ A− se obtiene inmediatamente de aplicar cerraduras ala inclusion A− p ⊆ A.

(b) De A− − A ⊆ Aa obtenemos A− = (A− − A) ∪ A ⊆ Aa ∪ A. La inclusionAa ∪A ⊆ A− se obtiene del inciso (a) y de la inclusion obvia A ⊆ A−.

(c) Es consecuencia directa del inciso (b) y del teorema 2.23 inciso (2).

Observacion 2.32. (a) Sean p, q puntos de un espacio seudo-metrico (X, d).Entonces tenemos que d(p, q) = 0 ⇔ p− = q− y d(p, q) > 0 ⇔p− ∩ q− = ∅.

(b) Una seudo-metrica d en el conjunto X es una metrica si y solo si cadasubconjunto finito de X es cerrado.

(c) Si d es una metrica en el conjunto X y si A ⊆ X es arbitrario, entoncesAa es cerrado. Si p ∈ X , entonces p ∈ Aa si y solo si para cada ε > 0, elconjunto Vε(p) ∩A es infinito.

La prueba de la observacion 2.32 se deja como ejercicio para el lector.

Definicion 2.33. (a) Sea (X, d) un espacio seudo-metrico y sean A ⊆ B sub-conjuntos de X. Decimos que A es denso en B si A− = B−. Por tanto,A es denso en X si A− = X.

(b) El espacio seudo-metrico (X, d) es separable si existe A ⊆ X, A numerabley denso en X.

(c) Una coleccion de abiertos B = Vi | i ∈ J es base de (X, d) si para cadaabierto W , existe JW ⊆ J tal que:

W = ∪Vi | i ∈ JW .

(d) (X, d) es completamente separable si tiene una base numerable.

(e) Si X es un conjunto y U ⊆ P(X), decimos que U es cubierta de X siX = ∪L|L ∈ U. Dadas dos cubiertas U ,V de X, decimos que V essubcubierta de U si V ⊆ U .

(f) Una cubierta U de un espacio seudo-metrico (X, d) es una cubierta abiertasi cada L ∈ U es abierto en X.

(g) Un espacio seudo-metrico (X, d) es de espacio de Lindelof si cada cu-bierta abierta de X tiene una subcubierta numerable.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 30

Teorema 2.34. Sea (X, d) un espacio seudo-metrico y sea A ⊆ X un subcon-junto denso. Entonces:

B = V d1/n(a) | a ∈ A,n ∈ N

es base de (X, d).

Demostracion. Como V dε (x) | x ∈ X, ε > 0 es base de (X, d), basta probar quecada V dε (x) es union de miembros de B. Fijemos un punto y ∈ V dε (x). Escojamosn ∈ N tal que 1

n <12 (ε− d(x, y)). La densidad de A implica la existencia de un

elemento a ∈ A tal que d(a, y) < 1n . Por tanto, y ∈ V d1/n(a) ∈ B. Bastara probar

entonces que V d1/n(a) ⊆ V dε (x). Escojamos z ∈ V d1/n(a). Por tanto:

d(z, x) ≤ d(z, a)+d(a, y)+d(y, x) <1

n+

1

n+ d(y, x) <

(ε−d(x, y)

)+d(x, y) = ε.

Teorema 2.35. Si el espacio seudo-metrico (X, d) es completamente separable,entonces cada base B = Bi | i ∈ J de (X, d) contiene una subfamilia numerableque tambien es base de (X, d).

Demostracion. Sea Bo = V1, V2, ... una base numerable de (X, d). Probaremosque para cada k ∈ N, existe un conjunto numerable Jk ⊆ J tal que:

Vk = ∪Bi | i ∈ Jk.

Tomemos un punto arbitrario x ∈ Vk . Escojamos nx ∈ N e ix ∈ J tales quex ∈ Vnx ⊆ Bix ⊆ Vk . Por otro lado, tenemos que el conjunto A = n ∈ N | n =nx para alguna x ∈ Vk es numerable. Para cada n ∈ A, escojamos in ∈ J talque Vn ⊆ Bin ⊆ Vk. Si Jk = in | n ∈ A, es claro que Vk = ∪Bi | i ∈ Jk.La subfamilia numerable B∗ = Bi | i ∈

∞⋃k=1

Jk de B es claramente una base de

(X, d).

Teorema 2.36. Todo espacio seudo-metrico completamente separable (X, d) esde Lindelof.

Demostracion. Sea U = Ui | i ∈ J una cubierta abierta de X y sea B0 =V1, V2, ... una base numerable de (X, d). Para cada i ∈ J , escojamos unsubconjunto Ai ⊆ N tal que Ui = ∪Vj | j ∈ Ai. Sea A = ∪Ai | i ∈ J.Para cada entero k ∈ A, escojamos un ındice ik ∈ J tal que Vk ⊆ Uik . ComoX = ∪Vk | k ∈ A, deducimos que Uik | k ∈ A es una subcubierta numerablede U .

Teorema 2.37. En un espacio seudo-metrico (X, d), son equivalentes las sigu-ientes propiedades:

Capıtulo 2. Espacios Metricos y Seudo-Metricos 31

(a) (X, d) es separable.

(b) (X.d) es completamente separable.

(c) (X, d) es de Lindelof.

Demostracion. (a) ⇒ (b) es consecuencia del teorema 2.34 y (b) ⇒ (c) es elteorema 2.36. Probaremos (c) ⇒ (a). La propiedad de Lindelof implica quepara cada n ∈ N, existe An ⊆ X numerable tal que X = ∪V d1/n(a) | a ∈ An.El conjunto numerable A = ∪An | n ∈ N es entonces denso en X: En efecto,si p ∈ X y ε > 0 son arbitrarios, fijemos n ∈ N tal que 1

n < ε y ap ∈ An talesque p ∈ V d1/n(ap). Por tanto, d(p, ap) <

1n < ε y V dε (p) ∩A 6= ∅.

Corolario 2.38. Sea Bi | i ∈ J una familia de abiertos (no necesariamen-te cubierta) en un espacio seudo-metrico separable (X, d). Entonces existe unsubconjunto numerable J0 ⊆ J tal que:

∪Bi | i ∈ J = ∪Bi | i ∈ J0.

Demostracion. Por el teorema 2.37, (X, d) posee una base numerable V1, V2, ....Si C = ∪Bi | i ∈ J, es claro que Vk ∩ C | k ∈ N es una base numerable delespacio seudo-metrico (C, dc). Usando nuevamente el teorema 2.37, deducimosque el espacio (C, dc) es de Lindelof y, por tanto, la cubierta abierta Bi | i ∈ Jde (C, dc) tiene una subcubierta numerable.

Ejemplo 2.39. (1) El conjunto de numeros racionales Q es denso en (R, d),en donde d es la metrica usual de R.

(2) Sea (Xi, di), i = 1, 2, ..., n una coleccion finita de espacios seudo-metricos.Sea X = X1×X2× ...×Xn y defınase d : X×X → R mediante la formula

d((a1, a2, ..., an), (b1, b2, ..., bn)

)= maxdi(ai, bi) | i = 1, 2, ..., n.

Entonces d es una seudo-metrica en X llamada la seudo-metrica pro-ducto de X. Si Ai ⊆ Xi, con i = 1, 2, ..., n, son arbitrarios, entonces:

( n∏i=1

Ai)−

=

n∏i=1

A−i

y ( n∏i=1

Ai)0

=

n∏i=1

A0i .

(3) Todo producto finito de espacios seudo-metricos separables es tambien sep-arable.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 32

(4) Si d1, d2 son seudo-metricas en un mismo conjunto X y si τd1 , τd2 denotanlas familias de abiertos en los espacios (X, d1), (X, d2), res-pectivamente, entonces τd1 ⊆ τd2 si y solo si para cada p ∈ X y cada ε > 0,existe un numero δ = δp,ε > 0 tal que V d2δ (p) ⊆ V d1ε (p).

Demostracion. (1) Es consecuencia del Teorema 1.9

(2) Tomemos (p1, p2, ..., pn) ∈( n∏i=1

Ai)−

y sea ε > 0. Debemos probar que

V diε (pi) ∩Ai 6= ∅ para cada i = 1, 2, ..., n.

Escojamos (a1, a2, ..., an) ∈n∏i=1

Ai tal que:

d((p1, p2, ..., pn), (a1, a2, ..., an)

)< ε.

Por la definicion de d, tenemos di(pi, ai) < ε para cada i = 1, 2, ..., n , porlo que la inclusion: ( n∏

i=1

Ai)− ⊆ n∏

i=1

A−i

esta demostrada.

Recıprocamente, tomemos un punto (p1, p2, ..., pn) ∈n∏i=1

A−i y sea ε > 0.

Probaremos que V dε((p1, p2, ..., pn)

)∩

n∏i=1

Ai 6= ∅. Como pi ∈ A−i para cada

i = 1, 2, ..., n , existen puntos ai ∈ V diε (pi) ∩Ai, en donde i = 1, 2, ..., n.

Por tanto,

d((p1, p2, ..., pn), (a1, a2, ..., an)

)= maxdi(ai, pi) | i = 1, 2, ..., n < ε,

es decir, V dε((p1, p2, ..., pn)

)∩

n∏i=1

Ai 6= ∅.

Dejamos la demostracion del resto del inciso (2) y del inciso (3) comoejercicios para el lector.

(4) Supongamos que τd1 ⊆ τd2 y sean p ∈ X, ε > 0. Como p ∈ V d1ε (p) ∈ τd2 , elCorolario 2.15 implica la existencia de un numero δ > 0 tal que V d2δ (p) ⊆V d1ε (p).

Recıprocamente, si para cada p ∈ X y cada ε > 0 podemos hallar δ >0 tal que V d2δ (p) ⊆ V d1ε (p), debemos probar que τd1 ⊆ τd2 . Para estobastara probar que cada V d1ε (p) ∈ τd2 .

Escojamos un punto x ∈ V d1ε (p). Se prueba facilmente, utilizando la de-sigualdad triangular, que V d1ε−d(p1,x)(x) ⊆ V d1ε (p). Por hipotesis, existe un

numero δ > 0 tal que V d2δ (x) ⊆ V d1ε−d(p1,x)(x). Por tanto, V d2δ (x) ⊆ V d1ε (p)

y V d1ε (p) ∈ τd2 .

Capıtulo 2. Espacios Metricos y Seudo-Metricos 33

Ejemplo 2.40. El cubo de Hilbert es separable.

Ejercicio 1. Sean (X1, d1), (X2, d2), ..., (Xn, dn) espacios seudo-metricos ar-bitrarios. Sea X = X1 × X2 × ... × Xn y defınase la seudo-metrica d en Xcomo en el ejemplo 2.39 inciso (2). Definimos d′, d′′ : X ×X → R mediante lasformulas:

d′((a1, a2, ..., an), (b1, b2, ..., bn)

)=( n∑i=1

di(ai, bi)2)1/2

d′′((a1, a2, ..., an), (b1, b2, ..., bn)

)=

n∑i=1

di(ai, bi).

Pruebe que tambien d′ y d′′ son seudo-metricas en X y que τd = τd′ = τd′′ .

Definicion 2.41. Sean A,B subconjuntos arbitrarios de un espacio seudo-metrico (X, d). Definimos la operacion binaria en X, denotada por M, mediantela formula:

A M B = (A ∩B−) ∪ (A− ∩B).

Decimos que A y B son conjuntos separados (en X) si A M B = ∅.

Observacion 2.42. (1) A M B = ∅ implica A ∩ B = ∅, pero el recıproco noes necesariamente cierto. Por ejemplo, si A ⊆ X es abierto pero no escerrado, entonces A y FrA son ajenos pero no estan separados.

(2) Si A∩B = ∅ y si los conjuntos A,B son ambos cerrados o ambos abiertos,entonces A y B estan separados.

(3) Si A y B estan separados y si A1 ⊆ A y B1 ⊂ B, entonces A1 y B1 tambienestan separados.

(4) Si A, B y C son subconjuntos arbitrarios de X, entonces

A M (B ∪ C) = (A M B) ∪ (A M C).

Por tanto, si A esta separado de B y de C, entonces A tambien esta sep-arado de B ∪ C.

La demostracion de la observacion 2.42 se deja como ejercicio para el lector.

Definicion 2.43. Un subconjunto C de un espacio seudometrico X es un con-junto conexo si siempre que C = A ∪B, en donde A y B estan separados, setiene A = ∅ o B = ∅.

C ⊆ X es un conjunto disconexo si no es conexo, es decir, si existenconjuntos separados A, B tales que C = A ∪B, con A 6= ∅ 6= B.

Teorema 2.44. (1) Sea C ⊆ X conexo, con C ⊆ A ∪ B, A, B separados.Entonces C ⊆ A o C ⊆ B.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 34

(2) Si C ⊆ X es conexo y si C ⊆ D ⊆ C−, entonces D tambien es conexo. Enparticular, la cerradura de cada conjunto conexo es conexa.

(3) Un espacio seudometrico (X, d) es conexo si y solo si los unicos subcon-juntos de X abiertos y cerrados a la vez son ∅ y X.

(4) Un subconjunto finito C de un espacio metrico (X, d) es conexo si y solosi C contiene a lo mas un elemento.

(5) Si C ⊆ X es conexo y si Ci | i ∈ J es una familia de subconjuntosconexos de X tales que C M Ci 6= ∅ para cada i ∈ J , entonces C∗ =C ∪

⋃Ci | i ∈ J es tambien conexo. En particular, si C1, C2, ..., ... es

una sucesion (finita o infinita) de subconjuntos conexos de X y si Ci MCi−1 6= ∅ para cada i ≥ 2, entonces C1 ∪ C2 ∪ ... es conexo.

(6) Si X es conexo, si C ⊆ X es conexo y si X − C = P ∪ Q, en dondeP M Q = ∅, entonces los conjuntos C ∪ P y C ∪Q son ambos conexos.

(7) Si p, q son puntos arbitrarios de un espacio euclidiano Rn, entonces [p, q] =(1 − λ)p + λq | λ ∈ [0, 1] es un conjunto cerrado, acotado y conexo enRn.

Demostracion. (1) Supongamos, por el contrario, que C∩A 6= A y C∩B 6= B.Entonces, por la observacion 2.42 inciso (3), A1 = A ∩ C y B1 = B ∩ Cson no vacıos, estan separados y C = A1 ∪B1, contradiciendo el hecho deque C es conexo.

(2) Sean A, B conjuntos separados tales que D = A ∪ B. Por el inciso (1),tenemos C ⊆ A o C ⊆ B, digamos C ⊆ A. Por tanto, B ⊆ D ⊆ C− ⊆A− ⊆ X −B (Recuerdese que A M B = ∅). De aquı se deduce que B = ∅.Los incisos (3) y (4) se dejan como ejercicio para el lector.

(5) Sean A, B conjuntos separados tales que C∗ = A ∪ B. Por el inciso (1)tenemos C ⊆ A o C ⊆ B, digamos C ⊆ A.

Tambien por el inciso (1) tenemos Ci ⊆ A o Ci ⊆ B para cada i ∈ J .Pero es imposible que Ci ⊆ B para alguna i ∈ J , pues esto implicarıa queC M Ci ⊆ A M B = ∅, una contradiccion.

Por tanto, Ci ⊆ A para cada i ∈ J y el conjunto B es necesariamentevacıo. Para la ultima parte, se prueba por induccion, que para cada i > 1,el conjunto:

Di = Ci ∪ Cj | j < i

es conexo. Usando la primera parte, se deduce que:⋃i≥1

Ci =⋃i≥2

Di

es conexo.

Capıtulo 2. Espacios Metricos y Seudo-Metricos 35

(6) Probemos, por ejemplo, que el conjunto C ∪ P es conexo. Sean A, Bconjuntos separados tales que C ∪ P = A ∪ B. Aplicando el inciso (1),podemos suponer, sin perdida de generalidad, que C ⊆ A. Por tanto, co-mo B ⊆ C ∪ P y B ∩ C ⊆ B ∩ A = ∅, tenemos B ⊆ P . Del inciso(3) deducimos que B M Q = ∅. Pero tambien B M A = ∅. Por tan-to, de la observacion 2.42 inciso (4), tenemos B M (A ∪ Q) = ∅. PeroB ∪ (A ∪ Q) = (A ∪ B) ∪ Q = (C ∪ P ) ∪ Q = X. Como X es conexo,tenemos B = ∅ o A ∪Q = ∅. Por tanto, B = ∅ o A = ∅ y la demostracionesta completa.

(7) Para cada λ ∈ [0, 1], definamos χ(λ) = (1 − λ)p + λq. Sean A, B, conjun-tos separados tales que [p, q] = A ∪ B. Sin perder generalidad, podemossuponer que p = χ(0) ∈ A. Probaremos que B = ∅. Como [p, q] es cer-rado en Rn, deducimos que ambos conjuntos A, B son cerrados en Rn,pues A− ∩ [p, q] = A− ∩ (A ∪ B) = A ∪ (A− ∩ B) = A y B− ∩ [p, q] =B− ∩ (A ∪ B) = (B− ∩ A) ∪ B = B. Procediendo por contradiccion, su-pongamos que B 6= ∅. Existe entonces λ0 ∈ (0, 1] tal que χ(λ0) ∈ B.Definamos S ⊆ [0, 1] mediante:

S = λ ∈ [0, λ0] | χ(λ) ∈ A.

Claramente S 6= ∅ (pues 0 ∈ S) y S esta acotado superiormente por λ0.Por tanto, existe un numero λ∗ ∈ [0, λ0] tal que λ∗ = supS. Probaremosque χ(λ∗) /∈ A∪B. Esta contradiccion implicara que B = ∅. Si χ(λ∗) ∈ A,tenemos λ∗ < λ0 y, por tanto, para cada λ ∈ (λ∗, λ0], se cumple χ(λ) ∈ B.Sea ε > 0 tal que Vε(χ(λ∗)) ∩ B = ∅ y escojamos δ > 0 tal que δ <mınλ0 − λ∗, ε

‖q−p‖.

Calculemos la distancia entre los puntos χ(λ∗) y χ(λ∗ + δ):

‖χ(λ∗ + δ)− χ(λ∗)‖ = ‖(1− λ∗ − δ)p+ (λ∗ + δ)q − (1− λ∗)p− λ∗q‖

= ‖δ(q − p)‖ = δ‖q − p‖ < ε.

Por otro lado, λ∗+δ < δ0. Por tanto, el punto χ(λ∗+δ) pertenece a ambosconjuntos Vε(χ(λ∗)) y B, una contradiccion. Si, por otro lado, χ(λ∗) ∈ B,tenemos χ(λ) ∈ A para cada λ ∈ [0, λ∗), y si ε > 0 es tal que A ∩Vε(χ(λ∗)) = ∅, construyamos δ > 0 de manera que δ < mınλ∗, ε

‖q−p‖.Razonando como antes, deducimos que el punto χ(λ∗ − δ) pertenece aambos conjuntos A y Vε(χ(λ∗)). Esto concluye la demostracion.

Capıtulo 3

Convergencia y Continuidad

Definicion 3.1. Una sucesion en un conjunto X es una funcion ϕ : N → X.Denotamos:

ϕ = xn, en donde xn = ϕ(n) para cada n ∈ N o ϕ = xn∞n=1.

Definicion 3.2. Una sucesion xn es una sucesion estrictamente cre-ciente si m < n implica xm < xn.

Definicion 3.3. Sean ϕ, ψ sucesiones en un conjunto X. Decimos que ψ essubsucesion de ϕ si existe α : N→ N sucesion estrictamente creciente tal queψ = ϕ α. Denotamos:

ψ = xn(k), en donde n(k) = α(k) y xn(k)

= ϕ(n(k)).

Definicion 3.4. Un subconjunto A de un espacio seudo-metrico (X, d) es unconjunto acotado si existe M > 0 tal que d(a, a′) ≤ M para toda pareja(a, a′) ∈ A×A.

Ejemplo 3.5. A ⊆ X es acotado si y solo si existen p ∈ X y M > 0 tales queA ⊆ V dM (p).

Ejemplo 3.6. Toda union finita de conjuntos acotados es acotada.

Definicion 3.7. Una sucesion ϕ : N → X en el espacio seudo-metrico X esacotada si el conjunto ϕ(N) es acotado.

Definicion 3.8. Una sucesion rn en R es nula si para cada ε > 0, existen(ε) ∈ N tal que |rn| < ε para cada n ≥ n(ε).

Teorema 3.9. (a) Toda sucesion nula es acotada.

(b) La suma de dos sucesiones nulas (respectivamente acotadas) en R es nula(respectivamente acotada).

(c) Toda subsuceson de una sucesion nula es nula.

(d) Sean rn, sn sucesiones en R. Si rn es nula y sn es acotada, en-tonces rnsn es nula. Por tanto, el producto de dos sucesiones nulas esnulo.

36

Capıtulo 3. Convergencia y Continuidad 37

(e) Si rn es una sucesion nula en R y si k ∈ N, entonces k√|rn| es nula.

En particular, |rn| es nula si y solo si rn es nula.

(f) Si rn es una sucesion nula y si sn es una sucesion en R tal que |sn| ≤|rn| para cada n ∈ N, entonces sn es tambien nula.

Demostracion. (a) Sea rn una sucesion nula y tomemos ε = 1. Existe en-tonces un numero n(1) ∈ N tal que |rn| < 1 para cada n ≥ n(1). Portanto, el conjunto r1, r2, ... es acotado pues es la union del conjuntofinito rn | n < n(1) y el conjunto acotado rn| n ≥ n(1).

(b) Sean rn, sn sucesiones nulas y sea ε > 0. Existen entonces numerosnaturales n1, n2 tales que |rn| < ε/2 si n ≥ n1 y |sn| < ε/2 si n ≥ n2.Si n0 = maxn1, n2, tenemos que |rn + sn| ≤ |rn| + |sn| < ε para cadan ≥ n0. Si rn, sn son sucesiones acotadas, existen numeros M1 >0,M2 > 0 tales que |rn| ≤ M1, |sn| ≤ M2 para toda n ∈ N. Por tanto,|rn + sn| ≤ |rn|+ |sn| ≤M1 +M2 para toda n ∈ N.

(c) Este inciso es obvio.

(d) Por hipotesis, existe M > 0 tal que |sn| ≤M para cada n ∈ N. Como rnes nula, para cada ε > 0, existe un ındice n0 ∈ N tal que |rn| < ε

M paracada n ≥ n0. Por tanto:

|rnsn| = |rn||sn| <ε

M|sn| ≤ ε para cada n ≥ n0.

(e) Fijemos ε > 0. Por hipotesis, existe n0 ∈ N tal que |rn| < εk para cadan ≥ no. Por tanto, k

√|rn| < ε para cada n ≥ n0.

(f) Este inciso es obvio.

Definicion 3.10. (a) Una sucesion xn en un espacio seudo-metrico (X, d)converge a un punto p ∈ X si d(xn, p) es una sucesion nula, es decir,si para cada ε > 0 existe n0 ∈ N tal que xn | n ≥ n0 ⊆ V dε (p). Estehecho se denota como xn → p.

(b) Dos sucesiones xn,yn en un espacio seudo-metrico (X, d) son equiva-lentes si d(xn, yn) es una sucesion nula. Este hecho se denota comoxn ∼ yn.

Observacion 3.11. Sea xn una sucesion en un espacio seudo-metrico (X, d)y sea ψ : N → X una sucesion constante, digamos ψ(n) = p (p ∈ X) paracada n ∈ N. Entonces xn → p si y solo si xn ∼ ψ.

Teorema 3.12. (a) Sea xn, yn, zn sucesiones en el espacio seudo-metri-co (X, d) tales que xn ∼ yn y yn ∼ zn. Entonces xn ∼ zn.

(b) Sean xn, yn sucesiones equivalentes en (X, d) y supongamos xn → p.Entonces yn → p.

Capıtulo 3. Convergencia y Continuidad 38

(c) Sean xn, yn sucesiones en (X, d), las cuales convergen a un mismopunto p. Entonces xn ∼ yn.

(d) Es falso que xn → p si y solo si existe ε > 0 y existe una subsucesionxn(k)

de xn tal que d(p, xn(k)) ≥ ε para cada k ∈ N.

Demostracion. (a) Sea ε > 0. Existen entonces numeros n1, n2 ∈ N tales qued(xn, yn) < ε/2 para cada n ≥ n1 y d(yn, zn) < ε/2 para cada n ≥ n2. Sean0 = maxn1, n2 y tomemos n ≥ n0. Por tanto, d(xn, yn)+d(yn, zn) < ε.Como d(xn, zn) ≤ d(xn, yn)+d(yn, zn), concluimos que d(xn, zn) < ε paracada n ≥ n0 y, por tanto xn ∼ zn.

(b) y (c) son consecuencias inmediatas del inciso (a) y de la observacion (3.11).

(d) Se deja como ejercicio al lector.

Corolario 3.13. (a) Dos sucesiones constantes en un espacio metrico sonequivalentes si y solo si coinciden.

(b) Una sucesion en un espacio metrico no puede converger a mas de un punto.

Teorema 3.14. (a) Sean an, bn dos sucesiones en un espacio normado Xy supongamos que an → p y bn → q con p, q ∈ X. Entonces an+bn → p+q.

(b) Sea an una sucesion en un espacio normado X y sea c ∈ R. Si an → p(p ∈ X), entonces can → cp.

(c) Sean an, bn sucesiones en R o en C y supongamos que an → p ybn → q. Entonces anbn → pq.

(d) Sea an una sucesion en R−0 o en C−0 y supongamos que an → λ(λ 6= 0). Entonces:

1

an→ 1

λ.

Demostracion. (a) Basta probar que ‖an + bn − (p+ q)‖ es una sucesion nula.Pero ‖an+bn−(p+q)‖ = ‖(an−p)+(bn−q)‖ ≤ ‖an−p‖+‖bn−q‖ y cadauna de las sucesiones ‖an − p‖, ‖an − q‖ es nula. Entonces aplicandoel teorema (3.9) incisos (b) y (f) obtenemos la conclusion deseada.

(b) Basta notar que ‖can − cp‖ = |c|‖an − p‖ y aplicar el teorema (3.9) inciso(d).

(c) Tenemos |anbn− pq| = |anbn− pbn + pbn− pq| = |bn(an− p) + p(bn− q)| ≤|bn||an − p|+ |p||bn − q|. Y aplicamos el teorema (3.9) incisos (d) y (f).

Capıtulo 3. Convergencia y Continuidad 39

(d) En este caso:

∣∣ 1

an− 1

λ

∣∣ =|λ− an||λ||an|

.

Dado ε > 0, escojamos un natural n0 tal que n ≥ n0 implica que |an−λ| <mınλ

2ε2 , |λ|2 . Por tanto, n ≥ n0 implica que |an| ≥ |λ|2 , o bien, 1

|an| ≤2|λ| .

Finalmente, n ≥ n0 implica que:

∣∣ 1

an− 1

λ

∣∣ =|λ− an||λ||an|

<λ2ε

2· 1

|λ|· 2

|λ|= ε.

Lema 3.15. Sea x = (x1, x2, ..., xn) ∈ Rn. Entonces:

sup|x1|, |x2|, ..., |xn| ≤ ‖x‖ ≤ |x1|+ |x2|+ ...+ |xn|.

La demostracion del lema (3.15) se deja como ejercicio para el lector.

Corolario 3.16. Sea xk = (x1, x2, ..., xn) ∈ Rn con k = 1, 2, ... y sea p =(p1, p2, ..., pn). Entonces xk → p si y solo si para cada i = 1, 2, ..., n se tiene quexi → pi.

Demostracion. La demostracion de este corolario se obtiene aplicando el lema(3.15) con el vector xk − p y aplicando el teorema (3.9).

Definicion 3.17. Sea A un subconjunto de un espacio seudo-metrico (X, d),sea p ∈ A−, sea η0 la coleccion de sucesiones en A que convergen a p y seaη ⊆ η0 una subcoleccion no vacıa tal que si xn ∈ η y si xni es cualquiersubsucesion de xn, entonces xni ∈ η. Dada una funcion f : A → Y de Aen un espacio metrico (Y, ρ) y dada λ ∈ Y , decimos que el η-lımite de f esigual a λ (en sımbolos, lım

η→ff(x) = λ) si para cada sucesion an ∈ η se tiene

f(an)→ λ.

Observacion 3.18. Sean A, ρ, η, f, λ como en la definicion (3.17). Entonces esfalso que lım

η→pf(x) = λ si y solo si existen ε > 0 y una sucesion an ∈ η tales

que ρ(f(an), λ) ≥ ε para cada n ∈ N.

Ejemplo 3.19. (a) Si η = η0, escribimos lımx→p

f(x) en lugar de lımη0→p

f(x). La

propiedad lımx→p

f(x) = λ es equivalente a decir:

Para cada ε > 0, existe un numero δ > 0 tal que si x ∈ A∩V dδ (p) entoncesf(x) ∈ V ρε (λ).

Capıtulo 3. Convergencia y Continuidad 40

(b) Sea p ∈ Aa y sea η la coleccion de todas las sucesiones en A − pque convergen a p. Escribimos entonces lım

x→p,x6=pf(x) = λ en lugar de

lımη→p,x 6=p

f(x) = λ. La propiedad lımx→p,x 6=p

f(x) = λ es equivalente a decir:

Para cada ε > 0, existe un numero δ > 0 tal que si x ∈ (A− p)∩ V dδ (p)entonces f(x) ∈ V ρε (λ).

(c) Sea A ⊆ R, p ∈ R y supongamos que para cada ε > 0, se tiene (p, p +ε)∩A 6= ∅. (En este caso decimos que p es punto de acumulacion porla derecha del conjunto A). Tomemos η como la familia de sucesionesen A ∩ (p,∞) que convergen a p. Si existe lım

η→pf(x) lo denotamos por

lımx→p+

f(x). En forma analoga se define lımx→p−

f(x) cuando (p−ε, p)∩A 6= ∅

para cada ε > 0. (Decimos entonces que p es punto de acumulacionpor la izquierda del conjunto A).

Observacion 3.20. Si p ∈ A ∩ Aa y si lımη→p

f(x) = λ, entonces lımx→p

f(x) = λ.

Mas generalmente, si η, η′ son dos colecciones no vacıas de sucesiones de A queconvergen a p, si η′ ⊆ η y si cada subsucesion de una sucesion en η (respec-tivamente en η′) pertenece a η(respectivamente a η′), entonces lım

η→pf(x) = λ

implica que lımη′→p

f(x) = λ .

Con ayuda del teorema (3.14), se prueba facilmente:

Teorema 3.21 ( Algebra de lımites). Sean f, g : A → Y , en donde A esun subconjunto de un espacio seudo-metrico (X, d) y (Y, ‖ · ‖) es un espacionormado. Sean p ∈ A−, λ, µ ∈ Y , c ∈ R y sea η una familia de sucesiones enA con las propiedades descritas en la definicion (3.17). Supongase tambien quelımη→p

f(x) = λ y lımη→p

g(x) = µ. Entonces:

(a) lımη→p

(f(x) + g(x)) = λ+ µ.

(b) lımη→p

cf(x) = cλ.

(c) Si Y = R o Y = C y ‖ ‖ es el valor absoluto, entonces:

lımη→p

f(x)g(x) = λµ.

(d) Si Y es como en el inciso (c), si µ 6= 0 y si g(x) 6= 0 para cada x ∈ A,entonces:

lımη→p

f(x)

g(x)=λ

µ.

La demostracion del teorema (3.21) se deja como ejercicio para el lector.

Capıtulo 3. Convergencia y Continuidad 41

Ejemplo 3.22. Sea R∗ = R ∪ −∞,∞ y consideremos la biyeccion ϕ : R∗ →[−1, 1] definida como:

ϕ(−∞) = −1

ϕ(∞) = 1

ϕ(t) =t

1 + |t|, t ∈ R.

Con la ayuda de esta biyeccion, podemos metrizar R∗ mediante la formula:

d(t, t′) = |ϕ(t)− ϕ(t′)|.

Si f : R → Y es una funcion de R en un espacio metrico (Y, ρ) y si λ ∈Y , lım

x→∞f(x) = λ significa que lım

u→1−g(u) = λ, en donde g : (−1, 1) → Y

esta definida como g(u) = f(ϕ−1(u)). En forma analoga podemos definir elsignificado de lım

x→−∞f(x) = λ. Tenemos ademas las siguientes equivalencias:

(i) lımx→∞

f(x) = λ si y solo si para cada ε > 0, existe un numero M > 0 tal que

x ≥M implica que f(x) ∈ Vε(λ).

(ii) lımx→−∞

f(x) = λ si y solo si para cada ε > 0, existe un numero M < 0 tal

que x ≤M implica que f(x) ∈ Vε(λ).

Ejemplo 3.23. Sean A,X, Y, p como en el enunciado del teorema (3.21). Seanf : A → Y , h : A → R tales que lım

η→pf(x) = λ y lım

η→ph(x) = s. Si definimos

k : A→ Y con la formula k(x) = h(x)f(x), entonces existe lımη→p

k(x) y es igual

a sλ.

Demostracion. Sea xn ∈ η. Probaremos que k(xn)→ sλ. Tenemos:

‖k(xn)− sλ‖ = ‖h(xn)f(xn)− sλ‖ = ‖h(xn)f(xn)− sf(xn) + sf(xn)− sλ‖

≤ |h(xn)− s| ‖f(xn)‖+ |s| ‖f(xn)−λ‖ → 0 · (1 + ||λ||) + |s|0 = 0.

Definicion 3.24. Sea xn una sucesion en un espacio seudo-metrico (X, d)y sea p ∈ X. Decimos que xn se adhiere a p, o que p es un punto deadherencia de xn (lo cual se denota como xn 7→ p) si existe una subsucesionxn(k)

de xn tal que xn(k)→ p. Si n0 ∈ N, la n0-seccion An0

de xn sedefine como:

An0 = xn | n ≥ n0.

Capıtulo 3. Convergencia y Continuidad 42

Observacion 3.25. xn → p implica obviamente que xn 7→ p. Sin embargo, elrecıproco no es valido en general. Por ejemplo, si xn = (−1)n(1− 1

n ), tenemosxn 7→ 1 y xn 7→ −1 pero xn no converge a ningun punto.

Teorema 3.26. Sea A un subconjunto de un espacio seudo-metrico (X, d) y seap ∈ X. Entonces son equivalentes:

(a) p ∈ A−.

(b) Existe una sucesion an en A tal que an → p.

(c) Existe una sucesion an en A tal que an 7→ p.

Demostracion. (a) ⇒ (b). Por hipotesis, Vε(p) ∩ A 6= ∅ para cada ε > 0.Escojamos x1 ∈ V1(p)∩A, x2 ∈ V 1

2(p)∩A, ..., xn ∈ V 1

n(p)∩A. Claramente

xn es una sucesion en A que converge a p.

(b) ⇒ (c) Esta implicacion es obvia.

(c) ⇒ (a) Basta escoger una subsucesion an(k) de an que converge a p.

Si ε > 0 es arbitrario, existe un natural k0 tal que k ≥ k0 implica quean(k)

∈ Vε(p). Por tanto, Vε ∩A 6= ∅ para cada ε > 0 y p ∈ A−.

Teorema 3.27. Sea xn una sucesion en un espacio seudo-metrico (X, d) ysea p ∈ X. Entonces xn 7→ p si y solo si p ∈ A−n para cada n ∈ N, en dondeAn = xk | k ≥ n.

Demostracion. ( ⇒) Sea xn(k) una subsucesion de xn tal que xn(k) → p ysea n ∈ N arbitrario. Fijemos k ∈ N tal que n(k) > n.

Claramente xn(k), xn(k+1), xn(k+2), ... es una sucesion en An la cual con-verge a p, de manera que p ∈ A−n . (Teorema (3.26)).

( ⇐ ) Sabemos que p ∈ A−n para cada n ∈ N de manera que Vε(p) ∩ An 6= ∅para cada ε > 0 y cada n ∈ N. Sea n(1) ∈ N tal que xn(1) ∈ V1(p).

Como p ∈ A−n(1)+1 entonces existe n(2) > n(1) tal que xn(2) ∈ V1/2(p).

Inductivamente, supongamos construidos naturales n(1) < n(2) < ... <n(k) tales que xn(j) ∈ V1/j(p) para cada j = 1, 2, ..., k. Como p ∈ A−n(k)+1

tenemos que existe n(k+1) > n(k) tal que xn(k+1) ∈ V1/k+1(p). Por tanto,xn(k) es una subsucesion de xn, la cual converge a p, es decir, xn 7→ p.

Corolario 3.28. xn 7→ p si y solo si para cada ε > 0 y cada natural n0, existen ≥ n0 tal que d(p, xn) < ε.

Definicion 3.29. Un espacio seudo-metrico (X, d) es totalmente acotado sipara cada ε > 0, existe un conjunto finito Aε ⊆ X tal que X = Vε(Aε) =∪Vε(x) | x ∈ Aε.

Capıtulo 3. Convergencia y Continuidad 43

Observacion 3.30. Si (X, d) es totalmente acotado , si ε > 0 y si B ⊆ X sonarbitrarios, entonces existe un conjunto finito Lε ⊆ B tal que B ⊆ ∪Vε(x)|x ∈Lε.

Demostracion. Sean a1, a2, ..., an ∈ X tales que X =m⋃i=1

Vε/2(ai). Ordenemos

las Vε/2(ai) de manera que Vε/2(ai)∩B 6= ∅ si y solo si i ≤ s, para alguna s ≤ m.Escojamos bi ∈ Vε/2(ai)∩B, i = 1, ..., s. Claramente Vε(bi) ⊇ Vε/2(ai) para cadai = 1, ..., s. Por tanto, Lε = b1, b2, ..., bs cumple con los requisitos.

Definicion 3.31. En un espacio seudo-metrico (X, d), xn es una sucesionde Cauchy si para cada ε > 0, existe n0 ∈ N tal que d(xm, xn) < ε para cadapareja de naturales m,n ≥ n0.

Teorema 3.32. (a) Toda sucesion convergente es de Cauchy.

(b) Toda sucesion de Cauchy es acotada.

(c) Una sucesion xn en (X, d) es de Cauchy si y solo si xn es equivalentea cada una de sus subsucesiones.

(d) Si xn es de Cauchy y si xn 7→ p, entonces xn → p. Por tanto, p es puntode convergencia de xn si y solo si p es punto de adherencia de xn.

(e) Si xn ∼ yn y si xn es de Cauchy, tambien yn es de Cauchy.

Demostracion. (a) y (b) Se dejan como ejercicios para el lector.

(c) Supongamos que xn es de Cauchy y sea xn(k) una subsucesion de xn.

Sea ε > 0 y sea An0una seccion de xn tal que δ(Ano) < ε. Si k ≥ n0 ,

entonces xk, xn(k)∈ An0 . Por tanto, d(xk, xn(k)

) < ε y xk ∼ xn(k).

Recıprocamente, si xn no es de Cauchy, existe ε > 0 tal que para cadak ∈ N tenemos δ(Ak) > 2ε y, de aquı que, podemos encontrar un naturaln(k) > k tal que d(xk, xn(k)

) ≥ ε. Existe ademas, una cantidad infinitade posibles elecciones de n(k), pues de lo contrario, Ak contendrıa unaseccion As tal que d(xk, xj) < ε para cada j ≥ s y, entonces, δ(As) ≤ 2ε.Por tanto, existen naturales n(1) < n(2) < ... tales que d(xk, xn(k)

) ≥ εpara cada k ∈ N. Por tanto, xn no es equivalente a su subsucesionxn(k)

.

(d) Es una consecuencia del inciso (c) y del teorema (3.12) inciso (b).

(e) Aplıquese nuevamente el inciso (c).

Teorema 3.33. Todo espacio totalmente acotado es separable.

Capıtulo 3. Convergencia y Continuidad 44

Demostracion. Por hipotesis, para cada k ∈ N podemos encontrar un conjunto

finito Ak ⊆ X tal que X = V1/k(Ak). Sea A =∞⋃k=1

Ak. Basta probar que el

conjunto numerable A es denso en X, es decir, que para cada ε > 0 y cadap ∈ X, se tiene Vε(p) ∩ A 6= ∅. Sea k ∈ N tal que 1

k < ε y sea x ∈ Ak tal quep ∈ V1/k(x). Por tanto, x ∈ V1/k(p) ⊆ Vε(p) y Vε(p) ∩A 6= ∅.

Corolario 3.34. Todo espacio totalmente acotado tiene base numerable.

Demostracion. Aplıquese el teorema 2.37.

Definicion 3.35. Una sucesion xn en (X, d) es discreta si existe ε > 0 talque d(xm, xn) ≥ ε para cada pareja (m,n) de naturales distintos.

Teorema 3.36. En un espacio seudo-metrico (X, d), son equivalentes:

(1) (X, d) es totalmente acotado.

(2) Toda sucesion en X tiene una subsucesion de Cauchy.

(3) No existen sucesiones discretas en X.

Demostracion. (1) ⇒ (2) Sea xn una sucesion en X. Si xn tiene una sub-sucesion constante, no hay nada que demostrar. Supongamos que este noes el caso. Entonces tenemos que cada seccion Ck = xn | n ≥ k es unconjunto infinito. Como (X, d) es totalmente acotado, existe un conjuntofinito A1 ⊆ X tal que X = ∪V1/2(x) | x ∈ A1. Escojamos p1 ∈ A1

tal que V1/2(p1) ∩ C1 es un conjunto infinito y sea xn1∈ V1/2(p1) ∩

C1. Por la observacion (3.30), existe un conjunto finito A2 ⊆ V1/2(p1)tal que V1/2(p1) ⊆ ∪V1/4(x) | x ∈ A2. Escojamos p2 ∈ A2 tal queV1/2(p1) ∩ V1/4(p2) ∩ Cn1

sea un conjunto infinito. Sea n2 > n1 tal quexn2∈ V1/2(p1)∩V1/4(p2). Sea A3 ⊆ V1/2(p1)∩V1/4(p2) un conjunto finito

tal que V1/2(p1) ∩ V1/4(p2) ⊆ ∪V1/8(x) | x ∈ A3 y sea p3 ∈ A3 tal queV1/2(p1) ∩ V1/4(p2) ∩ V1/8(p3) ∩ Cn2

sea un conjunto infinito. Tomemosn3 > n2 tal que xn3 ∈ V1/2(p1) ∩ V1/4(p2) ∩ V1/8(p3) y continuemos esteproceso indefinidamente. La subsucesion ası cons-truıda xn1

, xn2, xn3

, ... es de Cauchy, pues para cada i ∈ N tenemos xnj ∈V1/2i(pi) para cada j ≥ i y , por tanto, j, j′ ≥ i implica que d(xnj , xnj′ ) ≤d(xnj , pi) + d(pi, xnj′ ) <

12i + 1

2i = 12i−1

(2) ⇒ (3) Esta implicacion es obvia.

(3) ⇒ (1) Si (X, d) no fuera totalmente acotado, existirıa un numero ε > 0 talque para cada conjunto finito A ⊆ X, tendrıamos X 6= Vε(A). Si elegimosx1 ∈ X arbitrariamente y despues x2 /∈ Vε(x1), x3 /∈ Vε(x1, x2), etc., lasucesion x1, x2, x3, ... serıa discreta, una contradiccion .

Capıtulo 4

Compacidad

Definicion 4.1. Un espacio seudo-metrico (X, d) es completo si cada sucesionde Cauchy en X es convergente.

Definicion 4.2. Un subconjunto K de un espacio seudo-metrico (X, d) es com-pacto si para cada coleccion de abiertos Vi | i ∈ J enX conK ⊆ ∪Vi | i ∈ J,existe J0 ⊆ J , J0 finito, tal que K ⊆ ∪Vi | i ∈ J0.

Observacion 4.3. Todo subconjunto finito de X es compacto; mas general-mente, toda union finita de compactos en X es compacta.

Demostracion. Sean K1,K2, ...,Ks compactos en X, con s ∈ N, sea K = K1 ∪K2 ∪ ... ∪ Ks y sea Vi | i ∈ J una coleccion de abiertos en X tal que K ⊆∪Vi | i ∈ J. Para cada t ∈ 1, 2, ..., s, escojamos un conjunto finito Jt ⊆ Jtal que Kt ⊆ ∪Vi | i ∈ Jt. Si J0 = J1 ∪ J2 ∪ ... ∪ Js, es claro que J0 es finito yK ⊆ ∪Vi | i ∈ J0. Por tanto, K es compacto.

Observacion 4.4. Todo compacto en (X, d) es acotado.

Demostracion. Escojamos arbitrariamente un punto p ∈ X. (Si X = ∅, el resul-tado es trivial). Si K ⊆ X es compacto, tenemos:

K ⊆ ∪Vn(p) | n ∈ N = X.

Entonces, existen n1 < n2 < ... < ns naturales tales que K ⊆s⋃i=1

Vni(p).

Por tanto, K ⊆ Vns(p) y K es acotado.

Observacion 4.5. Todo compacto K en un espacio metrico (X, d) es ce-rrado.

Demostracion. Podemos suponer que K 6= X. Elijamos cualquier punto p ∈X −K.

Probaremos que p /∈ K−, es decir, encontraremos un ε > 0 tal que Vε(p) ∩K = ∅.

45

Capıtulo 4. Compacidad 46

Para cada x ∈ K, definimos el numero positivo εx = 12d(x, p) ( εx > 0

pues d es metrica ). Como K es compacto, existen x1, x2, ..., xs ∈ K tales que

K ⊆s⋃i=1

Vεxi (xi). Si ε = mınεx1, εx2

, ..., εxn, tenemos Vε(p) ∩ K = ∅. En

efecto, si existiera un punto z ∈ Vε(p)∩K, tendrıamos z ∈ Vεxi (xi) para algunai ∈ 1, 2, ..., s. Por tanto,

d(p, xi) ≤ d(p, z) + d(z, xi) < ε+ εxi ≤ 2εxi = d(p, xi),

una contradiccion.

Corolario 4.6. Todo subconjunto compacto de un espacio metrico (X, d) escerrado y acotado.

Teorema 4.7. Un subconjunto K de un espacio seudo-metrico (X, d) es com-pacto si y solo si cada sucesion sn en K se adhiere a algun punto de K.

Demostracion. (⇒) Supongamos, por contradiccion, que existe una sucesionxn en K que no se adhiere a ningun punto de K. Esto significa, por el

teorema (3.27), que K ∩∞⋂n=1

A−n = ∅ en donde An = xk | k ≥ n. Pero

entonces:

K ⊆ X −∞⋂n=1

A−n =

∞⋃n=1

(X −A−n )

La compacidad de K implicarıa que K ⊆ X − A−n0para alguna n0 ∈ N,

contradiciendo el hecho de que xn0 ∈ K ∩An0 .

(⇐ ) Sea Vi | i ∈ J una cuberta abierta de K. La hipotesis y el teorema(3.36) implican que K es un subespacio totalmente acotado de X. Por elcorolario (3.34), K es de Lindelof, es decir, toda cubierta abierta de Ktiene una subcubierta numerable. Podemos entonces suponer, sin perdidade generalidad, que el conjunto J es numerable, digamos J = N. Para

cada n ∈ N, definimos Wn =n⋃i=1

Vi. Basta probar entonces, para concluir

la demostracion, que K ⊆ Wn para alguna n ∈ N. Supongamos, por elcontrario , que K −Wn 6= ∅ para cada n ∈ N. Escojamos x1 ∈ K −W1.Sea n1 ∈ N tal que x1 ∈ Wn1

. Suponiendo que n0 = 1 < n1 < ... < ns yx1, x2, ..., xs ∈ K ya han sido definidos de tal manera que xi ∈Wnj−Wnj−1

para cada j ∈ 1, 2, ..., s, definimos xs+1 de manera que xs+1 ∈ K −Wns

y sea ns+1 ∈ N tal que xs+1 ∈ Wns+1 . Por construccion, cada par deelementos de la sucecion x1, x2, ... son distintos entre sı. Si p ∈ K es talquexn 7→ p y si p ∈Wm para alguna m ∈ N, observemos que Wm intersectaa cada seccion de la sucesion x1, x2, ... y, por tanto, cada una de estasintersecciones es infinita. Sin embargo, Wm ⊆ Wns para alguna s ∈ N y,por tanto, Wm ∩ x1, x2, ... ⊆ x1, x2, ..., xs, una contradiccion.

Capıtulo 4. Compacidad 47

Teorema 4.8. Un espacio seudo-metrico (X, d) es compacto si y solo si escompleto y totalmente acotado.

Demostracion. (⇒) Por los teoremas (3.36) y (4.7) (X, d) es totalmente acota-do. Probaremos que (X, d) es completo. Tomemos una sucesion de Cauchyxn en X. Por el teorema (4.7), existe p ∈ X tal que xn 7→ p. Pero elinciso (d) del teorema (3.32) implica que xn → p.

(⇐) Sea xn una sucesion arbitraria en X. Por el teorema (3.36), xn tieneuna subsucesion de Cauchy xni. Por ser completo, existe p ∈ X tal quexni → p. Por tanto, xn 7→ p. Por el teorema (4.7), X es compacto.

Definicion 4.9. Un espacio metrico (X, d) es de Heine-Borel si toda sucesionacotada en X se adhiere a algun punto de X.

Teorema 4.10. Sea (X, d) un espacio de Heine-Borel. Entonces:

(a) La metrica d es completa.

(b) Cada cerrado acotado K ⊆ X es compacto.

(c) τd tiene una base numerable B = B1, B2, ..., en donde cada B−i es com-pacta.

Demostracion. (a) Sea xn una sucesion de Cauchy en (X, d). Por el inciso (b)del teorema (3.32), xn es acotada. Por ser (X, d) un espacio de Heine-Borel, xn tiene una subsucesion xni la cual converge a un punto p.Por el inciso (d) del teorema (3.32), tenemos xn → p. Por tanto, la metricad es completa

(b) Basta aplicar la hipotesis y el teorema (4.7).

(c) Fijemos un punto p ∈ N. Del inciso (b), para cada n ∈ N el conjuntoEn = V dn (p)− es compacto y claramente X = ∪En | n ∈ N. Entonces,el espacio (X, d) es de Lindelof, pues toda cubierta U de X tiene unasubfamilia finita Un que cubre a En y, por tanto, U∗ = ∪Un | n ∈ Nes una subfamilia numerable de U que cubre a X. Usando el teorema(2.37), deducimos que (X, d) es completamente separable. Para completarla demostracion, basta aplicar el teorema (2.35) con la base V dε (x) | ε >0, x ∈ X.

Corolario 4.11. Sea (X, d) un espacio de Heine-Borel. Entonces un subcon-junto K ⊆ X es compacto si y solo si K es cerrado y acotado.

Teorema 4.12 (Teorema de Weierstrass). Toda sucesion acotada xk enun espacio euclidiano Rn tiene al menos un punto de adherencia. Por tanto,todos los espacios euclidianos son espacios de Heine-Borel.

Capıtulo 4. Compacidad 48

Demostracion. Supongamos primero que n = 1. Escojamos un intervalo [a, b] enR tal que xk ∈ [a, b] para cada k ∈ N. Si xk tiene una subsucesion constante,no hay nada mas que demostrar. Si este no es el caso, el conjunto:

L = x ∈ R | x = xk para alguna k ∈ N

es infinito. Sea c1 = a+b2 el punto medio de [a, b]. Como L ⊆ [a, b], alguno de los

subintervalos [a, c1], [c1, b] contiene una infinidad de puntos de L. Escojamos yfijemos uno de ellos y llamemoslo I1 = [a1, b1]. Sea c2 = a1+b1

2 el punto mediode I1 y llamemos I2 = [a2, b2] a uno de los subintervalos [a1, c2], [c2, b1] quecontenga una infinidad de puntos de L. Continuando este proceso, podemosencontrar una sucesion anidada:

[a1, b1] ⊇ [a2, b2] ⊇ [a3, b3] ⊇ ...

de subintervalos de [a, b] tal que cada [an, bn] contiene una infinidad de puntosde L y tal que bn − an = 2−n(b− a) para cada n ∈ N. Es facil probar que paracada pareja de ındices i, j ∈ N, se tiene ai ≤ bj . Por tanto, si A = x ∈ R | x =ai para alguna i ∈ N y B = y ∈ R | y = bj para alguna j ∈ N, tenemosque cada bj ∈ B es cota superior de A y cada ai ∈ A es cota inferior de B. Sia∗ = supA y b∗ = ınf B, tenemos a∗ ≤ b∗.

Afirmamos que a∗ = b∗: Si, por el contrario, a∗ < b∗ y si n ∈ N es tal que2−n(b− a) < b∗ − a∗, existen ındices i0, jo tales que ai > a∗ − 2−n(b− a) parai ≥ io y bj < b∗ + 2−n(b− a) para j ≥ j0. Pero si s ≥ maxi0, j0, n, tenemosbs − as ≥ b∗ − a∗ > 2−n(b − a) ≥ 2−s(b − a), contradiciendo el hecho de quebs − as = 2−s(b− a). Hemos probado entonces que a∗ = b∗. Para cada m ∈ N,podemos encontrar un ındice s(m) tal que [as(m), bs(m)] ⊆

(a∗ − 1

m , a∗ + 1

m

).

De aquı que podemos escoger ındices k1, k2, ..., con k1 < k2 < ... y tales quexkm ∈ L∩ [as(m), bs(m)] para cada m ∈ N es facil probar entonces que xkm → a∗.

En el caso general, tomemos una sucesion acotada x1, x2, ... en Rn. Paracada k ∈ N escribimos:

xk = (xk1 , xk2 , ..., xkn).

Sean p = (p1, p2, ..., pn) ∈ Rn y M > 0 tales que:

xk ∈n∏i=1

[pi −M,pi +M ],

para cada k ∈ N.

Por el teorema (4.7), xk tiene una subsucesion y(1)k , en donde y

(1)k =

(y(1)k1, y

(1)k2, ..., y

(1)kn

) es tal que y(1)k1→ a1 para cierta a1 ∈ [p1 − M,p1 + M ].

Nuevamente por el teorema (4.7) y(1)k tiene una subsucesion y(2)

k , en donde

y(2)k = (y

(2)k1, y

(2)k2, ..., y

(2)kn

) es tal que y(1)k1→ a1 y y

(2)k2→ a2 para cierta a2 ∈

[p2 −M,p2 + M ]. Continuando este proceso, podemos encontrar una subsuce-

sion y(n)k de xk, en donde Y

(n)

k = (Y(n)k1

, Y(n)k2

, ..., Y(n)kn

), y un punto a =

Capıtulo 4. Compacidad 49

(a1, a2, ..., an) ∈n∏i=1

[pi −M,pi +M ] tal que Y(n)ki→ ai para cada i = 1, 2, ..., n.

Por el corolario (3.16), tenemos Y(n)

k → a y, por tanto, xk 7→ a.

Corolario 4.13 (Heine-Borel). Un subconjunto K ⊆ Rn es compacto si y solosi K es cerrado y acotado.

Lema 4.14. Sea H ⊆ X un conjunto no vacıo en el espacio seudo-metrico(X, d) y sean x, y ∈ X. Entonces:

|d(x,H)− d(y,H)| ≤ d(x, y).

.

Demostracion. Fijemos h ∈ H. Por tanto, d(x,H) ≤ d(x, h) ≤ d(x, y) + d(y, h),es decir, d(x,H)−d(x, y) ≤ d(y, h) para cada h ∈ H. Tomando el ınfimo respectoa h en el lado derecho de esta ultima desigualdad, obtenemos:

d(x,H)− d(x, y) ≤ d(y,H)

o bien,

d(x,H)− d(y,H) ≤ d(x, y).

Intercambiando los papeles de x, y, obtenemos tambien:

d(y,H)− d(x,H) ≤ d(x, y).

Por tanto, |d(x,H)− d(y,H)| ≤ d(x, y).

Teorema 4.15. Sean H,K subconjuntos ajenos no vacıos de un espacio metrico(X, d), en donde H es cerrado y K es compacto. Entonces existe un punto p ∈ Ktal que d(p,H) = d(H,K).

Demostracion. Sea λ = d(H,K) = ınfd(h, k) |h ∈ H, k ∈ K. Para cadan ∈ N, existen puntos xn ∈ H, yn ∈ K tales que d(xn, yn) < λ+ 1

n . Por tanto,d(yn, H) ≤ d(yn, xn) < λ + 1

n . Por ser K compacto, existe un punto p ∈ K yuna subsucesion yni de yn tales que yni → p. Por el lema (3.15), tenemos:

|d(yni , H)− d(p,H) ≤ d(yni , p).

Como d(yni , p) es una sucesion nula, tenemos d(yni , H) → d(p,H). Perod(yni , H) − λ < 1/ni y λ ≤ d(yni , H), por lo que tambien d(yni , H) → λ. Dedonde, λ = d(p,H).

Corolario 4.16. Sean H,K compactos ajenos no vacıos en el espacio metrico(X, d). Entonces existen puntos q ∈ H, p ∈ K tales que d(H,K) = d(p, q).

Capıtulo 4. Compacidad 50

Corolario 4.17. Sean H,K conjuntos ajenos no vacıos en el espacio de Heine-Borel (X, d), en donde K es compacto y H es cerrado. Entonces existen puntosq ∈ H, p ∈ K tales que d(H,K) = d(p, q).

Demostracion. Por el teorema (4.15), existe p ∈ K tal que d(H,K) = d(p,H) =λ. Definamos:

H∗ = x ∈ H |d(p, x) ≤ λ+ 1.

H∗ es no vacıo y coincide con la interseccion del cerrado H con el conjuntoacotado H1 = x ∈ X |d(p, x) ≤ λ+ 1. H1 es tambien cerrado, pues si xn esuna sucesion en H1, la cual converge a un punto q ∈ X, tenemos d(p, q) ≤ λ+1;si, por el contrario, tuvieramos ε = d(p, q) − (λ + 1) > 0, entonces existirıa unındice n0 ∈ N tal que d(xn, q) < ε para cada n ≥ n0. Por tanto:

d(p, xn0) ≥ d(p, q)− d(xn0 , q) = ε− d(xn0 , q) + λ+ 1 > λ+ 1,

una contradiccion. Por ser X un espacio de Heine-Borel, el conjunto H1 escompacto. Por tanto, H∗ es tambien compacto y existe un punto q ∈ H∗ talque d(p, q) = d(p,H∗).

Falta probar que d(p, q) = d(p,H). Sea h ∈ H. Si h /∈ H∗, tenemos d(p, h) >λ + 1 ≥ d(p, q) y si h ∈ H∗, por definicion de q, d(p, h) ≥ d(p, q). Por tanto,para cada h ∈ H, d(p, h) ≥ d(p, q) y d(p,H) = d(p, q).

Teorema 4.18. Sea K un compacto no vacıo en un espacio metrico (X, d).Entonces existen puntos p, q ∈ K tales que:

d(p, q) = δ(K) = supd(x, y) |x, y ∈ K.

Demostracion. Sea µ = δ(K). Para cada n ∈ N, existen puntos xn, yn ∈ Ktales que µ − 1

n < d(xn.yn). Por ser K compacto, yn tiene una subsuce-sion yni la cual converge a un punto q ∈ K. Analogamente, xni tiene unasubsucesion xnij la cual converge a un punto p ∈ K. Entonces, xnij → p,

ynij → q y µ − 1nij

< d(xnij , ynij ) ≤ µ para cada j ∈ N. Esto implica que

la sucesion d(xnij , ynij ) converge a µ. Pero tambien d(p, q) − d(xnij , ynij ) ≤d(p, xnij ) + d(q, ynij ) y la sucesion del lado derecho es una sucesion nula. Por

tanto, d(xnij , ynij ) converge tambien a d(p, q). Por consiguiente, debido a la uni-

cidad de los lımites de convergencia en espacios metricos, tenemos µ = d(p, q).

Lema 4.19. Sean A,B subconjuntos acotados no vacıos de un espacio metrico(X, d). Entonces:

δ(A ∪B) ≤ d(A,B) + δ(A) + δ(B).

Capıtulo 4. Compacidad 51

Demostracion. Fijemos dos puntos p, q ∈ A ∪ B. Si ambos puntos pertenecena A o ambos pertenecen a B, entonces d(p, q) ≤ δ(A) + δ(B). Por tanto, bastaprobar que si p ∈ A y q ∈ B, entonces:

d(p, q) ≤ d(A,B) + δ(A) + δ(B).

Si a ∈ A y b ∈ B son arbitrarios, tenemos:

d(p, q) ≤ d(p, a) + d(a, b) + d(b, p) ≤ d(a, b) + δ(A) + δ(B).

Tomando el ınfimo para a ∈ A y b ∈ B, tenemos:

d(p, q) ≤ d(A,B) + δ(A) + δ(B).

De donde, δ(A ∪B) ≤ d(A,B) + δ(A) + δ(B).

Ejemplo 4.20. Existen dos cerrados ajenos no compactos A,B en R tales qued(A,B) = 0. Por tanto, no existen puntos a ∈ A, b ∈ B tales que d(a, b) =d(A,B).

Basta tomar A = (x, y) ∈ R2 | xy = 0 y B = (x, y) ∈ R2 | xy = 1.

Definicion 4.21. Sea f : X → Y una funcion del espacio seudo-metrico (X, d)en el espacio seudo-metrico (Y, ρ) y sea p ∈ X. Decimos que f es continua enp si para cada sucesion xn en X que converge a p, se tiene que f(xn)→ f(p),es decir, lım

x→pf(x) = f(p).

Teorema 4.22. Conservemos la notacion de la definicion (4.21). Entonces lasproposiciones que siguen son equivalentes:

(1) f es continua en p.

(2) Si A ⊆ X y p ∈ A−, entonces f(p) ∈ f(A)−.

(3) Si xn es una sucesion en X y si xn 7→ p, entonces f(xn) 7→ f(p).

(4) Para cada ε > 0, existe δ > 0 tal que f(V dδ (p)) ⊆ V ρε (f(p)).

(5) Para cada K ⊆ Y tal que f(p) ∈ K0, se tiene p ∈ (f−1(K))0.

(6) Si B ⊆ Y y si p ∈ f−1(B)− entonces f(p) ∈ B−.

Demostracion. (1)⇒ (2) De acuerdo con el teorema (3.26) , existe una sucesionxn en A tal que xn → p. Por hipotesis, f(xn) → f(p). Como f(xn)es una sucesion en f(A), necesariamente f(p) ∈ f(A)−.

(2) ⇒ (3) Sea Ak = xn |n ≥ k. Sabemos que p ∈ A−k para cada k ∈ N(teorema (3.27)). Por hipotesis, f(p) ∈ f(Ak)− para cada k ∈ N, es decir,f(xn) 7→ f(p).

Capıtulo 4. Compacidad 52

(3) ⇒ (4) Si (4) es falso, existe ε > 0 tal que para cada δ > 0, se tienef(V dδ (p)) − V ρε (f(p)) 6= ∅. Tomando δ = 1

n , podemos encontrar un puntoxn ∈ X tal que d(xn, p) < 1/n pero ρ(f(xn), f(p)) ≥ ε. Claramente xn →p y, por lo tanto, tambien xn 7→ p. Por hipotesis tenemos f(xn) 7→ f(p).Pero f(p) no pertenece a la cerradura de ninguna seccion de la sucesionf(xn), ya que V ρε (f(p)) no contiene ningun punto de f(xn). Estacontradiccion demuestra que (4) se cumple.

(4) ⇒ (5) Sea ε > 0 tal que V ρε (f(p)) ⊆ K. Si δ > 0 satisface f(V dδ (p)) ⊆V ρε (f(p)), tenemos V dδ (p)) ⊆ f−1(K), ya que si x ∈ V dδ (p), tenemos f(x) ∈V ρε (f(p)) ⊆ K. Por tanto, p ∈ (f−1(K))0.

(5)⇒ (6) Suponiendo que f(p) /∈ B− y definiendo K = Y −B, tenemos f(p) ∈K0. Por tanto, p ∈ (f−1(K))0 = (X − f−1(B))0 = X − f−1(B)−, unacontradiccion.

(6) ⇒ (1) Sea xn una sucesion en X que converge a p. Probaremos quef(xn) → f(p). Sea ε > 0 y supongamos que ninguna seccion de f(xn)esta contenida en V ρε (f(p)). Existen entonces numeros naturales n1 <n2 < ... tales que ρ(f(xni), f(p)) ≥ ε para cada i ∈ N. Si B = f(xni) | i ∈N, tenemos que xni es una subsucesion de xn contenida en f−1(B).Como xn → p, tambien xni → p. Por hipotesis y por el teorema (3.27)tenemos f(p) ∈ B−, contrario al hecho de que V ρε (f(p)) ∩B = ∅.

Definicion 4.23. Una funcion f : X → Y es continua si para cada p ∈ X, fes continua en p.

Teorema 4.24. Si f : X → Y es una funcion del espacio seudo-metrico X en elespacio seudometrico Y , entonces las proposiciones siguientes son equivalentes:

1) f es continua.

2) Si V ⊆ Y es abierto, f−1(V ) tambien lo es.

3) Para cada subconjunto A ⊆ X, se tiene f(A−) ⊆ f(A)−.

4) Para cada subconjunto B ⊆ Y , se tiene f−1(B)− ⊆ f−1(B−).

5) Si H ⊆ Y es cerrado, f−1(H) tambien lo es.

Para demostrar este teorema basta usar el teorema (4.22)

Teorema 4.25. Sean f : X → Y , g : Y → Z dos funciones entre espaciosseudo-metricos y sea p ∈ X. Si f es continua en p y g es continua en f(p),entonces h = g f : X → Z es continua en p.

Demostracion. Sea xn una sucesion en X la cual converge a p. Por tanto,usando las hipotesis, tenemos f(xn) → f(p) y h(xn) = g(f(xn)) → g(f(p)) =h(p).

Capıtulo 4. Compacidad 53

Teorema 4.26. Sea f : X → Y una funcion continua y sea H ⊆ X un subcon-junto compacto de X. Entonces f(H) es un subconjunto compacto de Y .

Demostracion. Por el teorema (4.7), basta probar que toda sucesion yn enf(H) se adhiere a algun punto de f(H). Para cada n ∈ N, existe xn ∈ H talque yn = f(xn). Por el teorema (4.7), existe una subsucesion xni de xn yexiste un punto p ∈ H tales que xni → p. Por la continuidad de f , deducimosque f(xni)→ f(p) y la demostracion esta completa.

Ejemplo 4.27. Escojamos cualquier polinomio f(X) = a0Xk + a1X

k−1 + ...+ak−1X + ak en R[X] y sea A ⊆ R un conjunto arbitrario. Entonces la funciong : A→ R definida con la formula g(a) = f(a) con a ∈ A es continua.

Demostracion. Sea xn una sucesion en A convergente a un punto p ∈ A. Por

el teorema (3.9), f(xn)− f(p) =k∑j=0

(aj(xk−jn − pk−j) es una sucesion nula. Por

tanto, f(xn)→ f(p) y la funcion g es continua.

Teorema 4.28. Sean (X1, d1), (X2, d2) espacios seudo-metricos y sea X =X1×X2. Seudo-metricemos X con la funcion d

((a1, a2), (b1, b2)

)= d1(a1, b1) +

d2(a2, b2), en donde (a1, a2), (b1, b2) ∈ X1 ×X2. Sean xn, yn sucesiones enX1, X2, respectivamente. Si (p1, p2) ∈ X1 ×X2, entonces (xn, yn)→ (p1, p2) siy solo si xn → p1 y yn → p2.

Demostracion. Si (xn, yn)→ (p1, p2), tenemos d1(xn, p1)+d2(yn, p2)→ 0. Por elteorema (3.9) inciso (f), tenemos d1(xn, p1)→ 0 y d2(yn, p2)→ 0, es decir, xn →p1 y yn → p2. Recıprocamente, si xn → p1 y yn → p2, tenemos d1(xn, p1) → 0y d2(yn, p2)→ 0.

Aplicando el teorema (3.9) inciso (b), tenemos d1(xn, p1) + d2(yn, p2) → 0,es decir, d

((xn, yn), (p1, p2)

)→ 0 y, por tanto, (xn, yn)→ (p1, p2).

Definicion 4.29. Dos espacios seudo-metricos (X, d), (X ′, d′) son homeo-morfos si existe una funcion biyectiva y continua f : (X, d) → (X ′, d′) talque f−1 : (X ′, d′) → (X, d) es tambien continua. Este hecho se expresa como(X, d) ≈ (X ′, d′). Dos metricas d, d′ en un mismo conjunto X son equivalentessi (X, d) ≈ (X, d′).

Observacion 4.30. Dos espacios seudo-metricos (X, d), (X ′, d′) son homeo-morfos si y solo si existe una biyecion ϕ : X → X ′ tal que para cada V ⊆ X setiene que V ∈ τd ⇔ ϕ(V ) ∈ τd′ . Por tanto dos seudometricas d, d′ en un mismoconjunto son equivalentes si y solo si τd = τd′ .

Para demostrar esta observacion basta aplicar el teorema (4.24).

Capıtulo 4. Compacidad 54

Teorema 4.31. Sean d, d′ seudo-metricas en un mismo conjunto X. Entoncesτd′ ⊆ τd si y solo si para cada sucesion xn en X y cada punto p ∈ X, se tiened(xn, p)→ 0 implica que d′(xn, p)→ 0. Por tanto, d y d′ son equivalentes si solosi para cada sucesion xn en X y cada p ∈ X, las aseveraciones d(xn, p)→ 0y d′(xn, p)→ 0 son equivalentes.

Demostracion. τd′ ⊆ τd es equivalente a afirmar que la funcion identica id :(X, d)→ (X, d′) es continua. Aplıquese entonces el teorema (4.24).

Ejemplo 4.32. Si (Xi, di) con i = 1, 2, 3 son espacios seudo-metricos, entonceslos espacios (X1 ×X2)×X3 y X1 × (X2 ×X3) son homeomorfos.

Teorema 4.33. Sea f : (X, d)→ (Y, ρ) una funcion continua y sea C ⊆ X unconjunto conexo. Entonces el conjunto f(C) es tambien conexo.

Demostracion. Sean A,B ⊆ Y conjuntos separados tales que f(C) = A ∪ B.Probaremos que A = ∅ o B = ∅. Afirmamos que f−1(A) y f−1(B) son subcon-juntos separados de X, ya que:

f−1(A)− ∩ f−1(B) ⊆ f−1(A−) ∩ f−1(B) = f−1(A− ∩B) = ∅

y

f−1(A) ∩ f−1(B)− ⊆ f−1(A) ∩ f−1(B−) = f−1(A ∩B−) = ∅.

Ademas, es claro que C ⊆ f−1(A)∪f−1(B). Usando el inciso (1) del teorema(2.44) deducimos que C ⊆ f−1(A) o C ⊆ f−1(B). Por tanto, f(C) ⊆ A of(C) ⊆ B, es decir, B = ∅ o A = ∅. Hemos probado entonces que el conjuntof(C) es conexo.

Teorema 4.34. Un subconjunto no vacıo K ⊆ R es compacto y conexo si ysolo si existen p, q ∈ R, p ≤ q, tales que K = [p, q].

Demostracion. Usando el inciso (1) del teorema (2.44) y el teorema (4.10), de-ducimos que cada intervalo cerrado [p, q] es compacto y conexo. Recıprocamente,si K ⊆ R es compacto y conexo, K esta acotado inferior y superiormente y Kes convexo. Si p = ınf K y q = supK, tenemos p, q ∈ K (ya que K es cerrado) yK ⊆ [p, q]. Pero por la convexidad de K, tenemos tambien que [p, q] ⊆ K. Portanto, K = [p, q].

Corolario 4.35. Sea y un numero real positivo y sea n ∈ N. Entonces existeun unico real positivo λ tal que λn = y.

Demostracion. Supongamos primero que y ≥ 1 y consideremos la funcion f :R→ R definida mediante la formula f(x) = xn. Por el teorema (4.34), tenemosf([1, y]) = [1, yn]. Como y ∈ [1, yn], existe λ ∈ [1, y] tal que f(λ) = y. Si

Capıtulo 4. Compacidad 55

0 < y < 1, encontramos primero un numero λ > 1 tal que λn = 1y . Por tanto, si

µ = 1λ , tenemos µn = y. Esto completa la demostracion.

Ejemplo 4.36. Sea f : X → R una funcion continua, en donde X es conexo.Si x1, x2 ∈ X y f(x1) < c < f(x2), entonces existe x3 ∈ X tal que f(x3) = c.Por tanto, cualquier funcion continua f : X → R que tome valores positivos yvalores negativos, satisface 0 ∈ f(X).

Ejemplo 4.37. Sean (X1, d1), (X2, d2) dos espacios seudo-metricos y sea X =X1×X2. Demostrar que las tres siguientes funciones d, d′, d′′ : X ×X → R sonseudo-metricas equivalentes en X:

d((a1, a2), (b1, b2)

)= d1(a1, b1) + d2(a2, b2),

d′((a1, a2), (b1, b2)

)= maxd1(a1, b1), d2(a2, b2),

d′′((a1, a2), (b1, b2)

)=√d1(a1, b1)2 + d2(a2, b2)2.

Sugerencia: Probar que para cada ε > 0 y cada p ∈ X, se tiene V d′

ε/2(p) ⊆V dε (p) ⊆ V d′′ε (p) ⊆ V d′ε (p).

Ejemplo 4.38. Generalizar el ejercicio anterior a productos finitos de espaciosseudo-metricos.

Teorema 4.39. Sea (X1, d1), (X2, d2), ... , (Xn, dn) una familia finita de espa-cios metricos no vacıos y sea X = X1×X2× ...×Xn. Defıınase d : X×X → Rmediante la formula:

d((a1, a2, ..., an), (b1, b2, ..., bn)

)= maxd1(a1, b1), ..., dn(an, bn).

Entonces d es una metrica en X y el espacio (X, d) es completo (respectiva-mente, totalmente acotado, respectivamente, compacto) si y solo si cada uno delos espacios (Xi, di) tiene la propiedad respectiva.

Demostracion. Observese primero que cada una de las proyecciones πi : (X, d)→(Xi, di) es continua y suprayectiva. De hecho, para cada pareja de puntosa = (a1, a2, ..., an), b = (b1, b2, ..., bn) enX, se tiene di(ai, bi) = di(πi(a), πi(b)) ≤d(a, b) para cada i = 1, 2, ..., n. Por tanto, si xk es una sucesion de Cauchyen (X, d), entonces πi(xk) es una sucesion de Cauchy en (Xi, di). Por tanto,si cada espacio (Xi, di) es completo, tambien (X, d) es completo (usese el teore-ma (4.28)). Recıprocamente, si (X, d) es completo y para cada i ∈ 1, 2, ..., nescogemos un punto ai ∈ Xi, entonces (Xj , dj) es completo para cada j ∈1, 2, ..., n, ya que (Xj , dj) es isometrico a:

Lj = (a1, a2, ..., aj−1, x, aj+1, ..., an) |x ∈ Xj

Capıtulo 4. Compacidad 56

y Lj es cerrado en X. Supongamos ahora que cada espacio (Xi, di) es totalmenteacotado y sea xk una sucesion arbitraria en X. Tomemos una subsucesion

y(1)k de xk tal que π1(y

(1)k ) es una sucesion de Cauchy en (X1, d1). Sea

ahora y(2)k una subsucesion de y(1)

k tal que π2(y(2)k ) es una sucesion de

Cauchy en (X2, d2). Continuando este proceso, encontramos una subsucesion

y(n)k de xk tal que para cada i ∈ 1, 2, .., n, πi(y(n)

k ) es una sucesion

de Cauchy en (Xi, di). Probemos que y(n)k es una sucesion de Cauchy en

(X, d): Dado ε > 0, existen ındices k1, k2, ..., kn tales que k, k′ ≥ ki implica

di(πi(y

(n)k ), πi(y

(n)k′ )

)< ε. Tomando k0 = maxk1, k2, ..., kn, es facil probar que

k, k′ ≥ k0 implica d(y(n)k , y

(n)k′ ) < ε. Por tanto, (X, d) es totalmente acotado.

Recıprocamente, si (X, d) es totalmente acotado y definimos Li ⊆ X con i ∈1, 2, ..., n como antes, entonces cada Li es totalmente acotado y lo mismo esvalido para su copia isometrica (Xi, di). El resto del teorema se desprende delteorema (4.8).

Teorema 4.40. Sean (X1, d1), (X2, d2), ... , (Xn, dn) espacios metricos novacıos y defınase el espacio metrico (X, d) como en el teorema (4.39). Entonces(X, d) es conexo si y solo si cada espacio (Xi, di) con i = 1, 2, ..., n es conexo.

Demostracion. Utilizando el hecho de que para cada terna i, j, k de ındices, losespacios Xi× (Xj ×Xk) y (Xi×Xj)×Xk son homeomorfos, podemos suponerque n = 2. Si (X, d) es conexo, usamos la continuidad y la suprayectividad delas proyecciones π1 : X → X1, π2 : X → X2 y el teorema (4.33) para deducirque ambos espacios (X1, d1) (X2, d2) son conexos.

Recıprocamente, supongamos que (X1, d1) y (X2, d2) son conexos. Fijemosun punto (p, q) ∈ X = X1×X2. Es obvio que para cada punto u ∈ X1, tenemosu ×X2 ≈ X2 y para cada punto v ∈ X2, tenemos X1 × v ≈ X1. Por tanto,u × X2 y X1 × v son subespacios conexos de X para cada (u, v) ∈ X.Dado (u, v) ∈ X, definamos H(u,v) =

(p × X2

)∪(X1 × v

). De acuerdo

con el inciso (1) del teorema (2.44), el conjunto H(u,v) es conexo y es claro quecontiene a ambos puntos (p, q), (u, v). Por tanto, tambien por (1) del teorema(2.44), X =

⋃H(u,v) | (u, v) ∈ X es conexo.

Definicion 4.41. Una funcion f : (X, d) → (Y, ρ) del espacio seudo-metrico(X, d) en el espacio seudometrico (Y, ρ) es uniformemente continua si paracada ε > 0 podemos encontrar un numero δ > 0 tal que si x, x′ ∈ X y d(x, x′) <δ, entonces ρ(f(x), f(x′)) < ε.

Observacion 4.42. Toda funcion uniformemente continua es continua.

Para demostrar este teorema basta usar la equivalencia (1)⇔ (4) del teorema(4.22).

Teorema 4.43. Una funcion f : (X, d)→ (Y, ρ) es uniformemente continua siy solo si para cada par de sucesiones equivalentes xn, xn′ en X, f(xn) yf(x′n) son sucesiones equivalentes en Y .

Capıtulo 4. Compacidad 57

Demostracion. (⇒) Sean xn, x′n sucesiones equivalentes en X.

Probaremos que f(xn) ∼ f(x′n). Dado ε > 0, encontremos δ > 0a partir de la hipotesis de continuidad uniforme. Como xn ∼ x′n,existe un ındice n0 tal que d(xn, x

′n) < δ para toda n ≥ n0. Por tanto,

ρ(f(xn), f(x′n)) < ε para cada n ≥ n0 y f(xn) ∼ f(x′n).

(⇐) Supongamos que f no es uniformemente continua. Existe entonces unnumero ε > 0 tal que para cada δ > 0, podemos encontrar dos puntosx(δ), x′(δ) ∈ X tales que d

(x(δ), x′(δ)

)< δ pero ρ

(f(x(δ)), f(x′(δ))

)≥

ε. Si definimos xn = x( 1n ), x′n = x′( 1

n ), las sucesiones xn, x′n sonequivalentes pero sus imagenes f(xn), f(x′n) no pueden serlo, ya queρ(f(xn), f(x′n)

)≥ ε para cada ındice n. Esta contradiccion a la hipotesis

prueba que f es uniformemente continua.

Ejemplo 4.44. (1) Consideremos la funcion f : (0,+∞) → (0,+∞) defini-da mediante la formula f(x) = 1

x . Usando el teorema (3.14) inciso (d),deducimos que f es continua. Ahora, si definimos xn = 1

n , x′n = 12n , ob-

tenemos dos sucesiones equivalentes xn, x′n. Sin embargo, |f(xn) −f(x′n)| = |n − 2n| = n para cada natural n. De acuerdo con el teorema(4.50), f no es uniformemente continua.

(2) Sea g : R → R definida mediante la formula g(z) = x2. Es facil probarque g es una funcion continua. Sin embargo, si para cada n ∈ N definimosxn = n, x′n = n + 1

n , obtenemos dos sucesiones equivalentes xn, x′ncuyas imagenes g(xn), g(x′n) no lo son, ya que:

|g(xn)− g(x′n)| = |n2 − (n+1

n)2| = 2 +

1

n2≥ 2.

Por tanto, g no es uniformemente continua.

Definicion 4.45. Una funcion f : (X, d)→ (Y, ρ) entre espacios seudo-metricoses de Lipschitz si existe un numero positivo M tal que:

ρ(f(x), f(x′)

)≤Md(x, x′)

para cada pareja de puntos x, x′ ∈ X.

Observacion 4.46. Toda funcion de Lipschitz es uniformemente continua.

Ejemplo 4.47. La norma ‖‖ de Rn, considerada como funcion de Rn a R, esuna funcion de Lipschitz.

Ejemplo 4.48. Sean (X1, d1), (X2, d2), ... , (Xn, dn), (X, d) como en el teorema(4.39). Entonces todas las proyecciones πi : X → Xi son de Lipschitz.

Ejemplo 4.49. Sea λ : Rm → Rn una funcion lineal, es decir, λ satisface lasdos propiedades siguientes:

Capıtulo 4. Compacidad 58

(a) λ(u+ v) = λ(u) + λ(v) para cada pareja u, v ∈ Rm.

(b) λ(αu) = αλ(u) para cada α ∈ R y cada u ∈ Rm.

Entonces λ es de Lipschitz.

Teorema 4.50. Si f : (X, d) → (Y, ρ) es continua y si (X, d) es compacto,entonces f es uniformemente continua.

Haremos dos demostraciones de este hecho.

Demostracion. (I)Si f no es uniformemente continua, podemos encontrar un numero ε > 0 y

dos sucesiones equivalentes xn, x′n en X tales que ρ(f(xn), f(x′n)

)≥ ε

para cada n ∈ N. Usando la compacidad de (X, d), podemos encontrar unpunto p ∈ X y una subsucesion xni de xn tal que xni → p. Claramentexni ∼ x′ni. Por tanto, tambien x′ni → p. La continuidad de f implica quef(xni) → f(p) y f(x′ni) → f(p). De acuerdo con el teorema (3.12) inciso (c),tenemos f(xni) ∼ f(x′ni). Pero ρ

(f(xni), f(x′ni)

)≥ ε para cada natural i.

Esta contradiccion prueba que f es uniformemente continua.

Demostracion. (II)Probaremos directamente que f es uniformemente continua. Sea ε > 0. Para

cada p ∈ X existe un numero δp > 0 talque f(V dδp(p)

)⊆ V ρε/2(f(p)). Como

(X, d) es compacto, existe un conjunto finito p1, p2, ..., pn ⊆ X tal que X =n⋃i=1

V dδpi2

(pi). Sea δ = 12 mınδp1 , ..., δpn y sean x,x′ tales que d(x, x′) < δ. Si

x ∈ V δpi2

(pi), entonces d(x′, pi) ≤ d(x′, x) + d(x, pi) < δ+δpi2 ≤

δpi2 +

δpi2 = δpi .

Por tanto, ρ(f(x′), f(pi)

)< ε/2 y ρ

(f(x), f(pi)

)< ε/2. Usando la desigualdad

triangular de la seudo-metrica ρ, deducimos que ρ(f(x), f(x′)

)< ε.

Teorema 4.51. Sea f : (X, d)→ (Y, ρ) una funcion uniformemente continua ysea xn una sucesion de Cauchy en (X, d). Entonces f(xn) es una sucesionde Cauchy en (Y, ρ).

Demostracion. Sea ε > 0 y sea δ > 0 como en la definicion de continuidaduniforme. Sea n0 ∈ N tal que m,n ≥ no implica que d(xm, xn) < δ. Por tanto,m,n ≥ no implica que ρ

(f(xm), f(xn)

)< ε y la sucesion f(xn) es de Cauchy.

Corolario 4.52. Sea f : (X, d) → (Y, ρ) una funcion uniformemente continuay suprayectiva. Entonces, si (X, d) es totalmente acotado, (Y, ρ) tambien lo es.

Demostracion. De acuerdo con el teorema (3.36), basta probar que toda sucesionyn en Y tiene una subsucesion de Cauchy.

Sea xn ∈ X tal que f(xn) = yn con n ∈ N. Nuevamente, por el teorema(3.36), xn tiene una subsucesion de Cauchy xni. Pero el teorema (4.53)

Capıtulo 4. Compacidad 59

implica que f(xni) es una sucesion de Cauchy en Y . Esto completa la de-mostracion.

Teorema 4.53. Sea A un subespacio denso de un espacio metrico (X, d) ysea f : (A, dA) → (Y, ρ) una funcion uniformemente continua en A en unespacio metrico completo (Y, ρ). Entonces existe una unica extension continuaF : (X, d)→ (Y, ρ) de f y esta es, de hecho, uniformemente continua.

Demostracion. Fijemos un punto x ∈ X. Por el teorema (3.26), existe unasucesion an en A tal que an → x. Claramente an es una sucesion de Cauchyen (A, dA). Por tanto f(an) es una sucesion de Cauchy en (Y, ρ) (teorema(4.51)). Como (Y, ρ) es completo, existe un punto y ∈ Y tal que ρ

(f(an), y

)→

0. Si escogemos otra sucesion a′n en A tal que a′n → x, tenemos an ∼a′n y, por tanto, f(an) ∼ f(a′n) (teorema (4.43)). Pero como f(an) → y,concluimos que f(a′n)→ y. Por tanto, el punto y esta determinado unicamentepor x y podemos definir F (x) = y. Claramente, si x ∈ A, podemos tomar ancomo la sucesion constante x, x, ... y en este caso, F (x) = f(x). Probemos queF es uniformemente continua. Sea ε > 0 y sea δ > 0 tal que a, a′ ∈ A, d(a, a′) < δimplica que ρ

(f(a), f(a′)

)< ε/2. Consideremos dos puntos x, x′ ∈ X tales que

d(x, x′) < δ/3. La densidad de A implica la existencia de puntos an, a′n ∈ A

tales que d(x, an) < δ/3 y d(x′, a′n) < δ/3. Usando la desigualdad triangularde d, deducimos que d(an, a

′n) < δ y, por tanto, ρ

(f(an), f(a′n) < ε/2. Por

construccion, sabemos que f(an) → F (x) y f(a′n) → F (x′). Escojamos unnumero natural n tal que ρ

(f(an), F (x)) < ε/4 y ρ

(f(a′n), F (x′)

)< ε/4. Por

tanto:

ρ(F (x), F (x′)

)≤ ρ(F (x), f(an)

)+ ρ(f(an), f(a′n)

)+ ρ(f(a′n), F (x′)

)<ε

4+ε

2+ε

4= ε.

Para completar la demostracion, supongamos que G : (X, d) → (Y, ρ) escontinua y extiende a f . Fijemos cualquier punto x ∈ X. Sea an cualquiersucesion en A que converge a x. Por construccion, sabemos que f(an)→ F (x).Como G es continua, tenemos tambien G(an) = f(an) → G(x). Por tanto,F (x) = G(x) y F es la unica extension continua de f .

Definicion 4.54. Una funcion biyectiva ϕ : (X, d) → (X ′, d′) entre espaciosseudo-metricos es una isometrıa si para cada pareja de puntos p, q ∈ X, tene-mos d′

(ϕ(p), ϕ(q)

)= d(p, q).

Una funcion inyectiva ψ : (X, d) → (X ′, d′) es un encaje isometrico siψ(X) es denso en X ′ y ψ es una isometrıa de (X, d) sobre

(ψ(X), d′|ψ(X)

). Un

espacio metrico (Y, ρ) es una completacion del espacio metrico (X, d) si (Y, ρ)es completo y si existe un encaje isometrico ψ : (X, d)→ (Y, ρ).

Ejemplo 4.55. (a) Todo encaje isometrico es uniformemente continuo.

(b) Si (Y1, ρ1), (Y2, ρ2) son completaciones del mismo espacio metrico (X, d),entonces (Y1, ρ1) y (Y2, ρ2) son isometricos.

Capıtulo 4. Compacidad 60

(c) Un espacio metrico completo (Y, ρ) es completacion de cada uno de sussubespacios densos.

Teorema 4.56. Todo espacio metrico (X, d) tiene una completacion(X, d

).

Demostracion. Consideremos el conjunto S(X) de todas las sucesiones de Cauchyen (X, d). Obviamente S(X) contiene todas las sucesiones convergentes de Xy, en particular, contiene todas las sucesiones constantes de X. Existe entoncesuna funcion natural h : X → S(X), en donde, para cada p ∈ X, h(p) es la suce-sion constante p, p, .... Seudo-metricemos S(X): Dadas xn, yn ∈ S(X),defınase d1(xn, yn) como el lımite en R de la sucesion de Cauchy d(xn, yn):para probar que esta ultima sucesion es de Cauchy, basta considerar la desigual-dad

|d(xn, yn)− d(xm, ym)| ≤ d(xn, xm) + d(yn, ym) con m, n ∈ N.

El lımite de la sucesion d(xn, yn) no cambia si reemplazamos xn y ynpor sucesiones equivalentes x′n y y′n. En efecto, las sucesiones d(xn, x

′n),

d(yn, y′n) son nulas y se cumplen las desigualdades:

d(x′n, y′n) ≤ d(x′n, xn) + d(xn, yn) + d(yn, y

′n)

d(xn, yn) ≤ d(xn, x′n) + d(x′n, y

′n) + d(y′n, yn),

de manera que:

|d(xn, yn)− d(x′n, y′n)| ≤ d(xn, x

′n) + d(yn, y

′n),

es decir, d(xn, yn) y d(x′n, y′n) son sucesiones equivalentes de numeros reales.

La funcion d1 : S(X) × S(X) → R es entonces una seudo-metrica en S(X) ypara cada pareja de sucesiones xn, yn ∈ S(X), se tiene d1

(xn, yn) = 0

si y solo si xn ∼ yn. La equivalencia entre sucesiones de Cauchy determinaentonces una particion de S(X):

S(X) = ∪Li | i ∈ J,

en donde cada Li esta formado por sucesiones de Cauchy equivalentes y sii, i′ ∈ J con i 6= i′, ninguna sucesion de Li es equivalente a ninguna sucesion deLi′ . Definamos d : J × J → R mediante la formula:

d(i, i′) = lımn→∞

d(xn, x′n

),

en donde xn ∈ Li y x′n ∈ Li′ . Existe una funcion natural h : X → J , en

donde h(p) = i y el ındice i ∈ J es el unico tal que p, p, ... ∈ Li.Para completar la demostracion, probaremos:

(a) d es una metrica en J .

(b) El espacio (J, d) es completo y

Capıtulo 4. Compacidad 61

(c) h es encaje isometrico de (X, d) en (J, d).

Dejamos al lector la facil demostracion de (a). Antes de probar (b), demostraremos

que h(X) es denso en J . Tomemos cualquier sucesion xn en S(X) y conside-remos los puntos h(x1), h(x2), ... en S(X). Debido a que xn es una sucesionde Cauchy, tenemos:

d1

(x1, x2, ..., xn, xn, ...

)→ 0 cuando n→∞.

Por tanto, si x1, x2, ... ∈ Li0 y h(xn) ∈ Lin para cada n = 1, 2, ..., tenemos

d(i0, in) = d1

(x1, x2, ..., xn, xn, ...

)→ 0. Por tanto, h(X) es denso en el

espacio seudo-metrico (S(X), d1) y h(X) es denso en el espacio metrico (J, d).

Tomemos ahora cualquier sucesion de Cauchy z1, z2, ... en (J, d). Usando la

densidad de h(X) en J , encontramos para cada n ∈ N, un punto xn ∈ X

tal que d(zn, h(xn)

)< 1

n . Tenemos entonces que las sucesiones z1, z2, ... y

h(x1), h(x2), ... son equivalentes. Por tanto, h(x1), h(x2), ... es tambien una

sucesion de Cauchy en J . Como d(xi, xj) = d(h(xi), h(xj)

)para cada pareja de

ındices i, j ∈ N, deducimos que x1, x2, ... es una sucesion de Cauchy en (X, d),es decir, z = x1, x2, ... ∈ S(X). Si i ∈ J es tal que z ∈ Li, tenemos zn → i, ya

que d(zn, i) ≤ d(zn, h(xn) + d(h(xn), i

)< 1

n + d(h(xn), i

)= 1

n +d1

(xn, xn, ...,

x1, x2, ...)→ 0.

Finalmente, la demostracion de (c) es obvia: por ejemplo, la inyectividad de

h es consecuencia del hecho de que p, q ∈ X, p 6= q implica que las sucesionesconstantes p, p, ... y q, q, ... no son equivalentes. El hecho de que h es unencaje isometrico es ahora obvio.

Capıtulo 5

Diferenciacion de Funciones de una Variable

Definicion 5.1. Sea f : A ⊆ R → R una funcion y sea p ∈ A ∩ Aa. Defınasefp : A− p → R mediante la formula:

fp(x) =f(x)− f(p)

x− p.

Decimos que f tiene derivada λ en p o es derivable en p (λ ∈ R) siexiste lım

x→pfp(x) y este lımite es igual a λ.

Escribimos entonces:

f ′(p) = λ = lımx→p

f(x)− f(p)

x− p.

Definicion 5.2. Sea f : A → R una funcion. La grafica Γ(f) de f se definecomo:

Γ(f) = (x, y) ∈ R2 |x ∈ A, y = f(x).

Dados p, q ∈ A, p 6= q, la secante L(p, q) consiste de los puntos (xo, yo) ∈ R2

que pertenecen a la recta en R2 que une los puntos (p, f(p)) y (q, f(q)), es decir,los puntos de R2 que satisfacen la ecuacion:

y − f(p) =f(p)− f(q)

p− q(x− p).

Observacion 5.3. Dadas dos secantes L(p, q), L(p, r) a la grafica de la funcionf : A → R, la tangente trigonometrica del angulo Θ menor o igual a π/2,formado por ambas secantes esta dada por la formula:

tan Θ =∣∣ fp(q)− fp(r)1 + fp(q)fp(r)

∣∣Demostracion. fp(q) y fp(r) denotan las pendientes de las secantes L(p, q),L(p, r), es decir, las tangentes trigonometricas de los angulos de inclinacionαq, αr de estas secantes. Basta entonces usar la formula:

62

Capıtulo 5. Diferenciacion de Funciones de una Variable 63

tan Θ = | tan(αq − αr)| =∣∣ tanαq − tanαr1 + tanαq tanαr

∣∣Definicion 5.4. Sea f : A → R una funcion, sea p ∈ A ∩ Aa y supongamosque existe la derivada f ′(p). La tangente geometrica a Γ(f) en (p, f(p)) es larecta que pasa por (p, f(p)) y tiene pendiente f ′(p), es decir, la recta en R2 quetiene por ecuacion:

y − f(p) = f ′(p)(x− p).

Denotaremos esta recta como L(p, p).

Observacion 5.5. Sea f : A→ R una funcion, sea p ∈ A∩Aa y sea q ∈ A−p.Supongamos que existe la derivada f ′(p). Entonces la tangente trigonometricadel angulo θq menor o igual a π/2, formado por las rectas L(p, p) y L(p, q),esta dada por la formula:

tan θq =∣∣ f ′(p)− fp(q)1 + f ′(p)fp(q)

∣∣.Por tanto, existe lım

q→pq 6=p

tan θq y es igual a cero.

Demostracion. Basta observar que:

lımq→pq 6=p

| |f′(p)− fp(q)|

|1 + f ′(p)fp(q)|

coincide con:

|f ′(p)− f ′(p)|1 + f ′(p)2

= 0.

Teorema 5.6. Sean f,A, p como en la definicion (5.1). Si existe λ = f ′(p),entonces f es continua en el punto p.

Demostracion. Sea an una sucesion en A tal que an → p. Probaremos quef(an)→ f(p). Definamos:

B = n ∈ N |an = p.

Si el conjunto N−B es finito, claramente f(an)→ f(p).Supongamos entonces que N − B es infinito y consideremos la subsucesion

ani de an formada por los elementos distintos de p. Por hipotesis:

fp(ani) =f(ani)− f(p)

ani − p→ λ,

Capıtulo 5. Diferenciacion de Funciones de una Variable 64

lo cual implica que f(ani)−f(p) = fp(ani)·(ani−p)→ 0, es decir, f(ani)→ f(p).Si el conjunto B es finito, las sucesiones f(ani) y f(an) son equivalentes,de manera que f(an)→ f(p).

Falta considerar el caso en que ambos conjuntos B y N − B son infinitos.Si ε > 0 es arbitrario, existe un ındice i0 ∈ N tal que i ≥ i0 implica que|f(ani)− f(p)| < ε. Obviamente esto implica que |f(an)− f(p)| < ε para cadan ≥ ni0 . Por tanto, en cualquier caso, f(an)→ f(p).

Teorema 5.7. Sean f, g : A → R y sea p ∈ A ∩ Aa. Defınanse h : A → Ry k : A → R mediante las formulas h(x) = f(x) + g(x); k(x) = f(x) · g(x)con x ∈ A. Entonces hp = fp + gp y kp = fgp + g(p)fp. Por tanto, si f ′(p)y g′(p) existen, tambien existen h′(p) y k′(p) y h′(p) = f ′(p) + g′(p), k′(p) =f(p)g′(p) + g(p)f ′(p).

Demostracion. Las formulas hp = fp + gp y kp = fgp + g(p)fp se obtienendirectamente de las definiciones. Aplıquese despues el teorema de algebra delımites y el teorema (5.6).

Corolario 5.8. Si n ∈ N, n ≥ 2 y s(x) = f(x)n, entonces:

sp(x) = fp(x) ·n−1∑k=0

f(x)n−1−kf(p)k.

Demostracion. Procedase por induccion sobre n.

Corolario 5.9. Si n ∈ N, f : A → R, p ∈ A ∩ Aa y si f es derivable en p,entonces s(x) = f(x)n es derivable en p y s′(p) = n(f(p))n−1f ′(p).

Teorema 5.10. Sea f : A→ R−0 y sea p ∈ A∩Aa. Defınase λ : A→ R−0con la formula:

λ(x) =1

f(x).

Entonces:

λp(x) = − fp(x)

f(x) · f(p).

Por tanto, si f ′(p) existe, tambien λ′(p) existe y:

λ′(p) = − f′(p)

f(p)2.

Capıtulo 5. Diferenciacion de Funciones de una Variable 65

Demostracion. Tenemos

λp(x) =λ(x)− λ(p)

x− p=

1f(x) −

1f(p)

x− p= − 1

f(x)f(p)· f(x)− f(p)

x− p

= − fp(x)

f(x) · f(p).

El resto del teorema se obtiene del teorema (5.6) y del algebra de lımites.

Combinando los teoremas (5.7) y (5.10) obtenemos el siguiente teorema.

Teorema 5.11. Sean f : A → R, g : A → R − 0 y sea p ∈ A ∩ Aa. Sidefinimos:

µ(x) =f(x)

g(x)

con x ∈ A. Entonces:

µp(x) =g(x)fp(x)− f(p)gp(x)

g(x)g(p).

Por tanto, si f ′(p) y g′(p) existen, entonces µ′(p) tambien existe y :

µ′(p) =g(p)f ′(p)− f(p)g′(p)

g(p)2

La demostracion se deja como ejercicio para el lector.

Teorema 5.12. Sean f : A→ (0,+∞), n ∈ N y p ∈ A∩Aa. Si g : A→ (0,+∞)se define mediante la formula:

g(x) = n√f(x),

entonces:

gp(x) =fp(x)

n−1∑k=0

f(x)kn f(p)

n−1−kn

.

Por tanto, si f ′(p) existe, tambien existe g′(p) y:

g′(p) =f ′(p)

n(f(p))n−1n

=1

n(f(p))1− 1

n f ′(p).

Demostracion. Tenemos gp(x) =n√f(x)− n

√f(p)

x−p , donde x ∈ A−p. Ahora, mul-

tiplicando el numerador y el denominador de esta fraccion porn−1∑k=0

f(x)kn f(p)

n−1−kn ,

tenemos:

Capıtulo 5. Diferenciacion de Funciones de una Variable 66

gp(x) =f(x)− f(p)

(x− p)n−1∑k=0

f(x)kn f(p)

n−1−kn

=fp(x)

n−1∑k=0

f(x)kn f(p)

n−1−kn

.

La misma formula se aplica si f : A→ R− 0 y n es un entero impar.

Corolario 5.13. Sea f : A → (0,+∞) una funcion derivable en p ∈ A ∩ Aa ysea q un numero racional. Si g(x) = f(x)q, entonces g es tambien derivable enp y g′(p) = q(f(p))q−1f ′(p).

Demostracion. Basta usar los teoremas (5.12) y (5.10) y el corolario (5.8).

Definicion 5.14. Sea f : A → R y sea p ∈ intA. Decimos que f es cre-ciente(respectivamente decreciente) en p si existe un numero γ > 0 talque (p−γ, p+γ) ⊆ A y para cada pareja de numeros r ∈ (p−γ, p), s ∈ (p, p+γ)se tiene f(r) < f(p) < f(s) (resp. f(r) > f(p) > f(s)).

Si B ⊆ A, decimos que f es creciente(resp. decreciente) en B si para cadapareja de numeros r, s ∈ B, con r < s, se tiene f(r) < f(s) (resp. f(r) > f(s)).

f es monotona creciente (resp. monotona decreciente) en B si paracada pareja de puntos r, s ∈ B con r < s, se tiene f(r) ≤ f(s) (resp. f(r) ≥ f(s))

Teorema 5.15. Sea f : A → R una funcion la cual admite derivada en unpunto p ∈ A ∩ Aa. Entonces, si f ′(p) 6= 0, existe un numero δ > 0 tal quex ∈ (p − δ, p) ∩ A implica (f(p) − f(x))f ′(p) > 0 y x ∈ (p, p + δ) ∩ A implica(f(p) − f(x))f ′(p) < 0. Por tanto, si p ∈ intA y si f ′(p) > 0, entonces f escreciente en p y si p ∈ intA y f ′(p) < 0, entonces f es decreciente en p.

Demostracion. Tomando ε = |f ′(p)|, podemos hallar un numero δ > 0 tal quex ∈ ((p− δ, p+ δ)− p) ∩A implica que |gp(x)− f ′(p)| < |f ′(p)|. Si f ′(p) > 0,tenemos entonces que:

gp(x) =f(x)− f(p)

x− p> 0

para cada x ∈ ((p− δ, p+ δ)− p) ∩A y si f ′(p) < 0, tenemos gp(x) < 0 paracada x ∈ ((p− δ, p+ δ)− p) ∩A. Por tanto, si x ∈ (p− δ, p) ∩A, f(p)− f(x)y f ′(p) tienen el mismo signo y si x ∈ (p, p+ δ) ∩A, f(p)− f(x) y f ′(p) tienensignos distintos. Esto completa la demostracion.

Ejemplo 5.16. Si para cierto punto p ∈ intA, tenemos f ′(p) = 0, no podemosdeducir, en general, que f sea creciente o decreciente en p. Por ejemplo, sif : R → R se define mediante las formulas f(x) = x2 sin 1

x , con x 6= 0 yf(0) = 0, deducimos que f es derivable en p = 0 y que f ′(p) = 0. Sin embargo,existen valores positivos y valores negativos de x, arbitrariamente pequenos, enlos que f(x) > 0, f(x) = 0 o f(x) < 0.

Capıtulo 5. Diferenciacion de Funciones de una Variable 67

Teorema 5.17 (Regla de la cadena). Sean f : A→ B, g : B → R, A,B ⊆ Ry sea p ∈ intA tal que f es derivable en p, f ′(p) 6= 0 y f(p) ∈ intB. Si g esderivable en f(p), entonces existe un numero δ > 0 tal que (p− δ, p+ δ) ⊆ A ytal que la funcion:

h = (g f)|(p− δ, p+ δ) : (p− δ, p+ δ)→ R

es derivable en p y h′(p) = g′(f(p))f ′(p).

Demostracion. De acuerdo con el teorema (5.15), existe δ > 0 tal que(p − δ, p + δ) ⊆ A y para cada x ∈ (p − δ, p + δ) − p, se tiene f(x) 6= f(p).Consideremos la funcion hp : (p− δ, p+ δ)− p → R definida por:

hp(x) =g(f(x))− g(f(p))

x− pSea xn una sucesion en (p− δ, p+ δ)− p tal que xn → p. Entonces:

hp(xn) =g(f(xn))− g(f(p))

xn − p=g(f(xn))− g(f(p))

f(xn)− f(p)· f(xn)− f(p)

xn − p

= gf(p)(f(xn)) · fp(xn).

Por hipotesis y por el teorema de algebra de lımites, tenemos hp(xn) =gf(p)(f(xn)) · fp(xn)→ g′(f(p))f ′(p).

Teorema 5.18 (Teorema de Rolle). Sea f : [a, b]→ R una funcion continua,con f(a) = f(b) y supongamos que f es derivable en cada punto x ∈ (a, b).Entonces existe x0 ∈ (a, b) tal que f ′(x0) = 0.

Demostracion. El teorema es trivial si f es una funcion constante, es decir, sif(x) = f(a) = f(b) para cada x ∈ [a, b], ya que en este caso f ′(x) = 0 paracada x ∈ [a, b]. Supongamos entonces que este no es el caso. Por los teore-mas (4.26),(4.33), (4.34), existen dos numeros reales λ, µ, con λ < µ, tales quef([a, b]) = [λ, µ].

Supongamos primero que µ 6= f(a). Sea x0 ∈ (a, b) tal que f(x0) = µ.Tenemos, por tanto, que f ′(x0) = 0. En efecto, si f ′(x0) > 0 entonces f escreciente en x0 y, por tanto, existirıan valores x > x0, x ∈ [a, b], tales quef(x) > f(x0) = µ, imposible. Si f ′(x0) < 0, entonces existen valores x < x0,x ∈ [a, b], tales que f(x) > f(x0) = µ. Por tanto, f ′(x0) = 0.

Analogamente, si µ = f(a), tenemos λ < f(a) y tomando x0 ∈ (a, b) tal quef(x0) = λ, concluimos que f ′(x0) = 0.

Si del teorema de Rolle eliminamos la hipotesis f(a) = f(b), tenemos masgeneralmente:

Capıtulo 5. Diferenciacion de Funciones de una Variable 68

Teorema 5.19 (Teorema del Valor Medio). Sea f : [a, b]→ R una funcioncontinua y derivable en cada punto x ∈ (a, b). Entonces existe un punto x0 ∈(a, b) tal que:

f ′(x0) =f(b)− f(a)

b− a.

Por tanto, la tangente L(x0, x0) es paralela a la secante L(a, b).

Demostracion. Consideremos la funcion g : [a, b] → R definida mediante laformula:

g(x) = f(x)− f(a)− f(b)− f(a)

b− a(x− a).

Claramente g(a) = g(b) = 0 y para cada x ∈ (a, b), existe g′(x) y

g′(x) = f ′(x)− f(b)− f(a)

b− a.

Basta entonces aplicar el teorema de Rolle con la funcion g.

Corolario 5.20. Sea f : [a, b]→ R una funcion continua la cual tiene derivadapositiva (resp. negativa) en cada punto x ∈ (a, b). Entonces f es creciente (resp.decreciente) en [a, b].

La demostracion de este corolario se deja como ejercicio para el lector.

Ejemplo 5.21. Para cada x ∈ (0, 2π], se tiene sinx < x.

Demostracion. Sea f(x) = x − sinx con x ∈ [0, 2π]. Tenemos f ′(x) = 1 −cosx > 0 para cada x ∈ (0, 2π). Por tanto, f es creciente en [0, 2π]. De donde,f(0) = 0 < f(x) para cada x ∈ (0, 2π], es decir sinx < x para cada x ∈ (0, 2π].

Ejemplo 5.22. Para cada x ∈ (1,+∞) se cumple 2x5 − 1x > 3− 2x.

Demostracion. Consideremos la funcion diferencia:

f(x) = 2x5 + 2x− 1

x− 3, x 6= 0.

Tenemos:

f ′(x) = 10x4 + 2 +1

x2> 0

para cada x > 0. Por tanto, f es creciente en (0,+∞). Como f(1) = 0, tenemos0 < f(x) para cada x ∈ (1,+∞). De aquı que:

2x5 − 1

x> 3− 2x.

Capıtulo 5. Diferenciacion de Funciones de una Variable 69

Teorema 5.23. (Teorema de la Funcion Inversa)Sean f : A → B, p ∈ intA, γ > 0 y (p− γ, p+ γ) ⊆ A. Supongamos que f ′

existe y es continua en (p− γ, p+ γ) y que f ′(p) 6= 0. Entonces existen ε > 0 yun intervalo abierto p ∈ (a, b) ⊆ (p − γ, p + γ) tales que (f(p) − ε, f(p) + ε) ⊆f(A), f ′(x) 6= 0 para cada x ∈ (a, b) y f |(a,b) es una biyeccion de (a, b) sobre(f(p)− ε, f(p) + ε) y la funcion inversa:

g : (f(p)− ε, f(p) + ε)→ (a, b)

tiene derivada continua en (f(p)− ε, f(p) + ε) y para cada y ∈ (f(p)− ε,f(p) + ε), se tiene:

g′(y) =1

f ′(g(y)).

Demostracion. Tomando en cuenta que f ′ es continua en p y que f ′(p) 6= 0,podemos suponer, sin perder generalidad, que f ′(x) y f ′(p) tienen el mismosigno para cada x ∈ (p − γ, p + γ) y que [p − γ, p + γ] ⊆ A. Por tanto, sif ′(p) > 0 (o f ′(p) < 0) entonces f es creciente (o decreciente) en [p− γ, p+ γ].Supongamos que f ′(p) > 0. Entonces f(p) es un punto interior del intervalof([p− γ, p+ γ]) = [f(p− γ), f(p+ γ)] y, por tanto, existe ε > 0 tal que:

(f(p)− ε, f(p) + ε) ⊆ [f(p− γ), f(p+ γ)].

Tomemos a, b ∈ [p − γ, p + γ] tales que f(a) = f(p) − ε, f(b) = f(p) + ε y seag : [f(p)−ε, f(p)+ε]→ [a, b] la funcion inversa de f restringida al intervalo [a, b].Si y ∈ (f(p)− ε, f(p) + ε) y si yn es una sucesion en (f(p)− ε, f(p) + ε)−ytal que yn → y, tenemos:

g(yn)− g(y)

yn − y=

xn − xf(xn)− f(x)

=1

f(xn)−f(x)xn−x

→ 1

f ′(x)=

1

f ′(g(y)),

donde xn = g(yn), x = g(y), de manera que g′(y) existe y:

g′(y) =1

f ′(g(y)).

Finalmente, la continuidad de g′ se obtiene de la continuidad de g y la def ′.

Teorema 5.24 (Teorema de Darboux ). Sea f : [a, b] → R una funciondiferenciable en cada x ∈ [a, b] y supongamos que f ′(a) 6= f ′(b). Si λ es unvalor intermedio entre f ′(a) y f ′(b), entonces existe un punto x0 ∈ (a, b) tal quef ′(x0) = λ.

Capıtulo 5. Diferenciacion de Funciones de una Variable 70

Demostracion. Supongamos primero que f ′(a) < λ < f ′(b) . Consideremos lafuncion h : [a, b] → R definida mediante la formula h(x) = f(x) − λ(x − a).Claramente h′(x) existe para cada x ∈ [a, b] y h′(x) = f ′(x) − λ. Por tanto,h′(a) < 0 < h′(b). Sean µ, ν ∈ R tales que h([a, b]) = [µ, ν] y sea x0 ∈ [a, b] talque h(x0) = µ. El teorema (5.15) implica que a 6= x0 6= b y h′(x0) = 0. Portanto, 0 = h′(x0) = f ′(x0)− λ y f ′(x0) = λ.

Si f ′(a) > λ > f ′(b), consideremos la funcion g(x) = λ(x − a) − f(x).Entonces g es diferenciable en cada x ∈ [a, b] y g′(a) = λ − f ′(a) < 0, g′(b) =λ−f ′(b) > 0. Por tanto, por la primera parte, existe x0 ∈ (a, b) tal que g′(x0) =0. De donde 0 = g′(x0) = λ− f ′(x0) y f ′(x0) = λ.

Teorema 5.25 (Teorema del Valor Medio de Cauchy). Sean f, g : [a, b]→R funciones continuas. Supongamos que ambas funciones son derivables en cadapunto x ∈ (a, b). Entonces existe un punto x0 ∈ (a, b) tal que f ′(x0)(g(b) −g(a)) = g′(x0)(f(b)− f(a)).

Demostracion. Definamos λ : [a, b]→ R con la formula:

λ(x) = f(x)(g(b)− g(a))− g(x)(f(b)− f(a)).

Claramente λ es continua en [a, b] y para cada x ∈ (a, b) existe λ′(x); dehecho:

λ′(x) = f ′(x)(g(b)− g(a))− g′(x)(f(b)− f(a)).

Ademas,

λ(a) = f(a)(g(b)− g(a))− g(a)(f(b)− f(a)) = f(a)g(b)− f(b)g(a),

y

λ(b) = f(b)(g(b)− g(a)− g(b)(f(b)− f(a)) = f(a)g(b)− f(b)g(a).

Por tanto, λ(a) = λ(b). Por el teorema de Rolle, existe x0 ∈ (a, b) tal queλ′(x0) = 0 y de aquı que f ′(x0)(g(b)− g(a)) = g′(x0)(f(b)− f(a)).

Definicion 5.26. Sea f : A→ R una funcion, en donde A ⊆ Aa y supongamosque f ′(x) existe para cada x ∈ A. Defınase g : A→ R por medio de la formulag(x) = f ′(x), con x ∈ A. Si para alguna x ∈ A, existe g′(x), escribimos g′(x) =f (2)(x). Si para cada x ∈ A, existe f (2)(x), llamamos a la funcion f (2) : A→ R lasegunda derivada de f . Inductivamente, si la n-esima derivada f (n) : A→ Rha sido definida y si f (n) es derivable en un punto x ∈ A, definimos f (n+1)(x)como la derivada de f (n) en el punto x.

Por notacion escribimos f (1)(x) = f ′(x) y f (0)(x) = f(x) para cada x ∈ A.

Capıtulo 5. Diferenciacion de Funciones de una Variable 71

Teorema 5.27 (Teorema generalizado de Cauchy). Sea J ⊆ R un inter-valo cerrado con extremos a, b donde a 6= b. Sea n ∈ N y sean f, g : J → R ytales que f (k)(x), g(k)(x) existen para cada x ∈ J y para cada k ∈ 1, 2, .., n−1.Supongamos tambien que ambas funciones f (n−1), g(n−1) son derivables en cadapunto interior de J . Entonces existe un punto x0 ∈ intJ tal que:

[f(b)−

n−1∑k=0

f (k)(a)

k!(b− a)k

]g(n)(x0) =

[g(b)−

n−1∑k=0

g(k)(a)

k!(b− a)k

]f (n)(x0).

Demostracion. Apliquemos el teorema (5.25) (Valor medio de Cauchy) con lasfunciones:

F (x) = f(x) +

n−1∑k=1

f (k)(x)

k!(b− x)k

y

G(x) = g(x) +

n−1∑k=1

g(k)(x)

k!(b− x)k.

Tenemos:

F (b)− F (a) = f(b)− f(a)−n−1∑k=1

f (k)(a)

k!(b− a)k = f(b)−

n−1∑k=0

f (k)(a)

k!(b− a)k.

Analogamente:

G(b)−G(a) = g(b)−n−1∑k=0

g(k)(a)

k!(b− a)k.

Aplicando el teorema (5.7) y su corolario (5.8), tenemos:

F ′(x) = f ′(x)+

n−1∑k=1

[f (k+1)(x)

k!(b−x)k− f (k)(x)

(k − 1)!(b−x)k−1

]=

f (n)(x)

(n− 1)!(b−x)n−1

con x ∈ (a, b).

De manera similar obtenemos:

G′(x) =f (n)(x)

(n− 1)!(b− x)n−1

con x ∈ (a, b).

El teorema (5.25) implica la existencia de un punto x0 ∈ (a, b) tal que:

Capıtulo 5. Diferenciacion de Funciones de una Variable 72

F ′(x0)(G(b)−G(a)) = G′(x0)(F (b)− F (a)).

Sustituyendo los valores indicados, se concluye la demostracion.

Teorema 5.28. (Teorema de Taylor) Sea f : [a, b]→ R y sea n ∈ N tal quef (k)(x) existe para cada x ∈ [a, b] y para cada k ∈ 1, 2, .., n − 1. Supongamostambien que f (n−1) es derivable en cada punto interior x ∈ (a, b).

Existe entonces un punto x0 ∈ (a, b) tal que :

f(b) =

n−1∑k=0

f (k)(a)

k!(b− a)k +

f (n)(x0)

n!(b− a)n.

Demostracion. Aplıquese el teorema (5.27) tomando g(x) = (x− a)n.

Definicion 5.29. Sea f : A → R y sea x0 ∈ A0. Decimos que f tiene unmaximo local en x0 si existe un numero δ > 0 tal que (x0 − δ, x0 + δ) ⊆ A ytal que para cada x ∈ (x0 − δ, x0 + δ)− x0, se tiene f(x) < f(x0).

Analogamente, si existe δ > 0 tal que (x0 − δ, x0 + δ) ⊆ A y tal que paracada x ∈ (x0 − δ, x0 + δ) − x0, se tiene f(x) > f(x0), diremos que f tienemınimo local en x0.

Observacion 5.30. Sea f : A→ R derivable en un punto interior xo ∈ A0. Sif tiene un maximo local o un mınimo local en x0, entonces f ′(x0) = 0.

Demostracion. Basta aplicar el teorema (5.15).

Teorema 5.31. Sea f : [a, b] → R y sea n ∈ N tal que f (k)(x) existe paracada k ∈ 1, 2, ..., n y cada x ∈ [a, b] y supongamos que f (n) : [a, b] → R escontinua. Sea x0 ∈ (a, b) tal que f (j)(x0) = 0 para cada 1 ≤ j ≤ n− 1 y tal quef (n)(x0) 6= 0. Entonces existe δ > 0 tal que (x0 − δ, x0 + δ) ⊆ [a, b] y tal quef (n)(x) y f (n)(x0) tienen el mismo signo para cada x ∈ (x0−δ, x0 +δ). Ademas,si x ∈ (x0 − δ, x0 + δ)− x0, existe un punto x1 entre x0 y x tal que:

f(x) =f (n)(x1)

n!(x− x0)n + f(x0).

Demostracion. La existencia de δ se obtiene de la continuidad de f (n). El restose obtiene del teorema de Taylor aplicado al intervalo con extremos x0, x ytomando como centro a x0.

Corolario 5.32. Sea f, g, n, x0 como en el teorema (5.31).

(1) Si f (n)(x0) > 0 y n es impar, entonces f es creciente en x0.

(2) Si f (n)(x0) > 0 y n es par, entonces f tiene un mınimo local en x0.

Capıtulo 5. Diferenciacion de Funciones de una Variable 73

(3) Si f (n)(x0) < 0 y n es impar, entonces f es decreciente en x0.

(4) Si f (n)(x0) < 0 y n es par, entonces f tiene un maximo local en x0.

Teorema 5.33 (Teorema de L’Hospital). Sea n ∈ N y sean f, g : [a, b]→ Rtales que:

(i) f (i), g(i) estan definidas y son continuas en [a, b] para cada i < n,

(ii) f (n), g(n) existen en [a, b),

(iii) f (n), g(n) son continuas en x = a,

(iv) f (i)(a) = g(i)(a) = 0 para cada i < n,

(v) Existe δ > 0 tal que (a, a+ δ) ⊆ (a, b) y g(x) 6= 0 en (a, a+ δ),

(vi) g(n)(a) 6= 0.

Entonces existe lımx→ax6=a

f(x)g(x) y coincide con f(n)(a)

g(n)(a).

Demostracion. Como g(n)(x) es continua en x = a y g(n)(a) 6= 0, suponemos, sinperdida de generalidad, que g(n)(x) 6= 0 para cada x ∈ [a, a+ δ). Consideremosuna sucesion xk en (a, a+ δ) tal que xk → a. Definamos:

F (x) = f(x)− (x− a)n−1f (n)(a)

(n− 1)!,

y

G(x) = g(x)− (x− a)n−1g(n)(a)

(n− 1)!

con x ∈ [a, b].Claramente F (i)(a) = G(i)(a) = 0 para i < n − 1. Ademas, F (n−1)(x) =

f (n−1)(x) − f (n)(a), F (n)(x) = f (n)(x), G(n−1)(x) = g(n−1)(x) − g(n)(a) yG(n)(x) = g(n)(x). Usando el teorema del valor medio de Cauchy con F yG en el intervalo [a, xk], encontramos γk ∈ (a, xk) tal que:

[F (xk)−

n−1∑i=0

F (i)(a)

i!(xk−a)i

]G(n)(γk) =

[G(xk)−

n−1∑i=0

G(i)(a)

i!(xk−a)i

]F (n)(γk).

Haciendo las sustituciones necesarias, obtenemos:

[F (xk)+

(xk − a)n−1

(n− 1)!f (n)(a)

]g(n)(γk) =

[G(xk)+

(xk − a)n−1

(n− 1)!g(n)(a)

]f (n)(γk).

Pero por la definicion de F y G, las cantidades en los parenteis rectangularesson f(xk) y g(xk), respectivamente. Por tanto, se cumple la ecuacion:

Capıtulo 5. Diferenciacion de Funciones de una Variable 74

f(xk)g(n)(γk) = g(xk)f (n)(γk).

Entonces:

f(xk)

g(xk)=f (n)(γk)

g(n)(γk)→ f (n)(a)

g(n)(a).

Ejemplo 5.34. Calcular

lımx→0x6=0

sin ax+ sin bx

sin cx+ sin dx,

en donde a, b, c+ d ∈ R− 0.Solucion.Por la regla de L’Hospital:

lımx→0x6=0

sin ax+ sin bx

sin cx+ sin dx= lımx→0

a cos ax+ b cos bx

c cos cx+ d cos dx=a+ b

c+ d.

Capıtulo 6

Sucesiones y Series

En este capıtulo estudiaremos la convergencia de sucesiones y series en unespacio normado completo (X, ‖‖). Empezaremos definiendo la serie asociada auna sucesion xn en X.

Definicion 6.1. Sea xn una sucesion en X. Para cada n ∈ N, formamos lasuma parcial:

sn = x1 + x2 + ...+ xn.

La nueva sucesion sn recibe el nombre de serie asociada a xn y se

denota sn =∑xn. Si sn → λ, escribimos λ =

∞∑n=1

xn.

Usando (4.4), tenemos:

Teorema 6.2. Si xn es una sucesion en X, son equivalentes:

(1) Existe p ∈ X tal que xn → p.

(2) xn es una sucesion de Cauchy.

(3) Para cada sucesion estrictamente creciente de naturales k1 < k2 < ...,‖xn − xkn‖ es una sucesion nula.

Teorema 6.3. (a) Si xn es una sucesion en X que converge a p y λn esuna sucesion en R que converge a λ ∈ R, entonces λnxn es una sucesionen X que converge a λp.

(b) Sea λn una sucesion acotada en R tal que λn ≤ λn+1 para cada n ∈ N.Entonces λn → λ, en donde λ es el supremo del conjunto x ∈ R |x =λn para alguna n ∈ N.

(c) Sea xk una sucesion en Rn, en donde xk = (xk1, xk2, ..., xkn). Entoncesxk es convergente si y solo si cada una de las n sucesiones xki, coni = 1, 2, .., n, es de Cauchy.

La demostracion de este teorema se deja como ejercicio para el lector.Veamos ahora algunos ejemplos del teorema (6.3).

75

Capıtulo 6. Sucesiones y Series 76

Ejemplo 6.4. (a) Sea λ1 < λ2 < ... una sucesion creciente no acotada denumeros reales distintos de cero. Entonces 1

λn→ 0.

(b) Sea λ ∈ R tal que 0 < |λ| < 1. Entonces λn → 0 y

∑λn → λ

1− λ.

(c) Sea λ ∈ R, λ > 0. Entonces n√λ→ 1.

Demostracion. (a) Sea ε > 0. Como λn no es acotada, existe n0 ∈ N tal queλn > 1/ε para cada n ≥ n0. Por tanto, 1

λn< ε para cada n ≥ n0, es decir,

1λn→ 0.

(b) Sea:

a =1

|λ|− 1 > 0.

Por la desigualdad de Bernoulli, tenemos (1 + a)n ≥ 1 + na para cadan ∈ N. Por tanto,

|λ|n =1

(1 + a)n≤ 1

1 + na<

1

na.

Por (a) tenemos:

1

na→ 0.

Por tanto, |λ|n → 0 y λn → 0.

Probaremos que:

∑λn → λ

1− λ.

Consideremos la diferencia λ1−λ − (λ+ λ2 + ...+ λn). Tenemos:

λ+ λ2 + ...+ λn =(λ+ λ2 + ...+ λn)(1− λ)

1− λ=λ− λn+1

1− λ

y usando la primera parte, obtenemos:

λ

1− λ− (λ+ λ2 + ...+ λn) =

λn+1

1− λ→ 0.

Capıtulo 6. Sucesiones y Series 77

(c) Basta considerar el caso en que λ > 1, ya que n√λ→ 1 si y solo si n

√1/λ→

1. Defınase xn = n√λ − 1 > 0. Usando nuevamente la desigualdad de

Bernoulli, tenemos λ = (1 + xn)n ≥ 1 + nxn. Por tanto,

xn ≤λ− 1

n.

Como:

λ− 1

n→ 0,

tambien xn → 0. De donde n√λ = 1 + xn → 1.

Definicion 6.5. (1) Una serie∑xn en X es absolutamente convergente

si la serie en R,∑‖xn‖ es convergente.

(2) Una sucesion xn en X es divergente si para cada numero positivoM > 0, existe un ındice n0 ∈ N tal que ‖xn‖ ≥M para cada n ≥ n0.

Observacion 6.6. (1) La serie∑xn es convergente si y solo si para cada

ε > 0, existe un numero n0 ∈ N tal que ‖xn0+1 + xn0+2 + ...+ xn0+k‖ < εpara cada k ∈ N.

(2) Toda serie absolutamente convergente es convergente.

(3) Si la serie∑xn es convergente, entonces la sucesion ‖xn‖ es nula.

(4) La serie∑xn en R, en donde xn = (−1)n−1

n , es convergente pero∑|xn|

es divergente.

Demostracion. (1) Sea sn = x1 +x2 + ...+xn con n ∈ N. Como sn0+k− sno =xno+1 + ... + xn0+k, deducimos que sn es de Cauchy si y solo si paracada ε > 0, existe un ındice n0 ∈ N tal que ‖xno+1 + ...+ xn0+k‖ < ε paracada k ∈ N.

(2) Basta observar que ‖xno+1+ ... + xn0+k

‖ ≤ ‖xno+1‖ + ... + ‖xn0+k‖ paracada pareja (n0, k) ∈ N× N.

(3) Sea sn = x1 + x2 + ... + xn con n ∈ N y sea p ∈ X tal que sn → p. Dadaε > 0, existe un ındice n0 ∈ N tal que n ≥ n0 implica ‖sn − p‖ < ε/2.Por tanto, si n > n0 tenemos xn = (sn − p) − (sn−1 − p) y de aquı que‖xn‖ ≤ ‖sn − p‖+ ‖sn−1 − p‖ < ε/2 + ε/2 = ε.

(4) Sea:

sn = 1− 1

2+

1

3− ...+ (−1)n−1

n,

Capıtulo 6. Sucesiones y Series 78

con n ∈ N. Cada numero sn satisface las desigualdades 12 ≤ sn ≤ 1. En

efecto, si n es par,

sn = (1− 1

2) + (

1

3− 1

4) + ...+ (

1

n− 1− 1

n)

= 1− (1

2− 1

3)− (

1

4− 1

5)− ...− (

1

n− 2− 1

n− 1)− 1

n,

entonces 12 ≤ sn ≤ 1.

Si n es impar,

sn = 1− (1

2− 1

3)− ...− (

1

n− 1− 1

n)

= (1− 1

2) + (

1

3− 1

4) + ...+ (

1

n− 2− 1

n− 1) +

1

n,

entonces tambien 12 ≤ sn ≤ 1.

Por otro lado, la subsucesion s2n es convergente (usese el teorema (6.3)inciso (b)), digamos s2n → p, para algun numero p ∈ [ 1

2 , 1]. Por tanto,sn 7→ p. Para probar que de hecho sn → p, basta probar que la sucesionsn es de Cauchy. Por ser estrictamente decreciente y acotada, la sub-sucesion s2n−1 tambien es convergente, digamos s2n−1 → q. Pero lassucesiones s2n y s2n−1 son equivalentes, por lo que tenemos p = q.Finalmente, dado ε > 0, existe un ındice n0 ∈ N tal que |s2n − p| < ε/2y |s2n−1 − p| < ε/2 para cada n ≥ n0. Por tanto, si m,n ≥ 2n0, tenemos|sm − sn| < ε.

Demostraremos que la serie armonica∑ 1n =

∑|xn| es divergente.

Llamando tn = 1 + 12 + 1

3 + ... + 1n , basta probar que para cada k ∈ N,

existe n0 ∈ N tal que tn0≥ k. Tomemos n0 = 22k−2. Por tanto:

tn0 = 1 + (1

2) + (

1

3+

1

4) + (

1

5+

1

6+

1

7+

1

8)+

(1

9+ ..+

1

16) + ...+ (

1

22k−3 + 1+ ...+

1

22k−2).

Las cantidades encerradas en parentesis son todas mayores o iguales a 12 ,

ya que si el ultimo termino en el parentesis es 12j , se estan incluyendo 2j−1

sumandos cada uno mayor o igual a 12j . Por otro lado, tenemos 2k − 2

parentesis. Por tanto, tn0≥ 1 + (2k − 2) · 1

2 = k.

Teorema 6.7 (Criterio de D’Alembert). Sea xn una sucesion en X−0y supongamos que la sucesion rn, en donde rn = ‖xn+1‖/‖xn‖ converge a unnumero r ∈ R.

Entonces, si r < 1, la serie∑xn es absolutamente convergente. Si r > 1,

la serie∑xn es divergente. Si r = 1, no llegamos a ninguna conclusion.

Capıtulo 6. Sucesiones y Series 79

Demostracion. Supongamos que r < 1. Tomando ε = (1 − r)/2, encontramosun ındice n0 tal que n ≥ n0 implica que |rn − r| < ε. Por tanto, n ≥ n0 implicaque:

rn ≤1 + r

2< 1.

Para cada k ∈ N tenemos:

‖xn0+k‖ ≤(1 + r

2

)k‖xn0‖.

Esto es claro para k = 1. Suponiendo cierta esta desigualdad para k, tenemos:

‖xn0+k+1‖ =‖xn0+k+1‖‖xn0+k‖

· ‖xn0+k‖ ≤(1 + r

2

)·(1 + r

2

)k‖xn0‖

=(1 + r

2

)k+1‖xn0‖.

De aquı obtenemos:

k∑j=1

‖xn0+j‖ ≤ ‖xn0‖

k∑j=1

sj ≤ s‖xn0‖

1− s,

donde s = (1 + r)/2. Por tanto, la serie∑xn es absolutamente convergente.

Supongamos ahora que r > 1. Tomamos esta vez ε = (r − 1)/2. Existeentonces un ındice n0 tal que n ≥ n0 implica que | rn − r |< ε. Por tanto,n ≥ n0 implica que:

rn ≥r + 1

2> 1.

Para cada k ∈ N tenemos:

‖ xn0 + k ‖≥(r + 1

2

)k ‖ xn0 ‖ .

Esta desigualdad se prueba razonando como en el caso r < 1. La sucesion‖ xn ‖ es entonces no acotada y la serie

∑xn es divergente.

Corolario 6.8. Sea s un numero real positivo, sea k ∈ N y sea:

xn =sn+k

n!.

Entonces la serie∑xn es convergente y, por tanto, la sucesion xn es

nula.

Demostracion. Tenemosxn+1

xn=

s

n+ 1→ 0.

Basta entonces aplicar el teorema (6.7).

Capıtulo 6. Sucesiones y Series 80

Corolario 6.9. Sea f : [a, b] → R una funcion con derivadas de todos losordenes en [a, b]. Supongamos que existen dos numeros s,M con s,M ≥ 1 y unnumero k ∈ N∪ 0 tales que |f (j)(x)| ≤M · sj+k para cada j ∈ N∪ 0 y cadax ∈ [a, b]. Entonces la serie de Taylor

∞∑j=0

f(j)(a)

j!(x− a)j

converge a f(x) para cada x ∈ [a, b].

Demostracion. Definamos:

sn(x) =n−1∑j=0

f (j)(a)

j!(x− a)j .

Por el teorema de Taylor (5.28), existe un punto x1 ∈ (a, x) tal que:

f(x) = sn(x) +f (n)(x1)

n!(x− a)n.

Probaremos entonces que sn(x)→ f(x) para cada x ∈ [a, b].Por hipotesis y el corolario (6.8), tenemos:

|f (n)(x1)|n!

(x− a)n ≤ Msn+k(x− a)n

n!

≤ Msn+k(b− a)n

n!

≤ Msn+k(1 + b− a)n+k

n!

=M [s(1 + b− a)]n+k

n!→ 0.

Teorema 6.10. Sean f , g dos funciones, f, g : [a, b] → R tales que satisfacenlas hipotesis del corolario (6.9). Entonces las funciones f + g y f · g tambien lassatisfacen.

Demostracion. Por hipotesis existen s, t,M,M ′ ∈ R con s, t,M,M ′ ≥ 1 y k, k′ ∈N ∪ 0 tales que:

|f (j)(x)| ≤Msj+k

y

|g(j)(x)| ≤M ′tj+k,

para cada x ∈ [a, b]. Por tanto:

Capıtulo 6. Sucesiones y Series 81

|(f + g)(j)(x)| = |f (j)(x) + g(j)(x)| ≤ |f (j)(x)|+ |g(j)(x)|

≤Msj+k +M ′tj+k′≤M ′′(sj+k

′′+ tj+k

′′)

≤M ′′(s+ t)j+k′′,

en donde M ′′ = maxM,M ′ y k′′ = maxk, k′.Por otro lado:

|(f · g)(j)(x)| = |j∑i=0

(j

i)f (j−i)(x)g(i)(x)| ≤

j∑i=0

(j

i)Msj−i+kM ′ti+k

= MM ′sktk′j∑i=0

(j

i)sj−iti = MM ′sktk

′(s+ t)j

≤MM ′(s+ t)j+k+k′ .

Capıtulo 7

Integracion de Riemann-Stieltjes

7.1. Funciones de variacion acotada

Definicion 7.1. Una funcion f : [a, b] → R es acotada si existe un numeropositivo M > 0 tal que |f(x)| ≤M para cada x ∈ [a, b]. Equivalentemente, f esacotada si su rango f(x) |x ∈ [a, b] esta contenido en un intervalo [c, d] ⊆ R.

Ejemplo 7.2. 1. Si f : [a, b]→ R es continua, entonces f es acotada.

2. Toda funcion f : [a, b]→ R con rango compacto es acotada. En particular,si f tiene rango finito, entonces f es acotada.

3. Si f, g : [a, b]→ R son acotadas, entonces f + g y f · g tambien lo son.

Demostracion. 3) Supongamos que f , g son acotadas. Entonces existenM1,M2 >0 tales que |f(x)| ≤M1 y |g(x)| ≤M2 para toda x ∈ [a, b] y:

|(f + g)(x)| = |f(x) + g(x)| ≤ |f(x)|+ |g(x)| ≤M1 +M2

y|(f · g)(x)| = |f(x) · g(x)| = |f(x)| |g(x)| ≤M1M2.

Definicion 7.3. Sea [a, b] ⊆ R un intervalo cerrado. Una particion P de [a, b]es una sucesion finita P = a = x0, x1, ..., xn = b de puntos de [a, b] tales quex0 < x1 < ... < xn.

El conjunto de particiones del intervalo [a, b] se denota como P[a, b]. Si a = b,entonces a es la unica particion de [a, b].

Si P = a = x0, x1, ..., xn = b ∈ P[a, b], llamamos la norma de P al maxi-mo de los numeros x1 − x0, x2 − x1, ..., xn − xn−1 y lo denotamos como |P |.

Definicion 7.4. Sea f : [a, b] → R. Decimos que f es de variacion acotadaen [a, b] si existe un numero M > 0 tal que:

82

Capıtulo 7. Integracion de Riemann-Stieltjes 83

∑(P, f) =

n∑k=1

|f(xk)− f(xk−1)| ≤M

para toda P ∈ P[a, b]. En tal caso definimos la variacion total de f en elintervalo [a, b] como:

V (f, [a, b]) = sup∑

(P, f) |P ∈ P[a, b].

Ejemplo 7.5. 1. Toda funcion de variacion acotada es acotada.

Demostracion. Sea f : [a, b] → R de variacion acotada. Tomemos P ∈ P[a, b]como P = a, x, b, x ∈ [a, b] y sea M > 0 tal que:∑

(P, f) = |f(x)− f(a)|+ |f(b)− f(x)| ≤M.

Entonces:

|f(x)| = |f(x)− f(a) + f(a)|≤ |f(x)− f(a)|+ |f(a)|≤ |f(x)− f(a)|+ |f(b)− f(x)|+ |f(a)|≤M + |f(a)| ,

y, por tanto, f es acotada.

2. No toda funcion acotada es de variacion acotada.

Demostracion. Para cada x ∈ (0, 1] definimos

f(x) =πx

4sin

1

x

y f(x) = 0 para x = 0. Es claro que f es una funcion continua del intervalo[0, 1] a R. Veamos que f no es de variacion acotada.

Basta probar que para cada entero n > 0 existe una particion Pn ∈ P[a, b]tal que: ∑

(Pn, f) >1

3+

1

5+

1

7+ ...+

1

2n− 1.

Capıtulo 7. Integracion de Riemann-Stieltjes 84

Para cada k ∈ N definimos ak = 2π(2k−1) y observemos que:

|f(ak+1)− f(ak)| = 1

2

∣∣∣∣ 1

2k + 1+

1

2k − 1

∣∣∣∣=

1

2

4k

(2k + 1)(2k − 1)

=2k

(2k + 1)(2k − 1)

≥ 1

2k + 1.

Ası, tomando Pn = 0, an, an−1, ..., a1, 1 ∈ P[0, 1], obtenemos la desigualdadbuscada.

3. Sea f : [a, b] → R continua, y supongamos que f ′(x) existe para todox ∈ (a, b). Si f ′ : (a, b) → R es acotada, entonces f es de variacion acotada.En particular si f ′′(x) existe para cada x ∈ [a, b], entonces f es de variacionacotada.

Demostracion. Como f ′(x) es acotada en (a, b), entonces existe un numeroM > 0 tal que |f ′(x)| ≤M para cada x ∈ (a, b).

Sea P = a = x0, x1, ..., xn = b una particion de [a, b]. Por el Teorema delvalor medio podemos encontrar un numero ck ∈ (xk−1, xk) tal que:

|f(xk)− f(xk−1)| = |f ′(ck)| |xk − xk−1| ≤M(xk − xk−1).

Entonces∑nk=1 |f(xk − f(xk−1)| ≤ M

∑nk=1(xk − xk−1) = M(b − a), y

por tanto V (f, [a, b]) ≤M(b− a), lo que concluye la prueba.

4. Toda funcion monotona es de variacion acotada.

Demostracion. (Ejercicio)

Definicion 7.6. Sea f : [a, b] → R y sea P ∈ P[a, b], P = x1, x2, ..., xn.Definimos:

λ(P, f) =

n∑k=1

√(xk − xk−1)2 + (f(xk)− f(xk−1))2

la longitud del polıgono resultante (xo, f(x0)), (x1, f(x1)), ..., (xn, f(xn)). Deci-mos que f es rectificable si existe un numero positivo s tal que λ(P, f) ≤ spara toda P ∈ P[a, b]. Y definimos la longitud de arco de f en [a, b] como:

S(f, [a, b]) = sup λ(P, f) |P ∈ P[a, b] .

Capıtulo 7. Integracion de Riemann-Stieltjes 85

Teorema 7.7. Una funcion f : [a, b] → R es rectificable si y solo si es devariacion acotada. Y en tal caso:

V (f, [a, b] ≤ S(f, [a, b]) ≤ V (f, [a, b]) + b− a.

Demostracion. Es suficiente notar que para cada pareja de puntos x, y ∈ [a, b],se tiene:

|f(x)− f(y)| ≤√

(x− y)2 + (f(x)− f(y))2 ≤ |x− y|+ |f(x)− f(y)| .

Ejemplo 7.8. Una posible definicion de π es el numero:

S(f,[− 1√

2,

1√2

]) =

π

2,

en donde f(x) =√

1− x2 para cada x ∈ [−1, 1].

La funcion f es rectificable en [− 1√2, 1√

2], ya que:

f ′(x) = − x√1− x2

y |f ′(x)| ≤ 1 para cada x ∈ [− 1√2, 1√

2].

Y tenemos tambien que 2−√

2 ≤ π2 ≤ 2, pues:

2−√

2 = V (f, [− 1√2,

1√2

])

y V (f, [− 1√2,

1√2

]) +2√2

= 2.

Proposicion 7.9. Sea f : [a, b] → R una funcion y sea a < c < b. Si fes de variacion acotada en [a, b], lo es tambien en los subintervalos [a, c],[c, b].Ademas, en este caso, V (f, [a, b]) = V (f, [a, c]) + V (f, [c, b]).

Demostracion. Sean P0 ∈ P[a, c] y P1 ∈ P[c, b]. Entonces se tiene:∑(P0, f) +

∑(P1, f) =

∑(P0 ∪ P1, f) ≤ V (f, [a, b])

Si ponemos P1 fijo:∑(P0, f) ≤ V (f, [a, b])−

∑(P1, f).

Ası que:

V (f, [a, c]) ≤ V (f, [a, b])−∑

(P1, f)

Capıtulo 7. Integracion de Riemann-Stieltjes 86

y ∑(P1, f) ≤ V (f, [a, b])− V (f, [a, c])

⇒ V (f, [c, b]) ≤ V (f, [a, b])− V (f, [a, c]).

Por tanto:

V (f, [a, b]) ≥ V (f, [a, c]) + V (f, [c, b]).

Para el otro lado de la desigualdad procedemos por contradiccion. Sea:

ε = V (f, [a, b])− V (f, [a, c])− V (f, [c, b]) > 0.

Como V (f, [a, b]) es un supremo, si le restamos ε existe una particion P ∈P[a, b] tal que:

V (f, [a, b])− ε <∑

(P, f)

y, supongamos, sin perdida de generalidad, que c ∈ P . Entonces:

V (f, [a, b])− ε = V (f, [a, c]) + V (f, [a, b])

<∑

(P, f)

=∑

(P ∩ [a, c], f) +∑

(P ∩ [c, b], f)

≤ V (f, [a, c]) + V (f, [c, b]),

lo cual es una contradiccion.

Proposicion 7.10. Sean f, g : [a, b] → R funciones de variacion acotada. En-tonces f + g, f · g y f − g son tambien funciones de variacion acotada en elintervalo [a, b].

Demostracion. Sean f, g : [a, b]→ R, f y g de variacion acotada en [a, b] y seaP = a = x0 < x1 < ... < xn = b una particion de [a, b].

I) Con la suma, tenemos:∑(P, f + g) =

n∑k=1

|(f + g)(xk)− (f + g)(xk−1)|

=

n∑k=1

|f(xk) + g(xk)− f(xk−1)− g(xk−1)|

≤n∑k=1

|f(xk)− f(xk−1)|+n∑k=1

|g(xk)− g(xk−1)|

=∑

(P, f) +∑

(P, g)

≤ V (f, [a, b]) + V (g, [a, b]).

Capıtulo 7. Integracion de Riemann-Stieltjes 87

Tomando supremos se tiene:

V (f + g, [a, b]) ≤ V (f, [a, b]) + V (g, [a, b])

y, por lo tanto, f + g es de variacion acotada.

II) Con el producto, tenemos:

∑(P, fg) =

n∑k=1

|(fg)(xk)− (fg)(xk−1)|

=

n∑k=1

|f(xk)g(xk)− f(xk−1)g(xk−1)|

=

n∑k=1

|f(xk)g(xk)− f(xk−1)g(xk) + f(xk−1)g(xk)− f(xk−1)g(xk−1)|

≤n∑k=1

|g(xk)| |f(xk)− f(xk−1)|+n∑k=1

|f(xk−1)| |g(xk)− g(xk−1)|

≤M1

∑(P, f) +M2

∑(P, g)

≤M1V (f, [a, b]) +M2V (g, [a, b]),

donde:

|g(x)| ≤M1 y |f(x)| ≤M2 para toda x ∈ [a, b].

Ası, tomando supremos tenemos:

V (fg, [a, b]) ≤M1V (f, [a, b]) +M2V (g, [a, b])

y, por tanto, fg es de variacion acotada en [a, b].

Proposicion 7.11. Sea f : [a, b] → R una funcion de variacion acotada. SiV (x) = V (f, [a, x]) y si W (x) = V (x)− f(x) , entonces ambas funciones V,Wson crecientes. Por tanto, una funcion f : [a, b]→ R es de variacion acotada siy solo si f es la diferencia de dos funciones crecientes.

Demostracion. Sean x, y ∈ [a, b], x < y. Entonces:

V (x) = V (f, [a, x]) ≤ V (f, [a, x]) + V (f, [x, y]) = V (f, [a, y]) = V (y).

Por otro lado:

W (y)−W (x) = V (y)− V (x) + (f(x)− f(y)) = V (f, [x, y])− (f(y)− f(x)).

Pero:f(y)− f(x) ≤ |f(y)− f(x)| ≤ V (f, [x, y]).

Capıtulo 7. Integracion de Riemann-Stieltjes 88

Por tanto, W (y)−W (x) ≥ 0.

De aqui se concluye que f es la diferencia de las funciones crecientes V y W .El recıproco se obtiene del hecho de que toda funcion mononota es de variacionacotada y de la proposicion anterior.

Teorema 7.12. Sea f : [a, b] → R una funcion de variacion acotada y seaV : [a, b]→ R definida como sigue:

V (x) =

V (f, [a, x]) si a < x ≤ b

0 x = a

y sea p ∈ [a, b]. Entonces f es continua en p si y solo si V es continua en p.

Demostracion. Supongamos primero que V es continua en p y sea ε > 0. En-tonces existe δ > 0 tal que si 0 < |x−p| < δ, x ∈ [a, b], se tiene |V (x)−V (p)| < ε.

Pero para toda x ∈ [a, b], se tiene:

|f(x)− f(p)| ≤ |V (x)− V (p)|.

Por tanto, si x ∈ [a, b] es tal que 0 < |x − p| < δ, se tiene |f(x) − f(p)| ≤|V (x)− V (p)| < ε y f es continua en p.

Supongamos ahora que f es continua en p y sea ε > 0. Ası, existe δ > 0 talque si |x− p| < δ y x ∈ [a, b], se tiene |f(x)− f(p)| < ε/2.

Tomemos y ∈ [a, b], y 6= p. Supongamos primero que y > p; sabemos que:

V (y)− V (p) = V (f, [p, y]).

Por la definicion de V , existe P = p = c0 < c1 < c2 < ... < cs = y ∈ P[p.y]tal que:

V (y)− V (p)− ε/2 <∑

(P, f).

Refinando P , si es necesario, podemos suponer que c1 − p < δ. Por tanto:

V (y)− V (p)− ε/2 < |f(c1)− f(p)|+s∑

k=2

|f(ck)− f(ck−1)|.

Pero |f(c1) − f(p)| < ε/2 y∑sk=2 |f(ck) − f(ck−1)| ≤ |V (y) − V (c1)|; asi

pues,

V (y)− V (p)− ε/2 < ε/2 + V (y)− V (c1) y V (c1)− V (p) < ε.

Esto implica que:

inf V (x)|x ∈ [p, b) = V (p).

Capıtulo 7. Integracion de Riemann-Stieltjes 89

Como V es creciente, esta igualdad implica que V es continua en p.

7.2. Propiedades generales

Definicion 7.13. Sea [a, b] ⊂ R. Una particion punteada P ∗ de [a, b] es unapareja (P, (t1, t2, ..., tn)) en donde P = a = x0 < x1... < xn = b es una parti-cion de [a, b] y la sucesion finita (t1, t2, ..., tn) satisface la propiedad ti ∈ [xi−1, xi]para cada i ∈ 1, 2, ...n.

La familia de particiones punteadas de [a, b] se denota como P∗[a, b].

Definicion 7.14. Sean P,Q dos particiones (punteadas o no) del intervalo [a, b].Decimos que Q refina a P si Q ⊇ P . Expresamos tambien este hecho comoQ ≥ P .

Definicion 7.15. Sean f, α : [a, b]→ R funciones y sea P ∗ = (a = x0 < x1 <... < xn = b, (t1, t2, ..., tn)) una particion punteada de [a, b]. Definimos la sumade Riemann-Stieltjes de f respecto a α y P ∗ en el intervalo [a, b] comoel numero S(P ∗, f, α) dado mediante la formula:

S(P ∗, f, α) =

n∑k=1

f(tk)(α(xk)− α(xk−1)).

Definicion 7.16. Sean f, α : [a, b] → R funciones acotadas. Decimos f esRiemann-Stieltjes integrable respecto a α en el intervalo [a, b] si existeun numero γ ∈ R con la siguiente propiedad:

(?) Si ε > 0 es arbitrario, existe una particion Pε ∈ P[a, b] tal que si P ∗ esuna particion punteada de [a, b] que refina a Pε, se tiene:

|S(P ∗, f, α)− γ| < ε.

Observacion 7.17. No pueden existir dos numeros distintos γ, γ′ que cumplanla condicion (a) de la definicion (?).

En efecto, si γ < γ′ y ε = (γ′−γ)/2 y tomamos cualquier particion punteadaP ∗ que refine a Pε, tenemos:

|S(P ∗, f, α)− γ| < ε

y| S(P ∗, f, α)− γ′ |< ε.

Por tanto,

γ′ − γ ≤| γ′ − S(P ∗, f, α) | + | S(P ∗, f, α)− γ |< 2ε,

Capıtulo 7. Integracion de Riemann-Stieltjes 90

una contradiccion.

En caso de existir el unico numero γ que cumpla la condicion (a) de ladefinicion 7.16, escribimos:

γ =

∫ b

a

fdα.

Abreviadamente escribimos f ∈ R(α) en [a, b]. Si α(x) = x para cadax ∈ [a, b] y si f ∈ R(α) en [a, b], diremos simplemente que f es Riemann

integrable en [a, b] y lo expresamos como f ∈ R en [a, b] y∫ bafdα =

∫ bafdx.

Ejemplo 7.18. 1. Sean f, α : [0, 1] → R definidas mediante: f(x) = x3,α(x) = x con x ∈ [0, 1] y consideremos la particion punteada:

P ∗n = 0 = x0 < x1... < xn = 1 ; t1, t2, ..., tn,

en donde xk = kn y tk = 2k−1

2n , k ∈ 1, 2, ..., n.

Entonces:

S(P ∗n , f, α) =

n∑k=1

(2k − 1

2n

)3(kn− k − 1

n

)=

1

8n4

n∑k=1

(2k − 1)3

=1

8n4

n∑k=1

(8k3 − 12k2 + 6k − 1)

=1

8n4

[8(n(n+ 1)

2

)2 − 12

6n(n+ 1)(2n+ 1) +

6

2n(n+ 1)− n

]=

1

4− 1

8n2.

En este ejemplo la sucesion S(P ∗n , f, α) converge a 14 .

2. Sean f, α : [0, 1]→ R, en donde:

f(x) = α(x) =

1x si x 6= 00 x = 0

Tomemos la misma particion P ∗n que en el ejemplo anterior.

En este caso tenemos:

Capıtulo 7. Integracion de Riemann-Stieltjes 91

S(P ∗n , f, α) = 2n · n+

n∑k=2

2n

2k − 1

(nk− n

k − 1

)= 2n2

(1−

n∑k=2

1

k(k − 1)(2k − 1)

). (7.1)

Por induccion podemos ver que k(k − 1)(2k − 1) ≥ k2 para cada k ≥ 2.Por tanto:

n∑k=2

1

k(k − 1)(2k − 1)≤

n∑k=2

1

k2

≤n∑k=2

1

k2 − k

=

n∑k=2

( 1

k − 1− 1

k

)= 1− 1

n.

Por tanto:1

n≤ 1−

n∑k=2

1

k(k − 1)(2k − 1).

Por la ecuacion (7.1) concluimos que S(P ∗n , f, α) ≥ 1n2n2 = 2n. En este

caso la sucesion S(P ∗n , f, α) diverge a +∞.

3. Sea f : [a, b] → R arbitraria y sea α : [a, b] → R una funcion con-stante. Entonces, para cualquier particion punteada P ∗ ∈ P∗[a, b], tene-mos S(P ∗, f, α) = 0. Si, por el contrario, f es constante y α es arbitraria,tenemos S(P ∗, f, α) = f(a)(α(b)− α(a)) para cualquier P ∗ ∈ P∗[a, b].

A continuacion estudiaremos algunas de las propiedades de linealidad quetienen las integrales de Riemann-Stieltjes.

Proposicion 7.19. Sean f1, f2, α : [a, b] → R y sean c1, c2 ∈ R. Supongamosque fi ∈ R(α) en [a, b] para i = 1, 2. Entonces c1f1 + c2f2 ∈ R(α) en [a, b] y:∫ b

a

(c1f1 + c2f2)dα = c1

∫ b

a

f1dα+ c2

∫ b

a

f2dα.

Demostracion. Sea ε > 0 y sea Ai =∫ bafidα, i = 1, 2.

Por hipotesis existen particiones P1, P2 de [a, b] tales que P ≥ Pi implicaque:

Capıtulo 7. Integracion de Riemann-Stieltjes 92

|Ai − S(P, fi, α)| < ε

1 + |c1|+ |c2|, i = 1, 2.

Si tomamos Pε = P1 ∪ P2 y si P ≥ Pε, tenemos:

|S(P, c1f1 + c2f2, α)− c1A1 − c2A2| = |c1S(P, f1, α) + c2S(P, f2, α)− c1A1 − c2A2|≤ |c1||S(P, f1, α)−A1|+ |c2||S(P, f2, α)−A2|

<(|c1|+ |c2|)ε1 + |c1|+ |c2|

< ε.

Por tanto, c1f1 + c2f2 ∈ R(α) en [a, b] y:∫ b

a

(c1f1 + c2f2)dα = c1

∫ b

a

f1dα+ c2

∫ b

a

f2dα.

Proposicion 7.20. Sean f, α1, α2 : [a, b] → R y sean c1, c2 ∈ R. Si f ∈ R(αi)en [a, b] para i = 1, 2, entonces f ∈ R(c1α1 + c2α2) en [a, b] y:∫ b

a

fd(c1α1 + c2α2) = c1

∫ b

a

fdα1 + c2

∫ b

a

fdα2.

Demostracion. En este caso, para cada particion punteada P de [a, b], tenemos:

S(P, f, c1α1 + c2α2) = c1S(P, f, α1) + c2S(P, f, α2).

Y, razonando como en 7.19, obtenemos lo deseado.

Proposicion 7.21. Supongamos a < c < b. Si dos de las integrales∫ cafdα,∫ b

cfdα,

∫ bafdα existen, entonces la tercera tambien existe y se cumple la ecuacion:∫ c

a

fdα+

∫ b

c

fdα =

∫ b

a

fdα.

Demostracion. Supongamos , para fijar ideas, que∫ cafdα y

∫ bcfdα existen. Sea

ε > 0. Existen entonces particiones P1 ∈ P[a, c] y P2 ∈ P[c, b] tales que si Q1

refina a P1 y Q2 refina a P2, entonces:∣∣ ∫ c

a

fdα− S(Q1, f, α)∣∣ < ε

2

y

∣∣ ∫ b

c

fdα− S(Q2, f, α)∣∣ < ε

2.

Tomando Pε = P1 ∪ P2 y Q un refinamiento de Pε, tenemos:

Capıtulo 7. Integracion de Riemann-Stieltjes 93

∣∣ ∫ c

a

fdα+

∫ b

c

fdα−S(Q, f, α)∣∣ =

∣∣ ∫ c

a

fdα+

∫ b

c

fdα−S(Q1, f, α)−S(Q2, f, α)∣∣,

en donde Q1 = Q ∩ [a, c] y Q2 = Q ∩ [c, b].

Por tanto,

∣∣ ∫ c

a

fdα+

∫ b

c

fdα− S(Q, f, α)∣∣ ≤ ∣∣ ∫ c

a

fdα− S(Q1, f, α)∣∣

+∣∣ ∫ b

c

fdα− S(Q2, f, α)∣∣

2+ε

2= ε.

Hemos probado entonces que∫ bafdα existe y coincide con

∫ cafdα+

∫ bcfdα.

Supongamos ahora que∫ cafdα y

∫ bafdα existen.

Probaremos que∫ bcfdα existe y es igual a la diferencia

∫ bafdα−

∫ cafdα.

Sea ε > 0 . Por hipotesis existen particiones P0 ∈ P[a, b] y P1 ∈ P[a, c] talesque si Q0 ⊇ P0, Q1 ⊇ P1, Q0 ∈ P[a, b], Q1 ∈ P[a, c], entonces:

∣∣ ∫ b

a

fdα− S(Q0, f, α)∣∣ < ε

2

y ∣∣ ∫ c

a

fdα− S(Q1, f, α)∣∣ < ε

2.

Sin perdida de generalidad supongamos que P0 ⊇ P1. Existe entonces unaparticion P2 ∈ P[c, b] tal que P0 = P1 ∪ P2. Si Q es una particion de [c, b] querefina a P2, tenemos:

∣∣ ∫ b

a

fdα−∫ c

a

fdα− S(Q, f, α)∣∣ =

∣∣ ∫ b

a

fdα−∫ c

a

fdα− S(P1 ∪Q, f, α) + S(P1, f, α)∣∣

≤∣∣ ∫ b

a

fdα− S(P1 ∪Q, f, α)∣∣+∣∣ ∫ c

a

fdα− S(P1, f, α)∣∣

2+ε

2= ε.

Por tanto,∫ bcfdα existe y su valor coincide con

∫ bafdα−

∫ cafdα.

Capıtulo 7. Integracion de Riemann-Stieltjes 94

Definicion 7.22. Supongamos que f ∈ R(α) en [a, b] con a < b. Definimos:∫ a

b

fdα = −∫ b

a

fdα

y ∫ a

a

fdα = 0.

Podemos entonces enunciar la Proposicion 7.21 de una forma equivalente:

Proposicion 7.23. Sean a, b, c ∈ R arbitrarios y supongamos que dos de las

integrales∫ cafdα,

∫ bcfdα,

∫ bafdα existen. Entonces la tercera integral tambien

existe y se cumple la ecuacion:∫ c

a

fdα+

∫ b

c

fdα+

∫ a

b

fdα = 0.

Teorema 7.24. (Teorema de Integracion por partes) Sean f, α : [a, b]→ Rtales que f ∈ R(α) en [a, b]. Entonces α ∈ R(f) en [a, b] y:∫ b

a

fdα+

∫ b

a

αdf = f(b)α(b)− f(a)α(a).

Demostracion. Sean C = f(b)α(b) − f(a)α(a) y A =∫ bafdα. Sea ε > 0. En-

tonces existe Pε ∈ P[a, b] tal que si P refina a Pε, se tiene |S(P, f, α)−A| < ε.

A cada particion punteada P ∗ = a = x0 < x1... < xn = b ; t1, t2, ..., tnasociemos el refinamiento:

P ′ = x0, t1, x1, t2, x2, ..., xn−1, tn, xn ; x0, x1, x1, x2, x2, ..., xn−1, xn.

Observemos la relacion:

S(P ′, f, α) =

n∑k=1

[f(xk−1)(α(tk)− α(xk−1)) + f(xk)(α(xk)− α(tk)

]=

n∑k=1

[f(xk)α(xk)− f(xk−1)α(xk−1)

]+

n∑k=1

α(tk)(f(xk−1)− f(xk)) = C − S(P, α, f).

Si P ≥ Pε, tambien P ′ ≥ Pε. Por tanto, tomando P ≥ Pε tenemos:

|S(P, α, f)− (C −A)| = |A− S(P ′, f, α)| < ε.

De donde, α ∈ R(f) en [a, b] y∫ baαdf = C −

∫ bafdα.

Capıtulo 7. Integracion de Riemann-Stieltjes 95

Teorema 7.25. (Teorema de Sustitucion) Sea f ∈ R(α) en [a, b] y seag una funcion continua biyectiva y monotona de un intervalo cerrado S conextremos c, d sobre [a, b]. Supongamos que a = g(c) y b = g(d). Sean h = f gy β = α g. Entonces h ∈ R(β) en S y se tiene

∫ bafdα =

∫ dchdβ.

Demostracion. Supongamos, por ejemplo, que g es estrictamente creciente. Portanto, c < d y g tiene inversa g−1 continua y estrictamente creciente de [a, b]sobre [c, d].

Por tanto, a cada particion P = yo, y1, ..., yn de [c, d] corresponde laparticion: g(P ) = g(yo), g(y1), ..., g(yn) de [a, b] y a cada particion P ′ =xo, x1, ..., xn de [a, b] corresponde la particion:

g−1(P ′) = g−1(x0), g−1(x1), ..., g−1(xn)

de [c, d]. Ademas, g y g−1 respetan refinamientos.

Si ε > 0 esta dado, existe una particion P ′ε de [a, b] tal que P ′ ⊇ P ′ε implica:

|S(P ′, f, α)−∫ b

a

fdα| < ε

Sea Pε = g−1(P ′ε) la correspondiente particion de [c, d] y sea P ⊇ Pε,P = yo, y1, ..., yn;µ1, ..., µn un refinamiento de Pε.

Formemos la suma de Riemann-Stieltjes S(P, h, β),

S(P, h, β) =n∑k=1

h(µk)(β(yk)− β(yk−1)), en donde µk ∈ [yk−1, yk].

Poniendo tk = g(µk), xk = g(yk), tenemos que P ′ = x0, x1, ..., xn; t1, ..., tnes una particion de [a, b] que refina a P ′ε . Ademas:

S(P, h, β) =

n∑k=1

f(g(µk))[α(g(yk))− α(g(yk−1))]

=

n∑k=1

f(tk)(α(xk)− α(xk−1))

= S(P ′, f, α).

Por tanto:

|S(P, h, β)−∫ b

a

fdα| = |S(P ′, f, α)−∫ b

a

fdα| < ε.

Si g es estrictamente decreciente, la demostracion es analoga.

Capıtulo 7. Integracion de Riemann-Stieltjes 96

El siguiente Teorema plantea un caso en que una integral de Riemann-Stieltjes puede reducirse a una integral de Riemann.

Teorema 7.26. Sea f ∈ R(α) en [a, b] , f acotada y supongamos que α tiene

derivada continua en [a, b]. Entonces fα′ ∈ R en [a, b] y∫ bafα′dx =

∫ bafdα.

Demostracion. Sea g(x) = f(x)α′(x) y consideremos una particion punteadaP = a = x0 < x1 < ... < xn = b ; t1, t2, ..., tn de [a, b]. Entonces:

S(P, g) =

n∑k=1

g(tk)(xk − xk−1) =

n∑k=1

f(tk)α′(tk)(xk − xk−1).

Por otro lado:

S(P, f, α) =

n∑k=1

f(tk)(α(xk)− α(xk−1)).

Aplicando el teorema del valor medio a la funcion α en cada subintervalo deP , encontramos, para cada k ∈ 1, 2, ..., n, un punto νk ∈ (xk−1, xk) tal que:

α(xk)− α(xk−1) = α′(νk)(xk − xk−1).

Por tanto, S(P, f, α)− S(P, g) =n∑k=1

f(tk)[α′(νk)− α′(tk)](xk − xk−1).

Como f es acotada, existe M > 0 tal que |f(x)| ≤ M para cada x ∈ [a, b].Si ε > 0 esta dado, existe, por la continuidad uniforme de α′, un numero δ > 0tal que 0 ≤ |x− y| < δ con x, y ∈ [a, b] implica que:

|α′(x)− α′(y)| < ε

2M(b− a).

Por tanto, si la particion P tiene norma < δ, tenemos:

|S(P, f, α)− S(P, g)| ≤n∑k=1

|f(tk)||α′(νk)− α′(tk)|(xk − xk−1)

< M · ε

2M(b− a)

n∑k=1

(xk − xk−1) =ε

2.

Por otro lado, existe una particion Pε de [a, b] tal que P ⊇ Pε implica que

|S(P, f, α)−∫ bafdα| < ε/2.

En consecuencia, si al mismo tiempo P ⊇ Pε y |P | < δ, tenemos:

|S(P, g)−∫ b

a

fdα| ≤ |S(P, g)− S(P, f, α)|+ |S(P, f, α)−∫ b

a

fdα|

< ε/2 + ε/2 = ε.

Como ε > 0 es arbitrario, concluimos que∫ bagdx =

∫ bafdα.

Capıtulo 7. Integracion de Riemann-Stieltjes 97

Teorema 7.27. (Teorema Fundamental del Calculo Integral) Sea f ∈ Ren [a, b]. Sea g : [a, b] → R tal que g′(x) = f(x) para cada x ∈ [a, b]. Entonces∫ baf(x)dx =

∫ bag′(x)dx = g(b)− g(a).

Demostracion. Para cada particion P = a = x0 < x1 < ... < xn = b de [a, b],tenemos la identidad:

g(b)− g(a) =

n∑k=1

(g(xk)− g(xk−1))

=

n∑k=1

g′(tk)(xk − xk−1)

=

n∑k=1

f(tk)(xk − xk−1),

en donde tk es un punto del intervalo abierto (xk−1, xk) cuya existencia asegurael teorema del valor medio del calculo diferencial. Si ε > 0, existe una particionPε ∈ P[a, b] tal que si P ⊇ Pε, entonces:

|S(P, f)−∫ b

a

f(x)dx| < ε.

Por tanto, si P ⊇ Pε y punteamos P con los puntos tk ∈ (xk−1, xk), tenemos:

|g(b)− g(a)−∫ b

a

f(x)dx| < ε.

Esto implica que g(b)− g(a) =∫ baf(x)dx.

Ejemplo 7.28. Suponiendo cierta la afirmacion: f : [a, b]→ R continua, impli-ca que f ∈ R en [a, b], calcularemos:

I =

∫ 1

−1

√1− x2 dx

Por 7.23 tenemos I = I1+I2, en donde I1 =∫ 0

−1

√1− x2 dx e I2 =

∫ 1

0

√1− x2 dx.

Calculemos I2.

Consideremos la funcion continua, biyectiva y estrictamente creciente g :[0, π2 ]→ [0, 1] definida por g(u) = sin(u).

Por 7.25 tenemos I2 =∫ π

2

0cos(u) d sin(u) y, por 7.26,∫ π

2

0

cos(u) d sin(u) =

∫ π2

0

cos2(u) du.

Usando la formula trigonometrica cos2(u) = 1+cos(2u)2 , tenemos:

Capıtulo 7. Integracion de Riemann-Stieltjes 98

∫ π2

0

cos2(u) du =1

2

∫ π2

0

du+1

2

∫ π2

0

cos(2u) du.

La funcion h : [0, π2 ]→ R, definida por la formula:

h(v) =sin(2v)

2

satisface h′(v) = cos(2v) para cada v ∈ [0, π2 ]. Por tanto, usando 7.27 obtene-mos: ∫ π

2

0

cos2(u) du =1

2

(π2− 0)

+1

2

( sin(π)

2− sin(0)

2

)=π

4.

De donde I2 = π4 . En forma analoga se prueba que

I1 =

∫ 0

−1

√1− x2 dx =

π

4.

Por tanto I = I1 + I2 = π2 .

Ejemplo 7.29. Usando los Teoremas 7.24 y 7.27 calculemos I =∫ π

2

0ex cos(x) dx.

I =

∫ π2

0

ex cos(x) dx

=

∫ π2

0

ex d sin(x)

= eπ2 −

∫ π2

0

sin(x) dex

= eπ2 −

∫ π2

0

ex sin(x) dx

= eπ2 +

∫ π2

0

ex d cos(x)

= eπ2 − 1−

∫ π2

0

cos(x) dex

= eπ2 − 1− I.

Por tanto I = 12 (e

π2 − 1).

7.3. Integracion con integradores crecientes

A lo largo de esta seccion supondremos que el integrador α : [a, b] → R esuna funcion creciente y que el integrando f : [a, b]→ R es una funcion acotada.

Capıtulo 7. Integracion de Riemann-Stieltjes 99

Definicion 7.30. Sea P = a = x0 < x1 < ... < xn = b una particion de[a, b]. Consideremos los numeros:

M(f, k) = supf(x) |x ∈ [xk−1, xk]

m(f, k) = ınff(x) |x ∈ [xk−1, xk].Definimos entonces:

U(P, f, α) =

n∑k=1

M(f, k)(α(xk)− α(xk−1)),

L(P, f, α) =n∑k=1

m(f, k)(α(xk)− α(xk−1)).

Los numeros U(P, f, α) y L(P, f, α) reciben el nombre de sumas(superiore inferior) de Riemann-Stieltjes de f y α respecto a la particion P.

En la siguiente proposicion resumimos las propiedades de estas sumas.

Proposicion 7.31. Sean P,Q ∈ P[a, b]. Entonces:

(i) L(P, f, α) ≤ U(P, f, α).

(ii) P ⊇ Q implica que U(P, f, α) ≤ U(Q, f, α) y L(P, f, α) ≥ L(Q, f, α).

(iii) Si P y Q son arbitrarias, siempre se tiene L(P, f, α) ≤ U(Q, f, α).

Demostracion. (i) Basta observar que m(f, k) ≤ M(f, k) y que α(xk−1) ≤α(xk) para cada k ∈ 1, 2, ..., n, en donde P = a = x0 < x1 < ... <xn = b.

(ii) Es suficiente considerar el caso en que P = Q ∪ λ, en donde Q = a =q0 < q1 < ... < qn = b y λ ∈ (qj−1, qj) para alguna j ∈ 1, 2, ...,m.Denotando:

M ′ = supf(x) |x ∈ [qj−1, λ]

y

M ′′ = supf(x) |x ∈ [λ, qj ],

tenemos:

U(P, f, α) =

j−1∑k=1

M(f, k)(α(xk)− α(xk−1))

+

m∑k=j+1

M(f, k)(α(xk)− α(xk−1))

+M ′(α(λ)− α(qj−1)) +M ′′(α(qj)− α(λ)).

Capıtulo 7. Integracion de Riemann-Stieltjes 100

Como M ′,M ′′ ≤M(f, j), tenemos:

U(P, f, α) ≤m∑k=1

M(f, k)(α(xk)− α(xk−1)) = U(Q, f, α).

Analogamente se demuestra que L(P, f, α) ≥ L(Q, f, α).

Definicion 7.32. Las integrales superior e inferior

−∫ b

a

fdα,

∫ b

a−

fdα se definen

con las formulas :

−∫ b

a

fdα = ınfU(P, f, α) |P ∈ P[a, b];

∫ b

a−

fdα = supL(P, f, α) |P ∈ P[a, b].

Las relaciones entre estas integrales se establecen en el siguiente Teorema.

Teorema 7.33. (i)

∫ b

a−

fdα ≤

−∫ b

a

fdα y existen ejemplos en los que ambas

integrales son diferentes.

(ii) Si a < c < b, se tiene:

−∫ b

a

fdα =

−∫ c

a

fdα+

−∫ b

c

fdα,

∫ b

a−

fdα =

∫ c

a−

fdα+

∫ b

c−

fdα.

(iii) Si f, g : [a, b]→ R,

−∫ b

a

(f + g)dα ≤

−∫ b

a

fdα+

−∫ b

a

gdα,

∫ b

a−

(f + g)dα ≥∫ b

a−

fdα+

∫ b

a−

gdα.

Capıtulo 7. Integracion de Riemann-Stieltjes 101

Demostracion. (i) De 7.31 inciso (iii), obtenemos:

L(P, f, α) ≤

−∫ b

a

gdα para cada P ∈ P[a, b].

Por tanto,

supL(P, f, α) |P ∈ P[a, b] =

∫ b

a−

fdα ≤

−∫ b

a

fdα.

(ii) Es claro que

−∫ b

a

fdα = ınfU(P, f, α) | c ∈ P ∈ P[a, b].

Pero si c ∈ P ∈ P[a, b] y P ′ = P ∩ [a, c], P ′′ = P ∩ [c, b], tenemos:

U(P, f, α) = U(P ′, f, α) + U(P ′′f, α).

Por tanto,

−∫ b

a

fdα = ınfU(P, f, α) | c ∈ P ∈ P[a, b]

= ınfU(P ′, f, α) |P ′ ∈ P[a, c]+ ınfU(P ′′, f, α) |P ′′ ∈ P[, b]

=

−∫ c

a

fdα+

−∫ b

c

fdα.

(iii) Probemos, por ejemplo, la desigualdad:

∫ b

a

(f + g)dα ≤∫ b

a

fdα+

∫ b

a

gdα.

Por contradiccion, supongamos que:∫ b

a

(f + g)dα−∫ b

a

fdα−∫ b

a

gdα = 2ε > 0.

Por definicion de

−∫ b

a

fdα,

−∫ b

a

gdα, existen particiones P,Q ∈ P[a, b] tales

que:

Capıtulo 7. Integracion de Riemann-Stieltjes 102

∫ b

a

fdα+ ε > U(P, f, α);

∫ b

a

gdα+ ε > U(Q, g, α).

Por tanto,

∫ b

a

(f + g)dα =(∫ b

a

fdα+ ε)

+(∫ b

a

gdα+ ε)

> U(P, f, α) + U(Q, g, α)

≥ U(P ∪Q, f, α) + U(P ∪Q, g, α)

≥ U(P ∪Q, f + g, α),

una contradiccion.

Teorema 7.34. Las siguientes condiciones son equivalentes:

(i) f ∈ R(α) en [a, b].

(ii) Para cada ε > 0, existe Pε ∈ P[a, b] tal que U(Pε, f, α)− L(Pε, f, α) < ε.

(iii) Existen particiones P1 ⊆ P2 ⊆ P3... de [a, b], tales que:

U(Pn, f, α)− L(Pn, f, α)→ 0.

(iv)

∫ b

a−

fdα =

−∫ b

a

fdα.

Demostracion. (i) ⇒ (ii) Sin perdida de generalidad, supongamos que α(a) <α(b).Dado ε > 0, existe una particion Pε = a = x0 < x1 < ... < xn = b de[a, b] tal que para punteos arbitrarios (λ1, λ2, ..., λn), (λ′1, λ

′2, ..., λ

′n) de Pε,

tenemos:

∣∣ n∑k=1

f(λk)(α(xk)− α(xk−1))−A∣∣ < ε

3,

∣∣ n∑k=1

f(λ′k)(α(xk)− α(xk−1))−A∣∣ < ε

3,

Capıtulo 7. Integracion de Riemann-Stieltjes 103

en donde A =∫ bafdα.

De aquı deducimos que si λk, λ′k son escogidos arbitrariamente en [xk−1, xk],tenemos:

∣∣ n∑k=1

(f(λk)− f(λ′k))(α(xk)− α(xk−1))∣∣ < 2

3ε.

Debido a que Mk(f) − mk(f) = supf(λ) − f(λ′) |λ, λ′ ∈ [xk−1, xk] ,existen λk y λ′k en [xk−1, xk] tales que:

Mk(f)−mk(f)− ε

3(α(b)− α(a))< f(λk)− f(λ′k).

Por tanto,

U(Pε, f, α)− L(Pε, f, α) =

n∑k=1

[Mk(f)−mk(f)][α(xk)− α(xk−1)]

<

n∑k=1

(f(λk)− f(λ′k))(α(xk)− α(xk−1))

3(α(b)− α(a))

n∑k=1

(α(xk)− α(xk−1))

<2

3ε+

ε

3= ε.

(ii)⇒ (iii) SeanQ1, Q2, ... particiones de [a, b] tales que U(Qn, f, α)−L(Qn, f, α) <1/n.

Tomando Pn = Q1 ∪Q2 ∪ ... ∪Qn, tenemos el resultado buscado.

(iii) ⇒ (iv) Basta observar que

0 ≤

−∫ b

a

fdα−∫ b

a−

fdα ≤ U(Pn, f, α)− L(Pn, f, α)

para cada n ∈ N.

(iv) ⇒ (i) Sean ε > 0 y A =

−∫ b

a

fdα =

∫ b

a−

fdα.

Capıtulo 7. Integracion de Riemann-Stieltjes 104

Existen entonces particiones P1, P2 ∈ P[a, b] tales que:A−ε/2 < L(P1, f, α)y A+ ε/2 > U(P2, f, α). Por tanto, si Pε = P1 ∪ P2 y si P ⊇ Pε tenemos:

A− ε

2< L(P1, f, α) ≤ L(P, f, α) ≤ U(P, f, α)

≤ U(P2, f, α) < A+ε

2.

Si punteamos P arbitrariamente, tenemos:

L(P, f, α) ≤ S(P, f, α) ≤ U(P, f, α).

Por tanto, P ⊇ Pε implica que |S(P, f, α)−A| < ε y f ∈ R(α) en [a, b].

Teorema 7.35. Sea α : [a, b]→ R de variacion acotada y sea V : [a, b]→ R lavariacion de α. Sea f ∈ R(α) en [a, b]. Entonces f ∈ R(V ) en [a, b].

Demostracion. Si V (b) = 0, entonces f es constante y el resultado es trivial.Ası pues, supongamos que V (b) > 0. Supongamos tambien que |f(x)| ≤M , conM > 0, para cada x ∈ [a, b].

Como V es creciente, bastara probar que para cada ε > 0, existe una par-ticion Pε ∈ P[a, b] tal que U(Pε, f, V ) − L(Pε, f, V ) < ε. Ya que f ∈ R(α) en

[a, b], existe P ′ε ∈ P[a, b] tal que si P ⊇ P ′ε , entonces |S(P, f, α)−∫ bafdα| < ε/8.

Por tanto, si P = a = x0 < x1 < ... < xn = b refina a P ′ε , para seleccionesarbitrarias tk, t

′k ∈ [xk−1, xk], tenemos:∣∣∑(f(tk)− f(t′k))(α(xk)− α(xk−1)

∣∣ < ε

4.

Sea Pε ⊇ P ′ε tal que

V (b)− ε

4M<

n∑k=1

|α(xk)− α(xk−1)| =∑

(Pε, α).

Observemos que

U(P, f, V )− L(P, f, V ) =

n∑k=1

(Mk(f)−mk(f))(V (xk)− V (xk−1))

=∑

1+∑

2,

en donde,

∑1

=

n∑k=1

(Mk(f)−mk(f))|α(xk)− α(xk−1)|

Capıtulo 7. Integracion de Riemann-Stieltjes 105

y

∑2

=

n∑k=1

(Mk(f)−mk(f))(V (xk)− V (xk−1)− |α(xk)− α(xk−1)|),

Es sencillo probar que:

∑2≤ 2M

n∑k=1

(V (xk)− V (xk−1)− |α(xk)− α(xk−1)|)

= 2M(V (b)−∑

(Pε, α)) <ε

2.

Probaremos entonces que∑

1 < ε/2. Definamos:

A1 = k ∈ 1, 2, ..., n|α(xk) ≥ α(xk−1);

A2 = k ∈ 1, 2, ..., n|α(xk) < α(xk−1).

Si k ∈ A1, sean tk, t′k tales que

Mk(f)−mk(f) < f(tk)− f(t′k) +ε

4V (b)

y si k ∈ A2, sean tk, t′k tales que

Mk(f)−mk(f) < f(t′k)− f(tk) +ε

4V (b).

Por tanto,

∑1<∑k∈A1

(f(tk)− f(t′k))|α(xk)− α(xk−1)|

+∑k∈A2

(f(t′k)− f(tk))|α(xk)− α(xk−1)|

4V (b)

n∑k=1

|α(xk)− α(xk−1)|

=

n∑k=1

(f(tk)− f(t′k))(α(xk)− α(xk−1)) +ε

4V (b)

∑(Pε, α)

4+

ε

4V (b)V (b) =

ε

2.

Capıtulo 7. Integracion de Riemann-Stieltjes 106

Corolario 7.36. Sea α : [a, b] → R una funcion de variacion acotada, seaV : [a, b] → R la variacion de α en [a, b] y sea D = V − α. Sea f : [a, b] → Runa funcion acotada. Entonces f ∈ R(α) en [a, b] si y solo si f ∈ R(V ) en [a, b]y f ∈ R(D) en [a, b].

Teorema 7.37. Sea α de variacion acotada en [a, b] y supongamos que f ∈ R(α)en [a, b]. Entonces f ∈ R(α) en cada subintervalo [c, d] ⊆ [a, b].

Demostracion. Por 7.35 y 7.36 basta suponer que α es creciente.Sea ε > 0. Por el Teorema 7.34, existe una particion Pε ∈ P[a, b] tal que

U(Pε, f, α) − L(Pε, f, α) < ε y , sin perdida de generalidad, podemos suponerque c ∈ Pε. Sea P ′ε = Pε ∩ [a, c]. Entonces se tiene:

U(P ′ε , f, α)− L(P ′ε , f, α) ≤ U(Pε, f, α)− L(Pε, f, α) < ε.

Nuevamente, por el Teorema 7.34, deducimos que f ∈ R(α) en [a, c]. Enforma similar se prueba que f ∈ R(α) en [a, d]. Por tanto f ∈ R(α) en [c, d].

Teorema 7.38. Sean f, g ∈ R(α) en [a, b], en donde α : [a, b]→ R es creciente. Si f(x) ≤ g(x) para cada x ∈ [a, b], entonces:∫ b

a

fdα ≤∫ b

a

gdα.

En particular∫ bafdα ≥ 0 si f(x) ≥ 0 para cada x ∈ [a, b].

Demostracion. Para cada particion P ∈ P[a, b] tenemos:

U(P, f, α) ≤ U(P, g, α).

Por tanto,

∫ b

a

fdα =

∫ b

a

fdα

= ınfU(P, f, α) |P ∈ P[a, b]≤ ınfU(P, g, α) |P ∈ P[a, b]

=

∫ b

a

gdα

=

∫ b

a

gdα.

Teorema 7.39. Sea α : [a, b]→ R una funcion creciente. Sea f : [a, b]→ R talque f ∈ R(α) en [a, b]. Entonces |f | ∈ R(α) en [a, b] y:

Capıtulo 7. Integracion de Riemann-Stieltjes 107

∣∣ ∫ b

a

fdα∣∣ ≤ ∫ b

a

|f |dα.

Demostracion. Sea P = a = x0 < x1... < xn = b ∈ P[a, b]. Para cada parejade puntos x, y ∈ [a, b], tenemos:∣∣|f(x)| − |f(y)|

∣∣ ≤ |f(x)− f(y)|.

Por tanto,

Mk(|f |)−mk(|f |) = sup|f(x)| − |f(y)| |x, y ∈ [xk−1, xk]≤ supf(x)− f(y) |x, y ∈ [xk−1, xk]= Mk(f)−mk(f).

En consecuencia,

U(P, |f |, α)− L(P, |f |, α) ≤ U(P, f, α)− L(P, f, α).

Aplicando el teorema 7.34, deducimos que |f | ∈ R(α) en [a, b].La desigualdad buscada la obtenemos tomando g = |f | en el teorema 7.38.

Teorema 7.40. Sea α : [a, b]→ R una funcion creciente y sean f, g : [a, b]→ Rtales que f ∈ R(α) en [a, b] y g ∈ R(α) en [a, b]. Entonces fg ∈ R(α) en [a, b].

Demostracion. Supongamos primero que f = g.

Sea M > 0 tal que |f(x)| ≤ M para cada x ∈ [a, b]. Si P = a = x0 < x1 <... < xn = b ∈ P[a, b], tenemos:

(Mk(|f |))2 = Mk(f2) y (mk(|f |))2 = mk(f2), y, por tanto:

Mk(f2)−mk(f2) = [Mk(|f |) +mk(|f |)][Mk(|f |)−mk(|f |)]≤ 2M [Mk(|f |)−mk(|f |)].

Aplicando 7.34 a |f |, deducimos que f2 ∈ R(α) en [a, b]. En el caso generalobservemos que:

2f(x)g(x) = [f(x) + g(x)]2 − [f(x)]2 − [g(x)]2.

Basta entonces aplicar el caso anterior y el Teorema 6.19.

Teorema 7.41. Sean f : [a, b] → R continua y α : [a, b] → R de variacionacotada. Entonces f ∈ R(α) en [a, b].

Capıtulo 7. Integracion de Riemann-Stieltjes 108

Demostracion. Por el corolario 7.36 basta probar el teorema cuando α es cre-ciente y no constante en [a, b].

Sea ε > 0. Usando el teorema 7.34, nos bastara encontrar una particion Pεde [a, b] tal que U(Pε, f, α)−L(Pε, f, α) < ε, digamos Pε = a = x0 < x1 < ... <xn = b.

Por la continuidad uniforme de f , existe δ > 0 tal que |x − y| < δ, conx, y ∈ [a, b], implica que |f(x)− f(y)| < ε/A, en donde A = α(b)− α(a).

Escojamos Pε ∈ P[a, b] de manera que |Pε| < δ. Ası, para cada k ∈ 1, 2, ..., n,existen tk, t

′k ∈ [xk−1, xk] tales que Mk(f) = f(tk) y mk(f) = f(t′k).

Multiplicando por α(xk)− α(xk−1) y sumando, obtenemos:

U(P, f, α)− L(P, f, α) <ε

A

n∑k=1

(α(xk)− α(xk−1)) = ε.

Corolario 7.42. Sean f : [a, b] → R de variacion acotada y α : [a, b] → Rcontinua. Entonces f ∈ R(α) en [a, b].

Demostracion. Aplıquese el Teorema de integracion por partes.

Corolario 7.43. Sea f : [a, b] → R continua o de variacion acotada en [a, b].Entonces f ∈ R en [a, b].

Ejemplo 7.44. Sea f : [a, b] → R tal que f ′ existe y es continua en [a, b].Entonces f es rectificable y:

S(f, [a, b]) =

∫ b

a

√1 + (f ′(x))2dx.

Demostracion. Definamos g(x) =√

1 + (f ′(x))2 para cada x ∈ [a, b]. Si P =a = x0 < x1 < ... < xn = b ∈ P[a, b], tenemos:

λ(P, f) =

n∑k=1

√(xk − xk−1)2 + (f(xk)− f(xk−1))2.

Aplicando el teorema del valor medio en cada subintervalo [xk−1, xk], exis-ten puntos tk ∈ (xk−1, xk), con k = 1, ..., n, tales que f(xk) − f(xk−1) =f ′(tk)(xk−1, xk). De donde,

λ(P, f) =

n∑k=1

g(tk)(xk − xk−1) = S(P, g).

Capıtulo 7. Integracion de Riemann-Stieltjes 109

Sea ε > 0. Por el Teorema 7.41 existe una particion Pε ∈ P[a, b] tal que

P ⊇ Pε implica que |S(P, g)−∫ bag(x)dx| < ε/2.

Como S(f, [a, b]) = supλ(P, f) |P ∈ P[a, b], existe P ′ε tal que:

|S(f, [a, b])− λ(P ′ε , f)| < ε/2.

Por tanto, si P ⊇ (Pε ∪ P ′ε), tenemos:

|S(f, [a, b])−∫ b

a

g(x)dx| ≤ |λ(P, g)−S(f, [a, b])|+|∫ b

a

g(x)dx−S(P, g)| < ε

2+ε

2= ε

De aquı que S(f, [a, b]) =∫ bag(x)dx.

Teorema 7.45. Sean f : [a, b] → R acotada y α : [a, b] → R creciente y seac ∈ (a, b). Supongamos que ambas son discontinuas por la derecha en c o ambasson discontinuas por la izquierda en c. Entonces f /∈ R(α) en [a, b].

Demostracion. Supongamos, por ejemplo, que f y α son ambas discontinuaspor la derecha en c. Existe entonces un numero positivo ε > 0 y dos sucesionesys, zs en (c, b) tales que ys → c, zs → c y |f(ys)−f(c)| ≥ ε, α(zs)−α(c) ≥ εpara cada s ∈ N. Si P es cualquier particion de [a, b] que contiene a c, digamosP = a = x0 < x1 < ... < xi−1 = c < xi < ... < xn = b, tenemos:

U(P, f, α)− L(P, f, α) ≥ (Mi(f)−mi(f))(α(xi)− α(c)).

Tomando s ∈ N tal que ys, zs ∈ (c, xi), tenemos:

Mi(f)−mi(f) = supf(x)− f(y) |x, y ∈ [c, xi]≥ |f(ys)− f(c)|≥ ε

y

α(xi)− α(c) ≥ α(zs)− α(c) ≥ ε.

Por tanto, U(P, f, α) − L(P, f, α) ≥ ε2 y f /∈ R(α) en [a, b]. Si f y α sonambas discontinuas por la izquierda en c, la demostracion es analoga.

Definicion 7.46. Una funcion α : [a, b] → R es escalonada si existe unconjunto finito x1, x2, ..., xs ⊆ [a, b], en donde a ≤ x1 < ... < xs ≤ b y tal queα es constante en cada uno de los intervalos [a, x1], (x1, x2), ...(xs−1, xs), [xs, b].Los valores constantes tomados en estos intervalos se denotan como λ0, λ1, ...λs,respectivamente.

Capıtulo 7. Integracion de Riemann-Stieltjes 110

Teorema 7.47. Sean f : [a, b]→ R y α : [a, b]→ R escalonadas. Supongamos:

(i) Si λi 6= α(xi+1) con i = 0, 1, ..., s−1, entonces f es continua por la izquierdaen xi+1;

(ii) Si λi 6= α(xi) con i = 0, 1, ..., s, entonces f es continua por la derecha enxi.

Entonces f ∈ R(α) en [a, b] y:

∫ b

a

fdα =

s∑i=1

f(xi)(λi − λi−1).

Demostracion. Sean c0, c1, ..., cs los puntos medios de los intervalos

[a, x1], (x1, x2), .., (xs−1, xs), [xs, b].

Probaremos que f ∈ R(α) en cada uno de los intervalos cerrados

[a, c0], [c0, x1], [x1, c1], [c1, x2], ..., [xs−1, cs−1], [cs−1, xs], [xs, cs], [cs, b].

Tenemos que α es constante en cada uno de estos intervalos con la posibleexcepcion de uno de los extremos.

Haciendo calculos sencillos obtenemos:∫ c0

a

fdα = 0∫ x1

c0

fdα = f(x1)(α(x1)− λ0)∫ c1

x1

fdα = f(x1)(λ1 − α(x1))

.

.

.∫ xs

cs−1

fdα = f(xs)(α(xs)− λs−1)∫ cs

xs

fdα = f(xs)(λs − α(xs))∫ b

cs

fdα = 0

Sumando todas estas integrales obtenemos el resultado deseado.

Capıtulo 7. Integracion de Riemann-Stieltjes 111

Teorema 7.48. (Primer teorema del valor medio para integrales deRiemann-Stieltjes). Sea α : [a, b] → R creciente y sea f : [a, b] → R acotadatal que f ∈ R(α) en [a, b]. Sean M = supf(x) |x ∈ [a, b] y m = ınff(x) |x ∈[a, b]. Entonces existe un numero c ∈ [m,M ] tal que

∫ bafdα = c(α(b)− α(a)).

En particular, si f es continua, existe x0 ∈ [a, b] tal que∫ bafdα = f(x0)(α(b)−

α(a)).

Demostracion. Si α es constante, el teorema es trivial, ya que:∫ b

a

fdα = 0 = M · 0 = M · (α(b)− α(a)).

Supongamos entonces que α(a) < α(b). Para cada P ∈ P[a, b], tenemos:

m(α(b)− α(a)) ≤ L(P, f, α) ≤ U(P, f, α) ≤M(α(b)− α(a)).

La integral A =∫ bafdα tiene las mismas cotas. Por tanto,

c =A

α(b)− α(a)∈ [m,M ]

y

A = c(α(b)− α(a)).

La ultima parte de la demostracion se deduce del teorema del valor interme-dio para funciones continuas.

Teorema 7.49. (Segundo teorema del valor medio para integrales deRiemann-Stieltjes). Sean α : [a, b] → R continua y f : [a, b] → R creciente.Entonces existe un punto x0 ∈ [a, b] tal que:∫ b

a

fdα = f(a)(α(x0)− α(a)) + f(b)(α(b)− α(x0)).

Demostracion. Por el Teorema de integracion por partes, tenemos:∫ b

a

fdα = f(b)α(b)− f(a)α(a)−∫ b

a

αdf.

Por el Teorema 7.48 existe x0 ∈ [a, b] tal que:∫ b

a

αdf = α(x0)(f(b)− f(a)).

Sustituyendo, concluimos la demostracion.

Capıtulo 7. Integracion de Riemann-Stieltjes 112

Lema 7.50. Sea f : [a, b]→ R una funcion acotada. Sea x ∈ [a, b] un punto decontinuidad de f y sea y1, y2, ... una sucesion en [a, b] que converge a x. Paracada n ∈ N, sean:

mn = ınff(z) |x ∧ yn ≤ z ≤ x ∨ yn,

Mn = supf(z) |x ∧ yn ≤ z ≤ x ∨ yn.Entonces Mn −mn → 0.

Demostracion. Lo demostraremos por contradiccion. Supongamos que existenε > 0 y n1 < n2 < ... tales que Mni −mni ≥ ε para cada i ∈ N.

Sean ui, νi ∈ [x∧yni , x∨yni ] tales que f(ui)−mni < ε/3 y Mni−f(νi) < ε/3.Como ui → x, νi → x y f es continua en x, tenemos f(ui)→ f(x) y f(νi)→

f(x). Por tanto, para i suficientemente grande, tenemos |f(ui) − f(νi)| < ε/3,una contradiccion.

Teorema 7.51. Sea α : [a, b] → R una funcion de variacion acotada en [a, b]y sea f : [a, b] → R acotada tal que f ∈ R(α) en [a, b]. Para cada x ∈ [a, b],defınase:

F (x) =

∫ x

a

fdα.

Entonces:

(1) F es de variacion acotada en [a, b].

(2) Todo punto de continuidad de α es tambien punto de continuidad de F .

(3) Si α es creciente en [a, b] y si x ∈ (a, b) es tal que α′(x) existe y f escontinua en x, entonces F ′(x) existe y F ′(x) = f(x)α′(x).

Demostracion. (1) Por el corolario 7.36 supongamos que α es creciente en[a, b]. Por el teorema 7.37, f ∈ R(α) en cada subintervalo [x, y] ⊆ [a, b].Por el teorema 7.48, si x, y ∈ [a, b] con x 6= y, existe un numero c, conm = ınff(z) | z ∈ [a, b] ≤ c ≤ supf(z) | z ∈ [a, b] = M tal que:

F (y)− F (x) =

∫ y

x

fdα = c(α(y)− α(x)).

Por tanto, para cada particion P = a = x0 < x1... < xn = b de [a, b],tenemos:

∑(P, F ) =

n∑k=1

|F (xk)− F (xk−1)| ≤M0(α(b)− α(a)),

en donde M0 = |m| ∨ |M |. Por tanto, F es de variacion acotada en [a, b].

Capıtulo 7. Integracion de Riemann-Stieltjes 113

(2) Sea α1 la variacion total de α en [a, b] y sea x un punto continuidad de α.Por el teorema 7.12, tenemos que x es tambien un punto de continuidad deα1. Por tanto, podemos suponer que α es creciente en [a, b]. Sea ε > 0 y seaδ > 0 tal que |y−x| < δ, con y ∈ [a, b], implica que |α(y)−α(x)| < ε/M0,en donde M0 es como en el inciso (1). Por tanto, como:

|F (y)− F (x)| ≤M0|α(y)− α(x)|,

deducimos que F es continua en x.

(3) Sean x, y ∈ [a, b] con x 6= y. Sea c ∈ [m,M ] tal que F (y) − F (x) =c(α(y)− α(x)). Por tanto,

F (y)− F (x)

y − x= c · α(y)− α(x)

y − x.

Sea yn ∈ [a, b]− x una sucesion tal que yn → x+ y sean:

mn = ınff(z) | z ∈ [x, yn],

Mn = supf(z) | z ∈ [x, yn].

Por tanto, existe cn ∈ [mn,Mn] tal que:

F (yn)− F (x)

yn − x= cn ·

α(yn)− α(x)

yn − x.

Por el lema 7.50 sabemos que Mn −mn → 0.

Por tanto, cn → f(x). Tambien:

α(yn)− α(x)

yn − x→ α′(x).

Entonces,

F (yn)− F (x)

yn − x→ f(x)α′(x).

Razonamos en forma analoga si yn → x−.

Este ultimo Teorema tiene dos interesantes aplicaciones. La primera nosayuda a entender mejor las funciones exponenciales y logarıtmicas y la segundaesclarece las bases de la trigonometrıa .

Capıtulo 7. Integracion de Riemann-Stieltjes 114

Teorema 7.52. Para cada numero real positivo x, definamos:

F (x) =

∫ x

1

dt

t.

Entonces:

(1) Para cada x ∈ (0,+∞), F ′(x) existe y:

F ′(x) =1

x.

(2) Para cada x ∈ (0,+∞) se tiene F (x) = −F ( 1x ) y para cada pareja (x1, x2)

de numeros positivos se tiene F (x1) + F (x2) = F (x1x2).

(3) F es una funcion estrictamente creciente de (0,+∞) sobre R.

Demostracion. (1) Del teorema 7.51 deducimos que F ′(x) existe para cadax ∈ (0,+∞) y que F ′(x) = 1

x .

(2) Sea x > 1 y consideremos la funcion ϕ : [1, x] → [ 1x , 1] definida como

ϕ(u) = 1u . Aplicando un cambio de variable obtenemos:

F (1

x) =

∫ 1x

1

dt

t=

∫ x

1

u(− 1

u2)du = −

∫ x

1

du

u= −F (x).

Si x = 1, tenemos F (1) = 0 y, por tanto, la formula F ( 1x ) = −F (x) se

cumple para x = 1 . Si 0 < x < 1, tenemos 1x > 1 y, entonces,

F (x) = F (11x

) = −F (1

x).

Ahora, sean x1, x2 ∈ (0,+∞). Supongamos que x1 < x2. Definamos g :[1, x2

x1] → [x1, x2] mediante la formula g(u) = t = x1u. Por tanto, usando

nuevamente el Teorema 7.25, tenemos:

F (x2)− F (x1) =

∫ x2

x1

dt

t=

∫ x2x1

1

x1du

x1u=

∫ x2x1

1

du

u= F (

x2

x1).

Tenemos tambien F (x1x2) = F (x1)− F ( 1x2

) = F (x1) + F (x2).

(3) Por el inciso (1) y 7.25, F es estrictamente creciente y continua. ComoF (2n) = nF (2), F (2) > F (1) = 0, deducimos, por el principio arqui-midiano, que F es una funcion estrictamente creciente de (0,+∞) sobreR.

Corolario 7.53. Existe un unico numero e ∈ (2, 3) tal que F (e) = 1.

Capıtulo 7. Integracion de Riemann-Stieltjes 115

Demostracion. Del teorema 7.51 deducimos la existencia del numero e. Parat ≥ 1, tenemos 1 ≤

√t ≤ t. Por tanto,

1

t≤ 1√

t

y ∫ x

1

dt

t≤∫ x

1

dt√t

=[2t

12

]x1

= 2√x− 2.

En particular, F (2) =∫ 2

1dtt ≤ 2

√2 − 2 < 1. Para probar que F (3) >

1, tomemos la particion de [1, 3]: P = 1 + k5 , | k = 0, 1, ..., 10 y pruebese

directamente que:

F (3) ≥ L(P, f, α) =

15∑k=5

1

k> 1.

Por tanto, e ∈ (2, 3).

Definicion 7.54. Conservemos la notacion de los teoremas 7.52 y 7.53 y seax ∈ R. Definimos ex como el unico numero real y ∈ (0,+∞) tal que F (y) = x.

Observacion 7.55. (a) e0 = 1, e1 = e.

(b) Para cada par (x1, x2) ∈ R× R, ex1+x2 = ex1ex2 .

(c) Para cada x ∈ R, e−x = 1ex .

La demostracion de esta observacion se deja como ejercicio para el lector.

Definicion 7.56. Sean a, x ∈ R con a > 0. Definimos:

ax = exF (a).

Teorema 7.57. Sean a, b ∈ R positivos y sean x, y ∈ R. Entonces:

(a) ax+y = ax · ay.

(b) (ax)y = axy.

(c) (ab)x = axbx.

Demostracion. (a) ax+y = e(x+y)F (a) = exF (a)+yF (a) = exF (a) ·eyF (a) = ax ·ay.

(b) (ax)y = eyF (ax) = eyF (exF (a)) = eyxF (a) = axy.

(c) (ab)x = exF (ab) = ex(F (a)+F (b)) = exF (a)+xF (b) = exF (a) · exF (b) = ax · bx.

Capıtulo 7. Integracion de Riemann-Stieltjes 116

Definicion 7.58. Sea a > 0, a 6= 1 y sea x ∈ (0,+∞). Definimos:

loga x =F (x)

F (a).

Teorema 7.59. Sean a > 0, b > 0, con a 6= 1 6= b y sean x, y ∈ (0,+∞).Entonces:

(a) loga x = − loga1x .

(b) loga xy = loga x+ loga y.

(c) logaxy = loga x− loga y.

(d) loga xy = y loga x.

(e) logb x = loga xloga b

.

Demostracion. (a)

loga1

x=F ( 1

x )

F (a)= −F (x)

F (a)= − loga x.

(b)

loga xy =F (xy)

F (a)=F (x) + F (y)

F (a)=F (x)

F (a)+F (y)

F (a)= loga x+ loga y.

(c)

logax

y= loga x ·

1

y= loga x+ loga

1

y= loga x− loga y.

(d)

loga xy =

F (xy)

F (a)=F (eyF (x))

F (a)=F (F−1(yF (x)))

F (a)=yF (x)

F (a)= y loga x.

(e)

logb x =F (x)

F (b)=

F (x)F (a)

F (b)F (a)

=loga x

loga b.

Procedemos ahora a establecer las bases de la Trigonometrıa.

Definicion 7.60. Para cada y ∈ R, definamos:

F (t) =

∫ t

0

dx

1 + x2.

Capıtulo 7. Integracion de Riemann-Stieltjes 117

Teorema 7.61. Sea F como en la definicion 7.60.Entonces:

(a) F es una funcion estrictamente creciente de R a R.

(b) Para cada t ∈ R, F (t) = −F (−t).

(c) Para cada t ∈ R− 0, F (t) + F ( 1t ) = 2(sgt)F (1).1

(d) Para cada t ∈ R, |F (t)| ≤ 2F (1).

(e) lımt→∞

F (t) = 2F (1) y lımt→−∞

F (t) = −2F (1).

(f) Si t1t2 6= −1,

F (t2)− F (t1) = F( t2 − t1

1 + t1t2

).

(g) F (R) = (−2F (1), 2F (1)).

(h) G = F−1 es una funcion estrictamente creciente y diferenciable de (−2F (1), 2F (1))sobre R. De hecho, para cada y ∈ (−2F (1), 2F (1)), G′(y) = 1 +G(y)2.

Demostracion. (a) Por el teorema 7.51, tenemos:

F ′(t) =1

1 + t2> 0

para cada t ∈ R. Por tanto, F es estrictamente creciente.

(b) Sin perdida de generalidad, supongamos que t > 0. Sea ϕ : [−t, 0] → [0, t]definida con la formula ϕ(y) = −y. Por tanto,

F (t) =

∫ t

0

dx

1 + x2=

∫ −t0

− dy

1 + y2= −F (−t).

(c) Sea t > 0. Por simetrıa, podemos suponer tambien que t ≤ 1. Si t = 1, lademostracion es trivial. Supongamos, entonces que 0 < t < 1. Definamosµ : [1, 1

t ]→ [t, 1] con la formula µ(y) = 1/y. Por tanto,

F (1)− F (t) =

∫ 1

t

dx

1 + x2=

∫ 1

1t

−dyy21 + 1

y2

= −∫ 1

1t

dy

1 + y2=

∫ 1t

1

dy

1 + y2= F (

1

t)− F (1).

Por tanto, F (t) + F ( 1t ) = 2F (1).

1sgt = 1 si t > 0 y sgt = −1 si t < 0.

Capıtulo 7. Integracion de Riemann-Stieltjes 118

Si t < 0, entonces −t > 0 y, de aquı que,

F (−t) + F (−1

t) = 2F (1).

Por el inciso (b), concluimos que F (t) + F ( 1t ) = −2F (1).

(d) Basta usar el inciso (c).

(e) Sea t1 < t2 < ... una sucesion no acotada estrictamente creciente denumeros positivos. Entonces,

F (tn) + F (1

tn) = 2F (1).

Como 1/tn → 0 y F es continua, tenemos F (1/tn)→ F (0) = 0. Por tanto,F (tn)→ 2F (1).

Para el caso negativo, basta usar los incisos (b) y (c) .

(f) Usando el inciso (b), sea 0 < t1 < t2 y t1t2 6= −1.

Definamos:

µ :[0,

t2 − t11 + t1t2

]→ [t1, t2]

mediante la formula:

µ(y) =y + t11− t1y

.

Para cada y ∈[0, t2−t11+t1t2

]tenemos 1 6= t1y ya que:

t−11 >

t2 − t11 + t1t2

.

En efecto,

t−11 −

t2 − t11 + t1t2

=1 + t1t2 − t1t2 + t21

t1(1 + t1t2)=

1 + t21t1(1 + t1t2)

> 0.

Tenemos tambien µ(0) = t1,

µ( t2 − t1

1 + t1t2

)= t2

y

µ′(y) =1 + t2

(1− t1y)2.

Capıtulo 7. Integracion de Riemann-Stieltjes 119

Aplicando la sustitucion determinada por µ, tenemos:

F (t2)− F (t1) =

∫ t2

t1

dx

1 + x2=

∫ t2−t11+t1t2

0

µ′(y)dy

1 + µ(y)2

=

∫ t2−t11+t1t2

0

dy

1 + y2= F

( t2 − t11 + t1t2

).

(g) Definamos π = 4F (1). Por tanto F : R →(− π

2 ,π2

)es estrictamente

creciente, suprayectiva y para cada t ∈ R,

F ′(t) =1

1 + t2.

La funcion inversa G = F−1 :(− π

2 ,π2

)→ R es tambien estrictamente

creciente, suprayectiva y diferenciable en cada y ∈(− π

2 ,π2

). Usando el

Teorema (5.23), tenemos G′(y) = 1 +G(y)2 para cada y ∈(− π

2 ,π2

).

Definicion 7.62. Si y ∈(− π

2 ,π2

), definimos:

tan y = G(y),

cos y =1√

1 + tan2y,

sen y =tan y√

1 + tan2y,

senπ

2= 1 , sen

(− π

2

)= −1,

cosπ

2= cos

(− π

2

)= 0.

Teorema 7.63. Sea y ∈[− π

2 ,π2

]. Entonces:

(a) sen2y + cos2y = 1,

(b) D sen y = cos y,

(c) D cos y = − sen y .

Demostracion. (c) Tenemos cos y = (1 + tan y2)−1/2. Por tanto,

Capıtulo 7. Integracion de Riemann-Stieltjes 120

D cos y = −1

2((1 + tan2y)−3/2D(1 + tan2y)

= −1

2(1 + tan2y)−3/2 · 2 tan yD tan y

= −(1 + tan2y)−3/2 tan y(1 + tan2y)

= − tan y√1 + tan2y

= − sen y.

Observacion 7.64. Si y ∈(0, π2

], entonces:

tan(y − π

2) = − 1

tan y.

Demostracion. Sean t1 = tan y, t2 = tan(y − π2 ). De acuerdo con el teorema

7.63, inciso (c), tenemos:

F (t1) + F (1

t1) =

π

2.

Por tanto,

F (t1)− F (− 1

t1) =

π

2.

Por otro lado,

F (t1) = y, F (t2) = y − π

2y F (t1)− F (t2) =

π

2,

De donde,

F (t2) = F (− 1

t1)

y

t2 = − 1

t1.

Corolario 7.65. Si y ∈[0, π2

], entonces:

cos(y − π

2

)= sen y y sen

(y − π

2

)= − cos y.

Capıtulo 7. Integracion de Riemann-Stieltjes 121

Definicion 7.66. Extendamos las funciones sen y y cos y a toda la rectamediante las formulas:

cos(y + π

2

)= − sen y ; cos

(y − π

2

)= sen y;

sen(y + π

2

)= cos y ; sen

(y − π

2

)= − cos y

(Estas formulas son consistentes con el corolario 7.65).

Teorema 7.67. Si y1, y2 ∈ R, entonces:

sen(y1 − y2) = sen y1 cos y2 − sen y2 cos y1,

cos(y1 − y2) = cos y1 cos y2 + sen y1 sen y2.

Demostracion. En base al teorema 7.41, supongamos, s.p.g., que y1 y y2 pertenecenambos al intervalo (−π, π] y que y1 ≥ y2.

Dejamos al lector la demostracion en los casos:

y1 − y2 ∈ 0,π

2, π,

2.

Supongamos entonces que esto ultimo no sucede. Sean k1, k2 enteros, k1, k2 ∈0, 1,−1 y sean z1, z2 ∈

(− π

2 ,π2

)tales que:

y1 = z1 +πk1

2, y2 = z2 +

πk2

2.

Si ti = tan zi con i = 1, 2, tenemos, por el inciso (f) de 7.63:

z1 − z2 = F (t1)− F (t2) = F( t1 − t2

1 + t1t2

).

Por tanto,

G(z1 − z2) = tan(z1 − z2) =tan z1 − tan z2

1 + tan z1 tan z2≥ 0

y

cos(z1 − z2) =1√

1 + tan 2(z1 − z2)=

1√1 +

(tan z1−tan z2

1+tan z1 tan z2

)2 .Dividiendo el numerador y denominador de la fraccion:

(tan z1 − tan z2)2

(1 + tan z1 tan z2)2

por (1 + tan z1)(1 + tan z2), tenemos:

(tan z1 − tan z2)2

(1 + tan z1 tan z2)2=

(sen z1 cos z2 − sen z2 cos z1)2

(sen z1 sen z2 + cos z1 cos z2)2.

Por tanto,

Capıtulo 7. Integracion de Riemann-Stieltjes 122

cos(z1 − z2) =cos z1 cos z2 + sen z1 sen z2√

(sen z1 sen z2 + cos z1 cos z2)2 + (sen z1 cos z2 − sen z2 cos z1)2

=cos z1 cos z2 + sen z1 sen z2√

(sen2z1 + cos2z1)(sen2z2 + cos2z2)

= cos z1 cos z2 + sen z1 sen z2.

Tomando en cuenta las formulas del teorema 7.41 , concluimos la demostraciondel teorema.

Teorema 7.68. Supongamos que g : [c, d] → R tiene derivada continua enS = [c, d]. Sea f : g(S)→ R continua y sea a = g(c), b = g(d). Defınase F conla ecuacion:

F (y) =

∫ y

a

f(u)du, y ∈ g(S).

Entonces, para cada x ∈ S, la integral∫ xcf(g(t))g′(t)dt existe y es igual a

F (g(x)). En particular, tenemos:∫ b

a

f(x)dx =

∫ d

c

f(g(t))g′(t)dt.

Demostracion. Como g′ y la composicion f g son ambas continuas en S, laintegral:

G(x) =

∫ x

c

f(g(t))g′(t)dt

existe para cada x ∈ S. Probaremos que G(x) = F (g(x)) para cada x ∈ S. Porel teorema 7.51 inciso (3), tenemos:

G′(x) = f(g(x))g′(x).

Por otro lado, por la regla de la cadena, la derivada de F g en x es tam-bien f(g(x))g′(x), ya que F ′(g(x)) = f(g(x)). De aquı que, G(x) − F (g(x)) esconstante en S.

Ahora, si x = c, entonces G(c) = 0 y F (g(c)) = F (a) = 0. Por lo tanto, estaconstante es cero. De donde , G(x) = F (g(x)) para cada x ∈ S. En particular,si x = d entonces G(d) = F (g(d)) = F (b).

Capıtulo 7. Integracion de Riemann-Stieltjes 123

Teorema 7.69. Supongamos que f y sus derivadas f ′, f ′′, ..., f (n), con n ∈ N,existen y son continuas en [a, b]. Entonces, para cada x ∈ [a, b],

f(b) = f(x) +f ′(x)

1!(b− x) + ...+

f (n−1)(x)

(n− 1)!(b− x)(n−1) +Rn(x),

en donde:

Rn(x) =1

(n− 1)!

∫ b

x

(b− t)(n−1)f (n)(t)dt.

Demostracion. Sea:

Φ(x) =1

(n− 1)!

∫ b

x

(b− t)(n−1)f (n)(t)dt.

Del teorema de Taylor sabemos que existe un numero t0 ∈ (x, b) tal que:

Rn(x) =f (n)(t0)

n!(b− x)n.

Probaremos que Φ(x) = Rn(x) para cada x ∈ [a, b]. Del teorema 7.51 inciso(3), sabemos que:

Φ′(x) = − (b− x)(n−1)f (n)(x)

(n− 1)!.

Si definimos:

Rn(x) = f(b)−n−1∑k=0

f (k)(x)

k!(b− x)k,

tenemos:

R′n(x) =

n−1∑k=1

f (k)(x)(b− x)k−1

(k − 1)!−n−1∑k=0

f (k+1)(x)(b− x)k

k!

=

n−1∑k=1

f (k)(x)(b− x)k−1

(k − 1)!−

n∑k=1

f (k)(x)(b− x)k−1

(k − 1)!

= −f(n)(x)(b− x)n−1

(n− 1)!.

Por tanto, Φ′(x) = R′n(x) para cada x ∈ [a, b]. Ademas Φ(b) = Rn(b) = 0.Entonces, Φ(x) = Rn(x) para cada x ∈ [a, b].

Capıtulo 8

Diferenciacion en Varias Variables

8.1. Antecedentes de Algebra Lineal

Para comodidad del lector, repetimos alguns definiciones.

Definicion 8.1. Un conjunto V con una operacion binaria conmutativa y aso-ciativa + es un espacio vectorial real si existe una funcion φ : R × V →V , (abreviada φ(r, v) = rv, r ∈ R, v ∈ V ) que cumple con las siguientespropiedades:

i) Existe 0 ∈ V tal que v + 0 = v para cada v ∈ V .

ii) Si v ∈ V es arbitrario, existe un vector w ∈ V tal que v + w = 0.

iii) (r + r′)v = rv + r′v para cada v ∈ V y r, r′ ∈ R.

iv) r(v + v′) = rv + rv′ para cada r ∈ R y v, v′ ∈ V .

v) (rr′)v = r(r′v) para cada r, r′ ∈ R y v ∈ V .

vi) 1v = v para cada v ∈ V .

Algunas consecuencias sencillas de estos axiomas son las siguientes:

a) (Ley de Cancelacion) Si u, v, w ∈ V y si u + w = v + w, entonces u = v.En particular, 0 ∈ V es el unico vector con la propiedad v + 0 = v paracada v ∈ V y si v ∈ V es arbitrario, solamente existe un vector w ∈ V talque v + w = 0. La notacion usual es w = −v. Si v, v′ ∈ V , v − v′ significav + (−v′).

b) Si r ∈ R y v ∈ V , entonces rv = 0 si y solo si r = 0 o v = 0.

c) Si r, r1, ..., rn ∈ R y v1, v2, ..., vn ∈ V , entonces r(r1v1 + r2v2 + ...+ rnvn) =(rr1)v1 + (rr2)v2 + ...+ (rrn)vn.

d) Si r ∈ R y v ∈ V , entonces −(rv) = (−r)v. En particular, −v = (−1)v.

124

Capıtulo 8. Diferenciacion de Varias Variables 125

Dado un subconjunto arbitrario A de un espacio vectorial V , 〈A〉 denota elconjunto de vectores v ∈ V tales que existen vectores v1, v2, ..., vk ∈ A y es-calares λ1, λ2, ..., λk ∈ R tales que v = λ1v1 + λ2v2 + ...+ λkvk.

Si A = ∅, definimos 〈A〉 = 0. Por ejemplo, si A consta de un solo vectorw, entonces 〈A〉 = λw |λ ∈ R.

Definicion 8.2. Un subconjunto no vacıo W de un espacio vectorial V es unsubespacio lineal de V si para cada par de vectores w,w′ ∈W y cada escalarλ ∈ R se cumple:

a) w − w′ ∈W ;

b) λw ∈W .

Ejemplo 8.3. El vector 0 pertenece a cada subespacio W de V y W mismo esun espacio vectorial real con la operacion binaria +|W×W y la multiplicacionpor escalares φ|R×W .

Ejemplo 8.4. Toda interseccion de subespacios de V es subespacio de V .

Ejemplo 8.5. Si A ⊆ V es arbitrario, 〈A〉 es un subespacio de V y coincidecon la interseccion de todos los subespacios de V que contienen a A. De hecho,〈A〉 es el mınimo subespacio de V que contiene a A.

Definicion 8.6. Un subconjunto finito no vacıo v1, ..., vk de V es lineal-mente independiente (abreviado l.i.) si la unica solucion de la ecuacionλ1v1 + λ2v2 + ...+ λkvk = 0 es λ1 = λ2 = ... = λk = 0.

Definicion 8.7. Un subconjunto A de un espacio vectorial V es libre si cadasubconjunto finito no vacıo de A es l.i. Por definicion, el conjunto vacıo es libre.Por tanto, cualquier subconjunto de un conjunto libre es libre.

Definicion 8.8. Un subconjunto finito no vacıo v1, ..., vk de V es lineal-mente dependiente (abreviado l.d.) si no es l.i., es decir, si existen escalaresλ1, λ2, ..., λk ∈ R, no todos cero, tales que λ1v1 + λ2v2 + ...+ λkvk = 0.

Ejemplo 8.9. Si A = v1, ..., vk, en donde los vectores v1, ..., vk son l.i. y siv /∈ 〈A〉, entonces v1, ..., vk, v son l.i.

Definicion 8.10. Un subconjunto A de un espacio vectorial V genera a unsubespacio W de V si W = 〈A〉. A ⊆ V es base de W si A es libre y genera aW .

Un importante teorema de Algebra Lineal es el siguiente:

Teorema 8.11. Sea V un espacio vectorial. Si A1 ⊆ V es libre y si A2 ⊆ Vgenera a V , existe A3 ⊆ A2 −A1 tal que A1 ∪A3 es base de V .

Este teorema tiene las siguientes consecuencias:

Corolario 8.12. Todo espacio vectorial admite una base.

Capıtulo 8. Diferenciacion de Varias Variables 126

Corolario 8.13. Todo subconjunto libre S ⊆ V esta contenido en una base deV .

Corolario 8.14. Si A genera a V , A contiene una base de V .

Otro importante teorema es:

Teorema 8.15. Sea B una base de un espacio vectorial V y sea W un subespaciode V . Si B′ es una base arbitraria de W , entonces existe una funcion inyectivaγ : B′ → B. En particular, dos bases de un mismo espacio vectorial tienen lamisma cardinalidad y si V tiene una base finita con n elementos, entonces todoslos subespacios de V tienen bases finitas con no mas de n elementos.

Definicion 8.16. Si V es un espacio vectorial, la dimension de V , denotadacomo dim(V ), representa la cardinalidad comun de todas las bases de V .

Ejemplo 8.17. Si dim(V ) = n y si W es un subespacio de V , entonces dim(W ) ≤n y dim(W ) = n si y solo si W = V .

Definicion 8.18. Una funcion ψ : V → V ′ entre espacios vectoriales reales esuna transformacion lineal si se cumple:

a) para cada pareja v, v′ ∈ V , se tiene ψ(v + v′) = ψ(v) + ψ(v′),

b) para cada escalar λ ∈ R y cada vector v ∈ V , se tiene ψ(λv) = λψ(v).

Ejemplo 8.19. Cada proyeccion πi : Rn → R (i = 1, 2, ..., n) es una transfor-macion lineal de Rn a R.

Ejemplo 8.20. Para cada espacio vectorial V , la funcion ψ(v) = −v es unatransformacion lineal biyectiva de V en el mismo.

Ejemplo 8.21. Si v1, v2, ..., vn es una base de V , la funcion ψ(λ1v1 +λ2v2 +... + λnvn) = (λ1, λ2, ..., λn) es una transformacon lineal biyectiva de V sobreRn.

Ejemplo 8.22. Si A = (aij), i = 1, 2, ...,m, j = 1, 2, ..., n es una matriz m ×n con entradas reales, la funcion ψ(λ1, λ2, ...λm) = (λ1, λ2, ..., λm)A es unatransformacion lineal de Rm en Rn. Si m = n, entonces ψ es biyectiva si y solosi det(A) 6= 0.

Teorema 8.23. Sea ψ : V → V ′ una transformacion lineal del espacio vectorialV en el espacio vectorial V ′. Entonces:

a) ψ(0V ) = 0V ′ .

b) Para cada v ∈ V , ψ(−v) = −ψ(v).

c) Si S es un subespacio de V , entonces ψ(S) es un subespacio de V ′.

d) Si U es un subespacio de V ′, entonces ψ−1(U) es un subespacio de V . Enparticular, el nucleo de ψ, ker(ψ) = v ∈ V |ψ(v) = 0, es un subespaciode V y la imagen de ψ, Im(ψ) = ψ(v) | v ∈ V , es un subespacio de V ′.

Capıtulo 8. Diferenciacion de Varias Variables 127

e) Si V tiene dimension finita n, entonces Im(ψ) tambien tiene dimensionfinita y dim(Im(ψ)) = n − dim(ker(ψ)). En este caso, ψ : V → V ′ esinyectiva si y solo si ψ es suprayectiva.

Definicion 8.24. Una transformacion lineal ψ : V → V ′ es un isomorfismosi ψ es biyectiva.

Los ejemplos mas conocidos de espacios vectoriales son los siguientes:

Ejemplo 8.25. a) El espacio euclidiano Rn (n ∈ N) con la suma:

(x1, x2, ..., xn) + (y1, y2, ..., yn) = (x1 + y1, x2 + y2, ..., xn + yn)

y la multiplicacion por escalares:

λ(x1, x2, ..., xn) = (λx1, λx2, ..., λxn).

En este caso, e1 = (1, 0, 0, ..., 0), e2 = (0, 1, 0, ..., 0),...,en = (0, 0, 0, ..., 1)es una base Rn y, por tanto, dim(Rn) = n. La base e1, e2, ..., en recibeel nombre de base canonica de Rn.

b) Las matrices m× n (aij), con la suma (aij) + (bij) = (cij), en donde cij =aij + bij para todo i, j y la multiplicacion por escalares λ(aij) = (uij),en donde uij = λaij, para todo i, j. Las matrices con exactamente unaentrada igual a 1 y las demas entradas iguales a 0 forman una base deeste espacio vectorial. Su dimension es entonces mn.

c) El conjunto L(V, V ′) de transformaciones lineales de V a V ′ con la suma(ψ + φ)(v) = ψ(v) + φ(v) y la multiplicacion por escalares (λφ)(v) =λφ(v), v ∈ V , λ ∈ R. Si ambos espacios tiene dimension finita, digamossi dim(V ) = m y dim(V ′) = n, entonces L(V, V ′) es isomorfo al espaciomatricial descrito en c) y, por tanto,

dim(L(V, V ′)) = dim(V )dim(V ′).

d) Para cada espacio vectorial V , el espacio L(V,R) recibe el nombre de dualde V y se denota como V ∗. Los elementos de L(V,R) reciben el nombrede funcionales lineales de V y claramente dim(V ) = dim(V ∗).

Definicion 8.26. Una norma Φ en un espacio vectorial V es una funcion deV en R con las siguientes propiedades:

i) Para cada v ∈ V , Φ(v) ≥ 0 y Φ(v) = 0 si y solo si v = 0.

ii) Para cada v ∈ V y cada λ ∈ R, se tiene Φ(λv) = |λ|Φ(v).

iii) Si v1, v2 ∈ V son arbitrarios, se tiene Φ(v1 + v2) ≤ Φ(v1) + Φ(v2).

Ejemplo 8.27. La funcion Φ : Rn → R definida mediante la formula Φ((x1, x2, ..., xn)) =√x2

1 + x22 + ...+ x2

n es una norma de Rn. Escribimos usualmente:

||(x1, x2, ..., xn)||n =√x2

1 + x22 + ...+ x2

n.

Capıtulo 8. Diferenciacion de Varias Variables 128

Una norma Φ en un espacio vectorial V convierte a V en un espacio metricosi definimos:

dΦ(v1, v2) = Φ(v1 − v2).

Por tanto, una sucesion vk en V converge a un vector v ∈ V si y solo si lasucesion Φ(vk − v) es nula.

Probaremos que el espacio L(Rm,Rn) posee una norma. Antes un lema:

Lema 8.28. Sea Φ : V → R una norma en el espacio vectorial V . Entonces,para cada pareja de vectores v, v′ ∈ V , tenemos:

|Φ(v)− Φ(v′)| ≤ Φ(v − v′).

Por tanto, Φ es una funcion uniformemente continua del espacio metrico (V, dΦ)en R.

Demostracion. Dejamos la prueba al lector.

Teorema 8.29. Sea L : Rm → Rn una transformacion lineal. Entonces existeun numero positivo M tal que:

||L(x)||n ≤M ||x||m ∀x ∈ Rm.

Por tanto, toda transformacion lineal L : Rm → Rn es uniformemente continua.

Demostracion. Llamemos B y B′ a las bases canonicas de Rm y Rn, respec-tivamente, digamos B = e1, e2, ..., em y B′ = e′1, e′2, ..., e′n. Para cada i ∈1, 2, ...,m, existen n escalares ai1, ..., ain tales que:

L(ei) = ai1e′1 + ...+ aine

′n.

Probaremos que cualquier numero M >√∑

i,j a2ij satisface la desigualdad del

enunciado. Consideremos un vector arbitrario x = λ1e1+λ2e2+...+λmem ∈ Rm.Por tanto,

L(x) = λ1L(e1) + λ2L(e2) + ...+ λmL(em).

Si llamamos c1, c2, ..., cn a las columnas de la matriz (aij), tenemos:

L(x) =

m∑i=1

λiL(ei) =

m∑i=1

n∑j=1

λiaije′j =

n∑j=1

(x · cj)e′j .

Por tanto:

||L(x)||2n =

n∑j=1

(x · cj)2.

Por la desigualdad de Cauchy-Schwartz, tenemos:

(x · cj)2 ≤ ||x||2m||cj ||2m = ||x||2m(

m∑j=1

a2ij).

Capıtulo 8. Diferenciacion de Varias Variables 129

Por tanto:

||L(x)||2n ≤ ||x||2m(

m∑i=1

n∑j=1

a2ij) ≤M2||x||2m

y||L(x)||n ≤M ||x||m

para cada x ∈ Rm.

Definicion 8.30. Dada L : Rm → Rn lineal, definimos:

||L||mn = ınfM > 0 | ||L(x)||n ≤M ||x||m para cada x ∈ Rm.

Teorema 8.31. Sea L : Rm → Rn lineal. Entonces exise un punto x0 ∈ Sm−1 =x ∈ Rm | ||x||m = 1 tal que ||L(x0)||n = ||L||mn y para cada x ∈ Rm, se tiene||L(x)||n ≤ ||L||mn||x||m.

Demostracion. Usando el Teorema 8.29, deducimos que la funcion ψ : Rm → Rdefinida mediante la formula:

ψ(x) = ||L(x)||n

es continua. Como Sm−1 es un subconjunto compacto de Rm (recuerdese queSm−1 es cerrado y acotado), ψ(Sm−1) es un subconjunto compacto de [0,∞).Existe entonces un punto x0 ∈ Sm−1 tal que ψ(x0) ≥ ψ(x) para cada x ∈ Sm−1,es decir, ||L(x0)||n ≥ ||L(x)||n para cada x ∈ Sm−1. Por tanto, si x ∈ Rm−0,entonces x

||x||m ∈ Sm−1, por lo que:

||L(x0)||n ≥ ||L](x

||x||m)||n =

1

||x||m· ||L(x)||n.

De donde, ||L(x)||n ≤ ||L(x0)||n · ||x||m para cada x ∈ Rm, incuyendo x = 0. Porotro lado, si M > 0 satisface ||L(x)||n ≤ M ||x||m para cada x ∈ Rm, tenemos,en particular,

M0 = ||L(x0)||n ≤M ||x0||m = M.

De aquı deducimos que M0 = ||L||mn.

Probemos a continuacion que ||·||mn es efectivamente una norma en L(Rm,Rn).

Teorema 8.32. a) || · ||mn es un norma en L(Rm,Rn).

b) Si L1 : Rm → Rn y L2 : Rn → Rs son lineales, entonces ||L2 L1||ms ≤||L1||mn||L2||ns.

c) El conjunto Om de transformaciones lineales invertibles L : Rm → Rm esabierto y denso en L(Rm,Rm).

d) La transformacion γ : Om → Om, en donde γ(L) = L−1 es un homeomor-fismo.

Capıtulo 8. Diferenciacion de Varias Variables 130

Demostracion. a) Es claro que ||L||mn es siempre mayor o igual a cero y||L||mn = 0 si y solo si L(x) = 0 para cada x ∈ Rm. Es claro tam-bien que para cada escalar λ ∈ R, se tiene ||λL||mn = |λ|||L||mn. Probe-mos finalmente la desigualdad triangular: sean L1, L2 : Rm → Rn trans-formaciones lineales. Sin perdida de generalidad, podemos suponer queL1 y L2 no son ambas la transformacion nula. Por tanto, el numeroM = ||L1||mn + ||L2||mn es positivo. Si x ∈ Rm es arbitrario, tenemos:

||(L1 + L2)(x)||n = ||L1(x) + L2(x)||n≤ ||L1(x)||n + ||L2(x)||n≤ ||L1||mn||x||m + ||L2||mn||x||m= M ||x||m.

Por definicion de ||L1 + L2||mn, tenemos:

||L1 + L2||mn ≤M = ||L1||mn + ||L2||mn.

b) Consideremos el numero M = ||L1||mn||L2||ns, y sea x ∈ Rm arbitrario.Tenemos entonces:

||L2(L1(x))||s ≤ ||L2||ns||L1(x)||n ≤ ||L2||ns||L1||mn||x||m.

Por la definicion de ||L2 L1||ms, tenemos:

||L2 L1||ms ≤ ||L1||mn||L2||ns.

c) Sea L0 ∈ Om y sea L ∈ L(Rm,Rm) tal que

||L− L0||mm <1

||L−10 ||mm

.

Aseguramos que tambien L ∈ Om. En efecto, si L no es biyectiva, existex ∈ Sm−1 tal que L(x) = 0.

Por tanto,

1 = ||x||m = ||L−10 ((L− L0)(x))||m ≤ ||L−1

0 ||mm||L− L0||mm < 1,

una contradiccion. Esto prueba que Om es abierto en L(Rm,Rm).

En cuanto a la densidad de Om, consideremos una transformacion linealarbitraria L ∈ L(Rm,Rm) y un numero ε > 0. La transformacion linealLε = L+εId tiene por kernel x ∈ Rm |L(x) = −εx. Por tanto, ker(Lε) =0 si y solo si −ε no es valor propio de L. Basta entonces elegir un numeroε′ < ε, tal que −ε′ no es valor propio de L. En este caso, Lε′ es invertible y||Lε′ − L||mm = ε′||Id||mm = ε′ < ε, es decir, Om es denso en L(Rm,Rm).

Capıtulo 8. Diferenciacion de Varias Variables 131

d) Basta probar que la asignacion L→ L−1 de Om en Om es continua. Tomem-os una sucesion Lk de transformaciones lineales en Om la cual con-verge a L ∈ Om. Por tanto, ||Lk − L||mm −→ 0. Debemos demostrar que||L−1

k − L−1||mm −→ 0. Sea α = 1||L−1||mm y sea βk = ||Lk − L||mm.

Tomemos k0 ∈ N tal que βk <α2 para cada k ≥ k0. Si x ∈ Rm, tenemos:

α||x||m = α||L−1(L(x))||m≤ α||L−1||mm||L(x)||m= ||L(x)||m ≤ ||(L− Lk)(x)||m + ||Lk(x)||m≤ βk||x||m + ||Lk(x)||m.

Por tanto, (α− βk)||x||m ≤ ||Lk(x)||m. (1)Cambiando x por L−1

k (y) en (1), obtenemos:

(α− βk)||L−1k (y)||m ≤ ||y||m.

Por la definicion de ||L−1k ||mm, tenemos:

||L−1k ||mm ≤

1

α− βk.

Por otro lado, por la identidad L−1k − L−1 = L−1

k (L− Lk) L−1, obte-nemos:

||L−1k − L

−1||mm ≤ ||L−1k ||mm||L− Lk||mm||L

−1||mm ≤||L− Lk||mmα(α− βk)

.

Si k ≥ k0, tenemos α− βk > α2 . Por tanto, k ≥ k0 implica que:

||L−1k − L

−1||mm <2||L− Lk||mm

α2

y ||L−1k − L−1||mm −→ 0.

Definicion 8.33. Sea f : D → Rn, en donde D ⊆ Rm y sea p ∈ int(D). Siu ∈ Rm − 0, definimos la derivada direccional de f en la direccion ucomo el lımite w:

w = lımt→0

f(p+ tu)− f(p)

t.

En caso de existir este lımite, lo denotamos como w = Duf(p).

Observacion 8.34. Si existe Duf(p) y λ ∈ R − 0, entonces tambien existeDλuf(p) y Dλuf(p) = λDuf(p).

Demostracion. Tomemos cuaquier sucesion tk en R−0 que converja a cero.Como tambien λtk −→ 0, tenemos:

f(p+ λtku)− f(p)

λtk−→ Duf(p).

Por tanto, f(p+tk(λu))−f(p)tk

−→ λDuf(p) y Dλuf(p) = λDuf(p).

Capıtulo 8. Diferenciacion de Varias Variables 132

Definicion 8.35. Una transformacion lineal L : Rm → Rn es diferencial deuna funcion f : D → Rn, D ⊆ Rm en un punto c ∈ int(D) si:

lımx→c ; c6=0

||f(x)− f(c)− L(x− c)||n||x− c||m

= 0.

En este caso escribimos L = Df(c).

Teorema 8.36. Si f tiene diferencial en c, esta es unica.

Demostracion. Supongamos que L1 y L2 son diferenciales de f en c. Debemosprobar que L1(y) = L2(y) para cada y ∈ Rm. Sin perdida de generalidad,podemos suponer que ||y||m = 1. Sea δ > 0 tal que Vδ(c) ⊆ D = dom(f).

Definamos la sucesion xk = c + δk+1y, k = 1, 2, ... Claramente xk es una

sucesion en D − c que converge a c. Como:

lımx→c ; c 6=0

||f(x)− f(c)− Li(x− c)||n||x− c||m

= 0,

(i = 1, 2), tenemos:f(xk)− f(c)

δk+1

−→ Li(y).

De donde, por la unicidad de los lımites, L1(y) = L2(y).

Teorema 8.37. Si f tiene diferencial en c, existen numeros positivos δ, k talesque si ||x−c|| < δ, entonces x ∈ dom(f) y ||f(x)−f(c)|| ≤ k||x−c||. Por tanto,f es continua en c.

Demostracion. Sabemos que existe una funcion lineal L : Rm → Rn tal quepara cada ε > 0, existe δ > 0 con la propiedad:

0 < ||x− c|| < δ ⇒ x ∈ dom(f) y ||f(x)− f(c)− L(x− c)|| < ε||x− c||.

Tomando ε = 1 y usando la desigualdad triangular, podemos hallar δ > 0 talque:

0 < ||x− c|| < δ ⇒ x ∈ dom(f) y ||f(x)− f(c)|| ≤ ||L(x− c)||+ ||x− c||.

Tomando B = ||L||mn = k − 1, tenemos ||L(x − c)|| ≤ B||x − c|| para cadax ∈ Rm. Por tanto:

0 < ||x− c|| < δ ⇒ x ∈ dom(f) y ||f(x)− f(c)|| ≤ (B + 1)||x− c|| = k||x− c||.

Esta desigualdad tambien es cierta para x = c.

Teorema 8.38. Si f tiene diferencial en c y u ∈ Rm − 0 es arbitrario,entonces Duf(c) existe y Duf(c) = Df(c)(u).

Capıtulo 8. Diferenciacion de Varias Variables 133

Demostracion. Sea L = Df(c) y supongamos ||u|| = 1. Tomemos una sucesiontk en R− 0 tal que tk −→ 0 y tal que c+ tku ∈ dom(f), para cada k ∈ N.Si xk = c+ tku, entonces:

||f(xk)− f(c)

tk− L(u)|| −→ 0.

De donde, L(u) = Duf(c).

Definicion 8.39. Sea D ⊆ Rm, f : D → R y c ∈ int(D). Si u es el vector(u1, u2, ..., um), con ui = 1 y uj = 0 para toda i 6= j y si Duf(c) ∈ R existe,escribimos:

Duf(c) =∂f

∂xi|x=c = i-esima derivada parcial de f en c

oDuf(c) = fxi(c) = Dif(c).

Corolario 8.40. Sean D ⊆ Rm, f : D → R y c ∈ int(D). Si Df(c) existe, en-tonces todas las derivadas parciales D1f(c), D2f(c), ..., Dmf(c) existen y si u =(u1, u2, ..., um) ∈ Rm entonces Df(c) = u1D1f(c)+u2D2f(c)+ ...+umDmf(c).

Demostracion. Escribamos u = u1e1 +u2e2 + ...+umem, en donde e1, e2, ..., emson los vectores canonicos de Rm. Como Df(c) es lineal, tenemos:

Df(c)(u) =

m∑j=1

ujDf(c)(ej) =

m∑j=1

ujDjf(c).

Definicion 8.41. Sean f : D → Rn, D ⊆ Rm, c ∈ int(D) y L = Df(c). Seaλj : Rn → R, la j-esima proyeccion y defınase fj : D → R (j = 1, 2, ..., n) con laformula fj = λj f . Definimos el jacobiano de f en c como la matriz m× n:

J(f)(c) = (Difj(c)).

Teorema 8.42. Sean f : D → Rn, D ⊆ Rm, c ∈ int(D). Si las parciales Difj(i = 1, 2, ...,m; j = 1, 2, ..., n) existen en una vecindad VM (c) ⊆ D y son todascontinuas en c, entonces existe Df(c) y para cada u ∈ Rm tenemos:

Df(c)(u) = uJ(f)(c).

Demostracion. Trataremos primero el caso n = 1. Si ε > 0, sea δ(ε) < M talque si ||y − c|| < δ(ε) (y ∈ Rm) y si i = 1, 2, ...,m, entonces:

|Dif(y)−Dif(c)| < ε.

Capıtulo 8. Diferenciacion de Varias Variables 134

Si x = (x1, x2, ..., xm) y c = (c1, c2, ..., cm), sean z1, z2, ..., zm−1 los puntos zi =(c1, ..., ci, xi+1, ..., xm) y z0 = x, zm = c.Si ||x − c|| ≤ δ(ε), tambien ||zi − c|| ≤ δ(ε) pues ||zi − c|| ≤ ||x − c|| para cadai = 0, 1, ...,m. Consideremos la identidad:

f(x)− f(c) =

m∑i=1

(f(zi−1)− f(zi))

y apliquemos el teorema del valor medio al i-esimo termino de esta suma. Existeentonces un punto zi en el segmento que une zi−1 con zi tal que f(zi−1)−f(zi) =(xi − ci)Dif(zi). En efecto, sea µi(h) = f(zi−1 + hei) con h en cierta vecindad(−β, β) de cero. Si t ∈ (−β, β), tenemos µ′i(t) = Dif(zi−1 + tei). Observeseque zi = zi−1 + (ci − xi)ei. Por tanto, podemos tomar β ≥ ci − xi y aplicar elteorema del valor medio en (0, ci − xi). De aquı tenemos:

f(x)− f(c)−m∑i=1

(xi − ci)Dif(c) =

m∑i=1

(xi − ci)[Dif(zi)−Dif(c)].

Si ||x− c|| ≤ δ(ε), entonces:

|f(x)− f(c)−m∑i=1

(xi − ci)Dif(c)| ≤ εm∑i=1

|xi − ci|.

Aplicando la desigualdad de Cauchy-Schwartz con los vectores

(|x1 − c1|, |x2 − c2|, ..., |xm − cm|) y (1, 1, ..., 1), obtenemos:

m∑i=1

|xi − ci| ≤√m||x− c||.

Por tanto, ||x− c|| ≤ δ(ε) implica:

|f(x)− f(c)−m∑i=1

(xi − ci)Dif(c)| ≤ ε√m||x− c||.

Hemos probado entonces que f es diferenciable en c y que su diferencial Df(c)es la funcion lineal de Rm a R dada por:

u = (u1, u2, ..., um) 7→ Df(c)(u) =

m∑i=1

uiDif(c).

En el caso general, basta usar el caso n = 1 y el lema:

Lema 8.43. Sean f : A → Rn, A ⊆ Rm, c ∈ int(A), λj : Rn → R, la j-esimaproyeccion, fj = λj f . Entonces f es diferenciable en c si y solo si cada fj esdiferenciable en c.

Capıtulo 8. Diferenciacion de Varias Variables 135

Demostracion. Supongamos primero que f es diferenciable en c y sea L =Df(c). Fijemos j ∈ 1, 2, ..., n. Sea e1, e2, ..., em la base canonica de Rm yconsideremos la funcion lineal Lj : Rm → R definida por Lj(ei) = Difj(c).Claramente Lj = λj L. Sea M > 0 tal que VM (c) ⊆ A. Dado ε > 0, existeδ > 0, δ < M tal que ||x− c|| < δ implica ||f(x)− f(c)−L(x− c)|| < ε||x− c||.Pero para cada j = 1, 2, ..., n, tenemos:

|fj(x)− fj(c)− Lj(x− c)| ≤ ||f(x)− f(c)− L(x− c)||.

Por tanto, ||x− c|| < δ implica:

|fj(x)− fj(c)− Lj(x− c)| < ε||x− c||

y fj es diferenciable en c. De hecho, Dfj(c) = λj Df(c). Supongamos ahoraque cada fj es diferenciable en c. Definamos la funcion lineal L : Rm → Rn conla formula:

L(ei) =

n∑j=1

Difj(c)wj ,

en donde w1, w2, ..., wn es la base canonica de Rn. Dado ε > 0, existe 0 < δj < Mtal que ||x− c|| < δj implica |fj(x)− fj(c)− Lj(x− c)| < ε

n ||x− c||. Por tanto:

||f(x)− f(c)− L(x− c)|| ≤n∑j=1

|fj(x)− fj(c)− Lj(x− c)| < ε||x− c||

y Df(c) = L.

Teorema 8.44. Sean A ⊆ Rm y c ∈ int(A).

a) Si f, g : A→ Rn son ambas diferenciales en c y si α, β ∈ R son arbitrarios,entonces la funcion h = αf+βg es diferenciable en c y Dh(c) = αDf(c)+βDg(c).

b) Si ϕ : A → R, f : A → Rn son ambas diferenciables en c, entonces lafuncion producto k = ϕf : A → Rn es diferenciable en c y Dk(c)(u) =Dϕ(c)(u)f(c) + ϕ(c)Df(c)(u), para cada u ∈ Rm.

Demostracion. a) Si ε > 0, existen δ1, δ2 > 0, δ1, δ2 < M tales que ||x− c|| <mınδ1, δ2 implica:

||f(x)−f(c)−Df(c)(x−c)|| < ε||x−c||; ||g(x)−g(c)−Dg(c)(x−c)|| < ε||x−c||.

Por tanto, ||x− c|| < mınδ1, δ2 implica:

||h(x)− h(c)− [αDf(c) + βDg(c)](x− c)|| ≤ (|α|+ |β|)ε||x− c||.

Como αDf(c) + βDg(c) es una transformacion lineal de Rm en Rn, sesigue que h es diferenciable en c y que:

Dh(c) = αDf(c) + βDg(c).

Capıtulo 8. Diferenciacion de Varias Variables 136

b) Tenemos la identidad:

k(x)−k(c)−[Dϕ(c)(x−c)f(c)+ϕ(c)Df(c)(x−c)] = [ϕ(x)−ϕ(c)−Dϕ(c)(x−c)]f(x)

+Dϕ(c)(x− c)(f(x)− f(c)) + ϕ(c)[f(x)− f(c)−Df(c)(x− c)].

Sea M > 0 tal que ||x− c|| < M implica que x ∈ A. Como Df(c) existe,el Teorema 8.37 implica que f es continua en c. Por otro lado, dado ε > 0,existe δ1 > 0, δ1 < M , tal que ||x− c|| < δ1 implica:

||f(x)− f(c)−Df(c)(x− c)|| < ε

3(|ϕ(c)|+ 1)||x− c||.

De 8.37 tambien se desprende que existen δ2, k > 0, δ2 < M tales que si||x − c|| ≤ δ2, entonces ||f(x) − f(c)|| ≤ k||x − c||. Si B = ||f(c)|| + kδ2,tenemos ||f(x)|| ≤ B siempre que ||x − c|| ≤ δ2. Sea δ3 > 0, δ3 < M talque ||x− c|| < δ3 implica:

|ϕ(x)− ϕ(c)−Dϕ(c)(x− c)| < ε

3B||x− c||.

Sea H > 0 tal que |Dϕ(c)(x − c)| ≤ H||x − c|| para cada x ∈ Rm. Por lacontinuidad de f en c, existe δ4 > 0, δ4 < M tal que ||x− c|| < δ4 implica:

||f(x)− f(c)|| < ε

3H.

Por tanto, si δ = mınδ1, δ2, δ3, δ4, ||x− c|| < δ implica:

||k(x)− k(c)− [Dϕ(c)(x− c)f(c) + ϕ(c)Df(c)(x− c)|| < ε||x− c||.

Teorema 8.45. (Regla de la Cadena). Sean f : A→ Rn, A ⊆ Rm, g : B →Rr, B ⊆ Rn y c ∈ int(A) tales que b = f(c) ∈ int(B). Si f es diferenciable en cy g es diferenciable en b, entonces la composicion h = g f es diferenciable enc y Dh(c) = Dg(b) Df(c). Alternativamente, escribimos:

D(g f)(c) = Dg(f(c)) Df(c).

Demostracion. Sea ε > 0. Existen entonces δ1, δ2 > 0 tales que ||x − c|| < δ1implica x ∈ A y ||f(x) − f(c) − L(x − c)|| < ε||x − c|| y ||y − b|| < δ2 implicay ∈ B y ||g(y)−g(b)−M(y−b)|| < ε||y−b||, en donde L = Df(c) y M = Dg(b).Por el Teorema 8.37, existen numeros γ, κ > 0 tales que si ||x−c|| ≤ γ, entoncesf(x) ∈ B y ||f(x) − f(c)|| ≤ κ||x − c||. Por otro lado, existe una constanteS > 0 tal que ||M(u)|| ≤ S||u|| para cada u ∈ Rn. Si δ0 = mınγ, δ2κ , entonces||x− c|| ≤ δ0 implica ||f(x)− f(c)|| ≤ δ2, lo que a su vez implica:

||g(f(x))− g(f(c))−M(f(x)− f(c))|| ≤ ε||f(x)− f(c)|| ≤ εκ||x− c||.

Capıtulo 8. Diferenciacion de Varias Variables 137

Si tambien requerimos que ||x− c|| ≤ δ1, entonces:

||M(f(x)− f(c)− L(x− c))|| ≤ S||f(x)− f(c)− L(x− c)|| ≤ εS||x− c||.

Finalmente, si δ = mınδ0, δ1 y si ||x− c|| ≤ δ, tenemos:

||g(f(x))− g(f(c))−M(L(x− c))|| ≤ ||g(f(x))− g(f(c))−M(f(x)− f(c))||+ ||M(f(x)− f(c))− L(x− c)||≤ ε(κ+ S)||x− c||.

De donde, Dh(c) = M L.

Ejemplo 8.46. a) Si m = n = r = 1, en este caso Df(c)(u) = f ′(c)(u),Dg(b)(v) = g′(b)v,Dh(c)(u) = f ′(c)g′(f(c))u.

b) Si m > 1, n = r = 1. Df(c)(u)) =∑mi=1Dif(c)ui, Dh(c)(u) = g′(f(c))[D1f(c)u1+

...+Dmf(c)um].

c) Si n > 1, m = r = 1, f : A → Rn, A ⊆ R, f = (f1, ..., fn). Aquı,Df(c)(u) = (f ′1(c), ..., f ′n(c))u; Dg(b)(v) = D1g(b)v1 + ...+Dng(b)vn. Portanto, Dh(c)(u) = [D1g(f(c))f ′1(c) + ...+Dng(f(c))f ′n(c)]u.

d) Si m = n = 2, r = 3.

f(x, y) = (w.z) = (W (x, y), Z(x, y)),

g(w, z) = (r, s, t) = (R(w, z), S(w, z), T (w, z)),

en donde (x, y) ∈ A = dom(f), (w, z) ∈ B = dom(g). Si c = (x0, y0),b = f(c) = (w0, z0), tenemos:

Df(c)(1, 0) = (Wx(x0, y0), Zx(x0, y0),

Df(c)(0, 1) = (Wy(x0, y0), Zy(x0, y0),

Dg(b)(1, 0) = (Rw(w0, z0), Sw(w0, z0), Tw(w0, z0)),

Dg(b)(0, 1) = (Rz(w0, z0), Sz(w0, z0), Tz(w0, z0)),

Dh(c)(1, 0) =(Wx(x0, y0)Rw(w0, z0) + Zx(x0, y0)Rz(w0, z0),

Wx(x0, y0)Sw(w0, z0) + Zx(x0, y0)Sz(w0, z0),

Wx(x0, y0)Tw(w0, z0) + Zx(x0, y0)Tz(w0, z0)),

Dh(c)(0, 1) =(Wy(x0, y0)Rw(w0, z0) + Zy(x0, y0)Rz(w0, z0),

Wy(x0, y0)Sw(w0, z0) + Zy(x0, y0)Sz(w0, z0),

Wy(x0, y0)Tw(w0, z0) + Zy(x0, y0)Tz(w0, z0)).

Capıtulo 8. Diferenciacion de Varias Variables 138

Teorema 8.47. (Primer teorema del Valor Medio). Sea f : Ω → R,Ω ⊆ Rm abierto. Supongamos que a, b ∈ Ω son tales que S = [a, b] ⊆ Ω y quef es diferenciable en cada punto de S. Entonces existe un punto c ∈ S tal quef(b)− f(a) = Df(c)(b− a).

Demostracion. Sea ϕ : R→ Rm definida por:

ϕ(t) = (1− t)a+ tb = a+ t(b− a).

Claramente ϕ(0) = a, ϕ(1) = b y ϕ(t) ∈ S ⊆ Ω para cada t ∈ [0, 1]. ComoΩ es abierto y ϕ es continua, existe un numero γ > 0 tal que ϕ transforma elintervalo abierto (−γ, 1+γ) en Ω. Definamos F : (−γ, 1+γ)→ R con la formulaF (t) = (f ϕ)(t) = f((1− t)a+ tb). Por la regla de la cadena tenemos:

F ′(t) = Df(ϕ(t))(ϕ′(t)) = Df((1− t)a+ tb)(b− a); t ∈ [0, 1].

Por el Teorema del valor medio en una variable aplicado a F en el intervalo[0, 1], deducimos que existe t0 ∈ (0, 1) tal que F (1) − F (0) = F ′(t0). Poniendoc = ϕ(t0) ∈ S, obtenemos:

f(b)− f(a) = F (1)− F (0) = F ′(t0) = Df(c)(b− a).

Teorema 8.48. Sea A ⊆ Rm y sea c ∈ int(A). Sean f, g : A→ Rn diferencia-bles en c. Si h : A → R se define con la formula h(x) = f(x) · g(x) (productointerior en Rn), entonces h es diferenciable en c y para cada u ∈ Rm, se tiene:

Dh(c)(u) = (Df(c))(u) · g(c) + f(c) · (Dg(c)(u)).

Demostracion. Sea M > 0 tal que VM (c) ⊆ A. Dado ε > 0, existe δ > 0, δ < M ,tal que ||x− c|| ≤ δ implica:

||f(x)− f(c)−Df(c)(x− c)|| < ε

3||g(c)||+ 1||x− c||;

||g(x)− g(c)−Dg(c)(x− c)|| < ε

3||f(c)||+ 1||x− c||.

Consideremos la identidad:

h(x)− h(c)− [Df(c)(x− c)] · g(c)− f(c) · [Dg(c)(x− c)] =

g(c) · (f(x)− f(c)−Df(c)(x− c)) + f(c) · (g(x)− g(c)−Dg(c)(x− c))+(f(x)− f(c)) · (g(x)− g(c)).

Sean δ′ < M , κ > 0 tales que ||x − c|| ≤ δ′ implica ||f(x) − f(c)|| ≤ κ||x − c||.Como g es continua en c, existe δ′′ < M tal que ||x− c|| ≤ δ′′ implica ||g(x)−g(c)|| < ε

3κ . Si δ0 = mınδ, δ′, δ′′, si tomamos x tal que ||x − c|| ≤ δ0 y siaplicamos la desigualdad de Cauchy-Schwartz, obtenemos:

[h(x)− h(c)− [Df(c)(x− c)] · g(c)− f(c) · [Dg(c)(x− c)]

Capıtulo 8. Diferenciacion de Varias Variables 139

≤ ||g(c)|| ||f(x)− f(c)−Df(c)(x− c)||+ ||f(c)|| ||g(x)− g(c)−Dg(c)(x− c)||+||f(x)− f(c)|| ||g(x)− g(c)||

< (||g(c)|| ε

3||g(c)||+ 1+ ||f(c)|| ε

3||f(c)||+ 1+ κ

ε

3κ)||x− c||

< ε||x− c||,y la demostracion esta completa.

Teorema 8.49. (Segundo teorema del Valor Medio). Sea Ω ⊆ Rm abiertoy sea f : Ω → Rn. Supongamos que a, b ∈ Ω son tales que S = [a, b] ⊆ Ω y quef es diferenciable en cada punto de S. Entonces existe un punto c ∈ S tal que:

||f(b)− f(a)|| ≤ ||Df(c)(b− a)||.

Demostracion. Si y0 = f(b)−f(a) = 0 ∈ Rn, el resultado es trivial. Supongamosque y0 6= 0 y sea y1 = y0

||y0|| . Usando el producto interior de Rn, definamos

H : Ω→ R con la formula:

H(x) = f(x) · y1.

Por 8.48, H es diferenciable en cada x ∈ S y:

DH(x)(u) = (Df(x)(u)) · y1.

Por el primer teorema del valor medio, existe un punto c ∈ S tal que:

||f(b)− f(a)|| = H(b)−H(a) = DH(c)(b− a) = [Df(c)(b− a)] · y1.

Usando la desigualdad de Cauchy-Schwartz y tomando en cuenta que ||y1|| = 1,tenemos:

||f(b)− f(a)|| ≤ ||D(f(c))(b− a)||.

Corolario 8.50. Sean f,Ω, a, b, S como en el teorema anterior y supongamosque existe M > 0 tal que ||Df(x)||mn ≤M para cada x ∈ S. Entonces tenemos||f(b)− f(a)|| ≤M ||b− a||.Demostracion. Como ||Df(c)(b − a)|| ≤ ||Df(c)||mn||b − a|| y como c ∈ S,tenemos:

||f(b)− f(a)|| ≤ ||Df(c)(b− a)|| ≤ ||Df(c)||mn||b− a|| ≤M ||b− a||.

Lema 8.51. Supongamos que f esta definida en una vecindad U del origen enR2 con valores en R, que las parciales Dxf y Dyf existen en U y que Dyxf escontinua en (0, 0). Si definimos A con la formula:

A(h, k) = f(h.k)− f(h,0)− f(0, k) + f(0,0), (h, k) ∈ U,

entonces tenemos:

Dyxf(0, 0) = lım(h,k)→(0,0)

A(h, k)

hk.

Capıtulo 8. Diferenciacion de Varias Variables 140

Demostracion. Sea ε > 0. Como Dyxf es continua en (0, 0), existe δ > 0 talque si |h| < δ y |k| < δ, entonces (h, k) ∈ U y |Dyxf(h, k)−Dyxf(0, 0)| < ε. Si|k| < δ, definimos B : (−δ, δ)→ R con la formula:

B(h) = f(h, k)− f(h, 0).

Por tanto, A(h, k) = B(h) − B(0) para |h| < δ, |k| < δ. Aplicando el teoremadel valor medio en una variable a B, existe un numero h0, con 0 < |h0| < |h|tal que:

A(h, k) = B(h)−B(0) = hB′(h0) (?)

Por otro lado, B′(h0) = (Dxf)(h0, k) − (Dxf)(h0, 0). Aplicando el mismo teo-rema al lado derecho de esta ultima ecuacion, existe un numero k0, con 0 <|k0| < |k| tal que B′(h0) = k(Dyxf)(h0, k0). Combinando esta ultima ecuacioncon (?), concluimos que si 0 < |h| < δ y 0 < |k| < δ, entonces:

A(h, k)

hk= (Dyxf)(h0, k0),

en donde 0 < |h0| < |h| y 0 < |k0| < |k|. Usando la continuidad de Dyxf en(0, 0), obtenemos: ∣∣A(h, k)

hk− (Dyxf)(0, 0)

∣∣ < ε

siempre que 0 < |h| < δ y 0 < |k| < δ.

Teorema 8.52. Supongamos que f esta definida en una vecindad U de unpunto (x, y) en R2 y con valores en R. Supongamos que las parciales Dxf , Dyfy Dyxf existen en U y que Dyxf es continua en (x, y). Entonces la parcial Dxyfexiste en (x, y) y Dxyf(x, y) = Dyxf(x, y).

Demostracion. Sin perdida de generalidad podemos suponer que (x, y) = (0, 0).Si definimos la funcion A como en el lema anterior, tenemos que:

Dyxf(0, 0) = lım(h,k)→(0,0)

A(h, k)

hk.

Por hipotesis Dyf existe en U , de manera que:

(?) lımk→0

A(h, k)

hk=

1

h(Dyf(h, 0)−Dyf(0, 0)), h 6= 0.

Si ε > 0, existe un numero δ(ε) > 0 tal que si 0 < |h| < δ(ε) y 0 < |k| < δ(ε),entonces (h, k) ∈ U y: ∣∣A(h, k)

hk− (Dyxf)(0, 0)

∣∣ < ε.

Tomando el lımite de esta desigualdad con respecto a k y usando (?), obtenemos:

| 1h

(Dyf(h, 0)−Dyf(0, 0)−Dyxf(0, 0))| ≤ ε

para cada h con 0 < |h| < δ(ε). Por tanto, Dxyf(0, 0) existe y es igual aDyxf(0, 0).

Capıtulo 8. Diferenciacion de Varias Variables 141

Definicion 8.53. Sea Ω ⊆ Rm abierto y sea f : Ω→ Rn una funcion. Decimosque f es de clase C1(Ω) si la diferencial Df(x) existe para cada x ∈ Ω y si elmapeo x 7→ Df(x) de Ω a L(Rm,Rn) es continuo.

Teorema 8.54. Una funcion f : Ω→ Rn es de clase C1(Ω) si y solo si las mnparciales Difj existen y son continuas en todo Ω.

Demostracion. ⇐] Segun 8.42 (Df)(x) existe para cada x ∈ Ω. Recordemos queel jacobiano (Difj(x)) es la matriz de Df(x) respecto a las bases canonicas de

Rm y Rn y que el numero B = (∑i,j(Difj(x))2)

12 satisface ||Df(x)(u)|| ≤ B||u||

para cada u ∈ Rm. Por tanto, tenemos ||Df(x)||mn ≤ B. Sea M > 0 tal queVM (x) ⊆ Ω. Dado ε > 0, existe δ > 0, δ < M tal que |Difj(y)−Difj(x)| < ε√

mn

siempre que ||y − x|| < δ, i = 1, ...,m, j = 1, ..., n. Por tanto, si y ∈ Ω y||y − x|| < δ, tenemos:

||Df(y)−Df(x)||2mn ≤∑i,j

(Difj(y)−Difj(x))2 < mnε2

mn= ε2.

De donde, la asignacion x 7→ Df(x) es continua.

⇒] Sabemos que la asignacion x 7→ Df(x) es continua. Dados x ∈ Ω, i ∈1, 2, ...,m, j ∈ 1, 2, ..., n y ε > 0, existe δ > 0 tal que si y ∈ Ω y ||y−x|| < δ,entonces ||Df(y) − Df(x)||mn < ε. Por otro lado, si x ∈ Ω, L = Df(x) ei ∈ 1, 2, ...,m, tenemos:

L(ei) = (Dif1(x), Dif2(x), ..., Difn(x)).

Como ei ∈ Sm−1, tenemos ||Df(x)(ei)|| ≤ ||Df(x)||mn para cada x ∈ Ω. Portanto:

|Difj(y)−Difj(x)|2 ≤n∑j=1

(Difj(y)−Difj(x))2 ≤ ||Df(y)−Df(x)||2mn.

Por tanto, ||y − x|| < δ implica que |Difj(y)−Difj(x)| < ε y Difj es continuaen x.

Lema 8.55. Sea f : Ω → Rn, Ω abierto en Rm, una funcion diferenciableen cada x ∈ Ω. Supongamos que S = [a, b] es un segmento cerrado de Rmtotalmente contenido en Ω y sea x0 ∈ Ω. Entonces tenemos:

||f(b)− f(a)−Df(x0)(b− a)|| ≤ ||b− a|| supx∈S||Df(x)−Df(x0)||mn.

Demostracion. Definamos g : Ω → Rn mediante la formula g(x) = f(x) −Df(x0)(x). Como Df(x0) es lineal, se sigue que para cada x ∈ Ω, tenemosf(x)− g(x) = Df(x0)(x). Por tanto,

f − g|Ω = Df(x0)|Ω

Capıtulo 8. Diferenciacion de Varias Variables 142

yDf(x)−Dg(x) = Df(x0)

para cada x ∈ Ω. Si aplicamos el teorema del valor medio, deducimos que existec ∈ S tal que:

||f(b)− f(a)−Df(x0)(b− a)|| =||g(b)− g(a)||≤||Dg(c)(b− a)||=||(Df(c)−Df(x0))(b− a)||≤||b− a|| ||Df(c)−Df(x0)||mn≤||b− a|| sup

x∈S||Df(x)−Df(x0)||mn.

Lema 8.56. (Lema de Aproximacion) Sea f : Ω → Rn de clase C1(Ω). Six0 ∈ Ω, VM (x0) ⊆ Ω y ε > 0, existe δ(ε) > 0, δ(ε) < M tal que si x1, x2 ∈ Ωsatisfacen ||xk − x0|| ≤ δ(ε), k = 1, 2, entonces:

||f(x1)− f(x2)−Df(x0)(x1 − x2)|| ≤ ε||x1 − x2||.

Demostracion. Como la asignacion x 7→ Df(x) es continua como funcion de Ωa L(Rm,Rn), dado ε > 0, existe δ(ε) > 0, δ(ε) < M tal que si ||x−x0|| ≤ δ(ε), setiene ||Df(x)−Df(x0)||mn ≤ ε. Ahora, sean x1, x2 tales que ||xk − x0|| ≤ δ(ε).Por tanto, [x1, x2] ⊆ Ω. Basta aplicar entonces el lema anterior.

Teorema 8.57. (Teorema del Mapeo Inyectivo). Sea f : Ω→ Rn de claseC1(Ω), en donde Ω es un abierto de Rm. Supongamos que c ∈ Ω y L = Df(c)es inyectiva. Entonces existe un numero δ > 0 tal que la restriccion de f aBδ = x ∈ Rm | ||x− c|| ≤ δ es inyectiva. Ademas, la inversa de la restriccionf |Bδ es una funcion continua de f(Bδ) ⊆ Rn sobre Bδ ⊆ Rm.

Demostracion. Como L = Df(c) es inyectiva, el numero r = ınf||L(x)|| |x ∈Rm, ||x|| = 1 es positivo. Por tanto, r||u|| ≤ ||L(u)|| para cada u ∈ Rm.Apliquemos ahora el lema de aproximacion con ε = 1

2r y obtenemos un numeroδ > 0 tal que si ||xk − c|| < δ con k = 1, 2, entonces x1, x2 ∈ Ω y ||f(x1) −f(x2)−L(x1 − x2)|| ≤ r

2 ||x1 − x2||. Aplicando la desigualdad triangular al ladoizquierdo de esta desigualdad obtenemos:

||L(x1 − x2)|| − ||f(x1)− f(x2)|| ≤ r

2||x1 − x2||.

Por otro lado, tomando u = x1 − x2, tenemos ||L(u)|| ≥ r||u||, de manera que:

r||x1 − x2|| − ||f(x1)− f(x2)|| ≤ r

2||x1 − x2||

yr

2||x1 − x2|| ≤ ||f(x1)− f(x2)|| (∗)

Capıtulo 8. Diferenciacion de Varias Variables 143

para xk ∈ Bδ, k = 1, 2. Esto prueba que la restriccion de f a Bδ es inyectiva.Llamemos ahora g = (f |Bδ)−1 : f(Bδ) → Bδ. Si yk ∈ f(Bδ), k = 1, 2, existenpuntos unicos xk = g(yk) en Bδ tales que yk = f(xk). De (∗) obtenemos:

||g(y1)− g(y2)|| ≤ 2

r||y1 − y2||.

De aquı se sigue que g es uniformemente continua.

Teorema 8.58. (Teorema de la Funcion Suprayectiva). Sea f : Ω→ Rnde clase C1(Ω), en donde Ω ⊆ Rm abierto. Supongamos que para alguna c ∈ Ω,la funcion lineal L = Df(c) es suprayectiva. (Esto implica que dim(L(Rm)) =n ≤ m). Entonces existen numeros µ > 0 y α > 0 tales que si y ∈ Rn y||y − f(c)|| ≤ α

2µ , entonces existe x ∈ Ω tal que ||x− c|| ≤ α y f(x) = y.

Demostracion. Como L es suprayectiva, cada uno de los vectores canonicose′1, e

′2, ..., e

′n de Rn es la imagen bajo L de algun vector de Rm, digamos L(ui) =

e′i, u1, ..., um ∈ Rm. Defınase M : Rn → Rm de manera que M es lineal yM(e′i) = ui para i = 1, 2, ..., n. Por tanto, M(

∑ni=1 aie

′i) =

∑ni=1 aiui. Deduci-

mos entonces que L M es la identidad en Rn, es decir, (L M)(y) = y para

cada y ∈ Rn. Si ponemos µ = [∑ni=1 ||ui||2]

12 y y =

∑ni=1 aie

′i, entonces:

M(y) =

n∑i=1

aiui,

||M(y)|| ≤n∑i=1

|ai| ||ui|| ≤ (

n∑i=1

a2i )

12 (

n∑i=1

||ui||2)12 = µ||y||.

Por el lema de aproximacion, existe un numero α > 0 tal que si ||xk − c|| ≤ α,k = 1, 2, entonces x1, x2 ∈ Ω y:

||f(x1)− f(x2)− L(x1 − x2)|| ≤ 1

2µ||x1 − x2||.

Pongamos Bα = x ∈ Rm | ||x − c|| ≤ α y supongamos que y ∈ Rn satisface||y − f(c)|| ≤ α

2µ . Probaremos que existe x ∈ Bα tal que y = f(x). Sea x0 = c

y x1 = x0 + M(y − f(c)). Se tiene entonces ||x1 − x0|| = ||M(y − f(c))|| ≤µ||y−f(c)|| ≤ α

2 . De donde, ||x1−x0|| ≤ α2 y ||x1− c|| ≤ (1− 1

2 )α. Supongamosque c = x0, x1, ..., xk han sido escogidas inductivamente en Rm de manera que:

||xj − xj−1|| ≤ α2j y ||xj − c|| ≤ (1− 1

2j )α, j = 1, 2, ..., k.

Definamos xk+1 mediante la formula:

xk+1 = xk −M [f(xk)− f(xk−1)− L(xk − xk−1)].

Se deduce entonces que:

||xk+1 − xk|| ≤µ||f(xk)− f(xk−1)− L(xk − xk−1)||

≤µ · 1

2µ||xk − xk−1|| =

1

2||xk − xk−1||

Capıtulo 8. Diferenciacion de Varias Variables 144

Por las hipotesis inductivas:

||xk+1 − xk|| ≤1

2

α

2k=

α

2k+1

y

||xk+1 − c|| ≤ ||xk+1 − xk||+ ||xk − c|| ≤α

2k+1+ (1− 1

2k)α = (1− 1

2k+1)α.

Esto completa la construccion inductiva de la sucesion c = x0, x1, .... Si k ≥ j,tenemos:

||xk − xj || ≤ ||xk − xk−1||+ ||xk−1 − xk−2||+ ...+ ||xj+1 − xj ||

≤ α

2k+

α

2k−1+ ...+

α

2j+1≤ α

2j.

De donde, (xj) es una sucesion de Cauchy y, por tanto, converge a un elementox. Como ||xk−c|| ≤ (1− 1

2k)α, se sigue que ||x−c|| ≤ α, de manera que x ∈ Bα.

Como x1 − x0 = M(y − f(c)), se sigue que:

L(x1 − x0) = (L M)(y − f(c)) = y − f(x0).

Ademas, de la definicion de xk+1, obtenemos:

L(xk+1 − xk) = −(L M)[f(xk)− f(xk−1)− L(xk − xk−1)]

= −[f(xk)− f(xk−1)− L(xk − xk−1)]

= L(xk − xk−1)− [f(xk)− f(xk−1)].

Aplicando la misma formula k veces, obtenemos:

L(xk+1 − xk) = L(x1 − x0)− [f(xk)− f(x0)] = y − f(xk).

Como:

||L(xk+1 − xk)|| ≤ ||L||mn||xk+1 − xk|| ≤ ||L||mnα

2k+1−→ 0,

deducimos que f(xk) −→ y. Pero por continuidad, f(xk) −→ f(x). Por tantoy = f(x). Hemos probado entonces que la imagen de la bola cerrada Bα(c)contiene a la bola cerrada Bα/2µ(f(c)).

Teorema 8.59. (Teorema de la Funcion Abierta). Sea Ω ⊆ Rm abiertoy sea f : Ω → Rn de clase C1(Ω). Si m ≥ n y para cada x ∈ Ω la diferencialDf(x) es suprayectiva, entonces, para cada abierto G ⊆ Ω, f(G) es abierto enRn.

Demostracion. Sea G ⊆ Ω abierto y fijemos un punto c ∈ G. Por 8.58 aplicadoa f |G, existen α > 0, β > 0 tales que Vα(c)− ⊆ G y Vβ(f(c))− ⊆ f(Vα(c)−).Como c era arbitrario, deducimos que f(G) es abierto en Rn.

Capıtulo 8. Diferenciacion de Varias Variables 145

Teorema 8.60. (Teorema de la Inversion). Sea Ω ⊆ Rm abierto y seaf : Ω → Rn de clase C1(Ω). Si c ∈ Ω es tal que Df(c) es biyectiva, entoncesexiste un abierto U ⊆ Rm tal que c ∈ U ⊆ Ω, tal que V = f(U) es abierto enRm y tal que la restriccion de f a U es una biyeccion de U sobre V . Ademas,la inversa g de esta biyeccion es de clase C1(V ) y para cada y ∈ V , se tieneDg(y) = [Df(g(y))]−1.

Demostracion. Por hipotesis, L = Df(c) es inyectiva. Por tanto, si 2r = ınf||L(x)|| |x ∈Sm−1, entonces r > 0 y 2r||z|| ≤ ||L(z)|| para cada z ∈ Rm. Como f esde clase C1(Ω), existe δ > 0 tal que Vδ(c) ⊆ Ω y para cada x ∈ Vδ(c),||Df(x)− L||mm < r. Por tanto, si x ∈ Vδ(c) y z ∈ Sm−1, tenemos:

2r − ||Df(x)(z)|| ≤ ||L(z)|| − ||Df(x)(z)|| ≤ ||L(z)−Df(x)(z)||

≤ ||L−Df(x)||mm < r.

De donde, ||Df(x)(z)|| > r para cada x ∈ Vδ(c) y cada z ∈ Sm−1. Esto implicaque r||z|| ≤ ||Df(x)(z)|| para cada x ∈ Vδ(c) y cada z ∈ Rm. De aquı deducimosque Df(x) es biyectiva para cada x ∈ Vδ(c). Podemos tambien suponer, por elteorema de la funcion inyectiva, que f |Vδ(c) : Vδ(c) → f(Vδ(c)) es inyectiva. SiU = Vδ(c), V = f(Vδ(c)) y g : V → U es la inversa de f |U , deducimos de8.59 y 8.58, que f |U : U → V es abierta y de clase C1(U). Probemos que g esdiferenciable en cada punto y1 ∈ V . Sea x1 = g(y1) ∈ U . Como f es diferenciableen x1, se sigue que si x ∈ U , entonces:

f(x)− f(x1)−Df(x1)(x− x1) = ||x− x1|| U(x),

en donde U : U → Rm y ||U(x)|| −→ 0 cuando x −→ x1. Si llamamos M1 a lainversa de la funcion lineal Df(x1), entonces:

x− x1 = M1[Df(x1)(x− x1)] = M1[f(x)− f(x1)− ||x− x1|| U(x)] (>).

Si x ∈ U , entonces x = g(y), en donde y = f(x) ∈ V . Ademas y1 = f(x1) asique (>) puede escribirse en la forma:

g(y)− g(y1)−M1(y − y1) = −||x− x1||M1(U(x)).

Como Df(x1) es inyectiva, se sigue, como en la prueba del teorema del mapeoinyectivo, que:

||y − y1|| = ||f(x)− f(x1)|| ≥ r

2||x− x1||

siempre que x, x1 permanezcan en una bola cerrada suficientemente chica concentro en c y contenida en U , y:

r||z|| ≤ ||Df(x1)(z)||

para cada z ∈ Rm. Como M1 es la inversa de la funcion lineal Df(x1), tenemos||M1(u)|| ≤ 1

r ||u|| para cada u ∈ Rm. Por tanto:

||g(y)− g(y1)−M1(y − y1)|| ≤ ||x− x1|| ||M1(U(x))|| ≤ 2

r2||U(x)|| ||y − y1||.

Capıtulo 8. Diferenciacion de Varias Variables 146

Ahora, cuando y −→ y1, entonces x = g(y) −→ g(y1) = x1, de manera que||U(x)|| −→ 0. Concluimos entonces que Dg(y1) existe y es igual a M1 =[Df(x1)]−1. El hecho de que g es de clase C1(V ) se sigue de la relacion Dg(y) =[Df(g(y))]−1 para y ∈ V y de la continuidad de los mapeos:

y 7→ g(y) de V a U,

x 7→ Df(x) de U a L(Rm,Rm),

y L 7→ L−1 de L(Rm,Rm) a L(Rm,Rm),

respectivamente.

Teorema 8.61. (Teorema de la Funcion Implıcita). Sea Ω ⊆ Rm × Rnabierto y sea (a, b) ∈ Ω, (a ∈ Rm, b ∈ Rn). Sea F = (F1, ..., Fn) : Ω → Rn declase C1(Ω) tal que F (a, b) = 0 y tal que el mapeo lineal L2 : Rn → Rn definidomediante la formula:

L2(v) = DF (a, b)(0, v), v ∈ Rn,

es una biyeccion. Entonces:

a) Existen una vecindad abierta W de a ∈ Rm y una unica funcion ϕ : W →Rn, de clase C1(W ), tal que b = ϕ(a) y F (x, ϕ(x)) = 0 para toda x ∈W .

b) Existe una vecindad abierta U de (a, b) en Rm ×Rn contenida en Ω tal quela pareja (x, y) ∈ U satisface F (x, y) = 0 si y solo si y = ϕ(x) para x ∈W ,i.e.,

U ∩ F−1(0) = (W × Rn) ∩ Γ(ϕ).1

Demostracion. Definamos F : Ω→ Rn, en donde:

Ω = (x− a, y − b)|(x, y) ∈ Ω

con la formula:F (x, y) = F (x+ a, y + b).

Por tanto, F (0, 0) = F (a, b) = 0. Sea T : Rm × Rn → Rm × Rn la traslacion:

T (u, v) = (u+ a, v + b).

De donde, F = F T . Claramente DT (u, v) = Id para cada (u, v) ∈ Rm × Rn.Por la regla de la cadena,

DF (0, 0) = DF (a, b) DT (0, 0) = DF (a, b),

yL2(v) = DF (0,0)(0, v) = DF (a, b)(0, v) = L2(v).

1Γ(ϕ) denota la grafica de ϕ, es decir, Γ(ϕ) = (x, ϕ(x)) |x ∈W.

Capıtulo 8. Diferenciacion de Varias Variables 147

Si aplicamos el teorema con F en lugar de F y con (0, 0) en lugar de (a, b),encontramos una vecindad abierta W de 0 ∈ Rm y una unica funcion ϕ : W →Rn, de clase C1(W ) tal que 0 = ϕ(0) y F (x, ϕ(x)) = 0 para cada x ∈ W ytambien una vecindad abierta U de (0, 0) en Rm × Rn contenida en Ω tal queU∩F−1(0) = (W×Rn)∩Γ(ϕ). Basta definir entonces W = W+a, U = U+(a, b)y ϕ(x) = ϕ(x − a) + b para x ∈ Ω. Podemos suponer entonces, sin perdida degeneralidad, que (a, b) = (0, 0). Definamos H : Ω → Rm × Rn mediante laformula:

H(x, y) = (x, F (x, y)).

Las m+ n funciones coordenadas de H son:

H1(x, y) = x1, ...,Hm(x, y) = xm,

Hm+1(x, y) = F1(x, y), ...,Hm+n = Fn(x, y).

Por tanto, la matriz jacobiana de JH(0, 0) tiene la forma siguiente:

JH(0, 0) =

Im×mJF (0, 0)(m+n)×n

0n×m

El determinante de JH(0, 0) es entonces:

(>) |JH(0, 0)| =∣∣∣∣ ∂Fj(0, 0)

∂xm+i

∣∣∣∣ ,donde i, j ∈ 1, 2, ..., n. En cuanto a la funcion L2 tenemos:

L2(e′i) = (0, e′i)JF (0, 0) = (∂F1

∂xm+i(0, 0),

∂F2

∂xm+i(0, 0), ...,

∂Fn∂xm+i

(0, 0)).

La hipotesis en L2 y la ecuacion (>) implican que |JH(0, 0)| 6= 0. De donde,H es de clase C1(Ω) y para cada (u, v) ∈ Rm × Rn tenemos:

DH(0, 0)(u, v) = (u, v)

IJF (0, 0)

0

= (u,DF (0, 0)(u, v).

Si definimos L1 : Rm → Rn con la formula:

L1(u) = DF (0, 0)(u, 0),

entonces L1 es lineal y:

DF (0, 0)(u, v) = L1(u) + L2(v).

De donde, DH(0, 0)(u, v) = (u, L1(u)+L2(v)). El mapeo lineal K : Rm×Rn →Rm × Rn definido como:

K(x, z) = (x, L−12 (z − L1(x)))

Capıtulo 8. Diferenciacion de Varias Variables 148

satisface:

(K DH(0, 0))(u, v) = K(u, L1(u) + L2(v)) = (u, v)

y(DH(0, 0) K)(x, z) = DH(0, 0)(x, L−1

2 (z − L1(x)))

= (x, L1(x) + z − L1(x)) = (x, z).

Por tanto, por el teorema de inversion, existe una vecindad abierta U de (0, 0)en Rm×Rn contenida en Ω tal que V = H(U) es una vecindad abierta de (0, 0)en Rm × Rn y tal que la restriccion H|U es una biyeccion sobre V con inversaΦ : V → U , la cual es de clase C1(V ) y con Φ(0, 0) = (0, 0). Por otro lado, Φtiene la forma:

Φ(x, z) = (ϕ1(x, z), ϕ2(x, z)) (x, z) ∈ V,

en donde ϕ1 : V → Rm y ϕ2 : V → Rn. Como:

(x, z) = (H Φ)(x, z) = H(ϕ1(x, z), ϕ2(x, z)) = (ϕ1(x, z), F (ϕ1(x, z), ϕ2(x, z))),

deducimos que ϕ1(x, z) = x para cada (x, z) ∈ V . Por tanto Φ tiene la formamas simple:

Φ(x, z) = (x, ϕ2(x, z)) (x, z) ∈ V.

Ahora, si P1 : Rm × Rn → Rm, P2 : Rm × Rn → Rn son las proyeccionesP1(x, z) = x, P2(x, z) = z, entonces ϕ2 = P2 Φ. Por tanto, ϕ2 es de claseC1(V ) y:

F (x, ϕ2(x, z)) = (P2 H)(x, ϕ2(x, z)) = (P2 H Φ)(x, z) = P2(x, z) = z.

Definamos ahora W = x ∈ Rm | (x, 0) ∈ V ∼= P−12 (0) ∩ V . W es entonces

una vecindad abierta de 0 en Rm y definimos ϕ(x) = ϕ2(x, 0) para x ∈ W .Obviamente ϕ(0) = ϕ2(0, 0) = 0 pues (0, 0) = Φ(0, 0) = (ϕ1(0, 0), ϕ2(0, 0)).Tambien x ∈W implica:

(x, 0) = (H Φ)(x, 0) = H(Φ(x, 0)) = H(x, ϕ2(x, 0)) = (x, F (x, ϕ2(x, 0))

y, por tanto,F (x, ϕ2(x, 0)) = F (x, ϕ(x)) = 0

Ademas, por la regla de la cadena,

Dϕ(x)(u) = (Dϕ2(x, 0) Dλ(x))(u) = Dϕ2(x, 0)(u, 0),

en donde, λ(x) = (x, 0) para cada x ∈W (λ : W → V ). Por tanto, ϕ es de claseC1(W ) y a) queda probado.

En cuanto a b), tomemos (x, y) ∈ U tal que F (x, y) = 0. Por tanto,

H(x, y) = (x, F (x, y)) = (x, 0) = (x, F (x, ϕ(x))) = H(x, ϕ(x)).

Capıtulo 8. Diferenciacion de Varias Variables 149

Como (x, ϕ(x)) = (x, ϕ2(x, 0)) = Φ(x, 0) ∈ U y H es inyectiva, tenemos y =ϕ(x).

Recıprocamente, sea (x, y) ∈ U tal que y = ϕ(x). Por tanto:

F (x, y) = F (x, ϕ(x)) = F (x, ϕ2(x, 0)) = 0

Esto completa la demostracion del Teorema.

Bibliografıa

[1] Anton, Howard, Introduccion al algebra lineal. Limusa Wiley, Mexico, 2002.

[2] Apostol, Thomas, Mathematical Analysis. Addison-Wesley, London, 1960.

[3] Bartle, Robert, The Elements of Real Analysis. John Wiley & Sons, Inc.,New York, 1967.

[4] Brand, L., Vector and Tensor Analysis. Wiley, New York, 1947.

[5] Burkill, J.C., The Lebesgue Integral. Cambridge University Press, 1951.

[6] Dugundji, J., Topology. Allyn and Bacon, Boston Mass., 1966.

[7] Garcıa-Maynez, A.; Tamariz A., Topologıa General. Porrua, Mexico, 1988.

[8] Halmos, P.R., Measure Theory. Van Nostrand, New York, 1950.

[9] Hocking, J.G.; Young, G.S., Topology. Addison-Wesley, Reading Mass.,1961.

[10] Kestelman, H., Modern Theories of Integration. Oxford University Press,1937.

[11] McShane, E.J., Integration. Princeton University Press, 1944.

[12] Rudin, W., Principles of Mathematical Analysis. McGraw-Hill, New York,1953.

150

Indice alfabetico

ınfimo, 13

Lindelof, espacio de, 29

abierto, 22absolutamente convergente, 77acotado inferiormente, 13acotado superiormente, 13

base, 29, 125base canonica, 127

campo, 6campo arquimidiano, 13campo completo, 13campo ordenado, 11Cauchy-Schwarz, desigualdad de , 19cerradura, 24codominio, 4compacto, 45completacion, 59completamente separable, 29completo, espacio, 45composicion, 5conjunto acotado, 36conjunto cerrado, 23conjunto conexo, 33conjunto derivado, 28conjunto disconexo, 33conjunto inductivo, 7conjuntos cercanos, 23conjuntos separados, 33continuidad puntual, 51cota inferior, 13cota superior, 13Criterio D’Alembert, 78cubierta, 29cubierta abierta, 29

denso, 29derivada direccional, 131derivada parcial, 133derivada puntual, 62desigualdad triangular, 18diferencial de una funcion, 132dimension, 126disco con centro en un punto, 22distancia, 23divergente, 77dominio, 4

elemento identico, 4elemento inverso, 5elementos negativos, 11elementos positivos, 11encaje isometrico, 59equivalentes, espacios, 53espacio dual, 127espacio metrico, 20espacio seudo-metrico, 20espacio vectorial, 17espacio vectorial real, 124exterior, 25

factorial, 9frontera, 25funcion, 4funcion acotada, 82funcion continua, 52funcion creciente, 66funcion de Lipschitz, 57funcion decreciente, 66funcion escalonada, 109funcion inyectiva, 4funcion Riemann integrable, 90funcion Riemann-Stieltjes integrable, 89funcion suprayectiva, 4

151

Indice alfabetico 152

funcion uniformemente continua, 56funciones lineales, 127

generador, 125grafica, 62grupo, 5grupo abeliano, 6

Heine-Borel, espacio de, 47Hilbert, cubo de, 21homeomorfo, espacio, 53

imagen, 126interior, 25intervalos abiertos, 12intervalos cerrados, 12isometrıa, 59isomorfismo, 127isomorfo, campo, 13

jacobiano, 133

lımite, 39Lema de Aproximacion, 142libre, 125linealmente dependiente, 125linealmente independiente, 125longitud de arco, 84

maximo local, 72metrica, 20metrica discreta, 23mınimo local, 72monotona creciente, 66monotona decreciente, 66monoide, 6

nucleo, 126norma, 18, 127norma de una particion, 82

operacion asociativa, 4operacion binaria, 4operacion conmutativa, 4

pareja no ordenada, 3pareja ordenada, 3

particion, 82particion punteada, 89Principio de Induccion, 7producto cartesiano, 3producto interior, 18punto de acumulacion, 28punto de acumulacion por la derecha,

40punto de acumulacion por la izquierda,

40punto de adherencia, 23, 41punto exterior, 25punto frontera, 25punto interior, 25

racionales, numeros, 15rectificable, 84refinar, 89Regla de la Cadena, 67, 136relacion, 4relacion inversa, 5

secante, 62segunda derivada, 70separable, espacio, 29serie asociada, 75seudo-metrica, 19seudo-metrica producto, 31subcubierta, 29subespacio lineal, 125subsucesion, 36sucesion, 36sucesion acotada, 36sucesion anidada, 13sucesion convergente a un punto, 37sucesion de Cauchy, 43sucesion discreta, 44sucesion estrictamente creciente, 36sucesion nula, 36sucesiones equivalentes, 37suma de Riemann-Stieltjes, 89suma inferior de Riemann-Stieltjes, 99suma superior de Riemann-Stieltjes, 99supremo, 13

tangente geometrica, 63

Indice alfabetico 153

tangente trigonometrica, 62Teorema de Darboux, 69Teorema de Integracion por partes, 94Teorema de L’Hospital, 73Teorema de la Funcion Abierta, 144Teorema de la Funcion Implıcita, 146Teorema de la Funcion Inversa, 69Teorema de la Funcion Suprayectiva,

143Teorema de la Inversion, 145Teorema de Rolle, 67Teorema de Sustitucion, 95Teorema de Taylor, 72Teorema de Weierstrass, 47Teorema del Binomio, 8Teorema del Mapeo Inyectivo, 142Teorema del Valor Medio, 68Teorema del Valor Medio de Cauchy,

70Teorema del valor medio para integrales

de Riemann-Stieltjes, segun-do, 111

Teorema del valor medio para integralesde Riemann-Stieltjes, primero,111

Teorema del Valor Medio, primero, 138Teorema del Valor Medio, segundo, 139Teorema Fundamental del Algebra, 10Teorema Fundamental del Calculo In-

tegral, 97Teorema generalizado de Cauchy, 71totalmente acotado, 42transformacion lineal, 126

variable proposicional, 3variacion acotada, 82variacion total, 83