Matemáticas PES Volumen II

Cuerpo de Profesores de Enseñanza Secundaria

Matemáticas Temario Volumen II

Jesús Gómez Gómez Fulgencio García Gómez Emilio M. Pina Coronado Jorge Navarro Camacho

ESTA ESPECIAL IDAD CONTIE NE

Servicio Exclusivo Gratuito


Matemáticas

¡ESTE AÑO CONSEGUIRÁS TU PLAZA CON EDITORIAL MAD! Publicaciones + servicio exclusivo por internet*

3

Temarios actualizados Programaciones para todas las especialidades

años

El servicio exclusivo incluye... Actualizaciones durante 3 años Material adicional

www.oposicion-secundaria.com Incluye 3 años de SERVICIO EXCLUSIVO por internet

*Consultar condiciones

Cursos Online de Formación Permanente del Profesorado Título acreditativo Homologación válida en todas las CC AA Temáticas de actualidad Sin desplazamientos y a tu ritmo Tutores expertos Y mucho más....

-

Infórmate y haz tu matrícula llamando al

902 111 163 O N L I N E

EL AULA VIRTUAL DE EDITORIAL MAD

www.eduformaonline.com/portal/profesores Servicios gratuitos de información - Información de oposiciones: www.oposicion-secundaria.com/form-inform-sec.asp - Novedades de editoriales: www.mad.es/nov-libros.asp - Información de cursos online: www.eduformaonline.com/portal/suscrip-nov-formul.asp

¡ESTE AÑO CONSEGUIRÁS TU PLAZA CON EDITORIAL MAD! Publicaciones + servicio exclusivo por internet* Temarios actualizados Programaciones para todas las especialidades

Coordinación: Isabel García Lucas TRIVIUM. Centro de Oposiciones de Murcia

El servicio exclusivo incluye... Actualizaciones durante 3 años Material adicional

3

años

www.oposicion-secundaria.com *Consultar condiciones

Incluye 3 años de SERVICIO EXCLUSIVO por internet

Temario Volumen II

Cursos Online de Formación Permanente del Profesorado Título acreditativo Homologación válida en todas las CC AA Temáticas de actualidad Sin desplazamientos y a tu ritmo Tutores expertos Y mucho más....

Infórmate y haz tu matrícula llamando al

902 111 163 O N L I N E

-

Matemáticas EL AULA VIRTUAL DE EDITORIAL MAD

www.eduformaonline.com/portal/profesores Servicios gratuitos de información - Información de oposiciones: www.oposicion-secundaria.com/form-inform-sec.asp - Novedades de editoriales: www.mad.es/nov-libros.asp

Cuerpo de Profesores de Enseñanza Secundaria - Información de cursos online: www.eduformaonline.com/portal/suscrip-nov-formul.asp

Jesús Gómez Gómez Licenciado en Ciencias Exactas y en Ciencias de la Educación-Pedagogía. Catedrático de Matemáticas en el IES Diego Tortosa, de Cieza (Murcia). Fulgencio García Gómez Licenciado en Ciencias Exactas. Profesor de Matemáticas en el IES Infanta Elena, de Jumilla (Murcia). Emilio M. Pina Coronado Licenciado en Psicología. Profesor en el IES José Castillo Puche, de Yecla. Jorge Navarro Camacho Doctor en Ciencias Matemáticas por la Universidad de Murcia. Profesor Titular de Facultad del Departamento de Estadística e Investigación Operativa de la Universidad de Murcia.

© Editorial MAD, S.L. © Los autores. Segunda edición, julio 2007. Depósito Legal: SE-3787-2007 (II) (550 páginas) Derechos de edición reservados a favor de EDITORIAL MAD, S.L. Prohibida la reproducción total o parcial sin permiso escrito del editor. IMPRESO EN ESPAÑA. Diseño Portada: EDITORIAL MAD, S.L. Edita: EDITORIAL MAD, S.L. Plg. Merka, c/B. Nave 1. 41500 ALCALÁ DE GUADAÍRA (Sevilla). Telf.: +34 902 452 900. WEB: www.mad.es ISBN-13: 978-84-665-7920-9. ISBN-10: 84-665-7920-6. ISBN-13 obra completa: 978-84-665-0948-0. ISBN-10 obra completa: 84-665-0948-8.

Presentación El libro que tiene en las manos corresponde al temario de Oposiciones para el Cuerpo de Profesores de Enseñanza Secundaria de la especialidad de Matemáticas que Editorial MAD pone a disposición de todos aquéllos que aspiren a conseguir una excelente preparación que garantice, en la medida de lo posible, su éxito en las oposiciones. A la hora de escribir un temario de oposiciones de gran calidad el criterio básico ha de ser redactar cada tema con la finalidad de que el opositor no tenga necesidad de acudir a ninguna otra obra de consulta, es decir, que encuentre en el propio temario absolutamente todo el material que necesita. La premura con que casi siempre se estudia una oposición hace necesario que toda la materia esté presentada de forma clara, al mismo tiempo que sistemática y rigurosamente expuesta, conjugando esto con un nivel de comprensión que no haga que el opositor deba realizar un doble esfuerzo: entender el tema, y entender al redactor del tema. Disponer de un temario contrastado y actualizado otorga al futuro profesor la garantía de contar con un material que le ahorre múltiples esfuerzos y que le asegure una excelente preparación. Nuestra experiencia durante bastantes años en el campo de la preparación de opositores nos ha permitido comprobar, por haber tenido alumnos de todas las Comunidades Autónomas, que, por lo general, aproximadamente una cuarta parte de los temas son “nuevos” (en su contenido) tanto para los recién licenciados como para muchos doctorados, al no haber estudiado los aspectos fundamentales de éstos durante su formación como alumnos en las diferentes universidades. Por eso este temario incorpora no sólo todo el material (y de forma abundante) necesario para la comprensión del tema, sino también la definición clara de cualquier concepto relevante que aparezca, así como las aclaraciones cuando sean pertinentes y también muchos otros datos que posibiliten la comprensión. Es preferible que los datos y las explicaciones sobreabunden a que sean demasiado escasos; el opositor siempre podrá “recortar” el tema o sintetizar lo que estime más relevante. Los resultados obtenidos durante bastantes años por muchos de nuestros alumnos han sido extraordinarios, y han logrado en diferentes convocatorias y en tribunales de oposición varios números uno y muchísimos aprobados con plaza. Esto siempre nos ha estimulado a seguir actualizando y “puliendo” los temas, así como animando a los opositores a conseguir la preparación de la mayor calidad posible, con la confianza en que su esfuerzo finalmente tendrá el resultado anhelado.

Los autores TRIVIUM. Centro de Oposiciones de Murcia.

Índice Tema 25. Límites de funciones. Continuidad y discontinuidades. Teorema de Bolzano. Ramas infinitas................................................................................................

11

Tema 26. Derivada de una función en un punto. Función derivada. Derivadas sucesivas. Aplicaciones................................................................................................

25

Tema 27. Desarrollo de una función en serie de potencias. Teorema de Taylor. Aplicaciones al estudio local de funciones. ............................................................

43

Tema 28. Estudio global de funciones. Aplicaciones a la representación gráfica de funciones..............................................................................................................

61

Tema 29. El problema del cálculo del área. Integral definitiva............................

83

Tema 30. Primitiva de una función. Cálculo de algunas primitivas. Aplicaciones de la integral al cálculo de magnitudes geométricas..............................................

113

Tema 31. Integración numérica. Métodos y aplicaciones. ....................................

135

Tema 32. Aplicación del estudio de funciones a la interpretación y resolución de problemas de la Economía, las Ciencias Sociales y la Naturaleza .......................

151

Tema 33. Evolución histórica del cálculo diferencial ...........................................

161

Tema 34. Análisis y formalización de los conceptos geométricos intuitivos: incidencia, paralelismo, perpendicularidad, ángulo, etc. ..............................................

175

Tema 35. Las magnitudes y su medida. Fundamentación de los conceptos relacionados con ellas. ...................................................................................................

195

Tema 36. Proporciones notables. La razón áurea. Aplicaciones...........................

203

Tema 37. La relación de semejanza en el plano. Consecuencias. Teorema de Thales. Razones trigonométricas. ............................................................................

237

Tema 38. Trigonometría plana. Resolución de triángulos. Aplicaciones. ............

253

Tema 39. Geometría del triángulo..........................................................................

277

Tema 40. Geometría de la circunferencia. Ángulos en la circunferencia. Potencia de un punto a una circunferencia. ...........................................................................

297

547

Bibliografía ..............................................................................................................

523

Tema 48. Espirales y hélices. Presencia en la Naturaleza, en el Arte y en la Técnica. Números naturales. Sistemas de numeración.................................................

Tema 41. Movimientos en el plano. Composición de movimientos. Aplicación al estudio de las teselaciones del plano. Frisos y mosaicos.......................................

323

507

Tema 47. Generación de curvas como envolventes...............................................

461

Tema 46. Distintas coordenadas para describir el plano o el espacio, ecuaciones de curvas y superficies.............................................................................................

Tema 42. Homotecia y semejanza en el plano. .....................................................

Tema 43. Proyecciones en el plano. Mapas. Planisferios terrestres: principales sistemas de representación. ......................................................................................

371

395

447

Tema 45. Poliedros. Teorema de Euler. Sólidos platónicos y arquimedianos........

417

Tema 44. Semejanza y movimientos en el espacio. ..............................................

395

Tema 43. Proyecciones en el plano. Mapas. Planisferios terrestres: principales sistemas de representación. ......................................................................................

Tema 44. Semejanza y movimientos en el espacio. .............................................. Tema 45. Poliedros. Teorema de Euler. Sólidos platónicos y arquimedianos........

Tema 46. Distintas coordenadas para describir el plano o el espacio, ecuaciones de curvas y superficies.............................................................................................

417 447

461

371

Tema 42. Homotecia y semejanza en el plano. .....................................................

323

Tema 41. Movimientos en el plano. Composición de movimientos. Aplicación al estudio de las teselaciones del plano. Frisos y mosaicos.......................................

Tema 47. Generación de curvas como envolventes...............................................

Tema 48. Espirales y hélices. Presencia en la Naturaleza, en el Arte y en la Técnica. Números naturales. Sistemas de numeración.................................................

507

523

297

Tema 40. Geometría de la circunferencia. Ángulos en la circunferencia. Potencia de un punto a una circunferencia. ...........................................................................

277

Tema 39. Geometría del triángulo..........................................................................

253

Tema 38. Trigonometría plana. Resolución de triángulos. Aplicaciones. ............

237

Tema 37. La relación de semejanza en el plano. Consecuencias. Teorema de Thales. Razones trigonométricas. ............................................................................

Bibliografía ..............................................................................................................

547

TEMA

25 Límites de funciones. Continuidad y discontinuidades. Teorema de Bolzano. Ramas infinitas

Emilio M. Pina Coronado


Volumen II. Matemáticas

12

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

LÍMITE DE UNA FUNCIÓN 2.1. Definición de límite de una función 2.2. Límites laterales 2.3. Proposición: unicidad del límite 2.4. Álgebra de límites

3.

LÍMITES INFINITOS 3.1. Ampliación de los números reales 3.2. Entornos e intervalos en R 3.3. Definición de límites infinitos

4.

FUNCIONES CONTINUAS 4.1. Definición de función continua en un punto 4.2. Función continua en un intervalo

5.

ÁLGEBRA DE FUNCIONES CONTINUAS 5.1. Continuidad de la función compuesta

6.

PROPIEDADES DE LAS FUNCIONES CONTINUAS EN UN PUNTO 6.1. Conservación del signo de la función en un entorno del punto donde es continua 6.2. Acotación de la función en un entorno del punto donde es continua

7.

TEOREMA DE BOLZANO

8.

TEOREMA DEL VALOR INTERMEDIO

9.

TEOREMA DE WEIERSTRASS

RAMAS INFINITAS. ASÍNTOTAS 13.1. Ramas infinitas de las curvas planas 13.2. Definición de rama hiperbólica 13.3. Definición de asíntotas

13.

DISCONTINUIDADES DE UNA FUNCIÓN 12.1. Definición de discontinuidad 12.2. Tipos de discontinuidades

12.

CONTINUIDAD UNIFORME

11.

CONTINUIDAD DE LA FUNCIÓN INVERSA

10.

TEOREMA DE WEIERSTRASS

9.

TEOREMA DEL VALOR INTERMEDIO

8.

TEOREMA DE BOLZANO

7.

PROPIEDADES DE LAS FUNCIONES CONTINUAS EN UN PUNTO 6.1. Conservación del signo de la función en un entorno del punto donde es continua 6.2. Acotación de la función en un entorno del punto donde es continua

6.

ÁLGEBRA DE FUNCIONES CONTINUAS 5.1. Continuidad de la función compuesta

5.

FUNCIONES CONTINUAS 4.1. Definición de función continua en un punto 4.2. Función continua en un intervalo

4.

LÍMITES INFINITOS 3.1. Ampliación de los números reales 3.2. Entornos e intervalos en R 3.3. Definición de límites infinitos

3.

LÍMITE DE UNA FUNCIÓN 2.1. Definición de límite de una función 2.2. Límites laterales 2.3. Proposición: unicidad del límite 2.4. Álgebra de límites

2.

INTRODUCCIÓN

1.

10.

CONTINUIDAD DE LA FUNCIÓN INVERSA

11.

CONTINUIDAD UNIFORME

12.

DISCONTINUIDADES DE UNA FUNCIÓN 12.1. Definición de discontinuidad 12.2. Tipos de discontinuidades

13.

RAMAS INFINITAS. ASÍNTOTAS 13.1. Ramas infinitas de las curvas planas 13.2. Definición de rama hiperbólica 13.3. Definición de asíntotas

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


12

Límites de funciones

1. INTRODUCCIÓN A la hora de abordar el tema se plantea la necesidad de justificar el orden en el que se plasman los distintos tópicos que lo componen. Aquí se ha considerado la definición de límite como previa a la de continuidad, básicamente por seguir la propuesta que se recoge en el título, pero actualmente es frecuente proceder a la inversa, teniendo en cuenta que desde un punto de vista del estudio global, el concepto de continuidad es el que realmente tiene sentido ya que el concepto de límite es de naturaleza local. No obstante, hay que tener en cuenta que ambos puntos de partida son correctos y que, dependiendo de las ocasiones, puede interesar partir de uno o de otro.

2. LÍMITE DE UNA FUNCIÓN 2.1. Definición de límite de una función Dada una función f ( x ), diremos que si cuando x tiende hacia a, la función tiende hacia l, su límite es l, lo denotaremos como lim f ( x ) = l, cuando para cada entorno de l, existe un entorno de a tal que el valor de x ®a la función en cualquier punto de ese entorno, resulta ser un punto del entorno de l. lim f ( x ) = l Û Para cada E ( l ), $ E ( a )| "x Î E ( a ) ® f ( x ) Î E ( l ) x ®a

Si atendemos a los radios de los entornos anteriores, e , d, respectivamente, se puede escribir: f ( x ) Î E ( l, e ) Û f ( x ) – l < e x Î E * (a,d ) Û 0< x – a < d con lo que podemos reformular la definición de límite: “Una función f ( x )tiende a l, su límite es l, cuando x tiende hacia a, si "e > 0, $ d > 0: f ( x ) – l < e siempre que 0< x – a < d.

+e

-e

"e > 0, $ d > 0|0 < x – a < d Þ | f ( x ) – l |< e a-d

Una función puede tener límite en un punto a y no estar definida en dicho punto. Si dos funciones coinciden en todos los puntos de un cierto entorno de a, difiriendo a lo sumo en a, entonces ambas funciones tienen el mismo límite en a.

a

a+d

Figura 1.

2.2. Límites laterales Cuando una función f ( x )tiende a l , cuando x tiende hacia a por la derecha, es decir, tomando valores mayores que a, diremos que l es el límite lateral por la derecha de f ( x ). lim f ( x ) = l Û "e > 0, $ d > 0: si x Î ( a , a + d ) Þ f ( x ) – l < e

x ®a+

es decir: "e > 0, $ d > 0: si 0 <| x – a |< d y x > a Þ | f ( x ) – l |< e "e > 0, $ d > 0: si 0 < ( x – a ) < dÞ | f ( x ) – l |< e

TEMARIO DE MATEMÁTICAS. PRUEBA A

13


14 x ®a

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA x ®a

x ®a

Análogamente podemos afirmar que cuando una función f ( x ) tiende a l, cuando x tiende hacia a por la izquierda, es decir, tomando valores menores que a, diremos que l es el límite lateral por la izquierda de f ( x ). lim( f ( x )+ g ( x )) = lim f ( x )+ lim g ( x ) = l + l '

x ®a

lim f ( x ) = l Û "e > 0, $ d > 0: si x Î ( a , a – d ) Þ f ( x ) – l < e

x ®a

Si lim f ( x ) = l y lim g ( x ) = l ', entonces:

x ®a –

Proposición 1:

Teniendo en cuenta las posibilidades que abre el valor absoluto, la condición 0<| x – a |< d que aparece en la definición de límite, equivale a las dos condiciones que caracterizan a los límites laterales tanto por la izquierda como por la derecha. 0< a – x < d 0< x – a < d æfö f (x ) , con la restricción de que g ( x )¹ 0. también se puede definir, análogamente,ç ç ÷ ÷( x ) = g g (x ) è ø

Sean las funciones f : A Ì R ® R y g : B Ì R ® R, las funciones suma, diferencia y producto de f y g son funciones definidas sobre ( A I B ) Ì R ® R y definidas como: ( f + g )( x ) = f ( x )+ g ( x )ü ï ï ï ( f – g )( x ) = f ( x ) – g ( x )ý " x Î ( A I B ) Ì R ï ï ( f × g )( x ) = f ( x )×g ( x ) ï þ

Lo que es la base para una definición de límite basado en la de límites laterales, así: el límite de una función f ( x ) en un punto a existe si y sólo si existen los límites laterales de f ( x ) en a y son iguales. lim f ( x ) = l Û lim+ f ( x ) = l = lim– f ( x ) x ®a

x ®a

x ®a

2.3. Proposición: unicidad del límite

El límite de una función f ( x ) cuando x tiende a a, si existe, es único. Para demostrarlo supongamos que no fuese único, que existiesen dos límites l y l', en consecuencia: e "e > 0, $d1 > 0: | f ( x ) – l |< ; 0 <| x – a |< d1 2

2.4. Álgebra de límites

lo que nos indica que 0 £| l – l '|£ e Þ | l – l '|= 0 Þ l = l ', luego el límite, de existir, es único. e "e > 0, $d2 > 0: | f ( x ) – l '|< ; 0 <| x – a |< d2 2

e e = | f ( x ) – l | + | f ( x ) – l '| < + = e 2 2

Tomando d = min( d1, d2 ) para 0<| x – a |< d se verifican simultáneamente las condiciones impuestas 0 <| x – a |< d1 y 0 <| x – a |< d2, y en consecuencia: | l – l '|= | l – f ( x )+ f ( x ) – l '| £ | l – f ( x )| + | f ( x ) – l '|=

Tomando d = min( d1, d2 ) para 0<| x – a |< d se verifican simultáneamente las condiciones impuestas 0 <| x – a |< d1 y 0 <| x – a |< d2, y en consecuencia: | l – l '|= | l – f ( x )+ f ( x ) – l '| £ | l – f ( x )| + | f ( x ) – l '|= e e = | f ( x ) – l | + | f ( x ) – l '| < + = e 2 2

e "e > 0, $d2 > 0: | f ( x ) – l '|< ; 0 <| x – a |< d2 2

lo que nos indica que 0 £| l – l '|£ e Þ | l – l '|= 0 Þ l = l ', luego el límite, de existir, es único. El límite de una función f ( x ) cuando x tiende a a, si existe, es único. Para demostrarlo supongamos que no fuese único, que existiesen dos límites l y l', en consecuencia: e "e > 0, $d1 > 0: | f ( x ) – l |< ; 0 <| x – a |< d1 2

2.4. Álgebra de límites

Sean las funciones f : A Ì R ® R y g : B Ì R ® R, las funciones suma, diferencia y producto de f y g son funciones definidas sobre ( A I B ) Ì R ® R y definidas como: ( f + g )( x ) = f ( x )+ g ( x )ü ï ï ï ( f – g )( x ) = f ( x ) – g ( x )ý " x Î ( A I B ) Ì R ï ï ( f × g )( x ) = f ( x )×g ( x ) ï þ

2.3. Proposición: unicidad del límite

x ®a

x ®a

x ®a

Lo que es la base para una definición de límite basado en la de límites laterales, así: el límite de una función f ( x ) en un punto a existe si y sólo si existen los límites laterales de f ( x ) en a y son iguales. lim f ( x ) = l Û lim+ f ( x ) = l = lim– f ( x ) æ ö çf÷ ÷( x ) = f ( x ), con la restricción de que g ( x )¹ 0. también se puede definir, análogamente,ç g (x ) èg ø

Teniendo en cuenta las posibilidades que abre el valor absoluto, la condición 0<| x – a |< d que aparece en la definición de límite, equivale a las dos condiciones que caracterizan a los límites laterales tanto por la izquierda como por la derecha. 0< a – x < d 0< x – a < d Proposición 1:

x ®a –

Si lim f ( x ) = l y lim g ( x ) = l ', entonces: x ®a

lim f ( x ) = l Û "e > 0, $ d > 0: si x Î ( a , a – d ) Þ f ( x ) – l < e x ®a

Análogamente podemos afirmar que cuando una función f ( x ) tiende a l, cuando x tiende hacia a por la izquierda, es decir, tomando valores menores que a, diremos que l es el límite lateral por la izquierda de f ( x ). lim( f ( x )+ g ( x )) = lim f ( x )+ lim g ( x ) = l + l ' x ®a

x ®a

14

x ®a



Límites de funciones Demostrémoslo: ì e ï | f ( x ) – l | < , 0 <| x – a | < d1 2 ï "e > 0, $ d1, d2 > 0 Þ í ï e | g ( x ) – l '| < , 0 <| x – a | < d2 ï î 2 Como hemos hecho anteriormente, si tomamos d = min( d1, d2 ) para 0<| x – a |< d se verifican simultáneamente las condiciones impuestas 0 <| x – a |< d1 y 0 <| x – a |< d2, y en consecuencia: e e ( f + g )( x ) – ( l + l ' ) = f ( x )+ g ( x ) – l – l ' £ f ( x ) – l + g ( x ) – l ' < + = e 2 2 y en consecuencia: lim( f ( x )+ g ( x )) = lim f ( x )+ lim g ( x ) = l + l ' x ®a

x ®a

x ®a

Proposición 2: Si lim f ( x ) = l y lim g ( x ) = l ', entonces: x ®a

x ®a

lim( f ( x ) – g ( x )) = lim f ( x ) – lim g ( x ) = l – l ' x ®a

x ®a

x ®a

La demostración es análoga a la desarrollada en la Proposición 1. Proposición 3: Si lim f ( x ) = l y lim g ( x ) = l ', entonces: x ®a

x ®a

lim( f ( x )× g ( x )) = lim f ( x )× lim g ( x ) = l × l ' x ®a

x ®a

x ®a

Demostrémoslo:

–

Caso A. Uno de los límites es cero, por ejemplo lim g ( x ) = 0, entonces: x ®a

lim( f ( x )× g ( x )) = lim f ( x )× lim g ( x ) = l × 0 = 0 x ®a

x ®a

x ®a

Como lim f ( x ) = l , $d1 > 0: | f ( x ) – l | < 1, 0 < | x – a | < d1 en consecuencia: x ®a

| f ( x )| = | f ( x ) – l + l | £ | f ( x ) – l | + | l | < 1+ | l | luego | f ( x )× g ( x )|= f ( x ) × g ( x ) < (1+ l )× g ( x ) = 0

–

Caso B. General. f ( x )× g ( x ) = f ( x )( g ( x ) – l ') + l '( f ( x ) – l) + l × l ' Los dos primeros términos tienden a cero, con lo que el segundo término tiende a l × l '

Proposición 4: Si lim f ( x ) = l y lim g ( x ) = l ', siendo g ( x )¹ 0, y lim g ( x ) ¹ 0 entonces: x ®a

x ®a

x ®a

f (x ) l æf ö lim = x ®a = limç ( x )÷ ç ÷ x ®aè g ø lim g ( x ) l ' x ®a


15


CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA i

åb x

j

j

j=0

åa a

i

åb a

j

Demostrémoslo:

16

j=0

åa x

j

l' Como lim g ( x ) = l '¹ 0,$d1 > 0|0 < x – a < d1 Þ g ( x ) – l ' < , entonces tenemos que x ®a 2 x ®a

lim

i=0 m

=

i

i=0 m

i

n

n

l ' = l '– g ( x )+ g ( x ) £ l '– g ( x ) + g ( x ) <

l' l' + g (x ) Û g (x ) > 2 2

8.

Análogamente se puede calcular el límite de una función racional de denominador no nulo. e 2

x ®a

lim( c0 + c1x+...+cnxn ) = c0 + c1a+...+cna n

Por otro lado "e > 0, $d2 > 0|0 < x – a < d2 Þ g ( x ) – l ' < l '2×

6.

Como el límite de una constante es igual a esa constante y el límite de un producto es igual al producto de los límites, se verifica que lim c× xn = c × a n, siendo c una constante "a , c Î R, "n Î N .

7.

Apoyándonos en las notas 5 y 6 podemos calcular el límite de una función polinómica:

Recurrimos, una vez más, a tomar d = min( d1, d2 ) para 0<| x – a |< d se verifican simultáneamente las e l' y g ( x ) – l ' < l '2× , 2 2 x ®a

condiciones impuestas 0 <| x – a |< d1 y 0 <| x – a |< d2, y en consecuencia g ( x ) > x ®a

luego:

x ®a

lim xn = lim xn–1× x = a n–1× a = a n

2 e æ ö ( x ) – l' l' × 2 g ç 1÷ ÷( x ) – l = 1 – l = < 2 =e ç l' g ( x ) l' l' × g ( x ) èg ø

2.

Si existe el límite de una de las funciones sumando pero no de la otra, no existe el límite de la suma.

3.

Puede existir lim( f × g )( x ) aunque no existan los lim f ( x ), lim g ( x ).

4.

Puede existir lim( f × g )( x ) aunque no exista el límite de una de las funciones factores.

5.

Por inducción lim xn = a n, "n Î N . x ®a Así, siendo cierto para n = 1, lo suponemos cierto para n – 1y lo probaremos para n: m 2

x ®a

æ ö ç 1÷ ÷( x ) = l , y como lim f ( x ) = l, con lo que apoyándonos en las proposiciones anterioAsí pues: limç x ®aè g ø x ®a l' res podemos escribir: x ®a

x ®a

x ®a

x ®a

x ®a

x ®a

Puede existir lim( f + g )( x ) aunque no existan los lim f ( x ), lim g ( x ). æ ö æ ö ç f × 1÷ ÷( x ) = l × 1 = l çf÷ ÷( x ) = limç limç x ®aè g ø x ®aè gø l' l'

1.

Notas sobre el álgebra de límites.

æ 1ö æfö 1 l ÷ limç ( x ) = limç ç f× ÷ ÷( x ) = l × = ç ÷ x ®aè g ø x ®aè gø l' l'

Notas sobre el álgebra de límites. 1.

Puede existir lim( f + g )( x ) aunque no existan los lim f ( x ), lim g ( x ). x ®a

x ®a

x ®a

æ 1ö l Así pues: limç f ( x ) = l, con lo que apoyándonos en las proposiciones anterioç ÷ ÷( x ) = , y como lim x ®aè g ø x ®a l' res podemos escribir: Puede existir lim( f × g )( x ) aunque no existan los lim f ( x ), lim g ( x ).

3.

Si existe el límite de una de las funciones sumando pero no de la otra, no existe el límite de la suma.

2.

4.

x ®a

x ®a

x ®a

Puede existir lim( f × g )( x ) aunque no exista el límite de una de las funciones factores.

Recurrimos, una vez más, a tomar d = min( d1, d2 ) para 0<| x – a |< d se verifican simultáneamente las e l' condiciones impuestas 0 <| x – a |< d1 y 0 <| x – a |< d2, y en consecuencia g ( x ) > y g ( x ) – l ' < l '2× , 2 2 luego: 2 e æ 1ö g ( x ) – l' l' × 2 l l 1 ç – = < 2 =e ç ÷ ÷( x ) – = l' g ( x ) l' l' × g ( x ) èg ø m 2 5.

x ®a

Por inducción lim xn = a n, "n Î N . x ®a Así, siendo cierto para n = 1, lo suponemos cierto para n – 1y lo probaremos para n: lim xn = lim xn–1× x = a n–1× a = a n x ®a

6.

x ®a

Como el límite de una constante es igual a esa constante y el límite de un producto es igual al producto de los límites, se verifica que lim c× xn = c × a n, siendo c una constante "a , c Î R, "n Î N . x ®a

7.

Apoyándonos en las notas 5 y 6 podemos calcular el límite de una función polinómica:

Por otro lado "e > 0, $d2 > 0|0 < x – a < d2 Þ g ( x ) – l ' < l '2×

e 2

lim( c0 + c1x+...+cnxn ) = c0 + c1a+...+cna n x ®a

Análogamente se puede calcular el límite de una función racional de denominador no nulo. l' l' + g (x ) Û g (x ) > 2 2

8.

l ' = l '– g ( x )+ g ( x ) £ l '– g ( x ) + g ( x ) < n

åa x

n

i

i

åa a

i

i

l' Como lim g ( x ) = l '¹ 0,$d1 > 0|0 < x – a < d1 Þ g ( x ) – l ' < , entonces tenemos que x ®a 2 lim x ®a

i=0 m

åb x

=

j

j

i=0 m

åb a

j

j

j=0

16

j=0

Demostrémoslo:




3. LÍMITES INFINITOS 3.1. Ampliación de los números reales Definimos la ampliación como R = R U{– ¥+¥ , }, y se le denomina sistema ampliado de los números reales, y la ordenación en R vendría dada por –¥< x <+¥, "x Î R, y en consecuencia dados x, y Î R ® x < y en R, si y sólo si x < y en R. La suma en R es una extensión de la suma en R. x+ (+¥ ) = (+¥ )+ x = +¥, "x Î R , x ¹ – ¥ x+ (– ¥ ) = (– ¥ )+ x = – ¥, "x Î R , x ¹ +¥ con lo que quedan sin definir las expresiones (+¥ )+ (– ¥ ) y (– ¥ )+ (+¥ ). En cuanto a la diferencia en R tenemos: x – (+¥ ) = x – ¥= – ¥, "x ¹ +¥ (+¥ ) – x = +¥, "x ¹ +¥ x – (– ¥ ) = x +¥= ¥, "x ¹ – ¥ (– ¥ ) – x = – ¥, "x ¹ +¥ quedando sin definir las expresiones (+¥ ) – (+¥ ) y (– ¥ ) – (– ¥ ). La extensión del producto en R vendría dada por: x× (+¥ ) = (+¥ )× x = +¥ü ï ý "x Î R > 0 ï x× (– ¥ ) = (– ¥ )× x = – ¥þ x × (+¥ ) = (+¥ )× x = – ¥ ü ï ý "x Î R < 0 ï x × (– ¥ ) = (– ¥ )× x = +¥þ quedan sin definir las expresiones 0× (+¥ ), (+¥ )×0, (– ¥ )×0 y 0× (– ¥ ). La extensión del cociente en R requiere previamente la definición de (+¥ )–1 = (– ¥ )–1 = 0 y así: x x = = 0, "x Î R (+¥ ) (– ¥ ) ü (+¥ ) = +¥ï x ï ý "x Î R > 0 ï (– ¥ ) = – ¥ï þ x ü (+¥ ) = – ¥ï x ï ý "x Î R < 0 ï (– ¥ ) = ¥ï þ x quedan sin definir las expresiones

+¥ +¥ – ¥ –¥ , , y +¥ – ¥ – ¥ +¥


17


18


y, evidentemente, una función será continua en un punto cuando sea continua en dicho punto por la izquierda y por la derecha.

3.2. Entornos e intervalos en R

Además de los usuales en R, en R definimos los siguientes:

x ®a

Por la derecha Û lim+ f ( x ) = f ( a )

E (– ¥ ) = (– ¥, a ) = {x, a Î R | x < a}

–

E (+¥ ) = ( a ,+¥ ) = {x, a Î R | x > a}

–

x ®a

Por la izquierda Û lim– f ( x ) = f ( a )

(– ¥, a ] = {x, a Î R | x £ a}

Podemos hablar de continuidad lateral:

[ a ,+¥ ) = {x, a Î R | x ³ a} " e > 0, $ d > 0: f ( x ) – f ( a ) < e , x – a < d

3.3. Definición de límites infinitos

Una función es continua en un punto a cuando existe lim f ( x ) = f ( a ). x ®a También podemos escribir:

Utilizando la definición de límite que se plantea en el punto 2.1. sólo habrá que contemplar en su extensión a R las particularidades que arrojan cada una de las definiciones de entorno en R antes expuestas. Así la expresión lim f ( x ) = "e > 0, $ d > 0|0 < x – a < d Þ f ( x ) – l < e admite las siguientes variaciones:

4.1. Definición de función continua en un punto

x ®a

4. FUNCIONES CONTINUAS

–

lim f ( x ) =+¥ Û " r Î R , $ d > 0|0 < x – a < d Þ f ( x ) > r

–

lim f ( x ) = – ¥ Û " r Î R , $ d > 0|0 < x – a < d Þ f ( x ) < r

x ®– ¥

lim f ( x ) = l Û "e > 0, $ s Î R , s > 0| x > s Þ f ( x ) – l < e

x ®– ¥

lim f ( x ) = l Û "e > 0, $ s Î R , s > 0| x < s Þ f ( x ) – l < e

x ®+¥

lim f ( x ) = +¥ Û "r Î R , $ s Î R | x > s Þ f ( x ) > r

x ®+¥

lim f ( x ) = – ¥ Û "r Î R , $ s Î R | x > s Þ f ( x ) < r

x ®– ¥

lim f ( x ) = +¥ Û "r Î R , $ s Î R | x < s Þ f ( x ) > r

x ®+¥

lim f ( x ) = – ¥ Û "r Î R , $ s Î R | x < s Þ f ( x ) < r

x ®a

lim f ( x ) = – ¥ Û " r Î R , $ d > 0|0 < x – a < d Þ f ( x ) < r x ®a

lim f ( x ) =+¥ Û " r Î R , $ d > 0|0 < x – a < d Þ f ( x ) > r

4. FUNCIONES CONTINUAS

–

lim f ( x ) = l Û "e > 0, $ s Î R , s > 0| x > s Þ f ( x ) – l < e

x ®– ¥

–

lim f ( x ) = l Û "e > 0, $ s Î R , s > 0| x < s Þ f ( x ) – l < e

x ®– ¥

–

lim f ( x ) = +¥ Û "r Î R , $ s Î R | x > s Þ f ( x ) > r

x ®+¥

–

x ®+¥

–

lim f ( x ) = – ¥ Û "r Î R , $ s Î R | x > s Þ f ( x ) < r

–

x ®– ¥

–

–

lim f ( x ) = +¥ Û "r Î R , $ s Î R | x < s Þ f ( x ) > r

–

x ®+¥

–

–

lim f ( x ) = – ¥ Û "r Î R , $ s Î R | x < s Þ f ( x ) < r

–

x ®a

–

–

x ®a

x ®a

Utilizando la definición de límite que se plantea en el punto 2.1. sólo habrá que contemplar en su extensión a R las particularidades que arrojan cada una de las definiciones de entorno en R antes expuestas. Así la expresión lim f ( x ) = "e > 0, $ d > 0|0 < x – a < d Þ f ( x ) – l < e admite las siguientes variaciones:

4.1. Definición de función continua en un punto

Una función es continua en un punto a cuando existe lim f ( x ) = f ( a ). x ®a También podemos escribir:

3.3. Definición de límites infinitos

" e > 0, $ d > 0: f ( x ) – f ( a ) < e , x – a < d [ a ,+¥ ) = {x, a Î R | x ³ a} Podemos hablar de continuidad lateral:

(– ¥, a ] = {x, a Î R | x £ a}

E (+¥ ) = ( a ,+¥ ) = {x, a Î R | x > a}

–

Por la izquierda Û lim– f ( x ) = f ( a )

–

Por la derecha Û lim+ f ( x ) = f ( a )

x ®a

E (– ¥ ) = (– ¥, a ) = {x, a Î R | x < a} Además de los usuales en R, en R definimos los siguientes:

x ®a

y, evidentemente, una función será continua en un punto cuando sea continua en dicho punto por la izquierda y por la derecha.

3.2. Entornos e intervalos en R



18


4.2. Función continua en un intervalo Sea un intervalo abierto ( a , b ) diremos que una función es continua en ese intervalo cuando lo es en todo punto del mismo. Si se trata de un intervalo cerrado [ a , b ] diremos que la función es continua en él cuando es continua en ( a , b ) y continua por la derecha de a y continua por la izquierda de b. Al tratar con intervalos semiabiertos ( a , b ], [ a , b ) requeriremos en ambos casos que sea continua en ( a , b ) y, en el primer caso continua por la izquierda en b, y en el segundo caso continua por la derecha en a.

5. ÁLGEBRA DE FUNCIONES CONTINUAS Sean f ( x ), g ( x ) dos funciones continuas en a. Las funciones f + g , f – g , f × g son también continuas en a, y si, además g ( a )¹ 0, entonces la función f / g es continua en a. Demostrémoslo: ìlim f ( x ) = f ( a ) Como f ( x ), g ( x ) son dos funciones continuas en a í x ®a g (x )= g (a ) î lim x ®a

–

Suma:

lim( f + g )( x ) = lim( f ( x )+ g ( x )) = f ( a )+ g ( a ) = ( f + g )( a )

–

Diferencia:

lim( f – g )( x ) = lim( f ( x ) – g ( x )) = f ( a ) – g ( a ) = ( f – g )( a )

–

Producto:

lim( f × g )( x ) = lim( f ( x )× g ( x )) = f ( a )× g ( a ) = ( f × g )( a )

–

Cociente (Con la restricción antes mencionada g ( a )¹ 0):

x ®a

x ®a

x ®a

x ®a

x ®a

x ®a

æfö f (x ) f (a ) æ fö ÷ ÷ = =ç limç ( x ) = lim ç ÷( a ) ç ÷ x ®aè g ø x ®a g ( x ) g (a ) è g ø Como consecuencia de lo anterior se puede extender el razonamiento a n funciones continuas, n

fi , i = 1,..., n, pudiendo plantear que å fi es también una función continua. i=1

n

Análogamente para el producto, obteniéndose que Õ fi es también una función continua. i=1

Si consideramos la función continua f ( x ) = x, "x Î R, entonces la función f ( x ) = xn , n Î N es también continua "x Î R. Consecuencia de lo anteriormente presentado, una función polinómica es continua, al igual que una expresión racional en la que el denominador no sea nulo.

5.1. Continuidad de la función compuesta Sea la función f ( x ) una función continua en a, y sea g ( x ) una función continua en f ( a ), su función compuesta g o f es continua en a. Demostrémoslo: Si es cierto lo que afirmamos, habrá de cumplirse que: " e > 0, $d > 0: x – a < d Þ g ( f ( x )) – g ( f ( a )) < e TEMARIO DE MATEMÁTICAS. PRUEBA A

19


20


f ( a ) – 1< f ( x ) < f ( a )+ 1 lo que nos indica que f ( x ), "x Î R : x – a < d es un conjunto acotado inferiormente por f ( a ) – 1 y superiormente por f ( a )+1. Al ser g ( x ) una función continua en f ( a ),

$d1 > 0: f ( x ) – f ( a ) < d1 Þ g ( f ( x )) – g ( f ( a )) < e

y como la función f ( x ) una función continua en a

" e = 1> 0, $ d > 0: f ( x ) – f ( a ) < 1, x – a < d

"d1 > 0, $d > 0: x – a < d Þ f ( x ) – f ( a ) < e

Demostrémoslo: Tomo para e el valor 1, con lo que la expresión de la continuidad quedaría como:

luego, en consecuencia, g ( f ( x )) – g ( f ( a )) < e siempre que x – a < d. Figura 2.

6. PROPIEDADES DE LAS FUNCIONES CONTINUAS EN UN PUNTO 6.1. Conservación del signo de la función en un entorno del punto donde es continua a

c

b

Sea una función f ( x ) no nula, continua en un punto a, existe un entorno simétrico de a en el que la función tiene el mismo signo que f ( a ). Demostrémoslo:

–

Si f ( a ) > 0

Existe un entorno del punto a, donde los valores que toma la función forman un conjunto acotado, es decir, la función está acotada en un entorno de a. Como la función es continua " e > 0, $ d > 0: f ( x ) – f ( a ) < e , x – a < d si tomamos e =

f (a ) , 2

6.2. Acotación de la función en un entorno del punto donde es continua Una demostración análoga si consideramos que f ( a ) < 0.

la expresión del valor absoluto podemos considerarla como: f ( a ) – e < f ( x ) < f ( a )+ e f (a ) f (a ) f (a ) – < f ( x ) < f ( a )+ 2 2 3 f (a ) f (a ) < f (x )< 2 2 y, en consecuencia, f ( x ) y f ( a ) tienen el mismo signo "x Î R : x – a < d

–

–

la expresión del valor absoluto podemos considerarla como: f ( a ) – e < f ( x ) < f ( a )+ e f (a ) f (a ) f (a ) – < f ( x ) < f ( a )+ 2 2 3 f (a ) f (a ) < f (x )< 2 2 y, en consecuencia, f ( x ) y f ( a ) tienen el mismo signo "x Î R : x – a < d Una demostración análoga si consideramos que f ( a ) < 0.

6.2. Acotación de la función en un entorno del punto donde es continua Como la función es continua " e > 0, $ d > 0: f ( x ) – f ( a ) < e , x – a < d si tomamos e =

f (a ) , 2

Existe un entorno del punto a, donde los valores que toma la función forman un conjunto acotado, es decir, la función está acotada en un entorno de a.

–

Si f ( a ) > 0

Demostrémoslo: Sea una función f ( x ) no nula, continua en un punto a, existe un entorno simétrico de a en el que la función tiene el mismo signo que f ( a ). c

b

6. PROPIEDADES DE LAS FUNCIONES CONTINUAS EN UN PUNTO 6.1. Conservación del signo de la función en un entorno del punto donde es continua a

Figura 2. luego, en consecuencia, g ( f ( x )) – g ( f ( a )) < e siempre que x – a < d.

Demostrémoslo: Tomo para e el valor 1, con lo que la expresión de la continuidad quedaría como: "d1 > 0, $d > 0: x – a < d Þ f ( x ) – f ( a ) < e

" e = 1> 0, $ d > 0: f ( x ) – f ( a ) < 1, x – a < d

y como la función f ( x ) una función continua en a

f ( a ) – 1< f ( x ) < f ( a )+ 1 lo que nos indica que f ( x ), "x Î R : x – a < d es un conjunto acotado inferiormente por f ( a ) – 1 y superiormente por f ( a )+1. $d1 > 0: f ( x ) – f ( a ) < d1 Þ g ( f ( x )) – g ( f ( a )) < e

Al ser g ( x ) una función continua en f ( a ),



20


7. TEOREMA DE BOLZANO Sea f ( x ) una función continua en un intervalo cerrado [ a , b ] que toma valores de distinto signo en los extremos de dicho intervalo, entonces existe algún punto c Î ( a , b ) en el que f ( c )= 0. Demostración: Vamos a demostrarlo considerando que f ( a )> 0 y que f ( b )< 0, aunque la demostración sería análoga si consideramos negativo el valor en el primer extremo y positivo en el segundo. æ a+ b ö ÷= 0, ya que el punto que buscamos sería el Una solución trivial nos la daría el caso en el que fç è 2 ø æ a+ b ö ÷¹ 0, tomando los extremos del intervapunto medio del intervalo, pero si consideramos que fç è 2 ø lo en el que la función tiene signo opuesto formaremos un nuevo intervalo en el que el nuevo punto a+ b a+ 2 y si el valor de la función en ese punto es cero, quedaría el teorema medio vendría dado por 2 demostrado, pero de no anularse reiteraríamos el proceso teniendo siempre en cuenta a la hora de definir los nuevos intervalos que en sus extremos la función debe tener signo contrario. En el momento en que encontremos un punto en el cual la función dé como valor cero el teorema queda demostrado. Pero si en la incrustación sucesiva de intervalos no encontramos ningún punto medio en el que la función valga cero, podemos presumir que existirá un cierto punto común a todos los intervalos en el que la función valga cero, ya que de tener un valor distinto de cero la función tendría, por ejemplo, signo positivo en un entorno de dicho punto según el teorema del signo, y esto está en contradicción con el criterio seguido en la construcción de los intervalos. Análogamente si el signo lo tomamos como negativo, luego, en consecuencia, el único valor posible para la función en ese punto será cero.

8. TEOREMA DEL VALOR INTERMEDIO Sea f ( x ) una función continua en un intervalo abierto ( a , b ), y sea un cierto valor c tal que f ( a )< c < < f ( b ) (análogamente si consideramos f ( a ) > c > f ( b )), entonces existe un cierto x Î ( a , b ) tal que f ( x )= c. Demostrémoslo: Suponemos que f ( a ) < c < f ( b ), y definimos la función g ( x ) = f ( x ) – c que es continua en [ a , b ], ya que es la diferencia de funciones continuas, estudiándola en los extremos del intervalo tenemos: g ( a ) = f ( a ) – c < 0ü ý g ( b ) = f ( b ) – c > 0þ con lo que nos encontramos con que se satisfacen las condiciones requeridas por el teorema de Bolzano y, en consecuencia $ x Î ( a , b )| g ( x ) = 0 g (x )= 0 Û 0= f (x ) – c Þ f (x )= c Proposición: Como consecuencia de la definición de función continua y acotación en un punto, podemos afirmar que toda función continua en un intervalo cerrado [ a , b ] está acotada en [ a , b ]. Demostración: Al ser f ( x ) continua en [ a , b ], lo es en todo punto x0 de ( a , b ), y en consecuencia: f ( x ) – f ( x0 ) < e Û f ( x0 ) – e < f ( x ) < f ( x0 )+ e luego f ( x ) está acotada y, en consecuencia, tendrá supremo e ínfimo. TEMARIO DE MATEMÁTICAS. PRUEBA A

21


22


aunque resulta evidente que una función uniformemente continua en I es continua en I, por lo general el recíproco no es cierto.

9. TEOREMA DE WEIERSTRASS

Sea f ( x )una función continua en un intervalo cerrado [ a , b ], entonces f ( x )está acotada en [ a , b ] y en consecuencia tendrá un máximo y un mínimo en [ a , b ], es decir, existen puntos c, d Î [ a , b ] tales que: " e > 0, $ d > 0 | " x, y Î I , x – y < d Þ f ( x ) – f ( y ) < e f ( c ) = Sup{ f ( x )| x Î [ a , b ]}

Una función se dice que es uniformemente continua en un intervalo I cuando:

11. CONTINUIDAD UNIFORME

f ( d ) = Inf { f ( x )| x Î [ a , b ]}

Demostrémoslo: Supongamos que f ( x ) es una función continua y creciente en un cierto intervalo I, y sean y1, y2 Î f ( I ), y1 < y2 y supongamos que x1 = f –1( y1 ), x2 = f –1( y2 ), entonces y1 = f ( x1 ), y2 = f ( x2 ). Al ser f ( x ) creciente y f ( x1 ) < f ( x2 ) Þ x1 < x2, y en consecuencia f –1( y1 ) < f –1( y2 ) Þ f –1( x ) es creciente en f ( I ). Demostrémoslo:

Si llamamos S = Sup{ f ( x )| x Î [ a , b ]}, y suponemos que no existe ningún punto del intervalo que satis1 face que f ( x )= S , entonces S – f ( x ) > 0, " x Î [ a , b ] y podemos definir la función g ( x ) = S – f (x ) que es continua por ser el cociente de funciones continuas y ser el denominador no nulo y también estará acotada en [ a , b ], por lo que existirá un cierto k > 0 tal que g ( x ) < k , " x Î [ a , b ]

Sea f ( x ) una función continua creciente (o decreciente) en un cierto intervalo I, entonces, su función inversa f –1( x ) es también continua y creciente (o decreciente) en el intervalo f ( I ). g (x )< k Þ

1 1 1 < k Þ S – f (x )> Þ f (x )< S – S – f (x ) k k

10. CONTINUIDAD DE LA FUNCIÓN INVERSA

1 y, en consecuencia, S – es una cota superior de f ( x ), que es menor que el supremo de dicho conk junto que al ser, por definición, la menor de las cotas superiores resulta imposible, luego es necesaria la existencia de un cierto c Î [ a , b ] tal que f ( c )= S . La demostración para el mínimo es análoga a la anterior. Puede demostrarse por reducción al caso del máximo antes expuesto, si consideramos la función – f que es continua en [ a , b ], y que tendrá un máximo d Î [ a , b ] que, en realidad, se trata del mínimo que estamos buscando. f ( d ) = Inf { f ( x )| x Î [ a , b ]}

Inf { f ( x )| x Î [ a , b ]}= Sup{– f ( x )| x Î [ a , b ]} – f ( d ) = Sup{– f ( x )| x Î [ a , b ]}

– f ( d ) = Sup{– f ( x )| x Î [ a , b ]}

1 es una cota superior de f ( x ), que es menor que el supremo de dicho conk junto que al ser, por definición, la menor de las cotas superiores resulta imposible, luego es necesaria la existencia de un cierto c Î [ a , b ] tal que f ( c )= S . La demostración para el mínimo es análoga a la anterior. Puede demostrarse por reducción al caso del máximo antes expuesto, si consideramos la función – f que es continua en [ a , b ], y que tendrá un máximo d Î [ a , b ] que, en realidad, se trata del mínimo que estamos buscando. Inf { f ( x )| x Î [ a , b ]}= Sup{– f ( x )| x Î [ a , b ]} f ( d ) = Inf { f ( x )| x Î [ a , b ]}

y, en consecuencia, S –

10. CONTINUIDAD DE LA FUNCIÓN INVERSA

g (x )< k Þ

1 1 1 < k Þ S – f (x )> Þ f (x )< S – S – f (x ) k k

Sea f ( x ) una función continua creciente (o decreciente) en un cierto intervalo I, entonces, su función inversa f –1( x ) es también continua y creciente (o decreciente) en el intervalo f ( I ).

Si llamamos S = Sup{ f ( x )| x Î [ a , b ]}, y suponemos que no existe ningún punto del intervalo que satis1 face que f ( x )= S , entonces S – f ( x ) > 0, " x Î [ a , b ] y podemos definir la función g ( x ) = S – f (x ) que es continua por ser el cociente de funciones continuas y ser el denominador no nulo y también estará acotada en [ a , b ], por lo que existirá un cierto k > 0 tal que g ( x ) < k , " x Î [ a , b ]

Demostrémoslo: Supongamos que f ( x ) es una función continua y creciente en un cierto intervalo I, y sean y1, y2 Î f ( I ), y1 < y2 y supongamos que x1 = f –1( y1 ), x2 = f –1( y2 ), entonces y1 = f ( x1 ), y2 = f ( x2 ). Al ser f ( x ) creciente y f ( x1 ) < f ( x2 ) Þ x1 < x2, y en consecuencia f –1( y1 ) < f –1( y2 ) Þ f –1( x ) es creciente en f ( I ). Demostrémoslo:

f ( d ) = Inf { f ( x )| x Î [ a , b ]}

11. CONTINUIDAD UNIFORME

f ( c ) = Sup{ f ( x )| x Î [ a , b ]}

Una función se dice que es uniformemente continua en un intervalo I cuando: Sea f ( x )una función continua en un intervalo cerrado [ a , b ], entonces f ( x )está acotada en [ a , b ] y en consecuencia tendrá un máximo y un mínimo en [ a , b ], es decir, existen puntos c, d Î [ a , b ] tales que: " e > 0, $ d > 0 | " x, y Î I , x – y < d Þ f ( x ) – f ( y ) < e

aunque resulta evidente que una función uniformemente continua en I es continua en I, por lo general el recíproco no es cierto.

9. TEOREMA DE WEIERSTRASS

22




12. DISCONTINUIDADES DE UNA FUNCIÓN 12.1. Definición de discontinuidad Una función f ( x ) decimos que es discontinua en un punto a, que presenta una discontinuidad en a, cuando f ( x ) no es continua en a.

12.2. Tipos de discontinuidades –

Discontinuidad evitable: No existe f ( a ), pero si existe lim f ( x ).

–

Discontinuidad de primera especie: Pese a existir f ( a ) y existir lim f ( x ), no se cumple que lim f ( x ) = f ( a ).

–

Discontinuidad de segunda especie con salto finito: Pese a existir lim– f ( x ) y lim+ f ( x ), no se cumple que lim– f ( x ) = lim+ f ( x ).

–

Discontinuidad de segunda especie con salto infinito: lim f ( x ) = ±¥ü ï x ®a – ï ý ï lim f ( x ) = ±¥ï þ x ®a+

x ®a

x ®a

x ®a

x ®a

x ®a

x ®a

x ®a

13. RAMAS INFINITAS. ASÍNTOTAS 13.1. Ramas infinitas de las curvas planas Sea f ( x ) una función continua en un intervalo abierto en el que uno de los extremos es a, y tomamos por convenio f ( x )= y, decimos que un punto P ( x, y ) describe una rama infinita de una curva de ecuación y = f ( x ) cuando x ® a+ (o también x ® a – ) si OP ® +¥.

O'

a

Î

Figura 3.

Î Î´

c irec A (D

P

ión)

O

a puede ser un valor finito,+¥, –¥; O es un punto cualquiera, y el resultado OP ® +¥ es independiente de la elección del punto O. Demostrémoslo: Atendiendo a las relaciones entre los lados del triángulo OO ' P podemos escribir: OP – OO ' £ O ' P £ OP + OO ' Por lo tanto O ' P ® ¥ Û OP ® ¥. TEMARIO DE MATEMÁTICAS. PRUEBA A

23


24


13.2. Definición de rama hiperbólica Una rama infinita de una curva es hiperbólica si admite una $ tiende dirección asintótica OA, cuando el ángulo agudo e = AOP a cero si x ® a.

Si la distancia PM de un punto de la curva a una dirección asintótica LM tiende a infinito decimos que esa rama es parabólica. O'

Î Î´

a

P

Proposición: La dirección asintótica es independiente del puntoO elegido.

Si una rama de curva tiene una dirección asintótica, LM , y la distancia PM tiende a un límite finito, d, la curva tiene una asíntota paralela a LM a la distancia d.

2.

Si la curva no tiene dirección asintótica, tampoco tendrá asíntota.

1.

Demostración:

) ción irec

Al ser r una asíntota de la curva, la dirección de la recta es una dirección asintótica para la curva y de esto se deducen los siguientes corolarios: Î

A (D

Sea PB ||OA, y teniendo en cuenta que por ser ángulos alter$ = OPB $ nos internos e = AOP $ $ ' e '= O ' PB a = OPO

O

Figura 5.

L

Figura 4.

d

M

e – a £ e '< e + a O

P

Aplicando el teorema del seno en el triángulo OPO' tenemos: sen a sen O$ ' OO 'sen O$ ' OO ' = Þ sen a = £ OO ' OP OP OP Q

r

C

en consecuencia, si OP ® +¥ Þ sen a ® 0 y e '® e Þ e ® 0 Una recta r es una asíntota de una curva C cuando la distancia desde un cierto punto P de la curva a la recta r (d ( P , r )= PQ) tiende a cero cuando P describe una rama infinita de la curva.

13.3. Definición de asíntotas

13.3. Definición de asíntotas

Una recta r es una asíntota de una curva C cuando la distancia desde un cierto punto P de la curva a la recta r (d ( P , r )= PQ) tiende a cero cuando P describe una rama infinita de la curva. en consecuencia, si OP ® +¥ Þ sen a ® 0 y e '® e Þ e ® 0 r

sen a sen O$ ' OO 'sen O$ ' OO ' = Þ sen a = £ OO ' OP OP OP C

Q

Aplicando el teorema del seno en el triángulo OPO' tenemos: P

O

e – a £ e '< e + a M

Figura 4.

L

Figura 5. O

d

$ e '= O ' PB

$ ' a = OPO

Sea PB ||OA, y teniendo en cuenta que por ser ángulos alter$ = OPB $ nos internos e = AOP

A (D

Al ser r una asíntota de la curva, la dirección de la recta es una dirección asintótica para la curva y de esto se deducen los siguientes corolarios: ) ción irec

Î

Demostración:

1.

Si la curva no tiene dirección asintótica, tampoco tendrá asíntota.

2.

Si una rama de curva tiene una dirección asintótica, LM , y la distancia PM tiende a un límite finito, d, la curva tiene una asíntota paralela a LM a la distancia d. a

La dirección asintótica es independiente del puntoO elegido.

Î Î´

Proposición: P

Si la distancia PM de un punto de la curva a una dirección asintótica LM tiende a infinito decimos que esa rama es parabólica. O'

Una rama infinita de una curva es hiperbólica si admite una $ tiende dirección asintótica OA, cuando el ángulo agudo e = AOP a cero si x ® a.

13.2. Definición de rama hiperbólica CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


24

TEMA

26 Derivada de una función en un punto. Función derivada. Derivadas sucesivas. Aplicaciones




26



INTRODUCCIÓN

2.

CONCEPTO DE DERIVADA 2.1. Definición de derivada en un punto 2.2. Definición de derivada en un intervalo 2.3. Interpretación geométrica de la derivada 2.4. Interpretación física de la derivada 2.5. Derivadas laterales 2.6. Definición de derivada

3.

ÁLGEBRA DE DERIVADAS

4.

FUNCIÓN DERIVADA

5.

DERIVADA DE LA FUNCIÓN COMPUESTA (REGLA DE LA CADENA)

6.

DERIVADA DE LA FUNCIÓN INVERSA

7.

DIFERENCIAL DE UNA FUNCIÓN EN UN PUNTO 7.1. Definición de función diferenciable en un punto 7.2. Definición de diferencial de una función en un punto 7.3. Interpretación geométrica de la diferencial 7.4. Álgebra de diferenciales

8.

REGLAS DE DERIVACIÓN DE LAS FUNCIONES SIMPLES MÁS UTILIZADAS 8.1. Derivada de una constante 8.2. Derivada del producto de una constante por una función 8.3. Derivada de una potencia de x 8.4. Derivada de la función polinómica 8.5. Derivada de la función potencial de exponente negativo 8.6. Derivada de la función logarítmica 8.7. Derivada de la función exponencial 8.8. Derivada de la función potencial - exponencial 8.9. Derivada de la función seno 8.10. Derivada de la función coseno 8.11. Derivada de la función tangente 8.12. Derivadas de las funciones trigonométricas inversas 8.13. Derivadas de las funciones inversas de las funciones trigonométricas

9.

DERIVADAS SUCESIVAS 9.1. Definición de derivadas sucesivas 9.2. Fórmula de Leibniz

10. 9.

DIFERENCIACIÓN SUCESIVA DERIVADAS SUCESIVAS 9.1. Definición de derivadas sucesivas 9.2. Fórmula de Leibniz

REGLAS DE DERIVACIÓN DE LAS FUNCIONES SIMPLES MÁS UTILIZADAS 8.1. Derivada de una constante 8.2. Derivada del producto de una constante por una función 8.3. Derivada de una potencia de x 8.4. Derivada de la función polinómica 8.5. Derivada de la función potencial de exponente negativo 8.6. Derivada de la función logarítmica 8.7. Derivada de la función exponencial 8.8. Derivada de la función potencial - exponencial 8.9. Derivada de la función seno 8.10. Derivada de la función coseno 8.11. Derivada de la función tangente 8.12. Derivadas de las funciones trigonométricas inversas 8.13. Derivadas de las funciones inversas de las funciones trigonométricas

8.

DIFERENCIAL DE UNA FUNCIÓN EN UN PUNTO 7.1. Definición de función diferenciable en un punto 7.2. Definición de diferencial de una función en un punto 7.3. Interpretación geométrica de la diferencial 7.4. Álgebra de diferenciales

7.

DERIVADA DE LA FUNCIÓN INVERSA

6.

DERIVADA DE LA FUNCIÓN COMPUESTA (REGLA DE LA CADENA)

5.

DIFERENCIACIÓN SUCESIVA

FUNCIÓN DERIVADA

4.

ÁLGEBRA DE DERIVADAS

3.

CONCEPTO DE DERIVADA 2.1. Definición de derivada en un punto 2.2. Definición de derivada en un intervalo 2.3. Interpretación geométrica de la derivada 2.4. Interpretación física de la derivada 2.5. Derivadas laterales 2.6. Definición de derivada

2.

INTRODUCCIÓN

1.

10.



26

Derivada de una función en un punto

1. INTRODUCCIÓN La derivación tiene su origen en el problema de la aproximación lineal de una función real de variable real en la proximidad de un valor de la variable, lo que consiste en aproximar una curva por su tangente. La definición de derivada como límite de un cociente restringe la posibilidad de extensión a aplicaciones generales, pues sólo tiene sentido cuando el denominador es un escalar y para las funciones vectoriales de variable escalar. Las derivadas sucesivas se definirán por recurrencia. Cuando se trata de aproximar una función por una de primer grado en la variable escalar, la derivada primera resuelve el problema, obteniéndose la aplicación afín tangente; y cuando se trata de aproximar la función por una polinómica es necesario utilizar tantas derivadas sucesivas como unidades tiene el grado del polinomio, siendo en este caso la utilización de las fórmulas de Taylor el elemento necesario para resolver la cuestión. y = f(x)

2. CONCEPTO DE DERIVADA Sea f ( x ) una función continua en un [ a , b ], dado un x0 Î [ a , b ]y un cierto h Îú*, tal que x0 + h Î [ a , b ], se denomina cociente incremental a la expresión:

f(x0 + h) – f(x0)

a

f ( x0 + h ) – f ( x0 ) h

h

el cociente incremental representa la tangente del ángulo que forma el vector definido por el origen en el punto ( x0 , f ( x0 )) y el extremo en el punto ( x0 + h , f ( x0 + h )) con el eje de abscisas.

x0

x0 + h

Figura 1.

Se denomina recta tangente a la función f ( x ) en el punto A, a la recta que pasando por dicho punto $ que tiende a cero cuando x ® x . define el ángulo BAC 0

Tangente y = f(x)

ante Sec

C

b A

a

B

h

x0

x

Figura 2. También se puede afirmar que la tangente es la recta límite de la secante determinada por A y un punto B de abscisa x, tal que x ® x0. Denominando a al ángulo que forma AB con el eje OX , y b al ángulo que forma AC con el eje OX , se verifica que: lim( b – a ) = 0 Þ b = lim a

x ®x0


x ®x0

27


28


Se llama tangente a una curva en un punto A, a la posición límite, si existe, de las secantes AB cuando B se aproxima al punto A.

2.1. Definición de derivada en un punto

Sea f : I ® ú una función definida en un intervalo I, siendo éste no nulo y no reducido, es decir: x ®x0

f '( x0 ) = lim tg a = tg b

I = [ a , b ] ( a < b ); sea x0 Î ( a , b ) y h Î ú, entonces x0 + h Î ( a , b )

En consecuencia f '( x0 ) es la pendiente de la tangente a la curva y = f ( x )en el punto de coordenadas ( x0 , f ( x0 )), verificándose además que:

Llamamos derivada de la función f en el punto x0, lo que representamos por f '( x0 ), al siguiente límite, si existe: f ( x0 + h ) – f ( x0 ) f '( x0 ) = lim h ®0 h lo que también se puede escribir, mediante un cambio de notación en la que llamamos x = x0 + h, con lo que cuando h ® h0 entonces x ® x0, como: f ( x ) – f ( x0 ) f '( x0 ) = lim x ®x0 x – x0 Dx0 ®0

m = lim

Dy0 Dx0

Hasta aquí ha bastado con un sencillo razonamiento geométrico, pero si hacemos que A1 se desplace sobre la curva acercándose a A, la pendiente vendría dada por la expresión: f ( x + h ) – f ( x0 ) 0 m = lim h ®0 h si tenemos en cuenta que Dy0 = f ( x0 + h ) – f ( x0 ), y que Dx0 = h = x – x0, la expresión anterior se puede escribir como:

2.2. Definición de derivada en un intervalo

Figura 3.

Una función f es derivable en un intervalo ( a , b ) cuando es derivable en todo punto del intervalo. x0

donde la pendiente vendría dada por m =

x1

y1 – y0 . x1 – x0

2.3. Interpretación geométrica de la derivada ( y – y0 ) =

Sean A y A1 dos puntos distintos de la curva definida por la función y = f ( x ), la ecuación de la recta que pasa por esos puntos viene dada por: A

x– x y – y0 0 = x1 – x0 y1 – y0

A1

x – x0 y – y0 = x1 – x0 y1 – y0

y1

y1

y0

y1 – y0 ( x – x0 ) x1 – x0

y = f(x)

A1

Sean A y A1 dos puntos distintos de la curva definida por la función y = f ( x ), la ecuación de la recta que pasa por esos puntos viene dada por:

y = f(x)

y0

A

( y – y0 ) =

y1 – y0 ( x – x0 ) x1 – x0

2.3. Interpretación geométrica de la derivada x0

donde la pendiente vendría dada por m =

x1

y1 – y0 . x1 – x0

Una función f es derivable en un intervalo ( a , b ) cuando es derivable en todo punto del intervalo.

2.2. Definición de derivada en un intervalo

Figura 3.

Hasta aquí ha bastado con un sencillo razonamiento geométrico, pero si hacemos que A1 se desplace sobre la curva acercándose a A, la pendiente vendría dada por la expresión: f ( x0 + h ) – f ( x0 ) m = lim h ®0 h si tenemos en cuenta que Dy0 = f ( x0 + h ) – f ( x0 ), y que Dx0 = h = x – x0, la expresión anterior se puede escribir como: Dy0 m = lim Dx0 ®0 Dx 0 x ®x0

f '( x0 ) = lim

f ( x ) – f ( x0 ) x – x0

Llamamos derivada de la función f en el punto x0, lo que representamos por f '( x0 ), al siguiente límite, si existe: f ( x0 + h ) – f ( x0 ) f '( x0 ) = lim h ®0 h lo que también se puede escribir, mediante un cambio de notación en la que llamamos x = x0 + h, con lo que cuando h ® h0 entonces x ® x0, como:

En consecuencia f '( x0 ) es la pendiente de la tangente a la curva y = f ( x )en el punto de coordenadas ( x0 , f ( x0 )), verificándose además que: f '( x0 ) = lim tg a = tg b I = [ a , b ] ( a < b ); sea x0 Î ( a , b ) y h Î ú, entonces x0 + h Î ( a , b ) x ®x0

Sea f : I ® ú una función definida en un intervalo I, siendo éste no nulo y no reducido, es decir:

Se llama tangente a una curva en un punto A, a la posición límite, si existe, de las secantes AB cuando B se aproxima al punto A.

2.1. Definición de derivada en un punto



28


2.4. Interpretación física de la derivada La derivada desde el punto de vista físico representa la variación instantánea de una magnitud dependiente con respecto a otra independiente. Es clásico el ejemplo del estudio de la velocidad que se puede entender partiendo del movimiento de una partícula material que se desplaza en función del tiempo t a lo largo de una trayectoria f ( t ). La velocidad media de dicha partícula en un intervalo de tiempo viene dada por el espacio recorrido en ese intervalo de tiempo con relación al tiempo invertido en ese desplazamiento. Así la velocidad media entre los instantes t 0 y t 0 + h viene dada por el cociente incremental: f (t0 + h ) – f (t0 ) h así la velocidad media se denomina, también, tasa de variación media del espacio. Hemos de tener en cuenta que la velocidad media de un móvil en un trayecto no coincide, generalmente, con la velocidad real del móvil en cada instante. Para ello sería necesario que la velocidad fuese constante. No obstante, si el intervalo de tiempos (t 0, t 0 + h) se va haciendo cada vez más pequeño, la velocidad media en él se aproximará a la velocidad real del móvil, y en consecuencia, la velocidad instantánea de la partícula en el instante t 0 vendrá dada por: lim h ®0

f (t0 + h ) – f (t0 ) h

Análogamente al estudio de la velocidad del móvil en un movimiento rectilíneo, se desarrolla el concepto de aceleración. Así, si consideramos un móvil cuya velocidad, en función del tiempo, viene dada por la expresión v = f ( t ), definiremos la aceleración media como la variación de velocidad experimentada por el móvil en la unidad de tiempo. Al intervalo de tiempos (t 0, t 0 + h), le corresponde el intervalo de velocidades [ f ( t 0 ), f ( t 0 + h )], con lo que la aceleración media vendrá dada por el cociente incremental: f ( t0 + h ) – f (t0 ) h

am =

a la aceleración media también se la denomina tasa de variación media de la velocidad. Aplicando el mismo razonamiento que hemos introducido para la velocidad, la aceleración media, a no ser que el móvil se desplace con aceleración constante, de un móvil a lo largo de una trayectoria no coincide con la aceleración media. Haciendo el intervalo de tiempos cada vez más pequeño, la aceleración media en ese intervalo temporal se acercará a la real del móvil, lo que se denomina aceleración instantánea, que para el instante t 0 vendrá dada por la expresión: a = lim h ®0

f ( t0 + h ) – f (t0 ) h

2.5. Derivadas laterales –

Derivada lateral por la izquierda: Sea f :( a , b ) ® ú, y sea x0 Î ( a , b ), diremos que la función es derivable por la izquierda si existe lim

h ®0 –

–

f ( x0 + h ) – f ( x0 ) h

Derivada lateral por la derecha: Sea f :( a , b ) ® ú, y sea x0 Î ( a , b ), diremos que la función es derivable por la derecha si existe lim+

h ®0


f ( x0 + h ) – f ( x0 ) h 29


30


( f + g )( x + h ) – ( f + g )( x ) [ f ( x + h )+ g ( x + h )] – [ f ( x0 ) – g ( x0 )] 0 0 0 0 = = h h f ( x0 + h ) – f ( x0 ) g ( x0 + h ) – g ( x0 ) + h h

2.6. Definición de derivada

=

Teniendo en cuenta las definiciones de derivada en un punto y de derivadas laterales, antes expuestas, podemos afirmar que f es derivable en x0 si y sólo si existen las derivadas laterales en ese punto y son coincidentes. En el caso de que aun existiendo las derivadas laterales no sean coincidentes, no existe la derivada en ese punto, y se le denomina punto anguloso. Diremos que una función f :[ a , b ] ® ú es derivable en [ a , b ] si es derivable en cualquier x0 Î ( a , b ) y existen las derivadas laterales a la derecha de a ( f '+ ( a )) y a la izquierda de b ( f '– ( b )). Demostrémoslo: Por ser f y g dos funciones derivables, para cualquier h ¹ 0 se verifica que: ( f – g )'( x0 ) = f '( x0 ) – g '( x0 )

( f + g )'( x0 ) = f '( x0 )+ g '( x0 )

Proposición:

Si f y g son dos funciones derivables en un cierto punto x0, entonces f + g y f – g son también derivables en x0 y se verifica que: Si f es derivable en x0, entonces f es continua en x0.

Proposición:

Demostrémoslo: x ®x0

3. ÁLGEBRA DE DERIVADAS

Por ser f derivable en x0, entonces existe f '( x0 ) = lim

f ( x ) – f ( x0 ) , y como para x ¹ x0 se puede esx – x0

cribir que:

Esta proposición proporciona un criterio de no derivabilidad ya que si una función no es continua en un punto x0 tampoco será derivable en ese punto, ya que si lo fuese en virtud de la proposición sería continua. f ( x ) – f ( x0 ) =

f ( x ) – f ( x0 ) ( x – x0 ) x – x0

Hay que tener en cuenta que la proposición recíproca no es cierta, ya que hay funciones continuas, por ejemplo la función f ( x ) = | x |, que es continua pero no es derivable, en este caso en el punto x0 = 0. entonces, tomando límites, tenemos que:

x ®x0

x ®x0

x ®x0

lim( f ( x ) – f ( x0 )) = f '( x0 )× lim( x – x0 ) = f '( x0 )× 0 = 0

x ®x0

es decir: lim( f ( x ) – f ( x0 )) = 0 Þ lim f ( x ) = f ( x0 ), lo que nos indica que f es continua en x0.

es decir: lim( f ( x ) – f ( x0 )) = 0 Þ lim f ( x ) = f ( x0 ), lo que nos indica que f es continua en x0. x ®x0

x ®x0

x ®x0

lim( f ( x ) – f ( x0 )) = f '( x0 )× lim( x – x0 ) = f '( x0 )× 0 = 0

x ®x0

Hay que tener en cuenta que la proposición recíproca no es cierta, ya que hay funciones continuas, por ejemplo la función f ( x ) = | x |, que es continua pero no es derivable, en este caso en el punto x0 = 0. entonces, tomando límites, tenemos que:

f ( x ) – f ( x0 ) =

f ( x ) – f ( x0 ) ( x – x0 ) x – x0

Esta proposición proporciona un criterio de no derivabilidad ya que si una función no es continua en un punto x0 tampoco será derivable en ese punto, ya que si lo fuese en virtud de la proposición sería continua. cribir que:

x ®x0

Por ser f derivable en x0, entonces existe f '( x0 ) = lim

f ( x ) – f ( x0 ) , y como para x ¹ x0 se puede esx – x0

3. ÁLGEBRA DE DERIVADAS

Demostrémoslo:

Proposición:

Si f y g son dos funciones derivables en un cierto punto x0, entonces f + g y f – g son también derivables en x0 y se verifica que: ( f + g )'( x0 ) = f '( x0 )+ g '( x0 ) Si f es derivable en x0, entonces f es continua en x0. Proposición:

( f – g )'( x0 ) = f '( x0 ) – g '( x0 )

Teniendo en cuenta las definiciones de derivada en un punto y de derivadas laterales, antes expuestas, podemos afirmar que f es derivable en x0 si y sólo si existen las derivadas laterales en ese punto y son coincidentes. En el caso de que aun existiendo las derivadas laterales no sean coincidentes, no existe la derivada en ese punto, y se le denomina punto anguloso. Diremos que una función f :[ a , b ] ® ú es derivable en [ a , b ] si es derivable en cualquier x0 Î ( a , b ) y existen las derivadas laterales a la derecha de a ( f '+ ( a )) y a la izquierda de b ( f '– ( b )). Demostrémoslo: Por ser f y g dos funciones derivables, para cualquier h ¹ 0 se verifica que:

( f + g )( x0 + h ) – ( f + g )( x0 ) [ f ( x0 + h )+ g ( x0 + h )] – [ f ( x0 ) – g ( x0 )] = = h h f ( x0 + h ) – f ( x0 ) g ( x0 + h ) – g ( x0 ) = + h h

2.6. Definición de derivada



30

Derivada de una función en un punto y tomando límites obtenemos: lim h ®0

( f + g )( x0 + h ) – ( f + g )( x0 ) f ( x0 + h ) – f ( x0 ) g ( x0 + h ) – g ( x0 ) = lim + lim h ®0 h ®0 h h h

en conclusión: ( f + g )( x0 ) = f ( x0 )+ g ( x0 ) Con un razonamiento análogo podemos probar que ( f – g )( x0 ) = f ( x0 ) – g ( x0 ). Por inducción se puede generalizar esta proposición a fi funciones derivables, pudiendo escribir que: n æ n ö çå f ÷( x ) = å f ' ( x ) ç i÷ 0 i 0 è i=1 ø i=1 '

Proposición: Si f y g son dos funciones derivables en un cierto punto x0, entonces f × g es también derivable en x0 y se verifica que: ( f × g )'( x0 ) = f '( x0 )× g ( x0 )+ f ( x0 )× g '( x0 ) Demostrémoslo: Por ser f y g dos funciones derivables, para cualquier h ¹ 0 se verifica que: ( f × g )( x0 + h ) – ( f × g )( x0 ) f ( x0 + h )× g ( x0 + h ) – f ( x0 )× g ( x0 ) = = h h f ( x0 + h )× g ( x0 + h ) – f ( x0 )g ( x0 + h )+ f ( x0 )g ( x0 + h ) – f ( x0 )g ( x0 ) = = h f ( x0 + h ) – f ( x0 ) g ( x0 + h ) – g ( x0 ) = g ( x0 + h )+ f ( x0 ) h h y dado que f y g son funciones derivables en x0, tomando límites podemos escribir: f '( x0 ) = lim

f ( x0 + h ) – f ( x0 ) h

g '( x0 ) = lim

g ( x0 + h ) – g ( x0 ) h

h ®0

h ®0

además, como g es derivable, también es continua, luego lim g ( x0 + h ) = g ( x0 ). h ®0 En consecuencia: ( f × g )'( x0 ) = lim h ®0

( f × g )( x0 + h ) – ( f × g )( x0 ) = f '( x0 )g ( x0 )+ f ( x0 )g ( x0 ) h

Proposición: æ 1ö Sea g una función derivable en x0, siendo g ( x0 ) ¹ 0, la funciónç ç ÷ ÷también es derivable en x0, y se èg ø verifica que: æ 1ö g '( x0 ) ç ç ÷ ÷ ( x0 ) = – èg ø [g ( x0 )]2 '


31


32


Demostrémoslo: Sea f :( a , b ) ® ú una función derivable en ( a , b ), "x0 Î ( a , b ), $f '( x0 ), ello nos permite definir una función que denominamos función derivada de f , f '( o Df ):( a , b ) ® ú tal que hace corresponder a cada x Î ( a , b ) su derivada f '( x ). Por ser g una función derivable, para cualquier h ¹ 0 se verifica que: æ 1ö æ 1ö ç ç ÷ ÷( x0 ) ç ÷ ÷( x0 + h ) – ç èg ø èg ø h

=

1 1 – g ( x0 + h ) – g ( x0 ) 1 g (x + h ) g (x ) 0 =– × h h g ( x0 )g ( x0 + h ) 0

4. FUNCIÓN DERIVADA

Como g es derivable, también es continua, luego podemos escribir:

æ g '( x ) ö f '( x ) f ( x )g '( x ) f '( x0 )g ( x0 ) – f ( x0 )g '( x0 ) f '( x0 ) ç ÷ 0 0 0 0 – + f ( x0 )ç – = 2 ÷= 2 ) g ( x0 ) g ( x [ ] [ ] [g ( x0 )]2 g ( x0 ) 0 è g ( x0 ) ø g '( x0 ) = lim h ®0

g ( x0 + h ) – g ( x0 ) h

=

æ 1ö æ 1ö æ 1ö æfö ÷( x0 )+ f ( x0 )ç ç ç ÷ ç ÷ ÷ ( x0 ) = ç f× ÷ ÷ ( x0 ) = f '( x0 )×ç ç ÷ ÷ ( x0 ) = ç èg ø èg ø è gø èg ø lim g ( x0 + h ) = g ( x0 ) h ®0

'

'

y en consecuencia:

'

f 1 = f × y basándonos en las proposiciones anteriores tenemos que: g g æ 1ö æ 1ö ç ' ç ÷ ÷g ( x ) ç ÷ ÷( x + h ) – ç 0 æ ö g 0 1 èg ø ç 1÷ ÷ ( x0 ) = limè ø = – g '( x0 )× ç 2 h ®0 h èg ø g [( x0 )]

Proposición:

Escribimos

Demostrémoslo:

æfö f '( x0 )g ( x0 ) – f ( x0 )g '( x0 ) ç ç ÷ ÷ ( x0 ) = 2 èg ø g [( x0 )] '

Si f y g son dos funciones derivables en un cierto punto x0 y g ( x0 ) ¹ 0, entonces

f es también derivag

ble en x0 y se verifica que:

ble en x0 y se verifica que:

Si f y g son dos funciones derivables en un cierto punto x0 y g ( x0 ) ¹ 0, entonces

f es también derivag

æfö f '( x0 )g ( x0 ) – f ( x0 )g '( x0 ) ç ç ÷ ÷ ( x0 ) = 2 èg ø g [( x0 )] '

Demostrémoslo: Escribimos

Proposición:

æ 1ö æ 1ö ç ' ç ÷ ÷g ( x0 ) ç ÷ ÷( x0 + h ) – ç æ 1ö gø 1 èg ø è ç ÷ = x ( ) lim = – g '( x0 )× ç ÷ 0 2 h ®0 h èg ø [ g ( x0 )]

f 1 = f × y basándonos en las proposiciones anteriores tenemos que: g g y en consecuencia:

æ 1ö æ 1ö æ 1ö æfö ÷ ç ( x0 )+ f ( x0 )ç ç ÷ ç ÷ ÷ ( x0 ) = ç f× ÷ ÷ ( x0 ) = f '( x0 )×ç ç ÷ ÷ ( x0 ) = ç èg ø èg ø è gø èg ø '

'

'

h ®0

lim g ( x0 + h ) = g ( x0 )

g ( x0 + h ) – g ( x0 ) h

=

h ®0

g '( x0 ) = lim

æ ö f '( x0 )g ( x0 ) – f ( x0 )g '( x0 ) f '( x0 ) ç g '( x0 ) ÷ f '( x0 ) f ( x0 )g '( x0 ) – + = f ( x 0 )ç – 2 ÷= g ( x0 ) [g ( x0 )]2 [g ( x0 )]2 è [g ( x0 )] ø g ( x0 )

Como g es derivable, también es continua, luego podemos escribir:

æ 1ö æ 1ö 1 1 ç – ç ÷ ÷( x0 ) ç ÷ ÷( x0 + h ) – ç g ( x0 + h ) – g ( x0 ) 1 g ( x0 + h ) g ( x0 ) èg ø èg ø = =– × h h h g ( x0 )g ( x0 + h )

4. FUNCIÓN DERIVADA

Sea f :( a , b ) ® ú una función derivable en ( a , b ), "x0 Î ( a , b ), $f '( x0 ), ello nos permite definir una función que denominamos función derivada de f , f '( o Df ):( a , b ) ® ú tal que hace corresponder a cada x Î ( a , b ) su derivada f '( x ). Por ser g una función derivable, para cualquier h ¹ 0 se verifica que: Demostrémoslo: 32




5. DERIVADA DE LA FUNCIÓN COMPUESTA (REGLA DE LA CADENA) Sea f una función derivable en x0, y sea g una función derivable en f ( x0 ), la función compuesta g o f es derivable en x0, y la derivada viene expresada por: ( g o f )'( x0 ) = g '( f ( x0 )) × f '( x0 ) Demostrémoslo: Definimos una función h como sigue: ì g ( y ) – g ( f ( x0 )) ï y – f ( x0 ) ï h ( y ) =í ï ( g ' f ( x0 )) ï î

si y ¹ f ( x0 ) si y = f ( x0 )

Al ser g derivable en f ( x0 ) podemos escribir que: g ( y ) – g ( f ( x0 )) = g '( f ( x0 )) = h( f ( x0 )) y ® f ( x0 ) y – f ( x0 )

lim h ( y ) = lim

y ® f ( x0 )

en consecuencia h es continua en f ( x0 ). Además como f es derivable, también es continua en x0, así pues, tomando en cuenta la proposición de continuidad de la función compuesta podemos escribir: lim h( f ( x )) = h( f ( x0 )) = g '( f ( x0 ))

x ®x0

Si consideramos la definición de h para x ¹ x0 entonces: g ( f ( x )) – g ( f ( x0 )) f ( x ) – f ( x0 ) = h( f ( x )) x – x0 x – x0 y, en consecuencia: lim

x ®x0

g ( f ( x )) – g ( f ( x0 )) f ( x ) – f ( x0 ) = lim h( f ( x )) = g '( f ( x0 )) × f '( x0 ) x ® x 0 x – x0 x – x0

6. DERIVADA DE LA FUNCIÓN INVERSA Sea f una función monótona y continua en un intervalo. Si f es derivable en un punto x0 del interior de dicho intervalo, y se verifica que f '( x0 ) ¹ 0, entonces su función inversa f –1 es derivable en b = f ( x0 ), y su derivada viene dada por: ( f –1 )'( b ) =

1 1 = ( f '( x0 ) f ' f –1( b ))

Demostrémoslo: Para demostrarlo habrá que probar que lim k ®0

f –1 ( b + k ) – f –1 ( b ) 1 = k f '( x0 )

Sea h = f –1( b + k ) – f –1( b ) = f –1( b + k ) – x0, entonces x0 + h = f –1( b + k ) y por lo tanto k = = f ( x0 + h ) – b = f ( x0 + h ) – f ( x0 ).


33


34


La longitud del segmento CD representa el error cometido al sustituir Dy por dy.

Además, si k ¹ 0 y también h ¹ 0, como f –1 es monótona, podemos escribir:

Figura 4.

f '( b + k ) – f '( b ) h 1 = = f ( x0 + h ) – f ( x0 ) k f ( x0 + h ) – f ( x0 ) h

Dx

Por otra parte, hemos de tener en cuenta que BD representa el incremento de la función y = f ( x )correspondiente al incremento en x.

B

y teniendo en cuenta que al ser f continua, también lo es f –1, luego: f '( x )Dx = BC

lim( f –1( b + k ) – f –1( b )) = 0 k ®0

A

CD y

Teniendo en cuenta que f '( x ) viene dada por la tangente del ángulo formado por la recta tangente a la función en el punto x y el semieje positivo de abscisas, podemos escribir:

así pues, h ® 0 cuando k ® 0 y dado que f es derivable en x0 y f '( x0 ) ¹ 0 tenemos que: D

( f –1( b + k ) – f –1( b )) 1 1 lim = lim = k ®0 h ®0 f ( x + h ) – f ( x0 ) k f '( x0 ) 0 h

7.3. Interpretación geométrica de la diferencial pudiendo apreciar que cuando Dx ® 0, entonces Dy = dy.

7. DIFERENCIAL DE UNA FUNCIÓN EN UN PUNTO Dy = dy + F( x , Dx )

7.1. Definición de función diferenciable en un punto

Dada la función y = f ( x )se denomina diferencial de la función en el punto x, y lo denotaremos como df ( x ) o dy, al producto f '( x )Dx. Utilizando este concepto, podemos expresar la diferencial de una función como una combinación lineal de Dx:

Sea la función y = f ( x ) definida en un conjunto abierto A Ìú, será diferenciable en un cierto x Î A si "x+ Dx Î A se verifica que: f ( x+ Dx ) – f ( x ) = f '( x )Dx + F( x , Dx )

7.2. Definición de diferencial de una función en un punto

donde sabemos que

F( x, Dx ) ® 0 cuando Dx ® 0. Dx

donde sabemos que

F( x, Dx ) ® 0 cuando Dx ® 0. Dx

7.2. Definición de diferencial de una función en un punto f ( x+ Dx ) – f ( x ) = f '( x )Dx + F( x , Dx )

Dada la función y = f ( x )se denomina diferencial de la función en el punto x, y lo denotaremos como df ( x ) o dy, al producto f '( x )Dx. Utilizando este concepto, podemos expresar la diferencial de una función como una combinación lineal de Dx:

Sea la función y = f ( x ) definida en un conjunto abierto A Ìú, será diferenciable en un cierto x Î A si "x+ Dx Î A se verifica que:

7.1. Definición de función diferenciable en un punto Dy = dy + F( x , Dx )

7. DIFERENCIAL DE UNA FUNCIÓN EN UN PUNTO

pudiendo apreciar que cuando Dx ® 0, entonces Dy = dy.

( f –1( b + k ) –

1 1 = f ( x0 + h ) – f ( x0 ) f '( x0 ) h

7.3. Interpretación geométrica de la diferencial

k

k ®0

lim

h ®0

f –1( b ))

= lim

Teniendo en cuenta que f '( x ) viene dada por la tangente del ángulo formado por la recta tangente a la función en el punto x y el semieje positivo de abscisas, podemos escribir:

D

así pues, h ® 0 cuando k ® 0 y dado que f es derivable en x0 y f '( x0 ) ¹ 0 tenemos que: CD y

k ®0

lim( f –1( b + k ) – f –1( b )) = 0

A

f '( x )Dx = BC

y teniendo en cuenta que al ser f continua, también lo es f –1, luego: B

Por otra parte, hemos de tener en cuenta que BD representa el incremento de la función y = f ( x )correspondiente al incremento en x.

f '( b + k ) – f '( b ) h 1 = = f ( x0 + h ) – f ( x0 ) k f ( x0 + h ) – f ( x0 ) h

Dx

La longitud del segmento CD representa el error cometido al sustituir Dy por dy.

Además, si k ¹ 0 y también h ¹ 0, como f –1 es monótona, podemos escribir:

Figura 4. 34




7.4. Álgebra de diferenciales –

Diferencial de la suma de funciones. Sea y( x ) = u ( x )+ v( x ) ® dy( x ) = du ( x )+ dv( x ) Probémoslo: y ( x ) = u ( x )+ v ( x ) ® y '( x ) = u '( x )+ v'( x ) Þ y'( x )dx = u '( x )dx + v '( x )dx = du ( x )+ dv( x )

–

Diferencial de un producto. y( x ) = u ( x )× v( x ) ® Sea ® d [ y( x )] = d [ u ( x )× v( x )] = [ du ( x )]v( x )+ u ( x )[ dv( x )] Probémoslo: y( x ) = u ( x )× v( x ) ® y'( x ) = u '( x )v( x )+ u ( x )v'( x ) Þ Þ y'( x )dx = u '( x )v( x )dx+ u ( x )v'( x )dx Þ Þ y'( x )dx = u '( x )dxv( x )+ u ( x )v'( x )dx Þ Þ dy( x ) = du ( x )× v ( x )+ u ( x )× dv ( x )

–

Diferencial de la función compuesta. Sea z = g ( f ( x )) ® dz = g '( y )dy, siendo y = f ( x ). Probémoslo: z ( x ) = ( g o f )( x ) = g [ f ( x )] = F ( x ) ® ® dz ( x ) = F '( x )dx = f '( x )g '( y )dx = g '( y )dy

8. REGLAS DE DERIVACIÓN DE LAS FUNCIONES SIMPLES MÁS UTILIZADAS 8.1. Derivada de una constante Sea y = f ( x ) = k , "x Î ú. y'= lim

Dx ®0

f ( x+ Dx ) – f ( x ) k–k = lim =0 D x ® 0 Dx Dx D ( y( x ) = k ) = 0

8.2. Derivada del producto de una constante por una función Sea y = kf ( x ) = F ( x ); "x, y Î ú. y'= F '( x ) = lim

Dx ®0

F ( x + Dx ) – F ( x ) kf ( x + Dx ) – kf ( x ) = lim = Dx ®0 Dx lim Dx ®0

f ( x+ Dx ) – f ( x ) = k lim = kf '( x ) Dx ®0 lim Dx ®0

D ( kf ( x )) = k × f '( x )

–

Linealidad de la derivación. Basándonos en el razonamiento anterior: D ( k1 f1( x )+ k 2 f2 ( x )) = k1D ( f1( x ))+ k2D ( f2 ( x )) = k1 f '1 ( x )+ k2 f '2 ( x )


35


36


1 1 = Le = x x

8.3. Derivada de una potencia de x Sea y = xn, n Î ù

x 1 x x x é ù é ù öDx ú æ öDx x öDx ú ê æ ê æ ç ÷ ç ÷ ç ÷ 1 ÷ 1 ÷ ú 1 ê ç 1 ÷ ú ê ç = L limç1+ L lim = + = lim 1 1 L = + ê Dx ®0ç Dx ®0ç x ÷ ú x ÷ x ÷ ú x ê Dx ®0ç ç ÷ ú ç ÷ ç ÷ ê è ú ê è è Dx ø Dx ø û Dx ø û ë ë

f ( x+ Dx ) – f ( x ) ( x+ Dx )n – ( x )n = lim = Dx ®0 Dx ®0 Dx Dx æ n ö n–1 æn ö ç ÷x Dx+ç ÷x n– 2Dx 2+...+Dx n – x n æn ö è 1ø è 2ø = lim = ç ÷xn–1 = nxn–1 Dx ®0 Dx è 1ø y'= lim

1

æ öDx 1 1 ç ÷ æ Dx öDx æ Dx öDx 1 ÷ = lim Lç1+ ÷ = L limç1+ ÷ = L limç1+ = Dx ®0ç Dx ®0 Dx ®0 x ÷ è ø è ø x x ç ÷ è Dx ø D ( y = xn ) = nxn–1

8.4. Derivada de la función polinómica 1

1 Sea la función y = ln x = Lx ® D ( y = ln x ) = x æ x+ Dx ö ÷ Lç L( x+ Dx ) – Lx 1 æ Dx ö è x ø y'= lim = = lim Lç1+ ÷= Dx ®0 Dx è Dx Dx x ø

Sea f ( x ) = a0 + a1x + a2x 2 + a3x 3+...+anx n, si aplicamos las estrategias de cálculo descritas anteriormente podemos escribir: Dx ®0

D ( y = a0 + a1x + a2x 2+...+anx n ) = 0+ a1+ 2a2x+...+nanx n

8.5. Derivada de la función potencial de exponente negativo

8.6. Derivada de la función logarítmica

Sea y = x– n ® D ( y = x – n ) = – nx – n–1, n Î ù. Es cierto, ya que y = x– n =

1 , y si llamamos f ( x )= xn, aplicando lo antes visto para la derivada de xn

Si consideramos una cierta función u ( x ):( a , b ) ® ú, que es derivable en ( a , b ) y n Îù, con n > 1, entonces D ( y = u ( x )– n ) = – nu ( x )– n–1u '( x ) para aquellos puntos donde u ( x )¹ 0. la función inversa tenemos:

f '( x )

nxn–1

[ f ( x )]

[xn]2

= – nx– n–1

[ f ( x )]2 f '( x )

2 = –

y'= –

=–

[xn]2

nxn–1

y'= –

= – nx– n–1

Si consideramos una cierta función u ( x ):( a , b ) ® ú, que es derivable en ( a , b ) y n Îù, con n > 1, entonces D ( y = u ( x )– n ) = – nu ( x )– n–1u '( x ) para aquellos puntos donde u ( x )¹ 0. la función inversa tenemos:

Es cierto, ya que y = x– n =

1 , y si llamamos f ( x )= xn, aplicando lo antes visto para la derivada de xn

Sea y = x– n ® D ( y = x – n ) = – nx – n–1, n Î ù.

8.6. Derivada de la función logarítmica

8.5. Derivada de la función potencial de exponente negativo

1 x æ x+ Dx ö ÷ Lç L( x+ Dx ) – Lx 1 æ Dx ö è x ø y'= lim = = lim Lç1+ ÷= Dx ®0 Dx ®0 Dx è Dx Dx x ø

Sea la función y = ln x = Lx ® D ( y = ln x ) =

D ( y = a0 + a1x + a2x 2+...+anx n ) = 0+ a1+ 2a2x+...+nanx n

Sea f ( x ) = a0 + a1x + a2x 2 + a3x 3+...+anx n, si aplicamos las estrategias de cálculo descritas anteriormente podemos escribir:

8.4. Derivada de la función polinómica 1

æ öDx ç ÷ æ Dx ö æ Dx ö 1 ÷ = = lim Lç1+ ÷ = L limç1+ ÷ = L limç1+ Dx ®0ç Dx ®0 è Dx ®0è x ÷ x ø x ø ç ÷ è Dx ø 1 Dx

1 Dx

D ( y = xn ) = nxn–1

Dx ®0

1

= lim

Dx

æn ö = ç ÷xn–1 = nxn–1 è 1ø

f ( x+ Dx ) – f ( x ) ( x+ Dx )n – ( x )n y'= lim = lim = Dx ®0 Dx ®0 Dx Dx æ ö æn ö n ç ÷x n–1Dx+ç ÷x n– 2Dx 2+...+Dx n – x n è 1ø è 2ø

36



1 1 = Le = x x

8.3. Derivada de una potencia de x

æ ö ç ÷ 1 ÷ = L limç1+ Dx ®0ç x ÷ ç ÷ è Dx ø

x x x é ù é ù öDx ú öDx ú ê æ ê æ ç ÷ ç ÷ 1 ÷ ú 1 1 ÷ ú = Lê limç1+ = = Lê limç1+ ê Dx ®0ç ê Dx ®0ç x ÷ ú x ÷ ú x ç ÷ ç ÷ ê è Dx ø ú ê è Dx ø ú ë û ë û

Sea y = xn, n Î ù

x 1 Dx x

Derivada de una función en un punto Si consideramos una cierta función u ( x ):( a , b ) ® ú, que es derivable en ( a , b ), tal que "x Î ( a , b ), u '( x ) , lo que es cierto ya que si consideramos y = L( u ( x )) como la u ( x )> 0 entonces D ( y = L( u ( x )) = u(x ) composición: y: x ¾¾® u ( x ) = z ¾¾® L( z ) = L( u ( x )) u

v

si aplicamos la regla de la cadena llegaremos a: y'= u '( x )× v'( x ) = u '( x )

1 u(x )

Si no trabajamos con logaritmos neperianos, hemos de introducir la condición de que la base de los 1 logaritmos cumpla que a Î ú+, siendo a ¹ 1, entonces D ( y = log a x ) = log a e. x Veámoslo: Si partimos de y = log a x, por la definición de logaritmo tenemos que x = a y = eLx . Si ahora tomamos logaritmos de base a tendríamos: 1 1 1 y'= log a e = x x La Análogo razonamiento podemos aplicar con y = log a u ( x )reiterando la regla de la cadena, con lo que se obtendría: u '( x ) u '( x ) 1 D ( y = log a u ( x )) = log a e = u(x ) u ( x ) La

8.7. Derivada de la función exponencial Sea la función y = a x , si sobre ella tomamos logaritmos neperianos en ambos miembros tenemos: Ly = La x aplicamos las propiedades de los logaritmos: Ly = xLa derivando ambos miembros: y' = La y despejando y': y'= yLa = a x La Con un razonamiento análogo podemos afirmar que D ( y = a u( x ) ) = u '( x )× a u( x ) × La

8.8. Derivada de la función potencial - exponencial v (x ) Sea la función y = [u ( x )] donde u ( x ) y v( x ) son funciones definidas en ú+, tomando logaritmos neperianos en ambos miembros tenemos: Ly = L[u ( x )]

v (x )

aplicando las propiedades de los logaritmos: Ly = v ( x )Lu ( x ) TEMARIO DE MATEMÁTICAS. PRUEBA A

37



u '( x ) = u '( x )(1+ tg 2 u ( x )) cos 2 u ( x )

derivando miembro a miembro:

38

D ( tg u ( x )) =

y' u '( x ) = v'( x )Lu ( x )+ v( x ) y u(x )

Considerando y = tg u ( x ), mediante un razonamiento análogo al anterior escribimos: cos x×cos x – sen x(– sen x ) cos 2 x+ sen 2 x 1 = = = 1+ tg 2 x 2 2 cos x cos x cos 2 x

despejamos y'

y'=

æ ö æ ö ç v'( x )Lu ( x )+ v( x ) u '( x ) ÷ ÷= [u ( x )]v ( x )ç ç v'( x )Lu ( x )+ v( x ) u '( x ) ÷ ÷ y'= yç u(x ) ø u(x ) ø è è

Sea la función y = tg x, mediante un sencillo razonamiento trigonométrico podemos formularla sen x , y teniendo en cuenta lo que se abordó al tratar el álgebra de derivadas en lo concerniente a como y = cos x la derivada del cociente de funciones, podemos escribir:

8.9. Derivada de la función seno

Sea la función y = sen x, su derivada vendrá dada por:

8.11. Derivada de la función tangente

sen ( x+ h ) – sen x sen x cos h + cos xsen h – sen x y'= lim = lim = h ®0 h ®0 h h sen x ×1+ cos x× h – sen x h cos x = cos x = lim h ®0 h h D ( y = cos u ( x )) = – u '( x )sen u ( x )

= lim

Si ahora atendemos a la función y = cos u ( x ), su derivada vendrá dada por:

h ®0

cos ( x+ h ) – cos x cos x cos h – sen x sen h – cos x = lim = h ® 0 h h cos x ×1 – sen x × h – cos x – hsen x = lim = lim = – sen x h ®0 h ®0 h h

Con análogo razonamiento podemos tratar la función y = sen u ( x ), obteniéndose que: D ( y = sen u ( x )) = u '( x )cos u ( x )

h ®0

y'= lim

Sea la función y = cos x, su derivada vendrá dada por:

8.10. Derivada de la función coseno

8.10. Derivada de la función coseno

Sea la función y = cos x, su derivada vendrá dada por:

cos ( x+ h ) – cos x cos x cos h – sen x sen h – cos x y'= lim = lim = h ®0 h ®0 h h cos x ×1 – sen x × h – cos x – hsen x = lim = – sen x h ®0 h h D ( y = sen u ( x )) = u '( x )cos u ( x )

= lim

Con análogo razonamiento podemos tratar la función y = sen u ( x ), obteniéndose que: h ®0

sen ( x+ h ) – sen x sen x cos h + cos xsen h – sen x = lim = h ®0 h h sen x ×1+ cos x× h – sen x h cos x = cos x = lim = lim h ®0 h ® 0 h h

Si ahora atendemos a la función y = cos u ( x ), su derivada vendrá dada por: D ( y = cos u ( x )) = – u '( x )sen u ( x )

h ®0

y'= lim

8.11. Derivada de la función tangente

Sea la función y = sen x, su derivada vendrá dada por:

Sea la función y = tg x, mediante un sencillo razonamiento trigonométrico podemos formularla sen x , y teniendo en cuenta lo que se abordó al tratar el álgebra de derivadas en lo concerniente a como y = cos x la derivada del cociente de funciones, podemos escribir:

8.9. Derivada de la función seno

æ u '( x ) ö u '( x ) ö v ( x )æ ÷ ÷ y'= yç ç v'( x )Lu ( x )+ v( x ) ÷= [u ( x )] ç ç v'( x )Lu ( x )+ v( x ) ÷ u ( x ) u(x ) ø è è ø y'=

cos x×cos x – sen x(– sen x ) cos 2 x+ sen 2 x 1 = = = 1+ tg 2 x cos 2 x cos 2 x cos 2 x

despejamos y'

Considerando y = tg u ( x ), mediante un razonamiento análogo al anterior escribimos: y' u '( x ) = v'( x )Lu ( x )+ v( x ) y u(x )

D ( tg u ( x )) =

38

u '( x ) = u '( x )(1+ tg 2 u ( x )) cos 2 u ( x )

derivando miembro a miembro:




8.12. Derivadas de las funciones trigonométricas inversas –

Cosecante. 1 , teniendo en cuenta lo que se abordó al tratar el álgebra de sen x cos x . derivadas en lo concerniente a la derivada de la inversa de una función, tenemos y'= – sen 2 x Dada la función y = cosec x =

Para la función y = cosec u ( x ) =

1 , su derivada vendrá dada por: sen u ( x )

æ 1 ö u '( x )cos u ( x ) ÷ Dç ç y = cosec u ( x ) = ÷= – sen u ( x ) ø sen 2 u ( x ) è

–

Secante. 1 , teniendo en cuenta lo que se abordó al tratar el álgebra de decos x sen x rivadas en lo concerniente a la derivada de la inversa de una función, tenemos y'= . cos 2 x

Dada la función y = sec x =

Para la función y = sec u ( x ) =

1 , su derivada vendrá dada por: cos u ( x )

æ 1 ö u '( x )sen u ( x ) ÷ Dç ç y = sec u ( x ) = ÷= cos u ( x ) ø cos 2 u ( x ) è

–

Cotangente. Sea la función y = cot g x, mediante un sencillo razonamiento trigonométrico podemos formucos x , y teniendo en cuenta lo que se abordó al tratar el álgebra de derivadas en lo larla como y = sen x concerniente a la derivada del cociente de funciones, podemos escribir: y'=

– sen x×sen x – cos x×cos x – sen 2x – cos 2 x –1 = = = –(1+ ctg 2 x ) sen 2x sen 2x sen 2x

Considerando y = ctg u ( x ), mediante un razonamiento análogo al anterior escribimos: D (ctg u ( x )) =

u '( x ) = – u '( x )(1+ ctg 2 u ( x )) sen 2 u ( x )

8.13. Derivadas de las funciones inversas de las funciones trigonométricas –

Arco seno. Dada la función y = f ( x ) = sen x, su función inversa será f –1( x ) = arcsen x, aplicando lo visto en álgebra de funciones a propósito de la función inversa, seguiremos el siguiente razonamiento: Sean

f ( x ) = arcsen x Þ x = sen f ( x ) , por lo tanto: g ( x ) = sen x Þ x = arcsen g ( x ) f '( x ) =


1 1 = g '( f ( x )) cos f ( x ) 39


40

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA n æ nö ( f × g )( n ( x ) = åç ÷ f ( k ( x )× g ( n– k ( x ) k k=0è ø

teniendo en cuenta que por el teorema fundamental de la trigonometría se puede escribir que: cos f ( x ) = ± 1 – sen 2 f ( x ) y como habíamos definido x = sen f ( x ), obtenemos: La fórmula de Leibniz permite calcular la derivada n - ésima de un producto. Sean f ( x )y g ( x )dos funciones que admiten derivadas hasta la de orden n en un cierto punto x, entonces: 1

± 1 – x2

Por el mismo razonamiento D (arcsen u ( x )) =

9.2. Fórmula de Leibniz

f '( x ) =

u '( x ) ± 1 – [u ( x )]

2

Por inducción podemos definir las derivadas sucesivas de f , así si llamamos a f ( n–1( x ) a la derivada de orden n – 1de la función f ( x ), si existe su derivada se denominará derivada n - ésima (o de orden n) de la función f ( x ).

–

Arco coseno.

f ( x ) = arccos x Þ x = cos f ( x ) , si realizamos un razonamiento análogo al anterior tenemos: g ( x ) = cos x Þ x = arccos g ( x )

Dada una función f , la función que a cada x Îú en donde f sea derivable, le hace corresponder la derivada f '( x ) de f en x, se denomina función primera derivada de f , designándola por f 'o f (1. A la función derivada de f 'se denomina derivada segunda de f y la representaremos por f ''o f (2. A la función derivada de f '' se denomina derivada tercera de f y la representaremos por f ''' o f (3 y así sucesivamente. Sean

f '( x ) =

1 1 –1 –1 = = = g '( f ( x )) – sen f ( x ) ± 1 – cos 2 f ( x ) ± 1 – x 2

9.1. Definición de derivadas sucesivas 1 1 1 = = 2 g '( f ( x )) 1+ tg f ( x ) 1+ x2

Por el mismo razonamiento D (arccos u ( x )) =

± 1 – [u ( x )]

9. DERIVADAS SUCESIVAS

u '( x ) 1+ u ( x )2

Arco tangente.

extendiendo el razonamiento D (arctg u ( x )) =

–

1 1 1 = = g '( f ( x )) 1+ tg 2 f ( x ) 1+ x2

reiterando el razonamiento anterior: f '( x ) =

f ( x ) = arctg x Þ x = tg f ( x ) g ( x ) = tg x Þ x = arctg g ( x )

f ( x ) = arctg x Þ x = tg f ( x ) g ( x ) = tg x Þ x = arctg g ( x )

Sean

u '( x ) 1+ u ( x )2

Sean

2

reiterando el razonamiento anterior: f '( x ) =

Arco tangente.

± 1 – [u ( x )]

extendiendo el razonamiento D (arctg u ( x )) =

–

– u '( x )

9. DERIVADAS SUCESIVAS

Por el mismo razonamiento D (arccos u ( x )) =

2

– u '( x )

9.1. Definición de derivadas sucesivas

1 1 –1 –1 = = = g '( f ( x )) – sen f ( x ) ± 1 – cos 2 f ( x ) ± 1 – x 2

Dada una función f , la función que a cada x Îú en donde f sea derivable, le hace corresponder la derivada f '( x ) de f en x, se denomina función primera derivada de f , designándola por f ' o f (1. A la función derivada de f 'se denomina derivada segunda de f y la representaremos por f ''o f (2. A la función derivada de f '' se denomina derivada tercera de f y la representaremos por f ''' o f (3 y así sucesivamente. f '( x ) =

Sean

f ( x ) = arccos x Þ x = cos f ( x ) , si realizamos un razonamiento análogo al anterior tenemos: g ( x ) = cos x Þ x = arccos g ( x )

Por inducción podemos definir las derivadas sucesivas de f , así si llamamos a f ( n–1( x ) a la derivada de orden n – 1de la función f ( x ), si existe su derivada se denominará derivada n - ésima (o de orden n) de la función f ( x ).

–

Arco coseno.

Por el mismo razonamiento D (arcsen u ( x )) =

± 1 – [u ( x )]

2

u '( x )

9.2. Fórmula de Leibniz

± 1 – x2

La fórmula de Leibniz permite calcular la derivada n - ésima de un producto. Sean f ( x )y g ( x )dos funciones que admiten derivadas hasta la de orden n en un cierto punto x, entonces: f '( x ) =

1

n æn ö ( f × g )( n ( x ) = åç ÷ f ( k ( x )× g ( n– k ( x ) k k=0è ø

teniendo en cuenta que por el teorema fundamental de la trigonometría se puede escribir que: cos f ( x ) = ± 1 – sen 2 f ( x ) y como habíamos definido x = sen f ( x ), obtenemos: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


40

Derivada de una función en un punto Demostrémoslo: Utilizaremos el método de inducción completa sobre n, partiendo de que para n = 1 la derivada se corresponde con la expresión usual de la derivada de un producto. Suponemos que es cierto hasta la derivada de orden n – 1, con lo que la de ese orden vendrá dada, según la expresión propuesta por Leibnit, por: n–1 æ n – 1ö ( k ÷ f ( x )× g ( n–1– k ( x ) ( f × g )( n–1( x ) = åç k è ø k=0

probemos si se cumple para n: n–1 æ n – 1ö ( k ' ÷[ f ( x )× g ( n– k ( x )+ f ( k+1( x )g ( n–1– k ( x )] = ( f × g )( n ( x ) = [ ( f × g )( n–1( x )] = åç k ø k=0è n–1 æ n – 1ö ( n æ n – 1ö éæ n – 1ö æ n – 1öù ( k ÷ f ( x )g ( x ) = ÷+ç ÷ f ( x )g ( n ( x )+ åêç ÷ú f ( x )g ( n– k ( x )+ç =ç k ø è k – 1øû è n – 1ø è0 ø k=1ëè n–1 æn ö æn ö æn ö = ç ÷ f ( x )g ( n ( x )+ åç ÷ f ( k ( x )g ( n– k ( x )+ç ÷ f ( n ( x )g ( x ) = k è 0ø èn ø k=1è ø n æn ö = åç ÷ f ( k ( x )g ( n– k ( x ) k k=0è ø

10. DIFERENCIACIÓN SUCESIVA Partimos de dy = f '( x )dx, expresaremos la diferencial de esta función como: d ( dy ) = [ f '( x )dx] dx = f ''( x )( dx )2 '

a esta expresión la denominamos diferencial segunda (de orden 2) de la función, lo que denotaremos como d 2 y. Por inducción llegamos a la diferencial de orden n – 1, cuya diferencial se denominará diferencial n - ésima de la función y representaremos como d n y. d ( d n–1 y ) = [ f ( n–1( x )( dx )n–1] dx = f ( n ( x )( dx )n '


41

TEMA

27 Desarrollo de una función en serie de potencias. Teorema de Taylor. Aplicaciones al estudio local de funciones




44



INTRODUCCIÓN

2.

SERIES FUNCIONALES 2.1. Concepto de sumas parciales 2.2. Concepto de serie funcional 2.3. Convergencia de series

3.

SERIE DE POTENCIAS 3.1. Intervalos de convergencia 3.2. Radio de convergencia 3.3. Criterios para la determinación del radio de convergencia

4.

TEOREMA DE TAYLOR 4.1. Primera fórmula de Taylor 4.2. Segunda fórmula de Taylor 4.3. Desarrollo por Taylor 4.3.1. Resto de Taylor 4.3.2. Desarrollo de Taylor con resto de Lagrange 4.4. Infinitésimos. Conceptos relacionados 4.5. Acotación del error

5.

DESARROLLO DE Mc LAURIN

6.

DESARROLLO EN SERIE CON RESTO DE CAUCHY 7.4. 7.5.

APLICACIONES AL ESTUDIO LOCAL DE FUNCIONES 7.1. Monotonía: crecimiento y decrecimiento 7.2. Criterios de crecimiento y decrecimiento 7.3. Extremos relativos. Máximos y mínimos 7.3.1. Condiciones suficientes para la existencia del extremo relativo Curvatura. Concavidad, convexidad y puntos de inflexión Generalización de la determinación de máximos y mínimos

7.

DESARROLLO EN SERIE CON RESTO DE CAUCHY

6.

DESARROLLO DE Mc LAURIN

5.

APLICACIONES AL ESTUDIO LOCAL DE FUNCIONES 7.1. Monotonía: crecimiento y decrecimiento 7.2. Criterios de crecimiento y decrecimiento 7.3. Extremos relativos. Máximos y mínimos 7.3.1. Condiciones suficientes para la existencia del extremo relativo 7.4. Curvatura. Concavidad, convexidad y puntos de inflexión 7.5. Generalización de la determinación de máximos y mínimos

TEOREMA DE TAYLOR 4.1. Primera fórmula de Taylor 4.2. Segunda fórmula de Taylor 4.3. Desarrollo por Taylor 4.3.1. Resto de Taylor 4.3.2. Desarrollo de Taylor con resto de Lagrange Infinitésimos. Conceptos relacionados Acotación del error

4.

SERIE DE POTENCIAS 3.1. Intervalos de convergencia 3.2. Radio de convergencia 3.3. Criterios para la determinación del radio de convergencia

3.

SERIES FUNCIONALES 2.1. Concepto de sumas parciales 2.2. Concepto de serie funcional 2.3. Convergencia de series

2.

INTRODUCCIÓN

1.

7.

4.4. 4.5.



44

Desarrollo de una función en serie de potencias

1. INTRODUCCIÓN En este tema nos centraremos en el estudio de una función f : A ® R, pretendiendo determinar, si existe, un intervalo en torno a un cierto punto x0 Î A y una serie de potencias que nos permitan escribir la función de la forma: ¥

f ( x ) = åan ( x- x0 )n; "x Î ( x0 - e , x0 + e ) n=0

y, además, averiguar cuál es esa serie. A continuación abordaremos los teoremas de Taylor que nos ayudarán a resolver el problema planteado y posteriormente lo aplicaremos al estudio local de una función.

2. SERIES FUNCIONALES 2.1. Concepto de sumas parciales Dada una sucesión de funciones { fn}llamamos sumas parciales a las funciones obtenidas en el desarrollo del sumatorio, de modo que: S 1 = f1 S 2 = f1+ f2 K S n = f1+ f2+...+ fn

" nÎN

2.2. Concepto de serie funcional Se denomina serie funcional de término general fn a cada pareja de sucesiones funcionales ({ fn}{ , S n}) y ¥

se representa por å fn. n=1

2.3. Convergencia de series –

Convergencia puntual. ¥

Decimos que la serie funcional å fn converge puntualmente a una función S en un conjunto n=1

¥

A Ì R, cuando se verifica que " x Î A el å fn ( x ) converge a S ( x ) que es la suma de la serie y n=1

considerando que x Î A nos indica que {S n} converge puntualmente a S en A.

–

Convergencia absoluta. ¥

Decimos que la serie å fn converge absolutamente en un conjunto A Ì R, cuando la serie de n=1 ¥

los valores absolutos å fn , converge puntualmente en A. n=1


45


46


do del teorema ya que nos encontraríamos con un cierto x0 para el cual la serie converge y un cierto x1, siendo x0 > x1 para el cual la serie diverge.

3. SERIE DE POTENCIAS

Se denomina serie de potencias a la serie funcional cuyos términos son de la forma an ( x- x0 )n, donde an representa una constante. La serie de potencias viene representada por n=0

valor de x, por ejemplo x = x0, con x0 > x1 para el cual åanx0n converge. Esto ocntradice el enuncia¥

¥

n=0

åa ( x - x

Para probar la segunda parte del teorema supondremos que la serie åanx1n diverge, y que existe otro n

0

)n

n=0

¥

lo que nos permite compararla con una serie geométrica de razón menor que 1, por lo que sería convergente. Si a la expresión ( x - x0 ) se le denomina z podemos escribir la serie de potencias como: ¥

n

xn x = anx0n < M × rn x0n x0 n

n=0

anxn = anx0n

åa z

n

el cambio de nomenclatura es equivalente a hacer x0 = 0 en la expresión ( x - x0 ). Si tomamos un cierto x tal que x < x0 , definiendo la razón r =

x < 1, podemos escribir: x0

3.1. Intervalos de convergencia ge, luego está acotada, existiendo entonces M Ì R tal que anx0n < M , " n Î [ 0,¥). ¥

Cualquier serie de potencias åanxn converge para el valor x = 0 ya que en este caso todos los térn=0

Supongamos que la serie åanxn converge para x = x0, esto nos indica que la sucesión{anx0n} convern=0

minos, excepto a0 se anulan y, en consecuencia, todas las sumas parciales {S n} son iguales a a0. ¥

Demostrémoslo:

Teorema.

convergente para todos los valores de x, tales que x < x0 , y si la serie diverge para que x = x1, podemos afirmar que diverge para todos los valores de x tales que x > x1 . ¥

Si la serie de potencias åanxn converge para x = x0, entonces decimos que la serie es absolutamente n=0

n=0

Si la serie de potencias åanxn converge para x = x0, entonces decimos que la serie es absolutamente

convergente para todos los valores de x, tales que x < x0 , y si la serie diverge para que x = x1, podemos afirmar que diverge para todos los valores de x tales que x > x1 . ¥

Teorema.

Demostrémoslo:

minos, excepto a0 se anulan y, en consecuencia, todas las sumas parciales {S n} son iguales a a0. ¥

Supongamos que la serie åanxn converge para x = x0, esto nos indica que la sucesión{anx0n} convern=0

Cualquier serie de potencias åanxn converge para el valor x = 0 ya que en este caso todos los térn=0

ge, luego está acotada, existiendo entonces M Ì R tal que anx0n < M , " n Î [ 0,¥). ¥

3.1. Intervalos de convergencia Si tomamos un cierto x tal que x < x0 , definiendo la razón r =

x < 1, podemos escribir: x0

el cambio de nomenclatura es equivalente a hacer x0 = 0 en la expresión ( x - x0 ). n

xn x anx = a x n = anx0n < M × rn x0 x0 n n 0

n=0

åa z n

n

n

¥

lo que nos permite compararla con una serie geométrica de razón menor que 1, por lo que sería convergente. Si a la expresión ( x - x0 ) se le denomina z podemos escribir la serie de potencias como: ¥

n=0

Para probar la segunda parte del teorema supondremos que la serie åanx1n diverge, y que existe otro

åa ( x - x n

n=0

¥

0

)n

¥

valor de x, por ejemplo x = x0, con x0 > x1 para el cual åa x converge. Esto ocntradice el enuncia-

Se denomina serie de potencias a la serie funcional cuyos términos son de la forma an ( x- x0 )n, donde an representa una constante. La serie de potencias viene representada por n n 0

n=0

do del teorema ya que nos encontraríamos con un cierto x0 para el cual la serie converge y un cierto x1, siendo x0 > x1 para el cual la serie diverge.

3. SERIE DE POTENCIAS



46


3.2. Radio de convergencia ¥

Dada una serie convergente åanxn, el conjunto C formado por todos los puntos en los que la serie es n=0

convergente está acotado, por lo que existe un extremo superior del mismo. Llamando R al extremo superior de C, tendremos que "x Î C ® x < R, y en consecuencia por el teorema anterior la serie es absolutamente convergente, mientras que si x > R la serie es divergente. A R se le denomina radio de convergencia de la serie, y al intervalo (-R , R ) se le denomina intervalo de convergencia. En base al estudio de R podemos afirmar que: ¥ ì n ï Si R = 0 ® åanx converge para x = 0 = 0 n ï ¥ ï í Si R = +¥ ® åanx n converge para todo x ï n=0 ¥ ï n ïSi R = SupC x ® åanx converge para C î n=0 Para la determinación de las cotas de R, resulta sencillo si conocernos un punto x = x0 la sucesión es convergente, y otro punto x = x1 a partir del cual la sucesión diverge, ya que: x0 £ R £ x1

3.3. Criterios para la determinación del radio de convergencia Teorema. ¥

Sea la serie åanx n para la cual existe Lím n ®¥

n=0

an+1 = L, entonces el radio de convergencia viene dado an

1 por la expresión R = . L Demostrémoslo: Lím n ®¥

an+1x n+1 a = Lím n+1 x = L x n ®¥ a anxn n

1 1 1 y R = , ya que la serie converge para x < y diverge para x > . L L L Teorema. ¥

Para cualquier serie de potencias åanxn, el radio de convergencia toma un valor caracterizado por: n=0

ìR = 0 si Lím sup n a = ¥ n ï n ®¥ ï ï ïR = ¥ si Lím sup n an = 0 n ®¥ í ï ï 1 si 0 < Lím sup n an < ¥ ïR = n ®¥ n Lím a = ¥ sup ï n î n ®¥


47



Demostrémoslo:

48

siendo l una constante a determinar y x Î [ a , b ] . Lím sup n anx n = Lím sup x n an =

f '( a ) f ( n-1( a ) ( x - a )-...( x- a )n-1- l ( x- a )n 1! ( n - 1)! n ®¥

n ®¥

F( x ) = f ( x )- f ( a )-

x Lím sup n an = x L

Para ello consideraremos una función real, F, de variable real definida como sigue: n ®¥

Demostrémoslo:

obtendremos la convergencia cuando x L< 1, lo que se verifica para cualquier valor de x si L = 0, pero si L = +¥ sólo se cumplirá cuando x = 0, en cualquier otro caso sólo se cumple cuando x<

1 L

siendo f ( 0 ( a ) = f ( a ); 0!= 1.

n-1 æ f (k ( a ) ö f (n ( m ) f ( b ) = åç ( b - a )k + ( b - a )n ÷ ç ÷ k ! n ! ø k=0è ¥

Podernos extraer un Corolario: Para una serie de potencias åanxn si definimos L = Lím sup n an y n ®¥

n=0

f (x) se define en [a, b].

2.

f (x) es continua en [a, b].

3.

f (x) tiene derivadas hasta la de orden n en (a, b.)

ì ï R = 0 si L = ¥ ï existe, entonces: íR = ¥ si L = 0 ï 1 si 0 < L < ¥ ïR = î L

Entonces, existe un punto m Î ( a , b ) tal que se verifica:

1.

Dada la función y = f ( x ) sujeta a las siguientes restricciones:

4. TEOREMA DE TAYLOR

4.1. Primera fórmula de Taylor

Las fórmulas de Taylor permiten desarrollar, bajo determinadas condiciones, una función en serie de potencias. Las fórmulas de Taylor permiten desarrollar, bajo determinadas condiciones, una función en serie de potencias.

4.1. Primera fórmula de Taylor

4. TEOREMA DE TAYLOR

Dada la función y = f ( x ) sujeta a las siguientes restricciones:

f (x) tiene derivadas hasta la de orden n en (a, b.)

3.

f (x) es continua en [a, b].

2.

f (x) se define en [a, b].

1.

n=0

Entonces, existe un punto m Î ( a , b ) tal que se verifica:

ì ï R = 0 si L = ¥ ï existe, entonces: íR = ¥ si L = 0 ï 1 R= si 0 < L < ¥ ï î L

n ®¥

Podernos extraer un Corolario: Para una serie de potencias åanxn si definimos L = Lím sup n an y n-1 (n æ (k ö ç f ( a ) ( b - a )k + f ( m ) ( b - a )n ÷ ÷ f ( b ) = åç k! n! ø k=0è ¥

1 L

siendo f ( 0 ( a ) = f ( a ); 0!= 1.

x<

obtendremos la convergencia cuando x L< 1, lo que se verifica para cualquier valor de x si L = 0, pero si L = +¥ sólo se cumplirá cuando x = 0, en cualquier otro caso sólo se cumple cuando Demostrémoslo:

Para ello consideraremos una función real, F, de variable real definida como sigue: n ®¥

x Lím sup n an = x L

f '( a ) f ( n-1( a ) ( x - a )-...( x- a )n-1- l ( x- a )n 1! ( n - 1)! n ®¥

F( x ) = f ( x )- f ( a )-

n ®¥

Lím sup n anx n = Lím sup x n an =

siendo l una constante a determinar y x Î [ a , b ] .

48

Demostrémoslo:



Desarrollo de una función en serie de potencias Por hipótesis podemos aplicar a F(x) el teorema de Rolle ya que esta función satisface: 1.

F(x) está definida en [a, b] F( a ) = 0 F( b ) = f ( b )- f ( a )-

f '( a ) f ( n-1( a ) ( b - a )-...( b - a )n-1- l ( b - a )n 1! ( n - 1)!

2.

F(x) es continua en [a, b] , al ser la composición de funciones continuas.

3.

F(x) es derivable en (a, b) siendo su derivada: F'( x ) = f '( x )-

f '( a ) f ( n-1( a ) ×1-...( x - a )n-2 × ( n - 1)- l ( x- a )n-1× n 1! ( n - 1)!

F'( x ) = f '( x )- f '( a )4.

f ''( a ) f ( n-1( a ) ( x- a )-...( x- a )n-2 - l ( x- a )n-1× n 1! ( n - 2 )!

F( a ) = F( b ) = 0.

Por el teorema de Rolle, para la función F(x) existe un cierto m1 Î ( a , b) tal que F'( m1 ) = 0, así pues, si particularizamos para ese m1, obtendremos: F'( m1 ) = 0 = f '( m1 )- f '( a )-

f ''( a ) f ( n-1( a ) -...( m - a )n-2 - l ( m1- a )n-1 1! ( n - 2 )! 1

Si particularizamos en la expresión de la derivada para x = a tendremos: F'( a ) = f '( a )- f '( a )-

f ''( a ) f ( n-1( a ) ( a - a )-...( a - a )n-2 - l ( a - a )n × n = 0 1! ( n - 2 )!

la función F'( x ) verifica: 1.

Está definida en [a, m1].

2.

Es continua en [a, m1].

3.

Es derivable n – 1 veces en (a, m1).

4.

F'( a ) = F'( m1 ) = 0. Podemos volver a aplicar el teorema de Rolle, existiendo un punto m2 Î ( a , m1 ) tal que F''( m2 ) = 0. F''( x ) = f ''( x )- f ''( a )-

f '''( a ) f ( n-1( a ) ( x - a )n-3 - ln ( n - 1)( x - a )n-2 ( x- a )-...1! ( n - 3 )!

F''( m2 ) = 0 = f ''( m2 )- f ''( a )-

f '''( a ) f ( n-1( a ) ( m2 - a )-...( m - a )n-3 - ln ( n - 1)( m2 - a )n-2 1! ( n - 3 )! 2

si particularizamos para x = a se obtiene: F''( a ) = f ''( a )- f ''( a )-

f '''( a ) f ( n-1( a ) ( a - a )n-3 - ln ( n - 1)( a - a )n-2 = 0 ( a - a )-...1! ( n - 3 )!

así estamos ante una función F''( x ), a la que podemos volver a aplicar el teorema de Rolle ya que satisface: 1.

Está definida en [a, m2].

2.

Es continua en [a, m2].


49


50


con m Î ( a , x ), lo que permite calcular el valor de una ftinción en un punto cualquiera del intervalo conocidas sus n primeras derivadas. 4.

F''( a ) = F''( m2 ) = 0.

k=0


f (x )= å

3.

f (k ( a ) f (n ( m ) ( x- a )k + ( x- a )n k! n!

Podemos volver a aplicar el teorema de Rolle, existiendo un punto intermedio m3 Î ( a , m2 ) tal que F'''( m3 ) = 0. Si recordamos la hipótesis inicial, la función es derivable n veces, luego iterando el proceso antes descrito n – 1 veces llegamos a una expresión para la derivada de orden n – 1. n-1

Teniendo en cuenta que x Î [ a , b ] se puede repetir el razonamiento en un intervalo encajado [a, x] donde se verificarían las hipótesis generales, pudiéndose escribir la expresión de Taylor como:

2.

Se puede optar por la determinación del punto a, sin más que alternar la posición de b y de a en la expresión, sin que por ello se altere la expresión, sólo su morfología.

l.

F( n-1 = f ( n-1( x )- f ( n-1( a )- ln ( n - 1)!( x- a ) = f ( n-1( x )- f ( n-1( a )- ln !( x- a )

Sobre la expresión de la Primera Fórmula de Taylor hay que tener en cuenta:

función que se anula para x = a, así F( n-1( a ) = 0.

2.

Es continua en [a, mn–1].

3.

Es derivable en (a, mn–1).

n-1

f (k ( a ) f (n ( m ) ( b - a )k + ( b - a )n k! n!

Está definida en [a, mn–1].

k=0

1.

f (b )= å

Esta función tiene las siguientes características:

lo que podemos escribir como:

f (n ( m ) f '( a ) f ''( a ) f ( n-1( a ) ( b - a )n-1+ ( b - a )n ( b - a )+ ( b - a )2+...+ 1! 2! ( n - 1)! n!

luego podemos aplicar, una vez más, el teorema de Rolle y, en consecuencia, existe un punto intermedio mn = m Î ( a , mn-1 ) tal que F( n ( m ) = 0. f ( b ) = f ( a )+

F( n ( x ) = f ( n ( x )- 0- ln != f ( n ( x )- ln !

y teniendo en cuenta que F( b ) = 0 llegamos a la expresión, que se denomina Primera Fórmula de Taylor. F( b ) = f ( b )-

F( n ( m ) = 0 = f ( n ( m )- ln !

f '( a ) f ( n-1( a ) ( b - a )-...( b - a )n-1- l( b - a )n 1! ( n - 1)!

f (n ( m ) n! Si introducimos este valor de l en la expresión original,

f '( a ) f ( n-1( a ) ( b - a )-...( b - a )n-1- l( b - a )n 1! ( n - 1)! F( n ( m ) = 0 = f ( n ( m )- ln !

F( b ) = f ( b )-

f (n ( m ) despejando el valor de l obtenemos: l = n! Si introducimos este valor de l en la expresión original,

despejando el valor de l obtenemos: l =

y teniendo en cuenta que F( b ) = 0 llegamos a la expresión, que se denomina Primera Fórmula de Taylor. F( n ( x ) = f ( n ( x )- 0- ln != f ( n ( x )- ln !

f (n ( m ) f '( a ) f ''( a ) f ( n-1( a ) ( b - a )n-1+ ( b - a )n ( b - a )+ ( b - a )2+...+ 1! 2! ( n - 1)! n!

luego podemos aplicar, una vez más, el teorema de Rolle y, en consecuencia, existe un punto intermedio mn = m Î ( a , mn-1 ) tal que F( n ( m ) = 0. Es continua en [a, mn–1].

Está definida en [a, mn–1].

1.

f (k ( a ) f (n ( m ) ( b - a )k + ( b - a )n k! n!

Esta función tiene las siguientes características:

k=0

2.

n-1

f (b )= å

Es derivable en (a, mn–1).

lo que podemos escribir como:

3.

f ( b ) = f ( a )+

función que se anula para x = a, así F( n-1( a ) = 0.

Sobre la expresión de la Primera Fórmula de Taylor hay que tener en cuenta:

Se puede optar por la determinación del punto a, sin más que alternar la posición de b y de a en la expresión, sin que por ello se altere la expresión, sólo su morfología. F( n-1 = f ( n-1( x )- f ( n-1( a )- ln ( n - 1)!( x- a ) = f ( n-1( x )- f ( n-1( a )- ln !( x- a )

l.

Podemos volver a aplicar el teorema de Rolle, existiendo un punto intermedio m3 Î ( a , m2 ) tal que F'''( m3 ) = 0. Si recordamos la hipótesis inicial, la función es derivable n veces, luego iterando el proceso antes descrito n – 1 veces llegamos a una expresión para la derivada de orden n – 1.

Teniendo en cuenta que x Î [ a , b ] se puede repetir el razonamiento en un intervalo encajado [a, x] donde se verificarían las hipótesis generales, pudiéndose escribir la expresión de Taylor como:


3.

k=0

f (k ( a ) f (n ( m ) ( x- a )k + ( x- a )n k! n!

F''( a ) = F''( m2 ) = 0.

n-1

f (x )= å

4.

2.

con m Î ( a , x ), lo que permite calcular el valor de una ftinción en un punto cualquiera del intervalo conocidas sus n primeras derivadas. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


50


4.2. Segunda fórmula de Taylor Si consideramos b muy próximo a a, mn-1- a < b - a , el valor absoluto de l difiere del valor de f (n ( a ) f (a ) tan poco como se desee; y en consecuencia se puede escribir el valor de l como: l = + e n ( b ), n! n! este e n ( b ) es dependiente de b y es tal que Lím e n ( b ) = 0. b ®a Introduciendo esto en la Primera Fórmula de Taylor tenemos: (n

n-1

f (b )= å k=0

n æ f (n ( a ) ö f (k ( a ) f (k ( a ) n ÷ ( b - a )k +ç + e ( b ) ( b a ) = å k ! ( b - a )k + en ( b )( b - a )n ç ÷ n k! è n! ø k=0

Si llamamos jn ( b ) = e n ( b )× n ! y tomamos límites, Lím e n ( b ) = 0 = Lím b ®a

b ®a

jn ( b ) 1 = Lím jn ( b ) Þ Lím jn ( b )= 0 b ®a n! n ! b®a

así, pues, la expresión de Taylor quedaría como: n

f (b )= å k=0

f (n ( a ) j (b ) ( b - a )k + n ( b - a )n k! n!

que constituye la Segunda Fórmula de Taylor, la cual aproxima el valor de la función para cualquier punto dentro del entorno de un punto dado, en el que se conozcan las n primeras derivadas.

4.3. Desarrollo por Taylor Sea y = f (x) una función real de variable real, con las siguientes características: 1.

y = f (x) está definida en el entorno de un punto a, el cual contiene a dicho punto.

2.

y = f (x) es continua en ese entorno.

3.

y = f (x) es derivable n veces en el punto a y en cualquier punto lo suficientemente próximo a a.

4.3.1. Resto de Taylor En la Segunda Fórmula de Taylor para f (x): n

f (x )= å k=0

f (n ( a ) j (x ) ( x- a )k + n ( x- a )n k! n!

jn ( x ) ( x- a )n y representa el error cometido en la apron! ximación de la función y = f (x) como un polinomio en x de grado n. Si tomarnos límites tendremos que: se denomina resto de Taylor a la expresión Rn ( x ) =

LímRn ( x ) = Lím x ®a

x ®a

jn ( x ) ( x- a )n = 0 n!

lo que nos indica que el error cometido será menor cuanto mayor sea el grado del polinomio.


51


52


4.3.2. Desarrollo de Taylor con resto de Lagrange n=0

f (x )= å

f (n ( a ) ( x- a )n n!

Si entre las características que definen a la función y = f (x) incluimos que sea derivable n + 1 veces en el punto a y en cualquier punto lo suficientemente próximo a a, entonces existirá un cierto m Î Ea tal que permite definir f (x) como: ¥

Sea y = f ( x ) una función indefinidamente derivable en- R < x - a < R. Si Rn ( x ) ® 0cuando n ® ¥ entonces f ( x ) puede expresarse como una serie de potencias. n

f (x )= å k=0

f (n ( a ) f ( n+1( m ) ( x- a )k + ( x- a )n+1 k! ( n + 1)!

Teorema.

a lo que se denomina Desarrollo de Taylor con resto de Lagrange de una función en las proximidades de un punto. El resto de Lagrange lo constituye la expresión Rn ( x ) = -

f ( n+1( m ) ( x- a )n+1 ( n + 1)!

donde despejando y haciendo b = a, cuando b tiende a x quedaría: ìm Î ( x, a ) f ( n+1( m ) ( x- a )n+1 con í ( n + 1)! îm Î ( a , x )

Rn ( x ) =

f ( n+1( m ) ( b - m )n 0- Rn ( x ) n! = 0- ( b - x )n+1 - ( n + 1)( b - m )n -

Demostrémoslo:

siendo x < m < b, y tomando j( x ) = ( b - x )n+1, la expresión anterior quedaría como:

Partimos de la expresión:

Rn ( b )- Rn ( x ) R 'n ( m ) = j( b )- j( x ) j'( m ) n

f (b )= å k=0

f (k ( a ) ( b - a )k + Rn ( b ) k!

Sabemos que Rn ( b )= 0, así, eligiendo otra función j( x ) que también se anule en b, y suponiendo que ambas funciones cumplan las condiciones impuestas por el teorema de Cauchy se puede escribir: como a cada valor de a le corresponde otro de Rn podemos considerar que: Rn ( x ) = f ( b )- f ( x )-

f '( x ) f (n ( x ) ( b - x )-...( b - x )n 1! n! R 'n ( x ) = -

f ( n+1( x ) ( b - x )n n!

y al derivar, podemos observar que los términos se reducen unos con otros, quedando la expresión: f ( n+1( x ) ( b - x )n n!

y al derivar, podemos observar que los términos se reducen unos con otros, quedando la expresión: R 'n ( x ) = -

f '( x ) f (n ( x ) ( b - x )-...( b - x )n 1! n!

Rn ( x ) = f ( b )- f ( x )-

Sabemos que Rn ( b )= 0, así, eligiendo otra función j( x ) que también se anule en b, y suponiendo que ambas funciones cumplan las condiciones impuestas por el teorema de Cauchy se puede escribir: como a cada valor de a le corresponde otro de Rn podemos considerar que: k=0

f (k ( a ) ( b - a )k + Rn ( b ) k!

R ( b )- R ( x ) R ' ( m ) n n = n j( b )- j( x ) j'( m )

f (b )= å n

Partimos de la expresión:

siendo x < m < b, y tomando j( x ) = ( b - x )n+1, la expresión anterior quedaría como:

Demostrémoslo:

f ( n+1( m ) ( b - m )n 0- Rn ( x ) n! = 0- ( b - x )n+1 - ( n + 1)( b - m )n

Rn ( x ) =

ìm Î ( x, a ) f ( n+1( m ) ( x- a )n+1 con í ( n + 1)! îm Î ( a , x )

donde despejando y haciendo b = a, cuando b tiende a x quedaría: a lo que se denomina Desarrollo de Taylor con resto de Lagrange de una función en las proximidades de un punto. El resto de Lagrange lo constituye la expresión Rn ( x ) = -

f ( n+1( m ) ( x- a )n+1 ( n + 1)!

n

f (n ( a ) f ( n+1( m ) ( x- a )k + ( x- a )n+1 k! ( n + 1)!

Teorema.

k=0

f (x )= å

Sea y = f ( x ) una función indefinidamente derivable en- R < x - a < R. Si Rn ( x ) ® 0cuando n ® ¥ entonces f ( x ) puede expresarse como una serie de potencias.

Si entre las características que definen a la función y = f (x) incluimos que sea derivable n + 1 veces en el punto a y en cualquier punto lo suficientemente próximo a a, entonces existirá un cierto m Î Ea tal que permite definir f (x) como: ¥

f (x )= å n=0

f (n ( a ) ( x- a )n n!

4.3.2. Desarrollo de Taylor con resto de Lagrange

52



Desarrollo de una función en serie de potencias Para demostrarlo, si aplicamos la fórmula de Taylor a cualquier x de ese intervalo, tenemos: ¥

f (x )= å k=0

n

y si llamamos S n ( x ) = å k=1

f (k ( a ) ( x- a )k + Rn ( x ) k!

(k

f (a ) ( x- a )k tenemos que f ( x )- S n ( x ) = Rn ( x ). k!

Esta serie cuando a = 0 se denomina serie de Mc Laurin. Teorema. Toda serie de potencias es la serie de Taylor de su suma. f (n ( a ) . n!

La demostración es trivial si consideramos que an =

4.4. Infinitésimos. Conceptos relacionados 1.

Una función f definida en un entorno de a, decimos que es un inifinitésimo en a cuando Lím f ( x ) = 0.

2.

Dadas dos funciones f y g que son infinitésimos en a, diremos que f es un infinitésimo de orden supef (x ) rior a g, lo que notaremos como f = 0( g ), cuando Lím = 0. x ®a g ( x )

3.

Dadas dos funciones f y g que son infinitésimos en a, se dice que f es un infinitésimo de orden equivaf (x ) lente a g, lo que notaremos como f ~ g , si Lím = 1. x ®a g ( x )

4.

Si en un límite aparece un infinitésimo como factor, puede ser sustituido por otro infinitésimo de orden equivalente, a excepción de en la suma o diferencia. Para probarlo consideremos f ~ g en a, y consideremos también el Lím f ( x )× h ( x ), entonces:

x ®a

x ®a

Lím f ( x )× h ( x ) = Lím x ®a

x ®a

f (x ) f (x ) Límg ( x )h ( x ) = 1× Límg ( x )h ( x ) = Límg ( x )h ( x ) g ( x )h ( x ) = Lím x ®a g ( x ) x ®a x ®a x ®a g (x )

Proposición. Sea Pn ( x ) un polinomio de Taylor de grado n de f en a, definido como: n

Pn ( x ) = å k=0

f (k ( a ) ( x- a )k k!

se verifica que f ( x )- Pn ( x ) = 0( x- a )n, lo que es equivalente a afirmar que: Lím x ®a

f ( x )- Pn ( x ) =0 ( x - a )n

Demostrémoslo: n

Lím x ®a

f ( x )- Pn ( x ) = Lím x ®a ( x - a )n


f (k ( a ) ( x - a )k k! 0 k=1 = ( x- a )n 0

f ( x )- å

53



f ( x ) está definida en el origen, a = 0, y en un entorno próximo de él.

2.

f ( x ) es continua en ese entorno.

3.

f ( x ) admite n + 1 derivadas finitas en el entorno.

hay que tener en cuenta que:

54

1.

ì0 ï f ( p[( x- a )r ] = í r! ï r- p îr( r- 1)...( r- p + 1)( x - a )

si p > r si p = r si r > p

Habíamos enunciado anteriormente el desarrollo de Mc Laurin definiendo en el desarrollo de Taylor, a en el origen, así pues las condiciones que se imponen a una función real de variable real serán las siguientes: para deshacer la indeterminación aplicamos la regla de L’Hôpital, reiteradamente, con lo que queda:

5. DESARROLLO DE Mc LAURIN

x ®a

f ( x )- P ( x ) f ( n ( x )- f ( n ( a ) n = Lím =0 x ®a n! ( x - a )n n!

b- a n!

Lím

Rn ( b ) =

lo que nos indica que f ( x )- P ( x ) es un infinitésimo de orden superior a ( x- a )n, por lo que se aproxima a cero, en un entorno de a más rápidamente que ( x- a )n y esto resulta equivalente a afirmar que, en un entorno de a, Pn ( x ) se aproxima a f (x) más rápidamente que ( x- a )n se aproxima a 0. Como la función ( x- a )n toma valores muy próximos a 0, para valores de x muy próximos a a, los polinomios de Taylor son una buena aproximación a la función f (x) en puntos suficientemente próximos a a, por lo que es apropiado utilizarlos para calcular valores aproximados de la función en puntos próximos a a, conociendo f y sus derivadas. Rn ( b ) £ M

f (n ( m ) b- a

£M

n

n

b- a f (n ( m ) . Y esto es cierto ya que sabiendo que Rn ( b ) = ( b - a )n con a < m < b, entonces: n! n! n

f (n ( m ) ( b - a )n con a < m < b, bajo ciertas condiciones puede fijarse una cota de este error. n! Así, sea f una función definida en [a, b] y tal que sus (n – 1) primeras derivadas son continuas en [a, b], y existiendo en (a, b) , existe, además, un cierto M Î ( a , b) tal que " x Î ( a , b) ® f ( n ( b ) £ M , entonces,

y como Rn ( b ) =

4.5. Acotación del error

f ( b )- Pn-1( b ) = Rn ( b )

Las condiciones del Teorema de Taylor nos indican:

En consecuencia $ m Î ( a , b ) tal que f ( b ) = Pn-1( b )+ Rn ( b ), por lo que el error cometido, en valor absoluto, al tomar el polinomio de Taylor (n – 1) - ésimo en lugar de la función, vendrá dado por el resto: Que existe f ( n en (a, b).

4.

Que f tiene derivadas hasta la orden n- 1en (a, b).

3.

Que f es continua en [a, b].

2.

Que f es una función definida en [a, b].

1.

1.

Que f es una función definida en [a, b].

2.

Que f es continua en [a, b].

3.

Que f tiene derivadas hasta la orden n- 1en (a, b).

4.

Que existe f ( n en (a, b).

En consecuencia $ m Î ( a , b ) tal que f ( b ) = Pn-1( b )+ Rn ( b ), por lo que el error cometido, en valor absoluto, al tomar el polinomio de Taylor (n – 1) - ésimo en lugar de la función, vendrá dado por el resto: Las condiciones del Teorema de Taylor nos indican:

f ( b )- Pn-1( b ) = Rn ( b )

4.5. Acotación del error

f (n ( m ) y como Rn ( b ) = ( b - a )n con a < m < b, bajo ciertas condiciones puede fijarse una cota de este error. n! Así, sea f una función definida en [a, b] y tal que sus (n – 1) primeras derivadas son continuas en [a, b], y existiendo en (a, b) , existe, además, un cierto M Î ( a , b) tal que " x Î ( a , b) ® f ( n ( b ) £ M , entonces,

lo que nos indica que f ( x )- P ( x ) es un infinitésimo de orden superior a ( x- a )n, por lo que se aproxima a cero, en un entorno de a más rápidamente que ( x- a )n y esto resulta equivalente a afirmar que, en un entorno de a, Pn ( x ) se aproxima a f (x) más rápidamente que ( x- a )n se aproxima a 0. Como la función ( x- a )n toma valores muy próximos a 0, para valores de x muy próximos a a, los polinomios de Taylor son una buena aproximación a la función f (x) en puntos suficientemente próximos a a, por lo que es apropiado utilizarlos para calcular valores aproximados de la función en puntos próximos a a, conociendo f y sus derivadas. n

b- a f (n ( m ) . Y esto es cierto ya que sabiendo que Rn ( b ) = Rn ( b ) £ M ( b - a )n con a < m < b, entonces: n! n! Rn ( b ) =

f (n ( m ) b- a

n

£M

n!

b- a n!

n

x ®a

Lím

f ( x )- Pn ( x ) f ( n ( x )- f ( n ( a ) = Lím =0 n x ®a n! ( x- a )

5. DESARROLLO DE Mc LAURIN

para deshacer la indeterminación aplicamos la regla de L’Hôpital, reiteradamente, con lo que queda:

Habíamos enunciado anteriormente el desarrollo de Mc Laurin definiendo en el desarrollo de Taylor, a en el origen, así pues las condiciones que se imponen a una función real de variable real serán las siguientes: ì0 ï f [( x- a ) ] = í r! ï r- p îr( r- 1)...( r- p + 1)( x - a )

si p > r si p = r si r > p

f ( x ) es continua en ese entorno.

2.

f ( x ) está definida en el origen, a = 0, y en un entorno próximo de él.

1. 3.

r

(p

hay que tener en cuenta que:

f ( x ) admite n + 1 derivadas finitas en el entorno.

54



Desarrollo de una función en serie de potencias Entonces, existe un punto m del entorno tal que: n

f (x )= å k=0

f (n ( 0) k x + Rn ( x ) k!

donde Rn es el resto de Lagrange. Particularizando el desarrollo de Mc Laurin de una función f ( x ) a un cierto punto b conocido, obtendremos: n

f (b )= å k=0

f (n ( 0) k b + Rn ( b ) k!

esto nos permite determinar el valor de la función en b.

6. DESARROLLO EN SERIE CON RESTO DE CAUCHY Impuestas las mismas condiciones que en desarrollo de Taylor con resto de Lagrange, bastaría con considerar un cierto m del entorno de a, con lo que obtendríamos: n

f (x )= å k=0

f (n ( a ) f ( n+1( m ) ( x- a )k + ( x- m )n ( x- a ) k! n!

Para demostrarlo, si sabemos que Rn ( b )= 0, así, eligiendo otra función j( x ) que también se anule en b, y suponiendo que ambas funciones cumplan las condiciones impuestas por el teorema de Cauchy se puede escribir: Rn ( b )- Rn ( x ) R 'n ( m ) = j( b )- j( x ) j'( m ) siendo x < m < b, y tomando j( x ) = ( b - x ), la expresión anterior quedaría como: 0- Rn ( x ) = 0- ( b - x )

-

f ( n+1( m ) ( b - m )n n! -1

donde despejando y haciendo b = a, cuando b tiende a x quedaría: Rn ( x ) =

f ( n+1( m ) ( x- m )n ( x- a ) n!

que es el resto de Cauchy. Si el desarrollo es de Mc Laurin con resto de Cauchy, bastaría con hace a = 0, con lo que quedaría: n

f (x )= å k=0

f ( n ( 0 ) k f ( n+1( m ) x + ( x- m )n x k! n!

7. APLICACIONES AL ESTUDIO LOCAL DE FUNCIONES 7.1. Monotonía: crecimiento y decrecimiento Una función y = f ( x ) decimos que es creciente en un cierto punto x0 cuando en un determinado entorno de ese punto se verifica que f (x0) es mayor o igual que los valores que toma f ( x ) para x situados a la izquierda de x0, mientras que f ( x0 ) es menor o igual que los valores que toma f ( x )para x situados a la derecha de x0. (Si es mayor o menor, respectivamente, pero no igual, decimos que f ( x ) es estrictamente creciente). TEMARIO DE MATEMÁTICAS. PRUEBA A

55


56


f '( x0 ) no puede ser mayor que cero ya que en ese caso f (x) sería creciente, pero tampoco puede ser f '( x0 ) menor que cero porque f (x) sería decreciente. Luego el único valor posible para f '( x0 ) será cero.

Una función y = f ( x ) decimos que es decreciente en un cierto punto x0 cuando en un determinado entorno de ese punto se verifica que f (x0) es menor o igual que los valores que toma f ( x )para x situados a la izquierda de x0, mientras que f ( x0 ) es mayor o igual que los valores que toma f ( x )para x situados a la derecha de x0. (Si es menor o mayor, respectivamente, pero no igual, decimos que f ( x )es estrictamente decreciente). Definimos la monotonía en un intervalo afirmando que una función y = f ( x ) es creciente (o decreciente) en un intervalo cuando es creciente (o decreciente) en todos y cada uno de los puntos de ese intervalo. Demostrémoslo.

Si una función f (x) admite un extremo relativo en un punto x0, entonces f '( x0 ) = 0. Teorema. Condición necesaria de existencia de máximo y mínimo.

7.2. Criterios de crecimiento y decrecimiento

Diremos que una función f ( x ), tiene un máximo absoluto en un punto x0 de un intervalo cerrado, si f ( x0 ) es mayor que cualquier otro posible valor de la función en ese intervalo. Y diremos que una función f ( x ), tiene un mínimo absoluto en un punto x0 de un intervalo cerrado, si f ( x0 ) es menor que cualquier otro posible valor de la función en ese intervalo. Teorema.

Una función f ( x ) cuya primera derivada no se anula en el punto x0 es estrictamente creciente si f '( x0 ) > 0. Análogamente, una función cuya primera derivada no se anula en el punto x0 es estrictamente decreciente si f '( x0 ) < 0. f ( x0 ) < f ( x ), " x|0 < x - x0 < d

Análogamente, dada una función f ( x ), diremos que tiene un mínimo relativo en un punto x0, si f ( x0 ) es menor que cualquier otro posible valor de la función en un cierto entorno del punto x0, lo que nos indica la existencia de un cierto d > 0 tal que: Demostrémoslo.

Haremos la demostración para el caso de f '( x0 ) > 0, siendo similar en el otro. Si f '( x0 ) > 0, entonces el cociente incremental

Dy0 f ( x )- f ( x0 ) será positivo ya que es positivo = Dx0 x - x0

f ( x0 ) > f ( x ), " x|0 < x - x0 < d

Dada una función f ( x ), diremos que tiene un máximo relativo en un punto x0, si f ( x0 ) es mayor que cualquier otro posible valor de la función en un cierto entorno del punto x0, lo que nos indica la existencia de un cierto d > 0 tal que: su límite en un cierto entorno de x0.

ìsi x > x0 Þ f ( x ) > f ( x0 ) ï í ï îsi x < x0 Þ f ( x ) < f ( x0 )

7.3. Extremos relativos. Máximos y mínimos

lo que caracteriza, como hemos visto anteriormente, a la función como creciente.

lo que caracteriza, como hemos visto anteriormente, a la función como creciente. ìsi x > x0 Þ f ( x ) > f ( x0 ) ï í ï îsi x < x0 Þ f ( x ) < f ( x0 )

7.3. Extremos relativos. Máximos y mínimos

Dada una función f ( x ), diremos que tiene un máximo relativo en un punto x0, si f ( x0 ) es mayor que cualquier otro posible valor de la función en un cierto entorno del punto x0, lo que nos indica la existencia de un cierto d > 0 tal que: su límite en un cierto entorno de x0.

Dy f ( x )- f ( x0 ) 0 será positivo ya que es positivo = Dx0 x - x0

f ( x0 ) > f ( x ), " x|0 < x - x0 < d

Si f '( x0 ) > 0, entonces el cociente incremental

Análogamente, dada una función f ( x ), diremos que tiene un mínimo relativo en un punto x0, si f ( x0 ) es menor que cualquier otro posible valor de la función en un cierto entorno del punto x0, lo que nos indica la existencia de un cierto d > 0 tal que: Haremos la demostración para el caso de f '( x0 ) > 0, siendo similar en el otro. Demostrémoslo.

f ( x0 ) < f ( x ), " x|0 < x - x0 < d

Una función f ( x ) cuya primera derivada no se anula en el punto x0 es estrictamente creciente si f '( x0 ) > 0. Análogamente, una función cuya primera derivada no se anula en el punto x0 es estrictamente decreciente si f '( x0 ) < 0.

Diremos que una función f ( x ), tiene un máximo absoluto en un punto x0 de un intervalo cerrado, si f ( x0 ) es mayor que cualquier otro posible valor de la función en ese intervalo. Y diremos que una función f ( x ), tiene un mínimo absoluto en un punto x0 de un intervalo cerrado, si f ( x0 ) es menor que cualquier otro posible valor de la función en ese intervalo. Teorema.

7.2. Criterios de crecimiento y decrecimiento

Teorema. Condición necesaria de existencia de máximo y mínimo. Una función y = f ( x ) decimos que es decreciente en un cierto punto x0 cuando en un determinado entorno de ese punto se verifica que f (x0) es menor o igual que los valores que toma f ( x )para x situados a la izquierda de x0, mientras que f ( x0 ) es mayor o igual que los valores que toma f ( x )para x situados a la derecha de x0. (Si es menor o mayor, respectivamente, pero no igual, decimos que f ( x )es estrictamente decreciente). Definimos la monotonía en un intervalo afirmando que una función y = f ( x ) es creciente (o decreciente) en un intervalo cuando es creciente (o decreciente) en todos y cada uno de los puntos de ese intervalo. Si una función f (x) admite un extremo relativo en un punto x0, entonces f '( x0 ) = 0.

Demostrémoslo.

f '( x0 ) no puede ser mayor que cero ya que en ese caso f (x) sería creciente, pero tampoco puede ser f '( x0 ) menor que cero porque f (x) sería decreciente. Luego el único valor posible para f '( x0 ) será cero. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


56


7.3.1. Condiciones suficientes para la existencia de extremo relativo Teorema. Sea una función f ( x ) tal que f '( x0 ) = 0 y f ''( x0 ) > 0, podemos afirmar que la función presenta un mínimo relativo para x = x0. Demostrémoslo: Desarrollamos por Taylor hasta la segunda derivada la función f (x). f ( x ) = f ( x0 )+

f '( x0 ) f ''( x0 ) ( x- x0 )+ ( x- x0 )2 + R2 ( x ) 1! 2!

habíamos visto que la condición necesaria para la existencia de extremo imponía que f '( x0 ) = 0, luef ''( x0 ) go teniendo en cuenta que R2 ( x ) < ( x - x0 )2 , podemos admitir que signo ( f ( x )- f ( x0 )) = 2! æ f ''( x0 ) ö = signoç ( x- x0 )2 ÷, y en consecuencia, al ser f ''( x0 ) > 0 también será positivo f ( x )- f ( x0 ), è 2! ø para un entorno simétrico de x0, es decir, f ( x0 ) < f ( x ), " x|0 < x - x0 < d, pudiendo concluir que f ( x ) presenta un mínimo relativo para x = x0. Teorema. Sea una función f ( x ) tal que f '( x0 ) = 0 y f ''( x0 ) < 0, podemos afirmar que la función presenta un máximo relativo para x = x0. Demostrémoslo: Una vez más, desarrollamos por Taylor hasta la segunda derivada la función f ( x ). f ( x ) = f ( x0 )+

f '( x0 ) f ''( x0 ) ( x- x0 )+ ( x- x0 )2 + R2 ( x ) 1! 2!

habíamos visto que la condición necesaria para la existencia de extremo imponía que f '( x0 ) = 0, luef ''( x0 ) go teniendo en cuenta que R2 ( x ) < ( x - x0 )2 , podemos admitir que signo ( f ( x )- f ( x0 )) = 2! æ f ''( x0 ) ö = signoç ( x- x0 )2 ÷, y en consecuencia, al ser f ''( x0 ) < 0 también será negativo f ( x )- f ( x0 ), è 2! ø para un entorno simétrico de x0, es decir, f ( x0 ) > f ( x ), " x|0 < x - x0 < d, pudiendo concluir que f ( x ) presenta un máximo relativo para x = x0.

7.4. Curvatura. Concavidad, convexidad y puntos de inflexión Decimos que una función f ( x ) es cóncava en un intervalo cuando la recta tangente a la gráfica de la función en cualquier punto del intervalo está situada por debajo de la gráfica de la función en cualquier punto del intervalo a excepción del punto de tangencia. Análogamente, decimos que una función f ( x ) es convexa en un intervalo cuando la recta tangente a la gráfica de la función en cualquier punto del intervalo está situada por encima de la gráfica de la función en cualquier punto del intervalo a excepción del punto de tangencia. Podemos definir, también, la curvatura a partir de los siguientes criterios: La curvatura de la función f ( x )es cóncava en x0, si existe un entorno E ( x0 , r ) en el que las diferencias entre la ordenada de la curva y la ordenada de la tangente a la curva en x0 sea negativa. Análogamente la curvatura será convexa si las diferencias son positivas, en ambos casos " x Î E * ( x0 , r ). Una función será cóncava o convexa en un intervalo si lo es en cada uno de los puntos del mismo.


57


58


Si la primera derivada, en el punto x0, no nula de la función f ( x ) es de orden impar, la función presenta un punto de inflexión en x0. Teorema.

Sea la función y = f ( x ), si existe f ''( x0 ) y f ''( x0 ) < 0, cuando x0 no es un punto de tangencia, la curva representativa de esa función es cóncava en x0. Teorema.

Dada la función f ( x )diremos que presenta un punto de inflexión en x0, si la diferencia entre la ordenada de la función y la ordenada de la tangente cambia de signo a la izquierda y a la derecha del punto x0. Demostrémoslo.

Desarrollamos por Taylor hasta la segunda derivada la función f ( x ).

f '( x0 ) f ''( x0 ) ( x- x0 )+ ( x- x0 )2 + R2 ( x ) 1! 2!

Definición de punto de inflexión.

f ( x ) = f ( x0 )+

por otra parte la ecuación de la recta tangente a la curva en x0 es:

æ f ''( x0 ) ö y como ya habíamos visto signo ( f ( x )- g ( x )) = signoç ( x- x0 )2 ÷y si, como hemos afirmaè 2! ø do, f ''( x0 ) > 0, también será positivo f ( x )- g ( x ) y en consecuencia la función será convexa en x0. g ( x ) = f ( x0 )+ f '( x0 )( x - x0 )

estudiamos las diferencias de las ordenadas de la curva y la tangente: f ''( x0 ) ( x- x )2 + R2 ( x ) 2!

f ''( x0 ) ( x- x )2 + R2 ( x ) 2! f ( x )- g ( x ) =

f ( x )- g ( x ) =

æ f ''( x0 ) ö y como ya habíamos visto signo ( f ( x )- g ( x )) = signoç ( x- x0 )2 ÷y si, como hemos afirmaè 2! ø do, f ''( x0 ) < 0, también será negativo f ( x )- g ( x ) y en consecuencia la función será cóncava en x0. estudiamos las diferencias de las ordenadas de la curva y la tangente: g ( x ) = f ( x0 )+ f '( x0 )( x - x0 )

por otra parte la ecuación de la recta tangente a la curva en x0 es: f ( x ) = f ( x0 )+

f '( x ) f ''( x0 ) 0 ( x- x0 )+ ( x- x0 )2 + R2 ( x ) 1! 2!

Teorema.

Sea la función y = f ( x ), si existe f ''( x0 ) y f ''( x0 ) > 0, cuando x0 no es un punto de tangencia, la curva representativa de esa función es convexa en x0.

Al igual que en la demostración anterior, volvemos a desarrollar por Taylor hasta la segunda derivada la función f ( x ). Demostrémoslo:

Demostrémoslo:

Al igual que en la demostración anterior, volvemos a desarrollar por Taylor hasta la segunda derivada la función f ( x ).

Sea la función y = f ( x ), si existe f ''( x0 ) y f ''( x0 ) > 0, cuando x0 no es un punto de tangencia, la curva representativa de esa función es convexa en x0. f '( x0 ) f ''( x0 ) ( x- x0 )+ ( x- x0 )2 + R2 ( x ) 1! 2!

Teorema.

f ( x ) = f ( x0 )+

por otra parte la ecuación de la recta tangente a la curva en x0 es:

æ f ''( x ) ö 0 y como ya habíamos visto signo ( f ( x )- g ( x )) = signoç ( x- x0 )2 ÷y si, como hemos afirmaè 2! ø do, f ''( x0 ) < 0, también será negativo f ( x )- g ( x ) y en consecuencia la función será cóncava en x0. g ( x ) = f ( x0 )+ f '( x0 )( x - x0 )

estudiamos las diferencias de las ordenadas de la curva y la tangente: f ''( x0 ) ( x- x )2 + R2 ( x ) 2!

f ''( x0 ) ( x- x )2 + R2 ( x ) 2! f ( x )- g ( x ) =

f ( x )- g ( x ) =

æ f ''( x0 ) ö y como ya habíamos visto signo ( f ( x )- g ( x )) = signoç ( x- x0 )2 ÷y si, como hemos afirmaè 2! ø do, f ''( x0 ) > 0, también será positivo f ( x )- g ( x ) y en consecuencia la función será convexa en x0. estudiamos las diferencias de las ordenadas de la curva y la tangente: g ( x ) = f ( x0 )+ f '( x0 )( x - x0 )

por otra parte la ecuación de la recta tangente a la curva en x0 es: f ( x ) = f ( x0 )+

f '( x ) f ''( x0 ) 0 ( x- x0 )+ ( x- x0 )2 + R2 ( x ) 1! 2!

Definición de punto de inflexión.

Dada la función f ( x )diremos que presenta un punto de inflexión en x0, si la diferencia entre la ordenada de la función y la ordenada de la tangente cambia de signo a la izquierda y a la derecha del punto x0. Desarrollamos por Taylor hasta la segunda derivada la función f ( x ). Demostrémoslo.

Sea la función y = f ( x ), si existe f ''( x0 ) y f ''( x0 ) < 0, cuando x0 no es un punto de tangencia, la curva representativa de esa función es cóncava en x0. Teorema.

Si la primera derivada, en el punto x0, no nula de la función f ( x ) es de orden impar, la función presenta un punto de inflexión en x0. Teorema.



58

Desarrollo de una función en serie de potencias Demostrémoslo. Supongamos que las sucesivas derivadas en x0, de la función f ( x ) son nulas hasta una cierta f ( n ( x0 ) ¹ 0, n Î N * (n impar). Desarrollamos por Taylor hasta esa derivada para x = x0 n

f (x )= å k=0

f ( k ( x0 ) ( x- x0 )k + Rn ( x ) k!

y teniendo en cuenta la ecuación de la recta tangente a la curva que pasa por el punto ( x0 , f ( x0 )), que sería g ( x ) = f ( x0 )+ f '( x0 )( x - x0 ), la diferencia entre las ordenadas vendría dada por: f ( n ( x0 ) ( x- x )n + Rn ( x ) n! y, una vez más, considerando los signos, sabemos que æ f ( n ( x0 ) ö signo ( f ( x )- g ( x )) = signoç ( x- x0 )n ÷ ç ÷ n ! è ø f ( x )- g ( x ) =

lo que presenta las siguientes posibilidades para n impar.

x < x0 (x - x0 )n < 0 x > x0 (x - x0 )n > 0

f ( n (x0 ) > 0

f ( n (x0 ) < 0

f (x ) - g (x ) < 0

f (x ) - g (x ) > 0

f (x ) - g (x ) > 0

f (x ) - g (x ) < 0

luego, la presencia de distintos signos nos indica la existencia de un punto de inflexión.

7.5. Generalización de la determinación de máximos y mínimos Teorema. Si la primera derivada, en el punto x0, no nula de la función f ( x ) es de orden par, la función presenta un mínimo relativo en x0, si f ( n ( x0 ) > 0 y presenta un máximo relativo si f ( n ( x0 ) < 0. Demostrémoslo. Desarrollamos por Taylor en x0, hasta n par. n

f (x )= å k=0

f ( k ( x0 ) ( x- x0 )k + Rn ( x ) k!

lo que, dado que las derivadas anteriores son nulas nos quedaría como: f ( n ( x0 ) f ( x ) = f ( x0 )+ ( x- x0 )n + Rn ( x ) n! y basándonos, una vez más, en la igualdad de signos tenemos: æ f ( n ( x0 ) ö signo ( f ( x )- g ( x )) = signoç ( x- x0 )n ÷ ç ÷ è n! ø y en consecuencia: ìSi í îSi

f ( n ( x0 ) > 0 Þ f ( x ) > f ( x0 ) ® Mínimo relativo en x0 f ( n ( x0 ) < 0 Þ f ( x ) < f ( x0 ) ® Máximo relativo en x0


59

TEMA

28 Estudio global de funciones. Aplicaciones a la representación gráfica de funciones

Fulgencio García Gómez



62



INTRODUCCIÓN

2.

CONTINUIDAD EN UN INTERVALO 2.1. Teorema de Bolzano 2.2. Teorema del valor intermedio

3.

ACOTACIÓN DE FUNCIONES CONTINUAS

4.

PROPIEDADES DE LAS FUNCIONES DERIVABLES 4.1. Determinación de máximos y mínimos absolutos en un intervalo cerrado 4.2. Teorema del valor medio para derivadas

5.

CRECIMIENTO Y DECRECIMIENTO DE UNA FUNCIÓN

6.

MÁXIMOS Y MÍNIMOS LOCALES

7.

CONCAVIDAD, CONVEXIDAD Y PUNTOS DE INFLEXIÓN

8.

ASÍNTOTAS

9.

ESTUDIO Y REPRESENTACIÓN DE CURVAS EXPLÍCITAS 9.1. Determinación del dominio o campo de existencia 9.2. Determinación de las simetrías de la función 9.3. Periodicidad 9.4. Cortes con los ejes y regionamiento 9.5. Crecimiento y decrecimiento 9.6. Máximos y mínimos 9.7. Concavidad y convexidad. Puntos de inflexión 9.8. Asíntotas

10.

REPRESENTACIÓN DE UNA CURVA DADA POR SUS ECUACIONES EN FORMA PARAMÉTRICA ESTUDIO Y REPRESENTACIÓN DE CURVAS EXPLÍCITAS 9.1. Determinación del dominio o campo de existencia 9.2. Determinación de las simetrías de la función 9.3. Periodicidad 9.4. Cortes con los ejes y regionamiento 9.5. Crecimiento y decrecimiento 9.6. Máximos y mínimos 9.7. Concavidad y convexidad. Puntos de inflexión 9.8. Asíntotas

9.

ASÍNTOTAS

8.

CONCAVIDAD, CONVEXIDAD Y PUNTOS DE INFLEXIÓN

7.

MÁXIMOS Y MÍNIMOS LOCALES

6.

CRECIMIENTO Y DECRECIMIENTO DE UNA FUNCIÓN

5.

PROPIEDADES DE LAS FUNCIONES DERIVABLES 4.1. Determinación de máximos y mínimos absolutos en un intervalo cerrado 4.2. Teorema del valor medio para derivadas

4.

ACOTACIÓN DE FUNCIONES CONTINUAS

3.

CONTINUIDAD EN UN INTERVALO 2.1. Teorema de Bolzano 2.2. Teorema del valor intermedio

2.

INTRODUCCIÓN

1.

10.

REPRESENTACIÓN DE UNA CURVA DADA POR SUS ECUACIONES EN FORMA PARAMÉTRICA



62

Estudio global de funciones

1. INTRODUCCIÓN Para estudiar globalmente una función nos harán falta conceptos desarrollados en temas anteriores, tanto relativos al estudio local de una función (ya que la representación global de una función supone estudiarla localmente en todos los puntos de su dominio), como los referidos a las derivadas y ramas infinitas o asíntotas. Así, empezaremos dando la definición de función, y aplicaremos las derivadas sucesivas de una función en el estudio de máximos, mínimos, intervalos de crecimiento y decrecimiento, puntos de inflexión, intervalos de concavidad y convexidad, y por último haremos un estudio de sus ramas infinitas o asíntotas. Los orígenes de la noción de función y de su influencia significativa en el desarrollo de la ciencia pueden fijarse en el siglo XVII, apareciendo explícitamente en Leibniz (1692) y siendo utilizado por los Bernoulli desde 1694. Se debe a Euler en 1734 la introducción del símbolo f(x) y el concepto general de función algebraica. El problema de la cuerda vibrante, resuelto por D’Alembert (1747), indujo a Euler a admitir funciones arbitrarias definidas gráficamente, puesto que la forma inicial de la cuerda puede ser arbitraria. Además Bernoulli dio una expresión por serie trigonométrica de la forma de la cuerda en cada momento, por lo que hubo que suprimir la distinción entre función arbitraria y función matemática ya que aquellas son expresables mediante operaciones aritméticas. Todo esto condujo a prescindir del modo de dar la correspondencia entre los valores de x y los de y, para atender solamente a la correspondencia en sí misma, y así quedó establecido por Dirichlet en 1854 el concepto general de función como correspondencia arbitraria entre dos variables. Así, diremos que una variable y es función de otra variable x, cuando a cada valor de x (dentro de un cierto conjunto X, llamado campo de variación de x) corresponde un valor determinado de y (función uniforme) o varios valores de y (función multiforme). En lo sucesivo y mientras no se diga lo contrario, con la palabra función nos referiremos exclusivamente a funciones uniformes. Como se ha dicho anteriormente, la continuidad y derivabilidad de funciones se ha estudiado con profundidad en otros temas. Lo que haremos a continuación será enunciar teoremas basados en la continuidad y derivabilidad de funciones, pero aplicados a intervalos con objeto de poder estudiar las funciones de forma global.

2. CONTINUIDAD EN UN INTERVALO 2.1. Teorema de Bolzano Bernardo Bolzano (1781-1848), sacerdote católico, fue uno de los primeros en reconocer que muchas de las propiedades sobre funciones continuas que parecían obvias, requerían una demostración formal. Sus demostraciones referentes a continuidad fueron publicadas en 1850 en su importante obra póstuma Paradojas del infinito. Uno de sus resultados es conocido como el teorema que lleva su nombre y que enunciamos como sigue: Teorema (1) de Bolzano. Sea f una función continua en todos los puntos del intervalo cerrado [a,b] y supongamos que f(a) y f(b) tienen signos opuestos. Existe entonces por lo menos un punto c en el intervalo abierto (a,b) tal que f ( c )= 0. (Gráfica en figura 1). Para demostrar el teorema de Bolzano, enunciaremos y demostraremos otro teorema o propiedad sobre las funciones continuas. Teorema (2) de la conservación del signo. Sea f una función continua en un punto c y supongamos que f ( c )¹ 0. Existe entonces un intervalo ( c – d, c+ d ) en el que f tiene el mismo signo que f ( c ). Demostración: Supongamos que f ( c )> 0. Por ser continua en c, para cada e > 0, existe un d > 0, tal que: f ( c ) – e < f ( x ) < f ( c )+ e siempre que c – d < x < c + d. Si tomamos el d correspondiente a e = f ( c ) / 2 (este valor de e es positivo), transformamos la desigualdad anterior en: f (c ) 3 f (c ) < f (x )< 2 2


63


64


siempre que c – d < x < c + d. de donde podemos deducir que f ( x )> 0 en ese intervalo y por tanto f(x) y f ( c ) tienen el mismo signo en ese intervalo. f (c ) y se Si f ( c )< 0 se toma el d correspondiente a e = – 2 llega a la misma conclusión.

Demostración: Basta aplicar el teorema de Bolzano a la función g ( x ) = f ( x ) – c, que es una función continua en [ a , b ].

Teorema (3) del valor intermedio. Sea f ( x ) una función continua en el intervalo [ a , b ]. Entonces f ( x ) toma todos los valores comprendidos entre f ( a ) y f ( b ), es decir que para todo valor c tal que f ( a ) < c < f ( b ) (suponiendo que f ( a ) < f ( b )), existe un valor z Î ( a , b ) tal que f ( z )= c. a

c

b

Es una consecuencia inmediata del teorema de Bolzano y su demostración se basa en el mismo, apareciendo en algunos textos como corolario del teorema de Bolzano. Lo enunciamos a continuación:

2.2. Teorema del valor intermedio

Figura 1.

Además a < c < b, puesto que f ( a )< 0y f ( b )> 0, con lo que queda demostrado el teorema de Bolzano. Demostración del teorema de Bolzano:

Sólo queda la posibilidad de que f ( c )= 0.

–

Si f ( c )< 0, hay un intervalo ( c – d, c+ d ) o [c, c+ d) si c = a, en el cual f es negativa y por tanto f ( x )< 0 para algún x > c, contradiciendo también la hipótesis de que c es una cota superior de S, por lo que f ( c )< 0 también es imposible.

–

Si f ( c )> 0hay un intervalo ( c – d, c+ d ) o ( c – d, b] si c = b en el que f ( x ) es positivo si x pertenece a ese intervalo. Por tanto ningún punto de S puede estar a la derecha de c – d, y por tanto c – d es una cota superior del conjunto S, contradiciendo la hipótesis de que c es el extremo superior de S, ya que c – d < c. Por tanto, la desigualdad f ( c )> 0 es imposible.

–

Supongamos sin perder generalidad que f ( a )< 0y f ( b )> 0. Puede haber muchos valores de x entre a y b, para los cuales f ( x )= 0, aunque nos bastará demostrar la existencia de uno, y lo haremos determinando el mayor x para el cual f ( x )= 0. Sea S el conjunto de todos los puntos del intervalo [ a , b ] para los cuales f ( x )£ 0. Al menos tenemos un punto en S, pues f ( a )< 0, por lo que S será un conjunto no vacío y además está acotado superiormente puesto que todos sus puntos están en el intervalo [ a , b ], y puesto que todo conjunto no vacío de números reales que está acotado superiormente tiene un extremo superior, llamaremos al mismo c. Se trata de demostrar que f ( c )= 0. Para el valor de la función en c, tenemos tres posibilidades: f ( c )> 0, f ( c )< 0 y f ( c )= 0.

–

Si f ( c )> 0hay un intervalo ( c – d, c+ d ) o ( c – d, b] si c = b en el que f ( x ) es positivo si x pertenece a ese intervalo. Por tanto ningún punto de S puede estar a la derecha de c – d, y por tanto c – d es una cota superior del conjunto S, contradiciendo la hipótesis de que c es el extremo superior de S, ya que c – d < c. Por tanto, la desigualdad f ( c )> 0 es imposible.

Supongamos sin perder generalidad que f ( a )< 0y f ( b )> 0. Puede haber muchos valores de x entre a y b, para los cuales f ( x )= 0, aunque nos bastará demostrar la existencia de uno, y lo haremos determinando el mayor x para el cual f ( x )= 0. Sea S el conjunto de todos los puntos del intervalo [ a , b ] para los cuales f ( x )£ 0. Al menos tenemos un punto en S, pues f ( a )< 0, por lo que S será un conjunto no vacío y además está acotado superiormente puesto que todos sus puntos están en el intervalo [ a , b ], y puesto que todo conjunto no vacío de números reales que está acotado superiormente tiene un extremo superior, llamaremos al mismo c. Se trata de demostrar que f ( c )= 0. Para el valor de la función en c, tenemos tres posibilidades: f ( c )> 0, f ( c )< 0 y f ( c )= 0.

–

Si f ( c )< 0, hay un intervalo ( c – d, c+ d ) o [c, c+ d) si c = a, en el cual f es negativa y por tanto f ( x )< 0 para algún x > c, contradiciendo también la hipótesis de que c es una cota superior de S, por lo que f ( c )< 0 también es imposible.

–

Sólo queda la posibilidad de que f ( c )= 0.

Demostración del teorema de Bolzano:

Además a < c < b, puesto que f ( a )< 0y f ( b )> 0, con lo que queda demostrado el teorema de Bolzano.

Figura 1.

2.2. Teorema del valor intermedio

Es una consecuencia inmediata del teorema de Bolzano y su demostración se basa en el mismo, apareciendo en algunos textos como corolario del teorema de Bolzano. Lo enunciamos a continuación: Teorema (3) del valor intermedio. Sea f ( x ) una función continua en el intervalo [ a , b ]. Entonces f ( x ) toma todos los valores comprendidos entre f ( a ) y f ( b ), es decir que para todo valor c tal que f ( a ) < c < f ( b ) (suponiendo que f ( a ) < f ( b )), existe un valor z Î ( a , b ) tal que f ( z )= c. a

c

b

llega a la misma conclusión. siempre que c – d < x < c + d. de donde podemos deducir que f ( x )> 0 en ese intervalo y por tanto f(x) y f ( c ) tienen el mismo signo en ese intervalo. f (c ) y se 2

Demostración: Basta aplicar el teorema de Bolzano a la función g ( x ) = f ( x ) – c, que es una función continua en [ a , b ].

Si f ( c )< 0 se toma el d correspondiente a e = –



64


3. ACOTACIÓN DE LAS FUNCIONES CONTINUAS Sea f ( x ) una función definida en el intervalo [ a , b ]. El conjunto imagen, f ([ a , b ]) de f ( x ) es un conjunto de números reales, para el cual son válidas las definiciones de cota superior, cota inferior, etc. Las recordaremos, adaptándolas al conjunto imagen de f ( x ).

–

Se llamará cota superior de una función f ( x ) en un intervalo [ a , b ] a un número real K, que no sea superado por ningún valor de la imagen de f ( x ), es decir, que sea mayor o igual que todos los valores de f ( x ) en ese intervalo: f (x )£ K

–

"x Î [ a , b ]

Análogamente se llama cota inferior de una función f ( x )en un intervalo [ a , b ] a un número real k, que no supere a ningún valor de la imagen de f ( x ), es decir, que sea menor o igual que todos los valores de f ( x ) en ese intervalo: f (x )³ k

"x Î [ a , b ]

Si una función tiene cota superior, diremos que está acotada superiormente; si tiene cota inferior diremos que está acotada inferiormente y diremos que está acotada si lo está superior e inferiormente. Teorema (4) de acotación para funciones continuas. Sea f ( x )una función continua en el intervalo cerrado [ a , b ]. Entonces f ( x ) está acotada en [ a , b ], es decir, existe un número C ³ 0 tal que f ( x ) £ C para todo x en [ a , b ]. Demostración: Veremos en primer lugar que f ( x ) está acotada superiormente. Para ello consideremos el conjunto A = {x Î [ a , b ] / f ( x ) está acotada superiormente en [ a , x ]}. Como a Î A, es A ¹ Æ y como A Ì [ a , b ], A está acotado superiormente por b. Por tanto A tiene un extremo superior a. Este extremo superior a es igual a b, pues si fuese a < b, existiría un entorno de a, ( a – d, a+ d) en el que, por ser f ( x )continua en a, f ( x )estaría acotada superiormente en él y en particular estaría acotada en el intervalo cerrado [a , x1] con a < x1 < a + d, lo que estaría en contradicción con la definición de a. Así pues a = b y f ( x ) está acotada en todo intervalo cerrado de la forma [ a , x] con x < b. Por otra parte, por ser f ( x ) continua en b, existe un entorno de b, ( b – h , b + h ) en el que f ( x ) está acotada superiormente (de hecho el entorno se reduce a ( b – h , b] pues la función f ( x ) no está definida a la derecha de b). Si tomamos un z tal que b – h < z < b tenemos que f ( x )estará acotada superiormente en [ z , b ] y como z < b, también f ( x ) estará acotada en [ a , z ], con lo que llegamos a la conclusión de que f ( x )está acotada superiormente en [ a , b ]. Análogamente se demuestra que f ( x ) está acotada inferiormente en [ a , b ]. Definición. Sea f(x) una función definida en un intervalo [ a , b ]. Se dice que la función tiene un máximo absoluto en el intervalo [ a , b ] si existe por lo menos un punto c perteneciente a [ a , b ], tal que f ( x ) £ f ( c ) para todo x Î [ a , b ].

–

El número f(c) se llama máximo absoluto de f(x) en [ a , b ].

Diremos también que f(x) tiene un mínimo absoluto en el intervalo [ a , b ] si existe por lo menos un punto d perteneciente a [ a , b ], tal que f ( d ) £ f ( x ) para todo x Î [ a , b ].

–

El número f(d) se llama mínimo absoluto de f(x) en [ a , b ].

Teorema (5) de Bolzano-Weierstrass. Si f(x) es una función continua en el intervalo cerrado [ a , b ], tiene un máximo y un mínimo absolutos en [ a , b ]. TEMARIO DE MATEMÁTICAS. PRUEBA A

65


66


Demostración: Por ser f ( x ) continua en el intervalo [ a , b ], está acotada en [ a , b ] (teorema 4), es decir, el conjunto A = f ([ a , b ]) = { y Î R / y = f ( x ) para todo x Î [ a , b ]} está acotado (superiormente) y además A ¹ Æ, pues f ( a ) Î A. Por tanto A tiene un extremo superior a. Así tendremos que f ( x )£ a para todo x Î [ a , b ]. Entonces para ver que f ( x ) tiene un máximo bastará demostrar que existe un z Î [ a , b ] tal que f ( z )= a. Si no existiera este z Î [ a , b ] tal que f ( z )= a, sería a ¹ f ( x ) para todo x Î [ a , b ] y la función g ( x ) definida por

Si el máximo y el mínimo de una función en un intervalo cerrado [ a , b ] coinciden y la función es continua en dicho intervalo, dicha función es constante.

Corolario 2.

Si f(x) es continua en [ a , b ], el conjunto imagen de f(x) es el intervalo cerrado [ m, M ].

Corolario 1.

1 a – f (x )

lo que nos dice aplicando el teorema de Bolzano que existe un punto z comprendido entre a y b (es decir, perteneciente al intervalo [ a , b ]) en el que g ( z )= 0, es decir f ( z ) – c = 0, o lo que es lo mismo f ( z )= c, con lo que queda demostrado el teorema. g (x )=

sería continua en [ a , b ], ya que el denominador no es nunca cero y que f ( x ) y a son ambas continuas en [ a , b ]. Por otra parte por ser a el extremo superior de A, los valores f ( x )se aproximan tanto como se quiera a a, es decir, dado un e > 0, existe siempre un punto t Î [ a , b ] tal que a – f ( t ) < e. Esto significa que, por pequeño que sea e > 0, siempre se puede encontrar un t Î [ a , b ] tal que g (a )= f (a ) – c = m – c < 0

g ( b )= f ( b ) – c = M – c > 0

Demostración: Por ser f(x) continua en [ a , b ], existe un punto b Î [ a , b ] tal que f ( b ) = M y un punto a Î [ a , b ] tal que f ( a ) = m (teorema 5). Si c es tal que m < c < M , consideramos la función g ( x ) = f ( x ) – c, que es evidentemente continua en [ a , b ] por serlo f(x) y c y además g (t )=

1 1 > a – f (t ) e

1 y al ser e muy pequeño, es tan grande como queramos, resultando que la función g ( x ) es continua y e no está acotada (superiormente) en [ a , b ] lo que contradice el teorema 4. Esta contradicción proviene de suponer a ¹ f ( z ) y en consecuencia debe existir un z perteneciente a [ a , b ], tal que a = f ( z ). Análogamente se demuestra la existencia de un mínimo.

Teorema 6. Si f ( x )es una función continua en un intervalo cerrado [ a , b ] y c es un valor comprendido entre los valores mínimo m y máximo M de la función en [ a , b ], existe un z Î [ a , b ] tal que f ( z )= c. Es decir, la función alcanza todos los valores comprendidos entre el mínimo y el máximo.

Teorema 6. Si f ( x )es una función continua en un intervalo cerrado [ a , b ] y c es un valor comprendido entre los valores mínimo m y máximo M de la función en [ a , b ], existe un z Î [ a , b ] tal que f ( z )= c. Es decir, la función alcanza todos los valores comprendidos entre el mínimo y el máximo.

1 y al ser e muy pequeño, es tan grande como queramos, resultando que la función g ( x ) es continua y e no está acotada (superiormente) en [ a , b ] lo que contradice el teorema 4. Esta contradicción proviene de suponer a ¹ f ( z ) y en consecuencia debe existir un z perteneciente a [ a , b ], tal que a = f ( z ). Análogamente se demuestra la existencia de un mínimo.

Demostración: Por ser f(x) continua en [ a , b ], existe un punto b Î [ a , b ] tal que f ( b ) = M y un punto a Î [ a , b ] tal que f ( a ) = m (teorema 5). Si c es tal que m < c < M , consideramos la función g ( x ) = f ( x ) – c, que es evidentemente continua en [ a , b ] por serlo f(x) y c y además g (t )=

1 1 > a – f (t ) e

sería continua en [ a , b ], ya que el denominador no es nunca cero y que f ( x ) y a son ambas continuas en [ a , b ]. Por otra parte por ser a el extremo superior de A, los valores f ( x )se aproximan tanto como se quiera a a, es decir, dado un e > 0, existe siempre un punto t Î [ a , b ] tal que a – f ( t ) < e. Esto significa que, por pequeño que sea e > 0, siempre se puede encontrar un t Î [ a , b ] tal que g ( b )= f ( b ) – c = M – c > 0 g (a )= f (a ) – c = m – c < 0

lo que nos dice aplicando el teorema de Bolzano que existe un punto z comprendido entre a y b (es decir, perteneciente al intervalo [ a , b ]) en el que g ( z )= 0, es decir f ( z ) – c = 0, o lo que es lo mismo f ( z )= c, con lo que queda demostrado el teorema. g (x )=

1 a – f (x )

Demostración: Por ser f ( x ) continua en el intervalo [ a , b ], está acotada en [ a , b ] (teorema 4), es decir, el conjunto A = f ([ a , b ]) = { y Î R / y = f ( x ) para todo x Î [ a , b ]} está acotado (superiormente) y además A ¹ Æ, pues f ( a ) Î A. Por tanto A tiene un extremo superior a. Así tendremos que f ( x )£ a para todo x Î [ a , b ]. Entonces para ver que f ( x ) tiene un máximo bastará demostrar que existe un z Î [ a , b ] tal que f ( z )= a. Si no existiera este z Î [ a , b ] tal que f ( z )= a, sería a ¹ f ( x ) para todo x Î [ a , b ] y la función g ( x ) definida por Corolario 1.

Si f(x) es continua en [ a , b ], el conjunto imagen de f(x) es el intervalo cerrado [ m, M ].

Corolario 2.

Si el máximo y el mínimo de una función en un intervalo cerrado [ a , b ] coinciden y la función es continua en dicho intervalo, dicha función es constante.



66


4. PROPIEDADES DE LAS FUNCIONES DERIVABLES La derivación puede utilizarse en la localización de los máximos y mínimos de las funciones. En realidad existen dos significados de las palabras “máximo” y “mínimo” que se distinguen con los adjetivos absoluto y relativo. El concepto de máximo absoluto se ha introducido en el epígrafe 3 y podemos recordarlo diciendo que una función f(x) definida en un intervalo [ a , b ] tiene un máximo absoluto en dicho intervalo si existe por lo menos un punto c perteneciente a [ a , b ], tal que f (x )£ f (c )

x Î [a, b]

El concepto de máximo relativo se define así:

–

Definición de máximo relativo. Una función f ( x )definida en un intervalo [ a , b ] tiene un máximo relativo en un punto c Î [ a , b ] si existe un entorno ( c – h , c+ h ) de c tal que para todo x de dicho entorno excepto c, se verifica que f ( x ) < f ( c ). El concepto de mínimo relativo se define del mismo modo con la desigualdad invertida. La palabra relativo indica que se compara el valor de la función en un punto con los valores en su vecindad solamente, por lo que un máximo relativo en c es un máximo absoluto en un cierto entorno de c, si bien no es necesariamente un máximo absoluto en el intervalo [ a , b ], ya que la función puede tomar valores superiores a ese máximo relativo en otros puntos del intervalo. Por el contrario, cualquier máximo absoluto es, en particular un máximo relativo. (Obsérvese la figura 2).

máximo relativo

máximo absoluto

a b mínimo absoluto

Figura 2.

–

Definición de extremo. Un número que es un máximo o un mínimo relativo de una función f ( x ) se denomina valor extremo o extremo relativo de f ( x ).

Teorema 7. Sea f(x) una función definida sobre ( a , b). Si c es un extremo (un máximo o un mínimo) para f(x) sobre ( a , b) y f(x) es derivable en c, entonces f '( c )= 0. (Obsérvese que no suponemos la derivabilidad, ni siquiera la continuidad de f ( x ) en otros puntos). Demostración: Definamos en ( a , b) una función g ( x ) como sigue: g (x )=

f (x ) – f (c ) si x ¹ c x– c

g ( c ) = f '( c )

Puesto que f '( c ) existe, g ( x ) ® g ( c ) cuando x ® c, con lo que g es continua en c. Queremos demostrar que g ( c )= 0 y lo conseguiremos demostrando que cada una de las desigualdades g ( c )> 0 y g ( c )< 0 nos llevan a una contradicción. TEMARIO DE MATEMÁTICAS. PRUEBA A

67


68


Supongamos que g ( c )> 0. Por la propiedad de conservación del signo de las funciones continuas, existe un entorno de c en el que g ( x ) es positiva. Por tanto el numerador del cociente g ( x ) tiene el mismo signo que el denominador para todo x ¹ c en ese intervalo. Dicho de otro modo, f ( x ) > f ( c ) cuando x > c y f ( x ) < f ( c ) cuando x < c. Esto contradice la hipótesis de que f ( x ) tiene un extremo en c, por lo que la desigualdad g ( c )> 0 es imposible. De forma parecida se demuestra que no puede ser g ( c )< 0, por lo que tendrá que ser g ( c )= 0, tal como se afirmó y como g ( c ) = f '( c ) = 0, queda demostrado el teorema.

El teorema del valor medio para derivadas es importante en Cálculo porque muchas de las propiedades de las funciones pueden deducirse a partir de él. Antes de establecer el teorema del valor medio, enunciaremos uno de sus casos particulares a partir del cual puede deducirse el teorema general. Este caso particular lo descubrió en 1690 el matemático francés Michel Rolle (1652-1719). Teorema (8) de Rolle. Sea f una función continua en todos los puntos del intervalo cerrado [ a , b ] y derivable en todos los puntos del abierto ( a , b), y supongamos también que f ( a ) = f ( b ). Entonces existe por lo menos un c perteneciente al intervalo ( a , b) tal que f '( c )= 0.

Obsérvese que no se puede sustituir ( a , b) por [ a , b ] en el teorema a no ser que se añada a la hipótesis la condición de que c está en ( a , b). Además es importante resaltar que el recíproco del teorema no es cierto ya que es posible que f '( x ) sea cero aunque no sea un extremo de f. Un ejemplo claro de esto es la función f ( x )= x3, donde f '( 0 ) = 0 y la función no presenta ningún extremo en toda la recta real.

4.2. Teorema del valor medio para derivadas

Si x es un punto máximo o un punto mínimo de f sobre [ a , b ], entonces x debe estar en una de las tres clases arriba enumeradas, pues si no está en el segundo o en el tercer grupo, entonces estará en el abierto ( a , b) y f es derivable en x, por lo que según el teorema 7, f '( x )= 0, significando esto que x pertenece al primer grupo. Si hay muchos puntos en esas tres categorías, puede no ser fácil hallar el máximo y el mínimo de f, pero cuando existen solo unos pocos puntos de cada clase, el procedimiento es bastante directo: se halla simplemente f(x) para cada x que satisface f '( x )= 0, f ( x ) para cada x en que la función no sea derivable y finalmente f(a) y f(b), siendo el mayor de todos estos valores el máximo y el menor el mínimo. Con este método, si es factible, localizaremos siempre los valores máximo y mínimo de una función continua en un intervalo cerrado, pero si la función no es continua o estamos buscando el máximo y el mínimo sobre un intervalo abierto o sobre toda la recta real, entonces no podemos ni siquiera asegurar que existan dichos valores por lo que toda la información obtenida con este procedimiento puede no servirnos de nada. Así, que enunciaremos algunos teoremas que tienen que ver con la función derivada y con posterioridad retomaremos el tema de obtener valores máximos y mínimos locales en intervalos abiertos y en toda la recta real.

Definición. Se llama punto singular de una función f(x) a todo número c tal que f '( c )= 0. Al número f(c) se le llama valor singular de f(x). Los valores singulares de f(x) junto con algunos otros números, resultan ser los que deben tomarse en consideración para hallar los máximos y mínimos de una función dada.

4.1. Determinación de máximos y mínimos absolutos en un intervalo cerrado

Sea f(x) una función definida en el intervalo cerrado [ a , b ] (si f es continua podemos afirmar que existe un máximo y un mínimo en ese intervalo). Para hallar el máximo y el mínimo de f debemos considerar tres clases de puntos: 1.

Los puntos singulares de f en [ a , b ].

2.

Los extremos del intervalo: a y b.

3.

Los puntos x de [ a , b ] en los que la función f no es derivable.

Los puntos x de [ a , b ] en los que la función f no es derivable.

3.

Los extremos del intervalo: a y b.

2.

Los puntos singulares de f en [ a , b ].

1.

Si x es un punto máximo o un punto mínimo de f sobre [ a , b ], entonces x debe estar en una de las tres clases arriba enumeradas, pues si no está en el segundo o en el tercer grupo, entonces estará en el abierto ( a , b) y f es derivable en x, por lo que según el teorema 7, f '( x )= 0, significando esto que x pertenece al primer grupo. Si hay muchos puntos en esas tres categorías, puede no ser fácil hallar el máximo y el mínimo de f, pero cuando existen solo unos pocos puntos de cada clase, el procedimiento es bastante directo: se halla simplemente f(x) para cada x que satisface f '( x )= 0, f ( x ) para cada x en que la función no sea derivable y finalmente f(a) y f(b), siendo el mayor de todos estos valores el máximo y el menor el mínimo. Con este método, si es factible, localizaremos siempre los valores máximo y mínimo de una función continua en un intervalo cerrado, pero si la función no es continua o estamos buscando el máximo y el mínimo sobre un intervalo abierto o sobre toda la recta real, entonces no podemos ni siquiera asegurar que existan dichos valores por lo que toda la información obtenida con este procedimiento puede no servirnos de nada. Así, que enunciaremos algunos teoremas que tienen que ver con la función derivada y con posterioridad retomaremos el tema de obtener valores máximos y mínimos locales en intervalos abiertos y en toda la recta real.

Sea f(x) una función definida en el intervalo cerrado [ a , b ] (si f es continua podemos afirmar que existe un máximo y un mínimo en ese intervalo). Para hallar el máximo y el mínimo de f debemos considerar tres clases de puntos:

4.1. Determinación de máximos y mínimos absolutos en un intervalo cerrado

Definición. Se llama punto singular de una función f(x) a todo número c tal que f '( c )= 0. Al número f(c) se le llama valor singular de f(x). Los valores singulares de f(x) junto con algunos otros números, resultan ser los que deben tomarse en consideración para hallar los máximos y mínimos de una función dada. Obsérvese que no se puede sustituir ( a , b) por [ a , b ] en el teorema a no ser que se añada a la hipótesis la condición de que c está en ( a , b). Además es importante resaltar que el recíproco del teorema no es cierto ya que es posible que f '( x ) sea cero aunque no sea un extremo de f. Un ejemplo claro de esto es la función f ( x )= x3, donde f '( 0 ) = 0 y la función no presenta ningún extremo en toda la recta real.

4.2. Teorema del valor medio para derivadas

El teorema del valor medio para derivadas es importante en Cálculo porque muchas de las propiedades de las funciones pueden deducirse a partir de él. Antes de establecer el teorema del valor medio, enunciaremos uno de sus casos particulares a partir del cual puede deducirse el teorema general. Este caso particular lo descubrió en 1690 el matemático francés Michel Rolle (1652-1719). Teorema (8) de Rolle. Sea f una función continua en todos los puntos del intervalo cerrado [ a , b ] y derivable en todos los puntos del abierto ( a , b), y supongamos también que f ( a ) = f ( b ). Entonces existe por lo menos un c perteneciente al intervalo ( a , b) tal que f '( c )= 0.

Supongamos que g ( c )> 0. Por la propiedad de conservación del signo de las funciones continuas, existe un entorno de c en el que g ( x ) es positiva. Por tanto el numerador del cociente g ( x ) tiene el mismo signo que el denominador para todo x ¹ c en ese intervalo. Dicho de otro modo, f ( x ) > f ( c ) cuando x > c y f ( x ) < f ( c ) cuando x < c. Esto contradice la hipótesis de que f ( x ) tiene un extremo en c, por lo que la desigualdad g ( c )> 0 es imposible. De forma parecida se demuestra que no puede ser g ( c )< 0, por lo que tendrá que ser g ( c )= 0, tal como se afirmó y como g ( c ) = f '( c ) = 0, queda demostrado el teorema.



68

Estudio global de funciones El significado geométrico de este teorema está representado en la figura 3, y en el mismo se afirma tan solo que la curva debe tener al menos una tangente horizontal en algún punto entre a y b. f´´(c) = 0

B

A f(a)

Figura 3.

f(b)

c

a

b

Demostración: Supongamos que f '( x )¹ 0 para todo valor x perteneciente al intervalo abierto ( a , b) y llegaremos a una contradicción. Según el teorema 5 si la función f es continua en el intervalo cerrado [ a , b ], alcanza en él un máximo absoluto M y un mínimo absoluto m. El teorema 7 nos dice que ningún punto extremo puede ser alcanzado en puntos interiores (al suponer f '( x )¹ 0), por lo que ambos valores extremos deben ser alcanzados en los extremos a y b del intervalo. Pero como f ( a ) = f ( b ), entonces M = m y por tanto f es constante en el intervalo [ a , b ], lo que contradice el hecho de que f '( x )¹ 0 para todo valor x perteneciente a ( a , b). Por tanto existirá al menos un c, a < c < b tal que f '( c )= 0, lo que demuestra el teorema. Observemos que para poder aplicar el teorema 7, es necesaria la hipótesis de que f sea derivable en ( a , b), ya que de otro modo el teorema es falso. B

(c,f(c))

A

Figura 4.

c

a

b

Aunque el teorema de Rolle es un caso particular del teorema del valor medio, podemos utilizarlo para hacer una demostración sencilla de éste. Antes de enunciarlo, examinaremos su significado geométrico. Si observamos la figura 4, vemos que es la gráfica de una función continua f, con tangente en cada punto del intervalo abierto ( a , b). En el punto ( c, f ( c )) la tangente es paralela a la cuerda AB. Hay gráficas en las que existe más de un punto del intervalo abierto donde se cumple esta propiedad, pero el teorema del valor medio asegura la existencia de al menos un punto que la cumpla. Para traducir al lenguaje analítico esta propiedad geométrica, aplicaremos que la propiedad de paralelismo de dos rectas implica la igualdad de sus pendientes, por lo que igualaremos la pendiente de la curva en ese punto (valor de la derivada de la función) con la pendiente de la cuerda, con lo que tendríamos la expresión f (b ) – f (a ) = f '( c ) b– a para algún punto c del intervalo abierto ( a , b). TEMARIO DE MATEMÁTICAS. PRUEBA A

69


70


f '( c )[g ( b ) – g ( a )] = g '( c )[ f ( b ) – f ( a )]

Si queremos hacer más intuitiva la validez de la expresión escrita arriba, podemos suponer que f(t) es el camino recorrido por un móvil en el tiempo t. Entonces el primer miembro de la expresión representa la velocidad media en el trayecto y la derivada la velocidad instantánea en cualquier punto del recorrido. Así, la expresión nos asegura que debe existir al menos un punto del recorrido donde la velocidad instantánea del móvil coincida con la velocidad media del trayecto. Enunciaremos ahora formalmente el teorema del valor medio. Teorema (9) del valor medio. Si f es una función continua en un intervalo cerrado [ a , b ] que tiene derivada en cada punto del intervalo abierto ( a , b), existe por lo menos un punto c interior a ( a , b) tal que

Teorema (10) del valor medio de Cauchy. Sean f y g dos funciones continuas en un intervalo cerrado [ a , b ] y que admitan derivadas en todo el intervalo abierto ( a , b). Entonces existe un punto c perteneciente a ( a , b), tal que Demostración: Para todo x del intervalo tenemos que ( f – g )'( x ) = f '( x ) – g '( x ) = 0, por lo que según el corolario anterior ( f – g ) es constante. Con frecuencia es útil la siguiente extensión del teorema del valor medio. f ( b ) – f ( a ) = f '( c )( b – a )

Demostración:

Corolario. Si f y g están definidas en un mismo intervalo y f '( x ) = g '( x ) para todo valor x del intervalo, entonces las funciones f y g se diferencian en una constante.

Como aplicaremos el teorema de Rolle, buscaremos una función que cumpla sus premisas. Así, sea h ( x ) = f ( x )( b – a ) – x[ f ( b ) – f ( a )]

Podemos observar que la función h es continua en el intervalo cerrado [ a , b ], tiene derivada en todos los puntos del abierto ( a , b) y su valor es

pero como para todo punto del intervalo la derivada es nula, sean cuales sean los valores a y b escogidos en el intervalo tendremos que f ( a ) = f ( b ), por lo que la función será constante en el intervalo. h '( x ) = f '( x )( b – a ) – [ f ( b ) – f ( a )] f ( b ) – f ( a ) = f '( c )( b – a )

y además h ( a ) = h ( b ) = bf ( a ) – af ( b ) por lo que aplicando el teorema de Rolle, existirá un c perteneciente al intervalo ( a , b) tal que h '( c )= 0 con lo que se cumplirá para ese valor c

Sean a y b dos puntos cualesquiera del intervalo con a ¹ b. Entonces existe algún c perteneciente a ( a , b) donde f ( b ) – f ( a ) = f '( c )( b – a )

Demostración:

quedando demostrado el teorema.

Corolario. Si se define f sobre un intervalo (con las premisas anteriores) y f '( x )= 0 para todo valor x del intervalo, entonces la función f es constante en ese intervalo.

Corolario. Si se define f sobre un intervalo (con las premisas anteriores) y f '( x )= 0 para todo valor x del intervalo, entonces la función f es constante en ese intervalo. quedando demostrado el teorema.

Demostración:

f ( b ) – f ( a ) = f '( c )( b – a )

Sean a y b dos puntos cualesquiera del intervalo con a ¹ b. Entonces existe algún c perteneciente a ( a , b) donde

y además h ( a ) = h ( b ) = bf ( a ) – af ( b ) por lo que aplicando el teorema de Rolle, existirá un c perteneciente al intervalo ( a , b) tal que h '( c )= 0 con lo que se cumplirá para ese valor c f ( b ) – f ( a ) = f '( c )( b – a )

h '( x ) = f '( x )( b – a ) – [ f ( b ) – f ( a )]

pero como para todo punto del intervalo la derivada es nula, sean cuales sean los valores a y b escogidos en el intervalo tendremos que f ( a ) = f ( b ), por lo que la función será constante en el intervalo.

Podemos observar que la función h es continua en el intervalo cerrado [ a , b ], tiene derivada en todos los puntos del abierto ( a , b) y su valor es h ( x ) = f ( x )( b – a ) – x[ f ( b ) – f ( a )]

Corolario. Si f y g están definidas en un mismo intervalo y f '( x ) = g '( x ) para todo valor x del intervalo, entonces las funciones f y g se diferencian en una constante.

Como aplicaremos el teorema de Rolle, buscaremos una función que cumpla sus premisas. Así, sea Demostración:

Demostración: Para todo x del intervalo tenemos que ( f – g )'( x ) = f '( x ) – g '( x ) = 0, por lo que según el corolario anterior ( f – g ) es constante. Con frecuencia es útil la siguiente extensión del teorema del valor medio. f ( b ) – f ( a ) = f '( c )( b – a )

Si queremos hacer más intuitiva la validez de la expresión escrita arriba, podemos suponer que f(t) es el camino recorrido por un móvil en el tiempo t. Entonces el primer miembro de la expresión representa la velocidad media en el trayecto y la derivada la velocidad instantánea en cualquier punto del recorrido. Así, la expresión nos asegura que debe existir al menos un punto del recorrido donde la velocidad instantánea del móvil coincida con la velocidad media del trayecto. Enunciaremos ahora formalmente el teorema del valor medio. Teorema (9) del valor medio. Si f es una función continua en un intervalo cerrado [ a , b ] que tiene derivada en cada punto del intervalo abierto ( a , b), existe por lo menos un punto c interior a ( a , b) tal que

Teorema (10) del valor medio de Cauchy. Sean f y g dos funciones continuas en un intervalo cerrado [ a , b ] y que admitan derivadas en todo el intervalo abierto ( a , b). Entonces existe un punto c perteneciente a ( a , b), tal que f '( c )[g ( b ) – g ( a )] = g '( c )[ f ( b ) – f ( a )]



70

Estudio global de funciones Demostración: Aplicaremos el teorema de Rolle a la función definida como h ( x ) = f ( x )[g ( b ) – g ( a )] – g ( x )[ f ( b ) – f ( a )] ya que vemos que cumple las condiciones del teorema de Rolle al ser continua en [ a , b ], derivable en ( a , b) y h ( a ) = h ( b ) = f ( a )g ( b ) – g ( a ) f ( b ), por lo que existirá un punto c perteneciente a ( a , b) donde h '( c )= 0, con lo que queda demostrado. Si nos fijamos, observaremos que el teorema 9 es un caso particular de éste, tomando g ( x )= x.

5. CRECIMIENTO Y DECRECIMIENTO DE UNA FUNCIÓN Definición. Se dice que una función f es creciente sobre un intervalo [ a , b ] si f ( x ) < f ( y ) siempre que x e y sean dos puntos del intervalo con x < y. Análogamente decimos que f es decreciente en [ a , b ], si f ( x ) > f ( y ) para cualesquiera puntos del intervalo con x < y. Teorema (11). Sea f una función continua en un intervalo cerrado [ a , b ] y que admite derivada en cada punto del intervalo abierto ( a , b). Tenemos entonces: a) b) c)

Si f '( x )> 0 para todo x de ( a , b), f es estrictamente creciente en [ a , b ]. Si f '( x )< 0 para todo x de ( a , b), f es estrictamente decreciente en [ a , b ]. Si f '( x )= 0 para todo x de ( a , b), f es constante en [ a , b ]. Demostración: Para probar a) tenemos que demostrar que f ( x ) < f ( y ) siempre que a £ x < y £ b. Supongamos que x < y y apliquemos el teorema del valor medio al intervalo cerrado [x, y], de donde obtendremos f ( y ) – f ( x ) = f '( c )( y – x ) Donde x < c < y y como f '( c ) e ( y – x ) son positivos, también debe serlo f ( y ) – f ( x ), lo que significa que f ( x ) < f ( y ), quedando demostrado a). La demostración de b) es análoga y para demostrar c) tomaremos x = a y al ser f '( c )= 0, nos quedará que f ( y ) = f ( a ) para todo valor y perteneciente a [ a , b ], con lo que f será constante en [ a , b ].

6. MÁXIMOS Y MÍNIMOS LOCALES El teorema 11 podemos emplearlo para demostrar que se presenta un extremo relativo siempre que la derivada cambia de signo (ver figura 5). f´(x) > 0

f´(x) < 0 f´(x) < 0 f´(x)>0

a

c

a

b

Máximo relativo en c

c

b

Mínimo relativo en c

Figura 5. TEMARIO DE MATEMÁTICAS. PRUEBA A

71


72


Teorema (12). Supongamos una función f continua en un intervalo cerrado [ a , b ] y que existe la derivada f’ en todo punto del intervalo abierto ( a , b), excepto acaso en un punto c. Entonces: Entonces: 1. Si n es par y f n ( a )> 0, entonces f tiene un mínimo local en a. 2. Si n es par y f n ( a )< 0, entonces f tiene un máximo local en a. 3. Si n es impar, entonces f no tiene ni máximo ni mínimo local en a.

Si f '( x ) es positiva para todo x < c y negativa para todo x > c, f tiene un máximo relativo en c. Si f '( x ) es negativa para todo x < c y positiva para todo x > c, f tiene un mínimo relativo en c. Demostración:

ì f '( a ) = f ''( a ) =... f n–1( a ) = 0 ï Teorema (15). Supongamos que í ï n î f (a )¹ 0

a) b)

En el caso a), el teorema 11, nos dice que es estrictamente creciente en [ a , c] y estrictamente decreciente en [ c, b ]. Así, f ( x ) < f ( c ) para todo x ¹ c en ( a , b), con lo que f tiene un máximo relativo en c. La demostración es análoga para el apartado b). La representación gráfica de ambos casos se encuentra en la figura 5.

Demostración: Supongamos que f tiene un mínimo local en a. Si f ''( a )< 0, f tendría también un máximo local en a según el teorema anterior. Así pues f sería una función constante con lo que f ''( a )= 0, lo cual es una contradicción, por lo que f ''( a )³ 0. En caso de que sea un máximo local la demostración es análoga. Los signos ³ y £ no pueden ser sustituidos por > y <, según se puede comprobar en las funciones f ( x )= x4 y f ( x ) = – x4.

Ahora, enunciaremos utilizando la derivada segunda algunos teoremas que nos caracterizarán máximos y mínimos locales. Teorema (13). Supongamos f '( a )= 0. Si f ''( a )> 0, entonces f tiene un mínimo local en a. Si f ''( a )< 0 entonces f tiene un máximo local en a.

Teorema (14). Supongamos que existe f ''( a ). Si f tiene un mínimo local en a, entonces f ''( a )³ 0 y si tiene un máximo local en a, entonces f ''( a )£ 0. Demostración: Por definición

Por definición f '( a + h ) – f '( a ) f ''( a ) = lim h ®0 h Puesto que f '( a )= 0, esto puede escribirse f '( a + h ) f ''( a ) = lim h ®0 h f '( a + h ) Supongamos ahora que f ''( a )> 0, con lo que debe ser positivo para h suficientemente peh queño, por lo que f '( a + h ) debe ser positivo para h > 0 suficientemente pequeño y f '( a + h ) debe ser negativo para h < 0 suficientemente pequeño. Esto significa que f crece en algún intervalo a la derecha de a y f decrece en algún intervalo a la izquierda de a. En consecuencia f tiene un mínimo en a. La demostración para el caso f ''( a )< 0 es análoga. f ''( a ) = lim h ®0

f '( a + h ) – f '( a ) h

Puesto que f '( a )= 0, esto puede escribirse

f '( a + h ) h f '( a + h ) Supongamos ahora que f ''( a )> 0, con lo que debe ser positivo para h suficientemente peh queño, por lo que f '( a + h ) debe ser positivo para h > 0 suficientemente pequeño y f '( a + h ) debe ser negativo para h < 0 suficientemente pequeño. Esto significa que f crece en algún intervalo a la derecha de a y f decrece en algún intervalo a la izquierda de a. En consecuencia f tiene un mínimo en a. La demostración para el caso f ''( a )< 0 es análoga. f ''( a ) = lim h ®0

Demostración:

Teorema (14). Supongamos que existe f ''( a ). Si f tiene un mínimo local en a, entonces f ''( a )³ 0 y si tiene un máximo local en a, entonces f ''( a )£ 0. Teorema (13). Supongamos f '( a )= 0. Si f ''( a )> 0, entonces f tiene un mínimo local en a. Si f ''( a )< 0 entonces f tiene un máximo local en a.

Demostración: Supongamos que f tiene un mínimo local en a. Si f ''( a )< 0, f tendría también un máximo local en a según el teorema anterior. Así pues f sería una función constante con lo que f ''( a )= 0, lo cual es una contradicción, por lo que f ''( a )³ 0. En caso de que sea un máximo local la demostración es análoga. Los signos ³ y £ no pueden ser sustituidos por > y <, según se puede comprobar en las funciones f ( x )= x4 y f ( x ) = – x4.

Ahora, enunciaremos utilizando la derivada segunda algunos teoremas que nos caracterizarán máximos y mínimos locales. En el caso a), el teorema 11, nos dice que es estrictamente creciente en [ a , c] y estrictamente decreciente en [ c, b ]. Así, f ( x ) < f ( c ) para todo x ¹ c en ( a , b), con lo que f tiene un máximo relativo en c. La demostración es análoga para el apartado b). La representación gráfica de ambos casos se encuentra en la figura 5. Demostración:

Si f '( x ) es positiva para todo x < c y negativa para todo x > c, f tiene un máximo relativo en c. Si f '( x ) es negativa para todo x < c y positiva para todo x > c, f tiene un mínimo relativo en c. Entonces: 1. Si n es par y f n ( a )> 0, entonces f tiene un mínimo local en a. 2. Si n es par y f n ( a )< 0, entonces f tiene un máximo local en a. 3. Si n es impar, entonces f no tiene ni máximo ni mínimo local en a.

a) b)

ì f '( a ) = f ''( a ) =... f n–1( a ) = 0 ï Teorema (15). Supongamos que í ï n î f (a )¹ 0

Teorema (12). Supongamos una función f continua en un intervalo cerrado [ a , b ] y que existe la derivada f’ en todo punto del intervalo abierto ( a , b), excepto acaso en un punto c. Entonces: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


72

Estudio global de funciones Demostración: La fórmula de Taylor para f ( x ) nos da, si x es próximo a a: f n (a ) f ( x ) = f ( a )+ ( x – a )n + Rn ( x ) n! de donde f (x ) – f (a ) f n (a ) R (x ) = + n n n (x – a ) n! (x – a ) y por tanto lim x ®a

ya que por el teorema de Taylor lim x ®a

f (x ) – f (a ) f n (a ) = n (x – a ) n!

Rn ( x ) = 0. Así, esta igualdad nos dice que en un entorno de a, ( x – a )n

f (x ) – f (a ) tiene el mismo signo que f n ( a ). ( x – a )n Si f n ( a )> 0, existe un entorno de a, en el que para todo x de ese entorno se verifica f (x ) – f (a ) >0 ( x – a )n es decir [ f ( x ) – f ( a )] y ( x – a )n tienen el mismo signo en el entorno considerado. Si n es par ( x – a )n es siempre positivo y por lo tanto f ( x ) – f ( a ) tiene que ser positivo en las proximidades de a. En consecuencia, f ( x ) > f ( a ), lo que indica que a es un mínimo local de f ( x ). Si n es par y f n ( a )< 0, es f ( x ) – f ( a )< 0en las proximidades de a y por tanto f ( x )tiene un máximo local en a. f (x ) – f (a ) que f n ( a ) (que podemos considerar positivo), Si n es impar, al tener el mismo signo ( x – a )n para valores de x > a, ( x – a )n > 0, por lo que f ( x ) – f ( a )> 0y por lo tanto f ( x ) > f ( a ) y para valores de x < a, ( x – a )n < 0, por lo que f ( x ) – f ( a )< 0 y por lo tanto f ( x ) < f ( a ), lo que demuestra que f ( x ) no tiene ni máximo ni mínimo local en el punto a.

7. CONCAVIDAD, CONVEXIDAD Y PUNTOS DE INFLEXIÓN Aunque la gráfica de una función puede trazarse con bastante exactitud sobre la base de información suministrada por la derivada, hay algunos aspectos sutiles de la misma, para cuya aclaración hace falta examinar la derivada segunda. Según diferentes autores las definiciones de concavidad y convexidad son totalmente contrarias, definiendo algunos concavidad como definen otros convexidad y viceversa. Definición. Se dice que una función f es convexa en un intervalo, si para todo a y b de ese intervalo, el segmento rectilíneo que une los puntos ( a , f ( a )) con ( b , f ( b )) queda por encima de la gráfica de f (ver figura 6). (a,f(a)) (b,f (b))

(b,f(b)) (a,f(a))

a

Figura 6.

b Función cóncava


a

b Función convexa

73


74


Una situación parecida se presenta para h negativo. Si h2 < h1 < 0, entonces a + h2 < a + h1 < a

La condición geométrica que aparece en esta definición puede expresarse de manera analítica, que generalmente resulta más útil en las demostraciones. La recta entre los puntos ( a , f ( a )) y ( b , f ( b )), tiene por ecuación f (b ) – f (a ) g (x )= ( x – a )+ f ( a ) b– a y quedará por encima de la gráfica de la función f si g ( x ) > f ( x ), que analíticamente puede expresarse como f (b ) – f (a ) ( x – a )+ f ( a ) > f ( x ) Þ b– a f (b ) – f (a ) (x – a )> f (x ) – f (a ) Þ b– a f (b ) – f (a ) f (x ) – f (a ) > b– a x– a lo que nos da otra definición equivalente de convexidad: que pasa por los puntos ( a , f ( a )) y ( a + h2 , f ( a + h2 )), ( a + h2 , f ( a + h2 )), queda por encima de la recta tangente.

por lo que la pendiente de la recta tangente en el punto a es menor que la pendiente de la recta secante lo que implica que el punto f '( a ) <

f ( a + h2 ) – f ( a ) h2

y al ser derivable f en a, tendremos

Si tomamos límites cuando h ® 0+ , tendremos 1 f (a+ h ) – f (a ) f ( a + h2 ) – f ( a ) 1 < lim+ h1 ®0 h1 h2 h1 ®0+

lim

f ( a + h1 ) – f ( a ) f ( a + h2 ) – f ( a ) < h1 h2

Definición. Una función f es convexa en un intervalo si para cualesquiera a, x y b del intervalo con a < x < b se tiene f (x ) – f (a ) f (b ) – f (a ) < x– a b– a Si sustituimos en la primera definición la palabra “encima” por “debajo”, o la desigualdad de la segunda definición la sustituimos por f (x ) – f (a ) f (b ) – f (a ) > x– a b– a obtenemos la definición de función cóncava. Es fácil observar que las funciones cóncavas son precisamente las de la forma –f donde f es convexa. Por eso los teoremas siguientes se refieren a funciones convexas, existiendo otros análogos que se demuestran de forma inmediata, teniendo en cuenta que si la función f es convexa, –f es cóncava.

Demostración: Observemos la figura 7. Sea 0 < h1 < h2. Consideremos los puntos a < a + h1 < a + h2. Al ser la función f convexa, tendremos

Teorema (16). Sea f una función convexa. Si f es derivable en a, entonces la gráfica de f queda por encima de la tangente a f en el punto ( a , f ( a )), excepto en ( a , f ( a )) mismo. Si a < b y f es derivable en a y en b, entonces f '( a ) < f '( b ), es decir, la pendiente va creciendo. Definición. Una función f es convexa en un intervalo si para cualesquiera a, x y b del intervalo con a < x < b se tiene f (x ) – f (a ) f (b ) – f (a ) < x– a b– a Si sustituimos en la primera definición la palabra “encima” por “debajo”, o la desigualdad de la segunda definición la sustituimos por f (x ) – f (a ) f (b ) – f (a ) > x– a b– a obtenemos la definición de función cóncava. Es fácil observar que las funciones cóncavas son precisamente las de la forma –f donde f es convexa. Por eso los teoremas siguientes se refieren a funciones convexas, existiendo otros análogos que se demuestran de forma inmediata, teniendo en cuenta que si la función f es convexa, –f es cóncava.

Teorema (16). Sea f una función convexa. Si f es derivable en a, entonces la gráfica de f queda por encima de la tangente a f en el punto ( a , f ( a )), excepto en ( a , f ( a )) mismo. Si a < b y f es derivable en a y en b, entonces f '( a ) < f '( b ), es decir, la pendiente va creciendo. Demostración: Observemos la figura 7. Sea 0 < h1 < h2. Consideremos los puntos a < a + h1 < a + h2. Al ser la función f convexa, tendremos f ( a + h1 ) – f ( a ) f ( a + h2 ) – f ( a ) < h1 h2

La condición geométrica que aparece en esta definición puede expresarse de manera analítica, que generalmente resulta más útil en las demostraciones. La recta entre los puntos ( a , f ( a )) y ( b , f ( b )), tiene por ecuación f (b ) – f (a ) g (x )= ( x – a )+ f ( a ) b– a y quedará por encima de la gráfica de la función f si g ( x ) > f ( x ), que analíticamente puede expresarse como f (b ) – f (a ) ( x – a )+ f ( a ) > f ( x ) Þ b– a f (b ) – f (a ) (x – a )> f (x ) – f (a ) Þ b– a f (b ) – f (a ) f (x ) – f (a ) > b– a x– a lo que nos da otra definición equivalente de convexidad: Si tomamos límites cuando h1 ® 0+ , tendremos f ( a + h1 ) – f ( a ) f ( a + h2 ) – f ( a ) lim < lim+ h1 ®0+ h ® 0 h1 h2 1

y al ser derivable f en a, tendremos

f '( a ) <

f ( a + h2 ) – f ( a ) h2

por lo que la pendiente de la recta tangente en el punto a es menor que la pendiente de la recta secante que pasa por los puntos ( a , f ( a )) y ( a + h2 , f ( a + h2 )), lo que implica que el punto ( a + h2 , f ( a + h2 )), queda por encima de la recta tangente. Una situación parecida se presenta para h negativo. Si h2 < h1 < 0, entonces a + h2 < a + h1 < a



74

Estudio global de funciones y como f es convexa, tendremos f ( a + h1 ) – f ( a ) f ( a + h2 ) – f ( a ) > h1 h2 y si tomamos límites cuando h1 ® 0– , tendremos lim

h1 ®0 –

f ( a + h1 ) – f ( a ) f ( a + h2 ) – f ( a ) > lim– h1 ®0 h1 h2

y al ser f derivable en a f '( a ) >

f ( a + h2 ) – f ( a ) h2

lo que nos indica que la pendiente de la recta tangente es mayor que la de la secante que pasa por los puntos ( a + h2 , f ( a + h2 )) y ( a , f ( a )) de modo que la gráfica queda por encima de la tangente. Esto demuestra la primera parte del teorema.

Figura 7.

a

a+h1

a+h2

a+h2

a+h1

a

Para demostrar la segunda parte, supongamos a < b. Entonces f '( a ) <

f ( a + ( b – a )) – f ( a ) b– a

por ser b – a > 0, con lo que f '( a ) <

f (b ) – f (a ) b– a

y f '( b ) >

f ( b + ( a – b )) – f ( b ) a– b

por ser a – b < 0, con lo que Lema. Supongamos que f es derivable y f’ es creciente. Si a < b y f ( a ) = f ( b ), entonces f ( x ) < f ( a ) = f ( b ) para a < x < b. Demostración: Supongamos que f ( x ) > f ( a ) = f ( b ) para algún x del intervalo abierto ( a , b). Entonces el máximo de f sobre el intervalo [ a , b ] se presenta en algún punto x0 perteneciente a ( a , b) y por ser máximo se cumplirá que f '( x0 ) = 0. Por otra parte, aplicando el teorema del valor medio al intervalo [a , x0], encontramos que existe un x1, con a < x1 < x0, que cumple f ( x0 ) – f ( a ) f '( x1 ) = >0 x0 – a TEMARIO DE MATEMÁTICAS. PRUEBA A

75


76


en contradicción con el hecho de ser f ' creciente, ya que f '( x1 ) > f '( x0 ) = 0, con x1 < x0. Así queda demostrado que f ( x ) £ f ( a ) = f ( b ) para a < x < b y sólo nos queda demostrar que f ( x ) ¹ f ( a ), para cualquier x perteneciente a ( a , b). Supongamos que f ( x ) = f ( a ) para algún x de ( a , b). Sabemos que f no es constante al ser f ' creciente sobre [ a , x], de modo que existe algún x1, con a < x1 < x y f ( x1 ) < f ( a ). Aplicando el teorema del valor medio al intervalo [x1, x], vemos que existe un valor x2 del mismo tal que

Si f ''( x0 ) > 0 la función sería convexa en x0. Si f ''( x0 ) < 0, la función sería convexa en x0. Como no es ni cóncava ni convexa, entonces f ''( x0 ) = 0. Demostración:

Si f es derivable de orden dos en x0 y x0 es un punto de inflexión de f, entonces f ''( x0 ) = 0. f ( x ) – f ( x1 ) >0 x – x1

Proposición:

f '( x2 ) =

lo que nos vuelve a contradecir la hipótesis del crecimiento de f ', al ser f '( x2 ) > f '( x ) = 0 y x2 < x. Si f ''( x0 ) > 0, entonces f ' es creciente y por el teorema anterior es convexa en x0. Teorema (17). Si f es una función derivable y su derivada f ' es creciente entonces f es convexa. Demostración:

Si f es derivable de orden dos en x0 y f ''( x0 ) > 0, entonces f es convexa en x0.

Demostración:

Sea a < b. Definamos la función g como

Proposición:

g (x )= f (x ) –

f (b ) – f (a ) (x – a ) b– a

Definición: Un número c recibe el nombre de punto de inflexión de f, si la tangente a la gráfica de f en ( a , f ( a )), corta a la misma. de donde

f (b ) – f (a ) b– a

por lo que f es convexa.

g '( x ) = f '( x ) –

f (x ) – f (a ) f (b ) – f (a ) < x– a b– a

Es fácil ver que g 'es creciente al serlo f 'y además g ( a ) = g ( b ) = f ( a ), por lo que aplicando el lema anterior a la función g, deducimos que g ( x ) < g ( a ) si a < x < b, o lo que es lo mismo f (b ) – f (a ) (x – a )< f (a ) b– a f (x ) –

f (b ) – f (a ) (x – a )< f (a ) b– a f (x ) –

Es fácil ver que g 'es creciente al serlo f 'y además g ( a ) = g ( b ) = f ( a ), por lo que aplicando el lema anterior a la función g, deducimos que g ( x ) < g ( a ) si a < x < b, o lo que es lo mismo f (x ) – f (a ) f (b ) – f (a ) < x– a b– a g '( x ) = f '( x ) –

f (b ) – f (a ) b– a

por lo que f es convexa.

de donde

Definición: Un número c recibe el nombre de punto de inflexión de f, si la tangente a la gráfica de f en ( a , f ( a )), corta a la misma. g (x )= f (x ) –

f (b ) – f (a ) (x – a ) b– a

Sea a < b. Definamos la función g como

Si f es derivable de orden dos en x0 y f ''( x0 ) > 0, entonces f es convexa en x0.

Demostración:

Proposición:

Demostración:

Teorema (17). Si f es una función derivable y su derivada f ' es creciente entonces f es convexa. Si f ''( x0 ) > 0, entonces f ' es creciente y por el teorema anterior es convexa en x0. lo que nos vuelve a contradecir la hipótesis del crecimiento de f ', al ser f '( x2 ) > f '( x ) = 0 y x2 < x. f '( x2 ) =

f ( x ) – f ( x1 ) >0 x – x1

Proposición:

Si f es derivable de orden dos en x0 y x0 es un punto de inflexión de f, entonces f ''( x0 ) = 0. en contradicción con el hecho de ser f ' creciente, ya que f '( x1 ) > f '( x0 ) = 0, con x1 < x0. Así queda demostrado que f ( x ) £ f ( a ) = f ( b ) para a < x < b y sólo nos queda demostrar que f ( x ) ¹ f ( a ), para cualquier x perteneciente a ( a , b). Supongamos que f ( x ) = f ( a ) para algún x de ( a , b). Sabemos que f no es constante al ser f ' creciente sobre [ a , x], de modo que existe algún x1, con a < x1 < x y f ( x1 ) < f ( a ). Aplicando el teorema del valor medio al intervalo [x1, x], vemos que existe un valor x2 del mismo tal que Demostración:

Si f ''( x0 ) > 0 la función sería convexa en x0. Si f ''( x0 ) < 0, la función sería convexa en x0. Como no es ni cóncava ni convexa, entonces f ''( x0 ) = 0.



76

Estudio global de funciones Teorema (18). Supongamos que f es una función n veces derivable en a y con derivada f n continua ì f ''( a ) = f '''( a ) =...= f n–1( a ) = 0 en a y que cumple: í n . Entonces î f (a )¹ 0 1. 2. 3.

Si n es par y f n ( a )> 0, entonces f es convexa. Si n es par y f n ( a )< 0, entonces f es cóncava. Si n es impar, entonces f tiene un punto de inflexión en a. Demostración: Si desarrollamos f ( x ) por la fórmula de Taylor en un entorno del punto a y teniendo en cuenta las hipótesis del teorema, tenemos f ( x ) = f ( a )+ f '( a )( x – a )+

f n (a ) ( x – a )n + Rn,a ( x ) n!

de donde f ( x ) – f ( a ) – f '( a )( x – a ) f n ( a ) R n ,a ( x ) = + n (x – a ) n! ( x – a )n y tomando límites cuando x ® a y teniendo en cuenta que lim x ®a

lim x ®a

R n ,a ( x ) = 0, tenemos ( x – a )n

f ( x ) – f ( a ) – f '( a )( x – a ) f n (a ) = n (x – a ) n!

es decir que en un entorno del punto a la función

f ( x ) – f ( a ) – f '( a )( x – a ) tiene el mismo signo ( x – a )n

f n (a ) . Como f ( x ) es la ordenada de la curva correspondiente al punto x del entorno de a y n! f ( a )+ f '( a )( x – a ) es la ordenada de la tangente a la curva en el punto a, tenemos que

que

–

Si n es par y f n ( a )> 0, como ( x – a )n > 0, el signo de f ( x ) – ( f ( a )+ f '( a )( x – a )) es igual al signo de f n ( a ) en un entorno del punto a, es decir f ( x ) – ( f ( a )+ f '( a )( x – a )) > 0, o sea f ( x ) > f ( a )+ f '( a )( x – a ) y por lo tanto la curva es convexa en el punto considerado ya que la gráfica se encuentra por encima de la tangente.

–

Si n es par y f n ( a )< 0, como ( x – a )n > 0, el signo de f ( x ) – ( f ( a )+ f '( a )( x – a )) es igual al signo de f n ( a ) en un entorno del punto a, es decir f ( x ) – ( f ( a )+ f '( a )( x – a )) < 0, o sea f ( x ) < f ( a )+ f '( a )( x – a ) y por lo tanto la curva es cóncava en el punto considerado ya que la gráfica se encuentra por debajo de la tangente.

–

f ( x ) – ( f ( a )+ f '( a )( x – a )) tiene el mismo signo que f n ( a ), ( x – a )n pero el signo de la primera expresión depende de que el valor de x sea mayor o menor que a, ya que si f n ( a )> 0 y x < a entonces f ( x ) – ( f ( a )+ f '( a )( x – a )) < 0, es decir f ( x ) < f ( a )+ + f '( a )( x – a ) y si x > a, f ( x ) > f ( a )+ f '( a )( x – a ), con lo que la tangente atraviesa a la curva en ese punto y por lo tanto a es un punto de inflexión. De manera análoga se demuestra si f n ( a )< 0. Si n es impar, tendremos que

8. ASÍNTOTAS Se dice que un punto se aleja infinitamente sobre una curva, cuando su abscisa, su ordenada o ambas coordenadas crecen infinitamente. Se llama asíntota una recta t tal que la distancia entre ella y un punto P TEMARIO DE MATEMÁTICAS. PRUEBA A

77


78


Una función f ( x )es periódica de periodo T (T > 0 y mínimo), si para todo valor x del dominio, se verifica f ( x+ T ) = f ( x ).

de la curva que se aleje infinitamente tiende a cero. Se pueden distinguir tres casos, según que tienda a infinito x, f(x) o ambas.

2.

Asíntotas horizontales. Si cuando x ® ¥,+¥, –¥, el límite de f ( x ) es b diremos que la recta y = b es una asíntota horizontal de f ( x ). Asíntotas verticales. Si cuando x ® a, a+ , a – , el límite de la función es+¥, –¥, diremos que la recta x = a es una asíntota vertical de f ( x ). Asíntotas oblicuas. Si al alejarse infinitamente un punto sobre una rama de la curva x e y crecen infinitamente, para que la recta y = mx + n sea un asíntota basta con que tienda a cero la diferencia de ordenadas de recta y curva para la misma abscisa, cuando esta tiende a infinito. Por lo tanto podemos escribir la ecuación de la curva como f ( x ) = mx + n + e ( x )

9.3. Periodicidad

1.

Estudiaremos las dos posibilidades de simetrías de la función según sea esta par o impar. Una función f ( x ) es simétrica respecto al eje de ordenadas o función par si al sustituir x por –x la función no varía, es decir f (– x ) = f ( x ), para todos los valores x del dominio. Así si una función es par, basta construir la gráfica para valores x > 0 y obtener el resto por simetría respecto al eje de ordenadas. Una función f ( x ) es simétrica respecto al origen o función impar si al sustituir x por –x la función cambia de signo, es decir f (– x ) = – f ( x ), para todos los valores x del dominio. Así si una función es impar, basta construir la gráfica para valores x > 0 y obtener el resto por simetría respecto al origen. 3.

siendo e( x ) un infinitésimo cuando x ® ¥,+¥, –¥. Si dividimos la expresión anterior por x, tendremos f (x ) n e( x ) = m+ + x x x

9.2. Determinación de las simetrías de la función

Es el conjunto de valores de la variable independiente x, para los cuales está definido el valor de la función f ( x ). Habrá que estudiar los valores para los que no está definida la función, bien por falta de expresión analítica, bien porque la expresión no tenga sentido en esos valores o bien porque la función sea “infinita” en ellos.

f (x ) = m, es decir, si existe la asíntota x oblicua, su pendiente debe coincidir con el límite indicado. Además como lim[mx+ n – f ( x )] = 0, y tomando límites cuando x ® ¥,+¥, –¥, tendremos que lim x ®¥

x ®¥

tendremos que n = lim[ f ( x ) – mx].

9.1. Determinación del dominio o campo de existencia

x ®¥

Construir la curva que representa gráficamente la función y = f ( x ) consiste en determinar las propiedades características de la misma y sus elementos notables de manera que aun no conociendo el valor de la función en todos los puntos de la curva, se pueda deducir del examen de la gráfica las propiedades de la función. Es difícil precisar cuáles son las propiedades que se han de considerar como características y los elementos que hemos llamado notables, pero nos ocuparemos de dar los pasos enumerados a continuación.

9. ESTUDIO Y REPRESENTACIÓN DE CURVAS EXPLÍCITAS

Construir la curva que representa gráficamente la función y = f ( x ) consiste en determinar las propiedades características de la misma y sus elementos notables de manera que aun no conociendo el valor de la función en todos los puntos de la curva, se pueda deducir del examen de la gráfica las propiedades de la función. Es difícil precisar cuáles son las propiedades que se han de considerar como características y los elementos que hemos llamado notables, pero nos ocuparemos de dar los pasos enumerados a continuación.

9. ESTUDIO Y REPRESENTACIÓN DE CURVAS EXPLÍCITAS x ®¥

9.1. Determinación del dominio o campo de existencia

tendremos que n = lim[ f ( x ) – mx].

x ®¥

f (x ) y tomando límites cuando x ® ¥,+¥, –¥, tendremos que lim = m, es decir, si existe la asíntota x ®¥ x oblicua, su pendiente debe coincidir con el límite indicado. Además como lim[mx+ n – f ( x )] = 0,

Es el conjunto de valores de la variable independiente x, para los cuales está definido el valor de la función f ( x ). Habrá que estudiar los valores para los que no está definida la función, bien por falta de expresión analítica, bien porque la expresión no tenga sentido en esos valores o bien porque la función sea “infinita” en ellos. f (x ) n e( x ) = m+ + x x x

9.2. Determinación de las simetrías de la función

siendo e( x ) un infinitésimo cuando x ® ¥,+¥, –¥. Si dividimos la expresión anterior por x, tendremos

Estudiaremos las dos posibilidades de simetrías de la función según sea esta par o impar. Una función f ( x ) es simétrica respecto al eje de ordenadas o función par si al sustituir x por –x la función no varía, es decir f (– x ) = f ( x ), para todos los valores x del dominio. Así si una función es par, basta construir la gráfica para valores x > 0 y obtener el resto por simetría respecto al eje de ordenadas. Una función f ( x ) es simétrica respecto al origen o función impar si al sustituir x por –x la función cambia de signo, es decir f (– x ) = – f ( x ), para todos los valores x del dominio. Así si una función es impar, basta construir la gráfica para valores x > 0 y obtener el resto por simetría respecto al origen. 3.

2.

1.

Asíntotas horizontales. Si cuando x ® ¥,+¥, –¥, el límite de f ( x ) es b diremos que la recta y = b es una asíntota horizontal de f ( x ). Asíntotas verticales. Si cuando x ® a, a+ , a – , el límite de la función es+¥, –¥, diremos que la recta x = a es una asíntota vertical de f ( x ). Asíntotas oblicuas. Si al alejarse infinitamente un punto sobre una rama de la curva x e y crecen infinitamente, para que la recta y = mx + n sea un asíntota basta con que tienda a cero la diferencia de ordenadas de recta y curva para la misma abscisa, cuando esta tiende a infinito. Por lo tanto podemos escribir la ecuación de la curva como f ( x ) = mx + n + e ( x )

9.3. Periodicidad

Una función f ( x )es periódica de periodo T (T > 0 y mínimo), si para todo valor x del dominio, se verifica f ( x+ T ) = f ( x ).

de la curva que se aleje infinitamente tiende a cero. Se pueden distinguir tres casos, según que tienda a infinito x, f(x) o ambas.



78


9.4. Cortes con los ejes y regionamiento Los cortes con los ejes son los puntos en los que la curva corta a los ejes coordenados. Para hallarlos se le da a x el valor cero (dándonos los puntos de corte con el eje de ordenadas) y a f(x) el valor cero, resolviendo dicha ecuación (dándonos los puntos de corte con el eje de abscisas). Una vez calculados los puntos de corte con el eje de abscisas y los puntos de discontinuidad de la función, procederemos a estudiar el signo de la misma en los diferentes intervalos de la recta real generados por los mismos, viendo en qué regiones del plano estará la gráfica de f(x).

9.5. Crecimiento y decrecimiento Apoyándonos en lo estudiado en el tema, daremos el siguiente criterio de crecimiento y decrecimiento de una función f(x). Sea la función y = f ( x ); supongamos que existe la derivada primera y que no se anula en un punto x0. Si f '( x0 ) > 0 la función es estrictamente creciente en x0 y si f '( x0 ) < 0 la función es estrictamente decreciente en x0. Así, calcularemos la derivada primera y veremos en qué puntos es f '( x )> 0 y f '( x )< 0.

9.6. Máximos y mínimos Sabemos que si la función f ( x ) es derivable, o sea, admite derivada finita en el punto x0 es condición necesaria para que en él tenga un máximo o un mínimo que f '( x0 ) = 0. Sin embargo, esta condición no es suficiente, por lo que para calcular los máximos y mínimos de una función y = f ( x ), calcularemos inicialmente los valores de x para los cuales f '( x )= 0 y aplicaremos con posterioridad los criterios expuestos en el tema para saber qué valores de x son máximos y cuáles mínimos.

–

Primer criterio. Si al crecer x pasando por el valor x0, la derivada f '( x ) pasa de: a) b) c)

–

Negativa a positiva, hay un mínimo en el punto x = x0. Positiva a negativa, hay un máximo en el punto x = x0. Positiva a positiva o negativa a negativa no hay extremo.

Segundo criterio. Cuando en el punto crítico x0 existe la derivada segunda, y no se anula, entonces si: a) f ''( x0 ) > 0, x = x0 es un mínimo relativo. b) f ''( x0 ) < 0, x = x0 es un máximo relativo.

9.7. Concavidad y convexidad. Puntos de inflexión Recordaremos el concepto de punto de inflexión: “Se llama punto de inflexión de una curva a todo punto P en el cual la misma cambia el sentido de su concavidad”. Recordaremos los criterios para estudiar la concavidad y convexidad de una curva:

–

Si en el punto x0, la segunda derivada existe y es finita, si: a) b)

–

f ''( x0 ) > 0, la función es convexa en ese punto. f ''( x0 ) < 0, la función es cóncava en ese punto.

Si f ''( x0 ) = 0, tomamos un entorno arbitrario de x0 y si la derivada segunda: a) b) c)

Cambia de signo, puede haber un punto de inflexión. Si pasa de positiva a positiva, la función es convexa. Si pasa de negativa a negativa, la función es cóncava.


79


80


y sen t = = tg t x cos t

9.8. Asíntotas

Recordemos que recibe el nombre de asíntota de una curva aquella recta que se acerca indefinidamente a una curva sin llegar a tocarla y esto ocurre cuando los puntos de la curva se alejan infinitamente. Cabe distinguir tres tipos de asíntotas, según la posición que adopten: horizontales, verticales y oblicuas. Para su estudio y localización daremos los pasos que se han explicado en el epígrafe 8 del tema. Lo que también nos interesa mucho a la hora de hacer la posterior representación gráfica es la posición de la curva respecto a las asíntotas, que deberemos estudiar según sea la asíntota: y como

x2 + y 2 = a 2t 2 cos 2 t + a 2t 2 sen 2 t = a 2t 2[cos 2 t + sen 2 t ] = a 2t 2

representan una espiral (espiral de Arquímedes). Si queremos eliminar t para hallar su ecuación implícita basta observar que debemos elevar al cuadrado los miembros de ambas ecuaciones y sumar, con lo que tendremos

Si la asíntota es y = mx + n (asíntota oblicua), basta estudiar el signo de f ( x ) – mx – n, cuando x ® ¥, +¥, – ¥ y según sea positivo o negativo la curva está por encima o por debajo de la asíntota. Si la asíntota es y = b (asíntota horizontal), veremos el signo de f ( x ) – b, cuando x ® ¥, +¥, – ¥ y según sea positivo o negativo la curva está por encima o por debajo de la asíntota. Si la asíntota es x = a (asíntota vertical), estudiaremos el signo de f ( x )cuando x tiende a a, por la derecha y por la izquierda, es decir, cuando x ® a+ y cuando x ® a – . y = a × t sen t

x2 y2 + =1 a2 b2

c)

que es la ecuación en forma implícita de dicha cónica. Las ecuaciones paramétricas

b)

x = a × t cos t

a)

son las ecuaciones paramétricas de una elipse. De ellas se deduce

10. REPRESENTACIÓN DE UNA CURVA DADA POR SUS ECUACIONES EN FORMA PARAMÉTRICA x = a cos t

y = b sen t

expresión que liga a las variables x e y, y que define a y como función de x si se hace corresponder a cada valor de x el valor o valores de y que junto con dicho valor de x satisfacen la condición anterior. Así por ejemplo, las ecuaciones Sean x, y funciones de un mismo parámetro t, o sea, x = f (t )

y = g (t )

F ( x , y )= 0 Para cada valor de t se tendrá un par de valores x, y que pueden considerarse como coordenadas de un punto P del plano. Al variar t, el punto P variará también. E1 conjunto de puntos P cuyas coordenadas están dadas por las dos funciones anteriores, al variar t, se dice que forma una curva dada por las ecuaciones paramétricas

Si las ecuaciones paramétricas permiten eliminar el parámetro t, se puede pasar de ellas a la ecuación de la curva en forma implícita x = f (t )

y = g (t )

x = f (t )

y = g (t )

Para cada valor de t se tendrá un par de valores x, y que pueden considerarse como coordenadas de un punto P del plano. Al variar t, el punto P variará también. E1 conjunto de puntos P cuyas coordenadas están dadas por las dos funciones anteriores, al variar t, se dice que forma una curva dada por las ecuaciones paramétricas

Si las ecuaciones paramétricas permiten eliminar el parámetro t, se puede pasar de ellas a la ecuación de la curva en forma implícita F ( x , y )= 0 x = f (t )

y = g (t )

expresión que liga a las variables x e y, y que define a y como función de x si se hace corresponder a cada valor de x el valor o valores de y que junto con dicho valor de x satisfacen la condición anterior. Así por ejemplo, las ecuaciones Sean x, y funciones de un mismo parámetro t, o sea,

10. REPRESENTACIÓN DE UNA CURVA DADA POR SUS ECUACIONES EN FORMA PARAMÉTRICA x = a cos t

y = b sen t

son las ecuaciones paramétricas de una elipse. De ellas se deduce

y = a × t sen t

a)

x = a × t cos t

b)

Si la asíntota es y = mx + n (asíntota oblicua), basta estudiar el signo de f ( x ) – mx – n, cuando x ® ¥, +¥, – ¥ y según sea positivo o negativo la curva está por encima o por debajo de la asíntota. Si la asíntota es y = b (asíntota horizontal), veremos el signo de f ( x ) – b, cuando x ® ¥, +¥, – ¥ y según sea positivo o negativo la curva está por encima o por debajo de la asíntota. Si la asíntota es x = a (asíntota vertical), estudiaremos el signo de f ( x )cuando x tiende a a, por la derecha y por la izquierda, es decir, cuando x ® a+ y cuando x ® a – . que es la ecuación en forma implícita de dicha cónica. Las ecuaciones paramétricas

c)

x2 y2 + =1 a2 b2

representan una espiral (espiral de Arquímedes). Si queremos eliminar t para hallar su ecuación implícita basta observar que debemos elevar al cuadrado los miembros de ambas ecuaciones y sumar, con lo que tendremos

Recordemos que recibe el nombre de asíntota de una curva aquella recta que se acerca indefinidamente a una curva sin llegar a tocarla y esto ocurre cuando los puntos de la curva se alejan infinitamente. Cabe distinguir tres tipos de asíntotas, según la posición que adopten: horizontales, verticales y oblicuas. Para su estudio y localización daremos los pasos que se han explicado en el epígrafe 8 del tema. Lo que también nos interesa mucho a la hora de hacer la posterior representación gráfica es la posición de la curva respecto a las asíntotas, que deberemos estudiar según sea la asíntota: x2 + y 2 = a 2t 2 cos 2 t + a 2t 2 sen 2 t = a 2t 2[cos 2 t + sen 2 t ] = a 2t 2

y como



80

9.8. Asíntotas

y sen t = = tg t x cos t

Estudio global de funciones deducimos t = arctg

y x

y por tanto æ yö x2 + y2 = a 2ç arctg ÷ è xø

2

que es la ecuación implícita de la espiral de Arquímedes. Sin embargo para el estudio de una curva dada por sus ecuaciones paramétricas, no siempre es conveniente pasar a la forma implícita por eliminación del parámetro, sino que muchas veces es preferible hacer el estudio directamente, manteniendo las ecuaciones en forma paramétrica. Para representar una curva en coordenadas paramétricas se deben seguir los siguientes pasos: 1.

Determinación del campo de definición. Cada una de las funciones x = f (t ) y = g (t ) tendrá un campo de existencia, y la parte común de éstos es el campo en que, al dar valores a t, obtenemos un valor para x y otro para y, teniendo así las coordenadas de un punto de la curva. En principio haremos variar t de –¥a+¥, pero este intervalo se puede restringir por no estar definida alguna de ellas o por ser funciones trigonométricas en cuyo caso y en virtud de la periodicidad bastará considerar el intervalo [ 0,2p ]. Por ejemplo, la curva de ecuaciones 3t 2 4t 3 x= 2 y= 3 t +1 t +1 tiene x definido para todo valor de t e y sólo en el intervalo –1< t < ¥, luego este último será el intervalo de variación de t para el cual existen puntos de la curva.

2.

Simetrías. A1 cambiar t por –t, pueden presentarse los siguientes casos: a) x e y no cambian. Se obtiene, por tanto, el mismo punto. Basta, pues, tomar como intervalo de variación el [ 0,¥ ) para representar toda la curva. b) x se cambia en –x; y no cambia. Existe simetría con respecto al eje de ordenadas. c) x no cambia; y cambia en –y. Existe simetría con respecto al eje de abscisas. d) x cambia en –x; y cambia en –y. Existe simetría con respecto al origen. Si para un valor de t se obtiene dos valores opuestos de x y un solo valor de y, la curva es simétrica respecto al eje de ordenadas. Si para un valor t se obtienen dos valores de y opuestos y un solo valor de x, la curva es simétrica respecto al eje de abscisas. Si para un valor de t se obtienen los valores opuestos de x y los valores opuestos de y, la curva es simétrica respecto al eje x, y al eje y. Por ejemplo la curva x= t4+3

y = 3t

da para un t determinado dos valores opuestos de x y uno solo de y, luego es simétrica respecto al eje de ordenadas. 3.

Cortes con los ejes. Para calcular la intersección con el eje de abscisas se resuelve la ecuación g ( t )= 0; si t i son las raíces de esta ecuación entonces xi = f ( t i ) son las abscisas de estos puntos de corte. Para calcular la intersección de la curva con el eje de ordenadas se resuelve la ecuación f ( t )= 0 y si son t i las raíces de esta ecuación entonces y = g ( t i ) son las ordenadas de estos puntos de corte. Por ejemplo, dada la elipse de ecuación: x = a cos t y = b sen t Los puntos de intersección con el eje x son en los que b ×sen t = 0, es decir t = 0y t = p, dándonos los puntos ( a ,0 ) y (– a ,0 ).


81


82


Asíntotas. Se buscan los valores de t para los cuales y = g ( t ) ® ¥ y tales que x = f ( t ) ® a ¹ ¥. Entonces x = a es una asíntota vertical. Análogamente si x = f ( t ) ® ¥ e y = g ( t ) ® b ¹ ¥, entonces y = b es una asíntota horizontal. Si cuando t ® t 0 se tiene f (t ) ® ¥ g (t ) ® ¥ pueden presentarse uno de estos casos: g (t ) a) Si lim = m, con lo que y = mx es una dirección asintótica. Si lim( g ( t ) – m× f ( t )) = h ¹ ¥, t ®t0 f ( t ) t ®t0 entonces existe una asíntota oblicua y = mx + h. g (t ) b) Si lim = ¥, existe una rama parabólica en la dirección del eje y. t ®t0 f ( t ) g (t ) c) Si lim = 0 existe una rama parabólica en la dirección del eje x. t ®t0 f ( t )

Crecimiento y decrecimiento. Para estudiar el crecimiento y decrecimiento, calculamos las derivadas x'( t ) e y '( t ) y vamos variando el valor del parámetro t a lo largo de todo el campo de definición, calculando el signo, positivo o negativo, de cada una de estas derivadas, calculando previamente los valores de t para los que se anulan.

9.

Puntos múltiples. Resultan de hallar los valores de t que hacen simultáneamente nulo x'( t ) e y '( t ).

8.

Puntos de cruzamiento. Son aquellos puntos en los que para dos valores distintos del parámetro t : t1 y t 2 se verifica: f ( t1 ) = f ( t 2 ) Þ x1 = x2 g ( t1 ) = g ( t 2 ) Þ y1 = y2 Para hallarlos, basta resolver el sistema formado por las ecuaciones anteriores.

7.

Máximos y mínimos. Puntos de inflexión. Concavidad y convexidad. No ofrece ninguna novedad sobre lo ya visto para las curvas en forma explícita, salvo que pueden ser máximos y mínimos de tangente vertical cuando x'( t )= 0 e y'( t )¹ 0 y de tangente horizontal cuando y '( t )= 0 y x'( t )¹ 0.

6.

Intersección con las asíntotas. Sea y = mx + h una asíntota cualquiera. Sustituimos cada función x e y por sus valores f ( t ) y g ( t ), respectivamente, con lo que tenemos g ( t ) = m× f ( t )+ h Sean t i las raíces de esta ecuación. Los puntos de corte con la asíntota son los Pi ( xi , yi ) dados por xi = f ( t i ), yi = g ( t i ).

5.

4.

Por ejemplo, sea la curva

y=

Para t ® –1

x®¥

y®

–6 8

y la ordenada en el origen será: é ù 5 t–5 t+2 4 h = limê – ú= t ®1ë ( t – 3 )( t – 1) 3 ( t – 1)( t + 1) û 6

–6 es una asíntota horizontal. 8 Para t ® –1, x ® ¥, y ® ¥ y tenemos y ( t – 5 )( t + 1) (1 – 5 )(1+ 1) 4 = ® = x ( t + 1)( t – 3 ) (1+ 1)(1 – 3 ) 3

y la ordenada en el origen será: é ù 5 t–5 t+2 4 h = limê – ú= t ®1ë ( t – 3 )( t – 1) 3 ( t – 1)( t + 1) û 6

Intersección con las asíntotas. Sea y = mx + h una asíntota cualquiera. Sustituimos cada función x e y por sus valores f ( t ) y g ( t ), respectivamente, con lo que tenemos g ( t ) = m× f ( t )+ h Sean t i las raíces de esta ecuación. Los puntos de corte con la asíntota son los Pi ( xi , yi ) dados por xi = f ( t i ), yi = g ( t i ). x=

t+2 t2 – 1

y=

5.

4 5 x + es una asíntota oblicua. 3 6

a)

Luego y =

b)

Para t ® –1 –6 x®¥ y® 8 –6 por tanto y = es una asíntota horizontal. 8 Para t ® –1, x ® ¥, y ® ¥ y tenemos y ( t – 5 )( t + 1) (1 – 5 )(1+ 1) 4 = ® = x ( t + 1)( t – 3 ) (1+ 1)(1 – 3 ) 3

por tanto y = b)

t–5 ( t – 3 )( t – 1)

4 5 x + es una asíntota oblicua. 3 6

a)

t+2 t2 – 1

Luego y =

x=

t–5 ( t – 3 )( t – 1)

Por ejemplo, sea la curva

Asíntotas. Se buscan los valores de t para los cuales y = g ( t ) ® ¥ y tales que x = f ( t ) ® a ¹ ¥. Entonces x = a es una asíntota vertical. Análogamente si x = f ( t ) ® ¥ e y = g ( t ) ® b ¹ ¥, entonces y = b es una asíntota horizontal. Si cuando t ® t 0 se tiene f (t ) ® ¥ g (t ) ® ¥ pueden presentarse uno de estos casos: g (t ) a) Si lim = m, con lo que y = mx es una dirección asintótica. Si lim( g ( t ) – m× f ( t )) = h ¹ ¥, t ®t0 f ( t ) t ®t0 entonces existe una asíntota oblicua y = mx + h. g (t ) b) Si lim = ¥, existe una rama parabólica en la dirección del eje y. t ®t0 f ( t ) g (t ) = 0 existe una rama parabólica en la dirección del eje x. f (t )

c)

t ®t0

Si lim

6.

Máximos y mínimos. Puntos de inflexión. Concavidad y convexidad. No ofrece ninguna novedad sobre lo ya visto para las curvas en forma explícita, salvo que pueden ser máximos y mínimos de tangente vertical cuando x'( t )= 0 e y'( t )¹ 0 y de tangente horizontal cuando y'( t )= 0 y x '( t )¹ 0.

7.

Puntos de cruzamiento. Son aquellos puntos en los que para dos valores distintos del parámetro t : t1 y t 2 se verifica: f ( t1 ) = f ( t 2 ) Þ x1 = x2 g ( t1 ) = g ( t 2 ) Þ y1 = y2 Para hallarlos, basta resolver el sistema formado por las ecuaciones anteriores.

8.

Puntos múltiples. Resultan de hallar los valores de t que hacen simultáneamente nulo x'( t ) e y'( t ).

9.

Crecimiento y decrecimiento. Para estudiar el crecimiento y decrecimiento, calculamos las derivadas x'( t ) e y '( t ) y vamos variando el valor del parámetro t a lo largo de todo el campo de definición, calculando el signo, positivo o negativo, de cada una de estas derivadas, calculando previamente los valores de t para los que se anulan.

82


4.


TEMA

29 El problema del cálculo del área. Integral definida

Jesús Gómez Gómez



84



INTRODUCCIÓN

2.

EL PROBLEMA DEL ÁREA COMO ORIGEN DEL CONCEPTO DE INTEGRAL 2.1. Génesis histórica del cálculo integral 2.2. Reformulación del problema del área 2.3. Hacia una formalización del concepto del área 2.3.1. Conjuntos cuadrables del plano 2.3.2. Axiomatización del área

3.

INTEGRAL DE RIEMANN DE UNA FUNCIÓN ACOTADA 3.1. Particiones de un intervalo 3.2. Sumas de Riemann 3.3. Definición de función R-integrable 3.4. Integral inferior e integral superior 3.5. La condición de Riemann. Criterios de integrabilidad 3.6. La integral y el área

4.

TIPOS DE FUNCIONES R-INTEGRABLES 4.1. Integrabilidad-Riemann de las funciones monótonas 4.2. Integrabilidad-Riemann de las funciones continuas 4.3. Integrabilidad-Riemann de funciones no continuas. Caracterización de Lebesgue 4.4. Integrabilidad-Riemann de funciones escalonadas y regladas

APÉNDICES I. Cambio de variable en una integral definida II. Integración por partes III. El segundo teorema de la media IV. Integrales impropias

RELACIÓN ENTRE INTEGRACIÓN Y DERIVACIÓN 7.1. El primer teorema de la media 7.2. El teorema fundamental del Cálculo 7.3. Cálculo de una integral mediante una primitiva: la fórmula de Newton-Leibniz

7.

SOBRE EL PROCESO DE INTEGRACIÓN 6.1. La integral definida como un límite 6.2. Acerca del símbolo de integración

6.

PROPIEDADES FUNDAMENTALES DE LA INTEGRAL DEFINIDA 5.1. Linealidad 5.2. Aditividad respecto del intervalo 5.3. Signo de la integral 5.4. Monotonía

5.

TIPOS DE FUNCIONES R-INTEGRABLES 4.1. Integrabilidad-Riemann de las funciones monótonas 4.2. Integrabilidad-Riemann de las funciones continuas 4.3. Integrabilidad-Riemann de funciones no continuas. Caracterización de Lebesgue 4.4. Integrabilidad-Riemann de funciones escalonadas y regladas

4.

INTEGRAL DE RIEMANN DE UNA FUNCIÓN ACOTADA 3.1. Particiones de un intervalo 3.2. Sumas de Riemann 3.3. Definición de función R-integrable 3.4. Integral inferior e integral superior 3.5. La condición de Riemann. Criterios de integrabilidad 3.6. La integral y el área

3.

EL PROBLEMA DEL ÁREA COMO ORIGEN DEL CONCEPTO DE INTEGRAL 2.1. Génesis histórica del cálculo integral 2.2. Reformulación del problema del área 2.3. Hacia una formalización del concepto del área 2.3.1. Conjuntos cuadrables del plano 2.3.2. Axiomatización del área

2.

INTRODUCCIÓN

1.

5.

PROPIEDADES FUNDAMENTALES DE LA INTEGRAL DEFINIDA 5.1. Linealidad 5.2. Aditividad respecto del intervalo 5.3. Signo de la integral 5.4. Monotonía

6.

SOBRE EL PROCESO DE INTEGRACIÓN 6.1. La integral definida como un límite 6.2. Acerca del símbolo de integración

7.

RELACIÓN ENTRE INTEGRACIÓN Y DERIVACIÓN 7.1. El primer teorema de la media 7.2. El teorema fundamental del Cálculo 7.3. Cálculo de una integral mediante una primitiva: la fórmula de Newton-Leibniz APÉNDICES I. Cambio de variable en una integral definida II. Integración por partes III. El segundo teorema de la media IV. Integrales impropias



84

El problema del cálculo del área

1. INTRODUCCIÓN Puede considerarse que el Cálculo Infinitesimal trata de dos problemas fundamentales: encontrar la tangente a una curva en uno de sus puntos y determinar el área encerrada por una curva. Ambos son resueltos por sendos procesos de paso al límite, denominados diferenciación e integración, respectivamente. Se sabe que el problema del área que dio origen a la noción de integral es históricamente anterior al de la recta tangente a una curva, que dio asimismo origen al concepto de derivada. Obviamente, desde los métodos aproximativos primitivos (Eudoxo de Cnido, Arquímedes de Siracusa, Hipócrates de Chíos…) hasta nuestros días, la teoría de la integración ha llegado a unas cotas de desarrollo que permiten enfoques teóricos modernos y diversos. Desde un punto de vista didáctico no es necesario abordar el tema al más alto nivel de formalización, lo cual no significa renunciar a cierto rigor científico. Lo que se cree oportuno aquí es “sacrificar” cierto grado de generalidad, en aras de poder optar por la vía menos engorrosa y más intuitiva para introducir el concepto. Así pues definiremos la integral a la manera de Riemann, estableceremos la integrabilidad de las funciones continuas en un intervalo [ a , b ] y acabaremos ciñéndonos prácticamente a este tipo de funciones. No obstante, es preciso también manejar la integral de funciones no necesariamente continuas, lo cual tiene gran aplicación en otras partes de la matemática, como la teoría de la probabilidad (recuérdense los sencillos ejemplos de la d de Dirac o la u de Heaviside). Por ello hace casi un siglo la integral de Lebesgue generalizó a la integral de Riemann. Grosso modo, la integral de Riemann se construye a partir de sumas asociadas a una partición del intervalo (sumas de Riemann) que se ajustan cada vez más valor al buscado, a medida que se va afinando la partición. La integral de Lebesgue se introduce partiendo de un tipo muy peculiar de funciones –las escalonadas–, para las que la definición de integral resulta muy simple y acorde con la intuición. Se extiende después el concepto, recurriendo a la convergencia uniforme, a funciones regladas o casi-escalonadas, que pueden tener una infinidad numerable de discontinuidades y de las que forman parte las funciones continuas y las funciones monótonas. Para ello es preciso dotar antes de una “norma” al espacio x de funciones escalonadas sobre el intervalo [ a , b ]. Obtenemos así el concepto de integral para una clase bastante amplia de funciones, todas ellas integrables en el sentido Riemann, que cubren las necesidades elementales del cálculo. Mayor generalización se consigue con la integración Riemann-Stieljes, que incluye no una función b sino dos. El símbolo para esta integral es òa ¦ ( x ) da ( x ), que tiene aún sentido para funciones a( x ) (“integradores”) discontinuas. La integral de Riemann es un caso particular para a( x ) = x, al igual que la sumación (Euler). En la teoría de la probabilidad la integral de Riemann-Stieljes es un instrumento útil que hace posible la consideración simultánea de variables aleatorias continuas y discretas. Ni que decir tiene que el objetivo del presente tema no es desarrollar estas generalizaciones teóricas de la noción de integral, sino que, al contrario, trataremos deliberadamente de no perder de vista la propia génesis del concepto: el problema del área. De ahí que el enfoque sea más conceptual e intuitivo que formal y abstracto, lo cual no es óbice para tratar de “conciliar” en modo alguno las diferentes perspectivas posibles del tema.

2. EL PROBLEMA DEL ÁREA COMO ORIGEN DEL CONCEPTO DE INTEGRAL 2.1. Génesis histórica del cálculo integral El equivalente griego del cálculo integral lo constituye el llamado método de exhausción, basado en lo que se conoce como axioma de Arquímedes, aunque el propio Arquímedes reconoció que fue Eudoxo de Cnido el que verdaderamente lo dio. Según ese lema o axioma, dadas dos magnitudes del mismo tipo (de modo que ninguna de las dos sea cero) siempre puede hallarse un múltiplo de una que exceda a la otra. A partir del axioma anterior es fácil demostrar la llamada propiedad de exhausción: Si de cualquier magnitud sustraemos una parte no menor que su mitad, y si del resto sustraemos de nuevo una cantidad no menor que su mitad, y si continuamos este proceso de sustracción, terminaremos por obtener como resto una magnitud menor que cualquier magnitud del mismo tipo dada de antemano.


85


86


Los griegos ya hicieron uso de esa propiedad para demostrar teoremas acerca de áreas de figuras curvilíneas. Figura 4.

0

a

Pero Fermat, algo más tarde, descubrió un método para hallar el área encerrada bajo curvas de la forma y = xn. En el cálculo de dichas áreas utilizó fórmulas para la suma de potencias de enteros. Los resultados obtenidos supusieron un avance importante sobre los anteriores de Cavalieri, quien se había limitado a casos particulares. La idea de Fermat consistía ya en subdividir el intervalo de x = 0 hasta x = a en infinitos subintervalos mediante los puntos a , ak , ak 2 , ak 3..., donde k es un número positivo menor que la unidad. De esa manera el área bajo la curva se aproximaba mediante rectángulos circunscritos, tal como se indica en la figura 4.

Figura 1.

Se había sugerido anteriormente que el área del círculo se podría obtener inscribiendo en él un polígono regular y aumentando indefinidamente el número de lados (figura 1). Pero no sabían cerrar el razonamiento, ya que la idea de límite era desconocida, y lo seguiría siendo durante más de dos milenios. Así pues, la pro1 piedad de exhausción, que equivale en términos modernos a límM (1 – r )n = 0 (si £ r < 1), sirvió para n ®¥ 2 hacer más riguroso ese método. Si consideramos las áreas que quedan fuera de los polígonos inscritos, pero dentro del círculo, está claro que al duplicar el número de lados, sustraemos de estas áreas intermedias más de su mitad. Por tanto, en virtud de la propiedad exhausción las áreas intermedias se pueden reducir cada vez más, duplicando el número de lados. Figura 2. Ese procedimiento iterativo fue perfeccionado por Arquímedes (III a. C.) para llegar a estimar el área del círculo con una precisión mayor que egipcios y babilonios. Se le atribuye la demostración, por el método de exhausción, de que el área del círculo es igual a la del triángulo rectángulo que tiene uno de sus catetos igual a la longitud de la circunferencia y el otro igual al radio, aunque se cree más probable que dicho resultado se deba a Dinostrato, quien lo presuponía en sus intentos sobre la cuadratura del círculo. De los tratados referentes al citado método de exhausción, el que mejor se puede considerar como un precedente del cálculo integral es la obra de Arquímedes titulada Sobre la cuadratura de la parábola. En ella el gran genio matemático de la antigüedad consigue puC lir aún más el método estándar y demuestra rigurosamente que el B 4T , siendo T el área del segmento parabólico ABCDE es igual a D 3 área del mayor triángulo ACE inscrito, es decir, el de la misma base y la misma altura (figura 3). Posteriormente, el monje Buenaventura Cavalieri, desarrollando y generalizando resultados de Kepler y Galileo, aporta una idea fundamental en su obra Geometría indivisubilibus, publicada A E en 1635: un área se puede considerar compuesta por segmentos rectilíneos o “indivisibles” . Sin saberlo, se encontraba siguiendo Figura 3. las huellas del verdadero proceso de integración como sumación de elementos infinitesimales. Entre otros, llega por la vía geoméa a n+1 n

Se había sugerido anteriormente que el área del círculo se podría obtener inscribiendo en él un polígono regular y aumentando indefinidamente el número de lados (figura 1). Pero no sabían cerrar el razonamiento, ya que la idea de límite era desconocida, y lo seguiría siendo durante más de dos milenios. Así pues, la pro1 piedad de exhausción, que equivale en términos modernos a límM (1 – r )n = 0 (si £ r < 1), sirvió para n ®¥ 2 hacer más riguroso ese método. Si consideramos las áreas que quedan fuera de los polígonos inscritos, pero dentro del círculo, está claro que al duplicar el número de lados, sustraemos de estas áreas intermedias más de su mitad. Por tanto, en virtud de la propiedad exhausción las áreas intermedias se pueden reducir cada vez más, duplicando el número de lados. Figura 2. Ese procedimiento iterativo fue perfeccionado por Arquímedes (III a. C.) para llegar a estimar el área del círculo con una precisión mayor que egipcios y babilonios. Se le atribuye la demostración, por el método de exhausción, de que el área del círculo es igual a la del triángulo rectángulo que tiene uno de sus catetos igual a la longitud de la circunferencia y el otro igual al radio, aunque se cree más probable que dicho resultado se deba a Dinostrato, quien lo presuponía en sus intentos sobre la cuadratura del círculo. De los tratados referentes al citado método de exhausción, el que mejor se puede considerar como un precedente del cálculo integral es la obra de Arquímedes titulada Sobre la cuadratura de la parábola. En ella el gran genio matemático de la antigüedad consigue puC lir aún más el método estándar y demuestra rigurosamente que el B 4T , siendo T el área del segmento parabólico ABCDE es igual a D 3 área del mayor triángulo ACE inscrito, es decir, el de la misma base y la misma altura (figura 3). Posteriormente, el monje Buenaventura Cavalieri, desarrollando y generalizando resultados de Kepler y Galileo, aporta una idea fundamental en su obra Geometría indivisubilibus, publicada A E en 1635: un área se puede considerar compuesta por segmentos rectilíneos o “indivisibles” . Sin saberlo, se encontraba siguiendo Figura 3. las huellas del verdadero proceso de integración como sumación de elementos infinitesimales. Entre otros, llega por la vía geoméa a n+1 . trica a resultados equivalentes a ò0 xndx = n+1 trica a resultados equivalentes a

ò x dx = n + 1. 0

Pero Fermat, algo más tarde, descubrió un método para hallar el área encerrada bajo curvas de la forma y = xn. En el cálculo de dichas áreas utilizó fórmulas para la suma de potencias de enteros. Los resultados obtenidos supusieron un avance importante sobre los anteriores de Cavalieri, quien se había limitado a casos particulares. La idea de Fermat consistía ya en subdividir el intervalo de x = 0 hasta x = a en infinitos subintervalos mediante los puntos a , ak , ak 2 , ak 3..., donde k es un número positivo menor que la unidad. De esa manera el área bajo la curva se aproximaba mediante rectángulos circunscritos, tal como se indica en la figura 4.

Figura 1. 0

a

Los griegos ya hicieron uso de esa propiedad para demostrar teoremas acerca de áreas de figuras curvilíneas. Figura 4.

86



El problema del cálculo del área El método de Fermat fallaba evidentemente para n = –1, pero dicho inconveniente vino a resolverlo otro contemporáneo de Fermat, el jesuita Gregory de St.Vincent. Este tomó a partir de x = a puntos tales que determinaran intervalos crecientes en progresión geométrica y vio que levantando en esos puntos las ordenadas correspondientes a la hipérbola xy = 1, entonces las áreas bajo la curva encerradas entre cada dos ordenadas sucesivas son iguales. Ello viene a significar que, según crece la abscisa geométricamente, el área bajo la curva crece aritméticamente. Por lo tanto, aun de manera imprecisa, lo equivalente a nuestra b igualdad òa x-1dx = ln b – ln a , ya era conocido. Así pues, Fermat y Gregory de St. Vincent, se interesaron por cuestiones propias del análisis infinitesimal (tangentes, cuadraturas, longitudes de curvas, etc.). Pero el carácter inverso del problema de hallar las tangentes a la curva y = kx n y el de hallar áreas encerradas bajo la misma pasó inadvertido. Al parecer Fermat no prestó atención a lo que hoy se llama teorema fundamental del cálculo. Aunque la integración se reducía prácticamente a funciones del tipo xn, podemos decir que el cálculo integral se anticipó al cálculo diferencial. Las generalizaciones del algoritmo arquimediano vinieron después fundamentalmente con John Wallis, James Gregory e Isaac Barrow, todos ellos ligeramente anteriores a Newton. De todos, fue este último el que más se aproximó a la relación entre integración y derivación. Sin conocer directamente la obra de Fermat, Barrow fue el primero en reconocer el carácter inverso de los problemas relativos a tangentes y cuadraturas, pero su empecinamiento en los métodos geométricos le impidió hacer uso de esa relación. Afortunadamente su joven sucesor y discípulo, Isaac Newton, continuó trabajando en esos problemas. Los avances que constituyeron sus nuevos métodos infinitesimales (“método de fluxiones”) le permitieron explotar la relación inversa entre pendiente y área. De hecho, en su tratado De Analysi, escrito en 1669, aparece por primera vez el cálculo de un área mediante el proceso inverso de lo que llamamos diferenciación. Por ello se considera a Newton el verdadero inventor del cálculo, aunque probablemente, como él mismo llegó a reconocer, no fuera el primero en efectuar diferenciaciones e integraciones, ni tampoco en ver las relaciones entre ambas operaciones, expresadas en el teorema fundamental. Una agria disputa sobre la prioridad en el descubrimiento del cálculo tuvo lugar entre Newton y otro de los matemáticos más grandes y fecundos de esa época: el alemán Gottfried W. Leibniz. Hoy día está claro que el descubrimiento de Newton precedió al de Leibniz, así como que éste hizo sus descubrimientos independientemente de los de aquél. Así pues, Leibniz publicó en 1686 una exposición del cálculo integral en las Acta Eruditorum (especie de “revista matemática” mensual), en la que muestra que las cuadraturas son un caso especial del método inverso de las tangentes, haciendo hincapié en la relación inversa entre diferenciación e integración y llegando prácticamente hasta el teorema fundamental del cálculo. Es destacable la aceptación que tuvo por la plausibilidad de sus ideas y por acertadísima notación que empleó, siendo el primero en utilizar el símbolo ò. Podemos decir que Newton y Leibniz son los verdaderos “padres” del cálculo integral, tal como se conoce en nuestros días.

2.2. Reformulación del problema del área El método exhaustivo de Eudoxo de Cnido, posteriormente completado por Arquímedes, fue el precursor del método de aproximaciones sucesivas. Como vimos, consistía en aproximar el recinto plano Â mediante figuras poligonales inscritas o circunscritas, haciendo cada vez mayor el número de lados de la poligonal (figura 5).

Â

P5

P7

n=5

n=7

área (R) = lím área (Pn ) n ¥

Figura 5.


87


88


Figura 8.

nk = nº de intervalos de Ek contenidos en A. n 'k = nº de intervalos de Ek con intersección no vacía con A.

Podemos considerar otro tipo de configuraciones elementales para aproximar el área del recinto (rectángulos, cuadrículas, trapecios, etc.). En cualquier caso la idea será la misma (figura 6). En el plano afín euclídeo A2 ( R ) llamamos intervalo generalizado de rané m m+ 1ö é p p + 1ö go k al conjunto ê k , k ÷´ê k , k ÷con m, p Î Z y n Î N , que se trata ë2 2 ø ë2 2 ø de un cuadrado. Notemos por Ek la familia de intervalos generalizados de rango k del plano. Dado un conjunto plano acotado cualquiera A, denotemos por

Figura 6.

M

M

A

M

2.3.1. Conjuntos cuadrables del plano

N

N

N

El concepto de área está incluido en la teoría general de la medida. Se han dado varias definiciones de área (Jordan, Lebesgue,…), pero en la mayoría de ellas se parte de unas figuras elementales (cuadrados, rectángulos, polígonos…) a las que se les asigna un área de manera simple (áreas básicas). Después las figuras casi-elementales pueden definirse como uniones casi-disjuntas (en el sentido de que su intersección se reduce a puntos-frontera). La definición de área debe ser tal que comprenda la mayor cantidad posible de conjuntos del plano como conjuntos dotados de un área. Pero no todos los subconjuntos del plano tienen área.

En todos ellos, área ( M ) y área ( N ) son aproximaciones por defecto y exceso, respectivamente, de área( Â ): área ( M ) £ área ( Â ) £ área ( N ). El valor de área( Â ) se asignaría por paso al límite. Pero formalizar esto no es tan simple. Aunque el concepto último de integral es independiente por sí mismo, pretendemos llegar a él sin perder de vista la idea motivadora. Si asumimos ciertas restricciones para una función y = f ( x ) definida en un intervalo cerrado [ a , b ] , tendremos un arco de curva en el semif plano superior respecto del eje OX, que encierra bajo sí una región plana dada por el conjunto

2.3. Hacia una formalización del concepto del área Figura 7.

En la figura adjunta, donde se ha tomado f continua y no negativa en [ a , b ], la región Â es el trapecio “mixtilíneo” (figura 7) delimitado por el arco de curva, el eje de abscisas y las rectas verticales x = a y x = b. La noción de integral definida surgirá del problema de asignar un área al citado recinto.

Â = {( x, y ) Î R 2 / 0 £ x £ a , 0 £ y £ f ( x )}

X

En la figura adjunta, donde se ha tomado f continua y no negativa en X

[ a , b ], la región Â es el trapecio “mixtilíneo” (figura 7) delimitado por el

Â = {( x, y ) Î R 2 / 0 £ x £ a , 0 £ y £ f ( x )}

arco de curva, el eje de abscisas y las rectas verticales x = a y x = b. La noción de integral definida surgirá del problema de asignar un área al citado recinto. Â

Figura 7.

Y

b

b

a

a

Â

Y

Si asumimos ciertas restricciones para una función y = f ( x ) definida en un intervalo cerrado [ a , b ] , tendremos un arco de curva en el semiplano superior respecto del eje OX, que encierra bajo sí una región plana dada por el conjunto

f

2.3. Hacia una formalización del concepto del área

En todos ellos, área ( M ) y área ( N ) son aproximaciones por defecto y exceso, respectivamente, de área( Â ): área ( M ) £ área ( Â ) £ área ( N ). El valor de área( Â ) se asignaría por paso al límite. Pero formalizar esto no es tan simple. Aunque el concepto último de integral es independiente por sí mismo, pretendemos llegar a él sin perder de vista la idea motivadora.

El concepto de área está incluido en la teoría general de la medida. Se han dado varias definiciones de área (Jordan, Lebesgue,…), pero en la mayoría de ellas se parte de unas figuras elementales (cuadrados, rectángulos, polígonos…) a las que se les asigna un área de manera simple (áreas básicas). Después las figuras casi-elementales pueden definirse como uniones casi-disjuntas (en el sentido de que su intersección se reduce a puntos-frontera). La definición de área debe ser tal que comprenda la mayor cantidad posible de conjuntos del plano como conjuntos dotados de un área. Pero no todos los subconjuntos del plano tienen área. N N

N

2.3.1. Conjuntos cuadrables del plano

M

M

A

En el plano afín euclídeo A2 ( R ) llamamos intervalo generalizado de rané m m+ 1ö é p p + 1ö go k al conjunto ê k , k ÷´ê k , k ÷con m, p Î Z y n Î N , que se trata ë2 2 ø ë2 2 ø de un cuadrado. Notemos por Ek la familia de intervalos generalizados de rango k del plano. Dado un conjunto plano acotado cualquiera A, denotemos por M

Figura 6.

nk = nº de intervalos de Ek contenidos en A. n 'k = nº de intervalos de Ek con intersección no vacía con A.

Podemos considerar otro tipo de configuraciones elementales para aproximar el área del recinto (rectángulos, cuadrículas, trapecios, etc.). En cualquier caso la idea será la misma (figura 6). 88



Figura 8.

El problema del cálculo del área Es trivial que nk £ n 'k , y además: n j+1 n1 n2 . 2 , n1 £ 2 , ..., y en general n j £ 2 2 22 n ' j+1 n' n' n '1£ 4 n '0 , n '2£ 4 n '1, de donde n '0³ 21 , n '1³ 22 , ..., y en general n ' j³ 2 . 2 2 2 n1 ³ 4 n0 , n2 ³ 4 n1, de donde n0 £

Por tanto, se tiene: n0 £

n1 n n n £ 2 £ 3 £...£ 2×kk £... 22 22×2 22×3 2

n '0³

n '1 n '2 n '3 n 'k 2 ³ 2×2 ³ 2×3 ³ ...³ 2×k ³... 2 2 2 2

Como nk £ n 'k , entonces se cumplen: nk n' k £ £ n '0 22k 22k

y

n 'k nk ³ ³ n0 22k 22k

æn ö æ n' ö Tenemos, pues, un par de sucesiones ç kk ÷ yç kk ÷ , ambas monótonas, la primera creciente y maè 2 øk Î N è 2 øk Î N n yorada y la segunda decreciente y minorada. En consecuencia ambas son convergentes. Sean a( A ) = lím kk y k ®¥ 2 n' a '(A) = lím kk . k ®¥ 2 Diremos que el conjunto A es cuadrable si a ( A ) = a '( A ). Al valor común de ambos límites le llamaremos área de A y lo denotaremos m( A ). Llamaremos W a la familia de los conjuntos cuadrables del plano. Se verifican: 1. Si A, B Î W, entonces A Ç B Î W y A È B Î W . 2.

Si A, B Î W y A Ç B = Æ, se tiene m ( A È B ) = m ( A )+ m ( B ).

3.

Si A, B Î W y A Ì B, entonces m ( A ) £ m ( B ).

4.

Para cualesquiera a , b , c, d Î R, con a < b y c < d , se cumple que [ a , b) ´ [ c , d ) Î W, siendo m([ a , b) ´ [ c, d ) ) = ( b – a )× ( d – c ).

5.

Æ Î W, siendo m( Æ ) = 0.

6.

Si ¶( A ) es la frontera de un conjunto cuadrable A, se tiene m(¶( A )) = 0.

Sabemos que todo rectángulo en el plano, cuyos lados tienen longitudes h y k es congruente con el rectángulo [ a , a + h ]´ [ b , b + h ] (lo cual puede particularizarse para un cuadrado de lado h).

Figura 9.

b+h

b+k

b

b

a

a+h


a

a+h

89


90


Podemos tomar, pues, como figuras básicas o elementales aquellas que resulten de unión casi-disjunta de cuadrados, o aquellas que son uniones de rectángulos “rampantes” (figura 10).

Axioma de exhausción: “Sea A un conjunto del plano tal S Ì A Ì T , siendo S y T dos regiones escalonadas (reuniones finitas de rectángulos), y tal que existe un único número a que satisfaga m ( S ) £ a £ m (T ) para todas las regiones escalonadas S y T que encierren a A. Entonces A es medible y m( A ) = a”.

5.

Axioma de elección de escala: “Todo rectángulo R es medible, siendo m( R ) = hk , donde h y k son las longitudes de sus lados”.

4.

Axioma de diferencia: “Si A , B Î M y B Ì A entonces también A – B Î M”.

3.

Axioma de aditividad: “La unión y la intersección de dos conjuntos medibles son también medibles. Es decir, si A , B Î M, entonces A È B, A Ç B Î M. En el caso de que la unión sea disjunta (A Ç B = Æ), entonces se verifica: m ( A È B ) = m ( A )+ m ( B )”.

2.

Axioma de invarianza: “Sean dos conjuntos del plano A y B entre los cuales se puede una biyección que conserve la distancia (isometría). Si A Î M, entonces también B Î M, siendo m ( A ) = m ( B ). En particular el axioma establece que si A y B son dos recintos planos cuadrables congruentes (superponibles por un movimiento) su área es la misma”.

1.

S

S

Figura 10.

El área m( S ) de tales figuras será la suma de las áreas de los cuadrados o rectángulos que las componen. Entonces diremos que una figura plana F es cuadrable o admite cuadratura si dado cualquier número e > 0 arbitrariamente pequeño, es posible encontrar dos figuras elementales S e y S e¢ tales que: 1. 2.

S e Ì F Ì S ¢e . m ( S e ) – m ( S¢e ) < e.

Sólo tendrá sentido hablar de área de una figura F , cuando ésta sea cuadrable.

Hay conjuntos del plano a los que se les puede asignar un área y otros a los que no. Aquellos conjuntos del plano que tienen área se llaman medibles. La noción de área de una región plana se puede establecer a partir de una definición axiomática. Tomaremos como axiomas algunas de las propiedades fundamentales del área. Si M es la clase de conjuntos medibles del plano, podemos definir el área como una función de conjunto m: M ® R+ È {0}, que a cada conjunto medible A asocia un número real m( A ) no negativo denominado área de A, sujeto a los axiomas siguientes: Figura 11.

2.3.2. Axiomatización del área

Hay conjuntos del plano a los que se les puede asignar un área y otros a los que no. Aquellos conjuntos del plano que tienen área se llaman medibles. La noción de área de una región plana se puede establecer a partir de una definición axiomática. Tomaremos como axiomas algunas de las propiedades fundamentales del área. Si M es la clase de conjuntos medibles del plano, podemos definir el área como una función de conjunto m: M ® R+ È {0}, que a cada conjunto medible A asocia un número real m( A ) no negativo denominado área de A, sujeto a los axiomas siguientes:

2.3.2. Axiomatización del área Figura 11.

Sólo tendrá sentido hablar de área de una figura F , cuando ésta sea cuadrable.

Axioma de invarianza: “Sean dos conjuntos del plano A y B entre los cuales se puede una biyección que conserve la distancia (isometría). Si A Î M, entonces también B Î M, siendo m ( A ) = m ( B ). En particular el axioma establece que si A y B son dos recintos planos cuadrables congruentes (superponibles por un movimiento) su área es la misma”. 1. 2.

S e Ì F Ì S ¢e . m ( S e ) – m ( S¢e ) < e.

1.

El área m( S ) de tales figuras será la suma de las áreas de los cuadrados o rectángulos que las componen. Entonces diremos que una figura plana F es cuadrable o admite cuadratura si dado cualquier número e > 0 arbitrariamente pequeño, es posible encontrar dos figuras elementales S e y S e¢ tales que: 2.

Axioma de aditividad: “La unión y la intersección de dos conjuntos medibles son también medibles. Es decir, si A , B Î M, entonces A È B, A Ç B Î M. En el caso de que la unión sea disjunta (A Ç B = Æ), entonces se verifica: m ( A È B ) = m ( A )+ m ( B )”.

3.

Axioma de diferencia: “Si A , B Î M y B Ì A entonces también A – B Î M”.

4.

Axioma de elección de escala: “Todo rectángulo R es medible, siendo m( R ) = hk , donde h y k son las longitudes de sus lados”.

5.

Axioma de exhausción: “Sea A un conjunto del plano tal S Ì A Ì T , siendo S y T dos regiones escalonadas (reuniones finitas de rectángulos), y tal que existe un único número a que satisfaga m ( S ) £ a £ m (T ) para todas las regiones escalonadas S y T que encierren a A. Entonces A es medible y m( A ) = a”.

Figura 10.

S

S

Podemos tomar, pues, como figuras básicas o elementales aquellas que resulten de unión casi-disjunta de cuadrados, o aquellas que son uniones de rectángulos “rampantes” (figura 10).



90


Algunas consecuencias: a)

& Æ, bastam( Æ ) = 0. En efecto, si tomamos un conjunto medible A, teniendo en cuenta que A = A È ría aplicar el axioma 2.

b)

Si A , B Î M y B Ì A, entonces m ( A – B ) = m ( A ) – m ( B ). Es consecuencia del axioma 2, pues en tal & ( A – B ). caso es A = B È

c)

Si A , B Î M y B Ì A, entonces m ( B ) £ m ( A ). De lo anterior tenemos m ( A ) = m ( B )+ m ( A – B ) ³ m ( B ), ya que m( A – B ) ³ 0.

d)

Toda región escalonada es medible al ser unión finita de rectángulos y en virtud del axioma de aditividad.

e)

Si A , B Î M, entonces m ( A È B ) = m ( A )+ m ( B ) – m ( A Ç B ). Basta tener en cuenta que la unión & B = A È ( B – A Ç B ), siendo además A Ç B Ì B. puede convertirse en unión disjunta poniendo A È Entonces en virtud del axioma 2 y de la consecuencia b) se obtiene la igualdad.

3. INTEGRAL DE RIEMANN DE UNA FUNCIÓN ACOTADA 3.1. Particiones de un intervalo Definición: Se llama partición del intervalo [ a , b ] a un conjunto finito P = {x0 , x1,..., xn}de puntos del intervalo, siendo: 1. 2.

x0 = a, xn = b. xi–1 < x1 ( i = 1,2,..., n ) . n

con lo cual se tiene [ a , b ] = U [xi–1, xi] . i=1

A la mayor de las amplitudes de los subintervalos [xi–1, xi] se denomina diámetro o norma de la partición, que denotaremos por DP. Se trata de la mayor de las diferencias Dxi = xi – xi–1, es decir, DP = máx{Dxi}i=1,...,n. Eventualmente los puntos de la partición pueden ser equidistantes, o sea, los subintervalos de la misb–a . n

ma amplitud. En tal caso será obviamente DP=

Una partición trivial de [ a , b ] sería P = {x0 , x1} con x0 = a, xn = b. Sean dos particiones P y Q del intervalo [ a , b ], tales todos los puntos de P son también puntos de Q ( P Ì Q ), que diremos que Q es más fina que P y escribiremos Q p P. Es obvio que entonces la más fina tiene menor diámetro, o sea: Q p P Þ DQ < DP. El conjunto P ( I ) de todas las particiones del intervalo I = [ a , b ] está parcialmente ordenado por la relación anterior, siendo además un conjunto dirigido, ya que dadas dos particiones P1 y P2, existe otra partición ( P1 È P2) más fina que ambas.

3.2. Sumas de Riemann Sea f una función real definida y acotada en el intervalo [ a , b ] . En principio supondremos que f es no negativa en dicho intervalo para enlazar mejor con la noción de área, pero dicha restricción después no será necesaria. Nos remitimos, pues, al problema planteado inicialmente de asignar un área al trapecio mixtilíneo de la figura, es decir, al recinto: Â = {( x, y) Î R / a £ x £ b , 0 £ y £ f ( x )} 2


f

Â

a

b

Figura 12.

91


92


Para una partición P = {x , x ,..., x } del intervalo, cualquier suma de la forma

Es cierta porque se verifica mi £ f ( t i ) £ M i para cualquier t i Î [xi–1, xi] . 0

1

n

Para cualquier partición del intervalo se verifica: S ( f , P ) £ S ( f , P ). n

n

S ( ¦, P )= å¦ ( t i )( xi – xi–1 ) = å¦ ( t i )Dxi

con t i Î [xi–1, xi]

1.

Propiedades de las sumas de Riemann:

i=1

i=1

–

se denomina suma de Riemann de f relativa a la partición P (figura 13 a). Está claro que para una misma partición hay infinitas sumas de Riemann, pues la elección de los ti es arbitraria. Figura 14.

Como hemos considerado f está acotada en [ a , b ], lo estará en cada subintervalo [xi–1, xi] de la partición, por lo que existen mi = inf { f ( x ) / x Î [xi–1, xi]} M i = sup{ f ( x ) / x Î [xi–1, xi]}

( i = 1,2,..., n ) ( i = 1,2,..., n )

Las sumas S ( f , P ), S ( f , P ) y S ( f , P ) definidas anteriormente, son aproximaciones del área del recinto Â. Con esos valores se pueden formar la sumas n

Figura 13.

n

S ( f , P ) = åmi ( xi – xi–1 ) = åmiDxi i=1

i=1

i=1

i=1

n

n

S ( f , P ) = åmi ( xi – xi–1 ) = åmiDxi

con t i Î [xi–1, xi] ti

con t i Î [xi–1, xi] mi

que denominamos, respectivamente, suma inferior y suma superior de f relativas a la partición P (figuras 13.b y 13.c) Mi

(a)

f(ti)

(b)

(c) (b)

(c) f(ti)

(a)

Mi

que denominamos, respectivamente, suma inferior y suma superior de f relativas a la partición P (figuras 13.b y 13.c) mi

n

n

i=1

i=1

n

n

i=1

i=1


con t i Î [xi–1, xi] ti



Figura 13.

Las sumas S ( f , P ), S ( f , P ) y S ( f , P ) definidas anteriormente, son aproximaciones del área del recinto Â. Con esos valores se pueden formar la sumas

mi = inf { f ( x ) / x Î [xi–1, xi]}

( i = 1,2,..., n )

M i = sup{ f ( x ) / x Î [xi–1, xi]}

( i = 1,2,..., n )

Como hemos considerado f está acotada en [ a , b ], lo estará en cada subintervalo [xi–1, xi] de la partición, por lo que existen

se denomina suma de Riemann de f relativa a la partición P (figura 13 a). Está claro que para una misma partición hay infinitas sumas de Riemann, pues la elección de los ti es arbitraria. Figura 14.

n

i=1

i=1

Propiedades de las sumas de Riemann: 1.


–

n

S ( ¦, P )= å¦ ( t i )( xi – xi–1 ) = å¦ ( t i )Dxi

Para cualquier partición del intervalo se verifica: S ( f , P ) £ S ( f , P ). Es cierta porque se verifica mi £ f ( t i ) £ M i para cualquier t i Î [xi–1, xi] .

Para una partición P = {x0 , x1,..., xn} del intervalo, cualquier suma de la forma

92




2.

Si P' es más fina que P, entonces S ( f , P ' ) ³ S ( f , P ) y S ( f , P ' ) £ S ( f , P ). Basta probarlo para dos particiones que difieran en un solo punto. Si fuese P '= P È {c}, donde c Î [xk –1, xk ] , tomemos m'k = inf { f ( x ) / x Î [xk –1, c]}

m''k = inf { f ( x ) / x Î [c , xk ]}

M 'k = inf { f ( x ) / x Î [xk –1, c]}

M ''k = inf { f ( x ) / x Î [c, xk ]}

Entonces: k –1

n

1

k+1

S ( f , P ' ) – S ( f , P ) = åmiDxi + m'k ( c – xk –1 )+ m''k ( xk – c )+ åmiDxi – n

– åmiDxi = m'k ( c – xk –1 )+ m''k ( xk – c ) – mk ( xk – xk –1 ) = ( m'k – mk )( c – xk –1 )+ 1

+ ( m''k – mk )( xk – c ) ³ 0 ya que m'k ³ mk y m''k ³ mk k –1

n

1

k+1

S ( f , P ' ) – S ( f , P ) = åM iDxi + M 'k ( c – xk –1 )+ M ''k ( xk – c )+ åM iDxi – n

– åM iDxi = M 'k ( c – xk –1 )+ M ''k ( xk – c ) – M k ( xk – xk –1 ) = ( M 'k – M k )( c – xk –1 )+ 1

+ ( M ''k – M k )( xk – c ) £ 0 ya que M 'k £ M k y M ''k £ M k 3.

Para cualesquiera dos particiones P y P' se tienen S ( f , P ) £ S ( f , P ' ). Tomando la partición unión P È P ', que es más fina que P y P ' y, basándonos en 1 y 2, tendremos S ( f , P ) £ S ( f , P È P ' ) £ S ( f , P È P ' ) £ S ( f , P ). La partición más “grosera” de [ a , b ] es trivialmente la {x0 , x1}, siendo x0 = a y x1 = b. Cualquier otra partición P es más fina que aquella. Si m = inf{ f ( x ) / x Î [ a , b ]} y M = sup{ f ( x ) / x Î [ a , b ]}, las sumas inferior y superior relativas a aquella partición trivial son respectivamente m( b – a ) y M ( b – a ).

m(b-a) M m

Figura 15.

a

M(b-a) b

a

b

Entonces para cualquier partición P de [ a , b ] , se verifica: m( b – a ) £ S ( f , P ) £ S ( f , P ) £ S ( f , P ) £ M ( b – a )

3.3. Definición de función R-integrable Una función f :[ a , b ] ® R acotada se dice que es integrable en el sentido de Riemann (diremos integrable-Riemann o simplemente R-integrable) si existe un número real A con la propiedad siguiente: Para todo número real e> 0, es posible encontrar una partición Pe de [ a, b] cumpliéndose S ( f , Pe ) – A < e, para cualquier suma de Riemann S ( f , Pe ) relativa a dicha partición. TEMARIO DE MATEMÁTICAS. PRUEBA A

93


94


Es posible probar fácilmente que dicho número A, si existe, es único. En tal caso lo denominamos integral b de Riemann de f en [ a , b ] y lo denotamos indistintamente por òa f ( x )dx o por I[ a,b] ( f ) (simplificado I ( f )). ì1 ï f (x )= í ï î0

si x Î [ a , b ] Ç ( R – Q )

En el símbolo òa f ( x )dx la letra x que designa la variable de integración es “muda”. Quiere esto decir b

si x Î [ a , b ] Ç Q

que puede ser reemplazada por cualquier otra, con lo que las integrales òa f ( t )dt , òa f ( u )du, òa f ( z )dz,... b

b

b

Ambas integrales pueden ser distintas. Pensemos, por ejemplo, en la restricción a [ a , b ] de la función de Dirichlet

son todas la misma que aquella. Ello explica que algunos autores prefieran escribir òa f ( x ) de manera más b

S ( f ,P )£ I ( f )£ S ( f ,P )

S ( f ,P )£ I ( f )£ S ( f ,P )

y

simplificada òa f . Esta notación para la integral definida se atribuye a Leibniz.

Para cualquier partición P de [ a , b ] , se tiene:

b)

I ( f ) £ I ( f ).

a)

b

Nota: una definición equivalente a la anterior es la siguiente

que llamaremos respectivamente integral inferior e integral superior de f en [ a , b ] . (El primero que las introdujo fue J. G. Darboux). Es fácil justificar que: ìExiste un número real A tal que para todo e > 0ü ý f integrable-Riemann en [ a , b ] Û í îexiste un d, tal que si DP < d es A – S ( f , P ) < eþ I ( f ) = inf {S ( f , P ) / P es partición de [ a , b ]}

3.4. Integral inferior e integral superior

I ( f ) = sup{S ( f , P ) / P es partición de [ a , b ]}

Volviendo al problema inicial, nuestra intuición geométrica nos dice que las sumas superiores son por lo menos tan grandes como el valor del área que buscamos, mientras que las inferiores no pueden exceder dicho área. Parece pues, natural preguntarse ¿cuál es el mayor valor posible de las sumas inferiores? ¿y el menor valor posible de las sumas superiores? Debemos precisar más esto.

son conjuntos acotados de números reales, siendo m( b – a ) y M ( b – a ) cotas inferior y superior, respectivamente. Por tanto, existen

{S ( f , P ) / P es partición de [a , b ]}

Por las propiedades de las sumas de Riemann, sabemos que cualquier suma superior S ( f , P ' ) es una cota superior del conjunto de las sumas inferiores y asimismo cualquier suma inferior S ( f , P )es cota inferior del conjunto de las sumas superiores. En definitiva, los dos conjuntos:

{S ( f , P ) / P es partición de [ a , b ]}

Por las propiedades de las sumas de Riemann, sabemos que cualquier suma superior S ( f , P ' ) es una cota superior del conjunto de las sumas inferiores y asimismo cualquier suma inferior S ( f , P )es cota inferior del conjunto de las sumas superiores. En definitiva, los dos conjuntos:

{S ( f , P ) / P es partición de [ a , b ]}

{S ( f , P ) / P es partición de [a , b ]}

Volviendo al problema inicial, nuestra intuición geométrica nos dice que las sumas superiores son por lo menos tan grandes como el valor del área que buscamos, mientras que las inferiores no pueden exceder dicho área. Parece pues, natural preguntarse ¿cuál es el mayor valor posible de las sumas inferiores? ¿y el menor valor posible de las sumas superiores? Debemos precisar más esto.

son conjuntos acotados de números reales, siendo m( b – a ) y M ( b – a ) cotas inferior y superior, respectivamente. Por tanto, existen I ( f ) = sup{S ( f , P ) / P es partición de [ a , b ]}

3.4. Integral inferior e integral superior

I ( f ) = inf {S ( f , P ) / P es partición de [ a , b ]} ìExiste un número real A tal que para todo e > 0ü ý f integrable-Riemann en [ a , b ] Û í îexiste un d, tal que si DP < d es A – S ( f , P ) < eþ

que llamaremos respectivamente integral inferior e integral superior de f en [ a , b ] . (El primero que las introdujo fue J. G. Darboux). Es fácil justificar que: Nota: una definición equivalente a la anterior es la siguiente

a)

I ( f ) £ I ( f ).

b)

Para cualquier partición P de [ a , b ] , se tiene:

simplificada òa f . Esta notación para la integral definida se atribuye a Leibniz. y

S ( f ,P )£ I ( f )£ S ( f ,P )

b

S ( f ,P )£ I ( f )£ S ( f ,P )

son todas la misma que aquella. Ello explica que algunos autores prefieran escribir òa f ( x ) de manera más

Ambas integrales pueden ser distintas. Pensemos, por ejemplo, en la restricción a [ a , b ] de la función de Dirichlet ì1 si x Î [ a , b ] Ç Q ï f (x )= í ï si x Î [ a , b ] Ç ( R – Q ) î0 b

que puede ser reemplazada por cualquier otra, con lo que las integrales òa f ( t )dt , òa f ( u )du, òa f ( z )dz,... b

b

b

En el símbolo òa f ( x )dx la letra x que designa la variable de integración es “muda”. Quiere esto decir b

Es posible probar fácilmente que dicho número A, si existe, es único. En tal caso lo denominamos integral b de Riemann de f en [ a , b ] y lo denotamos indistintamente por òa f ( x )dx o por I[ a,b] ( f ) (simplificado I ( f )).



94

El problema del cálculo del área Para cualquier partición de [ a , b ] en subintervalos [xi–1, xi] es mi = 0 y M i = 1, por lo que n

n

1

1

S ( f , P )= å0× Dxi = 0 y S ( f , P ) = å1× Dxi = b – a lo cual implica que I ( f )= 0 y I ( f ) = b – a, es decir I ( f ) ¹ I ( f ) . En este caso no va a ser posible asignar un área al conjunto de puntos

R ( f ,[ a , b ] ) = {( x, y ) Î R 2 / a £ x £ b , 0 £ y £ f ( x )} Un ejemplo en el otro sentido sería el de una función constante en

[ a , b ], o sea f ( x ) = k ( k > 0 ), para cualquier x Î [ a , b ] .

R

a

K

b

Figura 16.

Ahora para toda partición P es mi = k, M i = k ( i = 1,2,... n ), por lo que n

n

1

1

S ( f , P ) = S ( f , P ) = åkDxi = k åDxi = k ( b – a ) y por tanto I ( f ) = I ( f ) = k ( b – a ) . Dicho valor coincide con el área del rectángulo R de altura k y base b – a. Trataremos ahora de encontrar condiciones que aseguren la coincidencia de las integrales superior e inferior y que nos permitan resolver el problema del área.

3.5. La condición de Riemann. Criterios de integrabilidad Si se espera la igualdad de las dos integrales superior e inferior, también debemos esperar que la sumas superiores y las sumas inferiores sean tan próximas entre sí como queramos. Parece, pues, natural buscar aquellas funciones para las que la diferencia S ( f , P ) – S ( f , P ) pueda hacerse arbitrariamente pequeña. Decimos que f satisface la condición de Riemann en [ a , b ] si cumple: Para todo número real e> 0 , es posible encontrar una partición Pe de [ a, b] cumpliéndose S ( f , Pe ) – S ( f , Pe ) < e .

Notas: 1.

Para cualquier otra subpartición P de Pe también se cumple lo anterior, pues sería S ( f , P ) ³ S ( f , Pe ) y S ( f , P ) £ S ( f , Pe ), y de aquí: S ( f , P ) – S ( f , P ) £ S ( f , Pe ) – S ( f , Pe ) < e

2.

La condición de Riemann nos permite, al igual que la condición de Cauchy en los límites, determinar si la función es integrable sin necesidad de conocer su integral.

Teorema: Dada una función f :[ a , b ] ® R acotada las siguientes afirmaciones son equivalentes: a)

f es integrable-Riemann en [ a , b ] .

b)

f satisface la condición de Riemann en [ a , b ] .

c)

Coinciden las integrales superior e inferior de f en [ a , b ] , o sea I ( f ) = I ( f ) .


95


96


De igual manera llegamos a que existe otra partición P''e tal que I ( f ) < S ( f , P ''e )+ e. Luego S ( f , P ''e ) > I ( f ) – e, para cualquier subpartición de P''e . Demostración:

a) Þ b)

Suponiendo que I ( f ) = I ( f ), llamemos A al valor común. Por definición de I ( f ) como ínfimo de las sumas superiores, dado un e > 0 existe una partición P'e tal que S ( f , P 'e ) – e < I ( f ) . Luego S ( f , P ) < I ( f )+ e, para cualquier subpartición de P'e .

Si f es R-integrable, existe un número A cumpliendo que, dado un e > 0 cualquiera, puede encontrarse una partición Pe , tal que A – S ( f , Pe ) < e, donde S ( f , Pe ) es cualquier suma de Riemann. Podemos tomar t i y t 'i de [xi–1, xi] de modo que: c) Þ a)

n

A – å f ( t i )Dxi < l

e 3

y

n

A – å f ( t 'i )Dxi < l

e 3

Ello se cumple para cualquier e > 0, por lo que podemos asegurar que I ( f ) £ I ( f ) y, como también, I ( f ) ³ I ( f ), concluimos que I ( f ) = I ( f ) . Combinando ambas desigualdades, llegaremos a n

å[ f ( t ) –

f ( t 'i )]Dxi <

2e 3

I ( f ) £ S ( f , P ) < S ( f , P )+ e £ I ( f )+ e i

i

[1]

Si f cumple la condición de Riemann, para todo e > 0, es posible encontrar una partición P para la que S ( f , P ) < S ( f , P )+ e, y por tanto:

Puesto que M i – mi = sup{ f ( x ) – f ( x' ) / x, x'Î [xi–1, xi]}, por definición de supremo, fijado un d cualquiera, existe un elemento del conjunto anterior comprendido entre M i – mi – d y M i – mi. Tomando e , podremos pues elegir t i y t 'i cumpliendo M i – mi – d < f ( t i ) – f ( t 'i ) < M i – mi , es decir 3( b – a ) b) Þ c)

d=

M i – mi < f ( t i ) – f ( t 'i )+

e 3( b – a )

que es la condición de Riemann.

[2]

1

e 2e e 2e e ( b – a )= + = e Dxi < + å 3( b – a ) 1 3 3( b – a ) 3 3

A partir de [1] y [2] resulta que para la partición Pe se cumplirá: n n é ù e S ( f , P ) – S ( f , P ) = å[M i – mi] Dxi < åê f ( t i ) – f ( t 'i )+ úDx = ë 3( b – a ) û i 1 1

= å[ f ( t i ) – f ( t 'i )] Dxi + n

n

A partir de [1] y [2] resulta que para la partición Pe se cumplirá: n n é ù e S ( f , P ) – S ( f , P ) = å[M i – mi] Dxi < åê f ( t i ) – f ( t 'i )+ úDx = ë 3( b – a ) û i 1 1 n

= å[ f ( t i ) – f ( t 'i )] Dxi + 1

e 2e e 2e e åDxi < 3 + 3( b – a ) ( b – a )= 3 + 3 = e 3( b – a ) 1 n

e 3( b – a )

que es la condición de Riemann.

M i – mi < f ( t i ) – f ( t 'i )+

[2]

Puesto que M i – mi = sup{ f ( x ) – f ( x' ) / x, x'Î [xi–1, xi]}, por definición de supremo, fijado un d cualquiera, existe un elemento del conjunto anterior comprendido entre M i – mi – d y M i – mi. Tomando e , podremos pues elegir t i y t 'i cumpliendo M i – mi – d < f ( t i ) – f ( t 'i ) < M i – mi , es decir d= 3( b – a ) b) Þ c)

Si f cumple la condición de Riemann, para todo e > 0, es posible encontrar una partición P para la que S ( f , P ) < S ( f , P )+ e, y por tanto: i

å[ f ( t ) –

2e 3

I ( f ) £ S ( f , P ) < S ( f , P )+ e £ I ( f )+ e i

n

f ( t 'i )]Dxi <

[1]

Ello se cumple para cualquier e > 0, por lo que podemos asegurar que I ( f ) £ I ( f ) y, como también, I ( f ) ³ I ( f ), concluimos que I ( f ) = I ( f ) . Combinando ambas desigualdades, llegaremos a l

A – å f ( t i )Dxi < n

l

e 3

e 3

A – å f ( t 'i )Dxi <

y

n

c) Þ a)

Si f es R-integrable, existe un número A cumpliendo que, dado un e > 0 cualquiera, puede encontrarse una partición Pe , tal que A – S ( f , Pe ) < e, donde S ( f , Pe ) es cualquier suma de Riemann. Podemos tomar t i y t 'i de [xi–1, xi] de modo que:

Suponiendo que I ( f ) = I ( f ), llamemos A al valor común. Por definición de I ( f ) como ínfimo de las sumas superiores, dado un e > 0 existe una partición P'e tal que S ( f , P 'e ) – e < I ( f ) . Luego S ( f , P ) < I ( f )+ e, para cualquier subpartición de P'e . a) Þ b)

De igual manera llegamos a que existe otra partición P''e tal que I ( f ) < S ( f , P ''e )+ e. Luego S ( f , P ''e ) > I ( f ) – e, para cualquier subpartición de P''e . Demostración:

96



El problema del cálculo del área Si tomamos Pe = P 'e È P ''e , que es, a la vez, una subpartición de P'e y P''e , tendremos I ( f ) – e £ S ( f , P ) £ S ( f , P ) £ S ( f , P ) £ I ( f )+ e Como I ( f ) = I ( f ) = A, concluimos que para Pe o cualquier subpartición suya P se verifica A – e £ S ( f , P ) < A + e o, lo que es lo mismo, A – S ( f , P ) < e. Con ello hemos probado que f es integrable en [ a , b ] , siendo: A = I ( f ) = òa f ( x )dx = I ( f ) = I ( f ) b

3.6. La integral y el área El concepto de integral definida es independiente del concepto de área, pues la restricción de que f sea no negativa en [ a , b ] no es necesaria. Sólo habría que exigir que f esté acotada en [ a , b ] .

A

Figura 17.

Ahora bien, si f es acotada y no negativa en [ a , b ] y A es el conjunto de puntos del plano definido como

{( x , y ) Î R 2 / a £ x £ b ,

0 £ y £ f ( x )}

la condición de Riemann nos permite enlazar con la definición dada de figura cuadrable, por lo que: f es R-integrable en [ a , b ] Û A es cuadrable, siendo m( A ) = área de A = òa f ( x )dx. b

4. TIPOS DE FUNCIONES R-INTEGRABLES 4.1. Integrabilidad-Riemann de las funciones monótonas Proposición: Si f :[ a , b ] ® R es monótona, entonces es integrable-Riemann. Demostración:

–

Si f es monótona no decreciente en [ a , b ] , puede ocurrir:

Ø

f(a) = f(b) En ese caso se trata de una función constante en [ a , b ] y, por consiguiente, integrable, sienb b b do òa f ( x )dx = òa f ( a )dx = f ( a )òa dx = f ( a )( b – a ) (el recinto R ( f ; [ a , b ] ) es un rectángulo y, por tanto, cuadrable).


97


CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA i=1

S ( f , P ) – S ( f , P ) = å[ f ( t i ) – f ( t 'i )] Dxi <

e e (b – a )= e åDx = b – a i=1 i b – a f(a) ¹ f(b)

98

Ø

Entonces para cualquier partición del intervalo tendremos mi = f ( xi–1 ) y M i = f ( xi ), de donde f ( a ) £ mi £ M i £ f ( b ) y, por tanto: n

n

Ahora bien, por ser f continua en [ a , b ] , lo será en cada subintervalo [xi–1, xi] , en donde puede aplicarse el teorema de Weierstrass, llegando a que existen t i , t 'i Î [xi–1, xi] , tales que f ( t i )= M i, f ( t 'i )= mi . Entonces, al ser t i – t 'i £ Dxi £ DP < e, se tendrá: n

n

n

i=1

i=1

i=1

S ( f , P ) – S ( f , P ) = å( M i – mi) Dxi = å( M i – mi) Dxi £ å[ f ( xi ) – f ( xi–1 )] Dxi £ i=1

S ( f , P ) – S ( f , P ) = å( M i – mi )Dxi

n

£ máx Dxi å[ f ( xi ) – f ( xi–1 )] = DP ×[ f ( b ) – f ( a )] n

i=1

Si P es una partición con norma menor que d( DP < d ), entonces:

i

Demostración: Al ser f continua en un compacto [ a , b ] de R, es uniformemente continua. Así pues, dado un e > 0 e . cualquiera, existe un d > 0(que sólo depende de e) tal que: x – x ' < d implica f ( x ) – f ( x' ) < b– a f(b)

f(b)–f(a)

Proposición: Si f :[ a , b ] ® R es continua, entonces es integrable-Riemann.

f(a)

DP

Figura 18.

4.2. Integrabilidad-Riemann de las funciones continuas Tomando una partición P suficientemente fina de modo que su diámetro sea e DP = máx Dxi < i f (b ) – f (a )

Si f fuese monótona no creciente la demostración sería análoga, bastaría tomar P de modo que e . f (a ) – f (b ) i

DP = máx Dxi <

–

podremos conseguir que

luego f satisface la condición de Riemann y es por tanto integrable. e ×[ f ( b ) – f ( a )] = e f (b ) – f (a ) S ( f , P ) – S ( f ,P )£

S ( f , P ) – S ( f ,P )£

e ×[ f ( b ) – f ( a )] = e f (b ) – f (a )

luego f satisface la condición de Riemann y es por tanto integrable. podremos conseguir que

–

Si f fuese monótona no creciente la demostración sería análoga, bastaría tomar P de modo que e . DP = máx Dxi < i f (a ) – f (b ) Tomando una partición P suficientemente fina de modo que su diámetro sea e f (b ) – f (a ) i

DP = máx Dxi <

4.2. Integrabilidad-Riemann de las funciones continuas Figura 18.

Proposición: Si f :[ a , b ] ® R es continua, entonces es integrable-Riemann. DP

f(a)

Demostración: Al ser f continua en un compacto [ a , b ] de R, es uniformemente continua. Así pues, dado un e > 0 e . cualquiera, existe un d > 0(que sólo depende de e) tal que: x – x ' < d implica f ( x ) – f ( x' ) < b– a Si P es una partición con norma menor que d( DP < d ), entonces: f(b)–f(a)

f(b)

i

i=1

£ máx Dxi å[ f ( xi ) – f ( xi–1 )] = DP ×[ f ( b ) – f ( a )] i=1

n

n

S ( f , P ) – S ( f , P ) = å( M i – mi )Dxi

Ahora bien, por ser f continua en [ a , b ] , lo será en cada subintervalo [xi–1, xi] , en donde puede aplicarse el teorema de Weierstrass, llegando a que existen t i , t 'i Î [xi–1, xi] , tales que f ( t i )= M i, f ( t 'i )= mi . Entonces, al ser t i – t 'i £ Dxi £ DP < e, se tendrá: i=1

i=1

i=1

S ( f , P ) – S ( f , P ) = å( M i – mi) Dxi = å( M i – mi) Dxi £ å[ f ( xi ) – f ( xi–1 )] Dxi £ n

n

n

Entonces para cualquier partición del intervalo tendremos mi = f ( xi–1 ) y M i = f ( xi ), de donde f ( a ) £ mi £ M i £ f ( b ) y, por tanto:



98

n

f(a) ¹ f(b)

i=1

e e (b – a )= e åDx = b – a i=1 i b – a

Ø

n

S ( f , P ) – S ( f , P ) = å[ f ( t i ) – f ( t 'i )] Dxi <


4.3. Integrabilidad-Riemann de funciones no continuas. Caracterización de Lebesgue La continuidad en [ a , b ] es condición suficiente de integrabilidad, pero no necesaria. Así por ejemplo, tenemos el caso de una función escalonada, que no es continua pero sí integrable-Riemann, como probaremos más adelante. Es posible probar que una función acotada en [ a , b ] con un conjunto finito (o incluso infinito numerable) de discontinuidades es integrable-Riemann. Por ejemplo, sea el conjunto D de puntos del intervalo [ a , b ] dado por ì b – aü ý D = ít k = a + î k þkÎ N* ì1 si x Î D y definamos la función f ( x )= í î0 si x Ï D é eù Como lim x k = a, para cualquier e > 0, en el intervaloê a , a + úestarán todos los puntos de D salvo un k ®¥ ë 2û é ù e número finito x1, x 2 ,... x k0 , los cuales estarán enê a + , b ú. Construimos intervalos disjuntos centrados en ë 2 û e esos puntos y todos de amplitud menor que . Formemos ahora una partición P, en la que estén los ex2k0 e tremos de dichos intervalos y además x0 = a, x1 = a + y xn = b. Es fácil ver que S ( f , P )= 0 y 2 e e S ( f , P )< + k = e. Por tanto S ( f , P ) – S ( f , P )< e, con lo que f cumple la condición de Riemann. 2 2k0 0 El teorema siguiente, que no probaremos, generaliza lo anterior. Teorema (caracterización de Lebesgue): Si f :[ a , b ] ® R es acotada, la condición necesaria y suficiente para que sea integrable-Riemann es que el conjunto D de puntos de discontinuidad de f a lo largo del intervalo [ a , b ] sea un conjunto de medida nula. Como corolario obtenemos que las funciones regladas en [ a , b ] son integrables en sentido de Riemann. Ahora bien, el recíproco no es cierto, pues hay funciones integrables-Riemann que no son regladas. Por ejemplo: ì 1 si x Î ( 0,1] ïsen ï x f (x )= í ï 0 si x = 0 ï î es integrable según la caracterizazión de Lebesgue y sin embargo no es reglada, ya que no existe f ( 0+ ).

4.4. Integrabilidad-Riemann de funciones escalonadas y regladas Una función j:[ a , b ] ® R es escalonada si el intervalo de definición puede ser fraccionado en un número finito de subintervalos, de manera que en el interior de cada uno de ellos j toma valor constante. Es decir, un función escalonada es una función “constante a trozos”. Así pues, tendremos: Una función j:[ a, b] ® R es escalonada si existe una partición P = {x0 , x1 ,..., xn } de modo que j es constante en cada intervalo abierto ( xi– 1 , xi).


99


Si se cumple lo anterior para una partición P, es obvio que también se cumplirá en cualquiera otra más fina que P. Si P es la partición de [ a , b ] con el menor número posible de puntos, para la que se cumple la definición, la llamaremos partición asociada a la función escalonada j. Una función escalonada en [ a , b ] no toma más que un número finito de valores, y por tanto está acotada, sobre el intervalo. El recíproco no es cierto, pues la función a

b


100

ò

n ®¥

f ( x )dx = limòa jn ( x )dx b

conjunto de discontinuidades de jn. Como Dn es finito, y por ende numerable, para todo n Î N , resulta que D es numerable, al ser unión finita de conjuntos numerables. Resulta que f cumple la condición de Lebesgue, y es por tanto integrable-Riemann. Puede probarse que: n

Se sabe que el límite uniforme f de una sucesión ( jn) de funciones continuas en x0 Î I , es también una función continua en x0. Por tanto, el conjunto D de puntos de discontinuidad de f es U Dn, siendo Dn el a

b

ì1 si x Î [ a , b ] Ç Q ï h( x ) = í ï î0 si x Î [ a , b ] Ç ( R – Q )

sión ( j n ) de funciones escalonadas en [ a, b] .

Figura 19.

Una función f :[ a, b] ® R es reglada o casi-escalonada si es límite uniforme de una suce-

Decimos entonces que f es aproximada por j en menos de e. Por consiguiente, puede darse una definición equivalente de función reglada, en los términos siguientes:

sólo toma dos valores y sin embargo no es escalonada en [ a , b ]. El conjunto de discontinuidades de una función escalonada es finito (eventualmente vacío). Las únicas discontinuidades se localizan en los puntos xk de la partición asociada y serán de salto finito. Recíprocamente, toda función con un número finito de discontinuidades en el intervalo [ a , b ] y que tome en él tan sólo un número finito de valores es un función escalonada en [ a , b ], siendo la partición asociada la que se obtiene tomando los puntos de discontinuidad. Una función escalonada cumple de manera trivial la condición de Lebesgue por lo que es integrable siendo Figura 20. b

a

ò j( x )dx = ò b

I (j)

a

x1

x0

f ( x ) – j( x ) < e , "x Î [ a , b ]

Se dice que la función f :[ a , b ] ® R es reglada o casi-escalonada si cualquiera que sea e Î R+ , existe una función j escalonada en [ a , b ] tal que

Si todos los valores Ai son positivos la interpretación intuitiva de j( x òa )dx como área es inmediata.

j( x )dx+ òx j( x )dx+...+òn–1j( x )dx = òx A1dx + òx A2dx+...+òx Andx = 0

1

x1

x2

n

x2 1

xn

b

n–1

n

= A1( x1 – x0 )+ A2 ( x2 – x1 )+...+ An ( xn – xn–1 ) = å AiDxi i=1

= A1( x1 – x0 )+ A2 ( x2 – x1 )+...+ An ( xn – xn–1 ) = å AiDxi i=1

n

Si todos los valores Ai son positivos la interpretación intuitiva de

x1

1

0

1

n–1

j( x )dx+ òx j( x )dx+...+òn–1j( x )dx = òx A1dx + òx A2dx+...+òx Andx = x2

x1

n

x2

b

I (j)

b

xn

a

a

ò j( x )dx como área es inmediata.

x0

ò j( x )dx = ò

El conjunto de discontinuidades de una función escalonada es finito (eventualmente vacío). Las únicas discontinuidades se localizan en los puntos xk de la partición asociada y serán de salto finito. Recíprocamente, toda función con un número finito de discontinuidades en el intervalo [ a , b ] y que tome en él tan sólo un número finito de valores es un función escalonada en [ a , b ], siendo la partición asociada la que se obtiene tomando los puntos de discontinuidad. Una función escalonada cumple de manera trivial la condición de Lebesgue por lo que es integrable siendo Se dice que la función f :[ a , b ] ® R es reglada o casi-escalonada si cualquiera que sea e Î R+ , existe una función j escalonada en [ a , b ] tal que

a

b

Figura 20.

f ( x ) – j( x ) < e , "x Î [ a , b ]

Decimos entonces que f es aproximada por j en menos de e. Por consiguiente, puede darse una definición equivalente de función reglada, en los términos siguientes:

[ a , b ].

sólo toma dos valores y sin embargo no es escalonada en

Una función f :[ a, b] ® R es reglada o casi-escalonada si es límite uniforme de una sucesión ( j n ) de funciones escalonadas en [ a, b] .

ì1 si x Î [ a , b ] Ç Q ï h( x ) = í ï î0 si x Î [ a , b ] Ç ( R – Q )

Figura 19.

Se sabe que el límite uniforme f de una sucesión ( jn) de funciones continuas en x0 Î I , es también una función continua en x0. Por tanto, el conjunto D de puntos de discontinuidad de f es U Dn, siendo Dn el b

a

Si se cumple lo anterior para una partición P, es obvio que también se cumplirá en cualquiera otra más fina que P. Si P es la partición de [ a , b ] con el menor número posible de puntos, para la que se cumple la definición, la llamaremos partición asociada a la función escalonada j. Una función escalonada en [ a , b ] no toma más que un número finito de valores, y por tanto está acotada, sobre el intervalo. El recíproco no es cierto, pues la función

n

conjunto de discontinuidades de jn. Como Dn es finito, y por ende numerable, para todo n Î N , resulta que D es numerable, al ser unión finita de conjuntos numerables. Resulta que f cumple la condición de Lebesgue, y es por tanto integrable-Riemann. Puede probarse que:

ò

b

a

100

f ( x )dx = limòa jn ( x )dx b

n ®¥




5. PROPIEDADES FUNDAMENTALES DE LA INTEGRAL DEFINIDA 5.1. Linealidad Si f y g son integrables-Riemann en [ a , b ] , entonces para cualesquiera l , m Î R la función lf + mg es también integrable Riemann en [ a , b ] , siendo:

ò ( lf + mg )( x )dx = lò b

b

a

a

f ( x )dx+ mòa g ( x )dx b

Demostración: Dada una partición P de [ a , b ] tendremos n

n

n

1

1

S ( lf + mg , P ) = å( lf + mg , )( t i )Dxi = l å f ( t i )Dxi + m åg ( t i )Dxi = lS ( f , P )+ mS ( g , P ) 1

Si llamamos I ( f ) = òa f ( x )dx, I ( g ) = òa g ( x )dx. b

b

Dado un e > 0, por ser f y g integrables en [ a , b ], existen sendas particiones P'e y P''e tales que e , 2l

S ( f , P) – I ( f ) < S (g , P ) – I (g ) <

e 2m

,

para cualquier partición P más fina que P'e para cualquier partición P más fina que P''e

Entonces para cualquier partición P más fina que P 'e ÈP ''e se tiene: S ( lf + mg , P ) – lI ( f ) – mI ( g ) = lS ( f , P )+ mS ( g , P ) – lI ( f ) – mI ( g ) £ £ l S ( f ,P ) – I ( f ) + m S (g ,P ) – I (g ) < l

e e +m =e 2l 2m

Resulta que el conjunto de las funciones integrables-Riemann en [ a , b ] es un espacio vectorial y que el operador ò ba es una forma lineal sobre dicho subespacio.

5.2. Aditividad respecto del intervalo Si f es integrable-Riemann en el intervalo [ a , b ] y c Î ( a , b), entonces f es integrable-Riemann en los intervalos [ a , c] y [ c, b ] . Recíprocamente si f es integrable en [ a , c] y [ c, b ] , entonces f es integrable en [ a , b ] . Además se verifica:

ò

b

a

f ( x )dx = òa f ( x )dx+ òc f ( x )dx c

b

Demostración: a)

Si f es integrable en [ a , b ], dado un e > 0, existe una partición Pe , tal que para cualquier partición P más fina que Pe se cumple S ( f , P ) – S ( f , P )< e. Podemos suponer que c Î Pe (en caso contrario tomaríamos Pe È {c}, que es más fina que Pe ). La partición Pe se puede descomponer en otras dos: P 'e = Pe Ç [ a , c] y P ''e = Pe Ç [ c, b ], que designan particiones de [ a , c] y [ c, b ] , respectivamente.


101


102


Con los convenios establecidos podemos decir que la propiedad ò ba = ò ca+ò bc se verifica para cualesquiera a, b y c, aunque no sea a < c < b. Las sumas de Riemann guardan la relación

S ( f , Pe ) = S ( f , P 'e )+ S ( f , P ''e )

a1

1

f ( x )dx+ òa f ( x )dx+...+òa

n–1

n

f ( x )dx+ òa f ( x )dx = 0

S ( f , Pe ) = S ( f , P 'e )+ S ( f , P ''e )

a0

ò

a2

an

a0

por lo cual [ S ( f , P 'e ) – S ( f , P 'e )]+[ S ( f , P ''e ) – S ( f , P ''e )] = S ( f , Pe ) – S ( f , Pe )< e, donde cada una de las expresiones entre corchetes es no negativa, por lo que podemos concluir que S ( f , P 'e ) – S ( f , P 'e ) < e y S ( f , P ''e ) – S ( f , P ''e ) < e, de donde f cumple la condición de Riemann, tanto en [ a , c] como en [ c, b ]. Llegamos pues a que es integrable en [ a , c] y en [ c, b ]. Por inducción probaríamos que para una partición a = a 0 < a1 < a 2 <...< a n = b es:

De ese modo la propiedad aditiva se puede formular así òa f ( x )dx+ òb f ( x )dx+ òc f ( x )dx = 0. b

c

a

y que òa f ( x ) = 0. a

b

a

f ( x )dx = – òa f ( x )dx

b)

Si f integrable-Riemann en [ a , c] y en [ c, b ] , entonces para cualquier e > 0, pueden encone trarse sendas particiones P'e y P ''e [ a , c] y [ c, b ] tales que S ( f , P 'e ) – S ( f , P 'e ) < y 2 e . Considerando la partición Pe = P 'e ÈP ''e del intervalo [ a , b ], ten2

ò

b

Con objeto de generalizar la propiedad anterior convenimos que

S ( f , P ''e ) – S ( f , P ''e ) <

Observaciones:

dremos: e e S ( f , Pe ) – S ( f , Pe ) = [ S ( f , P 'e ) – S ( f , P 'e )]+[ S ( f , P ''e ) – S ( f , P ' 'e )] < + = e 2 2 I ( f ) = I ( f ) = òa f ( x )dx = òa f ( x )dx+ òc f ( x )dx b

mos que

c

b

con lo cual f es integrable-Riemann en [ a , b ].

Entonces I ( f ) £ òa f ( x )dx+ òc f ( x )dx £ I ( f ), de donde, al ser f integrable en [ a , b ], concluic) Para toda partición P de [ a , b ] , tomando P '= P Ç [ a , c] y P ''= P Ç [ b , c] tendremos: c

b

S ( f , P ) < òa f ( x )dx+ òc f ( x )dx < S ( f , P ) S ( f , P ' ) < òa f ( x )dx < S ( f , P ' ) c

c

b

de las que sumando m.a.m. Obtenemos

S ( f , P '' ) < òc f ( x )dx < S ( f , P ' ' ) b

S ( f , P '' ) < òc f ( x )dx < S ( f , P ' ' ) b

de las que sumando m.a.m. Obtenemos

S ( f , P ' ) < òa f ( x )dx < S ( f , P ' )

S ( f , P ) < òa f ( x )dx+ òc f ( x )dx < S ( f , P ) c

b

c

c) Para toda partición P de [ a , b ] , tomando P '= P Ç [ a , c] y P ''= P Ç [ b , c] tendremos:

Entonces I ( f ) £ òa f ( x )dx+ òc f ( x )dx £ I ( f ), de donde, al ser f integrable en [ a , b ], concluic

b

con lo cual f es integrable-Riemann en [ a , b ].

mos que

e e S ( f , Pe ) – S ( f , Pe ) = [ S ( f , P 'e ) – S ( f , P 'e )]+[ S ( f , P ''e ) – S ( f , P ' 'e )] < + = e 2 2 I ( f ) = I ( f ) = òa f ( x )dx = òa f ( x )dx+ òc f ( x )dx b

c

b

Si f integrable-Riemann en [ a , c] y en [ c, b ] , entonces para cualquier e > 0, pueden encone trarse sendas particiones P'e y P''e [ a , c] y [ c, b ] tales que S ( f , P 'e ) – S ( f , P 'e ) < y 2 e [ ] S ( f , P ''e ) – S ( f , P ''e ) < . Considerando la partición Pe = P 'e ÈP ''e del intervalo a , b , ten2 dremos: Observaciones:

Con objeto de generalizar la propiedad anterior convenimos que

ò

a

b

f ( x )dx = – òa f ( x )dx b

b)

y que òa f ( x ) = 0. a

por lo cual [ S ( f , P 'e ) – S ( f , P 'e )]+[ S ( f , P ''e ) – S ( f , P ''e )] = S ( f , Pe ) – S ( f , Pe )< e, donde cada una de las expresiones entre corchetes es no negativa, por lo que podemos concluir que S ( f , P 'e ) – S ( f , P 'e ) < e y S ( f , P ''e ) – S ( f , P ''e ) < e, de donde f cumple la condición de Riemann, tanto en [ a , c] como en [ c, b ]. Llegamos pues a que es integrable en [ a , c] y en [ c, b ].

De ese modo la propiedad aditiva se puede formular así òa f ( x )dx+ òb f ( x )dx+ òc f ( x )dx = 0. b

c

a

Por inducción probaríamos que para una partición a = a 0 < a1 < a 2 <...< a n = b es:

ò

a1

a0

f ( x )dx+ òa f ( x )dx+...+òa a2

f ( x )dx+ òa f ( x )dx = 0

an

a0

S ( f , Pe ) = S ( f , P 'e )+ S ( f , P ''e ) 1

n–1

n

S ( f , Pe ) = S ( f , P 'e )+ S ( f , P ''e )

Con los convenios establecidos podemos decir que la propiedad ò ab = ò ac+ò cb se verifica para cualesquiera a, b y c, aunque no sea a < c < b. Las sumas de Riemann guardan la relación

102




5.3. Signo de la integral Sea f una función integrable-Riemann en [ a , b ] . Entonces: a)

Si f ( x )³ 0 para cualquier x Î [ a , b ] , entonces òa f ( x )dx ³ 0.

b)

Si f ( x )£ 0 para cualquier x Î [ a , b ] , entonces òa f ( x )dx £ 0.

b

b

La demostración es muy simple, ya que si es no negativa en el intervalo [ a , b ] lo serán todas las sumas de Riemann.

5.4. Monotonía Sean f y g dos funciones integrables-Riemann tales que f ( x ) £ g ( x ) para cualquier x Î [ a , b ] , enb b tonces òa f ( x )dx £ òa g ( x )dx. (Propiedad de comparación). Bastaría aplicar la propiedad anterior a la función diferencia h ( x ) = g ( x ) – f ( x ).

ò

Consecuencia:

b

a

f ( x )dx £ òa f ( x ) dx b

En efecto, para cualquier x Î [ a , b ] se tiene – f ( x ) £ f ( x ) £ f ( x ), con lo que aplicando la propiedad

de monotonía – òa f ( x )dx £ òa f ( x )dx £ òa f ( x )dx y de aquí es inmediato lo que se quiere probar. b

b

b

6. SOBRE EL PROCESO DE INTEGRACIÓN 6.1. La integral definida como un límite Si f es continua y, por tanto, integrable en [ a , b ], hay otra manera de definir la integral mediante un límite, que es la forma en que suele introducirse tradicionalmente a niveles más elementales. Tomemos una sucesión {Pn}nÎ N de particiones cada vez más finas del intervalo, es decir, tales que para n ® ¥es DPn ® ¥(DPn = diámetro de Pn). En particular, podemos tomar una cadena de subparticiob– a nes P1 É P2 É P3 É...É Pn É... Ello es posible, pues basta tomar para Pn los puntos xni = a + i. El axion ma de continuidad de la recta real asegura que lím DPn = 0. n ®¥

{

Si para cada una de las particiones Pn = xn0 , xn1 , xn2 ,..., xnm

} elegimos puntos cualesquiera t

n1

, t n2 , t n3 ,

m

...,t nm , tales que t ni Îë xni –1 , xni ûtomamos para cada partición una suma de Riemann S ( f , Pn ) = å f ( t ni )Dxi, 1

tendremos las tres sucesiones de sumas

{S ( f , Pn )}nÎ N

,

{S ( f , Pn )}nÎ N

,

{S ( f , P )} n

nÎ N

cumpliendo para cualquier n: S ( f , Pn ) £ S ( f , Pn ) £ S ( f , Pn ) Las sucesiones {S ( f , Pn )}nÎ N

y

{S ( f , P )} n

nÎ N

son convergentes hacia I ( f ) y I ( f ), respectiva-

mente. Si la función f es integrable, la sucesión de intervalos encajados

[ S ( f , P ), S ( f , P )] É[ S ( f , P ), S ( f , P )] É...É[ S ( f , P ), S ( f , P )] É... 1

1

2

2

n

n

define un número real único A, ya que las diferencias S ( f , Pn ) – S ( f , Pn ) se hacen cada vez menores. TEMARIO DE MATEMÁTICAS. PRUEBA A

103


104

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA n 2 2 2 ö2 æ i – 2 1 ÷ 1 = 1 + 3 +...+3( 2n – 1) S ( f , Pn ) = åç è 2n ø n 4n i=1

Y además la integrabilidad de f asegura que I ( f ) = I ( f ) = I ( f ) . Por tanto, la regla del “sandwich” para límites de sucesiones nos lleva a que aquel número real único que responde a la definición de integral definida es: suma de Riemann correspondiente será:

m

A = I ( f ) = lím S ( f , Pn ) = lím å f ( t ni )Dxi = òa f ( x )dx b

2i – 1 , entonces la 2n

Si elegimos los t i los puntos medios de los subintervalos de la partición serán t i = 1

n ®¥

DPn ®0

Entonces lím

n ®¥

( n – 1)( 2n – 1) ( n + 1)( 2n + 1) 1 = lím = . n ®¥ 6n 3 6n 3 3

1 1 1 La diferencia S ( f , Pn ) – S ( f , Pn ) = 3 å[i 2 – ( i – 1)2] = 3 n 2 = puede hacerse menor que cualn i=1 n n quier e arbitrariamente pequeño, por lo que la función f ( x )= x 2 es integrable en [ 0,1] . A

n

i=1

æ i ö 1 12 + 22+...+n 2 n ( n + 1)( 2n + 1) ( n + 1)( 2n + 1) = S ( f , Pn ) = åç ÷ = = ènø n n3 6n 3 6n 2 n

Figura 21.

2

El límite anterior no depende ni de la sucesión de particiones tomada ni de la elección de los t ni . Así pues, si P1, P2 ,..., Pn ,... y P '1 , P '2 ,..., P 'n ,... son dos sistemas de particiones tales que DPn ® 0 y DP 'n ® 0, entonces el sistema P1, P '1 , P2 , P '2 , P3 , P '3 ,..., Pn , P 'n ,... tiene la misma propiedad, y los límites de las sumas de Riemann correspondientes a las dos primeras sucesiones de particiones son iguales al que se obtiene con esta última y, por tanto, iguales entre sí. Veamos un ejemplo. i=1

n æ i – 1ö2 1 12 + 22+...+( n – 1)2 ( n – 1)n ( 2n – 1) ( n – 1)( 2n – 1) ÷ = = S ( f , Pn ) = åç = è n øn n3 6n 3 6n 2

Tendremos:

Si tratamos de calcular el área encerrada bajo el arco de parábola y = x2 en el intervalo [ 0,1] podemos ì ü 1 2 – 1 n 1 tomar Pn = í0, , ,..., ,1ý, siendo DPn = (figura 22). î n n n þ n Figura 22. Figura 22.

Si tratamos de calcular el área encerrada bajo el arco de parábola y = x2 en el intervalo [ 0,1] podemos ì 1 2 n–1 ü 1 tomar Pn = í0, , ,..., ,1ý, siendo DPn = (figura 22). î n n n þ n

El límite anterior no depende ni de la sucesión de particiones tomada ni de la elección de los t ni . Así pues, si P1, P2 ,..., Pn ,... y P '1 , P '2 ,..., P 'n ,... son dos sistemas de particiones tales que DPn ® 0 y DP 'n ® 0, entonces el sistema P1, P '1 , P2 , P '2 , P3 , P '3 ,..., Pn , P 'n ,... tiene la misma propiedad, y los límites de las sumas de Riemann correspondientes a las dos primeras sucesiones de particiones son iguales al que se obtiene con esta última y, por tanto, iguales entre sí. Veamos un ejemplo. Tendremos:

n æ i – 1ö2 1 12 + 22+...+( n – 1)2 ( n – 1)n ( 2n – 1) ( n – 1)( 2n – 1) ÷ = = S ( f , Pn ) = åç = è n øn n3 6n 3 6n 2 i=1 n æ i ö2 1 12 + 22+...+n 2 n ( n + 1)( 2n + 1) ( n + 1)( 2n + 1) = S ( f , Pn ) = åç ÷ = = è øn n3 6n 3 6n 2 i=1 n

Figura 21.

n

1 1 1 å[i2 – ( i – 1)2] = n 3 n 2 = n puede hacerse menor que cualn 3 i=1 quier e arbitrariamente pequeño, por lo que la función f ( x )= x 2 es integrable en [ 0,1] . La diferencia S ( f , Pn ) – S ( f , Pn ) = A

Entonces lím n ®¥

( n – 1)( 2n – 1) ( n + 1)( 2n + 1) 1 = lím = . n ®¥ 6n 3 6n 3 3 1

Si elegimos los t i los puntos medios de los subintervalos de la partición serán t i = n ®¥

DPn ®0

A = I ( f ) = lím S ( f , Pn ) = lím å f ( t ni )Dxi = òa f ( x )dx m

b

suma de Riemann correspondiente será:

2i – 1 , entonces la 2n

Y además la integrabilidad de f asegura que I ( f ) = I ( f ) = I ( f ) . Por tanto, la regla del “sandwich” para límites de sucesiones nos lleva a que aquel número real único que responde a la definición de integral definida es: n æ 2i – 1ö2 1 12 + 32+...+( 2n – 1)2 ÷ = S ( f , Pn ) = åç è 2n ø n 4n3 i=1



104

El problema del cálculo del área El límite se calcula mediante la regla de Stolz: 12 + 32+...+( 2n – 1)2 ( 2n – 1)2 4 n 2 – 4 n +1 1 = lím 3 = 3 = lím 2 3 n ®¥ n ®¥ n ®¥ 4n 4 n – 4 ( n – 1) 4 ( 3n – 3n + 1) 3

lím

1 1 Concluimos, pues, que ò0x2dx = . 3

6.2. Acerca del símbolo de integración 2

x

De esta manera la integración se concibe como un proceso de “sumación de elementos infinitamente pequeños”. Así en la integral ò0x2dx imaginamos que el recinto se divide en infinidad 1

dx

2

de rectángulos de altura x y base infinitesimal dx (figura 23). El símbolo ò, introducido por Leibniz, tuvo gran aceptación entre los matemáticos de la época, porque resume el proceso anterior. De igual manera que se explica el empleo de dx procedente de Dxi .

Discreto Continuo

D xi

dx

f(ti)

f(x)

S

ò

Figura 23. El signo “integral” o signo de integración vendría a ser como una deformación del signo å (sumatorio), o quizás una estilización de la letra S (inicial de suma).

S

ò

S

ò

Aunque no es muy rigurosa desde un punto de vista matemático, pues no atribuye un significado preciso a los términos “infinitamente pequeños” y “suma infinita”, esta forma de entender la integración como “agregación” de “elementos infinitesimales” tiene un enorme alcance desde el punto de vista de sus aplicaciones prácticas (Cálculo geométrico, Física, Técnica, etc). Así pues, supone una potente herramienta que supera ampliamente el objetivo para el cual se introduce.

7. RELACIÓN ENTRE INTEGRACIÓN Y DERIVACIÓN 7.1. El primer teorema de la media Sean f y g dos funciones continuas en [ a , b ], siendo g ( x )³ 0 para cualquier x Î [ a , b ] . Entonces existe al menos un x Î [ a , b ] tal que:

ò

b

a

f ( x )g ( x )dx = f ( x )òa g ( x )dx b

[3]

Demostración: Según el teorema de Weierstrass de existencia de extremos para una función continua en [ a , b ], existen m = mín{ f ( x ) / x Î [ a , b ]}

M = máx{ f ( x ) / x Î [ a , b ]} TEMARIO DE MATEMÁTICAS. PRUEBA A

105


106


Para cualquier x Î [ a , b ] se tiene mg ( x ) £ f ( x )g ( x ) £ Mg ( x ) por ser g no negativa en todo el intervalo. Entonces Figura 25.

siendo 0 £ q £ 1.

mòa g ( x )dx £ òa f ( x )g ( x )dx £ M òa g ( x )dx b

ò

a

b

Como a £ x £ b, tenemos 0£ x – a £ b – a, y de aquí x–a x–a y h = b – a, la fórmula [4] 0£ £ 1 . Llamando q = b– a b– a puede ponerse en la forma: a

f ( x )g ( x )dx

ò g ( x )dx b

verifica m £ l £ M .

a

b)

f ( x )dx = h f ( a + qh )

b

ò

b

Si fuese òa g ( x )dx ¹ 0, el número l = b

b

a

b

El teorema de Darboux de valores intermedios asegura que la función continua f toma en [ a , b ] cualquier valor comprendido entre su mínimo m y su máximo M . Por tanto, existe algún x Î [ a , b ] tal que f ( x ) = l, resultando de aquí lo que queremos probar. cuyo límite cuando n ® ¥ es el promedio integral.

y + y2+...+ yn b– a 1 1 ~ Yn = 1 f ( x = = å å f ( xi )Dxi i) n b – a i=1 n b – a i=1

Si fuese òa g ( x )dx = 0, entonces será g(x) = 0 para cualquier x Î [ a , b ] (en efecto, si fuese g ( x0 ) > 0 g ( x0 ) en algún x0 Î [ a , b ] , en virtud de la continuidad de g, tomando e = > 0, existe un entorno de x0 2 g ( x0 ) g ( x0 ) en que g ( x0 ) – ; es decir, puede encontrarse un intervalo [a , b] que < g ( x ) < g ( x0 )+ 2 2 g ( x0 ) contenga x0 en el cual g ( x ) > , de donde 2 b b a b b g (x ) òa g ( x )dx = òa g ( x )dx+òa g ( x )dx+òb f ( x )dx ³ òa g ( x )dx > 2 0 ( b – a ) > 0 y llegaríamos a una contradicción). En este caso la igualdad [3] es trivial. b

n

n

Gráficamente la interpretación de [4] es sencilla: Existe al menos un punto x Î [ a , b ] tal que el área m( A) del trapecio mixtilíneo A coincide con el área del rectángulo de base en intervalo dado y de altura la ordenada media f ( x ) (figura 24). a b x b 1 Dicha ordenada media coincide con el valor ò f ( x )dx, el cual reb– a a Figura 24. cibe el nombre de promedio integral de f ( x ) en [ a , b ] . Veamos la justificación de tal denominación. Si tomamos las ordenadas de la curva en n puntos equidistantes del intervalo (figura 25), su media aritmética será: a b

f ( x )dx = f ( x )( b – a )

En particular si g es la función constante g ( x )= 1en [ a , b ], entonces la fórmula de la media queda:

En particular si g es la función constante g ( x )= 1en [ a , b ], entonces la fórmula de la media queda: b

a

f ( x )dx = f ( x )( b – a )

Observaciones:

ò

a)

[4]

a)

ò

Observaciones:

[4]

Si fuese òa g ( x )dx = 0, entonces será g(x) = 0 para cualquier x Î [ a , b ] (en efecto, si fuese g ( x0 ) > 0 g ( x0 ) en algún x0 Î [ a , b ] , en virtud de la continuidad de g, tomando e = > 0, existe un entorno de x0 2 g (x ) g ( x0 ) 0 en que g ( x0 ) – ; es decir, puede encontrarse un intervalo [a , b] que < g ( x ) < g ( x0 )+ 2 2 g ( x0 ) contenga x0 en el cual g ( x ) > , de donde 2 b b a b b g (x ) òa g ( x )dx = òa g ( x )dx+òa g ( x )dx+òb f ( x )dx ³ òa g ( x )dx > 2 0 ( b – a ) > 0 y llegaríamos a una contradicción). En este caso la igualdad [3] es trivial.

Gráficamente la interpretación de [4] es sencilla: Existe al menos un punto x Î [ a , b ] tal que el área m( A) del trapecio mixtilíneo A coincide con el área del rectángulo de base en intervalo dado y de altura la ordenada media f ( x ) (figura 24). a b x b 1 Dicha ordenada media coincide con el valor òa f ( x )dx, el cual re– b a Figura 24. cibe el nombre de promedio integral de f ( x ) en [ a , b ] . Veamos la justificación de tal denominación. Si tomamos las ordenadas de la curva en n puntos equidistantes del intervalo (figura 25), su media aritmética será: y + y2+...+ yn b– a 1 1 ~ Yn = 1 f ( xi ) = = å å f ( xi )Dxi n b – a i=1 n b – a i=1 n

n

b

El teorema de Darboux de valores intermedios asegura que la función continua f toma en [ a , b ] cualquier valor comprendido entre su mínimo m y su máximo M . Por tanto, existe algún x Î [ a , b ] tal que f ( x ) = l, resultando de aquí lo que queremos probar. cuyo límite cuando n ® ¥ es el promedio integral.

Como a £ x £ b, tenemos 0£ x – a £ b – a, y de aquí x–a x–a y h = b – a, la fórmula [4] 0£ £ 1 . Llamando q = b– a b– a puede ponerse en la forma: a

b

a

b

f ( x )g ( x )dx

verifica m £ l £ M .

f ( x )dx = h f ( a + qh )

mò g ( x )dx £ òa f ( x )g ( x )dx £ M òa g ( x )dx a

b

siendo 0 £ q £ 1.

b

a

b

Figura 25.

ò

b

b

ò

Si fuese ò g ( x )dx ¹ 0, el número l =

b

a

a

ò g ( x )dx

b)

Para cualquier x Î [ a , b ] se tiene mg ( x ) £ f ( x )g ( x ) £ Mg ( x ) por ser g no negativa en todo el intervalo. Entonces CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


106

El problema del cálculo del área c)

Si f y g no son continuas no podemos asegurar que la función producto f × g sea integrable, aunque lo sean f y g. Puede probarse que si f es integrable y g es de signo constante en [ a , b ] , entonces f × g es integrable (nos basamos en que si f y g son no negativas entonces sup f ( x )× g ( x ) £ sup( f ( x )×sup g ( x )).

d)

El teorema de la media puede extenderse a dos funciones f y g regladas en [ a , b ] , siendo g no b b negativa. Se tiene también òa f ( x )g ( x )dx = lòa g ( x )dx, con m < l < M , pero no se puede afir-

mar que l sea un valor de f en [ a , b ] .

7.2. El teorema fundamental del Cálculo Si f es una función integrable-Riemann en [ a , b ], lo es en cualquier subintervalo de [ a , b ] . En particular, f será integrable en [ a , x] para cualquier x Î [ a , b ], lo cual permite definir una función A:[ a , b ] ® R dada por: A ( x ) = òa f ( t )dt x

f

A(x)

Figura 26.

a

x

b

Si f es no negativa en [ a , b ], la función anterior se denomina a veces función área o función integral. Teorema: La función A ( x ) es continua en [ a , b ]. Si además f es continua en [ a , b ] , entonces A ( x ) es derivable en ( a , b ), siendo A '( x ) = f ( x ) para todo x Î [ a , b ]. Demostración: Para cualesquiera x, y Î [ a , b ], se tiene A ( y ) – A ( x ) = òa f ( t )dt – òa f ( t )dt = òx f ( t )dt . Como pary

x

y

timos de que f está acotada, existen m = inf{ f ( x ) / x Î [ a , b ]}y M = sup{ f ( x ) / x Î [ a , b ]}, teniendo m £ f ( x ) £ M ( "x Î [ a , b ] ), por lo que m( y – x ) £ òx f ( x )dx £ M ( y – x ) y

[5]

Si tomamos k = máx{ m , M }, de [5] se sigue que: A ( y ) – A (x ) £ k y – x es decir, que A ( x )es lipschitziana de razón k en [ a , b ], lo cual implica que es uniformemente continua, y e por tanto continua (para cualquier e > 0, existe d = tal que si y – x < d, entonces A ( y ) – A ( x ) < e). k Si fuese f :[ a , b ] ® R continua, la prueba de que lo es también A ( x ) es más simple que la anterior. Bastaría poner para cualquier punto x Î [ a , b ] : A ( x+ h ) = òa

x+ h

f ( t )dt = òa f ( t )dt + òx x

x+ h

f ( t )dt

Aplicando el teorema de la media en el intervalo [ x, x+ h ], lo anterior puede expresarse: [6] A ( x+ h ) = A ( x )+ f ( x+ qh )× h ( 0 £ q £ 1) Entonces, por ser f continua se tiene lím f ( x+ qh ) = f ( x ), y de h ®0 [6] resulta lím A ( x+ h ) = A ( x )+ lím f ( x + qh )× h = A ( x ), lo que h ®0 h ®0 prueba la continuidad de A ( x ).


a

x

x+h

b

x+ h

DA (x) = òx f (t )dt = f (x + qh)

Figura 27.

107


108


Además, de [6] también se obtiene fácilmente la derivabilidad en cualquier x Î ( a , b), siendo: A ( x+ h ) – A ( x ) f ( x+ qh )h DA ( x ) = lím = lím = lím f ( x+ qh ) = f ( x ) h ®0 h ®0 h ®0 h Dx h A '( x ) = lím

Dx ®0

Observaciones: 1.

El teorema anterior establece la relación entre la integral definida y la integral indefinida. Esto es, si f x es continua en [ a , b ] posee al menos una primitiva en ( a , b), a saber, la función integral òa f ( t )dx.

= F ( b ) – F ( a ) que se conoce como regla de Barrow. También suele hacerse referencia a la citada igualdad denominándola fórmula de Newton-Leibniz. Pero tal denominación es convencional, ya que ni uno ni otro dieron exactamente dicha fórmula. Lo importante es que ellos establecieron por primera vez la relación entre la integración y la derivación, lo que permitió enunciar una regla de cálculo de las integrales definidas. Aunque un proceso similar al del cálculo de la integral definida como límite de una suma integral fue conocido incluso en la antigüedad (Arquímedes), las aplicaciones de este método eran muy limitadas. La fórmula de Newton-Leibniz amplió considerablemente el campo de aplicación de la integral definida, puesto que los matemáticos obtuvieron un método general que permite solucionar múltiples problemas particulares en diferentes ámbitos (técnica, mecánica, astronomía, etc.). 2.

3.

d x La fórmula òa f ( t )dt = f ( x ) es el nexo entre el cálculo diferencial y el cálculo integral. De ahí que dx el teorema precedente se conozca como teorema fundamental del Cálculo. El teorema de la media no es más que el teorema de los incrementos finitos de Lagrange particularizado a la función A ( x ), pues la fórmula [4] puede fácilmente ponerse como A ( b ) – A ( a ) = A '( x )( b – a ).

La igualdad anterior (donde la letra t es “muda”), suele expresarse de la forma òa f ( x )dx = [F ( x )]a =

7.3. Cálculo de una integral mediante una primitiva: la fórmula de Newton-Leibniz b

b

Una consecuencia importante del teorema fundamental es la que permite calcular el valor de una integral definida, a partir de una primitiva cualquiera del integrando. A ( b ) = òa f ( t )dt = F ( b ) – F ( a ) b

En efecto, si F '( x ) = f ( x ) para cualquier x Î ( a , b), entonces A y F , por ser primitivas de una misma función f , diferirán en una constante, es decir A ( x ) – F ( x )= cte en [ a , b ], por lo cual A ( b ) – F ( b )= a = A ( a ) – F ( a ). Pero A ( a ) = òa f ( t )dt = 0, luego Corolario:

Si f es continua en [ a , b ] y F es una primitiva cualquiera de f en ( a , b), entonces b f ( x )dx = F ( b ) – F ( a ).

ò

a

ò

Si f es continua en [ a , b ] y F es una primitiva cualquiera de f en ( a , b), entonces b f ( x )dx = F ( b ) – F ( a ). a

En efecto, si F '( x ) = f ( x ) para cualquier x Î ( a , b), entonces A y F, por ser primitivas de una misma función f , diferirán en una constante, es decir A ( x ) – F ( x )= cte en [ a , b ], por lo cual A ( b ) – F ( b )= a = A ( a ) – F ( a ). Pero A ( a ) = ò f ( t )dt = 0, luego Corolario:

a

A ( b ) = òa f ( t )dt = F ( b ) – F ( a )

Una consecuencia importante del teorema fundamental es la que permite calcular el valor de una integral definida, a partir de una primitiva cualquiera del integrando. b

7.3. Cálculo de una integral mediante una primitiva: la fórmula de Newton-Leibniz

La igualdad anterior (donde la letra t es “muda”), suele expresarse de la forma òa f ( x )dx = [F ( x )]a = b

b

= F ( b ) – F ( a ) que se conoce como regla de Barrow. También suele hacerse referencia a la citada igualdad denominándola fórmula de Newton-Leibniz. Pero tal denominación es convencional, ya que ni uno ni otro dieron exactamente dicha fórmula. Lo importante es que ellos establecieron por primera vez la relación entre la integración y la derivación, lo que permitió enunciar una regla de cálculo de las integrales definidas. Aunque un proceso similar al del cálculo de la integral definida como límite de una suma integral fue conocido incluso en la antigüedad (Arquímedes), las aplicaciones de este método eran muy limitadas. La fórmula de Newton-Leibniz amplió considerablemente el campo de aplicación de la integral definida, puesto que los matemáticos obtuvieron un método general que permite solucionar múltiples problemas particulares en diferentes ámbitos (técnica, mecánica, astronomía, etc.). 3.

2.

1.

El teorema de la media no es más que el teorema de los incrementos finitos de Lagrange particularizado a la función A ( x ), pues la fórmula [4] puede fácilmente ponerse como A ( b ) – A ( a ) = A '( x )( b – a ). d x ò f ( t )dt = f ( x ) es el nexo entre el cálculo diferencial y el cálculo integral. De ahí que dx a el teorema precedente se conozca como teorema fundamental del Cálculo. La fórmula

El teorema anterior establece la relación entre la integral definida y la integral indefinida. Esto es, si f x es continua en [ a , b ] posee al menos una primitiva en ( a , b), a saber, la función integral òa f ( t )dx. Observaciones: Además, de [6] también se obtiene fácilmente la derivabilidad en cualquier x Î ( a , b), siendo: A ( x+ h ) – A ( x ) f ( x+ qh )h DA ( x ) A '( x ) = lím = lím = lím = lím f ( x+ qh ) = f ( x ) Dx ®0 h ® 0 h ® 0 h ®0 h Dx h 108




APÉNDICES I. Cambio de variable en una integral definida Sea f :[ a , b ] ® R continua y g una función continua que transforma el intervalo [a , b] en el intervalo

[a, b]

g

[a, b]

f

[a,b]

t

R f(x) = f [g(t)]

x = g(t) f°g

La función f o g es continua en [a , b], por ser compuesta de dos funciones continuas. Supongamos que g tiene derivada primera g 'continua en [a , b]; entonces la función f [g ( t )]× g '( t ) es continua en [a , b], ya que es el producto de funciones continuas. Podemos definir f( t ) = òa f [g ( u )]g '( u )du, que es continua f

en [a , b] y derivable en ( a , b), siendo f'( t ) = f [g ( t )]× g '( t ). Si llamamos F ( x ) = òa f ( t )dt , la función F [g ( t )] = òa x

g( t )

f ( u )du es continua, al ser compuesta de F

y g, ambas continuas. Además, según la regla de derivación de funciones compuestas: d d dg ( t ) F [g ( t )] = F ( x )× = f ( x )g '( t ) = f [g ( t )]× g '( t ) dt dx dt Resulta, pues, que las funciones f( t ) y F [g ( t )] tienen la misma derivada en [a , b], por lo que deben diferir en una constante k f( t ) – F [g ( t )] = k es decir:

ò f [g ( u )]g '( u )du = ò t

g( t )

a

a

Dando a t el valor a, resulta k = – òa

g( a )

ò f [g ( u )]g '( u )du = ò t

g( t )

a

a

f ( u )du + k

f ( u )du. Se tiene:

f ( u )du + k = òa

g( t )

f ( u )du – òa

g( a )

f ( u )du = òg( a ) f ( u )du g( t )

donde a £ t £ b. En resumen, podemos enunciar la siguiente Proposición: Sea g continua en [a , b] y derivable con derivada continua en ( a , b), y sea f continua en [ a , b ]. Supongamos además que a £ g ( t ) £ b para cualquier t Î [a , b] . Entonces se verifica:

ò f ( g ( u )) g '( u )du = ò t

g( t )

a

g( a )

f ( u )du

Observaciones: 1.

Si además de las hipótesis anteriores se cumple g ( a ) = a y g ( b ) = b, entonces obtenemos b b f ( x )dx, que es la fórmula de cambio de variable de integración en a a

ò f ( g ( u )) g '( u )du = ò la integral definida.


109


110

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA t ®+¥

ò

f ( x )dx = lim òa f ( x )dx

a

Podríamos haber llegado a la fórmula anterior teniendo en cuenta que si F ( x ) es una primitiva de f ( x ) entonces ( F o g )( t ) = F [g ( t )] es una primitiva de ( f o g )( t )× g '( t ) = f [g ( t )]g '( f ). Por la regla de Barrow se tiene: +¥

2.

t

[7]

y le atribuiremos como valor dicho límite

Las integrales impropias se introducen como generalizaciones del concepto de integral definida: Integrales en intervalos no acotados Sea f definida en [ a,+¥), siendo continua en cualquier sección [ a , t ] ( t > a ) (figura 28a). Si la intet +¥ gral òa f ( x )dx tiene límite finito cuando t ® +¥, diremos que la integral òa f ( x )dx es convergente b

b

a

a

= ( F o g )( b ) – ( F o g )( a ) =

= F [g ( b )] – F [g ( a )] = F ( b ) – F ( a ) = òa f ( x )dx b

a)

ò f ( g ( t )) g '( t )dt = [( F o g )( t )]

IV. Integrales impropias II. Integración por partes Si u ( x ) y v( x ) son dos funciones derivables sabemos que la función u '( x )× v( x )+ u ( x )× v'( x ) tiene como primitiva a u ( x )× v ( x ). Por tanto: ríamos probar.

Darboux de valores intermedios, existe un c Î [ a , b ] donde F ( c ) = òa f ( x )g ( x ) dx, que es lo que que-

ò [u '( x )v( x )+ u ( x )v'( x )] dx = [u ( x )v( x )] b

b

b

es decir F ( b ) £ òa f ( x )g ( x )dx £ F ( a ). Como F ( x ) es continua en [ a , b ], en virtud del teorema de a

a

b

de donde por la linealidad de la integral resulta

g ( a )òa f ( x )dx £ òa f ( x )g ( x )dx £ g ( b )òa f ( x )dx

ò u ( x )v'( x ) dx = [u ( x )v( x )] – ò v( x )u '( x )dx b

b

a

a

b

b

b

b

cualquier x Î [ a , b ], y por tanto g ( a ) f ( x ) £ f ( x )g ( x ) £ g ( b ) f ( x ), luego: a

o, lo que es lo mismo:

+g ( b )òx f ( t )dt , que es continua en [ a , b ]. Si g es no decreciente, entonces g ( a ) £ g ( x ) £ g ( b ) para

ò udv = [uv] – ò vdu b

b

a

a

b

b

Supongamos que f es no negativa en [ a , b ]. Consideremos la función F ( x ) = g ( a )òa f ( t )dt + a

x

que es la llamada fórmula de integración por partes.

Demostración: a b

f ( x )g ( x )dx = g ( a )òa f ( x )dx+ g ( b )òc f ( x )dx c

b

Teorema:

ò

III. El segundo teorema de la media

Sea f continua y g monótona, ambas definidas en [ a , b ]. Entonces existe al menos un c Î [ a , b ] tal que:

Sea f continua y g monótona, ambas definidas en [ a , b ]. Entonces existe al menos un c Î [ a , b ] tal que: f ( x )g ( x )dx = g ( a )òa f ( x )dx+ g ( b )òc f ( x )dx c

b

III. El segundo teorema de la media

b

a

Teorema:

ò Demostración:

que es la llamada fórmula de integración por partes.

Supongamos que f es no negativa en [ a , b ]. Consideremos la función F ( x ) = g ( a )òa f ( t )dt + x

ò udv = [uv] – ò vdu a

a

a

+g ( b )òx f ( t )dt , que es continua en [ a , b ]. Si g es no decreciente, entonces g ( a ) £ g ( x ) £ g ( b ) para b

b

b

cualquier x Î [ a , b ], y por tanto g ( a ) f ( x ) £ f ( x )g ( x ) £ g ( b ) f ( x ), luego:

o, lo que es lo mismo:

b

ò u ( x )v'( x ) dx = [u ( x )v( x )] – ò v( x )u '( x )dx a

a

a

g ( a )òa f ( x )dx £ òa f ( x )g ( x )dx £ g ( b )òa f ( x )dx b

b

b

b

b

b

de donde por la linealidad de la integral resulta

es decir F ( b ) £ òa f ( x )g ( x )dx £ F ( a ). Como F ( x ) es continua en [ a , b ], en virtud del teorema de b

ò [u '( x )v( x )+ u ( x )v'( x )] dx = [u ( x )v( x )] a

a

Darboux de valores intermedios, existe un c Î [ a , b ] donde F ( c ) = òa f ( x )g ( x ) dx, que es lo que queb

b

b

Si u ( x ) y v( x ) son dos funciones derivables sabemos que la función u '( x )× v( x )+ u ( x )× v'( x ) tiene como primitiva a u ( x )× v ( x ). Por tanto: ríamos probar.

II. Integración por partes IV. Integrales impropias = F [g ( b )] – F [g ( a )] = F ( b ) – F ( a ) = òa f ( x )dx b

a

ò f ( g ( t )) g '( t )dt = [( F o g )( t )]

a

b

b

a)

Las integrales impropias se introducen como generalizaciones del concepto de integral definida: Integrales en intervalos no acotados Sea f definida en [ a,+¥), siendo continua en cualquier sección [ a , t ] ( t > a ) (figura 28a). Si la intet +¥ gral òa f ( x )dx tiene límite finito cuando t ® +¥, diremos que la integral òa f ( x )dx es convergente = ( F o g )( b ) – ( F o g )( a ) =

Podríamos haber llegado a la fórmula anterior teniendo en cuenta que si F ( x ) es una primitiva de f ( x ) entonces ( F o g )( t ) = F [g ( t )] es una primitiva de ( f o g )( t )× g '( t ) = f [g ( t )]g '( f ). Por la regla de Barrow se tiene: y le atribuiremos como valor dicho límite

110

f ( x )dx = lim òa f ( x )dx t

t ®+¥

[7]



+¥

a

2.

ò


(a)

(b)

+¥

a

(c)

-¥

-¥

a

+¥

Figura 28. En caso de que dicho límite sea ¥,+¥ó –¥, la integral se dice divergente. Si el límite no existe (ni finito ni infinito) la función f carece de integral en [ a,+¥). Análogamente, si f es continua en [ t , a ] para cualquier t > a (figura 28b), se define

ò

a

–¥

f ( x )dx = lím òt f ( x )dx a

[8]

t ®– ¥

Si son convergentes ambas integrales [7] y [8], por definición es:

ò

+¥

–¥

b)

f ( x )dx = ò–¥ f ( x )dx + òa

+¥

a

f ( x )dx

Integrales de funciones no acotadas Sea f acotada en ( a , b ], pero no en [ a , b ]. Si suponemos además que es continua en ( a , b ], entonces lo que ocurrirá es que f presentará una discontinuidad en x = a, siendo lím+ f ( x ) = ±¥ (figura 29a). Si b b x ®a existe límite de la integral òt f ( x )dx cuando t ® a+ decimos que la integral òa f ( x )dx es convergente y le asignamos como valor dicho límite. Es decir:

ò

b

a

f ( x )dx = lím+ òt f ( x )dx = límòa+ e f ( x )dx b

b

e ®0 e>0

t ®a

(a)

(b)

(c)

c

a

a

b

a

b

b

Figura 29.

De modo análogo, si f está acotada en [ a , b), pero no en [ a , b ] (figura 29b), se define:

ò

b

a

f ( x )dx = lím– òa f ( x )dx = límòa

b– e

b

e ®0 e>0

t ®b

f ( x )dx

Si f está acotada en ( a , b) pero no en [ a , b ] (figura 29c), tomamos un punto c Î ( a , b) y definimos:

ò

b

a

f ( x )dx = límòa+ e f ( x )dx+ límòa

b– e

c

e ®0

e ®0

f ( x )dx ( e > 0 )

En cualquiera de los casos si los límites existen se dice que la integral es convergente. Puede ocurrir también que f no esté acotada en [ a , b ], al presentar intervalo una discontinuidad en un punto c Î ( a , b) donde alguno (o los dos) límites laterales es infinito (figura 30a). En este caso dire-


111


112


mos que la integral òa f ( x )dx es convergente cuando lo sean las integrales òa f ( x )dx y òc f ( x )dx, b

c

b

asignando a aquella como valor la suma de éstas. Si la integral òa f ( x )dx es convergente su valor coincide con el límite: b

lím e ®0

[ò

c– e

a

]

f ( x )dx+ òc+ e f ( x )dx b

[9]

pero puede ocurrir que este límite exista (finito) sin que la integral òa f ( x )dx sea convergente. b

En tal caso el límite [9] recibe el nombre de valor principal de la integral. La generalización a un número finito de discontinuidades c1, c2 ,..., cn en ( a , b) es inmediata (figura 30b).

(b) (a)

a c

b

b

Figura 30. a

a

c3

c2

c1

Figura 30.

b

c

a

c1

c2

b

c3

(a) (b)

En tal caso el límite [9] recibe el nombre de valor principal de la integral. La generalización a un número finito de discontinuidades c1, c2 ,..., cn en ( a , b) es inmediata (figura 30b). pero puede ocurrir que este límite exista (finito) sin que la integral òa f ( x )dx sea convergente. b

e ®0

lím

[ò

c+ e

a

b

c– e

f ( x )dx+ ò

]

f ( x )dx

[9]

Si la integral òa f ( x )dx es convergente su valor coincide con el límite: b

asignando a aquella como valor la suma de éstas. mos que la integral òa f ( x )dx es convergente cuando lo sean las integrales òa f ( x )dx y òc f ( x )dx, b



c

b

112

TEMA

30 Primitiva de una función. Cálculo de algunas primitivas. Aplicaciones de la integral al cálculo de magnitudes geométricas




114



INTRODUCCIÓN

2.

FUNCIÓN PRIMITIVA

3.

INTEGRAL INDEFINIDA 3.1. Propiedades de la integral indefinida 3.2. Integrales inmediatas

4.

MÉTODOS DE INTEGRACIÓN 4.1. Integración por descomposición 4.2. Integración por sustitución o cambio de variable 4.3. Integración por partes 4.4. Integración de funciones racionales 4.5. Método de Hermite 4.6. Integración de funciones irracionales 4.7. Integración de funciones trigonométricas

5.

APLICACIONES DE LA INTEGRAL AL CÁLCULO DE MAGNITUDES GEOMÉTRICAS 5.1. Cálculo de áreas planas 5.1.1. Área limitada por una función continua el eje OX, el eje y las rectas x = a y x=b 5.1.2. Área plana limitada por la gráfica de dos funciones continuas 5.1.3. Áreas de figuras planas en coordenadas polares 5.2. Longitud de un arco de curva 5.2.1. Longitud de un arco de curva en coordenadas cartesianas 5.2.2. Longitud de un arco de curva dada por sus ecuaciones paramétricas 5.2.3. Longitud de un arco de curva en coordenadas polares 5.3. Volumen de un cuerpo de revolución 5.4. Volumen de un cuerpo en función de secciones paralelas 5.5. Área de una superficie de revolución 5.3. 5.4. 5.5.

APLICACIONES DE LA INTEGRAL AL CÁLCULO DE MAGNITUDES GEOMÉTRICAS 5.1. Cálculo de áreas planas 5.1.1. Área limitada por una función continua el eje OX, el eje y las rectas x = a y x=b 5.1.2. Área plana limitada por la gráfica de dos funciones continuas 5.1.3. Áreas de figuras planas en coordenadas polares 5.2. Longitud de un arco de curva 5.2.1. Longitud de un arco de curva en coordenadas cartesianas 5.2.2. Longitud de un arco de curva dada por sus ecuaciones paramétricas 5.2.3. Longitud de un arco de curva en coordenadas polares Volumen de un cuerpo de revolución Volumen de un cuerpo en función de secciones paralelas Área de una superficie de revolución

5.

MÉTODOS DE INTEGRACIÓN 4.1. Integración por descomposición 4.2. Integración por sustitución o cambio de variable 4.3. Integración por partes 4.4. Integración de funciones racionales 4.5. Método de Hermite 4.6. Integración de funciones irracionales 4.7. Integración de funciones trigonométricas

4.

INTEGRAL INDEFINIDA 3.1. Propiedades de la integral indefinida 3.2. Integrales inmediatas

3.

FUNCIÓN PRIMITIVA

2.

INTRODUCCIÓN

1.



114

Primitiva de una función

1. INTRODUCCIÓN La noción de integral es mucho más vieja que la de derivada y sus orígenes pueden remontarse a los griegos en problemas de cálculo de áreas y volúmenes, tratados aisladamente. Antifonte, hacia el año 430 a.C. define el área del círculo mediante una sucesión de polígonos regulares inscritos y Eudoxo (409-356 a.C.) calcula los volúmenes del cono y de la pirámide, como nos ha transmitido Euclides en sus Elementos (libro 12 prop. 7 y 10). Se suele citar a Arquímedes como el primer antecesor del Cálculo integral. En su libro Sobre la cuadratura de la parábola, enuncia para áreas el llamado axioma de Arquímedes (aunque pudo ser de Eudoxo e incluso anterior): “nos hemos servido del lema siguiente: Si dos superficies son desiguales el exceso de la mayor sobre la menor, siendo agregado a sí mismo un cierto número de veces, puede llegar a sobrepasar una superficie propuesta y limitada”. Con este postulado, son eludidos los razonamientos dirigidos a infinitos o infinitésimos y reconducidos a un sistema de desigualdades, mediante demostraciones por absurdo, método llamado apagógico en el siglo XVII, que a pesar de ser irreprochable como método de demostración, no es constructivo, ya que al consistir en demostraciones por absurdo, se basa en el previo conocimiento del resultado a demostrar. Hasta el siglo XVII en el que Kepler (1571-1640) da un nuevo impulso al cálculo integral, no se encuentran grandes progresos en el mismo. Fue un problema práctico (con motivo de la gran cosecha de uva en Austria, donde Kepler se encontraba) el que le indujo a estudiar la cubicación de los toneles y en 1615 aparece su Steriometria doliorum, que contiene toda una teoría, muy imperfecta, de la cubicación de sólidos de revolución, resolviendo el problema para 92 tipos. Cavalieri (1598-1647) es otro gran precursor del cálculo integral y su Geometria indivisibilibus (1645) significa un progreso considerable en dirección distinta a la de Kepler ya que mientras que este persiste en la vía arquimediana de sumar los elementos infinitesimales en que se descompone cada figura, Cavalieri evita la sumación directa y se limita a comparar dos figuras para deducir la extensión de una mediante la otra. El resultado más relevante de su geometría es su famoso principio: “Dos figuras planas o espaciales que tienen equivalentes sus secciones paralelas, son equivalentes”. Con él logra cubicar conos, cuadrar la parábola, la elipse, la espiral de Arquímedes y perfecciona el método comparando figuras cuyas secciones son tales que la extensión de una es potencia de la otra llegando a resultados que equivalen con el tecnicismo actual a calcular integrales de las potencias de exponente natural. Nuevo impulso recibe el cálculo integral por medio de Wallis (1616-1703), que abandona el método geométrico, abordando la integración aritméticamente, que publicó en su obra Aritmetica infinitorum en 1655, llegando a integrar potencias de cualquier exponente y calculando la integral de 1- x2 , es decir, del área del círculo mediante producto de infinitos factores. Newton y Leibniz (Newton unos años antes) sientan las bases del análisis infinitesimal aunque por vías distintas, quedando fuera de toda sospecha que alguno se aprovechase de los hallazgos del otro. Aunque en los inicios se comunicaban los progresos que hacía cada uno, llegaron a surgir comentarios de matemáticos ajenos a todo ello que, en ocasiones, calificaban la obra de Newton como plagio de la de Leibniz, y en otras ocasiones era a la inversa, lo que provocó la enemistad de ambos. Todo esto hizo que Newton, poco antes de morir y habiendo fallecido Leibniz unos años antes, ordenara suprimir un comentario de su obra Principia en el que se citaba a su otrora amigo como autor de un procedimiento de cálculo similar al suyo. Leibniz es, además, el responsable de la actual simbología del cálculo infinitesimal, y no sólo eso; fue el primer matemático que utilizó el · para expresar una multiplicación y : para denotar un cociente, entre otras muchas más aportaciones.

2. FUNCIÓN PRIMITIVA Definición. Dada una función f :[ a , b ] ® Â, diremos que una función F es primitiva de f en [ a , b ], cuando esté definida y sea derivable en [ a , b ] y se cumpla en dicho intervalo que F '( x ) = f ( x ). Para denotar una primitiva cualquiera de f, adoptaremos la notación de Leibniz, quedando ò f ( x )dx. Proposición. Sea I un intervalo y F y G dos primitivas de f en I. Entonces la función F - G es constante en I. TEMARIO DE MATEMÁTICAS. PRUEBA A

115


116


En el desarrollo correspondiente al segundo miembro se ha utilizado el resultado de que la derivada de una constante por una función es igual a dicha constante por la derivada de la función. Las propiedades 2ª y 3ª, demuestran la linealidad de la integral indefinida. Demostración.

Hay que recordar que si una función f(x) definida en un intervalo cualquiera tiene derivada cero en todos los puntos, entonces la función f(x) es constante. Es decir, si f '( x )= 0, entonces f ( x )= C . Así, si F(x) es una primitiva de f(x), F '( x ) = f ( x ) y si G(x) es otra primitiva de f(x), G '( x ) = f ( x ). Si restamos ambas igualdades tendremos

[ò k × f ( x ) dx]' = k × f ( x ) [ k ×ò f ( x ) dx]' = k[ò f ( x ) dx]' = k × f ( x )

F '( x )- G '( x ) = ( F ( x )- G ( x )) '= f ( x )- f ( x ) = 0 Demostración. Derivando en los dos miembros, se tiene

de donde se deduce que

F ( x )- G ( x ) = C Así, si F es una primitiva de la función f en el intervalo I, cualquier otra primitiva de f en I, G será de la forma G = F + C , donde C es una constante real. 3.

ò k × f ( x ) dx = k ×ò f ( x ) dx, siendo k una constante.

[ò[ f ( x )+ g ( x )] dx]' = f ( x )+ g ( x ) [ò f ( x ) dx]' = f ( x ) [ò g ( x ) dx]' = g ( x )

3. INTEGRAL INDEFINIDA Definición.

Dada una función y = f ( x ), se llama integral indefinida de f ( x ) al conjunto de todas las primitivas de f ( x ), es decir a la familia de funciones de la forma F ( x )+ C , donde F ( x )es una primitiva y C una constante real, expresándola de la forma:

Demostración. Si derivamos en los dos miembros y utilizamos la primera propiedad, llegamos a lo propuesto, ya que

2.

ò f ( x ) dx = F ( x )+C

ò[ f ( x )+ g ( x )] dx = ò f ( x ) dx+ò g ( x ) dx

3.1. Propiedades de la integral indefinida

f (x )

f (x )

[ò f ( x ) dx]' =

[ò f ( x ) dx]' = [F ( x )+C]' = F '( x ) =

1.

Si ò f ( x ) dx = F ( x )+ C , al derivar en ambos miembros, tenemos

Demostración.

f (x )

Si ò f ( x ) dx = F ( x )+ C , al derivar en ambos miembros, tenemos

Demostración.

f (x )

[ò f ( x ) dx]' =

[ò f ( x ) dx]' = [F ( x )+C]' = F '( x ) =

1.

3.1. Propiedades de la integral indefinida

ò[ f ( x )+ g ( x )] dx = ò f ( x ) dx+ò g ( x ) dx

ò f ( x ) dx = F ( x )+C

2.

Demostración. Si derivamos en los dos miembros y utilizamos la primera propiedad, llegamos a lo propuesto, ya que

Dada una función y = f ( x ), se llama integral indefinida de f ( x ) al conjunto de todas las primitivas de f ( x ), es decir a la familia de funciones de la forma F ( x )+ C , donde F ( x )es una primitiva y C una constante real, expresándola de la forma: Definición.

[ò[ f ( x )+ g ( x )] dx]' = f ( x )+ g ( x ) [ò f ( x ) dx]' = f ( x ) [ò g ( x ) dx]' = g ( x )

3. INTEGRAL INDEFINIDA

ò k × f ( x ) dx = k ×ò f ( x ) dx, siendo k una constante.

de donde se deduce que F ( x )- G ( x ) = C Así, si F es una primitiva de la función f en el intervalo I, cualquier otra primitiva de f en I, G será de la forma G = F + C , donde C es una constante real. 3.

Demostración. Derivando en los dos miembros, se tiene

[ò k × f ( x ) dx]' = k × f ( x ) [ k ×ò f ( x ) dx]' = k[ò f ( x ) dx]' = k × f ( x )

F '( x )- G '( x ) = ( F ( x )- G ( x )) '= f ( x )- f ( x ) = 0 Hay que recordar que si una función f(x) definida en un intervalo cualquiera tiene derivada cero en todos los puntos, entonces la función f(x) es constante. Es decir, si f '( x )= 0, entonces f ( x )= C . Así, si F(x) es una primitiva de f(x), F '( x ) = f ( x ) y si G(x) es otra primitiva de f(x), G '( x ) = f ( x ). Si restamos ambas igualdades tendremos

En el desarrollo correspondiente al segundo miembro se ha utilizado el resultado de que la derivada de una constante por una función es igual a dicha constante por la derivada de la función. Las propiedades 2ª y 3ª, demuestran la linealidad de la integral indefinida. Demostración.



116


3.2. Integrales inmediatas Se llaman integrales inmediatas a aquellas que se calculan directamente a partir de las reglas de derivación y la regla de la cadena. Cada una de las fórmulas siguientes tiene validez en el intervalo en el que la función que se integra es continua: 1.

ò dx = x+C.

2.

ò x dx = n +1+C con n ¹ –1.

3.

ò xdx = ln x +C.

4.

ò e dx = e +C

5.

ò a dx = ln a +C

6. 7.

xn+1

n

1

x

x

ax

x

òsen x dx = -cos x+C òcos x dx = sen x+C dx

8.

ò cos

9.

ò sen

10.

ò

11.

ò 1+ x

12. 13. 14.

2

x

= ò (1+ tg 2 x ) dx = tg x+ C

x

= ò (1+ ctg 2 x ) dx = -ctg x+ C

dx 2

dx 1- x2 dx

2

= arcsen x+ C

= arctg x + C

òsh x dx = ch x+C òch x dx = sh x+C dx

ò 1- x

2

= arctg hx+ C

4. MÉTODOS DE INTEGRACIÓN Trataremos una serie de métodos de integración que permitan abordar el problema del cálculo de primitivas de una función. El objetivo final de dichos métodos es convertir la integral propuesta en alguno de los tipos expuestos en la tabla de inmediatas, con lo cual la resolución es directa.

4.1. Integración por descomposición Este método de integración se basa en las propiedades de linealidad de las integrales dadas anteriormente y consiste en realizar las distintas operaciones dentro del integrando para llegar a integrales inmediatas. Ejemplo:

ò ( x +1) dx = ò ( x + 2x +1) dx = ò x dx+ò 2x dx+ò dx = 2

2

4

2


4

2

x5 2x3 + + x+C 5 3 117


118


Este método permite la reducción de la integral ò u × dv a la ò v × du, y nos será útil cuando la segunda sea más sencilla que la primera. Normalmente suele utilizarse entre otros casos en el producto de dos funciones una de las cuales al derivarla se simplifica (por ejemplo una potencia de x) y la otra al integrarla no se complica (funciones seno, coseno o exponencial). Con este método se pueden obtener fórmulas recurrentes en algunas integrales, como ò xnemx dx o ò sen m x×cos n x dx.

El proceso seguido es desarrollar la potencia y aplicar después las propiedades de linealidad descomponiendo la integral de una suma en suma de integrales y la integral del producto de una constante por una función en el producto de la constante por la integral de la función.

4.2. Integración por sustitución o cambio de variable

Este método se utiliza para calcular la integral de una función reduciéndola a una integral inmediata o más fácil realizando un cambio de variable. En general, si tenemos que calcular la integral ò f ( x ) dx, el método consiste en realizar el cambio x = f( t ), siendo f( t ) una función derivable que admite función inversa uniforme, con lo que tendremos dx = f'( t ) dt y la integral nos quedará

ò u × dv = u × v- ò v× du

de donde se obtiene la fórmula de la integración por partes

u × v = ò u × dv+ ò v× du

ò f ( x ) dx = ò f [f( t )]f'( t ) dt = ò f ( t ) dt

(1)

1

con lo que

donde si el cambio ha sido bien hecho resulta que la integral de la función f1( t ) de la nueva variable es inmediata o más fácil de calcular que la inicial. Una vez integrada esta nueva función, en el resultado tendremos que deshacer el cambio sustituyendo t por su valor en función de x, es decir t = f-1( x )(de ahí la condición de que la función admita inversa uniforme). Para demostrar que los dos miembros de (1) son iguales, demostraremos que sus derivadas respecto a x lo son. Si calculamos la derivada del primer miembro, tendremos

ò d ( u × v ) = ò u × dv+ò v× du

Integrando ambos miembros, tendremos

d ( u × v ) = u × dv + v × du f (x )

que expresado simbólicamente queda

(ò f ( x ) dx)'=

d ( u × v ) = d [u ( x )× v ( x )] = u ( x )× d ( v( x )) + v( x )× d ( u ( x ))

y calculamos la derivada del segundo miembro, teniendo en cuenta que es una función compuesta, con lo que

Sean u = u ( x ) y v = v ( x ) dos funciones derivables en un intervalo abierto y con derivadas continuas en dicho intervalo. Consideremos la función producto u × v = u ( x )× v( x ). Diferenciando, tendremos dt 1 (ò f [f( t )]f'( t ) dt)' = (ò f [f( t )]f'( t ) )' dx = f [f( t )]f'( t ) = f [f( t )] = f'( t ) x

t

f (x )

4.3. Integración por partes

y por tanto las derivadas respecto a x de los dos miembros son iguales. y por tanto las derivadas respecto a x de los dos miembros son iguales.

4.3. Integración por partes

dt 1 (ò f [f( t )]f'( t ) dt)' = (ò f [f( t )]f'( t ) )' dx = f [f( t )]f'( t ) = f [f( t )] = f'( t ) x

t

f (x )

Sean u = u ( x ) y v = v ( x ) dos funciones derivables en un intervalo abierto y con derivadas continuas en dicho intervalo. Consideremos la función producto u × v = u ( x )× v( x ). Diferenciando, tendremos

y calculamos la derivada del segundo miembro, teniendo en cuenta que es una función compuesta, con lo que d ( u × v ) = d [u ( x )× v ( x )] = u ( x )× d ( v( x )) + v( x )× d ( u ( x ))

(ò f ( x ) dx)'=

f (x )

que expresado simbólicamente queda

donde si el cambio ha sido bien hecho resulta que la integral de la función f1( t ) de la nueva variable es inmediata o más fácil de calcular que la inicial. Una vez integrada esta nueva función, en el resultado tendremos que deshacer el cambio sustituyendo t por su valor en función de x, es decir t = f-1( x )(de ahí la condición de que la función admita inversa uniforme). Para demostrar que los dos miembros de (1) son iguales, demostraremos que sus derivadas respecto a x lo son. Si calculamos la derivada del primer miembro, tendremos d ( u × v ) = u × dv + v × du

Integrando ambos miembros, tendremos

ò d ( u × v ) = ò u × dv+ò v× du

ò f ( x ) dx = ò f [f( t )]f'( t ) dt = ò f ( t ) dt 1

con lo que

u × v = ò u × dv+ ò v× du

(1)

Este método se utiliza para calcular la integral de una función reduciéndola a una integral inmediata o más fácil realizando un cambio de variable. En general, si tenemos que calcular la integral ò f ( x ) dx, el método consiste en realizar el cambio x = f( t ), siendo f( t ) una función derivable que admite función inversa uniforme, con lo que tendremos dx = f'( t ) dt y la integral nos quedará de donde se obtiene la fórmula de la integración por partes

ò u × dv = u × v- ò v× du

4.2. Integración por sustitución o cambio de variable

Este método permite la reducción de la integral ò u × dv a la ò v × du, y nos será útil cuando la segunda sea más sencilla que la primera. Normalmente suele utilizarse entre otros casos en el producto de dos funciones una de las cuales al derivarla se simplifica (por ejemplo una potencia de x) y la otra al integrarla no se complica (funciones seno, coseno o exponencial). Con este método se pueden obtener fórmulas recurrentes en algunas integrales, como ò xnemx dx o ò sen m x×cos n x dx.

El proceso seguido es desarrollar la potencia y aplicar después las propiedades de linealidad descomponiendo la integral de una suma en suma de integrales y la integral del producto de una constante por una función en el producto de la constante por la integral de la función.



118


4.4. Integración de funciones racionales P (x ) dx, siendo P ( x ) y Q ( x ) polinomios con coeficientes reales y sin Q(x ) factores comunes. Distinguiremos dos casos en función del grado de los polinomios del numerador y denominador: Se trata de hallar la integral ò

a)

Grado P ( x )³ grado Q ( x ).

b)

Grado P ( x )< grado Q ( x ). En el caso a) se realiza la división entre los polinomios P ( x ) y Q ( x ), obteniéndose P (x ) R (x ) = C ( x )+ Q(x ) Q(x )

siendo C ( x ) el cociente de la división y R ( x ) el resto, por lo que su grado será menor que el de Q ( x ), quedando por tanto la integral como P (x )

R (x )

ò Q ( x ) dx = òC ( x ) dx+ò Q ( x ) dx donde la primera es la integral de un polinomio y es inmediata y la segunda es la integral de una función racional donde el grado del numerador es menor que el grado del denominador por lo que corresponde al caso b), por lo que de ahora en adelante nos ocuparemos de este caso. Este método se desglosa en función del tipo de raíces del denominador, al tener un tratamiento distinto, distinguiendo varios casos.

–

Primer caso: todas las raíces del denominador son reales y distintas. Supongamos que el denoP (x ) minador tiene n raíces reales distintas: x1, x2 ,..., xn, con lo que la fracción se puede descomQ(x ) poner en suma de fracciones simples de la forma P (x ) A1 A2 A = + +...+ n Q ( x ) x- x1 x- x2 x- xn donde A1, A2 ,..., An, son números reales únicos. Si realizamos la suma del segundo miembro e igualamos los numeradores, nos quedará P ( x ) = A1× ( x- x2 )×...×( x- xn )+ A2 × ( x- x1 )×...×( x- xn )+...+ An × ( x- x1 )×...×( x- xn-1 ) y para calcular los distintos Ai, tenemos dos posibilidades; la primera es desarrollar completo el polinomio del segundo término e igualar los coeficientes de los términos de igual grado del primer y segundo miembro llegando a un sistema de n ecuaciones con n incógnitas y el segundo, debido a que se trata de una identidad es dar a la variable x los distintos valores de las raíces, con lo que obtendremos los valores de los Ai de la forma A1 =

P ( x1 ) ( x1- x2 )×...× ( x1- xn )

A2 =

P ( x2 ) ( x2 - x1 )×...× ( x2 - xn ) K

An =


P ( xn ) ( xn - x1 )×...× ( xn - xn-1 ) 119


120


S (x ) P (x ) P (x ) A1 A2 An + = = + +...+ ( x- a ) R ( x ) Q ( x ) ( x- a )n × R ( x ) ( x- a )n ( x- a )n-1

con lo que la integral se nos transforma en P (x )

A

A

ò Q ( x ) dx = ò x- x dx+ò x- x 1

2

dx+...+ò

An dx x- xn

Tercer caso: hay raíces reales múltiples. Si el denominador tiene una raíz real múltiple de orden n, entonces aparece el factor ( x- a )n, que origina n fracciones simples, con lo que tendremos: 1

2

con lo que tendríamos una suma de integrales inmediatas quedándonos de la forma P (x )

n

A

n

n

ò Q ( x ) dx = åò x- x = å A × ln( x- x ) = åln( x- x )

Ai

i

i

i

Ma + N x- a Ma + N b × dt Ma + N arctg +K arctg t + K = ò 2 2 = b b 1+ t b b i

i=1

i=1

i

=

i=1

n

æ x- a ö ÷ 1+ç ç ÷ è b ø

= ln Õ ( x- xi )Ai

2

i=1

dx

–

–

Ma + N ò b2

Segundo caso: hay raíces imaginarias simples. Si una de las raíces es imaginaria z = a + bi, también lo será su conjugada z '= a - bi y los factores de la descomposición factorial del denominador que corresponden a esta raíz, son: con lo que la integral nos quedará

dx = b × dt

( x - z )× ( x- z ' ) = ( x- a - bi )× ( x+ a + bi ) = [( x- a )- bi]×[( x- a )+ bi] = ( x- a )2 + b 2 x- a =t b

y en la descomposición en fracciones simples sustituiremos las fracciones correspondientes por otra que tiene por denominador ( x- a )2 + b 2 y por numerador Mx + N , siendo M y N dos coeficientes que tendremos que determinar, quedándonos la fracción de la forma: y la segunda se reduce a un arco tangente, haciendo el cambio Mx+ N ( x- a )2 + b 2

M 2( x- a ) M dx = ln [( x- a )2 + b 2] ò 2 ( x- a )2 + b 2 2 De las dos integrales resultantes, la primera es inmediata ya que resulta que la derivada del denominador es el numerador, por lo que

cuya integral nos dará la descomposición general en dos, una de las cuales integrada será un logaritmo y la otra un arco tangente. Para integrarla, procederemos de la siguiente manera: 2

2

Ma + N Mx - Ma + Ma + N M ( x- a ) dx+ ò dx = dx = ò ( x- a )2 + b 2 ( x- a )2 + b 2 ( x- a )2 + b 2

dx = ò

æ x- a ö ÷ 1+ç ç ÷ è b ø

Mx+ N

2

ò ( x- a ) + b

2

Mx+ N

2

dx

M 2( x - a ) Ma + N dx dx + ò ò æ 2 2 ( x - a )2 + b 2 b2 ö ç x- a ÷ ÷ 1+ç è b ø

M 2( x - a ) Ma + N ò ò 2 2 dx + 2 ( x- a ) + b b2

ò ( x- a ) + b

Ma + N Mx - Ma + Ma + N M ( x- a ) dx+ ò dx = dx = ò ( x- a )2 + b 2 ( x- a )2 + b 2 ( x- a )2 + b 2

dx = ò

cuya integral nos dará la descomposición general en dos, una de las cuales integrada será un logaritmo y la otra un arco tangente. Para integrarla, procederemos de la siguiente manera:

De las dos integrales resultantes, la primera es inmediata ya que resulta que la derivada del denominador es el numerador, por lo que M 2( x- a ) M dx = ln [( x- a )2 + b 2] ò 2 ( x- a )2 + b 2 2 Mx+ N ( x- a )2 + b 2

y en la descomposición en fracciones simples sustituiremos las fracciones correspondientes por otra que tiene por denominador ( x- a )2 + b 2 y por numerador Mx + N , siendo M y N dos coeficientes que tendremos que determinar, quedándonos la fracción de la forma: y la segunda se reduce a un arco tangente, haciendo el cambio x- a =t b

( x - z )× ( x- z ' ) = ( x- a - bi )× ( x+ a + bi ) = [( x- a )- bi]×[( x- a )+ bi] = ( x- a )2 + b 2 dx = b × dt

Segundo caso: hay raíces imaginarias simples. Si una de las raíces es imaginaria z = a + bi, también lo será su conjugada z '= a - bi y los factores de la descomposición factorial del denominador que corresponden a esta raíz, son: con lo que la integral nos quedará

–

Ma + N x- a Ma + N dx Ma + N b × dt Ma + N ò ò 1+ t 2 = b arctg t + K = b arctg b + K 2 = b2 b2 æ x- a ö ÷ 1+ç ç ÷ è b ø i

i=1

i=1

i

P (x )

i

i

Ai

Ai

n

n

n

i=1

= ln Õ ( x- xi )Ai n

Tercer caso: hay raíces reales múltiples. Si el denominador tiene una raíz real múltiple de orden n, entonces aparece el factor ( x- a )n, que origina n fracciones simples, con lo que tendremos: 2

A1

P (x )

A2

dx+...+ò

An dx x- xn

–

i=1

ò Q ( x ) dx = åò x- x = å A × ln( x- x ) = åln( x- x )

con lo que tendríamos una suma de integrales inmediatas quedándonos de la forma 1

ò Q ( x ) dx = ò x- x dx+ò x- x

S (x ) P (x ) P (x ) A1 A2 An + = = + +...+ ( x- a ) R ( x ) Q ( x ) ( x- a )n × R ( x ) ( x- a )n ( x- a )n-1

con lo que la integral se nos transforma en

120




con lo que multiplicando todo por ( x- a )n y llamando f ( x ) =

P (x ) , tendremos R (x )

f ( x ) = A1+ A2 ( x- a )+...+ An ( x- a )n-1+ ( x- a )n ×

S (x ) R (x )

lo que nos dará los diferentes coeficientes: A1 = f ( a ) ;

A2 = f '( a ) ;

A3 =

f ''( a ) ... 2!

Este método pensamos es un más útil (en el caso de raíces reales múltiples) que el de los coeficientes indeterminados, para hallar los coeficientes de las fracciones simples.

–

Cuarto caso: el denominador tiene raíces imaginarias múltiples. Si el denominador tiene una n raíz imaginaria de orden n, aparecerá en el denominador el factor [( x- a )2 + b 2] , lo cual origina n fracciones simples. Así, quedaría: P (x ) P (x ) M 1x+ N 1 M 2x+ N 2 M nx+ N n = = =+ +...+ [( x- a )2 + b2] Q ( x ) [( x- a )2 + b 2]n [( x- a )2 + b 2]n [( x- a )2 + b2]n-1 calculándose los coeficientes M1, N1, M2, N2,… Por el método de los coeficientes indeterminados. Mx+ N Veremos ahora cómo calculamos por reducciones la integral ò dx. Para ello, [( x- a )2 + b2]n comenzaremos sumando y restando Ma en el numerador, con lo que obtendremos:

ò

Mx+ N

[( x- a )2 + b2]n

dx = M ò

x- a

[( x- a )2 + b2]n

dx+ ( Ma + N )ò

dx

[( x- a )2 + b2]n

En la primera integral del segundo miembro para que el numerador sea la derivada del denominador falta sólo el factor 2, por lo que si multiplicamos y dividimos por 2, tendremos:

ò

x– a

[( x- a )2 + b2]n

1 2× ( x- a ) 1 dx = ò n-1 + K 2 [( x- a )2 + b 2]n [ 2× ( n - 1) ( x- a )2 + b 2]

dx =

integral que resulta de hacer el cambio de variable ( x- a )2 + b 2 = t . La segunda integral se calcula por reducciones sucesivas, para lo que multiplicaremos y dividiremos por b 2 con lo que tendremos:

ò

dx

n =

[( x- a )2 + b2]

b2 1 dx ò b 2 [( x- a )2 + b 2]n

y si a esta última sumamos y restamos ( x- a )2, tendremos

ò

b2

[( x- a )2 + b ]

2 n

=ò

dx = ò

( x- a )2 + b 2

[( x- a )2 + b ]

dx

2 n

n-1 - ò

[( x- a )2 + b2]

dx- ò

( x- a )2

[( x- a )2 + b2]n

( x- a )2

[( x- a )2 + b2]n

dx =

dx

A esta última integral podemos aplicarle el método de integración por partes, tomando x- a = u ;


( x- a )

[( x- a )2 + b 2]n

dx = dv

121



con lo que

122

P u'D - D'u v = + qD D2 q

du = dx ; v = -

1

2× ( n - 1)×[( x- a )2 + b 2]

n-1

P u v dx, vemos que consta de una parte racional y otra ò dx, en la que al ser simples todos los Q D q ceros de q ( x ), está formada exclusivamente por funciones logaritmo y arco tangente. Sea n el grado de Q ( x )y h el de D ( x ). Entonces el grado de q ( x )será n – h y los de los polinomios u(x) y v(x) serán h – 1 y n – h – 1, respectivamente. Veremos que u(x) y v(x), quedan determinados aplicando la descomposición de Hermite. En efecto, de la misma deducimos que y así

ò

( x- a )2

[( x- a )2 + b2]n

dx = -

x- a

2× ( n - 1)×[( x- a )2 + b 2]

n-1

+

1 dx ò 2× ( n - 1) [( x- a )2 + b 2]n-1

de donde ò

y sustituyendo esta expresión en lugar de la integral en las igualdades anteriores, nos queda: dx

ù 1é x- a 2n - 3 dx ê ú + ò 2 2 n-1 b 2ê 2× ( n - 1) [( x- a )2 + b 2]n-1 û ú ë 2× ( n - 1)×[( x - a ) + b ] v

=

u

[( x- a )2 + b2]n

P

ò

ò Q dx = D +ò q dx

Q y u y v son polinomios (por ahora indeterminados) de grados respectivaD mente inferiores en 1 a los de D y q. Si integramos ahora miembro a miembro, obtenemos en la que D = mcd (Q ,Q ' ), q =

En esta igualdad, la integral que figura en el segundo miembro es la misma que la del primero, pero con una unidad menos en el exponente, por lo que llegamos al caso de reducciones sucesivas. dx , que ya ha sido resuelta en el caso tercero. ( x- a )2 + b 2 P ( x ) d é u ( x ) ù v( x ) = ê ú+ Q ( x ) dxë D ( x ) û q ( x )

Siguiendo así, llegaremos a la integral ò

P (x ) dx, sin Q(x ) descomponer la fracción totalmente en suma de fracciones simples. Para ello se aplica la siguiente descomposición debida a Hermite:

–

Quinto caso: caso general. Para calcular la integral de una función racional cualquiera se empieza dividiendo el numerador entre el denominador en caso de que el grado de aquel sea mayor o igual que el de este, transformando así el cociente en otro donde el grado del numerador es menor que el del denominador. Una vez hecho esto, se descompone éste en fracciones simples y se integra separadamente cada una de estas, siguiendo los métodos correspondientes a cada uno de los casos anteriores. En caso de que el denominador tenga raíces múltiples, podemos emplear el método de Hermite, que estudiaremos en el epígrafe siguiente. El método de Hermite permite aislar la parte racional, resultante de la integración de ò

4.5. Método de Hermite

Quinto caso: caso general. Para calcular la integral de una función racional cualquiera se empieza dividiendo el numerador entre el denominador en caso de que el grado de aquel sea mayor o igual que el de este, transformando así el cociente en otro donde el grado del numerador es menor que el del denominador. Una vez hecho esto, se descompone éste en fracciones simples y se integra separadamente cada una de estas, siguiendo los métodos correspondientes a cada uno de los casos anteriores. En caso de que el denominador tenga raíces múltiples, podemos emplear el método de Hermite, que estudiaremos en el epígrafe siguiente.

4.5. Método de Hermite

P (x ) El método de Hermite permite aislar la parte racional, resultante de la integración de ò dx, sin Q(x ) descomponer la fracción totalmente en suma de fracciones simples. Para ello se aplica la siguiente descomposición debida a Hermite:

–

P ( x ) d é u ( x ) ù v( x ) = ê ú+ Q ( x ) dxë D ( x ) û q ( x )

En esta igualdad, la integral que figura en el segundo miembro es la misma que la del primero, pero con una unidad menos en el exponente, por lo que llegamos al caso de reducciones sucesivas. dx , que ya ha sido resuelta en el caso tercero. Siguiendo así, llegaremos a la integral ò ( x- a )2 + b 2

Q en la que D = mcd (Q ,Q ' ), q = y u y v son polinomios (por ahora indeterminados) de grados respectivaD mente inferiores en 1 a los de D y q. Si integramos ahora miembro a miembro, obtenemos ù 1é x- a 2n - 3 dx ê ú + ò 1 1 n n 2 2 2 bê 2× ( n - 1) [( x- a )2 + b 2] ú ë 2× ( n - 1)×[( x - a ) + b ] û u

=

P

[( x- a )2 + b ]

2 n

dx

v

ò Q dx = D +ò q dx

ò

y sustituyendo esta expresión en lugar de la integral en las igualdades anteriores, nos queda: P u v de donde ò dx, vemos que consta de una parte racional y otra ò dx, en la que al ser simples todos los Q D q ceros de q ( x ), está formada exclusivamente por funciones logaritmo y arco tangente. Sea n el grado de Q ( x )y h el de D ( x ). Entonces el grado de q ( x )será n – h y los de los polinomios u(x) y v(x) serán h – 1 y n – h – 1, respectivamente. Veremos que u(x) y v(x), quedan determinados aplicando la descomposición de Hermite. En efecto, de la misma deducimos que

ò

[( x- a )2 + b2]n ( x- a )2

dx = -

n-1 2× ( n - 1)×[( x- a )2 + b 2]

x- a

+

1 dx ò 2× ( n - 1) [( x- a )2 + b 2]n-1

y así

du = dx ; v = -

2× ( n - 1)×[( x- a )2 + b 2]

n-1

1

P u'D - D'u v = + qD D2 q

122

con lo que



Primitiva de una función o sea P = qu '

qD ' u + Dv D

En el segundo miembro aparecen como indeterminados los h coeficientes de u más los n – h de v y como el grado de P es n – 1, al identificar los dos miembros se dispone de un número de ecuaciones lineales igual al número de dichos coeficientes, formando un sistema determinado, pues si fuese nulo su determinante, el sistema homogéneo que se obtendría al suponer nulos todos los coeficientes de P(x) admitiría una solución no idénticamente nula, es decir, habría dos polinomios, u ( x ) y v( x ), no idénticamente nulos que u v implicarían la igualdad de una función racional y una no algebraica ò dx. D q

4.6. Integración de funciones irracionales No es posible expresar siempre las integrales de funciones irracionales mediante funciones matemáticas elementales. De todas maneras estudiaremos varios casos, donde con los cambios adecuados las integrales irracionales pueden reducirse a racionales, pudiendo entonces resolverse mediante los métodos y procedimientos expuestos con anterioridad. a)

Integrales de la forma ò R ( xm / n , x p/ q ,..., x u/ v ) dx, donde R indica una función racional. Al ser los exponentes de x números racionales, podemos reducirlos a común denominador. Sea m = mcm( n , p ,..., v ), de modo que: m m' p p' u u' = , = , ..., = n m q m v m y haciendo el cambio x = t m, dx = m × t m-1, y sustituyendo en la integral, esta nos quedará como mò R ( t m ' , t p' ,..., t u' )× t m-1 dt , que es una integral racional.

b)

Integrales de la forma æ æ ax+ b öm / n æ ax+ b öp/ q æ ax+ b öu/ v ö ÷ ,...,ç ÷ ÷ dx ,ç è cx + d ø è cx + d ø ÷ è ø

ò Rççx,çè cx+ d ÷ø

Este tipo, generalización del anterior se integra mediante el cambio ax+ b = t m, cx + d donde m = mcm( n , p ,..., v ). De este cambio, resulta x=

d ×t m - b º r( t ) (racional); dx = r'( t ) dt (racional) a - c× t m

y la integral se transforma en

ò R(r( t ), t

m'

, t p' ,..., t u' ) r'( t ) dt

que es racional. Casos particulares del anterior son:

ò R(x,( ax+ b ) ,( ax+ b ) ,...) dx, con cambio ax+ b = t ò R(x, ax+ b ) dx con cambio ax+ b = t . m/ n

p/ q

m


m

m

123



ò Rèça × tg t , cos t ø÷cos

t

ò R(x,

æ

2

Integrales de la forma

124

c)

)

a ö a dt

ax2 + bx+ c dx reduciéndose la integral a una del tipo

Si hiciéramos el cambio ax2 + bx+ c = t , racionalizaríamos el radical, pero no la x ni dx, por ser irracional en t la expresión x deducida de la ecuación de segundo grado ax2 + bx+ c = t 2. Conviene igualar el radical a una expresión racional t, tal que al elevar al cuadrado la ecuación resultante en x sea lineal. Para ello, distinguiremos tres casos: a 2 + x2 = a 2 + a 2 tg 2t = a 1+ tg 2t =

a cos t

tendremos

1.

Si a > 0, haremos el cambio ax2 + bx+ c = ax+ t , de donde bx + c = 2 axt + t 2 y de aquí, t2- c tendremos x = º r( t ), que es una función racional de t, cuya derivada r'( t )es también b - 2 at racional.

2.

Si c > 0, haremos el cambio ax2 + bx+ c = tx+ c, de donde ax2 + bx+ c = t 2x2 + 2tx c + c y 2t c - b de aquí tendremos x = º r( t ), que es una función racional de t, cuya derivada r'( t ) es a- t 2 también racional. Si a < 0y c < 0, el trinomio ax 2 + bx + c es negativo para x = 0 y x = ¥, y para que el radical tenga dos raíces reales es preciso que dicho trinomio tenga valores positivos, es decir, debe anularse en dos puntos a y b, y por tanto ax 2 + bx + c = a ( x - a )( x - b ). Así, haremos el cambio ax2 + bx+ c = t ( x- a ) y al elevar al cuadrado y simplificar, quedará a ( x- b ) = t 2 ( x- a ) y ab - t 2a de aquí tendremos x = º r( t ), que es una función racional de t, cuya derivada r'( t ) es a- t 2 también racional.

–

Caso 2. Integrales del tipo ò R x, a 2 + x 2 dx. Aquí haremos el cambio x = a ×tg t , con lo que

(

según la sustitución que hayamos elegido.

)

ì aò R ( a sen t , a cos t )cos t dt ï í ï î- aò R ( a cos t , a sen t )sen t dt

con lo que la integral se reduce a una del tipo

ì a 2 - x2 = a 2 - a 2sen 2 t = a ×cos t ï í ï 2 2 2 2 2 î a - x = a - a cos t = a ×sen t

3.

o x = a ×cos t , con lo que tendremos

–

Caso 1. Integrales del tipo ò R x, a 2 - x 2 dx. Utilizaremos los posibles cambios x = a ×sen t

(

)

Dentro de este apartado de integración de funciones irracionales estudiaremos tres casos en los que utilizando cambios trigonométricos se pueden resolver las mismas, pasándolas primero a trigonométricas y con posterioridad a racionales.

Dentro de este apartado de integración de funciones irracionales estudiaremos tres casos en los que utilizando cambios trigonométricos se pueden resolver las mismas, pasándolas primero a trigonométricas y con posterioridad a racionales.

(

)

Caso 1. Integrales del tipo ò R x, a 2 - x 2 dx. Utilizaremos los posibles cambios x = a ×sen t también racional.

Si c > 0, haremos el cambio ax2 + bx+ c = tx+ c, de donde ax2 + bx+ c = t 2x2 + 2tx c + c y 2t c - b de aquí tendremos x = º r( t ), que es una función racional de t, cuya derivada r'( t ) es a- t 2 también racional. Si a < 0y c < 0, el trinomio ax 2 + bx + c es negativo para x = 0 y x = ¥, y para que el radical tenga dos raíces reales es preciso que dicho trinomio tenga valores positivos, es decir, debe anularse en dos puntos a y b, y por tanto ax 2 + bx + c = a ( x - a )( x - b ). Así, haremos el cambio ax2 + bx+ c = t ( x- a ) y al elevar al cuadrado y simplificar, quedará a ( x- b ) = t 2 ( x- a ) y ab - t 2a º r( t ), que es una función racional de t, cuya derivada r'( t ) es a- t 2 o x = a ×cos t , con lo que tendremos

de aquí tendremos x =

ì a 2 - x2 = a 2 - a 2sen 2 t = a ×cos t ï í ï 2 2 2 2 2 î a - x = a - a cos t = a ×sen t

3.

–

con lo que la integral se reduce a una del tipo

racional. b - 2 at

Si a > 0, haremos el cambio ax2 + bx+ c = ax+ t , de donde bx + c = 2 axt + t 2 y de aquí, t2- c º r( t ), que es una función racional de t, cuya derivada r'( t )es también

(

)

Caso 2. Integrales del tipo ò R x, a 2 + x 2 dx. Aquí haremos el cambio x = a ×tg t , con lo que 1.

–

tendremos x =

según la sustitución que hayamos elegido.

2.

ì aò R ( a sen t , a cos t )cos t dt ï í ï î- aò R ( a cos t , a sen t )sen t dt

tendremos

Si hiciéramos el cambio ax2 + bx+ c = t , racionalizaríamos el radical, pero no la x ni dx, por ser irracional en t la expresión x deducida de la ecuación de segundo grado ax2 + bx+ c = t 2. Conviene igualar el radical a una expresión racional t, tal que al elevar al cuadrado la ecuación resultante en x sea lineal. Para ello, distinguiremos tres casos: a 2 + x2 = a 2 + a 2 tg 2t = a 1+ tg 2t =

a cos t

reduciéndose la integral a una del tipo

ò R(x,

a ö a dt

t

Integrales de la forma



124

2

c)

)

ax2 + bx+ c dx æ

ò Rçèa × tg t , cos t ÷øcos


–

(

)

Caso 3. Integrales del tipo ò R x, x2 - a 2 dx. Haremos el cambio x = a ×sec t , de donde a ×sen t dx = dt . Así cos 2 t x2 - a 2 =

a2 - a2 = cos 2 t

a 2 - a 2 cos 2 t = a × tg t cos 2 t

reduciéndose la integral a una del tipo a ×sen t dt 2 t

ò R ( a ×sec t , a × tg t ) cos 4.7. Integración de funciones trigonométricas

Método general. El método general para integrar funciones dependientes de sen x y cos x, æxö ò R (sen x,cos x ) dx, es reducirlas a integrales racionales mediante el cambio de variable tgçè 2 ÷ø= t. Para ello tendremos en cuenta las fórmulas trigonométricas del ángulo doble y la primera fórmula fundamental, es decir sen x = 2sen

x x cos ; 2 2

x x cos x = cos 2 - sen 2 ; 2 2

x x 1= cos 2 + sen 2 2 2

por lo que x x x 2sen cos 2tg 2 2 = 2 sen x = x 2 x 2 x 1+ tg 2 cos + sen 2 2 2 x x x 1- tg 2 cos 2 – sen 2 2 2= 2 cos x = 2 x 2 x 2 x cos + sen 1+ tg 2 2 2 x 2tg sen x 2 tg x = = x cos x 1- tg 2 2 y al hacer el cambio tg

x = t , tendremos 2 sen x =

2t ; 1+ t 2

cos x =

1- t 2 ; 1+ t 2

tg x =

2t 1– t 2

y como además x = arctg t ; 2

dx =

2dt 1+ t 2

sustituyendo estos valores, la integral trigonométrica se reduce a una racional. Esta integral no es difícil de calcular, aunque este cambio de variable puede resultar muy laborioso en ciertos casos, por lo que a continuación estudiaremos algunos casos particulares que se pueden resolver por un cambio de variable distinto al general. TEMARIO DE MATEMÁTICAS. PRUEBA A

125


126


que se integra desarrollando el binomio (1- cos 2 x )n y haciendo el cambio cos x = t .

Primer caso: integrales del tipo ò R (sen 2x,cos 2 x,sen x ×cos x ) dx. Haremos el cambio tg x = t , con lo que nos quedará x dx = ò

sen 2nx×sen x (1- cos 2 x )nsen x dx dx = ò cos 2n+1 x cos 2n+1 x t2 tg 2x 2 = 1+ tg x 1+ t 2

2 n+1

sen 2x =

ò tg

–

Si m es impar, tendremos m = 2n + 1, con lo que

tg m-1x tg m-3x tg m-1x tg m-3x +...±tg x± x+ K +...±tg x± arctg t + K = m- 1 m- 3 m- 1 m- 3 x dx = ò

æ 1 ö tm ÷dt = dt = òç t m-2 - t m-4 + t m-6+....± è 1+ t 2 1+ t 2 ø

con lo que la integral nos quedaría:

Cuarto caso: integrales del tipo ò tg m x dx. Si m es par haremos el cambio tg x = t ; dx = x = arctg t ;

dx =

dt 1+ t 2

–

t 1+ t 2

m

sen x ×cos x =

ò tg

1 1 2 = 1+ tg x 1+ t 2

=

cos 2 x =

dt , 1+ t 2

Tercer caso: integrales del tipo ò cos m x×sen nx dx. Si es impar en seno (es decir que al sustituir sen x por –sen x la función cambia de signo), haremos el cambio cos x = t . Si la función es impar en coseno, haremos el cambio sen x = t y si es par en seno y en coseno haremos el cambio tg x = t , quedándonos la integral como en el caso primero. reduciéndose la integral inicial a una del tipo ,

1 t ö ÷ dt 2 , 2÷ 1+ t 1+ t ø1+ t 2

1 [cos ( m+ n ) x+ cos( m- n ) x] 2

Segundo caso: integrales del tipo

òsen mx×sen nx dx;

òcos mx×cos nx dx;

sen mx×sen nx =

òsen mx×cos nx dx;

cos mx×cos nx =

–

2

–

æ t2

ò Rççè1+ t

1 [-cos ( m+ n ) x+cos( m+ n ) x] 2

Aplicando las fórmulas trigonométricas de transformación de sumas en productos y viceversa, estas integrales quedarán reducidas a inmediatas de la forma: 1 sen mx×cos nx = [sen ( m+ n ) x+ sen ( m- n ) x] 2

Aplicando las fórmulas trigonométricas de transformación de sumas en productos y viceversa, estas integrales quedarán reducidas a inmediatas de la forma: 1 [sen ( m+ n ) x+sen ( m- n ) x] 2 sen mx×cos nx =

1 [cos ( m+ n ) x+ cos( m- n ) x] 2

–

òsen mx×sen nx dx;

Segundo caso: integrales del tipo

ò Rèçç1+ t

òcos mx×cos nx dx;

cos mx×cos nx =

ö dt 1 t ÷ , ÷ 1+ t 2 1+ t 2 ø1+ t 2

Tercer caso: integrales del tipo ò cos m x×sen nx dx. Si es impar en seno (es decir que al sustituir sen x por –sen x la función cambia de signo), haremos el cambio cos x = t . Si la función es impar en coseno, haremos el cambio sen x = t y si es par en seno y en coseno haremos el cambio tg x = t , quedándonos la integral como en el caso primero. æ t2

2

,

–

1 [-cos ( m+ n ) x+cos( m+ n ) x] 2

òsen mx×cos nx dx;

sen mx×sen nx =

reduciéndose la integral inicial a una del tipo x = arctg t ;

dx =

dt 1+ t 2

Cuarto caso: integrales del tipo ò tg m x dx. Si m es par haremos el cambio tg x = t ; dx = æ 1 ö tm ÷dt = dt = òç t m-2 - t m-4 + t m-6+....± è 1+ t 2 1+ t 2 ø

t2 tg 2x = 1+ tg 2x 1+ t 2

sen 2x =

x dx = ò

1 1 = 1+ tg 2x 1+ t 2

=

m

cos 2 x =

ò tg

t 1+ t 2

con lo que la integral nos quedaría:

dt , 1+ t 2

sen x ×cos x =

–

tg m-1x tg m-3x tg m-1x tg m-3x +...±tg x± x+ K +...±tg x± arctg t + K = m- 1 m- 3 m- 1 m- 3

Si m es impar, tendremos m = 2n + 1, con lo que x dx = ò

2 n+1

sen 2nx×sen x (1- cos 2 x )nsen x dx dx = ò cos 2n+1 x cos 2n+1 x

Primer caso: integrales del tipo ò R (sen 2x,cos 2 x,sen x ×cos x ) dx. Haremos el cambio tg x = t , con lo que nos quedará

que se integra desarrollando el binomio (1- cos 2 x )n y haciendo el cambio cos x = t .



126

–

ò tg


5. APLICACIONES DE LA INTEGRAL AL CÁLCULO DE MAGNITUDES GEOMÉTRICAS 5.1. Cálculo de áreas planas 5.1.1. Área limitada por una función continua el eje OX, el eje y las rectas x = a y x = b Distinguiremos tres casos según la función sea constantemente positiva, constantemente negativa o tome valores de ambos signos en el intervalo [ a , b ].

–

Caso 1. Función constantemente positiva. Definición. Sea f :[ a , b ] ® Â una función continua en [ a , b ] y supongamos que f ( x ) ³ 0, " x Î [ a , b ]. Llamamos R al recinto plano limitado por la gráfica de la función f ( x ), el eje OX y las rectas x = a b y x = b. El área de este recinto lo denotaremos por A ( R ) y será A ( R ) = òa f ( x ) dx. Y y = f(x)

R

a

b

X

Figura 1.

–

Caso 2. Función constantemente negativa Si la función f ( x ) £ 0, " x Î [ a , b ], su representación gráfica sería una curva situada por debajo del eje de las X. Si llamamos R' al recinto plano limitado por la gráfica de la función f ( x ), el eje OX y b las rectas x = a y x = b, y calculamos òa f ( x ) dx, obtendremos un número negativo, que no representa el valor de A ( R ' ) al no tener sentido hablar de áreas negativas. Por ello, consideramos la función g ( x ), simétrica a f ( x ) respecto del eje de las abscisas, es decir g ( x ) = - f ( x ), " x Î [ a , b ]. Vemos también que las áreas de los recintos planos R y R ' coinciden. Así A ( R ' ) = A ( R ) = òa g ( x ) dx = -òa f ( x ) dx b

b

Y y = g(x) = –f(x)

R

a

b

X

R´

y = f(x)


127


128


–

Caso 3. La función toma valores positivos y negativos en el intervalo [ a , b ]. Al ser una función continua, cambia de signo un número finito de veces en el intervalo [ a , b ]. Para calcular el área del recinto R que determinan la función, el eje Y OX y las rectas x = a y x = b, tendremos que descomponer la integral definida como suma de integrales referidas cada una de ellas a los subintervalos donde la función toma valores de signo constante. Cada una de ellas representará el área R3 R1 c d e del recinto plano limitado por la función y el eje a R2 R4 b X OX en cada uno de los subintervalos, si es constantemente positiva en el mismo y el área pero con signo negativo si la función es constantemente negativa. Suponiendo las condiciones dibujadas en el gráfico siguiente Figura 3. Figura 5.

y = f(x)

a

b

Si suponemos ahora que se sigue cumpliendo que f ( x ) £ g ( x ), pero eliminamos la condición de que f ( x )³ 0, veremos que efectuando una traslación cuyo vector K sea paralelo al eje de ordenadas, podemos conseguir que se vuelva a cumplir la condición de que las nuevas funciones f '( x ) = f ( x )+ K y g '( x ) = g ( x )+ K sean constantemente positivas en el intervalo [a,b]. (Observar la figura).

X

R

K

y = f(x) + K y = g(x)

K

R´

y = g(x) + K

Y

Así, A ( R ) = A ( R2 )- A ( R1 ) = òa g ( x ) dx - òa f ( x ) dx = òa( g ( x )- f ( x )) dx b

b

b

con lo que tendremos:

a

X

b

Figura 4.

A ( R ) = A ( R1 )+ A ( R2 )+ A ( R3 )+ A ( R4 ) = òa f ( x ) dx- òc f ( x ) dx+ òd f ( x ) dx- òe f ( x ) dx c

d

e

b

En la práctica también pueden una vez hallados los ceros de la función, hallar todas las integrales que hay entre dos ceros consecutivos y sumar sus respectivos valores absolutos. y = f(x) R2 – R1

5.1.2. Área plana limitada por la gráfica de dos funciones continuas y = g(x)

Y

Sean f , g : [ a , b ] ® Â dos funciones continuas tal que f ( x ) £ g ( x ), " x Î [ a , b ]. Llamaremos R2 al recinto plano limitado por la gráfica de la función g ( x ), el eje OX y las rectas x = a y x = b; y R1 al limitado por la gráfica de la función f ( x ), el eje OX y las rectas x = a y x = b. Supondremos que f ( x ) ³ 0, " x Î [ a , b ], con lo que tendremos

Sean f , g : [ a , b ] ® Â dos funciones continuas tal que f ( x ) £ g ( x ), " x Î [ a , b ]. Llamaremos R2 al recinto plano limitado por la gráfica de la función g ( x ), el eje OX y las rectas x = a y x = b; y R1 al limitado por la gráfica de la función f ( x ), el eje OX y las rectas x = a y x = b. Supondremos que f ( x ) ³ 0, " x Î [ a , b ], con lo que tendremos Y

y = g(x)

5.1.2. Área plana limitada por la gráfica de dos funciones continuas R2 – R1

En la práctica también pueden una vez hallados los ceros de la función, hallar todas las integrales que hay entre dos ceros consecutivos y sumar sus respectivos valores absolutos. y = f(x)

A ( R ) = A ( R1 )+ A ( R2 )+ A ( R3 )+ A ( R4 ) = òa f ( x ) dx- òc f ( x ) dx+ òd f ( x ) dx- òe f ( x ) dx c

d

a

b

X

Figura 4.

e

b

con lo que tendremos:

Caso 3. La función toma valores positivos y negativos en el intervalo [ a , b ]. Al ser una función continua, cambia de signo un número finito de veces en el intervalo [ a , b ]. Para calcular el área del recinto R que determinan la función, el eje Y OX y las rectas x = a y x = b, tendremos que descomponer la integral definida como suma de integrales referidas cada una de ellas a los subintervalos donde la función toma valores de signo constante. Cada una de ellas representará el área R R d e c 1 3 del recinto plano limitado por la función y el eje a R2 R4 b X OX en cada uno de los subintervalos, si es constantemente positiva en el mismo y el área pero con signo negativo si la función es constantemente negativa. Suponiendo las condiciones dibujadas en el gráfico siguiente Figura 3. Así, A ( R ) = A ( R2 )- A ( R1 ) = òa g ( x ) dx - òa f ( x ) dx = òa( g ( x )- f ( x )) dx b

Y

y = g(x) + K R´

K

K

R

b

a

y = f(x)

128

X

Figura 5.

Si suponemos ahora que se sigue cumpliendo que f ( x ) £ g ( x ), pero eliminamos la condición de que f ( x )³ 0, veremos que efectuando una traslación cuyo vector K sea paralelo al eje de ordenadas, podemos conseguir que se vuelva a cumplir la condición de que las nuevas funciones f '( x ) = f ( x )+ K y g '( x ) = g ( x )+ K sean constantemente positivas en el intervalo [a,b]. (Observar la figura).



y = f(x) + K y = g(x)

b

–

b

Primitiva de una función Además, como la traslación conserva las distancias, las áreas de los recintos R y R 'son iguales, por lo que tendremos: A ( R ) = A ( R ' ) = òa( g '( x )- f '( x )) dx = òa( g ( x )+ K - f ( x )- K ) dx = òa( g ( x )- f ( x )) dx b

b

b

Así pues para calcular el área del recinto plano limitado por dos funciones la primera fórmula obtenida sigue siendo válida aunque alguna de las dos (o ambas) no sea constantemente positiva. En el caso en que la función g ( x ) no sea constantemente mayor que f ( x ), se determinarán los diferentes subintervalos donde una de las funciones es constantemente mayor que la otra, siendo el área pedida la suma de las áreas de los recintos obtenidos en cada uno de los subintervalos determinados.

5.1.3. Áreas de figuras planas en coordenadas polares Sea r = f ( q ) la ecuación de una curva en coordenadas polares, donde f es una función continua para a £ q £ b. Calcularemos el área delimitada por esta curva y los radios vectores q = a y q = b. Dado el intervalo cerrado [ a , b ] correspondiente a la variable, consideremos la siguiente partición P: a = q 0 < q1 < q 2 < ...< q n = b

Figura 6. El área limitada por la curva de ecuación r = f ( q ) entre los radios vectores q 0 = a y q n = b, es la suma de las áreas de los sectores circulares delimitados por cada dos puntos consecutivos de la partición (sabemos que el área de un sector circular es igual a la mitad del producto del cuadrado del radio por el ángulo central, expresado en radianes). Consideremos el sector OAi-1Ai y sean mi y M i el mínimo y el máximo de la función r = f ( q ) en el intervalo [ q i-1, q i ]. Es evidente que 1 2 1 m Dq £ área sector OAi-1Ai £ M i2Dq i 2 i i 2 siendo Dq i = q i - q i-1. Por lo tanto, si consideramos la suma de todos los sectores producidos por la partición P, tendremos n

1

å 2 m Dq £ S (OA A 2 i

i=1

i

0

n

n

1 ) £ å M i2Dq i i=1 2

Cuando el número de puntos de la partición P del intervalo [ a , b ] crece de modo que el radio de la misma tiende a cero, tendremos como límites las sumas inferior y superior: n ì 1 ï S ( g , P ) = lím å mi2Dq i Dq i ®0 i=1 2 ï í n ï 1 ïS ( g , P ) = lím å M i2Dq i D q ® 0 i î i=1 2

siendo g ( q ) =

1 2 f ( q ), de modo que 2 S ( g , P ) £ S (OA0 An ) £ S ( g , P )


129


130


que nos da la longitud de un arco de curva y = f ( x ), entre las abscisas x = a y x = b.

y por ser r = f ( q ) continua en [ a , b ], tendremos que S ( g , P ) = S ( g , P ) = S (OA0 An ) y este límite es pre-

cisamente òa f 2 ( q ) d ( q ), por lo que el área en coordenadas polares viene dada por la fórmula: b

L = òa 1+ [ f '( x )] dx 2

b

S (OA0 An ) = òa f 2 ( q ) d ( q ) b

Al ser continua la función derivada f '( x ), existe el límite de las sumas anteriores cuando los Dxi ® 0, y este límite, según la definición de integral definida es i=1

i=1

åDL = å i

5.2. Longitud de un arco de curva

1+ [ f '( x i )] × Dxi 2

5.2.1. Longitud de un arco de curva en coordenadas cartesianas n

n

de donde el perímetro de la poligonal correspondiente a una partición P, será

Sea f ( x ) una función continua y derivable en el intervalo [ a , b ] y P = {x0 , x1, x2 ,..., xn}, donde a = x0 < x1 < x2 <...< xn = b, una partición del intervalo [ a , b ]. Para cada valor de abscisa de la partición xi, tenemos el punto de la curva Ai( xi , f ( xi )), puntos que forman una línea poligonal “inscrita” en la curva. Llamamos longitud del arco de curva comprendida entre los puntos A0 y An al límite de la longitud de la poligonal A0 , A1, A2 ,..., An, cuando el radio de la partición tiende a cero, es decir lím ( A0 A1+ A1A2+...+ An-1An). æ ö ç Dyi ÷ ÷ × Dxi = 1+ [ f '( x i )]2 × Dxi DLi = 1+ç è Dxi ø 2

Así

r ( P ) ®0

Dy f ( xi )- f ( xi-1 ) i = = f '( x i ) con x i Î ( xi-1, xi ) Dxi xi - xi-1 DLi. Al ser Ai-1( xi-1, f ( xi-1 )) y Ai( xi , f ( xi )), tendremos que DLi = ( Dxi )2 + ( Dyi )2 , siendo Dxi = xi - xi-1 e Dyi = f ( xi )- f ( xi-1 ). Al ser la función f ( x ) continua y derivable en cada uno de los intervalos [ xi-1, xi ], podemos aplicar el teorema del valor medio de Lagrange, teniendo

Para calcular este límite calcularemos la longitud de cada uno de los segmentos Ai-1Ai, que llamaremos Figura 7.

Figura 7.

Para calcular este límite calcularemos la longitud de cada uno de los segmentos Ai-1Ai, que llamaremos

DLi. Al ser Ai-1( xi-1, f ( xi-1 )) y Ai( xi , f ( xi )), tendremos que DLi = ( Dxi )2 + ( Dyi )2 , siendo Dxi = xi - xi-1 e Dyi = f ( xi )- f ( xi-1 ). Al ser la función f ( x ) continua y derivable en cada uno de los intervalos [ xi-1, xi ], podemos aplicar el teorema del valor medio de Lagrange, teniendo Dyi f ( xi )- f ( xi-1 ) = = f '( x i ) con x i Î ( xi-1, xi ) Dxi xi - xi-1 r ( P ) ®0

Sea f ( x ) una función continua y derivable en el intervalo [ a , b ] y P = {x0 , x1, x2 ,..., xn}, donde a = x0 < x1 < x2 <...< xn = b, una partición del intervalo [ a , b ]. Para cada valor de abscisa de la partición xi, tenemos el punto de la curva Ai( xi , f ( xi )), puntos que forman una línea poligonal “inscrita” en la curva. Llamamos longitud del arco de curva comprendida entre los puntos A0 y An al límite de la longitud de la poligonal A0 , A1, A2 ,..., An, cuando el radio de la partición tiende a cero, es decir lím ( A0 A1+ A1A2+...+ An-1An). Así

æ Dyi ö 2 ÷ DLi = 1+ç ç ÷ × Dxi = 1+ [ f '( x i )] × Dxi è Dxi ø 2

de donde el perímetro de la poligonal correspondiente a una partición P, será

5.2.1. Longitud de un arco de curva en coordenadas cartesianas n

i

i=1

i=1

1+ [ f '( x i )] × Dxi 2

5.2. Longitud de un arco de curva

n

åDL = å

Al ser continua la función derivada f '( x ), existe el límite de las sumas anteriores cuando los Dxi ® 0, y este límite, según la definición de integral definida es S (OA0 An ) = òa f 2 ( q ) d ( q ) b

b

2

a

b

cisamente ò

L = òa 1+ [ f '( x )] dx

f 2 ( q ) d ( q ), por lo que el área en coordenadas polares viene dada por la fórmula:

y por ser r = f ( q ) continua en [ a , b ], tendremos que S ( g , P ) = S ( g , P ) = S (OA0 An ) y este límite es preque nos da la longitud de un arco de curva y = f ( x ), entre las abscisas x = a y x = b.



130


5.2.2. Longitud de un arco de curva dada por sus ecuaciones paramétricas Calcularemos la longitud de un arco de curva que viene dada por sus ecuaciones paramétricas · · ì x = x( t ) í , cuando t toma valores del intervalo [ a , b ]. Para ello supondremos que x( t ), y( t ), x( t ) e y( t ) son î y = y( t ) ·

funciones continuas en [ a , b ] y además x( t ) ¹ 0, " t Î [ a , b ] . Sabemos que dy · dy dt y( t ) f '( x ) = = = · dx dx x( t ) dt ·

y que dx = x( t ) dt , por lo que si sustituimos todo en la fórmula de longitud de un arco de curva obtenida en el apartado anterior, tendremos æ· ö · 2 2 b é· ç y( t ) ÷ ù é· ù 1+ç · ÷ x ( t ) dt = òa ê x ( t )ú +ê y( t )ú dt û û ë ë è x( t ) ø 2

L = òa 1+ [ f '( x )] dx = òa b

2

b

5.2.3. Longitud de un arco de curva en coordenadas polares Sea r = f ( q ) la ecuación de una curva en coordenadas polares. Si tenemos en cuenta las fórmulas de ì x = r×cos q transformación de coordenadas polares a cartesianas í y sustituimos r por su expresión en poî y = r×sen q ì x = f ( q )×cos q lar, tendremos í , que podemos considerar las ecuaciones paramétricas de la curva î y = f ( q )×sen q r = f ( q ). Si derivamos estas últimas respecto a q, tendremos · · ì ïx = r( q )×cos q - r( q )×sen q í· · ï î y = r( q )×sen q + r( q )×cos q

Por lo tanto, para hallar la longitud del arco de curva comprendido entre q 0 y q1, tendremos: 2

2

2

2

q1 é · q1 é · ù ù ù é· ù é· L = òq ê x( q )ú +ê y ( q )ú dq = òq ê f ( q )×cos q - f ( q )×sen q ú +ê f ( q )×sen q + f ( q )×cos q ú dq = û û ë û û ë ë ë 0 0

= òq

q1 0

2

[ f ( q )]2 +éëê f ( q )ùûú dq ·

y teniendo en cuenta que r = f ( q ), nos quedará L = òq

q1 0

·

r 2 + r 2 × dq

5.3. Volumen de un cuerpo de revolución Sea f :[ a , b ] ® Â, función continua en[ a , b ], con f ( x ) ³ 0, " x Î [ a , b ] . Calcularemos el volumen engendrado al girar el arco de curva y = f ( x ) entre x = a y x = b alrededor del eje OX. Para ello, consideremos una partición P = {x0 , x1, x2 ,..., xn}, donde a = x0 < x1 < x2 <...< xn = b. Para cada valor de abscisa de TEMARIO DE MATEMÁTICAS. PRUEBA A

131


132


la partición xi, tenemos el punto de la curva Ai( xi , f ( xi )). Cualquier subintervalo de la partición [ xi-1, xi ] determina un arco de curva sobre f ( x ), el que une los puntos Ai-1 y Ai. Sean M i y mi los valores máximo y mínimo que toma la función f ( x )en el intervalo [ xi-1, xi ] (ya que al ser continua alcanza un máximo y un mínimo en dicho intervalo).

El cálculo integral permite resolver problemas de cálculo de volúmenes de cuerpos que no sean de revolución. Esto se podrá hacer cuando conozcamos el área A ( x )de toda sección plana perpendicular al eje OX.

5.4. Volumen de un cuerpo en función de secciones paralelas Y y = f(x) 0

V = p ×òt y 2 ( t )× x '( t ) dt t1

Ai – 1

Ai

Como habíamos supuesto que f ( x ) ³ 0, " x Î [ a , b ], puesto que f ( x ) = f 2 ( x ), el volumen engendrado por f ( x )y f ( x ) es el mismo, por lo que será lo mismo si la función no cumple la condición de ser estrictamente positiva. Si s es un arco simple de curva determinado por f :[ a , b ] ® Â, expresado en coordenadas paramétricas, es decir s ( t ) = ( x( t ), y( t )); s:[ t 0 , t1] ® Â 2, con y( t ) = f [x ( t )], inyectiva y con derivada continua, entonces el volumen de revolución engendrado por s al girar alrededor del eje OX es a

O

mi

Mi

xi – 1

xi

b

X

2

V = p ×òa f 2 ( x ) dx b

Figura 8.

Así, dando cualquier e > 0, es posible encontrar una partición donde ambas sumas difieran en menos de e y como además tanto mi como M i son valores de la función f ( x ), si hacemos que el límite del radio de la partición tienda a cero, tendremos

Al girar el arco Ai-1Ai alrededor del eje OX, engendra un sólido de revolución, cuyo volumen se encuentra acotado por los de los cilindros de radios M i y mi y altura xi - xi-1, con lo que tendremos i=1

i=1

p × mi2 × Dxi £ V £ p × M i2 × Dxi

åp × m × Dx £V £ åp × M 2 i

i

2 i

× Dxi

siendo Dxi = xi - xi-1. Si consideramos la suma correspondiente a todos los intervalos de la partición, tendremos n

n

siendo Dxi = xi - xi-1. Si consideramos la suma correspondiente a todos los intervalos de la partición, tendremos n

n

åp × mi2 × Dxi £V £ åp × M i2 × Dxi p × mi2 × Dxi £ V £ p × M i2 × Dxi

i=1

i=1

Al girar el arco Ai-1Ai alrededor del eje OX, engendra un sólido de revolución, cuyo volumen se encuentra acotado por los de los cilindros de radios M i y mi y altura xi - xi-1, con lo que tendremos

Así, dando cualquier e > 0, es posible encontrar una partición donde ambas sumas difieran en menos de e y como además tanto mi como M i son valores de la función f ( x ), si hacemos que el límite del radio de la partición tienda a cero, tendremos

Figura 8.

V = p ×òa f 2 ( x ) dx b

2

Como habíamos supuesto que f ( x ) ³ 0, " x Î [ a , b ], puesto que f ( x ) = f 2 ( x ), el volumen engendrado por f ( x )y f ( x ) es el mismo, por lo que será lo mismo si la función no cumple la condición de ser estrictamente positiva. Si s es un arco simple de curva determinado por f :[ a , b ] ® Â, expresado en coordenadas paramétricas, es decir s ( t ) = ( x( t ), y( t )); s:[ t 0 , t1] ® Â 2, con y( t ) = f [x ( t )], inyectiva y con derivada continua, entonces el volumen de revolución engendrado por s al girar alrededor del eje OX es O

a

xi – 1

xi

X

Mi

mi

Ai – 1

b

V = p ×òt y 2 ( t )× x '( t ) dt t1

Ai

0

y = f(x)

Y

5.4. Volumen de un cuerpo en función de secciones paralelas

la partición xi, tenemos el punto de la curva Ai( xi , f ( xi )). Cualquier subintervalo de la partición [ xi-1, xi ] determina un arco de curva sobre f ( x ), el que une los puntos Ai-1 y Ai. Sean M i y mi los valores máximo y mínimo que toma la función f ( x )en el intervalo [ xi-1, xi ] (ya que al ser continua alcanza un máximo y un mínimo en dicho intervalo).

El cálculo integral permite resolver problemas de cálculo de volúmenes de cuerpos que no sean de revolución. Esto se podrá hacer cuando conozcamos el área A ( x )de toda sección plana perpendicular al eje OX. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


132

Primitiva de una función Y

A(x)

O a

b

x

X

Z

Figura 9.

Consideremos una partición P = {x0 , x1, x2 ,..., xn}, donde a = x0 < x1 < x2 <...< xn = b, y tracemos los planos x = x0, x = x1, x = x2 ,..., x = xn. Consideremos el volumen comprendido entre las secciones producidas por los planos x = xi-1 y x = xi. Dicho volumenVi, verificará ai × Dxi £ Vi £ Ai × Dxi siendo ai el ínfimo de las superficies de las secciones en [ xi-1, xi ], Ai el supremo y Dxi = xi - xi-1. Repitiendo el proceso en todos los subintervalos producidos por la partición P en el intervalo [ a , b ] y sumando, tendremos n

N

åa × Dx £V £ å A × Dx i

i

i

i=1

i

i=1

donde V es el volumen total del cuerpo. Si hacemos tender a cero el radio de la partición, los límites de las sumas superiores e inferiores determinarán un mismo valor que es el volumen total del cuerpo dado por la integral definida: v = òa A ( x ) dx b

siempre que la función A ( x ) sea integrable. Si observamos la fórmula, el volumen de un cuerpo de revolución es un caso particular de este, ya que en los mismos, la superficie A ( x )es la de un círculo de radio f ( x ).

5.5. Área de una superficie de revolución Sea f ( x ) una función continua y derivable en el intervalo [ a , b ] y P = {x0 , x1, x2 ,..., xn}, donde a = x0 < x1 < x2 <...< xn = b, una partición del intervalo [ a , b ]. Cada intervalo de la partición [ xi-1, xi ] determina un arco de extremos f ( xi-1 ) y f ( xi ). Sea a i el punto medio de dicho intervalo y tracemos por él, la recta tangente a f ( x ).

f(ai)

Y

O

Pi –

1

xi –

1

Pi y = f(x) Q

ai

xi

X

Figura 10.


133


134


Las rectas x = xi-1 y x = xi, determinan sobre la recta tangente y = t ( x ) los puntos Pi-1 y Pi. Si el segmento Pi-1Pi gira una vuelta completa en torno a OX, engendra un tronco de cono de revolución. La superficie de un tronco de cono es S = p × ( R + r )× g donde R y r son los radios mayor y menor y g la generatriz. En nuestro caso R = t ( xi ), r = t ( xi-1 ) y g = Pi-1Pi. Este último segmento podemos calcularlo por el teorema de Pitágoras en el triángulo P QP , con lo que tendremos i-1

Pi-1Pi=

i

( xi - xi-1) 2 +( t ( xi )- t ( xi-1 )) 2 = ( xi - xi-1) 2 +[ f '( ai )×( xi - xi-1)]

2

= ( xi - xi-1) × 1+ [ f '( a i )]

2

ya que la recta tangente que pasa por Pi-1 y Pi verifica que (por su ecuación punto pendiente) t ( xi )- t ( xi-1 ) = f '( a i )×( xi - xi-1) Así, podemos escribir la superficie lateral como S i = p ×( t ( xi )- t ( xi-1 )) × 1+ [ f '( a i )] ×( xi - xi-1) 2

o bien

S = òa f ( x )× 1+ [ f '( x )] dx

( t ( x )- t ( xi-1 )) 2 2 × 1+ [ f '( a i )] ×( xi - xi-1) = 2p × f ( a1 )× 1+ [ f '( a i )] ×( xi - xi-1) 2 2

S i = 2p ×

b

i

t ( xi )+ t ( xi-1 ) = f ( a i ) se hace al ser el primer miembro de la igualdad el radio de la 2 circunferencia media, que es evidentemente f ( a i ). Si variamos la partición de forma que su norma tienda a cero, y sumamos todas las superficies S i, el sumatorio tiende a la integral y la superficie pedida será

t ( xi )+ t ( xi-1 ) donde la sustitución = f ( a i ) se hace al ser el primer miembro de la igualdad el radio de la 2 circunferencia media, que es evidentemente f ( a i ). Si variamos la partición de forma que su norma tienda a cero, y sumamos todas las superficies S i, el sumatorio tiende a la integral y la superficie pedida será donde la sustitución

× 1+ [ f '( a i )] ×( xi - xi-1) = 2p × f ( a1 )× 1+ [ f '( a i )] ×( xi - xi-1) 2

2

b

2

2

( t ( xi )- t ( xi-1 ))

S = òa f ( x )× 1+ [ f '( x )] dx

S i = 2p ×

o bien

S i = p ×( t ( xi )- t ( xi-1 )) × 1+ [ f '( a i )] ×( xi - xi-1) 2

Así, podemos escribir la superficie lateral como t ( xi )- t ( xi-1 ) = f '( a i )×( xi - xi-1) ya que la recta tangente que pasa por Pi-1 y Pi verifica que (por su ecuación punto pendiente) Pi-1Pi=

( xi - xi-1) 2 +( t ( xi )- t ( xi-1 )) 2 = ( xi - xi-1) 2 +[ f '( ai )×( xi - xi-1)]

2

= ( xi - xi-1) × 1+ [ f '( a i )]

2

En nuestro caso R = t ( xi ), r = t ( xi-1 ) y g = Pi-1Pi. Este último segmento podemos calcularlo por el teorema de Pitágoras en el triángulo Pi-1QPi, con lo que tendremos donde R y r son los radios mayor y menor y g la generatriz. S = p × ( R + r )× g Las rectas x = xi-1 y x = xi, determinan sobre la recta tangente y = t ( x ) los puntos Pi-1 y Pi. Si el segmento Pi-1Pi gira una vuelta completa en torno a OX, engendra un tronco de cono de revolución. La superficie de un tronco de cono es 134



TEMA

31 Integración numérica. Métodos y aplicaciones

Jorge Navarro Camacho



136



INTRODUCCIÓN

2.

INTERPOLACIÓN POLINÓMICA 2.1. Interpolación lineal 2.2. Interpolación cuadrática 2.3. Interpolación polinómica de grado k

3.

INTEGRACIÓN NUMÉRICA

4.

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES 4.1. Regla del trapecio simple 4.2. Regla del trapecio con segmentos múltiples 4.3. Regla de Simpson 1/3 simple 4.4. Regla de Simpson 1/3 con segmentos múltiples 4.5. Regla de Simpson 3/8 simple 4.6. Regla de Simpson 3/8 con segmentos múltiples 4.7. Regla de Simpson para un número par de puntos

5.

INTEGRACIÓN ROMBERG 5.1. Método de extrapolación de Richardson 5.2. Método de Romberg

6.

APÉNDICE

APÉNDICE

6.

INTEGRACIÓN ROMBERG 5.1. Método de extrapolación de Richardson 5.2. Método de Romberg

5.

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES 4.1. Regla del trapecio simple 4.2. Regla del trapecio con segmentos múltiples 4.3. Regla de Simpson 1/3 simple 4.4. Regla de Simpson 1/3 con segmentos múltiples 4.5. Regla de Simpson 3/8 simple 4.6. Regla de Simpson 3/8 con segmentos múltiples 4.7. Regla de Simpson para un número par de puntos

4.

INTEGRACIÓN NUMÉRICA

3.

INTERPOLACIÓN POLINÓMICA 2.1. Interpolación lineal 2.2. Interpolación cuadrática 2.3. Interpolación polinómica de grado k

2.

INTRODUCCIÓN

1.



136

Integración numérica

1. INTRODUCCIÓN Uno de los problemas más complicados que aparecen en las diversas aplicaciones de las matemáticas en Ingenierías, Ciencias Biomédicas, Económicas, Estadística, etc., es el del cálculo de integrales definidas (áreas, volúmenes, superficies, probabilidades, etc.). La popularización de los ordenadores personales permite la resolución de este problema complejo por medio de la Integración numérica, que engloba una serie de métodos para el cálculo aproximado de integrales definidas mediante computadores (métodos iterativos). Estos métodos, además de aplicarse a funciones difíciles (o imposibles) de integrar, también pueden utilizarse sobre funciones dadas en forma de tabla, es decir, a funciones que sólo se conocen en unos cuantos puntos. Comenzaremos estudiando algunos métodos de interpolación (polinomios de interpolación de Lagrange, ver tema 24) en los que se basarán algunos de los sistemas de integración más utilizados, denominados Métodos Cerrados de Newton-Cotes que consistirán, básicamente, en construir un polinomio de interpolación que aproxime la función a integrar para, posteriormente, aproximar su integral por la integral del polinomio. También veremos otro método, denominado Regla de Romberg, bastante más potente que los métodos basados en la interpolación, pero que necesita que la función a integrar sea sencilla, ya que se deberá evaluar en bastantes puntos.

2. INTERPOLACIÓN POLINÓMICA A menudo se proporcionan datos obtenidos experimentalmente sobre alguna función como un conjunto discreto (finito) de puntos (pares). Sin embargo, a veces es necesario estimar la función en puntos intermedios entre los valores obtenidos. La idea de la interpolación (polinómica) es sencilla, obtener una función simple (un polinomio) que pase por todos los puntos disponibles y utilizarla para aproximar la función en los puntos desconocidos. Sólo estudiaremos los polinomios de interpolación de Lagrange, puesto que son los que utilizaremos en las fórmulas de integración de Newton-Cotes.

2.1. Interpolación lineal La forma más sencilla de interpolación es la de conectar dos puntos con una línea recta. Así, dados dos puntos obtenidos experimentalmente ( x0 , f ( x0 )) y ( x1, f ( x1 )) la ecuación de la recta que los une es y – f ( x0 ) f ( x1 ) – f ( x0 ) = x – x0 x1 – x0

f(x1) y f(x0)

(ver figura 1) que también se puede escribir como y = f ( x0 )+

f ( x1 ) – f ( x0 ) ( x – x0 ) x1 – x0

x0

x

x1

Figura 1.

o como y = f ( x0 )

x – x1 x – x0 + f ( x1 ) x0 – x1 x1 – x0

Otra forma de construir el polinomio de interpolación lineal será resolver el sistema que resulta de sustituir los dos puntos iniciales sobre la función y = ax + b, f ( x0 ) = ax0 + b f ( x1 ) = ax1+ b sistema que tiene solución única siempre que x0 ¹ x1.


137


138


En primer lugar veamos que si existe, es único. Supongamos que P y Q son dos polinomios de grado menor o igual que k pasando por los puntos ( xi , f ( xi )). Entonces, el polinomio R = P – Q tiene grado menor o igual que k y se anula en k +1puntos, por lo que, por el teorema fundamental del álgebra, R debe ser cero. 5 4 3

Demostración.

y

2 1 0

Si x0 , x1... xk son puntos distintos y f ( x0 ),..., f ( xk ) son conocidos, entonces existe un único polinomio de grado menor o igual que k que coincide con f en dichos puntos. -1 -2

Proposición 1.

-3 -4

De igual forma que se usa una recta o una parábola si disponemos de k +1puntos podemos, en general, usar un polinomio de grado menor o igual que k. Veamos un resultado general. 0

1

2

3

4

5

x

Figura 2.

2.3. Interpolación polinómica de grado k De igual forma que se interpola entre dos puntos, se puede interpolar por poligonales sobre cualquier conjunto finito de puntos uniendo a los puntos consecutivos (eje x) mediante líneas rectas (ver figura 2). sistema que tiene solución única siempre que los puntos x0 , x1 y x2 sean distintos. f ( x2 ) = ax22 + bx2 + c

2.2. Interpolación cuadrática

f ( x1 ) = ax12 + bx1+ c

De igual forma que se usa una recta cuando disponemos de dos puntos, podemos pensar en utilizar una parábola cuando dispongamos de tres puntos no alineados, obteniéndose el denominado polinomio de interpolación cuadrático. Se puede comprobar que el polinomio de grado 2 que pasa por tres puntos dados es f ( x0 ) = ax02 + bx0 + c

Otra forma de construir el polinomio de interpolación cuadrático será resolver el sistema que resulta de sustituir los tres puntos iniciales sobre la función y = ax 2 + bx+ c, ( x – x1 )( x – x2 ) ( x – x0 )( x – x2 ) ( x – x0 )( x – x1 ) + f ( x1 ) + f ( x2 ) ( x0 – x1 )( x0 – x2 ) ( x1 – x0 )( x1 – x2 ) ( x2 – x0 )( x2 – x1 ) y = f ( x0 )

y = f ( x0 )

( x – x )( x – x ) ( x – x )( x – x ) ( x – x0 )( x – x1 ) 1 2 0 2 + f ( x1 ) + f ( x2 ) ( x0 – x1 )( x0 – x2 ) ( x1 – x0 )( x1 – x2 ) ( x2 – x0 )( x2 – x1 )

De igual forma que se usa una recta cuando disponemos de dos puntos, podemos pensar en utilizar una parábola cuando dispongamos de tres puntos no alineados, obteniéndose el denominado polinomio de interpolación cuadrático. Se puede comprobar que el polinomio de grado 2 que pasa por tres puntos dados es

Otra forma de construir el polinomio de interpolación cuadrático será resolver el sistema que resulta de sustituir los tres puntos iniciales sobre la función y = ax 2 + bx+ c, f ( x0 ) = ax02 + bx0 + c

f ( x2 ) = ax22 + bx2 + c

2.2. Interpolación cuadrática

f ( x1 ) = ax12 + bx1+ c

sistema que tiene solución única siempre que los puntos x0 , x1 y x2 sean distintos.

De igual forma que se interpola entre dos puntos, se puede interpolar por poligonales sobre cualquier conjunto finito de puntos uniendo a los puntos consecutivos (eje x) mediante líneas rectas (ver figura 2).

2.3. Interpolación polinómica de grado k Figura 2.

x

De igual forma que se usa una recta o una parábola si disponemos de k +1puntos podemos, en general, usar un polinomio de grado menor o igual que k. Veamos un resultado general. 0

1

2

3

4

5

-4 -3 -2

Proposición 1.

Si x0 , x1... xk son puntos distintos y f ( x0 ),..., f ( xk ) son conocidos, entonces existe un único polinomio de grado menor o igual que k que coincide con f en dichos puntos. -1 0

y

1 2

Demostración.

En primer lugar veamos que si existe, es único. Supongamos que P y Q son dos polinomios de grado menor o igual que k pasando por los puntos ( xi , f ( xi )). Entonces, el polinomio R = P – Q tiene grado menor o igual que k y se anula en k +1puntos, por lo que, por el teorema fundamental del álgebra, R debe ser cero. 3 4 5



138

Integración numérica Para ver que existe basta comprobar que el polinomio k

Pk ( x ) = å f ( xi )Õ i=0

j¹i

x – xj xi – x j

tiene grado menor o igual que k y que pasa por todos los puntos ( xi , f ( xi )). Definición 2. Llamaremos polinomio de interpolación de Lagrange de grado k sobre ( xi , f ( xi )), i = 0..., k a k

Pk ( x ) = å f ( xi )Õ i=0

j¹i

x – xj xi – x j

Otra forma de construir el polinomio de interpolación de grado k será resolver el sistema que resulta de sustituir los k +1puntos iniciales sobre la función y = ak x k + ak –1x k –1+...+a0, f ( x0 ) = ak x0k + ak –1x0k –1+...+a0 ... f ( xk ) = ak xkk + ak –1xkk –1+...+a0 sistema que tiene solución única siempre que los puntos x0 , x1..., xk sean distintos. El error que se comete al sustituir una función por su polinomio de interpolación de grado k viene dado en el resultado siguiente: Proposición 3. Si x0 , x1..., xk son puntos distintos en el intervalo [ a , b ] , f ( x0 )..., f ( xk ) son conocidos, Pk ( x ) es el polinomio de interpolación de grado k y f Î C k+1[ a , b ] , entonces, para cada x Î [ a , b ] existe un valor x( x ) Î ( a , b) tal que f ( x ) = Pk ( x )+

f ( k+1) ( x ( x )) ( x – x0 )...( x – xk ) ( n + 1)!

La demostración puede verse al final del tema. En particular, si k = 1, es decir, si usamos interpolación lineal, el error viene dado por e1( x ) = f ( x ) – P1( x ) =

f ''( x ( x )) ( x – x0 )( x – x1 ) ( n + 1)!

y si k = 2, entonces e2 ( x ) = f ( x ) – P2 ( x ) =

f '''( x ( x )) ( x – x0 )( x – x1 )( x – x2 ) ( n + 1)!

Nótese que el error disminuye cuando x está cerca de los puntos conocidos. Aunque el error dependa de x y de la función desconocida f ( k+1) , basta con conocer una cota superiorC de f ( k+1) –como ocurre, por ejemplo, con cos( x )– para que podamos obtener una cota superior del error cometido en cualquier punto C ek ( x ) £ ( b – a )k+1 ( n + 1)! Nota: todo esto corresponde al tema 24, por lo que se puede exponer de forma mucho más breve.


139


140


= (b – a )

f ( b )+ f ( a ) 2

3. INTEGRACIÓN NUMÉRICA

El concepto de integral corresponde inicialmente al área encerrada por una función en un intervalo finito. Durante mucho tiempo la técnica principal para el cálculo práctico del área de una región fue la triangulación. Sin embargo, en la definición del concepto de integral matemática se utilizan los rectángulos como forma de aproximación del área de una región. Recordaremos la definición de integral de Riemman. Dada una función f y una partición del intervalo [ a , b ] p = {t 0 = a < t1 <...< t n = b} , llamaremos sumas inferior y superior a

ò P ( x )dx = ò

a

a 1

b

b

f (b ) – f (a ) f ( b ) – f ( a ) ( b – a )2 = ( x – a )dx = f ( a )( b – a )+ 2 b– a b– a

f ( a )+

Para ello basta conocer f en a y b, con lo que

ò

a

f ( x )dx òa P1( x )dx n

s( f , p ) = åmi ( t i – t i–1 ) b

b

i=1

La más sencilla de las fórmulas de Newton-Cotes consiste en sustituir el integrando por un polinomio interpolador de primer orden n

i=1

4.1. Regla del trapecio simple

S ( f , p ) = åM i ( t i – t i–1 )

donde mi = infti –1£x£ti f ( x ) y M i = sup ti –1£x£ti f ( x ). Entonces, f es integrable Riemman si Los métodos de Newton-Cotes son los más usuales dentro de la integración numérica. Se basan en la estrategia de reemplazar la función a integrar por una función más sencilla (por ejemplo un polinomio de interpolación). Veamos los más usuales. sup s( f , p ) = inf S ( f , p ) p

p

representándose dicho número mediante

4. FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES I = òa f ( x )dx = sup s( f , p ) = inf S ( f , p ) b

p

p

El teorema fundamental del cálculo integral y la regla de Barrow permiten el cálculo de integrales mediante una primitiva de f . Sin embargo, para algunas funciones es complicado o imposible el cálculo de una primitiva. En otras ocasiones el problema es que no se dispone de una expresión analítica de la función a integrar, sino únicamente de sus valores en una serie de puntos. En ambos casos, es necesario disponer de técnicas que nos permitan obtener, aunque sea de forma aproximada, el valor de I. La misma definición de Riemman puede ser utilizada para obtener aproximaciones (por defecto o por exceso) de I. El principal problema será el cálculo de mi y M i pero también pueden obtenerse buenas aproximaciones sustituyéndolos por f ( x i ) para un x i Î [ t i–1, t i ]. Veamos otros métodos para aproximar I.

El teorema fundamental del cálculo integral y la regla de Barrow permiten el cálculo de integrales mediante una primitiva de f . Sin embargo, para algunas funciones es complicado o imposible el cálculo de una primitiva. En otras ocasiones el problema es que no se dispone de una expresión analítica de la función a integrar, sino únicamente de sus valores en una serie de puntos. En ambos casos, es necesario disponer de técnicas que nos permitan obtener, aunque sea de forma aproximada, el valor de I. La misma definición de Riemman puede ser utilizada para obtener aproximaciones (por defecto o por exceso) de I. El principal problema será el cálculo de mi y M i pero también pueden obtenerse buenas aproximaciones sustituyéndolos por f ( x i ) para un x i Î [ t i–1, t i ]. Veamos otros métodos para aproximar I. p

p

I = òa f ( x )dx = sup s( f , p ) = inf S ( f , p ) b

4. FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

representándose dicho número mediante

Los métodos de Newton-Cotes son los más usuales dentro de la integración numérica. Se basan en la estrategia de reemplazar la función a integrar por una función más sencilla (por ejemplo un polinomio de interpolación). Veamos los más usuales. p

p

sup s( f , p ) = inf S ( f , p )

donde mi = infti –1£x£ti f ( x ) y M i = sup ti –1£x£ti f ( x ). Entonces, f es integrable Riemman si i=1

S ( f , p ) = åM i ( t i – t i–1 )

4.1. Regla del trapecio simple

n

La más sencilla de las fórmulas de Newton-Cotes consiste en sustituir el integrando por un polinomio interpolador de primer orden i=1

s( f , p ) = åmi ( t i – t i–1 ) b

a

f ( x )dx òa P1( x )dx b

n

ò

El concepto de integral corresponde inicialmente al área encerrada por una función en un intervalo finito. Durante mucho tiempo la técnica principal para el cálculo práctico del área de una región fue la triangulación. Sin embargo, en la definición del concepto de integral matemática se utilizan los rectángulos como forma de aproximación del área de una región. Recordaremos la definición de integral de Riemman. Dada una función f y una partición del intervalo [ a , b ] p = {t = a < t <...< t = b} , llamaremos sumas inferior y superior a 0

1

n

Para ello basta conocer f en a y b, con lo que b

a 1

a

f ( a )+

f (b ) – f (a ) f ( b ) – f ( a ) ( b – a )2 = ( x – a )dx = f ( a )( b – a )+ 2 b– a b– a = (b – a )

140

f ( b )+ f ( a ) 2



b

3. INTEGRACIÓN NUMÉRICA

ò P ( x )dx = ò

Integración numérica expresión que recibe el nombre de regla trapezoidal, ya que equivale a aproximar el área bajo f por el área del trapecio que se forma con los puntos ( a , f ( a )) y ( b , f ( b )) (ver figura 3). Nótese que también equivale a sustituir f por la constante [ f ( a )+ f ( b )] / 2.

f(b)

(f(a)+f(b))/2

f(a) 0

Figura 3.

a

b x

Veamos qué error se comete. Si recordamos, se tenía f ( x ) – P1( x ) =

f ''( x ( x )) ( x – a )( x – b ) 2!

f – òa P1 = òa

f ''( x ( x )) ( x – a )( x – b ) dx 2

e, integrando,

ò

b

a

b

b

y, aplicando el teorema de valor medio del cálculo integral, existirá un d Î ( a , b) tal que

ò

b

a

f – òa P1 = b

b

ù f ''( d) b f ''( d)é x 3 x2 ( x – a )( x – b ) dx = – ( a + b ) + abxú = ò ê a 2 2 ë3 2 ûa

=

f ''( d)é b 3 b2 a3 a2 ù ê – ( a + b ) + ab ( b – a ) – + ( a + b ) ú= 2 ë3 2 3 2û

=

f ''( d) 2b 3 – 3ab 2 – 3b 3 + 6ab 2 – 6a 2b – 2a 3 + 3a 3 + 3a 2b = 2 6 f ''( d) a 3 – 3a 2b + 3ab 2 – b 3 ( b – a )3 =– f ''( d ) 2 6 12

=

4.2. Regla del trapecio con segmentos múltiples Como acabamos de ver, el error que se comente con la regla del trapecio es proporcional al cubo de la longitud del intervalo sobre el que se aplica, por lo que, si el intervalo es grande, no dará buenos resultados. Ahora bien, si se conoce el valor de la función en n+1puntos en el intervalo de integración ( x0 = a < x1 <...< xn = b ) podemos aplicar la regla del trapecio a cada uno de los intervalos correspondientes n

I = òa f ( x )dx = åòx b

i=1

xi i –1

n

f ( x )dx åòx P1( x )dx i=1

xi

i –1

con lo que se obtiene n

I

å( xi – xi–1 ) i=1


f ( xi–1 )+ f ( xi ) 2 141


142


Note la similitud entre esta expresión y las sumas utilizadas para definir la integral de Riemman. Lo que se hace es sustituir los valores (desconocidos) máximo y mínimo de f por el promedio de los valores en los extremos (conocidos). En la práctica suele ocurrir que los puntos están igualmente espaciados ( xi – xi–1 = h = ( b – a ) / n ) con lo que (ver apéndice) para un d Î ( a , b).

( b – a )5 ( iu) 1 5 ( iu) h f (d )= – f (d ) 90 2880

x0

f '''( x ( x )) ( x – x0 )( x – x1 )( x – x2 )dx

f ( a )+ f ( b )+ 2å f ( a + i ( b – a ) / n ) n–1

x2

i=1

donde h = xi – xi–1 = ( b – a ) / 2. El error que se comete es 2

f ( a )+ 4 f ( x )+ f ( b ) h 1 = [ f ( x0 )+ 4 f ( x1 )+ f ( x2 )] 6 3

ò P ( x )dx = ( b – a ) a

= (b – a )

ò

i=1

æ f ( x )+ f ( x ) n–1 ö f ( xi–1 )+ f ( xi ) 0 n ç = hç + å f ( xi )÷ ÷= 2 2 è ø i=1

que, usando el desarrollo de Taylor en torno al punto x1, es igual a

hå

–

n

I

2

b

Gráficamente, el método es equivalente a sustituir la función f por una poligonal que pase por los puntos conocidos de f (ver figura 2). El error que se comete es la suma de los errores que se cometen en cada intervalo Habitualmente x0 = a, x2 = b y x1 = ( a + b ) / 2 y, en este caso, se tiene

( x – x1 )( x – x2 ) ( x – x0 )( x – x2 ) ( x – x0 )( x – x1 ) + f ( x + f ( x 1) 2) ( x0 – x1 )( x0 – x2 ) ( x2 – x0 )( x2 – x1 ) ( x1 – x0 )( x1 – x2 ) n

h3 ( b – a )3 f ''( di ) = – å å f ''( di ) 12 i=1 12n 3 i=1

P2 ( x ) = f ( x0 )

n

donde P2 viene dado por

ETotal = –

donde di Î [xi–1, xi]. Si la segunda derivada está acotada

ò

a b

f ( x )dx òa P2 ( x )dx f ''( x ) £ C b

La técnica consiste en aproximar la función a integrar por un polinomio de interpolación cuadrático, para lo que necesitaremos conocer el valor de la función entres puntos x0, x1 y x2 entonces

( b – a )3 C 12n 2

4.3. Regla de Simpson 1/3 simple

ETotal £ que tiende a cero si n ® ¥.

que tiende a cero si n ® ¥. ETotal £

( b – a )3 C 12n 2

4.3. Regla de Simpson 1/3 simple

La técnica consiste en aproximar la función a integrar por un polinomio de interpolación cuadrático, para lo que necesitaremos conocer el valor de la función entres puntos x0, x1 y x2 entonces

b

a

f ( x )dx òa P2 ( x )dx f ''( x ) £ C

ò

b

donde di Î [xi–1, xi]. Si la segunda derivada está acotada

donde P2 viene dado por

h3 ( b – a )3 å f ''( di ) = – 12n 3 å f ''( di ) 12 i=1 i=1

( x – x1 )( x – x2 ) ( x – x0 )( x – x2 ) ( x – x0 )( x – x1 ) + f ( x1 ) + f ( x2 ) ( x0 – x1 )( x0 – x2 ) ( x1 – x0 )( x1 – x2 ) ( x2 – x0 )( x2 – x1 ) ETotal = –

n

P2 ( x ) = f ( x0 )

n

Gráficamente, el método es equivalente a sustituir la función f por una poligonal que pase por los puntos conocidos de f (ver figura 2). El error que se comete es la suma de los errores que se cometen en cada intervalo Habitualmente x0 = a, x2 = b y x1 = ( a + b ) / 2 y, en este caso, se tiene

f ( a )+ 4 f ( x1 )+ f ( b ) h = [ f ( x0 )+ 4 f ( x1 )+ f ( x2 )] 6 3 2

donde h = xi – xi–1 = ( b – a ) / 2. El error que se comete es i=1

f ( a + i( b – a ) / n )

f '''( x ( x )) ( x – x0 )( x – x1 )( x – x2 )dx n–1

i– 1

( b – a )5 ( iu) 1 5 ( iu) h f (d )= – f (d ) 90 2880

n

æ f ( x )+ f ( x ) ö f ( x )+ f ( x ) i 0 n ç ÷= = hç + å f ( xi )÷ 2 2 è ø i=1

que, usando el desarrollo de Taylor en torno al punto x1, es igual a

i=1

x2

x0

f ( a )+ f ( b )+ 2å

ò

hå

2

I

b

a

= (b – a )

ò P ( x )dx = ( b – a )

n–1

Note la similitud entre esta expresión y las sumas utilizadas para definir la integral de Riemman. Lo que se hace es sustituir los valores (desconocidos) máximo y mínimo de f por el promedio de los valores en los extremos (conocidos). En la práctica suele ocurrir que los puntos están igualmente espaciados ( xi – xi–1 = h = ( b – a ) / n ) con lo que –

(ver apéndice) para un d Î ( a , b).



142


4.4. Regla de Simpson 1/3 con segmentos múltiples Como acabamos de ver, el error que se comete con la regla de Simpson 1/3 es proporcional a la potencia quinta de la longitud del intervalo sobre el que se aplica, por lo que, si el intervalo es grande, no dará buenos resultados. Ahora bien, si se conoce el valor de la función en n+1 puntos en el intervalo de integración ( x0 = a < x1 <...< xn = b ) y n es par (disponemos de un número impar de datos), podemos aplicar la regla de Simpson a cada uno de los intervalos [x2i– 2 , x2i] para i = 1,2..., n / 2 n/ 2

I = òa f ( x )dx = åòx b

x2 i

i=1

2i – 2

n/ 2

f ( x )dx åòx i=1

x2 i 2i – 2

P2 ( x )dx

con lo que, si los puntos están igualmente espaciados ( h = xi – xi–1 ), se obtiene I

n 2– 2 n/ 2 n/ 2 ù h xn – x0é [ ] 4 2 ( ) + ( ) + ( ) = ( ) + f x f x f x f x f ( x2i )+ 4 å f ( x2i–1 )+ f ( xn )ú ê å å 2 i– 2 2 i– 1 2i 0 3 i=1 3n ë û i=1 i=1

El error total se puede obtener mediante n/ 2

ETotal = –

n/ 2

( b – a )5 1 5 h å f ( iu) ( di ) = – å f (iu) ( di ) 90 i=1 90n 5 i=1

donde di Î [x2i– 2 , x2i]. Si la derivada cuarta está acotada f ( iu) ( x ) £ C entonces ETotal £

( b – a )5 C 180n 4

que tiende a cero si n ® ¥. Aunque las derivadas no son comparables, si la cotas son similares, la regla de Simpson 1/3 es más precisa que la regla del trapecio, aunque tiene el inconveniente de que se necesita un número impar de puntos (mientras que la del trapecio se puede usar para cualquier número de puntos).

4.5. Regla de Simpson 3/8 simple La técnica consiste en aproximar la función a integrar por un polinomio de interpolación de grado 3, para lo que necesitaremos conocer el valor de la función en 4 puntos x0, x1, x2 y x3

ò

b

a

f ( x )dx òa P3 ( x )dx b

donde P3 viene dado por la expresión general de los polinomios de Lagrange (ver sección 2). Suponiendo que los puntos están igualmente espaciados, es decir x0 = a, x3 = b, x1 = a + h y x2 = a + 2h, donde h = xi – xi–1 = ( b – a ) / 3, en este caso se obtiene 3h ò P ( x )dx = 8 [ f ( x b

a

3

0

)+ 3 f ( x1 )+ 3 f ( x2 )+ f ( x3 )]

de donde le viene el número del nombre (Regla de Simpson 3/8). El error que se comete es igual a –

( b – a )5 ( iu) 3 5 ( iu) h f (d )= – f (d ) 80 6480

para un d Î ( a , b ). Puede observarse que la regla de Simpson 3/8 simple es algo más precisa (6480/2880) que la 1/3, sin embargo, tiene el inconveniente de necesitar un punto más.


143


144


4.6. Regla de Simpson 3/8 con segmentos múltiples ETotal = –

3 5 ( iu) 1 5 h f ( d1 ) – h 80 90

i=3

åf

( d1 )

Como acabamos de ver, el error que se comete con la regla de Simpson 1/3 es proporcional a la potencia quinta de la longitud del intervalo sobre el que se aplica, por lo que, si el intervalo es grande, no dará buenos resultados. Ahora bien, si se conoce el valor de la función en n+1 puntos en el intervalo de integración ( x0 = a < x1 <...< xn = b ) y n es múltiplo de tres, podemos aplicar la regla de Simpson a cada uno de los intervalos [x3i– 3 , x3i] para i = 1, 2..., n / 3 ( iu)

( n+1)/ 2

y el error será

3h h [ f ( x0 )+ 3 f ( x1 )+ 3 f ( x2 )+ f ( x3 )]+ 8 3 n/ 3

f ( x ) dx åòx P3 ( x ) dx x3 i

3

n

x3 i

i=3

å[ f ( x

2 i– 3

)+ 4 f ( x2i– 2 )+ f ( x2i–1 )]

( n+1)/ 2

b

I

n/ 3

I = òa f ( x ) dx = åòx

En general, si tenemos un número par de puntos (n impar mayor que 4), podemos optar por aplicar la regla de Simpson 3/8 sobre el intervalo [x0 , x3] (usando x1 y x2) y aplicar la regla 1/3 al resto de los intervalos ( x ..., x ), ya que queda un número impar de puntos ( n – 2 ) mediante i=1

3i –3

3i –3

i=1

con lo que, si los puntos están igualmente espaciados ( h = xi – xi–1 ), se obtiene

n/ 3

3h å[ f ( x3i– 3 )+ 3 f ( x3i– 2 )+ 3 f ( x3i–1 )+ f ( x3i )] = 8 i=1

4.7. Regla de Simpson para un número par de puntos

I

n 3– 3 n/ 3 n/ 3 ù xn – x0é ê f ( x0 )+ 2 å f ( x3i )+ 3å f ( x3i– 2 )+ 3å f ( x3i–1 )+ f ( xn )ú 3n ë û i=1 i=1 i=1

que tiende a cero si n ® ¥. Note que, aunque la regla de Simpson 3/8 simple es más precisa que la 1/3, al aplicarse sobre intervalos mayores, la regla de Simpson 3/8 en segmentos múltiples es peor que la regla 1/3 si tomamos el mismo número de puntos en ambas. Sí sería mejor si se toman los mismos intervalos de integración (es decir, un punto más en cada intervalo). Sin embargo, cuando n sea impar y múltiplo de 3 (3, 9, 15...), podemos usarla en lugar de la regla 1/3. =

El error total se puede obtener mediante

( b – a )5 C 80n 4

n/ 3

n/ 3

3 5 3( b – a )5 h å f ( iu) ( di ) = – å f (iu) ( di ) 80 i=1 80n 5 i=1 ETotal £

entonces

ETotal = –

donde di Î [x3i– 3 , x3i]. Si la derivada cuarta está acotada f ( iu) ( x ) £ C

f ( iu) ( x ) £ C donde di Î [x3i– 3 , x3i]. Si la derivada cuarta está acotada

3 3( b – a )5 h 5 å f ( iu) ( di ) = – å f (iu) ( di ) 80 i=1 80n 5 i=1 ( b – a )5 C 80n 4

n/ 3

ETotal £

ETotal = –

entonces n/ 3

El error total se puede obtener mediante

que tiende a cero si n ® ¥. Note que, aunque la regla de Simpson 3/8 simple es más precisa que la 1/3, al aplicarse sobre intervalos mayores, la regla de Simpson 3/8 en segmentos múltiples es peor que la regla 1/3 si tomamos el mismo número de puntos en ambas. Sí sería mejor si se toman los mismos intervalos de integración (es decir, un punto más en cada intervalo). Sin embargo, cuando n sea impar y múltiplo de 3 (3, 9, 15...), podemos usarla en lugar de la regla 1/3. =

ù xn – x0é ê f ( x0 )+ 2 å f ( x3i )+ 3å f ( x3i– 2 )+ 3å f ( x3i–1 )+ f ( xn )ú 3n ë û i=1 i=1 i=1 n/ 3

n 3– 3

n/ 3

i=1

I

3h å[ f ( x3i– 3 )+ 3 f ( x3i– 2 )+ 3 f ( x3i–1 )+ f ( x3i )] = 8

4.7. Regla de Simpson para un número par de puntos

n/ 3

En general, si tenemos un número par de puntos (n impar mayor que 4), podemos optar por aplicar la regla de Simpson 3/8 sobre el intervalo [x0 , x3] (usando x1 y x2) y aplicar la regla 1/3 al resto de los intervalos ( x3..., xn ), ya que queda un número impar de puntos ( n – 2 ) mediante con lo que, si los puntos están igualmente espaciados ( h = xi – xi–1 ), se obtiene i=1

3i –3

( n+1)/ 2

å[ f ( x

n/ 3

x3 i

3i –3

x3 i

3h [ f ( x0 )+ 3 f ( x1 )+ 3 f ( x2 )+ f ( x3 )]+ h 8 3

b

i=1

f ( x ) dx åòx P3 ( x ) dx n/ 3

I = òa f ( x ) dx = åòx

I

2 i– 3

)+ 4 f ( x2i– 2 )+ f ( x2i–1 )]

Como acabamos de ver, el error que se comete con la regla de Simpson 1/3 es proporcional a la potencia quinta de la longitud del intervalo sobre el que se aplica, por lo que, si el intervalo es grande, no dará buenos resultados. Ahora bien, si se conoce el valor de la función en n+1 puntos en el intervalo de integración ( x0 = a < x1 <...< xn = b ) y n es múltiplo de tres, podemos aplicar la regla de Simpson a cada uno de los intervalos [x3i– 3 , x3i] para i = 1, 2..., n / 3 i=3

y el error será

3 1 5 ETotal = – h 5 f ( iu) ( d1 ) – h 80 90

( n+1)/ 2

åf

( iu)

( d1 )

i=3

4.6. Regla de Simpson 3/8 con segmentos múltiples CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


144


5. INTEGRACIÓN ROMBERG Veamos un método diferente a los anteriores, ya que no utiliza ningún polinomio de interpolación para aproximar f . El método partirá de un valor aproximado de la integral de f (que puede obtenerse por cualquiera de los métodos anteriores), para conseguir paso a paso mejores aproximaciones de ésta. Como veremos, el método sólo será aplicable a funciones conocidas (fácilmente calculables) o de las que se disponen gran cantidad de puntos. En primer lugar veremos el método de extrapolación de Richardson, en el que se basa la Regla de Romberg.

5.1. Método de extrapolación de Richardson Como hemos visto en los apartados anteriores, cualquier método de integración sigue el modelo I = òa f = I ( h )+ E ( h ) b

donde I ( h ) es el valor aproximado de la integral, E ( h ) es el error que se comete y h es la distancia entre los puntos utilizados (o “paso”). Si tomamos dos valores diferentes de h, tendremos I = I ( h1 )+ E ( h1 ) = I ( h2 )+ E ( h2 )

(1)

Si, por ejemplo, usamos la regla trapezoidal, los errores vendrán dados por E (hj ) –

b– a 2 h C , j = 1,2 12 j

donde f ''( x ) C. De esta forma, E ( h2 )

h 22 h 21

E ( h1 )

que junto con (1) da E ( h1 ) –

h 22 h 21

E ( h1 ) = I ( h2 ) – I ( h1 ) E ( h1 ) =

I ( h2 ) – I ( h1 ) 1 – ( h2 / h1 )2

y se tiene I ( h2 ) – I ( h1 ) 1 – ( h2 / h1 )2

I

I ( h1 )+

I

1 –( h2 / h1 )2 I ( h2 ) 2 I ( h1 )+ 1 – ( h2 / h1 ) 1 – ( h2 / h1 )2

I

h22 h12 I ( h2 ) 2 I ( h1 )+ 2 h – h1 h1 – h22 2 2

que es una mejor aproximación del valor de la integral, ya que el error que se comete es E= I –

h22 h12 I ( h2 ) 2 2 I ( h1 ) – h – h1 h1 – h22


2 2

145


146


y como

donde j denota el número de subintervalos ( h j = h / 2 j–1 ) y k la etapa de aplicación de la regla de extrapolación. Puede demostrarse que I j,k tiende hacia el verdadero valor de I tanto si j ® ¥como si k ® ¥(para h < 1). Además, el error de la etapa k será de orden O ( h 2k ). I = [E ( h1 )+ I ( h1 )]

h2 – h2 2 + [E ( h2 )+ I ( h2 )] 2 1 2 h22 – h12 h2 – h1

4 k –1 – 1 4 k –1I j+1,k –1 – I j,k –1

Entonces

E=

I j,k

– h12 h22 ( E h E ( h2 ) 1 )+ 2 h22 – h12 h2 – h12

y el error sería O ( h 6 ). De nuevo, si tenemos dos aproximaciones podemos volver a aplicar el método, etc. En general, la ley de recurrencia que permite pasar de una etapa a otra que se obtiene de (2) es – h22 h22 ( E h E ( h1 ) = 0 1 )+ 2 h22 – h12 h2 – h12

16I ( h2 ) – I ( h1 ) 15

I

El método así generado tendría un errorO ( h 4 ). El proceso se puede repetir con h2 = h / 2 y h3 = h / 4, etc. Además, si ya tenemos dos aproximaciones obtenidas por este método (por ejemplo las obtenidas con h y h / 2y con h / 2y h / 4) de orden O ( h 4 ) se puede obtener una nueva aproximación (a partir de (2)), mediante

Evidentemente, el error final nunca es cero, pero sí se consigue aumentar su orden de convergencia cero que es o(E ( h1 )) y o(E ( h2 )). En general, si aplicamos este método a dos reglas que nos den errores E ( h1 ) y E ( h2 ), la mejor aproximación será I ( h2 ) – I ( h1 ) I I ( h1 )+ 1 – E ( h2 ) / E ( h1 )

h12 / 4 h12 I ( h2 ) 2 I ( h1 )+ 2 h / 4 – h1 h1 – h12 / 4

I

4 I ( h2 ) – I ( h1 ) 3

(2)

E ( h2 ) E ( h1 ) I ( h )+ I (h ) E ( h2 ) – E ( h1 ) 1 E ( h1 ) – E ( h2 ) 2 2 1

I

I

El método consiste en aplicar de forma reiterada el método de extrapolación tomando como longitud de los intervalos h, h / 2, h / 4, etc. Si h2 = h1 / 2, se tiene

5.2. Método de Romberg

5.2. Método de Romberg

El método consiste en aplicar de forma reiterada el método de extrapolación tomando como longitud de los intervalos h, h / 2, h / 4, etc. Si h2 = h1 / 2, se tiene I

h2 / 4 h2 1 I ( h1 )+ 2 1 2 I ( h2 ) h12 / 4 – h12 h1 – h1 / 4 4 I ( h2 ) – I ( h1 ) 3

I ( h2 ) – I ( h1 ) 1 – E ( h2 ) / E ( h1 )

(2)

E ( h2 ) E ( h1 ) I ( h1 )+ I (h ) E ( h2 ) – E ( h1 ) E ( h1 ) – E ( h2 ) 2

I ( h1 )+

I

I I

El método así generado tendría un errorO ( h 4 ). El proceso se puede repetir con h2 = h / 2 y h3 = h / 4, etc. Además, si ya tenemos dos aproximaciones obtenidas por este método (por ejemplo las obtenidas con h y h / 2y con h / 2y h / 4) de orden O ( h 4 ) se puede obtener una nueva aproximación (a partir de (2)), mediante

Evidentemente, el error final nunca es cero, pero sí se consigue aumentar su orden de convergencia cero que es o(E ( h1 )) y o(E ( h2 )). En general, si aplicamos este método a dos reglas que nos den errores E ( h1 ) y E ( h2 ), la mejor aproximación será – h22 h22 E ( h1 ) = 0 2 E ( h1 )+ 2 h – h1 h2 – h12

2 2

I

16I ( h2 ) – I ( h1 ) 15

y el error sería O ( h 6 ). De nuevo, si tenemos dos aproximaciones podemos volver a aplicar el método, etc. En general, la ley de recurrencia que permite pasar de una etapa a otra que se obtiene de (2) es – h12 h22 ( ) E h + E ( h2 ) 1 h22 – h12 h22 – h12 I j,k

E=

4 k –1I j+1,k –1 – I j,k –1

Entonces

4 k –1 – 1

h22 – h12 [ ] + E ( h ) + I ( h ) 2 2 h22 – h12 h22 – h12

donde j denota el número de subintervalos ( h j = h / 2 j–1 ) y k la etapa de aplicación de la regla de extrapolación. Puede demostrarse que I j,k tiende hacia el verdadero valor de I tanto si j ® ¥como si k ® ¥(para h < 1). Además, el error de la etapa k será de orden O ( h 2k ). I = [E ( h1 )+ I ( h1 )]

y como

146



Integración numérica Los valores obtenidos por este método se suelen poner en forma de tabla triangular mediante: I11, I1,2 I 2,1

I1,3

...

...

... I1,n

I 2 ,2 I 3,1 ...

...

Solución final

I n– 2,1 I n – 2 ,2 I n– 2,3 ...

I n–11, I n–1,2 I n,1

Ejemplo. Si para calcular la integral de la función f ( x ) = 0,2+ 25x – 200x 2 + 675x 3 – 900x 4 + 400x 5 en el intervalo [0, 0.8], aplicamos la regla trapezoidal f ( a )+ 2å f ( xi )+ f ( b ) n–1

I = (b – a )

i=1

2n

(n es el número de intervalos) se obtienen I11, = 0,172 ( un intervalo , h = 0,8 ) I 2,1 = 1,0688 (dos intervalos , h2 = h / 2 ) I 3,1 = 1,4848 (cuatro intervalos , h3 = h / 4 ) I 4,1 = 1,6008 (ocho intervalos , h4 = h / 8 ) Con estos valores (primera etapa), usando I

4I (h / 2) – I (h ) 3

podemos calcular los valores para la segunda etapa (columna), 4 I 2,1 – I11, = 1,6234 3 4 I 3,1 – I 2,1 = 1,6394 I 2 ,2 = 3 4 I 4,1 – I 3,1 I 3 ,2 = = 1,6405 3 I1,2 =

en la siguiente etapa se obtienen I1,3 =

16I 2,2 – I1,2 = 1,64053333 15

I 2 ,3 =

16I 2,2 – I 2,2 = 1,64053333 15


147


148


1 1 1 u f ''( x1 )( x – x1 )2 + f '''( x1 )( x – x1 )3 + f ' ( x1 )( x – x1 )4+... 2 6 24 I1,4 =

f ( x ) = f ( x1 )+ f '( x1 )( x – x1 )+

y la solución final es

64 I 2,3 – I1,3 = 1,64053333 63

Usando el desarrollo de Taylor para f en torno al punto x1,

(en la computación se usan más decimales de los que mostramos aquí). Note cómo la estabilidad numérica nos indica cuándo debemos detener el método. Demostración.

para h = xi – xi–1, a = x0, b = x2 y un d Î ( a , b). a b

f ( x )dx –

h [ f ( x0 )+ 4 f ( x1 )+ f ( x2 )] = – 1 h 5 f ( iu) ( d ) 3 90

Los contenidos de esta sección no son, a nuestro juicio, indispensables.

ò

6. APÉNDICE (4)

El error que se comete en la regla de Simpson 1/3 es Proposición 5.

Proposición 6.

Si x0 , x1... xk son puntos distintos en el intervalo [ a , b ] , f ( x0 )..., f ( xk ) son conocidos, Pk ( x ) es el polinomio de interpolación de grado k y f Î C k+1[ a , b ] , entonces, para cada x Î [ a , b ] existe un valor x( x ) Î ( a , b) tal que y, como se anula en x( x ), tenemos (3).

1 1 ... ( k + 1)! x – x1 x – xk

(3)

g ( k+1) ( t ) = f ( k+1) ( t ) – Pk( k+1) ( t ) – [ f ( x ) – Pk ( x )]

d k+1 t – x1 t – xk = ... dt ( k+1) x – x1 x – xk

Demostración:

f ( k+1) ( x ( x )) ( x – x0 )...( x – xk ) ( n + 1)!

= f ( k+1) ( t ) – [ f ( x ) – Pk ( x )]

f ( x ) = Pk ( x )+

Para cada x Î [ a , b ] distinto de x0 , x1... xk definimos la función

Como f Î C k+1[ a , b ] y Pk es un polinomio, entonces g Î C k+1[ a , b ]. Además, g ( x )= 0 y g ( xi )= 0 para todo i, es decir, se anula en k + 2 puntos. Utilizando el teorema de Rolle generalizado, existe un punto x( x ) donde g ( k+1) se anula. Derivando se tiene g ( t ) = f ( t ) – Pk ( t ) – [ f ( x ) – Pk ( x )]

t – x1 t – xk ... x – x1 x – xk

g ( t ) = f ( t ) – Pk ( t ) – [ f ( x ) – Pk ( x )]

t – x1 t – xk ... x – x1 x – xk

Como f Î C k+1[ a , b ] y Pk es un polinomio, entonces g Î C k+1[ a , b ]. Además, g ( x )= 0 y g ( xi )= 0 para todo i, es decir, se anula en k + 2 puntos. Utilizando el teorema de Rolle generalizado, existe un punto x( x ) donde g ( k+1) se anula. Derivando se tiene Para cada x Î [ a , b ] distinto de x0 , x1... xk definimos la función d k+1 t – x1 t – xk = ... dt ( k+1) x – x1 x – xk

f ( x ) = Pk ( x )+

f ( k+1) ( x ( x )) ( x – x0 )...( x – xk ) ( n + 1)!

(3)

= f ( k+1) ( t ) – [ f ( x ) – Pk ( x )]

Demostración:

g ( k+1) ( t ) = f ( k+1) ( t ) – Pk( k+1) ( t ) – [ f ( x ) – Pk ( x )]

1 1 ... ( k + 1)! x – x1 x – xk

Si x0 , x1... xk son puntos distintos en el intervalo [ a , b ] , f ( x0 )..., f ( xk ) son conocidos, Pk ( x ) es el polinomio de interpolación de grado k y f Î C k+1[ a , b ] , entonces, para cada x Î [ a , b ] existe un valor x( x ) Î ( a , b) tal que y, como se anula en x( x ), tenemos (3). Proposición 6.

Proposición 5.

El error que se comete en la regla de Simpson 1/3 es f ( x )dx –

h [ f ( x0 )+ 4 f ( x1 )+ f ( x2 )] = – 1 h 5 f ( iu) ( d ) 3 90

(4)

6. APÉNDICE

b

a

Los contenidos de esta sección no son, a nuestro juicio, indispensables.

ò

para h = xi – xi–1, a = x0, b = x2 y un d Î ( a , b). (en la computación se usan más decimales de los que mostramos aquí). Note cómo la estabilidad numérica nos indica cuándo debemos detener el método. Demostración.

Usando el desarrollo de Taylor para f en torno al punto x1, 64 I – I1,3 = 1,64053333 63 2 ,3

1 1 1 u f ''( x1 )( x – x1 )2 + f '''( x1 )( x – x1 )3 + f ' ( x1 )( x – x1 )4+... 2 6 24

y la solución final es



148

I1,4 =

f ( x ) = f ( x1 )+ f '( x1 )( x – x1 )+

Integración numérica e integrando, se tiene I = òa f ( x )dx = f ( x1 )2h + b

= 2hf ( x1 )+

1 1 u f ''( x1 )2h 3 + f ' ( x1 )2h 5 / 5+...= 6 24

1 1 u f ''( x1 )h 3 + f ' ( x1 )h 5+... 3 60

Por otro lado, la aproximación de I usando Simpson es I (h )=

h [ f ( x0 )+ 4 f ( x1 )+ f ( x2 )] = 3

hé 1 1 1 u = ê f ( x1 ) – f '( x1 )h + f ''( x1 )h 2 – f '''( x1 )h 3 + f ' ( x1 )h 4+...+4 f ( x1 )+ 3ë 2 6 24 + f ( x1 )+ f '( x1 )h +

ù 1 1 1 u f ''( x1 )h 2 + f '''( x1 )h 3 + f ' ( x1 )h 4+...ú= û 2 6 24

= 2hf ( x1 )+

1 1 u f ''( x1 )h 3 + f ' ( x1 )h 5+... 3 36

con lo que el error será æ1 1ö 1 u E ( h ) = I – I ( h ) = ç – ÷ f 'u ( x1 )h 5+...= – f ' ( x1 )h 5+... è 60 36 ø 90 que, por Taylor, también puede expresarse como en (4).


149

TEMA

32 Aplicación del estudio de funciones a la interpretación y resolución de problemas de la Economía, las Ciencias Sociales y la Naturaleza




152



INTRODUCCIÓN

2.

EL CONCEPTO DE VARIABLE Y DE FUNCIÓN 2.1. Funciones en Física. Algunas expresiones 2.2. Funciones en Economía. Algunas expresiones 2.3. Funciones en Ciencias Sociales. Algunas expresiones 2.4. Funciones en Ciencias Naturales. Algunas expresiones 2.5. Funciones en Psicología. Algunas expresiones

EL CONCEPTO DE VARIABLE Y DE FUNCIÓN 2.1. Funciones en Física. Algunas expresiones 2.2. Funciones en Economía. Algunas expresiones 2.3. Funciones en Ciencias Sociales. Algunas expresiones 2.4. Funciones en Ciencias Naturales. Algunas expresiones 2.5. Funciones en Psicología. Algunas expresiones

2.

INTRODUCCIÓN

1.



152

Problemas de Economía, Ciencias Sociales y Naturaleza

1. INTRODUCCIÓN Desde este tema se pretende analizar la contribución al desarrollo de la capacidad de interpretar y utilizar información presentada en una variedad de formas matemáticas y no matemáticas. En nuestro mundo, gran parte de la información acerca de los fenómenos de cambio, se presenta asociada a tablas de números, expresiones algebraicas y gráficas, y éstas en el terreno educativo son moneda de cambio en el ámbito de las Matemáticas y Ciencias de la Naturaleza y paulatinamente van cobrando importancia en el de las Ciencias Sociales como vía para la obtención de modelos matemáticos que permitan comprender la relación entre variables, sin presuponer la existencia de una relación causal. Desde esta perspectiva, las matemáticas se presentan como un poderoso lenguaje para describir, analizar y comprender aspectos de nuestro entorno económico, físico y social; y como todo lenguaje comporta el aprendizaje de unas “reglas gramaticales” que permitan la manipulación de estos símbolos. La gran diferencia es que las Matemáticas requieren, para la utilización de los símbolos, entender los conceptos subyacentes a que se refieren, lo que conlleva alcanzar una gama de destrezas, como ya nos indica el Informe Cockcroft.

2. EL CONCEPTO DE VARIABLE Y DE FUNCIÓN Descubrir y explorar modelos y funciones debe partir del análisis de situaciones realistas y relacionarlas con expresiones algebraicas que incluyen funciones lineales, recíprocas, cuadráticas y exponenciales.

2.1. Funciones en Física. Algunas expresiones –

Cinemática. El problema consiste en expresar la relación entre el espacio recorrido, S , y el tiempo invertido en ello, t. Una relación que presenta S = f ( t ) donde t es la variable independiente y S la variable dependiente. En el caso de un movimiento uniforme la relación entre las variables viene dada por la expresión: S = v0 × t donde v0, la velocidad inicial, es una constante. Si planteamos un movimiento uniformente acelerado, una mayor aproximación a la realidad, la relación entre las variables sería: 1 S = S 0 + v0 × t + a × t 2 2 en donde tanto S 0, el espacio inicial, v0, la velocidad inicial , como a, la aceleración, son factores constantes.

–

Dinámica. La expresión correspondiente al estiramiento de un muelle bajo la acción de una fuerza, entendida como causa productora de movimientos o deformaciones en los cuerpos, viene regida por la ley de Hoocke. F = k ×Dx donde k es una constante que depende de las características del muelle. La fuerza que hay que realizar para desplazar un cuerpo desde una posición de equilibrio viene dada por la expresión: F = m× g ×cos a donde g, la gravedad, la tomamos como un factor constante.


153


154


–

Trabajo y energía. La energía cinética, entendida como la generada por el movimiento de un cuerpo viene expresada por: 1 Ec = m× v2 2 donde la masa, m, es un factor constante. En la determinación del calor de cambio de estado, entendido como la energía que hay que suministrar a un cuerpo para que, a temperatura constante, varíe su estado físico viene dada (en el caso del calor de fusión) por la expresión: Q f = m× Lf donde Lf , el calor latente de fusión, es una constante ligada a la naturaleza del cuerpo.

–

Electricidad. La resistencia eléctrica de un hilo conductor viene dada por la expresión: l R= r s donde r, la resistividad, y s, la sección, son constantes. El trabajo producido por una corriente eléctrica al atravesar una resistencia viene dado por la expresión W = I 2 ×R ×t donde la resistencia y la intensidad son factores constantes.

Función de costes de una empresa. Cuando una empresa adquiere bienes o servicios necesarios para poder desarrollar su actividad productiva genera el concepto de gastos, y si estos van dirigidos a la actividad productiva se denominan costes. Para una producción eficiente la función de costes habrá de ser mínima, teniendo en cuenta los objetivos de la empresa. La función de costes de una unidad económica depende de la relación entre los factores productivos (inputs) y los productos terminados (outputs), y se expresa como: C t (Q ) = C v (Q )+ C f donde Q es la cantidad de producto obtenido (output), C t es el coste total, C v son los costes variables, en función de la cantidad de producto producido y C f son los costes fijos de producción. Podemos distinguir entre varias clases de costes: Ø Coste medio o unitario. Es el que resulta de dividir el coste de producción entre el número de unidades producidas. C t (Q ) C v (Q )+ C f C v (Q ) C f = = + = C v* + C *f Q Q Q Q C *t =

–

2.2. Funciones en Economía. Algunas expresiones

las cuales suponen el paso de las magnitudes de las variables concretas a variables generales, lo que constituye la vía de la matematización de unas expresiones particulares físicas a una expresión general de la teoría matemática que pasa de la asociación de magnitudes determinadas a variables de x e y de dos conjuntos numéricos. y = mx+ n y = px 2 + mx+ n

Como fácilmente puede observarse, la totalidad de las expresiones que hemos expuesto anteriormente pueden abstraerse a otras de tipo y = mx

Como fácilmente puede observarse, la totalidad de las expresiones que hemos expuesto anteriormente pueden abstraerse a otras de tipo y = mx y = mx+ n y = px 2 + mx+ n

Electricidad. La resistencia eléctrica de un hilo conductor viene dada por la expresión: l R= r s donde r, la resistividad, y s, la sección, son constantes. El trabajo producido por una corriente eléctrica al atravesar una resistencia viene dado por la expresión W = I 2 ×R ×t donde la resistencia y la intensidad son factores constantes.

–

Trabajo y energía. La energía cinética, entendida como la generada por el movimiento de un cuerpo viene expresada por: 1 Ec = m× v2 2 donde la masa, m, es un factor constante. En la determinación del calor de cambio de estado, entendido como la energía que hay que suministrar a un cuerpo para que, a temperatura constante, varíe su estado físico viene dada (en el caso del calor de fusión) por la expresión: Q f = m× Lf donde Lf , el calor latente de fusión, es una constante ligada a la naturaleza del cuerpo.

–

las cuales suponen el paso de las magnitudes de las variables concretas a variables generales, lo que constituye la vía de la matematización de unas expresiones particulares físicas a una expresión general de la teoría matemática que pasa de la asociación de magnitudes determinadas a variables de x e y de dos conjuntos numéricos.

2.2. Funciones en Economía. Algunas expresiones

154

Función de costes de una empresa. Cuando una empresa adquiere bienes o servicios necesarios para poder desarrollar su actividad productiva genera el concepto de gastos, y si estos van dirigidos a la actividad productiva se denominan costes. Para una producción eficiente la función de costes habrá de ser mínima, teniendo en cuenta los objetivos de la empresa. La función de costes de una unidad económica depende de la relación entre los factores productivos (inputs) y los productos terminados (outputs), y se expresa como: C t (Q ) = C v (Q )+ C f donde Q es la cantidad de producto obtenido (output), C t es el coste total, C v son los costes variables, en función de la cantidad de producto producido y C f son los costes fijos de producción. Podemos distinguir entre varias clases de costes: Ø Coste medio o unitario. Es el que resulta de dividir el coste de producción entre el número de unidades producidas. C (Q ) C v (Q )+ C f C v (Q ) C f C *t = t = = + = C v* + C *f Q Q Q Q



–


Ø

–

Coste marginal. Es la variación en el coste total ante un incremento unitario de la producción. Se expresa como: dC t C '= dQ

Oferta, demanda y punto de equilibrio. Modelo lineal. Considerando una única mercancía, utilizaremos la siguiente notación: llamaremos Qd a la cantidad demandada, Qs a la cantidad ofertada y P al precio del bien. Aceptemos la hipótesis de que se alcanza el equilibrio en el mercado cuando la cantidad demandada coincide con la cantidad ofertada. Qd es una función lineal decreciente de P (cuando P aumenta Qd disminuye), lo que podríamos expresar como: Qd = a – bP , a , b > 0 Qs es una función lineal creciente de P (cuando P disminuye, también lo hace Qs), lo que expresaremos como: Qs = – c + dP , c, d > 0 Representando gráficamente la relación entre Qs, Qd y P de modo simultáneo obtenemos la siguiente gráfica en la que únicamente se ha considerado el primer cuadrante dado que no tiene sentido, desde un punto de vista económico, la oferta o demanda negativa de cantidades de un bien. donde b es la pendiente de Qd y c es la pendiente de Qs.

Qs Qd

a Qd = –c + dP

Q = QS = Q d

(P,Q)

P1

P

QS = a – bP

P

–c

Figura 1. El par ordenado ( P ,Q ) representa el punto de equilibrio, para obtenerlo hemos de partir de la condición de equilibrio, Qd = Qs y en consecuencia podemos escribir: a+ c a – bP = – c + dP Þ a + c = P ( b + d ) Þ P = b+ d para el cálculo deQ bastará con introducir el valor antes obtenido para P en cualquiera de las expresiones de Qd o Qs, con lo que tenemos: a + c ad – bc Q = a – bP = a – b = b+ d b+ d Hemos de introducir la restricción de que ad – bc > 0 pues, como ya se ha comentado, no tiene sentido desde el punto de vista de la Economía que Q < 0.


155


156


donde A, B y k son números positivos.

Denotando, respectivamente, por D y S al conjunto de puntos de las curvas de demanda y de oferta, estos podrán escribirse como sigue: D = {( P ,Q ) / Q = a – bP} ü ï ý Þ D Ç S = ( P ,Q ) ï S = {( P ,Q ) / Q = – c + dP}þ

El crecimiento demográfico. Un tema de interés en el ámbito de las Ciencias Sociales es la estimación de la población mundial al cabo de un número determinado de años, para ello se utiliza la función: P ( t )= P0 × e lt donde t es el número de años para el que se estima la población, P0 es la población inicial y l es el crecimiento que se supone constante en el periodo. Esta función es un caso particular de la función de crecimiento exponencial, la cual es capaz de expresar, matemáticamente, los crecimientos sostenidos en un determinado tiempo. Si el crecimiento de una magnitud es exponencial y se desea que la función cumpla la condición inicial hemos de construir una función del tipo f ( 0 ) = C 0 = C 0 × a x , lo que es coherente con la expresión antes expuesta con sólo tomar a = el . Thomas Malthus en su Ensayo sobre el principio de la población (1978), propugna un crecimiento demográfico de tipo exponencial de la población frente a un crecimiento aritmético de los alimentos. Revisiones posteriores al trabajo de Malthus proponen para el crecimiento de la población un modelo logístico que vendría dado por la expresión: B 1+ A × e– kt P (t )=

Función de Cobb-Douglas. Una función de producción puede expresarse mediante la relación Q = Q ( K , L ) en donde Q representa la producción, K es el factor capital y L es el factor trabajo; y nos presenta el número de unidades producidas en una empresa teniendo en cuenta su dependencia lineal de los factores capital y trabajo. Entre las funciones de producción, una muy empleada en el análisis económico es la función de Cobb-Douglas que viene expresada como: Q = A × K a ×L1– a en donde A es una constante positiva y a es una fracción propia positiva. La expresión anterior se generaliza como: Q = A × K a ×L b

–

–

Así, encontramos que Q es una función homogénea de grado a + b, y en consecuencia, si multiplicamos cada una de sus variables independientes por una constante, el valor de la función se altera en la proporción de la constante elevada a a + b. Como tenemos que en el caso de la función de Cobb-Douglas a + b = 1, y teniendo en cuenta que Q es una función linealmente homogénea, entonces por derivación parcial obtendremos las funciones denominadas, respectivamente, productividad marginal del trabajo y productividad marginal del capital.

2.3. Funciones en Ciencias Sociales. Algunas expresiones æK ö dQ = AK a (1 – a )L– a = A (1 – a )ç ÷ èLø dL a –1

æK ö dQ = AaK a –1L–( a –1) = Aaç ÷ èLø dK

a

a

æK ö dQ = AaK a –1L–( a –1) = Aaç ÷ èLø dK

a –1

æK ö dQ = AK a (1 – a )L– a = A (1 – a )ç ÷ èLø dL

Así, encontramos que Q es una función homogénea de grado a + b, y en consecuencia, si multiplicamos cada una de sus variables independientes por una constante, el valor de la función se altera en la proporción de la constante elevada a a + b. Como tenemos que en el caso de la función de Cobb-Douglas a + b = 1, y teniendo en cuenta que Q es una función linealmente homogénea, entonces por derivación parcial obtendremos las funciones denominadas, respectivamente, productividad marginal del trabajo y productividad marginal del capital.

2.3. Funciones en Ciencias Sociales. Algunas expresiones

El crecimiento demográfico. Un tema de interés en el ámbito de las Ciencias Sociales es la estimación de la población mundial al cabo de un número determinado de años, para ello se utiliza la función: P ( t )= P0 × e lt donde t es el número de años para el que se estima la población, P0 es la población inicial y l es el crecimiento que se supone constante en el periodo. Esta función es un caso particular de la función de crecimiento exponencial, la cual es capaz de expresar, matemáticamente, los crecimientos sostenidos en un determinado tiempo. Si el crecimiento de una magnitud es exponencial y se desea que la función cumpla la condición inicial hemos de construir una función del tipo f ( 0 ) = C 0 = C 0 × a x , lo que es coherente con la expresión antes expuesta con sólo tomar a = el . Thomas Malthus en su Ensayo sobre el principio de la población (1978), propugna un crecimiento demográfico de tipo exponencial de la población frente a un crecimiento aritmético de los alimentos. Revisiones posteriores al trabajo de Malthus proponen para el crecimiento de la población un modelo logístico que vendría dado por la expresión: B P (t )= 1+ A × e– kt donde A, B y k son números positivos.

–

–

Función de Cobb-Douglas. Una función de producción puede expresarse mediante la relación Q = Q ( K , L ) en donde Q representa la producción, K es el factor capital y L es el factor trabajo; y nos presenta el número de unidades producidas en una empresa teniendo en cuenta su dependencia lineal de los factores capital y trabajo. Entre las funciones de producción, una muy empleada en el análisis económico es la función de Cobb-Douglas que viene expresada como: Q = A × K a ×L1– a en donde A es una constante positiva y a es una fracción propia positiva. La expresión anterior se generaliza como: Q = A × K a ×L b D = {( P ,Q ) / Q = a – bP} ü ï ý Þ D Ç S = ( P ,Q ) ï S = {( P ,Q ) / Q = – c + dP}þ

Denotando, respectivamente, por D y S al conjunto de puntos de las curvas de demanda y de oferta, estos podrán escribirse como sigue:



156


–

Escala de Richter. Los movimientos sísmicos han interesado e inquietado al hombre desde el comienzo de los tiempos y, en consecuencia, ha intentado encontrar una escala que permitiese su clasificación. Entre otras, la más conocida es la escala de Ritcher que viene representada por una función logarítmica de base decimal; en ella la magnitud de un terremoto viene dada por la expresión: M = log 10 P donde M es la magnitud del terremoto y P indica cuántas veces ha sido mayor la amplitud de la onda sísmica producida por el terremoto, en comparación con la onda de referencia correspondiente a una situación asísmica. La estructura de la expresión implica que para que un terremoto aumente en una unidad en la escala, P debe aumentar en diez veces (es decir, la potencia de un terremoto de grado 4 en la escala de Richter es diez veces mayor que la potencia de un terremoto de grado 3 en la misma escala).

2.4. Funciones en Ciencias Naturales. Algunas expresiones –

Ley de la gravitación universal. Isaac Newton planteó que la fuerza con que se atraen dos cuerpos es directamente proporcional al producto de sus masas e inversamente proporcional al cuadrado de la distancia entre sus centros, expresándolo como: m ×m F =G 1 2 2 d Fue el físico inglés Henry Cavendish quien ideó un dispositivo para la determinación experimental de la constante G, para lo que utilizó lo que se conoce con el nombre de balanza de Cavendish o balanza de torsión.

–

La tercera ley de Kepler. Establece la razón entre el cuadrado del periodo de revolución de un planeta alrededor del sol y æT 2 ö el cubo del semieje mayor de su órbitaç ç 3 = cte.÷ ÷, lo que es una constante para todos los planeèR ø tas. Esto nos indica que la velocidad de planetas alejados del sol es menor que la de los próximos al mismo y, en consecuencia, en una misma órbita no puede haber dos planetas moviéndose a velocidades diferentes. La tercera ley de Kepler es coherente con la ley de gravitación universal, lo que nos permite determinar un valor constante válido para nuestro sistema solar. ü M s ×M p 2 Fg = G ï 2 ï M s ×M p æ 2p ö 4 p 2R 3 T 2 4p 2 R ýG = M pç ÷ × R Þ M s = Þ 3= 2 2 2 æ 2p ö èT ø GT R GM s R Fc = M p × ac = M pç ÷ × Rï ï èT ø þ

–

Temperatura en la superficie de las estrellas. La emisión de espectros continuos por parte de los cuerpos incandescentes es un fenómeno conocido desde la segunda mitad del siglo XIX, así como el desarrollo de la espectroscopía puso de manifiesto la relación existente entre el color de la luz emitida por un cuerpo incandescente y la temperatura a la que se encuentra el mismo, lo que es equivalente a decir que el análisis del espectro proporciona una buena aproximación a la magnitud de la energía correspondiente a cada color, a su longitud de onda, teniendo en cuenta que la energía asociada a cada longitud de onda depende de la temperatura y no de la naturaleza química del cuerpo emisor. La longitud de onda se estructura en una primera aproximación en tres zonas correspondiente a ultravioleta (las longitudes de onda más bajas), luz visible e infrarroja (las longitudes de onda más altas) y enfrentándola a la intensidad de la radiación aparece una curva que presenta un máximo que de caer dentro de la zona visible dependiendo de su colocación dará lugar a que nuestro ojo perciba un color u otro. Al aumentar la temperatura el pico se desplaza hacia la izquierda


157


158


(disminución de la longitud de onda), mientras que si la temperatura disminuye el pico se desplaza hacia la derecha (aumento de la longitud de onda). Fue en 1893 cuando Wilheim Wien enunció la ley del desplazamiento o ley de Wien que, considerando la longitud de onda en centímetros y la temperatura en grados Kelvin presenta la siguiente relación: l m ×T = 0,2897 Analizando el espectro solar se encontró que la longitud de onda más energética corresponde a 5,5×10–5 cm, que corresponde al color verde, y en consecuencia, la temperatura en la superficie solar se estima como: 0,2897 T= = 5267,27 K 5,5×10–5

lo que nos indica que cuando la magnitud de dos estrellas se diferencia en una unidad, una es aproximadamente 2,512 veces más brillante que la otra. Se hace necesario objetivar esta clasificación que se ha realizado en base a apreciaciones subjetivas, así llegamos al concepto de magnitud absoluta de una astro, que se puede definir como la magnitud aparente que tendría si estuviese a una distancia de 10 parsecs (1 parsec = 3,26 años-luz). Se hace necesario deducir una función que nos permita conocer una magnitud en función de la otra y de la distancia a la que se encuentra la estrella. Si llamamos B al brillo de una estrella, sabemos que éste es inversamente proporcional al cuadrado de la distancia, D, de la estrella al observador: K B= 2 D Donde K es una constante, si realizamos la aproximación a 10 parsecs al pasarlo a absoluta, la expresión anterior quedaría como: K B '= 2 10 Si consideramos que para el brillo B la magnitud asignada es m y para el brillo B' la magnitud asignada es M , entonces, considerando que como se ha visto anteriormente para cada diferencia de una magnitud el brillo varía en 2,512 veces, para una diferencia de m – M podemos escribir: B = 2,512m – M B' K K Si dividimos miembro a miembro la expresión B '= 2 y la expresión B = 2 obtenemos: D 10 K 2 B' = 10 = 2,512m – M Þ D 2 = 2,512m – M ×102 K 2 B D

Teniendo en cuenta que existe un fenómeno de absorción de rayos solares en la atmósfera terrestre, se puede incrementar la previsión estimando en próxima a los 6000 K la temperatura en la fotosfera.

–

El brillo de las estrellas y su medida. Si realizamos una observación de las estrellas bajo condiciones de escasa o nula contaminación lumínica, observamos que unas estrellas brillan más que otras. Esto ha llamado la atención de los astrónomos desde tiempos lejanos, así Hiparco de Nicea (siglo II) estableció seis categorías en el brillo de las estrellas. Los astrónomos modernos han respetado, en parte, la clasificación de Hiparco pero han establecido distintos criterios de clasificación, donde una estrella de magnitud 1 es cien veces más brillante que otra de magnitud 6. Las valoraciones intermedias se han construido en base al siguiente razonamiento: x5 = 100 Þ x=

5

100 = 2,5118864

lo que nos indica que cuando la magnitud de dos estrellas se diferencia en una unidad, una es aproximadamente 2,512 veces más brillante que la otra. Se hace necesario objetivar esta clasificación que se ha realizado en base a apreciaciones subjetivas, así llegamos al concepto de magnitud absoluta de una astro, que se puede definir como la magnitud aparente que tendría si estuviese a una distancia de 10 parsecs (1 parsec = 3,26 años-luz). Se hace necesario deducir una función que nos permita conocer una magnitud en función de la otra y de la distancia a la que se encuentra la estrella. Si llamamos B al brillo de una estrella, sabemos que éste es inversamente proporcional al cuadrado de la distancia, D, de la estrella al observador: K B= 2 D Donde K es una constante, si realizamos la aproximación a 10 parsecs al pasarlo a absoluta, la expresión anterior quedaría como: K B '= 2 10 Si consideramos que para el brillo B la magnitud asignada es m y para el brillo B ' la magnitud asignada es M , entonces, considerando que como se ha visto anteriormente para cada diferencia de una magnitud el brillo varía en 2,512 veces, para una diferencia de m – M podemos escribir: B = 2,512m – M B' K K Si dividimos miembro a miembro la expresión B '= 2 y la expresión B = 2 obtenemos: 10 D K 2 B' = 10 = 2,512m – M Þ D 2 = 2,512m – M ×102 K 2 B D x5 = 100 Þ x=

–

5

100 = 2,5118864

El brillo de las estrellas y su medida. Si realizamos una observación de las estrellas bajo condiciones de escasa o nula contaminación lumínica, observamos que unas estrellas brillan más que otras. Esto ha llamado la atención de los astrónomos desde tiempos lejanos, así Hiparco de Nicea (siglo II) estableció seis categorías en el brillo de las estrellas. Los astrónomos modernos han respetado, en parte, la clasificación de Hiparco pero han establecido distintos criterios de clasificación, donde una estrella de magnitud 1 es cien veces más brillante que otra de magnitud 6. Las valoraciones intermedias se han construido en base al siguiente razonamiento:

Teniendo en cuenta que existe un fenómeno de absorción de rayos solares en la atmósfera terrestre, se puede incrementar la previsión estimando en próxima a los 6000 K la temperatura en la fotosfera. T=

0,2897 = 5267,27 K 5,5×10–5

(disminución de la longitud de onda), mientras que si la temperatura disminuye el pico se desplaza hacia la derecha (aumento de la longitud de onda). Fue en 1893 cuando Wilheim Wien enunció la ley del desplazamiento o ley de Wien que, considerando la longitud de onda en centímetros y la temperatura en grados Kelvin presenta la siguiente relación: l m ×T = 0,2897 Analizando el espectro solar se encontró que la longitud de onda más energética corresponde a 5,5×10–5 cm, que corresponde al color verde, y en consecuencia, la temperatura en la superficie solar se estima como:



158

Problemas de Economía, Ciencias Sociales y Naturaleza si tomamos logaritmos decimales en la expresión anterior nos queda: 2 log D = ( m – M )log 2,512+ 2 log 10 dividiendo ambos miembros entre el log 2,512 se obtiene: 5 log D = m – M + 5 Þ m = M – 5+ 5 log D La expresión anterior nos permite obtener m, el brillo, M , la luminosidad o D en función de las otras magnitudes.

–

La edad del universo. La teoría cosmogónica de Georges Lemaître apunta la formación del universo a partir del estallido de una concentración de materia de alta densidad. Posteriormente Gamow dio un impulso a esta teoría al estudiar las consecuencias de este estallido inicial al que denominó “Big Bang”. Basándonos en esta teoría y teniendo en cuenta la ley de Hubble, y denominando v a la velocidad de alejamiento de una galaxia, D a la distancia y H a una constante (constante de Hubble= 75 km× s–1), la relación entre ellas viene dada por: v = H ×D 1 D 30,87×1018 = = = 4 ,12×1017 s » 13×109 años H v 75 se ha tomado D como 1 megaparsec = 30,87×1018 km. Las tendencias actuales entre los científicos se inclinan a rebajar el valor de H, con lo que la edad del universo crece en la misma medida.

2.5. Funciones en Psicología. Algunas expresiones –

La ley del estímulo-sensación (Ley de Fechner-Weber). Establece la relación entre los cambios en la magnitud (intensidad) de los estímulos y su consecuencia en las sensaciones producidas por los mismos. Según Ernest Weber, la relación existente entre la magnitud inicial y la necesaria para que sea perceptible el cambio es constante, lo cual fue formulado matemáticamente por Gustav Fechner proponiendo que si llamamos M a la magnitud generadora del estímulo y S a la sensación producida por la misma, la relación entre ellas liga el aumento de las sensaciones con el logaritmo neperiano de los estímulos. E ( S )= K ×Ln M


159

TEMA

33 Evolución histórica del cálculo diferencial




162



INTRODUCCIÓN

2.

ORÍGENES DEL ANÁLISIS INFINITESIMAL

3.

PRINCIPIOS DEL SIGLO XVII: LOS PREDECESORES 3.1. Kepler 3.2. Cavalieri 3.3. Fermat 3.4. Huygens 3.5. Wallis 3.6. Barrow

4.

FINALES DEL SIGLO XVII: LOS FUNDADORES 4.1. Newton 4.2. Leibniz

5.

SIGLO XVIII 5.1. La familia Bernoulli y L’Hôpital 5.2. Brook Taylor y Colin MacLaurin 5.3. Euler 5.4. D’Alembert 5.5. Legendre 5.6. Lagrange

6.

EL SIGLO XIX 6.1. Bolzano 6.2. Cauchy 6.3. Riemann 6.4. Weierstrass

7.

EL SIGLO XX 7.1. Poincaré 7.2. Hilbert 7.3. Lebesgue

8.

CONCLUSIÓN

CONCLUSIÓN

8.

EL SIGLO XX 7.1. Poincaré 7.2. Hilbert 7.3. Lebesgue

7.

EL SIGLO XIX 6.1. Bolzano 6.2. Cauchy 6.3. Riemann 6.4. Weierstrass

6.

SIGLO XVIII 5.1. La familia Bernoulli y L’Hôpital 5.2. Brook Taylor y Colin MacLaurin 5.3. Euler 5.4. D’Alembert 5.5. Legendre 5.6. Lagrange

5.

FINALES DEL SIGLO XVII: LOS FUNDADORES 4.1. Newton 4.2. Leibniz

4.

PRINCIPIOS DEL SIGLO XVII: LOS PREDECESORES 3.1. Kepler 3.2. Cavalieri 3.3. Fermat 3.4. Huygens 3.5. Wallis 3.6. Barrow

3.

ORÍGENES DEL ANÁLISIS INFINITESIMAL

2.

INTRODUCCIÓN

1.



162

Evolución histórica del cálculo diferencial

1. INTRODUCCIÓN La historia del cálculo diferencial va de la mano con la historia del cálculo integral, ya que ambas pueden fundirse en una disciplina matemática que llamamos análisis infinitesimal. La base del análisis infinitesimal está en el concepto de “paso al límite” que se puede considerar una nueva operación algebraica. Las bases del análisis infinitesimal surgen en el siglo XVII, siendo Newton y Leibniz los que las sentaron. Sus orígenes fueron principalmente los nuevos problemas de mecánica, debido sobre todo al avance de la Astronomía y los viejos problemas de geometría, consistentes en el trazado de rectas tangentes a curvas, determinación de máximos y mínimos y cálculo de áreas y volúmenes. Así, esta disciplina se abre en dos ramas, íntimamente ligadas, el cálculo diferencial y el cálculo integral. La primera estudia entre otras cosas la determinación de rectas tangentes, máximos y mínimos, determinación de la velocidad en cualquier instante de un movimiento no uniforme, curvatura, etc. Estos problemas se resuelven por derivación. La segunda estudia entre otras cosas resolución de problemas de cuadraturas (encontrar el área de una figura curvilínea), determinación de centros de gravedad, cálculo de áreas y volúmenes, distancia recorrida en un movimiento no uniforme cuando se conoce la velocidad, etc. Estos problemas se resuelven por integración. Los antiguos griegos no habían tratado apenas el problema de la tangente. Solo sabemos que Arquímedes, considerando su espiral (definida como el lugar geométrico de un punto del plano, que partiendo del extremo de una semirrecta, se mueve uniformemente sobre ella, mientras que la semirrecta gira a su vez uniformemente alrededor de su extremo) y mediante la composición de velocidades indica la construcción de la tangente. Los matemáticos griegos se preocupan más del cálculo integral, aunque sus métodos de cálculo de áreas y volúmenes son esencialmente geométricos. Eudoxio y Arquímedes emplean las sumas que ahora llamamos de Riemann para aproximar áreas y volúmenes con un gran rigor, que en el caso de Arquímedes sigue siendo ejemplar hasta entrado el siglo XIX. El razonamiento era llamado método “apagógico”, aproximando los valores de las áreas y volúmenes, excluyendo los casos “mayor que” y “menor que”, aunque no se preocuparon (al igual que toda la matemática de su época) por una clasificación de los problemas, obteniendo resultados interesantes en casos particulares pero nunca llegaban a generalizar. Además siempre existía una mezcla entre los resultados algebraicos y los geométricos.

2. ORÍGENES DEL ANÁLISIS INFINITESIMAL A finales de la Edad Media, la nueva situación industrial en Europa así como el gran auge de descubrimientos geográficos y exploraciones, hizo que tuvieran que desarrollarse mucho la mecánica y la astronomía, planteándose problemas matemáticos nuevos, que requerían en su mayor parte el estudio de las leyes del movimiento y en cuyo desarrollo los métodos infinitesimales desempeñan un papel primordial. De todas formas, las primeras consideraciones de índole infinitesimal son claras reminiscencias de los métodos de Arquímedes, aunque los rigurosos y engorrosos métodos griegos se interpretan ahora con libertad de razonamiento no exenta de falta de rigor. Así, para determinar el centro de gravedad de un paraboloide de revolución, Stevin en 1586, circunscribe al mismo un número de cilindros de igual altura, que va duplicando, observando que el centro de gravedad de dichos cilindros se acerca indefinidamente a un punto fijo, que es el centro de gravedad del paraboloide. Este método es semejante al empleado por Arquímedes para la determinación geométrica de la cuadratura de la parábola. En ambos casos el resultado es el límite de una sucesión convergente. Pero mientras Stevin se limita a comprobar, sobre la base de los tres o cuatro primeros términos de la sucesión, que su límite es cero, Arquímedes sobre la base de la suma de un número finito de términos de una progresión geométrica de razón menor que la unidad, llega al resultado mediante el método de exhaución. En 1604, Luca Valerio modifica el raciocinio de Stevin mediante un teorema general, según el cual si se inscribe o circunscribe un escaloide (en forma de escalerilla), formada por polígonos, prismas o cilindros a una figura plana o sólida, la diferencia entre los escaloides inscritos y circunscritos puede hacerse tan pequeña como queramos, por lo que la diferencia entre esos escaloides y la figura también será lo pequeña que queramos. Este resultado no es demostrado y se basa en razonamientos geométricos intuitivos, nada rigurosos.


163


164


Entre otras contribuciones está la cuadratura de la espiral de Arquímedes, que relaciona y reduce a la de la parábola, observando que el arco de la espiral estudiada por Arquímedes era igual que el arco de una determinada parábola.

3. PRINCIPIOS DEL SIGLO XVII: LOS PREDECESORES

Las obras conocidas de Arquímedes se reeditaron a mediados del siglo XVI, pero su influencia empezó a notarse a principios del siglo XVII, debido en gran parte al avance de la Astronomía.

ò x dx = n +1 0

a

n

(a > 0)

a n+1

3.1. Kepler

Es autor de un método de “integración” basado en los “indivisibles”, que ocupa un lugar intermedio entre las rigurosas demostraciones de Arquímedes y los métodos infinitesimales que surgirán en la segunda mitad del siglo. El método lo expone en su libro Geometría indivisilibus continuorum nova quadam ratione promota, publicado en 1635. La idea fundamental del método es considerar que un área está formada por segmentos rectilíneos o indivisibles del área, y que un volumen sólido se puede considerar análogamente compuesto por secciones o áreas indivisibles de ese volumen. Sin recurrir al método de exhaución, logra dar el resultado de las tres primeras potencias de la variable y cuando más tarde logra la demostración para la cuarta potencia, extiende por analogía el resultado a una potencia de exponente natural cualquiera, que publicó en su obra Exercitaciones Geometricae sex, en 1647. Así, su resultado aplicando la terminología moderna sería:

Stevin estaba interesado en las aplicaciones físicas de la idea de infinitos elementos infinitamente pequeños, mientras que Kepler los necesitaba para aplicarlos a la Astronomía, especialmente para la segunda ley que publicó en su Astronomía Nova en 1609 (el radio vector que va del sol a un planeta barre áreas iguales en tiempos iguales). En estos problemas relativos a áreas Kepler suponía que el área estaba formada por triángulos infinitamente pequeños con un vértice en el sol y los otros dos en puntos infinitamente próximos de la órbita del planeta. Así, pudo aplicar Kepler un tipo de cálculo integral rudimentario y por ejemplo, para calcular el área del círculo, se descompone el mismo en triángulos infinitamente estrechos de igual altura que será “casi igual” al radio del círculo. Por un razonamiento análogo había obtenido Kepler el área de la elipse. En 1615 publica su obra matemática Nova stereometria doliorum vinariorum (que surge con el propósito de comparar las capacidades de los toneles entonces en uso, con el fin de hallar las dimensiones del más económico para conseguir el mismo volumen), que contiene consideraciones de índole infinitesimal. En este tratado estudió la cubatura de numerosos cuerpos de rotación, obtenidos haciendo girar circunferencias, elipses o arcos de estas curvas u otras cónicas, alrededor de ejes paralelos a los de aquellas. La primera parte del tratado se inicia con las cuadraturas y cubaturas de Arquímedes, pero sin utilizar el método de exhaución, admitiendo que las figuras estaban formadas por figuras infinitamente pequeñas de áreas o volúmenes conocidos. Como obtuvo para algunos casos resultados idénticos a los obtenidos por el método de exhaución, aplica iguales consideraciones a los cuerpos nuevos que iba generando, cuando no los puede reducir a casos conocidos y logra dar no siempre con éxito su volumen. Además, debido al problema que lo había conducido a estudiar este tema, Kepler se ocupa de cuestiones de máximo y mínimo, que resuelve de forma empírica, mediante la observación de cuadros numéricos y llega a la conclusión de que en las proximidades de un máximo, las variaciones de la cantidad, se hacen insensibles, forma rudimentaria de expresar la condición de derivada nula en un máximo. Se deben a Kepler otras consideraciones de índole infinitesimal: la caracterización de una curva a partir de una propiedad de sus tangentes, el valor aproximado de la longitud de una elipse como la de una circunferencia de diámetro la semisuma de los ejes de la elipse y la aplicación del principio de continuidad, que supone que la parábola es un caso límite de la elipse o de la hipérbola, cuando uno de sus focos se aleja infinitamente en cuyo caso el sistema de rayos focales se convierte en un haz de rayos paralelos.

3.2. Cavalieri

Stevin estaba interesado en las aplicaciones físicas de la idea de infinitos elementos infinitamente pequeños, mientras que Kepler los necesitaba para aplicarlos a la Astronomía, especialmente para la segunda ley que publicó en su Astronomía Nova en 1609 (el radio vector que va del sol a un planeta barre áreas iguales en tiempos iguales). En estos problemas relativos a áreas Kepler suponía que el área estaba formada por triángulos infinitamente pequeños con un vértice en el sol y los otros dos en puntos infinitamente próximos de la órbita del planeta. Así, pudo aplicar Kepler un tipo de cálculo integral rudimentario y por ejemplo, para calcular el área del círculo, se descompone el mismo en triángulos infinitamente estrechos de igual altura que será “casi igual” al radio del círculo. Por un razonamiento análogo había obtenido Kepler el área de la elipse. En 1615 publica su obra matemática Nova stereometria doliorum vinariorum (que surge con el propósito de comparar las capacidades de los toneles entonces en uso, con el fin de hallar las dimensiones del más económico para conseguir el mismo volumen), que contiene consideraciones de índole infinitesimal. En este tratado estudió la cubatura de numerosos cuerpos de rotación, obtenidos haciendo girar circunferencias, elipses o arcos de estas curvas u otras cónicas, alrededor de ejes paralelos a los de aquellas. La primera parte del tratado se inicia con las cuadraturas y cubaturas de Arquímedes, pero sin utilizar el método de exhaución, admitiendo que las figuras estaban formadas por figuras infinitamente pequeñas de áreas o volúmenes conocidos. Como obtuvo para algunos casos resultados idénticos a los obtenidos por el método de exhaución, aplica iguales consideraciones a los cuerpos nuevos que iba generando, cuando no los puede reducir a casos conocidos y logra dar no siempre con éxito su volumen. Además, debido al problema que lo había conducido a estudiar este tema, Kepler se ocupa de cuestiones de máximo y mínimo, que resuelve de forma empírica, mediante la observación de cuadros numéricos y llega a la conclusión de que en las proximidades de un máximo, las variaciones de la cantidad, se hacen insensibles, forma rudimentaria de expresar la condición de derivada nula en un máximo. Se deben a Kepler otras consideraciones de índole infinitesimal: la caracterización de una curva a partir de una propiedad de sus tangentes, el valor aproximado de la longitud de una elipse como la de una circunferencia de diámetro la semisuma de los ejes de la elipse y la aplicación del principio de continuidad, que supone que la parábola es un caso límite de la elipse o de la hipérbola, cuando uno de sus focos se aleja infinitamente en cuyo caso el sistema de rayos focales se convierte en un haz de rayos paralelos.

3.2. Cavalieri

Es autor de un método de “integración” basado en los “indivisibles”, que ocupa un lugar intermedio entre las rigurosas demostraciones de Arquímedes y los métodos infinitesimales que surgirán en la segunda mitad del siglo. El método lo expone en su libro Geometría indivisilibus continuorum nova quadam ratione promota, publicado en 1635. La idea fundamental del método es considerar que un área está formada por segmentos rectilíneos o indivisibles del área, y que un volumen sólido se puede considerar análogamente compuesto por secciones o áreas indivisibles de ese volumen. Sin recurrir al método de exhaución, logra dar el resultado de las tres primeras potencias de la variable y cuando más tarde logra la demostración para la cuarta potencia, extiende por analogía el resultado a una potencia de exponente natural cualquiera, que publicó en su obra Exercitaciones Geometricae sex, en 1647. Así, su resultado aplicando la terminología moderna sería: a

0

n

(a > 0)

3.1. Kepler

a n+1

ò x dx = n +1

Las obras conocidas de Arquímedes se reeditaron a mediados del siglo XVI, pero su influencia empezó a notarse a principios del siglo XVII, debido en gran parte al avance de la Astronomía.

Entre otras contribuciones está la cuadratura de la espiral de Arquímedes, que relaciona y reduce a la de la parábola, observando que el arco de la espiral estudiada por Arquímedes era igual que el arco de una determinada parábola.

3. PRINCIPIOS DEL SIGLO XVII: LOS PREDECESORES



164


3.3. Fermat Las contribuciones de Fermat al cálculo infinitesimal abarcan todas sus ramas, mostrando su gran habilidad algorítmica. Traduce algebraicamente la idea de Kepler, relativa a la anulación de la variación de las cantidades en las proximidades de un máximo o un mínimo, exponiendo un método para determinar esos valores, que publicó en su tratado (póstumo) Methodus ad disquirendam maximan et miniman (Método para hallar máximos y mínimos). Fermat había estado estudiando lugares geométricos dados por ecuaciones y = x n, con lo que tenemos una geometría analítica de orden superior, pero aún avanzó más. Para curvas polinómicas de la forma y = f ( x ) descubrió un método para hallar los puntos en que la función alcanza un máximo o un mínimo. Para ello comparaba el valor de la función en un punto f ( x ), con el valor en un punto próximo f ( x+ E ), que generalmente serán distintos, salvo en las proximidades de un máximo o un mínimo que serán casi iguales. Cuanto más pequeña sea la distancia entre los dos puntos E, más cerca estará dicha pseudo-igualdad de ser una ecuación, por lo que Fermat después de dividir todo por E, hace E = 0, lo que le permite calcular las abscisas de los puntos máximos y mínimos de la función polinómica. Esto nos da en esencia el proceso que en la actualidad llamamos diferenciación, pues este método es equivalente a calcular lím E ®0

f ( x+ E ) – f ( x ) E

e igualar a cero. Fermat no disponía del concepto de límite, pero su procedimiento de cambiar ligeramente el valor de la variable para considerar valores próximos a uno dado, constituye desde entonces la verdadera esencia del análisis infinitesimal. Posteriormente aplica este método a la determinación de las tangentes a una curva algebraica de la forma y = f ( x ). Además, a partir de la suma de términos de una progresión geométrica logra la cuadratura de parábolas de orden superior, o lo que es lo mismo la integración de funciones de potencia.

3.4. Huygens Huygens fue un científico de fama internacional al que se recuerda principalmente por el principio que lleva su nombre en la teoría de la luz, por la observación de los anillos de Saturno y por la verdadera invención del reloj de péndulo. Precisamente fue en conexión con sus investigaciones para mejorar los relojes como hizo su descubrimiento matemático más importante: la involuta (llamada también evolvente) de una cicloide es otra cicloide igual e inversamente la evoluta de una cicloide es otra cicloide igual. Este teorema, así como otros de sus resultados sobre involutas y evolutas de diversas curvas, los demostró Huygens, tomando puntos próximos y observando el resultado que se produce cuando el intervalo que los separa se anula, recurso que había utilizado Fermat para determinar las tangentes y normales a una curva y que ahora utilizaba Huygens para hallar lo que ahora llamamos radio de curvatura de una curva plana. Sus investigaciones sobre las involutas y evolutas se publicaron en el año 1673, en su famoso libro Horologium oscillatorium, tratado sobre el reloj de péndulo que sirvió como introducción a los Principia de Newton, publicados casi quince años más tarde. Además de sus investigaciones matemáticas, en conexión con sus trabajos realizó otras independientes entre las que pueden mencionarse cuestiones de geometría elemental, relacionadas en especial con la cuadratura del círculo, que perfecciona los métodos conocidos para hallar el valor aproximado de p. En 1656 aplicó el análisis infinitesimal a las cónicas, reduciendo la rectificación de una parábola a la cuadratura de la hipérbola, convirtiéndose al año siguiente en el primero que logró calcular el área de un segmento de paraboloide de revolución, demostrando que la determinación de la misma puede conseguirse por métodos elementales.

3.5. Wallis John Wallis fue uno de los matemáticos más originales del siglo. Introdujo las series de forma sistemática en el análisis, escribió sobre álgebra y sobre las cónicas, que consideró por primera vez como curvas cuya ecuación en coordenadas cartesianas es de segundo grado. Su obra más importante es Aritmética infinitorum, publicada en 1655, donde aparece el actual símbolo de “infinito”, que utiliza también para la nada (non-quanta) como recíproco: 1/¥. En esta obra aritmetiza la Geometría indivisibilibus de Cavalieri,


165

166



llegando mediante un método que es mezcla de inducción e interpolación a expresar nuestra integral de la función xm en el intervalo (0,1), como 1/(m + 1), para cualquier exponente. Este resultado correcto para m= -1, de acuerdo con la concepción de Wallis, no tiene sentido para m<-1y en efecto la interpretación de Wallis no es correcta en este caso. Posteriormente extiende esta regla a toda suma o serie de potencias, de donde resultó una importante contribución a la cuadratura del círculo. Al aplicar su regla a la expresión n entera (1- x2) para valores sucesivos de n, trató de obtener por interpolación el valor correspondiente a 1 n = 1 / 2 al que correspondería p. Como no logró éxito fue modificando los valores de n a la vez que mo4 dificaba los de la potencia de x y siguiendo ciertas leyes de interpolación y generalización llegó a un nuevo desarrollo de p, en producto infinito de la forma:

La labor matemática de Isaac Newton no se limitó a cuestiones infinitesimales, sino que abarca amplias zonas del álgebra y de la geometría. A él se le debe la iniciación de la teoría de las curvas algebraicas (curvas cuya ecuación en coordenadas cartesianas es de naturaleza algebraica) con Enumeriatum linearum tertii ordinis, terminado en 1695, pero publicado en 1704 como apéndice de la Optica. En De Analysi aparece el teorema general del binomio, al que llega generalizando para exponentes racionales los resultados obtenidos por Wallis. Obtiene otras series por división (procedimiento ya conocido), mientras que aplica por primera vez el método de inversión para obtener nuevas series, naciendo así las series exponencial de la logarítmica, la de las funciones seno y coseno de las ciclométricas, etc. Desarrolla además en serie funciones dadas implícitamente utilizando una regla denominada del “paralelogramo de Newton”. Como recurso para efectuar cuadraturas, aparece en Methodus differentialis de 1712 la hoy llamada”fórmula de interpolación de Newton”, que permite determinar la ecuación de una parábola de orden superior que pasa por n puntos prefijados de abscisas en progresión aritmética y que constituye el punto de partida de la teoría de las diferencias finitas. 2 3× 3× 5× 5× 7× 7×... = p 2× 2× 4 × 4 × 6× 6×...

4.1. Newton 3.6. Barrow Cierra la lista de los precursores y predecesores de los dos grandes fundadores del cálculo infinitesimal, Newton y Leibniz. La importancia de Barrow en el advenimiento de los nuevos métodos es doble. Por un lado, se le debe un método para la determinación de las tangentes a las curvas planas mediante el “triángulo característico”, con lo que se le puede considerar como el fundador de la noción de derivada y por otro Barrow fue el maestro de Newton, a quien en 1669 cede su cátedra de Cambridge para dedicarse a la teología.

La obra de los precursores de Newton y Leibniz, preparó el camino para que estos lograran dar nacimiento a una rama autónoma de la matemática que hoy conocemos como análisis infinitesimal, pero que durante mucho tiempo siguió siendo un conjunto de reglas de gran utilidad y eficacia, con grandes éxitos en sus aplicaciones, pero desde el punto de vista matemático, poco más que eso. Aquellos predecesores habían tratado y resuelto numerosos problemas relativos a las tres ramas que más tarde constituirían la nueva disciplina: de cálculo diferencial, al estudiar la determinación de rectas tangentes, la curvatura y los problemas de máximos y mínimos; de cálculo integral, en la determinación de cuadraturas, cubaturas y centros de gravedad; y de algoritmos infinitos, al ocuparse de series, de algoritmos infinitos y de fracciones continuas infinitas. Pero a pesar de todo les faltó estudiar el nexo que vinculara todos estos problemas en teoría independientes, al emplear métodos particulares en la resolución de cada problema. Esta evolución empírica fue superada por la obra de Newton y Leibniz, que fue la que en realidad dio nacimiento al cálculo infinitesimal.

4. FINALES DEL SIGLO XVII: LOS FUNDADORES

La obra de los precursores de Newton y Leibniz, preparó el camino para que estos lograran dar nacimiento a una rama autónoma de la matemática que hoy conocemos como análisis infinitesimal, pero que durante mucho tiempo siguió siendo un conjunto de reglas de gran utilidad y eficacia, con grandes éxitos en sus aplicaciones, pero desde el punto de vista matemático, poco más que eso. Aquellos predecesores habían tratado y resuelto numerosos problemas relativos a las tres ramas que más tarde constituirían la nueva disciplina: de cálculo diferencial, al estudiar la determinación de rectas tangentes, la curvatura y los problemas de máximos y mínimos; de cálculo integral, en la determinación de cuadraturas, cubaturas y centros de gravedad; y de algoritmos infinitos, al ocuparse de series, de algoritmos infinitos y de fracciones continuas infinitas. Pero a pesar de todo les faltó estudiar el nexo que vinculara todos estos problemas en teoría independientes, al emplear métodos particulares en la resolución de cada problema. Esta evolución empírica fue superada por la obra de Newton y Leibniz, que fue la que en realidad dio nacimiento al cálculo infinitesimal.

4. FINALES DEL SIGLO XVII: LOS FUNDADORES

Cierra la lista de los precursores y predecesores de los dos grandes fundadores del cálculo infinitesimal, Newton y Leibniz. La importancia de Barrow en el advenimiento de los nuevos métodos es doble. Por un lado, se le debe un método para la determinación de las tangentes a las curvas planas mediante el “triángulo característico”, con lo que se le puede considerar como el fundador de la noción de derivada y por otro Barrow fue el maestro de Newton, a quien en 1669 cede su cátedra de Cambridge para dedicarse a la teología.

3.6. Barrow 4.1. Newton La labor matemática de Isaac Newton no se limitó a cuestiones infinitesimales, sino que abarca amplias zonas del álgebra y de la geometría. A él se le debe la iniciación de la teoría de las curvas algebraicas (curvas cuya ecuación en coordenadas cartesianas es de naturaleza algebraica) con Enumeriatum linearum tertii ordinis, terminado en 1695, pero publicado en 1704 como apéndice de la Optica. En De Analysi aparece el teorema general del binomio, al que llega generalizando para exponentes racionales los resultados obtenidos por Wallis. Obtiene otras series por división (procedimiento ya conocido), mientras que aplica por primera vez el método de inversión para obtener nuevas series, naciendo así las series exponencial de la logarítmica, la de las funciones seno y coseno de las ciclométricas, etc. Desarrolla además en serie funciones dadas implícitamente utilizando una regla denominada del “paralelogramo de Newton”. Como recurso para efectuar cuadraturas, aparece en Methodus differentialis de 1712 la hoy llamada”fórmula de interpolación de Newton”, que permite determinar la ecuación de una parábola de orden superior que pasa por n puntos prefijados de abscisas en progresión aritmética y que constituye el punto de partida de la teoría de las diferencias finitas. 2 3× 3× 5× 5× 7× 7×... = p 2× 2× 4 × 4 × 6× 6×...

llegando mediante un método que es mezcla de inducción e interpolación a expresar nuestra integral de la función xm en el intervalo (0,1), como 1/(m + 1), para cualquier exponente. Este resultado correcto para m= -1, de acuerdo con la concepción de Wallis, no tiene sentido para m<-1y en efecto la interpretación de Wallis no es correcta en este caso. Posteriormente extiende esta regla a toda suma o serie de potencias, de donde resultó una importante contribución a la cuadratura del círculo. Al aplicar su regla a la expresión n entera (1- x2) para valores sucesivos de n, trató de obtener por interpolación el valor correspondiente a 1 n = 1 / 2 al que correspondería p. Como no logró éxito fue modificando los valores de n a la vez que mo4 dificaba los de la potencia de x y siguiendo ciertas leyes de interpolación y generalización llegó a un nuevo desarrollo de p, en producto infinito de la forma:



166

Evolución histórica del cálculo diferencial La contribución más original de Newton a los métodos infinitesimales es su “método de fluxiones”, que constituyó el tema principal de un tratado de 1671, no publicado hasta 1736. Del carácter general del método ya cuenta Newton en una carta de 1672 que puede aplicarse “no solo al trazado de tangentes a cualquier curva, sea geométrica o mecánica… sino también para resolver cualquier clase de problemas sobre curvaturas, áreas, longitudes, centros de gravedad, etc.” y agrega que ha “entrelazado ese método con aquel otro método que consiste en trabajar con las ecuaciones reduciéndolas a series infinitas”. En efecto, el método de las fluxiones de Newton, con su esencia y notación propias no es sino una forma de tratar los problemas del actual análisis infinitesimal. El método es de naturaleza geométrico-mecánica pues supone que todas las magnitudes geométricas son engendradas por movimientos de velocidades diferentes, mientras que el tiempo fluye constante y uniformemente. La notación de Newton para las fluxiones consiste en indicar las sucesivas fluxiones mediante puntos superpuestos a la fluente correspondiente; así, la fluxión de y (nuestra derivada) se indica &y.

4.2. Leibniz A la vez que en Inglaterra el cálculo infinitesimal lograba nuevos resultados, adquiriendo las primeras notas que le conferían unidad y autonomía, en el continente, por obra de Leibniz, tal unidad y autonomía se acentuaban. Fundamentalmente Leibniz era un “algorítmico” y su preocupación por la claridad de los conceptos y el aspecto formal de la matemática le llevaron a crear el simbolismo adecuado al nuevo algoritmo. En el estudio de las series dedujo por procedimientos originales varias de ellas, obtuvo nuevas y dio el criterio de convergencia de las series alternadas. Por ejemplo, para el desarrollo en serie de la función seno, se valió del método de los coeficientes indeterminados, partiendo de la ecuación diferencial de segundo orden que define esa función, obtenida geométricamente. Las consideraciones infinitesimales de Leibniz parten de la consideración de “triángulo característico” que ya habían considerado Barrow y Pascal. Mediante consideraciones en ese triángulo se observa que en el problema de la tangente interviene el incremento, es decir la “diferencia” de las ordenadas, mientras que en el problema de la cuadratura interviene la “suma” de las ordenadas, lo que revela que ambos problemas son inversos. En cuanto al simbolismo, al principio indicó las sumas mediante la abreviatura Omn. (de Omnia = todo), que luego sustituyó por el actual símbolo de integral, proveniente de la deformación de la letra S, inicial de suma. Respecto a la diferenciación, en principio escribió el símbolo d como denominador, aunque más tarde le dio la forma y el uso actuales. Aunque desde 1676 utiliza las reglas y fórmulas más simples del cálculo infinitesimal no es hasta 1684 cuando publica una memoria de apenas seis páginas sobre estos temas. Además de aparecer definidas las diferenciales en la forma actual, aparecen las reglas comunes de diferenciación de expresiones racionales e irracionales. Aplica también la diferenciación a la resolución de los problemas de máximos y mínimos, que distingue según el signo de la segunda diferenciación, cuya interpretación geométrica es la concavidad o convexidad, que al anularse pasa de un tipo de curvatura a otro por el “puntum flexus contrarii”. En 1686 aparecen sus primeros escritos relativos al cálculo integral, apareciendo por primera vez impreso el símbolo de la integral. En 1695 aparece entre otros ejemplos la diferenciación de funciones del tipo u v , mediante el uso de logaritmos, tal como se hace en la actualidad. Del mismo año es el teorema que lleva su nombre, acerca de la regla para las diferenciales sucesivas de un producto de funciones, sin más que cambiar en la fórmula del binomio los exponentes por órdenes de diferenciación. En otros trabajos se ocupó del círculo oscilador, de la teoría de las envolventes, de las series oscilantes y en general de todos los problemas de índole geométrico-mecánica que interesaban a los matemáticos de su época. No obstante, el hecho de que el nacimiento del cálculo infinitesimal fuera obra de dos matemáticos ilustres, provocó una lamentable cuestión que se inició con la posible paternidad del mismo, acusaciones de plagio, etc., que enturbió las relaciones entre los matemáticos ingleses y continentales durante más de un siglo. La consecuencia más lamentable de esta polémica fue el aislamiento de cada bando y la falta de cooperación científica, y aunque en definitiva los métodos solo diferían en la notación, esto impedía que los progresos fueran conocidos y asimilados por el bando contrario. Los amigos de Newton hicieron un flaco favor a la causa matemática al continuar apegados al punto de vista geométrico, mientras que en Europa se iniciaba un periodo de esplendor, gracias, entre otras cosas, a la utilización de la notación de Leibniz.


167


168


Esta serie, que se convierte en la de McLaurin si a = 0, era conocida mucho antes por James Gregory y Jean Bernoulli, pero Taylor no lo sabía. También llega a la serie en la forma dada por Johann Bernoulli, pero partiendo del método de integración por partes y no de la identidad de la que había partido Bernoulli.

5. SIGLO XVIII

La tarea más importante de los matemáticos del siglo se realizó en el campo de los métodos infinitesimales y de sus aplicaciones, contrastando los progresos técnicos y el éxito de las aplicaciones con la debilidad de sus fundamentos básicos. Aunque los métodos infinitesimales de Newton y Leibniz se dieron a conocer a finales del siglo XVII, la difusión de las nuevas ideas fue muy lenta, por lo que fuera de sus autores eran pocos los matemáticos enterados de estos y menos los que se encontraban en condiciones de aplicarlos. f ( x+ a ) = f ( a )+ f '( a )x+ f ''( a )

x2 x3 xn + f '''( a ) +...+ f ( n) ( a ) +... 2! 3! n!

Además de una obra sobre perspectiva, en la que sienta las bases del actual método de proyección central, se debe a Taylor un Methodus incrementorum directa e inversa de 1715, en el que hace un uso sistemático de las diferencias finitas. En esta obra, partiendo de las diferencias da la serie conocida por su nombre, que es por lo que más se le recuerda:

5.1. La familia Bernoulli y L’Hôpital

La familia Bernoulli, de origen holandés pero residente en Suiza, proporcionó durante los siglos XVII, XVIII y XIX más de una docena de matemáticos entre los que sobresalen Jacob, su hermano Johann y uno de los hijos de este, Daniel. En el campo infinitesimal, Jacob se ocupó de series y de las propiedades de las curvas, introduciendo el uso sistemático de las coordenadas polares. Las notables propiedades que descubrió en la espiral logarítmica, que se reproduce en su evoluta, en su envolvente, en su cáustica, etc., lo llevó a pedir que en su tumba se grabase esa curva con la leyenda Eadem mutata resurgo (Aunque cambio resurjo la misma). Es el primero en resolver con demostración el problema de la curva isócrona, tal que un punto cae sobre esta curva con movimiento uniforme respecto a la vertical, siendo en este estudio donde aparece por primera vez la palabra integral con el significado actual. En la lucha científica con su hermano Johann, fueron propuestos y resueltos diversos problemas de aplicación de los métodos infinitesimales a la geometría y a la mecánica. Así, Johann propuso en 1696 el problema de la curva de tiempo mínimo (braquistócrona), que fue resuelto entre otros por su hermano Jacob, mientras este propuso la ecuación diferencial que hoy lleva el nombre de Bernoulli, resuelta por Jacob. Las mayores contribuciones matemáticas de Johann en el campo infinitesimal, se refieren a la teoría de series y a la aplicación de estas al cálculo integral y a las ecuaciones diferenciales. Particularmente se le debe la cuadratura de funciones de la forma xx y los métodos del factor integrante y de la separación de variables en la integración de las ecuaciones diferenciales. Un original método de cuadratura por series, expuesto en 1694, dio nacimiento a una serie que es un caso particular de la hoy llamada “serie de Taylor”, de unos veinte años después. Íntimamente vinculado a Johann Bernoulli se encuentra el marqués de L’Hôpital, único francés que durante mucho tiempo estuvo en condiciones de resolver los problemas que Leibniz y los Bernoulli planteaban a los matemáticos de la época. Publicó el primer tratado sistemático de la época de cálculo diferencial: Analyse des infiniment pour l’intelligence des lignes courbes, tratado que no contiene sino las lecciones que le impartió Bernoulli en lo referente a cálculo infinitesimal a cambio de un salario regular. Dichas lecciones contienen también cálculo integral que el marqués no publicó pues se había enterado de que pensaba hacerlo Bernoulli directamente. En este tratado aparece la regla vinculada con el nombre de L’Hôpital, más tarde convertida en teorema, para el cálculo de límites indeterminados que más tarde reivindicó Bernoulli a la muerte del marqués. Dicha regla nos dice: “Si f ( x ) y g ( x ) son funciones diferenciables en x = a, tales que f '( x ) f (x ) f '( x ) . , entonces se cumple que lím = lím f ( a ) = g ( a ) = 0 y existe el límite lím x ®a g '( x ) x ®a g ( x ) x ®a g '( x )

5.2. Brook Taylor y Colin McLaurin

La familia Bernoulli, de origen holandés pero residente en Suiza, proporcionó durante los siglos XVII, XVIII y XIX más de una docena de matemáticos entre los que sobresalen Jacob, su hermano Johann y uno de los hijos de este, Daniel. En el campo infinitesimal, Jacob se ocupó de series y de las propiedades de las curvas, introduciendo el uso sistemático de las coordenadas polares. Las notables propiedades que descubrió en la espiral logarítmica, que se reproduce en su evoluta, en su envolvente, en su cáustica, etc., lo llevó a pedir que en su tumba se grabase esa curva con la leyenda Eadem mutata resurgo (Aunque cambio resurjo la misma). Es el primero en resolver con demostración el problema de la curva isócrona, tal que un punto cae sobre esta curva con movimiento uniforme respecto a la vertical, siendo en este estudio donde aparece por primera vez la palabra integral con el significado actual. En la lucha científica con su hermano Johann, fueron propuestos y resueltos diversos problemas de aplicación de los métodos infinitesimales a la geometría y a la mecánica. Así, Johann propuso en 1696 el problema de la curva de tiempo mínimo (braquistócrona), que fue resuelto entre otros por su hermano Jacob, mientras este propuso la ecuación diferencial que hoy lleva el nombre de Bernoulli, resuelta por Jacob. Las mayores contribuciones matemáticas de Johann en el campo infinitesimal, se refieren a la teoría de series y a la aplicación de estas al cálculo integral y a las ecuaciones diferenciales. Particularmente se le debe la cuadratura de funciones de la forma xx y los métodos del factor integrante y de la separación de variables en la integración de las ecuaciones diferenciales. Un original método de cuadratura por series, expuesto en 1694, dio nacimiento a una serie que es un caso particular de la hoy llamada “serie de Taylor”, de unos veinte años después. Íntimamente vinculado a Johann Bernoulli se encuentra el marqués de L’Hôpital, único francés que durante mucho tiempo estuvo en condiciones de resolver los problemas que Leibniz y los Bernoulli planteaban a los matemáticos de la época. Publicó el primer tratado sistemático de la época de cálculo diferencial: Analyse des infiniment pour l’intelligence des lignes courbes, tratado que no contiene sino las lecciones que le impartió Bernoulli en lo referente a cálculo infinitesimal a cambio de un salario regular. Dichas lecciones contienen también cálculo integral que el marqués no publicó pues se había enterado de que pensaba hacerlo Bernoulli directamente. En este tratado aparece la regla vinculada con el nombre de L’Hôpital, más tarde convertida en teorema, para el cálculo de límites indeterminados que más tarde reivindicó Bernoulli a la muerte del marqués. Dicha regla nos dice: “Si f ( x ) y g ( x ) son funciones diferenciables en x = a, tales que f '( x ) f (x ) f '( x ) . , entonces se cumple que lím = lím x ®a g ( x ) x ®a g '( x ) g '( x ) x ®a

f ( a ) = g ( a ) = 0 y existe el límite lím

5.2. Brook Taylor y Colin McLaurin

Además de una obra sobre perspectiva, en la que sienta las bases del actual método de proyección central, se debe a Taylor un Methodus incrementorum directa e inversa de 1715, en el que hace un uso sistemático de las diferencias finitas. En esta obra, partiendo de las diferencias da la serie conocida por su nombre, que es por lo que más se le recuerda:

5.1. La familia Bernoulli y L’Hôpital

La tarea más importante de los matemáticos del siglo se realizó en el campo de los métodos infinitesimales y de sus aplicaciones, contrastando los progresos técnicos y el éxito de las aplicaciones con la debilidad de sus fundamentos básicos. Aunque los métodos infinitesimales de Newton y Leibniz se dieron a conocer a finales del siglo XVII, la difusión de las nuevas ideas fue muy lenta, por lo que fuera de sus autores eran pocos los matemáticos enterados de estos y menos los que se encontraban en condiciones de aplicarlos. f ( x+ a ) = f ( a )+ f '( a )x+ f ''( a )

x2 x3 xn + f '''( a ) +...+ f ( n) ( a ) +... 2! 3! n!

Esta serie, que se convierte en la de McLaurin si a = 0, era conocida mucho antes por James Gregory y Jean Bernoulli, pero Taylor no lo sabía. También llega a la serie en la forma dada por Johann Bernoulli, pero partiendo del método de integración por partes y no de la identidad de la que había partido Bernoulli.

5. SIGLO XVIII



168

Evolución histórica del cálculo diferencial También se le deben fórmulas para el cambio de variable independiente e investigaciones acerca de ecuaciones diferenciales y de resolución aproximada de ecuaciones. El último matemático inglés del periodo y quizás el más importante es Colin McLaurin, que volvió a los métodos clásicos de los geómetras antiguos, con lo que si bien consiguió hacer más rigurosas las demostraciones, contribuyó a aumentar el aislamiento de los matemáticos ingleses frente a los continentales. Su Treatise on Fluxiones en dos volúmenes (1737, 1742) es un tratado sistemático del cálculo de fluxiones con sus aplicaciones geométricas y mecánicas donde se deduce la serie binómica de Newton por un método de coeficientes indeterminados que, aplicado a funciones cualesquiera, dio lugar a la llamada “serie de McLaurin” que el autor mismo reconoció no ser sino un caso especial de la serie de Taylor. Además, la serie de McLaurin había aparecido en la obra Methodus differentialis, publicada por Stirling 12 años antes de que lo hiciera McLaurin. Si hoy se recuerda el nombre de McLaurin asociada a una serie que él no fue el primero en descubrir, la cosa se compensa con el hecho de que uno de los descubrimientos que hizo realmente lleve el nombre de otro matemático. Nos referimos a la regla de Cramer, publicada por este en 1750 y descubierta por McLaurin en 1729. También aparece en el tratado del párrafo anterior el método de integración aproximada, llamado hoy de McLaurin, en el que cada trapezoide es sustituido por el rectángulo de altura la ordenada en el punto medio, así como la fórmula, descubierta independientemente por él y por Euler, que expresa la sumatoria de una función mediante la integral y las derivadas.

5.3. Euler A Leonhard Euler se le considera el mayor matemático del siglo XVIII. Desarrolló una amplia intensidad científica, que no decayó ni tan siquiera en los últimos años de su vida, donde totalmente ciego, dictaba sus trabajos. Se ocupó de diversas ramas de la matemática pero sus contribuciones más originales aparecen en el cálculo infinitesimal. Así, publicó los primeros tratados sistemáticos de esta disciplina: Methodus inveniendi lineas curvas maximi minimive propietate gaudentes (1744); Introductio in análisis infinitorum (1748, dos volúmenes); Instituciones calculi differentialis (1755); Instituciones calculi integralis (1768-1770, tres volúmenes). En su Introductio, Euler utiliza el concepto de función, cuyo símbolo f ( x ), también le pertenece, en la forma que conservó mucho tiempo: función de x es toda expresión analítica de esta variable, obtenida mediante una combinación finita o infinita de símbolos algebraicos o trascendentes. En conexión con las funciones trascendentes aparece una de las contribuciones más notables de Euler: los logaritmos como exponentes y su vinculación con los números imaginarios y las funciones circulares. Aparecen así las que hoy denominamos fórmulas de Euler, que por ejemplo se escriben de la forma 1 1 i sen a = ( eia – e-ia ) ; cos a = ( eia + e ia ) 2 2 Se le debe también la utilización de las letras e para “el número cuyo logaritmo hiperbólico vale 1”, i para representar la unidad imaginaria en el campo complejo con valor -1, p para representar la razón de la longitud de la circunferencia al diámetro, así como la definición de las potencias de base e como límites infinitos. En Institutionis calculi differentialis, considera el cociente de diferenciales como cociente de ceros que toman valores finitos, estudiando las diferencias finitas y abarcando las diferencias y sumas de potencias como operaciones inversas, estudiando también la suma de factoriales de exponentes positivos y negativos. Distingue entre las derivadas ordinarias y las derivadas parciales, de las que también da un simbolismo especial. Para funciones de varias variables, expone el teorema sobre las funciones homogéneas que lleva su nombre, así como la condición de integrabilidad de una expresión diferencial. En el estudio de las series, da un método de cálculo utilizando la diferencia de los coeficientes, que da re1 = 1+ x + x2 + x3+..., sultados inadmisibles para algunas series divergentes. Así, utiliza la serie binomial 1- x para valores de x ³ 1. De hecho, combinando las dos series x = x+ x2 + x3 + x4+... 1- x x 1 1 1 = 1+ + 2 + 3 +... x- 1 x x x TEMARIO DE MATEMÁTICAS. PRUEBA A

169


170


donde K 2 < 1. Existen tablas de estas integrales, tabuladas para cada K fija y valores variables de q.

concluye Euler que

1 1 1 + + + 1+ x+ x 2 + x3+...= 0 x3 x2 x

q

1- K sen t 2

2

dt

y

...+

F ( K , q ) = ò0

E ( K , q ) = ò0 1- K 2 sen 2 t dt q

Las soluciones polinómicas de esta ecuación para valores enteros positivos de n se conocen con el nombre de polinomios de Legendre. Legendre se esforzó bastante en reducir las integrales elípticas, es decir las cuadraturas de la forma ò R ( x, s )dx, donde R es una función racional y s es la raíz cuadrada de un polinomio en x de tercer o cuarto grado, a tres formas canónicas que llevan su nombre. Las integrales elípticas de primera y segunda especie en la forma de Legendre son:

Pese a tales osadías, Euler obtuvo, manipulando series infinitas, resultados que sus predecesores habían perseguido sin éxito. En su obra Institutiones calculi integralis, escrita cuando ya estaba ciego, trata los temas comunes del cálculo integral actual, desde la cuadratura hasta la integración de ecuaciones diferenciales ordinarias y con derivadas parciales. Si de algo se enorgullecía Euler, era de que sus aplicaciones eran todas algebraicas, jactándose de que no tenía que recurrir a figuras. (1- x2 ) y''-2xy'+n ( n + 1) y = 0

5.4. D’Alembert

Es un matemático que contribuye fundamentalmente en el desarrollo de la teoría de números, geometría y cálculo integral. En 1812, publica Exercices de Calcul Integral, ocupándose de las integrales eulerianas y de las integrales elípticas, expresiones que hacen así su aparición en matemática y que, por inversión dieron lugar a las llamadas funciones elípticas. Posteriormente (1827-1832) amplió algunos aspectos de esta obra en otros tres volúmenes, que constituyeron el Traité des Fonctions elliptiques et des intégrales eulériennes, dando cabida a las investigaciones de Abel y Jacobi. En estos tratados y otros anteriores introdujo el nombre de “integrales eulerianas” para designar a las funciones beta y gamma, creando algunas herramientas básicas del análisis, que resultaron tan útiles a los físicos matemáticos, que desde entonces llevan su nombre. Entre ellas están las funciones de Legendre, que son soluciones de la ecuación diferencial de Legendre:

Colaboró con Diderot (1713-1784) en la realización de los 28 volúmenes de la famosa Enciclopédie o Dictionnaire raisonné des Sciences, des arts et des métiers. Creía que los logaritmos de los números negativos eran reales y Euler lo convenció de que eran imaginarios y de que cualquier número positivo o negativo, tiene no sólo un logaritmo, sino infinitos, puesto que e i( q± 2kp ) = cos q + i sen q, implica que si c = ln a, entonces c ± 2kpi ( k = 0,1,2,..., n ,... ) son también logaritmos naturales y distintos de a. D’Alembert dedicó mucho tiempo a demostrar que toda ecuación polinómica f ( x )= 0 con coeficientes complejos y de grado n ³ 1tiene al menos una raíz compleja, resultado que conocemos hoy como “Teorema fundamental del álgebra”. El estudio de la cuerda vibrante le condujo a la ecuación en derivad 2u d 2u das parciales 2 = 2 para la que en 1747 (en las Memoirs de la Academia de Berlín), dio la solución dt dx u = f ( x+ t )+ g ( x - t ), siendo f y g funciones arbitrarias según él. Posteriormente, encontró la solución singular de un tipo de ecuación diferencial un poco más general: y = xf ( y ' )+ g ( y' ) y por ello a esta ecuación se le conoce con el nombre de “ecuación de D’Alembert”.

5.5. Legendre

Colaboró con Diderot (1713-1784) en la realización de los 28 volúmenes de la famosa Enciclopédie o Dictionnaire raisonné des Sciences, des arts et des métiers. Creía que los logaritmos de los números negativos eran reales y Euler lo convenció de que eran imaginarios y de que cualquier número positivo o negativo, tiene no sólo un logaritmo, sino infinitos, puesto que e i( q± 2kp ) = cos q + i sen q, implica que si c = ln a, entonces c± 2kpi ( k = 0,1,2,..., n ,... ) son también logaritmos naturales y distintos de a. D’Alembert dedicó mucho tiempo a demostrar que toda ecuación polinómica f ( x )= 0 con coeficientes complejos y de grado n ³ 1tiene al menos una raíz compleja, resultado que conocemos hoy como “Teorema fundamental del álgebra”. El estudio de la cuerda vibrante le condujo a la ecuación en derivad 2u d 2u das parciales 2 = 2 para la que en 1747 (en las Memoirs de la Academia de Berlín), dio la solución dt dx u = f ( x+ t )+ g ( x - t ), siendo f y g funciones arbitrarias según él. Posteriormente, encontró la solución singular de un tipo de ecuación diferencial un poco más general: y = xf ( y ' )+ g ( y' ) y por ello a esta ecuación se le conoce con el nombre de “ecuación de D’Alembert”.

5.5. Legendre

Es un matemático que contribuye fundamentalmente en el desarrollo de la teoría de números, geometría y cálculo integral. En 1812, publica Exercices de Calcul Integral, ocupándose de las integrales eulerianas y de las integrales elípticas, expresiones que hacen así su aparición en matemática y que, por inversión dieron lugar a las llamadas funciones elípticas. Posteriormente (1827-1832) amplió algunos aspectos de esta obra en otros tres volúmenes, que constituyeron el Traité des Fonctions elliptiques et des intégrales eulériennes, dando cabida a las investigaciones de Abel y Jacobi. En estos tratados y otros anteriores introdujo el nombre de “integrales eulerianas” para designar a las funciones beta y gamma, creando algunas herramientas básicas del análisis, que resultaron tan útiles a los físicos matemáticos, que desde entonces llevan su nombre. Entre ellas están las funciones de Legendre, que son soluciones de la ecuación diferencial de Legendre:

5.4. D’Alembert

(1- x2 ) y''-2xy'+n ( n + 1) y = 0

Las soluciones polinómicas de esta ecuación para valores enteros positivos de n se conocen con el nombre de polinomios de Legendre. Legendre se esforzó bastante en reducir las integrales elípticas, es decir las cuadraturas de la forma ò R ( x, s )dx, donde R es una función racional y s es la raíz cuadrada de un polinomio en x de tercer o cuarto grado, a tres formas canónicas que llevan su nombre. Las integrales elípticas de primera y segunda especie en la forma de Legendre son:

Pese a tales osadías, Euler obtuvo, manipulando series infinitas, resultados que sus predecesores habían perseguido sin éxito. En su obra Institutiones calculi integralis, escrita cuando ya estaba ciego, trata los temas comunes del cálculo integral actual, desde la cuadratura hasta la integración de ecuaciones diferenciales ordinarias y con derivadas parciales. Si de algo se enorgullecía Euler, era de que sus aplicaciones eran todas algebraicas, jactándose de que no tenía que recurrir a figuras. q

dt

E ( K , q ) = ò0 1- K 2 sen 2 t dt

1 1 1 + + + 1+ x+ x 2 + x3+...= 0 x3 x2 x

F ( K , q ) = ò0

1- K 2 sen 2 t

y

q

...+

donde K 2 < 1. Existen tablas de estas integrales, tabuladas para cada K fija y valores variables de q.

concluye Euler que

170




5.6. Lagrange La preferencia por los métodos analíticos, característica del siglo XVIII, se acentúa en Lagrange, creador de la “mecánica analítica”, como una rama de la matemática. En análisis se ocupó de funciones de varias variables y de ecuaciones con derivadas parciales; le pertenece el método de integración de ecuaciones diferenciales lineales llamado de la “variación de las constantes”. La aplicación de las fracciones continuas a la integración de ecuaciones diferenciales le permitió expresar, mediante una fracción continua, gran parte de las funciones elementales. En 1797, publicó su Théorie des fonctions analytiques, donde expone los principios del cálculo infinitesimal de manera original, aunque poco rigurosa. Del mismo procede nuestro nombre para la “derivada”, así como las notaciones usadas hoy de f '( x ), f ''( x ), ..., f ( n) ( x ),..., para las sucesivas derivadas de una función f ( x ). La idea directriz de la obra no era intentar hacer un cálculo más útil o más fácil de aplicar, sino hacerlo más satisfactorio desde un punto de vista lógico, es decir, más riguroso. Con el propósito de evitar los infinitamente pequeños, e independizarlo de toda consideración geométrica o mecánica, funda ese cálculo tomando como fórmula fundamental la serie de Taylor. En este desarrollo, denomina “derivadas” a los coeficientes de aquel, desarrollando el mismo en forma finita. Aunque tal “método de derivadas” no es riguroso (el fundamento está sin fundamentar) fue merito de Lagrange haber asignado al teorema de Taylor la importancia que tiene en el análisis. Una de sus contribuciones más importantes es el cálculo de variaciones. Se trata de una nueva rama de la matemática, cuyo nombre deriva de las notaciones usadas por Lagrange desde 1760. En su forma más simb ple, de lo que trata es de determinar una cierta relación funcional y = f ( x ) tal que una integral òa g ( x, y )dx, tome un valor máximo o mínimo. Los problemas de isoperimetrías son casos especiales del problema general del cálculo de variaciones. En 1755 Lagrange escribió a Euler exponiendole los métodos generales que había desarrollado para atacar los problemas anteriores y Euler retrasó la publicación de algunos resultados propios relacionados con el tema, pues consideró que los nuevos métodos de Lagrange eran superiores.

6. EL SIGLO XIX En líneas muy generales, tres rasgos caracterizan la matemática del siglo XIX. En primer lugar, a la par del gran desarrollo y científico del siglo, muestra una fecundidad asombrosa que se revela en el incremento del número de científicos y trabajos así como la creación de sociedades y revistas especializadas y la celebración de reuniones nacionales e internacionales. En segundo lugar el notable cambio que experimenta la matemática en su estructura íntima al conferirle una unidad y autonomía que había perdido desde los tiempos helénicos. El tercer rasgo es el cambio que experimentará en sus fundamentos. Acentuada su autonomía, hacia el último cuarto del siglo comienzan a prevalecer conceptos, que prefiguran una nueva matemática, pudiendo señalarse la década de los ochenta como fecha fronteriza, según expresión de Rey Pastor, entre una matemática clásica y una moderna o lo que es lo mismo, entre dos maneras de fundamentar la matemática, típicas del siglo XIX y del siglo XX. A comienzos del XIX, los métodos infinitesimales sistematizados por Euler y aplicados con éxito por Lagrange y Laplace seguían vivos. Sin embargo desde el punto de vista estrictamente matemático, seguían sin fundamentos sólidos a pesar de los esfuerzos sólidos que se habían hecho para sustituir por conceptos más precisos aquellos vagos infinitamente pequeños que eran cero y no eran cero y aquellos incrementos evanescentes que actuaban ya como cantidades finitas, ya como valores nulos. Llamaba la atención que en la ciencia deductiva por antonomasia se aceptara durante casi dos siglos que una rama tan importante como el cálculo infinitesimal descansara sobre bases tan débiles y discutibles. La explicación puede encontrarse en que dichos métodos habían surgido en función de exigencias externas, logrando resonantes triunfos por lo que ante el éxito de sus aplicaciones se descuidó el análisis de sus fundamentos. Estudiaremos ahora la contribución de algunos matemáticos al desarrollo del cálculo diferencial.

6.1. Bolzano En numerosas cuestiones se adelantó Bolzano a los rigurosos analistas del siglo XIX: en el concepto de función continua, en el criterio de convergencia de series (que se le atribuye a Cauchy), en la existencia de funciones continuas sin derivada (que se le suele atribuir a Weierstrass), pero por publiTEMARIO DE MATEMÁTICAS. PRUEBA A

171


172


car sus escritos de análisis en Praga, ciudad entonces alejada de los centros científicos o por permanecer inéditos como su Teoría de funciones que se publicó en 1930, la influencia de sus ideas en la época fue bastante escasa. con restricciones adecuadas sobre f ( x ) y g ( x ) en el intervalo [ a , b ]. f ( b )- f ( a ) f '( x0 ) = g ( b )- g ( a ) g '( x0 )

6.2. Cauchy

que no es sino una generalización del teorema de Rolle, conocido un siglo antes. En la actualidad se suele conocer como teorema del valor medio de Cauchy a la forma más general

En tres de sus libros, el Tours d’analyse de l’Ecole Polytechnique (1821), el Résumé des leçons sur le calcul infinitesimal (1823) y las Leçons sur le calcul différentiel (1829) dio al cálculo infinitesimal elemental, la forma que tiene hoy. En ellos vuelve al clásico rigor geométrico, delimitando el campo de validez de las fórmulas y eliminando toda extensión ilegítima. Con estas condiciones rigurosas y mediante las adecuadas definiciones de función, continuidad y límite, funda el análisis sobre bases más firmes que sus antecesores. Rechaza el planteamiento de Lagrange basado en el desarrollo en serie de potencias del teorema de Taylor, tomando como fundamental el concepto de límite de D’Alembert, considerando los infinitésimos como variables en lugar de constantes muy pequeñas. Su cálculo se basa en los conceptos fundamentales de función y de límite de una función. Para definir la derivada de la función y = f ( x )con respecto a x, le da a la variable x un incremento Dx = i, formando el cociente f '( x0 ) =

f ( b )- f ( a ) b- a

entonces el límite S de estas sumas, según las longitudes de los intervalos xi - xi-1 disminuyen indefinidamente es por definición la integral de la función f ( x ) en el intervalo que va desde x = x0 a x = X . Al definir la integral independiente del proceso de diferenciación, necesitó demostrar la relación que existe entre la integral y la antiderivada. Para ello utilizó el teorema del valor medio: Si f ( x ) es continua sobre el intervalo cerrado [ a , b ] y diferenciable en el intervalo abierto ( a , b), entonces existe al menos un valor x0 tal que a < x0 < b, que S n = ( x1- x0 ) f ( x0 )+ ( x2 - x1 ) f ( x1 ) +...+ ( X - xn-1 ) f ( xn-1 ) Dy f ( x+ i )- f ( x ) = Dx i

definiendo la derivada f '( x ) de y con respecto a x, como el límite de este cociente de diferencias cuando i tiende a cero. La diferencial (tan importante para Leibniz), la relega a un papel secundario y la define para la función y = f ( x ), como dy = f '( x )dx. Da también una definición satisfactoria de función continua: “La función f ( x )es continua entre límites dados de la variable x, si entre estos límites un incremento infinitamente pequeño i de la variable x siempre da lugar a un incremento infinitamente pequeño f ( x+ i )- f ( x ) de la función”, definición análoga a la empleada en la actualidad. Retoma el concepto de integral como una suma y no como la operación inversa de la diferenciación, ya que observó que si bien no existía la derivada de una función en un punto anguloso o en un punto en el que la función fuera discontinua, la integral podía no ofrecer dificultad alguna. Por ello, recupera el sentido geométrico original de la integral como área y define la integral definida como el límite de las sumas integrales, definición no muy distinta a la actual salvo que siempre tomaba el valor de la función correspondiente a cada subintervalo en el extremo izquierdo del mismo. Así si

definiendo la derivada f '( x ) de y con respecto a x, como el límite de este cociente de diferencias cuando i tiende a cero. La diferencial (tan importante para Leibniz), la relega a un papel secundario y la define para la función y = f ( x ), como dy = f '( x )dx. Da también una definición satisfactoria de función continua: “La función f ( x )es continua entre límites dados de la variable x, si entre estos límites un incremento infinitamente pequeño i de la variable x siempre da lugar a un incremento infinitamente pequeño f ( x+ i )- f ( x ) de la función”, definición análoga a la empleada en la actualidad. Retoma el concepto de integral como una suma y no como la operación inversa de la diferenciación, ya que observó que si bien no existía la derivada de una función en un punto anguloso o en un punto en el que la función fuera discontinua, la integral podía no ofrecer dificultad alguna. Por ello, recupera el sentido geométrico original de la integral como área y define la integral definida como el límite de las sumas integrales, definición no muy distinta a la actual salvo que siempre tomaba el valor de la función correspondiente a cada subintervalo en el extremo izquierdo del mismo. Así si Dy f ( x+ i )- f ( x ) = Dx i

S n = ( x1- x0 ) f ( x0 )+ ( x2 - x1 ) f ( x1 ) +...+ ( X - xn-1 ) f ( xn-1 )

En tres de sus libros, el Tours d’analyse de l’Ecole Polytechnique (1821), el Résumé des leçons sur le calcul infinitesimal (1823) y las Leçons sur le calcul différentiel (1829) dio al cálculo infinitesimal elemental, la forma que tiene hoy. En ellos vuelve al clásico rigor geométrico, delimitando el campo de validez de las fórmulas y eliminando toda extensión ilegítima. Con estas condiciones rigurosas y mediante las adecuadas definiciones de función, continuidad y límite, funda el análisis sobre bases más firmes que sus antecesores. Rechaza el planteamiento de Lagrange basado en el desarrollo en serie de potencias del teorema de Taylor, tomando como fundamental el concepto de límite de D’Alembert, considerando los infinitésimos como variables en lugar de constantes muy pequeñas. Su cálculo se basa en los conceptos fundamentales de función y de límite de una función. Para definir la derivada de la función y = f ( x )con respecto a x, le da a la variable x un incremento Dx = i, formando el cociente

entonces el límite S de estas sumas, según las longitudes de los intervalos xi - xi-1 disminuyen indefinidamente es por definición la integral de la función f ( x ) en el intervalo que va desde x = x0 a x = X . Al definir la integral independiente del proceso de diferenciación, necesitó demostrar la relación que existe entre la integral y la antiderivada. Para ello utilizó el teorema del valor medio: Si f ( x ) es continua sobre el intervalo cerrado [ a , b ] y diferenciable en el intervalo abierto ( a , b), entonces existe al menos un valor x0 tal que a < x0 < b, que f '( x0 ) =

f ( b )- f ( a ) b- a

que no es sino una generalización del teorema de Rolle, conocido un siglo antes. En la actualidad se suele conocer como teorema del valor medio de Cauchy a la forma más general

6.2. Cauchy

f ( b )- f ( a ) f '( x0 ) = g ( b )- g ( a ) g '( x0 ) con restricciones adecuadas sobre f ( x ) y g ( x ) en el intervalo [ a , b ].

car sus escritos de análisis en Praga, ciudad entonces alejada de los centros científicos o por permanecer inéditos como su Teoría de funciones que se publicó en 1930, la influencia de sus ideas en la época fue bastante escasa. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


172


6.3. Riemann Además de su contribución a los fundamentos de la geometría, tiene importantes aportaciones a las distintas ramas del análisis matemático. Así, se le debe un concepto de integral definida más general que el de Cauchy, pues incluye el caso en el que la función admite infinitas discontinuidades, siempre que se mantenga acotada. Se ocupó además con éxito de las funciones elípticas, de las series trigonométricas (donde alude a la existencia de funciones continuas sin derivada) y de la integración de ecuaciones diferenciales. La definición de integral definida sobe un intervalo que se suele utilizar actualmente , en términos de sumas superiores e inferiores, se conoce como “integral de Riemann”, en honor al hombre que dio las condiciones necesarias y suficientes para que una función acotada sea integrable.

6.4. Weierstrass Karl Weierstrass es el creador de una nueva dirección en el estudio de las funciones analíticas de variable compleja. Mientras que Cauchy y Riemann estudian como tales aquellas funciones que tienen derivada única en cada punto, es decir , cuyas componentes real e imaginaria satisfacen la ecuación diferencial de Laplace, Weierstrass llama función analítica a toda función definida mediante una serie de potencias convergentes en cierto recinto que, mediante determinadas condiciones es posible “prolongar” por círculos sucesivos. En conexión con esa teoría, Weierstrass utilizó de forma sistemática el concepto de convergencia uniforme que Cauchy no poseyó. También se le debe el rigor aritmético introducido en el cálculo de variaciones y un ejemplo de función continua sin derivada en ninguno de sus puntos. A finales del XIX, aparecen editados los grandes tratados de análisis (el de Jordan y el de Courant-Hilbert). En ellos aparece ya rigurosamente lo que hoy en día constituye los fundamentos del Análisis Funcional.

7. EL SIGLO XX También aportaron mucho al desarrollo del análisis durante este siglo algunos matemáticos entre los que cabe citar a Poincaré, Lebesgue y Hilbert, al que se le debe uno de los últimos ejemplos de construcción del análisis: el espacio de Hilbert. Además ha habido extensiones muy importantes de la teoría, con las que se han podido abordar problemas inaccesibles por los métodos clásicos. Por ejemplo la teoría de la medida es la prolongación natural de la integral. La irrupción de las nuevas tecnologías y en especial el ordenador han influido en un desarrollo espectacular de la matemática en el siglo XX. Incluso los métodos de trabajo de los matemáticos comienzan a cambiar debido a las grandes posibilidades de experimentación y modelización de estructuras complejas que pueden realizarse a través del ordenador.

7.1. Poincaré Fue un matemático universal, pues prácticamente dominaba todas las ramas de la matemática, tanto puras como aplicadas a pesar de tener grandes dificultades en cálculo aritmético. Su tesis doctoral fue un trabajo sobre ecuaciones diferenciales, pero no sobre métodos de resolución, sino sobre teoremas de existencia, lo que lo llevó a una de sus más famosas contribuciones a la matemática: el estudio de las propiedades de las funciones automorfas, de la teoría de las cuales fue prácticamente su fundador. Una función automorfa f ( z ) de la variable compleja z es una que es analítica en un dominio D, excepto en los polos correspondientes y que es invariante bajo un grupo infinito numerable de transformaciones lineales fraccionarias o de Möbius z '=

az + b cz + d

Murió en plena culminación de sus facultades a los 58 años de edad, después de haber escrito más que ningún otro matemático del siglo XX. TEMARIO DE MATEMÁTICAS. PRUEBA A

173

174



7.2. Hilbert Su influencia en la matemática se ejerció durante casi toda la primera mitad del siglo XX. Es famoso su discurso pronunciado en el congreso de París de 1900, sobre los “problemas de la matemática” en el que enumeró 23 problemas matemáticos que entonces esperaban solución. En gran medida la matemática del siglo XX ha evolucionado a partir del estudio de esos problemas, en su mayor parte resueltos, pero dejando tras de sí nuevos problemas. Tal como decía él: “Mientras una rama de la Ciencia ofrezca problemas en abundancia, esa rama estará viva”. En el campo del análisis, introduce entre 1900 y 1910 los llamados “espacios de Hilbert”, que permiten geometrizar el análisis y abren el camino al análisis funcional moderno.

7.3. Lebesgue En su tesis doctoral, en 1902 reconstruye de una manera prácticamente completa el campo de la teoría de la integración, apartándose de todos los puntos de vista sobre la misma aceptados generalmente. Ello le hizo ser muy criticado, aunque pronto fue reconocido el valor de sus ideas. A pesar de que su concepto de integral era un ejemplo de generalización, Lebesgue temía que “reducida a teorías generales, la matemática se convertiría en una bella forma sin contenido y moriría muy rápidamente”. Reflexionando sobre los trabajos de Borel acerca de los conjuntos de números reales, vio que la definición de Riemann de la integral tenía el inconveniente de que sólo se podía aplicar en casos excepcionales, ya que supone que la función tiene sólo “unos pocos” puntos de discontinuidad. Si una función y = f ( x ) tiene muchos puntos de discontinuidad, entonces aunque el intervalo ( xi , xi+1), se haga pequeño, los valores de f ( xi+1 ) y de f ( xi ), o valores intermedios de la función, no serán necesariamente próximos. Lebesgue entonces sustituyó las sumas de Riemann S n = å f ( xi )× Di, por las del tipo S n = åh i × m( Ei )y a continuación hace tender a cero los intervalos Dyi. Lo que hace es subdividir el rango de la función f en intervalos parciales Dyi y seleccionar un valor h i dentro de cada intervalo parcial. Así considera la medida m( Ei )del conjunto Ei de todos los puntos del eje de las x, para los que los valores de f ( x )son “aproximadamente iguales” a h i (en sentido preciso, caen en el intervalo Dyi al que pertenece h i). La obra de Lebesgue y otros matemáticos contemporáneos suyos respecto a la teoría de la integral ha alterado de una manera tan profunda el concepto de integral, a través de sucesivas generalizaciones, que se ha llegado a decir que, aunque la integración es tan antigua como la época de Arquímedes, la teoría de la integral es una creación del siglo XX.

Para llegar a justificar y clasificar el cálculo infinitesimal que se conoce hoy en día, ha sido necesario navegar por tres siglos en los conceptos básicos de la matemática, tratando de dar sentido a los procesos que constituyen su esencia. Las nociones precisas de límite, derivada, diferencial, etc., han sido las herramientas que hubo que poner a punto para desarrollar y justificar el cálculo. Hoy en día, cualquier alumno de nivel medio podría asimilar en poco tiempo la mayor parte de las matemáticas descubiertas y desarrolladas en tres siglos.

8. CONCLUSIÓN

En su tesis doctoral, en 1902 reconstruye de una manera prácticamente completa el campo de la teoría de la integración, apartándose de todos los puntos de vista sobre la misma aceptados generalmente. Ello le hizo ser muy criticado, aunque pronto fue reconocido el valor de sus ideas. A pesar de que su concepto de integral era un ejemplo de generalización, Lebesgue temía que “reducida a teorías generales, la matemática se convertiría en una bella forma sin contenido y moriría muy rápidamente”. Reflexionando sobre los trabajos de Borel acerca de los conjuntos de números reales, vio que la definición de Riemann de la integral tenía el inconveniente de que sólo se podía aplicar en casos excepcionales, ya que supone que la función tiene sólo “unos pocos” puntos de discontinuidad. Si una función y = f ( x ) tiene muchos puntos de discontinuidad, entonces aunque el intervalo ( xi , xi+1), se haga pequeño, los valores de f ( xi+1 ) y de f ( xi ), o valores intermedios de la función, no serán necesariamente próximos. Lebesgue entonces sustituyó las sumas de Riemann S n = å f ( xi )× Di, por las del tipo S n = åh i × m( Ei )y a continuación hace tender a cero los intervalos Dyi. Lo que hace es subdividir el rango de la función f en intervalos parciales Dyi y seleccionar un valor h i dentro de cada intervalo parcial. Así considera la medida m( Ei )del conjunto Ei de todos los puntos del eje de las x, para los que los valores de f ( x )son “aproximadamente iguales” a h i (en sentido preciso, caen en el intervalo Dyi al que pertenece h i). La obra de Lebesgue y otros matemáticos contemporáneos suyos respecto a la teoría de la integral ha alterado de una manera tan profunda el concepto de integral, a través de sucesivas generalizaciones, que se ha llegado a decir que, aunque la integración es tan antigua como la época de Arquímedes, la teoría de la integral es una creación del siglo XX.

8. CONCLUSIÓN

Para llegar a justificar y clasificar el cálculo infinitesimal que se conoce hoy en día, ha sido necesario navegar por tres siglos en los conceptos básicos de la matemática, tratando de dar sentido a los procesos que constituyen su esencia. Las nociones precisas de límite, derivada, diferencial, etc., han sido las herramientas que hubo que poner a punto para desarrollar y justificar el cálculo. Hoy en día, cualquier alumno de nivel medio podría asimilar en poco tiempo la mayor parte de las matemáticas descubiertas y desarrolladas en tres siglos.

7.3. Lebesgue Su influencia en la matemática se ejerció durante casi toda la primera mitad del siglo XX. Es famoso su discurso pronunciado en el congreso de París de 1900, sobre los “problemas de la matemática” en el que enumeró 23 problemas matemáticos que entonces esperaban solución. En gran medida la matemática del siglo XX ha evolucionado a partir del estudio de esos problemas, en su mayor parte resueltos, pero dejando tras de sí nuevos problemas. Tal como decía él: “Mientras una rama de la Ciencia ofrezca problemas en abundancia, esa rama estará viva”. En el campo del análisis, introduce entre 1900 y 1910 los llamados “espacios de Hilbert”, que permiten geometrizar el análisis y abren el camino al análisis funcional moderno.

7.2. Hilbert CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


174

TEMA

34 Análisis y formalización de los conceptos geométricos intuitivos: incidencia, paralelismo, perpendicularidad, ángulo, etc.




176


ÍNDICE SISTEMÁTICO INTRODUCCIÓN

2.

GEOMETRÍA PLANA 2.1. Recta y segmentos rectilíneos 2.1.1. Línea recta. Propiedades 2.1.2. Segmentos rectilíneos 2.1.3. Operaciones con segmentos rectilíneos 2.1.4. Medida de segmentos rectilíneos 2.2. Línea quebrada, línea curva, línea mixta 2.3. Ángulos 2.3.1. Generación de ángulos por el movimiento 2.3.2. Operaciones con ángulos 2.3.3. Medida de ángulos 2.4. Perpendiculares

3.

GEOMETRÍA DEL ESPACIO 3.1. Definición intuitiva de plano 3.1.1. División del espacio por un plano 3.2. Posiciones relativas de recta y plano 3.3. Posiciones relativas de dos rectas en el espacio 3.4. Posiciones relativas de dos planos en el espacio 3.5. Paralelismo en el espacio 3.5.1. Paralelismo de rectas 3.5.2. Paralelismo de rectas y planos 3.5.3. Paralelismo de planos 3.6. Ángulo de dos rectas 3.7. Perpendicularidad de rectas y planos 3.7.1. Recta perpendicular a un plano 3.7.2. Plano perpendicular a una recta 3.8. Perpendiculares de planos 3.9. Proyecciones sobre un plano 3.9.1. Ángulo de recta y plano

GEOMETRÍA DEL ESPACIO 3.1. Definición intuitiva de plano 3.1.1. División del espacio por un plano 3.2. Posiciones relativas de recta y plano 3.3. Posiciones relativas de dos rectas en el espacio 3.4. Posiciones relativas de dos planos en el espacio 3.5. Paralelismo en el espacio 3.5.1. Paralelismo de rectas 3.5.2. Paralelismo de rectas y planos 3.5.3. Paralelismo de planos 3.6. Ángulo de dos rectas 3.7. Perpendicularidad de rectas y planos 3.7.1. Recta perpendicular a un plano 3.7.2. Plano perpendicular a una recta Perpendiculares de planos Proyecciones sobre un plano 3.9.1. Ángulo de recta y plano 3.8. 3.9.

3.

1.

2.4.

GEOMETRÍA PLANA 2.1. Recta y segmentos rectilíneos 2.1.1. Línea recta. Propiedades 2.1.2. Segmentos rectilíneos 2.1.3. Operaciones con segmentos rectilíneos 2.1.4. Medida de segmentos rectilíneos 2.2. Línea quebrada, línea curva, línea mixta 2.3. Ángulos 2.3.1. Generación de ángulos por el movimiento 2.3.2. Operaciones con ángulos 2.3.3. Medida de ángulos Perpendiculares

2.

INTRODUCCIÓN

1.



176

Análisis y formalización de los conceptos geométricos intuitivos

1. INTRODUCCIÓN La observación de los objetos materiales nos proporciona las primeras nociones geométricas. Entre ellas destacar la noción de espacio que intuitivamente aparece como el continente de todos los objetos sensibles que coexisten. A la hora de definir el marco de trabajo caracterizamos al espacio por ser continuo, es decir, sin interrupción: ilimitado; homogéneo sin diversidad alguna entre sus partes; divisible... Apoyándonos en esto podemos definir un cuerpo geométrico como una parte limitada del espacio, constando de tres dimensiones: longitud, latitud (anchura) y altura, denominándose volumen al número que expresa la medida de un cuerpo geométrico. Al hablar de cuerpo nos referimos a cuerpo geométrico, que es ideal, inmaterial y, por tanto, penetrable. Llamamos superficie al límite o terminación de un cuerpo; o el límite que separa dos partes continuas de un cuerpo. En la superficie se aprecian sólo dos dimensiones: longitud y latitud (anchura). El número que expresa la medida de una superficie se denomina área. Se entiende por línea el límite o contorno de una superficie, o el límite que separa dos partes continuas de una superficie, o la intersección de dos superficies. En la línea se estima una sola dimensión, la longitud. El número que expresa la medida en una línea recibe el nombre de longitud. Punto es el extremo o terminación de una línea, o el límite que separa dos partes continuas de una línea, o la intersección de dos líneas. En el punto geométrico no se admite ninguna dimensión. El punto, la recta y el plano se denominan elementos geométricos simples. Los cuerpos geométricos, las superficies, las líneas y los puntos no pueden existir aislados en el espacio; son elementos constitutivos de los objetos materiales, y únicamente los separamos de estos, por abstracción, para su estudio. Los cuerpos, las superficies y las líneas son divisibles, es decir, constan de partes; en todo cuerpo hay superficies; en toda superficie líneas, y en toda línea, infinidad de puntos. El punto es indivisible. Llamamos figura geométrica al conjunto de elementos geométricos, o partes de ellos. Toda figura geométrica se considera continua pero penetrable, es decir, puede ser atravesada en todas las direcciones y sentidos. En cada figura geométrica distinguimos su extensión, su forma y su posición, verificándose que sin deformarse, toda figura geométrica puede: a) b) c) d) e)

Moverse en el espacio. Ocupar una posición cualquiera en el espacio. Trasladarse hasta que uno de sus puntos coincida con otro punto determinado del espacio. Girar alrededor de uno de sus puntos. Girar alrededor de dos de sus puntos.

2. GEOMETRÍA PLANA 2.1. Recta y segmentos rectilíneos 2.1.1. Línea recta. Propiedades La línea recta es la más sencilla de todas las líneas; no tiene definición propiamente dicha. La noción intuitiva de la línea recta se adquiere a través de la observación de entidades del mundo real. Asumiremos la siguiente notación: un punto se designa por una letra mayúscula, y una recta por dos letras mayúsculas, colocadas en dos puntos cualesquiera de ella. Sentidos de una recta son los dos órdenes naturales B A (contrario uno de otro) en que se encuentran los puntos de dicha recta al recorrerla de izquierda a derecha o de derecha a izquierda, de arriba abajo o de abajo arriba. Figura 1. Cada recta representa una dirección con dos sentidos opuestos. TEMARIO DE MATEMÁTICAS. PRUEBA A

177


178


Figura 4.

Si D'coincide con B decimos queCD = AB.

Mediante la intuición apoyada en la simple observación se pueden enunciar las siguientes propiedades: La línea recta es el camino más corto entre dos puntos, y en consecuencia por un punto pasan infinitas rectas. Por dos puntos dados puede pasar una y sólo una línea recta. De aquí se pueden extraer las siguientes consecuencias: 1. Todas las rectas que tienen dos puntos comunes coinciden (se confunden en la misma recta). 2. Bastan dos puntos para determinar perfectamente una recta. 3. Dos rectas no pueden tener más de un punto en común, denominado punto de intersección. La línea recta es ilimitada en ambos sentidos.

–

A

Comparación de segmentos rectilíneos. Para comparar segmentos rectilíneos se los coloca en posición de superpuestos.

D´

C

B

b)

Si D'está entre A y B decimos queCD < AB. Si D' está a la derecha de B decimos que CD > AB.

a)

D

Varios segmentos son consecutivos si cada uno lo es con respecto a su inmediato. Los segmentos consecutivos pueden ser: de la misma recta (colineales) o de rectas distintas. c)

Figura 3.

Se entiende por semirrecta (rayo) cada una de las dos partes en las que queda dividida una recta al considerar como origen uno cualquiera de sus puntos. Cada una de esas partes constituye una semirrecta opuesta. D

A

B

C

B

D

A

C

A

E

O

Figura 2.

Se denomina segmento rectilíneo (segmento) a la parte de recta limitada en ambos sentidos. Los dos puntos que limitan al segmento se llaman extremos, si interesa el sentido, se llama orden del segmento al punto en que comienza y se nombra en primer término, y extremo del segmento al punto en que termina, nombrándolo al final. Como notación, un segmento se designa con las letras de sus extremos y para indicar su sentido se pone encima de ambas letras un trazo horizontal: AB se lee segmento AB. Dos segmentos que tienen en común un extremo (el origen) se hallan superpuestos si están sobre la misma semirrecta, o bien consecutivos si pertenecen a distintas semirrectas.

Como notación para las semirrectas utilizaremos dos letras mayúsculas, una para el origen, O, y otra correspondiente a cualquier punto de la misma. La parte de la recta que tiene por origen O y es ilimitada hacia la derecha (ver dibujo) constituye la semirrecta OA.

2.1.2. Segmentos rectilíneos

Se denomina segmento rectilíneo (segmento) a la parte de recta limitada en ambos sentidos. Los dos puntos que limitan al segmento se llaman extremos, si interesa el sentido, se llama orden del segmento al punto en que comienza y se nombra en primer término, y extremo del segmento al punto en que termina, nombrándolo al final. Como notación, un segmento se designa con las letras de sus extremos y para indicar su sentido se pone encima de ambas letras un trazo horizontal: AB se lee segmento AB. Dos segmentos que tienen en común un extremo (el origen) se hallan superpuestos si están sobre la misma semirrecta, o bien consecutivos si pertenecen a distintas semirrectas.

2.1.2. Segmentos rectilíneos

Como notación para las semirrectas utilizaremos dos letras mayúsculas, una para el origen, O, y otra correspondiente a cualquier punto de la misma. La parte de la recta que tiene por origen O y es ilimitada hacia la derecha (ver dibujo) constituye la semirrecta OA. O

Figura 2.

A

C

A A

B

C

D

E

B

Se entiende por semirrecta (rayo) cada una de las dos partes en las que queda dividida una recta al considerar como origen uno cualquiera de sus puntos. Cada una de esas partes constituye una semirrecta opuesta. D

Figura 3.

c)

La línea recta es el camino más corto entre dos puntos, y en consecuencia por un punto pasan infinitas rectas. Por dos puntos dados puede pasar una y sólo una línea recta. De aquí se pueden extraer las siguientes consecuencias: 1. Todas las rectas que tienen dos puntos comunes coinciden (se confunden en la misma recta). 2. Bastan dos puntos para determinar perfectamente una recta. 3. Dos rectas no pueden tener más de un punto en común, denominado punto de intersección. La línea recta es ilimitada en ambos sentidos.

Varios segmentos son consecutivos si cada uno lo es con respecto a su inmediato. Los segmentos consecutivos pueden ser: de la misma recta (colineales) o de rectas distintas.

Si D'está entre A y B decimos queCD < AB. Si D' está a la derecha de B decimos que CD > AB. Si D'coincide con B decimos queCD = AB.

C

D

A

D´

B

a)

Comparación de segmentos rectilíneos. Para comparar segmentos rectilíneos se los coloca en posición de superpuestos.

b)

–

Mediante la intuición apoyada en la simple observación se pueden enunciar las siguientes propiedades: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


178

Figura 4.

Análisis y formalización de los conceptos geométricos intuitivos Dos segmentos son iguales cuando superpuestos coinciden, decimos entonces que son superponibles o directamente o por inversión. La igualdad de segmentos satisface las propiedades idéntica, recíproca y transitiva de la misma forma que los números naturales.

2.1.3. Operaciones con segmentos rectilíneos –

Suma. La suma de dos segmentos rectilíneos es el segmento determinado por los extremos no comunes de esos segmentos, o de otros respectivamente iguales a ellos, colocados en posición de consecutivos sobre una recta. AB + BC = AC

a

b B

A

C

Figura 5. Si las longitudes respectivas de los segmentos fueran a y b, la suma s sería: s = a+b La suma de varios segmentos es el segmento que se obtiene sumando dos de ellos, la suma hallada, con otro de los propuestos; el resultado, con otro, y así sucesivamente, hasta operar con todos los segmentos dados. La suma de segmentos tiene las mismas propiedades que la suma de números. Para sumar segmentos se los coloca en posición de consecutivos sobre una recta.

–

Diferencia. La diferencia de dos segmentos es el segmento que sumado con el menor de ellos da como resultado el mayor de los mismos. Restar dos segmentos es hallar la diferencia de ellos. Para restar dos segmentos se los coloca en posición de superpuestos; el segmento determinado por los extremos no comunes es la diferencia entre ambos segmentos. m

ON – OM = MN

n O

M

N

Figura 6.

–

Producto de un segmento por un número natural. El producto de un segmento por un número natural es el segmento suma de tantos segmentos iguales al dado como unidades tenga el número natural. Multiplicar un segmento por un número es hallar su producto por ese número. Múltiplo de un segmento es el producto de dicho segmento por un número natural.

Ø

–

Postulado de Arquímedes. Dados dos segmentos, siempre existe un segmento múltiplo de uno de ellos que es mayor que el otro.

Cociente entre un segmento y un número natural. El cociente entre un segmento y un número natural es el segmento que multiplicado por dicho número da como producto el segmento propuesto.


179


180


Dividir un segmento por un número es hallar su cociente por ese número. Todo segmento se puede dividir en n partes iguales (siempre que n sea un número natural). La razón de dos segmentos es el número por el que se ha de multiplicar uno de ellos para obtener el otro.

Figura 9.

F

E

B

A

C

G

2.1.4. Medida de segmentos rectilíneos Como se han definido anteriormente la igualdad y la suma de segmentos, podemos afirmar que estos son magnitudes mensurables. Así pues, medir un segmento es compararlo con otro que se denomina segmento unidad, siendo la medida de un segmento la razón entre dicho segmento y el segmento unidad (cuántas veces contiene al segmento unidad), siendo la longitud de un segmento el número que expresa la medida del mismo. Dado que todo segmento puede representarse por su longitud, para comparar y operar con segmentos basta comparar y operar sus longitudes. La distancia entre dos puntos viene dada por la medida del segmento que los une. D

H

Figura 8.

A

B

El origen del primer segmento y el extremo del último constituyen, respectivamente, el origen y el extremo de la línea poligonal. Cada uno de los diversos segmentos que constituyen la poligonal se denominan lados. Distinguimos entre línea poligonal abierta y cerrada, siendo aquella la que sus extremos no coinciden, mientras que en la poligonal cerrada los extremos coinciden. Se denomina curva a una línea que no es recta en ninguna de sus partes. La curva en la cual su origen y extremo coinciden se denomina cerrada, en caso contrario diremos que se trata de una línea curva abierta. Se denomina arco a cada una de las partes de la curva que vienen determinadas por dos puntos. Llamaremos línea mixta a aquella que se compone de segmentos rectilíneos y segmentos curvilíneos, de modo que cada dos segmentos de los que constituyan la curva tengan un solo punto en común.

2.2. Línea quebrada, línea curva, línea mixta

M

Llamamos línea quebrada o poligonal a una línea formada por varios segmentos rectilíneos consecutivos pertenecientes a distintas rectas. El origen del primer segmento y el extremo del último constituyen, respectivamente, el origen y el extremo de la línea B poligonal. E Cada uno de los diversos segmentos que constituyen la D poligonal se denominan lados. Distinguimos entre línea poligonal abierta y cerrada, A F siendo aquella la que sus extremos no coinciden, mientras que C en la poligonal cerrada los extremos coinciden. Se denomina curva a una línea que no es recta en ninguna Figura 7. de sus partes. La curva en la cual su origen y extremo coinciden se denomina cerrada, en caso contrario diremos que se trata de una M línea curva abierta. Se denomina arco a cada una de las partes de la curva que vienen determinadas por dos puntos. B A Llamaremos línea mixta a aquella que se compone de segmentos rectilíneos y segmentos curvilíneos, de modo que cada dos segmentos de los que constituyan la curva tengan un Figura 8. solo punto en común.

Figura 7. C

A

F

D

E

B

Llamamos línea quebrada o poligonal a una línea formada por varios segmentos rectilíneos consecutivos pertenecientes a distintas rectas.

2.2. Línea quebrada, línea curva, línea mixta

Como se han definido anteriormente la igualdad y la suma de segmentos, podemos afirmar que estos son magnitudes mensurables. Así pues, medir un segmento es compararlo con otro que se denomina segmento unidad, siendo la medida de un segmento la razón entre dicho segmento y el segmento unidad (cuántas veces contiene al segmento unidad), siendo la longitud de un segmento el número que expresa la medida del mismo. Dado que todo segmento puede representarse por su longitud, para comparar y operar con segmentos basta comparar y operar sus longitudes. La distancia entre dos puntos viene dada por la medida del segmento que los une. H

D

2.1.4. Medida de segmentos rectilíneos A

B

G

C E

Dividir un segmento por un número es hallar su cociente por ese número. Todo segmento se puede dividir en n partes iguales (siempre que n sea un número natural). La razón de dos segmentos es el número por el que se ha de multiplicar uno de ellos para obtener el otro. F

Figura 9.



180


2.3. Ángulos A

Se denomina ángulo a la región del plano limitada por dos semirrectas que tiene un punto en común, siendo las semirrectas los lados del ángulo y el vértice el punto en común de las semirrectas. Se dice que un ángulo es convexo cuando no contiene a las semirrectas opuestas a sus lados. Decimos que un ángulo es cóncavo cuando contiene dentro de sí a las semirrectas opuestas a sus lados. Llamamos ángulo llano a aquel cuyos lados son dos semirrectas opuestas.

O

B

Figura 10.

2.3.1. Generación de ángulos por el movimiento B

O

A

B

A

A

O A

B

Figura 11.

Un ángulo puede considerarse engendrado por el giro de una semirrecta alrededor de su origen en el plano. Si dejamos fija la semirrecta OA y permitimos que la semirrecta OB gire alrededor del punto O, cuan$ nulo o ángulo cero. Si permitimos que OB gire, el ángulo do OB coincide con OA tenemos el ángulo AOB $ va aumentando gradualmente, hasta llegar a que OB esté en la semirrecta opuesta de OA, siendo enAOB $ un ángulo llano, si el giro continúa el ángulo sigue creciendo haciéndose AOB $ cóncavo. Cuantonces AOB $ se denominará completo o ángulo de una vuelta, o ángulo do OB vuelva a coincidir con OA el ángulo AOB giro y es equivalente a dos llanos. Dos ángulos convexos que tengan en común el vértice y un lado se hallan superpuestos si pertenecen al mismo semiplano, o bien serán consecutivos si están en distinto semiplano. En dos ángulos consecutivos los lados no comunes se denominan exteriores. C

B

A

Figura 12. O

Varios ángulos son consecutivos, si cada uno lo es con el inmediato. Se dice que dos ángulos consecutivos son adyacentes si sus lados exteriores son semirrectas opuestas. B

C


o

A

181


182


Para la comparación de ángulos se sitúan en posición de superpuestos y se pueden producir las siguientes situaciones: $ entonces afirmamos que: Si el lado O' B' se sitúa dentro de AOB $ $ AOB > A 'O ' B '.

–

Diferencia. La diferencia de dos ángulos es otro ángulo tal que sumado con el menor de ellos da como resultado el mayor de los mismos.

–

Análogamente obtendremos la suma de varios ángulos sumándolos dos a dos y añadiendo a la suma un nuevo ángulo, así sucesivamente. La suma de ángulos tiene las mismas propiedades que la suma de números.

–

$ entonces: Si el lado O' B' se sitúa fuera de AOB $ < A 'O$ ' B '. AOB

–

Si O' B' coincide con OB diremos que: $ = A 'O$ ' B '. AOB

Figura 15.

$ + A 'O$ ' B '= AOC $ AOB B´

Figura 14. A

O´

A´

O´

O´

B

O

A´

O

A

B´ B

A B´

B C

A A´

–

O O´

Suma. La suma de dos ángulos es el ángulo determinado por los lados exteriores de esos ángulos, o de otros respectivamente iguales a ellos, colocados en posición de consecutivos.

Diremos, en consecuencia, que dos ángulos son iguales cuando al compararlos coinciden sus lados. La igualdad de ángulos satisface las mismas propiedades que la suma de números.

2.3.2. Operaciones con ángulos 2.3.2. Operaciones con ángulos Diremos, en consecuencia, que dos ángulos son iguales cuando al compararlos coinciden sus lados. La igualdad de ángulos satisface las mismas propiedades que la suma de números.

Suma. La suma de dos ángulos es el ángulo determinado por los lados exteriores de esos ángulos, o de otros respectivamente iguales a ellos, colocados en posición de consecutivos. O O´

–

A A´

C B

B´

A

B

B´ O

B A

O´

A´

A´

O´

A

O

$ + A 'O$ ' B '= AOC $ AOB B´

O´

Figura 14.

Si O' B' coincide con OB diremos que: $ = A 'O$ ' B '. AOB

Figura 15.

–

$ > A 'O$ ' B '. AOB $ entonces: Si el lado O' B' se sitúa fuera de AOB $ < A 'O$ ' B '. AOB

–

$ entonces afirmamos que: Si el lado O' B' se sitúa dentro de AOB

–

Análogamente obtendremos la suma de varios ángulos sumándolos dos a dos y añadiendo a la suma un nuevo ángulo, así sucesivamente. La suma de ángulos tiene las mismas propiedades que la suma de números.

–

Diferencia. La diferencia de dos ángulos es otro ángulo tal que sumado con el menor de ellos da como resultado el mayor de los mismos.

Para la comparación de ángulos se sitúan en posición de superpuestos y se pueden producir las siguientes situaciones:



182

Análisis y formalización de los conceptos geométricos intuitivos Para restar ángulos se colocan en posición de superpuestos y la diferencia vendrá dada por el ángulo determinado por los lados no comunes. B

B B´

O

A

O´

D

B´

A´

O O´

C

AÁ

O

$ – A 'O$ ' B '= COD $ AOB Figura 16.

–

Producto de un ángulo por un número natural. El producto de un ángulo por un número natural es el ángulo suma de tantos ángulos iguales al dado como unidades contenga el número natural.

–

Cociente entre un ángulo y un número natural. El cociente entre un ángulo y un número natural es otro ángulo tal que multiplicado por el número natural da como resultado el ángulo inicialmente propuesto. Todo ángulo puede dividirse en n ángulos iguales, siendo n un número natural. La bisectriz de un ángulo es la recta que parte del vértice de dicho ángulo y lo divide en dos ángulos iguales. El cálculo de la bisectriz es equivalente a dividir un ángulo entre dos. Llamamos razón de dos ángulos al número por el que se ha de multiplicar uno de ellos para obtener el otro.

2.3.3. Medida de ángulos Dado que se han definido anteriormente la igualdad y la suma de ángulos podemos afirmar que estos son magnitudes mensurables, y en consecuencia, medir un ángulo es compararlo con el ángulo unidad, siendo la medida de un ángulo la razón entre dicho ángulo y el ángulo unidad.

– – – –

Ángulo recto: aquel ángulo cuya medida es la mitad de un llano.

–

Ángulos suplementarios: aquellos ángulos cuya suma es dos rectos. El suplemento de un ángulo es otro ángulo con el que complementa o suma dos rectos.

Ángulo agudo: todo ángulo menor que un recto. Ángulo obtuso: todo ángulo mayor que un recto. Ángulos complementarios: aquellos cuya suma es un recto. El complemento de un ángulo es otro ángulo con el cual complementa o suma un recto.

Axioma: Dos ángulos iguales tienen idéntico complemento y suplemento, y recíprocamente dos ángulos que tienen el mismo complemento y suplemento son iguales. Teorema:

B

Dos ángulos adyacentes son suplementarios. $ y BOC $ dos ángulos adyacentes, entonces sus laSean AOB $ es un ándos exteriores OA y OB están en línea recta, luego AOC gulo llano.


A

C O

Figura 17.

183


184


$ + BOC $ = AOC $ . Por definición de suma de ángulos AOB Como recíproco enunciar que dos ángulos consecutivos suplementarios son adyacentes.

$ $ Por hipótesis los ángulos AOB y son opuestos por el vértice. Si consideramos que AC es una líCOD $ es el suplementario de AOB $ , y BD es otra línea recta siendo AOD $ el suplemento de COD $ , ennea y BOC $ = COD $ . tonces se verifica que AOB La suma de los ángulos consecutivos formados alrededor de un punto y en el mismo semiplano es igual a dos rectos. La suma de todos los ángulos consecutivos que se pueden formar alrededor de un punto, en un plano, es igual a cuatro rectos. Para obtener el suplemento de un ángulo basta con realizar la prolongación por el vértice de uno de los lados de ese ángulo. o

2.

Figura 20.

1.

D

Corolarios:

A

C

3.

B

B

Dos ángulos opuestos por el vértice son iguales. A

C O

Teorema:

Ángulos opuestos por el vértice: Son dos ángulos tales que los lados del uno son las semirrectas opuestas de los lados del otro. Figura 18.

Dos ángulos adyacentes iguales son rectos. Figura 19.

D

4.

C

B

A A

B

C

Figura 19.

4.

D

Dos ángulos adyacentes iguales son rectos. Ángulos opuestos por el vértice: Son dos ángulos tales que los lados del uno son las semirrectas opuestas de los lados del otro. Figura 18.

Teorema:

O C

A

Dos ángulos opuestos por el vértice son iguales. B

3.

B

La suma de los ángulos consecutivos formados alrededor de un punto y en el mismo semiplano es igual a dos rectos. La suma de todos los ángulos consecutivos que se pueden formar alrededor de un punto, en un plano, es igual a cuatro rectos. Para obtener el suplemento de un ángulo basta con realizar la prolongación por el vértice de uno de los lados de ese ángulo. C

A

Corolarios:

Figura 20.

1.

D

2.

o

$ y COD $ son opuestos por el vértice. Si consideramos que AC es una líPor hipótesis los ángulos AOB $ $ $ el suplemento de COD $ , ennea y BOC es el suplementario de AOB, y BD es otra línea recta siendo AOD $ = COD $ . tonces se verifica que AOB $ + BOC $ = AOC $ . Por definición de suma de ángulos AOB Como recíproco enunciar que dos ángulos consecutivos suplementarios son adyacentes.



184


2.4. Perpendiculares Definimos la perpendicular como la línea recta que determina con otra ángulos adyacentes iguales. $ es recto, entonces también lo son los ángulos COB $ y AOD $ ya que son el supleComo el ángulo AOC $ mento de aquel respectivamente a las rectas AB y CD, y en consecuencia también será recto el ángulo BOD $ . Entonces las rectas AB y CD son perpendiculares entre sí. por ser el opuesto por el vértice del AOC Se denomina oblicua a la recta que determina con otra ángulos adyacentes desiguales.

Teorema: Por un punto situado en una recta se puede trazar una y sólo una perpendicular a dicha recta. Sea la recta PC que forma con AB dos ángulos ad$ < CPB $ . Si se hace girar la recyacentes desiguales APC $ irá aumentando, mientras que el ánta PC el ángulo APC $ irá disminuyendo hasta que ambos ángulos se gulo CPB iguales, momento en el que la recta PC será perpendicular a la AB. Para probar que sólo se puede trazar una perpendicular atendemos a la recta PC''que es oblicua a AB, al modificar su posición C'' coincide con C'' luego por el punto P sólo se puede trazar una perpendicular a AB.

C´ C´´

C

B

P

A

Figura 21.

Teorema: Por un punto exterior a una recta se puede trazar una y sólo una perpendicular a dicha recta. P

Sea P' el simétrico de P respecto a la recta AB. Los $ y P ' DB $ son iguales y adyacentes, y en conángulos PDB secuencia las rectas AB y PP' son perpendiculares. Para probar que sólo se puede trazar una perpendicular, atendemos a un cierto punto C. Si la recta PC fuese perpendicular a la recta AB entonces tendría que verifi$ fuese recto y análogamente el carse que el ángulo PCA $ P 'CA y su suma debería ser de dos rectos. El cumplimiento de estas condiciones llevaría a que C y D coincidiesen, y en consecuencia la perpendicular sería única.

B

C

D

A

P´

Figura 22.

Teorema: Las bisectrices de dos ángulos adyacentes son perpendiculares. $ y COB $ son adyacentes, siendo Los ángulos AOC OD y OE sus bisectrices respectivas, por lo tanto el ángu$ es la mitad del ángulo COB $ , y otro tanto ocurre lo EOC $ que es la mitad del ángulo AOC $ , luecon el ángulo DOC $ $ go como AOC + COB suman dos rectos por ser adyacen$ y DOC $ suman un recto y tes, entonces los ángulos EOC en consecuencia las bisectrices son perpendiculares.

C E D B

O

A

Figura 23.


185


186


Mediatriz: Mediatriz de un segmento rectilíneo es la recta perpendicular al segmento en su punto medio.

–

Distancia de un punto a una recta: Es la longitud (del segmento) de la perpendicular desde dicho punto a la recta.

–

Teorema:

Si desde un punto exterior a una recta trazamos sobre ella una perpendicular y varias oblicuas, se verifica: 1. Que la menor distancia del punto a la recta viene definida por la trayectoria de la perpendicular. Las rectas AB y PO son perpendiculares. CalculaP mos P'que es el simétrico del punto P respecto de la recta AB. Se trata de demostrar que PO < PD. Los $ y P ' DA $ son iguales ya que son rectos ángulos PDA $ $ e iguales también las dislos ángulos POL y P 'OL B A O tancias PO y P' O. C D Podemos escribir que PO+ PO' < PD+ PD', y en consecuencia 2PO < 2PD, luego PO < PD, con lo que se prueba que es la menor de las distancias.

Como recíproco podemos afirmar que si desde un punto exterior a una recta trazamos segmentos rectilíneos a distintos puntos de esa recta, dos de esos segmentos que equidisten del pie de la perpendicular son iguales, el menor segmento que puede trazarse es perpendicular a esa recta y entre dos segmentos desiguales el pie del menor está más próximo que el pie del mayor a la perpendicular. De dos oblicuas es menor aquella que se aparta menos del pie de la perpendicular. Observando el dibujo tenemos que PO = P' O, que P PC = P' C y que PD = P' D, pero la línea poligonal PDP' es menor que la poligonal PCP', pudiendo escribir: PDP'< PCP' B O A PD + PD'< PC+ PC' E F C D 2PD < 2PC PD < PC lo que prueba que es menor al distar menos del pie de la perpendicular.

Figura 26.

P´

P´

Figura 24.

Las líneas oblicuas cuyos pies equidistan del pie de la perpendicular son iguales. Si buscamos el simétrico del punto D con respecto P a la recta PP' encontraremos el punto E, y dado que los ángulos definidos con P, O y E son iguales a los definidos con P, O y D, entonces las distancias PE y PD son también iguales. O

D

P´

C

D

O

B

A

Figura 25.

A P´

C

Figura 25.

B

3.

2.

Las líneas oblicuas cuyos pies equidistan del pie de la perpendicular son iguales. Si buscamos el simétrico del punto D con respecto P a la recta PP' encontraremos el punto E, y dado que los ángulos definidos con P, O y E son iguales a los definidos con P, O y D, entonces las distancias PE y PD son también iguales. 3.

De dos oblicuas es menor aquella que se aparta menos del pie de la perpendicular. Observando el dibujo tenemos que PO = P' O, que P PC = P' C y que PD = P' D, pero la línea poligonal PDP ' es menor que la poligonal PCP', pudiendo escribir: PDP'< PCP' B O A PD+ PD'< PC+ PC' E F C D 2PD < 2PC PD < PC lo que prueba que es menor al distar menos del pie P´ Figura 26. de la perpendicular. 2.

Figura 24.

P´

C

D

B

O

A

Las rectas AB y PO son perpendiculares. Calculamos P'que es el simétrico del punto P respecto de la recta AB. Se trata de demostrar que PO < PD. Los $ $ ángulos PDA y son iguales ya que son rectos P ' DA $ y P 'OL $ e iguales también las dislos ángulos POL tancias PO y P' O. Podemos escribir que PO+ PO' < PD+ PD', y en consecuencia 2PO < 2PD, luego PO < PD, con lo que se prueba que es la menor de las distancias.

Como recíproco podemos afirmar que si desde un punto exterior a una recta trazamos segmentos rectilíneos a distintos puntos de esa recta, dos de esos segmentos que equidisten del pie de la perpendicular son iguales, el menor segmento que puede trazarse es perpendicular a esa recta y entre dos segmentos desiguales el pie del menor está más próximo que el pie del mayor a la perpendicular. P

Si desde un punto exterior a una recta trazamos sobre ella una perpendicular y varias oblicuas, se verifica: 1. Que la menor distancia del punto a la recta viene definida por la trayectoria de la perpendicular.

–

Distancia de un punto a una recta: Es la longitud (del segmento) de la perpendicular desde dicho punto a la recta.

–

Mediatriz: Mediatriz de un segmento rectilíneo es la recta perpendicular al segmento en su punto medio. Teorema:



186


Teorema: Todo punto de la mediatriz de un segmento equidista de los extremos de dicho segmento, y como recíproco todo punto que equidista de los extremos de un segmento rectilíneo pertenece a la recta mediatriz de dicho segmento.

3. GEOMETRÍA DEL ESPACIO 3.1. Definición intuitiva de plano Se denomina plano a una superficie ilimitada que contiene exactamente a toda recta que pase por dos puntos cualesquiera de dicha superficie.

–

Determinación del plano: a) Determinar un plano es fijar las condiciones para hallarlo y que sea sólo uno el que las satisfaga. b) Por una recta dada pasan infinitos planos (haz de planos). c) Principios intuitivos: 1. Con sólo una recta no se puede determinar un plano. 2. Con una recta y un punto exterior a ella se puede determinar un y sólo un plano. 3. Dos rectas paralelas determinan un y sólo un plano. d) Como consecuencia, un plano queda perfectamente determinado: 1. Por tres puntos no alineados. 2. Por una recta y un punto exterior a ella. 3. Por dos rectas concurrentes. 4. Por dos rectas paralelas.

3.1.1. División del espacio por un plano Entendiendo por espacio el conjunto de todos los puntos, podemos afirmar que todo plano divide al espacio en dos regiones llamadas semiespacios. Cualquier punto se encuentra en uno de los dos semiespacios opuestos determinados por un plano y sólo los puntos del plano pertenecen a los dos semiespacios.

3.2. Posiciones relativas de recta y plano Si una recta AB tiene dos de sus puntos en el plano, podemos afirmar que la recta está contenida en el plano. La recta CE que une contiene puntos de uno y otro semiespacios y tiene, en consecuencia, sólo un punto D en el plano y se dice que corta al plano. Al punto D que pertenece a la recta y al plano se le denomina pie o traza de la recta en el plano. Cuando una recta FG no tiene ninguno de sus puntos en el plano decimos que la recta y el plano son paralelos.

F

A D

Figura 27.


G

C

B

E

187


188


3.3. Posiciones relativas de dos rectas en el espacio Dentro del espacio podemos considerar dos casos: El primero aquel en el que las rectas son coplanarias pudiendo situarse dos rectas en posiciones coincidentes (cuando tienen dos puntos en común), concurrentes (cuando tienen un punto en común) o paralelas (cuando no tienen puntos en común). Figura 30.

Si dos planos tienen tres puntos, no situados en la misma recta, en común diremos que estos planos son coincidentes, mientras que si dos planos distintos, los planos P y Q del dibujo, tienen dos puntos en común, el A y el B, la recta AB que une dichos puntos pertenece a la vez a ambos planos y decimos que es la recta de intersección de ambos planos. Si dos planos distintos tienen un punto en común, su intersección es una recta que pasa por dicho punto.

En un segundo caso las rectas no serían coplanarias y entonces las rectas se cruzan, no tienen ningún punto en común y están en distintos planos. B

A

A

C

A C

C

B

A

Q

–

P

–

D

P

D

B

D

3.4. Posiciones relativas de dos planos en el espacio B

Figura 28. Figura 29.

B D

C A A C D B

Figura 29.

Figura 28.

3.4. Posiciones relativas de dos planos en el espacio B

D

B

D

B P A

C

D

Q

Si dos planos tienen tres puntos, no situados en la misma recta, en común diremos que estos planos son coincidentes, mientras que si dos planos distintos, los planos P y Q del dibujo, tienen dos puntos en común, el A y el B, la recta AB que une dichos puntos pertenece a la vez a ambos planos y decimos que es la recta de intersección de ambos planos. Si dos planos distintos tienen un punto en común, su intersección es una recta que pasa por dicho punto.

C

A

A

C

B P

En un segundo caso las rectas no serían coplanarias y entonces las rectas se cruzan, no tienen ningún punto en común y están en distintos planos.

–

El primero aquel en el que las rectas son coplanarias pudiendo situarse dos rectas en posiciones coincidentes (cuando tienen dos puntos en común), concurrentes (cuando tienen un punto en común) o paralelas (cuando no tienen puntos en común).

–

A

Figura 30.

Dentro del espacio podemos considerar dos casos:

3.3. Posiciones relativas de dos rectas en el espacio CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


188

Análisis y formalización de los conceptos geométricos intuitivos Atendiendo al dibujo de la derecha, trazamos por el punto A dos L rectas LL' y MM' que pertenecen ambas al plano Q. Si alguna de ellas B Q estuviese también en el plano P sería la intersección de los planos P y D N Q por ser común a ambos. P A Si ninguna de las dos está en P, tomemos un punto B en la semirrecta AL y otro C en la semirrecta AM'. Uniendo B con C, la recta BC C ha de atravesar necesariamente al plano P en un punto D por unir dos M´ L´ puntos situados en semiespacios opuestos respecto a dicho plano P. El punto D está, pues, en el punto Q, ya que pertenece a la recta BC trazada en él, y a la vez en el plano P. Por hipótesis, también el Figura 31. punto A es común a los planos P y Q. Luego la recta AD es común a los dos planos e intersección de ellos. Hay planos distintos que no tienen ningún punto en común, denominándose planos paralelos.

3.5. Paralelismo en el espacio 3.5.1. Paralelismo de rectas Como hemos visto anteriormente, dos rectas son paralelas en el espacio si están en el mismo plano y no tienen ningún punto en común. Teorema: Por un punto dado P, exterior a una recta, puede trazarse una y sólo una paralela a dicha recta. Para demostrarlo tengamos en cuenta que la recta y el punto determinan un plano único, en el cual según lo visto en el postulado de Euclides sólo podemos trazar una paralela única a dicha recta.

3.5.2. Paralelismo de rectas y planos La paralela a un plano es aquella recta que no tiene ningún punto en común con el plano y, en consecuencia el plano paralelo a una recta no tiene puntos en común con ella. Teorema: Si una recta es paralela a otra situada en un plano es paralela al plano. Si atendemos al dibujo, las rectas paralelas AB y CD determinan un plano cuya intersección con el plano P es la recta AB. Todos los puntos de la recta CD están en el plano determinado por las paralelas, el cual tiene en común con el plano P sólo los puntos de la recta AB, luego CD no tiene ningún punto en común con el plano P, por lo que podemos afirmar que CD es paralela al plano P. Por un punto pasan infinitas rectas paralelas a un plano.

P

C

D

A

B

Figura 32.

Teorema: Si una recta es paralela a un plano, es paralela a la intersección de este plano con cualquier otro plano que pase por dicha recta.

B

D

Q A

Atendiendo al dibujo, las rectas AB y CD están en un mismo plano Q no tienen ningún punto en común, luego son paralelas.

C

P

Figura 33. Corolario: Toda recta paralela a dos planos que se cortan es paralela a la intersección de los mismos. TEMARIO DE MATEMÁTICAS. PRUEBA A

189


190


3.5.3. Paralelismo de planos

Figura 35.

Definimos como planos paralelos aquellos que no tienen ningún punto en común. Teorema: Por un punto exterior a un plano pasa otro plano paralelo al primero. C

Si en el plano tomamos dos rectas que se corten y por el punto exterior al plano trazamos dos paralelas a las que hemos trazado en el plano, éstas determinan otro plano que no puede cortar al inicial ya que si lo hiciese la intersección sería paralela a las rectas que hemos trazado en el plano inicial y esto es imposible, luego, en consecuencia el plano determinado por las rectas que se trazan en el punto es paralelo al plano inicial.

A A´ P

P

A

D D Q

B´

Q

B

B R

R

E

C´

C

Figura 34. Sean dos planos paralelos P y Q y un plano R que corta a ambos. Las intersecciones AB y CD están en un mismo plano que es, a su vez, el plano secante R, no tienen ningún punto en común por estar en planos que a su vez no tienen puntos en común, luego las intersecciones AB y CD son paralelas. Teorema:

Si un plano corta a dos planos paralelos, las intersecciones de los planos son paralelas entre sí. Si un plano corta a dos planos paralelos, las intersecciones de los planos son paralelas entre sí. Teorema:

Sean dos planos paralelos P y Q y un plano R que corta a ambos. Las intersecciones AB y CD están en un mismo plano que es, a su vez, el plano secante R, no tienen ningún punto en común por estar en planos que a su vez no tienen puntos en común, luego las intersecciones AB y CD son paralelas. Figura 34. C R

C´

B

Q

B

Si en el plano tomamos dos rectas que se corten y por el punto exterior al plano trazamos dos paralelas a las que hemos trazado en el plano, éstas determinan otro plano que no puede cortar al inicial ya que si lo hiciese la intersección sería paralela a las rectas que hemos trazado en el plano inicial y esto es imposible, luego, en consecuencia el plano determinado por las rectas que se trazan en el punto es paralelo al plano inicial. Q

B´

D

A

E

R

D

P

P A´ A

C

Por un punto exterior a un plano pasa otro plano paralelo al primero. Teorema: Definimos como planos paralelos aquellos que no tienen ningún punto en común. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


190

3.5.3. Paralelismo de planos

Figura 35.


Teorema: Los segmentos de rectas paralelas comprendidos entre planos paralelos son iguales. C Q

A

D

Figura 36.

P

B

AB y CD determinan un plano cuyas intersecciones AC y BD con los planos P y Q son paralelas. El cuadrilátero ABCD cuyos lados opuestos son paralelos entre sí es un paralelogramo por lo que se tiene que AB = CD. Teorema: Si tres planos paralelos cortan a dos rectas cualesquiera, determinan en ellas segmentos proporcionales. B

Sean P, Q y R tres planos paralelos que cortan a las rectas AC y A ' C'. Si por el punto A trazamos ADE y A ' B' C' tenemos que:

A C

AD = A ' B', DE = B' C' Además, en el triángulo ACE se cumple que BD es paralelo a CE ya que son intersecciones del plano ACE con los planos paralelos Q y R, con lo que podemos escribir: AB BC = AD DE AB BC o bien que = A ' B ' B 'C '

E D F

Figura 37.

X

(D)

3.6. Ángulo de dos rectas Dadas dos rectas no coplanarias, llamamos ángulo de dos rectas al determinado por dos rectas concurrentes respectivamente paralelas a dos rectas dadas. Dadas las rectas D y D'no situadas en el mismo plano. Por un punto cualquiera O exterior a ambas rectas trazamos las rectas OX y OX' respectivamente paralelas a D y D'. El ángulo $ 'es, por definición, el ángulo que forman las rectas D y D'. XOX $ ' es independiente del punto O. El ángulo XOX TEMARIO DE MATEMÁTICAS. PRUEBA A

O

(D´)

X´

Figura 38. 191


192

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA A´

Figura 39.

Teorema: Dos ángulos que tienen sus lados paralelos y del mismo sentido son iguales.

Atendiendo al dibujo, prolonguemos AP una longitud PA '= PA; en el plano M tracemos una recta BDC que encuentre a las tres rectas trazadas por el punto P, y unamos los puntos A y A'con los B, C y D. Como PB es mediatriz de AA', entonces BA = BA ' y análoA gamente CA = CA '. Entonces, el triángulo BAC es igual al triángulo BCA', ya que tienen sus tres lados respectivamente iguales y, en consecuencia, sus ángulos en B habrán de ser iguales. Por otra parte, el triángulo BDA es igual al BDA', ya que tienen respectivamente iguales los lados BA = BA ' y BD = BD' B y el ángulo comprendido B, y por consiguiente se verifica que M DA = DA '. Esto nos muestra que D equidista de A y de A', es decir, que B´ D la recta PD es la mediatriz de AA' en el plano ADA' y en conseP cuencia la recta AP es perpendicular a la recta PD. C Toda recta perpendicular a un plano es perpendicular a los planos paralelos a éste. Todas las rectas perpendiculares a un plano son paralelas entre sí.

Sean los ángulos A$ y D$ con lados paralelos y del mismo sentido. Tomemos segmentos iguales AB = DE y AC = DF. Por estas igualdades el cuadrilátero ADEB es un paralelogramo, al igual que ADFC. En consecuencia, las rectas BE y CF iguales y paralelas a AD son iguales y paralelas entre sí, el cuadrilátero CFEB es un paralelogramo y entonces BC = EF. Por consiguiente, el triángulo ABC es igual al triángulo DEF ya que tienen los lados respectivamente iguales y ser A$ = D$ . Corolarios: Si sus lados AB, DE fuesen del mismo sentido y los lados AC y DF de sentido contrario, los ángulos serían suplementarios. Si los lados AB, AC son, respectivamente, de sentido contrario a DE y DF, los ángulos son iguales.

1.

2.

Dos rectas del espacio cuyo ángulo es recto se denominan perpendiculares cuando se cortan y ortogonales cuando no se cortan. Por cada punto de una recta pasan infinitas perpendiculares a esa recta.

Teorema: Para que una recta sea perpendicular a un plano es condición necesaria y suficiente que la recta sea perpendicular a dos rectas no paralelas de dicho plano.

3.7. Perpendicularidad de rectas y planos 3.7.1. Recta perpendicular a un plano

Llamamos perpendicular a un plano a la recta perpendicular a todas las rectas de ese plano. Por todo punto de un plano, o exterior a él, pasa una y sólo una recta perpendicular a ese plano. Normal a un plano en un punto es la perpendicular al plano en ese punto.

Llamamos perpendicular a un plano a la recta perpendicular a todas las rectas de ese plano. Por todo punto de un plano, o exterior a él, pasa una y sólo una recta perpendicular a ese plano. Normal a un plano en un punto es la perpendicular al plano en ese punto.

3.7. Perpendicularidad de rectas y planos 3.7.1. Recta perpendicular a un plano

Teorema: Para que una recta sea perpendicular a un plano es condición necesaria y suficiente que la recta sea perpendicular a dos rectas no paralelas de dicho plano. Dos rectas del espacio cuyo ángulo es recto se denominan perpendiculares cuando se cortan y ortogonales cuando no se cortan. Por cada punto de una recta pasan infinitas perpendiculares a esa recta.

Atendiendo al dibujo, prolonguemos AP una longitud PA '= PA; en el plano M tracemos una recta BDC que encuentre a las tres rectas trazadas por el punto P, y unamos los puntos A y A'con los B, C y D. Como PB es mediatriz de AA', entonces BA = BA ' y análoA gamente CA = CA '. Entonces, el triángulo BAC es igual al triángulo BCA', ya que tienen sus tres lados respectivamente iguales y, en consecuencia, sus ángulos en B habrán de ser iguales. Por otra parte, el triángulo BDA es igual al BDA', ya que tienen respectivamente iguales los lados BA = BA ' y BD = BD' B y el ángulo comprendido B, y por consiguiente se verifica que M DA = DA '. Esto nos muestra que D equidista de A y de A', es decir, que B´ D la recta PD es la mediatriz de AA' en el plano ADA' y en conseP cuencia la recta AP es perpendicular a la recta PD. C Toda recta perpendicular a un plano es perpendicular a los planos paralelos a éste. Todas las rectas perpendiculares a un plano son paralelas entre sí. 2.

1.

Corolarios: Si sus lados AB, DE fuesen del mismo sentido y los lados AC y DF de sentido contrario, los ángulos serían suplementarios. Si los lados AB, AC son, respectivamente, de sentido contrario a DE y DF, los ángulos son iguales.

Sean los ángulos A$ y D$ con lados paralelos y del mismo sentido. Tomemos segmentos iguales AB = DE y AC = DF. Por estas igualdades el cuadrilátero ADEB es un paralelogramo, al igual que ADFC. En consecuencia, las rectas BE y CF iguales y paralelas a AD son iguales y paralelas entre sí, el cuadrilátero CFEB es un paralelogramo y entonces BC = EF. Por consiguiente, el triángulo ABC es igual al triángulo DEF ya que tienen los lados respectivamente iguales y ser A$ = D$ . Figura 39.



192

Teorema: Dos ángulos que tienen sus lados paralelos y del mismo sentido son iguales.

A´


3.7.2. Plano perpendicular a una recta Se entiende por plano perpendicular a una recta el plano determinado por todas las rectas perpendiculares a esa recta en un mismo punto de ella. Por un punto de una recta, o exterior a ella, pasa un plano perpendicular a esa recta y sólo uno. Todos los planos perpendiculares a una misma recta son paralelos.

3.8. Perpendiculares de planos Decimos que dos planos son perpendiculares cuando entre sí determinan un diedro recto. Corolarios: 1. 2.

Todo plano perpendicular a otro determina con éste dos diedros adyacentes iguales. Dos planos perpendiculares entre sí determinan cuatro ángulos diedros iguales.

3.9. Proyecciones sobre un plano Definimos la proyección ortogonal de un punto sobre un plano como el pie de la perpendicular al plano desde dicho punto. Se llama proyectante a la perpendicular al plano desde un punto. La proyección de una figura sobre un plano es la figura formada por las proyecciones de los diferentes puntos de aquella sobre el plano. Se entiende por plano de proyección aquel sobre el que se proyecta.

– –

Si una recta es perpendicular al plano de proyección su proyección sobre él es un punto. Si una recta no es perpendicular al plano de proyección, su proyección sobre él es otra recta.

3.9.1. Ángulo de recta y plano Es el ángulo agudo formado por la recta con su proyección sobre el plano. El ángulo se obtiene mediante la prolongación de la recta hasta el plano o bien trazando una paralela a la proyección de la recta por cualquier punto de la recta. Si la recta es paralela al plano se dice que su ángulo con el plano es nulo, y si la recta es perpendicular al plano se dice que su ángulo con el plano es recto. Teorema: El ángulo de una recta con el plano es menor que cualquiera de los ángulos formados por dicha recta con otra cualquiera de las infinitas rectas del plano que pasan por el pie de la primera. B

Sea AB una recta cualquiera y AB'la proyección de la recta AB sobre el plano P, AC es una cualquiera de las infinitas rectas del plano P que pasan por el pie de AB. Por el punto A, que es la intersección de la recta AB con el plano P, y en el mismo plano trazamos una recta cualquiera AC y en ella tomamos AC = AB' y trazamos el segmento BC. La recta BB' es perpendicular al plano P, así que BB'< BC. TEMARIO DE MATEMÁTICAS. PRUEBA A

A

A´

Figura 40.

a

C

B´

P

193


194


$ < BAC $ . En los triángulos ABB' y ABC el lado AB es común AB'= AC y BB'< BC, luego BAB B

B´´

B´

A C

Figura 41.

Figura 41.

C B´´

A

B´ B

$ < BAC $ . En los triángulos ABB' y ABC el lado AB es común AB'= AC y BB'< BC, luego BAB CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


194

TEMA

35 Las magnitudes y su medida. Fundamentación de los conceptos relacionados con ellas




196



INTRODUCCIÓN

2.

LAS MAGNITUDES Y SU MEDIDA 2.1. Concepto de magnitud 2.2. Concepto de cantidad 2.3. Magnitudes escalares continuas 2.4. Magnitudes escalares absolutas y relativas 2.5. Producto de una cantidad de cierta magnitud por un número real 2.6. Magnitudes escalares continuas

3.

MEDIDA DE MAGNITUDES 3.1. Concepto general de medida

4.

PROPORCIONALIDAD 4.1. Proporcionalidad de magnitudes 4.2. Proporcionalidad y medida 4.3. Teoría de la proporción

PROPORCIONALIDAD 4.1. Proporcionalidad de magnitudes 4.2. Proporcionalidad y medida 4.3. Teoría de la proporción

4.

MEDIDA DE MAGNITUDES 3.1. Concepto general de medida

3.

LAS MAGNITUDES Y SU MEDIDA 2.1. Concepto de magnitud 2.2. Concepto de cantidad 2.3. Magnitudes escalares continuas 2.4. Magnitudes escalares absolutas y relativas 2.5. Producto de una cantidad de cierta magnitud por un número real 2.6. Magnitudes escalares continuas

2.

INTRODUCCIÓN

1.



196

Las magnitudes y su medida

1. INTRODUCCIÓN Las ciencias experimentales y las ciencias aplicadas utilizan, al igual que las Matemáticas, las magnitudes en su desarrollo teórico y aplicado, pero la concepción de magnitud no es el mismo en las distintas ciencias. Así, por ejemplo, en el ámbito de la Termología (Física) se introduce el concepto de temperatura y éste no es aditivo en el sentido algebraico ya que la temperatura de equilibrio que es el resultado de la combinación de dos cuerpos a distintas temperaturas no es la suma de la temperatura de cada uno de ellos, y esto desde el punto de vista de las Matemáticas no permitiría clasificar a la temperatura como magnitud. Puig Adam (1947) define las magnitudes en el campo de las Matemáticas como cualidad común de un conjunto de entes u objetos materiales que les hace igualables y sumables. Por su parte, el profesor Rey Pastor (1948) define como magnitud todo lo capaz de aumento y disminución, lo que completa indicando que las magnitudes son entes abstractos entre los cuales se puede definir la igualdad y la suma. Evidentemente, las anteriores definiciones descalifican a la temperatura como magnitud, pero se hace necesario compaginar los conceptos de magnitud y llegar a una formulación unitaria de la misma. Así, a las magnitudes en las que no se puede definir con sentido la suma se les denomina magnitudes intensivas, mientras que a aquellas magnitudes en las que sí es posible definir la suma con sentido las denominaremos magnitudes extensivas, siendo estas últimas las propias del ámbito de las Matemáticas, y a tales nos referiremos cuando hablemos de magnitudes.

2. LAS MAGNITUDES Y SU MEDIDA 2.1. Concepto de magnitud Sea un conjunto de entes, e, en el que se satisfacen las siguientes condiciones: 1.

2.

Entre los elementos de e se puede definir una relación de equivalencia.

– –

Reflexiva: "e Î E ® e = e.

–

Transitiva: "e1, e2 , e3 Î E ® e1 = e2 Ù e2 = e3 Þ e1 = e3.

Simétrica: "e1, e2 Î E ® e1 = e2 Þ e2 = e1.

En el conjunto E( e / = ) se define la suma con las siguientes propiedades:

–

Interna: "e1, e2 Î E ® $ e1+ e2 Î E.

–

Uniforme: " e1 = e2 Î E, " d1 = d 2 Î E ® e1+ d1 = e2 + d 2.

–

Conmutativa: " e1, e2 Î E ® e1+ e2 = e2 + e1.

–

Asociativa: "e1, e2 , e3 Î E ® e1+ ( e2 + e3 ) = ( e1+ e2 )+ e3.

–

Modular: "e Î E, $ 0 Î E / 0+ e = e+ 0 = e.

Los elementos de E( e / = ) presentan una cualidad común que hace que sean igualables y sumables, por lo que definen una magnitud.

2.2. Concepto de cantidad Todos los elementos que son iguales entre sí tienen la misma cantidad de magnitud. Coloquialmente se manejan indistintamente los términos magnitud y cantidad, pero en rigor matemático son conceptos distintos, diferenciables por el contexto.


197


198


2.3. Magnitudes escalares continuas

Compatibilidad del producto con el orden total: " l Î R+ , " a,b Î E / a £ b Þ l* a £ l* b

Cualquier magnitud definida en un conjunto E se denomina escalar si los elementos del conjunto pueden ordenarse linealmente, lo que implica que en E podemos definir una relación de orden total, lo que nos indica que satisfaría las siguientes propiedades:

–

" l , m Î R+ ® l* ( m* a) = ( l* m)* a

Reflexiva: "a Î E ® a £ a.

Asociativa del producto:

–

Distributiva mixta del producto con respecto a la suma: " l Î R+ , "a , b Î E ® l* ( a + b ) = ( l* a) + ( l* b)

–

Antisimétrica: "a , b Î E ® a £ b , b £ a Þ a = b. Transitiva: "a , b , c Î E ® a £ b , b £ c Þ a £ c. Conexa: "a , b Î E ® a £ b Ú b £ a.

" l , m Î R+ , "a Î E ® ( l + m)* a = ( l* a) + ( m* a)

–

– – – –

Distributiva mixta de la suma con respecto al producto:

Introducimos una nueva propiedad, la propiedad de monotonía, que nos permite abordar la suma de magnitudes escalares de forma compatible con la relación de orden total definida anteriormente. esta ley de composición externa satisface las siguientes propiedades:

"a Î E dado l Î R+ , $ b Î E / l* a = b

–

Monotonía: "a , b , c Î E ® a £ b Þ a + c £ b + c.

Sea una magnitud escalar ( E+ , ,£ ), si definimos una ley de composición externa a la que denominaremos producto de una cantidad por un número real positivo (*) de la siguiente forma:

Así definido, la magnitud escalar integrante de ( E+ , ,£ ) tiene estructura algebraica de semigrupo conmutativo con elemento neutro y totalmente ordenado.

2.5. Producto de una cantidad de cierta magnitud por un número real

si siempre estamos en condiciones de garantizar la existencia de d = a – b nos encontramos ante magnitudes relativas, mientras que si para la definición de d = a – b hemos de fijar la restricción de b £ a estaremos ante magnitudes absolutas. En las magnitudes relativas existen cantidades que se denominan opuestas que están caracterizadas porque su suma es el elemento neutro (0).

2.4. Magnitudes escalares absolutas y relativas

Si entre dos elementos distintos de una misma magnitud escalar definimos la operación diferencia (–) del siguiente modo: " a , b Î E, $ d Î E / d = a – b Þ d + b = a

" a , b Î E, $ d Î E / d = a – b Þ d + b = a

si siempre estamos en condiciones de garantizar la existencia de d = a – b nos encontramos ante magnitudes relativas, mientras que si para la definición de d = a – b hemos de fijar la restricción de b £ a estaremos ante magnitudes absolutas. En las magnitudes relativas existen cantidades que se denominan opuestas que están caracterizadas porque su suma es el elemento neutro (0).

Si entre dos elementos distintos de una misma magnitud escalar definimos la operación diferencia (–) del siguiente modo:

2.4. Magnitudes escalares absolutas y relativas

Así definido, la magnitud escalar integrante de ( E+ , ,£ ) tiene estructura algebraica de semigrupo conmutativo con elemento neutro y totalmente ordenado.

2.5. Producto de una cantidad de cierta magnitud por un número real

Sea una magnitud escalar ( E+ , ,£ ), si definimos una ley de composición externa a la que denominaremos producto de una cantidad por un número real positivo (*) de la siguiente forma:

–

Monotonía: "a , b , c Î E ® a £ b Þ a + c £ b + c.

"a Î E dado l Î R+ , $ b Î E / l* a = b

Introducimos una nueva propiedad, la propiedad de monotonía, que nos permite abordar la suma de magnitudes escalares de forma compatible con la relación de orden total definida anteriormente. esta ley de composición externa satisface las siguientes propiedades:

Distributiva mixta de la suma con respecto al producto: " l , m Î R+ , "a Î E ® ( l + m)* a = ( l* a) + ( m* a)

Conexa: "a , b Î E ® a £ b Ú b £ a.

Transitiva: "a , b , c Î E ® a £ b , b £ c Þ a £ c.

–

Distributiva mixta del producto con respecto a la suma: " l Î R+ , "a , b Î E ® l* ( a + b ) = ( l* a) + ( l* b)

–

Asociativa del producto:

Antisimétrica: "a , b Î E ® a £ b , b £ a Þ a = b. Reflexiva: "a Î E ® a £ a.

" l , m Î R+ ® l* ( m* a) = ( l* m)* a

– – – –

–

Cualquier magnitud definida en un conjunto E se denomina escalar si los elementos del conjunto pueden ordenarse linealmente, lo que implica que en E podemos definir una relación de orden total, lo que nos indica que satisfaría las siguientes propiedades:

–

Compatibilidad del producto con el orden total: " l Î R+ , " a,b Î E / a £ b Þ l* a £ l* b

2.3. Magnitudes escalares continuas



198

Las magnitudes y su medida Así pues, el conjunto ( E+ , ,£ ) con la ley de composición externa del producto de una cantidad por un número real positivo tiene estructura algebraica de semimódulo ordenado sobre el semianillo ( R+ ,+,* ). Una propiedad imprescindible para poder definir los conceptos de medida y unidad es la de que el semimódulo sea monógeno, para lo cual debe cumplir que cualquier cantidad pueda siempre expresarse como el producto de un cierto número por otra cantidad.

2.6. Magnitudes escalares continuas Anteriormente hemos visto que con la ley de composición externa del producto de una cantidad por un número real positivo tiene estructura algebraica de semimódulo ordenado sobre el semianillo ( R+ ,+,* ). Pues bien, cuando el semianillo es el de los reales positivos a la magnitud la denominamos magnitud escalar continua, mientras que diremos que se trata de una magnitud escalar discreta cuando sólo los números naturales son multiplicables por todas las cantidades de la magnitud, es decir, cuando estamos trabajando sobre el semianillo de los números naturales.

3. MEDIDA DE MAGNITUDES Medir significa comparar con la unidad. Medir implica la asignación de un número a una cantidad de magnitud, el cual usualmente va seguido de la unidad en la que se ha expresado la medida. La unidad es el elemento de E que multiplicado por un determinado número real nos da cualquier cantidad. Así, cualquier cantidad puede expresarse como el producto de una cantidad fija que denominamos unidad. Dada una cantidad cualquiera, c, y una cantidad unidad, u, se verifica que: $ l Î R+ / c = l* u a l se le denomina medida de c respecto de la unidad u, lo que se suele expresar mediante la notación mu ( c )= l.

3.1. Concepto general de medida Sea el semianilllo ( E,+,£), y un subanillo de los números reales S ( R+ ,+,*), definamos una aplicación tal que asocia a cada elemento de E un elemento de S , el cual constituye su medida. Esta aplicación es biyectiva, ya que a cada magnitud, c, le corresponde una imagen única, l, que es su medida, y esta a su vez tiene una única preimagen, es decir, proviene de una única cantidad. Además, la aplicación es un isomorfismo que cumple: mu ( c1+ c2 ) = mu ( c1 )+ mu ( c2 ) y, además, se verifica que si multiplicamos una cantidad por un número la medida queda multiplicada también por dicho número. Probémoslo: mu ( c )= l Þ l = c* u si multiplicamos ambos miembros por un número real m tenemos: m* l = m* c* u = ( m* c)* u mu( m* c) = m* l = m* mu ( c ) La aplicación mu ( c )= l es compatible con la relación de orden ya que si una cantidad es menor que otra entonces la medida de la primera es menor que la de la segunda. Veámoslo: " u , c1, c2 Î E ® c1 £ c2 Þ mu ( c1 ) £ mu ( c2 )


199


200


l = mu ( c1 ) Þ c1 = u* l ü ý Þ u* l £ c2 = u* m Þ mu ( c1 ) £Þ mu ( c2 ) m = mu ( c2 ) Þ c2 = u* mþ

donde s y t son las respectivas medidas de a y b en una unidad determinada. p(a,b )=

Máx( s, t ) Mín ( s, t )

Sea

esto, dado que identifica el orden de E con el orden de los conjuntos numéricos, nos permite ordenar cantidades ordenando números. Así llegamos a la identificación de los comportamientos en cuanto a suma y orden que es característica de las magnitudes medibles.

Dadas dos cantidades a y b, diremos que son proporcionales si se puede definir la proporción de ( a , b) como:

Podemos, en consecuencia, afirmar que los conjuntos ( E,+ £), y S ( R+ ,+,*) son isomorfos, lo que nos permite determinar la suma de dos cantidades sumando sólo los números.

4.3. Teoría de la proporción

esta función de proporcionalidad adopta la forma f ( ci )= k * ci, donde k es un número real al que se le denomina constante de proporcionalidad. Si dos magnitudes E y E' son proporcionales, p: E ® E', se verifica que las medidas de cantidades correspondientes c1 y c'1 con unidades correspondientes, mediante la misma proporcionalidad, u y u', son iguales.

4. PROPORCIONALIDAD

4.1. Proporcionalidad de magnitudes

Sean dos magnitudes escalares E y E' cuyas cantidades son, respectivamente, c1, c2 , c3 ,..., ci y c'1 , c'2 , c '3 ,..., c'i, tomando cualquier l Î R+ definimos una aplicación biyectiva, p, de modo que: p: E ® E ' p ( ci ) = c'i

Sean las magnitudes escalares proporcionales E y E', y sea p la función de proporcionalidad definida entre ellas. Si establecemos una medida en cada una de las magnitudes, las cuales constituyen respectivamente los subconjuntos de R+ que denominaremos S y S ', podemos establecer una aplicación f : S ® S ' tal que asocie a un número real de S y otro de S '. f :S ® S ' mu ( ci ) ® mu' [ p ( ci )] cuando esta aplicación cumple:

p ( c1+ c2 ) = p ( c1 )+ p ( c2 ) = c '1+c '2. p ( l* ci ) = l* p ( ci ) = l* c 'i.

4.2. Proporcionalidad y medida

1. 2.

a p se le denomina aplicación de proporcionalidad o simplemente proporcionalidad, afirmaremos entonces que E y E' son magnitudes proporcionales. Las magnitudes escalares E y E' así definidas son directamente proporcionales , y diremos que son inversamente proporcionales si existe una biyección entre los semigrupos de las magnitudes que es conservativa en cuanto al orden y además verifica que al producto de una cantidad por un número le corresponde el cociente de la cantidad correspondiente a aquella por el mismo número. En dos magnitudes inversamente proporcionales se cumple que el producto de medidas de cada par de cantidades correspondientes es constante.

a p se le denomina aplicación de proporcionalidad o simplemente proporcionalidad, afirmaremos entonces que E y E' son magnitudes proporcionales. Las magnitudes escalares E y E' así definidas son directamente proporcionales , y diremos que son inversamente proporcionales si existe una biyección entre los semigrupos de las magnitudes que es conservativa en cuanto al orden y además verifica que al producto de una cantidad por un número le corresponde el cociente de la cantidad correspondiente a aquella por el mismo número. En dos magnitudes inversamente proporcionales se cumple que el producto de medidas de cada par de cantidades correspondientes es constante.

1. 2.

p ( c1+ c2 ) = p ( c1 )+ p ( c2 ) = c '1+c '2. p ( l* ci ) = l* p ( ci ) = l* c 'i.


Sean las magnitudes escalares proporcionales E y E', y sea p la función de proporcionalidad definida entre ellas. Si establecemos una medida en cada una de las magnitudes, las cuales constituyen respectivamente los subconjuntos de R+ que denominaremos S y S ', podemos establecer una aplicación f : S ® S ' tal que asocie a un número real de S y otro de S '. f :S ® S ' mu ( ci ) ® mu' [ p ( ci )] cuando esta aplicación cumple:

Sean dos magnitudes escalares E y E' cuyas cantidades son, respectivamente, c1, c2 , c3 ,..., ci y c'1 , c'2 , c '3 ,..., c'i, tomando cualquier l Î R+ definimos una aplicación biyectiva, p, de modo que: p: E ® E ' p ( ci ) = c'i

esta función de proporcionalidad adopta la forma f ( ci )= k * ci, donde k es un número real al que se le denomina constante de proporcionalidad. Si dos magnitudes E y E' son proporcionales, p: E ® E', se verifica que las medidas de cantidades correspondientes c1 y c'1 con unidades correspondientes, mediante la misma proporcionalidad, u y u', son iguales.

4.1. Proporcionalidad de magnitudes 4. PROPORCIONALIDAD

Podemos, en consecuencia, afirmar que los conjuntos ( E,+ £), y S ( R+ ,+,*) son isomorfos, lo que nos permite determinar la suma de dos cantidades sumando sólo los números.

4.3. Teoría de la proporción

Dadas dos cantidades a y b, diremos que son proporcionales si se puede definir la proporción de ( a , b) como: Máx( s, t ) p(a,b )= Mín ( s, t )

esto, dado que identifica el orden de E con el orden de los conjuntos numéricos, nos permite ordenar cantidades ordenando números. Así llegamos a la identificación de los comportamientos en cuanto a suma y orden que es característica de las magnitudes medibles. Sea

l = mu ( c1 ) Þ c1 = u* l ü ý Þ u* l £ c2 = u* m Þ mu ( c1 ) £Þ mu ( c2 ) m = mu ( c2 ) Þ c2 = u* mþ

donde s y t son las respectivas medidas de a y b en una unidad determinada.



200

Las magnitudes y su medida La proporción es una aplicación P tal que a todo par de cantidades les asigna un número mayor o igual que uno. P: M ´ M ® (1,+¥ ) (a,b ) ® p(a,b ) y que satisface: 1.

Propiedad de simetría: P ( a , b ) = P ( b , a ), " a , b Î M

2.

Propiedad de semejanza: P ( ra , rb ) = P ( a , b ), " r > 0Ù a , b Î M

3.

Aditividad: P ( a , b )+ P ( a , c ) = P ( a , b + c ), si a £ b Ù a £ c , siendo a , b , c Î M

4.

Continuidad: lím P ( an , bn ) = P ( a , b ) si a = lím an Ù b = lím bn n ®¥

n ®¥

n ®¥

Probémoslo: Si definimos p ( a , b ) =

Máx( s, t ) ³ 1, analizando cada una de las propiedades antes descritas tenemos: Mín ( s, t )

Máx( s, t ) Máx( t , s ) = ³ 1. Mín ( s, t ) Mín ( t , s )

1.

p(a,b )=

2.

p ( ra , rb ) =

3.

Si a £ Mín ( b , c ) entonces: Máx( s, t ) Máx( s, r ) t r t + r p ( a , b )+ p ( a , c ) = + = + = = p(a,b+ c ) Mín ( s, t ) Mín ( s, r ) s s s siendo m( a ) = s, m( b ) = t , m( c ) = r

4.

lím p ( an , bn ) = lím n ®¥

Máx( rs, rt ) Máx( s, t ) = = p ( a , b ) si r > 0. Mín ( rs, rt ) Mín ( s, t )

n ®¥

( sn , t n ) Máx( s, t ) Máx( sn , t n ) Máx lím n ®¥ = = = p(a,b ) Mín ( sn , t n ) Mín lím( sn , t n ) Mín ( s, t ) n ®¥

Las propiedades geométricas de la proporción caracterizan la expresión usual del cociente de la dimensión mayor entre la menor, que es lo que representa la razón entre dos magnitudes.


201

TEMA

36 Proporciones notables. La razón áurea. Aplicaciones




204



INTRODUCCIÓN

2.

RAZÓN Y PROPORCIÓN

3.

MAGNITUDES, CANTIDADES Y MEDIDAS

4.

LA PROPORCIONALIDAD DESDE EL PUNTO DE VISTA ARITMÉTICO, GEOMÉTRICO Y GRÁFICO 4.1. Razón entre cantidades 4.2. Proporcionalidad de magnitudes 4.3. Proporcionalidad geométrica 4.4. Tablas, funciones y gráficas de proporcionalidad

5.

PROPORCIONES NOTABLES 5.1. Cuarta y tercera proporcional 5.2. Media proporcional 5.3. Rectángulos DIN 5.4. Razón simple y razón doble de puntos alineados 5.5. División armónica 5.5.1. Construcción del cuarto armónico 5.6. La sección áurea 5.6.1. Construcción geométrica 5.6.2. Reproductividad de la sección áurea 5.6.3. Cuantificación de la sección áurea

6.

EL NÚMERO DE ORO Y LA DIVINA PROPORCIÓN 6.1. Proporción áurea y número áureo 6.2. Rectángulos áureos 6.3. La espiral áurea 6.4. El pentágono regular, el pentagrama y el triángulo áureo 6.5. El número de oro y la sucesión de Fibonacci 6.6. Definiciones recursivas del número áureo 6.7. La Pirámide de Keops y el triángulo sagrado

7.

APLICACIONES 7.1. Las proporciones en el arte 7.2. Las proporciones antropomórficas 7.3. Las proporciones en la música 7.4. Las proporciones en la naturaleza

APLICACIONES 7.1. Las proporciones en el arte 7.2. Las proporciones antropomórficas 7.3. Las proporciones en la música 7.4. Las proporciones en la naturaleza

7.

EL NÚMERO DE ORO Y LA DIVINA PROPORCIÓN 6.1. Proporción áurea y número áureo 6.2. Rectángulos áureos 6.3. La espiral áurea 6.4. El pentágono regular, el pentagrama y el triángulo áureo 6.5. El número de oro y la sucesión de Fibonacci 6.6. Definiciones recursivas del número áureo 6.7. La Pirámide de Keops y el triángulo sagrado

6.

PROPORCIONES NOTABLES 5.1. Cuarta y tercera proporcional 5.2. Media proporcional 5.3. Rectángulos DIN 5.4. Razón simple y razón doble de puntos alineados 5.5. División armónica 5.5.1. Construcción del cuarto armónico 5.6. La sección áurea 5.6.1. Construcción geométrica 5.6.2. Reproductividad de la sección áurea 5.6.3. Cuantificación de la sección áurea

5.

LA PROPORCIONALIDAD DESDE EL PUNTO DE VISTA ARITMÉTICO, GEOMÉTRICO Y GRÁFICO 4.1. Razón entre cantidades 4.2. Proporcionalidad de magnitudes 4.3. Proporcionalidad geométrica 4.4. Tablas, funciones y gráficas de proporcionalidad

4.

MAGNITUDES, CANTIDADES Y MEDIDAS

3.

RAZÓN Y PROPORCIÓN

2.

INTRODUCCIÓN

1.



204

Proporciones notables

1. INTRODUCCIÓN El concepto de proporción es muy antiguo y nació con la idea de precisar cuantitativamente la noción de semejanza. Es natural el deseo de comparar objetos de la misma forma, pero que tienen distintos tamaños. Ese deseo de comparación es el antecedente de la medida. El origen del concepto es, pues, geométrico y se remonta a los trabajos del griego Thales de Mileto ( 640-546 a.C). No obstante, civilizaciones más antiguas (Babilonia, Egipto, China) conocían ya una de las proporciones más notables: la que guardan el perímetro y el diámetro de cualquier círculo. La teoría de las razones y proporciones, bajo el punto de vista aritmético, surgió probablemente en la escuela pitagórica. Euclides (300 a.C.), basándose en los trabajos de Eudoxio, discípulo de Platón, trató dicha teoría en los Elementos. En el libro V encontramos como primera definición “rigurosa”: Razón es la relación cualitativa en lo que se refiere a la dimensión entre dos cantidades homogéneas. La proporción (analogia) es la igualdad entre razones.

Esta definición se mantuvo hasta el siglo XIX. Fue Dedekind (1831-1916) quien dio la formulación actual de la teoría de las proporciones. Nuestra palabra razón corresponde al griego logos, traducido por los latinos como proporción y, a partir de 1500, también como razón. Desde el siglo XVII, la palabra dominante fue razón, mientras que la palabra proporción pasó a designar un igualdad entre razones. Los griegos preferían reservar el nombre de “números” a los numerables (enteros) y daban a los números-medidas el apelativo y la forma de “razones” o de “relaciones” (razones de una magnitud medida con la unidad de medida). Sabemos que todos los números, sean enteros o racionales, e incluso los inconmensurables (algebraicos como 2 o trascendentes, como p) pueden representar razones. También que el conjunto de números reales entre 0 y a, puede ponerse en correspondencia biunívoca con un segmento de recta si se toma a como medida de éste. Hay, pues una correspondencia absoluta entre el continuo de los número-medidas y el continuo geométrico. Jámblico (siglo IV a.C.), que frecuentó los círculos neoplatónicos y neopitagóricos, reservó el noma b bre de “continua” para la proporción = , llamando “discontinua” a aquella en la que los cuatro térmib c nos son diferentes. De ahí la observación de Nicómaco de que para establecer una proporción se necesitan como mínimo tres términos. Llevando más lejos el “principio de economía”, podemos formar una proporción continua partiendo solamente de las cantidades a y b; su suma sería el tercer término y obtendríamos a+ b a la proporción más característica o proporción continua por excelencia = . Aplicada a longitudes a b corresponde a lo que Euclides llamó “división en media y extrema razón” que es la partición asimétrica más “lógica” y más importante, por sus consecuencias aritméticas, geométricas, estéticas, etc. Los griegos, Nicómaco entre otros, solían escribir las proporciones en forma de progresión o serie. Así, hablaban de la proporción 1, 2, 4 o de la 1, 3, 9, 27. Pero al igual que el concepto griego de razón como relación numérica era más amplio que el de razón como número-medida, la noción de proporción fue a su vez generalizada y la “analogía” o proporción geométrica no era más que uno entre varios tipos de “correlaciones entre relaciones”. Según Nicómaco la proporción es la combinación de dos o más relaciones. No implica necesariamente la igualdad entre dos razones iniciales, sino también se puede considerar entre ellos una diferencia u otro tipo de correlación o comparación. Para todo tipo de proporción el menor número de términos necesario es tres. a b Aparte de la proporción geométrica continua del tipo = , en la que el término medio es la media b c geométrica de los extremos b = ac (ejemplo: 2, 4, 8), se establecieron otros dos tipos usuales:

–

–

La proporción aritmética, cuyo término medio excede al primero lo mismo que aquel es excea+ c es la media aritmética de los extremos dido por el último, c – b = b – a, o bien que b = 2 (ejemplo: 2, 4, 6). La proporción armónica, en la que el término medio excede al primero en una fracción de éste c– b 2ac igual a la fracción en que aquel es sobrepasado por el último, b – a = a , o bien b = c a+ c (ejemplo: 6, 8, 12).


205


206


Esos tres tipos esenciales de proporciones fueron establecidos ya por los pitagóricos y probablemente transmitidos a Platón por Arquitas de Tarento (siglo IV a.C). Precisamente éste fue el primero en tratar oficialmente el problema délico de la duplicación del cubo. El pitagórico Hipócrates de Chíos remitió el problema a una cuestión de proporciones, reduciéndolo a otro problema conocido como el “mesolabio”: intercalar dos medias entre dos números dados, es decir, intercalar dos x e y segmentos medios proporcionaa x y les entre dos segmentos dados a y b, de manera que el segundo es el doble del primero. De = = x y 2a resulta algebraicamente, por eliminación de y, que x 3 = 2a 3, por lo que el problema es equivalente a la duplicación del cubo. Platón, Menecmo, Eratóstenes y Nicomedes encontraron soluciones mecánicas, siendo la dada por el primero la más elegante. Los discípulos de Platón y posteriormente los neopitagóricos agregaron nuevos tipos de relaciones a las tres anteriores. Así hasta llegar diez tipos de “proporciones” que se pueden establecer partiendo de tres cantidades. Utilizando un elegante “método logístico” (basado en el “principio de economía”), Nicómaco de Gerasa y Teón de Esmirna las obtuvieron:

Esto lo aplica Platón indiferentemente al dominio de la matemática, la música o la cosmogonía. La influencia posterior de este concepto platónico de la proporción fue decisiva, tanto en filosofía (teoría del Microcosmo y del Macrocosmo) como en estética. Así podremos ver, por ejemplo, cómo el mismo invariante universal (la razón áurea) está presente tanto en los cánones de Paccioli y Leonardo, como en el descubrimiento de las leyes astronómicas que inmortalizó a Kepler. … La proporción que los griegos llaman analogia es la consonancia entre las partes y el todo.

Lo mismo viene a decir Vitrubio:

No es posible que dos términos formen por sí solos una hermosa composición sin un tercero, pues entre ellos es necesario que haya un vínculo que los aproxime. Ahora bien, de todos los vínculos el más bello es el que se da a sí mismo y a los términos que une la unidad más completa. Y es naturalmente la proporción (analogia), la que realiza esto del modo más bello.

1.

c– b c = b– a c

(ej: 1, 2, 3)

2.

c– b c = b– a b

(ej: 1, 2, 4)

Platón es probablemente el pensador que más ha meditado sobre la proporción y la armonía. En su Timeo, de clara influencia pitagórica, establece lo que entiende por “armonizar” como intercalar un término entre otros dos de modo que se dé “consonancia” o acorde entre los intervalos, es decir, poniéndolos en proporción de modo que se den en razones definidas con los términos iniciales. En el pasaje del Timeo en que Platón introduce la proporción geométrica se lee: 3.

c– b c = b– a a

(ej: 2, 3,6)

4.

b– a c = c– b a

(ej: 3, 5, 6)

5.

b– a b = c– b a

(ej: 2, 4, 5)

6.

b– a c = c– b b

(ej: 1, 4, 6)

7.

c– a c = b– a a

(ej: 6, 8, 9)

8.

c– a c = c– b a

(ej: 6, 7, 9)

9.

c– a b = b– a a

10.

c– b b = c– b a

(Nótese que las tres primeras corresponden a las medias aritmética, geométrica y armónica, ya citadas). c– a b = b– a a

9.

c– a c = b– a a

7.

(ej: 2, 4, 5)

b– a b = c– b a

5.

(ej: 2, 3,6)

c– b c = b– a a

3.

c– b c = b– a c

1.

(ej: 4, 6, 7)

c– b b = c– b a

10.

c– a c = c– b a

8.

(ej: 1, 4, 6)

b– a c = c– b b

6.

(ej: 3, 5, 6)

b– a c = c– b a

4.

c– b c = b– a b

2.

(ej: 4, 6, 7)

(ej: 3, 5, 8)

(ej: 3, 5, 8)

(Nótese que las tres primeras corresponden a las medias aritmética, geométrica y armónica, ya citadas). (ej: 6, 8, 9)

(ej: 6, 7, 9)

Platón es probablemente el pensador que más ha meditado sobre la proporción y la armonía. En su Timeo, de clara influencia pitagórica, establece lo que entiende por “armonizar” como intercalar un término entre otros dos de modo que se dé “consonancia” o acorde entre los intervalos, es decir, poniéndolos en proporción de modo que se den en razones definidas con los términos iniciales. En el pasaje del Timeo en que Platón introduce la proporción geométrica se lee: No es posible que dos términos formen por sí solos una hermosa composición sin un tercero, pues entre ellos es necesario que haya un vínculo que los aproxime. Ahora bien, de todos los vínculos el más bello es el que se da a sí mismo y a los términos que une la unidad más completa. Y es naturalmente la proporción (analogia), la que realiza esto del modo más bello. (ej: 1, 2, 3)

(ej: 1, 2, 4)

Esos tres tipos esenciales de proporciones fueron establecidos ya por los pitagóricos y probablemente transmitidos a Platón por Arquitas de Tarento (siglo IV a.C). Precisamente éste fue el primero en tratar oficialmente el problema délico de la duplicación del cubo. El pitagórico Hipócrates de Chíos remitió el problema a una cuestión de proporciones, reduciéndolo a otro problema conocido como el “mesolabio”: intercalar dos medias entre dos números dados, es decir, intercalar dos x e y segmentos medios proporcionaa x y les entre dos segmentos dados a y b, de manera que el segundo es el doble del primero. De = = x y 2a resulta algebraicamente, por eliminación de y, que x 3 = 2a 3, por lo que el problema es equivalente a la duplicación del cubo. Platón, Menecmo, Eratóstenes y Nicomedes encontraron soluciones mecánicas, siendo la dada por el primero la más elegante. Los discípulos de Platón y posteriormente los neopitagóricos agregaron nuevos tipos de relaciones a las tres anteriores. Así hasta llegar diez tipos de “proporciones” que se pueden establecer partiendo de tres cantidades. Utilizando un elegante “método logístico” (basado en el “principio de economía”), Nicómaco de Gerasa y Teón de Esmirna las obtuvieron: Lo mismo viene a decir Vitrubio:

… La proporción que los griegos llaman analogia es la consonancia entre las partes y el todo.

Esto lo aplica Platón indiferentemente al dominio de la matemática, la música o la cosmogonía. La influencia posterior de este concepto platónico de la proporción fue decisiva, tanto en filosofía (teoría del Microcosmo y del Macrocosmo) como en estética. Así podremos ver, por ejemplo, cómo el mismo invariante universal (la razón áurea) está presente tanto en los cánones de Paccioli y Leonardo, como en el descubrimiento de las leyes astronómicas que inmortalizó a Kepler.



206


2. RAZÓN Y PROPORCIÓN a Sean a y b dos números reales positivos, con b ¹ 0, se denomina razón entre a y b al cociente . Una b proporción desde un punto de vista estrictamente “numérico” es una igualdad que expresa la equivalencia de dos razones, esto es, una igualdad del tipo: a c = b d

[1]

Los cuatro números a, b, c y d se denominan elementos o términos de la proporción. Tradicionalmente se ha llamado antecedentes a los numeradores a y c, y consecuentes a los denominadores b y c. Asimismo, los términos a y d reciben el nombre de extremos, mientras que b y c se llaman medios. Obviamente la proporción expresada en [1] es cierta si se cumple la conocida regla del producto en cruz, esto es, si y sólo si a´ d = b´ c que en los textos más elementales se bautiza como “ley fundamental de las proporciones” (el producto de medios es igual al producto de extremos). Desde un punto de vista más formal, podríamos introducir la noción de razón como “clase de equivalencia”. Baste recordar el conocido procedimiento de construcción del número racional (de ratio, razón) a partir del número entero, o de la extensión algebraica del anillo Ã(X) de polinomios sobre R al cuerpo de las razones algebraicas Â(X). No obstante, en el tema que nos ocupa parece conveniente limitarnos al conjunto R ´ R+ donde definimos la relación de equivalencia ( a , b ) ~ ( c , d ) Û a ´ d = b ´ c. Las clases de equivalencia por dicha relación serán las razones aritméticas a las que aludíamos al principio, lo que en definitiva viene a signia c ficar que si y son dos fracciones (positivas) equivalentes, la razón entre a y b es la misma que la rab d zón entre c y d, o que a, b, c y d ( por este orden) forman una proporción. También se utiliza la expresión: “a es a b como c es a d”. Se desprenden inmediatamente de lo anterior las “clásicas” propiedades de las proporciones, cuya justificación es elemental, tales como: a) b) c) d) e)

a c a b d c d b = Û = Û = Û = . b d c d b a c a a c b d Intercambio de antecedentes por consecuentes: = Û = . b d a c a c a + b c+ d . Suma de los antecedentes a los consecuentes: = Û = b d b d a c a c . Suma de los consecuentes a los antecedentes: = Û = b d b+ a d + c a c a a+ c Suma de antecedentes y consecuentes: = Þ = b d b b+ d Intercambio de medios y/o extremos:

3. MAGNITUDES, CANTIDADES Y MEDIDAS Pese a tratarse de nociones intuitivas parece oportuno precisarlas siquiera brevemente, sin pretender una formalización rigurosa, la cual escapa del objetivo del presente tema. Es claro que la “proporcionalidad”, una de las relaciones más sencillas y omnipresentes en la realidad cercana y en la vida cotidiana, se establece entre “cantidades” de “magnitudes”. Intuitivamente nos referimos a “magnitud” como característica o propiedad física de los objetos que es susceptible de medida o cuantificación, y a “cantidad” como “porción” de una determinada magnitud. Cabe señalar que lo que esencialmente define a una magnitud es que pueden aplicársele criterios de igualdad y aditividad. TEMARIO DE MATEMÁTICAS. PRUEBA A

207


208


Desde un punto de vista matemático las “definiciones” anteriores no son en modo alguno satisfactorias. Pero la fundamentación teórica de los conceptos citados, desde una perspectiva purista, nos adentraría en terrenos más intrincados, como la “Teoría de la medida”, que parece oportuno aquí soslayar.

Podemos decir que (A/~, +, o, £) es una estructura de “semimódulo ordenado” sobre el semianillo (R+, +, · ). Para definir luego los conceptos de unidad y medida, es preciso que dicho semimódulo sea monógeno, es decir, que exista una cantidad u tal que toda otra x pueda obtenerse como x = r o u , siendo r un número real positivo. Si la construcción anterior se hace sobre el semianillo (R+, +, · ) a la magnitud se le llama magnitud escalar continua. Si se toma el semianillo (N, +, · ) de los naturales se llama magnitud escalar discreta. Ahora surge la cuestión de la “medida” de una magnitud. Básicamente se trata de asignar a cada cantidad x de dicha magnitud un número real m(x) que deberá estar sujeto a un sistema de axiomas, entre los

En términos generales se define una magnitud en un determinado conjunto A al establecer una relación de “equivalencia” (~) en A y una “suma” (+) en el conjunto cociente A/~ de modo que (A/~, +) sea un semigrupo abeliano con elemento neutro. Esto es, la suma definida cumple: 1. 2. 3.

Asociatividad: x + ( y+ z ) = ( x + y )+ z ( " x , y, z Î A/ ~). Conmutatividad: x + y = y+ x ( " x , y Î A/ ~). Elemento neutro: existe un 0 Î A/ ~, tal que x + 0 = x ( "x Î A/ ~).

Diferencia de cantidades (cuando sólo existe en caso de que el “minuendo” sea mayor que el “sustraendo”, se trata de una magnitud escalar absoluta). Producto cantidades por números reales positivos. Se trata de una ley externa o con operadores en R+ (incluimos el 0), a la que exigiremos las propiedades: 1. Distributiva mixta de + respecto de o: ( r+ s ) o x = r o x + s o x. 2. Distributiva mixta de o respecto de +: r o ( x + y ) = r o x + r o y. 3. Pseudoasociativa: r o ( s o x ) = ( rs ) o x. 4. Compatibilidad con el orden: x £ y Þ r o x £ r o y. Entonces, a cada una de las clases de equivalencia x , y, z ,... se le denomina cantidad.

De acuerdo con lo anterior, sobre un mismo conjunto A podrían definirse distintas magnitudes. Pensemos por ejemplo en el conjunto de todos los polígonos planos convexos, en el cual pueden definirse las magnitudes “área” y “perímetro”. Una magnitud que nos va a interesar de modo especial en el presente tema es la magnitud “longitud” definida sobre el conjunto de todos los segmentos. Primero definiríamos la igualdad de segmentos como congruencia (dos segmentos son iguales si se pueden superponer mediante un movimiento en el plano) y después la suma de segmentos de la manera habitual. La longitud es una cualidad común de todos los segmentos que los hace igualables y sumables. La cantidad de longitud sería lo que tienen de común todos los segmentos iguales entre sí. Hay por el contrario cualidades de los objetos –como la forma– y nociones –como el paralelismo– que no son magnitudes. En ambos casos puede hablarse de clases de equivalencia, pero no tiene sentido definir una suma de formas o de direcciones. Conviene aclarar, sin embargo, que el concepto matemático de magnitud difiere del que se maneja en la Física. Ésta considera magnitudes como la densidad o la temperatura (que no son sumables). Se distingue entonces entre magnitudes extensivas y magnitudes intensivas, según respectivamente que tenga sentido o no definir la suma. En Matemáticas consideramos magnitudes sólo a las primeras. b) a)

Si los elementos del conjunto A pueden ordenarse mediante una relación de orden total £, compatible con la suma, entonces (A/~, +) es un semigrupo abeliano con elemento neutro, totalmente ordenado. En tal caso la magnitud recibe el nombre de magnitud escalar. Entre cantidades de una magnitud escalar pueden definirse dos nuevas operaciones: De acuerdo con lo anterior, sobre un mismo conjunto A podrían definirse distintas magnitudes. Pensemos por ejemplo en el conjunto de todos los polígonos planos convexos, en el cual pueden definirse las magnitudes “área” y “perímetro”. Una magnitud que nos va a interesar de modo especial en el presente tema es la magnitud “longitud” definida sobre el conjunto de todos los segmentos. Primero definiríamos la igualdad de segmentos como congruencia (dos segmentos son iguales si se pueden superponer mediante un movimiento en el plano) y después la suma de segmentos de la manera habitual. La longitud es una cualidad común de todos los segmentos que los hace igualables y sumables. La cantidad de longitud sería lo que tienen de común todos los segmentos iguales entre sí. Hay por el contrario cualidades de los objetos –como la forma– y nociones –como el paralelismo– que no son magnitudes. En ambos casos puede hablarse de clases de equivalencia, pero no tiene sentido definir una suma de formas o de direcciones. Conviene aclarar, sin embargo, que el concepto matemático de magnitud difiere del que se maneja en la Física. Ésta considera magnitudes como la densidad o la temperatura (que no son sumables). Se distingue entonces entre magnitudes extensivas y magnitudes intensivas, según respectivamente que tenga sentido o no definir la suma. En Matemáticas consideramos magnitudes sólo a las primeras.

Si los elementos del conjunto A pueden ordenarse mediante una relación de orden total £, compatible con la suma, entonces (A/~, +) es un semigrupo abeliano con elemento neutro, totalmente ordenado. En tal caso la magnitud recibe el nombre de magnitud escalar. Entre cantidades de una magnitud escalar pueden definirse dos nuevas operaciones:

a)

b)

Diferencia de cantidades (cuando sólo existe en caso de que el “minuendo” sea mayor que el “sustraendo”, se trata de una magnitud escalar absoluta). Producto cantidades por números reales positivos. Se trata de una ley externa o con operadores en R+ (incluimos el 0), a la que exigiremos las propiedades: 1. Distributiva mixta de + respecto de o: ( r+ s ) o x = r o x + s o x. 2. Distributiva mixta de o respecto de +: r o ( x + y ) = r o x + r o y. 3. Pseudoasociativa: r o ( s o x ) = ( rs ) o x. 4. Compatibilidad con el orden: x £ y Þ r o x £ r o y. Entonces, a cada una de las clases de equivalencia x , y, z ,... se le denomina cantidad.

1. 2. 3.

Asociatividad: x + ( y+ z ) = ( x + y )+ z ( " x , y, z Î A/ ~). Conmutatividad: x + y = y+ x ( " x , y Î A/ ~). Elemento neutro: existe un 0 Î A/ ~, tal que x + 0 = x ( "x Î A/ ~).

Podemos decir que (A/~, +, o, £) es una estructura de “semimódulo ordenado” sobre el semianillo (R+, +, · ). Para definir luego los conceptos de unidad y medida, es preciso que dicho semimódulo sea monógeno, es decir, que exista una cantidad u tal que toda otra x pueda obtenerse como x = r o u , siendo r un número real positivo. Si la construcción anterior se hace sobre el semianillo (R+, +, · ) a la magnitud se le llama magnitud escalar continua. Si se toma el semianillo (N, +, · ) de los naturales se llama magnitud escalar discreta. Ahora surge la cuestión de la “medida” de una magnitud. Básicamente se trata de asignar a cada cantidad x de dicha magnitud un número real m(x) que deberá estar sujeto a un sistema de axiomas, entre los

En términos generales se define una magnitud en un determinado conjunto A al establecer una relación de “equivalencia” (~) en A y una “suma” (+) en el conjunto cociente A/~ de modo que (A/~, +) sea un semigrupo abeliano con elemento neutro. Esto es, la suma definida cumple: Desde un punto de vista matemático las “definiciones” anteriores no son en modo alguno satisfactorias. Pero la fundamentación teórica de los conceptos citados, desde una perspectiva purista, nos adentraría en terrenos más intrincados, como la “Teoría de la medida”, que parece oportuno aquí soslayar.



208

Proporciones notables cuales estará el de no negatividad (m(x) ³ 0, para cualquier cantidad x, siendo m(x) = 0 si y sólo si x = 0) y el de aditividad (m( x + y ) = m( x )+ m( y )). Asimismo, para una cierta cantidad u es m( u )= 1, y decimos que se ha tomado u como “patrón” o “unidad”. De esa manera es obvio que si p Î N *, entonces: p veces

p veces

p veces

m( pu ) = m( u + u + ... + u ) = m( u )+ m( u )+ ... + m( u ) = 1+ 1+ ... + 1= p q veces

También si x es una cantidad tal que x + x + ... + x = u , entonces llegamos a q veces

m( x+ x+ ... + x ) = qm( x ) = m( u ) = 1 Þ m( x ) =

1 q q veces

p veces

Si tenemos ahora dos cantidades de una magnitud x e y tales que y+ y+ ... + y = x + x + ... + x, p entonces m( y ) = m( x ). A veces se ha expresado esto diciendo que la cantidad y es parte alícuota de x q (en tal caso también x lo es de y). En consecuencia si una cantidad x es parte alícuota de la unidad u, entonp ces la medida de dicha cantidad se expresaría mediante un número racional, es decir, una razón entre dos q números enteros (en caso contrario los antiguos griegos hablaban de “inconmensurables”). No obstante lo anterior, sabido es que la medida de una cantidad no siempre es racional. La construcción teórica es la siguiente: Si tenemos una magnitud escalar continua, lo que hacemos es tomar un generador u del semimódulo (A/~, +, o, £), al que llamaremos unidad. Se establece entonces una biyección mu : (A/~, +, o, £) ® (R+, +, ·, £), definida como: mu ( x )= r Û x = r o u Dicha biyección es un isomorfismo compatible con el orden, pues:

–

mu ( x + y ) = mu ( x )+ m( y ).

–

mu ( r o x ) = rmu ( x ).

–

Si x £ y, entonces mu ( x ) £ m( y ).

El isomorfismo anterior permite identificar una cantidad de una magnitud con su medida expresada mediante un número real (racional o no). Esto es lo que se hace a un nivel elemental.

4. LA PROPORCIONALIDAD DESDE EL PUNTO DE VISTA ARITMÉTICO, GEOMÉTRICO Y GRÁFICO 4.1. Razón entre cantidades El concepto de razón (“ratio”) adquiere una gran riqueza de significado cuando se aplica no a números en abstracto, sino a “cantidades”. Cuando hablamos de razón entre cantidades homogéneas, nos referimos a cantidades de una misma magnitud, que supondremos escalar. Si se trata de una magnitud escalar continua, en tal caso dicha razón expresa la medida del antecedente cuando se toma el consecuente como unidad. Así por ejemplo, si mezclamos en un recipiente 250 cc de alcohol puro y 550 cc de agua pura, obtenemos una disolución de alcohol en agua. La razón entre el volu250 men de alcohol y el volumen total es = 0,3125; se trata de un número adimensional que expresa el 800 TEMARIO DE MATEMÁTICAS. PRUEBA A

209


210


“tanto por uno”, es decir, los centímetros cúbicos de alcohol que habría en 1 cc de tal disolución. Dicho índice no es más que una forma de expresar la concentración de alcohol. Si manejamos magnitudes escalares discretas, la interpretación de razón entre dos cantidades homogéneas (que sigue siendo adimensional) tiene otro matiz. Así por ejemplo, si a una reunión asisten 36 per24 sonas de las cuales 24 son mujeres, la razón entre el número de éstas y el total de asistentes es que equi36 2 vale a . Ello significa que las mujeres suponen los dos tercios del total o que dos de cada tres asistentes a 3 dicha reunión eran mujeres. Sea ahora la razón entre dos cantidades de distinta magnitud. Disponemos de infinidad de ejemplos de tal situación. Bastaría citar algunos: f = mu ' o p o ( mu )–1

La función de proporcionalidad inducida es la biyección que resulta de

r'1 , r2' , r3' ,........., ri' …

r1 , r2 , r3 ,.........., ri …

f

mu'

mu

x1 , x2 , x3 ,.........., xi … _ (A /~,+, , <)

_ (B /~,+, , <) y1 , y2 , y3 ,.........., yi …

p

¡

¡

– – –

Razón entre el dinero pagado (euros) en una compra y la cantidad de mercancía adquirida (kg.). Razón entre la cantidad de agua (l.) vertida por un caño y el tiempo que permanece abierto (min.).

diremos que las magnitudes anteriores son proporcionales, y la aplicación p se denomina aplicación de proporcionalidad. Si establecemos una medida en cada una de esas magnitudes tomando unidades respectivas u y u ', tendremos el esquema siguiente: Razón entre la distancia recorrida (m.) por un móvil y el tiempo transcurrido (s.).

Aquí la razón sigue teniendo un significado de reducción a la unidad. En los ejemplos, se trataría del dinero pagado por cada kg. , del agua vertida en cada minuto y del espacio recorrido en dada segundo. Queremos decir que el precio, el caudal y la velocidad no son más que razones entre cantidades de dos magnitudes distintas. En física se definen como “magnitudes derivadas” y se expresan respectivamente en “unidades derivadas” (euros kg., l. min.,m.s.). 1. 2.

p ( x1+ x2 ) = p ( x1 )+ p ( x2 ) = y1+ y2. p ( r o x ) = r o p ( x ) = r o y.

Si se puede establecer una aplicación biyectiva p: (A/~, +, o, £) ® (B/~, +, o, £) que sea un isomorfismo de semimódulos, es decir, que cumpla: Sean dos conjuntos A y B, en los que hay definidas sendas magnitudes escalares. Pensemos por ejemplo en el conjunto de los ángulos generales del plano y el de los arcos sobre una circunferencia. Las magnitudes que nos pueden servir de ejemplo serían la “amplitud del ángulo” y la “longitud del arco”.


Sean dos conjuntos A y B, en los que hay definidas sendas magnitudes escalares. Pensemos por ejemplo en el conjunto de los ángulos generales del plano y el de los arcos sobre una circunferencia. Las magnitudes que nos pueden servir de ejemplo serían la “amplitud del ángulo” y la “longitud del arco”.


Si se puede establecer una aplicación biyectiva p: (A/~, +, o, £) ® (B/~, +, o, £) que sea un isomorfismo de semimódulos, es decir, que cumpla:

Aquí la razón sigue teniendo un significado de reducción a la unidad. En los ejemplos, se trataría del dinero pagado por cada kg. , del agua vertida en cada minuto y del espacio recorrido en dada segundo. Queremos decir que el precio, el caudal y la velocidad no son más que razones entre cantidades de dos magnitudes distintas. En física se definen como “magnitudes derivadas” y se expresan respectivamente en “unidades derivadas” (euros kg., l. min.,m.s.). 1. 2.

p ( x1+ x2 ) = p ( x1 )+ p ( x2 ) = y1+ y2. p ( r o x ) = r o p ( x ) = r o y.

diremos que las magnitudes anteriores son proporcionales, y la aplicación p se denomina aplicación de proporcionalidad. Si establecemos una medida en cada una de esas magnitudes tomando unidades respectivas u y u ', tendremos el esquema siguiente: Razón entre la distancia recorrida (m.) por un móvil y el tiempo transcurrido (s.).

Razón entre la cantidad de agua (l.) vertida por un caño y el tiempo que permanece abierto (min.). Razón entre el dinero pagado (euros) en una compra y la cantidad de mercancía adquirida (kg.). ¡

p

_ (B /~,+, , <) y1 , y2 , y3 ,.........., yi … ¡

– – –

_ (A /~,+, , <)

“tanto por uno”, es decir, los centímetros cúbicos de alcohol que habría en 1 cc de tal disolución. Dicho índice no es más que una forma de expresar la concentración de alcohol. Si manejamos magnitudes escalares discretas, la interpretación de razón entre dos cantidades homogéneas (que sigue siendo adimensional) tiene otro matiz. Así por ejemplo, si a una reunión asisten 36 per24 sonas de las cuales 24 son mujeres, la razón entre el número de éstas y el total de asistentes es que equi36 2 vale a . Ello significa que las mujeres suponen los dos tercios del total o que dos de cada tres asistentes a 3 dicha reunión eran mujeres. Sea ahora la razón entre dos cantidades de distinta magnitud. Disponemos de infinidad de ejemplos de tal situación. Bastaría citar algunos: x1 , x2 , x3 ,.........., xi … mu

mu'

f

r1 , r2 , r3 ,.........., ri …

r'1 , r2' , r3' ,........., ri' …

La función de proporcionalidad inducida es la biyección que resulta de f = mu ' o p o ( mu )–1



210

Proporciones notables Es decir, la proporcionalidad de las magnitudes establece una correspondencia uno a uno entre las medidas de cantidades de una y otra, dada por f ( ri )= kri donde k es un número real que recibe el nombre de constante de proporcionalidad. En efecto, tomemos k = mu ' [ p ( u )]. Dada una cantidad cualquiera xi de la primera magnitud, cuya medida es mu ( xi )= ri, entonces se tendrá: f ( ri ) = [mu ' o p o ( mu )–1]( ri ) = ( mu ' o p )( xi ) = mu ' [ p ( xi )] =

[ ] = mu ' [ p ( ri o u )] = mu ' [ri o p ( u )] = rm i u ' p ( u ) = kri Resultan como consecuencias inmediatas que k = f(1) y que si se toman para ambas magnitudes unidades correspondientes, entonces las medidas de cantidades correspondientes resultan ser iguales. Esto último se justifica fácilmente, ya que si u '= p ( u ), entonces k = mu ' [ p ( u )] = mu ' ( u ' ) = 1, con lo que la función f se reduce a la identidad, o sea f ( ri )= ri. Después de todas las precisiones anteriores, cuando decimos que las cantidades x1, x2 son proporcioy y nales a las y1, y2 podemos escribir 1 = 2 y decimos que las cuatro cantidades forman una proporción. x1 x2 Eligiendo una unidad de medida, si x1, x2 e y1, y2 son las respectivas medidas de tales cantidades entonces se y y tiene una proporción numérica 1 = 2 . x1 x2

4.3. Proporcionalidad geométrica Aunque pueden ponerse más ejemplos de proporcionalidad entre magnitudes “geométricas” , como el citado anteriormente entre amplitud del ángulo central y longitud del arco correspondiente, no referiremos en este apartado a la “proporcionalidad de segmentos”. No nos explayaremos aquí en la formalización del concepto de longitud de un segmento. A grandes rasgos los pasos del proceso serían:

–

Definición de una relación de equivalencia en el conjunto S de todos los segmentos generales del plano: “Dos segmentos AB y CD son iguales o congruentes si se pueden hacer coincidir mediante un movimiento en el plano”.

–

Establecimiento de una biyección entre S/~ y el conjunto de puntos de una semirrecta “s”de origen O: la clase [AB] se asocia al punto X de dicha semirrecta tal que OX~AB (figura 1).

–

Definición de una “suma” en S/~: dados AB y CD, es posible tomar dos puntos X e Y sobre la semirrecta s tales que OX~AB y XY~CD , se define entonces [AB] + [CD] = [XY] La suma está bien definida y dota a S/~ de estructura de semigrupo abeliano con elemento neutro (este sería la clase de los segmentos nulos, o sea [AA] ).

–

S X O

A B

Figura 1.

Establecimiento de un orden en S/~: si al tomar sobre la semirrecta s los puntos X e Y correspondientes respectivamente a [AB] y a [CD] se tiene que X está entre O e Y, decimos que [AB] < [CD]. Si X e Y coinciden, sabido es que entonces [AB] = [CD]. La relación £ es de orden total compatible con la suma.

Queda así definida una magnitud sobre el conjunto de los segmentos generales del plano, que denominaremos “longitud”. Se trata de una magnitud escalar absoluta continua. TEMARIO DE MATEMÁTICAS. PRUEBA A

211


212


Figura 3.

Tomando como unidad u una cantidad de longitud o clase de S/~, a cualquier otra clase de segmentos [AB] se podrá asociar como medida un número real mu [ AB ]. Se llama razón entre dos segmentos [AB] y [CD] al número real cociente entre sus respectivas medidas, es decir: C'

B'

A'

[ AB ] mu [ AB ] mu ' [ A ' B '] [ A ' B '] = = = [CD ] mu [CD ] mu ' [C ' D '] [C ' D ']

D'

s'

y por definición de razón entre segmentos:

[ AB ] mu [ AB ] = [CD ] mu [CD ]

A

mu [ AB ] = mu ' [ A ' B '] mu [CD ] = mu ' [C ' D ']

B C

En efecto, si tomamos en s y en s' unidades correspondientes u y u ', entonces ya vimos que la medida de cantidades correspondientes

Si X e Y son los puntos que corresponden de manera unívoca a [AB] y [CD] respectivamente sobre la [ AB ] [OX ] , estando O, X e Y alineados. En el caso de que tengamos en genesemirrecta s, es obvio que = [CD ] [OY ] ral tres puntos M, N y P alineados, se define la razón simple (M, N, P) como la razón entre [MN] y [CD]. Para llegar a una aplicación de proporcionalidad entre segmentos definamos primero lo que se entiens d D de por “proyección paralela”. C Sean s y s' dos semirrectas concurrentes en O y B una recta d no paralela ni a s ni a s'. Si tenemos puntos A A , B ,C ... sobre s, trazando por ellos rectas paralelas a O d obtenemos los puntos A ', B ',C '... sobre s'. s' El postulado de Euclides garantiza que se trata A' B' D' C' de una aplicación biyectiva de los puntos de s en los puntos de s', a la que denominaremos ppd (proyección paralela en la dirección de la recta d). Asimismo todo segmento [ XY ] sobre s se transforma en otro [ X 'Y '] Figura 2. sobre s', siendo X '= ppd ( X ) e Y '= ppd (Y ). Escribiremos que [ X 'Y '] = ppd[ XY ]. Se verifica que hay correspondencia en la igualdad y en la suma, es decir: D

s

tos homólogos son proporcionales

[ AB ] [ A ' B '] . = [CD ] [C ' D ']

La formulación de lo anterior se concreta en el teorema de Thales, que viene a decir que los segmen-

S/~

S/~

s'

s

ppd

Como ya vimos anteriormente, el conjunto S/~ de los segmentos generales del plano puede ponerse en correspondencia biyectiva con el conjunto de puntos de la semirrecta s y también con el conjunto de puntos de la s'. De aquí resulta que la “proyección paralela” ppd induce una biyección de S/~ en sí mismo, que es una aplicación de proporcionalidad.

1. 2.

[ AB ] = [CD ] Û ppd[ AB ] = ppd[CD ]. ppd ([ AB ]+ [ BC ] ) = ppd[ AB ]+ ppd[ BC ].

Si X e Y son los puntos que corresponden de manera unívoca a [AB] y [CD] respectivamente sobre la [ AB ] [OX ] , estando O, X e Y alineados. En el caso de que tengamos en genesemirrecta s, es obvio que = [CD ] [OY ] ral tres puntos M, N y P alineados, se define la razón simple (M, N, P) como la razón entre [MN] y [CD]. Para llegar a una aplicación de proporcionalidad entre segmentos definamos primero lo que se entiens d D de por “proyección paralela”. C Sean s y s' dos semirrectas concurrentes en O y B una recta d no paralela ni a s ni a s'. Si tenemos puntos A A , B ,C ... sobre s, trazando por ellos rectas paralelas a O d obtenemos los puntos A ', B ',C '... sobre s'. s' El postulado de Euclides garantiza que se trata A' B' D' C' de una aplicación biyectiva de los puntos de s en los puntos de s', a la que denominaremos ppd (proyección paralela en la dirección de la recta d). Asimismo todo segmento [ XY ] sobre s se transforma en otro [ X 'Y '] Figura 2. sobre s', siendo X '= ppd ( X ) e Y '= ppd (Y ). Escribiremos que [ X 'Y '] = ppd[ XY ]. Se verifica que hay correspondencia en la igualdad y en la suma, es decir: 1. 2.

[ AB ] = [CD ] Û ppd[ AB ] = ppd[CD ]. ppd ([ AB ]+ [ BC ] ) = ppd[ AB ]+ ppd[ BC ].

Como ya vimos anteriormente, el conjunto S/~ de los segmentos generales del plano puede ponerse en correspondencia biyectiva con el conjunto de puntos de la semirrecta s y también con el conjunto de puntos de la s'. De aquí resulta que la “proyección paralela” ppd induce una biyección de S/~ en sí mismo, que es una aplicación de proporcionalidad. ppd

S/~

s

s'

S/~

La formulación de lo anterior se concreta en el teorema de Thales, que viene a decir que los segmen[ AB ] [ A ' B '] . tos homólogos son proporcionales = [CD ] [C ' D '] En efecto, si tomamos en s y en s' unidades correspondientes u y u ', entonces ya vimos que la medida de cantidades correspondientes

s

D

C

B A

mu [ AB ] = mu ' [ A ' B '] mu [CD ] = mu ' [C ' D ']

[ AB ] mu [ AB ] = [CD ] mu [CD ]

y por definición de razón entre segmentos:

Tomando como unidad u una cantidad de longitud o clase de S/~, a cualquier otra clase de segmentos [AB] se podrá asociar como medida un número real mu [ AB ]. Se llama razón entre dos segmentos [AB] y [CD] al número real cociente entre sus respectivas medidas, es decir: A'

B'

C'

s'

D'

[ AB ] mu [ AB ] mu ' [ A ' B '] [ A ' B '] = = = [CD ] mu [CD ] mu ' [C ' D '] [C ' D ']

Figura 3.



212


4.4. Tablas, funciones y gráficas de proporcionalidad Sean {x1, x2 ,..., xi ,...} e { y1, y2 ,..., yi ,...}dos conjuntos de valores de sendas variables reales X e Y entre los cuales puede establecerse una correspondencia biunívoca que suponemos dada mediante una tabla empírica. X

x1

x2

x3

...

xi

...

Y

y1

y2

y3

...

yi

...

Si la razón entre cada dos valores correspondientes es siempre la misma, es decir yi = k = cte xi

( i = 1,2,3,... )

decimos que los valores xi y los yi son directamente proporcionales, siendo k la razón de proporcionalidad directa. Para cada dos pares asociados en la tabla anterior ( xk , yk ) e ( x j , y j ) puede establecerse una proporción yj y aritmética k = . xk xj Un término de dicha proporción puede obtenerse conocidos los otros tres; por ejemplo y j =

x j ´ yk xk

, lo

que viene a ser la popular regla de tres directa. xk

÷

yk

´ xj

yj

Si en la tabla anterior se verifica que el producto de cada dos valores correspondientes es siempre el mismo xi yi = k = cte

( i = 1,2,3,... )

ello equivaldría a que la razón entre cada valor de un fila y el inverso del valor correspondiente en la otra es constante, o sea: yi = k = cte xi

( i = 1,2,3,... )

Decimos ahora que los valores xi son inversamente proporcionales a los yi, siendo k la razón de proporcionalidad inversa. Al igual que antes, para cada dos pares asociados en la tabla anterior ( xk , yk ) e ( x j , y j ) puede estableyj y cerse ahora una proporción aritmética: k = . xj xk Un término de dicha proporción puede obtenerse conocidos los otros tres; así pues, y j =

xk ´ yk , que xj

constituye la regla de tres inversa. xk

´

yk

÷ xj


yj

213


214


Si representamos en el plano cartesiano los puntos ( xi , yi ) de la tabla, en el caso de que haya proporcionalidad directa obtendríamos triángulos OQiPi rectángulos semejantes (figura 4a). En el caso de proporcionalidad inversa, rectángulos OQiPM i i de área constante k, para k > 0 (figura 4b). x

b)

O

C

X

A

s'

Pi

Mi

B s

Desde un punto de vista geométrico, si a, b, c son segmentos, la obtención del segmento x cuarto proporcional es sencilla si nos basamos en el teorema de Thales. Bastaría tomar dos semirrectas distintas s y s' con origen común O (figura 6). Sobre s es posible tomar dos puntos A y B únicos tales que [OA ] = a y [OB ] = b . Sobre s' tomaríamos igualmente el único punto C tal que [OC ] = c. Trazando por B una paralela a AC, ésta cortará a s' en un punto X , que es el extremo del segmento del segmento buscado, medido desde O, o sea [OX ] = x. Pi

Figura 6.

a)

c

a c = b x

b

O

a

Qi

O

Qi

Dadas tres cantidades a, b, c (que en adelante identificaremos con sus medidas a, b, c), la cuarta o cuarto proporcional es otra cantidad x tal que a y c sean proporcionales a b y x. Esto es tal que se cumpla la proporción numérica: Figura 4.

Como resulta obvio las funciones reales de variable real que se “ajustan” en cada caso a las tablas empíricas, y sus gráficas respectivas son:

5.1. Cuarta y tercera proporcional k x Función de proporcionalidad inversa

Y

Y

f ( x )=

Figura 5. HIPÉRBOLA

RECTA X

X

k f ( x )= x Función de proporcionalidad inversa

X

X RECTA

HIPÉRBOLA

Figura 5. Y

Y b)

5. PROPORCIONES NOTABLES

a)

Función de proporcionalidad directa (Función lineal)

f ( x )= kx

f ( x )= kx

Función de proporcionalidad directa (Función lineal)

b)

5. PROPORCIONES NOTABLES

a)

Como resulta obvio las funciones reales de variable real que se “ajustan” en cada caso a las tablas empíricas, y sus gráficas respectivas son:

5.1. Cuarta y tercera proporcional

Dadas tres cantidades a, b, c (que en adelante identificaremos con sus medidas a, b, c), la cuarta o cuarto proporcional es otra cantidad x tal que a y c sean proporcionales a b y x. Esto es tal que se cumpla la proporción numérica: Figura 4.

a c = b x

Qi

O

Qi

b

O

a c

Pi x

X

s'

b)

C

O

a)

Mi

B A

Desde un punto de vista geométrico, si a, b, c son segmentos, la obtención del segmento x cuarto proporcional es sencilla si nos basamos en el teorema de Thales. Bastaría tomar dos semirrectas distintas s y s' con origen común O (figura 6). Sobre s es posible tomar dos puntos A y B únicos tales que [OA ] = a y [OB ] = b . Sobre s' tomaríamos igualmente el único punto C tal que [OC ] = c. Trazando por B una paralela a AC, ésta cortará a s' en un punto X , que es el extremo del segmento del segmento buscado, medido desde O, o sea [OX ] = x. Pi

s

Si representamos en el plano cartesiano los puntos ( xi , yi ) de la tabla, en el caso de que haya proporcionalidad directa obtendríamos triángulos OQiPi rectángulos semejantes (figura 4a). En el caso de proporcionalidad inversa, rectángulos OQiPM i i de área constante k, para k > 0 (figura 4b). 214



Figura 6.

Proporciones notables En el caso de que b = c, obtenemos la definición de tercero o tercera proporcional de dos números o de dos segmentos. Esto es, desde el punto de vista aritmético, dados dos números a y b, el número x que cuma b ple la proporción = . Geométricamente, la construcción es tan sólo un caso particular de la anterior. b x

5.2. Media proporcional Dados ahora a y b, la media o medio proporcional de ambos es el medio común x de la proporción a x = . Obviamente es x = ab , con lo cual la media proporcional de dos números es su media geométrica. x b La construcción geométrica de un segmento que sea media proporcional entre dos dados puede basarse en propiedades métricas conocidas. He aquí algunos ejemplos: a)

Construcción basada en el teorema de la altura Sabemos que la altura sobre la hipotenusa es un segmento x cumple: a x = x b

x

Figura 7. b)

a

b

Construcción basada en el teorema del cateto En un triángulo rectángulo sabemos que un cateto es media proporcional entre la hipotenusa y su proyección sobre ella. x

b a

Figura 8. c)

Construcción basada en la potencia respecto a una circunferencia La potencia de un punto respecto de una circunferencia no depende de la secante trazada, por lo cual podemos tomar una que pase por el centro. Además la potencia coincide con el cuadrado del segmento de tangente desde el punto. Luego tendremos en la figura a × b = x2

x

b a

Figura 9.


215



5.3. Rectángulos DIN

216

ê ¾ ¾®ú Puede decirse que la razón simple es el escalar l tal queê AC ú= ë û

ê ¾ ¾®ú lê BC ú. ë û

Están caracterizados por una relación recursiva muy simple. Esta relación consiste en que al doblar por la mitad el rectángulo inicial se produzca otro rectángulo semejante al inicial. 7 (ABC) = — 2

5 (ABC) = – — 3

¿Cuál debe ser la razón entre sus lados? Tomando como unidad el lado menor y siendo x el lado mayor, se tendrá: C

C

A

B

x/2

B

x

A

x 1 x2 = Þ = 1Þ x = 2 1 x/ 2 2

Ejemplos:

1 1

ì AC si el punto C no está entre A y B ï+ ï BC l = ( ABC ) = í ï AC – si el punto C está entre A y B ï î BC Figura 10.

El proceso puede reiterarse y formar una cadena recursiva de rectángulos todos semejantes entre sí lado mayor = 2. lado menor

cumpliendo siempre

Sean A, B yC tres puntos sobre una misma recta. Se define la razón simple entre ellos y la denotamos por (ABC) como el número real l dado por: Así por ejemplo, los formatos de la serie A para el papel son

5.4. Razón simple y razón doble de puntos alineados Dimensiones (en mm)

Serie A

841 ´ 1189

DIN A0

A4 A3

594 ´ 841

DIN A1

A6

Figura 11.

105 ´ 148

DIN A6

DIN A2

DIN A5

DIN A3

297 ´ 420

210 ´ 197

DIN A4

DIN A4

210 ´ 197

297 ´ 420

DIN A3

DIN A5

148 ´ 210

420 ´ 594

DIN A2

DIN A6

A5

A1

A2

148 ´ 210

A1

105 ´ 148 A6

420 ´ 594

Figura 11.

A2

A5 A3

A4

Serie A

Dimensiones (en mm)

DIN A0

841 ´ 1189

DIN A1

594 ´ 841

5.4. Razón simple y razón doble de puntos alineados Sean A, B yC tres puntos sobre una misma recta. Se define la razón simple entre ellos y la denotamos por (ABC) como el número real l dado por: Así por ejemplo, los formatos de la serie A para el papel son

El proceso puede reiterarse y formar una cadena recursiva de rectángulos todos semejantes entre sí lado mayor cumpliendo siempre = 2. lado menor ì AC si el punto C no está entre A y B ï+ ï BC l = ( ABC ) = í ï AC si el punto C está entre A y B ï– î BC Figura 10.

1

1

x 1 x2 = Þ = 1Þ x = 2 1 x/ 2 2

Ejemplos:

B

x/2

A

x

A

C

C

Tomando como unidad el lado menor y siendo x el lado mayor, se tendrá: 7 (ABC) = — 2

B

5 (ABC) = – — 3

¿Cuál debe ser la razón entre sus lados?

Están caracterizados por una relación recursiva muy simple. Esta relación consiste en que al doblar por la mitad el rectángulo inicial se produzca otro rectángulo semejante al inicial. ê ¾ ¾®ú ê ¾ ¾®ú Puede decirse que la razón simple es el escalar l tal queê AC ú= lê BC ú. ë û ë û

5.3. Rectángulos DIN

216



Proporciones notables Es obvio que la proyección paralela conserva la razón simple: C B

( ABC ) = ( A ' B 'C ' ) A

A'

Figura 12.

Si dados dos puntos A y B queremos obtener otro C tal que ( ABC ) =

B'

C'

m , nos podemos basar en lo n

anterior. Trazamos por A una recta distinta a la AB y sobre ella tomamos puntos tales que AC1 = m y BC 1 1 = n. Basta unir B con B1 y trazar una paralela a BB1 por C1.

n m

C1

B1

Figura 13.

A

B

C

Sean ahora cuatro puntos A, B, C y D alineados. La razón doble de esos cuatro puntos, que denotaremos por ( ABCD ), se definirá como un cociente de razones simples. A saber: ( ABC ) ( ABCD ) = ( ABD ) Observación: El orden en que se enuncian los cuatro puntos es fundamental. Hay 4 != 24 formas de ordenar los cuatro puntos, pero para esas 24 ordenaciones no son distintas todas las razones dobles que se obtienen. La razón doble goza de propiedades interesantes, de las que enunciaremos algunas sin demostrarlas: 1.

Si se permutan dos puntos entre sí y al mismo tiempo los otros dos, la razón doble obtenida tiene el mismo valor que la de partida: ( ABCD ) = ( BADC ) = (CDAB ) = ( DCBA )

2.

Si permutan los dos primeros puntos de una razón doble se obtiene el inverso: 1 ( ABCD ) = r Þ ( BACD ) = r

3.

Si en una razón doble permutamos los dos puntos intermedios entonces la nueva razón doble tiene de valor uno menos el valor de partida: ( ABCD ) = r Þ ( ACBD ) = 1 – r

4.

Dados tres puntos distintos A, B y C existe un único punto X tal que ( A , B ,C , X ) = r.

5.

La razón doble es invariante por proyección paralela.


217


218


Definición: Cuatro puntos alineados A, B, C y D forman una cuaterna armónica cuando ( ABCD ) = –1.

5.5. División armónica

Vamos a comenzar con un ejemplo. AX sea BX

Se dirá que los puntos X y X ' dividen armónicamente al segmento AB, o bien que los puntos X y X ' son conjugados armónicos de A y B, o bien que los cuatro puntos A, B, X y X ' (en ese orden) forman una cuaterna armónica. La relación particular 3/2 de nuestro ejemplo puede ser reemplazada por cualquier razón en general. Podemos dar una definición general de cuaterna armónica, utilizando el concepto, definido antes, de razón doble de cuatro puntos alineados: Dado un segmento AB, queremos encontrar otro punto X alineado con A y B tal que la razón

una dada, por ejemplo 3/2. Caben dos posibilidades, según el punto X esté entre A y B (fig. a) o se dé lo contrario (fig. b). X

B B

X'

(b ) A

X

A

A

(a)

B

X'

Tomemos ahora los cuatro puntos A, B, X y X ', es decir, los dos dados A y B y los dos X y X ' cuyas razones de distancias a aquellos son iguales y de distinto signo:

AX BX AX + BX AB . Es decir, lo que hacemos es = = = 3 2 5 5 “partir” el segmento AB en cinco partes, de las cuales tres corresponden a AX y las otras dos a BX . En tal caso hay que sumar las partes para obtener el total. Decimos que los segmentos AX y BX constituyen una partición aditiva de AB. AX ' BX ' AX '– BX ' En el segundo caso = = = AB. Aquí no tiene sentido hablar “partición”, 3 2 1 pues lo que hacemos es añadir a BC otro segmento, el A 'C . Sería más propio hablar de “yuxtaposición” o “conjugación”. De cualquier forma, puesto que hay que restar las “partes” para obtener el segmento de partida, decimos que los segmentos AX ' y BX ' constituyen una partición sustractiva de BC. En el primer supuesto, se verifica

( ABX ) = –

AX 3 =– 2 BX

( ABX ' ) =

–

AX ' 3 = BX ' 2

La diferencia entre ambos supuestos es que en un caso el punto X está entre A y B, y en el otro ocurre lo contrario, y en ambos las relaciones anteriores no contienen ninguna medida en término absoluto, pues las unidades no son las mismas. La noción de razón simple de tres puntos alineados, tal como se definió, discrimina las dos soluciones anteriores en virtud del signo que se atribuye a tal razón. Así pues:

–

AX BX AX + BX AB En el primer supuesto, se verifica . Es decir, lo que hacemos es = = = 3 2 5 5 “partir” el segmento AB en cinco partes, de las cuales tres corresponden a AX y las otras dos a BX . En tal caso hay que sumar las partes para obtener el total. Decimos que los segmentos AX y BX constituyen una partición aditiva de AB. AX ' BX ' AX '– BX ' En el segundo caso = = = AB. Aquí no tiene sentido hablar “partición”, 3 2 1 pues lo que hacemos es añadir a BC otro segmento, el A 'C . Sería más propio hablar de “yuxtaposición” o “conjugación”. De cualquier forma, puesto que hay que restar las “partes” para obtener el segmento de partida, decimos que los segmentos AX ' y BX ' constituyen una partición sustractiva de BC.

La diferencia entre ambos supuestos es que en un caso el punto X está entre A y B, y en el otro ocurre lo contrario, y en ambos las relaciones anteriores no contienen ninguna medida en término absoluto, pues las unidades no son las mismas. La noción de razón simple de tres puntos alineados, tal como se definió, discrimina las dos soluciones anteriores en virtud del signo que se atribuye a tal razón. Así pues: ( ABX ' ) =

AX ' 3 = BX ' 2

–

AX 3 =– BX 2

–

( ABX ) = –

Tomemos ahora los cuatro puntos A, B, X y X ', es decir, los dos dados A y B y los dos X y X ' cuyas razones de distancias a aquellos son iguales y de distinto signo: B

(b)

B

X'

(a)

X'

A

X

X

A

A

B

Se dirá que los puntos X y X ' dividen armónicamente al segmento AB, o bien que los puntos X y X ' son conjugados armónicos de A y B, o bien que los cuatro puntos A, B, X y X ' (en ese orden) forman una cuaterna armónica. La relación particular 3/2 de nuestro ejemplo puede ser reemplazada por cualquier razón en general. Podemos dar una definición general de cuaterna armónica, utilizando el concepto, definido antes, de razón doble de cuatro puntos alineados:

Vamos a comenzar con un ejemplo. AX Dado un segmento AB, queremos encontrar otro punto X alineado con A y B tal que la razón sea BX una dada, por ejemplo 3/2. Caben dos posibilidades, según el punto X esté entre A y B (fig. a) o se dé lo contrario (fig. b).

Definición: Cuatro puntos alineados A, B, C y D forman una cuaterna armónica cuando ( ABCD ) = –1.

5.5. División armónica



218

Proporciones notables Un ejemplo de cuaterna armónica es la que forman dos vértices de un triángulo y los pies sobre ese lado de las bisectrices interior y exterior del ángulo opuesto (teoremas de la bisectriz interior y exterior en la Geometría del triángulo).

(A B Q Q') = –1

Figura 14. A

Q

B

Q'

5.5.1. Construcción del cuarto armónico Dados tres puntos alineados A, B y C (estando C entre A y B) queremos encontrar otro punto X , sobre la misma recta, que forme con los anteriores una cuaterna armónica. Método 1º: Trazamos una circunferencia arbitraria que pase por A y B, para ello basta tomar el centro en cualquier punto de la mediatriz de AB. Sean M y N los puntos diametralmente opuestos que dicha mediatriz intercepta con la circunferencia. El punto M correspondiente al arco menor AB se une con C y se prolonga hasta interceptar con la circunferencia un punto P. La recta NP corta a la prolongación de AB en el punto buscado. La justificación del procedimiento anterior es sencilla. Basta probar que PC y PX son las bisectrices interior y exterior correspondientes al vértice P del triángulo DABP.

N

P

A

C

B

X

M

Figura 15.

Método 2º: Trazamos por A y B dos rectas paralelas arbitrarias y por C un recta que las corte en M y N . Se prolonga NB en otro segmento BN ' = NB. La recta MN ' corta a la prolongación de AB en el cuarto armónico que queremos. Si llamamos m = AM y n = NB = BN ', el A teorema de Thales aplicado a las rectas MC y AB AC AM m = = , y aplicado a las rectas nos da BC NB n AX AM m = = . MN ' y AB también BX BN ' n Pero, según el criterio del signo, tendremos m m ( ABC ) = – y ( ABX ) = , por lo que ( ABCX ) = –1. n n

M

N' X C

B N

Figura 16.

5.6. La sección áurea Dividir un segmento AB en media y extrema razón es dividirlo en dos segmentos de manera que el mayor sea la media proporcional entre el menor y el total o, lo que es lo mismo, que el menor sea la tercera proporcional entre el total y el mayor. Esto es, como sabemos, hacer una “partición aditiva” del segmento AB tal que la parte mayor sea a la menor como el segmento total a la parte mayor. A


P

B

219


220


Bastará localizar un punto P interior al segmento AB que verifique la proporción: D

C

Figura 18.

AB AP segmento total segmento mayor Û = = AP BP segmento mayor segmento menor

M

En los Elementos de Euclides encontramos una construcción equivalente. Euclides construye el cuadrado ABCD de lado AB. Tomando el punto medio M del lado CA, traza el segmento MB y prolonga CA hasta un punto N tal que MN = MB. Por último, completando el cuadrado ANQP, obtenemos el punto P buscado (figura 18).

Decimos entonces que el punto P divide al segmento AB en media y extrema razón o que AP es el segmento áureo o la sección áurea de AB. P

Q

N

B

1.

A

5.6.1. Construcción geométrica

Obtener la sección áurea de un segmento dado AB Levantamos la perpendicular al segmento por el extremo B y sobre dicha perpendicular determinamos un puntoO que diste de B la mitad del segmento dado. De esta manera formamos el triángulo rectángulo ABO. Con centro en O trazamos la circunferencia de radio OB, la cual corta a AO en un punto P '. Si transportamos el segmento AP' sobre AB, tendremos el punto P que divide al segmento dado en media y extrema razón. Observación:

AB AP = AP BP

Luego:

Þ AP 2 = AB 2 – AP × AB = AB × ( AB – AP ) = AB × BP.

æ AB ö æ AB ö ÷ = AB 2 +ç ÷ Þ AP 2 + AP × AB = AB 2 Þ Þ AP 2 + AP × AB +ç è 2 ø è 2 ø 2

2

æ æ AB ö AB ö ÷ = AB 2 +ç ÷Þ ' OP ' )2 = ç AP + AO 2 = AB 2 + OB 2 Þ ( AP + è è 2 ø 2 ø O

P'

AB OP '= OB = 2

2

2

A

B

P

Figura 17.

En efecto: En efecto: P

Figura 17.

B

AB 2

A

OP '= OB =

P'

æ æ AB ö AB ö ÷ = AB 2 +ç ÷Þ ' OP ' )2 = ç AP + AO 2 = AB 2 + OB 2 Þ ( AP + è è 2 ø 2 ø 2

2

O

æ AB ö æ AB ö ÷ = AB 2 +ç ÷ Þ AP 2 + AP × AB = AB 2 Þ Þ AP 2 + AP × AB +ç è 2 ø è 2 ø 2

2

Þ AP 2 = AB 2 – AP × AB = AB × ( AB – AP ) = AB × BP.

Obtener la sección áurea de un segmento dado AB Levantamos la perpendicular al segmento por el extremo B y sobre dicha perpendicular determinamos un puntoO que diste de B la mitad del segmento dado. De esta manera formamos el triángulo rectángulo ABO. Con centro en O trazamos la circunferencia de radio OB, la cual corta a AO en un punto P'. Si transportamos el segmento AP' sobre AB, tendremos el punto P que divide al segmento dado en media y extrema razón. AB AP = AP BP

Observación: Q

A

P

5.6.1. Construcción geométrica

N

1.

Luego:

En los Elementos de Euclides encontramos una construcción equivalente. Euclides construye el cuadrado ABCD de lado AB. Tomando el punto medio M del lado CA, traza el segmento MB y prolonga CA hasta un punto N tal que MN = MB. Por último, completando el cuadrado ANQP, obtenemos el punto P buscado (figura 18).

B

Decimos entonces que el punto P divide al segmento AB en media y extrema razón o que AP es el segmento áureo o la sección áurea de AB. M

D

Figura 18.

Bastará localizar un punto P interior al segmento AB que verifique la proporción: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


220

AB AP segmento total segmento mayor Û = = AP BP segmento mayor segmento menor

C

Proporciones notables 2.

Dado el segmento áureo AP obtener el segmento total AB Por el extremo P del segmento dado trazamos una recta perpendicular y tomamos en ésta un punto O cuya distancia a P sea la mitad de la longitud de AP. Trazamos con centro en O una circunferencia de radioOP. Prolongando el segmento AO obtenemos un punto B' de dicha circunferencia. Transportando el segmento AB' a partir de A sobre la recta AP, obtendremos el segmento AB buscado. En efecto: OP =

B' O

A

P

B

Figura 19.

AP = OB ' 2

AP 2 + OP 2 = AO 2 = ( AB '– OB ' )2 Þ æ AP ö æ æ AP ö AP ö ÷Þ ÷ = ç AB '– ÷ = AB '2 – AB '×AP +ç Þ AP 2 +ç è 2 ø è 2 ø è 2 ø 2

2

2

Þ AP 2 = AB '2 – AB × ' AP = AB × ' ( AB '– AP ) = AB × ( AB – AP ) = AB × BP. Luego:

AB AP = AP BP

5.6.2. Reproductividad de la sección áurea Veamos ahora una interesante propiedad: Si se efectúa la sección áurea de un segmento, la parte menor en que queda dividido es a su vez el segmento áureo de la parte mayor. Podemos decir que la sección áurea es auto-reproductiva: A

P

B

AP es segmento áureo de AB. BP = AP1 es segmento áureo de AP.

A

PP1 = AP2 es segmento áureo de AP2.

P1

A

M

P2

P

P1

Figura 20. Continuando este proceso iterativo vamos obteniendo un segmento más pequeño APn dividido en media y extrema razón por un punto Pn+1 (figura 20). No sabemos si los primitivos pitagóricos se percataron de este proceso interminable o si, en caso afirmativo, sacaron consecuencias de él. Vamos a probarlo identificando los segmentos con su medida real. Llamando AB = a y AP = x, BP = y, tendremos a = x + y, con x > y. Si x es segmento áureo de a se deberá cumplir la proporción: a x = x y

A

P

x

y

B

a

Aplicando las propiedades de las proporciones, al sumar antecedentes y consecuentes se deduce a– x x y x = , de donde se llega a que = , lo que nos permite asegurar que la parte menor y es tamx– y y x– y y bién segmento áureo de la mayor x.


221


222


Si suprimimos el requisito de que P sea interior al segmento, la existencia de dos soluciones de la ecuación sugiere la posibilidad de que exista otro punto P'exterior al segmento AB, que produzca una AB AP ' . = AP ' BP ' También puede formularse de otra manera:

“partición sustractiva” en dos segmentos AP' y BP', siendo

Si a un segmento se añade su segmento áureo se obtiene un segmento cuya porción áurea es el segmento dado. A

B

a

Q

x

AB AP = AP BP

a x Como x era la porción áurea de a se cumplía = , de donde sumando antecedentes y consecuenx a– x a a+ x a+ x , lo que prueba que AB = a es la sección áurea de AQ = a + x. tes = = x x+ a – x a

5 +1 En la ecuación anterior hemos desestimado la solución negativa, la cual sería x = – a. Si con2 ferimos un significado al signo –, podríamos “aprovechar” tal solución. En efecto, antes habíamos considerado que AB quedaba dividido “interiormente” por un punto P en dos segmentos aditivos cumpliendo

5.6.3. Cuantificación de la sección áurea

Observación:

Si conocemos la medida a del segmento dado AB, ¿cuál sería la medida x del segmento áureo AP? P

x

AP = x =

5–1 a 2 A

a x = x a– x

a–x

B

a

siendo la raíz negativa la de mayor valor absoluto. Como quiera que buscamos un P que divida “internamente” al segmento AB, deberá ser en valor absoluto x menor que a, por lo que el segmento áureo de AB tendrá de longitud la solución positiva de las dos obtenidas, es decir La proporción anterior puede escribirse x2 = a ( a – x ), de donde resulta la ecuación de segundo grado: x2 + ax – a 2 = 0

ì ( 5 – 1)a ï 2 – a± a2 + 4a2 – a± a 5 ï x= = =í 2 2 ï ( 5 + 1)a ï– î 2

Resuelta la ecuación anterior nos da dos soluciones:

ì ( 5 – 1)a ï 2 – a± a2 + 4a2 – a± a 5 ï x= = =í 2 2 ï ( 5 + 1)a ï– î 2

Resuelta la ecuación anterior nos da dos soluciones:

x2 + ax – a 2 = 0

siendo la raíz negativa la de mayor valor absoluto. Como quiera que buscamos un P que divida “internamente” al segmento AB, deberá ser en valor absoluto x menor que a, por lo que el segmento áureo de AB tendrá de longitud la solución positiva de las dos obtenidas, es decir La proporción anterior puede escribirse x2 = a ( a – x ), de donde resulta la ecuación de segundo grado: 5–1 a 2

a x = x a– x

A

a

AP = x = x

P

a–x

B

Si conocemos la medida a del segmento dado AB, ¿cuál sería la medida x del segmento áureo AP? Observación:

5.6.3. Cuantificación de la sección áurea

En la ecuación anterior hemos desestimado la solución negativa, la cual sería x = –

5 +1 a. Si con2

a x Como x era la porción áurea de a se cumplía = , de donde sumando antecedentes y consecuenx a– x a a+ x a+ x , lo que prueba que AB = a es la sección áurea de AQ = a + x. = = x x+ a – x a

ferimos un significado al signo –, podríamos “aprovechar” tal solución. En efecto, antes habíamos considerado que AB quedaba dividido “interiormente” por un punto P en dos segmentos aditivos cumpliendo tes

A

a

AB AP = AP BP

B

x

Q

Si suprimimos el requisito de que P sea interior al segmento, la existencia de dos soluciones de la ecuación sugiere la posibilidad de que exista otro punto P'exterior al segmento AB, que produzca una AB AP ' . “partición sustractiva” en dos segmentos AP' y BP', siendo = AP ' BP '

Si a un segmento se añade su segmento áureo se obtiene un segmento cuya porción áurea es el segmento dado. También puede formularse de otra manera:



222

Proporciones notables Si aceptamos también la partición sustractiva, el problema de dividir un segmento en media y extrema razón tendría dos soluciones: los dos puntos P y P' (figura 21) . La construcción gráfica puede completarse:

Figura 21.

A

P'

P

B

6. EL NÚMERO DE ORO Y LA DIVINA PROPORCIÓN 6.1. Proporción áurea y número áureo En el epígrafe anterior ya vimos que de la proporción AB a x AP = = = AP x a – x BP

[2]

5–1 a. 2 La razón de dicha proporción [2], es decir, entre un segmento y porción áurea, es entonces:

resultaba AP = x =

F=

a = x

2 5–1

=

1+ 5 2

a la que llamamos razón áurea. También podríamos haber dividido en [2] por x, obteniendo: a 1 = x a –1 x y de aquí F=

1 F– 1

o, lo que es lo mismo, F2 – F – 1= 0 Es decir, el número F es una de las raices de la ecuación x 2 – x – 1= 0. Al resolver dicha ecuación obtenemos como soluciones: F= F'=

1+ 5 = 1,6180339887... 2

1– 5 = –0,6180339887... 2

El denominado número de oro es la solución positiva F. Se trata, pues, de un número irracional algebraico, que tiene, como veremos, propiedades sorprendentes. TEMARIO DE MATEMÁTICAS. PRUEBA A

223


224


Se trata de una progresión geométrica que además es una serie “aditiva en dos tiempos”. O sea, una serie de términos que participa a la vez de propiedades aditivas y multiplicativas, conjugando así la naturaleza aritmética con la geométrica. Como consecuencia, longitudes proporcionales a los términos de esta serie tendrán propiedades geométricas y gráficas notables (dos longitudes que estén en razón F, permiten construir con regla y compás, por simples adiciones o sustracciones, la sucesión geométrica completa).

También podemos llegar a él si tenemos en cuenta que si se divide el segmento a en media y extrema razón, la parte menor es también el segmento áureo de la mayor. Es decir x

A

y

P

x y = ® x2 – xy – y2 = 0 y x– y

B

(1, F, F2 , F3 , F4 ,... )

æ 1± 5 ö y± y2 + 4 y2 y± y 5 ÷ = = yç ç 2 ÷. Descartamos la 2 2 è ø

lo que nos conduce a x 2 – x – 1= 0, cuya única solución real y positiva ya vimos que era F. La propiedad anterior hace particularmente interesante a la “serie F” o sucesión de las potencias de F Ecuación que resuelta en x nos lleva a x =

solución negativa, con lo que se llega a

xn– 2 ( x2 – x – 1) = 0

AP x 1+ 5 = = = F = razón áurea BP y 2

Sacando factor común:

xn – xn–1 – xn– 2 = 0 ¿Qué tiene de particular el número F= 1,618033...? Con la ayuda de una calculadora podemos ver que:

¿Hay algún otro número real positivo que cumpla la misma propiedad? Pensemos en la ecuación: F = 1,618033... F2 = 2,618033... F3 = 4 ,236067... F4 = 6,854100... F5 = 11,090166...

Es fácil probarlo ya que el número áureo es solución de la ecuación x 2 – x – 1= 0, por lo cual cumplirá F2 = 1+ F, y bastaría ir multiplicando miembro a miembro por F. Lo que permite hacer la conjetura: Las sucesivas potencias del número áureo cumplen Fn = Fn–1+ Fn– 2. L

F2 + F3 = F4 M

Tomando un número suficiente de decimales, puede observarse una hermosa regularidad: 1+ F = F2 F + F2 = F3

1+ F = F2 F + F2 = F3

Tomando un número suficiente de decimales, puede observarse una hermosa regularidad: F2 + F3 = F4 M

F2 = 2,618033... F3 = 4 ,236067... F4 = 6,854100... F5 = 11,090166... L

Lo que permite hacer la conjetura: Las sucesivas potencias del número áureo cumplen Fn = Fn–1+ Fn– 2. Es fácil probarlo ya que el número áureo es solución de la ecuación x 2 – x – 1= 0, por lo cual cumplirá F = 1+ F, y bastaría ir multiplicando miembro a miembro por F. 2

F = 1,618033... ¿Qué tiene de particular el número F= 1,618033...? Con la ayuda de una calculadora podemos ver que:

¿Hay algún otro número real positivo que cumpla la misma propiedad? Pensemos en la ecuación: xn – xn–1 – xn– 2 = 0 AP x 1+ 5 = = = F = razón áurea BP y 2

Sacando factor común:

xn– 2 ( x2 – x – 1) = 0

solución negativa, con lo que se llega a

lo que nos conduce a x 2 – x – 1= 0, cuya única solución real y positiva ya vimos que era F. La propiedad anterior hace particularmente interesante a la “serie F” o sucesión de las potencias de F Ecuación que resuelta en x nos lleva a x =

y± y2 + 4 y2 y± y 5 = = 2 2

(1, F, F2 , F3 , F4 ,... ) A

P

B

æ ö ç 1± 5 ÷. Descartamos la yç ÷ è 2 ø

x y = ® x2 – xy – y2 = 0 y x– y

Se trata de una progresión geométrica que además es una serie “aditiva en dos tiempos”. O sea, una serie de términos que participa a la vez de propiedades aditivas y multiplicativas, conjugando así la naturaleza aritmética con la geométrica. Como consecuencia, longitudes proporcionales a los términos de esta serie tendrán propiedades geométricas y gráficas notables (dos longitudes que estén en razón F, permiten construir con regla y compás, por simples adiciones o sustracciones, la sucesión geométrica completa). x

y

También podemos llegar a él si tenemos en cuenta que si se divide el segmento a en media y extrema razón, la parte menor es también el segmento áureo de la mayor. Es decir



224

Proporciones notables También las dos raices Fy F'de la ecuación x2 – x – 1= 0, verifican las fórmulas de Cardano, esto es: ìF+ F'= 1 í î F× F'= –1 De aquí resulta F – 1=

1 F

es decir, si el número áureo lo disminuimos en una unidad resulta su recíproco, siendo el único número que cumple esta condición. La historia de este número áureo o número de oro es ciertamente apasionante. Se trata del primero del que se tuvo constancia de que es irracional. Platón recoge ya en su Timeo la división de un segmento en media y extrema razón, la cual denominaba “divina” por las numerosas correspondencias que guarda con las propiedades de la Divinidad. Este tipo de subdivisión se hizo tan popular entre los antiguos griegos que no se sintió la necesidad de ningún nombre descriptivo especial para designarla, y el nombre de “media y extrema razón” se sustituyó por el más lacónico de “la sección”. Es célebre la frase, hecha sobre una traducción de Euclides, con que Campano de Novara (siglo XIII) rinde homenaje a la proporción por excelencia, la proporción áurea (rationabiliter… irrationali symphonia), por ser una sinfonía irracional (es decir, una simetría dinámica de números irracionales, conmensurables sólo en potencia) en la que concuerdan “de la manera más racional” (en el sentido de armoniosamente lógico) las proporciones de los cuerpos platónicos. En el Renacimiento, el monje boloñés Fray Luca Paccioli di Borgo (1509) lo designó “divina proporción”, mientras que la denominación de “sección dorada” o “número de oro” (que perdura hasta hoy) se atribuye a Leonardo da Vinci. Se debe a Mark Barr y Schooling la nomenclatura del número de oro, éste aparece denotado por la letra griega F en los anexos matemáticos del libro The curses of live, de Sir Theodore Cook. Probablemente la elección de tal letra (phi) tiene que ver con la inicial del nombre de Phidias, escultor griego que decoró el Partenón. El número de oro está presente en la naturaleza y en particular en el propio cuerpo humano, como veremos en posteriores ejemplos. A lo largo de la historia del hombre, como producto de la naturaleza éste ha intentado siempre imitarla. De ahí que los arquitectos, escultores y pintores de todos los tiempos han utilizado la sección áurea como la proporción ideal para componer sus obras. Incluso Ftiene que ver con la música. La “divina proporción” produce en las obras de arte una impresión de armonía lineal, de equilibrio en la desigualdad, más satisfactorio que el de cualquier otra combinación, opinión de Leonardo da Vinci y de la mayor parte de artistas y sabios del Renacimiento, entre los que Kepler (1571-1630) fue el último. Este llegó a citar la divina proporción o sección áurea como una de las dos grandes joyas de la Geometría: La Geometría tiene dos grandes tesoros; uno es el Teorema de Pitágoras; el otro es la división de un segmento en una proporción extrema y una media. Podemos comparar el primero con una medida de oro; el segundo lo podríamos comparar con una preciosa joya.

No obstante, el carácter inconmensurable de la “divina proporción” fue la causa de su restringida aplicación en la arquitectura y pintura del siglo XVI. El interés suscitado por las propiedades matemáticas del número de oro, se debió fundamentalmente a sus peculiares características y, sobre todo, a su conexión con la famosa “serie de Fibonacci” (llamada en Análisis “serie de Lamé”). Este matemático había introducido en su Liber Abaci (1202) la serie que lleva su nombre. Durante los siglos XVII y XVIII la sección áurea fue cayendo poco a poco en el olvido, hasta que en 1850 Zeysing volvió a descubrirla. En uno de sus libros proclama: Para que un todo, dividido en dos partes desiguales, parezca hermoso desde el punto de vista de la forma, debe haber entre la parte menor y la mayor la misma razón que entre la mayor y el todo.

A esto lo llama ley de las proporciones. El ejemplo más interesante lo encontramos en la famosa pirámide de Keops, estudiada desde el punto de vista matemático por numerosos científicos. TEMARIO DE MATEMÁTICAS. PRUEBA A

225


226


Figura 24.

Un rectángulo es áureo cuando, una vez cortado el cuadrado construido sobre el lado menor, el rectángulo que queda es semejante al de partida. Ello permite determinar qué razón debe haber entre los lados de un rectángulo para que sea áureo. x 1 , donde x es la Si tomamos como unidad el lado menor debe ser = 1 x–1 longitud del lado mayor. De ahí resulta de nuevo la ecuación de segundo grado 1+ 5 » 1,618. x2 – x – 1= 0, cuya única solución real positiva es F= 2 Luego un rectángulo es áureo cuando cumple C

Figura 22.

D

Si se reitera el proceso comenzando por un rectángulo áureo ABCD y cortando cada vez un cuadrado, obtenemos una serie de rectángulos áureos. Se trata una vez más de la llamada propiedad reproductiva. A partir de esta secuencia de rectángulos puede obtenerse la espiral áurea o de Durero, que es una falsa espiral, pues está formada por arcos de circunferencia. No obstante es una buena aproximación de la espiral equiangular o espiral del crecimiento armonioso. 1–x

1

B

1

A

6.2. Rectángulos áureos

6.3. La espiral áurea

lado mayor =F lado menor

Podemos construir un rectángulo áureo partiendo de un cuadrado de lado a; para ello, haciendo centro con el compás en el punto medio de la base con abertura la distancia de este punto al vértice del lado opuesto; traza un arco que intercepte a la prolongación de la base, tal como se muestra en la figura 23a. De esta forma se construye un rectángulo áureo. Esta propiedad se utiliza para construir rectángulos áureos, conocido su lado menor. Para construir un rectángulo áureo conocido su lado mayor AB, bastará dividir éste en media y extrema razón, y tomar como longitud del lado menor la misma que la del segmento áureo AP. En la figura 23b se muestra que el rectángulo áureo es el único en el cual la prolongación de una diagonal contiene al vértice del mismo rectángulo adyacente colocado verticalmente al lado. Obviamente todo rectángulo semejante a uno áureo es también áureo. a)

a

b)

a

b

b

Figura 23.

a

a a

a a

a

Figura 23.

b

Podemos construir un rectángulo áureo partiendo de un cuadrado de lado a; para ello, haciendo centro con el compás en el punto medio de la base con abertura la distancia de este punto al vértice del lado opuesto; traza un arco que intercepte a la prolongación de la base, tal como se muestra en la figura 23a. De esta forma se construye un rectángulo áureo. Esta propiedad se utiliza para construir rectángulos áureos, conocido su lado menor. Para construir un rectángulo áureo conocido su lado mayor AB, bastará dividir éste en media y extrema razón, y tomar como longitud del lado menor la misma que la del segmento áureo AP. En la figura 23b se muestra que el rectángulo áureo es el único en el cual la prolongación de una diagonal contiene al vértice del mismo rectángulo adyacente colocado verticalmente al lado. a

b

a)

b)

a

Obviamente todo rectángulo semejante a uno áureo es también áureo. lado mayor =F lado menor

Luego un rectángulo es áureo cuando cumple

6.3. La espiral áurea

Figura 22.

Un rectángulo es áureo cuando, una vez cortado el cuadrado construido sobre el lado menor, el rectángulo que queda es semejante al de partida. Ello permite determinar qué razón debe haber entre los lados de un rectángulo para que sea áureo. x 1 , donde x es la Si tomamos como unidad el lado menor debe ser = 1 x–1 longitud del lado mayor. De ahí resulta de nuevo la ecuación de segundo grado 1+ 5 » 1,618. 2 x2 – x – 1= 0, cuya única solución real positiva es F=



226

Figura 24.

6.2. Rectángulos áureos

B

1

A

Si se reitera el proceso comenzando por un rectángulo áureo ABCD y cortando cada vez un cuadrado, obtenemos una serie de rectángulos áureos. Se trata una vez más de la llamada propiedad reproductiva. A partir de esta secuencia de rectángulos puede obtenerse la espiral áurea o de Durero, que es una falsa espiral, pues está formada por arcos de circunferencia. No obstante es una buena aproximación de la espiral equiangular o espiral del crecimiento armonioso. 1–x

C

1

D


6.4. El pentágono regular, el pentagrama y el triángulo áureo La escuela pitagórica fue fundada por Pitágoras de Samos (sigloVI a.C.), y se estableció en Crotona, al sur de Italia. El pentagrama, estrella de cinco puntas, fue el símbolo distintivo de los pitagóricos. En esta figura tan emblemática también está presente la razón áurea. A Si trazamos las cinco diagonales de un pentágono regular ABCDE como el de la figura 25, nos aparece un pentágono regular estrellado (el pentagrama pitagórico), y además se “reproduce” un pentágono regular C' D' E B semejante A ' B 'C ' D ' E '. Ese sentido de autorreproducción se da también en triángulos isósceles como el ACD, cuyos ángulos son 36º , 72º , 72º. E'

B' A'

Figura 25.

C

D

Por esa propiedad reproductiva similar a la del rectángulo áureo, ese triángulo recibe también el nombre de triángulo áureo (figuras 26a, 26b). Obviamente las cinco puntas del pentagrama son también triángulos áureos. a)

b)

A

c)

36º

36º

36º

P 72º

72º

108º

36º 72º

72º

72º

36º

72º D

C

Figura 26. Sea l5 el lado del pentágono regular de partida y d 5 la diagonal (cuya medida equivale a la del lado l*5 del pentágono regular estrellado). Vamos a justificar la presencia de la razón áurea en la figura viendo que d 5 l5* 1+ 5 = = F= l5 l5 2 Razonaremos sobre la figura 26c: La bisectriz del ángulo C$ corta al lado AD en un punto P que divide a dicho lado en media y extrema AD CD . razón. Por semejanza de los triángulos isósceles ACD y CDP tendremos = CD DP Pero, por ser ACP también isósceles, DP = AD – AP = AD – CP = AD – CD. d l5 . Luego: 5 = l5 d 5 – l5 Así, pues, del pentagrama de la figura 25 pueden obtenerse muchos pares de segmentos en razón áurea. Por ejemplo: AD ' CE EC ' AE ' = = = ...= F D ' E ' CB ' C ' D ' B ' E ' TEMARIO DE MATEMÁTICAS. PRUEBA A

227


228


Si unimos las diagonales de un pentágono regular, éstas forman, tal como vimos, otro pentágono regular más pequeño, y a la vez las diagonales de este segundo forman un tercer pentágono más pequeño aún. Este proceso puede continuarse indefinidamente, obteniéndose pentágonos regulares tan pequeños como queramos (figura 28), y lleva a la conclusión de que la razón de la diagonal al lado en el pentágono regular no puede ser racional. Es bastante plausible que esta observación fuera la que condujo a Hipaso de Metaponto (siglo V a.C.) al descubrimiento de parejas de segmentos inconmensurables. Figura 28. Utilizando la sección áurea, divulgada por Euclides, Claudio Ptolomeo resolvió en su Almagesto el problema de encontrar los lados del pentágono y decágono regulares convexos inscritos en un círculo dado. Pero el dodecaedro e icosaedro inscritos en una esfera son las prolongaciones en el espacio del pentágono regular. Los 20 vértices del dodecaedro son los de cuatro pentágonos regulares iguales de dos en dos, situados en planos paralelos, siendo F la razón entre la longitud de los lados de los grandes y los lados de los pequeños. Asimismo, los 12 vértices del icosaedro son los 3 rectángulos áureos perpendiculares entre sí. El dodecaedro y el icosaedro son cuerpos recíprocos (al igual que el cubo y el octaedro, se obtiene uno de ellos uniendo los centros de las caras del otro).

Podemos dividir una circunferencia de radio r en diez partes iguales. Los puntos de división forman el decavértice regular.

–

Si unimos de uno en uno obtenemos el decágono regular convexo de lado l10.

–

Si unimos de dos en dos obtenemos el pentágono regular convexo de lado l5.

–

Si unimos de tres en tres obtenemos el decágono regular estrellado de lado l*10 .

–

Si unimos de cuatro en cuatro obtenemos el pentágono regular estrellado de lado l*5 .

a)

b)

c)

1

1

2

10

1A

2

10

36º

9

3

8

4

3

8

O

4

72º 72º 36º

3C

H

72º

36º 4D

* 1 l10 l = 1+ 10 = 1+ = F F r r

5

7

9

5

7

6

y dividiendo entre r:

6

Figura 27. * l10 = AD = AH + HD = OA + CD = r+ l10

Son fáciles de deducir las relaciones

La tercera ya está probada. La primera es inmediata, pues el ángulo central en el decágono regular es precisamente 36º. La segunda se deduce rápidamente de la figura 27c, ya que: l10* =F r

l*5 =F l5

r =F l10

r =F l10

l*5 =F l5

l10* =F r

La tercera ya está probada. La primera es inmediata, pues el ángulo central en el decágono regular es precisamente 36º. La segunda se deduce rápidamente de la figura 27c, ya que: Son fáciles de deducir las relaciones

* l10 = AD = AH + HD = OA + CD = r+ l10

Figura 27. * 1 l10 l = 1+ 10 = 1+ = F F r r

6 7

y dividiendo entre r:

6

7

5

8

4

8

9

3

9

5

36º 4D

4

Si unimos las diagonales de un pentágono regular, éstas forman, tal como vimos, otro pentágono regular más pequeño, y a la vez las diagonales de este segundo forman un tercer pentágono más pequeño aún. Este proceso puede continuarse indefinidamente, obteniéndose pentágonos regulares tan pequeños como queramos (figura 28), y lleva a la conclusión de que la razón de la diagonal al lado en el pentágono regular no puede ser racional. Es bastante plausible que esta observación fuera la que condujo a Hipaso de Metaponto (siglo V a.C.) al descubrimiento de parejas de segmentos inconmensurables. Figura 28. Utilizando la sección áurea, divulgada por Euclides, Claudio Ptolomeo resolvió en su Almagesto el problema de encontrar los lados del pentágono y decágono regulares convexos inscritos en un círculo dado. Pero el dodecaedro e icosaedro inscritos en una esfera son las prolongaciones en el espacio del pentágono regular. Los 20 vértices del dodecaedro son los de cuatro pentágonos regulares iguales de dos en dos, situados en planos paralelos, siendo F la razón entre la longitud de los lados de los grandes y los lados de los pequeños. Asimismo, los 12 vértices del icosaedro son los 3 rectángulos áureos perpendiculares entre sí. El dodecaedro y el icosaedro son cuerpos recíprocos (al igual que el cubo y el octaedro, se obtiene uno de ellos uniendo los centros de las caras del otro). O

72º 72º 36º

3

72º

H

3C

36º

10

10

2

1

a)

2

1A

1

b)

c)

Si unimos de cuatro en cuatro obtenemos el pentágono regular estrellado de lado l*5 .

–

Si unimos de tres en tres obtenemos el decágono regular estrellado de lado l10* .

–

Si unimos de dos en dos obtenemos el pentágono regular convexo de lado l5.

–

Si unimos de uno en uno obtenemos el decágono regular convexo de lado l10.

–

Podemos dividir una circunferencia de radio r en diez partes iguales. Los puntos de división forman el decavértice regular.



228

Proporciones notables En el espacio sólo existen cinco poliedros convexos regulares –cuerpos platónicos– y dos poliedros regulares estrellados precisamente ambos dodecaedros estrellados (figura 29). La sección áurea juega un papel importante como vínculo armónico entre esos sólidos, en particular entre el dodecaedro y el icosaedro, ambos convexos, y los dos estrellados.

Figura 29.

6.5. El número de oro y la sucesión de Fibonacci Haciendo uso de la propiedad anterior podemos obtener las sucesivas potencias de F como sigue: F2 = 1+ F F3 = (1+ F )F = F+ F2 = 1+ 2F F4 = (1+ 2F )F = F+ 2F2 = F+ 2(1+ 2F ) = 2+ 3F F5 = ( 2+ 3F )F = 2F+ 3F2 = 2F+ 3(1+ F ) = 3+ 5F M Obtenemos como puede apreciarse Fn = Fn–1+ FnF siendo Fn los números de Fibonacci, o sea ( Fn ) = (1, 1, 2, 3, 5, 8, ... ) sucesión que de manera recurrente se define mediante: F1 = 1; F2 = 1; Fn = Fn– 2 + Fn–1. F Por su parte, la sucesión n de cocientes entre cada dos números de Fibonacci consecutivos es Fn–1 1 2 3 5 8 13 , , , , , ,... , que se aproxima cada vez más a F, es decir 1 1 2 3 5 8 F lím n = F n ®¥ F n –1 Recíprocamente los números de la sucesión de Fibonacci pueden expresarse a partir de las dos soluciones de la ecuación x 2 – x – 1= 0, de la manera siguiente: Fn =

n n æ öù 1 éæ 1+ 5 ö ÷ – ç 1 – 5 ÷ ú con n Î N * êç ç ÷ ç ÷ 5ê ëè 2 ø è 2 ø ú û


229


230


6.6. Definiciones recursivas del número áureo

Como consecuencia los cuadrados construidos sobre los lados de ese triángulo tienen áreas a 2, h 2 y c2 en progresión geométrica de razón F.

Recordemos que el número F es solución de la ecuación x2 – x – 1= 0, por lo que verifica F2 = F+ 1 1 y dividiendo por F, llegamos a F = 1+ . Ello permite una caracterización numérica mediante una iteraF ción, que da como resultado una fracción continua: c c c c = = = h ac c a

c = F a

1 c = F a

1+

= [1, 1, 1, ...]

1

1+

1

1+

h ac = = a a

F= 1+

1 O

y esta ecuación tiene como solución, como ya sabemos, el número de oro . Aún podemos llegar a que las medidas de los lados a, h y c del triángulo rectángulo AOM están en progresión geométrica cuya razón es F. En efecto: Hay otras formas de obtener de modo recurrente el valor de F, como por ejemplo: ( ax )2 – a 2 = a ( ax ) ; a 2 ( x 2 – 1) = a 2x ; x 2 – x – 1= 0

La razón x =

c debe cumplir a

F= 1+ 1+ 1+ 1+...

cuya simple comprobación mediante la calculadora puede ser didácticamente interesante. Igualando: h 2 = ac, de donde c2 – a 2 = ac.

Figura 30.

6.7. La Pirámide de Keops y el triángulo sagrado Área del cuadrado = h 2. 2ac = ac 2

Esta pirámide es de base cuadrada de lado: 2a = 232,805 m y de altura: h = 148,208 m. Los sacerdotes egipcios comunicaron a Herodoto que las proporA ciones de la gran pirámide eran tales que el área del cuadrado construido sobre la altura coincidía con el el área de cada una de las caras laterales triangulares. 2a

M

h O

– –

Área cara =

c

Esta pirámide es de base cuadrada de lado: 2a = 232,805 m y de altura: h = 148,208 m. Los sacerdotes egipcios comunicaron a Herodoto que las proporA ciones de la gran pirámide eran tales que el área del cuadrado construido sobre la altura coincidía con el el área de cada una de las caras laterales triangulares. c

h O

–

M

–

6.7. La Pirámide de Keops y el triángulo sagrado

2a

Área del cuadrado = h 2. 2ac Área cara = = ac 2

Figura 30.

Igualando: h 2 = ac, de donde c2 – a 2 = ac.

cuya simple comprobación mediante la calculadora puede ser didácticamente interesante. c debe cumplir a

F= 1+ 1+ 1+ 1+...

La razón x =

( ax )2 – a 2 = a ( ax ) ; a 2 ( x 2 – 1) = a 2x ; x 2 – x – 1= 0

Hay otras formas de obtener de modo recurrente el valor de F, como por ejemplo:

y esta ecuación tiene como solución, como ya sabemos, el número de oro . Aún podemos llegar a que las medidas de los lados a, h y c del triángulo rectángulo AOM están en progresión geométrica cuya razón es F. En efecto: 1

1

= [1, 1, 1, ...]

c c c c = = = h ac c a

F= 1+

1+

c = F a

1+

1 1 O

1+

h ac = = a a

c = F a

Recordemos que el número F es solución de la ecuación x2 – x – 1= 0, por lo que verifica F2 = F+ 1 1 y dividiendo por F, llegamos a F = 1+ . Ello permite una caracterización numérica mediante una iteraF ción, que da como resultado una fracción continua:

Como consecuencia los cuadrados construidos sobre los lados de ese triángulo tienen áreas a 2, h 2 y c2 en progresión geométrica de razón F.

6.6. Definiciones recursivas del número áureo



230

Proporciones notables En la pirámide se observa, pues, la presencia del llamado triángulo sagrado, semejante al de medi2 das 1, F, F, que es rectángulo, pues cumple F2 = 12 + ( F) . Alateral 4 F = =F 4 Abase

~ F

4 F+ 4 1 Atotal = = 1+ = F 4F F Alateral

~F

~1

Figura 31.

7. APLICACIONES 7.1. Las proporciones en el arte Un problema que se ha planteado a lo largo de la historia es ver qué proporción entre los elementos de una obra de arte (pintura, escultura, arquitectura,…) le confiere un mayor grado de belleza. El concepto platónico de proporción ha acercado a arquitectos, escultores y pintores de todos los tiempos a la razón áurea, utilizándola en la composición de sus obras como elemento que aporta una agradable sensación de la armonía y equilibrio. La simetría, según Vitruvio, es “el acorde de medida entre los diferentes elementos de la obra, como entre estos elementos separados y el conjunto... Como en el cuerpo humano fluye de la proporción –la que los griegos llaman “analogía”– consonancia entre el todo y la parte... Cuando cada parte importante del edificio está, además, convenientemente proporcionada en razón al acorde entre lo alto y lo ancho, entre lo ancho y lo profundo, y cuando todas esas partes tienen también su lugar en la simetría total del edificio, obtenemos la euritmia”. Vitruvio insiste mucho en esa “sinfonía” perfecta del juego de las proporciones en el cuerpo humano y de correspondencias análogas, e incluso numéricamente idénticas, que el arquitecto debe establecer en el plano eurítmico de los edificios sagrados. La euritmia aparece cuando esa simetría, esa correspondencia métrica, se obtiene por el encadenamiento continuo de las proporciones, por analogía recurrente, y cuando además la analogía se manifiesta de modo feliz tanto en las partes maestras como en las relaciones entre esas partes y el conjunto arquitectónico. A

Y

Z B Q

P b O S

D

R

a

M

N

C

ABCD: áureo. PQRS : áureo. a: 36º. MN : lado del decágono de radio OM . b = 60º. MN = YZ = lado del hexágono regular inscrito en la circunferencia de centro X y de radio XY .

Figura 32. Planta de la Iglesia del Santo Espíritu (Florencia).

Algunos ejemplos los tenemos en el Partenón de Atenas, el cual se inscribe en un rectángulo de oro (figura 33a). En otros muchos edificios actuales y de la antigüedad como la catedral de Notre Dame en París, la de Colonia en Alemania o las torres de las Naciones Unidas de Nueva York, también está presente la divina proporción. Incluso en monumentos megalíticos como el cromlech de Chartres (Francia). TEMARIO DE MATEMÁTICAS. PRUEBA A

231



Figura 34. a) El hombre microcosmos. b) El canon de Leonardo.

b)

232

a)

Los escultores egipcios ya las concibieron al dividir en partes iguales el cuerpo humano para repartirse el trabajo entre varios. Tomaron como unidad modular el dedo corazón, que equivalía a la decimonona parte de la altura. Los griegos utilizaron los números para buscar con ellos proporciones armoniosas en las esculturas humanas. A estas proporciones ideales las llamaron canon. Polícleto (siglo V a.C.) presenta en su famoa) b) so Doríforo, a un atleta idealizado en el que la altura del cuerpo es siete veces la de la cabeza. En cambio Lisipo (siglo IV a.C.) adopta en su Apoxiomeno una estatura completa de ocho cabezas. Otros muchos artistas (Mirón, Vitruvio, Alberti, Durero, Leonardo da Vinci, etc.) han propuesto su canon. Las proporciones humanas fueron objeto sistemático de estudio por parte de arquitectos, escultores, pintores y matemáticos. En los inicios del Renacimiento fue cuando se introdujo con más fuerza el canon artístico definido por el nú-

Fachada del Partenón

Figura 33.

Esquema de templo egipcio

Además de la gran pirámide de Keops ya estudiada, otros templos del antiguo Egipto delatan la presencia de la razón áurea (figura 33b). Así por ejemplo el templo de Osiris tenía como planta un rectángulo de oro aproximado, cuyas dimensiones eran de 100 y 160 codos. En el de Hathor aparecen la proporciones 1, F, F2. En los frescos del templo de Chunsu en Karnak hay representadas fachadas de que son rectángulos áureos divididos armónicamente. Muchos pintores han utilizado en sus cuadros la proporción áurea. A saber: Las Hilanderas de Velázquez, La Sagrada Familia de Miguel Angel, Los pastores de Arcadia de Nicolás Poussin, San Miguel abatiendo al demonio y La bella jardinera de Rafael, La Gioconda de Leonardo da Vinci. Más recientemente, aparece en obras de artistas modernos como el cuadro de Salvador Dalí titulado Taza gigante volante con anexo inexplicable de cinco metros de longitud. El arquitecto francés Le Corbusier es el autor de una escala llamada, el Modulor, basada en el cuerpo humano y sus proporciones áureas. Fechner, inventor de la Psicología Física, hizo en 1876 una serie de experiencias de estadística estética, pidiendo a numerosas personas que escogieran, entre diferentes rectángulos (incluyendo también el cuadrado), aquél cuya forma les agradase más. El rectángulo de oro tuvo una acentuada mayoría de sufragios. Se explica que el uso de la proporción áurea en el diseño esté tan extendido. Así pues, los formatos del papel de oficio y de muchos libros, tabletas de chocolate, tarjetas postales, etc., son rectángulos de oro.

7.2. Las proporciones antropomórficas

Además de la gran pirámide de Keops ya estudiada, otros templos del antiguo Egipto delatan la presencia de la razón áurea (figura 33b). Así por ejemplo el templo de Osiris tenía como planta un rectángulo de oro aproximado, cuyas dimensiones eran de 100 y 160 codos. En el de Hathor aparecen la proporciones 1, F, F2. En los frescos del templo de Chunsu en Karnak hay representadas fachadas de que son rectángulos áureos divididos armónicamente. Muchos pintores han utilizado en sus cuadros la proporción áurea. A saber: Las Hilanderas de Velázquez, La Sagrada Familia de Miguel Angel, Los pastores de Arcadia de Nicolás Poussin, San Miguel abatiendo al demonio y La bella jardinera de Rafael, La Gioconda de Leonardo da Vinci. Más recientemente, aparece en obras de artistas modernos como el cuadro de Salvador Dalí titulado Taza gigante volante con anexo inexplicable de cinco metros de longitud. El arquitecto francés Le Corbusier es el autor de una escala llamada, el Modulor, basada en el cuerpo humano y sus proporciones áureas. Fechner, inventor de la Psicología Física, hizo en 1876 una serie de experiencias de estadística estética, pidiendo a numerosas personas que escogieran, entre diferentes rectángulos (incluyendo también el cuadrado), aquél cuya forma les agradase más. El rectángulo de oro tuvo una acentuada mayoría de sufragios. Se explica que el uso de la proporción áurea en el diseño esté tan extendido. Así pues, los formatos del papel de oficio y de muchos libros, tabletas de chocolate, tarjetas postales, etc., son rectángulos de oro.

7.2. Las proporciones antropomórficas

Los escultores egipcios ya las concibieron al dividir en partes iguales el cuerpo humano para repartirse el trabajo entre varios. Tomaron como unidad modular el dedo corazón, que equivalía a la decimonona parte de la altura. Los griegos utilizaron los números para buscar con ellos proporciones armoniosas en las esculturas humanas. A estas proporciones ideales las llamaron canon. Polícleto (siglo V a.C.) presenta en su famoa) b) so Doríforo, a un atleta idealizado en el que la altura del cuerpo es siete veces la de la cabeza. En cambio Lisipo (siglo IV a.C.) adopta en su Apoxiomeno una estatura completa de ocho cabezas. Otros muchos artistas (Mirón, Vitruvio, Alberti, Durero, Leonardo da Vinci, etc.) han propuesto su canon. Las proporciones humanas fueron objeto sistemático de estudio por parte de arquitectos, escultores, pintores y matemáticos. En los inicios Figura 34. a) El hombre microcosmos. del Renacimiento fue cuando se introdujo con más fuerza el canon artístico definido por el núb) El canon de Leonardo.

Fachada del Partenón

a)

Esquema de templo egipcio

b)



Figura 33.

232

Proporciones notables mero de oro. Así pues, el monje italiano Luca Paccioli publicó su libro Divina Proportione (Venecia, 1509), en el que aparece la figura hecha por Leonardo da Vinci del hombre inscrito en un cuadrado, para ilustrar los trabajos de Vitrubio acerca de las proporciones humanas. Leonardo dice: Si abres las piernas hasta reducir tu altura en una décima cuarta parte, y si extiendes y levantas los brazos hasta que los dedos corazón lleguen al nivel de la cima de la cabeza, verás que el centro de los miembros extendidos se halla en el ombligo, y que el espacio entre las piernas formará un triángulo equilátero.

Colocando la punta de un compás en el ombligo, y tomando como radio de la circunferencia la distancia que existe entre la planta de los pies y el ombligo, entonces los dedos de las manos y de los pies tocarán la circunferencia así trazada. En el Renacimiento diferentes artistas estudiaron con profundidad las proporciones del cuerpo humano. El más significativo, Leonardo da Vinci, en su Tratado de Pintura, recoge: la longitud de la mano debe ser 1/3 del brazo; la distancia entre el corte de la boca y la base de la nariz debe ser 1/7 del rostro; las longitudes del mentón a la base de la nariz y de aquí a la frente deben estar en la proporción de 1/3 ; la boca debe medir una cuarta parte de la longitud del rostro; la anchura del cuello debe ser 1, y 3/4 el espacio entre la nuca y la ceja,... Y así miles de medidas diferentes para todas las partes del cuerpo, incluyendo torso, piernas y dedos,… A

K

F AB = AD = DB = BC FD EB

a'

a

FD = DH = EB = DE DE HB

D

CD = a a'= b b'= a a' b b' c c'

c

E

c'

b

b'

H

B

C

Figura 35. Análisis armónico de un rostro (Helen Wills).

En 1855, el científico alemán Zeysing efectuó medidas sobre miles de cuerpos humanos y encontró que el canon ideal relacionado con la divina proporción parece ser la expresión de una ley estadística media para los cuerpos sanamente desarrollados (figura 35). Así pues, comprobó estadísticamente que el ombligo divide “áureamente” al cuerpo humano adulto en sección áurea. Por tanto, en el dibujo de Leonardo el cuerpo del hombre está inscrito en una circunferencia, cuyo radio es su sección áurea. En las estatuas antiguas grieA gas de la época de Fidias, también han sido hechas estas comprobaB ciones, resultando muy de acuerAE = CE = F (Ombligo) CE CA do con los cánones muy estudiados de Durero y de Leonardo. AC BC BC

=

BA

= F (Cuello)

C

EC = DC = F (Rodilla) DC DE

D


E

233

234



Desde la antigüedad es sabido que las distintas partes del cuerpo humano guardan la proporción anteriormente estudiada, Así, por ejemplo, en el dedo del cuerpo humano aparece esta relación entre la primera falange y la segunda, y la segunda y la tercera. Ya se indicó cómo Zeysing constató estadísticamente que el ombligo divide la altura del cuerpo humano de un adulto según la razón F como resultado estadístico medio de un gran número de observacio-

7.3. Las proporciones en la música

Las proporciones desempeñan también una función importante en la música. La superposición de dos sonidos se llama intervalo; los intervalos utilizados en música son tales que el número de vibraciones de los dos sonidos están en una razón sencilla. Así si ambos tienen el mismo número de vibraciones se llama unísono, razón 1/1. Cuando la razón es 2/1 tenemos la octava. Otras razones que dan sonidos acordes, y por tanto agradables, son 3/2 (quinta), 4/3 (cuarta), 5/4 (tercia mayor), 6/5 (tercia menor), 5/3 (sexta menor) y 8/5 (sexta mayor). Los antiguos no trataron de contar las vibraciones correspondientes a los diferentes sonidos sino que encontraron directamente la ley de las razones sencillas operando con una cuerda vibrante cuya longitud se hacía variar con un cursor: esas longitudes son en efecto inversamente proporcionales al número de vibraciones. Así pues, Pitágoras realizó el siguiente experimento:

7.4. Las proporciones en la naturaleza

Tensó una cuerda musical que producía un sonido cuyo 0 0 0 0 grado de elevación (tono) tomó como base. Hizo señales 1 en la cuerda dividiéndola en doce partes iguales. Al pisar la cuerda en el 6 y hacerla sonar se obtenía un sonido conso2 nante con el anterior, es decir, que armonizaban al produ1 3 cirse ambos juntos: era precisamente la octava superior. 2 3 Pisó luego en el 9 y obtuvo otro sonido consonante con los 4 3 8 anteriores: la cuarta superior. Del mismo modo al pisar en 4 5 el 8, se obtenía la quinta. 6 6 1 Como puede verse al pisar en un punto de la cuerda, según Octava 7 el trozo que se deja para producir el nuevo sonido esté con 1 3 2 8 8 respecto al total en la proporción , o , tendremos resQuinta 2 4 3 9 9 pectivamente los tres sonidos consonantes fundamentales: Cuarta 10 la octava, la cuarta y la quinta. Los sonidos obtenidos al pisar en otros puntos de la cuerda resultaban discordes, o al 11 menos no tan acordes con los anteriores. 12 Pitágoras llegó, pues, a la conclusión de que las proporcioTono nes también gobiernan la música. El arte de encadenar las notas o acordes sucesivos en una frase o contorno melódico es la armonía musical. Se ve la analogía con el encadenamiento de proporciones en líneas, superficies o volúmenes eurítmicos en las artes visuales. Haylock (1978) estudió el primer movimiento de la 5ª sinfonía de Beethoven, el cual se estructura en cinco partes: exposición, exposición repetida, desarrollo, recapitulación y coda. El movimiento comienza con la famosa frase musical “la llamada del destino”, que actúa como célula generadora de todo el movimiento y reaparece en los demás, confiriendo a la obra una unidad extraordinaria. Entre la primera y la última vez que aparece en el primer movimiento hay 600 compases. Si dividimos en sección áurea ese segmento obtenemos dos de 372 y 228 compases. Pues bien, en el compás 372 hay otra exposición de “la llamada del destino” y comienza la recapitulación. Además, la exposición consta de 124 compases. La división áurea de los primeros 62 compases da dos segmentos de 38 y 24 compases. Sorprendentemente al llegar al compás 24 de nuevo aparece “la llamada del destino”. En los 38 compases siguientes también se observan propiedades curiosas en las que están implicados los números de Fibonacci. Para Haylock toda esa estructura no fue intencionada, sino más bien fruto del azar o de la intuición estética de Beethoven. Sin embargo, parece ser que en algunas obras musicales sus compositores sí han utilizado premeditadamente la razón áurea.

Tensó una cuerda musical que producía un sonido cuyo grado de elevación (tono) tomó como base. Hizo señales 1 en la cuerda dividiéndola en doce partes iguales. Al pisar la cuerda en el 6 y hacerla sonar se obtenía un sonido conso2 nante con el anterior, es decir, que armonizaban al produ1 3 cirse ambos juntos: era precisamente la octava superior. 2 3 Pisó luego en el 9 y obtuvo otro sonido consonante con los 4 3 8 anteriores: la cuarta superior. Del mismo modo al pisar en 4 5 el 8, se obtenía la quinta. 6 6 1 Como puede verse al pisar en un punto de la cuerda, según Octava 7 el trozo que se deja para producir el nuevo sonido esté con 1 3 2 8 8 respecto al total en la proporción , o , tendremos resQuinta 2 4 3 9 9 pectivamente los tres sonidos consonantes fundamentales: Cuarta 10 la octava, la cuarta y la quinta. Los sonidos obtenidos al pisar en otros puntos de la cuerda resultaban discordes, o al 11 menos no tan acordes con los anteriores. 12 Pitágoras llegó, pues, a la conclusión de que las proporcioTono nes también gobiernan la música. El arte de encadenar las notas o acordes sucesivos en una frase o contorno melódico es la armonía musical. Se ve la analogía con el encadenamiento de proporciones en líneas, superficies o volúmenes eurítmicos en las artes visuales. Haylock (1978) estudió el primer movimiento de la 5ª sinfonía de Beethoven, el cual se estructura en cinco partes: exposición, exposición repetida, desarrollo, recapitulación y coda. El movimiento comienza con la famosa frase musical “la llamada del destino”, que actúa como célula generadora de todo el movimiento y reaparece en los demás, confiriendo a la obra una unidad extraordinaria. Entre la primera y la última vez que aparece en el primer movimiento hay 600 compases. Si dividimos en sección áurea ese segmento obtenemos dos de 372 y 228 compases. Pues bien, en el compás 372 hay otra exposición de “la llamada del destino” y comienza la recapitulación. Además, la exposición consta de 124 compases. La división áurea de los primeros 62 compases da dos segmentos de 38 y 24 compases. Sorprendentemente al llegar al compás 24 de nuevo aparece “la llamada del destino”. En los 38 compases siguientes también se observan propiedades curiosas en las que están implicados los números de Fibonacci. Para Haylock toda esa estructura no fue intencionada, sino más bien fruto del azar o de la intuición estética de Beethoven. Sin embargo, parece ser que en algunas obras musicales sus compositores sí han utilizado premeditadamente la razón áurea. 0

0

0

0

Las proporciones desempeñan también una función importante en la música. La superposición de dos sonidos se llama intervalo; los intervalos utilizados en música son tales que el número de vibraciones de los dos sonidos están en una razón sencilla. Así si ambos tienen el mismo número de vibraciones se llama unísono, razón 1/1. Cuando la razón es 2/1 tenemos la octava. Otras razones que dan sonidos acordes, y por tanto agradables, son 3/2 (quinta), 4/3 (cuarta), 5/4 (tercia mayor), 6/5 (tercia menor), 5/3 (sexta menor) y 8/5 (sexta mayor). Los antiguos no trataron de contar las vibraciones correspondientes a los diferentes sonidos sino que encontraron directamente la ley de las razones sencillas operando con una cuerda vibrante cuya longitud se hacía variar con un cursor: esas longitudes son en efecto inversamente proporcionales al número de vibraciones. Así pues, Pitágoras realizó el siguiente experimento:

7.4. Las proporciones en la naturaleza

Desde la antigüedad es sabido que las distintas partes del cuerpo humano guardan la proporción anteriormente estudiada, Así, por ejemplo, en el dedo del cuerpo humano aparece esta relación entre la primera falange y la segunda, y la segunda y la tercera. Ya se indicó cómo Zeysing constató estadísticamente que el ombligo divide la altura del cuerpo humano de un adulto según la razón F como resultado estadístico medio de un gran número de observacio-

7.3. Las proporciones en la música



234

Proporciones notables nes. Si dividimos la estatura de un adulto de pie en 13 partes iguales el ombligo queda aproximadamente a 8 13 8 del suelo (aproximaciones fibonacianas que encuadran a F, pues = 1,6 y = 1,625). 5 8 Pero también aparece la sección áurea, allá donde queramos buscarla, dentro de la naturaleza. Así por ejemplo: en la forma y crecimiento de las plantas, en organismos marinos como la estrella de mar, en conchas de moluscos, piñas, etc. Sorprende cómo los estados de equilibrio de la mayoría de los sistemas físicoquímicos inorgánicos, como por ejemplo las redes cristalinas, tienden a esquemas geométricos regulares que dan simetrías resultantes de tipo cuadrado, triangular o hexagonal (en el plano) y cúbico u octaédrico (en el espacio). Sin embargo, en los sistemas que contienen materia viva organizada encontramos a menudo formas fundadas en la simetría pentagonal, es decir, una asimetría armoniosa basada en la sección áurea. El crecimiento de los seres vivos –que actúa de dentro hacia fuera, como por imbibición o turgencia, y no por aglutinación como en las redes cristalinas– tiende a producir forma sucesivas homotéticas, es decir semejantes a sí mismas. Aquí se manifiesta la diferencia esencial entre la simetría hexagonal que corresponde perfectamente al equilibrio inerte (relleno del plano, isotropismo, periodicidad estática...) y la simetría pentagonal que introduce tanto en el plano (pentágonos y pentagramas) como en el espacio (poliedros estrellados alternados a partir de un núcleo dodecaédrico) periodicidad dinámica, perfectamente ritmada en progresión geométrica, que corresponde al crecimiento perfectamente homotético (analógico) cuya huella esquemática correspondería a una espiral logarítmica. Más aún, el crecimiento que resuelve el problema de ser a la vez aditivo y geométrico está regido por una espiral con rectángulo director de módulo F, es decir, la espiral áurea como aproximación de una espiral logarítmica.

Concha del nautilus. Flores pentámeras. Figura 37.

Muchas flores y algunos animales marinos (crinoideos, estrellas de mar y erizos) tienen una disposición pentagonal, lo que guarda relación con el número de oro. Así pues, el pentagrama, cuyas propiedades están resumidas aritmética y algebraicamente en el número de oro es un motivo dominante en las formas vivas. La concha del nautilus crece en forma de una espiral áurea. El perfil de algunos huevos de aves puede inscribirse en un rectángulo cuyas proporciones oscilan entre F (figura 38a) y F (figura 38b). Además, el eje transversal corta al longitudinal según la proporción áurea. TEMARIO DE MATEMÁTICAS. PRUEBA A

(a)

(b)

Figura 38. 235


236


El número de oro aparece también en Filotaxia, parte de la Botánica que se ocupa de la distribución de las ramas, de las hojas y de las semillas. Si se calcula qué ángulo constante deben formar entre sí las hojas o las ramas de una planta (dispuestas en hélice ascendente sobre la rama o el tronco) para asegurar el máximo de exposición a una luz vertical. El profesor Wiener encontró en 1875 como solución matemática un ángulo tal que: a=

360º @ 137º 30' 27'' F2

que recibe el nombre de ángulo ideal, siendo el menor ángulo de los dos que resultan al dividir áureamente la circunferencia completa, ya que: 360 = 360 – a

F2 F2 360 = 2 = =F 360 F – 1 F 360 – 2 F

360 1 1– 2 360 – a 360 – F2 F = F2 – 1= F = = 360 1 a F2 F2 Ha habido afán por encontrar leyes que explicaran la “armonía” del Universo. Así pues, en el Sistema Solar, si se colocan todos los planetas en línea recta y se ve cómo cada uno divide a la distancia entre los dos vecinos, se llega a que sólo la Tierra lo hace razón áurea. Se ha especulado con que esto tuviera que ver con el hecho de que nuestro planeta sea el único del Sistema Solar donde haya vida.

Ha habido afán por encontrar leyes que explicaran la “armonía” del Universo. Así pues, en el Sistema Solar, si se colocan todos los planetas en línea recta y se ve cómo cada uno divide a la distancia entre los dos vecinos, se llega a que sólo la Tierra lo hace razón áurea. Se ha especulado con que esto tuviera que ver con el hecho de que nuestro planeta sea el único del Sistema Solar donde haya vida. 360 1 1– 2 360 – a 360 – F2 F = F2 – 1= F = = 360 1 a F2 F2 360 = 360 – a

F2 F2 360 = = =F 360 F2 – 1 F F2

360 –

que recibe el nombre de ángulo ideal, siendo el menor ángulo de los dos que resultan al dividir áureamente la circunferencia completa, ya que: a=

360º @ 137º 30' 27'' F2

El número de oro aparece también en Filotaxia, parte de la Botánica que se ocupa de la distribución de las ramas, de las hojas y de las semillas. Si se calcula qué ángulo constante deben formar entre sí las hojas o las ramas de una planta (dispuestas en hélice ascendente sobre la rama o el tronco) para asegurar el máximo de exposición a una luz vertical. El profesor Wiener encontró en 1875 como solución matemática un ángulo tal que: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


236

TEMA

37 La relación de semejanza en el plano. Consecuencias. Teorema de Thales. Razones trigonométricas




238



INTRODUCCIÓN

2.

LA RELACIÓN DE SEMEJANZA EN EL PLANO 2.1. Propiedades de la semejanza 2.2. Grupo de las semejanzas

3.

SEMEJANZA DE FIGURAS. GRUPO EQUIFORME 3.1. Relación de semejanza en el plano 3.2. Semejanza de figuras 3.3. Grupo equiforme de las semejanzas en el plano

4.

PROPORCIONALIDAD DE MAGNITUDES. MEDIDA 4.1. Aplicación proporcionalidad 4.2. Proporcionalidad y medida 4.3. Proporcionalidad de segmentos: Teorema de Thales 4.3.1. Proyección paralela 4.3.2. Razón de segmentos 4.3.3. Teorema de Thales

5.

TRIÁNGULOS SEMEJANTES. CRITERIOS DE SEMEJANZA DE TRIÁNGULOS 5.1. Primer criterio 5.2. Segundo criterio 5.3. Tercer criterio 5.4. Semejanza de polígonos 5.5. Razones de áreas de dos figuras semejantes

6.

RAZONES TRIGONOMÉTRICAS 6.1. Razones trigonométricas de un ángulo cualquiera 6.2. Otras razones trigonométricas

RAZONES TRIGONOMÉTRICAS 6.1. Razones trigonométricas de un ángulo cualquiera 6.2. Otras razones trigonométricas

6.

TRIÁNGULOS SEMEJANTES. CRITERIOS DE SEMEJANZA DE TRIÁNGULOS 5.1. Primer criterio 5.2. Segundo criterio 5.3. Tercer criterio 5.4. Semejanza de polígonos 5.5. Razones de áreas de dos figuras semejantes

5.

PROPORCIONALIDAD DE MAGNITUDES. MEDIDA 4.1. Aplicación proporcionalidad 4.2. Proporcionalidad y medida 4.3. Proporcionalidad de segmentos: Teorema de Thales 4.3.1. Proyección paralela 4.3.2. Razón de segmentos 4.3.3. Teorema de Thales

4.

SEMEJANZA DE FIGURAS. GRUPO EQUIFORME 3.1. Relación de semejanza en el plano 3.2. Semejanza de figuras 3.3. Grupo equiforme de las semejanzas en el plano

3.

LA RELACIÓN DE SEMEJANZA EN EL PLANO 2.1. Propiedades de la semejanza 2.2. Grupo de las semejanzas

2.

INTRODUCCIÓN

1.



238

La relación de semejanza en el plano

1. INTRODUCCIÓN Es frecuente que los arquitectos, industriales, artistas, etc., tengan la precaución de diseñar su obra en dimensiones reducidas o aumentadas como paso previo a su construcción. Hacen uso de maquetas, modelos, planos, etc. Es decir, en sus respectivas obras trabajan con formas idénticas al resultado final pero a tamaño distinto. El boceto de su obra y ésta serán “semejantes”. Hay dos modos de introducir la semejanza: uno como caso particular de una homotecia, y otro a través de la proporcionalidad de segmentos y definición de figuras semejantes. Del primer modo de enfocar la semejanza se ocupa el tema 42. En el presente tema hablaremos de semejanza de figuras para establecer la relación de semejanza en el plano y hablar del grupo equiforme. Continuaremos con la demostración del teorema de Thales y finalizaremos utilizando dicho teorema para deducir las razones trigonomértricas de un ángulo a.

2. LA RELACIÓN DE SEMEJANZA EN EL PLANO Definición 1. Se llama semejanza en el plano a toda correspondencia biunívoca entre sus puntos tal que si A ' y B ' son los transformados de dos puntos cualesquiera A y B, se verifica que A 'B ' =K AB siendo K un número real, independiente de A y B, llamado razón de semejanza. Es decir, s es una razón de semejanza sobre el plano p si s( A ) = A 'ü ý Þ A ' B ' = K × AB "A , B Î p: s( B ) = B 'þ Se dice que una semejanza es directa si conserva el sentido del plano e inversa en el caso contrario. Llamaremos S al conjunto de todas las semejanzas sobre el plano p.

2.1. Propiedades de la semejanza Consecuencias directas de la definición dada con anterioridad. La semejanza en el plano tiene las siguientes propiedades: 1. 2. 3.

Las semejanzas transforman puntos alineados en puntos alineados y puntos no alineados en puntos no alineados, por lo que transformarán segmentos en segmentos. Las semejanzas transforman ángulos fijos en ángulos fijos iguales, es decir, conservan los ángulos. Por la propia definición un segmento y su transformado son proporcionales, viniendo dada su razón de proporcionalidad por la razón de semejanza K.

2.2. Grupo de las semejanzas Veremos que el conjunto de todas las semejanzas con la operación producto de semejanzas definida por s2 × s1( A ) = s2( s1( A )) tiene estructura de grupo. Para ello, veremos que cumple las siguientes propiedades: 1.

Operación interna: el producto de dos semejanzas es otra semejanza. En efecto, sean s1 y s2 dos semejanzas cualesquiera. Dado un punto A cualquiera, existe un único punto A' tal que A ' = s1( A ), y conocido ese A', existe un único punto A'' tal que s2 ( A ' ) = A ''. Por lo tanto, el transformado de A por el producto s2 × s1 es único, teniendo

( s2 × s1)( A) = s2( s1( A )) = s2( A ') = A ''


239


240


Si fuese ( s2 × s1)( A) = A '' y ( s2 × s1)( B) = A '', siendo A ' = s1( A ) y B ' = s1( B ), tendríamos que s2 ( A ' ) = s2 ( B ' ), por lo que A ' = B ', de donde se deduce que A = B.

Llamemos P(p) al conjunto de las partes del plano p, es decir, al conjunto que contiene todos los subconjuntos de puntos del plano que se puedan formar. A los elementos de P(p) se les llama figuras. Si representamos por F el conjunto de todas las figuras del plano, tendremos que F = P(p). Por tanto, para puntos distintos A y B, si

s1( A ) = A ' y s1( B ) = B ' y

s2 ( A ' ) = A ''

Una figura en el plano será cualquier subconjunto de puntos del plano. Definición 2.

s2 ( B ' ) = B ''

para K1 y K2, razones de s1 y s2, respectivamente, tendríamos

3. SEMEJANZA DE FIGURAS. GRUPO EQUIFORME A 'B ' = K1 y AB

A '' B '' = K2 A 'B '

Así, el conjunto de todas las semejanzas con la operación producto forma un grupo llamado grupo de las semejanzas. y si multiplicamos, miembro a miembro, tenemos

A ' B ' A '' B '' A '' B '' × = K 1× K 2 Þ = K 1× K 2 AB A ' B ' AB

( s–1× s ) = ( M –1× H –1 )× ( H × M ) = M –1× ( H –1× H )× M = M –1× M = I de donde deducimos que la razón de la semejanza producto es igual al producto de las razones de las semejanzas factores.

Toda semejanza s admite una inversa, es decir, que existe una semejanza s–1 tal que s× s–1 = s–1× s = I . Para demostrar esa existencia nos basaremos en que toda semejanza en el plano es el producto de un movimiento por una homotecia. Así, si s = H · M donde H es una homotecia y M un movimiento, su inversa s–1 = M –1× H –1. En efecto, si hacemos

El producto de semejanzas (al ser transformaciones geométricas del plano) es asociativo. En efecto, sean las semejanzas s1, s2 y s3, aplicadas la primera a un punto A, la segunda a la imagen por la primera de A, A' y la tercera a la imagen por la segunda de A', A'', es decir s2 ( A ' ) = A ''

s3 ( A '' ) = A '''

El elemento neutro o semejanza unidad es una convencional para la cual todos los puntos son dobles. Si la representamos por I, se verifica siendo s1 cualquier semejanza Demostraremos que ( ( s3 × s2 )× s1)( A) = ( s3 × ( s2 × s1 ))( A).

3.

s1× I = I × s1 = s1

s1( A ) = A '

4.

2.

( ( s3 × s2 )× s1)( A) = ( s3 × s2 )( s1( A )) = ( s3 × s2 )( A ') = s3( s2 ( A ' )) = s3( A '') = A'''

( s3 × ( s2 × s1 ))( A) = s3 ( s2 × s1 )( A) = s3(s2( s1( A ))) = s3( s2 ( A ' )) = s3( A '') = A '''

( s3 × ( s2 × s1 ))( A) = s3 ( s2 × s1 )( A) = s3(s2( s1( A ))) = s3( s2 ( A ' )) = s3( A '') = A '''

( ( s3 × s2 )× s1)( A) = ( s3 × s2 )( s1( A )) = ( s3 × s2 )( A ') = s3( s2 ( A ' )) = s3( A '') = A'''

Demostraremos que ( ( s3 × s2 )× s1)( A) = ( s3 × ( s2 × s1 ))( A).

El elemento neutro o semejanza unidad es una convencional para la cual todos los puntos son dobles. Si la representamos por I, se verifica siendo s1 cualquier semejanza s2 ( A ' ) = A ''

s1× I = I × s1 = s1

s1( A ) = A '

s3 ( A '' ) = A '''

El producto de semejanzas (al ser transformaciones geométricas del plano) es asociativo. En efecto, sean las semejanzas s1, s2 y s3, aplicadas la primera a un punto A, la segunda a la imagen por la primera de A, A' y la tercera a la imagen por la segunda de A', A'', es decir 4.

Toda semejanza s admite una inversa, es decir, que existe una semejanza s–1 tal que s× s–1 = s–1× s = I . Para demostrar esa existencia nos basaremos en que toda semejanza en el plano es el producto de un movimiento por una homotecia. Así, si s = H · M donde H es una homotecia y M un movimiento, su inversa s–1 = M –1× H –1. En efecto, si hacemos 2.

3.

de donde deducimos que la razón de la semejanza producto es igual al producto de las razones de las semejanzas factores. ( s–1× s ) = ( M –1× H –1 )× ( H × M ) = M –1× ( H –1× H )× M = M –1× M = I A ' B ' A '' B '' A '' B '' × = K 1× K 2 Þ = K 1× K 2 AB A ' B ' AB

Así, el conjunto de todas las semejanzas con la operación producto forma un grupo llamado grupo de las semejanzas. y si multiplicamos, miembro a miembro, tenemos A 'B ' = K1 y AB

A '' B '' = K2 A 'B '

3. SEMEJANZA DE FIGURAS. GRUPO EQUIFORME

para K1 y K2, razones de s1 y s2, respectivamente, tendríamos s1( A ) = A ' y s1( B ) = B ' y

s2 ( A ' ) = A '' s2 ( B ' ) = B ''

Definición 2.

Una figura en el plano será cualquier subconjunto de puntos del plano. Por tanto, para puntos distintos A y B, si

Llamemos P(p) al conjunto de las partes del plano p, es decir, al conjunto que contiene todos los subconjuntos de puntos del plano que se puedan formar. A los elementos de P(p) se les llama figuras. Si representamos por F el conjunto de todas las figuras del plano, tendremos que F = P(p).

Si fuese ( s2 × s1)( A) = A '' y ( s2 × s1)( B) = A '', siendo A ' = s1( A ) y B ' = s1( B ), tendríamos que s2 ( A ' ) = s2 ( B ' ), por lo que A ' = B ', de donde se deduce que A = B.



240


3.1. Relación de semejanza en el plano En el conjunto F vamos a definir una relación entre sus elementos (figuras) de la siguiente manera: dadas dos figuras de F, F1 y F2, diremos que F1 está relacionada con F2 si encontramos una semejanza que permita transformar la figura F1 en F2, es decir, " F1, F2 Î F

F1 ~ F2 Û $ s Î S tal que s( F1 ) = F2

La relación “~”, así definida, es una relación de equivalencia, ya que cumple las propiedades: 1.

Reflexiva: para todo F perteneciente a F, se verifica que F ~ F.

2.

Simétrica: para cualesquiera figuras F1 y F2 de F, si F1 ~ F2, entonces F2 ~ F1.

3.

Transitiva: para cualesquiera figuras F1, F2 y F3 de F, F1 ~ F2 Þ $ s1 Î S tal que s1( F1 ) = F2 ü ýÞ F2 ~ F3 Þ $ s2 Î S tal que s2 ( F2 ) = F3þ Þ s2( s1( F1 )) = F3 Þ ( s2 × s1 )( F1 ) = F3

Por tanto, la relación “~” establece un conjunto cociente en las partes del plano donde cada clase de equivalencia estará formada por una figura y todas sus semejantes. Así, cuando hablamos de un “pentágono” nos estamos refiriendo en realidad a la clase pentágono.

3.2. Semejanza de figuras Dos figuras F1 y F2 de F se dice que son semejantes si están relacionadas mediante la relación de semejanza “~”. Así, existe una relación s, que hace que s(F1) = F2, con lo que tendrán la misma forma pero distinto tamaño. Se podría escribir que F2 = K × F1 donde K es la razón de semejanza. Además, como la relación de semejanza transforma puntos en puntos y conserva los ángulos, podíamos dar una definición alternativa de polígonos semejantes, diciendo que son aquellos en los que sus ángulos son iguales y sus lados correspondientes (homólogos) son proporcionales. Llamaremos:

– – – – –

Ángulos homólogos: ángulos iguales e igualmente dispuestos en polígonos semejantes.

–

Rectas homólogas: son las rectas que unen puntos homólogos.

Vértices homólogos: vértices de los ángulos homólogos en polígonos semejantes. Lados homólogos: lados que unen los vértices homólogos. Razón de semejanza: es el número que expresa la razón de dos lados homólogos. Puntos homólogos de dos polígonos semejantes: son los puntos que pueden referirse a dos vértices homólogos mediante triángulos semejantes (semejántemente dispuestos).

En el caso de una circunferencia, ésta es semejante a cualquier otra, viniendo determinada la razón de semejanza por el cociente de los radios de ambas.


241


242


Figura 1. (E',+,£)

Figura 2.

3.3. Grupo equiforme de las semejanzas en el plano

Ya se ha visto con anterioridad que el conjunto de las semejanzas en el plano con la operación producto tiene estructura de grupo, llamándosele grupo equiforme debido a que toda semejanza transforma una figura en otra mayor, menor o igual, con la misma orientación o distinta, pero siempre de la misma forma. La geometría equiforme tiene como objeto el estudio de esa clase de figuras. Las propiedades que se conservan en las semejanzas (comunes a todas las figuras de una clase determinada), ] se llaman propiedades métricas. Antes de demostrar el teorema de Thales, definiremos la proporcionalidad de magnitudes en general, centrándonos en las magnitudes geométricas de tipo escalar y viendo la relación que tienen con la medida. Tras estudiar brevemente la proporcionalidad de segmentos, demostraremos el teorema de Thales y veremos algunas aplicaciones del mismo. 1

c'

2

c'

f

S'(R+,+,).

r'

i

S

mu' p(ci)]

mu

E

p

– 1

E'

mu'

S'

r'2

c'1

Sean E y E' dos magnitudes escalares proporcionales y p una función de proporcionalidad definida entre ambas p: E ® E'. Supongamos que establecemos una medida en cada una de esas magnitudes. Llamemos S y S ' a los subconjuntos de R+ utilizados como conjuntos imágenes de las medidas m y mu' , respectivamente. u Por definición (1) es la función de proporcionalidad inducida f respecto de mu y mu' . Nótese que la función de proporcionalidad inducida f resulta ser una aplicación biyectiva, composición de las aplicaciones siguientes:

r'1

f (mu(ci)) = mu'(p(ci)) (1)

p(ci)

ci

ri

4. PROPORCIONALIDAD DE MAGNITUDES. MEDIDA

mu(ci)

c2

r2

c1

4.1. Aplicación proporcionalidad

r1

Supongamos dos magnitudes escalares E y E'. Llamemos c1, c2,..., ci a las cantidades de E y c'1, c'2,..., c 'i a las cantidades de E'. Al ser E y E' magnitudes escalares tienen definida la operación interna suma, la relación de orden £ y la operación externa sobre los reales producto. Sea r cualquier número real. Definimos la siguiente aplicación biyectiva de (E,+,£) en (E ',+,£). p: (E,+,£) ® (E',+,£) de forma que p(ci) = c'i. (E,+,£)

S(R+,+,).


Se dice entonces que p es una “aplicación proporcionalidad” o simplemente “proporcionalidad” entre las magnitudes E y E', y que las magnitudes E y E' son proporcionales. Dicha aplicación cumple las propiedades: p ( c1+ c2 ) = p ( c1 )+ p ( c2 ) = c '1+c '2

p ( r× ci ) = r× p ( ci ) = r× c 'i

1.

2.

p ( r× ci ) = r× p ( ci ) = r× c 'i

p ( c1+ c2 ) = p ( c1 )+ p ( c2 ) = c '1+c '2

2.

1.

Dicha aplicación cumple las propiedades: Se dice entonces que p es una “aplicación proporcionalidad” o simplemente “proporcionalidad” entre las magnitudes E y E', y que las magnitudes E y E' son proporcionales. de forma que p(ci) = c'i.

Supongamos dos magnitudes escalares E y E'. Llamemos c1, c2,..., ci a las cantidades de E y c'1, c'2,..., c 'i a las cantidades de E '. Al ser E y E' magnitudes escalares tienen definida la operación interna suma, la relación de orden £ y la operación externa sobre los reales producto. Sea r cualquier número real. Definimos la siguiente aplicación biyectiva de (E,+,£) en (E',+,£). p: (E,+,£) ® (E',+,£)

4.2. Proporcionalidad y medida (E,+,£)

+ S(R ,+,).

c1

r1 mu(ci)

4.1. Aplicación proporcionalidad

c2

Sean E y E' dos magnitudes escalares proporcionales y p una función de proporcionalidad definida entre ambas p: E ® E'. Supongamos que establecemos una medida en cada una de esas magnitudes. Llamemos S y S ' a los subconjuntos de R+ utilizados como conjuntos imágenes de las medidas mu y mu' , respectivamente. Por definición (1) es la función de proporcionalidad inducida f respecto de mu y mu' . Nótese que la función de proporcionalidad inducida f resulta ser una aplicación biyectiva, composición de las aplicaciones siguientes:

r2

4. PROPORCIONALIDAD DE MAGNITUDES. MEDIDA

ci

ri

Ya se ha visto con anterioridad que el conjunto de las semejanzas en el plano con la operación producto tiene estructura de grupo, llamándosele grupo equiforme debido a que toda semejanza transforma una figura en otra mayor, menor o igual, con la misma orientación o distinta, pero siempre de la misma forma. La geometría equiforme tiene como objeto el estudio de esa clase de figuras. Las propiedades que se conservan en las semejanzas (comunes a todas las figuras de una clase determinada), ] se llaman propiedades métricas. Antes de demostrar el teorema de Thales, definiremos la proporcionalidad de magnitudes en general, centrándonos en las magnitudes geométricas de tipo escalar y viendo la relación que tienen con la medida. Tras estudiar brevemente la proporcionalidad de segmentos, demostraremos el teorema de Thales y veremos algunas aplicaciones del mismo. f (mu(ci)) = mu'(p(ci)) (1)

p(ci)

r'1

c'1

mu' p(ci)]

r'2

S

– 1

E

p

E'

mu'

S'

r'i

c'1

S'(R+,+,).

Figura 1.

f

3.3. Grupo equiforme de las semejanzas en el plano

(E',+,£)

242

mu

Figura 2.



c'2


Proposición 3. La función de proporcionalidad f: S ® S ' siempre toma la forma f(ri) = k · ri, con ri Î S, siendo k un número real que llamamos constante de proporcionalidad. En efecto, llamemos mu' ( p ( u )) = k (2). Como sabemos que para todo ci perteneciente a E, se verifica que mu ( ci )= ri; de acuerdo con la fórmula (1), tenemos que f ( ri ) = mu' ( p ( ci )) y, por lo tanto, como mu ( ci )= ri tendremos que ci = ri × u, donde u es la unidad en E. Es decir: f ( ri ) = mu' [ p ( ri × u )] = mu' [ri × p ( u )] = ri × mu' ( p ( u )) = ri × k dándose esta segunda igualdad por (2). Como consecuencia, tenemos: “Cuando dos magnitudes E y E', son proporcionales se verifica que las medidas de cantidades correspondientes ci y c'i, con unidades correspondientes (mediante la misma proporcionalidad p) u y u', resultan iguales”. –1

S

[mu (ci)]

p (ci)

E

E'

mu' (c'i)

S'

ri

ci

c'i

r'i

1

u

u'

1

f

Figura 3.

En efecto, como f (ri) = ri · k, cuando ri = 1, entonces f (1) = k · 1 = 1 Þ k = 1. Por tanto, para todo ri perteneciente a S, se verifica que f (ri) = k · ri = r'i y como k = 1, entonces ri = r'i.

4.3. Proporcionalidad de segmentos: Teorema de Thales 4.3.1. Proyección paralela Consideremos dos rectas concurrentes en O, a y a', y otra recta b en una dirección cualquiera no paralela ni a a, ni a a'. Sean los puntos P, Q, R y S de la recta a situados a distancias arbitrarias de O. Tracemos rectas paralelas a la recta b que pasen por dichos puntos. Estas rectas cortan a a' en P ', Q ', R ' y S ', respectivamente. a S R b Q P a' S'

R'

Q'

O P'

Figura 4.

Para cada punto de la recta a podemos trazar una paralela a b, que cortará a a' en otro punto. Con este criterio podemos definir una aplicación que asocia a los puntos de la recta a, los puntos de la recta a', que llamaremos proyección paralela.


243


244


Esta aplicación

[ PQ ] [ P 'Q '] = [ RS ] [ R ' S '] pp: a ® a '

es una biyección, pues lo contrario nos llevaría a que existieran dos paralelas distintas a una misma recta por un punto. Sus propiedades son: es decir que

La proyección paralela de un segmento es el segmento formado por las proyecciones de los extremos del segmento original, es decir, si Figura 5.

1.

pp ( P ) = P 'ü ý Þ pp([ PQ ]) = [ P 'Q '] pp (Q ) = Q 'þ

S'

R'

Q'

P'

a'

Si dos segmentos son iguales, también lo serán sus proyecciones paralelas b

2.

[ PQ ] = [ RS ] Þ pp([ PQ ]) = pp([ RS ]) Q

a

R

La aplicación pp así definida es un homomorfismo, pues

S

P

3.

pp([ PQ ]+ [QR ]) = pp([ PQ ]) + pp([QR ])

Sean a y a' dos rectas no idénticas cortadas por un sistema de paralelas a la recta b, entonces los segmentos homólogos son proporcionales. esto lo podemos ver en la figura ya que

pp([ PQ ]+ [QR ]) = pp([ PR ]) = [ P ' R '] = [ P 'Q ']+ [Q ' R '] = pp([ PQ ]) + pp([QR])

4.3.3. Teorema de Thales

[ PQ ] mu[ PQ ] = [ RS ] mu[ RS ]

Por todo lo anterior, queda claro que la aplicación pp es una proporcionalidad. Establezcamos en el conjunto de segmentos generales del plano una medida con unidad de segmento u no nulo. Sean los segmentos [PQ] y [RS] y sus medidas respectivas mu[PQ] y mu[RS]. Se llama razón de los segmentos [PQ] y [RS] al número real cociente de sus medidas respectivas. Se representa por [PQ]/[RS]. Es decir

4.3.2. Razón de segmentos

Establezcamos en el conjunto de segmentos generales del plano una medida con unidad de segmento u no nulo. Sean los segmentos [PQ] y [RS] y sus medidas respectivas mu[PQ] y mu[RS]. Se llama razón de los segmentos [PQ] y [RS] al número real cociente de sus medidas respectivas. Se representa por [PQ]/[RS]. Es decir

4.3.2. Razón de segmentos

[ PQ ] mu[ PQ ] = [ RS ] mu[ RS ]

Por todo lo anterior, queda claro que la aplicación pp es una proporcionalidad. pp([ PQ ]+ [QR ]) = pp([ PR ]) = [ P ' R '] = [ P 'Q ']+ [Q ' R '] = pp([ PQ ]) + pp([QR])

4.3.3. Teorema de Thales

esto lo podemos ver en la figura ya que

Sean a y a' dos rectas no idénticas cortadas por un sistema de paralelas a la recta b, entonces los segmentos homólogos son proporcionales. pp([ PQ ]+ [QR ]) = pp([ PQ ]) + pp([QR ])

La aplicación pp así definida es un homomorfismo, pues R

Q

3.

S

[ PQ ] = [ RS ] Þ pp([ PQ ]) = pp([ RS ]) a

b

2.

P

Si dos segmentos son iguales, también lo serán sus proyecciones paralelas a'

pp ( P ) = P 'ü ý Þ pp([ PQ ]) = [ P 'Q '] pp (Q ) = Q 'þ Q'

P'

La proyección paralela de un segmento es el segmento formado por las proyecciones de los extremos del segmento original, es decir, si Figura 5.

1.

S'

R'

es una biyección, pues lo contrario nos llevaría a que existieran dos paralelas distintas a una misma recta por un punto. Sus propiedades son: es decir que

[ PQ ] [ P 'Q '] = [ RS ] [ R ' S '] pp: a ® a '

Esta aplicación



244

La relación de semejanza en el plano En efecto, podemos considerar que estamos ante una proyección paralela a la recta b entre las rectas a y a'. pp: a ® a ' En el punto anterior demostramos que esa aplicación es una proporcionalidad y, por tanto, cuando dos magnitudes son proporcionales las medidas de cantidades correspondientes [PQ] y [ P 'Q '], con unidades correspondientes (mediante la misma constante de proporcionalidad ppb) u y u'son iguales. Gráficamente: –1

[mu]

ppb

Segmento de a

Segmento , de a'

m'u

mu[PQ]

[PQ]

[P'Q']

mu'[P'Q']

1

u

u'

1

Figura 6.

En efecto pp

u ¾ ¾® u ' Û pp

b [ PQ ] ¾ ¾ ¾ ®[ P 'Q '] Û

ppb ( u ) = u ' ppb[ PQ ] = [ P 'Q ']

por lo que mu' [ P 'Q '] = mu[ PQ ], igualdad que se verifica para cualquier segmento [PQ] de a y su correspondiente [ P 'Q '] de a'. Por tanto, lo anterior también se verifica para el segmento [RS] y su correspondiente[ R ' S '], es decir mu' [ R ' S '] = mu[ RS ] Considerando ahora la razón de segmentos [ PQ ] mu[ PQ ] mu' [ P 'Q '] [ P 'Q '] = = = [ RS ] mu[ RS ] mu' [ R ' S '] [ R ' S '] donde la primera y tercera igualdad es por la definición de la razón de segmentos, con lo que hemos demostrado que [ PQ ] [ P 'Q '] = [ RS ] [ R ' S '] Proposición 4. Toda paralela a un lado de un triángulo determina, con los otros lados, un nuevo triángulo cuyos lados son proporcionales a los del primero.


245


246


En efecto, sea el triángulo ABC. Tracemos una paralela MN al lado BC, tal como aparece en la figura.

A

1.

N

2.

Tienen los ángulos correspondientes iguales, pues A = A por ser común, M = B por correspondientes y N = C por correspondientes. Utilizaremos, por tanto, este resultado para mostrar los criterios de semejanza de triángulos.

M

Tienen los lados proporcionales según demuestra la propia proposición.

Entre las diversas figuras planas es fundamental el estudio del triángulo, pues cualquier figura poligonal puede descomponerse en un conjunto de triángulos. Aplicando la definición dada para polígonos semejantes, dos triángulos semejantes tienen sus ángulos correspondientes iguales y sus lados correspondientes proporcionales. Para verificar esta afirmación no es preciso comprobar que los tres ángulos homólogos son iguales y sus tres lados homólogos proporcionales, ya que existen tres criterios que permiten asegurar la semejanza de dos triángulos dados. Son los llamados “criterios de semejanza de triángulos”, que pasamos a estudiar. En la proposición anterior los triángulos ABC y AMN son semejantes porque:

B

C

P

Figura 7.

5. TRIÁNGULOS SEMEJANTES. CRITERIOS DE SEMEJANZA DE TRIÁNGULOS

Por el teorema de Thales, se cumple

[ AM ] [ AN ] = [ AB ] [ AC ]

(1)

[ AM ] [ AN ] [ MN ] = = [ AB ] [ AC ] [ BC ]

Trazando ahora por N una paralela a AB, y aplicando nuevamente el teorema de Thales, podemos escribir Pero como [MN] = [BP], podemos deducir utilizando (1) y (2) que [ AN ] [ BP ] = [ AC ] [ BC ]

(2)

[ AN ] [ BP ] = [ AC ] [ BC ]

(2)

Pero como [MN] = [BP], podemos deducir utilizando (1) y (2) que Trazando ahora por N una paralela a AB, y aplicando nuevamente el teorema de Thales, podemos escribir [ AM ] [ AN ] [ MN ] = = [ AB ] [ AC ] [ BC ] [ AM ] [ AN ] = [ AB ] [ AC ]

(1)

5. TRIÁNGULOS SEMEJANTES. CRITERIOS DE SEMEJANZA DE TRIÁNGULOS

Por el teorema de Thales, se cumple

Entre las diversas figuras planas es fundamental el estudio del triángulo, pues cualquier figura poligonal puede descomponerse en un conjunto de triángulos. Aplicando la definición dada para polígonos semejantes, dos triángulos semejantes tienen sus ángulos correspondientes iguales y sus lados correspondientes proporcionales. Para verificar esta afirmación no es preciso comprobar que los tres ángulos homólogos son iguales y sus tres lados homólogos proporcionales, ya que existen tres criterios que permiten asegurar la semejanza de dos triángulos dados. Son los llamados “criterios de semejanza de triángulos”, que pasamos a estudiar. En la proposición anterior los triángulos ABC y AMN son semejantes porque: Figura 7.

P

B

C

1.

Tienen los lados proporcionales según demuestra la propia proposición.

2.

Tienen los ángulos correspondientes iguales, pues A = A por ser común, M = B por correspondientes y N = C por correspondientes. Utilizaremos, por tanto, este resultado para mostrar los criterios de semejanza de triángulos.

M

N

A

En efecto, sea el triángulo ABC. Tracemos una paralela MN al lado BC, tal como aparece en la figura. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


246


5.1. Primer criterio Dos triángulos son semejantes si tienen un ángulo igual y proporcionales los lados que lo forman. En efecto, sean los triángulos ABC y A '' B ''C '' que verifican A = A '' y

[ AB ] [ AC ] = [ A '' B ''] [ A ''C '']

A

B'

A''

C'

B'' C'' B

C

Figura 8.

Tomamos [ A '' B ''] y lo llevamos sobre [AB], a partir de A. Este segmento terminará en B' y por ese punto trazamos una paralela a [BC]. Por tanto [ AB '] = [ A '' B ''] . Los triángulos ABC y AB 'C ' son semejantes porque verifican las condiciones de la proposición anterior. Por otro lado los triángulos AB 'C ' y A '' B ''C '' son iguales puesto que A = A '' [ AB ] [ AC ] = [ A '' B ''] [ A ''C ''] [ AB ] [ AC ] = [ AB '] [ AC '] [ AB '] = [ A '' B ' ']

ü ï por hipótesis ï ï [ AC ] [ AC ] ýÞ Þ [ A ''C ''] = [ AC '] = ï [ A ''C ''] [ AC ' ] por Thales ï por construcción ï þ por hipótesis

por lo que los triángulos AB 'C ' y A '' B ''C '' son iguales al tener iguales también los respectivos lados que forman los ángulos A y A''. Así, llegamos a la conclusión de que los triángulos ABC y A '' B ''C '' son semejantes, al ser semejantes ABC y AB 'C '.

5.2. Segundo criterio Si dos triángulos tienen dos ángulos iguales son semejantes. En efecto, sean los triángulos ABC y A '' B ''C '' que cumplen que A = A'' y B = B''. Construimos, como en el caso anterior, el triángulo AB 'C '. Al igual que antes, los triángulos ABC y AB 'C ' son semejantes al verificar la proposición anterior. TEMARIO DE MATEMÁTICAS. PRUEBA A

247


248


Por otro lado, los triángulos A '' B ''C '' y AB 'C ' son iguales porque ABC ~ AB 'C ' ü ý Þ ABC ~ A '' B ''C '' AB 'C ' = A '' B ''C ''þ

ì A = A '' ï ïB '' = B ' í ïC ' = C '' ï î[ AB '] = [ A '' B '']

por hipótesis ì B = B ' por correspondientes puesto que í îB = B '' por hipótesis por suplementario de la suma de los otrosdos por construcción

De la primera igualdad deducimos que [ AC '] = [ A ''C ''] y de la tercera que [ B 'C '] = [ B ''C ''], por lo que el triángulo AB 'C ' y el A '' B ''C '' son iguales por tener los tres lados respectivamente iguales. Así [ AC '] [ A ''C ''] [ B 'C '] [ B ''C ''] = = = [ AC ] [ AC ] [ BC ] [ BC ] ABC ~ AB 'C ' ü ý Þ ABC ~ A '' B ''C '' AB 'C ' = A '' B ''C ''þ

con lo que tendríamos

Por lo tanto, como

[ A '' B ''] [ A ''C ''] [ B ''C ''] = = [ AB ] [ AC ] [ BC ]

pero por hipótesis

5.3. Tercer criterio

Dos triángulos son semejantes si tienen sus tres lados homólogos proporcionales. [ A '' B ''] [ AC '] [ B 'C '] = = [ AB ] [ AC ] [ BC ]

En efecto, sean los triángulos ABC y A '' B ''C '' que verifican

y como [ AB '] = [ A '' B '']

[ A '' B ''] [ A ''C ''] [ B ''C ''] = = [ AB ] [ AC ] [ BC ] [ AB '] [ AC '] [ B 'C '] = = [ AB ] [ AC ] [ BC ]

Construimos, como en los dos casos anteriores, el triángulo AB 'C ', con lo que ABC ~ AB 'C '. Veremos que los triángulos AB 'C ' y A '' B ''C '' son iguales. Por ser ABC ~ AB 'C ', tenemos

Construimos, como en los dos casos anteriores, el triángulo AB 'C ', con lo que ABC ~ AB 'C '. Veremos que los triángulos AB 'C ' y A '' B ''C '' son iguales. Por ser ABC ~ AB 'C ', tenemos [ AB '] [ AC '] [ B 'C '] = = [ AB ] [ AC ] [ BC ]

[ A '' B ''] [ A ''C ''] [ B ''C ''] = = [ AB ] [ AC ] [ BC ] En efecto, sean los triángulos ABC y A '' B ''C '' que verifican

y como [ AB '] = [ A '' B '']

[ A '' B ''] [ AC '] [ B 'C '] = = [ AB ] [ AC ] [ BC ]

Dos triángulos son semejantes si tienen sus tres lados homólogos proporcionales.

5.3. Tercer criterio

pero por hipótesis [ A '' B ''] [ A ''C ''] [ B ''C ''] = = [ AB ] [ AC ] [ BC ]

ABC ~ AB 'C ' ü ý Þ ABC ~ A '' B ''C '' AB 'C ' = A '' B ''C ''þ [ AC '] [ A ''C ''] [ B 'C '] [ B ''C ''] = = = [ AC ] [ AC ] [ BC ] [ BC ]

Por lo tanto, como

con lo que tendríamos

ì A = A '' ï ïB '' = B ' í ïC ' = C '' ï î[ AB '] = [ A '' B '']

por hipótesis ì B = B ' por correspondientes puesto que í îB = B '' por hipótesis por suplementario de la suma de los otrosdos por construcción

De la primera igualdad deducimos que [ AC '] = [ A ''C ''] y de la tercera que [ B 'C '] = [ B ''C ''], por lo que el triángulo AB 'C ' y el A '' B ''C '' son iguales por tener los tres lados respectivamente iguales. Así ABC ~ AB 'C ' ü ý Þ ABC ~ A '' B ''C '' AB 'C ' = A '' B ''C ''þ

Por otro lado, los triángulos A '' B ''C '' y AB 'C ' son iguales porque CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


248


5.4. Semejanza de polígonos Como todo polígono puede triangularse, los criterios de semejanza de triángulos sirven para averiguar si los polígonos son semejantes o no. Por ejemplo, sea el pentágono [ABCDE] y el [ A ' B 'C ' D ' E '], supuestamente semejantes. A A'

I'

B'

I

B

III II

C

III'

II'

E'

E D'

C'

D

Figura 9.

Una posible triangulación es la que aparece en la figura. Así, para determinar si los pentágonos son semejantes, basta saber si lo son los siguientes pares de triángulos. I ~ I' II ~ II ' III ~ III ' Se verifica que [ AB ] [ BC ] [CD ] [ DE ] [ EA ] =k = = = = [ A ' B '] [ B 'C '] [C ' D '] [ D ' E '] [ E ' A '] así, pues, son semejantes. También es fácil comprobar que la razón entre los perímetros de dos polígonos semejantes es igual a la razón de semejanza. Basta para ello sumar antecedentes y consecuentes en la serie de razones iguales, obteniendo así la razón de los dos perímetros P y p. P [ AB ]+ [ BC ]+ [CD ]+ [ DE ]+ [ EA ] = =k [ A ' B ']+ [ B 'C ']+ [C ' D ']+ [ D ' E ' ]+ [ E ' A '] p

5.5. Razones de áreas de dos figuras semejantes Sean dos triángulos semejantes ABC y A ' B 'C ', y llamemos a sus alturas respectivamente h y h'. Sea k la razón de semejanza B'

B h' A'

h

Figura 10.

A


C'

C

249


250


[ A1B1] cateto opuesto a a = tangente del ángulo a = [OA1] cateto contiguo a a [ AC ]× h 2

S A' B' C ' =

[ A 'C ']× h ' 2

[OA1] cateto contiguo a a = = coseno del ángulo a [OB1] hipotenusa

Por ser los triángulos semejantes se verifica que

h'= h×k

[ A1B1] cateto opuesto a a = = seno del ángulo a [OB1] hipotenusa

y por lo tanto

sen a =

[ A 'C '] = [ AC ]× k

cos a =

S ABC =

tg a =

Las áreas de estos triángulos son, respectivamente

[ A 'C ']× h ' [ AC ]× k × h × k [ AC ]× h = = k2× = k 2 × S ABC 2 2 2

Formamos, de este modo, los triángulos rectángulos OA1B1, OA2B2, OA3B3, OA4B4,... Todos estos triángulos son semejantes por tener dos ángulos iguales: el ángulo recto y a (segundo criterio). En OA1B1 definimos las siguientes razones trigonométricas de a: S A' B' C ' =

Cualquier polígono puede descomponerse en triángulos, por lo que este resultado puede extenderse a polígonos en general: “La razón entre las áreas de dos superficies semejantes es igual al cuadrado de la razón de la semejanza”. Figura 11.

b

A

a

r

6.1. Razones trigonométricas de un ángulo cualquiera

o

A3

A2

1

A4

6. RAZONES TRIGONOMÉTRICAS

Consideremos dos rectas concurrentes en O, r y s y otra recta b con dirección perpendicular a la recta r. Sea a el ángulo que forman r y s. Sean los puntos A1, A2, A3, A4,... de la recta r situados a distancias arbitrarias de O. Tracemos rectas paralelas a la recta b que pasen por dichos puntos. Estas rectas cortarán a s en los puntos B1, B2, B3, B4, ..., respectivamente. Esta situación describe una aplicación en proyección paralela, como ya se ha visto con anterioridad.

B1

B2

B3

B4

S

S

B4

Consideremos dos rectas concurrentes en O, r y s y otra recta b con dirección perpendicular a la recta r. Sea a el ángulo que forman r y s. Sean los puntos A1, A2, A3, A4,... de la recta r situados a distancias arbitrarias de O. Tracemos rectas paralelas a la recta b que pasen por dichos puntos. Estas rectas cortarán a s en los puntos B1, B2, B3, B4, ..., respectivamente. Esta situación describe una aplicación en proyección paralela, como ya se ha visto con anterioridad.

B3

B2

B1

a

6. RAZONES TRIGONOMÉTRICAS

A1

6.1. Razones trigonométricas de un ángulo cualquiera

o

A2

A3

A4

r b

Figura 11.

Cualquier polígono puede descomponerse en triángulos, por lo que este resultado puede extenderse a polígonos en general: “La razón entre las áreas de dos superficies semejantes es igual al cuadrado de la razón de la semejanza”. Formamos, de este modo, los triángulos rectángulos OA1B1, OA2B2, OA3B3, OA4B4,... Todos estos triángulos son semejantes por tener dos ángulos iguales: el ángulo recto y a (segundo criterio). En OA1B1 definimos las siguientes razones trigonométricas de a: [ A1B1] cateto opuesto a a = = seno del ángulo a [OB1] hipotenusa h'= h×k

[OA1] cateto contiguo a a = = coseno del ángulo a [OB1] hipotenusa

Por ser los triángulos semejantes se verifica que S ABC =

[ AC ]× h 2

S A' B' C ' =

[ A 'C ']× h ' 2

[ A1B1] cateto opuesto a a = tangente del ángulo a = [OA1] cateto contiguo a a

Las áreas de estos triángulos son, respectivamente



250

[ A 'C '] = [ AC ]× k

tg a =

y por lo tanto

[ A 'C ']× h ' [ AC ]× k × h × k [ AC ]× h = = k2× = k 2 × S ABC 2 2 2 cos a =

S A' B' C ' =

sen a =

La relación de semejanza en el plano Si en lugar del triángulo OA1B1 tomamos otro cualquiera, puesto que será semejante con él, podemos escribir sen a =

[ A1B1] [ A2B2 ] [ A3B3 ] = = =... [OB1] [OB2 ] [OB3 ]

cos a =

tg a =

[OA1] [OA2 ] [OA3 ] = = =... [OB1] [OB2 ] [OB3 ]

[ A1B1] [ A2B2 ] [ A3B3 ] = = =... [OA1] [OA2 ] [OA3 ]

Por ello podemos decir que las razones trigonométricas de a son independientes de las longitudes de los lados. Así, solamente dependen del ángulo a y por ello se habla de razones trigonométricas del mismo, no importando el triángulo rectángulo sobre el que se calculen.

6.2. Otras razones trigonométricas Conocidos sen a, cos a y tg a, se definen sus razones trigonométricas recíprocas, que son cosec a =

sec a =

cotg a =

1 [OB1] = = cosecante del ángulo a sen a [ A1B1] [OB1] 1 = = secante del ángulo a cos a [OA1] 1 [OA1] = cotangente del ángulo a = tg a [ A1B1]

Puede comprobarse también que tg a =


sen a cos a y que cotg a = . cos a sen a

251

TEMA

38 Trigonometría plana. Resolución de triángulos. Aplicaciones




254


ÍNDICE SISTEMÁTICO APLICACIONES 12.1. Cálculo de la altura de un punto de pie accesible 12.2. Cálculo de la altura de un punto de pie inaccesible 12.3. Cálculo de la distancia entre dos puntos, uno de los cuales es inaccesible 12.4. Cálculo de la distancia entre dos puntos inaccesibles

12.

RESOLUCIÓN DE TRIÁNGULOS OBLICUÁNGULOS 11.1. Primer caso: conocemos un lado y dos ángulos 11.2. Segundo caso: conocemos dos lados y el ángulo comprendido 11.3. Tercer caso: conocemos los tres lados 11.4. Cuarto caso: conocemos dos lados y el ángulo opuesto a uno de ellos

11.

RELACIONES ENTRE LOS ELEMENTOS (ÁNGULOS Y LADOS) DE UN TRIÁNGULO CUALESQUIERA 10.1. Teorema del coseno 10.2. Teorema de los senos 10.3. Teorema de la tangente o de Neper 10.4. Fórmulas de Briggs 10.5. Superficie de un triángulo

10.

1.

INTRODUCCIÓN

2.

ÁNGULOS 2.1. Unidades de medida de ángulos

3.

RAZONES TRIGONOMÉTRICAS DE UN ÁNGULO

4.

FÓRMULAS FUNDAMENTALES DE LA TRIGONOMETRÍA

5.

RAZONES TRIGONOMÉTRICAS DE ÁNGULOS NOTABLES 5.1. Razones trigonométricas de los ángulos de 0º, 90º, 180º y 360º 5.2. Razones trigonométricas de los ángulos de 30º, 45º y 60º

6.

REDUCCIÓN AL PRIMER CUADRANTE 6.1. Razones trigonométricas de ángulos complementarios 6.2. Razones trigonométricas de ángulos que difieren 90º (p/2 radianes) 6.3. Razones trigonométricas de ángulos suplementarios 6.4. Razones trigonométricas de ángulos que difieren 180º 6.5. Razones trigonométricas del ángulo 270º – a 6.6. Razones trigonométricas del ángulo 270º + a 6.7. Razones trigonométricas del ángulo opuesto (–a)

7.

RAZONES TRIGONOMÉTRICAS DE LOS ÁNGULOS SUMA, DIFERENCIA DOBLE Y MITAD 7.1. Razones trigonométricas de a + b 7.2. Razones trigonométricas de a – b 7.3. Razones trigonométricas del ángulo doble 7.4. Razones trigonométricas del ángulo mitad

RESOLUCIÓN DE TRIÁNGULOS RECTÁNGULOS 9.1. Conocidos un ángulo agudo y su cateto opuesto 9.2. Conocidos un ángulo agudo y su cateto adyacente 9.3. Conocidos un ángulo agudo y la hipotenusa 9.4. Conocidos los dos catetos 9.5. Conocidos un cateto y la hipotenusa

9.

TRANSFORMACIÓN DE SUMAS EN PRODUCTOS 8.1. Fórmula de Moivre

8.

RAZONES TRIGONOMÉTRICAS DE LOS ÁNGULOS SUMA, DIFERENCIA DOBLE Y MITAD 7.1. Razones trigonométricas de a + b 7.2. Razones trigonométricas de a – b 7.3. Razones trigonométricas del ángulo doble 7.4. Razones trigonométricas del ángulo mitad

7.

REDUCCIÓN AL PRIMER CUADRANTE 6.1. Razones trigonométricas de ángulos complementarios 6.2. Razones trigonométricas de ángulos que difieren 90º (p/2 radianes) 6.3. Razones trigonométricas de ángulos suplementarios 6.4. Razones trigonométricas de ángulos que difieren 180º 6.5. Razones trigonométricas del ángulo 270º – a 6.6. Razones trigonométricas del ángulo 270º + a 6.7. Razones trigonométricas del ángulo opuesto (–a)

6.

RAZONES TRIGONOMÉTRICAS DE ÁNGULOS NOTABLES 5.1. Razones trigonométricas de los ángulos de 0º, 90º, 180º y 360º 5.2. Razones trigonométricas de los ángulos de 30º, 45º y 60º

5.

FÓRMULAS FUNDAMENTALES DE LA TRIGONOMETRÍA

4.

RAZONES TRIGONOMÉTRICAS DE UN ÁNGULO

3.

ÁNGULOS 2.1. Unidades de medida de ángulos

2.

INTRODUCCIÓN

1.

8.

TRANSFORMACIÓN DE SUMAS EN PRODUCTOS 8.1. Fórmula de Moivre

9.

RESOLUCIÓN DE TRIÁNGULOS RECTÁNGULOS 9.1. Conocidos un ángulo agudo y su cateto opuesto 9.2. Conocidos un ángulo agudo y su cateto adyacente 9.3. Conocidos un ángulo agudo y la hipotenusa 9.4. Conocidos los dos catetos 9.5. Conocidos un cateto y la hipotenusa

10.

11.

12.

RELACIONES ENTRE LOS ELEMENTOS (ÁNGULOS Y LADOS) DE UN TRIÁNGULO CUALESQUIERA 10.1. Teorema del coseno 10.2. Teorema de los senos 10.3. Teorema de la tangente o de Neper 10.4. Fórmulas de Briggs 10.5. Superficie de un triángulo RESOLUCIÓN DE TRIÁNGULOS OBLICUÁNGULOS 11.1. Primer caso: conocemos un lado y dos ángulos 11.2. Segundo caso: conocemos dos lados y el ángulo comprendido 11.3. Tercer caso: conocemos los tres lados 11.4. Cuarto caso: conocemos dos lados y el ángulo opuesto a uno de ellos APLICACIONES 12.1. Cálculo de la altura de un punto de pie accesible 12.2. Cálculo de la altura de un punto de pie inaccesible 12.3. Cálculo de la distancia entre dos puntos, uno de los cuales es inaccesible 12.4. Cálculo de la distancia entre dos puntos inaccesibles



254

Trigonometría plana

1. INTRODUCCIÓN En la antigüedad se usaron los ángulos al estudiar la astronomía para poder orientarse en el mar, en agrimensura, etc. Cabe destacar a Hiparco (siglo II a.C.) y a Tolomeo (siglo II d.C.), que escribió el Almagesto, la colección de libros de geometría más completa de la antigüedad, e incluso construyó unas tablas de las funciones trigonométricas de medio grado en medio grado, mejoradas hasta hace unos 30 años, donde fueron sustituidas por las actuales calculadoras. La trigonometría deriva del griego y proviene de dos palabras trigonon (triángulo) y metron (medida). Es la parte de la matemática que estudia la manera de calcular todos los elementos de un triángulo (ángulos y lados), conociendo tres de ellos independientes entre sí y siempre que estos no sean a la vez los tres ángulos. De dicho conocimiento se puede deducir la forma del triángulo y calcular los restantes elementos. Para desarrollar este capítulo deberemos utilizar las fórmulas y definiciones de las razones trigonométricas vistas en el tema anterior. Así, para resolver un triángulo deberemos conocer sus tres lados y sus tres ángulos, por lo que será necesario encontrar las relaciones que existen entre ellos con el fin de que a partir de tres de los datos podamos encontrar los otros tres. Por último veremos problemas de aplicaciones prácticas de la resolución de estos triángulos.

2. ÁNGULOS Ángulo es la región del plano limitado por dos semirrectas r y s, en ese mismo orden y con el mismo origen O. El primer lado del ángulo es r, el segundo s y el vértice O. Los ángulos son valores orientados, esto quiere decir que el ángulo que tiene como primer lado s y como segundo r es distinto del que tiene como primer lado r y como segundo s. Así, el ángulo será la región del plano que se recorre al girar con centro en el vértice, el primer lado hasta llevarlo al segundo, existiendo dos sentidos de giro:

– –

Sentido positivo, que es el contrario al movimiento de las agujas de un reloj. Sentido negativo, que coincide con el movimiento de las agujas de un reloj.

Si trazamos una circunferencia con centro el vértice del ángulo y radio cualquiera, esa circunferencia corta a los dos lados del ángulo en dos puntos A y B, formándose el arco AB. La medida del ángulo AVB, es igual a la del arco AB, usándose para medir ambos las mismas unidades.

2.1. Unidades de medida de ángulos Para medir ángulos o arcos de circunferencias, se emplean las siguientes unidades:

–

Grado sexageximal: es igual a 1/360 parte de la circunferencia. Esta unidad se divide a su vez en sesenta minutos y cada minuto en sesenta segundos, expresándose dichas unidades como º, ', y ''.

–

Grado centesimal: es igual a 1/400 parte de la circunferencia. Esta unidad se divide en cien minutos y a su vez cada minuto en 100 segundos, expresándose dichas unidades como g, m, y s.

–

Radián: es la medida de un ángulo cuyo arco tiene la longitud de un radio.

Con estas unidades, el ángulo que abarca una circunferencia completa tiene 360º (grados sexagesimales), 400 g (grados centesimales) y 2p radianes. Normalmente, para representar ángulos se suele colocar en un sistema cartesiano rectangular, el vértice en el origen de coordenadas y el primer lado en la dirección positiva del eje de abscisas, diciéndose entonces que el ángulo se encuentra en posición normal. Así, la posición del lado final no permite explícitamente conocer el ángulo determinado por el mismo, ya que todos los ángulos que difieren entre sí una vuelta completa tienen el mismo lado final, es decir, son coterminales. Para localizar mejor la posición del lado terminal dividiremos el plano en cuatro cuadrantes, que tendrán como líneas de división a los ejes coordenados, que equivaldrán a 90º, 100 g, p/2 radianes; 180º, 200 g, p radianes; 270º, 300 g, 3p/2 radianes y 360º, 400g, 2p radianes. Este último equivaldría a cero. TEMARIO DE MATEMÁTICAS. PRUEBA A

255


256


1 cos a

3. RAZONES TRIGONOMÉTRICAS DE UN ÁNGULO sec a =

Para definir o representar de forma geométrica las razones trigonométricas de un ángulo cualquiera, consideraremos una circunferencia de radio unidad llamada goniométrica, tal como aparece en la figura 1. Consideremos un ángulo cualquiera a en la misma, cuyo primer lado coincida con el semieje positivo del eje de abscisas. o lo que es lo mismo

OD OC OD 1 = Þ = OA OB 1 OB D

También se puede observar que E

F A

sen a = tg a cos a de donde podemos deducir que

a

C

B

O

AB DC DC = = = DC OB OC 1 Como observamos, los lados de dicho ángulo cortan a la circunferencia en C y en A. Por ambos puntos tracemos perpendiculares al eje de abscisas, que cortarán a los otros dos lados en D y en B respectivamente, y por E, que es donde corta la delimitación del primer cuadrante a la circunferencia, trazaremos una paralela al eje de abscisas, que cortará al segundo lado del ángulo en F. Definiremos la función seno como una aplicación del conjunto de los ángulos en el intervalo [–1,1] de forma que al ángulo a le haga corresponder el segmento AB. La función coseno será una aplicación del conjunto de los ángulos en el intervalo [–1,1], de forma que al ángulo a le haga corresponder el segmento OB. La función tangente será una aplicación del conjunto de los ángulos en la recta real de forma que al ángulo a le haga corresponder el segmento CD. La función secante será una aplicación del conjunto de los ángulos en la recta real menos el intervalo (–1,1), que hace corresponder al ángulo a el segmento OD. La función cosecante será una aplicación del conjunto de los ángulos en la recta real menos el intervalo (–1,1), que hace corresponder al ángulo a el segmento OF y por último la función cotangente será una aplicación del conjunto de los ángulos en la recta real que hace corresponder al ángulo a el segmento EF. Observando en la figura la relación de semejanza de los triángulos OAB y ODC, podemos llegar a algunas propiedades y relaciones de las razones trigonométricas de un ángulo. Podemos observar que Figura 1.

Como observamos, los lados de dicho ángulo cortan a la circunferencia en C y en A. Por ambos puntos tracemos perpendiculares al eje de abscisas, que cortarán a los otros dos lados en D y en B respectivamente, y por E, que es donde corta la delimitación del primer cuadrante a la circunferencia, trazaremos una paralela al eje de abscisas, que cortará al segundo lado del ángulo en F. Definiremos la función seno como una aplicación del conjunto de los ángulos en el intervalo [–1,1] de forma que al ángulo a le haga corresponder el segmento AB. La función coseno será una aplicación del conjunto de los ángulos en el intervalo [–1,1], de forma que al ángulo a le haga corresponder el segmento OB. La función tangente será una aplicación del conjunto de los ángulos en la recta real de forma que al ángulo a le haga corresponder el segmento CD. La función secante será una aplicación del conjunto de los ángulos en la recta real menos el intervalo (–1,1), que hace corresponder al ángulo a el segmento OD. La función cosecante será una aplicación del conjunto de los ángulos en la recta real menos el intervalo (–1,1), que hace corresponder al ángulo a el segmento OF y por último la función cotangente será una aplicación del conjunto de los ángulos en la recta real que hace corresponder al ángulo a el segmento EF. Observando en la figura la relación de semejanza de los triángulos OAB y ODC, podemos llegar a algunas propiedades y relaciones de las razones trigonométricas de un ángulo. Podemos observar que Figura 1.

AB DC DC = = = DC OB OC 1 O

B

a

C

de donde podemos deducir que

sen a = tg a cos a E

F A

También se puede observar que D

OD OC OD 1 = Þ = OA OB 1 OB

Para definir o representar de forma geométrica las razones trigonométricas de un ángulo cualquiera, consideraremos una circunferencia de radio unidad llamada goniométrica, tal como aparece en la figura 1. Consideremos un ángulo cualquiera a en la misma, cuyo primer lado coincida con el semieje positivo del eje de abscisas. o lo que es lo mismo

sec a =

1 cos a

3. RAZONES TRIGONOMÉTRICAS DE UN ÁNGULO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


256

Trigonometría plana Si aplicamos ahora la relación de semejanza a los triángulos OAB y OEF, tendremos OF OA OF 1 = Þ = OE AB 1 AB de donde cosec a =

1 sen a

Por último, si aplicamos la semejanza a los triángulos OCD y OEF, tendremos EF OC EF 1 = Þ = OE CD 1 CD de donde cotg a =

1 tg a

Observamos así que la función secante es la inversa de la función coseno, la función cosecante es la inversa de la función seno y que la función cotangente es la inversa de la función tangente. En la figura está representado un ángulo del primer cuadrante pero se podría haber representado un ángulo de cualquier otro cuadrante. Por la definición de las funciones trigonométricas podemos observar que la función coseno se mide con valores en el eje de abscisas, mientras que la función seno toma sus valores en el eje de ordenadas. Así, el signo de dicha función trigonométrica será distinto en función del cuadrante en el que se encuentre situado el ángulo. Se puede observar fácilmente que si el ángulo se encuentra en el primer o segundo cuadrante el seno será positivo, y si se encuentra en el tercer o cuarto cuadrante será negativo. Igualmente, si el ángulo se encuentra en el primer o cuarto cuadrante el coseno será positivo y si se encuentra en el segundo o tercer cuadrante el coseno será negativo. Los signos de las funciones secante y cosecante serán los mismos que las de sus respectivas inversas. Las funciones anteriormente definidas estaban basadas en una circunferencia goniométrica. Si aplicamos semejanza de triángulos podemos obtener cualquier triángulo rectángulo que tenga el mismo ángulo a, pero que su hipotenusa sea distinta de uno, pudiendo definir las razones trigonométricas de un ángulo agudo de otra forma: G A

Figura 2.

O

a B

C

Si aplicamos la semejanza de triángulos vemos que AB CG CG CG = Þ AB = Þ sen a = OA OG OG OG o lo que es lo mismo, que en un triángulo rectángulo el seno de un ángulo es igual al cateto opuesto partido por la hipotenusa. De la misma manera OB OC OC OC = Þ OB = Þ cos a = OA OG OG OG o lo que es lo mismo, que en un triángulo rectángulo el coseno de un ángulo es igual al cateto adyacente partido por la hipotenusa. Si aplicamos que la tangente es igual al seno partido por el coseno llegamos a que la tangente de un ángulo es igual al cateto opuesto partido por el cateto adyacente. TEMARIO DE MATEMÁTICAS. PRUEBA A

257


258


4. FÓRMULAS FUNDAMENTALES DE LA TRIGONOMETRÍA

Los valores de tg 90º y sec 90º no están definidos, ya que si aplicamos su definición nos da un valor æ 1ö indeterminadoç ÷, y si calculáramos su límite nos daría en valor absoluto infinito pero no existe al ser los è 0ø límites laterales de la misma más y menos infinito. Aparte de las relaciones que ligan las razones trigonométricas dadas con anterioridad, como tg a =

sen a , cos a

1 1 1 y cotg a = existen unas identidades trigonométricas, que llamamos fór, cosec a = cos a sen a tg a mulas fundamentales y que son:

sec a =

cot g 0 = 0;

1+ tg 2 a = sec2 a

cosec 0 = 0;

2.

cos 90 = 0;

sen 2 a + cos 2 a = 1

sen 90 = 1;

1.

Cuando el ángulo es de 90º, el punto extremo B tiene las coordenadas (0,1) y aplicando las definiciones de las razones trigonométricas, tendremos que 1+ cotg 2 a = cos ec 2 a

Los valores de ctg 0º y cosec 0º no están definidos, ya que si aplicamos su definición nos da un valor æ 1ö indeterminadoç ÷, y si calculáramos su límite nos daría en valor absoluto infinito, pero no existe al ser los è 0ø límites laterales de la misma más y menos infinito. 3.

Para demostrar la primera nos basamos en las definiciones de seno, y coseno dadas en el triángulo rectángulo de la figura 2. Así æ GC ö æ OC ö GC 2 OC 2 GC 2 + OC 2 OG 2 ÷ +ç ÷= sen 2 a + cos 2 a = ç + = = =1 è OG ø è OG ø OG 2 OG 2 OG 2 OG 2 2

sen 0 = 0;

cos 0 = 1;

2

tg 0 = 0;

sec 0 = 0;

Cuando a = 0º, el punto A y el B coinciden teniendo como coordenadas cartesianas (1,0), y si aplicamos las definiciones dadas para sus razones trigonométricas, tendremos que donde para la última igualdad hemos aplicado el teorema de Pitágoras en el triángulo rectángulo. Demostraremos ahora la segunda

5.1. Razones trigonométricas de los ángulos de 0º, 90º, 180º y 360º sen 2 a cos 2 a + sen 2 a 1 = = = sec2 a cos 2 a cos 2 a cos 2 a

5. RAZONES TRIGONOMÉTRICAS DE ÁNGULOS NOTABLES 1+ tg 2 a = 1+

La demostración de la tercera es análoga a ésta.

La demostración de la tercera es análoga a ésta.

1+ tg 2 a = 1+

sen 2 a cos 2 a + sen 2 a 1 = = = sec2 a cos 2 a cos 2 a cos 2 a

5. RAZONES TRIGONOMÉTRICAS DE ÁNGULOS NOTABLES 5.1. Razones trigonométricas de los ángulos de 0º, 90º, 180º y 360º

Demostraremos ahora la segunda

Cuando a = 0º, el punto A y el B coinciden teniendo como coordenadas cartesianas (1,0), y si aplicamos las definiciones dadas para sus razones trigonométricas, tendremos que donde para la última igualdad hemos aplicado el teorema de Pitágoras en el triángulo rectángulo. æ GC ö æ OC ö GC 2 OC 2 GC 2 + OC 2 OG 2 ÷ +ç ÷= sen 2 a + cos 2 a = ç + = = =1 è OG ø è OG ø OG 2 OG 2 OG 2 OG 2 cos 0 = 1;

tg 0 = 0;

sec 0 = 0;

2

sen 0 = 0;

2

Para demostrar la primera nos basamos en las definiciones de seno, y coseno dadas en el triángulo rectángulo de la figura 2. Así

Los valores de ctg 0º y cosec 0º no están definidos, ya que si aplicamos su definición nos da un valor æ 1ö indeterminadoç ÷, y si calculáramos su límite nos daría en valor absoluto infinito, pero no existe al ser los è 0ø límites laterales de la misma más y menos infinito. 1+ cotg 2 a = cos ec 2 a

3.

1+ tg 2 a = sec2 a

2.

sen 2 a + cos 2 a = 1

1.

Cuando el ángulo es de 90º, el punto extremo B tiene las coordenadas (0,1) y aplicando las definiciones de las razones trigonométricas, tendremos que sen 90 = 1;

cos 90 = 0;

cosec 0 = 0;

cot g 0 = 0;

sen a Aparte de las relaciones que ligan las razones trigonométricas dadas con anterioridad, como tg a = , cos a 1 1 1 y cotg a = existen unas identidades trigonométricas, que llamamos fór, cosec a = sec a = cos a sen a tg a mulas fundamentales y que son:

Los valores de tg 90º y sec 90º no están definidos, ya que si aplicamos su definición nos da un valor æ 1ö indeterminadoç ÷, y si calculáramos su límite nos daría en valor absoluto infinito pero no existe al ser los è 0ø límites laterales de la misma más y menos infinito.

4. FÓRMULAS FUNDAMENTALES DE LA TRIGONOMETRÍA



258

Trigonometría plana Cuando el ángulo es de 180º, el punto extremo B tiene las coordenadas (-1,0) y aplicando las definiciones de las razones trigonométricas, tendremos que sen 180 = 0;

cos 180 = –1;

tg 180 = 0;

sec 0 = 0;

Los valores de ctg 180º y cosec 180º no están definidos, ya que si aplicamos su definición nos da un æ 1ö valor indeterminadoç ÷, y si calculáramos su límite nos daría en valor absoluto infinito pero no existe al è 0ø ser los límites laterales de la misma más y menos infinito. Cuando el ángulo es de 270º, el punto extremo B tiene las coordenadas (0,–1) y aplicando las definiciones de las razones trigonométricas, tendremos que sen 270 = –1;

cos 270 = 0;

cosec 270 = 0;

cot g 270 = 0;

Los valores de tg 270º y sec 270º no están definidos, ya que si aplicamos su definición nos da un valor æ 1ö indeterminadoç ÷, y si calculáramos su límite nos daría en valor absoluto infinito pero no existe al ser los è 0ø límites laterales de la misma más y menos infinito.

5.2. Razones trigonométricas de los ángulos de 30º, 45º y 60º Para calcular las razones trigonométricas de los ángulos 30º y 60º, construimos un triángulo equilátero de lado a, que dividiremos por medio de una altura en dos triángulos rectángulos tal como se aprecia en la figura 3.

30º

a

Calculamos el valor de h por el teorema de Pitágoras y tenemos 3 que h = × a. Si aplicamos las definiciones de seno, coseno y tan2 gente al triángulo rectángulo de la izquierda, llegamos a sen 30º=

1 2

cos 30º=

3 2

tg 30º=

1 3

=

3 3

a h

60º

a/2

Figura 3. 3 sen 60º= 2

1 cos 60º= 2

tg 60º= 3

Para calcular las razones trigonométricas de 45º, construimos un cuadrado de lado a, que posteriormente dividimos en dos triángulos rectángulos por medio de una diagonal tal como se ve en la figura 4. Si calculamos el valor de la diagonal por el teorema de Pitágo2 ras, tenemos que d = × a. Aplicando las definiciones de las razo2 nes trigonométricas al triángulo rectángulo inferior llegamos a sen 45º=

2 2

cos 45º=

2 2

d

a

tg 45º= 1 45º


45º

a

259


260


Haremos como resumen una tabla de las razones trigonométricas vistas con anterioridad

3 2

c a

cos a =

2 2

0

1 3 = 3 3

sen a =

tg b =

1 2

cos b =

30º

b a

tg ( 90º– a ) = cotg a

0

y

c a

1

0º

tg a

sen b =

cos a

de donde

cos( 90º– a ) = sen a sen a

sen ( 90º– a ) = cos a

a

b a

tg a = 45º

2 2

60º

3 2

1 2

3

90º

1

0

Ind

180º

0

–1

270º

–1

0

1

b c c b

Si observamos la figura y calculamos las razones trigonométricas de a y b, tendremos que a

0 Ind

Figura 5. b

c

a

b

6. REDUCCIÓN AL PRIMER CUADRANTE

Dos ángulos a y b son complementarios si su suma es 90º, de donde deducimos que b = 90º – a. Calcularemos las razones trigonométricas de b en función de las de a.

Veremos ahora cómo podemos poner las razones trigonométricas de un ángulo de cualquier cuadrante en función de las de uno del primero.

6.1. Razones trigonométricas de ángulos complementarios

6.1. Razones trigonométricas de ángulos complementarios

Veremos ahora cómo podemos poner las razones trigonométricas de un ángulo de cualquier cuadrante en función de las de uno del primero.

Dos ángulos a y b son complementarios si su suma es 90º, de donde deducimos que b = 90º – a. Calcularemos las razones trigonométricas de b en función de las de a.

6. REDUCCIÓN AL PRIMER CUADRANTE b

60º

0

–1

1 3 2

Figura 5.

90º

0 b

180º

–1

Ind a

c

270º

a

0 Ind

0

3

1 2

Si observamos la figura y calculamos las razones trigonométricas de a y b, tendremos que tg a =

1 2

c a

tg b =

c b b c

a

0

sen a

1

cos a

cos( 90º– a ) = sen a

0º

3 2

1 3 = 3 3 0

tg a

sen ( 90º– a ) = cos a

cos b =

b a

30º

1

de donde

b a

2 2

sen b =

cos a =

2 2

y

c a

45º

sen a =

tg ( 90º– a ) = cotg a

Haremos como resumen una tabla de las razones trigonométricas vistas con anterioridad CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


260


6.2. Razones trigonométricas de ángulos que difieren 90º (p/2 radianes) Si observamos la figura vemos que los triángulos OAA ' y BOB ' son iguales ya que son rectángulos con la misma hipotenusa y el ángulo AOA ' es el mismo que OBB' al ser sus lados perpendiculares a los del primero. Así, AA '= OB ' y OA '= BB ', en módulo, por lo que

B

sen ( 90º+a ) = BB '= OA '= cos a

A 90+a a

cos ( 90º+a ) = OB '= – AA '= – sen a tg ( 90º+a ) =

B'

O

A'

sen ( 90º+a ) = – cotg a cos ( 90º+a )

Obsérvese que se ha tomado el signo de cada segmento en función del eje en el que se mide. Así, el segmento OB'es negativo al medirse en el eje de abscisas y estar a la izquierda del origen. En lo sucesivo haremos lo mismo.

Figura 6.

6.3. Razones trigonométricas de ángulos suplementarios Dos ángulos son suplementarios cuando suman 180º (p radianes). Así, calcularemos las razones trigonométricas del ángulo 180º –a en función de las de a. Los triángulos OAA' y OBB ' son iguales, por lo que tendremos sen (180º– a ) = B ' B = A ' A = sen a

B

A 180 – a a

B'

A'

O

cos (180º– a ) = OB '= – OA '= – cos a tg (180º– a ) =

sen (180º– a ) = – tg a cos (180º– a )

Figura 7.

6.4. Razones trigonométricas de ángulos que difieren 180º Haciendo las mismas consideraciones de igualdad de triángulos que en los apartados anteriores tenemos que sen (180º+a ) = B ' B = – A ' A = – sen a

A 180 + a

cos (180º+a ) = OB '= – OA '= – cos a tg (180º– a ) =

sen (180º+a ) = tg a cos (180º+a )

Siguiendo los mismos razonamientos llegaremos a

a

B' O

A'

B

Figura 8.

6.5. Razones trigonométricas del ángulo 270º –a sen ( 270º– a ) = – cos a cos ( 270º– a ) = – sen a tg ( 270º– a ) = – cotg a TEMARIO DE MATEMÁTICAS. PRUEBA A

261


262


OD OC – CD OC CD = = – OB OB OB OB

6.6. Razones trigonométricas del ángulo 270º + a

cos (a + b ) =

sen ( 270º+a ) = – cos a cos ( 270º+a ) = sen a

Del mismo modo

tg ( 270º+a ) = – cotg a

sen ( a + b ) = sen a ×cos a+ cos a ×sen b

(1)

por lo que

6.7. Razones trigonométricas del ángulo opuesto (–a)

sen ( a + b ) =

OA BA ×sen a + ×cos a OB OB

sen (– a ) = sen ( 360º– a ) = – sen a cos (– a ) = cos ( 360º– a ) = cos a tg (– a ) = tg ( 360º– a ) = – tg a

nes en la fórmula anterior, tendremos

Y como DE = CA = OA · sen a y en el triángulo BEA (el ángulo ABE es igual a a por ser sus lados perEB de donde EB = BA · cos a. Si sustituimos estas expresioBA

pendiculares a los de a), tenemos que cos a =

7. RAZONES TRIGONOMÉTRICAS DE LOS ÁNGULOS SUMA, DIFERENCIA DOBLE Y MITAD sen (a + b ) =

DB DE + EB DE EB = = + OB OB OB OB

7.1. Razones trigonométricas de a + b

CA OC AB OA Si observamos la figura 9, podemos ver que sen a = , cos a = , sen b = , cos b = , OA OA OB OB DB OD ycos (a + b ) = . Por lo tanto, para hallar las razones del ángulo suma, tendremos OB OB

sen (a + b ) =

B

o

D

Figura 9.

C

a a+b

A

E

b

A

b

E a+b a

o

D

C

Si observamos la figura 9, podemos ver que sen a = B

sen (a + b ) =

Figura 9. CA OC AB OA , cos a = , sen b = , cos b = , OA OA OB OB

DB OD ycos (a + b ) = . Por lo tanto, para hallar las razones del ángulo suma, tendremos OB OB

7.1. Razones trigonométricas de a + b

sen (a + b ) =

DB DE + EB DE EB = = + OB OB OB OB

7. RAZONES TRIGONOMÉTRICAS DE LOS ÁNGULOS SUMA, DIFERENCIA DOBLE Y MITAD Y como DE = CA = OA · sen a y en el triángulo BEA (el ángulo ABE es igual a a por ser sus lados perEB de donde EB = BA · cos a. Si sustituimos estas expresiopendiculares a los de a), tenemos que cos a = BA nes en la fórmula anterior, tendremos sen (– a ) = sen ( 360º– a ) = – sen a cos (– a ) = cos ( 360º– a ) = cos a tg (– a ) = tg ( 360º– a ) = – tg a

sen ( a + b ) =

OA BA ×sen a + ×cos a OB OB

6.7. Razones trigonométricas del ángulo opuesto (–a)

por lo que sen ( a + b ) = sen a ×cos a+ cos a ×sen b sen ( 270º+a ) = – cos a cos ( 270º+a ) = sen a tg ( 270º+a ) = – cotg a

Del mismo modo

cos (a + b ) =

(1)

OD OC – CD OC CD = = – OB OB OB OB

6.6. Razones trigonométricas del ángulo 270º + a CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


262


Y como OC = OA · cos a y en el triángulo ABE sen a =

EA , de donde DC = EA = BA · sen a. SustituBA

yendo en la fórmula anterior, tenemos cos ( a + b ) =

OA BA ×cos a – ×sen a OB OB

por lo que cos ( a + b ) = cos a ×cos b – sen a ×sen b

(2)

Si dividimos miembro a miembro las expresiones (1) y (2), tendremos tg ( a + b ) =

sen ( a + b ) sen a ×cos b + cos a ×sen b = cos( a + b ) cos a ×cos b – sen a ×sen b

y si dividimos numerador y denominador entre cos a · cos b, tendremos sen a ×cos b cos a ×sen b + tg a + tg b cos a ×cos b cos a ×cos b tg ( a + b ) = = cos a ×cos b sen a ×sen b 1 – tg a × tg b – cos a ×cos b cos a ×cos b

(3)

7.2. Razones trigonométricas de a – b Si utilizamos las fórmulas (1), (2) y (3), tendremos sen ( a – b ) = sen ( a + (– b )) = sen a ×cos(– b )+ cos a ×sen (– b ) sen ( a – b ) = sen a ×cos b – cos a ×sen b

(4)

Para el coseno tendremos cos ( a – b ) = cos ( a + (– b )) = cos a ×cos(– b ) – sen a ×sen (– b ) cos ( a – b ) = cos a ×cos b + sen a ×sen b

(5)

Y para la tangente tg ( a – b ) = tg ( a + (– b )) = tg ( a – b ) =

tg a – tg b 1 – tg a × tg b

tg a + tg (– b ) 1 – tg a × tg (– b )

(6)

7.3. Razones trigonométricas del ángulo doble Utilizando las fórmulas de la suma y haciendo b = a, tendremos sen 2a = sen ( a + a ) = sen a ×cos a + cos a ×sen a = 2×sen a ×cos a cos 2a = cos ( a + a ) = cos a ×cos a – sen a ×sen a = cos 2 a – sen 2 a tg ( 2a ) = tg ( a + a ) =


tg a + tg a 2× tg a = 1 – tg a × tg a 1 – tg 2 a 263


264


cos ( a + b ) – cos ( a – b ) = –2×sen a ×sen b

7.4. Razones trigonométricas del ángulo mitad

Si tomamos la fórmula del coseno del ángulo doble y la primera fórmula fundamental, tendremos cos ( a + b )+ cos ( a – b ) = 2×cos a ×cos b 1= cos 2 a + sen 2 a

tendremos

cos ( a – b ) = cos a ×cos b + sen a ×sen b cos 2a = cos 2 a – sen 2 a

cos ( a + b ) = cos a ×cos b – sen a ×sen b

Si sumamos y restamos ambas fórmulas, tendremos

Haciendo lo mismo con las fórmulas (2) y (5)

1+ cos 2a = 2×cos 2 a

sen ( a + b ) – sen ( a – b ) = 2×cos a ×sen b 1 – cos 2a = 2×sen 2 a

sen ( a + b )+ sen ( a – b ) = 2×sen a ×cos b

Despejando sen a y cos a, y haciendo el cambio a = 2a, tendremos 1 – cos a a = 2 2

y las sumamos y restamos, tendremos

sen

sen ( a – b ) = sen a ×cos b – cos a ×sen b 1+ cos a a = 2 2

sen ( a + b ) = sen a ×cos b+ cos a ×sen b Si utilizamos las fórmulas (1) y (4),

cos

1 – cos a a = 2 1+ cos a

8. TRANSFORMACIÓN DE SUMAS EN PRODUCTOS tg

1 – cos a a = 2 1+ cos a

tg

1+ cos a a = 2 2

cos

1 – cos a a = 2 2

sen

8. TRANSFORMACIÓN DE SUMAS EN PRODUCTOS Si utilizamos las fórmulas (1) y (4),

sen ( a + b ) = sen a ×cos b+ cos a ×sen b sen ( a – b ) = sen a ×cos b – cos a ×sen b y las sumamos y restamos, tendremos

Despejando sen a y cos a, y haciendo el cambio a = 2a, tendremos

sen ( a + b )+ sen ( a – b ) = 2×sen a ×cos b 1 – cos 2a = 2×sen 2 a

sen ( a + b ) – sen ( a – b ) = 2×cos a ×sen b 1+ cos 2a = 2×cos 2 a

Haciendo lo mismo con las fórmulas (2) y (5)

Si sumamos y restamos ambas fórmulas, tendremos

cos ( a + b ) = cos a ×cos b – sen a ×sen b cos 2a = cos 2 a – sen 2 a

cos ( a – b ) = cos a ×cos b + sen a ×sen b 1= cos 2 a + sen 2 a

tendremos

cos ( a + b )+ cos ( a – b ) = 2×cos a ×cos b

Si tomamos la fórmula del coseno del ángulo doble y la primera fórmula fundamental, tendremos

7.4. Razones trigonométricas del ángulo mitad

cos ( a + b ) – cos ( a – b ) = –2×sen a ×sen b



264


Si ahora hacemos el cambio a + b = A, y a – b = B, llegamos a que a =

A+B A–B y b= . Sustitu2 2

yendo en las fórmulas anteriores, tendremos sen A + sen B = 2×sen

A+B A–B ×cos 2 2

sen A – sen B = 2×cos

A+B A–B ×sen 2 2

cos A + cos B = 2×cos

A+B A–B ×cos 2 2

cos A – cos B = –2×sen

A+B A–B ×sen 2 2

8.1. Fórmula de Moivre Es un procedimiento que se basa en la potenciación de números complejos para expresar los valores del seno y del coseno de un ángulo múltiplo entero de a en función de las razones trigonométricas de a. Para elevar un complejo expresado en forma polar a una potencia, se eleva el módulo a dicha potencia y se multiplica el argumento por la misma. Así:

(1a ) n = 1n×a Si ahora expresamos estos complejos en forma trigonométrica, tenemos

(cos a+ i ×sen a) n = cos na+ i ×sen na que es la llamada fórmula de Moivre. Si desarrollamos la potencia utilizando la fórmula del binomio de Newton, tenemos cos na + i ×sen na = æn ö æn ö æn ö æn ö = ç ÷cos n a +ç ÷cos n–1 a ×sen a × i +ç ÷cos n– 2 a ×sen 2 a × i 2 +ç ÷cos n– 3 a ×sen 3 a × i 3+...= è 2ø è 0ø è 3ø è 1ø æn ö æn ö æn ö = ç ÷cos n a – ç ÷cos n– 2 a ×sen 2 a +ç ÷cos n– 4 a ×sen 4 a+...+ 0 2 è ø è ø è4 ø æn ö æn ö éæ n ö ù +êç ÷cos n–1 a ×sen a – ç ÷cos n– 3 a ×sen 3 a +ç ÷cos n– 5 a ×sen 5 a+...ú× i è 3ø è 5ø ëè 1ø û Si ahora igualamos componentes reales e imaginarias de ambos miembros, llegamos a æn ö æn ö æn ö cos na = ç ÷cos n a – ç ÷cos n– 2 a ×sen 2 a +ç ÷cos n– 4 a ×sen 4 a+... è 0ø è 2ø è4 ø æn ö æn ö æn ö sen na = ç ÷cos n–1 a ×sen a – ç ÷cos n– 3 a ×sen 3 a+ç ÷cos n– 5 a ×sen 5 a+... è 1ø è 5ø è 3ø TEMARIO DE MATEMÁTICAS. PRUEBA A

265


266


c cos B

Si aplicamos estas fórmulas para n = 2 y n = 3, llegamos a las expresiones C = 90º– B

a=

b = c× tg B

cos 2a = cos 2 a – sen 2 a sen 2a = 2×sen a ×cos a

de donde

cos 3a = 4 ×cos 3 a – 3×cos a sen 3a = 3×sen a – 4 ×sen 3 a

B + C = 90º

cos B =

c a

tg B =

b c

Supongamos ahora que los datos sean B y c, con lo que tendremos

y así para cualquier valor de n.

9.2. Conocidos un ángulo agudo y su cateto adyacente 9. RESOLUCIÓN DE TRIÁNGULOS RECTÁNGULOS b sen B

b tg B

Un triángulo rectángulo es aquel que tiene un ángulo recto, es decir de 90º. A los lados que forman dicho ángulo se les llaman catetos y al lado contrario al mismo hipotenusa. Sin perder generalidad tomaremos el triángulo rectángulo de la figura, donde b y c serán los catetos y a la hipotenusa. a=

C = 90º– B

sen B =

B + C = 90º

c=

de donde b a

tg B =

B

b c

a

Supondremos conocidos el ángulo B y el cateto b. Aplicando las razones trigonométricas y las fórmulas generales, tenemos: c

9.1. Conocidos un ángulo agudo y su cateto opuesto A

C

b

Figura 10.

De este triángulo conocemos que A = 90º, por lo que B + C = 90º y además se verifica el teorema de Pitágoras, es decir, a2 = b2 + c2. Resolver este triángulo es, dados dos datos (además del ángulo recto), calcular los restantes. Por ello nos podemos encontrar con diferentes casos:

De este triángulo conocemos que A = 90º, por lo que B + C = 90º y además se verifica el teorema de Pitágoras, es decir, a2 = b2 + c2. Resolver este triángulo es, dados dos datos (además del ángulo recto), calcular los restantes. Por ello nos podemos encontrar con diferentes casos: b

A

C

Figura 10.

9.1. Conocidos un ángulo agudo y su cateto opuesto Supondremos conocidos el ángulo B y el cateto b. Aplicando las razones trigonométricas y las fórmulas generales, tenemos: c

a

sen B =

b a

tg B =

b c

B

B + C = 90º de donde

Un triángulo rectángulo es aquel que tiene un ángulo recto, es decir de 90º. A los lados que forman dicho ángulo se les llaman catetos y al lado contrario al mismo hipotenusa. Sin perder generalidad tomaremos el triángulo rectángulo de la figura, donde b y c serán los catetos y a la hipotenusa. C = 90º– B

a=

b sen B

c=

b tg B

9. RESOLUCIÓN DE TRIÁNGULOS RECTÁNGULOS 9.2. Conocidos un ángulo agudo y su cateto adyacente cos 2a = cos 2 a – sen 2 a sen 2a = 2×sen a ×cos a cos 3a = 4 ×cos 3 a – 3×cos a sen 3a = 3×sen a – 4 ×sen 3 a

B + C = 90º de donde

C = 90º– B

cos B =

a=

c cos B

c a

tg B =

y así para cualquier valor de n.

Supongamos ahora que los datos sean B y c, con lo que tendremos

b c

b = c× tg B

Si aplicamos estas fórmulas para n = 2 y n = 3, llegamos a las expresiones CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


266


9.3. Conocidos un ángulo agudo y la hipotenusa Supongamos ahora que los datos sean B y a, con lo que tendremos B + C = 90º

sen B =

b a

cos B =

c a

de donde C = 90º– B

b = a ×sen B

c = a ×cos B

9.4. Conocidos los dos catetos Supongamos ahora que los datos sean b y c, con lo que tendremos a 2 = b 2 + c2

tg B =

b c

tg C =

c b

B = arctg

b c

C = arctg

de donde a = b 2 + c2

c b

9.5. Conocidos un cateto y la hipotenusa Supongamos ahora que los datos sean b y a, con lo que tendremos a 2 = b 2 + c2

sen B =

b a

cos C =

b a

B = arcsen

b a

C = arccos

de donde c = a2 – b2

b a

10. RELACIONES ENTRE LOS ELEMENTOS (ÁNGULOS Y LADOS) DE UN TRIÁNGULO CUALQUIERA Antes de pasar a la resolución de triángulos oblicuángulos, veremos los teoremas y fórmulas que nos permitirán acceder a la misma.

10.1. Teorema del coseno

r r r Consideremos r r el rtriángulode la figura ABC, en el que llamaremos a = BC , b = AC y c = AB. Así se cumplirá que c + a = b. B

c

a

C

A

Figura 11.

b

r r r r Así, a = b – c. Si multiplicamos escalarmente a por sí mismo, tendremos r r r r r r r r r r r r a × a = (b – c)×(b – c) = b × b – 2b × c + c × c TEMARIO DE MATEMÁTICAS. PRUEBA A

267


268


a b = sen A sen B

Aplicando la definición de producto escalar, tenemos r2 r2 r r r r r2 a = b + c – 2× b × c ×cos( b , c )

a ×sen B = b ×sen A Þ de donde

r r r Si llamamos a = a, b = b y c = c y como el ángulo que forman los vectores b y c es A, tendremos sen B =

h Þ h = a ×sen B a

a 2 = b 2 + c 2 – 2× b × c ×cos A sen A =

h Þ h = b ×sen A b

que es el teorema del coseno. Su enunciado sería:

Si nos fijamos en los triángulos de la figura, observamos que al dibujar la altura sobre el lado c aparecen dos triángulos rectángulos, AHC y BHC en los que se cumple (en el acutángulo podemos ver que sen A = sen (180º – a)). Teorema 1:

La longitud del lado de un triángulo al cuadrado es igual a la suma de los cuadrados de las longitudes de los otros dos menos el doble producto de esas longitudes por el coseno del ángulo que forman. A

c

H

H

B

c

A

Figura 12.

B

Se llama también teorema de Pitágoras generalizado. Para los otros lados, tendríamos h

b

b

b 2 = a 2 + c 2 – 2× a × c ×cos B h

a

a

c 2 = a 2 + b 2 – 2× a × b ×cos C C

C

10.2. Teorema de los senos a b c = = = 2× R sen A sen B sen C

Teorema 2:

En todo triángulo las longitudes de sus lados son proporcionales a los senos de los ángulos opuestos respectivos, siendo esa constante de proporcionalidad igual al diámetro de la circunferencia circunscrita al triángulo. Es decir

En todo triángulo las longitudes de sus lados son proporcionales a los senos de los ángulos opuestos respectivos, siendo esa constante de proporcionalidad igual al diámetro de la circunferencia circunscrita al triángulo. Es decir

a b c = = = 2× R sen A sen B sen C

Teorema 2:

10.2. Teorema de los senos C

C

c 2 = a 2 + b 2 – 2× a × b ×cos C a

b 2 = a 2 + c 2 – 2× a × c ×cos B

b

h

h

a

b

Se llama también teorema de Pitágoras generalizado. Para los otros lados, tendríamos A

H

c

B

A

H

c

B

Figura 12.

La longitud del lado de un triángulo al cuadrado es igual a la suma de los cuadrados de las longitudes de los otros dos menos el doble producto de esas longitudes por el coseno del ángulo que forman.

Si nos fijamos en los triángulos de la figura, observamos que al dibujar la altura sobre el lado c aparecen dos triángulos rectángulos, AHC y BHC en los que se cumple (en el acutángulo podemos ver que sen A = sen (180º – a)). Teorema 1:

que es el teorema del coseno. Su enunciado sería:

sen A =

h Þ h = b ×sen A b

a 2 = b 2 + c 2 – 2× b × c ×cos A h Þ h = a ×sen B a

r r r Si llamamos a = a, b = b y c = c y como el ángulo que forman los vectores b y c es A, tendremos sen B =

Aplicando la definición de producto escalar, tenemos r2 r2 r r r r r2 a = b + c – 2× b × c ×cos( b , c )

a ×sen B = b ×sen A Þ

268

a b = sen A sen B



de donde

Trigonometría plana Si procedemos de la misma forma con la altura sobre el lado b, se obtiene a c = sen A sen C por lo que a b c = = sen A sen B sen C

Para comprobar que la constante de proporcionalidad es el diámetro de la circunferencia circunscrita al triángulo, observamos en la figura 13 que dibujamos el triángulo BCA', siendo A' el extremo del diámetro que pasa por B. En este triángulo se cumple que C = 90º, ya que es un ángulo inscrito y subtiende un diámetro. Además se puede ver que A = A ' por ser inscritos y abarcar el mismo arco. C

90º

A'

a

O

b

B

c

A

Figura 13.

Si aplicamos el teorema de los senos al triángulo BCA', tenemos a 2R = = 2R sen A ' sen 90º y como A = A ' a b c = = = 2× R sen A sen B sen C

10.3. Teorema de la tangente o de Neper a b y le aplicamos la propiedad de las proporciones = sen A sen B que dice que en toda proporción la suma de antecedentes es a su diferencia como la suma de consecuentes es a su diferencia, tenemos que Si partimos del teorema de los senos

a + b sen A + sen B = a – b sen A – sen B


269


270


Si ahora transformamos la suma y diferencia del segundo miembro en producto y simplificamos, tendremos =

( a + b – c) ×( a – b + c) a 2 – ( b – c) = 2× b × c 2× b × c

A+B A–B A+B tg a + b 2×sen 2 ×cos 2 2 = = A+B A–B A–B a– b 2×cos ×sen tg 2 2 2 2

1 – cos A = 1 –

b 2 + c2 – a 2 2× b × c – b 2 – c2 + a 2 = = 2× b × c 2× b × c

fórmula según la cual podemos enunciar el teorema de la tangente que dice =

( b + c) – a 2 ( b + c+ a) ×( b + c – a) = 2× b × c 2× b × c 2

Teorema 3:

b 2 + c2 – a 2 b 2 + c2 – a 2 + 2× b × c = = 2× b × c 2× b × c

En cualquier triángulo el cociente de la suma de dos de sus lados entre la diferencia de los mismos es igual al cociente de la tangente de la semisuma de sus ángulos opuestos entre la tangente de la semidiferencia de los mismos. 1+ cos A = 1+

Si a 1 le sumamos y restamos esta fórmula, tendremos Así, también se cumplirá

a 2 = b 2 + c 2 – 2× b × c ×cos A Þ cos A = A +C a + c tg 2 = A–C a– c tg 2

b 2 + c2 – a 2 2× b × c

Estas fórmulas nos relacionan los ángulos y lados de un triángulo. Partimos para ello del teorema del coseno, donde despejaremos el coseno del ángulo

10.4. Fórmulas de Briggs

B +C b + c tg 2 = B–C b– c tg 2

B +C b + c tg 2 = B–C b– c tg 2

10.4. Fórmulas de Briggs

A +C a + c tg 2 = A–C a– c tg 2

Estas fórmulas nos relacionan los ángulos y lados de un triángulo. Partimos para ello del teorema del coseno, donde despejaremos el coseno del ángulo a 2 = b 2 + c 2 – 2× b × c ×cos A Þ cos A =

b 2 + c2 – a 2 2× b × c

Así, también se cumplirá

Si a 1 le sumamos y restamos esta fórmula, tendremos En cualquier triángulo el cociente de la suma de dos de sus lados entre la diferencia de los mismos es igual al cociente de la tangente de la semisuma de sus ángulos opuestos entre la tangente de la semidiferencia de los mismos. =

b 2 + c2 – a 2 b 2 + c2 – a 2 + 2× b × c = = 2× b × c 2× b × c

( b + c) 2 – a 2 2× b × c

=

Teorema 3:

1+ cos A = 1+

( b + c+ a) ×( b + c – a) 2× b × c

fórmula según la cual podemos enunciar el teorema de la tangente que dice A+B A–B A+B tg a + b 2×sen 2 ×cos 2 2 = = A+B A–B A–B a– b 2×cos ×sen tg 2 2 2

1 – cos A = 1 –

b 2 + c2 – a 2 2× b × c – b 2 – c2 + a 2 = = 2× b × c 2× b × c

( a + b – c) ×( a – b + c) a 2 – ( b – c) = 2× b × c 2× b × c 2

=

Si ahora transformamos la suma y diferencia del segundo miembro en producto y simplificamos, tendremos CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


270

Trigonometría plana Si llamamos 2p al perímetro del triángulo, tendremos que a + b + c = 2p, por lo que b + c – a = 2 p – 2a = 2× ( p – a ) a + b – c = 2 p – 2c = 2× ( p – c ) a – b + c = 2 p – 2b = 2×( p – b ) además, por las razones trigonométricas del ángulo mitad sabemos que 1+ cos A = 2×cos 2

A 2

1 – cos A = 2×sen 2

A 2

si sustituimos esto último en las fórmulas anteriores, tendremos 2×sen 2

A 2× ( p – b )× 2× ( p – c ) A = Þ sen = 2 2× b × c 2

2×cos 2

A 2× p × 2× ( p – a ) A = Þ cos = 2 2× b × c 2

( p – b )× ( p – c ) b×c p×( p – a ) b×c

Si dividimos estas fórmulas y haciendo el mismo razonamiento para el teorema del coseno de los otros ángulos, tendremos las fórmulas de Briggs, que nos permiten calcular los ángulos de un triángulo conocidos los tres lados. Estas son: tg

A = 2

( p – b )× ( p – c ) p×( p – a )

tg

B = 2

( p – a )× ( p – c ) p×( p – b )

tg

C = 2

( p – b )× ( p – b ) p×( p – c )

10.5. Superficie de un triángulo La superficie de un triánguloes igual a 1/2 de la longitud de la base por la altura. Si tomamos por ejemplo cualquiera de los dos triángulos de la figura 12, observamos que la base es c y que la altura se puede poner como a · sen B, con lo que el área sería 1 S = a × c×sen B 2 Si tomamos otros lados como base, llegamos a 1 S = a × b ×sen C 2 1 S = b × c×sen A 2 Así, podemos decir que la superficie de un triángulo es igual al semiproducto de dos de sus lados por el seno del ángulo comprendido. TEMARIO DE MATEMÁTICAS. PRUEBA A

271


272


c = a 2 + b 2 – 2× b × c ×cos C

Si utilizamos la constante de proporcionalidad del teorema de los senos, tendremos que

a = 2R, sen A

a , con lo que la fórmula de la superficie en función del radio de la circunferencia cir2R cunscrita al triángulo sería

Aquí tendremos que aplicar el teorema del coseno y el teorema de los senos además de que la suma de los tres ángulos de un triángulo es 180º. Supongamos que los datos que nos dan son a, b y C. Utilizando el teorema del coseno para el ángulo C, llegamos a de donde sen A =

a×b×c 4R

11.2. Segundo caso: conocemos dos lados y el ángulo comprendido S=

pudiendo decir que el área de un triángulo es igual al producto de sus lados dividido por cuatro veces el radio de su circunferencia circunscrita. Si en la primera fórmula calculada ponemos el seno del ángulo en función del seno y coseno del ángulo mitad y sustituimos los mismos por las fórmulas de Briggs, llegaremos a la llamada fórmula de Herón, que nos da la superficie en función de los lados A = 180º– ( B + C ) a ×sen B b= sen A a ×sen C sen A c=

1 1 C S = a × b ×sen C = a × b ×sen 2× = 2 2 2

Para resolver este caso, aplicaremos que la suma de los tres ángulos de un triángulo es 180º y bastará con aplicar el teorema de los senos. Supongamos que los datos que nos dan son a, B y C, suponiendo que la suma de estos ángulos es menor de 180º. Los valores de las incógnitas serán C C 1 ( p – a )× ( p – b ) p×( p – c ) 1 = a × b × 2×sen ×cos = a × b × × = a×b a×b 2 2 2 2

11.1. Primer caso: conocemos un lado y dos ángulos

=

p × ( p – a )× ( p – b )× ( p – c )

Para determinar un triángulo es necesario conocer tres elementos del mismo entre los cuales debe de haber necesariamente un lado. Por tanto, para resolver un triángulo cualquiera se nos pueden presentar cuatro casos.

Utilizando el radio del circulo inscrito (cuyo centro será el incentro o lugar donde se cortan las bisectrices), llegaríamos a la fórmula S = p · r, donde p es el semiperímetro y r el radio de la circunferencia inscrita al triángulo.

11. RESOLUCIÓN DE TRIÁNGULOS OBLICUÁNGULOS

Utilizando el radio del circulo inscrito (cuyo centro será el incentro o lugar donde se cortan las bisectrices), llegaríamos a la fórmula S = p · r, donde p es el semiperímetro y r el radio de la circunferencia inscrita al triángulo.

11. RESOLUCIÓN DE TRIÁNGULOS OBLICUÁNGULOS

Para determinar un triángulo es necesario conocer tres elementos del mismo entre los cuales debe de haber necesariamente un lado. Por tanto, para resolver un triángulo cualquiera se nos pueden presentar cuatro casos. =

p × ( p – a )× ( p – b )× ( p – c )

11.1. Primer caso: conocemos un lado y dos ángulos

C C 1 ( p – a )× ( p – b ) p×( p – c ) 1 = a × b × 2×sen ×cos = a × b × × = a×b a×b 2 2 2 2

Para resolver este caso, aplicaremos que la suma de los tres ángulos de un triángulo es 180º y bastará con aplicar el teorema de los senos. Supongamos que los datos que nos dan son a, B y C, suponiendo que la suma de estos ángulos es menor de 180º. Los valores de las incógnitas serán 1 1 C S = a × b ×sen C = a × b ×sen 2× = 2 2 2

A = 180º– ( B + C ) a ×sen B b= sen A a ×sen C c= sen A

pudiendo decir que el área de un triángulo es igual al producto de sus lados dividido por cuatro veces el radio de su circunferencia circunscrita. Si en la primera fórmula calculada ponemos el seno del ángulo en función del seno y coseno del ángulo mitad y sustituimos los mismos por las fórmulas de Briggs, llegaremos a la llamada fórmula de Herón, que nos da la superficie en función de los lados S=

a×b×c 4R

11.2. Segundo caso: conocemos dos lados y el ángulo comprendido a Si utilizamos la constante de proporcionalidad del teorema de los senos, tendremos que = 2R, sen A a de donde sen A = , con lo que la fórmula de la superficie en función del radio de la circunferencia cir2R cunscrita al triángulo sería

Aquí tendremos que aplicar el teorema del coseno y el teorema de los senos además de que la suma de los tres ángulos de un triángulo es 180º. Supongamos que los datos que nos dan son a, b y C. Utilizando el teorema del coseno para el ángulo C, llegamos a c = a 2 + b 2 – 2× b × c ×cos C



272

Trigonometría plana Calculado ya c, utilizaremos ahora dos veces el teorema de los senos para calcular A y B. a c a ×sen C a ×sen C = Þ sen A = Þ A = arcsen sen A sen C c c a ×sen C b ×sen C b c Þ sen B = Þ B = arcsen = b c sen B sen C

11.3. Tercer caso: conocemos los tres lados Podemos resolverlo de dos maneras distintas: una de ellas es utilizar las fórmulas de Briggs, y la otra utilizar tres veces el teorema del coseno. Los datos serán a, b y c. Aquí pondremos la resolución por el segundo método ya que en el primero es simplemente sustituir los valores de los lados y semiperímetro en las fórmulas. Aplicando tres veces el teorema del coseno llegamos a cos A =

b 2 + c2 – a 2 2× b × c

cos B =

a 2 + c2 – b 2 2× a × c

cos C =

a 2 + b 2 – c2 2× a × b

11.4. Cuarto caso: conocemos dos lados y el ángulo opuesto a uno de ellos Este caso puede ser ambiguo ya que puede tener una, dos o ninguna solución. En principio intentaremos resolver mediante las fórmulas conocidas, haciendo posteriormente la discusión sobre sus posibles soluciones. Supongamos que los datos que nos dan son a, b y A. Para calcular el ángulo B, utilizamos el teorema de los senos, teniendo a b b ×sen A b ×sen A = Þ sen B = Þ B = arcsen sen A sen B a a

(7)

La solución de esto último nos puede dar dos valores ya que el seno de un ángulo es igual al seno de su suplementario. Por lo tanto, si B tiene dos soluciones a C le ocurriría lo mismo, teniendo ì C1 = 180º–( A + B1 ) ì B1 < 90º Þ Cí Bí îC 2 = 180º–( A + B2 ) îB2 = 180º– B1 Con cualquiera de los valores de B y C, para calcular el lado c, haremos uso del teorema de los senos a c a ×sen C = Þ c= sen A sen C sen A Discusión de los posibles casos: a)

Si a > b, el problema tiene solución única porque el valor de sen B en (7) resulta menor que el de sen A, y por tanto menor que 1. Y como a mayor lado se opone mayor ángulo A > B, por lo que la solución de B, tendrá que ser menor de 90º.

b)

Si a = b, entonces A = B. Por ello si A ³ 90º el problema no tiene solución.

c)

Si a < b, entonces A < B, lo que exige que A se agudo. Si A ³ 90º el problema no tiene solución y si A < 90º pueden ocurrir tres casos:

– –

Si a < b · sen A, el problema no tiene solución ya que resultaría que sen B > 1.

–

Si a > b · sen A, el valor de sen B es menor que 1 y se obtienen dos valores para B, uno menor de 90º y el otro su suplementario. En ambos casos el ángulo B, será menor que A.

Si a = b · sen A, el problema tiene solución única ya que sen B = 1 Þ B = 90º y el triángulo sería rectángulo.


273


274


c b b ×sen g = Þ c= sen g sen B sen B

12. APLICACIONES

Las aplicaciones de la trigonometría plana son bastantes, aunque principalmente su uso en topografía tiene un interés especial. Veremos algunas aplicaciones prácticas:

Suponemos que B es el punto más alto de una montaña cuya altura queremos medir. Tenemos acceso a los puntos A y C, con lo que podemos medir la distancia AC y los ángulos a, b y g. Con estos datos podemos resolver el triángulo ABC y con el dato del lado AB podremos calcular h en el triángulo ABH. Para ello primero calculamos el ángulo B del triángulo ABC como 180º – (b + g) y aplicamos el teorema de los senos, con lo que tendremos

12.1. Cálculo de la altura de un punto de pie accesible C

12.2. Cálculo de la altura de un punto de pie inaccesible h BA BA ×sen a BA ×sen a = Þ h= = sen a sen ( 90º– a ') sen ( 90º– a' ) cos a' h

Así, podemos medir además de BA, los ángulos a y a'. Así, el ángulo ACB será 90º– a ', con lo que conoceremos tres elementos del triángulo ABC. Para hallar h utilizamos el teorema de los senos, teniendo a

B h'

B

a'

d

A

Figura 14.

Figura 15.

A'

a

Si queremos calcular la altura h de la torre de la figura, con un teodolito de altura h', podemos medir la distancia d de separación de la vertical del aparato de medida al pie de la torre y el ángulo de inclinación a, que forma la horizontal del aparato con la visual dirigida al punto más alto. Determinamos así un triángulo rectángulo ABC, en el que la distancia AC es fácilmente calculable, valiendo d · tga. Así la altura de la torre es h = d × tg a + h '. Si la base BA no fuera horizontal (figura 15), además de medir la base y el ángulo a, se podría medir el ángulo que forma la horizontal con la visual dirigida a C (al llevar los teodolitos niveles). A h

C

C

Si queremos calcular la altura h de la torre de la figura, con un teodolito de altura h', podemos medir la distancia d de separación de la vertical del aparato de medida al pie de la torre y el ángulo de inclinación a, que forma la horizontal del aparato con la visual dirigida al punto más alto. Determinamos así un triángulo rectángulo ABC, en el que la distancia AC es fácilmente calculable, valiendo d · tga. Así la altura de la torre es h = d × tg a + h '. Si la base BA no fuera horizontal (figura 15), además de medir la base y el ángulo a, se podría medir el ángulo que forma la horizontal con la visual dirigida a C (al llevar los teodolitos niveles). h

A

a A'

Figura 15. A

d

a

a'

B h'

Figura 14.

B

Así, podemos medir además de BA, los ángulos a y a'. Así, el ángulo ACB será 90º– a ', con lo que conoceremos tres elementos del triángulo ABC. Para hallar h utilizamos el teorema de los senos, teniendo h

h BA BA ×sen a BA ×sen a = Þ h= = sen a sen ( 90º– a ') sen ( 90º– a' ) cos a'

12.2. Cálculo de la altura de un punto de pie inaccesible C

Suponemos que B es el punto más alto de una montaña cuya altura queremos medir. Tenemos acceso a los puntos A y C, con lo que podemos medir la distancia AC y los ángulos a, b y g. Con estos datos podemos resolver el triángulo ABC y con el dato del lado AB podremos calcular h en el triángulo ABH. Para ello primero calculamos el ángulo B del triángulo ABC como 180º – (b + g) y aplicamos el teorema de los senos, con lo que tendremos

12.1. Cálculo de la altura de un punto de pie accesible

Las aplicaciones de la trigonometría plana son bastantes, aunque principalmente su uso en topografía tiene un interés especial. Veremos algunas aplicaciones prácticas:



274

12. APLICACIONES

c b b ×sen g = Þ c= sen g sen B sen B

Trigonometría plana C

a h c 90º

b

a

H

b

g

C

A

Figura 16.

Si nos vamos ahora al triángulo rectángulo ABH, tendremos que h = c ×sen a =

b ×sen g ×sen a sen B

Otro caso que se podría presentar para calcular la altura de un punto de pie inaccesible es el llamado método de doble observación, pudiendo darse cuando la base la podemos tener alineada con los puntos de observación, tal como se aprecia en la figura. C

a

b

a A

h

B

d

x

Figura 17.

Aquí podemos medir la distancia AB y los ángulos a y b. De los triángulos rectángulos que tenemos sabemos que h ü d + x = h ×cotg aü d + xï ýÞ ý Þ d = h × (cotg a – cotg b) h x = h ×cotg bþ ï tg b = þ x tg a =

de donde h=


d cotg a – cotg b

275


276


12.3. Cálculo de la distancia entre dos puntos, uno de los cuales es inaccesible Imaginemos que queremos calcular la distancia desde un punto de una orilla de un río (A) a otro que se encuentra en la otra orilla al que no tenemos acceso (C), según la figura adjunta x=

AC 2 + CB 2 – 2× AC ×CB ×cos a C

Si con los valores calculados nos vamos al triángulo ABC, tendremos a

b

b CB b ×sen ( g + d ) b ×sen ( g + d ) = Þ CB = = sen B sen ( g + d ) sen B sen ( b+ g + d ) a

A

b

c

Figura 18.

B

En el triángulo BCD, como B = 180º– ( b + g + d), tenemos

En el triángulo del dibujo podemos medir la distancia entre A y B (c) y los ángulos a y b. Como C = = 180º – (a + b), podemos aplicar el teorema de los senos, teniendo b AC b ×sen g b ×sen g = Þ AC = = sen A sen g sen A sen ( a + b + g ) b c c×sen b = Þ b= sen b sen C sen C

Para resolverlo lo estudiaremos en dos triángulos distintos: ACD, en el que podemos calcular AC; BCD, en el que podemos calcular CB, y ABC, donde con los datos anteriores calcularemos AB, que es la distancia que nos piden. En el triángulo ACD, como A = 180º– ( a + b + g ), tenemos y ya conoceremos dicha distancia.

b

C

D

b

Figura 19.

g

12.4. Cálculo de la distancia entre dos puntos inaccesibles a

d

Queremos hallar la distancia entre dos puntos A y B inaccesibles. Elegimos arbitrariamente una base b = CD y desde ella medimos ángulos que forman las visuales, como se indica en la figura x

B A

A

B

x

Queremos hallar la distancia entre dos puntos A y B inaccesibles. Elegimos arbitrariamente una base b = CD y desde ella medimos ángulos que forman las visuales, como se indica en la figura d

a

12.4. Cálculo de la distancia entre dos puntos inaccesibles g

b

C

D

b

Figura 19.

y ya conoceremos dicha distancia.

Para resolverlo lo estudiaremos en dos triángulos distintos: ACD, en el que podemos calcular AC; BCD, en el que podemos calcular CB, y ABC, donde con los datos anteriores calcularemos AB, que es la distancia que nos piden. En el triángulo ACD, como A = 180º– ( a + b + g ), tenemos b c c×sen b = Þ b= sen b sen C sen C

b AC b ×sen g b ×sen g = Þ AC = = sen A sen g sen A sen ( a + b + g )

En el triángulo del dibujo podemos medir la distancia entre A y B (c) y los ángulos a y b. Como C = = 180º – (a + b), podemos aplicar el teorema de los senos, teniendo En el triángulo BCD, como B = 180º– ( b + g + d), tenemos B

c

A

Figura 18.

b CB b ×sen ( g + d ) b ×sen ( g + d ) = Þ CB = = sen B sen ( g + d ) sen B sen ( b+ g + d ) b

a

b

a

Si con los valores calculados nos vamos al triángulo ABC, tendremos C

x=

AC 2 + CB 2 – 2× AC ×CB ×cos a

Imaginemos que queremos calcular la distancia desde un punto de una orilla de un río (A) a otro que se encuentra en la otra orilla al que no tenemos acceso (C), según la figura adjunta

12.3. Cálculo de la distancia entre dos puntos, uno de los cuales es inaccesible CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


276

TEMA

39 Geometría del triángulo

Fulgencio García Gómez Cuerpo de Profesores de Enseñanza Secundaria


278



INTRODUCCION

2.

DEFINICIONES Y CLASIFICACIÓN 2.1. Definiciones de triángulo 2.2. Elementos de un triángulo 2.3. Clasificación de los triángulos 2.4. Consideraciones sobre los ángulos de un triángulo 2.5. Rectas notables de un triángulo 2.6. Igualdad de triángulos 2.7. Relaciones entre los lados y los ángulos de un triángulo 2.8. Construcción de triángulos

3.

PUNTOS Y RECTAS NOTABLES DEL TRIÁNGULO 3.1. Teoremas relativos a mediatrices y bisectrices como lugares geométricos 3.2. Puntos notables de un triángulo

4.

PROPIEDADES MÉTRICAS EN EL TRIÁNGULO 4.1. Teorema de Pitágoras 4.2. Interpretación geométrica del teorema de Pitágoras 4.3. Consecuencias del teorema de Pitágoras 4.4. Relaciones métricas en un triángulo cualquiera 4.5. Superficie del triángulo

PROPIEDADES MÉTRICAS EN EL TRIÁNGULO 4.1. Teorema de Pitágoras 4.2. Interpretación geométrica del teorema de Pitágoras 4.3. Consecuencias del teorema de Pitágoras 4.4. Relaciones métricas en un triángulo cualquiera 4.5. Superficie del triángulo

4.

PUNTOS Y RECTAS NOTABLES DEL TRIÁNGULO 3.1. Teoremas relativos a mediatrices y bisectrices como lugares geométricos 3.2. Puntos notables de un triángulo

3.

DEFINICIONES Y CLASIFICACIÓN 2.1. Definiciones de triángulo 2.2. Elementos de un triángulo 2.3. Clasificación de los triángulos 2.4. Consideraciones sobre los ángulos de un triángulo 2.5. Rectas notables de un triángulo 2.6. Igualdad de triángulos 2.7. Relaciones entre los lados y los ángulos de un triángulo 2.8. Construcción de triángulos

2.

INTRODUCCION

1.



278

Geometría del triángulo

1. INTRODUCCIÓN El título del tema abre las puertas a una cantidad enorme de cuestiones que pueden ser tratadas en el desarrollo del mismo. Comenzaremos por dar una definición de triángulo para, posteriormente, realizar una clasificación de los mismos y obtener algunas propiedades. Se definirán los puntos y las rectas notables de un triángulo para finalizar con el teorema de Pitágoras y algunas consecuencias del mismo.

2. DEFINICIONES Y CLASIFICACIÓN 2.1. Definiciones de triángulo Se pueden dar varias definiciones de triángulo, todas ellas equivalentes:

– – – –

Polígono de tres lados. Figura geométrica plana determinada por tres rectas que se cortan dos a dos. Porción de plano limitado por tres segmentos rectilíneos que tienen dos a dos un extremo en común. Porción de plano común a tres ángulos coplanarios que tienen dos a dos un lado común.

2.2. Elementos de un triángulo Sea cual sea la definición, en cada triángulo se distinguen seis elementos principales: tres lados y tres ángulos. Para construir un triángulo se marcan tres puntos, A, B y C, no alineados, y se unen los segmentos AB, BC y CA. Los segmentos son los lados y se suelen designar por letras minúsculas correspondientes al ángulo opuesto al lado de que se trate, y los puntos A, B y C son los vértices del triángulo. El triángulo D

ABC se designa por A BC , o D ABC.

C a

b

A

c

B

Figura 1.

En todo triángulo, un lado y un ángulo se dicen adyacentes si el vértice del ángulo está en ese lado (por ejemplo b y A). En caso contrario son opuestos. Se llama perímetro a la suma de las longitudes de los tres lados. Los ángulos convexos formados por cada dos lados se llaman ángulos del triángulo y los adyacentes a éstos se dicen ángulos externos del triángulo.

2.3. Clasificación de los triángulos 2.3.1. Atendiendo a sus lados – – –

Equiláteros, cuando los tres lados miden lo mismo. Isósceles, con dos lados son iguales en medida y otro distinto.

Escaleno, con los tres lados de distintas medidas. Los triángulos equiláteros tienen tres ejes de simetría, los isósceles uno y los escalenos no tienen ninguno.


279


280


– –

En un triángulo no puede haber un ángulo recto y uno obtuso.

C

C

En un triángulo no puede haber dos ángulos obtusos.

Se cumple que a$ + B$ + b$ = 180º y por ser ángulos alternos internos a$ = A$ y b$ = C$ , por lo que si sustituimos tenemos que A$ + B$ + C$ = 180º, que son dos rectos. A Consecuencias: – En un triángulo no puede haber dos ángulos rectos, ya que la suma de los tres sería mayor de 180º. C

Figura 4. C

A

B

A

B

A

B

Isósceles

Equilátero

Escaleno

Figura 2.

En efecto, sea el A BC y tracemos por uno de sus vértices, por ejemplo el B, una recta paralela al lado opuesto, tal como aparece en la figura.

a

b

2.3.2. Atendiendo a sus ángulos B

D

Teorema 1. En todo triángulo la suma de los ángulos interiores es igual a dos rectos.

–

Rectángulos, que tienen un ángulo recto (puede ser isósceles o escaleno, pero nunca equilátero). Los lados que forman el ángulo recto se llaman catetos y el lado opuesto al ángulo recto se llama hipotenusa.

– –

Obtusángulos, con un ángulo obtuso (puede ser isósceles o escaleno, pero nunca equilátero).

Respecto a los ángulos de un triángulo, veremos los dos siguientes teoremas:

2.4. Consideraciones sobre los ángulos de un triángulo

Acutángulos, con los tres ángulos agudos (puede ser equilátero, isósceles o escaleno). Figura 3. C

A

B B

B

A A

A A

B

Acutángulo

Rectángulo

Obtusángulo C

B

B

C

C

Figura 3.

– –

Obtusángulo

Acutángulo

A

C Rectángulo

C

Acutángulos, con los tres ángulos agudos (puede ser equilátero, isósceles o escaleno).

2.4. Consideraciones sobre los ángulos de un triángulo

Obtusángulos, con un ángulo obtuso (puede ser isósceles o escaleno, pero nunca equilátero). Respecto a los ángulos de un triángulo, veremos los dos siguientes teoremas:

Rectángulos, que tienen un ángulo recto (puede ser isósceles o escaleno, pero nunca equilátero). Los lados que forman el ángulo recto se llaman catetos y el lado opuesto al ángulo recto se llama hipotenusa.

–

Teorema 1. En todo triángulo la suma de los ángulos interiores es igual a dos rectos. D

B

2.3.2. Atendiendo a sus ángulos b

a

Figura 2.

Equilátero A

En efecto, sea el A BC y tracemos por uno de sus vértices, por ejemplo el B, una recta paralela al lado opuesto, tal como aparece en la figura. Se cumple que a$ + B$ + b$ = 180º y por ser ángulos alternos internos a$ = A$ y b$ = C$ , por lo que si sustituimos tenemos que A$ + B$ + C$ = 180º, que son dos rectos. A Consecuencias: – En un triángulo no puede haber dos ángulos rectos, ya que la suma de los tres sería mayor de 180º. Escaleno

Isósceles B

C

Figura 4.

A

B

A

B

C

C

En un triángulo no puede haber un ángulo recto y uno obtuso.



280

En un triángulo no puede haber dos ángulos obtusos. C

– –

Geometría del triángulo Teorema 2. En todo triángulo un ángulo externo es igual a la suma de los dos ángulos interiores no adyacentes. B

b a A

C

D

Figura 5.

$ el ángulo exterior, tracemos por el vértice C una semirrecta paralela al lado En efecto, sea BCD opuesto AB, con lo que tendremos $ = a$ + b$ DCB Además, a$ = A$ por ser ángulos correspondientes y b$ = B$ por ser ángulos alternos internos, luego sustituyendo, tendremos que $ = A$ + B$ DCB Como consecuencia del teorema podemos decir que “un ángulo exterior de un triángulo es mayor que cualquiera de los interiores no adyacentes”.

2.5. Rectas notables de un triángulo D

Dado el triángulo A BC , definimos:

– – – – – – –

Base es uno cualquiera de sus lados. Altura es el segmento perpendicular trazado desde el vértice opuesto a la base o a su prolongación. Mediana es el segmento que une un vértice con el punto medio del lado opuesto. Bisectriz interior es la recta que divide un ángulo cualquiera en dos ángulos iguales y queda limitada por el lado opuesto. Bisectriz exterior es cada bisectriz de un ángulo exterior. Mediatriz es la recta perpendicular a un lado cualquiera en su punto medio. Paralelas medias son las rectas que se obtienen uniendo los puntos medios de los lados.

Como puede observarse, en todo triángulo hay tres bases, tres alturas, tres medianas, tres bisectrices interiores, tres bisectrices exteriores, tres mediatrices y tres paralelas medias.

2.6. Igualdad de triángulos D

D

Diremos que dos triángulos A BC y A ' B 'C ' son iguales o congruentes si existe un movimiento que transforma uno en el otro, es decir, que al superponerlos coinciden. Para ello deben tener sus lados iguales y sus ángulos iguales. Para demostrar la igualdad de dos triángulos no se necesita probar la igualdad de sus seis elementos, puesto que si se verifica que un cierto número de ellos son iguales, los restantes han de ser necesariamente iguales. Cada grupo mínimo de elementos de un triángulo cuya igualdad suponga necesariamente la igualdad de todos los demás constituye un “criterio de igualdad de triángulos”, que enunciaremos seguidamente. TEMARIO DE MATEMÁTICAS. PRUEBA A

281


282


que A BC = A ' B 'C '. D

2.6.1. Criterios generales de igualdad

D

Aplicamos al triángulo T' un movimiento que lleve B 'C ' sobre BC y el semiplano que contiene a A' quede en lado distinto de A (con lo que conseguimos un triángulo T'', simétrico de T', respecto al lado A ' B '). Como AB = A ' B ' = A '' B y AC = A 'C ' = A ''C , tenemos que los puntos B y C equidistan de A y A'', con lo que BC es la mediatriz de AA''y en la simetría respecto de dicha mediatriz son simétricos T y T'', por lo que son iguales o congruentes. Además, como T'' es igual que T', deducimos de aquí que T y T' coinciden con lo Primer criterio. Dos triángulos son iguales si tienen iguales un lado y los dos ángulos adyacentes. A

A'

T

T'

Figura 7.

A''

C

B

C'

B'

Figura 6. D

T''

D

En efecto, sean los triángulos T = A BC y T '= A ' B 'C ' y supongamos que BC = B 'C ', B$ = B$ ' y C$ = C$ ', con lo que veremos que los triángulos T y T' son iguales. Coloquemos el triángulo T sobre el T', de modo que el lado BC coincida con su igual B'C' y que el punto A caiga en el mismo semiplano que el A' respecto a la recta B'C'. Entonces, el lado AB caerá sobre el A'B', por ser B$ = B$ ' y el lado AC caerá sobre A'C' al ser C$ = C$ ' . Así, el punto A, que está a la vez en los lados A'B' y A'C', ha de caer necesariamente en A', pues A ' B ' Ç A 'C ' = A ' . Por lo tanto, los triángulos T y T' B

C

B'

C'

T

T'

A

A'

D

D

coinciden con lo que A BC = A ' B 'C '. Segundo criterio. Dos triángulos son iguales si tienen respectivamente iguales dos lados y el ángulo comprendido.

quier eje. Sean dos triángulos T = A BC y T '= A ' B 'C ', en los que AB = A ' B ', AC = A 'C ' y BC = B 'C '. Construiremos otro triángulo T'' simétrico de T', con lo que quedará demostrada la igualdad de T y T'. D

D

D

D

En efecto, partimos como antes de dos triángulos T = A BC y T '= A ' B 'C ', en los que A$ = A$ ', AB = A ' B ' y AC = A 'C '. Colocamos el triángulo T sobre el T', de modo que el lado AB coincida con su igual A'B' y que el punto C caiga en el mismo semiplano que el punto C' respecto de AB. El lado AC coincidirá con el A'C' por ser A$ = A ' e igual la longitud de los mismos. Por tanto el lado BC, que tiene el punto B

en B' y el C en C' coincidirá con B'C'. Así, los triángulos T y T' coinciden, con lo que A BC = A ' B 'C '. Tercer criterio. Dos triángulos son iguales si tienen respectivamente iguales sus tres lados. Por las propiedades de la simetría, sabemos que un triángulo es igual que su simétrico respecto a cualD

D

D

D

En efecto, partimos como antes de dos triángulos T = A BC y T '= A ' B 'C ', en los que A$ = A$ ', AB = A ' B ' y AC = A 'C '. Colocamos el triángulo T sobre el T', de modo que el lado AB coincida con su igual A'B' y que el punto C caiga en el mismo semiplano que el punto C' respecto de AB. El lado AC coincidirá con el A'C' por ser A$ = A ' e igual la longitud de los mismos. Por tanto el lado BC, que tiene el punto B

en B' y el C en C' coincidirá con B'C'. Así, los triángulos T y T' coinciden, con lo que A BC = A ' B 'C '. Tercer criterio. Dos triángulos son iguales si tienen respectivamente iguales sus tres lados. Por las propiedades de la simetría, sabemos que un triángulo es igual que su simétrico respecto a cualD

D

D

D

quier eje. Sean dos triángulos T = A BC y T '= A ' B 'C ', en los que AB = A ' B ', AC = A 'C ' y BC = B 'C '. Construiremos otro triángulo T'' simétrico de T', con lo que quedará demostrada la igualdad de T y T'.

coinciden con lo que A BC = A ' B 'C '. Segundo criterio. Dos triángulos son iguales si tienen respectivamente iguales dos lados y el ángulo comprendido. D

D

En efecto, sean los triángulos T = A BC y T '= A ' B 'C ' y supongamos que BC = B 'C ', B$ = B$ ' y C$ = C$ ', con lo que veremos que los triángulos T y T' son iguales. Coloquemos el triángulo T sobre el T', de modo que el lado BC coincida con su igual B'C' y que el punto A caiga en el mismo semiplano que el A' respecto a la recta B'C'. Entonces, el lado AB caerá sobre el A'B', por ser B$ = B$ ' y el lado AC caerá sobre A'C' al ser C$ = C$ ' . Así, el punto A, que está a la vez en los lados A'B' y A'C', ha de caer necesariamente en A', pues A ' B ' Ç A 'C ' = A ' . Por lo tanto, los triángulos T y T' A

A'

T'

T

B'

D

C

T''

C'

D

B

Figura 6. B

C

B'

Figura 7.

T

C' A''

T'

Aplicamos al triángulo T' un movimiento que lleve B 'C ' sobre BC y el semiplano que contiene a A' quede en lado distinto de A (con lo que conseguimos un triángulo T'', simétrico de T', respecto al lado A ' B '). Como AB = A ' B ' = A '' B y AC = A 'C ' = A ''C , tenemos que los puntos B y C equidistan de A y A'', con lo que BC es la mediatriz de AA''y en la simetría respecto de dicha mediatriz son simétricos T y T'', por lo que son iguales o congruentes. Además, como T'' es igual que T', deducimos de aquí que T y T' coinciden con lo A

A'

Primer criterio. Dos triángulos son iguales si tienen iguales un lado y los dos ángulos adyacentes.

282



D

2.6.1. Criterios generales de igualdad

D

que A BC = A ' B 'C '.

Geometría del triángulo Cuarto criterio. Dos triángulos son iguales si tienen respectivamente iguales dos lados y el ángulo opuesto al mayor de ellos. D

D

En efecto, sean dos triángulos T = A BC y T = A ' B 'C ', en los que BC = B 'C ', AB = A ' B ' y C$ = C$ , siendo AB > BC . A

A'

A'' T' T

C

B

C'

B'

Figura 8. Transportando T' sobre T de modo que coincidan B 'C ' con BC y los semiplanos que contienen a A y A', por ser C$ = C$ , coinciden las semirrectas AC y A 'C '. Veamos que A' ha de coincidir con A. Si coincidiese con A'', sería BA '' = B ' A ' = BA. En el triángulo isósceles BCC'', sería A$ = A$ ''> C por ser exterior del triángulo BA''C, y por tanto, BC > BA '' = BA, en contra de lo supuesto. Si A'' fuese exterior a AC, se llega a la consecuencia de que A$ ''> C$ y como el triángulo A'B'C' es igual que A''BC, resulta que A$ ' > C$ ', de donde B 'C ' > B ' A ', que también contradice la hipótesis.

2.6.2. Criterios de igualdad de triángulos rectángulos Los cuatro criterios de igualdad estudiados, aplicados a los triángulos rectángulos, dan los siguientes enunciados: 1. Dos triángulos rectángulos de catetos respectivamente iguales, son iguales. 2. Dos triángulos rectángulos que tienen, respectivamente, iguales un cateto y un ángulo agudo, son iguales. 3. Si un triángulo es rectángulo, otro que tenga los lados respectivamente iguales, también lo es, y es igual que él. 4. Dos triángulos rectángulos que tengan, respectivamente, iguales un cateto y la hipotenusa, son iguales.

2.7. Relaciones entre los lados y los ángulos de un triángulo En un triángulo, las relaciones más importantes que tienen lugar entre sus elementos son: Teorema 3. En todo triángulo un lado es menor que la suma de los otros dos y mayor que su diferencia. D

En efecto, sea el triángulo T = A BC . Para llegar a través del mismo desde el vértice A hasta el vértice C podemos seguir dos caminos distintos: a través del lado b o a través de los lados a y c (a+c). Como sabemos, la distancia más corta entre dos puntos es la longitud del segmento que los une, por lo que bb–c

B

c

a T

b

C

Figura 9.


283


284


Figura 12.

B

Teorema 4. Si un triángulo tiene dos lados iguales, sus ángulos opuestos son también iguales. En efecto, consideremos el triángulo isósceles representado en la figura, cuyos lados iguales son AB y BC. Uniendo B con el punto medio del lado opuesto

A

B

A'

B'

D

D

(M) se forman los triángulos A B M y C B M , que son iguales al ser BM mediatriz del segmento AC, por lo que A$ = C$ . Como consecuencia de este teorema podemos decir que “en un triángulo equilátero, al ser los tres lados iguales, los ángulos también son iguales”.

c

a

C''

C'

D

b

C

M

C

Teorema 7. Si dos triángulos tienen dos pares de lados respectivamente iguales y el ángulo comprendido distinto, los lados opuestos a estos ángulos están en la misma relación de desigualdad. Es decir, si AB = A ' B ', AC = A 'C ' y A$ > A$ ', entonces BC > B 'C '. A

Teorema 5. En todo triángulo, a mayor lado se opone mayor ángulo.

Figura 10.

B

– a = b, con lo que el triángulo será isósceles, y A$ = B$ en contra de la hipótesis. – a < b, con lo que por el teorema anterior, A$ < B$ en contra de la hipótesis. Así, el teorema queda demostrado. b

a

D

La demostración la haremos por reducción al absurdo. Para demostrar que A$ > B$ implica que a > b, supondremos que a no es mayor que b, con lo que se nos pueden dar dos casos: C

A

Figura 11.

Teorema 6. En todo triángulo, a mayor ángulo se opone mayor lado.

D

En el triángulo A BC , consideremos que el lado BC es mayor que el AB. Veremos que A$ > C$ . Para ello, a partir del vértice B y sobre el lado BC, tomamos un segmento BD, de igual medida que AB, con lo D que se forma el triángulo isósceles A B D, en el que, por lo visto, en el teorema anterior a$ = b$ . Por ser exte-

rior al triángulo A DC , el ángulo b es mayor que cualquiera de los dos interiores no adyacentes, por lo que $ Además, tal y como se deduce de la propia construcción A$ > a. $ Combinando adecuadamente las b$ > C. desigualdades y la igualdad anterior, tenemos ü ü A$ > b$ ï a$ = b$ ï ý Þ A$ >C$ ý Þ A$ > a$ ; Así ï ï A$ > a$ þ b$ >C$ þ D

rior al triángulo A DC , el ángulo b es mayor que cualquiera de los dos interiores no adyacentes, por lo que $ Además, tal y como se deduce de la propia construcción A$ > a. $ Combinando adecuadamente las b$ > C. desigualdades y la igualdad anterior, tenemos A$ > b$ ü a$ = b$ ü ï $ $ ï $ ý Þ A>C ý Þ A > a$ ; Así $ A$ > a$ ï b >C$ ï þ þ D

En el triángulo A BC , consideremos que el lado BC es mayor que el AB. Veremos que A$ > C$ . Para ello, a partir del vértice B y sobre el lado BC, tomamos un segmento BD, de igual medida que AB, con lo D que se forma el triángulo isósceles A B D, en el que, por lo visto, en el teorema anterior a$ = b$ . Por ser exteD

Teorema 6. En todo triángulo, a mayor ángulo se opone mayor lado.

A

C

Figura 11.

La demostración la haremos por reducción al absurdo. Para demostrar que A$ > B$ implica que a > b, supondremos que a no es mayor que b, con lo que se nos pueden dar dos casos: – a = b, con lo que el triángulo será isósceles, y A$ = B$ en contra de la hipótesis.

a

D

b

a < b, con lo que por el teorema anterior, A$ < B$ en contra de la hipótesis. Así, el teorema queda demostrado.

–

Teorema 7. Si dos triángulos tienen dos pares de lados respectivamente iguales y el ángulo comprendido distinto, los lados opuestos a estos ángulos están en la misma relación de desigualdad. Es decir, si AB = A ' B ', AC = A 'C ' y A$ > A$ ', entonces BC > B 'C '. B

Figura 10.

Teorema 5. En todo triángulo, a mayor lado se opone mayor ángulo.

A

M

C

(M) se forman los triángulos A B M y C B M , que son iguales al ser BM mediatriz del segmento AC, por lo que A$ = C$ . Como consecuencia de este teorema podemos decir que “en un triángulo equilátero, al ser los tres lados iguales, los ángulos también son iguales”.

C

b

D

C''

C'

D

Teorema 4. Si un triángulo tiene dos lados iguales, sus ángulos opuestos son también iguales. En efecto, consideremos el triángulo isósceles representado en la figura, cuyos lados iguales son AB y BC. Uniendo B con el punto medio del lado opuesto B

A'

B'

Figura 12.



a B 284

D

c A

Geometría del triángulo D

D

En efecto, transportando A ' B 'C ' sobre A BC de modo que coincidan AB y A ' B ' y los semiplanos que D D contienen a C y a C', obtenemos A BC '', igual que A ' B 'C '. Por ser A$ > A$ '= ang (C '' AB ), la semirrecta AC'' es interior al ángulo A y la bisectriz del ángulo CAC'' corta al lado BC en un punto D tal que DC = DC ''. D

Entonces AC = AC ''. Además, en el triángulo B DC '' es BC '' < BD + DC '' = BC (ya que DC ''= DC ), luego B 'C ' = BC '' < BC . Teorema 8. Si dos triángulos tienen dos pares de lados respectivamente iguales y el tercer lado distinto, los ángulos opuestos a estos lados están en la misma razón de desigualdad, es decir, si AB = A ' B ', AC = A 'C ' y BC > B 'C ', entonces A$ > A$ '. El teorema se demuestra por reducción al absurdo.

2.8. Construcción de triángulos 2.8.1. Casos particulares –

Triángulo equilátero: con regla y compás, con escuadra y cartabón, sobre la circunferencia o con el plegado son las formas más frecuentes de construirlos.

–

Triángulo isósceles: con regla y compás, pinchando en los dos extremos del lado desigual y con igual abertura, trazamos dos arcos de circunferencia y donde se corten se encontrará el tercer vértice. Otra forma es trazar la mediatriz del lado desigual y cualquier punto de la mediatriz, unido con los extremos del lado desigual, forman un triángulo isósceles.

–

Triángulo rectángulo: con la escuadra y el cartabón se construyen los lados del ángulo recto y llevando la medida de los catetos se delimitan los dos vértices restantes.

2.8.2. Construcción en general La construcción de un triángulo se puede realizar conociendo los tres lados, conociendo dos lados y un ángulo y conociendo dos ángulos y un lado. Conocidos los tres lados. 1. Con la regla se traza uno de los segmentos dados. 2. Con el compás medimos otro de los segmentos dados y, pinchando en uno de los extremos del segmento trazado, se dibuja un arco de circunferencia. 3. Con el compás medimos el otro segmento y trazamos un arco de circunferencia tomando como centro el otro extremo del segmento. 4. Los dos arcos de circunferencia se cortan en un punto que es el tercer vértice del triángulo. 5. Se une ese punto con los extremos del primer segmento y queda construido el triángulo. Conocidos dos lados y un ángulo. 1. Con la regla se traza uno de los segmentos dados. 2. Se traza el ángulo dado, tomando como uno de sus lados el dibujado con la regla. 3. Con el compás, pinchando en el vértice del ángulo, se señala en el lado recién trazado la medida del otro segmento conocido, obteniendo así el tercer vértice del triángulo. 4. Se une el vértice hallado, con el otro extremo, obteniéndose el triángulo.


285


286


Conocidos dos ángulos y un lado. 1. Se traza el segmento dado. 2. Tomando como vértice un extremo del segmento se traza un ángulo que tenga como lado el segmento dado. 3. Se traza el otro ángulo tomando como vértice el otro extremo del segmento y como lado el segmento dado. 4. Prolongando los lados de los ángulos construidos se cortan en un punto que es el tercer vértice.

Teorema 10. La bisectriz de un ángulo de un triángulo es el lugar geométrico de los puntos del plano que equidistan de los lados del ángulo. Como en el teorema anterior, haremos la demostración en dos partes. Trazando desde P la perpendicular a la recta AC, obtendremos los triángulos A M P y C M P, que son iguales al tener ambos un ángulo recto, PA = PC y el cateto PM común. Por lo tanto, AM = MC , lo que implica que M es el punto medio del lado AC, estando así P en la mediatriz de AC. D

2.

D

Sea ahora P un punto que equidista de A y C, es decir AP = CP. Comprobaremos que P pertenece a la mediatriz DM, correspondiente al lado AC.

3. PUNTOS Y RECTAS NOTABLES DEL TRIÁNGULO

En el apartado anterior hemos definido las rectas notables de un triángulo y en éste nos centraremos en propiedades de las mismas, así como puntos y figuras generadas por ellas.

A M P y C M P. Así, al tener los dos triángulos rectángulos A M P y C M P los dos catetos iguales, se verifica que ambos son iguales, de donde deducimos que los lados AP y CP son iguales. D

D

D

D

A MP y C M P son triángulos rectángulos en M por ser la mediatriz perpendicular a AC. Se verifica por otro lado que AM = MC , pues M es el punto medio de AC y PM es lado común de los triángulos

3.1. Teoremas relativos a mediatrices y bisectrices como lugares geométricos 1.

D

D

Si P es un punto que pertenece a la mediatriz DM, hemos de comprobar que AP = CP. Los triángulos

Teorema 9. La mediatriz correspondiente a un lado de un triángulo es el lugar geométrico de los puntos del plano que equidistan de los vértices de dicho lado.

En efecto, sea el triángulo A BC y sea DM la mediatriz correspondiente al lado AC. Dividiremos la demostración en dos partes: 1. Todo punto perteneciente a la mediatriz DM equidista de A y C. 2. Todo punto del plano que equidista de A y C, pertenece a la mediatriz DM.

B

D

D

M

A

C

Figura 13.

A

C

M

Figura 13.

D

En efecto, sea el triángulo A BC y sea DM la mediatriz correspondiente al lado AC. Dividiremos la demostración en dos partes: 1. Todo punto perteneciente a la mediatriz DM equidista de A y C. 2. Todo punto del plano que equidista de A y C, pertenece a la mediatriz DM.

D

B

Teorema 9. La mediatriz correspondiente a un lado de un triángulo es el lugar geométrico de los puntos del plano que equidistan de los vértices de dicho lado. 1.

Si P es un punto que pertenece a la mediatriz DM, hemos de comprobar que AP = CP. Los triángulos D

D

3.1. Teoremas relativos a mediatrices y bisectrices como lugares geométricos

A MP y C M P son triángulos rectángulos en M por ser la mediatriz perpendicular a AC. Se verifica por otro lado que AM = MC , pues M es el punto medio de AC y PM es lado común de los triángulos D

D

D

D

A M P y C M P. Así, al tener los dos triángulos rectángulos A M P y C M P los dos catetos iguales, se verifica que ambos son iguales, de donde deducimos que los lados AP y CP son iguales.

En el apartado anterior hemos definido las rectas notables de un triángulo y en éste nos centraremos en propiedades de las mismas, así como puntos y figuras generadas por ellas.

Sea ahora P un punto que equidista de A y C, es decir AP = CP. Comprobaremos que P pertenece a la mediatriz DM, correspondiente al lado AC.

3. PUNTOS Y RECTAS NOTABLES DEL TRIÁNGULO

2.

D

D

Trazando desde P la perpendicular a la recta AC, obtendremos los triángulos A M P y C M P, que son iguales al tener ambos un ángulo recto, PA = PC y el cateto PM común. Por lo tanto, AM = MC , lo que implica que M es el punto medio del lado AC, estando así P en la mediatriz de AC. 4.

Conocidos dos ángulos y un lado. 1. Se traza el segmento dado. 2. Tomando como vértice un extremo del segmento se traza un ángulo que tenga como lado el segmento dado. 3. Se traza el otro ángulo tomando como vértice el otro extremo del segmento y como lado el segmento dado. Prolongando los lados de los ángulos construidos se cortan en un punto que es el tercer vértice.

Teorema 10. La bisectriz de un ángulo de un triángulo es el lugar geométrico de los puntos del plano que equidistan de los lados del ángulo. Como en el teorema anterior, haremos la demostración en dos partes.



286

Geometría del triángulo

B E F

A

Figura 14.

C

D

1.

$ veremos que equidista de los lados AB y BC, es decir, Si D es un punto de la bisectriz del ángulo B,

2.

DE = DF . Para ello construimos los triángulos rectángulos D E B y D F B, que son iguales al tener el $ Así, lado BD común y ang (EBD = ang (FBD) (al ser cada uno de ellos la mitad del ángulo B). DE = DF . $ Si D equidista de los lados AB y CB, es decir, DE = DF , entonces D pertenece a la bisectriz del ángulo B.

D

D

D

D

Si unimos B con D obtenemos los triángulos rectángulos D E B y D F B, que son iguales, pues DE = DF por hipótesis y BD es común a ambos, por lo que ang ( EBD ) = ang ( FBD ), siendo así BD $ perteneciendo D a la misma. la bisectriz del ángulo B,

3.2. Puntos notables de un triángulo Proposición 1. Las mediatrices de un triángulo concurren en un punto que llamamos circuncentro que equidista de los tres vértices, siendo el centro de la circunferencia circunscrita al triángulo. B

En efecto, las mediatrices m y n pertenecientes a los lados AC y AB se cortan (tienen distinta dirección) por ser perpendiculares a rectas que tienen distinta dirección (se cortan). Si O = m Ç n, por pertenecer a m equidista de A y C y por pertenecer a n equidista de A y B, por lo que equidista de B y C, perteneciendo a p (mediatriz del lado BC). Así, O = m Ç n Ç p, es decir, las tres mediatrices se cortan A en un punto que equidista de los tres vértices.

n

p O C

m

Figura 15. Proposición 2. El segmento que une los puntos medios de dos lados de un triángulo es paralelo al tercer lado y tiene de longitud la mitad de éste. D

En efecto, dado el triángulo A BC , sean D y E los puntos medios de los lados AB y BC. Tracemos por D la recta rD paralela al lado AC, que cortará al lado BC en el punto E'. Aplicando el

B

D

teorema fundamental de la semejanza a los triángulos A BC y D

B D E ', tendremos: DB BE ' DE ' BE ' DB y de aquí = = = A AB BC AC BC AB y teniendo en cuenta que D es el punto medio de AB, tendremos BE ' DB 1 = = , lo que nos dice que E' es el punto medio del BC AB 2 lado BC, por lo que coincide con E.


D

E = E'

C

Figura 16.

287


288


iguales, además de tener un lado común. Observamos que los triángulos AC M y C ' B M también tienen

Proposición 3. Las medianas de un triángulo se cortan en un punto G llamado Baricentro, que dista de cada vértice los dos tercios de la mediana correspondiente. D

D

A'B', con lo que se demostraría que ambas medianas coinciden. Para ello veremos que A BC = BCC ', cosa cierta, ya que por construcción son iguales al tener sus lados paralelos, lo que implica que sus ángulos son D

C

D

D

En efecto, sea el triángulo A BC y consideremos la mediana AF, trazada desde el vértice A. Una segunda mediana, la BD, correspondiente al vértice B corta a AF, por estar B y D en distinto semiplano respecto de la recta AF en el punto G.

Demostraremos que M es el punto medio del lado BC, ya que según se ha visto A es el punto medio de Figura 18.

A'

D

F

D

G A

En el triángulo G A B el segmento EH que une los puntos medios de los lados GA y GB es paralelo a AB e igual a su mitad (proposición anterior), es decir:

E

H

A

B

C

EH || AB y AB = 2×EH M

Figura 17. B'

C'

D

B

De modo análogo, en el triángulo A BC , DF es paralelo a AB e igual a su mitad, es decir:

Veremos que la mediana de A ' B 'C ', trazada por ejemplo desde C', coincide con la mediana de A BC , trazada desde A. DF || AB y AB = 2×DF

D

D

En efecto, dado el triángulo A BC y su asociado A ' B 'C ', demostraremos que sus medianas coinciden.

De lo anterior deducimos que DF y EH son paralelos y tienen la misma longitud, lo que implica que D

Proposición 4. Un triángulo y su asociado tienen el mismo baricentro.

D

D

D

los triángulos DG F y H G E son iguales. Por lo tanto GF = GE

GA 2 Þ GA = AF 2 3

GD = GH

GB 2 Þ GB = BD 2 3

Definición 2. Dado el triángulo A BC , llamaremos triángulo asociado A ' B 'C ' al que obtenemos trazando por cada vértice una paralela al lado opuesto. D

D

dos paralelos a los de A BC y la longitud de los mismos es la mitad que la de los lados de A BC . D

D

uniendo los puntos medios de los lados de A BC . Ya hemos comprobado que dicho triángulo tiene los la-

2 La tercera mediana, por razones análogas, cortará a BD en un punto que distará de B, de BD, lo que im3 plica que se trata del mismo punto G, común a las tres medianas. Dicho punto G recibe el nombre de Baricentro. D

Definición 1. Dado el triángulo A BC , llamaremos triángulo mediano de A BC al que se obtiene D

D

GB 2 GD = GH Þ GB = BD 2 3 2 La tercera mediana, por razones análogas, cortará a BD en un punto que distará de B, de BD, lo que im3 plica que se trata del mismo punto G, común a las tres medianas. Dicho punto G recibe el nombre de Baricentro. D

D

Definición 1. Dado el triángulo A BC , llamaremos triángulo mediano de A BC al que se obtiene D

uniendo los puntos medios de los lados de A BC . Ya hemos comprobado que dicho triángulo tiene los laD

D

dos paralelos a los de A BC y la longitud de los mismos es la mitad que la de los lados de A BC . D

D

Definición 2. Dado el triángulo A BC , llamaremos triángulo asociado A ' B 'C ' al que obtenemos trazando por cada vértice una paralela al lado opuesto. GF = GE

GA 2 Þ GA = AF 2 3

los triángulos DG F y H G E son iguales. Por lo tanto D

D

D

D

Proposición 4. Un triángulo y su asociado tienen el mismo baricentro.

De lo anterior deducimos que DF y EH son paralelos y tienen la misma longitud, lo que implica que

En efecto, dado el triángulo A BC y su asociado A ' B 'C ', demostraremos que sus medianas coinciden. D

DF || AB y AB = 2×DF

D

Veremos que la mediana de A ' B 'C ', trazada por ejemplo desde C', coincide con la mediana de A BC , trazada desde A. De modo análogo, en el triángulo A BC , DF es paralelo a AB e igual a su mitad, es decir: D

B

B'

C'

EH || AB y AB = 2×EH

Figura 17.

M

En el triángulo G A B el segmento EH que une los puntos medios de los lados GA y GB es paralelo a AB e igual a su mitad (proposición anterior), es decir:

A A

C

B E

H G

D

En efecto, sea el triángulo A BC y consideremos la mediana AF, trazada desde el vértice A. Una segunda mediana, la BD, correspondiente al vértice B corta a AF, por estar B y D en distinto semiplano respecto de la recta AF en el punto G. Figura 18.

D

F

A'

Demostraremos que M es el punto medio del lado BC, ya que según se ha visto A es el punto medio de D

D

C

A'B', con lo que se demostraría que ambas medianas coinciden. Para ello veremos que A BC = BCC ', cosa cierta, ya que por construcción son iguales al tener sus lados paralelos, lo que implica que sus ángulos son D

Proposición 3. Las medianas de un triángulo se cortan en un punto G llamado Baricentro, que dista de cada vértice los dos tercios de la mediana correspondiente. D

D

iguales, además de tener un lado común. Observamos que los triángulos AC M y C ' B M también tienen CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


288

Geometría del triángulo D

D

sus lados paralelos, por lo que sus ángulos son iguales y, además, BC '= AC , ya que A BC = BC C '. Así, por ser iguales los triángulos, BM = MC , por lo que M es el punto medio de BC. Por tanto, si coinciden las medianas de un triángulo con las de su asociado, se cortarán en el mismo punto, con lo que ambos triángulos tienen el mismo baricentro. Proposición 5. Las rectas que contienen a las alturas de un triángulo se cortan en un punto llamado ortocentro. D

D

En efecto, consideremos la figura anterior, en la que aparece el triángulo A BC y su asociado A ' B 'C '. D

D

Por lo ya visto, el triángulo asociado A ' B 'C ' tiene los lados paralelos a los de A BC y dobles de los de éste. D

En consecuencia, las rectas que contienen a las alturas del triángulo A BC son las mediatrices del triángulo D

A ' B 'C ' y, por tanto, concurren en un punto al que llamaremos ortocentro. Proposición 6. Las bisectrices interiores de un triángulo se cortan en un punto llamado incentro, que equidista de sus tres lados. B En efecto, si consideramos las bisectrices de los ángulos A$ y B$ , que llamamos m y n, ambas rectas han de cortarse por forn I mar con la secante común AB ángulos cuya suma es menor que un ángulo llano. El punto de intersección I equidista de las rectas m p de los tres lados por pertenecer a una y otra bisectriz. A este punto I lo llamamos incentro y es el centro de la única circunferencia A C interior y tangente a los tres lados, a la que se llama circunferenFigura 19. cia inscrita al triángulo. Definición 3. Una circunferencia no inscrita, tangente a los tres lados de un triángulo, se llama circunferencia exinscrita y su centro exincentro. En una circunferencia exinscrita (hay 3), el centro es el punto de corte de una bisectriz interior y dos bisectrices exteriores. D

Definición 4. Dado un triángulo acutángulo A BC , el triángulo que tiene como vértices los pies de las tres alturas del mismo se llama triángulo órtico.

D

Proposición 7. Las alturas de todo triángulo acutángulo A BC son las bisectrices interiores de su triángulo órtico. A Demostraremos, por ejemplo, que b = b'. Hc y Hb son vértices de ángulos rectos cuyos lados pasan por B y C, luego los cuatro puntos B, Hc, Hb y C están en una cirHc cunferencia, siendo iguales los ángulos inscritos que Hb abarcan el mismo arco. Así, a = a'. Análogamente, por ser restos los ángulos CHbO y OHaC, los cuatro puntos O C, Hb, O y Ha están en otra circunferencia, verificándose por la misma razón anterior que a = b. De la misma mab b' a nera se prueba que a' = b', de donde resulta que b = b'. a' De ello se deduce que los lados de un triángulo acutángulo son las bisectrices exteriores de su triángulo órtico C Ha y que los vértices de un triángulo son los exincentros de B Figura 20. su triángulo órtico. Si el triángulo es obtusángulo, se demuestra de forma análoga que las alturas son una bisectriz interior y dos exteriores y los lados son las bisectrices restantes del triángulo órtico. Si el triángulo es rectángulo no existe triángulo órtico.


289


290


AC × AC = ( AB + BC ) × ( AB + BC ) D

Proposición 8. La circunferencia circunscrita a un triángulo A BC contiene los puntos de intersección de cada lado con las bisectrices que pasan por el vértice opuesto. Figura 23.

Si multiplicamos escalarmente la expresión (1) por sí O –i misma, tendremos G'

c

B

Sabemos que (1) y expresando estos AC = AB + BC vectores como diferencias der losr vectoresr derposición de r r sus extremos, tendremos AC = c – a , AB = b – a y BC = c – b A

del triángulo A BC .

– j

En efecto, por los puntos medios G'c y Gc de los arcos de dicha circunferencia de extremos A y B pasan, a la vez, el diámetro perpendicular a AB (mediatriz de AB) y las bisectrices interior (ya que ésta divide al ángulo inscrito ang(ACB) en dos iguales, por lo que pasa por el centro del arco AB, es decir, por G'c) y exterior (al ser la de un ángulo no inscrito, suma de los inscritos A$ y B$ , por lo que divide el $ arco AB en dos partes iguales pasando así por Gc) del ángulo C.

D

Demostración 2. La demostración la haremos basándonos en las propiedades del plano afín euclídeo. Para ello suD $ pondremos el triángulo A BC , rectángulor en r B, representado en el sistema de referencia afín R = {O , i , j} del plano. Sean r r r a, b y c los vectores de posición de los puntos A, B y C, vértices

–c

– b

–a

C

b

A

a

c

B

Definición 5. El baricentro de un triángulo está alineado con el ortocentro y el circuncentro y a doble distancia del primero que del segundo (Teorema de Euler). La recta que contiene estos tres puntos se llama recta de Euler.

C

Gc

m n construcción en D y además semejantes al A BC , ya que tienen con él un lado y un ángulo común además del recto (el triángulo A D b D D A D B el lado AB y el ángulo A$ y el triángulo C DB el lado BC y el Figura 22. $ ángulo C). Así, por ser semejantes: D D ü b c A B D ~ A BC Û = Þ c2 = b × mï ï c m ý Þ a 2 + c2 = b × ( m+ n ) ¾ ¾¾¾¾ ¾® b 2 = a 2 + c 2 D D b a m + n =b ï = = a2 = b × n ï þ a n

C D B ~ A BC Û Figura 21.

4. PROPIEDADES MÉTRICAS EN EL TRIÁNGULO 4.1. Teorema de Pitágoras

Teorema 11. En un triángulo rectángulo, el cuadrado de la hipotenusa coincide con la suma de los cuadrados de los catetos. Existen varias formas de demostrar el teorema de Pitágoras, B de las que expondremos dos.

C

D

en el punto D. Los triángulos A D B y C DB son rectángulos por D

D

$ Demostración 1. Sea el triángulo A BC rectángulo en B. Trazamos desde B la altura (perpendicular a AC), que corta a AC D

$ Demostración 1. Sea el triángulo A BC rectángulo en B. Trazamos desde B la altura (perpendicular a AC), que corta a AC

c

D

c

a

D

D

a

Teorema 11. En un triángulo rectángulo, el cuadrado de la hipotenusa coincide con la suma de los cuadrados de los catetos. Existen varias formas de demostrar el teorema de Pitágoras, B de las que expondremos dos. en el punto D. Los triángulos A D B y C DB son rectángulos por D

m n construcción en D y además semejantes al A BC , ya que tienen con él un lado y un ángulo común además del recto (el triángulo A D b D D A D B el lado AB y el ángulo A$ y el triángulo C DB el lado BC y el Figura 22. $ Así, por ser semejantes: ángulo C). D D ü b c A B D ~ A BC Û = Þ c2 = b × mï ï c m ý Þ a 2 + c2 = b × ( m+ n ) ¾ ¾¾¾¾ ¾® b 2 = a 2 + c 2 D D b a m + n = b ï C D B ~ A BC Û = = a 2 = b × n ï þ a n

C

4.1. Teorema de Pitágoras

4. PROPIEDADES MÉTRICAS EN EL TRIÁNGULO

Figura 21.

Definición 5. El baricentro de un triángulo está alineado con el ortocentro y el circuncentro y a doble distancia del primero que del segundo (Teorema de Euler). La recta que contiene estos tres puntos se llama recta de Euler.

Gc

C

Demostración 2. La demostración la haremos basándonos en las propiedades del plano afín euclídeo. Para ello suD $ pondremos el triángulo A BC , rectángulor en r B, representado en el sistema de referencia afín R = {O , i , j} del plano. Sean r r r a, b y c los vectores de posición de los puntos A, B y C, vértices

En efecto, por los puntos medios G'c y Gc de los arcos de dicha circunferencia de extremos A y B pasan, a la vez, el diámetro perpendicular a AB (mediatriz de AB) y las bisectrices interior (ya que ésta divide al ángulo inscrito ang(ACB) en dos iguales, por lo que pasa por el centro del arco AB, es decir, por G'c) y exterior (al ser la de un ángulo no inscrito, suma de los inscritos A$ y B$ , por lo que divide el $ arco AB en dos partes iguales pasando así por Gc) del ángulo C.

D

del triángulo A BC .

B

A

Sabemos que AC = AB + BC (1) y expresando estos vectores como diferencias der losr vectoresr derposición de r r sus extremos, tendremos AC = c – a , AB = b – a y BC = c – b

c

a

A

–a

– j

G'

c

B

Si multiplicamos escalarmente la expresión (1) por sí O –i misma, tendremos

– b

b

–c

C

Proposición 8. La circunferencia circunscrita a un triángulo A BC contiene los puntos de intersección de cada lado con las bisectrices que pasan por el vértice opuesto. AC × AC = ( AB + BC ) × ( AB + BC )

Figura 23.

D



290

Geometría del triángulo de donde AC 2 = AB 2 + BC 2, pues AB × AC = 0 al ser perpendiculares, por lo que tendremo b2 = c 2 +a 2.

4.2. Interpretación geométrica del teorema de Pitágoras El área del cuadrado construido sobre la hipotenusa de un triángulo rectángulo es equivalente a la suma de las áreas de los cuadrados construidos sobre los catetos. D

$ Sobre él construimos los cuadrados M, P y Q, soEn efecto sea el triángulo, A BC , rectángulo en A. bre la hipotenusa y los catetos, respectivamente. Probaremos que el área de M es la suma de las áreas de P y Q. Tracemos la altura relativa al vértice A (AD) y la prolongamos hasta que corte al cuadrado M en F. Esta perpendicular divide al cuadrado M en dos rectángulos: R y S. Tracemos también los segmentos AE y BH (observar la figura). D

J

K I

Q A

D

n C

D

cie del triángulo AC E es la mitad de la del rectángulo R, ya que ambos tienen por base CE y por altura CD. De la misma manera, la superficie del triángulo H C B es la mitad de la del cuadrado P, ya que la base de ambos es CH y la altura AC. Así, el rectángulo R y el cuadrado P tienen la mis-

P H

D

Los triángulos AC E y H C B son iguales, pues tienen iguales dos lados (CA = CH y CE = CB) y el ángulo comprendido (C$ = 90+ n$ ). Por otro lado, la superfi-

B

D

D

ma superficie, pues sus mitades, los triángulos AC E y D

R

H C B son iguales. Análogamente se prueba que la superficie del rectángulo S es la misma que la del cuadrado Q. Así:

S M

área = (R + S) = área M = área P + área Q E

F

G

Figura 24.

4.3. Consecuencias del teorema de Pitágoras Como consecuencias del teorema de Pitágoras enumeraremos algunos teoremas que nos dan relaciones métricas en triángulos rectángulos. Teorema 12. Teorema del cateto. En todo triángulo rectángulo, un cateto es media proporcional entre la hipotenusa y su proyección sobre ella. D

En la primera demostración del teorema de Pitágoras (Teorema 11), dado el triángulo A BC rectán$ obtuvimos gulo en B, c = b × mü c2 = b × mü ï ï ý de donde ý 2 ï a = b × nþ ï a= b×nþ con lo que queda demostrado el teorema.


291


292


Teorema 13. Teorema de la altura. En todo triángulo rectángulo la altura relativa a la hipotenusa es media proporcional entre los dos segmentos en que divide a ésta. En efecto, como observamos en la figura, si trazamos la al-

B

En el triángulo B DA también se verifica h 2 = c2 – n2 Si sustituimos y operamos, tendremos a2 = (b – n)2 + c2 – n2 = b2 + c2 –2bn c

a

h

D

tura relativa al vértice B, se forman los triángulos A D B y C D B, que son semejantes por tener los mismos ángulos, uno recto y los otros dos formados por lados perpendiculares, es decir: A ì ADB $ = CDB $ por rectos. ï ï $ $ ü íDAB = DBC ï ý por lados perpendiculares. ï $ = DCB $ ï ï ABD þ î

m

n

D

D

D

C

b

a 2 = m2 + h 2 = ( b – n )2 + h 2

Figura 25.

$ Sean los dos posibles triángulos de la El teorema lo demostraremos tomando como ángulo agudo A. D figura, en los que tendremos en el triángulo B DC Figura 26.

Por lo tanto sus lados son proporcionales, con lo que m h = Þ h2 = m× n Þ h = m× n h n

b

C

D

A

m

D

n

C

A

b

m

n

a

Teorema 14. Producto de los catetos. En todo triángulo rectángulo el producto de los catetos es igual al producto de la hipotenusa por su altura. h

a

h

c

c

D

En efecto, consideremos el triángulo A BC rectángulo en B$ (figura anterior). Como se ha visto en la D

B

D

B

demostración 1 del teorema de Pitágoras, los triángulos C D B y A BC son semejantes, por lo que sus lados serán proporcionales. Así:

Teorema 15. En todo triángulo el cuadrado del lado opuesto a un ángulo agudo es igual a la suma de los cuadrados de los otros dos lados, menos el doble de uno de ellos por la proyección del otro sobre él. AB BD = Û AB × BC = AC × BD Û c × a = b × h AC BC

4.4. Relaciones métricas en un triángulo cualquiera

4.4. Relaciones métricas en un triángulo cualquiera

AB BD = Û AB × BC = AC × BD Û c × a = b × h AC BC

Teorema 15. En todo triángulo el cuadrado del lado opuesto a un ángulo agudo es igual a la suma de los cuadrados de los otros dos lados, menos el doble de uno de ellos por la proyección del otro sobre él.

demostración 1 del teorema de Pitágoras, los triángulos C D B y A BC son semejantes, por lo que sus lados serán proporcionales. Así: B

D

B

D

En efecto, consideremos el triángulo A BC rectángulo en B$ (figura anterior). Como se ha visto en la D

a

c

Teorema 14. Producto de los catetos. En todo triángulo rectángulo el producto de los catetos es igual al producto de la hipotenusa por su altura. h

m

n

a

m

b

Por lo tanto sus lados son proporcionales, con lo que m h = Þ h2 = m× n Þ h = m× n h n

C

c

h

b

D

A

D

C

n

A

Figura 26.

ì ADB $ = CDB $ por rectos. ï ï ü $ ï í $ = DAB DBC ý por lados perpendiculares. ï $ $ ï ï î ABD = DCBþ

$ Sean los dos posibles triángulos de la El teorema lo demostraremos tomando como ángulo agudo A. D figura, en los que tendremos en el triángulo B DC Figura 25.

a 2 = m2 + h 2 = ( b – n )2 + h 2

tura relativa al vértice B, se forman los triángulos A D B y C D B, que son semejantes por tener los mismos ángulos, uno recto y los otros dos formados por lados perpendiculares, es decir: A

D

b D

m

C n

En el triángulo B DA también se verifica

h 2 = c2 – n2 D

h

D

Teorema 13. Teorema de la altura. En todo triángulo rectángulo la altura relativa a la hipotenusa es media proporcional entre los dos segmentos en que divide a ésta. En efecto, como observamos en la figura, si trazamos la al-

c

a

Si sustituimos y operamos, tendremos a2 = (b – n)2 + c2 – n2 = b2 + c2 –2bn



B

292

Geometría del triángulo Teorema 16. En todo triángulo obtusángulo el cuadrado del lado opuesto al ángulo obtuso es igual a la suma de los cuadrados de los otros dos lados más el doble de uno de ellos por la proyección del otro sobre él.

B a

D

D

h

c

$ Si trazaEn efecto, sea el triángulo A BC de ángulo obtuso A. mos la altura respecto al lado AC ( BD ), obtenemos dos triángulos

b

D

rectángulos en D$ ( BC D y B A D ), en el que se verifican (ver figura) C las igualdades: a 2 = m2 + h 2

n D

A

m

Figura 27.

m = b + n Þ m = ( b+ n ) = b + n + 2bn 2

2

2

2

h 2= c2 – n 2 Sustituyendo en la primera las otras dos, tendremos a2 = b2 + n2 + 2bn + c2 – n2 = b2 + c2 2bn Con lo visto en los dos teoremas anteriores, dadas las medidas de los tres lados de un triángulo, podemos reconocer si es rectángulo, acutángulo u obtusángulo sin construirlo, comprobando si el cuadrado del lado mayor es menor, igual o mayor que la suma de los cuadrados de los otros dos.

Teorema 17. La suma de los cuadrados de los lados de un triángulo es igual al doble del cuadrado de la mediana relativa al tercer lado más la mitad del cuadrado del tercer lado. En efecto, sea el triángulo de la figura 28, donde suponemos que b > c, y hemos dibujado la altura ( AH ) y la mediana ( AM ) del a lado BC. Sabemos que MB = MC = y llamamos n = MH , pro2 D yección de m sobre a. En el triángulo A M C , obtuso en M$ , podemos C 2 aplicar el teorema anterior, teniendo b 2 = m2 + CM + 2 × CM × m a y como CM = , quedará a2 2 (1) b 2 = m2 + + a × n 4

A

b

c m n

a

M

H

B

Figura 28.

D

$ teniendo De la misma forma, aplicamos el teorema anterior al triángulo A M B, agudo en B, a2 – a×n 4 Si sumamos las expresiones (1) y (2), obtenemos c2 = m2 +

(2)

a2 2 Esta fórmula tiene la particularidad de que si nos dan las longitudes de los tres lados de un triángulo podemos calcular las longitudes de las tres medianas. b 2 + c2 = 2× m2 +

Teorema 18. La diferencia de los cuadrados de dos lados de un triángulo es igual al doble del tercer lado por la proyección sobre él de la mediana que le corresponde. En efecto, si a la expresión (1) del apartado anterior le restamos la expresión (2), tendremos b 2 – c2 = 2 × a × n Con esta fórmula y la anterior podemos calcular las longitudes de las alturas a partir de las longitudes de los lados aplicando el teorema de Pitágoras en el triángulo de la figura al conocer m y n. TEMARIO DE MATEMÁTICAS. PRUEBA A

293


294

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA D

Teorema 19. Teorema de Stewart. Dado un triángulo A BC y un punto N, perteneciente al lado AB, se verifica: 2

( a 2 + b 2 – c 2 )2 4 a 2b 2 – ( a 2 + b 2 – c2 )2 = = h =b – 4a2 4a2 ( 2ab )2 – ( a 2 + b 2 – c2 )2 = 4a2 2

BN × CA + NA × CB + AB × CN + BN × NA × AB = 0

2

2

Figura 30.

En efecto, tomamos un punto cualquiera N sobre el lado AB y llamamos c1= BN y c2= NA. Aplicando a 2 + b 2 – c2 2a Si sustituimos esta expresión de m en (1), tendremos:

a

H

D

D

los teorema 15 y 16 respectivamente a los triángulos AC N y B N C , tendremos:

c2 = a 2 + b 2 – 2am Þ m =

C

B

m

C

$ tenemos: En el triángulo A BC , agudo en C,

h

D

c

b

llamemos m = HC . En el triángulo rectángulo A H C , tenemos que h2 = b2 – m2 (1). a

b

h

n

D

En efecto, sea AH = h la altura que queremos calcular y

A

c

c

1

2

gulo A BC , si llamamos p al semiperímetro, es decir 2p = a +b + c, la altura correspondiente al vértice A 2 es ha = p ( p – a )( p – b )( p – c ). a B

N

A

H

c

Figura 29.

D

Teorema 20. Cálculo de las alturas de un triángulo A B C en función de sus lados. Dado un triánD

2 2 ü ü b 2 = c2 + n 2 – 2c2 × NH ï c1b 2 = c1c2 + c1n 2 – 2c1c2 × NH ï ýÞ ýÞ 2 2 ï ï a 2 = c1 + n 2 + 2c1 × NH þ c2a 2 = c2c1 + c2n 2 + 2c1c2 × NH þ

BN ×CA + NA×CB + AB×CN + BN ×NA× AB= 0 2

2

2

Þ c1b 2 + c2a 2 = c1 c2 + c2 c1+ c1n 2+ c2n 2 = c1c2 ( c1+ c2 ) + n 2 ( c1+ c2 ) Þ 2

2

Si atribuimos signos a los segmentos sobre la recta AB y designamos por AB la medida del lado AB con signo, la igualdad anterior se convierte en Þ c1b 2 + c2a 2 = ( c1c2 + n 2 ) × c

ya que c = c1+ c2

Þ c1b 2 + c2a 2 = ( c1c2 + n 2 ) × c

ya que c = c1+ c2

Si atribuimos signos a los segmentos sobre la recta AB y designamos por AB la medida del lado AB con signo, la igualdad anterior se convierte en Þ c1b 2 + c2a 2 = c1 c2 + c2 c1+ c1n 2+ c2n 2 = c1c2 ( c1+ c2 ) + n 2 ( c1+ c2 ) Þ 2

2

2

2

2

2 2 b 2 = c2 + n 2 – 2c2 × NH ü c1b 2 = c1c2 + c1n 2 – 2c1c2 × NH ü ï ï ýÞ ýÞ 2 2 2 2 2 2 ï a = c1 + n + 2c1 × NH þ c2a = c2c1 + c2n + 2c1c2 × NH ï þ

BN ×CA + NA×CB + AB×CN + BN ×NA× AB= 0 D

Teorema 20. Cálculo de las alturas de un triángulo A B C en función de sus lados. Dado un triánD

Figura 29.

gulo A BC , si llamamos p al semiperímetro, es decir 2p = a +b + c, la altura correspondiente al vértice A 2 p ( p – a )( p – b )( p – c ). a c1

H

es ha =

c

N

B

A

c2

En efecto, sea AH = h la altura que queremos calcular y

A

D

llamemos m = HC . En el triángulo rectángulo A H C , tenemos que h2 = b2 – m2 (1). n

h

b

a

b

D

$ tenemos: En el triángulo A BC , agudo en C,

c h

C

a 2 + b 2 – c2 c2 = a 2 + b 2 – 2am Þ m = 2a Si sustituimos esta expresión de m en (1), tendremos:

m

los teorema 15 y 16 respectivamente a los triángulos AC N y B N C , tendremos: C

a

D

D

B

H

En efecto, tomamos un punto cualquiera N sobre el lado AB y llamamos c1= BN y c2= NA. Aplicando

Figura 30.

( a 2 + b 2 – c 2 )2 4 a 2b 2 – ( a 2 + b 2 – c2 )2 = = h2 = b2 – 4a2 4a2 ( 2ab )2 – ( a 2 + b 2 – c2 )2 4a2

BN × CA + NA × CB + AB × CN + BN × NA × AB = 0 2

2

=

Teorema 19. Teorema de Stewart. Dado un triángulo A BC y un punto N, perteneciente al lado AB, se verifica: D

294



Geometría del triángulo Descomponiendo el numerador en una suma por diferencia, quedará: ( 2ab + a 2 + b 2 – c 2 )× ( 2ab – a 2 – b 2 + c 2 ) [( a + b )2 – c 2]×[c2 – ( a – b )2] = 4a2 4a2 ( a + b + c )× ( a + b – c )× ( c + a – b )× ( c – a + b ) = 4a2 h2 =

1 ( a + b + c )× ( a + b – c )× ( c+ a – b )× ( c – a + b ) y como 2p = a + b + c tenemos 2a

de donde ha = ha =

1 2 2 p × 2( p – c ) × 2( p – b )× 2( p – a ) = 2a a

De la misma forma

ì h = ï ï b í ïh = ï î c

p×( p – a )× ( p – b )× ( p – c )

2 p×( p – a )× ( p – b )× ( p – c ) b 2 p×( p – a )× ( p – b )× ( p – c ) c

4.5. Superficie del triángulo Teorema 21. La superficie de cada triángulo es igual a la de un paralelogramo de igual base y mitad de altura, o a la mitad de un paralelogramo de igual base e igual altura. En efecto, si observamos la figura 31 vemos que si M y N son los puntos medios de los lados AB y D

A

D

AC, el triángulo M A N es igual que el M 'C N , al tener los lados paralelos y uno común y por suma, el D

área de A BC será la misma que la del paralelogramo BMM'C, de igual base y mitad de altura. Los otros dos casos se demuestran análogamente. B Como conclusión, dos triángulos de bases y alturas iguales tienen la misma superficie y al ser el área de un paralelogramo igual al producto de su base por su altura, llegamos a que

M

M'

N

H

C

Figura 31.

æ D ö BC × AH S ç A BC ÷= è ø 2 Si tomamos una base cualquiera (en este caso BC = a) y aplicamos las fórmulas de la altura en función de las longitudes de los lados obtenidas en el teorema anterior, llegamos a la Fórmula de Herón, que nos da la superficie de un triámngulo en función de las longitudes de sus lados: S=

a × ha a 2 = × × p × ( p – a )× ( p – b )× ( p – c ) = 2 2 a


p × ( p – a )× ( p – b )× ( p – c )

295

TEMA

40 Geometría de la circunferencia. Ángulos en la circunferencia. Potencia de un punto respecto a una circunferencia




298



DEFINICIÓN Y GENERALIDADES 1.1. Definición 1.2. Segmentos sobre la circunferencia 1.3. Posiciones relativas 1.4. Determinación de una circunferencia 1.5. Tangentes a una circunferencia

2.

ÁNGULOS SOBRE LA CIRCUNFERENCIA 2.1. Ángulos centrales, arcos y cuerdas 2.2. Ángulos no centrales 2.3. Medida de ángulos inscritos 2.4. Medida de ángulos semiinscritos 2.5. Medida de ángulos exteriores 2.6. Medida de ángulos interiores 2.7. Arco capaz

3.

LONGITUD DE LA CIRCUNFERENCIA

4.

EL NÚMERO p

5.

POTENCIA DE UN PUNTO RESPECTO DE UNA CIRCUNFERENCIA 5.1. Definición de potencia 5.2. Potencia y tangente 5.3. Eje y centro radical 5.4. Condición para que cuatro puntos sean cocíclicos 5.5. Circunferencias ortogonales

6.

ESTUDIO ANALÍTICO DE LA CIRCUNFERENCIA 6.1. Ecuación cartesiana 6.2. Ecuaciones paramétricas y ecuación polar 6.3. Rectas tangente y normal en un punto 6.4. Expresión analítica de la potencia de un punto 6.5. Ecuación del eje radical 6.6. Condición de ortogonalidad de dos circunferencias

ESTUDIO ANALÍTICO DE LA CIRCUNFERENCIA 6.1. Ecuación cartesiana 6.2. Ecuaciones paramétricas y ecuación polar 6.3. Rectas tangente y normal en un punto 6.4. Expresión analítica de la potencia de un punto 6.5. Ecuación del eje radical 6.6. Condición de ortogonalidad de dos circunferencias

6.

POTENCIA DE UN PUNTO RESPECTO DE UNA CIRCUNFERENCIA 5.1. Definición de potencia 5.2. Potencia y tangente 5.3. Eje y centro radical 5.4. Condición para que cuatro puntos sean cocíclicos 5.5. Circunferencias ortogonales

5.

EL NÚMERO p

4.

LONGITUD DE LA CIRCUNFERENCIA

3.

ÁNGULOS SOBRE LA CIRCUNFERENCIA 2.1. Ángulos centrales, arcos y cuerdas 2.2. Ángulos no centrales 2.3. Medida de ángulos inscritos 2.4. Medida de ángulos semiinscritos 2.5. Medida de ángulos exteriores 2.6. Medida de ángulos interiores 2.7. Arco capaz

2.

DEFINICIÓN Y GENERALIDADES 1.1. Definición 1.2. Segmentos sobre la circunferencia 1.3. Posiciones relativas 1.4. Determinación de una circunferencia 1.5. Tangentes a una circunferencia

1.



298

Geometría de la circunferencia

1. DEFINICIÓN Y GENERALIDADES 1.1. Definición Todos estamos familiarizados con la simetría de la circunferencia. Los griegos la consideraban la figura perfecta. Estimaban que el firmamento también lo era y que los planetas debían moverse en órbitas circulares. Su lógica era deficiente pero podemos comprender por qué recurrieron a este modelo para ilustrar el movimiento de los cuerpos celestes. Formalmente una circunferencia se define como sigue: Si C es un punto y r es cualquier número real positivo, una circunferencia de centro C y radio r , es el conjunto de puntos P en el plano cuya distancia a C es igual a r.

Por abuso del lenguaje se utiliza el término radio con una doble acepción: para designar cualquier segmento de recta que une el centro P con un punto de la circunferencia o el número real r que mide la longitud de cualquiera de esos segmentos. Una circunferencia es una curva cerrada y simple. Divide al plano en tres conjuntos de puntos disjuntos: la circunferencia misma, su interior y su exterior. Una región circular o círculo es la unión de una circunferencia y su interior; se trata de un conjunto convexo. El interior de una circunferencia de centro C y radio r es el conjunto de los puntos cuya distancia a C es menor que r; el exterior es el conjunto de los puntos cuya distancia de C es mayor que r. Es posible probar la siguiente propiedad: “si se une un punto interior y uno exterior el segmento obtenido tiene en común con la circunferencia un punto y sólo uno”. Esto se conoce como teorema fundamental. La simetría de la circunferencia es “perfecta”. De hecho tiene infinidad de ejes de simetría (a saber, cualquier recta que pase por su centro) y todos pasan por el centro de simetría que es obviamente el centro C de la definición. En general, toda circunferencia se transforma en sí misma por cualquier isometría que deje invariante su centro.

1.2. Segmentos sobre la circunferencia Desde un punto de vista muy elemental los segmentos fundamentales relacionados con la circunferencia son: G F D OA = Radio BC = Diámetro DE = Cuerda B FG = Flecha

E

O

C

A

Figura 1.

1.3. Posiciones relativas a)

Posición relativa de recta y circunferencia Una recta puede tener a lo sumo dos puntos comunes con una circunferencia. En efecto, si todos los puntos de la recta son exteriores a la circunferencia entonces recta y circunferencia no tienen ningún punto en común.


299


300


Supongamos entonces que la recta tenga un punto interior a la circunferencia. Si este punto fuese el centro O, entonces en cada semirrecta de origen O hay un punto único cuya distancia a O es igual al radio r, y por tanto la recta y la circunferencia tendrían dos puntos comunes. Si M es un punto interior, distinto del centro, por donde pasa la recta, tomemos sobre cada semirrecta de origen M un punto cuya distancia a M sea 2r (figura 2). Tendríamos dos puntos P y Q tales que b)

Posición relativa de dos circunferencias Dos circunferencias se denominan concéntricas si tienen el mismo centro, y en caso contrario excéntricas. OP > PM – OM > 2r – r = r

Figura 3.

OQ > QM – OM > 2r – r = r

a)

b)

c)

Q

M O P

–

Si la distancia de O a la recta es mayor que el radio, la recta y la circunferencia no tienen ningún punto en común y se dice entonces que la recta es exterior a la circunferencia (figura 3c).

Figura 2.

Si la distancia de O a la recta es igual al radio, entonces la recta y la circunferencia sólo tienen un punto en común y se dice que la recta es tangente a la circunferencia (figura 3b).

–

Si la distancia del centro O de la circunferencia a la recta dada es menor que el radio, recta y circunferencia tendrán dos puntos comunes y diremos que la recta es secante a la circunferencia (figura 3a). En caso de que la recta pase por el centro se dice que corta a la circunferencia diametralmente.

–

Por tanto los puntos P y Q son exteriores. Si aplicamos el teorema fundamental a cada uno de los segmentos PM y QM tendremos dos puntos de corte de la recta con la circunferencia. Por consiguiente, para una recta y una circunferencia pueden darse los casos siguientes:

–

Si la distancia del centro O de la circunferencia a la recta dada es menor que el radio, recta y circunferencia tendrán dos puntos comunes y diremos que la recta es secante a la circunferencia (figura 3a). En caso de que la recta pase por el centro se dice que corta a la circunferencia diametralmente.

–

Si la distancia de O a la recta es igual al radio, entonces la recta y la circunferencia sólo tienen un punto en común y se dice que la recta es tangente a la circunferencia (figura 3b).

–

Si la distancia de O a la recta es mayor que el radio, la recta y la circunferencia no tienen ningún punto en común y se dice entonces que la recta es exterior a la circunferencia (figura 3c).

Por tanto los puntos P y Q son exteriores. Si aplicamos el teorema fundamental a cada uno de los segmentos PM y QM tendremos dos puntos de corte de la recta con la circunferencia. Por consiguiente, para una recta y una circunferencia pueden darse los casos siguientes:

Figura 2.

P

O M Q b)

OQ > QM – OM > 2r – r = r

a)

c)

Figura 3.

OP > PM – OM > 2r – r = r Supongamos entonces que la recta tenga un punto interior a la circunferencia. Si este punto fuese el centro O, entonces en cada semirrecta de origen O hay un punto único cuya distancia a O es igual al radio r, y por tanto la recta y la circunferencia tendrían dos puntos comunes. Si M es un punto interior, distinto del centro, por donde pasa la recta, tomemos sobre cada semirrecta de origen M un punto cuya distancia a M sea 2r (figura 2). Tendríamos dos puntos P y Q tales que 300

Posición relativa de dos circunferencias Dos circunferencias se denominan concéntricas si tienen el mismo centro, y en caso contrario excéntricas.



b)

Geometría de la circunferencia Dos circunferencias tienen a lo sumo dos puntos en común. Puede haber sólo uno o no tener ningún punto común. Si denotamos por d la distancia entre los centros O y O'y por r y r'los radios respectivos (r > r'), pueden darse los casos:

d > r+r'

Exteriores

d = r+ r'

Tangentes exteriores

r+ r' > d > r - r'

Secantes

r+ r' > d = r - r'

Tangentes interiores

r+ r' > r - r' > d

C' es interior a C

1.4. Determinación de una circunferencia Una circunferencia puede determinarse de varias formas (por ejemplo: circunferencia tangente a una recta dada y que pase por dos puntos exteriores a dicha recta). Pero la determinación más simple de una circunferencia consiste en dar tres puntos de la misma. Así pues: “Una circunferencia queda unívocamente determinada por tres puntos no alineados”.

En efecto, si M, N y P no están alineados forman un triángulo. Entonces sabemos que las mediatrices de DMNP se cortan en un punto. Dicho punto equidista de M y N por ser de la mediatriz de MN, equidista de M y P por ser de la mediatriz de MP y equidista de N y P por ser de la mediatriz de NP. Por tanto, es el centro de la circunferencia circunscrita al triángulo. Obviamente, si los puntos estuvieran alineados las mediatrices de MN, MP y NP serían paralelas y no se cortarían en ningún punto.


P

M

N

Figura 4.

301


302

c)


Si C y C' son exteriores tienen dos tangentes comunes exteriores y otras dos tangentes comunes interiores (figura 8a). Si C y C' son tangentes exteriores, entonces tienen dos tangentes comunes exteriores y una única tangente común interior, que pasa por el punto de tangencia de C y C'y es perpendicular a la línea de centros OO'(figura 8b). Si C y C' son secantes sólo tienen dos tangentes comunes exteriores (figura 8c).

Tres puntos alineados no determinan un circunferencia. En caso contrario habría una recta y una circunferencia con más de dos puntos comunes y quedó demostrado que ello no es posible. b)

1.5. Tangentes a una circunferencia

a)

1.

Si una recta t es tangente a una circunferencia C, entonces ambas poseen un único punto T común (punto de tangencia) y todos los demás puntos de t son exteriores a la circunferencia. En efecto, si t tuviera algún punto interior a C, entonces t cortaría a C en dos puntos y sería secante y no tangente. Por tanto d(O,T) = r y para cualquier otro punto P Î t se tiene d(O,P) > r.

En el caso de dos circunferencias C y C' puede hablarse de tangentes comunes, pudiendo presentare los casos siguientes: Figura 7.

Por cada punto A de la circunferencia pasa una única recta tangente que es perpendicular al radio OA. A

En efecto, si OH es la mediatriz de la cuerda AB, cuando B tiende a confundirse con A, la secante se confunde con la tangente AT y la mediatriz OH con el radio OA. Recíprocamente, toda perpendicular a un radio en un extremo es tangente a la circunferencia.

T

t

H

O

O

O

T´

2.

B

T

a)

b)

Figura 5.

Si t y t ' son dos rectas que están a igual distancia de un punto O, existe un única circunferencia de Figura 6. centro O que sea tangente a t y t ' (figura 7a). Si consideramos una familia de rectas con la propiedad de estar todas a igual distancia r de un punto fijo O, entonces la envolvente de dicha familia de rectas es la circunferencia de centro O y radio r (figura 7b). Esto constituye una definición tangencial de la circunferencia. 3.

Por un punto P exterior a una circunferencia pueden trazarse dos rectas tangentes a la misma en puntos T y T ', siendo PT = PT '. Si d = d(O,P) se tiene PT = PT' = d 2 – r2 .

T

En Cosmografía, al ángulo ÐTPT' se le llama, a veces, “diámetro aparente”. O

P

En Cosmografía, al ángulo ÐTPT' se le llama, a veces, “diámetro aparente”. P

T

O

Si t y t ' son dos rectas que están a igual distancia de un punto O, existe un única circunferencia de centro O que sea tangente a t y t ' (figura 7a). Si consideramos una familia de rectas con la propiedad de estar todas a igual distancia r de un punto fijo O, entonces la envolvente de dicha familia de rectas es la circunferencia de centro O y radio r (figura 7b). Esto constituye una definición tangencial de la circunferencia. Si d = d(O,P) se tiene PT = PT' = d 2 – r2 . Figura 6.

3.

Por un punto P exterior a una circunferencia pueden trazarse dos rectas tangentes a la misma en puntos T y T ', siendo PT = PT '. Figura 5.

a)

b)

En efecto, si OH es la mediatriz de la cuerda AB, cuando B tiende a confundirse con A, la secante se confunde con la tangente AT y la mediatriz OH con el radio OA. Recíprocamente, toda perpendicular a un radio en un extremo es tangente a la circunferencia. T

B H

t

A

T

T´

O

O

O

Por cada punto A de la circunferencia pasa una única recta tangente que es perpendicular al radio OA.

2.

Si una recta t es tangente a una circunferencia C, entonces ambas poseen un único punto T común (punto de tangencia) y todos los demás puntos de t son exteriores a la circunferencia. En efecto, si t tuviera algún punto interior a C, entonces t cortaría a C en dos puntos y sería secante y no tangente. Por tanto d(O,T) = r y para cualquier otro punto P Î t se tiene d(O,P) > r.

1.

Figura 7.

En el caso de dos circunferencias C y C' puede hablarse de tangentes comunes, pudiendo presentare los casos siguientes: a)

Si C y C' son exteriores tienen dos tangentes comunes exteriores y otras dos tangentes comunes interiores (figura 8a). Si C y C' son tangentes exteriores, entonces tienen dos tangentes comunes exteriores y una única tangente común interior, que pasa por el punto de tangencia de C y C'y es perpendicular a la línea de centros OO'(figura 8b). Si C y C' son secantes sólo tienen dos tangentes comunes exteriores (figura 8c).

1.5. Tangentes a una circunferencia

b)

Tres puntos alineados no determinan un circunferencia. En caso contrario habría una recta y una circunferencia con más de dos puntos comunes y quedó demostrado que ello no es posible. 302



c)

Geometría de la circunferencia d) e)

Si C y C'son tangentes interiores sólo hay una tangente común que pasa por el punto de tangencia y es perpendicular a la línea de centros (figura 8d). Si C es interior a C' o viceversa, entonces no hay ninguna recta tangente común.

Figura 8.

(a)

(b)

(c)

(d)

De lo anteriormente expuesto pueden obtenerse muchas consecuencias inmediatas. Veamos un par de ejemplos: B 1. Cuadrilátero circunscrito a una circunferencia: la suma de los M lados opuestos es constante. N Por la propiedad 3: A AM = AQ; BM = BN; CN = CP; DP = DQ C Entonces: Q P AB + DC = AM + BM + CP + DP =

D

= AQ + BN + CN + DQ = = (AQ + DQ) + (BN + CN) = AD + BC 2.

Tangentes comunes a dos circunferencias tangentes exteriores. La propiedad 3 nos lleva a MT = MP = MT', lo que prueba que M es el punto medio de TT'. El triángulo TPT' está inscrito en una circunferencia de centro M y diámetro TT'. Luego ÐTPT' = 90º. Lo mismo ocurre con las rectas MO y MO'que son bisectrices respectivas de ÐTMP y ÐT'MP, y siendo TMT' llano, tenemos ÐOMO' = 90º. En el triángulo rectángulo OMO' el teorema de la altura nos da que MP es media proporcional de los radios OP y O'P es decir MP2 = OP × O'P = r × r'. Además la perpendicular MN a TT'es la tercera paralela a OT y O'T'y , como M es el punto medio de TT', el punto N será el punto medio de OO'.

Figura 9.

T

O

T´

M

N

P

O´

Figura 10.

s B

2. ÁNGULOS SOBRE LA CIRCUNFERENCIA 2.1. Ángulos centrales, arcos y cuerdas Si en una circunferencia se trazan dos semirrectas r y s con vértice en el centro O obtenemos dos puntos A y B de la circunferencia de modo que OA y OB son dos radios (figura 11). Consideremos el sentido de giro positivo el contrario al de las agujas del reloj. Entonces los pares ordenados de semirrectas (r,s) y (s,r) son dos ángulos orientados con vértice en O cuyas medidas suman 360º.


O A

r

Figura 11.

303


304


Todo ángulo con vértice en O se denomina ángulo central . El conjunto de puntos de la circunferencia comprendido entre sus lados se llama arco correspondiente. Designaremos por AB el arco correspondiente al ángulo (r,s) y por BA el correspondiente a (s,r). El segmento AB es la cuerda subtendida por ambos ángulos centrales y ambos arcos correspondientes. En particular se llama cuadrante al arco correspondiente a un ángulo central recto. Si el ángulo central es llano el arco se denomina semicircunferencia.

Figura 15.

B

d

O A

Dos cuerdas iguales equidistan del centro. Si son desiguales, la mayor dista menos del centro. En consecuencia, la envolvente de todas las cuerdas de una longitud dada c, es una circunferencia concéntrica con la dada y de radio d (figura 15). Figura 12.

3.

Propiedades elementales:

Figura 14.

1.

En una misma circunferencia a arcos iguales corresponden ángulos centrales iguales y viceversa. Hay, pues, proporcionalidad directa entre la medida del ángulo central y la longitud del arco correspondiente.

2.

En una misma circunferencia si dos arcos son iguales subtienden cuerdas iguales y viceversa. Si son desiguales, y ambos menores que una semicircunferencia, el mayor subtiende mayor cuerda. Si los arcos AB y CD son iguales entonces los ángulos centrales corresponB dientes a y b son iguales (por la propiedad anterior), Los triángulos isósceles OAB y OCD son iguales por tener iguales dos lados (OA = OC = r y OB = c1 = OD = r) y el ángulo comprendido. Por tanto, AB = C, es decir, c1 = c2. A a Supongamos ahora que AB < CD (figura14a). Mediante un giro de centro O O hacemos coincidir B con D y tendremos un nuevo triángulo ODA' congruente con OAB (figura 14b). La bisectriz de ÐA'OC corta a CD en un b punto H, siendo AB = A'D < A'H + HD = CH + HD = CD, o sea, c1 < c2. c2 Recíprocamente, si c1 < c2 se tiene entonces ÐAOB < ÐCOD, y de aquí D AB < CD. C

a)

b)

A'

c2

C

D

C

O

D

H

c1

Figura 13.

A

O

B

C

En una misma circunferencia si dos arcos son iguales subtienden cuerdas iguales y viceversa. Si son desiguales, y ambos menores que una semicircunferencia, el mayor subtiende mayor cuerda. Si los arcos AB y CD son iguales entonces los ángulos centrales corresponB dientes a y b son iguales (por la propiedad anterior), Los triángulos isósceles OAB y OCD son iguales por tener iguales dos lados (OA = OC = r y OB = c1 = OD = r) y el ángulo comprendido. Por tanto, AB = C, es decir, c1 = c2. A a Supongamos ahora que AB < CD (figura14a). Mediante un giro de centro O O hacemos coincidir B con D y tendremos un nuevo triángulo ODA' congruente con OAB (figura 14b). La bisectriz de ÐA'OC corta a CD en un b punto H, siendo AB = A'D < A'H + HD = CH + HD = CD, o sea, c1 < c2. c2 Recíprocamente, si c1 < c2 se tiene entonces ÐAOB < ÐCOD, y de aquí AB < CD.

2.

En una misma circunferencia a arcos iguales corresponden ángulos centrales iguales y viceversa. Hay, pues, proporcionalidad directa entre la medida del ángulo central y la longitud del arco correspondiente.

1.

D

B

Figura 13.

c1

O

A

H

O

C

c2

C

D

A'

a)

D

b)

Figura 14.

Propiedades elementales: 3.

Dos cuerdas iguales equidistan del centro. Si son desiguales, la mayor dista menos del centro. En consecuencia, la envolvente de todas las cuerdas de una longitud dada c, es una circunferencia concéntrica con la dada y de radio d (figura 15). Figura 12.

A O

Todo ángulo con vértice en O se denomina ángulo central . El conjunto de puntos de la circunferencia comprendido entre sus lados se llama arco correspondiente. Designaremos por AB el arco correspondiente al ángulo (r,s) y por BA el correspondiente a (s,r). El segmento AB es la cuerda subtendida por ambos ángulos centrales y ambos arcos correspondientes. En particular se llama cuadrante al arco correspondiente a un ángulo central recto. Si el ángulo central es llano el arco se denomina semicircunferencia.

d



304

B

Figura 15.

Geometría de la circunferencia 4.

5.

La perpendicular a una cuerda pasando por el centro O de la circunferencia divide al arco que la subtiende en dos arcos iguales. En efecto, los triángulos rectángulos OCA y OCD de la figura 16 son iguales por tener iguales las hipotenusas (OA = OB = r) y el cateto OC común. Por tanto, son iguales los otros dos catetos, es decir, B AC = CB. Los triángulos ACM y BCM son también iguales por ser M rectángulos y ser iguales sus catetos, luego las cuerdas AM y MB son iguales y por consiguiente los arcos que las subtienden, esto es AM = MB. C Esta propiedad tiene otras interpretaciones. Así pues, una misma cuerO da AB podrá pertenecer a muchas circunferencias, pero todas ellas A tendrán sus centros en la misma mediatriz MN que será el lugar geométrico de tales centros. Esto encuentra su aplicación en la herramienta llamada “escuadra de centrar” que permite hallar el centro de la circunferencia a que pertenece un arco dado. Así pues, la mediatriz de una cuerda MN contiene infinidad de centros de circunferencias pasando por M y N. Si imponemos la condición de pasar por un tercer Figura 16. punto P no alineado con M y N, entonces el centro buscado ha de estar en la mediatriz de MP y, por tanto, en la intersección de ésta con la de MN. Se trata, pues, del circuncentro del triángulo MNP, que también está en la tercera mediatriz por equidistar también de N y P. M Los arcos de una misma circunferencia comprendidos entre paralelas son iguales. D C Si AB y CD son dos cuerdas paralelas, podemos trazar la perpendicular desde O y será mediatriz de ambas. Por la propiedad anteB A O rior los arcos cumplen AM = MB y CM = MD. Restando ambas AM – CM = MB – MD, de donde AC = BD. Figura 17.

6.

Si dos circunferencias son secantes la recta que une los centros (línea de centros) es la mediatriz de la cuerda común. En caso de dos circunferencias tangentes la línea de centros pasa por el punto de tangencia. Es una consecuencia inmediata de las anteriores.

7.

Flecha de la cuerda Es posible obtener la longitud de la flecha en función del radio r y de la longitud c de la propia cuerda. Llamando d a la distancia del centro O a la cuerda, basta aplicar el teorema de Pitágoras: æcö 1 4 r2 – c 2 f = r – d = r – r2 – ç ÷ = r – è 2ø 2 2

f d

r

O

Figura 18.


305


306


2.2. Ángulos no centrales

Como vimos anteriormente, hay una proporcionalidad directa entre medida del ángulo central y del arco correspondiente. De ahí que podamos identificar la medida del arco con la del ángulo central correspondiente; de esa manera, es habitual expresar los arcos sobre una circunferencia en unidades del sistema sexagesimal. Hay una estrecha relación entre la medida de un ángulo inscrito o semiincrito y la del arco que comprenden sus lados. Esa relación se extiende para ángulos interiores y exteriores. Vamos a deducir tales relaciones en lo que sigue.

Ya definíamos en el epígrafe anterior lo que se entiende como ángulo central (aquel que tiene su vértice en el centro de la circunferencia). Podemos considerar ahora ángulos que tienen como vértice un punto P de la circunferencia, y definimos:

–

Ángulo inscrito: ángulo con vértice sobre la circunferencia y lados secantes a la misma (figura 19b).

–

Ángulo semiinscrito: ángulo con vértice sobre la circunferencia, un lado secante y el otro tangente (figura 19c). Figura 19.

Si consideramos como vértice un punto P que no está sobre la circunferencia, tenemos dos nuevas definiciones:

Ángulo exterior

Ángulo interior

Ángulo exterior

–

Ángulo interior: ángulo con vértice en un punto interior distinto del centro y lados secantes (figura 19d).

–

Ángulo exterior: ángulo con vértice en un punto exterior y lados secantes o tangentes (figuras 19e -19f).

a

P

(c)

a

(e)

(b)

P

P

(d)

a

P

a

Ángulo inscrito

P

Ángulo semiinscrito P

Ángulo central

a

(f)

(a)

a a

P

Ángulo inscrito

Ángulo semiinscrito

a a

P

P (b)

a (e)

P

(c)

P

(d)

(f)

a

(a)

Ángulo central

P

Ángulo exterior: ángulo con vértice en un punto exterior y lados secantes o tangentes (figuras 19e -19f).

–

Ángulo interior: ángulo con vértice en un punto interior distinto del centro y lados secantes (figura 19d).

–

a

Si consideramos como vértice un punto P que no está sobre la circunferencia, tenemos dos nuevas definiciones:

Ángulo interior

Ángulo exterior

Ángulo exterior

Figura 19.

Ángulo semiinscrito: ángulo con vértice sobre la circunferencia, un lado secante y el otro tangente (figura 19c).

–

Ángulo inscrito: ángulo con vértice sobre la circunferencia y lados secantes a la misma (figura 19b).

–

Como vimos anteriormente, hay una proporcionalidad directa entre medida del ángulo central y del arco correspondiente. De ahí que podamos identificar la medida del arco con la del ángulo central correspondiente; de esa manera, es habitual expresar los arcos sobre una circunferencia en unidades del sistema sexagesimal. Hay una estrecha relación entre la medida de un ángulo inscrito o semiincrito y la del arco que comprenden sus lados. Esa relación se extiende para ángulos interiores y exteriores. Vamos a deducir tales relaciones en lo que sigue.

Ya definíamos en el epígrafe anterior lo que se entiende como ángulo central (aquel que tiene su vértice en el centro de la circunferencia). Podemos considerar ahora ángulos que tienen como vértice un punto P de la circunferencia, y definimos:

2.2. Ángulos no centrales



306


2.3. Medida de ángulos inscritos Sea el caso particular en que uno de los lados es un diámetro (figura 20). Entonces, si unimos O con B , tendremos que el ángulo central b es un ángulo exterior del triángulo POB, y por tanto b es la suma de los dos ángulos interiores de dicho triángulo no adyacentes a b, o sea b = ÐOPB + ÐOBP.

P a O

b

B

A

Figura 20.

Ahora bien, el triángulo POB es isósceles ya que OP = OB = r, siendo ÐOPB = ÐOBP = a, de donde b AB b = 2a. Resulta por tanto a = = . 2 2 Supongamos ahora que ninguno de los lados pasa por O (figura 21). Trazando el diámetro por P, entonces obtenemos a por adición o sustracción de otros dos ángulos inscritos a1 y a2 , que se sitúan en el caso particular anterior.

P

P (a)

(b)

a a1

a a2 B

a2

B

a1

A

A Figura 21.

M

M

En figura 21a: a = a1+ a 2 =

AM MB AM + MB AB + = = 2 2 2 2

En figura 21b: a = a 2 – a1 =

MB MA MB – MA AB – = = 2 2 2 2 P

Podemos concluir que: “La medida de un ángulo inscrito en un circunferencia equivale a la mitad del arco que abarcan sus lados”.

Del resultado anterior pueden extraerse varias consecuencias. Si tenemos una cuerda AB, todos los ángulos inscritos en la circunferencia cuyos lados pasen por las extremos de la cuerda dada interceptan el mismo arco y por lo tanto tienen igual medida, es decir, ÐAPB = ÐAP´B. Las bisectrices interiores de todos esos ángulos se cortan en el mismo punto M que es el punto medio del arco AB y las bisectrices exteriores se cortan en P. Además, los triángulos AEP y BEP´ son semejantes. TEMARIO DE MATEMÁTICAS. PRUEBA A

P'

E A

B M

Figura 22. 307


308


En el caso (a) es obvio que a = 90º es la mitad del arco abarcado que es una semicircunferencia. En los casos (b) y (c) se llega al resultado por adición o sustracción respectivamente.

En particular, todo triángulo rectángulo puede ser inscrito en una circunferencia cuyo diámetro es la hipotenusa (figura 23). Asimismo, un cuadrilátero será inscriptible en una circunferencia si dos de sus ángulos opuestos suman dos rectos. Por lo pronto nunca lo serán los paralelogramos que no sean cuadrados o rectángulos; en cambio estos últimos siempre serán inscriptibles. Cabe afirmar también que todo cuadrilátero inscrito en una circunferencia cumple que sus dos pares de ángulos opuestos son suplementarios.

A

a

Figura 26.

a

(a)

(b)

B

a (c) Figura 23.

2.

También puede razonarse distinguiendo los casos de las figuras siguientes:

2.4. Medida de ángulos semiinscritos Figura 25.

B

a

Veamos que un ángulo semiinscrito tiene la misma medida que uno inscrito que abarque el mismo arco. En efecto, trazamos una paralela por A al lado tangente PB y razonando sobre la figura:

A

P

O

a = ÐAPB = ÐPAC por alternos-internos. Como el ángulo ÐPAC es inscrito, su medida es la mitad del PC arco que abarcan sus lados, o sea . Pero sabemos que los arcos in2 terceptados por dos paralelas en una circunferencia son iguales, luePA go PC =PA, de donde resulta a = . 2

C

a

B

Hay otra forma de llegar al resultado, y consiste en trazar dos radios perpendiculares a los lados del ángulo dado. Los ángulos ÐAPB y ÐPOC son iguales por tener los lados perpendiculares. Por tratarse de un ángulo central ÐPOC = PC . Pero sabemos que el radio perpendicular a la cuerda divide al PA 2 arco que la subtiende en dos mitades iguales por lo cual PC =

Figura 24.

Observaciones:

Observaciones:

Hay otra forma de llegar al resultado, y consiste en trazar dos radios perpendiculares a los lados del ángulo dado. Los ángulos ÐAPB y ÐPOC son iguales por tener los lados perpendiculares. Por tratarse de un ángulo central ÐPOC = PC . Pero sabemos que el radio perpendicular a la cuerda divide al PA arco que la subtiende en dos mitades iguales por lo cual PC = 2

Como el ángulo ÐPAC es inscrito, su medida es la mitad del PC arco que abarcan sus lados, o sea . Pero sabemos que los arcos in2 terceptados por dos paralelas en una circunferencia son iguales, luePA . 2

Figura 24.

go PC =PA, de donde resulta a =

A

P

C

1.

1.

A

P

C

B

a

C

a = ÐAPB = ÐPAC por alternos-internos.

O

a

Veamos que un ángulo semiinscrito tiene la misma medida que uno inscrito que abarque el mismo arco. En efecto, trazamos una paralela por A al lado tangente PB y razonando sobre la figura:

B

A

P

2.4. Medida de ángulos semiinscritos Figura 25.

2.

También puede razonarse distinguiendo los casos de las figuras siguientes: Figura 23.

(c)

En particular, todo triángulo rectángulo puede ser inscrito en una circunferencia cuyo diámetro es la hipotenusa (figura 23). Asimismo, un cuadrilátero será inscriptible en una circunferencia si dos de sus ángulos opuestos suman dos rectos. Por lo pronto nunca lo serán los paralelogramos que no sean cuadrados o rectángulos; en cambio estos últimos siempre serán inscriptibles. Cabe afirmar también que todo cuadrilátero inscrito en una circunferencia cumple que sus dos pares de ángulos opuestos son suplementarios.

a

a

a

A

(b)

B

(a)

Figura 26.

En el caso (a) es obvio que a = 90º es la mitad del arco abarcado que es una semicircunferencia. En los casos (b) y (c) se llega al resultado por adición o sustracción respectivamente. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


308

Geometría de la circunferencia Podemos concluir que: “La medida de un ángulo semiinscrito en un circunferencia equivale a la mitad del arco que abarcan sus lados”.

2.5. Medida de ángulos exteriores

P

Uniendo A y C tenemos el triángulo PAC donde se cumple

B

ÐCAD = ÐPCA + ÐCPA

a

A

de donde a = ÐCPA = ÐCAD -ÐPCA pero los ángulos ÐCAD y ÐPCA son inscritos y por tanto:

C D

Figura 27.

CD AB a= – 2 2 Es decir:

La medida de un ángulo exterior es la semidiferencia de los arcos que interceptan sus lados sobre la circunferencia.

Observaciones: 1. 2.

En el caso particular de que uno o ambos lados sean tangentes, el resultado es también válido. El razonamiento es similar. Cuando ambos lados son tangentes al ángulo se le llama circunscrito.

P a

T

P T

a

A T' B Figura 28.

2.6. Medida de ángulos interiores

B A

Uniendo B y C tenemos el triángulo PBC donde se cumple P

a = ÐCPD = ÐBCA + ÐCBD pero los ángulos ÐBCA y ÐCBD son inscritos y abarcan respectivamente los arcos AB y CD. Por tanto: AB CD a= + 2 2


Figura 29.

a C D

309



Figura 33.

Este resultado también se obtiene razonadamente si trazamos la paralela por B al lado AC y tendremos un punto H, siendo: C

a

a = ÐCPD = ÐHBD = B

P a

HD HC+ CD AB+ CD = = 2 2 2 A

A H

310

B

pues HC y AB son arcos interceptados por paralelas. O

C

Concluimos que: D La medida de un ángulo interior es la semisuma de los arcos que abarcan sus lados y las prolongaciones de éstos sobre la circunferencia.

Basta trazar un ángulo ÐBAC = a y el centro O del arco será la intersección de la perpendicular por A a AC con la mediatriz de AB (figura 33). El centro O' del arco simétrico se puede obtener haciendo la construcción análoga sobre el extremo B.

Figura 32.

–

Figura 30.

En el caso particular de que el punto P sea el centro de la circunferencia (figura 31) tendremos AB = CD y entonces a = AB, lo que corrobora que la medida del ángulo central equivale a la del arco que abarcan sus lados. B

Se denomina arco capaz del ángulo a sobre el segmento AB al lugar geométrico de los puntos del plano desde los cuales se “ve” el segmento dado bajo el ángulo dado. Es decir, estará formado por todos aquellos puntos P del plano para los cuales se verifica ÐAPB = a. Según vimos anteriormente, si el segmento es una cuerda de circunferencia, todos los ángulos inscritos en ésta cuyos lados pasen por A y B tendrán la misma medida (a saber la mitad de la del ángulo central). El lugar geométrico anteriormente definido es en realidad cualquiera de los arcos de sendas circunferencias que tienen a A y B como cuerda y de modo que el ángulo central sea 2a. Por ello la construcción es muy sencilla:

C

B

A

a

A

a

D

Figura 31.

2.7. Arco capaz

2.7. Arco capaz a

Se denomina arco capaz del ángulo a sobre el segmento AB al lugar geométrico de los puntos del plano desde los cuales se “ve” el segmento dado bajo el ángulo dado. Es decir, estará formado por todos aquellos puntos P del plano para los cuales se verifica ÐAPB = a. Según vimos anteriormente, si el segmento es una cuerda de circunferencia, todos los ángulos inscritos en ésta cuyos lados pasen por A y B tendrán la misma medida (a saber la mitad de la del ángulo central). El lugar geométrico anteriormente definido es en realidad cualquiera de los arcos de sendas circunferencias que tienen a A y B como cuerda y de modo que el ángulo central sea 2a. Por ello la construcción es muy sencilla: Figura 31.

D

A

B

a

A

C

En el caso particular de que el punto P sea el centro de la circunferencia (figura 31) tendremos AB = CD y entonces a = AB, lo que corrobora que la medida del ángulo central equivale a la del arco que abarcan sus lados. B

–

Figura 32.

Basta trazar un ángulo ÐBAC = a y el centro O del arco será la intersección de la perpendicular por A a AC con la mediatriz de AB (figura 33). El centro O' del arco simétrico se puede obtener haciendo la construcción análoga sobre el extremo B.

La medida de un ángulo interior es la semisuma de los arcos que abarcan sus lados y las prolongaciones de éstos sobre la circunferencia.

Figura 30.

D

Concluimos que: C

pues HC y AB son arcos interceptados por paralelas. O

a A

Este resultado también se obtiene razonadamente si trazamos la paralela por B al lado AC y tendremos un punto H, siendo:



HD HC+ CD AB+ CD = = 2 2 2 310

Figura 33.

B

a = ÐCPD = ÐHBD = C

P

B

a

H

A


3. LONGITUD DE LA CIRCUNFERENCIA Y ÁREA DEL CÍRCULO Una deducción rigurosa no viene al caso en el presente tema. Veremos una justificación intuitiva a la archiconocida fórmula L = 2pr. Comencemos por un hexágono regular inscrito. Evidentemente su perímetro es menor que la longitud de la circunferencia C. Llamemos p6 al perímetro de dicho hexágono. Podemos construir un dodecágono inscrito en la misma circunferencia, trazando la mediatriz de cada uno de los lados del hexágono de partida. Por la desigualdad triangular es obvio que PP 1 '1+P '1 P2 > PP 1 2 y, por tanto, el perímetro P12 del dodecágono cumple p6 < p12 < L. Si repetimos el proceso podemos construir una sucesión p6 < p12 < p24 < … < p6n < … < L monótona estrictamente creciente y acotada, y, por tanto, convergente, que se acerca tanto a L como se quiera, esto es lim p2n = L. n ®¥ Otra alternativa sería tomar una sucesión de perímetros de polígonos regulares circunscritos. Así, si q6 es el perímetro del hexágono regular circunscrito, es obvio que el perímetro q12 del dodecágono circunscrito cumple q6 > q12 > q24 > … > q6n > … > L Esta sucesión es diferente pero su límite es también L. Las sucesiones { p6n} y { q6n} son un par de sucesiones monótonas convergente que define el número real L. En general, sean pn y qn los perímetros de los polígonos inscritos y circunscritos de n lados. Entonces: El lado del polígono inscrito es l = AB y el del circunscrito es l´ = HJ. Según la figura ÐBOH = ÐKBH, pues sus lados son perpendiculares, y entonces en el triángulo rectángulo HKB tendremos: l q 2 l cos = = ; 2 l' l' 2

l '=

cos

H

A

l q 2

K

q/2

B J

1 Luego qn – pn = n(l´ – l) = nl( – 1) cos q 2

O

Si n ®¥, entonces qn - pn®0. Ello implica que dado un e > 0 arbitrariamente pequeño podemos encontrar un polígono inscrito y otro circunscrito, ambos de n lados, cuya diferencia de perímetros es meFigura 34. nor que e. Entonces lim pn = lim qn = L. n ®¥ n ®¥ L La fórmula L = 2pr escrita como = 2p se interpreta como que la razón entre la longitud de la cirr cunferencia y su radio es una constante. Mientras no podamos probar este enunciado, podemos mostrar que la razón del perímetro de un polígono regular inscrito de n lados al radio es una constante. Está claro que si se trata del hexágono perímetro 6r = = 6. radio r Consideramos ahora un polígono inscrito de 10 lados. El ángulo central q correspondiente mide 36º. q Si trazamos la apotema tendremos un triángulo rectángulo donde el ángulo ÐAOB es = 18º. Entonces 2 l q perímetro 10 l 20 sen = 2 y la razón constante del perímetro al radio es = = @ 6,18 (comparemos r 2 radio r sen 18º con 2p @ 6,283 ). TEMARIO DE MATEMÁTICAS. PRUEBA A

311


312


Más tarde muchos matemáticos imitaron el método para obtener el valor de p con más precisión. Así por ejemplo, en 1610 Ludolph van Ceulen, en Alemania obtuvo 35 decimales empleando polígonos de 262 lados.

A

l

q

Figura 36.

r

A

B

O

r l/2

q /2

1 22 AB= 3d + d = d @ pd = L 7 7

O

C

Figura 35. A

B

En general, si el polígono tiene n lados el ángulo central q será 360º/n y el perímetro nl = n · 2r sen perímetro nl (360º/n), con lo que = = 2n sen ( 360º/ n ) = cte. radio r Para obtener el área encerrada por una circunferencia de radio r, podemos considerar un círculo como el límite de un polígono regular de n lados cuando n ®¥. Entonces el perímetro del polígono tiende a la longitud de la circunferencia y la apotema al radio. L

La razón entre la longitud L de la circunferencia y su diámetro 2r es el número p. En la antigüedad se pensó que su valor era 3. El primer intento para encontrar esta constante fue debido probablemente a Arquímedes (casi 240 años a. de C.). El método clásico para obtener el valor de p consistía en tomar polígonos regulares inscritos y circunscritos de un número cada vez mayor de lados. Eso fue lo que hizo Arquímedes y ob22 se basa el método de rectuvo la acotación 223 71< p < 22 7. Precisamente en la aproximación p @ 7 tificación aproximada de la circunferencia (figura 36).

4. EL NÚMERO p 2pr ´ r 2 Área = ————— = pr 2

perímetro · apotema Área = —————————— 2

2pr ´ r 2 Área = ————— = pr 2

perímetro · apotema Área = —————————— 2

4. EL NÚMERO p La razón entre la longitud L de la circunferencia y su diámetro 2r es el número p. En la antigüedad se pensó que su valor era 3. El primer intento para encontrar esta constante fue debido probablemente a Arquímedes (casi 240 años a. de C.). El método clásico para obtener el valor de p consistía en tomar polígonos regulares inscritos y circunscritos de un número cada vez mayor de lados. Eso fue lo que hizo Arquímedes y ob22 se basa el método de rectuvo la acotación 223 71< p < 22 7. Precisamente en la aproximación p @ 7 tificación aproximada de la circunferencia (figura 36).

En general, si el polígono tiene n lados el ángulo central q será 360º/n y el perímetro nl = n · 2r sen perímetro nl (360º/n), con lo que = = 2n sen ( 360º/ n ) = cte. radio r Para obtener el área encerrada por una circunferencia de radio r, podemos considerar un círculo como el límite de un polígono regular de n lados cuando n ®¥. Entonces el perímetro del polígono tiende a la longitud de la circunferencia y la apotema al radio. L

B

A

C

O 1 22 AB= 3d + d = d @ pd = L 7 7

O

B

q r

l

q /2

Figura 35.

l/2

r

A Figura 36.

Más tarde muchos matemáticos imitaron el método para obtener el valor de p con más precisión. Así por ejemplo, en 1610 Ludolph van Ceulen, en Alemania obtuvo 35 decimales empleando polígonos de 262 lados.

A



312

Geometría de la circunferencia Los chinos alrededor del año 480 emplearon el valor 355113 y en la Edad Media se tomó 10 como

aproximación de p. En las postrimerías del siglo XVII, los matemáticos abordaron el problema desde un punto de vista diferente: mediante series, productos infinitos y fracciones continuas. Así por ejemplo, el matemático escocés James Gregory, descubrió la serie: 1 1 1 p 1 – + – +...= 3 5 7 4 que ha sido usada desde entonces, con varias modificaciones, para encontrar valores aproximados de p. 4 3× 3× 5× 5× 7× 7×... . Sería prolijo citar a todos. Wallis dio otro resultado original: = p 2× 4 × 4 × 6× 6× 8×... Si sumamos los primeros 50 términos de la serie de Gregory 1 1 1 1 1 – + – +...– 3 5 7 99

obtenemos el valor de p 4 con error menor que 1101. Utilizando una modificación de este método el inglés William Shanks calculó p con 707 decimales en 1873. La aparición de las computadoras supuso un salto importante en la obtención de cifras de p. La computadora ENIAC en 1949 dio 2.937 decimales en 70 horas. ¿Qué fue lo que llevó a muchos matemáticos a dedicar buena parte de su vida a calcular p con más decimales? Un valor de p con diez decimales nos da la circunferencia de la Tierra casi en términos de fracción de centímetro. Treinta decimales pueden dar la circunferencia completa del universo observable, con un error tan pequeño que ni siquiera el más poderoso telescopio puede medirlo. En la práctica, el más cuidadoso trabajo requiere tan sólo 4 decimales. ¿Por qué calcularlo con 100.000 decimales? La razón es que los matemáticos de la antigüedad perseveraron en la idea de encontrar una periodicidad que hubiera implicado la posibilidad de expresarlo como la razón de dos enteros. En cambio Lambert, en 1767, demostró su irracionalidad y posteriormente Lindemann en 1884 probó que se trata de un número trascendente.

5. POTENCIA DE UN PUNTO RESPECTO DE UNA CIRCUNFERENCIA 5.1. Definición de potencia Sea la circunferencia de centro C y radio r, y un punto cualquiera P del plano. Si trazamos una secante por P a la circunferencia, se determinan dos puntos A y B de la misma. Definimos la potencia de P con respecto a la circunferencia dada como ¾ ¾® ¾ ¾®

Pot C( P ) = k = PA× PB

Al tratarse de un producto escalar, hemos de notar que si P es exterior a la circunferencia ambos vectores tendrán el mismo sentido y por tanto será k > 0. En caso de que P sea interior, será al contrario, es decir k < 0. Por último, si P está en la circunferencia, es obvio que k = 0.

B P

Figura 37.

A

B A

A

P

(a)

B P

(b)

(c)

Entonces la potencia de un punto nos servirá para determinar su posición con respecto a la circunferencia. TEMARIO DE MATEMÁTICAS. PRUEBA A

313


314


Luego: “La potencia de un punto con respecto a una circunferencia es igual al cuadrado del segmento de la tangente trazada desde P a la circunferencia”. Veamos que la potencia no depende de la secante trazada.

PT2 = PO2 – OT2 = d 2 – r2 = k = Pot C (P)

En efecto, los ángulos inscritos con vértices en A y A´ son iguales por subtender el mismo arco BB´. Los triángulos PA´B y PAB´, que tienen además en común el ángulo en P son semejantes, de donde se sigue

B

Supongamos que en la figura 40a hacemos pivotar una secante pasando por P alrededor del punto P. La posición límite es cuando los puntos de corte A y B se confunden en uno solo T, en cuyo caso la recta PT es la tangente a la circunferencia desde P. Entonces sabemos que la tangente en T es perpendicular al radio OT, con lo cual el triángulo PTO es rectángulo en T y por tanto

A

P

PA PB ' = Þ PA × PB = PA '×PB ' PA ' PB

Figura 40.

A'

O B

Figura 38. r

A

d

T

Si es d la distancia de P al centro y r el radio de la circunferencia, se tiene (b)

T

(a)

B'

P

P

k = Pot C(P0) = PH · PJ = (d - r) × (d + r) = d 2 - r 2

5.2. Potencia y tangente r

O

J

P es exterior a la circunferencia Û P es interior a la circunferencia Û P es un punto de la circunferencia Û

d>rÛ k>0 d
En particular si se trata del propio centro O de la circunferencia entonces la potencia es Pot C(O) = –r2. Todos los puntos que tienen una potencia dada k respecto a la circunferencia C, constituyen una circunferencia concéntrica con C. En efecto: Pot C ( P ) = Pot C (Q ) Û d (O , P )2 – r2 = d (O , P )2 – r2 Û d (O , P ) = d (O ,Q )

d

Figura 39.

Observaciones:

Observaciones:

Figura 39.

En particular si se trata del propio centro O de la circunferencia entonces la potencia es Pot C(O) = –r2. Todos los puntos que tienen una potencia dada k respecto a la circunferencia C, constituyen una circunferencia concéntrica con C. En efecto: Pot C ( P ) = Pot C (Q ) Û d (O , P )2 – r2 = d (O , P )2 – r2 Û d (O , P ) = d (O ,Q ) P es exterior a la circunferencia Û P es interior a la circunferencia Û P es un punto de la circunferencia Û

d

P

H

J

r

O

d>rÛ k>0 d
1. 2.

1. 2.

H

P

5.2. Potencia y tangente k = Pot C(P0) = PH · PJ = (d - r) × (d + r) = d 2 - r 2 P

T

P

Si es d la distancia de P al centro y r el radio de la circunferencia, se tiene (b)

T

A

r

Figura 38.

B

d

B'

(a)

O

A'

PA PB ' = Þ PA × PB = PA '×PB ' PA ' PB

Figura 40.

Supongamos que en la figura 40a hacemos pivotar una secante pasando por P alrededor del punto P. La posición límite es cuando los puntos de corte A y B se confunden en uno solo T, en cuyo caso la recta PT es la tangente a la circunferencia desde P. Entonces sabemos que la tangente en T es perpendicular al radio OT, con lo cual el triángulo PTO es rectángulo en T y por tanto

P

A

B

En efecto, los ángulos inscritos con vértices en A y A´ son iguales por subtender el mismo arco BB´. Los triángulos PA´B y PAB´, que tienen además en común el ángulo en P son semejantes, de donde se sigue

PT2 = PO2 – OT2 = d 2 – r2 = k = Pot C (P)

Luego: “La potencia de un punto con respecto a una circunferencia es igual al cuadrado del segmento de la tangente trazada desde P a la circunferencia”. Veamos que la potencia no depende de la secante trazada.



314


5.3. Eje y centro radical Se define el eje radical de dos circunferencias C y C’ no concéntricas como el lugar geométrico de los puntos del plano con igual potencia respecto de ambas. Vamos a justificar que el lugar geométrico anterior es una recta P P

(a)

(b)

d'

d O

r

r'

O'

O'

O M H

Figura 41. Un punto P de dicho lugar geométrico debe cumplir Pot C ( P ) = Pot C ' ( P ) Û d 2 – r2 = d '2 – r'2 Û d 2 – d '2= r2 – r'2 Û PO 2 – PO '2= cte Si trazamos desde P la mediana del triángulo OO’P (figura 41b), tendremos æ OO ' ö æ OO ' ö OO ' ÷ + PM 2 + 2 ÷ + PM 2 + OO '×MH d 2 = PO 2 = ç MH = ç è 2 ø è 2 ø 2 2

2

æ OO ' ö æ OO ' ö OO ' ÷ + PM 2 – 2 ÷ + PM 2 – OO × ' MH d '2= PO '2= ç MH = ç è 2 ø è 2 ø 2 2

2

Restando m.a.m. se llega a d 2 – d '2= cte Û 2OO '×MH = cte Û MH = cte. Pero para que la proyección MH de la mediana sobre OO’sea constante el punto P debe recorrer una recta perpendicular a OO’. La distancia entre el pie H del eje radical y el punto medio M del segmento que une los centros viene dada por: MH =

r2 – r'2 2OO '

(Relación de Euler)

Llamamos centro radical de tres circunferencias cuyos centros no estén alineados al lugar geométrico de los puntos del plano que tienen igual potencia respecto de las tres circunferencias. Resulta ser el punto en que se cortan los ejes radicales de dichas circunferencias tomadas dos a dos (figura 42a).

(a)

(b)

(c)


315


316


Figura 45.

En caso de que los centros estén alineados, los ejes radicales pueden ser paralelos (figura 42b) y el centro radical será un punto impropio (punto del infinito), o bien coincidentes, en cuyo caso no hay un centro radical único sino que habría infinitos puntos de igual potencia respecto a las tres circunferencias (figura 42c). El trazado del eje radical es sencillo:

En caso de que ambas circunferencias sean tangentes, razonando igual veremos que el eje radical es la perpendicular pasando por el punto de tangencia a la recta que une los centros, es decir la tangente común a ambas circunferencias.

Pot C ( M 1 ) = M 1T1 = M 1T '1= Pot C ' ( M 1 )

O'

O T1

Pot C ( M 2 ) = M 2T2 = M 2T '2= Pot C ' ( M 2 )

–

(a)

M1

En efecto:

T1'

Exteriores Se trazan dos circunferencias auxiliares que corten a las dos dadas. Entonces bastaría unir los centros radicales de las ternas C, C ', C1 y C, C ', C2 (figura 44b). Es fácil probar en este caso que el eje radical es la recta determinada por los puntos medios de los segmentos de tangente común (figura 45).

–

En caso de que las circunferencias C1 y C2 no tengan punto en común, podemos distinguir.

(b)

(c) b)

T2'

M2

En caso de que las dos circunferencias sean secantes, ambos puntos de corte tienen potencia cero respecto de las dos circunferencias, por lo cual pertenecen al eje radical, con lo que éste será la recta que los une.

T2

–

Figura 44.

Figura 43. Interiores Trazamos una circunferencia auxiliar C que corte a las dos dadas. Los ejes radicales de C1 y C y de C2 y C, que se obtienen en cada caso uniendo los puntos de corte, son dos rectas secantes en P (siempre que C1 y C2 no sean concéntricas). La perpendicular desde P a la línea de centros O1O2 es el eje radical de C1 y C (figura 44a).

(a)

(b)

(a) a)

a)

(b)

Figura 43. Interiores Trazamos una circunferencia auxiliar C que corte a las dos dadas. Los ejes radicales de C1 y C y de C2 y C, que se obtienen en cada caso uniendo los puntos de corte, son dos rectas secantes en P (siempre que C1 y C2 no sean concéntricas). La perpendicular desde P a la línea de centros O1O2 es el eje radical de C1 y C (figura 44a). Figura 44.

Exteriores Se trazan dos circunferencias auxiliares que corten a las dos dadas. Entonces bastaría unir los centros radicales de las ternas C, C ', C1 y C, C ', C2 (figura 44b). Es fácil probar en este caso que el eje radical es la recta determinada por los puntos medios de los segmentos de tangente común (figura 45). En caso de que ambas circunferencias sean tangentes, razonando igual veremos que el eje radical es la perpendicular pasando por el punto de tangencia a la recta que une los centros, es decir la tangente común a ambas circunferencias.

–

En caso de que las dos circunferencias sean secantes, ambos puntos de corte tienen potencia cero respecto de las dos circunferencias, por lo cual pertenecen al eje radical, con lo que éste será la recta que los une.

–

M1

–

(c) (b)

T1

En caso de que las circunferencias C1 y C2 no tengan punto en común, podemos distinguir.

b)

T1'

En efecto:

O'

O

Pot C ( M 1 ) = M 1T1 = M 1T '1= Pot C ' ( M 1 )

(a)

En caso de que los centros estén alineados, los ejes radicales pueden ser paralelos (figura 42b) y el centro radical será un punto impropio (punto del infinito), o bien coincidentes, en cuyo caso no hay un centro radical único sino que habría infinitos puntos de igual potencia respecto a las tres circunferencias (figura 42c). El trazado del eje radical es sencillo: T2

M2

T2'

Pot C ( M 2 ) = M 2T2 = M 2T '2= Pot C ' ( M 2 )

Figura 45.



316

Geometría de la circunferencia El centro radical de tres circunferencias se obtiene a partir de los ejes radicales

Figura 46.

5.4. Condición para que cuatro puntos sean cocíclicos Dados cuatro puntos A, B, C, D que estén sobre la misma circunferencia. Si trazamos las rectas AB y CD y ambas se cortan en un punto P (figura 47a), entonces, como la potencia de P respecto de la circunferencia no depende de la secante desde P, se cumplirá: PA · PB = PC · PD

[1]

Pudiera ocurrir, sin embargo, que AB y CD sean paralelas (figura 47b). Unimos entonces A con C y B con D. Obtenemos el punto Q (figura 47c), cumpliéndose: QA · QC = QB · QD a)

A

[2]

b)

B

P

c) A

B

A

P

C D

B

C

D

D

C Figura 47.

Resulta que para que los cuatro puntos sean cocíclicos es suficiente que se cumpla alguna de las dos condiciones [1] o [2]

5.5. Circunferencias ortogonales Dos circunferencias secantes son ortogonales si las respectivas tangentes en los puntos de intersección son rectas perpendiculares. Como quiera que hay simetría con respecto a la línea de centros OO', bastaría con que la condición se cumpliese en uno de los dos puntos de corte. La definición dada tiene consecuencias inmediatas. Los radios r y r'y la distancia d entre los centros cumplen la relación pitagórica: d 2 = r2 + r'2

[3]

que es también condición suficiente para que las circunferencias sean ortogonales. TEMARIO DE MATEMÁTICAS. PRUEBA A

A r

r' O'

O d A' Figura 48.

317


318


De lo anterior se deduce Pot C (O ' ) = d 2 – r2 = r'2 y Pot C ' (O ) = d 2 – r'2= r2. Teniendo en cuenta que Pot C (O ) = – r2 y Pot C ' (O ' ) = – r'2, entonces la relación [3] equivale a cualquiera de estas dos: ì x = a + rcos t í î y = b + rsen t

[5]

Pot C (O )+ Pot C ' (O ) = – r2 + r2 = 0

ì x = rcos t Las ecuaciones í definen una curva cuyos puntos verifican x 2 + y 2 = r2 (cos 2 t + sen 2 t ) = r2, î y = rsen t es decir, son las ecuaciones paramétricas de una circunferencia centrada en O(0,0) y de radio r. Asimismo, si en general el centro es el punto (a,b) las ecuaciones paramétricas serían Pot C (O ' )+ Pot C ' (O ' ) = – r'2+r'2= 0

6.2. Ecuaciones paramétricas y ecuación polar

Resulta que “la condición necesaria y suficiente para que dos circunferencias sean ortogonales es que la suma de potencias de uno de los centros con respecto a ambas circunferencias sea cero”. Obviamente, para que una ecuación del tipo [4] defina una circunferencia “real” debe cumplirse la condición M2 + N2 – 4P > 0.

2.

6. ESTUDIO ANALÍTICO DE LA CIRCUNFERENCIA

a= –

M , 2

b= –

N , 2

r=

1 M 2 + N 2 – 4P 2

6.1. Ecuación cartesiana

Sea la circunferencia de centro C(a,b) y radio r > 0. Un punto genérico P(x,y) de dicha circunferencia debe cumplir la ecuación característica d(P,C) = r, lo cual se traduce en la ecuación reducida:

Dada la ecuación en esta forma, es fácil deducir que las coordenadas del centro y el radio vendrían dados por:

1.

y

Observaciones:

( x – a )2 + ( y – b )2 = r2 x 2 + y 2 + Mx+ Ny + P = 0

C(a,b) r

Desarrollando y reordenando los términos llegamos a x 2 + y 2 – 2ax – 2by + a 2 + b 2 – r2 = 0

Ahora llamamos M = –2a, N = –2b, P = a2 + b2 – r2, obtenemos la ecuación cartesiana general de la circunferencia:

Ahora llamamos M = –2a, N = –2b, P = a2 + b2 – r2, obtenemos la ecuación cartesiana general de la circunferencia:

x

Figura 49.

Figura 49.

x

x 2 + y 2 – 2ax – 2by + a 2 + b 2 – r2 = 0

P(x, y)

Desarrollando y reordenando los términos llegamos a

x 2 + y 2 + Mx+ Ny + P = 0

C(a,b) r

[4]

P(x, y)

[4]

( x – a )2 + ( y – b )2 = r2 Observaciones:

Sea la circunferencia de centro C(a,b) y radio r > 0. Un punto genérico P(x,y) de dicha circunferencia debe cumplir la ecuación característica d(P,C) = r, lo cual se traduce en la ecuación reducida: 1.

Dada la ecuación en esta forma, es fácil deducir que las coordenadas del centro y el radio vendrían dados por: M N 1 a= – , b= – , r= M 2 + N 2 – 4P 2 2 2

2.

Obviamente, para que una ecuación del tipo [4] defina una circunferencia “real” debe cumplirse la condición M2 + N2 – 4P > 0.

y

6.1. Ecuación cartesiana

6. ESTUDIO ANALÍTICO DE LA CIRCUNFERENCIA

Resulta que “la condición necesaria y suficiente para que dos circunferencias sean ortogonales es que la suma de potencias de uno de los centros con respecto a ambas circunferencias sea cero”.

6.2. Ecuaciones paramétricas y ecuación polar

ì x = rcos t Las ecuaciones í definen una curva cuyos puntos verifican x 2 + y 2 = r2 (cos 2 t + sen 2 t ) = r2, î y = rsen t es decir, son las ecuaciones paramétricas de una circunferencia centrada en O(0,0) y de radio r. Asimismo, si en general el centro es el punto (a,b) las ecuaciones paramétricas serían Pot C (O ' )+ Pot C ' (O ' ) = – r'2+r'2= 0 Pot C (O )+ Pot C ' (O ) = – r2 + r2 = 0

De lo anterior se deduce Pot C (O ' ) = d 2 – r2 = r'2 y Pot C ' (O ) = d 2 – r'2= r2. Teniendo en cuenta que Pot C (O ) = – r2 y Pot C ' (O ' ) = – r'2, entonces la relación [3] equivale a cualquiera de estas dos: ì x = a + rcos t í î y = b + rsen t



318

[5]

Geometría de la circunferencia Si tomamos como polo el centro de la circunferencia, el cambio a polares x = r cos q,

y = r sen q

nos lleva, sustituyendo en la ecuación x + y = r , hasta la ecuación polar: 2

2

2

r= r = cte

[6]

6.3. Rectas tangente y normal en un punto Vamos a obtener la ecuación de la recta tangente a la circunferencia de ecuación ( x – a )2 + ( y – b )2 = r2 en un punto P0 ( x0 , y0 ) de la misma.

t P0

n

C C

Figura 50. Basta tener en cuenta que la tangente en P0 es, en el caso de la circunferencia, perpendicular al radio correspondiente al punto de tangencia, es decir, al vector ¾ ¾®

CP0 = ( x0 – a , y0 – b ) por lo que la pendiente de la recta tangente en P0 es mt = –

x0 – a y0 – b

Nota: idéntico resultado obtenemos si derivamos implícitamente y con respecto a x en la ecuación reducida 2( x – a )+ 2( y – b ) y'= 0, pues la pendiente de la tangente será el valor de la derivada y' en el punto P0 ( x0 , y0 ). Por tanto la ecuación de dicha tangente es y – y0 = – t:

x0 – a ( x – x0 ), o sea: y0 – b

( x – x0 )( x0 – a )+ ( y – y0 )( y0 – b ) = 0

[7]

¾ ¾®

Para la normal hemos de tomar como pendiente la del vector CP0 , o sea mn = con lo que la ecuación de la normal es y – y0 = – n:

y0 – b x0 – a

y0 – b ( x – x0 ), que se expresa así: x0 – a

( x – x0 )( y0 – b ) – ( y – y0 )( x0 – a ) = 0

[8]

La ecuación de la recta tangente puede ponerse de otra manera, si tenemos en cuenta que P0 es de la circunferencia por lo que cumple la condición ( x0 – a )2 + ( y0 – b )2 = r2, que sumada miembro a miembro a [7] nos lleva a la ecuación de la recta tangente en la forma ( x0 – a )( x – a )+ ( y0 – b )( y – b ) = r2 TEMARIO DE MATEMÁTICAS. PRUEBA A

[9]

319


320


¾ ¾® r entonces n = (–2a + 2a ',– 2b + 2b ' ) = 2( a '– a , b '– b ) = 2CC ', con lo que se prueba que el eje radical es perpendicular a la recta que une los centros de ambas circunferencias.

6.4. Expresión analítica de la potencia de un punto

Para obtener una expresión analítica sencilla de la potencia tomamos una secante que pase por el centro de la circunferencia. M = –2a ,

N = –2b ,

M '= –2a '

N '= –2b '

r Un vector normal a dicha recta es n = ( M – M ', N – N ' ). Teniendo en cuenta que eje radical ® ( M – M ' )x+ ( N – N ' ) y + ( P – P ' ) = 0

r

d

[11]

P0

Si las respectivas ecuaciones cartesianas son x2 + y2 + Mx + Ny + P = 0 y x2 + y2 + M´x + Ný + P´ = 0, la ecuación del eje radical se obtiene igualando los primeros miembros, de donde resulta:

6.5. Ecuación del eje radical

Figura 51.

Desarrollando, y teniendo en cuenta que u12 + u22 = 1 por ser u unitario, tendremos una ecuación de segundo grado en l cuyo coeficiente en l2 es 1 y cuyo término independiente es x02 + y02 + Mx0 + Ny0 + P. Entonces, el producto de las soluciones de esa ecuación que es l1l 2 = x02 + y02 + Mx0 + Ny0 + P es la potencia PotC(P0), que como vemos no depende de u, es decir, no depende de la secante elegida. Si llamamos d a la distancia de P0 ( x0 , y0 ) al centro C(a,b), se tendrá:

k = Pot C ( P0 ) = ( d – r )× ( d + r ) = d 2 – r2

( x0 + lu1 )2 + ( y0 + lu2 )2 + M ( x0 + lu1 )+ N ( y0 + lu2 )+ P = 0

de donde:

Pot C ( P0 ) = ( x0 – a )2 + ( y0 – b )2 – r2

Recíprocamente, los puntos de una recta que pase por P0 ( x0 , y0 ) y tenga de vector director unitario u = ( u1, u2 ) vienen dados por ( x0 + lu1, y0 + lu2 ). Las intersecciones de dicha recta con la circunferencia se obtienen con los valores de l que sean soluciones de la ecuación

Es decir, la potencia resulta ser el valor que se obtiene al sustituir las coordenadas del punto dado en el primer miembro de la ecuación cartesiana de la circunferencia, o sea: Pot C ( P0 ) = x02 + y02 + Mx0 + Ny0 + P

[10]

Pot C ( P0 ) = x02 + y02 + Mx0 + Ny0 + P

[10]

Es decir, la potencia resulta ser el valor que se obtiene al sustituir las coordenadas del punto dado en el primer miembro de la ecuación cartesiana de la circunferencia, o sea:

Recíprocamente, los puntos de una recta que pase por P0 ( x0 , y0 ) y tenga de vector director unitario u = ( u1, u2 ) vienen dados por ( x0 + lu1, y0 + lu2 ). Las intersecciones de dicha recta con la circunferencia se obtienen con los valores de l que sean soluciones de la ecuación Pot C ( P0 ) = ( x0 – a )2 + ( y0 – b )2 – r2

de donde:

( x0 + lu1 )2 + ( y0 + lu2 )2 + M ( x0 + lu1 )+ N ( y0 + lu2 )+ P = 0 k = Pot C ( P0 ) = ( d – r )× ( d + r ) = d 2 – r2

Desarrollando, y teniendo en cuenta que u12 + u22 = 1 por ser u unitario, tendremos una ecuación de segundo grado en l cuyo coeficiente en l2 es 1 y cuyo término independiente es x02 + y02 + Mx0 + Ny0 + P. Entonces, el producto de las soluciones de esa ecuación que es l1l 2 = x02 + y02 + Mx0 + Ny0 + P es la potencia PotC(P0), que como vemos no depende de u, es decir, no depende de la secante elegida. Si llamamos d a la distancia de P0 ( x0 , y0 ) al centro C(a,b), se tendrá: Figura 51.

6.5. Ecuación del eje radical

Si las respectivas ecuaciones cartesianas son x2 + y2 + Mx + Ny + P = 0 y x2 + y2 + M´x + Ný + P´ = 0, la ecuación del eje radical se obtiene igualando los primeros miembros, de donde resulta:

P0

d

eje radical ® ( M – M ' )x+ ( N – N ' ) y + ( P – P ' ) = 0

[11]

r

r Un vector normal a dicha recta es n = ( M – M ', N – N ' ). Teniendo en cuenta que M = –2a ,

N = –2b ,

M '= –2a '

N '= –2b '

Para obtener una expresión analítica sencilla de la potencia tomamos una secante que pase por el centro de la circunferencia.

r entonces n = (–2a + 2a ',– 2b + 2b ' ) = 2( a '– a , b '– b ) = 2CC ', con lo que se prueba que el eje radical es perpendicular a la recta que une los centros de ambas circunferencias. ¾ ¾®

6.4. Expresión analítica de la potencia de un punto



320


6.6. Condición de ortogonalidad de dos circunferencias Analíticamente, si las ecuaciones generales de las circunferencias son C º x 2 + y 2 + Mx + Ny + P = 0 ; C'º x 2 + y 2 + M ' x + N ' y + P '= 0 æ M Nö El centro de C, que esç – ,– ÷, cumple: è 2 2ø Pot C (O ) =

M2 N2 M2 N2 + – – +P 4 4 2 2

Pot C ' (O ) =

M 2 N 2 MM ' NN ' +P' + – – 4 4 2 2

La condición necesaria y suficiente para que las circunferencias sean ortogonales Pot C (O )+ Pot C ' (O ) = 0 se traduce en

MM + ' NN ' = P + P '. 2


321

TEMA

41 Movimientos en el plano. Composición de movimientos. Aplicación al estudio de las teselaciones en el plano. Frisos y mosaicos




324



INTRODUCCIÓN

2.

TRANSFORMACIONES GEOMÉTRICAS EN EL PLANO EUCLÍDEO

3.

TRASLACIONES EN EL PLANO 3.1. Definición 3.2. Propiedad característica 3.3. Consecuencias 3.4. Elementos invariantes 3.5. El grupo de las traslaciones

4.

GIROS EN EL PLANO 4.1. Definición 4.2. Propiedad característica 4.3. Consecuencias 4.4. Elementos invariantes 4.5. El grupo de los giros de un mismo centro 4.6. La simetría central como caso particular de giro

5.

SIMETRÍAS AXIALES 5.1. Definición 5.2. Propiedades 5.3. Elementos invariantes

6.

COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS AXIALES 6.1. Composición de dos simetrías axiales 6.2. Composición de dos giros 6.3. Composición de dos simetrías centrales 6.4. Composición de traslación y giro

APLICACIÓN AL ESTUDIO DE LAS TESELACIONES DEL PLANO. FRISOS Y MOSAICOS 9.1. Generación de frisos 9.2 Teselaciones del plano 9.3. Teselaciones regulares y semirregulares 9.4. Teselaciones pararregulares 9.5. Generación de mosaicos

9.

ESTUDIO ANALÍTICO DE LAS ISOMETRÍAS EN EL PLANO 8.1. Ecuaciones de la traslación 8.2. Ecuaciones del giro 8.3. Ecuaciones de la simetría central 8.4. Ecuaciones de la simetría axial 8.5. Estudio matricial general

8.

EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL PLANO 7.1. Isometrías directas e inversas 7.2. El grupo de los movimientos en el plano 7.3. Descomposición de una isometría en producto de simetrías axiales 7.4. Caracterización por los puntos dobles 7.5. Igualdad o congruencia de figuras planas

7.

COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS AXIALES 6.1. Composición de dos simetrías axiales 6.2. Composición de dos giros 6.3. Composición de dos simetrías centrales 6.4. Composición de traslación y giro

6.

SIMETRÍAS AXIALES 5.1. Definición 5.2. Propiedades 5.3. Elementos invariantes

5.

7.

EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL PLANO 7.1. Isometrías directas e inversas 7.2. El grupo de los movimientos en el plano 7.3. Descomposición de una isometría en producto de simetrías axiales 7.4. Caracterización por los puntos dobles 7.5. Igualdad o congruencia de figuras planas

8.

ESTUDIO ANALÍTICO DE LAS ISOMETRÍAS EN EL PLANO 8.1. Ecuaciones de la traslación 8.2. Ecuaciones del giro 8.3. Ecuaciones de la simetría central 8.4. Ecuaciones de la simetría axial 8.5. Estudio matricial general

9.

APLICACIÓN AL ESTUDIO DE LAS TESELACIONES DEL PLANO. FRISOS Y MOSAICOS 9.1. Generación de frisos 9.2 Teselaciones del plano 9.3. Teselaciones regulares y semirregulares 9.4. Teselaciones pararregulares 9.5. Generación de mosaicos

GIROS EN EL PLANO 4.1. Definición 4.2. Propiedad característica 4.3. Consecuencias 4.4. Elementos invariantes 4.5. El grupo de los giros de un mismo centro 4.6. La simetría central como caso particular de giro

4.

TRASLACIONES EN EL PLANO 3.1. Definición 3.2. Propiedad característica 3.3. Consecuencias 3.4. Elementos invariantes 3.5. El grupo de las traslaciones

3.

TRANSFORMACIONES GEOMÉTRICAS EN EL PLANO EUCLÍDEO

2.

INTRODUCCIÓN

1.



324

Movimientos en el plano

1. INTRODUCCIÓN Es de sobra conocido el culto que los geómetras griegos rindieron a la regularidad de las formas. Así, pues, la geometría platónica diviniza la “simetría” como característica fundamental de las figuras y cuerpos geométricos. Los esfuerzos de Euclides (siglo III a.C.) por recopilar y organizar el conocimiento geométrico se vieron cristalizados en los Elementos. El enfoque sistemático del saber geométrico en definiciones, postulados y teoremas perduró toda la Edad Antigua, Media y Moderna, llegando su influencia hasta hoy. La mayor parte de las proposiciones del libro I se han venido incluyendo en los programas de geometría de nivel medio, como por ejemplo los teoremas relativos a congruencia de triángulos. No obstante, Euclides no introdujo entre sus axiomas ninguno que justificara el método de superposición de figuras en el estudio de la congruencia. La perspectiva del estudio de la Geometría desde un punto de vista sintético, aplicando un modelo hipotético-deductivo, a la manera de Euclides, pasa por el estudio de propiedades y relaciones entre elementos geométricos (puntos, rectas, planos, etc.), partiendo de otras que se admiten como ciertas (axiomas). Aunque en el siglo XVI el arte es el motor de nuevas geometrías (descriptiva, proyectiva...), con Descartes alcanza su punto feliz la aritmetización de la Geometría, caminando hacia una progresiva algebrización que culmina en el fin del divorcio Aritmética-Geometría. En la enseñanza surge el debate entre la perseverancia en los Elementos, representada por el escolasticismo conservador y una tendencia “modernizadora” hacia los métodos analíticos. Pero a finales del siglo XIX, surge la figura de Félix Klein (1849-1925), quien propugna un concepto unificador de geometría: “Un espacio y unas transformaciones”. Trasladando el objeto de estudio desde las figuras a las transformaciones y combinando los progresos de la geometría proyectiva con los de la teoría de grupos, Klein aporta un sentido dinámico e innovador al estudio de la Geometría. Klein dio en 1872 una lección inaugural en la universidad alemana de Erlangen. En su disertación, conocida después como Erlangen Programm, hizo una sistematización y jerarquización de las geometrías, mediante grupos y subgrupos, concibiendo como objeto de cada una el estudio de propiedades invariantes respecto de un determinado grupo de transformaciones, y considerando cada geometría como subgeometría de otra. Clasificar geometrías es, pues, clasificar grupos de transformaciones. Así, por ejemplo, la Topología es la geometría de los homeomorfismos o aplicaciones bicontinuas, que constituyen un grupo de transformaciones que conserva la conexión (deformar sin cortar). En la Geometría Proyectiva, las transformaciones proyectivas o proyectividades constituyen un grupo que conserva la alineación. El grupo de transformaciones afines o afinidades conserva el paralelismo y caracteriza a la geometría conocida como “geometría afín”. Dentro de ésta se incluye la “geometría de la semejanza”. Las transformaciones que aquí se manejan son de la forma: ì x' = ax + by + c í î y' = dx + ey + f con la restricción ae – bd ¹ 0. Si imponemos la restricción más fuerte de que ae – bd = 1, entonces tendremos las transformaciones rígidas o movimientos, que conservan la forma y el tamaño. La geometría euclídea plana es, pues, la geometría de las congruencias, que consiste en el estudio de propiedades de las figuras, incluidas las áreas y longitudes, que permanecen invariantes bajo el grupo anterior, engendrado por las traslaciones y rotaciones en el plano. Esto es equivalente al axioma, no postulado por Euclides, de que las figuras no varían en sus propiedades cuando se las somete a movimientos en el plano. Por tanto, la geometría euclídea, desde el punto de vista de Klein, es sólo un caso especial de la geometría afín, y ésta a su vez un caso especial de una geometría aún más general, la geometría proyectiva. Cabe señalar que todas estas propiedades (paralelismo, razón simple, etc.) eran ya conocidas por Pappus un milenio y medio antes, pero carecía de la menor noción del concepto de grupo, que fue el que hizo posible tal clasificación de las geometrías.


325

326



En el presente tema vamos a estudiar esas transformaciones que definen la geometría de las congruencias, es decir, las traslaciones y los giros. Pero para obtener los giros y las traslaciones son básicas las reflexiones o simetrías axiales. Las reflexiones en la naturaleza reflejan simplicidad y armonía. Hoy sabemos que hay simetría en el microcosmos de la célula, en la estructura molecular de las sustancias químicas y en los animales y vegetales. La simetría es un instrumento del diseño de máquinas. El arte, la danza, la música, etc., utilizan la idea de simetría como elemento estético. De ahí que en este tema también se van a estudiar unas aplicaciones relevantes de los movimientos en el plano. Nos referimos a los frisos y mosaicos. Ambos conforman bellos diseños decorativos ya utilizados por egipcios, griegos y árabes, y muy extendidos en nuestros días. Se forman a partir de un elemento principal que se repite indefinidamente por los movimientos antes citados. Diseños de elaboración compleja se reducen a trasladar adecuadamente pequeñas zonas de dibujo. Los programas actuales de diseño asistido por ordenador contienen, entre sus herramientas más elementales, las reflexiones, giros o traslaciones. El embaldosado y decoración de superficies planas es un problema matemático que se ha resuelto, por cuestiones estéticas, religiosas, etc., dentro de cada época o civilización. Así, por ejemplo, el arte islámico puso empeño y énfasis en la creación de motivos decorativos, desarrollando espectaculares técnicas en el diseño de mosaicos. Un claro exponente lo tenemos en La Alhambra, donde podemos apreciar en su suntuosa decoración toda la belleza del arte nazarí o nazarita, donde predominan las formas geométricas. También los romanos utilizaron los mosaicos para recubrir suelos y paredes. De hecho el término latino tesella (con el que los romanos denominaban a los azulejos que utilizaban) es el origen del vocablo teselación con el que también se denomina al pavimentado o recubrimiento de un plano. Los mosaicos o teselaciones aparecen también en la naturaleza. Pueden apreciarse en los panales de las abejas, en las estructuras celulares, en las redes cristalinas, etc. Actualmente la técnica del mosaico se sigue utilizando en el pavimentado de suelos, alicatado de paredes, motivos decorativos de tejidos…, y en mil detalles relacionados con el diseño artístico. Son dignas de resaltar las excepcionales e innumerables creaciones del genial artista holandés Maurits Cornelis Escher (1898-1972). El estudio de los movimientos en el plano a través de los frisos y mosaicos ofrece gran interés desde un punto de vista didáctico como elemento motivador. Pero más allá del aspecto recreativo, el problema de recubrir completamente el plano con figuras, poligonales o no, ha experimentado un espectacular desarrollo a partir de la última mitad del siglo XX. El cristalógrafo ruso Fedorov hizo en 1891 el primer tratamiento matemático, cuando demostró que no hay más que 17 estructuras básica para las infinitas formas de mosaicos planos periódicos. Fueron G. Polya y P. Niggli, ya en el siglo XX, quienes descubrieron los 17 grupos de isometrías del plano. A partir de ahí empezaron a publicarse resultados de investigaciones. Por ejemplo, H. Weyl descubrió que las 17 posibilidades eran conocidas por los artesanos del viejo Egipto. También se sabe que en la cultura china aparecen 14 modelos de los anteriores y que en La Alhambra de Granada hay una representación de cada uno de los 17. En cualquier caso el estudio de las teselaciones continúa. El propio Escher llegó incluso a realizar unos mosaicos basados en geometrías no euclídeas. Cabe destacar también a Roger Penrose por sus investigaciones sobre teselaciones aperiódicas, así como la Sociedad Andaluza de Profesores de Matemáticas por sus monografías sobre la geometría del arte nazarí de La Alhambra.

Al igual que las aplicaciones entre conjuntos de números reciben el nombre de funciones, las aplicaciones entre conjuntos de puntos, del plano o del espacio, suelen llamarse transformaciones geométricas. Precisaremos esto definiendo una transformación geométrica en el plano como cualquier aplicación biyectiva f : E2 ® E2 del plano euclídeo E2 en sí mismo. Dado un punto P Î E2, su imagen P '= f ( P ) recibe el nombre de punto homólogo o transformado de P mediante la transformación f . En particular la aplicación identidad i: E2 ® E2 es la transformación geométrica en la que el homólogo de cualquier punto es él mismo.

2. TRANSFORMACIONES GEOMÉTRICAS EN EL PLANO EUCLÍDEO

En el presente tema vamos a estudiar esas transformaciones que definen la geometría de las congruencias, es decir, las traslaciones y los giros. Pero para obtener los giros y las traslaciones son básicas las reflexiones o simetrías axiales. Las reflexiones en la naturaleza reflejan simplicidad y armonía. Hoy sabemos que hay simetría en el microcosmos de la célula, en la estructura molecular de las sustancias químicas y en los animales y vegetales. La simetría es un instrumento del diseño de máquinas. El arte, la danza, la música, etc., utilizan la idea de simetría como elemento estético. De ahí que en este tema también se van a estudiar unas aplicaciones relevantes de los movimientos en el plano. Nos referimos a los frisos y mosaicos. Ambos conforman bellos diseños decorativos ya utilizados por egipcios, griegos y árabes, y muy extendidos en nuestros días. Se forman a partir de un elemento principal que se repite indefinidamente por los movimientos antes citados. Diseños de elaboración compleja se reducen a trasladar adecuadamente pequeñas zonas de dibujo. Los programas actuales de diseño asistido por ordenador contienen, entre sus herramientas más elementales, las reflexiones, giros o traslaciones. El embaldosado y decoración de superficies planas es un problema matemático que se ha resuelto, por cuestiones estéticas, religiosas, etc., dentro de cada época o civilización. Así, por ejemplo, el arte islámico puso empeño y énfasis en la creación de motivos decorativos, desarrollando espectaculares técnicas en el diseño de mosaicos. Un claro exponente lo tenemos en La Alhambra, donde podemos apreciar en su suntuosa decoración toda la belleza del arte nazarí o nazarita, donde predominan las formas geométricas. También los romanos utilizaron los mosaicos para recubrir suelos y paredes. De hecho el término latino tesella (con el que los romanos denominaban a los azulejos que utilizaban) es el origen del vocablo teselación con el que también se denomina al pavimentado o recubrimiento de un plano. Los mosaicos o teselaciones aparecen también en la naturaleza. Pueden apreciarse en los panales de las abejas, en las estructuras celulares, en las redes cristalinas, etc. Actualmente la técnica del mosaico se sigue utilizando en el pavimentado de suelos, alicatado de paredes, motivos decorativos de tejidos…, y en mil detalles relacionados con el diseño artístico. Son dignas de resaltar las excepcionales e innumerables creaciones del genial artista holandés Maurits Cornelis Escher (1898-1972). El estudio de los movimientos en el plano a través de los frisos y mosaicos ofrece gran interés desde un punto de vista didáctico como elemento motivador. Pero más allá del aspecto recreativo, el problema de recubrir completamente el plano con figuras, poligonales o no, ha experimentado un espectacular desarrollo a partir de la última mitad del siglo XX. El cristalógrafo ruso Fedorov hizo en 1891 el primer tratamiento matemático, cuando demostró que no hay más que 17 estructuras básica para las infinitas formas de mosaicos planos periódicos. Fueron G. Polya y P. Niggli, ya en el siglo XX, quienes descubrieron los 17 grupos de isometrías del plano. A partir de ahí empezaron a publicarse resultados de investigaciones. Por ejemplo, H. Weyl descubrió que las 17 posibilidades eran conocidas por los artesanos del viejo Egipto. También se sabe que en la cultura china aparecen 14 modelos de los anteriores y que en La Alhambra de Granada hay una representación de cada uno de los 17. En cualquier caso el estudio de las teselaciones continúa. El propio Escher llegó incluso a realizar unos mosaicos basados en geometrías no euclídeas. Cabe destacar también a Roger Penrose por sus investigaciones sobre teselaciones aperiódicas, así como la Sociedad Andaluza de Profesores de Matemáticas por sus monografías sobre la geometría del arte nazarí de La Alhambra.

2. TRANSFORMACIONES GEOMÉTRICAS EN EL PLANO EUCLÍDEO

Al igual que las aplicaciones entre conjuntos de números reciben el nombre de funciones, las aplicaciones entre conjuntos de puntos, del plano o del espacio, suelen llamarse transformaciones geométricas. Precisaremos esto definiendo una transformación geométrica en el plano como cualquier aplicación biyectiva f : E2 ® E2 del plano euclídeo E2 en sí mismo. Dado un punto P Î E2, su imagen P '= f ( P ) recibe el nombre de punto homólogo o transformado de P mediante la transformación f . En particular la aplicación identidad i: E2 ® E2 es la transformación geométrica en la que el homólogo de cualquier punto es él mismo.



326

Movimientos en el plano Dadas dos transformaciones f y g, sabemos que la transformación producto o compuesta g o f se define de la siguiente manera: si un punto P se transforma en P' mediante f , y éste lo hace en P '' mediante g, entonces el homólogo de P mediante g o f es P''. Es decir:

f

g

E2

E2

E2

P

P'

P''

( g o f )( P ) = g [ f ( P )] = g ( P ' ) = P ''

gof La composición de transformaciones no es conmutativa. En general, las transformaciones g o f y f o g son distintas. Al definir una transformación geométrica f como una biyección, garantizamos la existencia de la transformación inversa o recíproca f –1, que cumple f o f –1 = f –1 o f = i. Si la transformación directa asocia al punto P su homólogo P', la inversa actúa asociando a P ' su antihomólogo o preimagen P. Vamos a dar a continuación algunas definiciones que se van a utilizar en el presente tema:

–

Si un punto P coincide con su homólogo, es decir f ( P )= P, decimos que se trata de un punto doble, fijo o invariante. Puede hablarse, en general, de figura invariante para una transformación f como aquella figura que se transforma en sí misma. Obviamente una transformación en la que todos los puntos del plano son dobles, no puede ser otra que la identidad i.

–

Una transformación geométrica es involutiva si f o f = i.

–

Si una transformación f conserva las distancias se denomina transformación isométrica, o simplemente isometría. Esto es, si para cualesquiera dos puntos P y Q del plano se tiene: d ( P ,Q )= = d ( f ( P ), f (Q )). Como manejaremos la métrica euclídea, lo anterior es equivalente a poner PQ = P 'Q ' .

–

Análogamente, si f conserva los ángulos recibe el nombre de transformación conforme o isogonal. Esto es, si dados tres puntos M , N , P cualesquiera y sus respectivos homólogos M ', N ', P ', se verifica: ÐMNP = ÐM ' N ' P '. Nota: conviene recordar que para un ángulo en el plano, definido como un par de semirrectas ( r, s ) con un origen común, se establecen dos sentidos u orientaciones. Se suele tomar positivo el sentido antihorario, es decir, el contrario al de las agujas del reloj.

s

O

r

+ O r

s

Figura 1.

En el caso de una transformación isogonal, diremos que es directa si conserva tanto la medida de los ángulos como su orientación. En caso de que invierta la orientación, se denomina inversa. TEMARIO DE MATEMÁTICAS. PRUEBA A

327


328


ralelogramo. Entonces tendríamos tambiénë QQ 'û=ë PP 'û y por consir guienteë QQ 'û= u. Resulta que la transformación T sería la traslación Tur .

Figura 4.

3. TRASLACIONES EN EL PLANO

u

P

3.1. Definición

P´

Dado otro punto Q cualquiera y su homólogo Q '= T (Q ), por cumplirse la condición se tieneë PQ û=ë P 'Q 'û, con lo cual la figura PP 'Q ' P 'es un pa-

r r Sea u un vector libre del plano. Se llama traslación de vector u a la transformación geométrica T : E2 ® E2 definida como sigue: r u

Probemos ahora que la condición es también suficiente. r Sea P un punto arbitrario y su homólogo P '= T ( P ) y denominemos u al vectorë PP'û. Q´

u

Q´

P

Q

P´

A cada punto P del plano le hacemos corresponder r un punto homólogo P' tal queë PP 'û= u. Escribimos, por tanto: r Tur ( P ) = P ' Ûë PP 'û= u

Igualando, tendremos inmediatamenteë PQ û=ë P 'Q 'û. Luego la condición es necesaria. Figura 3. P´

M

ë PQ 'û=ë PP 'û+ë P 'Q 'û= ur +ë P 'Q 'û

Q´

–

P

Observaciones:

ë PQ 'û=ë PQ û+ë QQ 'û=ë PQ û+ ur

Q

M´

Evidentemente toda traslación es una biyección del plano E2 en sí mismo, ya que dado un punto r P y un vector libre u, existe un único representante de dicho vector rque tiene su origen en P y, recíprocamente, dado un punto P' existe un único representante de u con extremo en P'. r En particular si el vector que define la traslación es 0(caso trivial), entonces r punto coincide r todo con su homólogo y la transformación Tr0 es la identidad i. En caso de que u ¹ 0, cada punto será distinto de su homólogo. Q

r r En efecto, si T es una traslación de vector u se tieneë PP 'û=ë QQ 'û= u. Además:

–

Para que una transformación geométrica T del plano sea una traslación es condición necesaria y suficiente que el vector determinado por dos puntos cualesquiera sea equipolente al determinado por sus homólogos. Es decir, que para cualesquiera P y Q, se verifiqueë PQ û=ë P 'Q 'û, siendo P '= T ( P ) y Q '= T (Q ).

3.2. Propiedad característica

Para que una transformación geométrica T del plano sea una traslación es condición necesaria y suficiente que el vector determinado por dos puntos cualesquiera sea equipolente al determinado por sus homólogos. Es decir, que para cualesquiera P y Q, se verifiqueë PQ û=ë P 'Q 'û, siendo P '= T ( P ) y Q '= T (Q ).

3.2. Propiedad característica –

Evidentemente toda traslación es una biyección del plano E2 en sí mismo, ya que dado un punto r P y un vector libre u, existe un único representante de dicho vector rque tiene su origen en P y, recíprocamente, dado un punto P' existe un único representante de u con extremo en P'. r En particular si el vector que define la traslación es 0(caso trivial), entonces r punto coincide r todo con su homólogo y la transformación T0r es la identidad i. En caso de que u ¹ 0, cada punto será distinto de su homólogo. r r En efecto, si T es una traslación de vector u se tieneë PP 'û=ë QQ 'û= u. Además:

Q

Q´

Observaciones:

P

P´

M Figura 3.

Q

ë PQ 'û=ë PQ û+ë QQ 'û=ë PQ û+ ur

–

ë PQ 'û=ë PP 'û+ë P 'Q 'û= ur +ë P 'Q 'û

M´

r Tur ( P ) = P ' Ûë PP 'û= u

Igualando, tendremos inmediatamenteë PQ û=ë P 'Q 'û. Luego la condición es necesaria.

P

Q´

u

A cada punto P del plano le hacemos corresponder r un punto homólogo P' tal queë PP 'û= u. Escribimos, por tanto:

Probemos ahora que la condición es también suficiente. r Sea P un punto arbitrario y su homólogo P '= T ( P ) y denominemos u Q´ Q al vectorë PP'û.

P´

r r Sea u un vector libre del plano. Se llama traslación de vector u a la transformación geométrica Tur : E2 ® E2 definida como sigue: 328



Figura 4.

ralelogramo. Entonces tendríamos tambiénë QQ 'û=ë PP 'û y por consir guienteë QQ 'û= u. Resulta que la transformación T sería la traslación Tur .

3. TRASLACIONES EN EL PLANO

P´

u

3.1. Definición

P

Dado otro punto Q cualquiera y su homólogo Q '= T (Q ), por cumplirse la condición se tieneë PQ û=ë P 'Q 'û, con lo cual la figura PP 'Q ' P 'es un pa-


3.3. Consecuencias 1.

Toda traslación es una transformación isométrica. Es inmediata, pues dados dos puntos cualesquiera P yQ, por la propiedad característicaë PQ û=ë P 'Q 'û, y por tanto d ( P ,Q ) = d ( P ',Q ' ).

2.

En una traslación toda recta se transforma en otra recta paralela. Si A y B son dos puntos de la recta r. Para cualquier otro punto X de r se tiene:

ë AX û= të AB û

r´

X´

B´ A´

r

[1]

Mediante la traslación Tur , los puntos A, B y X se transforman en sus homólogos respectivos A', B' y X ', siendo ë A ' X 'û=ë AX û y

X B

ë A ' B 'û=ë AB û(según la propiedad característica). Entonces la igual-

A

dad [1] equivale a

ë A ' X 'û= të A ' B 'û

Figura 5.

lo que prueba que si X está alineado con A y B, entonces X 'está alineado con A'y B'. Hemos probado que si r es la recta determinada por dos puntos A y B, la recta homóloga r'es la determinada por los homólogos A' y B'. Como quiera que ë A ' B 'û=ë AB û, ambas rectas tienen un vector direccional común y son, por lo tanto, paralelas. La recta homóloga r' es la recta determinada por los puntos homólogos A' y B'. Puede concluirse además que dos rectas paralelas son homólogas en infinitas traslaciones, cuyo vector está determinado por un punto cualquiera de la primera y otro cualquiera de la segunda. 3.

Toda traslación es una transformación isogonal directa. Esta propiedad es consecuencia inmediata de la anterior ya que si un ángulo tiene sus lados paralelos a los de otro, ambos ángulos tienen igual medida. Para cualesquiera tres puntos del plano no alineados se tiene: ÐMPQ = ÐM ' P 'Q '. Pero además la traslación conserva la orientación o sentido de los ángulos. Figura 6.

Q¢

Q

M¢

M P¢

P

4.

En una traslación toda circunferencia se transforma en otra circunferencia del mismo radio. Si A es un punto de la circunferencia de centro O y radio r (figura 7), entonces O ' A '= OA = r, por lo que el punto A' pertenece a la circunferencia de centro O' y radio r.

5.

La transformada de la recta tangente a una curva en un punto es la recta tangente a la nueva curva en el punto homólogo. Sobre la curva C se tiene un punto fijo P y otro móvil Qn (figura 8). Sobre la curva homóloga C' los puntos homólogos P' y Qn ' de los mencionados. Por la propiedad característica de la traslación ë PQn û=ë P 'Qn 'û. Si Qn tiende a P también Qn ' tiende a P'. Entonces la secante PQn tiende a la tangente t en P, al mismo tiempo que la secante PQn ' tiende a la tangente t ' en P'. A¢

A O¢ O

Qn

C

Q¢n

P¢

P t


C’

t¢

Figura 8. 329


330


Figura 10.

3.4. Elementos invariantes

P

O

Estableciendo la equivalencia entre ángulos orientados que difieren en un número entero de vueltas, tendremos obviamente GO ,j = GO ,j+ 2kp .

La traslación Tr0 deja invariantes todos los puntos del plano, ya que se trata de la transformación identidad. r r En cambio, si u ¹ 0, para la traslación Tur no hay ningún punto doble o invariante. Sin embargo, cualquier recta paralela al vector que define la traslación es globalmente invariante (se transforma en ella misma), aunque no esté constituida por puntos dobles. Q

j

P´

j

–

En el caso particular de que sea j = 2kp ( k Î Z ) el giro es la transformación identidad i.

–

Todo giro es una biyección de E2 en sí mismo.

– Q´

3.5. El grupo de las traslaciones

Observaciones: O,j

Sean dos traslaciones Tur y Tvr cualesquiera. Mediante la primera todo punto P se transformará en P', r siendoë PP 'û= u, y mediante la segunda el punto P' se transformará a su vez en un tercero P '', siendo ë P ' P ''û= vr. La transformación compuesta o producto de las dadas Tvr o Tur es, como sabemos, la que transforma P en P'', es decir: Denotaremos por G

2. 1.

a esta transformación.

Ð(OP ,OP ') = j.

d (O , P ) = d (O , P ' ).

(Tvr o Tur )( P ) = Tvr [Tur ( P )] = Tvr ( P ' ) = P ''

Dado un punto O del plano y un ángulo orientado j, se denomina giro de centro O y ángulo j a la transformación geométrica que a cada punto P asocia el punto P', tal que: P´´

ë PP ''û=ë PP 'û+ë P ' P ''û= ur + vr

P´

u

4. GIROS EN EL PLANO

P

Ahora bien, para cualquier P el vectorë PP''ûes

v

4.1. Definición

u+v

lo cual prueba que la composición de dos traslaciones es otra traslación definida por el vector suma de las traslaciones dadas:

Figura 9.

Como los vectores libres del plano constituyen grupo abeliano respecto de la suma, en consecuencia las traslaciones en el plano constituyen también un grupo abeliano respecto de la composición, denominar do grupo de las traslaciones del plano ( T ,o ). El elemento neutro en dicho r grupo es la identidad i = T0, y el elemento inverso de Tur es la traslación definida por el vector opuesto – u, es decir Tur–1 = T– ur . Ni que decir tiene que la aplicación (V2 ,+ ) ® (T ,o ), que a cada vector libre del plano asocia la traslación definida por dicho vector, es un isomorfismo de grupos. Tvr o Tur = Tur+ vr

Como los vectores libres del plano constituyen grupo abeliano respecto de la suma, en consecuencia las traslaciones en el plano constituyen también un grupo abeliano respecto de la composición, denominar do grupo de las traslaciones del plano ( T ,o ). El elemento neutro en dicho r grupo es la identidad i = T0, y el elemento inverso de Tur es la traslación definida por el vector opuesto – u, es decir Tur–1 = T– ur . Ni que decir tiene que la aplicación (V2 ,+ ) ® (T ,o ), que a cada vector libre del plano asocia la traslación definida por dicho vector, es un isomorfismo de grupos. Tvr o Tur = Tur+ vr

Figura 9. u

u+v

ë PP ''û=ë PP 'û+ë P ' P ''û= ur + vr

P´

v

4.1. Definición

P

lo cual prueba que la composición de dos traslaciones es otra traslación definida por el vector suma de las traslaciones dadas:

4. GIROS EN EL PLANO

Ahora bien, para cualquier P el vectorë PP''ûes

Dado un punto O del plano y un ángulo orientado j, se denomina giro de centro O y ángulo j a la transformación geométrica que a cada punto P asocia el punto P', tal que: P´´

(Tvr o Tur )( P ) = Tvr [Tur ( P )] = Tvr ( P ' ) = P ''

forma P en P'', es decir:

1.

d (O , P ) = d (O , P ' ).

r siendoë PP 'û= u, y mediante la segunda el punto P' se transformará a su vez en un tercero P'', siendo ë P ' P ''û= vr. La transformación compuesta o producto de las dadas Tvr o Tur es, como sabemos, la que trans2.

Ð(OP ,OP ') = j.

Sean dos traslaciones Tur y Tvr cualesquiera. Mediante la primera todo punto P se transformará en P', Denotaremos por GO,j a esta transformación.

j

3.5. El grupo de las traslaciones

Observaciones:

Q´

–

Todo giro es una biyección de E2 en sí mismo.

–

En el caso particular de que sea j = 2kp ( k Î Z ) el giro es la transformación identidad i.

–

Estableciendo la equivalencia entre ángulos orientados que difieren en un número entero de vueltas, tendremos obviamente GO ,j = GO ,j+ 2kp .

La traslación T0r deja invariantes todos los puntos del plano, ya que se trata de la transformación identidad. r r En cambio, si u ¹ 0, para la traslación Tur no hay ningún punto doble o invariante. Sin embargo, cualquier recta paralela al vector que define la traslación es globalmente invariante (se transforma en ella misma), aunque no esté constituida por puntos dobles.

O

Q

P

Figura 10. 330



j

3.4. Elementos invariantes

P´


4.2. Propiedad característica Son condiciones necesarias y suficientes para que una transformación G sea un giro en el plano que el vector determinado por dos puntos cualesquiera tenga el mismo módulo que el determinado por sus homólogos y que formen un ángulo constante (en magnitud y sentido). Es decir, que para cualesquiera P y Q, se verifiquen: 1.

PQ = P 'Q ' .

2.

Ð(PQ , P 'Q ') = j = cte

siendo P '= G ( P ) y Q '= G (Q ). Veamos que las condiciones son necesarias: Sean dos puntos cualesquiera P y Q y sus homólogos P' y Q'. Según la definición de giro se cumple OP '= OP ; OQ '= OQ ; ÐPOP ' = ÐQOQ ' = j M´

M

a

j P´

Q

a

j O P

Figura 11.

Tal como se observa en la figura 11, tenemos ÐP 'OQ ' = ÐQOQ '– ÐQOP ' = ÐPOP '– ÐQOP ' = ÐPOQ Deducimos que DPOQ = DP 'OQ ', por tener iguales dos lados y el ángulo comprendido. Por tanto PQ = P 'Q ', es decir PQ = P 'Q ' . Trazando OM y OM ' paralelas a PQ y P 'Q ', respectivamente: ÐPOM = a = ÐP 'OM ' y entonces: Ð(PQ , P 'Q ') = ÐMOM '= ÐPOM '– ÐPOM = ÐPOM '– a = (ÐPOP '+ÐP 'OM ') – a = = (ÐPOP +Ð ' P 'OM ') – a = ÐPOP '+a – a = ÐPOP ' = j Ahora vamos a probar que las condiciones son suficientes. Sean dos puntos cualesquiera P y Q y sus transformados P'y Q', mediante la transformación G.

Si se cumplen PQ = P 'Q ' y Ð(PQ , P 'Q ') = j, existe un punto O tal

que OP = OP ' y Ð(OP ,OP ') = j. En efecto, bastaría obtenerlo como el punto que la mediatriz del segmento PP' intercepta sobre el arco capaz (ver tema 40) del ángulo j construido sobre dicho segmento (figura 12).

Q¢

j

O j

P¢ M


Q

P

331


332


Llegamos a que el punto B ' está sobre una recta r' que forma con r el ángulo j y dista de O lo mismo que r. En el cuadrilátero inscriptible OPMP ' se tiene ÐOPM +ÐOP ' M =

arco (OP ' M ) arco (OPM ) 360º + = = 180º 2 2 2

Ð(OA ',OB ') = Ð(OA ,OB) = 90º

y por tanto ÐOPM = 180º– ÐOP ' M = ÐOP 'Q '. Se desprende la igualdad de los triángulos DOPQ = DOP 'Q ', por tener iguales dos lados y el ángulo comprendido, de donde se concluye que OP = OP ' y Ð(OP ,OP ') = j. Esto prueba que la transformación G es el giro GO,j . Ð( AB , A ' B ') = j

Si A es la proyección del centro de giro O sobre la recta r, entonces su homólogo A' es tal que OA = OA 'y Ð(OA ,OA ') = j. Cualquier otro punto B de la recta r se transforma en B', cumpliéndose, según la propiedad característica, las relaciones: Observaciones:

–

Otra construcción para determinar el centro O del giro consistiría en trazar las mediatrices de PP' y de QQ' (figura 13).

–

Incluso, en una tercera construcción, podría obtenerse O como la intersección de los arcos capaces del ángulo j construidos sobre los segmentos anteriores.

Figura 14.

A

r

j

B

j

A¢

Q¢

O

B¢

r¢

O

j

En un giro toda recta se transforma en otra recta.

2.

Todo giro es una transformación isométrica. Es inmediata, por la propiedad característica, antes demostrada.

1.

P¢

Q

P

Figura 13.

4.3. Consecuencias 4.3. Consecuencias Figura 13.

1.

Todo giro es una transformación isométrica. Es inmediata, por la propiedad característica, antes demostrada.

2.

En un giro toda recta se transforma en otra recta.

P

P¢

Q

j O

r¢

O

B¢

Q¢ j

A¢

Incluso, en una tercera construcción, podría obtenerse O como la intersección de los arcos capaces del ángulo j construidos sobre los segmentos anteriores.

–

Otra construcción para determinar el centro O del giro consistiría en trazar las mediatrices de PP' y de QQ' (figura 13).

–

r

A

j

B

Figura 14.

Si A es la proyección del centro de giro O sobre la recta r, entonces su homólogo A ' es tal que OA = OA 'y Ð(OA ,OA ') = j. Cualquier otro punto B de la recta r se transforma en B', cumpliéndose, según la propiedad característica, las relaciones: Observaciones:

y por tanto ÐOPM = 180º– ÐOP ' M = ÐOP 'Q '. Se desprende la igualdad de los triángulos DOPQ = DOP 'Q ', por tener iguales dos lados y el ángulo comprendido, de donde se concluye que OP = OP ' y Ð(OP ,OP ') = j. Esto prueba que la transformación G es el giro GO,j . Ð( AB , A ' B ') = j

Ð(OA ',OB ') = Ð(OA ,OB) = 90º

ÐOPM +ÐOP ' M =

arco (OP ' M ) arco (OPM ) 360º + = = 180º 2 2 2

Llegamos a que el punto B' está sobre una recta r' que forma con r el ángulo j y dista de O lo mismo que r. En el cuadrilátero inscriptible OPMP ' se tiene



332

Movimientos en el plano 3.

Todo giro es una transformación isogonal directa. Sean tres puntos cualesquiera A, B y C y sus homólogos A', B', C ' mediante un giro de centro O y ángulo j. Vamos a probar que Ð( AB , AC ) = Ð( A ' B ', A 'C ').

En efecto, trazando por A una paralela a A 'C ' y por A'una paralela a AB tendremos dos ángulos iguales, por tener sus lados paralelos, a saber: Ð( AB , AD) = Ð( A ' E , A 'C ')

de donde (figura 15):

Ð( AB , AC )+Ð( AC , AD) = Ð( A ' E , A ' B ')+Ð( A ' B ', A 'C ')

[2]

C¢ B¢ j E A¢

O

C G

j

A

B

Figura 15. Por la propiedad característica Ð( AC , AD) = Ð( AC , A 'C ') = j ; Ð( A ' E , A ' B ') = Ð( A ' B ', AB) = j que sustituidas en [2] nos dan

Ð( AB , AC )+ j = j+Ð( A ' B ', A 'C ') Þ Ð( AB , AC ) = Ð( A ' B ', A 'C ')

4.

csqd

La figura transformada de una circunferencia mediante un giro es otra circunferencia del mismo radio y centro que el homólogo del centro de la primera. Es inmediata, ya que si A está en la circunferencia de centro C y radio r, entonces se cumple por ser el giro una isometría que d (C , A ) = d (C ', A ' ) = r, luego A' estará en la circunferencia de centro C ' y de radio r (figura 16).

A' r A r C

C'

j

O Figura 16.


333


334


5.

La transformada de la recta tangente a una curva en un punto es la recta tangente a la nueva curva en el punto homólogo. Sobre la curva C se tiene un punto fijo P y otro móvil Qn y sobre la curva homóloga C'los puntos homólogos P y Q 'n de los mencionados. Por la propiedad característica de la rotación PQn = P 'Q 'n y Figura 19.

el único que transforma el segmento AB en el A ' B '.

Ð(PQn , P 'Q 'n) = j. Si Qn tiende a P también Q 'n tiende a P'. Entonces la secante PQn tiende a la tangente t en P, al mismo tiempo que la secante PQ 'n tiende a la tangente t ' en P' (figura 17).

Si las rectas AA' y BB' son paralelas entonces ABB ' A ' es un trapecio isósceles (figura 19) y si prolongamos los lados no paralelos hasta obtener la intersección O, entonces los triángulos DOAA' y DOBB' serán también isósceles, siendo OA = OA ', OB = OB ' y ÐAOA ' = ÐBOB ' = j, con lo que el giro GO,j sería

B

t

t’

que junto con OA = OA ' y OB = OB ', probaría que el giro GO,j transforma A en A' y B en B'. La unicidad es fácil de probar ya que cualquier otro giro GO',j ' que transforme el segmento AB en

B'

P’

Luego ÐAOB = ÐA 'OB ', y por consiguiente: ÐAOA '= ÐAOB +ÐBOA '= ÐBOA +ÐA 'OB '= ÐBOB ' AB = A ' B ', por hipótesis. Figura 17.

B'

OB = OB ', por ser O de la mediatriz de BB'.

B

Dados dos segmentos no paralelos de igual longitud, AB = A ' B ', existe un único giro que transforma AB en A ' B '. En el caso de que las rectas AA' y BB' no sean paralelas, las mediatrices de los segmentos AA' y BB' se cortan en un punto O (figura 18). Se tiene DOAB = DOA ' B ', ya que se trata de triángulos con sus lados iguales:

OA = OA ', por ser O de la mediatriz de AA'.

Dados dos segmentos no paralelos de igual longitud, AB = A ' B ', existe un único giro que transforma AB en A ' B '. En el caso de que las rectas AA' y BB' no sean paralelas, las mediatrices de los segmentos AA' y BB' se cortan en un punto O (figura 18). Se tiene DOAB = DOA ' B ', ya que se trata de triángulos con sus lados iguales:

A'

O

A

OA = OA ', por ser O de la mediatriz de AA'.

O

A'

B

OB = OB ', por ser O de la mediatriz de BB'.

B'

Figura 17.

O

AB = A ' B ', por hipótesis.

Figura 18.

Luego ÐAOB = ÐA 'OB ', y por consiguiente: ÐAOA '= ÐAOB +ÐBOA '= ÐBOA +ÐA 'OB '= ÐBOB '

j

Q ¢n

t’

A

el A ' B ', tendrá su centro en las mediatrices de los segmentos AA' y BB', siendo O '= O y j' = Ð(O ' A ,O ' A ') = Ð(OA ,OA ') = j.

C’

B'

Qn

A'

P

P’

O

que junto con OA = OA ' y OB = OB ', probaría que el giro GO,j transforma A en A' y B en B'. La unicidad es fácil de probar ya que cualquier otro giro GO',j ' que transforme el segmento AB en

C

– – –

A

6.

O

– – –

Figura 18.

6.

A'

j

P

O

Q ¢n

el A ' B ', tendrá su centro en las mediatrices de los segmentos AA' y BB', siendo O '= O y j' = Ð(O ' A ,O ' A ') = Ð(OA ,OA ') = j.

C

A

C’

Qn

Si las rectas AA' y BB' son paralelas entonces ABB ' A ' es un trapecio isósceles (figura 19) y si prolongamos los lados no paralelos hasta obtener la intersección O, entonces los triángulos DOAA' y DOBB' serán también isósceles, siendo OA = OA ', OB = OB ' y ÐAOA ' = ÐBOB ' = j, con lo que el giro GO,j sería

t

Ð(PQn , P 'Q 'n) = j. Si Qn tiende a P también Q 'n tiende a P'. Entonces la secante PQn tiende a la tangente t en P, al mismo tiempo que la secante PQ 'n tiende a la tangente t ' en P' (figura 17).

B

Sobre la curva C se tiene un punto fijo P y otro móvil Qn y sobre la curva homóloga C'los puntos homólogos P y Q 'n de los mencionados. Por la propiedad característica de la rotación PQn = P 'Q 'n y el único que transforma el segmento AB en el A ' B '.

La transformada de la recta tangente a una curva en un punto es la recta tangente a la nueva curva en el punto homólogo.



334

5.

Figura 19.


4.4. Elementos invariantes Ya se dijo que si el ángulo de giro es múltiplo de 2p se trata de la aplicación identidad, GO ,2kp = i, y entonces todo punto es doble. Si fuese j ¹ 2kp, el único punto doble es el centro de giro O. Ahora bien, toda circunferencia centrada en el centro de giro es globalmente doble, pero sus puntos no son dobles. Para valores concretos del ángulo de giro, puede haber otras figuras globalmente invariantes. Así, por ejemplo, el giro GO,p 2 dejaría invariante cualquier cuadrado con centro en O (figura 20).

O

90º

Figura 20.

4.5. El grupo de los giros de un mismo centro Sea el conjunto GO de los giros del plano con centro en O. Veamos que la composición o producto de giros es una operación interna en dicho conjunto. El producto de giros del mismo centro es otro giro del mismo centro y de ángulo la suma de los respectivos ángulos de giro, o sea GO ,j ' o GO ,j = GO ,j+ j ' .

Es inmediato, ya que si un punto P se transforma por la primera rotación (de ángulo j) en P', y ésta a su vez en P''por la segunda rotación (de ángulo j'), tendremos:

P'

P ''

OP = OP ' , Ð(OP ,OP ') = j

j'

OP ' = OP '' , Ð(OP ',OP '') = j'

j+j' j P

Figura 21.

O

Se deduce OP = OP '' (por transitividad), y además: Ð(OP ,OP '') = Ð(OP ,OP ')+Ð(OP ',OP '') = j+ j' Luego P'' es el homólogo de P mediante el giro GO,j+ j ' . La asociatividad y la conmutatividad de la composición de giros de centro O son inmediatas. El giroGO ,2kp , que es el mismo queGO,0º es el elemento neutro, ya que es la transformación identidad. Asimismo es obvio que todo giro GO,j tiene su recíproco o inverso, pues: GO ,j o = GO ,j+ (– j ) = GO ,0º = i Þ GO–1,j = GO ,– j Concluimos que (GO ,o) es un grupo abeliano, llamado grupo de los giros de centro O. Observaciones: Si consideramos los giros que dejan invariante un polígono regular de n lados centrado en O, tendre, que es estable para la composición y constituye un subgrupo fimos el conjunto de GO ,2k p n

{

}

k=0 ,1...,n – 1

nito de orden n del grupo (GO ,o).


335


336


Figura 23.

Figura 24.

Así, por ejemplo, la tabla de composición del subgrupo finito de los giros que dejan invariante un cuadrado de centro O, sería: r'

o

G O ,0 º

GO ,90 º

GO ,180 º

GO ,270 º

G O ,0 º

G O ,0 º

GO ,90 º

GO ,180 º

GO ,270 º

GO ,90 º

GO ,90 º

GO ,180 º

GO ,270 º

G O ,0 º

O r

Mediante una simetría central cualquier recta se transforma en otra recta paralela (figura 24).

–

En una simetría central el único punto doble es el centro. Toda recta que pasa por O es globalmente invariante, así como toda circunferencia centrada enO. En general si una figuraF es invariante para una simetría de centro O, decimos que F tiene centro de simetría (figura 23).

–

GO ,180 º

GO ,270 º

GO ,270 º

GO ,270 º G O ,0 º

G O ,0 º

GO ,90 º

GO ,90 º

GO ,180 º

El subgrupo ({GO ,0º ,GO ,90º ,GO ,180º ,GO ,270º},o) es cíclico, siendo el generador GO,90º .

–

GO ,180 º

La simetría central es una transformación involutiva, ya que S O2 = S O o S O = GO ,180º o GO ,180º = GO ,360º = GO ,0º = i

Esto equivale a decir que O, P y P' están alineados, siendo O el punto medio del segmento PP'. Las propiedades son las de los giros en general. Tan sólo cabría notar que:

4.6. La simetría central como caso particular de giro

La simetría central o con respecto a un punto O es un caso particular de giro; se trata del giro de centro O y ángulo j = ±p = ±180º. Denotaremos por S O a dicha transformación, es decir: S O = GO ,+180º = GO ,–180º . Una simetría central de centro O es una transformación del plano E2 en sí mismo que asocia a cada punto P un homólogo P' tal queëOP 'û= –ëOP û. Q'

-180º

M'

Nótese que la definición de S O quedaría entonces reducida a la siguiente: P' P'

+180º

P

Q

M

P

O P

Figura 22.

O

M

Q

P

O

O +180º

Figura 22.

P'

P' -180º

Nótese que la definición de S O quedaría entonces reducida a la siguiente: M'

Q'

Una simetría central de centro O es una transformación del plano E2 en sí mismo que asocia a cada punto P un homólogo P' tal queëOP 'û= –ëOP û.

La simetría central o con respecto a un punto O es un caso particular de giro; se trata del giro de centro O y ángulo j = ±p = ±180º. Denotaremos por S O a dicha transformación, es decir: S O = GO ,+180º = GO ,–180º .

4.6. La simetría central como caso particular de giro

Esto equivale a decir que O, P y P' están alineados, siendo O el punto medio del segmento PP'. Las propiedades son las de los giros en general. Tan sólo cabría notar que:

–

La simetría central es una transformación involutiva, ya que S O2 = S O o S O = GO ,180º o GO ,180º = GO ,360º = GO ,0º = i

–

En una simetría central el único punto doble es el centro. Toda recta que pasa por O es globalmente invariante, así como toda circunferencia centrada enO. En general si una figuraF es invariante para una simetría de centro O, decimos que F tiene centro de simetría (figura 23).

–

Mediante una simetría central cualquier recta se transforma en otra recta paralela (figura 24).

El subgrupo ({GO ,0º ,GO ,90º ,GO ,180º ,GO ,270º},o) es cíclico, siendo el generador GO,90º . r O r'

GO ,270 º

GO ,270 º

GO ,180 º

GO ,180 º

GO ,90 º

GO ,90 º G O ,0 º o

G O ,0 º G O ,0 º

G O ,0 º

GO ,270 º GO ,180 º GO ,90 º GO ,90 º

GO ,180 º

GO ,90 º

GO ,90 º

G O ,0 º

GO ,270 º GO ,180 º GO ,180 º

G O ,0 º GO ,270 º GO ,270 º

Así, por ejemplo, la tabla de composición del subgrupo finito de los giros que dejan invariante un cuadrado de centro O, sería: 336

Figura 24.



Figura 23.


5. SIMETRÍAS AXIALES

P

5.1. Definición M

Dada una recta e en el plano E2 se llama simetría respecto a dicha recta o simetría axial de eje e, a la transformación geométrica S e del plano que asocia a cada punto P un homólogo P' tal que e es la mediatriz del segmento PP'. A la recta e se denomina eje de simetría.

P' e

Figura 25. Observaciones:

–

Una simetría axial es una biyección de E2 en sí mismo. En efecto, si M es el punto medio del segmento PP', es decir, la intersección de PP' con e, se verificaë PM û=ë MP 'ûy PP 'ê. La propia definición de la transformación S e nos dice que si P' es el homólogo de P, entonces P' es también el homólogo de P. Es decir, S e es biyectiva, siendo su recíproca ella misma S e–1 = S e , lo cual equivale a decir que la simetría axial es una transformación involutiva f S e2 = S e o S e = i.

–

La definición dada anteriormente corresponde a una simetría axial ortogonal. Podemos generalizar tal definición. Así, pues, una simetría axial de eje e según una dirección f es una transformación puntual que asocia a cada punto P del plano un homólogo P'tal que PP' // f y e pasa por el punto medio de PP' (figura 26.)

P'

P e

Figura 26.

5.2. Propiedades Q

1.

Toda simetría axial es una isometría. Veamos que la simetría axial S e conserva las distancias. En efecto, dados dos puntos P y Q y sus homólogos P'y Q', sean M y N los puntos en que PP' y QQ' cortan respectivamente al eje de simetría. Si trazamos por P y P'paralelas a dicho eje se forman dos triángulos rectángulos DPHQ y DP ' KQ '. Dichos triángulos son iguales, pues por definición de simetría axial: MP = P ' M , NQ = Q ' N , y de aquí:

H e

N

P

K

M

Q’

P'

Figura 27.

HQ = NQ – NH = NQ – MP = Q ' N – P ' M = Q ' N – KN = KQ ' Además PH = P ' K , pues son segmentos de paralelas interceptados por paralelas. Luego los catetos del triángulo DPHQ son iguales a los del DP ' KQ ', por lo que PQ = P 'Q ', es decir d ( p ,Q ) = d ( P ',Q ' ) . 2.

La transformada de una recta mediante una simetría axial es otra recta.

–

Si la recta r es paralela al eje de simetría (figura 28), tomemos un punto A de r y su simétrico A'. Tracemos ahora por una recta r'también paralela al eje e. Si X es otro punto cualquiera de r, la perpendicular desde X a e corta a r' en otro punto X '. Si llamamos M y N a los puntos de intersección de AA' y XX ' respectivamente con el eje de simetría, entonces las figuras AXNM y A ' X ' NM son dos rectángulos, ya que sus lados son paralelos y perpendiculares a r. Por otra parte, por definición de simetría axial, MA = A ' M , por lo que los rectángulos anteriores tie-


r e

X

A

N

M

X'

A' Figura 28.

337


338


Figura 31.

C'

nen sus lados iguales, ya que MN es común a ambos. En consecuencia NX = X ' N . Como también es XX 'ê, hemos probado que X ' es el simétrico de X . Por tanto el simétrico de cualquier punto X de la recta r está sobre la recta r'.

B'

En caso de que la recta r no sea paralela al eje de simetría (figura 29), denotemos por C el punto de intersección de r con el eje e de simetría. Vamos a hallar el simétrico A' de un punto cualquiera A de la recta r, y veamos que la recta CA' es la recta simétrica de r. Los triángulos DCMA y DCMA'son iguales, ya que son recr tángulos en M , tienen en común el cateto CM y AM = MA '. X Por tanto ÐACM = ÐA 'CM . A Si X es un punto cualquiera de r, tracemos por él una perpendicular a e hasta cortar a la recta CA' en un punto X '. M N e Entonces los triángulos DCNX y DCNX ' tienen el cateto C CN común y además: ÐXCN = ÐACM = ÐA 'CM = ÐX 'CN

A'

+b -b

A

–

–

-a

+a

+

B

C

A'

Resulta, pues, que XN = NX ', con lo que X 'es el simétrico de X . Probamos también así que el simétrico de cualquier punto X de la recta r está sobre la recta CA'. Figura 30.

Toda simetría axial es una transformación isogonal inversa. Una semirrecta s con origen en un punto O del eje e de simetría se s transforma mediante la simetría axial S e en otra semirrecta s'con origen en O (figura 30). De la anterior demostración se desprende que los ángulos orientados Ð( e , s ) y Ð( e, s' ) son iguales y de sentido con+a e trario. O Sean y A, B C tres puntos cualesquiera no alineados y A', B' y C ' sus –a respectivos homólogos mediante la simetría axial S e . Probar que los ángulos Ð( AB , AC ) y Ð( A ' B ', A 'C ') son iguales en magnitud es tris´ vial, ya que los triángulos DABC y DA ' B 'C ' tienen sus lados iguales, pues ya se probó que S e es una transformación isométrica. X'

r'

Figura 29.

Observación: Otra demostración sencilla de esta propiedad se puede basar en que dados tres puntos A, B, C cualesquiera del plano se verifica d ( A ,C ) £ d ( A , B )+ d ( B ,C ) y la igualdad es cierta, si y sólo si, los tres puntos están alineados. Entonces si A, B y C están alineados se cumple d ( A ,C ) = d ( A , B )+ d ( B ,C ). Como la simetría axial es una isometría, tendremos d ( A ,C ) = d ( A ',C ' ), d ( A , B ) = d ( A ', B ' ), y d ( B ,C ) = d ( B ',C ' ), de donde d ( A ',C ' ) = d ( A ', B ' )+ d ( B ',C ' ), por que los homólogos A', B', C ' están también alineados. 3.

Observación: Otra demostración sencilla de esta propiedad se puede basar en que dados tres puntos A, B, C cualesquiera del plano se verifica d ( A ,C ) £ d ( A , B )+ d ( B ,C ) y la igualdad es cierta, si y sólo si, los tres puntos están alineados. Entonces si A, B y C están alineados se cumple d ( A ,C ) = d ( A , B )+ d ( B ,C ). Como la simetría axial es una isometría, tendremos d ( A ,C ) = d ( A ',C ' ), d ( A , B ) = d ( A ', B ' ), y d ( B ,C ) = d ( B ',C ' ), de donde d ( A ',C ' ) = d ( A ', B ' )+ d ( B ',C ' ), por que los homólogos A', B', C ' están también alineados. 3.

Toda simetría axial es una transformación isogonal inversa. Una semirrecta s con origen en un punto O del eje e de simetría se s transforma mediante la simetría axial S e en otra semirrecta s'con origen en O (figura 30). De la anterior demostración se desprende que los ángulos orientados Ð( e , s ) y Ð( e, s' ) son iguales y de sentido con+a e trario. O Sean A, B y C tres puntos cualesquiera no alineados y A', B' y C ' sus –a respectivos homólogos mediante la simetría axial S e . Probar que los ángulos Ð( AB , AC ) y Ð( A ' B ', A 'C ') son iguales en magnitud es tris´ vial, ya que los triángulos DABC y DA ' B 'C ' tienen sus lados iguales, pues ya se probó que S e es una transformación isométrica. Figura 30. Figura 29.

X'

r'

A'

Resulta, pues, que XN = NX ', con lo que X 'es el simétrico de X . Probamos también así que el simétrico de cualquier punto X de la recta r está sobre la recta CA'.

En caso de que la recta r no sea paralela al eje de simetría (figura 29), denotemos por C el punto de intersección de r con el eje e de simetría. Vamos a hallar el simétrico A' de un punto cualquiera A de la recta r, y veamos que la recta CA' es la recta simétrica de r. Los triángulos DCMA y DCMA'son iguales, ya que son recr tángulos en M , tienen en común el cateto CM y AM = MA '. X Por tanto ÐACM = ÐA 'CM . A Si X es un punto cualquiera de r, tracemos por él una perpendicular a e hasta cortar a la recta CA' en un punto X '. M N e Entonces los triángulos DCNX y DCNX ' tienen el cateto C común y además: CN ÐXCN = ÐACM = ÐA 'CM = ÐX 'CN

C

B

+b -b

+

+a -a

A' –

B'

–

A

nen sus lados iguales, ya que MN es común a ambos. En consecuencia NX = X ' N . Como también es XX 'ê, hemos probado que X ' es el simétrico de X . Por tanto el simétrico de cualquier punto X de la recta r está sobre la recta r'.

C'



338

Figura 31.

Movimientos en el plano Como podemos ver en la figura 31:

( AB , AC) = (+a ) – (+b ) = a – b

con lo que concluimos que

;

( A ' B ', A 'C ') = (– a ) – (– b ) = b – a

( A ' B ', A 'C ') = – ( AB , AC)

Esto es, la simetría axial invierte el sentido de los ángulos y , por consiguiente, la orientación de las figuras. Así, pues, si suponemos recorrido el triángulo DABC en un cierto sentido, que sería el contrario al de las agujas del reloj, el triángulo DA ' B 'C ', simétrico del dado respecto al eje e, es recorrido en sentido contrario, o sea, el de las agujas del reloj (figura 32). C B

A

e A'

B' C ''

Figura 32. 4.

La transformada de una circunferencia es otra circunferencia. Es obvio, pues dada una circunferencia de centroO y radio r, y siendo O' el simétrico de O, cualquier punto A de dicha circunferencia se transforma en su simétrico A', que cumple d (O ', A ' ) = d (O , A ) = r, pues vimos que la simetría axial es una isometría. Por tanto, el transformado de cualquier punto de una circunferencia de radio r, está en la circunferencia del mismo radio y con centro en el punto simétrico del centro.

A e

r O r

A'

O' Figura 33.

5.3. Elementos invariantes Todos los puntos del eje de simetría son puntos dobles y ya no hay más puntos dobles. Toda recta perpendicular al eje de simetría es globalmente invariante o doble, aunque no sea una recta de puntos dobles. En general, si una figura F es globalmente invariante mediante la simetría axial S e , decimos que e es un eje de simetría de F . Así, por ejemplo, una circunferencia tiene como eje de simetría cualquier diámetro; un rombo, sus dos diagonales, etc.


339


340


Por ser S e y S e ' isometrías, se tendrá OP = OP ' = OP '', con lo cual el triángulo rectángulo DPOM tiene sus lados, y por tanto sus ángulos, iguales a los del DP 'OM . Lo mismo ocurre con los triángulos DP 'ON y DP ''ON . Se tendrá, pues, ÐPOM = ÐMOP'y ÐP 'ON = ÐNOP '', y de aquí: ÐPOP '' = ÐPOM +ÐMOP '+ÐP 'ON +ÐNOP '' = 2ÐMOP '+ 2ÐP 'ON = = 2(ÐMOP '+ÐP 'ON ) = 2ÐMON = 2a

6. COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS AXIALES 6.1. Composición de dos simetrías axiales –

Caso de ejes coincidentes Si se trata de dos simetrías axiales del mismo eje ya sabemos que la transformación producto es la identidad ( S e o S e = i ) .

Al igual que antes ( S e ' o S e )( P ) = S e ' [S e ( P )] = S e ' ( P ' ) = P '', cumpliéndose PM = MP ', P ' N = NP '', PP 'ê, P ' P ''ê'.

–

Caso de ejes paralelos Dado un punto cualquiera P, sean S e ( P ) = P ' y S e ' ( P ' ) = P ''. Entonces ( S e ' o S e )( P ) = S e ' [S e ( P )] = S e ' ( P ' ) = P '' Figura 36.

P

M

Puesto que PP 'ê y P ' P ''ê', los puntos P, P', P'' están alineados sobre una recta perpendicular a e y e' (figura 35). Sean M y N los puntos de intersección de dicha recta con e y e' respectivamente. Entonces: e

2a a

P'

2ëMNë

O

e'

e

N

M P'

P

N

[ PP ''] = [ PP ']+[ P ' P ''] = [ PM ]+[ MP ']+[ P ' N ]+[ NP ''] = = 2[ MP ']+ 2[ P ' N ] = 2([ MP ']+[ P ' N ]) = 2[ MN ]

P''

e'

P''

Figura 35.

–

Caso de ejes concurrentes Supongamos que los dos ejes se cortan en un punto O, formando un ángulo orientado a. Luego S e ' o S e = T2MN , es decir:

La composición de dos simetrías axiales de ejes paralelos da como resultado una traslación definida por un vector de dirección perpendicular a los ejes, de sentido el que va del primer eje al segundo y de módulo el doble de la distancia entre ambos ejes.

La composición de dos simetrías axiales de ejes paralelos da como resultado una traslación definida por un vector de dirección perpendicular a los ejes, de sentido el que va del primer eje al segundo y de módulo el doble de la distancia entre ambos ejes.

Luego S e ' o S e = T2MN , es decir:

–

Caso de ejes concurrentes Supongamos que los dos ejes se cortan en un punto O, formando un ángulo orientado a. Figura 35.

P''

e'

(

)

= 2[ MP ']+ 2[ P ' N ] = 2 [ MP ']+[ P ' N ] = 2[ MN ] M P'

P

P''

N

[ PP ''] = [ PP ']+[ P ' P ''] = [ PM ]+[ MP ']+[ P ' N ]+[ NP ''] = N

ë

2ëMN

P'

e'

e

e

Puesto que PP 'ê y P ' P ''ê', los puntos P, P', P'' están alineados sobre una recta perpendicular a e y e' (figura 35). Sean M y N los puntos de intersección de dicha recta con e y e' respectivamente. Entonces: O

2a a

M P

Figura 36.

( S e ' o S e )( P ) = S e ' [S e ( P )] = S e ' ( P ' ) = P ''

Caso de ejes paralelos Dado un punto cualquiera P, sean S e ( P ) = P ' y S e ' ( P ' ) = P ''. Entonces

–

Caso de ejes coincidentes Si se trata de dos simetrías axiales del mismo eje ya sabemos que la transformación producto es la identidad ( S e o S e = i ) .

–

Al igual que antes ( S e ' o S e )( P ) = S e ' [S e ( P )] = S e ' ( P ' ) = P '', cumpliéndose PM = MP ', P ' N = NP '', PP 'ê, P ' P ''ê'.

Por ser S e y S e ' isometrías, se tendrá OP = OP ' = OP '', con lo cual el triángulo rectángulo DPOM tiene sus lados, y por tanto sus ángulos, iguales a los del DP 'OM . Lo mismo ocurre con los triángulos DP 'ON y DP ''ON . Se tendrá, pues, ÐPOM = ÐMOP'y ÐP 'ON = ÐNOP '', y de aquí: ÐPOP '' = ÐPOM +ÐMOP '+ÐP 'ON +ÐNOP '' = 2ÐMOP '+ 2ÐP 'ON = = 2(ÐMOP '+ÐP 'ON ) = 2ÐMON = 2a

6.1. Composición de dos simetrías axiales

6. COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS AXIALES



340

Movimientos en el plano Entonces, concluimos que mediante la composición de simetrías S e ' o S e se pasa del punto P al punto P'', siendo OP = OP '' y ÐPOP ''= 2a, es decir: S e ' o S e = GO ,2a . La composición de dos simetrías axiales de ejes concurrentes da como resultado un giro con centro en el punto de intersección de los ejes y ángulo el doble del que forman los ejes, orientado desde el primero al segundo de ellos.

Los recíprocos de los resultados anteriores son también ciertos en el siguiente sentido: a)

Toda traslación se puede descomponer de infinitas maneras en producto de dos simetrías axiales de ejes paralelos, perpendiculares ambos a la dirección del vector de traslación y separados una distancia igual a la mitad del módulo de dicho vector.

b)

Todo giro se puede descomponer de infinitas maneras en producto de dos simetrías axiales de ejes concurrentes en el centro del giro y formando un ángulo igual a la mitad del ángulo de giro.

Estos resultados van a determinar la importancia de las simetrías axiales como generadores del grupo de los movimientos en el plano.

6.2. Composición de dos giros Ya se obtuvo en el apartado 4.5. que el producto de dos giros de centro O es otro giro de centro O, es decir GO ,j ' o GO ,j = GO ,j+ j ' . Vamos, pues, a ver ahora cuál es el resultado de la composición de dos giros de distinto centro. Podemos tomar la recta e2 que determinan los centros O y O', y considerar sendas rectas e1 y e3 formando con la anterior ángulos respectivos j 2 y j' 2 (con la orientación adecuada, es decir Ð( e1, e2 ) = j 2 y Ð( e2 , e3 ) = j' 2. Entonces los girosGO,j yGO',j ' pueden descomponerse en producto de simetrías axiales: GO ,j = S e2 o S e1

y GO ',j ' = S e2 o S e3

de donde GO ',j ' o GO ,j = ( S e3 o S e2 ) o ( S e2 o S e1 ) = S e3 o ( S e2 o S e2 ) o S e1 = S e3 o i o S e1 = S e3 o S e1 Si los ejes e1 y e3 son concurrentes, formarían un ángulo igual a tado sería un giro de ángulo j+ j'. Esto es: GO ',j ' o GO ,j = GO '',j+ j ' .

j+ j' (figura 37), por lo cual el resul2

e3 j'/2

O O'

j /2

e2

j + j¢ 2

O''

e1 Figura 37.


341


342


En caso de que los ejes e1 y e3 fuesen paralelos (cuando j+ j' = 2kp) el resultado sería una traslación de vector 2ë OO'û. Luego:

Como el ángulo que forman e1 y e2 es j 2, si j ¹ 2kp, resulta un giro de centro O'y amplitud j. Es decir: Tr o GO ,j = GO ',j . v El caso j = 2kp es trivial, pues el giro sería la identidad y el resultado sería Tvr o i = Tvr . Salvo este caso trivial podemos formular el siguiente enunciado. El producto o composición de dos giros de distinto centro es, o bien una traslación, o bien otro giro de amplitud, la suma de las amplitudes.

Tvr o GO ,j = ( S e3 o S e2 ) o ( S e2 o S e1 ) = S e3 o ( S e2 o S e2 ) o S e1 = S e3 o i o S e1 = S e3 o S e1

Observación:

de donde

Hay que hacer notar que tal producto no es conmutativo, pues si cambiamos el orden de composición, debemos cambiar los ejes e1 y e3. Figura 39.

ì Tr = S o S e3 e2 ï v í ï îGO ,j = S e2 o S e1

6.3. Composición de dos simetrías centrales Ya se vio que la simetría central es involutiva, es decir S 0 o S 0 = i. En caso de dos simetrías respecto de distinto centro estaríamos P ¢¢ en el caso particular del apartado anterior, pues S O = GO ,± p y S O ' = GO ',± p , por lo cual aquí es j+ j' = 2kp. Por tanto:

O

O¢

e1

P

Como sabemos, para efectuar el producto de traslación por giro Tvr o GO ,j aplicamos primero a un punto P el giro de centro O y ángulo j, obteniendo el punto r P', y a continuación trasladamos éste siguiendo el vector v, hasta llegar al punto P''. e 3 Tomamos una recta e2 que paser por O y que sea perpendicular a la dirección del vector v. Trazamos asimismo e2 otra recta e3 paralela a la anterior por el punto A, tal que n [OA] = 1 vr y una recta e1 concurrente con e2 en O y forman2 do ambas un ángulo igual a j 2. De esta manera se pueden descomponer tanto la traslación como el giro en producto de dos simetrías axiales:

j/2

A

S O ' o S O = T2[ OO ' ]

O¢

P¢

Recíprocamente, toda traslación Tvr podría descomponerse en producto de simetrías centrales, de infinitas maneras. Bastaría elegir 1r arbitrariamente el punto O y tomar O', de modo que [OO '] = v. 2

Figura 38.

6.4. Composición de traslación y giro


O

Como sabemos, para efectuar el producto de traslación por giro Tvr o GO ,j aplicamos primero a un punto P el giro de centro O y ángulo j, obteniendo el punto r P', y a continuación trasladamos éste siguiendo el vector v, hasta llegar al punto P''. e3 Tomamos una recta e2 que paser por O y que sea perpendicular a la dirección del vector v. Trazamos asimismo e2 otra recta e3 paralela a la anterior por el punto A, tal que n [OA] = 1 vr y una recta e1 concurrente con e2 en O y forman2 do ambas un ángulo igual a j 2. De esta manera se pueden descomponer tanto la traslación como el giro en producto A j/2 de dos simetrías axiales: e

Recíprocamente, toda traslación Tvr podría descomponerse en producto de simetrías centrales, de infinitas maneras. Bastaría elegir 1r arbitrariamente el punto O y tomar O', de modo que [OO '] = v. 2

Figura 38. P¢

P

S O ' o S O = T2[ OO ' ]

O¢

Ya se vio que la simetría central es involutiva, es decir S 0 o S 0 = i. En caso de dos simetrías respecto de distinto centro estaríamos en el caso particular del apartado anterior, pues S O = GO ,± p y S O ' = GO ',± p , por lo cual aquí es j+ j' = 2kp. Por tanto: P ¢¢

1

O

O

O¢

ì Tr = S o S e3 e2 ï v í ï îGO ,j = S e2 o S e1

6.3. Composición de dos simetrías centrales Figura 39.

Hay que hacer notar que tal producto no es conmutativo, pues si cambiamos el orden de composición, debemos cambiar los ejes e1 y e3. de donde

Observación:

Tvr o GO ,j = ( S e3 o S e2 ) o ( S e2 o S e1 ) = S e3 o ( S e2 o S e2 ) o S e1 = S e3 o i o S e1 = S e3 o S e1 El producto o composición de dos giros de distinto centro es, o bien una traslación, o bien otro giro de amplitud, la suma de las amplitudes.

Como el ángulo que forman e1 y e2 es j 2, si j ¹ 2kp, resulta un giro de centro O'y amplitud j. Es decir: Tvr o GO ,j = GO ',j . El caso j = 2kp es trivial, pues el giro sería la identidad y el resultado sería Tvr o i = Tvr . Salvo este caso trivial podemos formular el siguiente enunciado.

En caso de que los ejes e1 y e3 fuesen paralelos (cuando j+ j' = 2kp) el resultado sería una traslación de vector 2ë OO'û. Luego:



342


Proposición 1: El producto de una traslación por un giro distinto de la identidad da como resultado otro giro de la misma amplitud. Observaciones:

–

Justificar que el producto anterior no es conmutativo es sencillo. Basta considerar la figura siguiente:

P

O

P¢

P ¢¢

Si al punto P se aplica primero la traslación de vectorë PO ûllegamos al punto O, si a continuación aplicamos el giro GO,p obtenemos el punto O. En cambio si aplicamos primero GO,p pasamos del punto P al P', y si éste lo trasladamos segúnë PO û, llegamos al punto P''. Veamos, pues, ahora cuál sería el resultado del producto de giro por traslación, o sea GO ,j o Tvr (consideramos j ¹ 2kp). 1r Ahora tomamos un punto A tal que [ AO] = v. e2 e3 2 e v Trazamos por O y A, respectivamente, dos rectas j/2 ambas perpendiculares a la dirección e2 y e1 paralelas, r del vector v. Por O trazamos otra recta e3, tal que el ángulo Ð( e2 , e3 ) sea igual a j 2. 1

O

A

Figura 40.

O ¢¢

Del mismo modo que antes, tendremos: GO ,j o Tvr = ( S e3 o S e2 ) o ( S e2 o S e1 ) = S e3 o ( S e2 o S e2 ) o S e1 = S e3 o i o S e1 = S e3 o S e1 con lo cual el resultado es, como antes, otro giro de amplitud j y centro O''. Por tanto, también es cierta la siguiente proposición. Proposición 2: El producto de un giro distinto de la identidad por una traslación da como resultado otro giro de la misma amplitud. Como consecuencia, podemos obtener que la composición en cualquier orden de un número finito de giros y traslaciones puede reducirse a un giro único o a una traslación única. En efecto, sea fn o fn–1o...o f2 o f1 , donde cada fi es un giro o una traslación. Para probar que el resultado es un giro o una traslación razonamos por inducción:

– –

Las dos proposiciones anteriores prueban que es cierto para n = 2. Si lo suponemos cierto para n – 1, entonces fn–1o...o f2 o f1 será un giro o una traslación y por tanto fn o fn–1o...o f2 o f1 = fn o ( fn–1o...o f2 o f1 ) , aplicando de nuevo las dos proposiciones anteriores, también resultaría giro o traslación, con lo que la propiedad sería también cierta para n.


343


344


Según se ha visto a lo largo del tema, hemos de notar que las traslaciones y los giros son isometrías directas, mientras que las simetrías axiales son isometrías inversas. Si consideramos el conjunto de todos los giros y todas las traslaciones en el plano, la composición de dos transformaciones en dicho conjunto (dos traslaciones,rdos giros o giro y traslación) da siempre un giro o una traslación. La identidad sería la traslación de vector 0, o bien el giro de ángulo 2kp. La inversa de una traslación es otra traslación de vector opuesto al de la dada y la inversa de un giro es el giro del mismo cen-

7. EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL PLANO 7.1. Isometrías directas e inversas

Una transformación geométrica del plano euclídeo E2 (o biyección de E2 en sí mismo) es una isometría, como ya se indicó, si para cualesquiera dos puntos P y Q y sus respectivos homólogos P' y Q' se cumple d ( P ,Q ) = d ( P ',Q ' ), o sea PQ = P 'Q '.

7.2. El grupo de los movimientos en el plano

Hemos de hacer notar que esta condición de conservar la distancia implica automáticamente la isogonalidad, es decir, la propiedad de conservar los ángulos en magnitud. En efecto, si partimos de tres puntos no alineados A, B y C y sus respectivos homólogos A', B' y C ', mediante una isometría f , se tendrá AB = A ' B ' , BC = B 'C ' , AC = A 'C ' , con lo cual los triángulos DABC y DA ' B 'C ' tienen sus lados iguales y por tanto sus ángulos iguales en valor absoluto (figura 41). Puede ocurrir:

Asimismo Isom+ ( E2 ) es también estable, ya que si dos isometrías conservan la orientación, el producto de ambas también la conservará. Sin embargo, no podemos decir lo mismo para Isom– ( E2 ) , ya que si f , g Î Isom– ( E2 ) es obvio que f o g Î Isom+ ( E2 ) . Ð( A ' B ', A 'C ') = Ð( AB , AC )

Ð( A ' B ', A 'C ') = – Ð( AB , AC )

o

d ( ( g o f )( P ),( g o f )(Q )) = d ( g ( f ( P )), g ( f (Q )) = d ( f ( P ), f (Q )) = d ( P ,Q ) Es fácil verificar que Isom( E2 ) es estable o cerrado para la composición. Es decir, si f , g Î Isom( E2 ) será g o f Î Isom( E2 ) , pues por definición de isometría, para cualesquiera dos puntos P yQ, se verifica: C¢

f

B¢

+

+

B¢

C

f

ìIsom( E2 ) = Isom+ ( E2 ) È Isom– ( E2 ) ï í ï + – îIsom ( E2 ) Ç Isom ( E2 ) = Æ

C

-

+

B

A¢

A

C¢

B

A

Denotaremos por Isom( E2 ) al conjunto de todas las isometrías del plano. Asimismo, por Isom+ ( E2 ) y Isom– ( E2 ) a los subconjuntos de Isom( E2 ) formados por la isometrías directas y las isometrías inversas, respectivamente. Obviamente: (a)

(b)

A¢

Figura 41.

En el primer caso ( a ) se trata de una isometría directa (conserva la orientación). En el segundo caso ( b ) tenemos una isometría inversa (invierte la orientación).

En el primer caso ( a ) se trata de una isometría directa (conserva la orientación). En el segundo caso ( b ) tenemos una isometría inversa (invierte la orientación). Figura 41.

Denotaremos por Isom( E2 ) al conjunto de todas las isometrías del plano. Asimismo, por Isom+ ( E2 ) y Isom ( E2 ) a los subconjuntos de Isom( E2 ) formados por la isometrías directas y las isometrías inversas, respectivamente. Obviamente: (a)

A

(b)

A¢

+

ìIsom( E2 ) = Isom+ ( E2 ) È Isom– ( E2 ) ï í ï + – îIsom ( E2 ) Ç Isom ( E2 ) = Æ

B

A¢

A

B

+

+

C

–

B¢

f

-

C¢

f

Es fácil verificar que Isom( E2 ) es estable o cerrado para la composición. Es decir, si f , g Î Isom( E2 ) será g o f Î Isom( E2 ) , pues por definición de isometría, para cualesquiera dos puntos P yQ, se verifica: C

C¢

B¢

d ( ( g o f )( P ),( g o f )(Q )) = d ( g ( f ( P )), g ( f (Q )) = d ( f ( P ), f (Q )) = d ( P ,Q ) Ð( A ' B ', A 'C ') = Ð( AB , AC )

o

Ð( A ' B ', A 'C ') = – Ð( AB , AC )

Hemos de hacer notar que esta condición de conservar la distancia implica automáticamente la isogonalidad, es decir, la propiedad de conservar los ángulos en magnitud. En efecto, si partimos de tres puntos no alineados A, B y C y sus respectivos homólogos A', B' y C ', mediante una isometría f , se tendrá AB = A ' B ' , BC = B 'C ' , AC = A 'C ' , con lo cual los triángulos DABC y DA ' B 'C ' tienen sus lados iguales y por tanto sus ángulos iguales en valor absoluto (figura 41). Puede ocurrir:

Asimismo Isom+ ( E2 ) es también estable, ya que si dos isometrías conservan la orientación, el producto de ambas también la conservará. Sin embargo, no podemos decir lo mismo para Isom– ( E2 ) , ya que si f , g Î Isom– ( E2 ) es obvio que f o g Î Isom+ ( E2 ) .

Una transformación geométrica del plano euclídeo E2 (o biyección de E2 en sí mismo) es una isometría, como ya se indicó, si para cualesquiera dos puntos P y Q y sus respectivos homólogos P' y Q' se cumple d ( P ,Q ) = d ( P ',Q ' ), o sea PQ = P 'Q '.

7.2. El grupo de los movimientos en el plano

Según se ha visto a lo largo del tema, hemos de notar que las traslaciones y los giros son isometrías directas, mientras que las simetrías axiales son isometrías inversas. Si consideramos el conjunto de todos los giros y todas las traslaciones en el plano, la composición de dos transformaciones en dicho conjunto (dos traslaciones,rdos giros o giro y traslación) da siempre un giro o una traslación. La identidad sería la traslación de vector 0, o bien el giro de ángulo 2kp. La inversa de una traslación es otra traslación de vector opuesto al de la dada y la inversa de un giro es el giro del mismo cen-

7.1. Isometrías directas e inversas

7. EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL PLANO



344

Movimientos en el plano tro y ángulo opuesto. Así, pues, el conjunto de las traslaciones y giros en el plano constituye un grupo no conmutativo, que es el llamado grupo de los movimientos, que no es más que ( Isom+ ( E2 ),o). Por tanto, entenderemos aquí que movimiento (o desplazamiento) en el plano es toda isometría directa, aunque hemos de hacer notar que algunos autores identifican movimiento con isometría en general, y distinguen luego entre movimientos directos y movimientos inversos.

7.3. Descomposición de una isometría en producto de simetrías axiales Sabido es también que toda traslación y todo giro pueden descomponerse en producto de dos simetrías axiales. Por tanto, podemos deducir que cualquier movimiento o isometría directa es el resultado de la composición de un número par de simetrías axiales. Si al grupo de los movimientos (giros y traslaciones) añadimos el conjunto de todas las simetrías axiales y todas las transformaciones que resultan de componer movimientos y simetrías axiales, tendremos el conjunto más amplio Isom( E2 ) de todas las isometrías. Entonces cualquier elemento f de Isom( E2 ) será el resultado de componer n simetrías axiales: f = S en o S en–1 o...o S e2 o S e1 Teniendo en cuenta que para cualquier simetría axial es i = S e o S e , la transformación inversa de f es f –1 = S e1 o S e2 o...o S en–1 o S en y, por tanto, f –1 Î Isom( E2 ). Llegamos a que ( Isom( E2 ),o) es un grupo más amplio denominado el grupo de la isometrías del plano, del cual ( Isom+ ( E2 ),o) es un subgrupo. A su vez el grupo de las traslaciones (T ,o ) y el grupo (GO ,o ) de los giros concéntricos en O, son subgrupos de este último. Si en la descomposición f = S en o S en–1 o...o S e2 o S e1 es n par, la isometría f será directa (esto es, un movimiento). Por el contrario, si n es impar, tendremos una isometría inversa. En este caso tal isometría inversa será obviamente el resultado de componer un movimiento y una simetría axial, ya que si n es impar entonces n – 1es par y, por tanto f = S en o S en–1 o...o S e2 o S e1 = (S en o S en–1 o...o S e2 ) o S e1 144 42444 3 MOVIMIENTO

f = S en o S en–1 o...o S e2 o S e1 = S en o (S en–1 o...o S e2 o S e1 ) 144 42444 3

o bien

MOVIMIENTO

Proposición: Toda isometría en el plano se puede descomponer en producto de n simetrías axiales con n £ 3. Esa descomposición no es única.

–

Si se trata de una isometría directa se reduce a un giro o a una traslación, que son los posibles resultados de componer un número par de simetrías axiales. Recuérdese que al componer cada dos simetrías axiales el resultado es un giro o una traslación, según que los ejes sean concurrentes o paralelos, y que la composición de dos giros, dos traslaciones, giro y traslación, o traslación o giro, da en todo caso un giro o una traslación. e¢ e e¢¢ Entonces, toda isometría directa se descompone en producto de dos simetrías axiales, bien de ejes concurrentes (giro), o bien de ejes paralelos (traslación).

–

En caso de una isometría inversa, tendremos los casos siguientes: a) Producto de traslación por simetría axial o viceversa. r v Si la dirección del vector de traslación v es perpendicular al eje e de la simetría, la composición se puede reducir a una sola simetría axial. Bastaría considerar las dos rectas re' y e'' paralelas a e y que distan de e la mitad del módulo de v.


n

Figura 42. 345


346


S e o GO ,j = S e o S e1 o S e ' = Tvr o S e '

GO ,j o S e = S e '' o S e1 o S e = S e '' o Tvr

Entonces Tvr o S e = ( S e ' o S e ) o S e = S e ' o ( S e o S e ) = S e ' o i = S e '

Figura 44.

S e o Tvr = S e o ( S e o S e '' ) = ( S e o S e ) o S e '' = i o S e '' = S e '' v

v

v

Si la dirección del vector y la dirección del eje de simetría no son perpendiculares, entonces las composiciones anteriores equivalen a la composición de tres simetrías r axiales, que no puede reducirse a una sola. En particular si v es paralelo a e, tenemos una transformación particular que denominamos deslizamiento, cumpliéndose enr tonces Tvr o S e = S e o Tvr (figura 43a). Si v no es paralelo a e las transformaciones Tvr y S e no son conmutables (figura 43b). O

O

j2

(a)

e1

e¢

j2

e¢¢

(b)

e

e

Si O no pertenece al eje e, la composición equivale a un producto de tres simetrías, que no puede reducirse como antes a una sola. Lo que sí puede hacerse es descomponer el giro en dos simetrías axiales de ejes concurrentes en O, de modo que uno de ellos sea paralelo al e. Entonces este caso puede reducirse al caso a).

v

v

P¢¢

P¢

O

P e¢¢

j 2 (b)

S e o GO ,j = S e o ( S e o S e '' )o = ( S e o S e ) o S e '' = i o S e '' = S e '' (a)

Si el eje e de la simetría pasa por el centro O del giro, entonces el resultado de la composición se reduce a una sola simetría axial. Basta tomar las rectas e' y e'' que pasan por O y forman con e ángulos de magnitud j 2. Resultan e GO ,j o S e = ( S e ' o S e ) o S e = S e ' o ( S e o S e ) = S e ' o i = S e '

j 2

(Tvr o S e )( P ) = Tvr [ S e ( P )] = P ' ( S e o Tvr )( P ) = S e [Tvr ( P )] = P ' '

v

(Tvr o S e )( P ) = Tvr [ S e ( P )] = P ' ( S e o Tvr )( P ) = S e [Tvr ( P )] = P '

Figura 43. e¢

P

Producto de giro por simetría axial o viceversa.

Producto de giro por simetría axial o viceversa.

Si el eje e de la simetría pasa por el centro O del giro, entonces el resultado de la composición se reduce a una sola simetría axial. Basta tomar las rectas e' y e'' que pasan por O y forman con e ángulos de magnitud j 2. Resultan e j 2 GO ,j o S e = ( S e ' o S e ) o S e = S e ' o ( S e o S e ) = S e ' o i = S e '

(Tvr o S e )( P ) = Tvr [ S e ( P )] = P ' ( S e o Tvr )( P ) = S e [Tvr ( P )] = P ' '

(a)

Figura 43.

(b)

j 2

e¢¢

S e o GO ,j = S e o ( S e o S e '' )o = ( S e o S e ) o S e '' = i o S e '' = S e ''

P

e¢

P

O

Si O no pertenece al eje e, la composición equivale a un producto de tres simetrías, que no puede reducirse como antes a una sola. Lo que sí puede hacerse es descomponer el giro en dos simetrías axiales de ejes concurrentes en O, de modo que uno de ellos sea paralelo al e. Entonces este caso puede reducirse al caso a).

P¢

P¢¢

v

v

P¢

v

e

e

e1

e

e1

(a)

e¢

e¢¢

e (b)

Si la dirección del vector y la dirección del eje de simetría no son perpendiculares, entonces las composiciones anteriores equivalen a la composición de tres simetrías r axiales, que no puede reducirse a una sola. En particular si v es paralelo a e, tenemos una transformación particular que denominamos deslizamiento, cumpliéndose enr tonces Tvr o S e = S e o Tvr (figura 43a). Si v no es paralelo a e las transformaciones Tvr y S e no son conmutables (figura 43b). j2

O

j2

O

v

v

v

v

(Tvr o S e )( P ) = Tvr [ S e ( P )] = P ' ( S e o Tvr )( P ) = S e [Tvr ( P )] = P '

b)

b)

P¢

v

e

e1

e

S e o Tvr = S e o ( S e o S e '' ) = ( S e o S e ) o S e '' = i o S e '' = S e '' Entonces Tvr o S e = ( S e ' o S e ) o S e = S e ' o ( S e o S e ) = S e ' o i = S e '

S e o GO ,j = S e o S e1 o S e ' = Tvr o S e '

GO ,j o S e = S e '' o S e1 o S e = S e '' o Tvr



346

Figura 44.

Movimientos en el plano En resumen:

ISOMETRÍAS Isom(E2) grupo no abeliano

Isom(E2)

+

Isom (E ) 2

T

DIRECTAS Isom+(E2) subgrupo de los movimientos Se reducen a la composición de dos simetrías axiales

INVERSAS Isom (E2) No constituyen un subgrupo Se reducen a una simetría axial o a la composición de tres simetrías axiales

G0

7.4. Caracterización por los puntos dobles Según se vio en el apartado anterior puede establecerse la definición de isometría directa o movimiento como transformación del plano en sí mismo, cumpliendo para cualesquiera tres puntos A, B y C y sus respectivos homólogos A', B' y C ' que AB = A ' B ' , AC = A 'C ' , Ð( A ' B ', A 'C ') = Ð( AB , AC )

[3]

Proposición: Un movimiento queda determinado si se conocen dos pares de puntos homólogos. Efectivamente, si se conocen A y B y sus homólogos A' y B', para hallar el homólogo de cualquier punto X , se construye Ð( A ' B ', A ' X ') = Ð( AB , AX ) y se toma AX = A ' X .

X B

Entonces X cumple las relaciones [3]. Si tales relaciones se cumplen para el par X y X ', obtenidos de la forma anterior, respecto de los pares fijos A , A ' y B , B ', veamos que también se verificarían respecto a otros dos pares cualesquiera C ,C ' y D , D ' de puntos homólogos. Sea D otro punto y su homólogo D', los cuales verificarán respecto de A , A ' y B , B ' las relaciones [3], es decir, AD = A ' D ', AB = A ' B ', Ð( A ' D ', A ' B ') = Ð( AD , AB).

X¢

B¢

A D D¢ A¢

Figura 45.

Entonces AD = A ' D ', AX = A ' X , y además: Ð( AD , AX ) = Ð( AD , AB)+Ð( AB , AX ) = Ð( A ' D ', A ' B ')+Ð( A ' B ', A ' X ') = Ð( A ' D ', A ' X ') por lo cual el punto X verifica las relaciones [3] respecto de A y D. Por un razonamiento similar podemos reemplazar el punto A por otro punto C. Como consecuencia de lo anterior tenemos: 1.

Un movimiento con dos puntos dobles es una identidad. Según el razonamiento anterior, si A y B son los puntos dobles, entonces para cualquier punto X los triángulos DABX y DA ' B ' X ' serían coincidentes, por lo que X = X '.


347


348


2.

Un movimiento con un punto doble es un giro. Si A es el punto doble, para cada dos pares X , X ' e Y ,Y ' de puntos hoX¢ Y¢ mólogos, según [1] tendremos j

En el caso de una isometría inversa, puede probarse que si hay un punto doble entonces hay toda una recta de puntos dobles y se trata de una simetría axial. La demostración es trivial, ya que si A es el punto doble, entonces para cualesquiera dos puntos homólogos X y X ' se tendrá XA = X ' A, al tratarse de una isometría, por lo cual el triángulo DAXX 'es isósceles y la mediatriz del lado XX 'pasa por A. Tal recta sería el eje de simetría. Hay que hacer notar que también hay isometrías inversas sin puntos dobles. Basta considerar, por ejemplo, la composición de una simetría axial y una traslación. Ð( AX , AY ) = Ð( AX ', AY ') , AX = AX ' , AY = AY '

X

De aquí se desprende

Ð( AX , AX ') = Ð( AY , AY ') = j

A

Observación:

Y

j

con lo cual se trata del giro GA,j .

Figura 46.

Todo movimiento o isometría directa en el plano es una traslación, un giro o la identidad. Un movimiento con ningún punto doble es una traslación. Razonaremos por reducción al absurdo. Supongamos que la isometría directa f no fuera una traslación. Entonces para dos pares de puntos hoQ mólogos X , X ' e Y ,Y ' las rectas XY y X 'Y ' se cortarían en un punto Q. X¢ Tracemos ahora las circunferencias C1 y C2 determinadas respectivamente por las ternas de puntos QXY y QX 'Y ', las cuales se cortarían en Y¢ un punto A (figura 47). Proposición:

3.

En consecuencia podemos enunciar lo siguiente:

Al ser f una isometría también XY = X 'Y ', por lo cual DXYA = DX 'Y ' A al tener iguales un lado y dos ángulos. Ello implica que Ð( XY , XA) = Ð( X 'Y ', X ' A) y XA = X ' A , con lo que A sería el homólogo del propio A y sería un punto doble, en contra de la hipótesis. Luego f debe ser una traslación. Y

A

1 1 1 ÐX 'Y ' A = arcoQYA = ( 360º– arcoQY ' A ) = 180º– arcoQY ' A = 180º– ÐQYA = ÐXYA 2 2 2 X

Figura 47.

Se verifican: 1 1 1 ÐYXA = arcoQX ' A = ( 360º– arcoQXA ) = 180º– arcoQXA = 180º– ÐQX ' A = ÐY ' X ' A 2 2 2

Se verifican: 1 1 1 ÐYXA = arcoQX ' A = ( 360º– arcoQXA ) = 180º– arcoQXA = 180º– ÐQX ' A = ÐY ' X ' A 2 2 2 Figura 47.

1 1 1 ÐX 'Y ' A = arcoQYA = ( 360º– arcoQY ' A ) = 180º– arcoQY ' A = 180º– ÐQYA = ÐXYA 2 2 2 X

Al ser f una isometría también XY = X 'Y ', por lo cual DXYA = DX 'Y ' A al tener iguales un lado y dos ángulos. Ello implica que Ð( XY , XA) = Ð( X 'Y ', X ' A) y XA = X ' A , con lo que A sería el homólogo del propio A y sería un punto doble, en contra de la hipótesis. Luego f debe ser una traslación. A

Y

Un movimiento con ningún punto doble es una traslación. Razonaremos por reducción al absurdo. Supongamos que la isometría directa f no fuera una traslación. Entonces para dos pares de puntos hoQ mólogos X , X ' e Y ,Y ' las rectas XY y X 'Y ' se cortarían en un punto Q. X¢ Tracemos ahora las circunferencias C1 y C2 determinadas respectivamente por las ternas de puntos QXY y QX 'Y ', las cuales se cortarían en un punto A (figura 47). Y¢

En consecuencia podemos enunciar lo siguiente:

3.

Proposición:

Todo movimiento o isometría directa en el plano es una traslación, un giro o la identidad. Figura 46.

con lo cual se trata del giro GA,j .

A

Observación:

Ð( AX , AX ') = Ð( AY , AY ') = j

En el caso de una isometría inversa, puede probarse que si hay un punto doble entonces hay toda una recta de puntos dobles y se trata de una simetría axial. La demostración es trivial, ya que si A es el punto doble, entonces para cualesquiera dos puntos homólogos X y X ' se tendrá XA = X ' A, al tratarse de una isometría, por lo cual el triángulo DAXX 'es isósceles y la mediatriz del lado XX 'pasa por A. Tal recta sería el eje de simetría. Hay que hacer notar que también hay isometrías inversas sin puntos dobles. Basta considerar, por ejemplo, la composición de una simetría axial y una traslación. X

j

Y¢

2.

X¢ j

Y

De aquí se desprende

Ð( AX , AY ) = Ð( AX ', AY ') , AX = AX ' , AY = AY '

Un movimiento con un punto doble es un giro. Si A es el punto doble, para cada dos pares X , X ' e Y ,Y ' de puntos homólogos, según [1] tendremos



348


7.5. Igualdad o congruencia de figuras planas Observemos las figuras F , F ' y F '' F

D

C

F

A

F

F

E

E¢ A¢

F’

A D

D C¢

B

E

C

B¢

Figura 48.

F”

B

La figura F se puede hacer superponer con la figura F ' moviéndola en el plano, esto es, existe una isometría directa (no única) mediante la cual la figura transformada de la F es la F ' (figura 49).

Figura 49. En cambio no hay ningún movimiento en el plano (isometría directa) mediante el cual pueda hacerse superponer las figuras F y F ''(habría que arrancar F ''y darle la vuelta). Hemos de hacer notar que las figuras F y F ' tienen la misma orientación, mientras que la figura F ''tiene una orientación distinta, de ahí que para superponer F y F '' es preciso aplicar un movimiento y una simetría axial, esto es, una isometría inversa. Decimos que dos figuras planas son congruentes o iguales si se pueden hacer coincidir mediante un movimiento en el plano. Así, pues, la congruencia o igualdad directa se identifica con la isometría directa, es decir, la igualdad de figuras planas implica el mismo tamaño, la misma forma y la misma orientación. En este sentido las figuras F y F ' de nuestro ejemplo serían “iguales”, no así las figuras F y F ''. Tal relación de congruencia de figuras es una relación de equivalencia (reflexiva, simétrica y transitiva).

8. ESTUDIO ANALÍTICO DE LAS ISOMETRÍAS EN EL PLANO 8.1. Ecuaciones de la traslación r r Tomando en E2 el sistema de referencia ortonormal{O; u1, u2} , sean ( a , b) las componentes del vector r r r de traslación, o sea u = au1+ bu2. Para un punto P ( x, y ) y su homólogo P '( x', y' ) se tiene Y u [OP '] =ë OP û+ë PP 'û=ë OP û+ ur P¢

es decir:

P

( x', y' ) = ( x, y )+ ( a0 , b0 )

r resultando las ecuaciones de la traslación de vector u = ( a , b ): ì x'= x+ a0 í î y'= y+ b0


X

O

[4] Figura 50. 349


350


Matricialmente las ecuaciones pueden recogerse en la igualdad: ì x' = ( x0 – x0 cos j+ y0 sen j )+ xcos j – y sen j = a0 + xcos j – y sen j í î y' = ( y0 – x0 sen j – y0 cos j )+ x sen j+ ycos j = b0 + x sen j+ ycos j æ x' ö æ a0 ö æ 1 0öæ x ö ç ÷ ç ÷ ÷= ç ç ÷ç ç ÷ ÷ ç ÷ ÷+ç è y'ø è b0 ø è 0 1øè yø

[5] o bien

o bien ì x'– x0 = ( x – x0 )cos j – ( y – y0 ) sen j í î y'– y0 = ( x – x0 ) sen j+ ( y – y0 )cos j æ x' ö æ 1 0 a0 öæ x ö ÷ç ÷ ç ÷ ç ç y '÷= ç 0 1 b0 ÷ç y÷ ÷ç ÷ ç ÷ ç è 1 ø è 0 0 1 øè 1 ø

[6]

[9]

Si el centro de giro es un punto cualquiera C ( x0 , y0 ) las ecuaciones anteriores son válidas si ponemos x – x0, y – y0, x'– x '0, y '– y'0 en lugar de x, y, x', y'. Es decir: æ x' ö æcos j – sen jöæ x ö ç ÷ ÷= ç ç ÷ç ç ÷ ÷ ç ÷ è y'ø èsen j cos j øè yø

8.2. Ecuaciones del giro

r r Elegimos en E2 un sistema de referencia ortonormal {O; u1, u2}.

[8]

que pueden expresarse matricialmente en la forma

Si el centro de giro es el origen de coordenadas el punto P de coordenadas polares ( r, q ) se transforma mediante el giroGO,j en el punto P'cuyas coordenadas polares son ( r, q + j ) .

P¢ (x¢ ,y¢)

ì x ' = x cos j – y sen j í î y ' = x sen j+ y cos j

j

r

q O

P(x,y)

Quedan las ecuaciones de un giro de centro el origen de coordenadas:

[7]

r

Figura 51.

y ' = r (sen q cos j+ cos q sen j ) = ( rsen q ) cos j+ ( rcos q ) sen j = y cos j+ x sen j Siendo las coordenadas cartesianas de P y P' respectivamente ( x, y ) y ( x', y' ), tendremos: x' = r (cos q cos j – sen q sen j ) = ( rcos q ) cos j – ( r sen q ) sen j = xcos j – y sen j x = OP cos q = rcos q ; ;

y ' = OP 'sen ( q + j ) = rsen ( q + j )

;

x' = OP 'cos( q + j ) = rcos( q + j )

x = OP cos q = rcos q ;

y ' = OP 'sen ( q + j ) = rsen ( q + j ) Desarrollando estas últimas:

Desarrollando estas últimas:

x' = OP 'cos( q + j ) = rcos( q + j )

y = OPsen q = rsen q

y = OPsen q = rsen q

x ' = r (cos q cos j – sen q sen j ) = ( rcos q ) cos j – ( r sen q ) sen j = xcos j – y sen j

Siendo las coordenadas cartesianas de P y P' respectivamente ( x, y ) y ( x', y' ), tendremos: y ' = r (sen q cos j+ cos q sen j ) = ( rsen q ) cos j+ ( rcos q ) sen j = y cos j+ x sen j Figura 51.

q r r

P(x,y)

[7]

j

P¢ (x¢ ,y¢)

Si el centro de giro es el origen de coordenadas el punto P de coordenadas polares ( r, q ) se transforma mediante el giroGO,j en el punto P'cuyas coordenadas polares son ( r, q + j ) .

ì x' = x cos j – y sen j í î y ' = x sen j+ y cos j

O

Quedan las ecuaciones de un giro de centro el origen de coordenadas:

que pueden expresarse matricialmente en la forma

r r Elegimos en E2 un sistema de referencia ortonormal {O; u1, u2}.

[8]

8.2. Ecuaciones del giro

æ x' ö æcos j – sen jöæ x ö ç ÷ ç ÷ ÷= ç ç ÷ç ç ÷ ÷ è y'ø èsen j cos j øè yø

Si el centro de giro es un punto cualquiera C ( x0 , y0 ) las ecuaciones anteriores son válidas si ponemos x – x0, y – y0, x'– x '0, y '– y'0 en lugar de x, y, x', y'. Es decir: öæ ö æ ö æ ç x' ÷ ç 1 0 a0 ÷ç x ÷ ç y '÷= ç 0 1 b0 ÷ç y÷ ÷ç ÷ ç ÷ ç è 1 ø è 0 0 1 øè 1 ø

ì x'– x0 = ( x – x0 )cos j – ( y – y0 ) sen j í î y'– y0 = ( x – x0 ) sen j+ ( y – y0 )cos j

[9] o bien

[6] o bien

æ x' ö æ a0 ö æ 1 0öæ x ö ç ÷ ÷+ç ç ÷ ÷= ç ç ÷ç ç ÷ ÷ ç ÷ è y'ø è b0 ø è 0 1øè yø

ì x' = ( x0 – x0 cos j+ y0 sen j )+ xcos j – y sen j = a0 + xcos j – y sen j í î y' = ( y0 – x0 sen j – y0 cos j )+ x sen j+ ycos j = b0 + x sen j+ ycos j

[5]

Matricialmente las ecuaciones pueden recogerse en la igualdad: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


350

Movimientos en el plano que matricialmente puede expresarse æ x' ö æ a0 ö æcos j – sen jöæ x ö ç ÷ ÷ç ç ÷ ÷ ç ÷ ÷= ç ç ç ÷ ÷+ç è y'ø è b0 ø èsen j cos j øè y ø

[10]

siendo ( a0 , b0 ) las coordenadas del homólogo O' del origen de coordenadas. La ecuación matricial anterior también puede ponerse como sigue: æ x ' ö æcos j – sen j a0 öæ x ö ÷ç ÷ ç ÷ ç ç y'÷= çsen j cos j b0 ÷ç y÷ ÷ç ÷ ç ÷ ç 0 1 øè 1 ø è 1ø è 0

[11]

Observación: Podemos recurrir a los números complejos para obtener el transformado P '( x', y' ) de un punto P ( x, y ) mediante un giro de centro del origen de coordenadas y ángulo j. Si P es el afijo del número complejo z, entonces P' es el afijo del número complejo z' que resulta de multiplicar z por 1j = cos j+ isen j. Por tanto z ' = x '+iy '= ( x + yi )× (cos j+ i sen j ), de donde resultan las ecuaciones [7]. Si el centro de giro es C ( x0 , y0 ), afijo del número complejo z 0 = x0 + iy0, entonces el homólogo de P, se obtendría de z '– z 0 = ( z – z 0 )×1j , llegando a las ecuaciones [9].

8.3. Ecuaciones de la simetría central Las ecuaciones de una simetría central de centro el punto C de coordenadas ( x0 , y0 ) se obtienen teniendo en cuenta queë OP 'û= –ë OP û, es decir ( x'– x0 , y'– y0 ) = –( x – x0 , y – y0 ) de donde queda: ì x ' = – x + 2x0 í î y' = – y + 2 y0 Matricialmente: æ x ' ö æ –1 0 2x0 öæ x ö ÷ç ÷ ç ÷ ç æ x' ö æ 2x0 ö æ –1 0 öæ x ö ç ÷ ç ÷ ç ÷ ÷= ç ÷+ç ç ÷ç ç ÷ ÷ o ç y'÷= ç 0 –1 2 y0 ÷ç y÷ è y 'ø è 2 y0 ø è 0 –1øè yø ÷ç ÷ ç ÷ ç 1 øè 1 ø è 1ø è 0 0 que son particularizaciones de las [10] y [11] para j = 2p.

8.4. Ecuaciones de la simetría axial P(x, y)

De manera general, si la ecuación cartesiana del eje de simetría es e: Ax + By + C = 0, entonces el æ x+ x' y+ y' ö ÷ del segmento PP' punto medio Mç , 2 ø è 2 debe verificar la ecuación del eje.

Y

e: Ax+By+C=0

P¢(x¢, y¢) X

Figura 52. Esto es: æ x+ x' ö æ y+ y' ö ÷+ C = 0 Þ ÷+ Bç Aç è 2 ø è 2 ø


' By '= –2C – Ax – By Ax +

[12]

351


352


Figura 54.

A y'– y , y la de la recta PP', que es , han de ser inversas B x'– x

A su vez, la pendiente de la recta e, que es –

O

a

y de signo contrario, por lo cual:

a

x´

y'– y B = Þ Bx'– Ay'= Bx – Ay x'– x A Resolviendo en x' e y' el sistema formado por las relaciones [12] y [13], llegaremos a: ì –2 AC – ( A 2 – B 2 )x – 2 ABy ï x' = A2+B2 ï í ï –2BC – 2 ABx+ ( A 2 – B 2 ) y ï y' = î A2+B2

[13]

A

P¢

m

v

x

M

e

[14]

P

Podemos a las ecuaciones de la simetría axialr partiendo de la ecuación vectorial del eje e de sir r llegar r r metría y = a + tv, donde tomamos el vector direccional v unitario y como a el vector de posición del punto A, pie de la perpendicular desde O a la recta e. De estas ecuaciones resultan algunas particularizaciones sencillas:

Y

Y

P(x, y)

Simetría respecto a la bisectriz del primer cuadrante ( e : x – y = 0 ) ìx ' = y Tomando A = 1, B = –1, C = 0 quedan í î y' = x

c)

Simetría respecto al eje OY ( e : x = 0 ) ìx' = – x Tomando B = C = 0 y A = 1 quedan í î y' = y

b)

Simetría respecto al eje OX ( e : y = 0 ) ì x' = x Tomando A = C = 0 y B = 1 quedan í î y' = – y

a)

Y

P¢(-x, y)

P(x, y)

O

P(x, y)

P¢( -x, y)

X P¢(x, -y)

X

O

(a)

(c)

(b)

Figura 53.

Simetría respecto al eje OX ( e : y = 0 ) ì x' = x Tomando A = C = 0 y B = 1 quedan í î y' = – y

b)

Simetría respecto al eje OY ( e : x = 0 ) ìx' = – x Tomando B = C = 0 y A = 1 quedan í î y' = y

c)

Simetría respecto a la bisectriz del primer cuadrante ( e : x – y = 0 ) ìx ' = y Tomando A = 1, B = –1, C = 0 quedan í î y' = x

(b)

(a) O

P¢(x, -y) X

O

Figura 53.

(c)

O

X

X

P¢( -x, y)

P(x, y)

P¢(-x, y)

P(x, y)

a)

X

O

Y

Y

Y

P(x, y)

Podemos a las ecuaciones de la simetría axialr partiendo de la ecuación vectorial del eje e de sir r llegar r r metría y = a + tv, donde tomamos el vector direccional v unitario y como a el vector de posición del punto A, pie de la perpendicular desde O a la recta e. De estas ecuaciones resultan algunas particularizaciones sencillas:

A y'– y A su vez, la pendiente de la recta e, que es – , y la de la recta PP', que es , han de ser inversas B x'– x y de signo contrario, por lo cual: y'– y B [13] = Þ Bx'– Ay'= Bx – Ay x'– x A Resolviendo en x' e y' el sistema formado por las relaciones [12] y [13], llegaremos a: ì –2 AC – ( A 2 – B 2 )x – 2 ABy ï x' = A2+B2 ï í [14] ï – 2 BC – 2 ABx +( A2 – B2 ) y ï y' = î A2+B2 P

e

M

x

v

A

x´

a

O

352

P¢

Figura 54.



a

m

Movimientos en el plano Dado un punto cualquiera P ( x, y ) y su simétrico P '( x', y' ), el punto medio M del segmento PP' debe 1 r r r r r pertenecer a la recta e, es decir el vector m = [OM ] = ( x + x ' ), donde x =ë OP ûy x '=ë OP 'û, debe cum2 1 r r r r plir la ecuación vectorial de e, es decir para algún valor de t debe ser ( x + x ' ) = a + tv, de donde 2 r r r r [15] x ' = 2a + 2tv – x r Veamos ahora cómo obtener el valor de t. Multiplicando en [15] escalarmente por v sale r r r r r r r x× ' v = 2a × v + 2tv 2 – x × v r r r pero como v 2 = 1 y a × v = 0 queda r r r r x× ' v = 2t – x × v r r r r r r r r Teniendo en cuenta queë PP 'û^v, entonces ( x '– x )× v = 0, y por tanto x '×v = x × v. Sustituyendo llegar r r r r r mos a x × ' v = 2t – x × v, y de aquí t = x × v. Luego la ecuación [15] nos queda: r r r r r r x ' = 2a + 2( x × v )v – x r r Si llamamos a a la inclinación del eje de simetría y d = a , entonces v = (cos a , sen a ) y r a = ( d sen a ,– d cos a ), con lo cual resultan: ì x ' = 2d sen a + 2( xcos a + y sen a )cos a – x = 2d sen a + x ( 2cos 2 a – 1)+ 2 y sen a cos a í 2 î y' = –2d cos a + 2( x cos a + y sen a ) sen a – y = –2d cos a + 2x sen a cos a – y ( 2cos a – 1) quedando ì x ' = 2d sen a + x cos a + y sen a í î y' = –2d cos a + x sen 2a – y cos 2a

[16]

que matricialmente pueden expresarse de las formas: æ x' ö æ 2d sen a ö æcos 2a sen 2a öæ x ö ç ÷ ÷ ç ÷ ÷= ç ç ÷+ç ç ÷ç ç ÷ ÷ è y 'ø è –2d cos a ø èsen 2a – cos 2a øè yø

[17]

æ x' ö æcos 2a sen 2a 2d sen a öæ x ö ÷ç ÷ ç ÷ ç ç y'÷= çsen 2a – cos 2a –2d cos a ÷ç y ÷ ÷ç ÷ ç ÷ ç 0 1 øè 1 ø è 1ø è 0

[18]

o bien

Observaciones: Los resultados [14] y [16] son concordantes, pues sabemos por geometría analítica elemental que podeö A B r æ ÷como vector normal unitario asociado a la recta de ecuamos tomar n = ç , ç 2 2 2 2 ÷ è± A + B ± A + B ø C . Si convenimos poner ción Ax+ By+ C = 0y la distancia de dicha recta al origen será d = 2 A +B2 A B C la ecuación normalizada = 0 de modo que el término indepenx+ y+ A2+B2 A2+B2 A2+B2 diente sea negativo, entonces d=


–C A2+B2

[19]

353


354


æ ö A B r ç ÷será de los dos vectores unitarios normales a e, el que está dirigido y el vector n = ç , ÷ è A2+B2 A2+B2 ø hacia el semiplano que no contiene al origen de coordenadas. Entonces un vector direccional unitario será æ x' ö æ a0 ö æ c11 c12 öæ x ö ÷ ç ç ÷ ÷ ç ÷ ÷= ç ç ÷ ÷+ç ç ÷ç è y'ø è b0 ø è c21 c22 øè y ø

[23]

æ c11 c12 ö ÷ Si la matriz de la aplicación lineal f : R 2 ® R 2 es C = ç ç ÷la relación [22] se podrá expresar maè c21 c22 ø tricialmente como sigue: æ ö A r ç –B ÷ v = (cos a , sen a ) = ç , ÷ è A2+B2 A2+B2 ø

[20]

y de aquí: Figura 56.

cos 2a = cos 2 a – sen 2a =

A2 – B2

A2+B2

, sen 2a = 2sen 2a cos e =

z

–2 AB A2+B2

Sustituyendo [19], [20] y [21] en [16] obtendremos las [14].

z¢ x

x¢

8.5. Estudio matricial general

[21]

x

z

y¢

x¢

(b)

r r Sea una isometría en E2, donde tenemos un sistema de referencia ortonormal {O; u1, u2}. Supongamos que el origen se transforma en el punto P ( a , b ) . 0 0 0 Para cualquier otro punto X ( x, y ) de E2 el vector OX se transformará el vector P0 X ' de igual módulo que X¢ r r r el anterior. Si ponemos x =ë OX ûy x '=ë P0 X 'û= f ( x ) x¢ X tendremos r r x '=ë OX 'û=ë OP0 û+ë P0 X 'û=ë OP0 û+ f ( x ) (a)

z

Hemos de tener en cuenta que f , por ser isometría, transforma un triángulo en otro triángulo con los lados de la r r y los r ángulos iguales. r r Sean r ambos triángulos r r r misma r o distinta orientación, tendremos que si , es decir z = x + y es rtambién z ' = x ' + y ' f ( x + y ) = f ( x ) + f ( y r) (figura 56a). Análogamente puede pror r r r barse que si z = lx, es también z '= lx ', por lo que f ( lx ) = lf ( x ) (figura 56b). Figura 55.

P0

donde f es una aplicación lineal de R en R . 2

2

r X ' = P0 + f ( x )

[22] O

es decir:

O

r X ' = P0 + f ( x )

es decir:

[22]

donde f es una aplicación lineal de R 2 en R 2.

r r Sea una isometría en E2, donde tenemos un sistema de referencia ortonormal {O; u1, u2}. Supongamos que el origen se transforma en el punto P0 ( a0 , b0 ) . Para cualquier otro punto X ( x, y ) de E2 el vector OX se transformará el vector P0 X ' de igual módulo que X¢ r r r el anterior. Si ponemos x =ë OX ûy x '=ë P0 X 'û= f ( x ) x¢ X tendremos r r P0 x '=ë OX 'û=ë OP0 û+ë P0 X 'û=ë OP0 û+ f ( x ) Figura 55.

Hemos de tener en cuenta que f , por ser isometría, transforma un triángulo en otro triángulo con los lados y los ángulos iguales. Sean ambos triángulos de la r r r r r r r r r misma r o distinta orientación, tendremos que si z = x + y es rtambién r z '= x '+ y', es r decir r f ( x + y ) = f ( xr )+ f ( y r) (figura 56a). Análogamente puede probarse que si z = lx, es también z '= lx ', por lo que f ( lx ) = lf ( x ) (figura 56b).

z

(a)

x¢

z

y¢

x

(b)

x¢

8.5. Estudio matricial general z¢

x

Sustituyendo [19], [20] y [21] en [16] obtendremos las [14]. A2 – B2

z

A2+B2

cos 2a = cos 2 a – sen 2a =

, sen 2a = 2sen 2a cos e =

A2+B2

[21]

–2 AB

Figura 56.

y de aquí: æc c ö ç 11 12 ÷ ÷la relación [22] se podrá expresar maSi la matriz de la aplicación lineal f : R 2 ® R 2 es C = ç è c21 c22 ø æ –B ö A r ÷ v = (cos a , sen a ) = ç , ç 2 2 2 2 ÷ è A +B A +B ø

[20]

tricialmente como sigue:

ö A B r æ ÷será de los dos vectores unitarios normales a e, el que está dirigido y el vector n = ç , ç 2 2 2 2 ÷ è A +B A +B ø hacia el semiplano que no contiene al origen de coordenadas. Entonces un vector direccional unitario será æ x' ö æ a0 ö æ c11 c12 öæ x ö ç ÷ ÷+ç ç ÷ç ç ÷ ÷ ç ÷ ÷= ç ç ÷ è y'ø è b0 ø è c21 c22 øè y ø

354

[23]



Movimientos en el plano o bien

æ x' ö æ c11 c12 ç ÷ ç ç y '÷= ç c21 c22 ç ÷ ç è 1ø è 0 0

æ ö a0 ö ÷ç x ÷ b0 ÷ç y÷ ÷ç ÷ 1 øè 1 ø

[24]

æ c11 c12 a0 ö ÷ ~ ç Puesto que estamos tratando de biyecciones de E2 en sí mismo, la matriz “orlada” C = ç c21 c22 b0 ÷ ÷ ç è 0 0 1ø ~ será inversible, para lo cual es necesario y suficiente que lo sea C, puesto que C = C . Es más, como la transr r formación dada es una isometría, el vector x = ( x, y ) y su transformado x '= ( x', y' ) han de tener el mismo módulo, por lo que de las relaciones r2 x ' = x'2+ y'2= ( x'

æ x' ö y')ç ç ÷ ÷= ( x è y'ø

r2 x = x2 + y2 = ( x

æxö y)ç ç ÷ ÷ è yø

æxö y) C '×Cç ç ÷ ÷ è yø

llegamos a que C '×C = I , es decir la matriz C es una matriz ortogonal. Sabemos, además, que si C es ortogonal, entonces C = ±1. Al mismo resultado llegamos teniendo en cuenta que las columnas de la matriz C son los transformados de los vectores básicos por la aplicación lineal f , es decir æ 1ö æ 0ö r r æ c11 ö r r æ c12 ö u '1= ç ç ÷ ÷= f ( u1 ) , u '2= ç ç ÷ ÷= f ( u2 ) ç ÷ ÷= Cç ç ÷ ÷= Cç c c è 21ø è 0ø è 22 ø è 1ø Al tratarse de una isometría, transformará una base ortonormal en otra ortonormal, por lo cual r 2 r 2 r r 2 2 2 [25] u '1 = c112+ c21 = 1 ; u '2 = c21 + c22 = 1 ; u '1×u '2= c11×c12 + c21× c22 = 0 y esto nos lleva a que 2 æ c11 c21 öæ c11 c12 ö æ c112+ c21 ÷ ÷ C '×C = ç ç ÷ç ç ÷= ç ç è c12 c22 øè c21 c22 ø è c11× c12 + c21× c22

æ 1 0ö c11× c12 + c21× c22 ö ÷= ç ÷= I ÷ ç 0 1÷ 2 2 c21+ c22 ø ø è

æ x ' ö æ a0 ö æ x ö Podemos probar ahora que toda transformación dada porç ç ÷ ÷= ç ç ÷ ÷, donde C es una matriz ç ÷ ÷+ Cç è y'ø è b0 ø è yø ortogonal 2´ 2, es una isometría en E2. æ x2 ö æ x1 ö En efecto dados dos puntos P = ç ç ÷ ç ÷ ÷, sus transformados serán ÷y Q = ç è y2 ø è y1ø r r P ' = P0 + C x1 ; Q ' = P0 + C x2 æ x'2 – x '1 ö æ x2 – x1 ö r r ÷ ÷ de donde P 'Q ' = ç ç ç ÷. Entonces: ÷= C ( x2 – x1) = Cç è y'2 – y '2 ø è y2 – y2 ø d ( P ',Q ' )2 = P 'Q ' = ( x'2 – x'1 2

= ( x2 – x1

æ x'2 – x'1 ö ÷ y'2 – y'2)ç ÷= ( x2 – x1 ç è y'2 – y'2 ø

æ x2 – x1 ö ÷ y2 – y2) C '×Cç ç ÷= è y2 – y2 ø

æ x2 – x1 ö 2 2 ÷ y2 – y2)ç ç ÷= PQ = d ( P ,Q ) – y y è 2 1ø

de donde d ( P ',Q ' ) = d ( P ,Q ). TEMARIO DE MATEMÁTICAS. PRUEBA A

355


356


r r Puede probarse que si C = +1, la isometría transforma una base ortonormal {u1, u2}en otra base ortor r normal {u '1 , u '2} con la misma orientación que la anterior. Entonces se tratará de una isometría directa o r r r r movimiento. En caso de que C = –1, las bases {u1, u2}y {u '1 , u '2}tienen orientaciones distintas y la transformación es una isometría inversa.

en ambos casos con la condición a 2 + b 2 = 1. En el primero de ellos, si en particular es a = 1, b = 0, la matriz C se reduce a la identidad I y la transæ x' ö æ a0 ö æ x ö ç ÷ ÷+ç ç ÷ ÷= ç ç ÷ ÷que es una traslación en la que el origen O se transforma en el formación queda reducida aç è y'ø è b0 ø è yø punto de coordenadas ( a0 , b0 ). En cualquier caso, si fuese a0 = b0 = 0, tendríamos una transformación en la que el origen es un punto doble (que podría ser el único o no). u2¢

u2

u1¢

+

u1¢

u2

+

u2¢

+

æ x' ö æ a ö æ a – b öæ x ö æ x' ö æ a0 ö æ a b öæ x ö ç 0÷ ç ÷ ÷+ç ÷+ç ç ÷ ÷= ç ç ÷ ÷= ç ç ÷ç ç ÷ ÷ o ç ç ÷ç ç ÷ ÷ ç ÷ ÷ è y'ø è b0 ø è b a øè yø è y'ø è b0 ø è b – a øè yø u1

u1

[26]

÷C÷= +1

÷C÷= -1

Por tanto, la relación [23], que expresa la ecuación general de una transformación isométrica en el plano, se reduce a una de las dos formas siguientes: Figura 57.

c12 = c21. æa b ö ç ÷, con la condición a 2 + b 2 = 1. En consecuencia c11 = – c22, y la matriz C sería de la forma ç ÷ èb – a ø Aquí se tendrá C = – a 2 – b 2 = –1y se tratará de una isometría inversa. Las igualdades [25] determinan las formas posibles de la matriz C, ya que

c11 – c22 c2 c2 ü = Þ 112 = 222 ï c21 c12 c21 c12 ï ï ï c112 1 2 2 ý Þ c122 = c122 Þ c12 = ±c21 c11+ c21 = 1 Þ 2 + 1= 2 c21 c21 ï ï 2 ï 1 c22 2 2 c21+ c22 = 1 Þ 1+ 2 = 2 ï c12 c12 þ

c11× c12 + c21× c22 = 0 Þ

2. 1.

c12 = – c21. æa – b ö ç ÷, con la condición a 2 + b 2 = 1. Aquí En consecuencia c11 = c22, y la matriz C sería de la formaç ÷ èb a ø se tendrá C = a 2 + b 2 = 1y se tratará de una isometría directa. Entonces puede ser:

Entonces puede ser:

c –c c2 c2 ü c11× c12 + c21× c22 = 0 Þ 11 = 22 Þ 112 = 222 ï c c c c 21 12 ï 21 12 ï ï c2 1 2 ý Þ c122 = c122 Þ c12 = ±c21 c112+ c21 = 1 Þ 112 + 1= 2 c c ï 21 21 ï ï ï þ 2 1 c22 = c122 c122

c12 = – c21.

2 2 c21 + c22 = 1 Þ 1+

1.

æa – b ö 2 2 ÷ En consecuencia c11 = c22, y la matriz C sería de la formaç ç ÷, con la condición a + b = 1. Aquí èb a ø se tendrá C = a 2 + b 2 = 1y se tratará de una isometría directa. 2.

c12 = c21.

æa b ö 2 2 ÷ En consecuencia c11 = – c22, y la matriz C sería de la forma ç ç ÷, con la condición a + b = 1. èb – a ø Aquí se tendrá C = – a 2 – b 2 = –1y se tratará de una isometría inversa. Las igualdades [25] determinan las formas posibles de la matriz C, ya que

Por tanto, la relación [23], que expresa la ecuación general de una transformación isométrica en el plano, se reduce a una de las dos formas siguientes: Figura 57.

æ x' ö æ a0 ö æ a – b öæ x ö æ x' ö æ a0 ö æ a b öæ x ö ç ÷ ÷ ç ÷ ÷= ç ç ÷ ÷= ç ç ÷ç ç ÷ ÷ o ç ç ÷ç ç ÷ ÷ ç ÷ ç ÷ ÷+ç ÷+ç è y'ø è b0 ø è b a øè yø è y'ø è b0 ø è b – a øè yø ÷C÷= +1

[26]

÷C÷= -1

u1

u1

+

+

en ambos casos con la condición a 2 + b 2 = 1. En el primero de ellos, si en particular es a = 1, b = 0, la matriz C se reduce a la identidad I y la transæ x' ö æ a0 ö æ x ö formación queda reducida aç ç ÷ ÷= ç ç ÷ ÷que es una traslación en la que el origen O se transforma en el ç ÷ ÷+ç è y'ø è b0 ø è yø punto de coordenadas ( a0 , b0 ). En cualquier caso, si fuese a0 = b0 = 0, tendríamos una transformación en la que el origen es un punto doble (que podría ser el único o no). u2

u2¢

+

u2

u1¢

u1¢

u2 ¢

r r Puede probarse que si C = +1, la isometría transforma una base ortonormal {u1, u2}en otra base ortor r normal {u '1 , u '2} con la misma orientación que la anterior. Entonces se tratará de una isometría directa o r r r r movimiento. En caso de que C = –1, las bases {u1, u2}y {u '1 , u '2}tienen orientaciones distintas y la transformación es una isometría inversa.



356

Movimientos en el plano æ x' ö æ a – b öæ x ö ÷ En caso de la transformaciónç ç ÷ ÷= ç ç ÷ç ç ÷ ÷, se trataría de un giro de centro el origen. Recordeè y'ø è b a øè y ø æcos j – sen jö ÷ mos que la forma de la matriz obtenida en tal caso eraç ç ÷. èsen j cos j ø æ x' ö æ a b öæ x ö ÷ En caso de la transformaciónç ç ÷ ÷= ç ç ÷ç ç ÷ ÷, se trataría de una simetría axial respecto de un eje è y'ø è b – a øè y ø æcos 2a sen 2a ö ÷ que pasa por el origen O. Recordemos que entonces la matriz que obteníamos eraç ç ÷. èsen 2a – cos 2a ø En el caso general completo, las transformaciones [26] son el resultado de componer una un giro o una simetría axial, en los que el origen es punto doble, con una traslación que lleve el origen al punto P0 ( a0 , b0 ).

9. APLICACIÓN AL ESTUDIO DE LAS TESELACIONES DEL PLANO. FRISOS Y MOSAICOS 9.1. Generación de frisos Innumerables dibujos en pintura, escultura, arquitectura, estampados de telas y papeles, etc., se caracterizan por motivos geométricos constantes que se repiten, ofreciendo combinaciones sugerentes. Las cenefas o frisos son ejemplos de esta manifestación geométrica, fiel reflejo de un proceso dinámico en que se combinan el ritmo y la belleza. Por ello constituyen un recurso artístico muy utilizado (hileras de dólmenes prehistóricos, decoraciones egipcias, cerámicas nazaritas, decoración textil romana, esculturas de templos griegos…). Hoy día encontramos frisos en telas, papeles pintados, alicatados, filigranas de imprenta, etc. Se llama friso o cenefa a un dibujo plano infinito generado por la traslación de una figura base o región fundamental. Esta a su vez se forma a partir de un elemento o motivo mínimo generador mediante movimientos. Así, pues, en un friso podemos reconocer los siguientes elementos:

– – –

La región fundamental que se traslada.

–

Características de la traslación que reproduce el friso.

La región mínima. Movimientos o composición de movimientos que dan paso de la región mínima a la región fundamental.

Para un friso dado hay transformaciones que lo dejan invariante. A saber, una traslación paralela a la línea base del friso y de módulo la base d de la región fundamental. El lado vertical del rectángulo que limita la región fundamental también es un eje de simetría invariante, porque deja, a izquierda y derecha, bandas de friso que se superponen al doblar por este eje Resumiendo, si al doblar el friso –vertical u horizontalmente–, las figuras se superponen, es porque se ha localizado una simetría invariante vertical u horizontal, respectivamente. Al trasladar una copia del friso, se encuentran las traslaciones invariantes. En algunos frisos también hay otros movimientos invariantes, como los giros y simetrías en deslizamiento. Éstos dependen de las transformaciones utilizadas para dibujar la región mínima y la región fundamental. d

r


357


358


Figura 60.

Entonces podemos dar una definición más precisa de friso: Sea una figura F y su grupo de simetría S F (constituido éste por todas las isometrías que dejan F invariante). Se dice que la figura F es un friso (o cenefa) si cumple las siguientes condiciones:

Del elemento generador se obtiene la figura base por reflexión horizontal. Las transformaciones que dejan invariante el friso son las traslaciones Tndr y la simetría S r . 1.

2.

Hay una recta r (dibujada o no) que queda invariante por todas las isometrías del grupo S F . Dicha recta indica la dirección en que se va a desarrollar el friso por traslación. r Existe una traslación de vector no nulo d y dirección la de la recta r, que rdeja invariante el friso, y tal r que para cualquier otra traslación Tdr que deje invariante el friso debe ser v = nd con n entero. La traslación Tdr nos da el ritmo del friso.

î î î î î î î î î î î î ì ì ì ì ì ì ì ì ì ì ì ì

b)

Friso de las traslaciones y la simetría horizontal:

Figura 59. El elemento generador o motivo mínimo coincide con la figura base. Las únicas transformaciones r que forman su grupo de simetría son las traslaciones de vector múltiplo de d.

En consecuencia podemos establecer aquellas transformaciones que pueden estar presentes en la formación de un friso. El grupo de simetría del friso puede estar constituido por este tipo de transformaciones: Reflexiones:

2.

Traslaciones: todas las Tndr con n entero.

1.

–

d

Simetría S r horizontal de eje la recta r.

d

– Si hay una simetría vertical S r ' (siendo r'perpendicular a r) que deja invariante el friso, entonces cualquier otra simetría vertical cuyo eje se obtenga sometiendo r'a una traslación T1 r (con n ennd tero) también se integra en el grupo S F . 2 Ya no habrá más reflexiones, pues la recta r debe quedar globalmente invariante, y esto es sólo cierto si el eje de la simetría es r o una recta perpendicular a r. ì ì ì ì ì ì ì ì ì ì ì ì

a)

Friso de las traslaciones:

Según cuáles sean las transformaciones anteriores a las que se somete el elemento generador para formar la figura base los frisos se clasifican en siete tipos: 3.

Giros: serán giros que deben dejar la recta r invariante, por lo cual el centro de giro debe estar en r y el ángulo debe ser 180º. Así, pues, si un giro GO,180º se integra en el grupo de simetría del friso, entonces r también estarán todos los girosGCn ,180º cuyo centroC n se obtiene trasladandoO mediante el vector nd . 2

nd

Deslizamientos: para que un deslizamiento esté en el grupo de simetría de un friso, debe ser el resultado de componer la simetría S r con una traslación T1 r (con n entero). 4.

4.

Deslizamientos: para que un deslizamiento esté en el grupo de simetría de un friso, debe ser el resultado de componer la simetría S r con una traslación T1 r (con n entero).

Giros: serán giros que deben dejar la recta r invariante, por lo cual el centro de giro debe estar en r y el ángulo debe ser 180º. Así, pues, si un giro GO,180º se integra en el grupo de simetría del friso, entonces r también estarán todos los girosGCn ,180º cuyo centroC n se obtiene trasladandoO mediante el vector nd . 2

nd

3.

Según cuáles sean las transformaciones anteriores a las que se somete el elemento generador para formar la figura base los frisos se clasifican en siete tipos:

Si hay una simetría vertical S r ' (siendo r'perpendicular a r) que deja invariante el friso, entonces cualquier otra simetría vertical cuyo eje se obtenga sometiendo r'a una traslación T1 r (con n ennd tero) también se integra en el grupo S F . 2 Ya no habrá más reflexiones, pues la recta r debe quedar globalmente invariante, y esto es sólo cierto si el eje de la simetría es r o una recta perpendicular a r. a)

Friso de las traslaciones:

ì ì ì ì ì ì ì ì ì ì ì ì

d

– –

Simetría S r horizontal de eje la recta r.

1.

Traslaciones: todas las Tndr con n entero.

2.

Reflexiones:

d Figura 59. El elemento generador o motivo mínimo coincide con la figura base. Las únicas transformaciones r que forman su grupo de simetría son las traslaciones de vector múltiplo de d.

En consecuencia podemos establecer aquellas transformaciones que pueden estar presentes en la formación de un friso. El grupo de simetría del friso puede estar constituido por este tipo de transformaciones: b)

Friso de las traslaciones y la simetría horizontal:

Hay una recta r (dibujada o no) que queda invariante por todas las isometrías del grupo S F . Dicha recta indica la dirección en que se va a desarrollar el friso por traslación. r Existe una traslación de vector no nulo d y dirección la de la recta r, que rdeja invariante el friso, y tal r que para cualquier otra traslación Tdr que deje invariante el friso debe ser v = nd con n entero. La traslación Tdr nos da el ritmo del friso.

Del elemento generador se obtiene la figura base por reflexión horizontal. Las transformaciones que dejan invariante el friso son las traslaciones Tndr y la simetría S r .

ì ì ì ì ì ì ì ì ì ì ì ì î î î î î î î î î î î î

2.

1.

Sea una figura F y su grupo de simetría S F (constituido éste por todas las isometrías que dejan F invariante). Se dice que la figura F es un friso (o cenefa) si cumple las siguientes condiciones: Entonces podemos dar una definición más precisa de friso: Figura 60.

358



Movimientos en el plano c)

Friso de las traslaciones y las simetrías verticales: La figura base se forma sometiendo el elemento generador a una simetría de ìë, ìë eje vertical. Las transformaciones que forman el grupo de simetría de este friso está generado por las reflexiones verticales respecto de una recta r', perpendicular a r, y todas las reflexiones respecto de los ejes que resultan de trasladar r' mediante las traslaciones T1 r con n entero. 2

d)

nd

ìë ìë ìë ìë ìë ìë

Figura 61.

Friso de las traslaciones y el deslizamiento: La figura base se forma aplicando al ì ì ì ì ì ì ì ì ì elemento generador una simetría horizontal y una traslación. î î î î î î î î î El friso se genera con la traslación Tdr y el deslizamiento T1 r o S r . 2

d

Las transformaciones que lo dejan invariante son las traslaciones Tndr y los deslizamientos Tæ 1 ö r o S r . ç + n ÷d è2 ø

e)

f)

Figura 62.

Friso de las traslaciones y las rotaciones: La figura base se obtiene del elemento generador mediante un giro de 180º, es decir por simetría central, con centro O en la recta r. El friso queda invariante con las traslaciones elementales y con todos los giros GCn ,180º cuyos centros son los puntos obtenidos me1 r diante C n = O + nd . Se excluyen la 2 simetría horizontal y las simetrías verticales.

ì

ì ì ì ì ì ì ì ì ì

í

ì ì ì ì ì ì ì ì ì

Figura 63. Friso más completo: La figura base se forma aplicando al elemento generador un giro de 180º y a las figuras resultantes una simetría horizontal. Este friso es el resultado de someter el del tipo anterior a la simetría S r . Resulta un friso cuyo grupo de simetría incluye todos los tipos de transformaciones: traslaciones, giros, reflexiones y deslizamientos.

ìë, ìë ìë ìë ìë ìë ìë ìë îí îí îí îí îí îí îí îí


359



ìë

îí í

ìë

îí

ìë

îí

ìë îí

îí

Un teselado es periódico cuando puede delimitarse una región que pavimenta todo el plano por traslación. Es decir, se logra cubrir todo el plano desplazando esa región fundamental, sin someterla a giros ni reflexiones. Estas son las más fáciles de obtener. Figura 65.

–

ìë ,

Figura 66.

Friso de los giros y los deslizamientos:

360

g)

Existe un número ilimitado de formas de recubrir el plano y, por tanto, el número de posibles mosaicos es numerosísimo. Las teselas pueden ser poligonales o bien tener lados curvilíneos. Se pueden formar mosaicos con una sola pieza base, o bien combinando dos o más tipos. No obstante, distinguiremos dos grandes tipos de teselaciones: periódicas y aperiódicas.

En este tipo de friso para obtener la figura base aplicamos al elemento generador una simetría vertical y a las dos figuras resultantes un giro de 180º. Se obtiene un friso invariante por un grupo de isometrías que incluye traslaciones, giros, reflexiones verticales y deslizamientos, excluyendo la simetría horizontal S r . b)

Las piezas básicas o losetas utilizadas para recubrir se forman haciendo composiciones con polígonos o figuras curvas. Las piezas no pueden superponerse, ni pueden dejar huecos sin recubrir.

9.2. Teselaciones del plano

a)

Realizar una teselación del plano consiste en pavimentarlo completamente con ayuda de formas planas. El término tesela se utiliza para designar las loseta o piezas de un mosaico. Proviene del latín tesella, pieza de mármol que los romanos utilizaban en el pavimentado con mosaicos. Así, pues, una teselación o mosaico es todo recubrimiento del plano que cumpla las siguientes condiciones:

Realizar una teselación del plano consiste en pavimentarlo completamente con ayuda de formas planas. El término tesela se utiliza para designar las loseta o piezas de un mosaico. Proviene del latín tesella, pieza de mármol que los romanos utilizaban en el pavimentado con mosaicos. Así, pues, una teselación o mosaico es todo recubrimiento del plano que cumpla las siguientes condiciones: a)

Las piezas básicas o losetas utilizadas para recubrir se forman haciendo composiciones con polígonos o figuras curvas. Las piezas no pueden superponerse, ni pueden dejar huecos sin recubrir.

9.2. Teselaciones del plano

b)

En este tipo de friso para obtener la figura base aplicamos al elemento generador una simetría vertical y a las dos figuras resultantes un giro de 180º. Se obtiene un friso invariante por un grupo de isometrías que incluye traslaciones, giros, reflexiones verticales y deslizamientos, excluyendo la simetría horizontal S r .

Existe un número ilimitado de formas de recubrir el plano y, por tanto, el número de posibles mosaicos es numerosísimo. Las teselas pueden ser poligonales o bien tener lados curvilíneos. Se pueden formar mosaicos con una sola pieza base, o bien combinando dos o más tipos. No obstante, distinguiremos dos grandes tipos de teselaciones: periódicas y aperiódicas. Un teselado es periódico cuando puede delimitarse una región que pavimenta todo el plano por traslación. Es decir, se logra cubrir todo el plano desplazando esa región fundamental, sin someterla a giros ni reflexiones. Estas son las más fáciles de obtener. Figura 65.

ìë , g)

ìë

îí ìë

Friso de los giros y los deslizamientos:

îí ìë



îí

ìë 360

îí

Figura 66.

îí í

–


–

Por el contrario las teselaciones aperiódicas han sido objeto de investigaciones más complejas. Aquí se encuadran diversas familias de mosaicos, tales como las conocidas como “rombos de Penrose”, “dardos y cometas”, “polipiedros”, etc.

Figura 67.

9.3. Teselaciones regulares y semirregulares Una teselación regular es aquella que está realizada con un solo tipo de polígono regular. Teniendo en cuenta que la suma de los m ángulos que concurren en cada “nudo” ha de ser 360º y que cada uno de los ( n – 2 )×180º , encontrar los polígonos ángulos interiores de un polígono regular de n lados tiene de medida n ( n – 2 )×180º regulares que teselan el plano se reduce a resolver m = 360º. n Esto nos lleva a la ecuación diofántica 2n – mn + 2m = 0 cuyas únicas soluciones son n = 3, m = 6 n = 4, m= 4 n = 6, m = 3 Resultan por tanto las tres únicas teselaciones regulares: triangular, cuadrangular y hexagonal. En cada caso la suma de ángulos en cada nudo es, respectivamente: 6´ 60º= 360º ; 4 ´ 90º= 360º ; 3´ 120 = 360º

90º

30º

30º

108º

120º

30º 30º

120º

90º

108º

108º

90º

30º

120º 108º

90º 30º

La pieza gris encaja perfectamente en los tres casos ¡ HAY TESELACIÓN!

Figura 68.

Teselación triangular


Teselación cuadrangular

La pieza gris no encaja ¡ NO HAY TESELACIÓN!

Teselación hexagonal

361


362


Si una teselación se forma pavimentando el plano con varios tipos de polígonos regulares se trata de una teselación semirregular, siempre y cuando la distribución de los polígonos regulares alrededor de cualquier vértice sea siempre la misma. Para que no queden huecos sin cubrir, en cada nudo deben concurrir al menos tres polígonos y como máximo seis. La suma de los ángulos con ese vértice común debe ser 360º y puede conseguirse con ángulos de valores de 60º (triángulo equilátero), 90º (cuadrado), 120º (hexágono regular), 135º (octógono regular) o 150º (dodecágono regular). Las combinaciones que resultan son:

Figura 70.

2 ´ 108º +144º

150º + 90º + 2 ´ 60º

60 º + 144º + 156º

Polígonos regulares

Ángulos

2 octógonos + 1 cuadrado

2 ´ 135º + 90º = 360º

2 dodecágonos + 1 triángulo

2 ´ 150º + 60º = 360º

2 hexágonos + 2 triángulos

2 ´ 120º + 2 ´ 60º = 360º

1 hexágono +1 triángulo + 2 cuadrados

120º + 60º + 2 ´ 90º = 360º

1 hexágono + 4 triángulos

120º + 4 ´ 60º = 360º

1 dodecágono + 1 hexágono + 1 cuadrado

150º + 120º + 90º = 360º

2 cuadrados + 3 triángulos

2 ´ 90º + 3 ´ 60º= 360º

Hay otras sumas que dan 360º y donde los ángulos que intervienen son ángulos interiores de polígonos regulares. Pero estas combinaciones no permiten formar mosaicos semirregulares, pues los ensamblajes dejan espacios vacíos irregulares. Observación:

Figura 69.

Cada una de las seis primeras sumas se traduce en un mosaico semirregular, mientras que la última ofrece dos posibilidades de ensamblaje dando lugar a dos mosaicos. Resultan por tanto los ocho mosaicos semirregulares que existen y que se muestran a continuación: E

F

H

G

B

C

A

D

D C

B

A

G

F

Cada una de las seis primeras sumas se traduce en un mosaico semirregular, mientras que la última ofrece dos posibilidades de ensamblaje dando lugar a dos mosaicos. Resultan por tanto los ocho mosaicos semirregulares que existen y que se muestran a continuación: H

E

2 cuadrados + 3 triángulos

Figura 69.

1 dodecágono + 1 hexágono + 1 cuadrado

2 ´ 90º + 3 ´ 60º= 360º 150º + 120º + 90º = 360º 120º + 4 ´ 60º = 360º

1 hexágono + 4 triángulos

Observación:

1 hexágono +1 triángulo + 2 cuadrados

120º + 60º + 2 ´ 90º = 360º

Hay otras sumas que dan 360º y donde los ángulos que intervienen son ángulos interiores de polígonos regulares. Pero estas combinaciones no permiten formar mosaicos semirregulares, pues los ensamblajes dejan espacios vacíos irregulares. 2 ´ 120º + 2 ´ 60º = 360º

2 hexágonos + 2 triángulos

2 ´ 150º + 60º = 360º

2 dodecágonos + 1 triángulo

2 ´ 135º + 90º = 360º

2 octógonos + 1 cuadrado Polígonos regulares

Ángulos

Si una teselación se forma pavimentando el plano con varios tipos de polígonos regulares se trata de una teselación semirregular, siempre y cuando la distribución de los polígonos regulares alrededor de cualquier vértice sea siempre la misma. Para que no queden huecos sin cubrir, en cada nudo deben concurrir al menos tres polígonos y como máximo seis. La suma de los ángulos con ese vértice común debe ser 360º y puede conseguirse con ángulos de valores de 60º (triángulo equilátero), 90º (cuadrado), 120º (hexágono regular), 135º (octógono regular) o 150º (dodecágono regular). Las combinaciones que resultan son: 2 ´ 108º +144º

60 º + 144º + 156º

150º + 90º + 2 ´ 60º

Figura 70.



362

Movimientos en el plano Las teselaciones regulares y semirregulares son teselaciones periódicas. Para denotarlas se utiliza el llamado código de Schläfi, que consiste simplemente en nombrar los polígonos que concurren en cada vértice, según el número de lados, y por orden cíclico según van “rodeando” el citado vértice. Tales notaciones serían:

Regulares

Semirregulares

Teselación

Símbolo de Schläfi

Triangular Cuadrangular Hexagonal A B C D E F G H

3,3,3,3,3,3 4,4,4,4 6,6,6 8,8,4 12,12,3 6,3,6,3 6,4,3,4 6,3,3,3,3 12,6,4 4,3,4,3,3 4,4,3,3,3

La obtención de todas las teselaciones regulares y semirregulares puede relacionarse también con la solución de ecuaciones diofánticas. Si rodeamos cada nudo con una serie de k polígonos de números de lados n1, n2..., nk respectivamente debe cumplirse: k

å i=1

( ni – 2 )×180º = 360º ni

k

Û

å i=1

k

( ni – 2 ) 1 = k – 2å = 2 ni 1 ni

k

1 k o, lo que es lo mismo: å = – 1, donde 3 £ k £ 6. n 2 i 1 Resulta las siguientes posibilidades de solución: 1 1 1 1 – Para k = 3 Þ + + = . n1 n2 n3 2

–

–

–

Resultan 10 soluciones ( n1, n2 , n3 ) con n1 £ n2 £ n3: {(6,6,6), (5,5,10), (4,5,20), (4,6,12), (4,8,8), (3,7,42), (3,8,24), (3,9,18), (3,10,15), (3,12,12)} 1 1 1 1 Para k = 4 Þ + + + = 1. n1 n2 n3 n4 Resultan 4 soluciones ( n1, n2 , n3 , n4 ) con n1 £ n2 £ n3 £ n4: {(4,4,4,4), (3,3,4,12), (3,3,6,6), (3,4,4,6)} 1 1 1 1 1 3 Para k = 5 Þ + + + + = . n1 n2 n3 n4 n5 2 Resultan 2 soluciones ( n1, n2 , n3 , n4 , n5 ) con n1 £ n2 £ n3 £ n4 £ n5: {(3,3,3,3,6), (3,3,3,4,4)} 1 1 1 1 1 1 Para k = 6 Þ + + + + + = 2. n1 n2 n3 n4 n5 n6 Resulta 1 solución ( n1, n2 , n3 , n4 , n5 , n6 ) con n1 £ n2 £ n3 £ n4 £ n5 £ n6: {(3,3,3,3,3,3)}

Las soluciones en negrita corresponden a las 11 configuraciones posibles entre regurales y semirregulares, teniendo en cuenta que la solución (3,3,3,4,4) posibilita dos teselaciones diferentes según el orden con que los polígonos “rodeen” al vértice. TEMARIO DE MATEMÁTICAS. PRUEBA A

363


364


‘‘Avión’’

Figura 73.

9.4. Teselaciones pararregulares

Cabe ahora considerar teselaciones formadas con otros polígonos no regulares, bien con una única pieza base o con varias. Para indagar sobre tipos de polígonos que pueden tomarse como teselas, podríamos ir abandonando paulatinamente la “regularidad”. Es decir empezar por aquellos polígonos convexos que, no siendo regulares, conservan sin embargo la “equilateralidad” o la “equiangularidad”. Tendríamos: ‘‘Hueso’’

– – –

Equilateralidad + media equiangularidad Þ rombos

Utilizando papel tramado (isométrico, cuadrangular o hexagonal) pueden obtenerse bellas teselaciones del plano con piezas cóncavas en formas de poliamante (yuxtaposición de trángulos equiláteros), poliminó (yuxtaposición de cuadrados) o polihexe (yuxtaposición de hexágonos regulares). Igualmente encontramos bellas formas teseladoras en multitud de polígonos “nazaritas”. Equiangularidad + media equilateralidad Þ rectángulos

Media equiangularidad + media equiangularidad Þ paralelogramos, hexágonos con lados opuestos paralelos, trapecios isósceles, cometas, etc. “esfinge”

Flecha

Pentágono

Ala delta

Cruz griega

Figura 72.

Incluso podemos ver que, aunque con el pentágono regular no se puede teselar el plano el plano, sí es posible hacerlo con pentágonos que cumplan ciertas peculiaridades. El paso siguiente sería el abandono de la convexidad y podríamos obtener pavimentados del plano con teselas de muy variadas formas Figura 71.

Incluso podemos ver que, aunque con el pentágono regular no se puede teselar el plano el plano, sí es posible hacerlo con pentágonos que cumplan ciertas peculiaridades. El paso siguiente sería el abandono de la convexidad y podríamos obtener pavimentados del plano con teselas de muy variadas formas Figura 71.

Flecha

Pentágono “esfinge”

Ala delta

Cruz griega

Figura 72.

Media equiangularidad + media equiangularidad Þ paralelogramos, hexágonos con lados opuestos paralelos, trapecios isósceles, cometas, etc.

Utilizando papel tramado (isométrico, cuadrangular o hexagonal) pueden obtenerse bellas teselaciones del plano con piezas cóncavas en formas de poliamante (yuxtaposición de trángulos equiláteros), poliminó (yuxtaposición de cuadrados) o polihexe (yuxtaposición de hexágonos regulares). Igualmente encontramos bellas formas teseladoras en multitud de polígonos “nazaritas”.

– – –

Equiangularidad + media equilateralidad Þ rectángulos Equilateralidad + media equiangularidad Þ rombos

Cabe ahora considerar teselaciones formadas con otros polígonos no regulares, bien con una única pieza base o con varias. Para indagar sobre tipos de polígonos que pueden tomarse como teselas, podríamos ir abandonando paulatinamente la “regularidad”. Es decir empezar por aquellos polígonos convexos que, no siendo regulares, conservan sin embargo la “equilateralidad” o la “equiangularidad”. Tendríamos: ‘‘Hueso’’

Figura 73.



364

9.4. Teselaciones pararregulares

‘‘Avión’’

Movimientos en el plano Podemos justificar algunos enunciados generales: Teorema: Todo cuadrilátero tesela el plano. Hay que tener en cuenta que la suma de los cuatro ángulos interiores de cualquier cuadrilátero es 360º. Si realizamos giros de 180º respecto de los puntos medios de los lados podemos “rodear” cada nudo, hasta que coincidan en él los cuatro ángulos. De esta manera se cubre el plano.

Figura 74. Corolario: Todo triángulo tesela el plano. En efecto, la teselación se obtendría “fusionando” las piezas de dos en dos, de manera que tendríamos un paralelogramo, y entonces aplicaríamos semigiros respecto a los puntos medios de los lados, tal como se indicó en el teorema anterior (figura 75).

Figura 75.

Corolario: Todo hexágono con tres pares de lados paralelos tesela el plano. Como la suma de los seis ángulo interiores del hexágono es 4 ´ 180º= 720º, si éstos son iguales dos a dos tendremos 2a + 2 b + 2g = 720º a + b + g = 360º.

Figura 76. a b

g

9.5. Generación de mosaicos A partir de un mosaico dado se pueden obtener otros mediante procedimientos diversos. Así, pues, dividiendo la pieza base de un mosaico en partes iguales puede obtenerse una nueva tesela (figura 77 a). Igualmente, podemos proceder por yuxtaposición de grupos de teselas hasta obtener una nueva pieza base (figura 77 b).

(a)

(b)


365


366


Las posibilidades de formar mosaicos son ilimitadas si utilizamos recursos como cortar esquinas, dejar huecos, hacer solapamientos, etc. (figura 78).

Figura 78. Pero vamos aquí a centrar nuestro interés en algunas técnica sencillas que permiten obtener piezas teseladoras con lados curvos partiendo de una loseta poligonal y deformando sus lados. Tales técnicas son aplicaciones sencillas de las isometrías en el plano. Si suponemos que todas las losetas son iguales, podemos imaginar que una de ellas va a ir generando la loseta vecina mediante un tipo de transformación. Por ejemplo, en el caso de una loseta de forma cuadrada, las transformaciones básicas serían:

Pero vamos aquí a centrar nuestro interés en algunas técnica sencillas que permiten obtener piezas teseladoras con lados curvos partiendo de una loseta poligonal y deformando sus lados. Tales técnicas son aplicaciones sencillas de las isometrías en el plano. Si suponemos que todas las losetas son iguales, podemos imaginar que una de ellas va a ir generando la loseta vecina mediante un tipo de transformación. Por ejemplo, en el caso de una loseta de forma cuadrada, las transformaciones básicas serían:

Figura 78. Las posibilidades de formar mosaicos son ilimitadas si utilizamos recursos como cortar esquinas, dejar huecos, hacer solapamientos, etc. (figura 78). CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


366

Movimientos en el plano En el caso de un triángulo equilátero, los giros respecto de un vértice que habrá que considerar son los de ángulos 60º, 120º o 180º. En el caso de un hexágono regular, una loseta puede generar una “vecina” mediante un giro de 120º. Ejemplos: g120º

g120º

Figura 79.

Basándonos en lo anterior podemos obtener unas reglas que permitirán introducir modificaciones en los lados de una tesela poligonal, para convertirla en otra de lados curvos, que puede tener variadas formas (mariposas, flores, lagartos,etc.). a)

Traslación paralela Si una loseta genera un mosaico por traslación –por ejemplo, en el caso de un paralelogramo o un hexágono de lados opuestos paralelos– entonces podemos recortar una parte de un lado y por traslación añadírsela al lado opuesto.

Figura 80. b)

Rotación respecto de un vértice Es el caso, por ejemplo, del triángulo equilátero, del cuadrado, del hexágono regular, o del rombo que resulta por yuxtaposición de dos triángulos equiláteros.


367


368


Figura 82.

Podemos recortar una forma de un lado y añadírsela al lado contiguo, tomando como centros de giro vértices no consecutivos. El mosaico de los “huesos” o el de la “pajarita” o el del “pez volador” se obtendrán de esta manera.

Si partimos de una pieza básica triangular, la loseta curvilínea obtenida por este procedimiento recibe el nombre de triside (figura 82 a). Si la pieza de partida es cuadrangular obtenemos un cuadriside (figura 82 b). c)

Rotación respecto del punto medio de un lado En el caso de una amplia gama de losetas poligonales pueden infligirse deformaciones curvas recortando una porción de la mitad de un lado y añadiéndosela al mismo lado mediante un giro de 180º respecto del punto medio de ese lado. Figura 81. C

A´

B

120° B'

A B'

A 120°

A´

C

B

Figura 81. c)

Rotación respecto del punto medio de un lado En el caso de una amplia gama de losetas poligonales pueden infligirse deformaciones curvas recortando una porción de la mitad de un lado y añadiéndosela al mismo lado mediante un giro de 180º respecto del punto medio de ese lado. Si partimos de una pieza básica triangular, la loseta curvilínea obtenida por este procedimiento recibe el nombre de triside (figura 82 a). Si la pieza de partida es cuadrangular obtenemos un cuadriside (figura 82 b).

Podemos recortar una forma de un lado y añadírsela al lado contiguo, tomando como centros de giro vértices no consecutivos. El mosaico de los “huesos” o el de la “pajarita” o el del “pez volador” se obtendrán de esta manera. Figura 82.



368

Movimientos en el plano En general, cualquier figura de tres o cuatro lados (no necesariamente rectos) formaría mosaico con la única condición de que dichos lados sean simétricos respecto de su punto medio.

(a)

(b)

Figura 83.


369

TEMA

42 Homotecia y semejanza en el plano




372



INTRODUCCIÓN

2.

HOMOTECIA EN EL PLANO 2.1. Definición 2.2. Propiedad característica 2.3. Consecuencias. Transformadas de las figuras elementales 2.4. Elementos dobles o invariantes 2.5. Composición de homotecias 2.6. El grupo de las homotecias y las traslaciones

3.

SEMEJANZA EN EL PLANO 3.1. Definición 3.2. Consecuencias. Transformadas de las figuras elementales 3.3. Teorema fundamental de la semejanza 3.4. Caracterización de la semejanza 3.5. Determinación de una semejanza 3.6. Centro de semejanza directa 3.6.1. Determinación del centro de semejanza 3.7. El grupo equiforme

4.

ESTUDIO ANALÍTICO DE LA HOMOTECIA Y LA SEMEJANZA EN EL PLANO 4.1. Ecuaciones de la homotecia 4.2. Ecuaciones de la semejanza 4.3. Las semejanzas como caso particular de afinidades

4.

ESTUDIO ANALÍTICO DE LA HOMOTECIA Y LA SEMEJANZA EN EL PLANO 4.1. Ecuaciones de la homotecia 4.2. Ecuaciones de la semejanza 4.3. Las semejanzas como caso particular de afinidades 3.7.

SEMEJANZA EN EL PLANO 3.1. Definición 3.2. Consecuencias. Transformadas de las figuras elementales 3.3. Teorema fundamental de la semejanza 3.4. Caracterización de la semejanza 3.5. Determinación de una semejanza 3.6. Centro de semejanza directa 3.6.1. Determinación del centro de semejanza El grupo equiforme

3.

HOMOTECIA EN EL PLANO 2.1. Definición 2.2. Propiedad característica 2.3. Consecuencias. Transformadas de las figuras elementales 2.4. Elementos dobles o invariantes 2.5. Composición de homotecias 2.6. El grupo de las homotecias y las traslaciones

2.

INTRODUCCIÓN

1.



372

Homotecia y semejanza en el plano

1. INTRODUCCIÓN Los primeros cuatro libros de los Elementos de Euclides, de probable origen pitagórico, recogen, desde Tales hasta entonces, los resultados más importantes de la geometría plana elemental referentes a triángulos, paralelogramos, equivalencias, etc. Los dos siguientes libros se refieren a la proporcionalidad y a la semejanza, de acuerdo con los fundamentos sentados por Eudoxo. Aunque tal vez algunas de las definiciones, entre ellas la de “razón”, son tan vagas como inútiles, el libro V, a través de 25 proposiciones, expone la teoría general de la proporcionalidad, independientemente de la naturaleza de las cantidades proporcionales. En el libro VI, Euclides aplica la teoría de las proporciones a las magnitudes geométricas. Aprovecha, pues, las bases firmes establecidas en el libro V para hacer uso libremente del concepto de semejanza. Demuestra así teoremas relativos a razones y proporciones que se presentan al estudiar triángulos, paralelogramos, etc., dando nacimiento a la teoría de los polígonos semejantes. La enorme influencia posterior de los Elementos es de sobra conocida. La geometría sintética clásica de los griegos continuó desarrollándose hasta el final del período alejandrino. La noción de semejanza de figuras y la proporcionalidad geométrica fueron un pilar esencial en ese desarrollo. Así, pues, fueron utilizadas por Aristarco y Eratóstenes en sus cálculos del radio terrestre, por Menelao en la demostración de su teorema para triángulos planos, y por Ptolomeo en su teorema sobre el cuadrilátero inscriptible en una circunferencia. La relación de semejanza para triángulos en el plano se estudia en los temas 37 y 39 de la presente obra a partir del teorema de Tales, el cual constituye el nexo entre la proporcionalidad aritmética y la proporcionalidad geométrica. Así, pues, dos triángulos semejantes son aquellos que tienen sus ángulos iguales o sus lados proporcionales. En el caso del triángulo ambas condiciones son equivalentes, no así en polígonos de más de tres lados. No obstante, por extensión del caso del triángulo, también pueden definirse polígonos semejantes como aquellos que tienen sus ángulos iguales y sus lados proporcionales. No basta con una sola de las dos condiciones.

F'

F'

F

F Lados proporcionales pero ángulos no iguales. F y F' no son semejantes

F

F'

Ángulos iguales y lados proporcionales. F y F' sí son semejantes

Ángulos iguales pero lados no proporcionales. F y F' no son semejantes

Figura 1. Para la relación de congruencia o igualdad directa entre figuras cualesquiera no habría dificultad, a nivel elemental, en definirla a partir de la posibilidad de hacerlas coincidir o superponer mediante un movimiento en el plano. Pero en el caso de figuras planas no poligonales, de borde curvilíneo, no podemos definir la semejanza como antes, pues ni hay lados ni hay ángulos. F'

F'

F

F

Semejantes

No semejantes

Figura 2. Ambas relaciones geométricas entre figuras, la congruencia –misma forma y tamaño– y la semejanza –misma forma pero distinto tamaño–, se obtienen a partir de transformaciones geométricas del plano en sí TEMARIO DE MATEMÁTICAS. PRUEBA A

373


374


mismo. El estudio de las transformaciones puntuales de congruencia se hizo en el tema 41, mientras que el de las transformaciones puntuales de semejanza se aborda en el presente. Ya en 1872, combinando el desarrollo alcanzado por la geometrías euclidiana y proyectiva con la teoría de grupos, Felix Klein, en su famoso Programa de Erlangen, expuso una sistematización y jerarquización de todas las geometrías, mediante grupos y subgrupos, concibiendo como objeto de cada geometría el estudio de propiedades invariantes respecto de un determinado grupo de transformaciones. Así, pues, una geometría se reduce, según Klein, a un espacio y un grupo de transformaciones. Cada geometría resultaba ser una subgeometría de otra. Por tanto, cualquier clasificación de los grupos de transformaciones se traduce en una clasificación de las geometrías. Así, pues, el grupo de los homoemorfismos o transformaciones que conservan la conexión se corresponde con la Topología. El grupo de las proyectividades, o transformaciones que conservan la alineación, se asocia a la Geometría Proyectiva. El grupo de las afinidades, o transformaciones que conservan el paralelismo, se asocia con la Geometría Afín. Como subgrupo del anterior tenemos el grupo de las semejanzas o grupo equiforme, constituido por las transformaciones que conservan la forma, que va asociado a la Geometría de la Semejanza. A su vez tenemos un subgrupo del grupo equiforme, el grupo de los movimientos o transformaciones que conservan la forma y el tamaño, que sustenta la Geometría de la Congruencia.

La semejanza se va a definir a partir de un tipo de transformación puntual peculiar: la homotecia. Es la transformación que va a agrandar o empequeñecer las figuras sin cambiar su forma. Dos polígonos homotéticos tienen ángulos iguales y lados proporcionales, pero además están colocados en una determinada posición tal que cada par de vértices homólogos está alineado con un punto fijo O, que es como el foco del que parten los rayos de homotecia. La semejanza resultará de aplicar después un desplazamiento en el plano. Figura 3.

F

F'

F'

F

F

F'

F'

CONGRUENTES

HOMOTÉTICAS

SEMEJANTES

F

F

F'

F'

F

F'

F

F'

F'

F

F

F

F

F'

F'

F

F'

F'

F'

F F

F CONGRUENTES

HOMOTÉTICAS

F'

SEMEJANTES

mismo. El estudio de las transformaciones puntuales de congruencia se hizo en el tema 41, mientras que el de las transformaciones puntuales de semejanza se aborda en el presente. Ya en 1872, combinando el desarrollo alcanzado por la geometrías euclidiana y proyectiva con la teoría de grupos, Felix Klein, en su famoso Programa de Erlangen, expuso una sistematización y jerarquización de todas las geometrías, mediante grupos y subgrupos, concibiendo como objeto de cada geometría el estudio de propiedades invariantes respecto de un determinado grupo de transformaciones. Así, pues, una geometría se reduce, según Klein, a un espacio y un grupo de transformaciones. Cada geometría resultaba ser una subgeometría de otra. Por tanto, cualquier clasificación de los grupos de transformaciones se traduce en una clasificación de las geometrías. Así, pues, el grupo de los homoemorfismos o transformaciones que conservan la conexión se corresponde con la Topología. El grupo de las proyectividades, o transformaciones que conservan la alineación, se asocia a la Geometría Proyectiva. El grupo de las afinidades, o transformaciones que conservan el paralelismo, se asocia con la Geometría Afín. Como subgrupo del anterior tenemos el grupo de las semejanzas o grupo equiforme, constituido por las transformaciones que conservan la forma, que va asociado a la Geometría de la Semejanza. A su vez tenemos un subgrupo del grupo equiforme, el grupo de los movimientos o transformaciones que conservan la forma y el tamaño, que sustenta la Geometría de la Congruencia. F'

F

F

F

F'

F'

Figura 3.

La semejanza se va a definir a partir de un tipo de transformación puntual peculiar: la homotecia. Es la transformación que va a agrandar o empequeñecer las figuras sin cambiar su forma. Dos polígonos homotéticos tienen ángulos iguales y lados proporcionales, pero además están colocados en una determinada posición tal que cada par de vértices homólogos está alineado con un punto fijo O, que es como el foco del que parten los rayos de homotecia. La semejanza resultará de aplicar después un desplazamiento en el plano.



374


2. HOMOTECIA EN EL PLANO 2.1. Definición SeaO un punto del plano y k un número real ( k ¹ 0 ). Se llama homotecia de centroO y razón k, que denotaremos por H O ,k , a la transformación del plano euclídeo E2 en sí mismo, definida de la siguiente forma: Cada punto P se transforma en otro P' tal queëOP 'û= këOP û.

Escribimos, pues H O ,k ( P ) = P ', y decimos que P' es homotético de P. Observaciones:

–

Toda homotecia H O ,k es una biyección de E2 en E2, ya que todo punto tendrá un único transformado y, además, dado un punto P'existe siempre un punto P tal que H O ,k ( P ) = P ', ya que basta1 ría tomarlo de manera que [OP] = [OP ']. k

–

De la definición se desprende que O, P y P' están alineados. Si fuese k > 0, el punto P y P ' están en la misma semirrecta determinada por O; decimos entonces que H O ,k es una homotecia positiva. En caso de que k < 0, entonces el punto O está entre P y P ', y la homotecia es negativa. P'

P O

P O P'

Figura 4.

–

Como casos particulares inmediatos tenemos:

Ø

Para k = 1, se tieneë OP 'û=ë OP ûy, por tanto, P '= P. Resulta la identidad: H O,1 = i.

Ø

Para k = –1, entoncesë OP 'û= –ë OP û. Resulta una simetría central: H O ,–1 = S O .

2.2. Propiedad característica Una condición necesaria y suficiente para que una transformación H de E2 en sí mismo sea una homotecia es que para cualesquiera dos puntos P y Q se verifique

Q'

Q

ë P 'Q 'û= kë PQ û(con k ¹ 1) siendo P ' = H ( P ) y Q ' = H (Q ). O

Figura 5.

P

P'

En efecto, si H es una homotecia de centro O y razón k, tendremos

ë P 'Q 'û=ë OQ 'û–ë OP 'û= kë OQ û– kë OP û= k(ë OQ û–ë OP û) = kë PQ û TEMARIO DE MATEMÁTICAS. PRUEBA A

375


376


O 'C ' O ' D ' = =k O' A O'B

Veamos ahora que la condición es también suficiente.

Si k = 1, o sea, si para cualesquiera dos puntos P y Q fueseë P 'Q 'û=ë PQ û, entonces se trataría de un traslación (ver tema 41, epígrafe 3.2.). Ahora bien, en caso de que k ¹ 1, podemos encontrar un punto O sobre la recta QQ' tal que la razón simple (OQQ ' ) sea k; esto es, tal queë OQ 'û= kë OQ û. Por consiguiente, de[OP ']+ë P 'Q 'û=ë OQ 'û, ten-

Si los segmentos están sobre la misma recta, podemos hacer la construcción de la figura 8. C ' D ' CD y como centro de homotecia el punto O que resulta Entonces, tomando la razón k = = AB AB de la proyección ortogonal de O' sobre la recta, la homotecia H1 = H O ,k transforma el segmento AB en el CD. En efecto, los segmentos AB y C ' D ' son homotéticos, según vimos en el párrafo anterior, siendo dríamos [OP ']+ kë P 'Q 'û= kë OQ 'û, y de aquí:

[OP '] = kë OQ û– kë PQ û= k(ë OQ û–ë PQ û) = kë OP û

Figura 7. Luego la transformación H sería la homotecia H O ,k .

O

B

D

En efecto, si AB y CD son los segmentos dados paralelos, uniendo A con C y B con D obtenemos dos rectas no paralelas, al ser los segmentos de distinta longitud (figura 7). Ambas rectas se cortarán OC , el teorema de Tales en un punto O. Tomando entonces k = OA permite concluir que la homotecia H1 = H O ,k transforma el segmento AB en el CD. Si unimos A con D y B con C, obtenemos el punto de corte O'. SienOD do k '= , puede probarse también que la homotecia H 2 = H O ',– k ' OA transforma el primer segmento dado en el segundo.

2.3. Consecuencias. Transformadas de las figuras elementales O'

Transformada de un segmento

–

A

Una homotecia transforma un segmento en otro, sobre la misma recta o paralelo, y de longitud proporcional al dado. De la propiedad característica anterior es inmediato que el segmento PQ se transforma en otro P 'Q ', siendo la razón entre ambos k , P 'Q ' es decir: = k . Si el centro de homotecia está sobre la recta PQ PQ, el segmento transformado está también en la misma recta. En caso contrario, sobre una recta paralela. C

–

a)

Dados dos segmentos de distinta longitud, bien paralelos o bien sobre la misma recta, existen dos homotecias que transforman el primero en el segundo. Figura 6. Figura 6. De la propiedad característica anterior es inmediato que el segmento PQ se transforma en otro P 'Q ', siendo la razón entre ambos k , P 'Q ' es decir: = k . Si el centro de homotecia está sobre la recta PQ PQ, el segmento transformado está también en la misma recta. En caso contrario, sobre una recta paralela.

–

Dados dos segmentos de distinta longitud, bien paralelos o bien sobre la misma recta, existen dos homotecias que transforman el primero en el segundo. En efecto, si AB y CD son los segmentos dados paralelos, uniendo A con C y B con D obtenemos dos rectas no paralelas, al ser los segmentos de distinta longitud (figura 7). Ambas rectas se cortarán OC , el teorema de Tales en un punto O. Tomando entonces k = OA permite concluir que la homotecia H1 = H O ,k transforma el segmento AB en el CD. Si unimos A con D y B con C, obtenemos el punto de corte O'. SienOD do k '= , puede probarse también que la homotecia H 2 = H O ',– k ' OA transforma el primer segmento dado en el segundo. Transformada de un segmento

O'

a)

Una homotecia transforma un segmento en otro, sobre la misma recta o paralelo, y de longitud proporcional al dado. A

–

C

2.3. Consecuencias. Transformadas de las figuras elementales B

D

Luego la transformación H sería la homotecia H O ,k .

O

Figura 7.

[OP '] = kë OQ û– kë PQ û= k(ë OQ û–ë PQ û) = kë OP û

Si los segmentos están sobre la misma recta, podemos hacer la construcción de la figura 8. C ' D ' CD y como centro de homotecia el punto O que resulta Entonces, tomando la razón k = = AB AB de la proyección ortogonal de O' sobre la recta, la homotecia H1 = H O ,k transforma el segmento AB en el CD. En efecto, los segmentos AB y C ' D ' son homotéticos, según vimos en el párrafo anterior, siendo dríamos [OP ']+ kë P 'Q 'û= kë OQ 'û, y de aquí:

Si k = 1, o sea, si para cualesquiera dos puntos P y Q fueseë P 'Q 'û=ë PQ û, entonces se trataría de un traslación (ver tema 41, epígrafe 3.2.). Ahora bien, en caso de que k ¹ 1, podemos encontrar un punto O sobre la recta QQ' tal que la razón simple (OQQ ' ) sea k; esto es, tal queë OQ 'û= kë OQ û. Por consiguiente, de[OP ']+ë P 'Q 'û=ë OQ 'û, tenO 'C ' O ' D ' = =k O' A O'B

Veamos ahora que la condición es también suficiente. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


376


O

A

B

C'

D'

C

D

O'

Figura 8.

En consecuencia, se tendrá: OA AC OA + AC OC OC O 'C ' = = = Þ = =k O' A AC ' O ' A + AC ' O 'C ' OA O ' A OB BD OB + BD OD OD O ' D ' = = = Þ = =k O ' B BD ' O ' B + BD ' O ' D ' OB O'B lo que prueba lo afirmado. C'

D'

C

D

O'

A

Figura 9.

B

O

La construcción de la figura 9 permitiría probar de modo análogo que la homotecia H 2 = H O ',– k transforma también el segmento AB en el CD. En ambos casos los centros O y O'que se obtienen son independientes del segmento auxiliar C ' D ' escogido. Observación: Nótese que si los segmentos son de la misma longitud, paralelos o sobre la misma recta, entonces hay una sola homotecia que transforma uno en otro; a saber, una simetría central que, como vimos, es una homotecia de razón –1 (figura 10). O

O

Figura 10.

b)

Transformada de una recta

–

Toda homotecia transforma puntos alineados en puntos alineados. En efecto, si A, B, C están alineados, podemos suponer que B está entre A y C, y entonces se tendrá AC = AB + BC .


377


378


AC < AB + BC

[1]

Por la propiedad anterior es A 'C '= k AC , A ' B '= k AB, B 'C '= k BC . De donde resulta: k AC = k ( AB + BC ) = k AB + k BC Þ A 'C ' = A ' B '+ B 'C ', lo que prueba que A ', B ', C ' también están alineados y que B' está también entre A' y C '. Con lo anterior probamos que la homotecia transforma rectas en rectas y conserva la posición relativa de los puntos.

–

c)

Una homotecia transforma puntos no alineados en puntos no alineados. En efecto, si A, B, C no están alineados se verifica

Transformada de un ángulo

Dos rectas paralelas son homólogas en infinitas homotecias de centro cualquier punto exterior a ambas. La razón de homotecia queda fijada al conocer el centro. Si las rectas son coincidentes, podemos tomar como centro cualquier punto de ellas y entonces la razón de homotecia puede ser cualquier número arbitrario no nulo.

–

Toda figura que mediante una homotecia se transforme en una recta es otra recta. Esto es inmediato teniendo en cuenta que la homotecia es una biyección, siendo la transformación inversa otra homotecia.

–

–

La transformada de una recta es la recta dada o una recta paralela. Es decir, la homotecia conserva la dirección. En efecto, en el caso de que el centro de homotecia esté en la recta r, todo punto A de r se transforma en otro punto A'de r, pues por definición de homoteciaO, A y A'están alineados. Es obvio entonces que r se transforma en sí misma. En caso de que el centro de homotecia sea exterior a r, podemos tomar tres puntos cualesquiera A, B, C de r y sus homólogos A', B', C ' mediante la homotecia H O ,k . Debido a a) tenemos que A ' B '// AB y A 'C '// AC. Como A, B, C están sobre una misma recta r, y por A' sólo se puede trazar una paralela r' a r, entonces A ', B ', C ' están sobre r'. Queda probado que la recta homotética de r es la paralela r'.

Puede probarse también de un modo sencillo esta propiedad partiendo de la ecuación de la recta r en forma vectorial, que tomado el origen de coordenadas en el centro O de homotecia sería r r r r r r x = a + tv (( t Î R ), donde x =ë OX û, a =ë OA ûy v =ë AB û. El punto X ' homotético de X verifica: r r r r r r r r x '=ë OX 'û= kë OX û= kx '= k ( a + tv ) = ka + ( kt )v = a '+sv r r r lo que prueba que la transformada de r es la recta r' de ecuación vectorial x '= a + ' sv, donde r a '=ë OA 'û, que es paralela a r.

Nótese que cuando k > 0 los vectores direccionalesë AB ûyë A ' B 'ûtienen el mismo sentido, mientras que si k < 0 ocurre al contrario (figura 11). r'

C'

O

B'

B A'

Figura 11. B

C C

Figura 11.

A' B

B'

C'

C

B'

B C

r A

O

A

O

r'

A'

C'

r

O

B'

Puede probarse también de un modo sencillo esta propiedad partiendo de la ecuación de la recta r en forma vectorial, que tomado el origen de coordenadas en el centro O de homotecia sería r r r r r r x = a + tv (( t Î R ), donde x =ë OX û, a =ë OA ûy v =ë AB û. El punto X ' homotético de X verifica: r r r r r r r r x '=ë OX 'û= kë OX û= kx '= k ( a + tv ) = ka + ( kt )v = a '+sv r r r lo que prueba que la transformada de r es la recta r' de ecuación vectorial x '= a + ' sv, donde r a '=ë OA 'û, que es paralela a r. A

A'

r

r A

C'

r'

r'

Nótese que cuando k > 0 los vectores direccionalesë AB ûyë A ' B 'ûtienen el mismo sentido, mientras que si k < 0 ocurre al contrario (figura 11). La transformada de una recta es la recta dada o una recta paralela. Es decir, la homotecia conserva la dirección. En efecto, en el caso de que el centro de homotecia esté en la recta r, todo punto A de r se transforma en otro punto A'de r, pues por definición de homoteciaO, A y A'están alineados. Es obvio entonces que r se transforma en sí misma. En caso de que el centro de homotecia sea exterior a r, podemos tomar tres puntos cualesquiera A, B, C de r y sus homólogos A', B', C ' mediante la homotecia H O ,k . Debido a a) tenemos que A ' B '// AB y A 'C '// AC. Como A, B, C están sobre una misma recta r, y por A' sólo se puede trazar una paralela r' a r, entonces A', B', C ' están sobre r'. Queda probado que la recta homotética de r es la paralela r'.

–

Toda figura que mediante una homotecia se transforme en una recta es otra recta. Esto es inmediato teniendo en cuenta que la homotecia es una biyección, siendo la transformación inversa otra homotecia.

–

Dos rectas paralelas son homólogas en infinitas homotecias de centro cualquier punto exterior a ambas. La razón de homotecia queda fijada al conocer el centro. Si las rectas son coincidentes, podemos tomar como centro cualquier punto de ellas y entonces la razón de homotecia puede ser cualquier número arbitrario no nulo.

Por la propiedad anterior es A 'C '= k AC , A ' B '= k AB, B 'C '= k BC . De donde resulta: k AC = k ( AB + BC ) = k AB + k BC Þ A 'C ' = A ' B '+ B 'C ', lo que prueba que A', B', C ' también están alineados y que B' está también entre A' y C '. Con lo anterior probamos que la homotecia transforma rectas en rectas y conserva la posición relativa de los puntos. Transformada de un ángulo

Una homotecia transforma puntos no alineados en puntos no alineados. En efecto, si A, B, C no están alineados se verifica AC < AB + BC

[1]



–

378

–

c)

Homotecia y semejanza en el plano Los transformados A', B', C ' cumplen A 'C '= k × AC , A ' B '= k × AB, B 'C '= k × BC , por lo que multiplicando en [1] por k , llegamos a A 'C ' < A ' B '+ B 'C ', que prueba que A', B', C ' no están alineados.

–

d)

Toda homotecia es una transformación isogonal directa. Es decir, la figura homotética de un ángulo es otro ángulo de la misma medida e igualmente orientado. Esto es consecuencia inmediata de la conservación del paralelismo.

Transformada de un triángulo

–

Mediante una homotecia un triángulo se transforma en otro triángulo. Dos triángulos homotéticos tienen ángulos iguales y lados proporcionales. Es consecuencia inmediata de las anteriores. Dado un triángulo DABC (figura 12), los transformados de los vértices son puntos no alineados y por tanto forman también un triángulo DA ' B 'C ', cumpliéndose la proporcionalidad de los lados, ya que según vimos en a) se tiene A ' B '= k × AB, A 'C '= k × AC , B 'C '= k × BC . Además, por c), también A$ = A$ ', B$ = B$ ', C$ = C$ '. C'

C'

C

B'

C

B

O B

B'

O

A A

A'

A'

Figura 12. e)

Transformada de una circunferencia

–

La figura homotética de una circunferencia es otra circunferencia que tiene por centro el homólogo del centro de la de partida. X' X O C

C'

Figura 13. En efecto, dada la circunferencia de centro C y radio r, la homotecia H O ,k transforma cualquier punto X de la misma en otro X ' tal que C ' X '= k ×CX = k r, siendo C '= H O ,k (C ) . Luego X ' está en una circunferencia de centro C ' y radio r'.

–

Dadas dos circunferencias cualesquiera de distinto radio existen dos homotecias respecto a las cuales son homólogas. En efecto, dadas las dos circunferencias de centros C y C ' y radios r y r', respectivamente, trazando los radios paralelos y del mismo sentido CA y C ' A ', las rectas AA' y CC ' se cortan en un punto O que es el centro de una homotecia H1 positiva de razón r'/ r que transforma la circunferencia C en C' (figura 14).


379



Figura 16. A'

A' A

O

O'

A

T'2

C

T'1

A' C'

A

C'

C'

O' C O

C'

T2

C

T1

C

380 A' A

A''

O An

A'n

a)

b)

A''

Figura 14.

Ð( AT1, AT2 ) = Ð( A 'T '1 , A 'T '2 )

Análogamente, trazando los radios paralelos y de sentido contrario CA y C ' A '', las rectas AA'' y CC ' se cortan en un punto O' que es el centro de una homotecia H 2 negativa de razón – r'/ r que transforma la circunferencia C en C '. En caso de que las circunferencias sean concéntricas (figura 15), ambas homotecias H1 y H 2 tienen el mismo centro, el de las circunferencias dadas. En particular, si son coincidentes serán homotéticas respecto de sendas homotecias de razones +1 (identidad) y –1 (simetría central).

como recta límite la tangente AT. Al mismo tiempo la recta A ' X 'n tiende a la tangente A 'T 'a la curva homotética C '. En consecuencia, si dos curvas C1 y C2 se cortan en un punto A, sus homotéticas C '1 y C '2 se cortan en un punto A'conservándose el ángulo que forman entre sí las tangentes a ambas curvas (figura 16b). Es decir: Si consideramos sobre la curva C un punto fijo A y otro móvil X n, sobre la curva homotética tendremos los homotéticos A'y X 'n de los mencionados (figura 16a). Por la propiedad característica de la homotecia tenemosë A ' X 'n û= kë AX n û. Si X n tiende a A la secante AX n tiene A'

A

A'

A

O

La transformada de la recta tangente a una curva en un punto es la recta tangente a la nueva curva en el punto homotético. C

O

C'

–

Transformada de la recta tangente a una curva. A''

A''

f)

Figura 15.

Si las circunferencias son distintas pero de igual radio habrá una sola homotecia que transforme una en otra. Se tratará de una simetría central (k = –1). Si las circunferencias son distintas pero de igual radio habrá una sola homotecia que transforme una en otra. Se tratará de una simetría central (k = –1). Figura 15.

Transformada de la recta tangente a una curva. C'

–

O

f)

A''

A''

C

La transformada de la recta tangente a una curva en un punto es la recta tangente a la nueva curva en el punto homotético. O

Si consideramos sobre la curva C un punto fijo A y otro móvil X n, sobre la curva homotética tendremos los homotéticos A'y X 'n de los mencionados (figura 16a). Por la propiedad característica de la homotecia tenemosë A ' X 'n û= kë AX n û. Si X n tiende a A la secante AX n tiene como recta límite la tangente AT. Al mismo tiempo la recta A ' X 'n tiende a la tangente A 'T 'a la curva homotética C '. En consecuencia, si dos curvas C1 y C2 se cortan en un punto A, sus homotéticas C '1 y C '2 se cortan en un punto A'conservándose el ángulo que forman entre sí las tangentes a ambas curvas (figura 16b). Es decir: A

A'

A

A'

Análogamente, trazando los radios paralelos y de sentido contrario CA y C ' A '', las rectas AA'' y CC ' se cortan en un punto O' que es el centro de una homotecia H 2 negativa de razón – r'/ r que transforma la circunferencia C en C '. En caso de que las circunferencias sean concéntricas (figura 15), ambas homotecias H1 y H 2 tienen el mismo centro, el de las circunferencias dadas. En particular, si son coincidentes serán homotéticas respecto de sendas homotecias de razones +1 (identidad) y –1 (simetría central). Ð( AT1, AT2 ) = Ð( A 'T '1 , A 'T '2 )

Figura 14.

A''

a)

b)

A'n

T1

C

T2

C'

C'

O'

An

C'

A

C O

T'1

A C'

A

A'

T'2

O'

O

A'' C

C

O

A

A'

A'

A'

380

Figura 16. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA



2.4. Elementos dobles o invariantes a) b)

c)

Si k = 1 obviamente todos los puntos son dobles o invariantes, pues sería la transformación identidad. Si k ¹ 1 el único punto doble es el centro de la homoteciaO, ya que H O ,k ( P )= P Þ kë OP û=ë OP ûÞ r r Þ ( k – 1ë ) OP û= 0, siendo k – 1¹ 0. Se desprende queë OP û= 0, con lo que P = O. En toda homotecia todas las rectas que pasan por el centro O son globalmente invariantes, aunque no sean rectas de puntos dobles. Tales rectas se denominan rayos de homotecia.

2.5. Composición de homotecias Utilizando la propiedad característica es fácil probar que la composición de dos homotecias H y H ' es, salvo casos excepcionales, otra homotecia. En efecto, dados dos puntos cualesquiera P y Q, sean: H ( P ) = P ',

H (Q ) = Q ',

H ( P ' ) = P '',

H (Q ' ) = Q ''

Tendremosë P 'Q 'û= kë PQ ûyë P ''Q ''û= kë ' P 'Q 'û, de donde resultaë P ''Q ''û= k ' kë PQ û, lo que prueba que H 'o H es una homotecia siempre que k ' k ¹ 1. En caso de que la razones sean inversas, o sea k ' k = 1, entonces la composición da como resultado una traslación. Vamos a precisar más lo anterior, distinguiendo dos casos, según que las homotecias que se componen tengan el mismo o distinto centro. a)

P'

Caso de homotecias del mismo centro Sean las homotecias H O ,k y H O ,k ' . Dado un punto cualquiera P, por definición de homotecia, tendremos:

– –

P O

H O ,k ( P ) = P ', siendo O, P, P' ali-

neados yë OP 'û= kë OP û.

Figura 17.

H O ,k ' ( P ' ) = P '', siendo O, P', P''

alineados yë OP ''û= kë ' OP 'û.

De lo anterior se desprende fácilmente queO, P, P''están alineados yë OP ''û= k ' kë OP û, por lo que H O ,k ' o H O ,k = H O ,kk ' Por tanto, el conjunto de homotecias de centro O constituye el grupo abeliano ( H O ,o ), en que el elemento neutro es la identidad (homotecia de razón 1) y el inverso de H O ,k es H O ,1/ k . Nótese además que 1 para que H O ,k sea involutiva, ha de ser k = , lo cual sólo es posible si k = 1(identidad) k = –1(simek tría central). El grupo ( H O ,o ) es isomorfo al grupo multiplicativo ( R*,×) de los reales no nulos. b)

Caso de homotecias de distinto centro Supongamos que ambas razones son positivas (en los demás casos el razonamiento y es similar). Sean H O ,k ( P ) = P ' H O ',k ' ( P ' ) = P ''. Llamemos O'' al punto de corte de las rectas OO' y PP'' (en el supuesto de que no sean paralelas), y llamemos también Q al punto de corte con OO' de la paralela a O ' P ' pasando por P (figura 18).


Figura 18.

P'

P P''

O

Q

O'

O''

381


382

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA O

O'

O''

C1

Por semejanza de los triángulos: Figura 20.

DOQP ~ DOO ' P ' DO ''QP ~ DO ''O ' P ''

lo que indica que los puntos O, O', O'', C1 están alineados

ë O 'O ''û= kë' O 'C1û

se tiene:

O '' P '' O ' P '' k 'O ' P ' OP ' = = = k '× = k 'k O '' P QP QP OP

En el caso k ' k ¹ 1, el centro O'' de la homotecia resultante puede determinarse vectorialmente como sigue: Sea H O ,k (O '' )= C1, entonces H O ',k ' (C1 ) = O '', pues O'' es el único punto doble en la homotecia producto y se tendrá:

De aquí podemos escribir la relación vectorialë O '' P ''û= k ' kë O '' P û, de donde resulta que la transformación que pasa del punto P al P'', es decir el producto H O ',k ' o H O ,k es la homotecia H O '',k ' k .

–

æ è

kø

æ è

kø

[ PP ''] = [ P ' P ']+[ P ' P ''] = –ç1 – 1 ÷([OP '] – [O ' P ']) =ç1 – 1 ÷[OO']

Nota: en la demostración anterior faltaría justificar que el punto O'' es independiente del punto P del que se parte, lo cual es efectivamente cierto. Para probarlo es preciso utilizar el teorema de Desargues, pero lo omitimos para no alargar excesivamente el tema. Es importante hacer notar que en el caso de que las rectas OO' y PP'' P' sean paralelas, entonces, deë OP 'û= kë OP ûyë O ' P ''û= kë O ' P 'ûy del teorema de Tales, resulta: ö

ö

Sumándolas miembro a miembro:

æ è

k

kø

[ P ' P ''] = [O ' P ''] – [O ' P '] = 1 [O ' P '] – [O ' P '] = –ç1 – 1 ÷[O ' P '] æ è

kø

P''

k

ö

P

[ PP '] = [OP '] – [OP] = [OP '] – 1 [OP '] =ç1 – 1 ÷[OP '] 1 OP ' O ' P ' = Þ k= k' OP O ' P ''

–

En el caso k ' k = 1, el vector de la traslación resultanteë PP''ûpuede obtenerse teniendo en cuenta que ö O

y observamos que en este caso se pasa de P a P ' por una traslación de vector paralelo aë OO'û.

O'

Figura 19.

La composición de dos homotecias de distinto centro y razones inversas (k ' k =1) es una traslación de vector paralelo a la recta que une los centros de ambas homotecias. Si las razones no son inversas (k ' k ¹1), la composición de ambas homotecias es otra homotecia cuyo centro está alineado con los de las homotecias dadas y cuya razón es el producto de ambas razones.

Concluimos, por tanto, que:

La composición de dos homotecias de distinto centro y razones inversas (k ' k =1) es una traslación de vector paralelo a la recta que une los centros de ambas homotecias. Si las razones no son inversas (k ' k ¹1), la composición de ambas homotecias es otra homotecia cuyo centro está alineado con los de las homotecias dadas y cuya razón es el producto de ambas razones.

Concluimos, por tanto, que: Figura 19.

y observamos que en este caso se pasa de P a P' por una traslación de vector paralelo aë OO'û.

En el caso k ' k = 1, el vector de la traslación resultanteë PP''ûpuede obtenerse teniendo en cuenta que æ ö [ PP '] = [OP '] – [OP] = [OP '] – 1 [OP '] =ç1 – 1 ÷[OP '] è kø k O

O'

–

1 OP ' O ' P ' = Þ k= k' OP O ' P ''

P

P''

Nota: en la demostración anterior faltaría justificar que el punto O'' es independiente del punto P del que se parte, lo cual es efectivamente cierto. Para probarlo es preciso utilizar el teorema de Desargues, pero lo omitimos para no alargar excesivamente el tema. Es importante hacer notar que en el caso de que las rectas OO' y PP'' P' sean paralelas, entonces, deë OP 'û= kë OP ûyë O ' P ''û= kë O ' P 'ûy del teorema de Tales, resulta: æ è

ö

[ P ' P ''] = [O ' P ''] – [O ' P '] = 1 [O ' P '] – [O ' P '] = –ç1 – 1 ÷[O ' P '] k

kø

Sumándolas miembro a miembro:

æ è

ö kø

æ è

ö kø

[ PP ''] = [ P ' P ']+[ P ' P ''] = –ç1 – 1 ÷([OP '] – [O ' P ']) =ç1 – 1 ÷[OO']

De aquí podemos escribir la relación vectorialë O '' P ''û= k ' kë O '' P û, de donde resulta que la transformación que pasa del punto P al P'', es decir el producto H O ',k ' o H O ,k es la homotecia H O '',k ' k .

–

En el caso k ' k ¹ 1, el centro O'' de la homotecia resultante puede determinarse vectorialmente como sigue: Sea H O ,k (O '' )= C1, entonces H O ',k ' (C1 ) = O '', pues O'' es el único punto doble en la homotecia producto y se tendrá: O '' P '' O ' P '' k 'O ' P ' OP ' = = = k '× = k 'k O '' P QP QP OP

ë O 'O ''û= kë' O 'C1û

se tiene:

DOQP ~ DOO ' P ' DO ''QP ~ DO ''O ' P ''

lo que indica que los puntos O, O', O'', C1 están alineados O''

C1

Figura 20.



382

O'

Por semejanza de los triángulos:

O

Homotecia y semejanza en el plano Además

ë O 'O ''û= kë O 'C1û= k(ë OC1û–ë OO 'û) = k '(kë OO ''û–ë OO 'û) = k ' kë OO ''û– kë' OO 'û, y al ser tambiénë O 'O ''û=ë OO ''û–ë OO 'û, quedaríaë OO ''û–ë OO 'û= k ' kë OO ''û– kë ' OO 'û que resolviéndola respecto aë OO''ûnos lleva hasta:

ë OO'' û=

1 – k' ë OO' û 1 – kk'

2.6. El grupo de las homotecias y las traslaciones Sabemos que el producto de dos traslaciones en el plano da como resultado la traslación según el vector suma, siendo en este caso el producto conmutativo. Asimismo se ha visto que la composición de dos homotecias puede dar, según el caso, o bien otra homotecia, o bien una traslación. Aquí el producto no es conmutativo. Veamos ahora qué se obtiene al componer una homotecia con una traslación o viceversa. Basta tener en cuenta que este tipo de transformaciones están caracterizadas mediante la propiedad de existir un número real k ¹ 0, tal que para cualesquiera dos puntos del plano P y Q se verifica, siendo P'y Q'sus transformados, queë P 'Q 'û= kë PQ û. En particular si k = 1se trata de una traslación. Sean la homotecia H O ,k y la traslación Tur .

Si H O ,k ( P ) = P ', H O ,k (Q ) = Q ', Tur ( P ' ) = P '', Tur (Q ' ) = Q '', se tendráë P 'Q 'û= kë PQ ûyë P ''Q ''û=

=ë P 'Q 'û, y por tantoë P ''Q ''û= kë PQ û, de donde la composición Tur o H O ,k es una homotecia de razón k, cuyo centro se obtiene como la intersección de las rectas PP'' y QQ'' (figura 19a). De manera análoga se prueba que H O ,k o Tur es también otra homotecia de razón k (figura 19b), no siendo la misma que Tur o H O ,k , pues como puede apreciarse en la figura el centro de la homotecia resultante no es el mismo en ambos casos. Q'

(a) Q

Q'' P'

u

Q

P''

P

P

Figura 21.

O'

O

O'

(b)

Q''

Q'

P''

P'

O

Se tiene por tanto que el conjunto T È H formado por las traslaciones y las homotecias del plano es cerrado para la composición o producto de transformaciones, siendo (T È H ,o ) un grupo no abeliano. Tanto en el conjunto de todas las traslaciones del plano como en el conjunto HO de las homotecias de centro, un punto O dado son subgrupos de aquel.

3. SEMEJANZA EN EL PLANO 3.1. Definición Si reunimos en un conjunto todas las isometrías y homotecias y la composición de isometrías con homotecias y viceversa, tendremos un conjunto de transformaciones geométricas en el que la composición o producto es una ley de composición interna. Tal conjunto tiene estructura de grupo al que denominaremos grupo de las semejanzas.


383


384


La semejanza es una transformación isogonal. También es inmediato ya que la homotecia conserva los ángulos, según se ha visto, tanto en medida como en orientación. Lo mismo ocurre con una isometría directa. En cambio las isometrías inversas conservan la medida de los ángulos, pero no la orientación. De ahí que la semejanza conserve la medida de los ángulos en cualquier caso. Si la semejanza es directa mantiene el sentido, mientras que si es inversa lo cambia.

Así pues, tenemos la siguiente Definición: Una semejanza en el plano euclídeo E2 es la composición de una isometría con una homotecia ( f o H O ,k ) o de una homotecia con una isometría ( H O ,k o f ). 3.

Observaciones:

a)

Al ser tanto las isometrías como las homotecias biyecciones de E2 en sí mismo, también lo son las semejanzas.

b)

No perdemos generalidad al considerar k > 0. En efecto, si fuese k < 0, podríamos poner H O ,k = = H O ,– k o H O ,–1 = H O ,–1 o H O ,– k , siendo – k > 0. No olvidemos que la homotecia H O,–1 no es más que la simetría central de centro O, o lo que es lo mismo un giro de 180º, y por tanto una isometría. Entonces tendríamos: 2.

Una semejanza conserva la alineación, es decir, la transformada de una recta es otra recta. Es inmediata, ya que tanto las isometrías como las homotecias transforman puntos alineados en puntos alineados. El razonamiento es análogo si fuese S = f o H .

donde A '= H ( A '' ) = H [ f ( A )] = S ( A ) y B '= H ( B '' ) = H [ f ( B )] = S ( B ).

S = f o H O ,k = f o (H O ,–1 o H O ,– k ) = ( f o H O ,–1) o H O ,– k = g o H O ,– k A ' B '= k × AB

Resulta inmediatamente:

o bien

S = H O ,k o f = (H O ,– k o H O ,–1) o f = H O ,– k o (H O ,–1 o f ) = H O ,– k o g

En una semejanza la razón entre las longitudes de cualesquiera dos segmentos homólogos es constante. Sea S = H o f ( f isometría y H homotecia de razón k). Dos puntos cualesquiera A y B se transforman mediante f en A''y B''y éstos a su vez en A'y B'mediante H. Por ser f una isometría se tiene A '' B ''= AB y, por ser H homotecia, A ' B ' = k × A '' B ''.

con – k > 0 y siendo g una isometría por ser composición de isometrías. Por consiguiente, podemos definir una semejanza como el producto de una homotecia positiva con una isometría o viceversa. Entonces la razón positiva k se denomina razón de semejanza. 1.

c)

Diremos que la semejanza es directa o inversa según lo sea la isometría f . Así, pues, la composición de homotecia y traslación o de homotecia y giro son semejanzas directas. En cambio la composición de homotecia y simetría axial es una semejanza inversa. Una semejanza inversa resulta de la composición de una semejanza directa y una simetría axial.

d)

Si f es la identidad tendremos una homotecia como caso particular de semejanza. Si fuese k = 1 tendremos las isometrías como caso también particular de semejanzas.

Las propiedades siguientes se deducen inmediatamente de las propiedades ya vistas para las isometrías y homotecias, al ser la semejanza la composición de éstas. Así, pues:

3.2. Consecuencias. Transformadas de las figuras elementales

Si f es la identidad tendremos una homotecia como caso particular de semejanza. Si fuese k = 1 tendremos las isometrías como caso también particular de semejanzas.

d)

Diremos que la semejanza es directa o inversa según lo sea la isometría f . Así, pues, la composición de homotecia y traslación o de homotecia y giro son semejanzas directas. En cambio la composición de homotecia y simetría axial es una semejanza inversa. Una semejanza inversa resulta de la composición de una semejanza directa y una simetría axial.

c)

3.2. Consecuencias. Transformadas de las figuras elementales

Las propiedades siguientes se deducen inmediatamente de las propiedades ya vistas para las isometrías y homotecias, al ser la semejanza la composición de éstas. Así, pues: 1.

En una semejanza la razón entre las longitudes de cualesquiera dos segmentos homólogos es constante. Sea S = H o f ( f isometría y H homotecia de razón k). Dos puntos cualesquiera A y B se transforman mediante f en A''y B''y éstos a su vez en A'y B'mediante H. Por ser f una isometría se tiene A '' B ''= AB y, por ser H homotecia, A ' B ' = k × A '' B ''.

con – k > 0 y siendo g una isometría por ser composición de isometrías. Por consiguiente, podemos definir una semejanza como el producto de una homotecia positiva con una isometría o viceversa. Entonces la razón positiva k se denomina razón de semejanza. o bien

S = H O ,k o f = (H O ,– k o H O ,–1) o f = H O ,– k o (H O ,–1 o f ) = H O ,– k o g

Resulta inmediatamente:

A ' B '= k × AB

S = f o H O ,k = f o (H O ,–1 o H O ,– k ) = ( f o H O ,–1) o H O ,– k = g o H O ,– k

donde A '= H ( A '' ) = H [ f ( A )] = S ( A ) y B '= H ( B '' ) = H [ f ( B )] = S ( B ).

No perdemos generalidad al considerar k > 0. En efecto, si fuese k < 0, podríamos poner H O ,k = = H O ,– k o H O ,–1 = H O ,–1 o H O ,– k , siendo – k > 0. No olvidemos que la homotecia H O,–1 no es más que la simetría central de centro O, o lo que es lo mismo un giro de 180º, y por tanto una isometría. Entonces tendríamos:

b)

Al ser tanto las isometrías como las homotecias biyecciones de E2 en sí mismo, también lo son las semejanzas.

a)

El razonamiento es análogo si fuese S = f o H .

3.

Una semejanza conserva la alineación, es decir, la transformada de una recta es otra recta. Es inmediata, ya que tanto las isometrías como las homotecias transforman puntos alineados en puntos alineados. La semejanza es una transformación isogonal. También es inmediato ya que la homotecia conserva los ángulos, según se ha visto, tanto en medida como en orientación. Lo mismo ocurre con una isometría directa. En cambio las isometrías inversas conservan la medida de los ángulos, pero no la orientación. De ahí que la semejanza conserve la medida de los ángulos en cualquier caso. Si la semejanza es directa mantiene el sentido, mientras que si es inversa lo cambia. Observaciones:

2.

Así pues, tenemos la siguiente Definición: Una semejanza en el plano euclídeo E2 es la composición de una isometría con una homotecia ( f o H O ,k ) o de una homotecia con una isometría ( H O ,k o f ).



384

Homotecia y semejanza en el plano 4.

La figura transformada de un triángulo es otro triángulo. En efecto, ya que tanto las isometrías como las homotecias transforman puntos no alineados en puntos no alineados. Es más, como consecuencia de las propiedades 1 y 3, dos triángulos homólogos mediante una semejanza tendrán sus lados proporcionales y sus ángulos iguales.

5.

La transformada de una circunferencia es otra circunferencia.

6.

La recta tangente a una curva en un punto se transforma mediante una semejanza en la recta tangente a la curva homóloga en el punto homólogo.

3.3. Teorema fundamental de la semejanza C'

En los temas 37 y 39 puede verse que en el caso particular del triángulo, y no en cualquier otro polígono, la proporcionalidad de los lados implica la igualdad en magnitud de los ángulos y viceversa. Es decir, dados dos triángulos DABC y DA ' B 'C ', entonces: ì A$ '= A$ ï A ' B ' A 'C ' B 'C ' = = = k Û í B$ '= B$ AB AC BC ï$ îC '= C$

C

(a) T A

B

[2]

T'

A'

B'

C

Esto permite la primera definición de triángulos semejantes, sin utilizar la noción de homotecia:

C'

(b) B'

T

Dos triángulos son semejantes cuando tienen sus ángulos iguales o sus lados proporcionales.

A

T'

B A'

La relación entre esta definición y la noción general de semejanza como transformación geométrica del plano nos la da el siguiente teorema.

Figura 22.

Teorema: Dados dos triángulos semejantes existe una única semejanza que transforma uno en el otro. Demostración: Sean DABC y DA ' B 'C ' tales que

A ' B ' A 'C ' B 'C ' = = = k y A$ ' = A$ , B$ ' = B$ , C$ ' = C$ . AB AC BC C'

C1

C

j

C2

B Q

v A'

A


B1 j B2

B'

X

385


386


r Mediante una traslación de vector v =ë AA 'ûel triángulo DABC se transforma en el DA ' BC 1 1 (figura 24). Consideremos el ángulo orientado j= Ð( A ' B1, A ' B '). El giro GA',j transforma el punto B1 en otro B2 situado en la recta A ' B '. Finalmente llegamos a ( X 'Q ' A ' ) = ( X '*Q ' A ' ), resultando X '= X '* . ì X ' A' ï = ï XA í ïX ' A' ï * = î XA

X 'Q ' ü ì X ' A ' XA ü ï ï ï = X 'Q ' XQ XQ ï ï ï X ' A ' X ' A' ýÛí ýÞ = * Þ ( X 'Q ' A ' ) = ( X '*Q '* A ' ) X 'Q ' X '*Q '* X '*Q '*ï ï X '* A ' XA ï ï ï ï = XQ þ î X '*Q '* XQ þ

Supongamos que B2 esté en la misma semirrecta que B'con respecto a A'. Es fácil deducir de la figura que el ángulo orientado Ð( A 'C1, A 'C ') es también j, y por tanto el punto C1 se transforma mediante el giroGA',j en un puntoC 2 de la semirrecta A 'C '. Como la traslación y el giro son isometrías tendremos A ' B2 = A ' B1 = AB

, A 'C 2 = A 'C1 = AC

Análogamente A 'B ' A 'B ' A 'C ' A ' B ' = =ky = = k, estando alineados los puntos A', B2, B y los puntos A ' B2 AB A 'C 2 AC A', C 2, C. El triángulo DA ' BC 1 1 se transforma en el DA ' B 'C ' mediante la homotecia H A ',k .

y por tanto

Q 'C ' Q ' B ' y La recta CX corta a la AB en un punto Q. Sean Q '= S (Q ) y Q '*= S * (Q ), tendremos = QC QB Q '*C ' Q '* B ' Q 'C ' QC Q '*C ' QC y, por tanto , es decir, la semejanza conserva las razones y = = = QC QB Q ' B ' QB Q '* B ' QB simples (QBC ) = (Q ' B 'C ' ) y (QBC ) = (Q '* B 'C ' ). De aquí (Q ' B 'C ' ) = (Q '* B 'C ' ) y por consiguiente Q '= Q '* . Tendremos el esquema siguiente: DABC

Tv

DA'B1C1

GA',j

DA'B2C1

HA', k

DA'B'C'

Supongamos que hay dos semejanza S y S * que transforman el triángulo DABC en el DA ' B 'C '. Sea un punto cualquiera X y sean X '= S ( X ) y X '*= S * ( X ). S

Hemos de probar ahora la unicidad.

Figura 24.

La transformación S = H A ',k o GA ',j o Tvr es una semejanza que transforma el triángulo DABC en el DA ' B 'C '.

Si el punto B2 está en distinta semirrecta que B'con respecto a A', entonces es preciso utilizar también una simetría axial de eje A 'C ', y la semejanza obtenida sería inversa.

Si el punto B2 está en distinta semirrecta que B'con respecto a A', entonces es preciso utilizar también una simetría axial de eje A 'C ', y la semejanza obtenida sería inversa.

La transformación S = H A ',k o GA ',j o Tvr es una semejanza que transforma el triángulo DABC en el DA ' B 'C '. Hemos de probar ahora la unicidad.

Figura 24.

Supongamos que hay dos semejanza S y S * que transforman el triángulo DABC en el DA ' B 'C '. Sea un punto cualquiera X y sean X '= S ( X ) y X '*= S * ( X ). S

DABC

Tv

DA'B1C1

GA',j

DA'B2C1

DA'B'C'

La recta CX corta a la AB en un punto Q. Sean Q '= S (Q ) y Q '*= S * (Q ), tendremos

Q 'C ' Q ' B ' y = QC QB

HA', k

Q '*C ' Q '* B ' Q 'C ' QC Q '*C ' QC y, por tanto , es decir, la semejanza conserva las razones y = = = QC QB Q ' B ' QB Q '* B ' QB simples (QBC ) = (Q ' B 'C ' ) y (QBC ) = (Q '* B 'C ' ). De aquí (Q ' B 'C ' ) = (Q '* B 'C ' ) y por consiguiente Q '= Q '* . Tendremos el esquema siguiente:

A 'B ' A 'B ' A 'C ' A ' B ' y por tanto = =ky = = k, estando alineados los puntos A', B2, B y los puntos A 'B AB A 'C 2 AC 2 A ', C 2, C. El triángulo DA ' BC 1 1 se transforma en el DA ' B 'C ' mediante la homotecia H A ',k . Análogamente A ' B2 = A ' B1 = AB

, A 'C 2 = A 'C1 = AC

ì X ' A' ï = ï XA í ïX ' A' ï * = î XA

X 'Q ' ü ì X ' A ' XA ü ï ï ï = XQ ï ï X 'Q ' XQ ï X ' A ' X ' A ' ýÛí ýÞ = * Þ ( X 'Q ' A ' ) = ( X '*Q '* A ' ) X 'Q ' X '*Q '* ï ï ï X '*Q '* X ' A' XA ï ï ï * = XQ þ î X '*Q '* XQ þ

Supongamos que B2 esté en la misma semirrecta que B'con respecto a A'. Es fácil deducir de la figura que el ángulo orientado Ð( A 'C1, A 'C ') es también j, y por tanto el punto C1 se transforma mediante el giroGA',j en un puntoC 2 de la semirrecta A 'C '. Como la traslación y el giro son isometrías tendremos ra 24). Consideremos el ángulo orientado j= Ð( A ' B1, A ' B '). El giro GA',j transforma el punto B1 en otro B2 situado en la recta A ' B '. Finalmente llegamos a ( X 'Q ' A ' ) = ( X '*Q ' A ' ), resultando X '= X '* .

r Mediante una traslación de vector v =ë AA 'ûel triángulo DABC se transforma en el DA ' BC 1 1 (figuCUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


386


3.4. Caracterización de la semejanza Lo anterior permite caracterizar la semejanza en el plano bien mediante la propiedad de conservación de los ángulos o la de proporcionalidad de longitudes de segmentos homólogos. Así, pues, podríamos haber partido de una definición equivalente de semejanza en el plano: Una biyección S del plano E2 en sí mismo es una semejanza si existe un número real positivo k, tal que para cualquier par de puntos A y B se verifica d ( A ', B ') = kd ( A , B ), siendo A '= S ( A ) y B '= S ( B ).

La propiedad d ( A ', B ' ) = kd ( A , B ) para cualesquiera dos puntos, conlleva el que todo triángulo arbitrario DABC se transforme en otro DA ' B 'C ' semejante, es decir, con lados proporcionales y ángulos iguales al de partida. Una transformación puntual que cumpla esto debe ser la composición de una homotecia y una isometría. Así pues la equivalencia entre la nueva definición y la dada, cuya demostración detallada omitiremos, se sustenta en el teorema anterior relativo a triángulos. La distinción entre semejanza directa e inversa se basa en la conservación o inversión de la orientación de los triángulos (figura 25). B' B B

INVERSA

DIRECTA + + C

Figura 25.

C

+ A

– C'

A'

A

Partiendo de aquí, podemos también caracterizar las semejanzas directas mediante la siguiente Proposición: Una transformación puntual del plano E2 es una semejanza directa si, y sólo si, el vector formado por dos puntos A y B cualesquiera y el formado por sus homólogos A' y B', forman un ángulo constante Ð( AB , A ' B ') = j. En efecto, una semejanza directa se reduce a la composición de una homotecia con un movimiento (traslación o giro). En el primer caso los vectores AB y A ' B ' son paralelos con lo que j= 0, ya que tanto una traslación como una homotecia transforman vectores en vectores paralelos. En el segundo caso j sería el ángulo del giro. Veamos el recíproco. Sean A y B dos puntos cualesquiera y sus homólogos A'y B'. Tomemos un punto auxiliarC que forme con A y B un triángulo. Por hipótesis:

H H' A

Q A'

B C

Ð( AB , A ' B ') = Ð( AC , A 'C ') = Ð(BC , B 'C ') = j

C' B'

Como vemos en la figura 26, teniendo en cuenta la igualdad de ángulos opuestos por el vértice, de los triánguFigura 26. los DAQH y DA 'QH ' se desprende H$ + A$ = H$ '+ A$ '. Pero H$ = Ð( AC , A 'C ') = j y H$ '= Ð( AB , A ' B ') = j, de donde resulta A$ = A$ '. Análogamente se probaría que B$ = B$ ' y que C$ = C$ ', es decir, los triángulos DABC y A ' B ' A 'C ' B 'C ' DA ' B 'C ' son semejantes y por tanto . = = AB AC BC TEMARIO DE MATEMÁTICAS. PRUEBA A

387


388


3.5. Determinación de una semejanza

Dada una semejanza directa S de razón k, existe un único punto O que es a la vez centro de la homotecia y del giro en que puede descomponerse S . Ese punto es el punto doble de la transformación y se llama centro de semejanza directa. Proposición:

Una semejanza directa queda determinada por dos pares de puntos homólogos.

Si los vectores homólogos AB y A ' B ' no son paralelos, sino que forman un ángulo j, la semejanza se puede descomponer de infinitas maneras como producto de homotecia y giro S = H O1 ,k o GO2 ,j , siendo O1 y O2 en general distintos. Ahora bien se tiene la siguiente propiedad:

En efecto, si los vectores AB y A ' B ' son homólogos, para cualquier otro punto X , el homólogo X ' se obtendría teniendo en cuenta que debe ser

X'

Figura 28.

Ð( AB , A ' B ') = Ð( AX , A ' X ') = Ð(BX , B ' X ') = j

X

O1 A

O

Nota: una semejanza inversa también queda determinada conociendo dos vectores homólogos. En la demostración anterior bastaría sustituir X 'por su simétrico X ''respecto de A ' B '. v

B

B'

(a)

A'

B v

j

B (b)

B'

j

A'

A

B'

A'

A

para lo cual bastaría construir sobre el segmento A ' B ' un triángulo DA ' B ' X ' tal que tenga los ángulos iguales y la misma orientación que el triángulo DABX (figura 27). A

j

B

Figura 27. Supongamos que en una semejanza S los vectores homólogos AB y A ' B ' son paralelos (si es directa tendrán además el mismo sentido). Si ambos vectores tienen igual módulo la semejanza se reduce al caso particular de una traslación (figura 28a). Si AB ¹ A ' B ', podemos considerar la homotecia de centro el punA 'B ' to O de intersección de las rectas AA' y BB' y razón k = y entonces S = H O ,k , pero también podría AB descomponerse S de infinitas maneras como producto de una homotecia y una traslación: S = H O1 ,k o Tvr (figura 28b).

3.6. Centro de semejanza directa

Supongamos que en una semejanza S los vectores homólogos AB y A ' B ' son paralelos (si es directa tendrán además el mismo sentido). Si ambos vectores tienen igual módulo la semejanza se reduce al caso particular de una traslación (figura 28a). Si AB ¹ A ' B ', podemos considerar la homotecia de centro el punA 'B ' to O de intersección de las rectas AA' y BB' y razón k = y entonces S = H O ,k , pero también podría AB descomponerse S de infinitas maneras como producto de una homotecia y una traslación: S = H O1 ,k o Tvr (figura 28b).

3.6. Centro de semejanza directa

Figura 27. B v B

B'

A'

j

para lo cual bastaría construir sobre el segmento A ' B ' un triángulo DA ' B ' X ' tal que tenga los ángulos iguales y la misma orientación que el triángulo DABX (figura 27). A

A'

A

A'

A

B

O

A

Nota: una semejanza inversa también queda determinada conociendo dos vectores homólogos. En la demostración anterior bastaría sustituir X 'por su simétrico X ''respecto de A ' B '. v

j

B

B'

(b)

B'

j

(a)

O1

X

Ð( AB , A ' B ') = Ð( AX , A ' X ') = Ð(BX , B ' X ') = j Figura 28.

X'

En efecto, si los vectores AB y A ' B ' son homólogos, para cualquier otro punto X , el homólogo X ' se obtendría teniendo en cuenta que debe ser

Si los vectores homólogos AB y A ' B ' no son paralelos, sino que forman un ángulo j, la semejanza se puede descomponer de infinitas maneras como producto de homotecia y giro S = H O1 ,k o GO2 ,j , siendo O1 y O2 en general distintos. Ahora bien se tiene la siguiente propiedad: Una semejanza directa queda determinada por dos pares de puntos homólogos.

Dada una semejanza directa S de razón k, existe un único punto O que es a la vez centro de la homotecia y del giro en que puede descomponerse S . Ese punto es el punto doble de la transformación y se llama centro de semejanza directa. Proposición:

3.5. Determinación de una semejanza



388


3.6.1. Determinación del centro de semejanza El punto O será doble para la homotecia y doble para la rotación. Dados dos pares A, A' y B, B' de puntos homólogos se tendrá: Ð(OA ,OA ') = Ð(OB ,OB ') = j. Es decir desde O se ve-

C2

J j

A'

B'

rán los segmentos AA'y BB'bajo el ángulo j, por lo que O estará A C1 sobre el arco capaz del ángulo j construido sobre el segmento B AA' y a su vez sobre el arco capaz del mismo ángulo construido sobre el segmento BB'. Habrá que construir ambos arcos capaO ces y hallar su intersección (figura 29). Pero ambos arcos capaces pasan a su vez por el punto J de Figura 29. intersección de las rectas AB y A ' B ', con lo que la construcción se reduce a trazar las circunferencias C1 y C2 que pasan, respectivamente, por las ternas de puntos A, A', J y B, B', J . El nuevo punto de intersección O de ambas circunferencias es el centro de semejanza buscado. En efecto ÐAOA '= ÐBOB '= j, pues ambos son ángulos inscritos en C1 y C2, abarcando en cada caso el mismo arco que ÐBJB'. Por consiguiente: Ð(OA ,OA ') = Ð(OB ,OB ') = j

[3]

Se tiene ÐOBA '= ÐBOB ', ya que ambos son ángulos inscritos en C2 que abarcan el mismo arco. También ÐOAB +ÐOAJ = 180º= ÐOA ' B +Ð ' OA ' J , y como ÐOAJ = ÐOA ' J por ser ángulos inscritos en C2 que abarcan el mismo arco, entonces también ÐOAB = ÐOA ' B '. Resulta que los triángulos DOAB y DOA ' B ' son semejantes, al tener iguales dos de sus ángulos y, por tanto: A ' B ' OA ' OB ' = = =k AB OA OB

[4]

Los resultados [3] y [4] prueban que el punto O es el centro de semejanza.

3.7. El grupo equiforme En cualquier caso, aunque la semejanza no conserva el tamaño, dos figuras semejantes tienen la misma forma, sin tener en cuenta la orientación. De ahí que el grupo ( S ,o ) de las semejanzas en el plano recibe el nombre de grupo equiforme. Dicho grupo contiene gran variedad de subgrupos. Así, pues, las semejanzas directas constituyen un subgrupo, no así las semejanzas inversas. Si reunimos las homotecias y traslaciones y composiciones de ambas tendremos a la vez un subgrupo del anterior. Las homotecias de un mismo centro son asimismo otro subgrupo.

4. ESTUDIO ANALÍTICO DE LA HOMOTECIA Y LA SEMEJANZA EN EL PLANO 4.1. Ecuaciones de la homotecia La forma más sencilla de expresar las ecuaciones de una homotecia de razón k se obtiene tomando como origen de coordenadas O el centro de homotecia. Entonces si ( x, y ) y ( x', y' ) son las coordenadas de ì x'= kx que maun punto X y su homólogo X ', la relaciónë OX 'û= kë OX ûnos conduce a las ecuaciones í î y '= ky tricialmente se expresan: æ x ' ö æ k 0öæ x ö ç ÷= ç ÷ç ÷ è y 'ø è 0 k øè y ø TEMARIO DE MATEMÁTICAS. PRUEBA A

389


390


Si el centro de homotecia no es el origen de coordenadas, sino uno cualquiera C ( x0 , y0 ), entonces la relación entre dos puntos homólogos quedaë CX 'û= kë CX û, de donde las ecuaciones que resultan ahora ì x' = (1 – k )x0 + kx ì x '– x0 = k ( x – x0 ) , o bien í son í que pueden recogerse en la ecuación matricial: î y' = (1 – k ) y0 + ky î y'– y0 = k ( y – y0 ) motecia de razón k ' k y centro alineado con C y C '.

b)

é r 1– k ' r r ù r r Si k ' k ¹ 1, podremos poner [5] en la forma x ''= (1 – k ' k )ê c + ( c '– c )ú+ k ' kx, que es una hoë û 1– k 'k

teniendo los casos siguientes: r r r r r r Si k ' k = 1, quedará x ''= (1 – k ' )( c '– c )+ x que es una traslación de vector paralelo aë CC 'û= c '– c. a)

æ x' ö æ k 0 (1 – k )x0 öæ x ö ç ÷ ç ÷ç ÷ ç y'÷= ç 0 k (1 – k ) y0 ÷ç y÷ ç ÷ ç ÷ç ÷ 1 è 1 ø è0 0 øè 1 ø

Bastaría sustituir, y entonces obtendremos la transformación compuesta: r r r r r r r x ''= (1 – k ' )c '+k '[(1 – k )c + kx '] = (1 – k ' )c + k '(1 – k )c + k 'kx

[5]

Podemos comprobar que si k = 1, transformación se reduce a la identidad. En caso de que k = –1, se obtiene la ecuación de una simetría central (ver tema 41, epígrafe 8.3.).

Podríamos probar ahora de manera analítica algunas propiedades vistas anteriormente. Por ejemplo, que la composición de dos homotecias es otra homotecia o una traslación. Tendríamos las ecuaciones: r r r x '= (1 – k )c + kx r r r x ''= (1 – k ' )c '+k ' x ' X'

X

C

x'

x c

r r r x '= (1 – k )c + kx de donde queda la ecuación:

O

ë CX 'û= kë CX ûÞë OX 'û–ë OC û= k(ë OX û–ë OC û) Þ xr '= cr + k ( xr – cr ) Figura 30.

Entonces: También puede expresarse vectorialmente la ecuación de una homotecia, manejando vectores de por r r sición del centro de la homotecia c =ë OC û, de un punto genérico x =ë OX ûy su homólogo x '=ë OX 'û.

También puede expresarse vectorialmente la ecuación de una homotecia, manejando vectores de por r r sición del centro de la homotecia c =ë OC û, de un punto genérico x =ë OX ûy su homólogo x '=ë OX 'û. Entonces: Figura 30.

ë CX 'û= kë CX ûÞë OX 'û–ë OC û= k(ë OX û–ë OC û) Þ xr '= cr + k ( xr – cr ) O

de donde queda la ecuación: r r r x '= (1 – k )c + kx

c x

x'

Podríamos probar ahora de manera analítica algunas propiedades vistas anteriormente. Por ejemplo, que la composición de dos homotecias es otra homotecia o una traslación. Tendríamos las ecuaciones: r r r x '= (1 – k )c + kx r r r x ''= (1 – k ' )c '+k ' x ' C

X

X'

Podemos comprobar que si k = 1, transformación se reduce a la identidad. En caso de que k = –1, se obtiene la ecuación de una simetría central (ver tema 41, epígrafe 8.3.). Bastaría sustituir, y entonces obtendremos la transformación compuesta: r r r r r r r x ''= (1 – k ' )c '+k '[(1 – k )c + kx '] = (1 – k ' )c + k '(1 – k )c + k 'kx

[5]

æ ö æ öæ ö ç x' ÷ ç k 0 (1 – k )x0 ÷ç x ÷ ç y'÷= ç 0 k (1 – k ) y ÷ç y÷ 0 ç ÷ ç ÷ç ÷ 1 è 1 ø è0 0 øè 1 ø

teniendo los casos siguientes: r r r r r r a) Si k ' k = 1, quedará x ''= (1 – k ' )( c '– c )+ x que es una traslación de vector paralelo aë CC 'û= c '– c.

Si el centro de homotecia no es el origen de coordenadas, sino uno cualquiera C ( x0 , y0 ), entonces la relación entre dos puntos homólogos quedaë CX 'û= kë CX û, de donde las ecuaciones que resultan ahora ì x' = (1 – k )x0 + kx ì x '– x0 = k ( x – x0 ) , o bien í son í que pueden recogerse en la ecuación matricial: î y' = (1 – k ) y0 + ky î y'– y0 = k ( y – y0 ) 390

é r 1– k ' r r ù r r Si k ' k ¹ 1, podremos poner [5] en la forma x ''= (1 – k ' k )ê c + ( c '– c )ú+ k ' kx, que es una hoë û 1– k 'k motecia de razón k ' k y centro alineado con C y C '.



b)


4.2. Ecuaciones de la semejanza r Sea la homotecia H de centro C ( x0 , y0 ) y razón k y la traslación T de vector v ( a , b ). La semejanza S que resulta de la composición T o H vendrá dada matricialmente por æ x' ö æ 1 0 a öæ k 0 (1 – k )x0 öæ x ö æ k 0 a + (1 – k )x0 öæ x ö ÷ç ÷ ç ÷ç ÷ ç ÷ ç ÷ç ç y'÷= ç 0 1 b ÷ç 0 k (1 – k ) y0 ÷ç y ÷=ç 0 k b + (1 – k ) y0 ÷ç y÷ ÷ç ÷ ç ÷ç ÷ ç ÷ ç ÷ç 1 1 øè 1 ø è 0 0 øè 1 ø è 1 ø è 0 0 1øè 0 0 r r r r Vectorialmente podemos expresarla x '= a + (1 – k )c + kx. r rHemos r de r notar aquí que si k = 1, resultará el caso particular de una traslación de vector a, de ecuación x '= a + x, que matricialmente se traduce en æ x' ö æ 1 0 a öæ x ö ç ÷ ç ÷ç ÷ ç y'÷= ç 0 1 b ÷ç y÷ ç ÷ ç ÷ç ÷ è 1 ø è 0 0 1øè 1 ø Si se trata de la composición de la homotecia H y giro G de ángulo j, entonces G o H se obtiene mediante æ x' ö æcos j – sen j a öæ k 0 (1 – k )x0 öæ x ö ÷ç ÷ ç ÷ ç ÷ç ç y '÷= çsen j cos j b ÷ç 0 k (1 – k ) y0 ÷ç y÷= ÷ç ÷ ç ÷ ç ÷ç 0 1øè 0 0 1 øè 1 ø è 1ø è 0 æ k cos j – k sen j (1 – k )x0 cos j – (1 – k ) y0sen j+ a öæ x ö ç ÷ç ÷ = ç k sen j k cos j (1 – k )x0 sen j+ (1 – k ) y0sen j+ b ÷ç y÷ ç ÷ç ÷ 0 1 è 0 øè 1 ø Podríamos obtener así las ecuaciones de semejanzas que resulten de la composición de homotecia con otras isometrías. Hay que tener en cuenta que la composición no es conmutativa, al igual que no lo es el producto de matrices.

4.3. Las semejanzas como caso particular de afinidades En general una semejanza viene dada por una ecuación matricial de la forma æ x ' ö æ a11 a12 ç ÷ ç ç y '÷= ç a21 a22 ç ÷ ç 0 è 1ø è 0

a0 öæ x ö ÷ç ÷ b0 ÷ç y÷ ÷ç ÷ 1 øè 1 ø

[6]

æ a11 a12 a0 ö ç ÷ La matriz A = ç a21 a22 b0 ÷deberá estar sujeta a ciertas restricciones, además de A ¹ 0, para que ç ÷ 0 1ø è0 la transformación cumpla las propiedades métricas definitorias de una semejanza. En realidad, la semejanza es un caso particular dentro de las transformaciones del plano que vienen dadas en la forma matricial [6], a las que en general se denomina transformaciones afines o afinidades. Las ecuaciones analíticas de una afinidad son: ì x1'= a0 + a11x1+ a12x2 í îx2 '= b0 + a21x1+ a22x2 TEMARIO DE MATEMÁTICAS. PRUEBA A

391



–

r r ì a12a11+ a21a22 = 0 Para X = e2 = ( 0,1), tendremos í 2 r 2 îa12 + a22 = l( e2 )

o bien

ìa 2 + a 2 = l( er1 ) r r Para X = e1 = (1,0 ), tendremos í 11 21 î a11a12 + a21a22 = 0

æ x ' ö æa ö æ a a öæ x ö ç 1 ÷= ç 0 ÷+ç 11 12 ÷ç 1 ÷ è x2 'ø è b0 ø è a21 a22 øè x2 ø siendo

a11 a12 ¹ 0. a21 a22

392

–

En particular:

Obviamente una transformación puntualr de este tipo induce un automorfismo deV2 que transforma el r vector X =ë PQ û= ( X 1, X 2) en el vector X '=ë P 'Q 'û= ( X 1', X 2 '), siendo

Se trata obviamente de un sistema homogéneo compatible indeterminado, pues hay siempre vectores ortogonales a uno dado. Ello nos lleva a que los coeficientes de dicho sistema deben ser proporcionales, o sea: r ì ( a 2 + a 2 ) X + ( a a + a a ) X = l( X ) X 11 21 1 12 11 21 22 2 r 1 í [8] 2 2 î( a11a12 + a21a22) X 1+ ( a12 + a22) X 2 = l( X ) X 2 ì X 1'= a11X 1+ a12 X 2 í î X 2 '= a21X 1+ a22 X 2

[7]

æ X 1' ö æ a11 a12 öæ X 1 ö ÷ç ÷, o más simplemente X '= AX . que expresaremosç ÷= ç è X 2 'ø è a21 a22 øè X 2 ø

ì X 1Y1+ X 2Y2 = 0 í 2 2 2 2 î[( a11+ a21) X 1+ ( a12a11+ a21a22) X 2]Y1+ [( a11a12 + a21a22) X 1+ ( a12 + a22) X 2]Y2 = 0

El hecho de ser aplicación lineal implica que se conserve el paralelismo, en tanto que el transformado del vector l X es l X ' . Ahora bien, si además se conserva la ortogonalidad tendremos una semejanza. Esto es, podemos definirla como caso particular de afinidad. r r Fijado, por tanto, el vector X = ( X 1, X 2), el vector Y = (Y1,Y2) se obtendría resolviendo el sistema Definición: Una semejanza es una afinidad que conserva la perpendicularidad. r r r r Es decir, que cumple: X ×Y = 0 Þ X ' ×Y '= 0.

[( a112+ a212) X 1+( a12a11+ a21a22) X 2]Y1+[( a11a12 + a21a22) X 1+( a122 + a222) X 2]Y2 = 0

Manejando los vectores como matrices columna, se pondría: X tY = 0 Þ X 't Y '= 0. Veamos entonces qué requisitos debe cumplir la matriz A para que defina una semejanza. La relación X 't Y '= 0 equivale a X t A t AY = 0, que desarrollada es:

Manejando los vectores como matrices columna, se pondría: X tY = 0 Þ X 't Y '= 0. Veamos entonces qué requisitos debe cumplir la matriz A para que defina una semejanza. La relación X 't Y '= 0 equivale a X t A t AY = 0, que desarrollada es:

Definición: Una semejanza es una afinidad que conserva la perpendicularidad. r r r r Es decir, que cumple: X ×Y = 0 Þ X ' ×Y '= 0.

[( a112+ a212) X 1+( a12a11+ a21a22) X 2]Y1+[( a11a12 + a21a22) X 1+( a122 + a222) X 2]Y2 = 0

r r Fijado, por tanto, el vector X = ( X 1, X 2), el vector Y = (Y1,Y2) se obtendría resolviendo el sistema

El hecho de ser aplicación lineal implica que se conserve el paralelismo, en tanto que el transformado del vector l X es l X ' . Ahora bien, si además se conserva la ortogonalidad tendremos una semejanza. Esto es, podemos definirla como caso particular de afinidad. ì X 1Y1+ X 2Y2 = 0 í 2 2 2 2 î[( a11+ a21) X 1+ ( a12a11+ a21a22) X 2]Y1+ [( a11a12 + a21a22) X 1+ ( a12 + a22) X 2]Y2 = 0

æ X 1' ö æ a11 a12 öæ X 1 ö ÷ç ÷, o más simplemente X '= AX . que expresaremosç ÷= ç è X 2 'ø è a21 a22 øè X 2 ø

Se trata obviamente de un sistema homogéneo compatible indeterminado, pues hay siempre vectores ortogonales a uno dado. Ello nos lleva a que los coeficientes de dicho sistema deben ser proporcionales, o sea: ì X 1'= a11X 1+ a12 X 2 í î X 2 '= a21X 1+ a22 X 2

r ì ( a 2 + a 2 ) X + ( a a + a a ) X = l( X ) X 12 11 21 22 2 r 1 í 11 21 1 2 2 î( a11a12 + a21a22) X 1+ ( a12 + a22) X 2 = l( X ) X 2

[7]

[8]

Obviamente una transformación puntualr de este tipo induce un automorfismo deV2 que transforma el r vector X =ë PQ û= ( X 1, X 2) en el vector X '=ë P 'Q 'û= ( X 1', X 2 '), siendo ¹ 0.

En particular: ìa 2 + a 2 = l( er1 ) r r Para X = e1 = (1,0 ), tendremos í 11 21 î a11a12 + a21a22 = 0

a12

–

a21 a22 a11

–

siendo

æ x1' ö æ a0 ö æ a11 a12 öæ x1 ö ç ÷= ç ÷+ç ÷ç ÷ è x2 'ø è b0 ø è a21 a22 øè x2 ø

r r ì a12a11+ a21a22 = 0 Para X = e2 = ( 0,1), tendremos í 2 r 2 îa12 + a22 = l( e2 )

392

o bien



Homotecia y semejanza en el plano Las ecuaciones [8] se reducen a

r ì l ( er ) X = l ( X ) X r 1 í r1 1 l ( e ) X l ( X )X 2 = î 2 2

r Si tomamos un vector X = ( X 1, X 2 ) con X 1 ¹ 0 y X 2 ¹ 0 resulta r r r l ( e1 ) = l ( e2 ) = l ( X ) = l = cte. Entonces para que la afinidad cuyo automorfismo asociado viene dado por las ecuaciones [7] sea una semejanza, se deben cumplir las condiciones: 2 ì a112+ a21 =l ï 2 2 ía12 + a22 = l ï î a11a12 + a21a22 = 0

[9]

Veamos ahora que la semejanza conserva los ángulos. Si se cumplen las [9], entonces: X× ' Y ' = X 1'×Y1'+ X 2 '×Y2 '= ( a11X 1+ a12 X 2 )( a11Y1+ a12Y2 )+ ( a21X 1+ a22 X 2 )( a21Y1+ a22Y 2 ) = 2 2 ) X 2Y 2 = = ( a112+ a21 ) X 1Y1+ ( a11a12 + a21a22 ) X 1Y2 + ( a12a11+ a22a21 ) X 2Y1+ ( a122 + a22

= lX 1Y1+ lX 2Y2 = l ( X 1Y1+ X 2Y 2 ) = lX ×Y Haciendo X = Y , se tiene X ' =

l X yY'=

l Y .

En consecuencia cos( X ',Y ' ) =

Además, el resultado

X' X

=

X ' ×Y ' = X ' ×Y '

lX ×Y lX × lY

=

X ×Y = cos ( X ,Y ) X ×Y

l = cte significa que la razón entre las longitudes de dos segmentos

homólogos es constante. La razón de semejanza es k =

l.

æ a11 a12 öæ a11 a21 ö æ l 0 ö ÷ç ÷= ç ÷, de donde A 2 = l2. Entonces la semeHemos de notar que A × A t = ç a a a a 0 l ø è 21 22 øè 12 22 ø è janza será directa o inversa según que sea A = +l o A = – l. æ l æ ö 0 ö ÷= ç k 0÷, que cumple los requisitos [9], nos proporciona un En particular la matriz A = ç ç ÷ 0 k ø lø è è 0 caso particular de semejanza. Así pues la transformación puntual æ x1' ö æ k 0öæ x1 ö ç ÷= ç ÷ç ÷ è x2 'ø è 0 k øè x2 ø la homotecia de centro el origen y razón k. æ x1' ö æ1 – k 0 öæ a ö æ k 0öæ x1 ö ÷ç ÷+ç ÷ç ÷es la homotecia de centro C ( a , b ) y razón k. Análogamenteç ÷= ç è x2 'ø è 0 1 – k øè b ø è 0 k øè x2 ø TEMARIO DE MATEMÁTICAS. PRUEBA A

393


394


2 ì a112+ a21 =l æ x1' ö æ a0 ö æ a11 a12 öæ x1 ö ï 2 2 ç ÷ ç ÷ ç ÷ ç ÷ puede po, con ía12 + a22 = l Una semejanza en general dada por = + è x2 'ø è b0 ø è a21 a22 øè x2 ø ï a a a a + = 0 î 11 12 21 22 nerse en la forma:

é ù a12 / k öæ x1 ö æ k 0öêæ a0 / k ö æ a11 / k a12 / k öæ x1 öú ÷+ç ÷ç ÷ú ÷ç ÷= ç ÷êç a22 / k øè x2 ø è 0 k øêè b0 / k ø è a21 / k a22 / k øè x2 øú 123 144444244444 3 û homoteciaë isometría

æ x1' ö æ k 0öæ a0 / k ö æ k 0öæ a11 / k ç ÷= ç ÷+ç ÷ç ÷ç è x2 'ø è 0 k øè b0 / k ø è 0 k øè a21 / k

a12 / k ö 1 ÷= A es ortogonal, ya que a22 / k ø k æ 1 öæ 1 ö 1 1æ l ç A ÷×ç A ÷ = 2 A × A t = ç èk øèk ø k lè 0 t

0ö ÷= I . lø

t æ 1 öæ 1 ö 1 1æ l ç A ÷×ç A ÷ = A×At = ç èk øèk ø k2 lè 0

æ a11 / k pues la matrizç è a21 / k

0ö ÷= I . lø

a12 / k ö 1 ÷= A es ortogonal, ya que a22 / k ø k

æ x ' ö æ k 0öæ a0 / k ö æ k 0öæ a11 / k ç 1 ÷= ç ÷+ç ÷ç ÷ç è x 'ø è 0 k øè b / k ø è 0 k øè a / k 2

æ a11 / k pues la matrizç è a21 / k

0

21

é ù a12 / k öæ x1 ö æ k 0öêæ a0 / k ö æ a11 / k a12 / k öæ x1 öú ÷+ç ÷ç ÷ú ÷ç ÷= ç ÷êç a / k øè x ø è 0 k øè b / k ø è a / k a22 / k øè x2 øú 123ê 10444421 4244444 3 û homoteciaë isometría 22

2

nerse en la forma: 2 ì 2 l a a + = æ x ' ö æa ö æ a ï 11 21 a öæ x ö 1 0 11 12 2 ÷ç 1 ÷, con ía122 + a22 puede poUna semejanza en general dada porç ÷= ç ÷+ç =l è x2 'ø è b0 ø è a21 a22 øè x2 ø ï îa11a12 + a21a22 = 0



394

TEMA

43 Proyecciones en el plano. Mapas. Planisferios terrestres: principales sistemas de representación




396



INTRODUCCIÓN

2.

PROYECCIONES PUNTUALES 2.1. Proyección sobre un plano paralelamente a una recta 2.2. Proyección sobre una recta paralelamente a un plano

3.

TEOREMA DE THALES

4.

PROYECCIONES, ÁNGULOS Y DISTANCIAS 4.1. Definición de proyección cónica 4.2. Definición de proyección cilíndrica 4.3. Proyección de una recta y de rectas paralelas 4.4. Proyección de rectas perpendiculares 4.5. Teorema de las tres perpendiculares 4.6. Recta y plano perpendiculares 4.7. Ángulo de recta y plano 4.8. Recta de máxima pendiente en un plano 4.9. Mínima distancia entre dos rectas que se cruzan

5.

SISTEMAS DE PROYECCIÓN 5.1. Sistema acotado 5.2. Sistema diédrico o de Monge 5.3. Sistema axonométrico 5.4. Sistema cónico

6.

MAPAS 6.1. Definición de mapas. Tipos 6.2. Sistemas de representación en Topología

7.

PROYECCIONES CARTOGRÁFICAS 7.1. Anamorfosis 7.2. Escala local 7.3. Clasificación de las proyecciones cartográficas 7.4. Clasificación por el sistema de transformación 7.4.1. Sistemas convencionales 7.4.2. Sistemas perspectivos o naturales 7.5. Sistemas artificiales o por desarrollo 7.5.1. Proyección cilíndrica conforme de Mercator 7.5.2. Proyección UTM 7.5.3. Proyección cónica conforme de Lambert

PROYECCIONES CARTOGRÁFICAS 7.1. Anamorfosis 7.2. Escala local 7.3. Clasificación de las proyecciones cartográficas 7.4. Clasificación por el sistema de transformación 7.4.1. Sistemas convencionales 7.4.2. Sistemas perspectivos o naturales 7.5. Sistemas artificiales o por desarrollo 7.5.1. Proyección cilíndrica conforme de Mercator 7.5.2. Proyección UTM 7.5.3. Proyección cónica conforme de Lambert

7.

MAPAS 6.1. Definición de mapas. Tipos 6.2. Sistemas de representación en Topología

6.

SISTEMAS DE PROYECCIÓN 5.1. Sistema acotado 5.2. Sistema diédrico o de Monge 5.3. Sistema axonométrico 5.4. Sistema cónico

5.

PROYECCIONES, ÁNGULOS Y DISTANCIAS 4.1. Definición de proyección cónica 4.2. Definición de proyección cilíndrica 4.3. Proyección de una recta y de rectas paralelas 4.4. Proyección de rectas perpendiculares 4.5. Teorema de las tres perpendiculares 4.6. Recta y plano perpendiculares 4.7. Ángulo de recta y plano 4.8. Recta de máxima pendiente en un plano 4.9. Mínima distancia entre dos rectas que se cruzan

4.

TEOREMA DE THALES

3.

PROYECCIONES PUNTUALES 2.1. Proyección sobre un plano paralelamente a una recta 2.2. Proyección sobre una recta paralelamente a un plano

2.

INTRODUCCIÓN

1.



396

Proyecciones en el plano

1. INTRODUCCIÓN Una cuestión que ha preocupado al hombre desde el inicio de la matematización es la fidelidad con que una representación plana era juicio fiel de entidades tridimensionales. Es la Geometría descriptiva quien tiene por objeto establecer las relaciones correlativas entre la forma del espacio, de tres dimensiones, y la forma plana, de dos dimensiones, es decir, proporcionar una vía para representar y manejar formas y cuerpos concebidos en el espacio sobre elementos que permitan su asimilación en el plano, y viceversa, estableciendo las normas por las que una forma representada en el plano con arreglo a unos criterios pueda restituirse al espacio en su forma original. Los orígenes de los trabajos al respecto hay que buscarlos en el geómetra griego Thales de Mileto (siglo VI a.C.), cuya labor está vinculada a las proyecciones en el plano, al estudio de las proyecciones en el triángulo y a la aplicación de sus técnicas geométricas a la medida de la altura de las pirámides o a los cálculos de distancias en el mar. El estudio del concepto de proyección nos permitirá abordar los mapas, los planisferios terrestres y los principales sistemas de representación, cuyo objetivo principal es representar sobre el plano un cuerpo dado en el espacio.

2. PROYECCIONES PUNTUALES Sea P un plano, y sean r y s dos rectas no paralelas definidas en P. Basándonos en el axioma de Euclides que nos indica que por todo punto P del plano P, pasa una y sólo una recta sP paralela a s, y teniendo en cuenta que las rectas r y s las hemos definido como secantes, entonces, la recta sP corta a r en un punto único. Decimos que p es el proyectado o proyección de P sobre r paralelamente a s, es decir, que p es el proyectado o proyección de P sobre r según la dirección de s. Así definimos una aplicación f , tal que a todo punto P del plano se le asocia su proyectado p sobre r paralelamente a s. f :P ® p

P

p

Sp

r

S

p

Figura 1. A esa aplicación f se le denomina proyección puntual sobre r paralelamente a s, o también podemos decir que f es la proyección de base r paralelamente a s. Al vector formado por el punto origen y su imagen (proyección) se le llama rayo proyector. Cuando r y s son rectas perpendiculares decimos que f es la proyección ortogonal sobre la recta r, o proyección ortogonal de base r. Proposición: Sean dos rectas r y s no paralelas de un planoP y f la proyección de base r paralelamente a s, entonces el conjunto de puntos invariantes por f es la recta r. Para demostrarla partimos de que P es un punto invariante por f , entonces P = p, pero teniendo en cuenta que p Î r al ser p = r Ç s, entonces, todo punto invariante por f pertenece a r. Recíprocamente, sea P un punto de r. La recta paralela S P que pasa por P corta a r en un punto único; pero como P Î r y P Î S P , entonces, P es el punto de intersección y, por definición de p, P es igual a su proyectado p, con lo que podemos afirmar que todo punto de r es invariante por f . Así queda demostrado que el conjunto de los puntos invariantes por f constituye la recta r. Corolario: “El conjunto imagen del plano P por la aplicación f es la recta r”. En efecto, el punto p = f ( P) y p Î r, con lo que la imagen del plano esta incluida en r, y como todo punto de r es igual a un transformado por f , al estar en la imagen del plano k, entonces, la imagen por f del plano P está en la recta r.


397


398


2.1. Proyección sobre un plano paralelamente a una recta

Corolario: La imagen por f del espacio x es la recta r. Sea p Î r. El conjunto de los puntos que tienen imagen mediante f ese punto p es el plano paralelo a P que pasa por p.

Sea P un plano del espacio x, y r una recta no paralela al plano P. Basándonos en el axioma de Euclides, por todo punto P Î x pasa una sola recta rP paralela a r que tampoco será paralela al plano P y al que cortará en un único punto p que será el proyectado de P sobre P paralelamente a r, o bien, podemos decir que p es el proyectado de P sobre P siguiendo la dirección de la recta r. La aplicación f que, a todo punto P Î x, asocia su proyectado p sobre P paralelamente a r se denomina proyección puntual sobre P paralelamente a r. Si P y r son ortogonales, decimos que f es la proyección ortogonal sobre el plano P. P La proyección de un punto sobre un plano P, llamado plano de proyección o plano proyectante, se obtiene haciendo pasar una recta llamada recta proyectante, por dicho punto y hallando su intersección con el plano. Si no especificamos la recta, son infinitas las proyectantes que p pasan por un punto, obteniéndose infinitas proyecciones de ese punto, y en consecuencia su proyección queda indeterminada. p Para evitar la indeterminación sometemos a la proyectante a ciertas condiciones que dan lugar a distintos sistemas de proyección.

Figura 3.

p

Sea P un plano del espacio x, y r una recta no paralela a P. Una vez más, de acuerdo con el axioma de Euclides, pasa, por todo punto P del espacio x un único plano P P paralelo a P . Este plano lo corta r en un punto p único, llamado proyectado de P sobre r paralelamente a P. La aplicación que al punto P, asocia el punto p, se denomina proyección puntual sobre r paralelamente a P (o que sigue la dirección de P).

pP

r

p

P

rp

Proposición: Sea P un plano, r una recta no paralela a P y f la proyección sobre r paralelamente a P, entonces: “El conjunto de los puntos invariantes por f es la recta r ”. La demostración es análoga a la vista anteriormente.

r

Proposición: Sea P un plano, r una recta no paralela a P y f la proyección Figura 2. sobre P paralelamente a r, entonces: “El conjunto de puntos invariantes por f es el plano P”. Para demostrarlo tendremos en cuenta que como p pertenece al plano P, todo punto P invariante, es decir, igual a p, pertenece a P . Recíprocamente, todo punto P de P es invariante, porque la paralela a r que pasa por P corta a este plano en P, y así p es igual a P, con lo que el conjunto de los puntos invariantes es consiguientemente el plano P. Con un razonamiento análogo al que podríamos hacer en la dimensión dos, la imagen del espacio x es aquí el plano P, y todo punto p de P es imagen por f de los puntos de la paralela a r que pasa por p.

2.2. Proyección sobre una recta paralelamente a un plano

p Proposición: Sea P un plano, r una recta no paralela a P y f la proyección Figura 2. sobre P paralelamente a r, entonces: “El conjunto de puntos invariantes por f es el plano P”. Para demostrarlo tendremos en cuenta que como p pertenece al plano P, todo punto P invariante, es decir, igual a p, pertenece a P . Recíprocamente, todo punto P de P es invariante, porque la paralela a r que pasa por P corta a este plano en P, y así p es igual a P, con lo que el conjunto de los puntos invariantes es consiguientemente el plano P. Con un razonamiento análogo al que podríamos hacer en la dimensión dos, la imagen del espacio x es aquí el plano P, y todo punto p de P es imagen por f de los puntos de la paralela a r que pasa por p.

2.2. Proyección sobre una recta paralelamente a un plano

r

Sea P un plano del espacio x, y r una recta no paralela a P. Una vez más, de acuerdo con el axioma de Euclides, pasa, por todo punto P del espacio x un único plano P P paralelo a P . Este plano lo corta r en un punto p único, llamado proyectado de P sobre r paralelamente a P. La aplicación que al punto P, asocia el punto p, se denomina proyección puntual sobre r paralelamente a P (o que sigue la dirección de P).

r

Sea P un plano del espacio x, y r una recta no paralela al plano P. Basándonos en el axioma de Euclides, por todo punto P Î x pasa una sola recta rP paralela a r que tampoco será paralela al plano P y al que cortará en un único punto p que será el proyectado de P sobre P paralelamente a r, o bien, podemos decir que p es el proyectado de P sobre P siguiendo la dirección de la recta r. La aplicación f que, a todo punto P Î x, asocia su proyectado p sobre P paralelamente a r se denomina proyección puntual sobre P paralelamente a r. Si P y r son ortogonales, decimos que f es la proyección ortogonal sobre el plano P. P La proyección de un punto sobre un plano P, llamado plano de proyección o plano proyectante, se obtiene haciendo pasar una recta llamada recta proyectante, por dicho punto y hallando su intersección con el plano. Si no especificamos la recta, son infinitas las proyectantes que p pasan por un punto, obteniéndose infinitas proyecciones de ese punto, y en consecuencia su proyección queda indeterminada. p Para evitar la indeterminación sometemos a la proyectante a ciertas condiciones que dan lugar a distintos sistemas de proyección. Proposición: Sea P un plano, r una recta no paralela a P y f la proyección sobre r paralelamente a P, entonces: “El conjunto de los puntos invariantes por f es la recta r ”. La demostración es análoga a la vista anteriormente.

P

p

p

r

pP

Figura 3.

Corolario: La imagen por f del espacio x es la recta r. Sea p Î r. El conjunto de los puntos que tienen imagen mediante f ese punto p es el plano paralelo a P que pasa por p.

2.1. Proyección sobre un plano paralelamente a una recta



398


3. TEOREMA DE THALES Trabajando sobre el plano, situemos en él tres rectas (ampliable a n rectas) s1, s2 , s3 estrictamente paralelas y otras dos rectas r y r1 no paralelas a s1, como se muestra en el dibujo

r1 C B

A

r A´

Figura 4.

S1

B´ S2

C´ S3

Si llamamos A, B, C a los puntos de intersección de r1 con s1, s2 , s3 y A ', B', C', a los de intersección de r con esas mismas rectas, podemos establecer: AC A 'C ' = AB A 'B ' lo que se puede interpretar en términos de proyección sobre una recta r paralelamente a una recta si. Si tomamos tres puntos A, B, C, tales que AC = l × AB ,( l Î R) entonces si llamamos A ', B ', C 'a los puntos proyectados de A, B, C, sobre r paralelamente a si, podemos escribir la relación vectorial A 'C ' = l × A ' B ',( l Î R). Proposición: Sean r, r1 dos rectas no paralelas; A, B, C, tres puntos del plano. Si existe l Î R tal que, AC = l × AB ,( l Î R) entonces los puntos proyectados A ', B', C' de A, B, C sobre r paralelamente a si verifican también que A 'C ' = l × A ' B ',( l Î R). Extendiendo el razonamiento anterior del teorema de Thales al espacio podemos decir que siP1,P 2 ,P 3 son tres planos estrictamente paralelos y r, r1 dos rectas distintas y no paralelas al plano P1, entre los puntos A, B, C de intersección de r1 con P1,P 2 ,P 3 , y los puntos A ', B', C' los puntos de intersección de r con esos misAC A 'C ' mos planos se puede establecer la relación = AB A 'B ' Demostrémoslo:

–

Caso 1. r y r1 coplanarias (paralelas / concurrentes). Como r, r1 son rectas coplanarias no coincidentes determinan un plano a y los planos P1,P 2 ,P 3 al ser paralelos, cortan a a definiendo tres rectas paralelas s1, s2 , s3, pudiéndose AC A 'C ' establecer que = AB A 'B '

–

Caso 2. r y r1 no coplanarias (rectas que se cruzan). Si llamamos r2 a la recta paralela a r que pasa por A, dicha recta r2 corta al plano P 2 en un punto I y al plano P 3 en un cierto punto J. Como las rectas r y r2 son paralelas, determinan un plano b que corta a los planos P1,P 2 ,P 3 de-


r1

r

r1

A

P1

A´

B

B´

C

r

A´ P1

A

P2

B´

C´ P3

P2

B

C

P3

C´

Figura 5. 399


400


finiendo tres rectas paralelas. Así, podemos aplicar el Teorema de Thales en el plano b a las rectas paralelas ( AA ') ,( IB') ,( JC') con lo que podemos escribir:

1 1 AB, lo que implica que A ' I ' = A ' B ', por lo que I ' es el punto medio de A ' B '. 2 2 Proposición: La imagen de un paralelogramo por una proyección puntual es un paralelogramo. Para demostrarlo consideremos ABCD un paralelogramo. Sus diagonales AC y BD se cortan en su punto medio I. Si llamamos A ', B', C', D', I' a las proyecciones de A, B, C, D e I, por una proyección puntual, podemos afirmar que la proyección I' de I es el punto medio de A’C’ y también el punto medio de B', D' . Por tanto AC y BD tienen el mismo punto medio, lo que es una propiedad característica de todo paralelogramo. Así pues, A ', B', C', D' es también un paralelogramo.

r1 r2

r

AJ A 'C ' = AI A 'B '

A

P1

A´

Análogamente, las rectas r y r1 determinan un cierto plano a y dado que r1 y r2 son coplanarias podemos aplicar lo visto anteriormente, r1 corta a los planos P1,P 2 ,P 3 en los puntos A, I, J y dado que los planos P1,P 2 ,P 3 son paralelos podemos escribir: AI =

( l Î R), entonces A 'C ' = l × A ' B ',( l Î R), y si I es el punto medio de AB, entonces podemos escribir que AJ AC = AI AB

Para demostrarlo, tal y como hemos visto anteriormente, para toda proyección puntual, si AC = l × AB , P2

Proposición: Toda proyección puntual “conserva las mitades”, es decir: si I es el punto medio del segmento AB, entonces su proyección I' es el punto medio del segmento determinado por A ' B', siendo A' y B' las proyecciones respectivas de A y B. B

I

B´

AC A 'C ' . y relacionando las expresiones anteriores llegamos a = AB A 'B ' Proposición: Sea P un plano y r una recta no paralela al plano, y sean A, B, C tres puntos con sus respectivas proyecciones A ', B', C' sobre r paralelamente a P, si existe un cierto l Î R tal que AC = l × AB ,( l Î R), se verifica entonces que A 'C ' = l × A ' B ',( l Î R).

Si (AB) no es paralela a r , las rectas r y (AB) determinan un plano a que corta al plano P según una recta r'entonces A 'Î r' al ser la intersección de la paralela a r que pasa por A; lo mismo puede decirse de B' y C' . Aplicando el Teorema de Thales en este plano a a las rectas paralelas a r que pasan por A, B y C, se obtiene que A 'C ' = l × A ' B ',( l Î R). P3

C

C´

J

– Caso 2. Si A ¹ B, entonces los puntos A, B y C están sobre la recta (AB) . Si esta recta (AB) es paralela a r, entonces los puntos A, B y C tienen la misma proyección A' y en consecuencia se tendrá entonces que A 'C ' = l × A ' B ',( l Î R) ya que A 'C ' = 0 = l A ' B ',( 0 Î R). Para demostrarlo partimos de la hipótesis de que AC = l × AB ,( l Î R)

y se nos presentan distintos casos:

–

Caso 1. Si A = B, entonces A = C y la proyecciones A, B y C son el mismo punto por lo que se verificaría que A 'C ' = l × A ' B ',( l Î R)

–

Figura 6.

Figura 6.

Caso 1. Si A = B, entonces A = C y la proyecciones A, B y C son el mismo punto por lo que se verificaría que A 'C ' = l × A ' B ',( l Î R)

– Caso 2. Si A ¹ B, entonces los puntos A, B y C están sobre la recta (AB) . Si esta recta (AB) es paralela a r, entonces los puntos A, B y C tienen la misma proyección A' y en consecuencia se tendrá entonces que A 'C ' = l × A ' B ',( l Î R) ya que A 'C ' = 0 = l A ' B ',( 0 Î R). y se nos presentan distintos casos:

AC = l × AB ,( l Î R)

Para demostrarlo partimos de la hipótesis de que

Proposición: Sea P un plano y r una recta no paralela al plano, y sean A, B, C tres puntos con sus respectivas proyecciones A ', B', C' sobre r paralelamente a P, si existe un cierto l Î R tal que AC = l × AB ,( l Î R), se verifica entonces que A 'C ' = l × A ' B ',( l Î R).

Si (AB) no es paralela a r , las rectas r y (AB) determinan un plano a que corta al plano P según una recta r'entonces A 'Î r' al ser la intersección de la paralela a r que pasa por A; lo mismo puede decirse de B' y C' . Aplicando el Teorema de Thales en este plano a a las rectas paralelas a r que pasan por A, B y C, se obtiene que A 'C ' = l × A ' B ',( l Î R). J

C´

P3

C

Proposición: Toda proyección puntual “conserva las mitades”, es decir: si I es el punto medio del segmento AB, entonces su proyección I' es el punto medio del segmento determinado por A ' B', siendo A' y B' las proyecciones respectivas de A y B. y relacionando las expresiones anteriores llegamos a

I

B

B´

P2

AC A 'C ' . = AB A 'B '

AJ AC = AI AB

Para demostrarlo, tal y como hemos visto anteriormente, para toda proyección puntual, si AC = l × AB , ( l Î R), entonces A 'C ' = l × A ' B ',( l Î R), y si I es el punto medio de AB, entonces podemos escribir que 1 1 AI = AB, lo que implica que A ' I ' = A ' B ', por lo que I ' es el punto medio de A ' B '. 2 2 Proposición: La imagen de un paralelogramo por una proyección puntual es un paralelogramo. Para demostrarlo consideremos ABCD un paralelogramo. Sus diagonales AC y BD se cortan en su punto medio I. Si llamamos A ', B', C', D', I' a las proyecciones de A, B, C, D e I, por una proyección puntual, podemos afirmar que la proyección I' de I es el punto medio de A’C’ y también el punto medio de B', D' . Por tanto AC y BD tienen el mismo punto medio, lo que es una propiedad característica de todo paralelogramo. Así pues, A ', B', C', D' es también un paralelogramo. A

A´

P1

Análogamente, las rectas r y r1 determinan un cierto plano a y dado que r1 y r2 son coplanarias podemos aplicar lo visto anteriormente, r1 corta a los planos P1,P 2 ,P 3 en los puntos A, I, J y dado que los planos P1,P 2 ,P 3 son paralelos podemos escribir: AJ A 'C ' = AI A 'B '

finiendo tres rectas paralelas. Así, podemos aplicar el Teorema de Thales en el plano b a las rectas paralelas ( AA ') ,( IB') ,( JC') con lo que podemos escribir: 400

r

r1 r2



Proyecciones en el plano B C

I A

D

B´ C´

I´

P

A´ D´

Figura 7.

4. PROYECCIONES, ÁNGULOS Y DISTANCIAS 4.1. Definición de proyección cónica Realizamos una proyección cónica cuando todas las proyectantes las hacemos pasar por un punto fijo, al que se denomina centro de la proyección. V

A

B

D

C

D´ A´

P

C´

B´

Figura 8.

4.2. Definición de proyección cilíndrica Realizamos una proyección cilíndrica cuando todas las proyectantes son paralelas a una dirección dada. La proyección cilíndrica puede ser ortogonal u oblicua dependiendo de que las proyectantes sean perpendiculares u oblicuas al plano de proyección.

A

P

B

C

A´

D

B´

C´

D´


401


402


4.3. Proyección de una recta y de rectas paralelas Sin embargo, si las proyecciones de dos rectas sobre dos planos distintos no paralelos entre sí son paralelas, las rectas son paralelas. En efecto, al ser paralelas las proyecciones y las proyectantes de sus puntos sobre un plano, son paralelos los dos planos proyectantes y, por la misma razón, también, son paralelos los planos proyectantes de las rectas sobre el otro plano. Una recta es, por tanto, paralela a los dos planos proyectantes de la otra sobre los dos planos y cuando una recta es paralela a dos planos, es paralela a su intersección.

La proyección de una recta r sobre un plano es otra recta, puesto que siendo paralelas las proyectantes de sus puntos, todas ellas se encuentran en un plano perpendicular al plano de proyección P, que se denomina plano proyectante de la recta r. N

M

R

E

S

H

Figura 11. D

G

A C n

F

r

m

h

s

e

B c

a=b

g

d

f

s´ Q r´

Figura 10.

S R

Si la recta es perpendicular al plano de proyección, esta se reduce a un punto, si la recta es paralela al plano de proyección, su proyección es paralela a la recta, proyectándose todos sus segmentos en verdadera magnitud. Las proyecciones de dos rectas paralelas sobre un plano son paralelas ya que al ser paralelas las proyectantes de sus puntos, los planos proyectantes de ambas rectas son así mismo paralelos, al tener cada uno de ellos dos rectas paralelas al otro. La intersección de ambos planos proyectantes con el de proyección son, por lo tanto, rectas paralelas. Hay que tener en cuenta que el recíproco no se cumple ya que, como se muestra en el gráfico, las proyecciones de dos rectas puede ser paralelas y no serlo sin embargo las rectas espaciales. Basta para ello que las rectas tengan planos proyectantes paralelos sin serlo las rectas.

Si la recta es perpendicular al plano de proyección, esta se reduce a un punto, si la recta es paralela al plano de proyección, su proyección es paralela a la recta, proyectándose todos sus segmentos en verdadera magnitud. Las proyecciones de dos rectas paralelas sobre un plano son paralelas ya que al ser paralelas las proyectantes de sus puntos, los planos proyectantes de ambas rectas son así mismo paralelos, al tener cada uno de ellos dos rectas paralelas al otro. La intersección de ambos planos proyectantes con el de proyección son, por lo tanto, rectas paralelas. Hay que tener en cuenta que el recíproco no se cumple ya que, como se muestra en el gráfico, las proyecciones de dos rectas puede ser paralelas y no serlo sin embargo las rectas espaciales. Basta para ello que las rectas tengan planos proyectantes paralelos sin serlo las rectas. R

S

Figura 10. r´ Q s´

a=b

c

B

s

m

f

d

g e

n

h

r F

C A

G

D

Figura 11. H E

R

S

Sin embargo, si las proyecciones de dos rectas sobre dos planos distintos no paralelos entre sí son paralelas, las rectas son paralelas. En efecto, al ser paralelas las proyecciones y las proyectantes de sus puntos sobre un plano, son paralelos los dos planos proyectantes y, por la misma razón, también, son paralelos los planos proyectantes de las rectas sobre el otro plano. Una recta es, por tanto, paralela a los dos planos proyectantes de la otra sobre los dos planos y cuando una recta es paralela a dos planos, es paralela a su intersección. M

N

La proyección de una recta r sobre un plano es otra recta, puesto que siendo paralelas las proyectantes de sus puntos, todas ellas se encuentran en un plano perpendicular al plano de proyección P, que se denomina plano proyectante de la recta r.

4.3. Proyección de una recta y de rectas paralelas CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


402


R

S

r P

S´

Figura 12.

4.4. Proyección de rectas perpendiculares Dos rectas R y S que se cortan o se cruzan, son perpendiculares en el espacio y una de ellas es paralela al plano de proyección P, sus proyecciones r y s sobre ese plano son también perpendiculares. Como la recta R es paralela al plano P su proyección r sobre P es paralela a R y, por tanto, perpendicular a la recta S, y también perpendicular a las proyectantes de los puntos de S sobre P, r es perpendicular al plano proyectante de S sobre P, al serlo a dos de sus rectas por lo que también será perpendicular a cualquier recta de ese plano. El recíproco también es cierto: si las proyecciones r y s de dos rectas sobre un plano son perpendiculares y una de ellas R es paralela al plano de proyección, las rectas R y S son perpendiculares ya que siendo R y r paralelas, y ambas perpendiculares a sus proyectantes sobre el plano P, la recta S está contenida en un plano proyectante que es perpendicular a R.

4.5. Teorema de las tres perpendiculares Si por el pie m de una perpendicular .Mm a un plano P, se traza una perpendicular m.M a una recta S de P, la recta R que une el punto N con cualquier punto de la perpendicular Mm al plano P, también es perpendicular a S. M

R

N m P

S

Figura 13.

R P

r Q

T

Figura 14.


403


404


El teorema de las tres perpendiculares se puede entender como un caso particular de la proyección de rectas perpendiculares, considerando una de ellas en el plano.

De todas las rectas situadas en un plano P que pasan por uno de sus puntos M, la que forma el mayor ángulo con otro plano Q, oblicuo con P es la perpendicular por M a la intersección T de ambos planos, a esta recta se le denomina recta de máxima pendiente de P respecto de Q. La recta MN de máxima pendiente se obtiene trazando por la proyección m de M sobre Q la perpendicular a la traza T siendo MN perpendicular a T por el teorema de las tres perpendiculares expuesto anteriormente. Para otro punto L de T el ángulo que forma ML con Q lo denominamos b, y siendo el triángulo Lnm rectángulo en N, entonces Lm > Nm, por lo que girando el triangulo LMm alrededor del cateto Mm hasta superponerlo con el plano MNm resulta que a = b + g.

4.6. Recta y plano perpendiculares

Si una recta R es perpendicular a un plano P, su proyección r sobre otro plano Q es perpendicular a la intersección T de los planos P y Q. Como R y T son rectas perpendiculares y también lo son las proyectantes de R sobre Q perpendiculares a T, entonces es la recta T perpendicular al plano proyectante de R sobre Q. Por lo tanto r y T son perpendiculares. El recíproco no es cierto pues del hecho de que r y T sean perpendiculares se deduce que el plano proyectante de R es perpendicular a T, quedando en ese plano indeterminada la posición de R con relación al plano R.

4.8. Recta de máxima pendiente de un plano

Ese ángulo es el menor de ángulos que forma la recta R con cualquier recta que situada en plano P pase por su intersección I con P. Mm Sabemos que en el triángulo IMN, sena = , y para otra recta S cualquiera situada en el plano P y IM MN , y dado que MN es una de las oblicuas que pase por el punto I, en el triángulo IMN tendremos senb = IM que pasan por M respecto del plano P, entonces MN > Mm, lo que nos permite afirmar que a < b, con lo que queda probado que es el ángulo menor.

4.7. Ángulo de recta y plano

Se llama ángulo de una recta oblicua R, con un plano P al que forma la recta R con su proyección r sobre ese plano. M

Figura 15. N S r

a

r

R

m

P

b

b

I

m I

a

P

R

S N

Figura 15. M

Ese ángulo es el menor de ángulos que forma la recta R con cualquier recta que situada en plano P pase por su intersección I con P. Mm Sabemos que en el triángulo IMN, sena = , y para otra recta S cualquiera situada en el plano P y IM MN , y dado que MN es una de las oblicuas que pase por el punto I, en el triángulo IMN tendremos senb = IM que pasan por M respecto del plano P, entonces MN > Mm, lo que nos permite afirmar que a < b, con lo que queda probado que es el ángulo menor.

Se llama ángulo de una recta oblicua R, con un plano P al que forma la recta R con su proyección r sobre ese plano.

4.7. Ángulo de recta y plano

Si una recta R es perpendicular a un plano P, su proyección r sobre otro plano Q es perpendicular a la intersección T de los planos P y Q. Como R y T son rectas perpendiculares y también lo son las proyectantes de R sobre Q perpendiculares a T, entonces es la recta T perpendicular al plano proyectante de R sobre Q. Por lo tanto r y T son perpendiculares. El recíproco no es cierto pues del hecho de que r y T sean perpendiculares se deduce que el plano proyectante de R es perpendicular a T, quedando en ese plano indeterminada la posición de R con relación al plano R.

4.8. Recta de máxima pendiente de un plano

De todas las rectas situadas en un plano P que pasan por uno de sus puntos M, la que forma el mayor ángulo con otro plano Q, oblicuo con P es la perpendicular por M a la intersección T de ambos planos, a esta recta se le denomina recta de máxima pendiente de P respecto de Q. La recta MN de máxima pendiente se obtiene trazando por la proyección m de M sobre Q la perpendicular a la traza T siendo MN perpendicular a T por el teorema de las tres perpendiculares expuesto anteriormente. Para otro punto L de T el ángulo que forma ML con Q lo denominamos b, y siendo el triángulo Lnm rectángulo en N, entonces Lm > Nm, por lo que girando el triangulo LMm alrededor del cateto Mm hasta superponerlo con el plano MNm resulta que a = b + g.

4.6. Recta y plano perpendiculares

El teorema de las tres perpendiculares se puede entender como un caso particular de la proyección de rectas perpendiculares, considerando una de ellas en el plano.



404


P

M Q

b

L

b

a N

m

T

Figura 16. El ángulo a que forma con Q la recta MN de máxima pendiente es el mayor de todos los ángulos que forma cualquier otra recta que pase por M con Q y coincide con el rectilíneo del diedro que forman P y Q, al ser M.N y mM perpendiculares a T. Por cada punto M de P pasa una línea de máxima pendiente y al ser todas perpendiculares a la traza T, todas serán paralelas.

4.9. Mínima distancia entre dos rectas que se cruzan Se define la mínima distancia entre dos rectas R y S que se cruzan como una recta MN perpendicular a las dos rectas y que se apoya o corta a ambas. Por una de las rectas S se traza un plano P paralelo a la otra R, siendo este plano el formado por S y una recta paralela R1 a la recta R trazada por uno de sus puntos F.

P

L

R

M

l

p

(+h)

P

R2 N

S K

F

R1

Figura 18. Figura 17. Los planos perpendiculares por cada recta R y S a P proporcionan en su intersección la recta MN ya que ambos se cortan en una recta perpendicular a P y por tanto a R y S.

5. SISTEMAS DE PROYECCIÓN 5.1. Sistema acotado La forma de conseguir la proyección de la figura del espacio consiste en obtener de ella una proyección cilíndrica ortogonal sobre dicho plano, la cual, sintetizada en un punto nos proporciona p como pie de la perpendicular trazada desde P al plano; anotaremos al lado de p un número que nos indique la distancia del punto P al plano de proyección, o sea su cota h, la cual tendrá signo positivo o negativo, segun se halle


405


406


en una región o en otra con relación al plano de proyección, el cual divide al espacio en dos partes, de las que una es de cotas positivas y la otra de cotas negativas. Figura 19.

5.2. Sistema diédrico o de Monge Para evitar el inconveniente que supone en la restitución la unión en el espacio de varios puntos situados sobre la misma proyectante, tal como vienen representados en el sistema acotado, se recurre a una segunda proyección que nos evite el afectar el mismo punto proyección de varias cotas. Para ello se dispone de un conjunto formado por dos planos ortogonales entre sí, que se colocarán, en general, uno de ellos, horizontal, y el otro vertical, adoptándose para ellos la denominación: plano horizontal de proyección H y plano vertical de proyección V. La operación en el espacio se consigue proyectando ortogonalmente el punto P sobre el plano horizontal H, dando lugar a su proyeccion horizontal p, y también se proyecta verticalmente, es decir, ortogonalmente al plano V, obteniendo así la proyección vertical p'. Ahora bien: como nosotros operaremos sobre el plano del dibujo, haremos que éste coincida con el plano H (horizontal de proyección), haciendo coincidir también el plano V en su totalidad sobre H, haciéndolo girar alrededor de su recta de intersección, a la que en lo sucesivo llamaremos línea de tierra. De esta forma, p' viene a ocupar una posición tal que se encuentren p y p' sobre la misma perpendicular a la línea de tierra. La distancia que separa la proyección vertical p'de la línea de tierra, será h, igual a la altura del punto P sobre el plano horizontal de proyección H, es decir, la magnitud del segmento Pp; de la misma forma, la distancia d que separa la proyección horizontal p de la línea de tierra, nos representa un segmento igual a la magnitud Pp', es decir, la distancia existente entre el punto del espacio P y el plano vertical V de proyección. Al conjunto de todos los puntos tales que p, proyección horizontal de los del espacio, se acostumbra a llamar planta del conjunto; y a la proyección vertical del mismo se le denomina también alzado. L

d

H

P

P´

h

h

T

V

P´

P

d

Para evitar el inconveniente que supone en la restitución la unión en el espacio de varios puntos situados sobre la misma proyectante, tal como vienen representados en el sistema acotado, se recurre a una segunda proyección que nos evite el afectar el mismo punto proyección de varias cotas. Para ello se dispone de un conjunto formado por dos planos ortogonales entre sí, que se colocarán, en general, uno de ellos, horizontal, y el otro vertical, adoptándose para ellos la denominación: plano horizontal de proyección H y plano vertical de proyección V. La operación en el espacio se consigue proyectando ortogonalmente el punto P sobre el plano horizontal H, dando lugar a su proyeccion horizontal p, y también se proyecta verticalmente, es decir, ortogonalmente al plano V, obteniendo así la proyección vertical p'. Ahora bien: como nosotros operaremos sobre el plano del dibujo, haremos que éste coincida con el plano H (horizontal de proyección), haciendo coincidir también el plano V en su totalidad sobre H, haciéndolo girar alrededor de su recta de intersección, a la que en lo sucesivo llamaremos línea de tierra. De esta forma, p' viene a ocupar una posición tal que se encuentren p y p' sobre la misma perpendicular a la línea de tierra. La distancia que separa la proyección vertical p'de la línea de tierra, será h, igual a la altura del punto P sobre el plano horizontal de proyección H, es decir, la magnitud del segmento Pp; de la misma forma, la distancia d que separa la proyección horizontal p de la línea de tierra, nos representa un segmento igual a la magnitud Pp', es decir, la distancia existente entre el punto del espacio P y el plano vertical V de proyección. Al conjunto de todos los puntos tales que p, proyección horizontal de los del espacio, se acostumbra a llamar planta del conjunto; y a la proyección vertical del mismo se le denomina también alzado. d

P

P´

V

T

h

h

P´

P

H

d

L

5.2. Sistema diédrico o de Monge en una región o en otra con relación al plano de proyección, el cual divide al espacio en dos partes, de las que una es de cotas positivas y la otra de cotas negativas. Figura 19.



406

Proyecciones en el plano En la siguiente figura aparece en el plano del dibujo tal y como realmente las cosas suceden; es decir, que la línea de tierra viene representada por una recta LT, y a ambos lados de la misma aparecen las porciones de plano que corresponden a la proyección horizontal y a la proyección vertical.

V p´ h L

T d p H

Figura 20. Si ahora desde p levantamos la perpendicular a H, y desde p'la perpendicular a V, observaremos que estas dos perpendiculares se cortarán en un único punto del espacio, que será el punto P, el cual dio origen a las dos proyecciones en cuestión, p - p.

5.3. Sistema axonométrico Supongamos un triedro trirrectángulo O – (X) – (Y) – (Z). Dado un punto P del espacio, proyectaremos ortogonalmente este punto sobre las tres caras de este triedro trirrectángulo, obteniendo así las proyecciones ( p ') – ( p '') – ( p '''); es decir, habiendo obtenido los segmentos Pp ''', Pp '', Pp ' iguales, respectivamente, a las coordenadas (x) (y) (z) del punto (P) con relación al sistema del espacio.

Z

D (Z)

p p´´

p´´´

p´´´ x

y p

(p´´) (x)(y) (P)

o

z

(z) p´

p´

Y

(X) (Y)

X

Figura 21.


407


408


Figura 23.

p´

Hagamos pasar ahora el plano de proyección por el vértice O' del triedro trirrectángulo, y proyectemos ortogonalmente el conjunto del espacio constituido por la forma (P) y sus respectivas proyecciones ( p ') , ( p '') y ( p'''). 3

1

Y

X

z

De esta forma obtendremos una proyección directa Pdel punto (P) y tres proyecciones, p ' – p '' – p ''', de los anteriores, ( p ') , ( p '') y ( p'''), situadas sobre las caras del triedro trirrectángulo. O

p

En esta nueva proyección se aprecian de una sola vez las tres coordenadas del punto (P); es decir, que se obtienen los segmentos x, y, z, Pp' ' ' , Pp '', Pp ' proporcionales a las coordenadas (x) – (y) – (z), que son las que aparecen en la figura siguiente, en que el plano P se ha hecho coincidir con el plano del dibujo. También se observa que este sistema es perfectamente reversible. p

p´´´

Y

X

Z

Figura 22.

p´´

Se comprende que las direcciones de las proyecciones OX ,OY ,OZ de los ejes sean cualesquiera y vengan en función del ángulo que forma el planoP con las aristas del triedro trirrectángulo; pero existe una posición tal en que los ángulos que formen entre si dichas proyecciones sean iguales a 120º, y por elIo recibe el nombre este sistema de sistema axonométrico isométrico. En la axonometría isométrica, los segmentos paralelos a las aristas del triedro, es decir, las coordenadas de los puntos, están afectadas en su proyección por el mismo coeficiente de reducción, por formar ángulos iguales los tres ejes con el plano P. Para que un punto esté representado en este sistema bastará conocer dos de sus proyecciones; es decir, por ejemplo, la directa y una de las laterales P y p'; o bien, dos laterales cualesquiera, p' y p'', pues con ellas se obtienen las otras dos, debiendo observar, sin embargo, la posición relativa que han de ocupar, pues se ha de verificar la condición de que las paralelas a los ejes trazadas por ellas se cortan en el mismo punto del tercero; es decir, que p '1, p ''1han de ser paralelas a los ejes Y y Z, respectivamente, y que lo mismo ha de suceder con respecto a p '2, p ''2 y con p '3, p ''3. 2

Un punto M queda determinado conociendo su proyección central m, intersección de su rayo proyectante MO con el plano P; y para atender a su restitución al espacio, se le proyecta además ortogonalmente sobre P, obteniéndose m'. Existe un punto notable, y es la proyección ortogonal del centro de proyección O sobre el plano del cuadro P; este punto recibe el nombre de punto principal P, y la condición a que han de sujetarse los puntos m (proyección central) y m' (proyección ortogonal) es que la recta m' m pase por el punto P, lo cual es evidente, puesto que tal recta m' mP es la traza del plano P con el plano formado por los tres puntos OPM , por ser paralelas las rectas Mm' y OP.

D

P

O

M

m´ m

p

5.4. Sistema cónico

El sistema cónico está compuesto por el plano de proyección P y el centro de proyección O. El plano P se denomina plano del cuadro. Un punto M queda determinado conociendo su proyección central m, intersección de su rayo proyecp tante MO con el plano P; y para atender a su restitución al espacio, se le proyecta además ortogonalmente sobre m´ P, obteniéndose m'. m M Existe un punto notable, y es la proyección ortogonal del centro de proyección O sobre el plano del cuaO dro P; este punto recibe el nombre de punto principal P, P y la condición a que han de sujetarse los puntos m (proD yección central) y m' (proyección ortogonal) es que la recta m' m pase por el punto P, lo cual es evidente, puesto que tal recta m' mP es la traza del plano P con el plano formado por los tres puntos OPM , por ser paralelas las rectas Mm' y OP.

El sistema cónico está compuesto por el plano de proyección P y el centro de proyección O. El plano P se denomina plano del cuadro.

5.4. Sistema cónico

Se comprende que las direcciones de las proyecciones OX ,OY ,OZ de los ejes sean cualesquiera y vengan en función del ángulo que forma el planoP con las aristas del triedro trirrectángulo; pero existe una posición tal en que los ángulos que formen entre si dichas proyecciones sean iguales a 120º, y por elIo recibe el nombre este sistema de sistema axonométrico isométrico. En la axonometría isométrica, los segmentos paralelos a las aristas del triedro, es decir, las coordenadas de los puntos, están afectadas en su proyección por el mismo coeficiente de reducción, por formar ángulos iguales los tres ejes con el plano P. Para que un punto esté representado en este sistema bastará conocer dos de sus proyecciones; es decir, por ejemplo, la directa y una de las laterales P y p'; o bien, dos laterales cualesquiera, p' y p'', pues con ellas se obtienen las otras dos, debiendo observar, sin embargo, la posición relativa que han de ocupar, pues se ha de verificar la condición de que las paralelas a los ejes trazadas por ellas se cortan en el mismo punto del tercero; es decir, que p '1, p ''1han de ser paralelas a los ejes Y y Z, respectivamente, y que lo mismo ha de suceder con respecto a p '2, p ''2 y con p '3, p ''3. 2

Figura 22.

Z

En esta nueva proyección se aprecian de una sola vez las tres coordenadas del punto (P); es decir, que se obtienen los segmentos x, y, z, Pp' ' ' , Pp '', Pp ' proporcionales a las coordenadas (x) – (y) – (z), que son las que aparecen en la figura siguiente, en que el plano P se ha hecho coincidir con el plano del dibujo. También se observa que este sistema es perfectamente reversible. p´´´

X

p´´

Y

p

p

De esta forma obtendremos una proyección directa Pdel punto (P) y tres proyecciones, p ' – p '' – p ''', de los anteriores, ( p ') , ( p '') y ( p'''), situadas sobre las caras del triedro trirrectángulo. O

X 1

( p ') , ( p '') y ( p''').

z

Y

Hagamos pasar ahora el plano de proyección por el vértice O' del triedro trirrectángulo, y proyectemos ortogonalmente el conjunto del espacio constituido por la forma (P) y sus respectivas proyecciones 3

Figura 23.



408

p´

Proyecciones en el plano Pasemos ahora al plano del dibujo, como se ve en la siguiente figura, sobre el que se ha hecho coincidir el plano de proyección P, en el que tenemos representado el punto principal P y la distancia D del centro de proyección a dicho plano P. En él tendremos los puntos m – m', proyección central y ortogonal, respectivamente, del punto M del espacio. Se aprecia la reversibilidad del sistema, pues para restituir el punto M a su posición verdadera bastará efectuar la operación siguiente: 1.

2. 3.

D

p P

O M

(M) m

T (m)

L

G

Levantar a partir de P la perpendicular al plano del dibujo y tomar sobre ella la distancia D. Unir el punto O así determinado con m. Trazar desde m' la perpendicular al plano del dibujo.

Figura 24.

La intersección de esta última perpendicular con el rayo OM nos individualizará la posición del punto del espacio M Existe, sin embargo, una modalidad de la representación en el sistema cónico, que presenta grandes ventajas tanto como sistema general de representación central, como por permitirnos con gran facilidad el paso de un sistema a otro. Tal modalidad consiste en que, además del plano P de proyección y del centro O que define este sistema, se utiliza un plano perpendicular a P, que generalmente es horizontal, y que llamaremos geometral, G. La recta LT, intersección de G con P, se llama p D también línea de tierra. De esta suerte viene modificada la proyecP ción central de la siguiente forma: M Se obtiene primeramente el punto M, proyección directa central, desde O sobre P del punto del espacio (M). Seguidamente se proyecta ortogonalmente el punto (M) en (m) sobre G, y nuevamente se efectúa la proyección cónica de (m) sobre el plano de proyección P, dando lugar a m. Entonces, siendo la recta Mm del espacio perpendicular a todas las rectas del plano geometral G, lo será tambien a la de intersección LT de G con P, y su proyección sobre el plano del cuadro sera la recta Mm, también perpendicular a LT, tal y como aparece en la figura adjunta, donde se ha hecho coincidir el plano de proyección con el plano del dibujo.

m L

T

Figura 25.

p m´ m p D

Figura 26.


409


410


6. MAPAS 6.1. Definición de mapas. Tipos

Figura 28.

Ya se ha comentado el problema que supone la representaA ción de la realidad tridimensional en un plano, a lo que hay que añadir el problema de la esfericidad terrestre. Esto conlleva la utilización de los sistemas de representación propios de la Geometría Descriptiva. C De los cuatro sistemas fundamentales de representación, la Topografía debe prescindir de los métodos perspectivos (cónico y p axonométrico) debido a que estos deforman las figuras debido a la a variación de las dimensiones en las distintas direcciones. Tampoco se puede utilizar, dentro de los sistemas métricos, el sistema diédrico o de Monge ya que al ser la proyección vertical mucho menor que la horizontal se acumularían y superpondrían las proyecciones Figura 27. con lo que se dificultaría o incluso imposibilitaría la lectura. La Topografía utiliza el sistema acotado, en donde se representan los distintos puntos del espacio tomando como referencia un plano horizontal P al que se denomina Plano de Comparación, cuya elección es arbitraria. Sobre el Plano de Comparación se proyectan ortogonalmente los diversos puntos, sustituyéndose así la realidad tridimensional por su proyección bidimensional. Hemos de imponer la condición de que la representación sea reversible, es decir, que desde la proyección podamos deducir la verdadera forma en el espacio, por lo que se hace necesario otro elemento en el sistema y éste lo constituye la distancia existente entre un punto y su proyección, a esta distancia se representa al lado de la proyección y se le denomina cota. Con la proyección y la cota cada punto queda unívocamente determinado, y se hace reversible el sistema de representación, por lo que podemos afirmar que existe biunivocidad en el mapa. El Plano de Comparación, elegido al azar, divide al espacio en dos subespacios, de modo que la cota será positiva si el punto a pro17 yectar pertenece al subespacio superior, mientras que la cota será 22 negativa si el punto pertenece al subespacio inferior, y cero si el pun35 to se encuentra en el Plano de Comparación. Desde un punto de vista 26 práctico, el Plano de Comparación se toma lo suficientemente 20 “bajo” como para que todas las cotas sean positivas. El conjunto de puntos del espacio que tienen una misma cota se representan en el plano mediante la curva de nivel de esa superficie, las cuales pueden presentar también puntos aislados.

La Topología es la ciencia a la que compete el estudio de los métodos necesarios para llegar a la representación de un terreno con todos sus detalles naturales o los creados por el hombre, junto con el conocimiento y manejo de los instrumentos y técnicas precisos. Se denomina mapa a toda representación de una parte de la superficie terrestre, la cual por su extensión y debido a la curvatura de la superficie del planeta, requiera hacer uso de sistemas especiales de transformación propios de la Cartografía. Al mapa que abarca la totalidad del globo se le denomina planisferio, y si la representación del mundo se realiza mediante los dos hemisferios se denomina Mapa Mundi. Cuando la representación se refiere a una gran superficie como puede ser un continente o una nación, la representación se denomina Mapa Geográfico, mientras que si la superficie es menor, como una nación o una provincia, la representación es, lógicamente, más detallada, denominándose Mapas Corográficos. Podemos, a su vez, subdividir los mapas atendiendo al contenido que muestran en: Mapas Físicos (describen accidentes geográficos, subdividiéndose a su vez en orográficos, hidrográficos, geológicos...), Mapas Políticos (recogen las naciones, fronteras, límites regionales y provinciales...), Mapas Biológicos, Históricos, Estadísticos, etc.

6.2. Sistema de representación usado en Topología

Ya se ha comentado el problema que supone la representación de la realidad tridimensional en un plano, a lo que hay que añadir el problema de la esfericidad terrestre. Esto conlleva la utilización de los sistemas de representación propios de la Geometría Descriptiva. C De los cuatro sistemas fundamentales de representación, la Topografía debe prescindir de los métodos perspectivos (cónico y p axonométrico) debido a que estos deforman las figuras debido a la a variación de las dimensiones en las distintas direcciones. Tampoco se puede utilizar, dentro de los sistemas métricos, el sistema diédrico o de Monge ya que al ser la proyección vertical mucho menor que la horizontal se acumularían y superpondrían las proyecciones Figura 27. con lo que se dificultaría o incluso imposibilitaría la lectura. La Topografía utiliza el sistema acotado, en donde se representan los distintos puntos del espacio tomando como referencia un plano horizontal P al que se denomina Plano de Comparación, cuya elección es arbitraria. Sobre el Plano de Comparación se proyectan ortogonalmente los diversos puntos, sustituyéndose así la realidad tridimensional por su proyección bidimensional. Hemos de imponer la condición de que la representación sea reversible, es decir, que desde la proyección podamos deducir la verdadera forma en el espacio, por lo que se hace necesario otro elemento en el sistema y éste lo constituye la distancia existente entre un punto y su proyección, a esta distancia se representa al lado de la proyección y se le denomina cota. Con la proyección y la cota cada punto queda unívocamente determinado, y se hace reversible el sistema de representación, por lo que podemos afirmar que existe biunivocidad en el mapa. El Plano de Comparación, elegido al azar, divide al espacio en dos subespacios, de modo que la cota será positiva si el punto a pro17 yectar pertenece al subespacio superior, mientras que la cota será 22 negativa si el punto pertenece al subespacio inferior, y cero si el pun35 to se encuentra en el Plano de Comparación. Desde un punto de vista 26 práctico, el Plano de Comparación se toma lo suficientemente 20 “bajo” como para que todas las cotas sean positivas. El conjunto de puntos del espacio que tienen una misma cota se representan en el plano mediante la curva de nivel de esa superficie, las cuales pueden presentar también puntos aislados. Figura 28. A

6.2. Sistema de representación usado en Topología

La Topología es la ciencia a la que compete el estudio de los métodos necesarios para llegar a la representación de un terreno con todos sus detalles naturales o los creados por el hombre, junto con el conocimiento y manejo de los instrumentos y técnicas precisos. Se denomina mapa a toda representación de una parte de la superficie terrestre, la cual por su extensión y debido a la curvatura de la superficie del planeta, requiera hacer uso de sistemas especiales de transformación propios de la Cartografía. Al mapa que abarca la totalidad del globo se le denomina planisferio, y si la representación del mundo se realiza mediante los dos hemisferios se denomina Mapa Mundi. Cuando la representación se refiere a una gran superficie como puede ser un continente o una nación, la representación se denomina Mapa Geográfico, mientras que si la superficie es menor, como una nación o una provincia, la representación es, lógicamente, más detallada, denominándose Mapas Corográficos. Podemos, a su vez, subdividir los mapas atendiendo al contenido que muestran en: Mapas Físicos (describen accidentes geográficos, subdividiéndose a su vez en orográficos, hidrográficos, geológicos...), Mapas Políticos (recogen las naciones, fronteras, límites regionales y provinciales...), Mapas Biológicos, Históricos, Estadísticos, etc.

6. MAPAS 6.1. Definición de mapas. Tipos



410


7. PROYECCIONES CARTOGRÁFICAS Como las proyecciones topográficas, tal y como se comentó anteriormente, se muestran inadecuadas para representar superficies a partir de una determinada extensión, se hace necesario recurrir a la Cartografía; ésta es desarrollable de modo esférico o elipsoideo mediante unas transformaciones adecuadas al método que se adopte. Los métodos se fundamentan en la transformación de las coordenadas geográficas longitud y latitud (M, L) que definen la posición de un punto, sobre el elipsoide de referencia, en otras coordenadas de tipo cartesiano (X, Y) que determinan la posición de otro punto homólogo del primero, sobre una superficie plana que se denomina genéricamente mapa. Todos los puntos de la tierra situados a lo largo de un meridiano o de un paralelo tendrán sus homólogos en el mapa en ciertas líneas que constituyen los meridianos y paralelos de la proyección. La ley de transformación empleada es la que define el correspondiente sistema cartográfico, constituyendo el conjunto de transformaciones lo que se denominan Sistemas de Proyección.

7.1. Anamorfosis Se entiende por anamorfosis las deformaciones que experimenta la realidad de la superficie de la tierra al representarse en el plano. Estas pueden ser de tres tipos: 1.

Anamorfosis lineal. Designando por Dl la longitud de un elemento de una línea en el terreno, y designando como Dl'su homólogo en la proyección, se denomina anamorfosis lineal o módulo de deformación lineal a: m=

Dl Dl '

Una línea para la cual m= 1se denomina automecoica. 2.

Anamorfosis superficial. Designando por Ds la superficie de un elemento del terreno, y designando como Ds' su homólogo en la proyección, se denomina anamorfosis superficial lineal o módulo de deformación superficial en un punto al cociente dado por: s=

3.

Ds Ds'

Anamorfosis angular. Designando por a el ángulo formado por dos elementos lineales del terreno, y designando como a'su homólogo en la proyección, que viene determinado por el ángulo formado por los elementos homólogos a los que forman a se denomina anamorfosis angular o deformación a la diferencia a - a '.

7.2. Escala local Si m= 1, las líneas automecoicas, podremos aplicar la escala 1: M a la que se halla elaborado el mapa, ya que para cualquier otro lugar por haberse deformado puede variar ligeramente. Si en ese punto el módulo fuese m, la escala anterior se transformaría en lo que se denomina la escala local, que vendría dada por: E=

1 1 ×m = M M :m

En los sistemas de proyección usuales, aún refiriéndose a grandes extensiones de terreno como una nación, se suele tomar m » 1, siendo la variación muy pequeña, pudiéndose así considerar la escala constante incluso en grandes extensiones de terreno.


411


412


7.3. Clasificación de las proyecciones cartográficas

En los sistemas perspectivos se supone la tierra esférica y dentro de ellos podemos distinguir entre varios tipos de proyecciones en función de la situación del centro de proyección: a) Proyección Gnómica: cuando el centro de proyección se toma como el centro de la tierra. b) Proyección Estereográfica: cuando el centro de proyección está en el exterior de la esfera. c) Proyección Ortográfica: cuando el centro de proyección se toma en el infinito.

Cada uno de los sistemas de proyección está orientado a la eliminación de alguna de las anamorfosis. Podemos clasificarlas en: a) Proyecciones conformes: son aquellas que resultan conservativas para los ángulos del terreno, por lo que en superficies pequeñas resultan muy semejantes a la superficie real, variando ligeramente la escala a medida que nos vamos alejando del centro de proyección. A este tipo de proyecciones se les denomina, también, Ortomorfas o Autogonales. b) Proyecciones equivalentes: son aquellas que resultan conservativas en la proyección de las áreas del terreno, aunque las figuras dejen de ser semejantes. Se denominan, también, Autálicas. c) Proyecciones aphylácticas o de mínima anamorfosis: son aquellas que, sin ser rigurosamente conformes ni equivalentes, reducen al mínimo las deformaciones. d) Proyecciones automecoicas: son aquellas que conservan las longitudes en determinadas direcciones. Figura 29.

7.4. Clasificación por el sistema de transformación 7.4.1. Sistemas convencionales En los sistemas convencionales no se sigue un verdadero sistema de proyección. En ellos para la proyección se supone el centro situado en cada uno de los trapecios curvilíneos formado por meridianos y paralelos, quedando de esta forma la Tierra sustituida por una superficie poliedral circunscrita, representándose con independencia cada hoja que, por la escasa, relativa, superficie que representa se supone coincidente con el trapecio curvilíneo. De este modo se toman tantos centros de proyección como hojas, de ahí que este sistema de transformación se denomine policéntrico o poliédrico.

Se representa la superficie mediante una verdadera proyección sobre el plano, tomando un centro de proyección único. Este sistema se emplea en la representación de grandes extensiones de la Tierra, hasta un hemisferio e incluso mayor. Los sistemas perspectivos consisten en la proyección de la superficie a considerar sobre un plano tangente a la Tierra, perpendicular al diámetro que pasa por el centro de proyección.

7.4.2. Sistemas perspectivos o naturales

7.4.2. Sistemas perspectivos o naturales

Se representa la superficie mediante una verdadera proyección sobre el plano, tomando un centro de proyección único. Este sistema se emplea en la representación de grandes extensiones de la Tierra, hasta un hemisferio e incluso mayor. Los sistemas perspectivos consisten en la proyección de la superficie a considerar sobre un plano tangente a la Tierra, perpendicular al diámetro que pasa por el centro de proyección.

En los sistemas convencionales no se sigue un verdadero sistema de proyección. En ellos para la proyección se supone el centro situado en cada uno de los trapecios curvilíneos formado por meridianos y paralelos, quedando de esta forma la Tierra sustituida por una superficie poliedral circunscrita, representándose con independencia cada hoja que, por la escasa, relativa, superficie que representa se supone coincidente con el trapecio curvilíneo. De este modo se toman tantos centros de proyección como hojas, de ahí que este sistema de transformación se denomine policéntrico o poliédrico.

7.4.1. Sistemas convencionales 7.4. Clasificación por el sistema de transformación d)

Cada uno de los sistemas de proyección está orientado a la eliminación de alguna de las anamorfosis. Podemos clasificarlas en: a) Proyecciones conformes: son aquellas que resultan conservativas para los ángulos del terreno, por lo que en superficies pequeñas resultan muy semejantes a la superficie real, variando ligeramente la escala a medida que nos vamos alejando del centro de proyección. A este tipo de proyecciones se les denomina, también, Ortomorfas o Autogonales. b) Proyecciones equivalentes: son aquellas que resultan conservativas en la proyección de las áreas del terreno, aunque las figuras dejen de ser semejantes. Se denominan, también, Autálicas. c) Proyecciones aphylácticas o de mínima anamorfosis: son aquellas que, sin ser rigurosamente conformes ni equivalentes, reducen al mínimo las deformaciones. Proyecciones automecoicas: son aquellas que conservan las longitudes en determinadas direcciones. Figura 29.

En los sistemas perspectivos se supone la tierra esférica y dentro de ellos podemos distinguir entre varios tipos de proyecciones en función de la situación del centro de proyección: a) Proyección Gnómica: cuando el centro de proyección se toma como el centro de la tierra. b) Proyección Estereográfica: cuando el centro de proyección está en el exterior de la esfera. c) Proyección Ortográfica: cuando el centro de proyección se toma en el infinito.

7.3. Clasificación de las proyecciones cartográficas



412

Proyecciones en el plano Partiendo de que cuando tomamos como origen un punto del exterior de la esfera la inversa de la esfera es un plano, cumpliéndose las siguientes propiedades: 1. 2. 3.

En la proyección estereográfica se conservan los ángulos. La proyección estereográfica de una superficie muy pequeña es otra semejante a la primera. La proyección de una circunferencia es otra circunferencia, y en el caso particular de que la primera pase por el punto de vista la proyección será una recta. En consecuencia, la proyección estereográfica es una proyección conforme.

c

a

A´

b

q

A B Q

O

v Figura 30.

La escala local, como hemos visto, es el cociente de las distancias al centro de proyección de los elementos considerados. Así, sean A y B dos puntos de la superficie esférica y a y b sus proyecciones, suponiendo que AB y ab son longitudes tan pequeñas que en ellas la anamorfosis es despreciable, la escala local será: e=

VA VA ' = Va Vc

Si tomamos radio unitario y siendo L la latitud del punto A podemos escribir: e=

1+ OA ' 1+ senL = 2 2

Según la posición del cuadro, la proyección estereográfica puede ser:

– –

Ecuatorial: cuando es paralelo al Ecuador y el punto de vista está en el Polo.

–

Horizontal: cuando se toma como cuadro el plano del horizonte de un lugar de la Tierra y como punto de vista el extremo del diámetro que pasa por él.

Meridiana: cuando se sitúa paralelamente a un meridiano y el centro de proyección está en el Ecuador.

7.5. Sistemas artificiales o por desarrollo En estos sistemas se sustituye la Tierra por un cilindro tangente a lo largo del Ecuador o que lo corta por dos paralelos, N y S, de igual latitud o por un cilindro tangente a lo largo de su meridiano, o bien se sustituye por un cono tangente a la tierra en un cierto paralelo o que la corte por dos. Sobre estos cilindros o conos se trasladan los puntos de la Tierra según una ley analítica determinada y después se desarrollan sobre un plano, dando origen a la proyección.


413


414


Podemos distinguir los siguientes sistemas de desarrollo: Figura 32.

7.5.1. Proyección cilíndrica conforme de Mercator

P

Se denomina también cilíndrica transversa conforme de Gauss, es muy utilizado (en él se representa el mapa de España). El UTM (Universal Transversal Mercatol) es una proyección cilíndrica, semejante a la de Mercator, si bien el cilindro se coloca transversalmente, es decir, con el eje sobre el Ecuador en lugar de coincidir con el de la Tierra. El cilindro tangente al elipsoide a lo largo de un meridiano tomado como origen y al desarrollar la superficie cilíndrica, abriéndola por las generatrices que pasan por los polos. Figura 31.

Constituye el sistema más importante para las cartas de navegación. Fue ideado por Mercator en 1569 y consiste en circunscribir a la Tierra en un cilindro tangente a lo largo del Ecuador en el que se representan los meridianos por generatrices, con lo que en el desarrollo del cilindro aparecen como líneas paralelas equidistantes una magnitud igual al arco del ecuador rectificado comprendido entre cada dos meridianos. La utilidad para la navegación estriba en que los navíos en el mar, al dirigirse de un punto a otro no siguen la línea más corta (línea ortodrómica) sino que describen la línea loxodrómica que corta a todos los meridianos bajo el mismo ángulo, con lo que se puede seguir un rumbo constante.

7.5.2. Proyección UTM

Constituye el sistema más importante para las cartas de navegación. Fue ideado por Mercator en 1569 y consiste en circunscribir a la Tierra en un cilindro tangente a lo largo del Ecuador en el que se representan los meridianos por generatrices, con lo que en el desarrollo del cilindro aparecen como líneas paralelas equidistantes una magnitud igual al arco del ecuador rectificado comprendido entre cada dos meridianos. La utilidad para la navegación estriba en que los navíos en el mar, al dirigirse de un punto a otro no siguen la línea más corta (línea ortodrómica) sino que describen la línea loxodrómica que corta a todos los meridianos bajo el mismo ángulo, con lo que se puede seguir un rumbo constante.

7.5.2. Proyección UTM

Se denomina también cilíndrica transversa conforme de Gauss, es muy utilizado (en él se representa el mapa de España). El UTM (Universal Transversal Mercatol) es una proyección cilíndrica, semejante a la de Mercator, si bien el cilindro se coloca transversalmente, es decir, con el eje sobre el Ecuador en lugar de coincidir con el de la Tierra. El cilindro tangente al elipsoide a lo largo de un meridiano tomado como origen y al desarrollar la superficie cilíndrica, abriéndola por las generatrices que pasan por los polos. Figura 31. P

7.5.1. Proyección cilíndrica conforme de Mercator Figura 32.

Podemos distinguir los siguientes sistemas de desarrollo: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


414


7.5.3. Proyección cónica conforme de Lambert

Figura 33. En este sistema se sustituye a la Tierra por una superficie cónica tangente a lo largo del paralelo central del levantamiento, al que se denomina paralelo de origen. El mapa queda constituido por el desarrollo de una superficie cónica y adoptará la forma de un sector circular cuyo radio es la generatriz del cono circunscrito. V

Figura 34.


415

TEMA

44 Semejanza y movimientos en el espacio




418



INTRODUCCIÓN

2.

TRANSFORMACIONES GEOMÉTRICAS EN EL ESPACIO EUCLÍDEO

3.

TRASLACIONES Y GIROS EN EL ESPACIO 3.1. Traslaciones 3.2. Giros

4.

SIMETRÍAS 4.1. Simetría especular o respecto a un plano 4.2. Simetría axial o respecto a una recta 4.3. Simetría central o respecto a un punto 4.4. Elementos de simetría de un cuerpo en el espacio

5.

COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS 5.1. Composición de dos simetrías especulares 5.2. Composición de dos simetrías axiales 5.3. Movimiento helicoidal. Composición de movimientos helicoidales 5.4. Composición de dos simetrías centrales 5.5. Composición de dos giros de distinto eje 5.6. Composición de traslación y giro

6.

EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL ESPACIO 6.1. Definición general de isometría en el espacio euclídeo 6.2. Isometrías directas e indirectas. Definición de movimiento en el espacio 6.3. Descomposición de una isometría en producto de simetrías especulares

7.

HOMOTECIA EN EL ESPACIO 7.1. Concepto de homotecia 7.2. Composición de homotecias 7.2.1. Caso de homotecias del mismo centro 7.2.2. Caso de homotecias de distinto centro 7.3. El grupo de las homotecias y las traslaciones

10.

ESTUDIO ANALÍTICO GENERAL DE LAS ISOMETRÍAS Y LAS SEMEJANZAS EN EL ESPACIO 10.1. Las isometrías en el espacio como caso particular de afinidades 10.2. Caracterización de isometrías por los puntos dobles 10.3. Ecuaciones generales de la homotecia y la semejanza ESTUDIO ANALÍTICO PARTICULAR DE ALGUNAS TRANSFORMACIONES 9.1. Ecuaciones de una traslación 9.2. Ecuaciones de un giro 9.3. Ecuaciones de un movimiento helicoidal 9.4. Ecuaciones de una simetría especular 9.5. Ecuaciones de una simetría central 9.6. Ecuaciones de una homotecia 9.7. Ecuaciones de una semejanza

9.

SEMEJANZA EN EL ESPACIO 8.1. Concepto de semejanza. Semejanza directa e indirecta 8.2. Propiedades fundamentales de la semejanza en el espacio 8.3. El grupo equiforme

8.

7.3.

HOMOTECIA EN EL ESPACIO 7.1. Concepto de homotecia 7.2. Composición de homotecias 7.2.1. Caso de homotecias del mismo centro 7.2.2. Caso de homotecias de distinto centro El grupo de las homotecias y las traslaciones

7.

EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL ESPACIO 6.1. Definición general de isometría en el espacio euclídeo 6.2. Isometrías directas e indirectas. Definición de movimiento en el espacio 6.3. Descomposición de una isometría en producto de simetrías especulares

6.

8.

SEMEJANZA EN EL ESPACIO 8.1. Concepto de semejanza. Semejanza directa e indirecta 8.2. Propiedades fundamentales de la semejanza en el espacio 8.3. El grupo equiforme

9.

ESTUDIO ANALÍTICO PARTICULAR DE ALGUNAS TRANSFORMACIONES 9.1. Ecuaciones de una traslación 9.2. Ecuaciones de un giro 9.3. Ecuaciones de un movimiento helicoidal 9.4. Ecuaciones de una simetría especular 9.5. Ecuaciones de una simetría central 9.6. Ecuaciones de una homotecia 9.7. Ecuaciones de una semejanza

COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS 5.1. Composición de dos simetrías especulares 5.2. Composición de dos simetrías axiales 5.3. Movimiento helicoidal. Composición de movimientos helicoidales 5.4. Composición de dos simetrías centrales 5.5. Composición de dos giros de distinto eje 5.6. Composición de traslación y giro

5.

SIMETRÍAS 4.1. Simetría especular o respecto a un plano 4.2. Simetría axial o respecto a una recta 4.3. Simetría central o respecto a un punto 4.4. Elementos de simetría de un cuerpo en el espacio

4.

10.

ESTUDIO ANALÍTICO GENERAL DE LAS ISOMETRÍAS Y LAS SEMEJANZAS EN EL ESPACIO 10.1. Las isometrías en el espacio como caso particular de afinidades 10.2. Caracterización de isometrías por los puntos dobles 10.3. Ecuaciones generales de la homotecia y la semejanza TRASLACIONES Y GIROS EN EL ESPACIO 3.1. Traslaciones 3.2. Giros

3.

TRANSFORMACIONES GEOMÉTRICAS EN EL ESPACIO EUCLÍDEO

2.

INTRODUCCIÓN

1.



418

Semejanza y movimientos en el espacio

1. INTRODUCCIÓN A modo de introducción valdría aquí casi todo lo expuesto en las introducciones a los temas 41 y 42 y en especial, una vez más, lo referente a la sistematización de las diferentes geometrías hecha por Klein en su Programa de Erlangen. Ciertamente el contenido del presente tema se apoya en lo estudiado para el plano. No obstante el “salto” al espacio posibilita la aparición de nuevas transformaciones tales como la simetría especular o los movimientos helicoidales. Hay algunas diferencias. Por ejemplo, en lo referente a la simetría central o con respecto a un punto, que en el plano es una isometría directa, mientras que en el espacio es inversa. Las homotecias en el plano son siempre directas, mientras que en el espacio las de razón negativa invierten la orientación de los tetraedros y son por tanto inversas. Los giros y las traslaciones del espacio se descomponen en productos de simetrías respecto de planos, lo mismo que se hizo con los giros y las traslaciones del plano en simetrías respecto de rectas. No obstante, en el espacio no se verifica que el producto de una traslación por giro o viceversa, sea un solo giro o una sola traslación. En efecto, cuando en el plano componíamos, por ejemplo, un giro con una traslación, tomábamos una recta r’ que pasase por el centro de giro y fuese perpendicular al vector de la traslación; esa recta siempre existe y era uno de los ejes de las dos simetrías en que se descompone el giro o la traslación. Para seguir el mismo método, si quisiéramos componer un giro con una traslación en el espacio, tendríamos que tomar un plano que pasando por el eje de giro fuese perpendicular al vector de la traslación; pero este plano no existe, salvo en el caso muy particular de que el vector de la traslación fuese perpendicular al eje de giro. En el espacio, las composiciones de giros y traslaciones dan como resultado transformaciones que, salvo casos particulares, no se reducen a un solo giro ni a una sola traslación: los movimientos helicoidales. Cabe hacer alguna precisión previa con respecto a qué se va a entender como movimiento en el espacio. Cuando estamos en el plano no plantea ningún problema el considerar “iguales” las figuras A y A ', en tanto que si bien no se pueden superponer haciéndolas coincidir, sin salirnos del plano, sí es posible hacerlo si “sacamos” una de ellas de dicho plano y la movemos en el espacio.

B

A

B´

A´

Figura 1. Ahora bien, ¿son iguales las figuras B y B' ? Es obvio que aunque tengan la misma forma y tamaño, no se pueden hacer coincidir “moviéndolas en el espacio”. Aunque algunos autores prefieran hablar de movimientos directos e inversos, aquí se ha optado por denominar movimientos a las isometrías directas. Las isometrías inversas, como por ejemplo la simetría especular, es en todo caso rotulable como “pseudomovimiento”. Lo que se pretende en este tema es abordar en el espacio las transformaciones geométricas ya tratadas en el plano. La semejanza es la transformación más general que se estudia y que engloba como casos particulares a las isometrías y homotecias, a partir de las que se define.

2. TRANSFORMACIONES GEOMÉTRICAS EN EL ESPACIO EUCLÍDEO Una transformación geométrica en el espacio es toda biyección f : E3 ® E3, siendo E3 el espacio euclídeo tridimensional. Dado un punto P Î E3, su imagen P '= f ( P) recibe el nombre de punto homólogo o transformado de P mediante la transformación f. TEMARIO DE MATEMÁTICAS. PRUEBA A

419


420


En particular la aplicación identidad i: E3 ® E3 es la transformación geométrica en la que el homólogo de cualquier punto es él mismo. Dadas dos transformaciones f y g, sabemos que la transformación producto o compuesta g o f se define de la siguiente manera: si un punto P se transforma en P' mediante f , y éste lo hace en P'' mediante g, entonces el homólogo de P mediante g o f es P''. Es decir:

La transformación geométrica Tur : E3 ® E3 que a cada punto P del espacio hace corresponder un punto r r homólogo P' tal queë PP 'û= u se denomina “traslación de vector u” r Tur ( P) = P ' Ûë PP 'û= u

3. TRASLACIONES Y GIROS EN EL ESPACIO 3.1. Traslaciones g

f E3

E3

E3

P

P´

P´´

Figura 3. A

Figura 2.

Nota: dos semiplanos (caras) con una recta (arista) común forman un ángulo diedro o simplemente un diedro. Denotaremos por (p1, AB , p 2) al diedro de arista orientada AB, y caras p1 y p 2. Si un observador situado sobre la arista, con los pies en A y la cabeza en B, ve la primera cara p1 a su derecha y la segunda p 2 a su izquierda, diremos que el diedro está orientado positivamente. En caso contrario, diremos que está orientado negativamente. En el caso de una transformación isogonal, diremos que es directa si conserva tanto la medida de los diedros como su orientación. En caso de que invierta la orientación, se denomina inversa.

g° f

( g o f ) ( P ) = g [ f ( P)] = g ( P ') = P ''

p2

La composición de transformaciones no es conmutativa. En general, las transformaciones g o f y f o g son distintas. Al definir una transformación geométrica f como una biyección, garantizamos la existencia de la transformación inversa o recíproca f -1 , que cumple f o f -1 = f -1 o f = i. Si la transformación directa asocia al punto P su homólogo P' , la inversa actúa asociando a P ' su antihomólogo o preimagen P. Vamos a dar a continuación algunas definiciones que se van a utilizar en el presente tema:

–

B

p1

+

Análogamente, si f conserva los ángulos recibe el nombre de transformación conforme o isogonal.

–

Si un punto P coincide con su homólogo, es decir f ( P) = P, decimos que se trata de un punto doble, fijo o invariante. Puede hablarse, en general, de figura invariante para una transformación f como aquella figura que se transforma en sí misma. Obviamente, una transformación en la que todos los puntos del plano son dobles no puede ser otra que la identidad i. a poner PQ = P 'Q ' .

Si una transformación f conserva las distancias se denomina transformación isométrica, o simplemente isometría. Esto es, si para cualesquiera dos puntos P y Q del plano se tiene: d ( P ,Q) = d ( f ( P) , f (Q)). Como manejaremos la métrica euclídea, lo anterior es equivalente

–


–

Si una transformación f conserva las distancias se denomina transformación isométrica, o simplemente isometría. Esto es, si para cualesquiera dos puntos P y Q del plano se tiene: d ( P ,Q) = d ( f ( P) , f (Q)). Como manejaremos la métrica euclídea, lo anterior es equivalente

–


–

Si un punto P coincide con su homólogo, es decir f ( P) = P, decimos que se trata de un punto doble, fijo o invariante. Puede hablarse, en general, de figura invariante para una transformación f como aquella figura que se transforma en sí misma. Obviamente, una transformación en la que todos los puntos del plano son dobles no puede ser otra que la identidad i.

–

a poner PQ = P 'Q ' .

–

Análogamente, si f conserva los ángulos recibe el nombre de transformación conforme o isogonal.

La composición de transformaciones no es conmutativa. En general, las transformaciones g o f y f o g son distintas. Al definir una transformación geométrica f como una biyección, garantizamos la existencia de la transformación inversa o recíproca f -1 , que cumple f o f -1 = f -1 o f = i. Si la transformación directa asocia al punto P su homólogo P' , la inversa actúa asociando a P' su antihomólogo o preimagen P. Vamos a dar a continuación algunas definiciones que se van a utilizar en el presente tema: p1

+

B

p2

Figura 2. A

Figura 3. P

P´

P´´

E3 f

E3

( g o f ) ( P ) = g [ f ( P)] = g ( P ') = P ''

3. TRASLACIONES Y GIROS EN EL ESPACIO 3.1. Traslaciones

E3

g° f

Nota: dos semiplanos (caras) con una recta (arista) común forman un ángulo diedro o simplemente un diedro. Denotaremos por (p1, AB , p 2) al diedro de arista orientada AB, y caras p1 y p 2. Si un observador situado sobre la arista, con los pies en A y la cabeza en B, ve la primera cara p1 a su derecha y la segunda p 2 a su izquierda, diremos que el diedro está orientado positivamente. En caso contrario, diremos que está orientado negativamente. En el caso de una transformación isogonal, diremos que es directa si conserva tanto la medida de los diedros como su orientación. En caso de que invierta la orientación, se denomina inversa.

g

En particular la aplicación identidad i: E3 ® E3 es la transformación geométrica en la que el homólogo de cualquier punto es él mismo. Dadas dos transformaciones f y g, sabemos que la transformación producto o compuesta g o f se define de la siguiente manera: si un punto P se transforma en P' mediante f , y éste lo hace en P'' mediante g, entonces el homólogo de P mediante g o f es P''. Es decir:

La transformación geométrica Tur : E3 ® E3 que a cada punto P del espacio hace corresponder un punto r r homólogo P' tal queë PP 'û= u se denomina “traslación de vector u” r Tur ( P) = P ' Ûë PP 'û= u CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


420


P'

Al igual que el plano, las traslaciones en elr espacio son biyecr ciones de E3 en sí mismo. En el caso trivial de u = 0, tendremos la

u

identidad (Tr0 = i)

Propiedad característica: “Para que una transformación geométrica T del espacio sea una traslación es condición necesaria y suficiente que el vector determinado por dos puntos cualesquiera sea equipolente al determinado por sus homólogos. Es decir, que para cualesquiera P y Q, se verifiqueë PQ û=ë P 'Q 'û, siendo P '= T ( P) y Q' = T (Q)”.

1. 2. 3. 4.

Q'

P Q Figura 4.

La demostración es la misma que para el plano (véase Tema 41, §3.2) También son consecuencias inmediatas: “Toda traslación es una transformación isométrica”. “En una traslación toda recta se transforma en otra recta paralela (distinta o coincidente con la dada)”. “En una traslación todo plano se transforma en otro plano paralelo (distinto o coincidente con el dado)”. “Toda traslación es una transformación isogonal directa”. En este enunciado resumimos que si A, B y C son tres puntos no alineados, entonces los homólogos A ', B ' y C ' tampoco está alineados y están situados en el mismo plano determinado por A, B y C, o en un plano paralelo, siendo Ð( AB , AC ) = Ð( A ' B ', A 'C ')

Además, una traslación transforma un diedro orientado en otro diedro de igual medida e igualmente orientado.

C

C´

B´

B

A

A´

Figura 5.

5. 6. 7. 8.

“En una traslación toda circunferencia se transforma en otra circunferencia del mismo radio, que tiene por centro el homólogo del centro y está situada en el mismo plano o en un plano paralelo ”. “La transformada de la recta tangente a una curva en un punto es la recta tangente a la nueva curva en el punto homólogo”. “La transformada de una superficie esférica es otra superficie esférica del mismo radio y de centro el homólogo del centro”. “La transformada del plano tangente a una superficie en un punto es el plano tangente a la superficie homóloga en el punto homólogo”.


421


422


El giro de eje e y ángulo p se llama simetría axial respecto del eje e.

–

Además, se verifica Ge ,j = Ge ,j+ 2kp ( k Î Z), y en particular Ge ,0o = Ge ,2kp = i (identidad).

–

Todo giro con respecto a un eje es una biyección de E3 en sí mismo.

–

Elementos invariantes La traslación Tr0 deja invariantes todos los puntos del plano, ya que se trata de la transformación identidad. r r En cambio, si u ¹ 0, para la traslación Tur no hay ningún punto doble o invariante. Sin embargo, cualquier recta paralela al vector que define la traslación es globalmente invariante (se transforma en ella misma), aunque no esté constituida por puntos dobles. Lo mismo ocurre con cualquier plano paralelo al vector de traslación. Observaciones:

3.

2.

Figura 7.

Ð(OP ,OP ') = j OP = OP '

P

El grupo de las traslaciones La composición de dos traslaciones Tur y Tvr cualesquiera es otra traslación definida por el vector suma. Es decir: Tvr o Tur = Tur+ vr . Como la adición de vectores en el espacio posee las mismas propiedades que en el plano, las traslaciones en el espacio constituyen también un grupo abeliano respecto de la composición, denominado grupo de las traslaciones del espacio (T ,o), que es isomorfo al grupo aditivo (V3 ,+).

r Sea una recta e, en la que tomamos un vector direccional v. Tendremos un eje de rotación orientado. Dado un punto P exterior a e y su proyección ortogonal O sobre la recta e, si el punto P describe una circunferencia de centro O, podemos establecer el sentido de la rotación mediante un convenio sencillo: el del avance del “tornillo” o “regla del sacacorchos”. Podemos definir ahora un giro de eje e y ángulo j como una transformación puntual, que denotaremos por e G , tal que a cada punto P asocia un homólogo P', cume ,j pliéndose: P´ 1. El punto P' está en el plano que contiene a P y es perO j pendicular a e, es decir, OPê y OP^ ' e

3.2. Giros

El estudio de los giros en el espacio se apoya también en el de los giros en el plano, aunque de forma no tan inmediata como las traslaciones. Figura 6. P´ P

P

P´

+

-

+

P´

P

P

P´

Figura 6. El estudio de los giros en el espacio se apoya también en el de los giros en el plano, aunque de forma no tan inmediata como las traslaciones.

r Sea una recta e, en la que tomamos un vector direccional v. Tendremos un eje de rotación orientado. Dado un punto P exterior a e y su proyección ortogonal O sobre la recta e, si el punto P describe una circunferencia de centro O, podemos establecer el sentido de la rotación mediante un convenio sencillo: el del avance del “tornillo” o “regla del sacacorchos”. Podemos definir ahora un giro de eje e y ángulo j como una transformación puntual, que denotaremos por e Ge ,j , tal que a cada punto P asocia un homólogo P', cumpliéndose: P´ 1. El punto P' está en el plano que contiene a P y es perO j pendicular a e, es decir, OPê y OP^ ' e

3.2. Giros

El grupo de las traslaciones La composición de dos traslaciones Tur y Tvr cualesquiera es otra traslación definida por el vector suma. Es decir: Tvr o Tur = Tur+ vr . Como la adición de vectores en el espacio posee las mismas propiedades que en el plano, las traslaciones en el espacio constituyen también un grupo abeliano respecto de la composición, denominado grupo de las traslaciones del espacio (T ,o), que es isomorfo al grupo aditivo (V3 ,+). 2.

3.

OP = OP '

P

Ð(OP ,OP ') = j

Elementos invariantes La traslación T0r deja invariantes todos los puntos del plano, ya que se trata de la transformación identidad. r r En cambio, si u ¹ 0, para la traslación Tur no hay ningún punto doble o invariante. Sin embargo, cualquier recta paralela al vector que define la traslación es globalmente invariante (se transforma en ella misma), aunque no esté constituida por puntos dobles. Lo mismo ocurre con cualquier plano paralelo al vector de traslación. Figura 7.

Observaciones:

Todo giro con respecto a un eje es una biyección de E3 en sí mismo.

–

Además, se verifica Ge ,j = Ge ,j+ 2kp ( k Î Z), y en particular Ge ,0o = Ge ,2kp = i (identidad).

–

El giro de eje e y ángulo p se llama simetría axial respecto del eje e.



422

–

Semejanza y movimientos en el espacio Son inmediatas las siguientes propiedades: 1.

“Todo giro en el espacio es una transformación isométrica (conserva la distancia)”.

2.

“Todo giro en el espacio es una transformación isogonal directa (conserva la medida de los ángulos y su orientación)”.

3.

“Todo giro en el espacio transforma puntos alineados en puntos alineados (conserva la alineación)”.

En consecuencia son fáciles de obtener las transformadas de las figuras elementales. Así pues, una recta, un plano, una circunferencia, una esfera, etc., se transforman mediante una rotación respecto de un eje en otra recta, otro plano, otra circunferencia, otra esfera, etc. Elementos invariantes En el caso particular de j = 2kp, se trata de la identidad, y obviamente en este caso todos los puntos del espacio son dobles. En caso de que j ¹ 2kp, los únicos puntos dobles son los que están situados sobre el eje de giro, que será por tanto una recta de puntos dobles. Cualquier plano perpendicular al eje es globalmente invariante, aunque no es un plano de puntos dobles. Lo mismo ocurre con cualquier circunferencia situada en un plano ortogonal al eje y centrada en un punto de éste. El grupo de los giros de un mismo eje Denotaremos por Ge al conjunto de todos los giros respecto al eje e. Es sencillo demostrar que “la composición de dos giros de eje e es otro giro del mismo eje y de ángulo suma” Supongamos que Ge ,a ( P) = P ' y Ge , b( P¢) = P¢¢. Por la propia definición de giro, la proyección ortogonal sobre e de P , P 'y P¢¢ es el mismo punto O, resultando además que los cuatro puntosO , P , P¢y P¢¢ están en el plano perpendicular por O al eje de giro. Se tiene ÐPOP¢¢ = ÐPOP¢+ÐP¢OP¢¢ = a + b, con lo que queda probado que Ge , b o Ge ,a = Ga+ b La asociatividad y la conmutatividad son inmediatas. El giro identidad Ge ,2kp = i es el elemento neutro y cada giro Ge ,j tiene su simétrico o inverso que es el de ángulo igual y de sentido contrario, esto es, el giro Ge ,-j . Por consiguiente ( Ge ,o) es un grupo abeliano.

4. SIMETRÍAS 4.1. Simetría especular o respecto a un plano Se define la simetría respecto de un plano p como una transformación geométrica que a cada punto P de E3 asocia un homólogo P¢ tal que p es el plano mediador del segmento PP¢. Tendremos por tanto (figura 8): PP¢^p

y

ë A¢O û=ë OA û

P'

P O

La transformación así definida es biyectiva y la denotaremos por S p . Resulta ser involutiva, esto es, inversa de sí misma, ya que S p2 = S p o S p = i, como es fácil de ver.


Figura 8.

423


424


Cabe hacer ahora una consideración con respecto a la orientación, al igual que ocurría con la simetría axial en el plano. Así por ejemplo, el tetraedro ABCD de la figura 11 y su transformado A¢B¢C ¢D¢, teniendo iguales sus aristas y sus caras están orientados de manera distinta. En efecto, un observador situado en el vértice D ve el triángulo ABC recorrido según sentido positivo u opuesto al de las agujas del reloj. Ocurre lo contrario con un observador en D¢ respecto del triángulo A¢B¢C ¢. Decimos que el tetraedro ABCD está orientado “a derechas” (dextrógiro) mientras que el A¢B¢C ¢D¢ lo está “a izquierdas” (levógiro). La simetría especular es, por tanto, una transformación isogonal inversa.

Las propiedades esenciales de la simetría especular en el espacio se justifican de modo similar a las de la simetría axial en el plano: 1. “La simetría especular conserva la alineación”. Es decir, transforma puntos alineados en puntos alineados y puntos no alineados en puntos no alineados. Por tanto, la figura transformada de una recta r es otra recta r'. a) Si r está contenida en el plano p, la recta homóloga es ella misma. b) Si r es paralela a p, entonces r y r¢ son paralelas. c) Si r es secante a p, la recta homóloga r¢ corta también a p en el mismo punto. Figura 11.

B

B'

A'

A

C

C'

D

D

r

r

p

p

En estos dos últimos casos el plano que contiene a r y r¢ es perpendicular a p (figura 9). “La simetría especular transforma puntos coplanarios en puntos coplanarios”. En efecto. Si X es un punto coplanario con los puntos no aliX C neados A,B,C podemos tomar el punto M de intersección de H las diagonales del cuadrilátero ABXC (figura 10). Al ser M A B un punto de las rectas AX y BC su simétrico M 'estará en las rectas A¢X ¢ y B¢C ¢, por lo que éstas rectas son secantes y por tanto coplanarias. El punto X ¢ está en ese plano, en el que también están A¢, B¢ y C ¢. La simetría especular es una transformación isométrica”. Todo segmento XY se transforma en otro segmento X ¢Y ¢ C' X' de igual longitud. En consecuencia, un triángulo se transforma en otro triángulo con los lados de igual medida que H ' B' A' los del triángulo de partida, y por lo tanto un ángulo en un ángulo igual. Asimismo, un tetraedro se transformaría en otro tetraedro con las aristas de igual longitud y la caFigura 10. ras iguales.

r'

r'

Figura 9.

2.

3.

3.

2.

En estos dos últimos casos el plano que contiene a r y r¢ es perpendicular a p (figura 9). “La simetría especular transforma puntos coplanarios en puntos coplanarios”. En efecto. Si X es un punto coplanario con los puntos no aliX C neados A,B,C podemos tomar el punto M de intersección de H las diagonales del cuadrilátero ABXC (figura 10). Al ser M A B un punto de las rectas AX y BC su simétrico M 'estará en las rectas A¢X ¢ y B¢C ¢, por lo que éstas rectas son secantes y por tanto coplanarias. El punto X ¢ está en ese plano, en el que también están A¢, B¢ y C ¢. La simetría especular es una transformación isométrica”. Todo segmento XY se transforma en otro segmento X ¢Y ¢ C' X' de igual longitud. En consecuencia, un triángulo se transforma en otro triángulo con los lados de igual medida que H ' B' A' los del triángulo de partida, y por lo tanto un ángulo en un ángulo igual. Asimismo, un tetraedro se transformaría en otro tetraedro con las aristas de igual longitud y la caFigura 10. ras iguales. Figura 9.

r'

r'

p

p

r

r

D

Cabe hacer ahora una consideración con respecto a la orientación, al igual que ocurría con la simetría axial en el plano. Así por ejemplo, el tetraedro ABCD de la figura 11 y su transformado A¢B¢C ¢D¢, teniendo iguales sus aristas y sus caras están orientados de manera distinta. En efecto, un observador situado en el vértice D ve el triángulo ABC recorrido según sentido positivo u opuesto al de las agujas del reloj. Ocurre lo contrario con un observador en D¢ respecto del triángulo A¢B¢C ¢. Decimos que el tetraedro ABCD está orientado “a derechas” (dextrógiro) mientras que el A¢B¢C ¢D¢ lo está “a izquierdas” (levógiro). La simetría especular es, por tanto, una transformación isogonal inversa.

D

Las propiedades esenciales de la simetría especular en el espacio se justifican de modo similar a las de la simetría axial en el plano: 1. “La simetría especular conserva la alineación”. Es decir, transforma puntos alineados en puntos alineados y puntos no alineados en puntos no alineados. Por tanto, la figura transformada de una recta r es otra recta r'. a) Si r está contenida en el plano p, la recta homóloga es ella misma. b) Si r es paralela a p, entonces r y r¢ son paralelas. c) Si r es secante a p, la recta homóloga r¢ corta también a p en el mismo punto. C'

A

A'

B'

B

Figura 11.

424



C

Semejanza y movimientos en el espacio En cuanto a los elementos invariantes por una simetría especular tenemos:

–

El plano de simetría p es un plano de puntos dobles y toda recta contenida en dicho plano es también una recta de puntos dobles.

–

Todos los planos y todas las rectas perpendiculares a p son globalmente dobles.

4.2. Simetría axial o respecto a una recta Una simetría axial de eje e es una transformación del espacio tal que a cada punto P hace corresponder un homólogo P¢ tal que e es la mediatriz del segmento PP¢. O sea: PP¢ê

Y

ë PM û=ë MP¢û

e Q

Q N

P M

Es evidente que esta transformación equivale a un giro de±180º respecto de la recta e. De ahí que también reciba el nombre de semigiro o transposición. La denotaremos por S e . Obviamente, cumplirá todas las propiedades esenciales del giro. Se tiene la particularidad de que es un transformación involutiva, o sea, inversa de sí misma. Aparte del eje, que es una recta de puntos dobles, como en cualquier giro, en una simetría axial cualquier plano que contiene al eje e y cualquier recta o plano perpendicular a dicho eje son globalmente invariantes.

P' Figura 12.

4.3. Simetría central o respecto a un punto Se denomina simetría central respecto de un punto O, a la transformación S O que a cada punto P del espacio asocia el punto P¢ tal que O es el punto medio del segmento PP¢, es decirë PO û=ë OP¢û(figura 13).

P H' Q

B'

D

O Q'

H

C

A'

O C'

A B

D'

P' Figura 13.

Son inmediatas las siguientes consecuencias:

–

La simetría central es una biyección de E3 en E3, siendo su inversa ella misma. Esto es, se trata de una transformación involutiva: S O2 = S O o S O = i.

–

El centro O es el único punto doble. Cualquier recta y cualquier plano que contengan a O son dobles considerados globalmente.

–

La simetría central es una isometría inversa. Es decir, conserva la distancia y la medida de los ángulos, pero invierte la orientación (figura 14).


425


426


4.4. Elementos de simetría de un cuerpo en el espacio –

e3

Una figura F tiene centro de simetría si existe un punto O, tal que mediante una simetría central de centro O la figura dada es homóloga de sí misma.

Resulta que el producto S p¢ o S p es la traslación de vector el doble del de la traslación que transforma el plano p en el p¢: S p¢ o S p = T2vr El producto anterior no es conmutativo pues al cambiar el orden de las simetrías cambia el sentido del vector.

–

O

e2

Igualmente si existe una recta e, de manera que la simetría axial S e transforma la figura dada en sí misma, diremos que e es un eje de simetría de F (figura 14).

Decimos que F tiene a p como plano de simetría si la simetría especular respecto a p deja a F invariante (figura 15).

ë XX ¢¢û=ë XX ¢û+ë X ¢X ¢¢û= 2ë MX ¢û+ 2ë X ¢M ¢û= 2(ë MX ¢û+ë X ¢M ¢û) = 2ë MM ¢û= 2vr –

e1

Sean S p y S p¢ las simetrías respecto los planos p y p¢. Caso de planos coincidentes. Si ambos planos son el mismo ya vimos que S p¢ o S p = S p o S p = i Caso de planos paralelos. Supongamos que p y p¢ son paralelos distintos. Dado un punto cualquiera X , sean M y M ¢ sus proyecciones ortogonales sobre ambos planos (figura 16). Entonces, llamando X ¢ = S p ( X ) y X ¢¢ = S p¢ ( X ¢), tendremos: Figura 14.

b) a)

p´

p

p´´

5.1. Composición de dos simetrías especulares En los epígrafes anteriores se han estudiado los casos particulares del producto de dos traslaciones y del producto de dos giros del mismo eje. Vamos a tratar aquí de estudiar otros casos de composición de isometrías. Figura 15.

5. COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS 5. COMPOSICIÓN DE GIROS, TRASLACIONES Y SIMETRÍAS En los epígrafes anteriores se han estudiado los casos particulares del producto de dos traslaciones y del producto de dos giros del mismo eje. Vamos a tratar aquí de estudiar otros casos de composición de isometrías. Figura 15.

5.1. Composición de dos simetrías especulares p´´

Sean S p y S p¢ las simetrías respecto los planos p y p¢. a) Caso de planos coincidentes. Si ambos planos son el mismo ya vimos que S p¢ o S p = S p o S p = i b) Caso de planos paralelos. Supongamos que p y p¢ son paralelos distintos. Dado un punto cualquiera X , sean M y M ¢ sus proyecciones ortogonales sobre ambos planos (figura 16). Entonces, llamando X ¢ = S p ( X ) y X ¢¢ = S p¢ ( X ¢), tendremos: ë XX ¢¢û=ë XX ¢û+ë X ¢X ¢¢û= 2ë MX ¢û+ 2ë X ¢M ¢û= 2(ë MX ¢û+ë X ¢M ¢û) = 2ë MM ¢û= 2vr p

p´

Figura 14.

–

e1

Decimos que F tiene a p como plano de simetría si la simetría especular respecto a p deja a F invariante (figura 15).

Resulta que el producto S p¢ o S p es la traslación de vector el doble del de la traslación que transforma el plano p en el p¢: S p¢ o S p = T2vr El producto anterior no es conmutativo pues al cambiar el orden de las simetrías cambia el sentido del vector. e2

forma la figura dada en sí misma, diremos que e es un eje de simetría de F (figura 14).

O

–

e3

–

Igualmente si existe una recta e, de manera que la simetría axial S e trans-

Una figura F tiene centro de simetría si existe un punto O, tal que mediante una simetría central de centro O la figura dada es homóloga de sí misma.

4.4. Elementos de simetría de un cuerpo en el espacio CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


426


e

v

X

p¢

X

O a

p

M M

X

r

Figura 16. c)

Figura 17.

Caso de planos secantes. Supongamos que los planos p y p¢ son secantes en una recta e y forman un ángulo a (figura 17). Par~ que contiene a X y es perpendicular a e, y el punto O en tiendo de un punto X, consideremos el plano p ~ de S y S , son las simetrías planas que dicho plano intersecta a e. Las restricciones sobre el plano p p¢ p ~ ~ ¢ ¢ respecto de r y r respectivamente, siendo r= p Ç p y r = p Ç p¢. Teniendo en cuenta lo estudiado ~ en el tema 41 para el plano, la restricción de S p¢ o S p sobre p será un giro de centro O y ángulo 2a. Luego hemos probado que: S p¢ o S p = Ge ,2a Los resultados recíprocos de los anteriores son ciertos: r maneras como producto de rdos – Toda traslación de vector 2v se puede descomponer de infinitas r simetrías respecto de dos planos, ambos perpendiculares a v y siendo la distancia entre ellos v .

–

Toda rotación de ángulo 2a alrededor de un eje e se puede descomponer de infinitas maneras como producto de dos simetrías respecto de dos planos secantes en la recta e y formando entre ellos un ángulo a.

Observación: En el caso particular de la composición de dos simetrías respecto a dos planos perpendiculares, resulta un giro de 180º respecto de la recta e intersección de ambos planos; esto es una simetría axial de eje e. Recíprocamente una simetría axial de eje e puede obtenerse de infinitas maneras como el producto de dos simetrías especulares respecto de sendos planos que se cortan perpendicularmente en la recta e. En este caso es S p¢ o S p = S p o S p¢ .

p X

X M e X

Figura 18.

5.2. Composición de dos simetrías axiales a) b)

Sean S e y S e¢ dos simetrías respecto a los ejes e y e¢. Caso de ejes coincidentes. Por ser involutiva la simetría axial, se tendrá S e¢ o S e = S e o S e = i. Caso de ejes paralelos. Si e y e¢ son paralelos, podemos tomar el plano p¢¢ que contiene a ambas rectas y los dos planos pr y p¢ perpendiculares a p¢¢ conteniendo respectivamente a e y e¢ (figura 19). El vector de traslación v que transforma la recta e en e¢ es el mismo que el de la traslación que transforma p en p¢. Entonces: S e¢ o S e = ( S p¢ o S p¢¢ ) o ( S p¢¢ o S p ) = S p¢ o ( S p¢¢ o S p¢¢ ) o S p ) = S p¢ o S p = T2vr 14243 identidad


427


428


Figura 22.

Figura 21.

Se obtiene una traslación de vector perpendicular a los dos ejes en el sentido del primero al segundo y de módulo el doble de la distancia entre ellos. p''

X'

e

e'

a

A

M

e'

v

e

e'

O

e A

N a

A

O

p

p''

X

X'

p'

p

X

p'

p p

Se obtiene una rotación de eje la perpendicular común por el punto de intersección de los dos ejes y ángulo el doble del que forman dichos ejes y orientado del primero al segundo.

X' '

X

identidad

S o S = ( S o S ) o ( S o S ) = S o ( S p¢¢ o S p¢¢ ) o S p ) = S p¢ o S p = G p,2a 14243 e¢

p¢

e

p¢¢

p¢¢

p

p¢

El producto anterior no es conmutativo pues al cambiar el orden de las simetrías cambia el sentido del vector. Caso de ejes secantes secantes. Supongamos que e y e¢ se cortan en un punto O formando un ángulo a. Sea p¢¢ el plano que contiene a ambas rectas y p y p¢ los dos planos perpendiculares a p¢¢ conteniendo respectivamente a e y e¢. Estos dos últimos, que también forman un ángulo a se cortan en la recta p perpendicular común por O a los ejes e y e¢ (figura 21). Entonces: Figura 20.

Figura 19.

Puede probarse de otra manera, siguiendo la figura 20. Dado un punto cualquiera X, sea X ¢ su simétrico respecto de e y sea X ¢¢ el simétrico de X ¢ respecto de e¢. Los tres puntos X, X ¢ y X ¢¢ están en un plano perpendicular a los ejes e y e' que intercepta con ellos sendos puntos M y M ¢. Entonces, por la definición de simetría axial se tiene: ë XX ¢¢û=ë XX ¢û+ë X ¢X ¢¢û= 2ë MX ¢û+ 2ë X ¢M ¢û= 2(ë MX ¢û+ë X ¢M ¢û) = 2ë MM ¢û= 2vr c)

ë XX ¢¢û=ë XX ¢û+ë X ¢X ¢¢û= 2ë MX ¢û+ 2ë X ¢M ¢û= 2(ë MX ¢û+ë X ¢M ¢û) = 2ë MM ¢û= 2vr

El producto anterior no es conmutativo pues al cambiar el orden de las simetrías cambia el sentido del vector. Caso de ejes secantes secantes. Supongamos que e y e¢ se cortan en un punto O formando un ángulo a. Sea p¢¢ el plano que contiene a ambas rectas y p y p¢ los dos planos perpendiculares a p¢¢ conteniendo respectivamente a e y e¢. Estos dos últimos, que también forman un ángulo a se cortan en la recta p perpendicular común por O a los ejes e y e¢ (figura 21). Entonces:

Puede probarse de otra manera, siguiendo la figura 20. Dado un punto cualquiera X, sea X ¢ su simétrico respecto de e y sea X ¢¢ el simétrico de X ¢ respecto de e¢. Los tres puntos X, X ¢ y X ¢¢ están en un plano perpendicular a los ejes e y e' que intercepta con ellos sendos puntos M y M ¢. Entonces, por la definición de simetría axial se tiene: Figura 19.

c)

Figura 20.

S e¢ o S e = ( S p¢ o S p¢¢ ) o ( S p¢¢ o S p ) = S p¢ o ( S p¢¢ o S p¢¢ ) o S p ) = S p¢ o S p = G p,2a 14243 identidad

Se obtiene una rotación de eje la perpendicular común por el punto de intersección de los dos ejes y ángulo el doble del que forman dichos ejes y orientado del primero al segundo.

X

X' '

p

p

p'

p'

p

X

X'

X

p''

p

O

e

M

A

e' e

A

a

N

e

e'

p''

a

e'

v

O

A

X'

Se obtiene una traslación de vector perpendicular a los dos ejes en el sentido del primero al segundo y de módulo el doble de la distancia entre ellos. 428

Figura 22.



Figura 21.

Semejanza y movimientos en el espacio También podemos justificar lo anterior a partir de la figura 22. Dado un punto cualquiera X, sea X ¢ su simétrico respecto de e y sea X ¢¢ el simétrico de X ¢ respecto de e'. Consideremos también las proyecciones ortogonales A, A¢ y A¢¢ de los puntos X, X ¢ y X ¢¢ sobre el plano p determinado por los ejes e y e¢. Por la simetría respecto a e: MX = MX ¢, MA = MA¢, AX = A¢X ¢, OA = OA¢, ÐAOM = ÐMOA¢ Por la simetría respecto a e¢: NX ¢ = NX ¢¢, NA¢ = NA¢¢, A¢X ¢ = A¢¢X ¢¢, OA¢ = OA¢¢, ÐA¢ON = ÐNOA¢¢ Resulta: A¢X ¢ = A¢¢X ¢¢, OA = OA¢¢ ÐAOA¢¢ = ÐAOA¢+ÐA¢OA¢¢ = 2ÐMOA¢+ 2ÐA¢ON = = 2(ÐMOA¢+ÐA¢ON ) = 2ÐMON = 2a

d)

lo que prueba que X ¢¢ es el homólogo de X en un giro de eje p y ángulo el doble del que forman los ejes e y e¢. Recíprocamente a lo obtenido en b) y c), se verifica que: “Toda traslación puede descomponerse de manera no única en producto de dos simetrías axiales respecto de dos rectas paralelas y todo giro en producto de dos simetrías axiales de ejes concurrentes”. Caso de ejes que se cruzan. Si e y e¢ se cruzan tracemos la perpendicular común p cortando a ambas rectas en sendos puntos O y O¢. Sea la recta r paralela a e¢ pasando por O, esto es, la recta r será la proyección ortogonal de e'sobre el plano paralelo a e¢ que contiene a e (figura 23).

p

A'

e'

p

O'

2d

r

d a

e

O

A Figura 23.

Figura 24.

La distancia entre las rectas paralelas r y e¢ es la mínima distancia entre e y e¢, es decir, el módulo del r vector d =ë OO¢û. Las rectas r y e son secantes formando una ángulo a. Resulta: S e¢ o S e = S e¢ o ( S r o S r ) o S e = ( S e¢ o S r ) o ( S r o S e ) = T2dr o G p.,2a 1424 3 identidad

es decir, el producto de un giro por una traslación de vector paralelo al eje del giro.

5.3. Movimiento helicoidal. Composición de dos movimientos helicoidales r La composición de un giro de ángulo a respecto de un eje e con una traslación rde vector v paralelo al eje del giro recibe el nombre de movimiento helicoidal de eje e, ángulo a y vector v.


429


430


r r Los giros y las traslaciones son los casos particulares de movimiento helicoidal cuando v = 0 y cuando a = 0 respectivamente. Según se vio antes, el producto de dos simetrías respecto de dos ejes que se cruzan es un movimiento helicoidal. Recíprocamente, todo movimiento helicoidal puede descomponerse de infinitas maneras en producto de dos simetrías axiales. Podemos probar también que la composición de dos movimientos helicoidales da otro movimiento helicoidal. r En efecto, sea el primero un movimiento helicoidal H de eje p, ángulo a y vector a y el segundo H ¢ de r eje p¢, ángulo a¢ y vector a¢, tomemos la recta e¢ perpendicular común a p y p¢, a los que corta en O y O¢ respectivamente. identidad

Ge¢ , b o Ge ,a = ( S p¢ o S p¢¢ ) o ( S p¢¢ o S p ) = S p¢ o ( S p¢¢ o S p¢¢ ) o S p = S p¢ o S p 14243

En el caso de composición de dos giros del mismo eje ya se vio que resulta otro giro del mismo eje y ángulo suma, o sea: Ge , b o Ge ,a = Ga+ b. Vamos a estudiar ahora otros casos. a) Caso de ejes paralelos. Consideremos el plano p¢¢que contiene a ambos ejes e y e¢. Seguidamente elegimos dos planos p y p¢conteniendo a los ejes e y e¢ respectivamente, de manera queGe¢ , b = S p¢ o S p¢¢ yGe ,a = S p¢¢ o S p (figura 27). Entonces

5.5. Composición de dos giros de distinto eje

p'

e'

Elegimos ahora una recta e que se cruce con e¢, forme con ella un r ángulo a 2 y diste de ella a¢ 2 y será entonces H = S e¢ o S e Análogamente tomamos la recta e¢¢rtal que el ángulo que forma e¢ con ella sea a¢ 2 y la distancia entre ellas a¢ 2. Se verifica H ¢ = S e¢¢ o S e¢ . Componiendo tenemos:

Obviamente el producto no es conmutativo, ya que al cambiar el orden en que se componen las simetrías cambia el sentido del vector de la traslación resultante. e''

a'/2

S O¢ o S O = T2[ OO¢ ] p

Resulta que la composición de dos simetrías centrales da una traslación de vector doble del que une los centros de las simetrías dadas. Es decir:

H ¢ o H = ( S e¢¢ o S e¢ ) o ( S e¢ o S e ) = S e¢¢ o ( S e¢ o S e¢ ) o S e = S e¢¢ o S e 1424 3

a /2

X ''

e

Figura 26. identidad

X

Como vemos, resulta el producto de dos simetrías axiales y, por tanto, un movimiento helicoidal. Este quedará reducido a un giro o a una traslación si las rectas e'' y e se cortan o son paralelas.

[ XX ¢¢] = [ XX ¢]+[ X ¢X ¢¢]= 2[OX ¢]+ 2[ X ¢O¢] = = 2 ([OX ¢]+[ X ¢O¢]) = 2[OO¢] Figura 25.

O'

5.4. Composición de dos simetrías centrales

O

Sean S O y S O¢ las simetrías respecto a los puntos O y O¢. Dado un punto cualquiera X del espacio, si S O ( X ) = X ¢ y S O¢ ( X ¢) = X ¢¢, se verifica:

X'

Sean S O y S O¢ las simetrías respecto a los puntos O y O¢. Dado un punto cualquiera X del espacio, si S O ( X ) = X ¢ y S O¢ ( X ¢) = X ¢¢, se verifica:

X'

5.4. Composición de dos simetrías centrales

[ XX ¢¢] = [ XX ¢]+[ X ¢X ¢¢]= 2[OX ¢]+ 2[ X ¢O¢] =

Como vemos, resulta el producto de dos simetrías axiales y, por tanto, un movimiento helicoidal. Este quedará reducido a un giro o a una traslación si las rectas e'' y e se cortan o son paralelas.

O

O'

=2

([OX ¢]+[ X ¢O¢]) = 2[OO¢]

Figura 25.

a /2

Resulta que la composición de dos simetrías centrales da X X '' una traslación de vector doble del que une los centros de las simetrías dadas. Es decir: Figura 26. S O¢ o S O = T2[ OO¢ ] Obviamente el producto no es conmutativo, ya que al cambiar el orden en que se componen las simetrías cambia el sentido del vector de la traslación resultante. identidad

p

a'/2

e

e''

H = S e¢ o S e Análogamente tomamos la recta e¢¢rtal que el ángulo que forma e¢ con ella sea a¢ 2 y la distancia entre ellas a¢ 2. Se verifica H ¢ = S e¢¢ o S e¢ . Componiendo tenemos: H ¢ o H = ( S e¢¢ o S e¢ ) o ( S e¢ o S e ) = S e¢¢ o ( S e¢ o S e¢ ) o S e = S e¢¢ o S e 1424 3

r r Los giros y las traslaciones son los casos particulares de movimiento helicoidal cuando v = 0 y cuando a = 0 respectivamente. Según se vio antes, el producto de dos simetrías respecto de dos ejes que se cruzan es un movimiento helicoidal. Recíprocamente, todo movimiento helicoidal puede descomponerse de infinitas maneras en producto de dos simetrías axiales. Podemos probar también que la composición de dos movimientos helicoidales da otro movimiento helicoidal. r En efecto, sea el primero un movimiento helicoidal H de eje p, ángulo a y vector a y el segundo H ¢ de r eje p¢, ángulo a¢ y vector a¢, tomemos la recta e¢ perpendicular común a p y p¢, a los que corta en O y O¢ respectivamente. Elegimos ahora una recta e que se cruce con e¢, forme con ella un r ¢ y será entonces y diste de ella ángulo a 2 a 2 p' e'

5.5. Composición de dos giros de distinto eje

En el caso de composición de dos giros del mismo eje ya se vio que resulta otro giro del mismo eje y ángulo suma, o sea: Ge , b o Ge ,a = Ga+ b. Vamos a estudiar ahora otros casos. a) Caso de ejes paralelos. Consideremos el plano p¢¢que contiene a ambos ejes e y e¢. Seguidamente elegimos dos planos p y p¢conteniendo a los ejes e y e¢ respectivamente, de manera queGe¢ , b = S p¢ o S p¢¢ yGe ,a = S p¢¢ o S p (figura 27). Entonces Ge¢ , b o Ge ,a = ( S p¢ o S p¢¢ ) o ( S p¢¢ o S p ) = S p¢ o ( S p¢¢ o S p¢¢ ) o S p = S p¢ o S p 14243 identidad

430



Semejanza y movimientos en el espacio Si los planos p y p¢ no son paralelos, entonces S p¢ o S p es un giro de eje e¢¢, con la orientación que se observa en la figura 27 y ángulo d. Del triángulo æa bö d DAA¢A¢¢ se desprende = 180º-ç + ÷, es deè 2 2ø 2 cir d = 360º-( a + b) = -( a + b). Cambiando de sentido el eje e¢¢ podemos tomar como ángulo a + b. a b En particular, si + = 180º es p¢ paralelo a p 2 2 y el resultado anterior equivale a una traslación de vector doble del de la traslación que transforma p y p¢. Concluimos que: “El producto de dos giros de ejes paralelos es un giro o una traslación”. b)

e

e''

d 2

A

A' '

e'

A' b 2

Figura 27.

Caso de ejes secantes. Si los ejes e y e¢ se cortan en un punto O, trazamos las siguientes rectas que pasan por O (figura 28):

– –

-a/2

r¢¢perpendicular común a e y e¢.

r

r'' b/2 r'

r que resulta de girar r¢¢ alrededor de e un ángulo-a 2 (es perpendicular a e).

r¢ que resulta de girar r¢¢ alrededor de e¢ un ángulo b 2 (es perpendicular a e¢). Teniendo en cuenta que todo giro se puede descomponer en producto de dos simetrías axiales y que la simetría axial es involutiva, llegamos a:

–

O e

p

Ge¢ , b o Ge ,a = ( S r¢ o S r¢¢ ) o ( S r¢¢ o S r ) =

e'

Figura 28.

= S r¢ o ( S r¢¢ o S r¢¢ ) o S r = S r¢ o S r 14243 identidad

c)

Según se vio, el producto S r¢ o S r es un producto de simetrías axiales de ejes secantes y resulta ser un giro de un eje p perpendicular por O a r y r¢. Luego, “el producto de dos giros de ejes concurrentes en un punto es otro giro de eje también concurrente en ese punto”. r' Caso de ejes que se cruzan. r r'' Al igual que antes se trazan

– –

r¢¢ perpendicular común a e y e¢.

O'

r que resulta de girar r¢¢ alrededor de e un ángulo -a 2 (es perpendicular a e).

r¢ que resulta de girar r¢¢ alrededor de e¢ un ángulo b 2 (es perpendicular a e¢). Las rectas r y r¢ se cruzan, pues de lo contrario serían coplanarias y las e y e¢ por ser perpendiculares a su plano serían paralelas, en contra de lo supuesto. Igual que antes tenemos

e'

–

O e Figura 29.

Ge¢ , b o Ge ,a = ( S r¢ o S r¢¢ ) o ( S r¢¢ o S r ) = S r¢ o ( S r¢¢ o S r¢¢ ) o S r = S r¢ o S r 14243 identidad


431


432


Como sabemos, la composición de dos simetrías axiales cuyos ejes se cruzan es el producto de una traslación por un giro, o lo que es lo mismo, un movimiento helicoidal. Por tanto: “el producto de dos giros cuyos ejes se cruzan es un movimiento helicoidal”. YZ = XZ - XY = ( XZ - XY )×( XZ - XY ) = XZ - 2 XY × XZ + XY 2

2

2

2

De la igualdad YZ = XZ - XY se deduce :

En efecto, llamemos X ¢ = f ( X ) , Y ¢ = f (Y ) , Z¢ = f ( Z). e

“Si f es una isometría, entonces conserva el producto escalar. O sea, para cualesquiera X ,Y , Z Î E3 se cumple XY × XZ = f ( X ) f (Y ) × f ( X ) f ( Z)”.


Sea la traslación Tvr y el giro Ge ,a . Consideremos un plano p perpendicular al eje del giro y sea O el punto de corte de ambos. Sea p¢ el plano que contiene a O y es perpendicular al vector de la traslación. Tomaremos las rectas siguientes.

v

Proposición:

Veamos ahora que la definición anterior implica la conservación del producto escalar, y como consecuencia los ángulos. O

r¢¢ recta intersección de los planos p y p¢.

– –

r recta que resulta de aplicar a r¢¢ la traslación: T– vr 2.

–

r¢ recta que resulta de aplicar a r¢¢ el giro Ge ,a 2.

Nota: ni que decir tiene que en la definición anterior nos referimos a distancia asociada a la norma euclídea, es decir d ( X ,Y ) = XY .

a/2

r'

Definición: Se dice que una aplicación f : E3 ® E3 es una isometría si conserva la distancia, es decir, si para cualesquiera dos puntos X ,Y Î E3 se verifica d ( X ,Y ) = d ( f ( X ) , f (Y )). r''

Entonces:

Ge ,a o Tvr = ( S r¢ o S r¢¢ ) o ( S r¢¢ o S r ) =

r

= S r¢ o ( S r¢¢ o S r¢¢ ) o S r = S r¢ o S r 14243

6. EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL ESPACIO 6.1. Definición general de isometría en el espacio euclídeo Figura 30.

identidad

Resulta un movimiento helicoidal ya que la composición de simetrías axiales S r¢ o S r es una traslación si r y r¢ son paralelos, un giro si r y r¢ se cortan y un movimiento helicoidal propiamente dicho si r y r¢ se cruzan. Análogamente, si tomamos como r y r¢ la que resultan respectivamente de someter a r¢¢ a la traslación Tvr 2 y al giro Ge ,-a 2 , entonces será:

En cualquier caso podemos concluir: “la composición de traslaciones y giros en el espacio da como resultado movimientos helicoidales”. Tvr o Ge ,a = ( S r o S r¢¢ ) o ( S r¢¢ o S r¢ ) = S r o ( S r¢¢ o S r¢¢ ) o S r¢ = S r o S r¢ 14243 identidad

Tvr o Ge ,a = ( S r o S r¢¢ ) o ( S r¢¢ o S r¢ ) = S r o ( S r¢¢ o S r¢¢ ) o S r¢ = S r o S r¢ 14243 identidad

Resulta un movimiento helicoidal ya que la composición de simetrías axiales S r¢ o S r es una traslación si r y r¢ son paralelos, un giro si r y r¢ se cortan y un movimiento helicoidal propiamente dicho si r y r¢ se cruzan. Análogamente, si tomamos como r y r¢ la que resultan respectivamente de someter a r¢¢ a la traslación Tvr 2 y al giro Ge ,-a 2 , entonces será:

En cualquier caso podemos concluir: “la composición de traslaciones y giros en el espacio da como resultado movimientos helicoidales”.

6. EL GRUPO DE LAS ISOMETRÍAS Y EL SUBGRUPO DE LOS MOVIMIENTOS EN EL ESPACIO 6.1. Definición general de isometría en el espacio euclídeo identidad

= S r¢ o ( S r¢¢ o S r¢¢ ) o S r = S r¢ o S r 14243

Figura 30.

Ge ,a o Tvr = ( S r¢ o S r¢¢ ) o ( S r¢¢ o S r ) =

Definición: Se dice que una aplicación f : E3 ® E3 es una isometría si conserva la distancia, es decir, si para cualesquiera dos puntos X ,Y Î E3 se verifica d ( X ,Y ) = d ( f ( X ) , f (Y )). r

Entonces:

r''

r¢ recta que resulta de aplicar a r¢¢ el giro Ge ,a 2.

–

r recta que resulta de aplicar a r¢¢ la traslación: T– vr 2.

– –

a/2

r'

Nota: ni que decir tiene que en la definición anterior nos referimos a distancia asociada a la norma euclídea, es decir d ( X ,Y ) = XY . r¢¢ recta intersección de los planos p y p¢.

O

Veamos ahora que la definición anterior implica la conservación del producto escalar, y como consecuencia los ángulos. Sea la traslación Tvr y el giro Ge ,a . Consideremos un plano p perpendicular al eje del giro y sea O el punto de corte de ambos. Sea p¢ el plano que contiene a O y es perpendicular al vector de la traslación. Tomaremos las rectas siguientes.

Proposición:

“Si f es una isometría, entonces conserva el producto escalar. O sea, para cualesquiera X ,Y , Z Î E3 se cumple XY × XZ = f ( X ) f (Y ) × f ( X ) f ( Z)”.

v


e

En efecto, llamemos X ¢ = f ( X ) , Y ¢ = f (Y ) , Z¢ = f ( Z). De la igualdad YZ = XZ - XY se deduce :

Como sabemos, la composición de dos simetrías axiales cuyos ejes se cruzan es el producto de una traslación por un giro, o lo que es lo mismo, un movimiento helicoidal. Por tanto: “el producto de dos giros cuyos ejes se cruzan es un movimiento helicoidal”. YZ = XZ - XY = ( XZ - XY )×( XZ - XY ) = XZ - 2 XY × XZ + XY

432

2

2

2



2

Semejanza y movimientos en el espacio y de aquí: 2 1 2 2 XY × XY = é XZ + XY - YZ ù ë û 2

[1]

2 2 2 1 X ¢Y ¢× X ¢Y ¢ = é X ¢Z¢ + X ¢Y ¢ - Y ¢Z¢ ù ë û 2

[2]

Análogamente

La igualdad de los segundos miembros de [1] y [ 2] es inmediata consecuencia de la definición de isometría, pues: 2

XZ = d ( X , Z) = d ( X ¢, Z¢) = X ¢Z¢ 2

2

XY = d ( X ,Y ) = d ( X ¢,Y ¢) = X ¢Y ¢ 2

YZ = d (Y , Z) = d (Y ¢, Z¢) = Y ¢Z¢

2

2

Concluyendo que XY × XZ = X ¢Y ¢× X ¢Z¢. De la proposición anterior, a su vez, se deduce la conservación de los ángulos. Proposición: “Si f es una isometría, entonces conserva los ángulos. O sea, para cualesquiera X ,Y , Z Î E3 se cumple Ð( XY , XZ) = Ð f ( X ) f (Y ) , f ( X ) f ( Z) ”.

(

) En efecto, llamando q = Ð( XY , XZ) y q¢ = Ð( f ( X ) f (Y ) , f ( X ) f ( Z)), se tendrá: cos q =

XY × XZ XY × XZ

=

X ¢Y ¢× X ¢Z¢ X ¢Y ¢ × X ¢Z¢

= cos q¢

Luego q¢ = ±q + 2kp. Prescindiendo del número entero de vueltas, podemos poner q¢ = ±q, con lo que se conserva el módulo del ángulo pudiendo cambiar el sentido u orientación.

6.2. Isometrías directas e indirectas. Definición de movimiento en el espacio Todas las transformaciones estudiadas hasta ahora, es decir, las traslaciones, los giros y las simetrías, son isometrías. Las traslaciones, los giros y las simetrías axiales conservan además el sentido de los ángulos y la orientación de los tetraedros. Se denominan isometrías directas. En cambio, la simetría central y la simetría especular invierten el sentido y la orientación. Son, por lo tanto, isometrías inversas. Denotaremos por Isom( E3) al conjunto de todas las isometrías del espacio. Es fácil verificar que ( Isom E3) es estable o cerrado para la composición. Es decir, si f , g Î Isom( E3) será g o f Î Isom( E3), pues por definición de isometría, para cualesquiera dos puntos X e Y se verifica:

d (( g o f )( X ) ,( g o f )(Y )) = d (g ( f ( X )) , g ( f (Y )) = d ( f ( X ) , f (QY )) = d ( X ,Y )

La identidad i: E3 ® E3 es obviamente una isometría. Toda isometría f, al ser una biyección, tiene una transformación inversa f -1 que es otra isometría. Esto último se prueba fácilmente, pues dados dos puntos X ¢ e Y ¢, existen X = f -1( X ¢) e Y = f -1(Y ¢), para los cuales, por ser f isometría, tendremos d ( f ( X ) , f (Y )) = d ( X ,Y ), y de aquí d ( f ( f -1( X ¢)) , f ( f -1(Y ¢))) = = d ( f -1( X ¢) , f -1(Y )) de donde d ( X ¢,Y ¢) = d ( f -1( X ¢) , f -1(Y ¢)).


433


434


Así pues, tenemos el grupo no abeliano (Isom( E3) o) de las isometrías del espacio. identidad

Ge ,a o S n = ( S p¢ o S p ) o S p = S p¢ o ( S p o S p ) = S p¢ 1424 3

Asimismo, vamos a denotar por Isom+ ( E3) y Isom-( E3) a los subconjuntos de Isom( E3) formados por las isometrías directas y las isometrías inversas, respectivamente. Se tendrá: + ì ïIsom( E3) = Isom ( E3) È Isom ( E3) í ïIsom+ ( E3) Ç Isom-( E3) = Æ î

Es interesante reducir una isometría a la composición de un número mínimo de simetrías axiales. Por ejemplo: La composición de una simetría respecto de un plano por un giro respecto de un eje contenido en dicho plano se reduce a una sola una simetría respecto de un plano que pasa por el eje de giro. En efecto, sea el plano p¢ que contiene a e y forma con p un ángulo a 2. Entonces S p¢ o S p = Ge ,a, de donde:

Figura 32.

Se tiene que Isom+ ( E3) es estable para la composición, ya que si dos isometrías conservan la orientación, el producto de ambas también la conservará. Sin embargo, no podemos decir lo mismo para Isom-( E3), ya que si f , g Î Isom-( E3) es obvio que g o f Î Isom+ ( E3). p

movimiento

p'

f=S

pn

oS

p n-1

p3

p2

oKo S o S

p1

oS =S

pn

o (S p n-1 oKo S p3 o S p 2 ) 144424443

Definiremos un movimiento en el espacio como una isometría directa. El subgrupo de los movimientos (Isom+ ( E3) o) está constituido por las traslaciones, los giros y las composiciones de giros y traslaciones o viceversa; esto es, lo que antes habíamos llamado los movimientos helicoidales. A su vez el conjunto de las traslaciones y el conjunto de los giros de un mismo eje son subgrupos del de los movimientos. El resto de las isometrías son las isometrías inversas o negativas (algunos autores las denominan también movimientos inversos).

a/2

o bien

movimiento

f=S

pn

oS

p n-1

oKo S

p3

oS

p2

o S = (S p n o S p n-1 oKo S p3 o S p 2 ) o S p1 1444442444443 p1

Si n es par la isometría es directa, o sea, un movimiento. Si n es impar tendremos una isometría inversa, que será el resultado de componer un movimiento con una simetría especular o viceversa, pues

e

f = S p o S p n-1 oKo S p3 o S p 2 o S p1

Figura 31.

6.3. Descomposición de una isometría en producto de simetrías especulares En definitiva, cualquier f Î Isom( E3) puede ponerse

Vimos antes que cualquier traslación y cualquier giro se pueden descomponer en producto de dos simetrías especulares. En particular, una simetría axial es un giro de ángulo±180º, y puede descomponerse en dos simetrías respecto de planos perpendiculares. Igualmente, un simetría central se puede descomponer en producto de tres simetrías especulares, tomando tres planos perpendiculares dos a dos y cuya intersección sea el centro de la simetría (figura 31). Resulta, por tanto, que cualquier composición de un número finito de traslaciones, giros y simetrías se puede considerar como la composición de un número finito de simetrías respecto a planos. X ''

X'''

X'

X'

X

X

X'''

Vimos antes que cualquier traslación y cualquier giro se pueden descomponer en producto de dos simetrías especulares. En particular, una simetría axial es un giro de ángulo±180º, y puede descomponerse en dos simetrías respecto de planos perpendiculares. Igualmente, un simetría central se puede descomponer en producto de tres simetrías especulares, tomando tres planos perpendiculares dos a dos y cuya intersección sea el centro de la simetría (figura 31). Resulta, por tanto, que cualquier composición de un número finito de traslaciones, giros y simetrías se puede considerar como la composición de un número finito de simetrías respecto a planos. X ''

En definitiva, cualquier f Î Isom( E3) puede ponerse

6.3. Descomposición de una isometría en producto de simetrías especulares Figura 31.

f = S p o S p n-1 oKo S p3 o S p 2 o S p1 Si n es par la isometría es directa, o sea, un movimiento. Si n es impar tendremos una isometría inversa, que será el resultado de componer un movimiento con una simetría especular o viceversa, pues

Definiremos un movimiento en el espacio como una isometría directa. El subgrupo de los movimientos (Isom+ ( E3) o) está constituido por las traslaciones, los giros y las composiciones de giros y traslaciones o viceversa; esto es, lo que antes habíamos llamado los movimientos helicoidales. A su vez el conjunto de las traslaciones y el conjunto de los giros de un mismo eje son subgrupos del de los movimientos. El resto de las isometrías son las isometrías inversas o negativas (algunos autores las denominan también movimientos inversos). e

f = S p n o S p n-1 oKo S p3 o S p 2 o S p1 = (S p n o S p n-1 oKo S p3 o S p 2 ) o S p1 1444442444443 movimiento

a/2

o bien

p'

p

f = S p n o S p n-1 oKo S p3 o S p 2 o S p1 = S p n o (S p n-1 oKo S p3 o S p 2 ) 144424443

Se tiene que Isom+ ( E3) es estable para la composición, ya que si dos isometrías conservan la orientación, el producto de ambas también la conservará. Sin embargo, no podemos decir lo mismo para Isom-( E3), ya que si f , g Î Isom-( E3) es obvio que g o f Î Isom+ ( E3). movimiento

Es interesante reducir una isometría a la composición de un número mínimo de simetrías axiales. Por ejemplo: La composición de una simetría respecto de un plano por un giro respecto de un eje contenido en dicho plano se reduce a una sola una simetría respecto de un plano que pasa por el eje de giro. En efecto, sea el plano p¢ que contiene a e y forma con p un ángulo a 2. Entonces S p¢ o S p = Ge ,a, de donde:

Asimismo, vamos a denotar por Isom+ ( E3) y Isom-( E3) a los subconjuntos de Isom( E3) formados por las isometrías directas y las isometrías inversas, respectivamente. Se tendrá: ìIsom( E3) = Isom+ ( E3) È Isom-( E3) ï í ïIsom+ ( E3) Ç Isom-( E3) = Æ î Figura 32.

Ge ,a o S n = ( S p¢ o S p ) o S p = S p¢ o ( S p o S p ) = S p¢ 1424 3

Así pues, tenemos el grupo no abeliano (Isom( E3) o) de las isometrías del espacio. identidad



434


7. HOMOTECIA EN EL ESPACIO 7.1. Concepto de homotecia Se define igual que en el plano (ver tema 42). Así pues, dado un punto O del espacio y k un número real ( k ¹ 0), se llama homotecia de centro O y razón k, que denotaremos por H O ,k , a la transformación del espacio euclídeo E3 en sí mismo, que transforma cada punto P en un homólogo P¢ tal queë OP¢û= kë OP û. Escribimos, pues H O ,k ( P) = P¢, y decimos que P¢ es homotético de P. En particular , si k =1 la homotecia se reduce a la identidad i, y si k = -1 a la simetría de centro O. Respecto a los elementos invariantes tenemos:

– –

Si k =1, obviamente todos los puntos son dobles. Si k ¹ 1entonces el único punto doble es O y los únicos planos y rectas dobles son los que contienen a O.

Al ser las propiedades de los vectores del espacio las mismas que para los vectores del plano, se pueden trasladar aquí las propiedades de las homotecias planas. Así pues, una homotecia es una biyección de E3 en sí mismo que transforma rectas en rectas paralelas y planos en planos paralelos. “Un segmento se transforma mediante una homotecia en otro segmento de longitud la del dado multiplicada por k ”. En efecto: ' B

ë A¢B¢û=ë OB¢û-ë OA¢û= kë OB û- kë OA û=

(

)

B

= k [OB]- [OA] = k[ AB]

A'

de donde A¢B¢ = A¢B¢ = k AB = AB

A

O

En consecuencia, la homotecia conserva los ángulos. En efecto, sean tres puntos A, B, C, y sus homólogos A¢, B¢,C ¢. Denotemos por j= Ð( AB , AC ) y j¢ = Ð( A¢B¢, A¢C ¢). Se verifica: cos j¢ =

A¢B¢× A¢C ¢ A¢B¢ × A¢C ¢

=

k AB × k AC k AB × k AC

=

k 2 AB × k AC k AB × AC 2

=

Figura 33.

AB × k AC AB × AC

= cos j

Por tanto un triángulo se transforma en otro triángulo con lados proporcionales y ángulos iguales al de partida. Asimismo un tetraedro tiene como figura homóloga otro tetraedro de ángulos y diedros iguales y aristas proporcionales. Las homotecias conservan por tanto la forma de las figuras, aunque no el tamaño, salvo que k = 1. Pero aquí hay que señalar que mientras que en el plano toda homotecia conserva la orientación, en el espacio la orientación se conserva o no dependiendo de que sea k positiva o negativa. Esto puede ilustrarse como sigue: mientras que en la figura 34 (a) a los tetraedros OABC y OA¢B¢C ¢ están igualmente orientados, en la 34 (b) ocurre lo contrario. C

C'

(a)

B

(b)

A'

B'

C

O

B

A

O A

Figura 34.


A'

B' C'

435


436


OP¢ O¢P¢ 1 Þ k= = k¢ OP O¢P¢¢

Una homotecia inversa o negativa puede obtenerse a partir de una positiva componiéndola con una simetría central, ya que H O ,-k = H O ,-k o H O ,-1 = H O ,-1 o H O ,-k , y sabemos que H O ,-1 = S O . Hay que hacer notar también que si una homotecia H O ,k en el espacio se restringe a un plano que contiene a O, se tiene una homotecia plana de igual centro y razón.

¢ O¢P¢ûy del teorema de Thales, resulta: ë OP¢û= kë OP ûyë O¢P¢¢û= kë

Es importante hacer notar que en el caso de que las rectas OO¢ y PP¢¢ sean paralelas, entonces, de

7.2. Composición de homotecias Nota: en la demostración anterior faltaría justificar que el punto O¢¢ es independiente del punto P del que se parte, lo cual es efectivamente cierto. Para probarlo es preciso utilizar el teorema de Desargues, pero lo omitimos para no alargar excesivamente el tema.

7.2.1. Caso de homotecias del mismo centro

Figura 36.

Sean las homotecias H O ,k y H O ,k¢ .Dado un punto cualquiera P, por definición de homotecia, tendremos: O

H O ,k ( P) = P¢, siendo O, P, P¢ alineados yë OP¢û= kë OP û O'

P'

= k¢kë O¢¢P û, de donde resulta que la transformación que pasa del punto P al P¢¢ , es decir el producto H O¢ ,k¢ es la homotecia H O¢¢ ,k¢k .

¢ OP¢û H O ,k¢ ( P¢) = P¢¢, siendo O, P¢, P¢¢ alineados yë OP¢¢û= kë R

Q'

–

R Q’

O

P

–

P

O' '

P'

De lo anterior se desprende fácilmente que O, P, P¢¢ están alineados yë OP¢¢û= k¢kë OP û, por lo que

De aquí podemos escribir la relación vectorialë O¢¢P¢¢û=

Q''

O¢¢P¢¢ P¢¢R¢¢ P¢¢R¢¢ P¢R¢ × = k ¢k = = O¢¢P PR P¢R¢ PR

H O ,k¢ o H O ,k = H O ,kk¢

P''

Figura 35.

R ''

Por tanto, el conjunto de homotecias de centro O constituye el grupo abeliano ( H 0 ,o), en que el elemento neutro es la identidad (homotecia de razón 1) y el inverso de H O ,k es H O ,1 k . Nótese además que para 1 que H O ,k sea involutiva, ha de ser k = , lo cual sólo es posible si k =1 (identidad) o si k = -1 (simetría k central). El grupo ( H 0 ,o) es isomorfo al grupo multiplicativo ( R*,×) de los reales no nulos.

Supongamos que ambas razones son positivas (en los demás casos el razonamiento es similar). Consideremos un triángulo DPQR y su homólogo DP¢Q¢R¢ mediante H O ,k . Sea ahora DP¢¢Q¢¢R¢¢ el homólogo de DP¢Q¢R¢ mediante H O¢k¢ . Llamemos O¢¢ al punto de corte de las rectas OO¢ y PP¢¢ (en el supuesto de que no sean paralelas). Podemos aplicar las propiedades de la homotecia plana y resulta:

7.2.2. Caso de homotecias de distinto centro

7.2.2. Caso de homotecias de distinto centro

Por tanto, el conjunto de homotecias de centro O constituye el grupo abeliano ( H 0 ,o), en que el elemento neutro es la identidad (homotecia de razón 1) y el inverso de H O ,k es H O ,1 k . Nótese además que para 1 que H O ,k sea involutiva, ha de ser k = , lo cual sólo es posible si k =1 (identidad) o si k = -1 (simetría k central). El grupo ( H 0 ,o) es isomorfo al grupo multiplicativo ( R*,×) de los reales no nulos.

Supongamos que ambas razones son positivas (en los demás casos el razonamiento es similar). Consideremos un triángulo DPQR y su homólogo DP¢Q¢R¢ mediante H O ,k . Sea ahora DP¢¢Q¢¢R¢¢ el homólogo de DP¢Q¢R¢ mediante H O¢k¢ . Llamemos O¢¢ al punto de corte de las rectas OO¢ y PP¢¢ (en el supuesto de que no sean paralelas). Podemos aplicar las propiedades de la homotecia plana y resulta: O¢¢P¢¢ P¢¢R¢¢ P¢¢R¢¢ P¢R¢ × = k ¢k = = O¢¢P PR P¢R¢ PR

Figura 35.

R ''

H O ,k¢ o H O ,k = H O ,kk¢

De lo anterior se desprende fácilmente que O, P, P¢¢ están alineados yë OP¢¢û= k¢kë OP û, por lo que

De aquí podemos escribir la relación vectorialë O¢¢P¢¢û=

Q''

= k¢kë O¢¢P û, de donde resulta que la transformación que pasa del punto P al P¢¢ , es decir el producto H O¢ ,k¢ es la homotecia H O¢¢ ,k¢k .

Q'

¢ OP¢û H O ,k¢ ( P¢) = P¢¢, siendo O, P¢, P¢¢ alineados yë OP¢¢û= kë

–

H O ,k ( P) = P¢, siendo O, P, P¢ alineados yë OP¢û= kë OP û

–

P

P'

O'

O

Nota: en la demostración anterior faltaría justificar que el punto O¢¢ es independiente del punto P del que se parte, lo cual es efectivamente cierto. Para probarlo es preciso utilizar el teorema de Desargues, pero lo omitimos para no alargar excesivamente el tema.

Sean las homotecias H O ,k y H O ,k¢ .Dado un punto cualquiera P, por definición de homotecia, tendremos: Figura 36.

7.2.1. Caso de homotecias del mismo centro

O' '

P'

R Q’

P

R

O

P''

7.2. Composición de homotecias Es importante hacer notar que en el caso de que las rectas OO¢ y PP¢¢ sean paralelas, entonces, de ¢ O¢P¢ûy del teorema de Thales, resulta: ë OP¢û= kë OP ûyë O¢P¢¢û= kë Una homotecia inversa o negativa puede obtenerse a partir de una positiva componiéndola con una simetría central, ya que H O ,-k = H O ,-k o H O ,-1 = H O ,-1 o H O ,-k , y sabemos que H O ,-1 = S O . Hay que hacer notar también que si una homotecia H O ,k en el espacio se restringe a un plano que contiene a O, se tiene una homotecia plana de igual centro y razón. OP¢ O¢P¢ 1 Þ k= = k¢ OP O¢P¢¢



436

Semejanza y movimientos en el espacio y observamos que en este caso se pasa de P a P¢ por una traslación de vector paralelo aë OO¢û.

P'

P

Concluimos, por tanto, que: “La composición de dos homotecias de distinto centro y razones inversas ( k¢k = 1) es una traslación de vector paralelo a la recta que une los centros de ambas homotecias. Si las razones no son inversas ( k¢k ¹ 1), la composición de ambas homotecias es otra homotecia cuyo centro está alineado con los de las homotecias dadas y cuya razón es el producto de ambas razones”.

O

P''

O'

Figura 37.

7.3. El grupo de las homotecias y las traslaciones Sabemos que el producto de dos traslaciones da como resultado la traslación según el vector suma, siendo en este caso el producto conmutativo. Asimismo se ha visto que la composición de dos homotecias puede dar, según el caso, o bien otra homotecia, o bien una traslación. Aquí el producto no es conmutativo. Veamos ahora qué se obtiene al componer una homotecia con una traslación o viceversa. Basta tener en cuenta que este tipo de transformaciones están caracterizadas mediante la propiedad de existir un número real k ¹ 0, tal que para cualesquiera dos puntos del espacio P y Q se verifica, siendo P¢ y Q¢ sus transformados, queë P¢Q¢û= kë PQ û. En particular si k = 1 se trata de una traslación. Sean la homotecia H O ,k y la traslación Tur .

Si H O ,k ( P) = P¢, H O,k (Q) = Q¢, Tur ( P¢) = P¢¢, Tur (Q¢) = Q¢¢, se tendráë P¢Q¢û= kë PQ ûyë P¢¢Q¢¢û=

=ë P¢Q¢û, y por tantoë P¢¢Q¢¢û= kë PQ û, de donde la composiciónTur o H O ,k es una homotecia de razón k, cuyo centro se obtiene como la intersección de las rectas PP¢¢ y QQ¢¢ (figura 38a). De manera análoga se prueba que H O ,k o Tur es también otra homotecia de razón k (figura 38a), no siendo la misma que Tur o H O ,k , pues como puede apreciarse en la figura el centro de la homotecia resultante no es el mismo en ambos casos.

Q'' Q'

(a) Q

Q''

u

Q

P'

P O'

O

Q'

P''

P O'

(b) P''

P'

O

Figura 38.

Se tiene por tanto que el conjunto T È H formado por las traslaciones y las homotecias del espacio es cerrado para la composición o producto de transformaciones, siendo (T È H ,o) un grupo no abeliano. Tanto el conjunto T de todas las traslaciones como el conjunto H0 de las homotecias de centro un punto O dado, son subgrupos de aquel.


437


438


La semejanza conserva la alineación ya que las isometrías como las homotecias transforman puntos alineados en puntos alineados. La homotecia positiva, según se ha visto, conserva tanto la medida como el sentido de los ángulos. Lo mismo ocurre con una isometría directa. En cambio las isometrías inversas conservan la medida de los án-

8. SEMEJANZA EN EL ESPACIO

8.1. Concepto de semejanza. Semejanza directa e indirecta

Una semejanza en el plano euclídeo E3 es la composición de una isometría con una homotecia

( f o H O ,k ) o de una homotecia con una isometría (H O ,k o f ).

Proposición: “Una biyección S del espacio euclídeo E3 es una semejanza si y sólo existe un número real positivo k , tal que para cualesquiera dos puntos X e Y de E3 se verifica d ( S ( X ) , S (Y )) = d ( X ,Y ).” Observaciones:

a)

Al ser tanto las isometrías como las homotecias, biyecciones de E3 en sí mismo, también lo son las semejanzas.

b)

No perdemos generalidad al considerar k > 0. En efecto, si fuese k < 0, podríamos poner H O ,k = H O ,-k o H O ,-1 = H O ,-1 o H O ,-k siendo- k > 0. No olvidemos que la homotecia H O,-1 no es más que la simetría central de centro O, o lo que es lo mismo un giro de 180º , y por tanto una isometría. Entonces tendríamos:

Las propiedades de la semejanza, al igual que en el plano, se deducen inmediatamente de las propiedades ya vistas para las isometrías y homotecias. Así pues, se cumple también la propiedad esencial de que “la razón entre las longitudes de cualesquiera dos segmentos homólogos mediante una semejanza S es constante”. En efecto, sea S = H o f ( f isometría y H homotecia de razón k > 0). Dos puntos cualesquiera A y B se transforman mediante f en A¢¢ y B¢¢ y éstos a su vez en A¢ y B¢ mediante H. Por ser f una isometría se tiene A¢¢B¢¢ = AB y , por ser H homotecia, A¢B¢ = k × A¢¢B¢¢. Resulta inmediatamente A¢B¢ = k × AB. El razonamiento es análogo si fuese S = f o H . El recíproco es también cierto y posibilita una forma de caracterizar la semejanza mediante la siguiente proposición, cuya demostración rigurosa omitiremos. S = f o H O ,k = f o (H O ,-1 o H O ,-k ) = ( f o H O ,-1) o H O ,-k = g o H O ,-k

o bien

S = H O ,k o f = (H O ,-k o H O ,-1) o f = H O ,-k o (H O ,-1 o f ) = H O ,-k o g

8.2. Propiedades fundamentales de la semejanza en el espacio

con- k > 0 y siendo g una isometría por ser composición de isometrías. Por consiguiente, podemos definir una semejanza como el producto de una homotecia positiva con una isometría o viceversa. Entonces la razón positiva k se denomina razón de semejanza. Diremos que la semejanza es directa o inversa según lo sea la isometría f. Así pues, la composición de homotecia y traslación o de homotecia y giro son semejanzas directas. En cambio la composición de homotecia y simetría especular es una semejanza inversa. Una semejanza inversa resulta de la composición de una semejanza directa y una simetría especular. Si f es la identidad tendremos una homotecia como caso particular de semejanza. En general una homotecia de razón k, positiva o negativa, es una semejanza de razón k . Si fuese k = 1 tendremos las isometrías como caso también particular de semejanzas. c)

d)

d)

con- k > 0 y siendo g una isometría por ser composición de isometrías. Por consiguiente, podemos definir una semejanza como el producto de una homotecia positiva con una isometría o viceversa. Entonces la razón positiva k se denomina razón de semejanza. Diremos que la semejanza es directa o inversa según lo sea la isometría f. Así pues, la composición de homotecia y traslación o de homotecia y giro son semejanzas directas. En cambio la composición de homotecia y simetría especular es una semejanza inversa. Una semejanza inversa resulta de la composición de una semejanza directa y una simetría especular. Si f es la identidad tendremos una homotecia como caso particular de semejanza. En general una homotecia de razón k, positiva o negativa, es una semejanza de razón k . Si fuese k = 1 tendremos las isometrías como caso también particular de semejanzas. c)

8.2. Propiedades fundamentales de la semejanza en el espacio

S = H O ,k o f = (H O ,-k o H O ,-1) o f = H O ,-k o (H O ,-1 o f ) = H O ,-k o g

Las propiedades de la semejanza, al igual que en el plano, se deducen inmediatamente de las propiedades ya vistas para las isometrías y homotecias. Así pues, se cumple también la propiedad esencial de que “la razón entre las longitudes de cualesquiera dos segmentos homólogos mediante una semejanza S es constante”. En efecto, sea S = H o f ( f isometría y H homotecia de razón k > 0). Dos puntos cualesquiera A y B se transforman mediante f en A¢¢ y B¢¢ y éstos a su vez en A¢ y B¢ mediante H. Por ser f una isometría se tiene A¢¢B¢¢ = AB y , por ser H homotecia, A¢B¢ = k × A¢¢B¢¢. Resulta inmediatamente A¢B¢ = k × AB. El razonamiento es análogo si fuese S = f o H . El recíproco es también cierto y posibilita una forma de caracterizar la semejanza mediante la siguiente proposición, cuya demostración rigurosa omitiremos. o bien

S = f o H O ,k = f o (H O ,-1 o H O ,-k ) = ( f o H O ,-1) o H O ,-k = g o H O ,-k

No perdemos generalidad al considerar k > 0. En efecto, si fuese k < 0, podríamos poner H O ,k = H O ,-k o H O ,-1 = H O ,-1 o H O ,-k siendo- k > 0. No olvidemos que la homotecia H O,-1 no es más que la simetría central de centro O, o lo que es lo mismo un giro de 180º , y por tanto una isometría. Entonces tendríamos:

b)

Al ser tanto las isometrías como las homotecias, biyecciones de E3 en sí mismo, también lo son las semejanzas.

a)

Observaciones:

Proposición: “Una biyección S del espacio euclídeo E3 es una semejanza si y sólo existe un número real positivo k , tal que para cualesquiera dos puntos X e Y de E3 se verifica d ( S ( X ) , S (Y )) = d ( X ,Y ).”

( f o H O ,k ) o de una homotecia con una isometría (H O ,k o f ).

Una semejanza en el plano euclídeo E3 es la composición de una isometría con una homotecia

La semejanza conserva la alineación ya que las isometrías como las homotecias transforman puntos alineados en puntos alineados. La homotecia positiva, según se ha visto, conserva tanto la medida como el sentido de los ángulos. Lo mismo ocurre con una isometría directa. En cambio las isometrías inversas conservan la medida de los án-

8.1. Concepto de semejanza. Semejanza directa e indirecta 8. SEMEJANZA EN EL ESPACIO



438

Semejanza y movimientos en el espacio gulos, pero no el sentido. De ahí que la semejanza conserve la medida de los ángulos en cualquier caso. Si la semejanza es directa mantiene el sentido, mientras que si es inversa lo cambia. En consecuencia, mediante una semejanza en el espacio un triángulo se tranforma en otro triángulo con lados proporcionales y ángulos iguales al de partida. Asimismo un tetraedro tiene como figura homóloga otro tetraedro de ángulos y diedros iguales y aristas proporcionales. Las semejanzas directas conservan la orientación de las figuras, mientras que las inversas la cambian.

8.3. El grupo equiforme Hemos visto que la composición de dos homotecias da como resultado otra homotecia, o bien una traslación. Asimismo toda homotecia de centro O y razón k, tiene una homotecia inversa, la de centro o y razón 1 k. En consecuencia el conjunto de todas las homotecias, todas las isometrías, y todas las composiciones de isometrías con homotecias o viceversa, constituyen un grupo no abeliano ( S ,o), que no es otro que el grupo de las semejanzas del espacio. Se trata de todas la transformaciones que conservan la forma, aunque no necesariamente el tamaño ni la orientación de las figuras. De ahí que tal grupo reciba el nombre de grupo equiforme. Las semejanzas directas constituyen un subgrupo. Asimismo, el grupo de las homotecias del mismo centro, el grupo de los giros del mismo centro, el grupo de las traslaciones, etc., son subgrupos del grupo equiforme.

9. ESTUDIO ANALÍTICO PARTICULAR DE ALGUNAS TRANSFORMACIONES 9.1. Ecuaciones de una traslación r La traslación en el espacio Tvr de vector v = ( a , b , c), se obtienen fácilmente, ya que cada punto X ( x, y , z) y su homólogo X ¢( x¢, y¢, z¢) deben cumplir: ë XX ¢û=ë OX ¢û-ë OX û= xr¢- xr = vr r r r De donde la ecuación vectorial de una traslación es x¢ = x + v, que se traduce en cualquiera de estas formas: ìx¢ = x + a ï í y¢ = y + b ; ï ¢ îz = z + c

æ x¢ ö æ x ö æ a ö æ a ö æ 1 0 0öæ x ö ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ç ÷ ç y¢÷= ç y÷+ç b ÷= ç b ÷+ç 0 1 0÷ç y ÷ ; ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ç ÷ è z¢ ø è z ø è c ø è c ø è 0 0 1øè z ø

æ x¢ ö æ 1 ç ÷ ç ç y¢÷ ç 0 ç z¢÷= ç 0 ç ÷ ç è 1 ø è0

0 0 a öæ x ö ÷ç ÷ 1 0 b ÷ç y÷ 0 1 c ÷ç z ÷ ÷ç ÷ 0 0 1øè 1 ø

9.2. Ecuaciones de un giro

r r r Si tomamos un sistema de referencia ortonormal {O; i , j , k} de modo que el eje e del giro coincida con el eje OZ, las ecuaciones del giro se simplifican, pues la restricción al plano OXY sería un giro en el plano. Tendríamos: ìx¢ = x cos a - ysena ï í y = xsena + y cos a ï î z = z¢ que se podrían expresar matricialmente: æ x¢ ö æcos a -sena 0öæ x ö ç ÷ ç ÷ç ÷ ç y¢÷= ç sena cos a 0÷ç y÷ ç ÷ ç ÷ç ÷ 0 1øè z ø è z¢ ø è 0 TEMARIO DE MATEMÁTICAS. PRUEBA A

X' X

a

O a

Figura 39.

439


440


9.3. Ecuaciones de un movimiento helicoidal

ìx¢ = 2dn + (1- 2n 2) x- 2n n y- 2n1n3 z 1 1 1 2 ï 2 ( ) í ¢ y = 2 dn 2 - 2n1n2 x + 1- 2n2 y - 2n2 n3 z ï 2 î z¢ = 2dn3 - 2n1n3x - 2n2n3 y+ (1- 2n3 ) z

r Si tomamos un sistema de referencia con eje OZ que coincida con el eje e, el vector v de ese movi( ) miento, al ser paralelo a OZ tendrá de componentes 0,0,c . Si el ángulo de giro es a, cada punto ( x, y, z) se transformará por dicho giro en el punto

( xcos a- ysen a, xsen a+ ycos a, z)

Si X ¢ es el punto simétrico de X con respecto a p se ha de cumplirë XX ¢û= 2ë XP û, por lo que de [ 3] r r r r r r r r r r resultaë XX ¢û= x ' x = 2( n × x - d ) n. Luego x¢ = x + 2( n × x - d ) n, que nos da las ecuaciones de la simetría especular: r y éste mediante la traslación de vector v en el

( xcos a- ysena, xsena+ ycos a, z + c)

Figura 40. X'

con lo que las ecuaciones del movimiento helicoidal serán: ìx¢ = x cos a - ysena ï í y¢ = xsena + y cos a ï ¢ îz = z + c

ë PX û= ( nr × xr - d ) nr

[3]

En general, podemos obtener las ecuaciones de una simetría respecto del plano p de ecuación normal n1x+ n2 y+ n3 z = d , siendo r n = ( n1, n2 , n3) un vector unitario y perpendicular a p. Para cualquier r r punto X ( x, y , z), su distancia al plano viene dada por n × x - d , que r r es el módulo del vector x - p =ë OX û-ë OP û=ë PX û, siendo P la proyección ortogonal de X sobre el plano p. Por tanto: Matricialmente

X

æ x¢ ö æ 0ö æcos a -sena 0öæ x ö ç ÷ ç ÷ ç ÷ç ÷ ç y¢÷= ç 0÷+ç sena cos a 0÷ç y÷ ç ÷ ç ÷ ç ÷ç ÷ 0 1øè z ø è z¢ ø è c ø è 0

ìx¢ = x æ ¢ö æ öæ ö ç x ÷ ç 1 0 0 ÷ç x ÷ ï í ¢ y = y , o sea ç y¢÷= ç 0 1 0 ÷ç y÷ ç ÷ ç ÷ç ÷ ï î z¢ = - z è z¢ø è 0 0 –1øè z ø

9.4. Ecuaciones de una simetría especular

En casos particulares las ecuaciones que resultan son sencillas. Por ejemplo, la simetría respecto del plano OXY, vendría dada por las ecuaciones:

En casos particulares las ecuaciones que resultan son sencillas. Por ejemplo, la simetría respecto del plano OXY, vendría dada por las ecuaciones:

9.4. Ecuaciones de una simetría especular

æ ¢ö æ ö æ öæ ö ç x ÷ ç 0÷ çcos a -sena 0÷ç x ÷ ç y¢÷= ç 0÷+ç sena cos a 0÷ç y ÷ ç ÷ ç ÷ ç ÷ç ÷ 0 1øè z ø è z¢ ø è c ø è 0

X

ìx¢ = x æ x¢ ö æ 1 0 0 öæ x ö ç ÷ ç ÷ç ÷ ï í y¢ = y , o sea ç y¢÷= ç 0 1 0 ÷ç y÷ ç ÷ ç ÷ç ÷ ï ¢ îz = - z è z¢ø è 0 0 –1øè z ø

En general, podemos obtener las ecuaciones de una simetría respecto del plano p de ecuación normal n1x+ n2 y+ n3 z = d , siendo r n = ( n1, n2 , n3) un vector unitario y perpendicular a p. Para cualquier r r punto X ( x, y , z), su distancia al plano viene dada por n × x - d , que r r es el módulo del vector x - p =ë OX û-ë OP û=ë PX û, siendo P la proyección ortogonal de X sobre el plano p. Por tanto: [3] ë PX û= ( nr × xr - d ) nr Matricialmente

Figura 40.

con lo que las ecuaciones del movimiento helicoidal serán: ìx¢ = x cos a - ysena ï í y¢ = xsena + y cos a ï î z¢ = z + c

X'

( xcos a- ysena, xsena+ ycos a, z + c)

Si X ¢ es el punto simétrico de X con respecto a p se ha de cumplirë XX ¢û= 2ë XP û, por lo que de [ 3] r r r r r r r r r r resultaë XX ¢û= x ' x = 2( n × x - d ) n. Luego x¢ = x + 2( n × x - d ) n, que nos da las ecuaciones de la simetría especular:

( xcos a- ysen a, xsen a+ ycos a, z) r y éste mediante la traslación de vector v en el

ìx¢ = 2dn1+ (1- 2n12) x- 2n1n2 y- 2n1n3 z ï í y¢ = 2dn2 - 2n1n2x + (1- 2n22) y- 2n2n3 z ï 2 î z¢ = 2dn3 - 2n1n3x - 2n2n3 y+ (1- 2n3 ) z

Si el ángulo de giro es a, cada punto ( x, y, z) se transformará por dicho giro en el punto

r Si tomamos un sistema de referencia con eje OZ que coincida con el eje e, el vector v de ese movimiento, al ser paralelo a OZ tendrá de componentes ( 0,0,c).

9.3. Ecuaciones de un movimiento helicoidal



440


9.5. Ecuaciones de una simetría central Si el centro de simetría es el punto C ( a , b , c), para dos puntos homólogos X ( x, y , z) y X ¢( x¢, y¢, z¢) ha r r r de cumplirseë CX ¢û= -ë CX û, de donde x¢ = - x + 2c, es decir: ìx¢ = - x+ 2a ï í y¢ = - y+ 2b que matricialmente se pueden poner ï ¢ î z = - z + 2c

æ x¢ ö æ 2a ö æ-1 0 0 öæ x ö ç ÷ ç ÷ ç ÷ç ÷ ç y ¢÷= ç 2b ÷+ç 0 -1 0 ÷ç y÷, ç ÷ ç ÷ ç ÷ç ÷ è z¢ ø è 2c ø è 0 0 -1øè z ø

o bien: æ x¢ ö æ-1 0 0 2a öæ x ö ÷ç ÷ ç ÷ ç ç y¢÷ ç 0 -1 0 2b ÷ç y ÷ ç z¢÷= ç 0 0 -1 2c ÷ç z ÷ ÷ç ÷ ç ÷ ç è 1 ø è 0 0 0 1 øè 1 ø

9.6. Ecuaciones de una homotecia Dado un punto genérico X ( x, y , z) y su homólogo X ¢( x¢, y¢, z¢) mediante la homotecia de razón k y centro C ( x0 , y0 , z 0), se tendrá:

ë CX û= kë CX û r r r Tomando vectores de posición c =ë OC û, x =ë OX û, x¢ =ë OX ¢û, podemos poner:

ë OX ¢û-ë OC û= k(ë OX û-ë OC û)

C

X

X'

O

Figura 41.

r r r r r r r de donde obtenemos la ecuación vectorial de la homotecia x¢ = c + k( x - c), o bien x¢ = (1- k) c + kx. Las ecuaciones de H C ,k son, pues, las siguientes: ìx¢ = (1- k) x0 + kx ï í y¢ = (1- k) y0 + ky ï î z¢ = (1- k) z 0 + kz que matricialmente se expresarían: æ x¢ ö æ (1- k ) x0 ö æ x ö æ (1- k) x0 ö æ k 0 0öæ x ö ÷ ç ÷ ç ÷ ç ÷ç ÷ ç ÷ ç ç y¢÷= ç(1- k ) y0 ÷+ kç y ÷= ç(1- k ) y0 ÷+ç 0 k 0÷ç y÷ ÷ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ ç è z¢ø è(1- k ) z 0 ø è z ø è(1- k) z 0 ø è 0 0 k øè z ø o también: æ x¢ ö æ k ç ÷ ç ç y¢÷ ç 0 ç z¢÷= ç 0 ç ÷ ç è 1 ø è0


æxö 0 0 (1- k ) x0 ö ÷ç ÷ k 0 (1- k ) y0 ÷ç y ÷ 0 k (1- k ) z 0 ÷ç z ÷ ÷ç ÷ 0 0 1 øè 1 ø

441



9.7. Ecuaciones de una semejanza

Así pues, en la transformación [ 4 ] la imagen del origen O(0,0,0) es el punto P0( a0 , b0 , c0) y para cualquier otro punto X ( x1, x2 , x3) se tendrá r X ¢ = PO + f ( x) X'

X' ' X

o brevemente X ¢ = AX

O

En el caso sencillo de una semejanza que sea la composición del giro de centro el origen de coordenadas O(0,0,0) y ángulo a con una homotecia de centro también O(0,0,0) y razón k, las ecuaciones se obtienen de forma casi inmediata: P0

ìx¢ = kx¢¢ = kx cos a - kysen a ï í y¢ = ky¢¢ = kxsen a + kycos a ï î z¢ = kz¢¢ = kz X'

æ ö a13 ö ÷ç X 1 ÷ a23 ÷ç X 2 ÷, ÷ç ÷ a33 øè X 3 ø

a

442

Figura 43. O

x

X

æ X 1¢ö æ a11 a12 ç ÷ ç ç X 2¢ ÷= ç a21 a22 ç ÷ ç è X 3¢ ø è a31 a32

Toda afinidad lleva asociada una aplicación lineal f, la inducida por la matriz A. En efecto, el vector X =ë PQ û= ( X 1, X 2 , X 3) se transforma en el vector X ¢ = ( X 1¢, X ¢2 , X 3¢), que vendrá dado por: que en forma matricial se expresaría:

æ ¢ö æ öæ ö ç x ÷ ç k cos a - k sen a 0÷ç x ÷ ç y¢÷= ç k sen a k cos a 0÷ç y ÷ ç ÷ ç ÷ç ÷ 0 k øè z ø è z¢ ø è 0

Figura 42.

æ a11 a12 a13 ö ç ÷ Si denominamos A a la matrizç a21 a22 a23 ÷, la condición A ¹ 0 garantiza que exista transformaç ÷ è a31 a32 a33 ø ción inversa, es decir, que se trate de una biyección de E3 en sí mismo.

10. ESTUDIO ANALÍTICO GENERAL DE LAS ISOMETRÍAS Y LAS SEMEJANZAS EN EL ESPACIO æ x1¢ö æ a0 ö æ a11 a12 ç ÷ ç ÷ ç ç x¢2 ÷= ç b0 ÷+ç a21 a22 ç ÷ ç ÷ ç è x¢3 ø è b0 ø è a31 a32

æ x1¢ö æ a11 a12 ç ÷ ç æ x1 ö a13 ö ÷ç ÷ ç x¢2 ÷ ç a21 a22 a23 ÷ç x2 ÷, o bien ç ÷= ç x¢ a a ÷ç ÷ ç 3 ÷ ç 31 32 a33 øè x3 ø 1 0 0 è ø è

a33 0

a0 öæ x1 ö ÷ç ÷ b0 ÷ç x2 ÷ c0 ÷ç x3 ÷ ÷ç ÷ 1 øè 1 ø

10.1. Las isometrías en el espacio como caso particular de afinidades a23

En general, en E3 una transformación afín o afinidad viene dada por unas ecuaciones del tipo: a13

æ ¢ ö ç x1 = a0 + a11x1+ a12x2 + a13x3 ÷ ç x¢2 = b0 + a21x1+ a22x2 + a23x3 ÷ ç ÷ è x1¢= c0 + a31x1+ a32x2 + a33x3 ø

que matricialmente pueden expresarse de las formas:

æ x1¢= a0 + a11x1+ a12x2 + a13x3 ö ç ÷ ç x¢2 = b0 + a21x1+ a22x2 + a23x3 ÷ ç ÷ è x1¢= c0 + a31x1+ a32x2 + a33x3 ø

[4]

[4]

que matricialmente pueden expresarse de las formas: æ ¢ö æ ö æ ç x1 ÷ ç a0 ÷ ç a11 a12 ç x¢2 ÷= ç b0 ÷+ç a21 a22 ç ÷ ç ÷ ç è x¢3 ø è b0 ø è a31 a32

æ x¢ö æ a a ç 1 ÷ ç 11 12 öæ x1 ö a13 ÷ ç ÷ x¢ a a22 ç ÷ ç 2 21 a23 ÷ç x2 ÷, o bien ç ÷= ç x¢ a a ÷ç ÷ ç 3 ÷ ç 31 32 a33 øè x3 ø 0 è 1ø è 0

a13


En general, en E3 una transformación afín o afinidad viene dada por unas ecuaciones del tipo: a23

10.1. Las isometrías en el espacio como caso particular de afinidades a33 0

10. ESTUDIO ANALÍTICO GENERAL DE LAS ISOMETRÍAS Y LAS SEMEJANZAS EN EL ESPACIO

æ ö ç a11 a12 a13 ÷ Si denominamos A a la matrizç a21 a22 a23 ÷, la condición A ¹ 0 garantiza que exista transformaç ÷ è a31 a32 a33 ø ción inversa, es decir, que se trate de una biyección de E3 en sí mismo. æ x¢ ö æ k cos a - k sen a 0öæ x ö ç ÷ ç ÷ç ÷ ç y¢÷= ç k sen a k cos a 0÷ç y÷ ç ÷ ç ÷ç ÷ 0 k øè z ø è z¢ ø è 0

Figura 42.

Toda afinidad lleva asociada una aplicación lineal f, la inducida por la matriz A. En efecto, el vector X =ë PQ û= ( X 1, X 2 , X 3) se transforma en el vector X ¢ = ( X 1¢, X ¢2 , X 3¢), que vendrá dado por: que en forma matricial se expresaría:

ìx¢ = kx¢¢ = kx cos a - kysen a ï í y¢ = ky¢¢ = kxsen a + kycos a ï ¢ î z = kz¢¢ = kz

æ ¢ö æ ç X 1 ÷ ç a11 a12 ç X 2¢ ÷= ç a21 a22 ç ÷ ç è X 3¢ ø è a31 a32

X'

X x

öæ X 1 ö a13 ÷ ç ÷ a23 ÷ç X 2 ÷, ÷ç ÷ a33 øè X 3 ø

o brevemente X ¢ = AX X' '

P0

a

O

X

En el caso sencillo de una semejanza que sea la composición del giro de centro el origen de coordenadas O(0,0,0) y ángulo a con una homotecia de centro también O(0,0,0) y razón k, las ecuaciones se obtienen de forma casi inmediata:

Así pues, en la transformación [ 4 ] la imagen del origen O(0,0,0) es el punto P0( a0 , b0 , c0) y para cualquier otro punto X ( x1, x2 , x3) se tendrá r X ¢ = PO + f ( x)

O

X'

9.7. Ecuaciones de una semejanza

Figura 43. 442




Una afinidad conserva el paralelismo y la alineación, ya que la aplicación lineal inducida transforma el vector l X en el vector l X ¢. Para que la transformación [ 4 ] sea una isometría deberá cumplir que r la aplicación lineal f inducida conserve la norma de cualquier vector, es decir, que para cualquier X =ë PQ û= ( X 1, X 2 , X 3 ,) sea X = PQ = P¢Q¢ = X ¢ , por tanto debe cumplirse: X 12 + X 22 + X 32 = X 1¢2 + X 2¢2 + X 3¢2 Matricialmente æ X1ö æ X 1¢ö ç ÷ ç ÷ ( X 1 X 2 X 3)ç X 2 ÷= ( X 1¢ X 2¢ X 3¢)ç X ¢2 ÷. ç ÷ ç ÷ èX 3ø è X ¢3 ø En forma abreviada manejando matrices columna X t X = X 't X ¢ = ( X t A t )( AX ) = X t ( A t A) X Þ A t A = I Por tanto, resulta que para que la afinidad [ 4 ] sea una isometría la matriz A de la aplicación lineal inducida debe ser una matriz ortogonal. Deben ser, pues, las columnas de A una base ortonormal de E3, y por tanto cumplir las relaciones: a1ha1k + a2ha2k + a3ha3k = dhk (d de Kronecker)

r r En consecuencia, se conserva el producto escalar ya que para cualesquiera dos vectores X e Y se tendrá: r r r r X ¢×Y ¢ = X 't Y ¢ = ( X t A t )( AY ) = X t ( A t A)Y = X t IY = X tY = X ×Y Nota: lo anterior es en realidad una simple consecuencia de la conservación de la norma, ya que podemos escribir. r r 2 r r 2 r r 2 r r 2 f ( X )+ f (Y ) + f ( X )- f (Y ) f ( X +Y ) + f ( X - Y ) r r f ( X )× f (Y ) = = = 4 4 r r2 r r2 r r X +Y + X - Y = = X ¢×Y ¢ 4 2

2

Al ser ortogonal la matriz de una isometría tendremos A t A = A t × A = A = I = 1. Por tanto A = ±1.

–

Si A = +1 tendremos una isometría directa (que aquí se denominó movimiento o congruencia).

–

Si A = -1se trata de una isometría inversa.

10.2. Caracterización de isometrías por los puntos dobles Supongamos que hay doble O y lo tomamos como origen de coordenadas del sistema de rer un r punto r ferencia ortonormal {O; u1, u2 , u3}. Entonces las ecuaciones de la isometría se reducen a: ìx1¢= a11x1+ a12x2 + a13x3 ï íx¢2 = a21x1+ a22x2 + a23x3 ï¢ îx1 = a31x1+ a32x2 + a33x3

[5]

Los puntos dobles de la transformación serán los que cumplan x1¢= x1, x2¢ = x2 , x¢3 = x3


443


444


lo que nos lleva a las soluciones del sistema lineal homogéneo:

a31 = 0; a32 = 0; a33 - 1= n

ì( a11- 1) x1+ a12x2 + a13x3 = 0 ï ía21x1+ ( a22 - 1) x2 + a23x3 = 0 ï îa31x1+ a32x2 + ( a33 - 1) x3 = 0

a21 = 0; a22 - 1= 0; a23 = m

Las ecuaciones de sistema homogéneo representan tres planos coincidentes. Hay pues un plano de puntos dobles y la transformación será una simetría especular respecto de dicho plano. Con un cambio de base adecuado podemos conseguir que ese plano sea el x3 = 0. Entonces: a11- 1= 0; a12 = 0; a13 = l

[6]

es decir, al núcleo de la aplicación lineal definida por la matriz A - I . Así pues, Ker( f - I ) es el conjunto de puntos dobles de la isometría dada por [ 5]. Haremos nuestra discusión con el rango de la matriz

–

Caso 2: Rango ( A - I ) = 1.

ì1 si i = j Todos los elementos de la matriz A - I son nulos, resultando aij = dij = í con lo que î0 si i ¹ j A = I y la isometría es la identidad i. Todos los puntos son dobles. æ ö a12 a13 ÷ ç a11- 1 A - I = ç a21 a22 - 1 a23 ÷ ç ÷ a32 a33 - 1ø è a31

–

Caso 1: Rango ( A - I ) = 0.

Ya se puede anticipar que si la isometría es directa y tiene puntos dobles ha de tener infinitos ya que en este caso A = +1, por lo que A - I = 0 y el sistema homogéneo [ 6] tendría infinitas soluciones. Se presentan los siguientes casos: cuyo determinante desarrollado es:

é a22 A - I = A -ê ë a32

a23 a33

+

a11

a12

a21 a22

+

a11 a13 ù ú+ ( a11+ a22 + a33) - 1 a31 a33 û

[7]

A - I = A - ( a11+ a22 + a33) A + ( a11+ a22 + a33) - 1= (1- A )( a11+ a22 + a33 - 1)

Al ser ortogonal la matriz, se tiene A-1A t y por tanto:

a23 = A11 = a11 A a33 a13

[8]

a22 a32

que al reemplazar en [ 7] nos dan:

a31 a33 a11

= A22 = a22 A

a11 a12 = A33 = a33 A a21 a22

a11 a12 = A33 = a33 A a21 a22 a11

a13

= A22 = a22 A

a23 = A11 = a11 A a33 a31 a33

que al reemplazar en [ 7] nos dan:

a22 a32

Al ser ortogonal la matriz, se tiene A-1A t y por tanto:

A - I = A - ( a11+ a22 + a33) A + ( a11+ a22 + a33) - 1= (1- A )( a11+ a22 + a33 - 1)

[8]

é a22 A - I = A -ê ë a32

a33 a23

+

a21 a22 a11

a12

+

a31 a11

a13 ù ú+ ( a11+ a22 + a33) - 1 a33 û

[7]

Ya se puede anticipar que si la isometría es directa y tiene puntos dobles ha de tener infinitos ya que en este caso A = +1, por lo que A - I = 0 y el sistema homogéneo [ 6] tendría infinitas soluciones. Se presentan los siguientes casos: cuyo determinante desarrollado es:

–

æ a11- 1 a12 a13 ö ç ÷ A - I = ç a21 a22 - 1 a23 ÷ ç ÷ a32 a33 - 1ø è a31

Caso 1: Rango ( A - I ) = 0.

ì1 si i = j Todos los elementos de la matriz A - I son nulos, resultando aij = dij = í con lo que î0 si i ¹ j A = I y la isometría es la identidad i. Todos los puntos son dobles.

es decir, al núcleo de la aplicación lineal definida por la matriz A - I . Así pues, Ker( f - I ) es el conjunto de puntos dobles de la isometría dada por [ 5]. Haremos nuestra discusión con el rango de la matriz

–

Caso 2: Rango ( A - I ) = 1.

Las ecuaciones de sistema homogéneo representan tres planos coincidentes. Hay pues un plano de puntos dobles y la transformación será una simetría especular respecto de dicho plano. Con un cambio de base adecuado podemos conseguir que ese plano sea el x3 = 0. Entonces: a11- 1= 0; a12 = 0; a13 = l ì( a11- 1) x1+ a12x2 + a13x3 = 0 ï ía21x1+ ( a22 - 1) x2 + a23x3 = 0 ï îa31x1+ a32x2 + ( a33 - 1) x3 = 0

[6]

a21 = 0; a22 - 1= 0; a23 = m a31 = 0; a32 = 0; a33 - 1= n

lo que nos lleva a las soluciones del sistema lineal homogéneo:

444



Semejanza y movimientos en el espacio y las ecuaciones de la transformación se reducirían a ìx1¢= x1+ lx3 æ x1¢ö æ 1 0 l öæ xö ç ÷ ç ÷ç 1 ÷ ï íx¢2 = x2 + mx3 Þ ç x¢2 ÷= ç 0 1 m ÷ç x2 ÷ ÷ç ÷ ç ÷ ç ï ¢ n øè x3 ø 0 0 1 + x ( ) ¢ è 1 n ø x = + x è î3 3 3 Ahora bien, como las columnas de la matriz A constituyen una base ortonormal debe ser 2 l = 0; m = 0 y l2 + m 2 + (1+ n) = 0, de donde v = -1. La transformación que queda es ìx1¢= x1 ï íx¢2 = x2 ï¢ îx3 = x3

æ1 0 0 ö ç ÷ cuya matriz A = ç 0 1 0 ÷ y ç ÷ è 0 0 -1ø

A = -1

Se trata de la simetría respecto al plano x3 = 0 y es un pseudomovimiento o isometría directa.

–

Caso 3: Rango ( A - I ) = 2. En este caso, resultan en [ 6] dos ecuaciones independientes con lo que el sistema homogéneo representa tres planos secantes en una misma recta. Tendremos una isometría con una recta de puntos dobles. Cada plano perpendicular a esa recta se transformará en él mismo, ya que han de conservarse los ángulos, y sobre estos planos tendremos un movimiento subordinado por el anterior, con un punto doble. Se tratará de un giro, o en particular una simetría, respecto de ese punto. En el espacio tendremos un giro respecto a la recta de puntos dobles, que eventualmente puede ser una simetría respecto de ella.

–

Caso 4: Rango ( A - I ) = 3.

Si el determinante |A- I| ¹ 0, se desprende de [ 8] que debe ser A = -1, y tendremos el único punto doble el O elegido como origen. Tal es el caso de la simetría central. Hay isometrías que no tienen puntos dobles. Baste pensar en la traslación. En general, si una isometría con puntos dobles se compone con una traslación podemos obtener una isometría sin puntos dobles, como el caso de un movimiento helicoidal (giro+ traslación). Podemos hacer el resumen siguiente: Isometrías directas

Isometrías inversas

Traslación o movimiento helicoidal (giro + traslación)

Simetría + traslación

Un solo punto doble

No hay

Simetría central o composición de 3 simetrías especulares (cuyos planos se cortan en un punto)

Una recta de puntos dobles

Rotación respecto de un eje (simetría axial como caso particular)

No hay

Un plano de puntos dobles

No hay

Simetría especular

Sin puntos dobles

Todos los puntos son dobles

r Identidad (traslación de vector O)

No hay

10.3. Ecuaciones generales de la homotecia y la semejanza Las semejanzas en el espacio se obtienen también como caso particular de afinidades. Al igual que vimos para el plano (tema 42, § 4.3) partir de la condición de que conserve r r la ortogonalidad, r res decir, r podemos r para cualesquiera dos vectores X ,Y ,el automorfismo inducido f, verifique X ×Y = 0 Þ f ( X )× f (Y ) = 0. Por un procedimiento similar al que utilizó en el plano se llega a la forma que debe tener la matriz A de f que para que la afinidad cumpla lo anterior.


445


446


Dicha matriz debe tener como columnas una base ortogonal de E2, normalizada o no, cuyos vectores tengan todos de norma k. Es decir, que cumpla: a1ha1k + a2ha2k + a3ha3k = k 2dhk . Por tanto debe ser æ ka11 ka12 ç A = ç ka21 ka22 ç è ka31 ka32

æ a11 a12 ka13 ö ÷ ç ka23 ÷dondeç a21 a22 ÷ ç ka33 ø è a31 a32

a13 ö ÷ a23 ÷es una matriz ortogonal. ÷ a33 ø

La constante k es la razón de semejanza. Por lo tanto, una semejanza en general puede ponerse en la forma: æ x1¢ö æ a0 ö æ ka11 ka12 ç ÷ ç ÷ ç ç x¢2 ÷= ç b0 ÷+ç ka21 ka22 ç ÷ ç ÷ ç è x¢3 ø è c0 ø è ka31 ka32

æ x1¢ö æ ka11 ka12 ç ÷ ç æ ö ka13 ö ÷ç x1 ÷ ç x¢2 ÷ ç ka21 ka22 ka23 ÷ç x2 ÷, o bienç ÷= ç x¢ ka ka32 ÷ç ÷ ç 3 ÷ ç 31 ka33 øè x3 ø 0 è 1ø è 0

ka13 ka23 ka33 0


En particular una homotecia de centro el punto ( x0 , y0 , z 0) tendrá de ecuaciones:

é ù öæ x1 ö æ k 0 0öêæ a0 k ö æ a11 a12 a13 öæ x1 öú a13 ÷ ÷ ç ç ÷ ç ÷ç ÷ú ÷êç a23 ÷ç x2 ÷= ç 0 k 0÷êç a0 k ÷+ç a21 a22 a23 ÷ç x2 ÷ú ÷ç ÷ç ÷ ç ÷ç ÷ ÷ ç a a32 a33 øè x3 øú a x è 0 0 k øê a k ø è ø è è ø 3 31 14243ê 104444 4 24444 4 3ú û homotecia ë isometría 33

La semejanza en general puede ponerse de la forma

æ ö æ ö öæ ka13 ö ÷ç x1 ÷ ç k 0 0÷ç a0 k ÷ ka23 ÷ç x2 ÷= ç 0 k 0÷ç a0 k ÷ ÷ç ÷ç ÷ ç ÷ ka33 øè x3 ø è 0 0 k øè a0 k ø

öæ x1 ö æ k 0 0öæ a0 k ö ka13 ÷ ç ÷ ç ÷ ÷ç ka23 ÷ç x2 ÷= ç 0 k 0÷ç a0 k ÷ ÷ç ÷ç ÷ ç ÷ ka33 øè x3 ø è 0 0 k øè a0 k ø

é ù æ x1 ö æ k 0 0öêæ a0 k ö æ a11 a12 a13 öæ x1 öú a13 ö ÷ ç ÷ç ÷ ç ÷ç ÷ú ÷êç a23 ÷ç x2 ÷= ç 0 k 0÷êç a0 k ÷+ç a21 a22 a23 ÷ç x2 ÷ú ÷ç ÷ç ÷ ç ÷ç ÷ ÷ ç a33 øè x3 ø è 0 0 k øêè a0 k ø è a31 a32 a33 øè x3 øú 14243ê 14444 4244444 3ú û homotecia ë isometría

La semejanza en general puede ponerse de la forma

æ x¢ö æ k ç 1÷ ç æ ¢ö æ(1- k) x0 ö æ k 0 0öæ x1 ö ÷ ç ç x1 ÷ ç ÷ç ÷ ç x¢ ÷ ç 0 2 ç x¢2 ÷= ç(1- k) y0 ÷+ç 0 k 0÷ç x2 ÷ o bienç ÷= ç x¢ 0 ÷ç ÷ ç ÷ ç ÷ ç ç 3÷ ç è x¢3 ø è(1- k) z 0 ø è 0 0 k øè x3 ø è 1 ø è0

æ k 0 0öæ a11 a12 ç ÷ç +ç 0 k 0÷ç a21 a22 ç ÷ç è 0 0 k øè a31 a32

æ ¢ö æ ö æ ç x1 ÷ ç a0 ÷ ç ka11 ka12 ç x¢2 ÷= ç b0 ÷+ç ka21 ka22 ç ÷ ç ÷ ç è x¢3 ø è c0 ø è ka31 ka32

æ x1¢ö æ a0 ö æ ka11 ka12 ç ÷ ç ÷ ç ç x¢2 ÷= ç b0 ÷+ç ka21 ka22 ç ÷ ç ÷ ç è x¢3 ø è c0 ø è ka31 ka32

æx ö 0 0 (1- k) x0 ö ÷ç 1 ÷ k 0 (1- k) y0 ÷ç x2 ÷ 0 k (1- k) z 0 ÷ç x3 ÷ ÷ç ÷ 0 0 1 øè 1 ø

æ öæ ç k 0 0÷ç a11 a12 +ç 0 k 0÷ç a21 a22 ç ÷ç è 0 0 k øè a31 a32

æ x1¢ö æ k ç ÷ ç æ x1¢ö æ(1- k) x0 ö æ k 0 0öæ x1 ö ÷ ç ç ÷ ç ÷ ç ÷ ç x¢2 ÷ ç 0 ç x¢2 ÷= ç(1- k) y0 ÷+ç 0 k 0÷ç x2 ÷ o bienç ÷= ç x¢ 0 ÷ç ÷ ç ÷ ç ÷ ç ç 3÷ ç è x¢3 ø è(1- k) z 0 ø è 0 0 k øè x3 ø è 1 ø è0

öæ x1 ö 0 0 (1- k) x0 ÷ ç ÷ k 0 (1- k) y0 ÷ç x2 ÷ 0 k (1- k) z 0 ÷ç x3 ÷ ÷ç ÷ 0 0 1 øè 1 ø

En particular una homotecia de centro el punto ( x0 , y0 , z 0) tendrá de ecuaciones: æ ¢ö æ ö æ ç x1 ÷ ç a0 ÷ ç ka11 ka12 ç x¢2 ÷= ç b0 ÷+ç ka21 ka22 ç ÷ ç ÷ ç è x¢3 ø è c0 ø è ka31 ka32

æ x¢ö æ ka ka12 ç 1 ÷ ç 11 öæ x1 ö ka13 ÷ ç ÷ ç x¢2 ÷ ç ka21 ka22 ka23 ÷ç x2 ÷, o bienç ÷= ç x¢ ka ka32 ÷ç ÷ ç 3 ÷ ç 31 ka33 øè x3 ø 0 è 1ø è 0

0 33

ka

ka13 ka23


La constante k es la razón de semejanza. Por lo tanto, una semejanza en general puede ponerse en la forma: æ ç ka11 ka12 A = ç ka21 ka22 ç è ka31 ka32

ö æ ka13 ÷ ç a11 a12 ka23 ÷dondeç a21 a22 ÷ ç ka33 ø è a31 a32

ö a13 ÷ a23 ÷es una matriz ortogonal. ÷ a33 ø

Dicha matriz debe tener como columnas una base ortogonal de E2, normalizada o no, cuyos vectores tengan todos de norma k. Es decir, que cumpla: a1ha1k + a2ha2k + a3ha3k = k 2dhk . Por tanto debe ser CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


446

TEMA

45 Poliedros. Teorema de Euler. Sólidos platónicos y arquimedianos




448



INTRODUCCIÓN

2.

POLIEDROS 2.1. Definición de diedro 2.2. Definición de triedro. Ángulo poliedro 2.3. Definición de poliedro convexo. Superficie poliédrica 2.4. Elementos de un poliedro 2.5. Construcción de un poliedro no convexo 2.6. Clasificación de los poliedros 2.7. Teorema de Euler

3.

POLIEDROS PLATÓNICOS 3.1. Tipos de poliedros regulares 3.2. Desarrollo de la superficie de los poliedros platónicos

4.

TIPOS DE POLIEDROS

5.

POLIEDROS REGULARES 5.1. Elementos fundamentales de los poliedros regulares

6.

POLIEDROS ARQUIMEDIANOS 6.1. Truncamiento

POLIEDROS ARQUIMEDIANOS 6.1. Truncamiento

6.

POLIEDROS REGULARES 5.1. Elementos fundamentales de los poliedros regulares

5.

TIPOS DE POLIEDROS

4.

POLIEDROS PLATÓNICOS 3.1. Tipos de poliedros regulares 3.2. Desarrollo de la superficie de los poliedros platónicos

3.

POLIEDROS 2.1. Definición de diedro 2.2. Definición de triedro. Ángulo poliedro 2.3. Definición de poliedro convexo. Superficie poliédrica 2.4. Elementos de un poliedro 2.5. Construcción de un poliedro no convexo 2.6. Clasificación de los poliedros 2.7. Teorema de Euler

2.

INTRODUCCIÓN

1.



448

Poliedros

1. INTRODUCCIÓN Desde la antigüedad, el hombre en sus construcciones ha utilizado todo tipo de cuerpos geométricos. A medida que ha ido aumentando lo que se sabe de los cuerpos geométricos ha sido posible hacer construcciones más grandes y más bellas. Las formas poliédricas están presentes en la naturaleza. Por ejemplo, los granos de polen y las semillas de ciertas plantas tienen formas poliédricas basadas fundamentalmente en pentágonos y hexágonos. También aparecen los poliedros en el campo de la virología. Algunos virus pueden formar cristales con formas geométricas regulares. Por ejemplo, la cobertura de numerosos virus está formada por 20 caras triangulares formando un icosaedro. Platón y sus discípulos estaban fascinados con la idea de que sólo existan 5 poliedros regulares. En su particular visión filosófico-poética del mundo asociaban cada uno de ellos con un elemento natural:

– – – – –

El octaedro con el aire. El icosaedro con el agua. El cubo con la tierra. El tetraedro con el fuego. El dodecaedro con el orden del universo.

En general se entiende por poliedro a una parte del espacio limitada por polígonos. El estudio histórico de los mismos se inicia en los tiempos prepitagóricos y llega hasta nuestros días, donde se sigue realizando nuevas clasificaciones y nuevos descubrimientos. En este tema vamos a ver una definición de poliedro y varios tipos de clasificaciones atendiendo a varios atributos. A continuación realizaremos un estudio detallado de los sólidos platónicos o poliedros regulares convexos. Finalizaremos el tema exponiendo qué son los truncamientos, los tipos que hay y un estudio de los sólidos arquimedianos.

2. POLIEDROS 2.1. Definición de diedro Dados dos semiplanos a y b con un borde común r, pero situados en planos distintos, llamaremos diedro convexo al conjunto de puntos comunes a los semiespacios limitados por a y b que contienen respectivamente a y b. La recta r es la arista del diedro y a y b son las caras del diedro. El ángulo de dos semirrectas OA y OB, obtenidas por sección del diedro por un plano p perpendicular a la arista r se llama ángulo rectilíneo del diedro (es independiente del plano p). Consecuencias:

– – – –

r

O

B A

Dos planos secantes dividen al espacio en 4 diedros convexos. El semiplano determinado por r y un punto interior al diedro tiene todos sus puntos pertenecientes a él. Cada semiplano interior a un diedro convexo lo divide en dos diedros. El segmento que une dos puntos situados en las caras del diedro convexo pertenece al mismo.

Definición. Dos diedros con una cara común y la otra en semiplanos opuestos se llaman adyacentes. Un diedro convexo y sus dos adyacentes forman un diedro cóncavo.


449


450


2.2. Definición de triedro. Ángulo poliedro

Llamemos superficie poliédrica convexa al conjunto de un número finito de polígonos, llamado caras tal que cada lado de una cara pertenece a otra y sólo a otra (ambas caras se dice que son contiguas), dos caras contiguas están en distinto plano y el plano de cada cara deja en el mismo semiespacio a todas las demás (si no se verifica esta última condición, la superficie poliédrica es no convexa). Definimos un poliedro convexo como el conjunto de los puntos comunes a todos estos semiespacios. Los vértices y lados de las caras se llaman vértices y aristas del poliedro. En todo lo que sigue, a menos que se indique lo contrario, los poliedros serán siempre convexos.

Sean tres semirrectas x, y, z no coplanarias con origen común O, llamamos triedro al conjunto de puntos comunes a los semiespacios limitados por los planos xy, yz y zx y que contienen las semirrectas restantes. Cada uno de los ángulos convexos Oxy, Oyz, Ozx se llama cara del triedro y O es el vértice. Z

2.3. Definición de poliedro convexo. Superficie poliédrica X

O

x5

Y

x4

Dadas varias semirrectas x1, x2, ..., xn con origen común O y tales que el plano determinado por cada dos consecutivas deje a las demás en un mismo semiespacio, el conjunto de los puntos comunes a todos los semiespacios se llama ángulo poliedro convexo o anguloide convexo. Las semirrectas x1, x2, ..., xn se llaman aristas, los ángulos convexos x1x2, x2x3, ..., xn x1 se llaman caras. Los diedros definidos por cada dos caras consecutivas se llaman también diedros del ángulo poliedro. Una sección del ángulo poliedro es un polígono. x6

x3

O

x2 x1 x1 x2 O

Dadas varias semirrectas x1, x2, ..., xn con origen común O y tales que el plano determinado por cada dos consecutivas deje a las demás en un mismo semiespacio, el conjunto de los puntos comunes a todos los semiespacios se llama ángulo poliedro convexo o anguloide convexo. Las semirrectas x1, x2, ..., xn se llaman aristas, los ángulos convexos x1x2, x2x3, ..., xn x1 se llaman caras. Los diedros definidos por cada dos caras consecutivas se llaman también diedros del ángulo poliedro. Una sección del ángulo poliedro es un polígono. x3

x6

x4 Y

x5 O

X

2.3. Definición de poliedro convexo. Superficie poliédrica Llamemos superficie poliédrica convexa al conjunto de un número finito de polígonos, llamado caras tal que cada lado de una cara pertenece a otra y sólo a otra (ambas caras se dice que son contiguas), dos caras contiguas están en distinto plano y el plano de cada cara deja en el mismo semiespacio a todas las demás (si no se verifica esta última condición, la superficie poliédrica es no convexa). Definimos un poliedro convexo como el conjunto de los puntos comunes a todos estos semiespacios. Los vértices y lados de las caras se llaman vértices y aristas del poliedro. En todo lo que sigue, a menos que se indique lo contrario, los poliedros serán siempre convexos. Z

Sean tres semirrectas x, y, z no coplanarias con origen común O, llamamos triedro al conjunto de puntos comunes a los semiespacios limitados por los planos xy, yz y zx y que contienen las semirrectas restantes. Cada uno de los ángulos convexos Oxy, Oyz, Ozx se llama cara del triedro y O es el vértice.

2.2. Definición de triedro. Ángulo poliedro



450

Poliedros

2.4. Elementos de un poliedro Hemos visto que un poliedro es un conjunto de puntos limitados por planos, por tanto está constituido por:

– –

Un conjunto finito de polígonos llamados caras del poliedro.

–

En cada arista concurren dos caras del poliedro, en cada vértice concurren al menos tres aristas, luego cada vértice es vértice de un ángulo poliedro convexo.

–

Los polígonos de las caras son convexos y su conjunto forma la superficie poliédrica. Los puntos del poliedro no situados en la superficie se llaman interiores, los demás exteriores.

–

Una recta cualquiera del espacio corta a un poliedro convexo en dos puntos y no en más, ya que si consideramos un plano cualquiera que pase por esa recta, cortará al poliedro según un polígono convexo al que la recta cortará en dos puntos que pertenecerán al poliedro.

–

Se define la diagonal de un poliedro como la recta que une dos vértices que no están en la misma cara.

–

Dos vértices cualesquiera de un poliedro están conectados por una poligonal formada por aristas de dicho poliedro.

–

Cada poliedro convexo divide al espacio en dos regiones: una convexa (el poliedro) y otra no (ya que toda semirrecta r con origen en un punto interior corta a la superficie en un único punto).

–

Tanto el interior como el exterior son regiones conexas (es decir, se pueden unir sus puntos por una línea quebrada que no corte a la superficie).

Dos caras consecutivas se cortan en un arista y forman un ángulo diedro. La arista es lado de dos caras.

2.5. Construcción de un poliedro no convexo Por ejemplo, a partir de un ortoedro, tomando un punto interior y eliminando el poliedro determinado por O y una cara.

A

D

C

D B

A

O

C B

Es obvio que el nuevo poliedro no es convexo. El poliedro anterior tiene una superficie poliédrica que divide al espacio en dos regiones conexas. Este tipo de superficies se llama simple. La clase de poliedros simples contiene a la de los poliedros convexos. Proposición. Todo poliedro convexo tiene como mínimo cuatro vértices, cuatro caras y seis aristas. Demostración. Sea V un vértice, entonces pertenece al menos a tres caras y a tres aristas. Si a es una de las aristas que contienen a V, seaV ' el otro vértice de la arista a.V ' también pertenece al menos a tres caras y a tres aristas; pero de las tres caras, como mínimo, que contienen aV ', sólo dos de ellas pueden contener a la arista a. Así pues, al menos hay una cara de las que contienen aV ' que no contiene a V. Cada una de las tres aristas a las que pertenece V, tienen otro vértice. Por tanto, hay, además de V, otros tres vértices que forman una arista con V. Hay como mínimo cuatro vértices, lo que supone que al menos hay cuatro caras. Por otro lado, cada cara tiene al menos tres aristas, por lo que tenemos doce aristas y como cada arista es compartida por dos caras, por tanto hay como mínimo seis aristas. TEMARIO DE MATEMÁTICAS. PRUEBA A

451


452


2.6. Clasificación de los poliedros

Sean c, v y a el número de caras, vértices y aristas, respectivamente, de un poliedro convexo. Veamos que c + v = a + 2. Realizamos inducción sobre c. El poliedro más sencillo tiene c = 4, v = 4, a = 6 (es un tetraedro). Eliminamos una de las caras del poliedro, y deformamos la superficie restante hasta extenderla sobre un plano. Las áreas de las caras y sus ángulos se alterarán, pero la red plana de vértices y aristas contendrá el mismo número de unos y otros que en el poliedro original, mientras que ha disminuido en una unidad el número de caras. Probando que en la red plana v – a + c = 1, se habrá probado que en el poliedro v – a + c = 2. Por tanto, eliminada una cara en el tetraedro se tiene c = 3, v = 4, a = 6, entonces c + v = a + 1. Supongamos por inducción que c + v = a + 1 para todas las redes planas con n – 1 aristas, y sea ahora una red plana con n aristas, que tendrá c caras, v vértices y a = n aristas. Eliminamos una arista de esta red que no sea común con ninguna otra cara. La nueva red tiene c – 1 caras, v vértices y a – 1 aristas, y por hipótesis de inducción (c – 1) + v = (a – 1) + 1 entonces c + v = a + 1 y sobre el poliedro c + v = a + 2 cqd. Poliedros regulares

Iguales

Deltaedros

Poliedros de caras regulares

Poliedros arquimedianos

No todas iguales

Poliedros de caras iguales pero no todas iguales

Poliedros de Catalán

Demostración. Prismas Poliedros que no tienen todas las caras regulares ni todas las caras iguales

Excepto los de caras regulares

En todo poliedro convexo, el número de caras más el número de vértices es igual al número de aristas más dos. Antiprisma Pirámides

2.7. Teorema de Euler Estos poliedros serán analizados más adelante. Estos poliedros serán analizados más adelante.

2.7. Teorema de Euler Pirámides

En todo poliedro convexo, el número de caras más el número de vértices es igual al número de aristas más dos. Poliedros que no tienen todas las caras regulares ni todas las caras iguales

Antiprisma

Excepto los de caras regulares

Prismas

Demostración. Sean c, v y a el número de caras, vértices y aristas, respectivamente, de un poliedro convexo. Veamos que c + v = a + 2. Realizamos inducción sobre c. El poliedro más sencillo tiene c = 4, v = 4, a = 6 (es un tetraedro). Eliminamos una de las caras del poliedro, y deformamos la superficie restante hasta extenderla sobre un plano. Las áreas de las caras y sus ángulos se alterarán, pero la red plana de vértices y aristas contendrá el mismo número de unos y otros que en el poliedro original, mientras que ha disminuido en una unidad el número de caras. Probando que en la red plana v – a + c = 1, se habrá probado que en el poliedro v – a + c = 2. Por tanto, eliminada una cara en el tetraedro se tiene c = 3, v = 4, a = 6, entonces c + v = a + 1. Supongamos por inducción que c + v = a + 1 para todas las redes planas con n – 1 aristas, y sea ahora una red plana con n aristas, que tendrá c caras, v vértices y a = n aristas. Eliminamos una arista de esta red que no sea común con ninguna otra cara. La nueva red tiene c – 1 caras, v vértices y a – 1 aristas, y por hipótesis de inducción (c – 1) + v = (a – 1) + 1 entonces c + v = a + 1 y sobre el poliedro c + v = a + 2 cqd. Poliedros de caras iguales pero no todas iguales

Poliedros de Catalán

No todas iguales

Poliedros arquimedianos

Poliedros de caras regulares

Deltaedros

Iguales

Poliedros regulares

2.6. Clasificación de los poliedros



452

Poliedros

3. POLIEDROS PLATÓNICOS Llamamos poliedros platónicos a los poliedros regulares convexos en los que sus caras son polígonos regulares, todas iguales y, además, todos sus vértices tienen el mismo orden (es decir en cada vértice concurren el mismo número de caras).

3.1. Tipos de poliedros regulares Del teorema de Euler obtenemos los siguientes resultados:

–

Cada cara contiene tres o más aristas, y como cada arista está en dos caras será a ³ 3c/2, entonces 3c £ 2a.

–

En cada vértice concurren tres o más aristas, y cada una de ellas tiene dos vértices, luego a ³ 3v/2, es decir 3v £ 2a.

Por el teorema de Euler a + 2 = c + v, entonces multiplicando por tres esta igualdad tenemos 3a + 6 = = 3c + 3v £ 4a, por tanto a ³ 6. Por otro lado es 3a + 6 = 3c + 3v £ 2a + 3v y 3a + 6 = 3c + 3v £ 2a + 3c. De aquí tenemos

a + 6 £ 3c £ 2a. a + 6 £ 3v £ 2a.

Por tanto: c ³ 4 y v ³ 4. Nota: no existe ningún poliedro convexo con siete aristas, ya que 13 £ 3c £ 14 y 13 £ 3v £ 14 no es posible. Sea un poliedro de c caras, siendo cada cara un polígono regular de n lados, y en cada vértice concurren m aristas. a)

Por un lado 2a = mv, ya que de cada vértice salen m aristas y cada arista sale de dos vértices y, por tanto, se cuenta dos veces.

b)

2a = nc, ya que cada arista pertenece a dos caras y cada cara tiene n aristas (todos los polígonos tienen n lados).

Sustituyendo c = 2a/n y v = 2a/m en la fórmula de Euler tenemos

2a 2a + = a + 2, dividiendo por a n m

nos queda: 1 1 1 1 + = + n m a 2

n ³ 3, m ³ 3

Nota: n y m no pueden ser mayores de tres simultáneamente. Demostración: Si n ³ 3v y m ³ 3 entonces

1 1 1 1 £ y £ . n 4 m 4

1 1 1 1 2 1 1 Ahora tenemos: + = + £ = , por tanto £ 0. Contradicción. a 2 n m 4 2 a


453


454


Veamos qué valores toma n para m = 3, y qué valores toma m para n = 3. a D

a

h M

Ø Ø Ø

H

a

1 1 1 – = , de aquí m puede ser 3, 4 ó 5. m 6 a

h

a

Caso n = 3

a

–

m = 3 entonces a = 6, v = 4, c = 4 Tetraedro regular.

a

m = 4 entonces a = 12, v = 6, c = 8 Octaedro regular.

Tetraedro

Octaedro

Hexaedro o cubo

Icosaedro

Dodecaedro

m = 5 entonces a = 30, v = 12, c = 20 Icosaedro regular. A continuación tenemos el dibujo de los cinco poliedros regulares o platónicos.

Caso m = 3, de aquí n puede ser 3, 4, ó 5.

Icosaedro: poliedro regular cuyas veinte caras son triángulos equiláteros y cuyos ángulos poliedros son pentaedros. Tiene 12 vértices y 30 aristas.

Ø Ø Ø

n = 3 entonces a = 6, v = 4, c = 4 Tetraedro regular.

–

–

n = 4 entonces a = 12, v = 8, c = 6 Hexaedro regular.

Dodecaedro: poliedro regular cuyas doce caras son pentágonos regulares y cuyos ángulos poliedros son triedros. Tiene 20 vértices y 30 aristas.

–

Octaedro: poliedro regular cuyas 8 caras son triángulos equiláteros y cuyos ángulos poliedros son tetraedros. Tiene 6 vértices y 12 aristas.

–

Hexaedro o cubo: poliedro regular cuyas 6 caras son cuadrados y cuyos ángulos poliedros son triedros. Tiene 8 vértices y 12 aristas.

–

Podemos resumir los resultados en la siguiente tabla: n

m

c

Nombre del poliedro

3

3

4

Tetraedro (caras triangulares)

3

4

8

Octaedro (caras triangulares)

–

n = 5 entonces a = 30, v = 20, c = 12 Dodecaedro regular.

Tetraedro: poliedro regular cuyas caras son cuatro triángulos equiláteros y sus ángulos poliedros son triedros. Tiene 4 vértices y 6 aristas.

Según lo anterior podemos dar las siguientes definiciones de los sólidos platónicos: Hexaedro (caras cuadradas)

Dodecaedro (caras pentagonales) 12

6

6

3

12

5

3

3

Icosaedro (caras triangulares) 3

4

20

Dodecaedro (caras pentagonales) 4

5

5

3

Hexaedro (caras cuadradas)

Según lo anterior podemos dar las siguientes definiciones de los sólidos platónicos: 3 3

20

5

8

4

4

3

c

m

Icosaedro (caras triangulares) Octaedro (caras triangulares)

–

Tetraedro: poliedro regular cuyas caras son cuatro triángulos equiláteros y sus ángulos poliedros son triedros. Tiene 4 vértices y 6 aristas.

–

Hexaedro o cubo: poliedro regular cuyas 6 caras son cuadrados y cuyos ángulos poliedros son triedros. Tiene 8 vértices y 12 aristas.

–

Octaedro: poliedro regular cuyas 8 caras son triángulos equiláteros y cuyos ángulos poliedros son tetraedros. Tiene 6 vértices y 12 aristas.

–

Dodecaedro: poliedro regular cuyas doce caras son pentágonos regulares y cuyos ángulos poliedros son triedros. Tiene 20 vértices y 30 aristas.

–

Icosaedro: poliedro regular cuyas veinte caras son triángulos equiláteros y cuyos ángulos poliedros son pentaedros. Tiene 12 vértices y 30 aristas.

3

n

Tetraedro (caras triangulares) Nombre del poliedro

Podemos resumir los resultados en la siguiente tabla:

Ø Ø Ø

–

n = 5 entonces a = 30, v = 20, c = 12 Dodecaedro regular. n = 4 entonces a = 12, v = 8, c = 6 Hexaedro regular. n = 3 entonces a = 6, v = 4, c = 4 Tetraedro regular.

Caso m = 3, de aquí n puede ser 3, 4, ó 5.

A continuación tenemos el dibujo de los cinco poliedros regulares o platónicos. m = 5 entonces a = 30, v = 12, c = 20 Icosaedro regular. Hexaedro o cubo

M

m = 3 entonces a = 6, v = 4, c = 4 Tetraedro regular.

1 1 1 – = , de aquí m puede ser 3, 4 ó 5. m 6 a

a

h

a

a

Caso n = 3

D

Veamos qué valores toma n para m = 3, y qué valores toma m para n = 3. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


h

–

H

Icosaedro

a

454

Dodecaedro

m = 4 entonces a = 12, v = 6, c = 8 Octaedro regular.

a

a

Octaedro

Ø Ø Ø

Tetraedro

Poliedros

3.2. Desarrollo de la superficie de los sólidos platónicos Dada una superficie poliédrica, perteneciente a uno de los sólidos platónicos, podemos obtener una figura plana formada por polígonos consecutivos e iguales a las caras. Esta figura recibe el nombre de “desarrollo de la superficie poliédrica”. Para un mismo poliedro puede haber diversos desarrollos. En las siguientes figuras se ha representado el desarrollo de cada uno de los poliedros regulares. Observa la forma de las caras y el número de ellas.

Dodecaedro Icosaedro

Tetraedro Hexaedro Octaedro

4. TIPOS DE POLIEDROS –

Prisma: Consideramos un polígono convexo y una recta r no contenida en el plano del polígono. El lugar geométrico de los homólogos de los puntos del contorno del polígono por traslaciones de la misma dirección que r es una superficie prismática. Se llama prisma al poliedro convexo obtenido al cortar una superficie prismática por dos planos paralelos que no contengan a la dirección de la recta r. Las caras contenidas en dichos planos se llaman bases del prisma y las demás caras se llaman caras laterales. La distancia entre las dos bases es la altura del prisma. Si los planos de las bases son perpendiculares a las aristas laterales, el prisma se llama recto, y en caso contrario, oblicuo. Igualmente el prisma es triangular, cuadrangular, etc., según sea el polígono de la base. Dentro de éstos distinguimos dos especiales: los paralelepípedos, en los que las bases son paralelogramos (pueden ser rectos y oblicuos) y los ortoedros (paralelepípedos rectos de base rectangular). Los ortoedros quedan definidos dando las longitudes de tres aristas concurrentes en un vértice, y en ellos se verifica, trivialmente, que la longitud de una diagonal es la suma de los cuadrados de las aristas concurrentes en su vértice.


455


456


Un tipo especial de ortoedro es el cubo (el que tiene sus tres aristas iguales). Es un poliedro regular de seis caras cuadradas.

Hemos visto que los únicos poliedros regulares que pueden existir son los cinco platónicos. La construcción efectiva de los cinco poliedros regulares es fácil en el caso del tetraedro y del cubo. Veamos el dodecaedro: Construimos un pentágono regular, y sobre cada uno de sus lados otro pentágono igual. Plegamos la figura hasta unir las aristas numeradas igual. Obtenemos un casquete formado por seis pentágonos que determinan cinco triedros. Los planos bisectores de todos los diedros de estos triedros se cortan en un punto O. Hallando la figura simétrica respecto O se completa el dodecaedro. El poliedro resultante tiene doce caras y veinte vértices. Si unimos los centros de las caras del dodecaedro concurrentes en un vértice, obtenemos un triángulo equilátero. Repitiendo la operación con los veinte vértices del dodecaedro obtenemos veinte caras triangulares, concurriendo cinco de ellas en cada vértice. Tendrá entonces doce vértices y treinta aristas. Hemos obtenido el icosaedro regular. Esta curiosa propiedad permite obtener un poliedro regular a partir de otros. Uniendo los centros de tres caras concurrentes en un vértice del cubo, obtenemos un triángulo equilátero. Haciendo lo mismo con los ocho vértices obtenemos un poliedro de ocho caras concurriendo cuatro en cada vértice. Tendrá seis vértices y doce aristas. Es el octaedro regular. Igualmente haciendo esto con el octaedro obtenemos un cubo, y con el icosaedro nuevamente el dodecaedro. Por tanto el cubo y el octaedro, y por otro lado el icosaedro y dodecaedro son conjugados. El tetraedro es conjugado de sí mismo. Paralelepípedo

Ortoedro

–

Pirámides: Si cortamos un ángulo poliedro convexo por un plano que no contenga al vértice queda delimitado un poliedro convexo llamado pirámide. El vértice del ángulo poliedro se llama vértice de la pirámide. La única cara que no contiene al vértice es la base y es un polígono convexo de n lados (tantas como caras tenga el ángulo poliedro). Las aristas que contienen al vértice se llaman aristas laterales, y las caras correspondientes, caras laterales. La distancia del vértice a la base es la altura de la misma. La pirámide se llama regular cuando la base es un polígono regular y el vértice está en la perpendicular al plano de la base, trazada por el baricentro de ella. Dicha recta es el eje de la pirámide y las caras laterales son triángulos isósceles.

–

Tronco de pirámide: Si cortamos una pirámide por un plano paralelo a la base que no contenga al vértice obtenemos un tronco de pirámide y una pirámide (pirámide deficiente). Las bases del tronco son polígonos semejantes y la razón de semejanza es igual a la razón entre la altura de la pirámide y la altura de la deficiente.

5. POLIEDROS REGULARES –

Tronco de pirámide: Si cortamos una pirámide por un plano paralelo a la base que no contenga al vértice obtenemos un tronco de pirámide y una pirámide (pirámide deficiente). Las bases del tronco son polígonos semejantes y la razón de semejanza es igual a la razón entre la altura de la pirámide y la altura de la deficiente.

5. POLIEDROS REGULARES

Hemos visto que los únicos poliedros regulares que pueden existir son los cinco platónicos. La construcción efectiva de los cinco poliedros regulares es fácil en el caso del tetraedro y del cubo. Veamos el dodecaedro: Construimos un pentágono regular, y sobre cada uno de sus lados otro pentágono igual. Plegamos la figura hasta unir las aristas numeradas igual. Obtenemos un casquete formado por seis pentágonos que determinan cinco triedros. Los planos bisectores de todos los diedros de estos triedros se cortan en un punto O. Hallando la figura simétrica respecto O se completa el dodecaedro. El poliedro resultante tiene doce caras y veinte vértices. Si unimos los centros de las caras del dodecaedro concurrentes en un vértice, obtenemos un triángulo equilátero. Repitiendo la operación con los veinte vértices del dodecaedro obtenemos veinte caras triangulares, concurriendo cinco de ellas en cada vértice. Tendrá entonces doce vértices y treinta aristas. Hemos obtenido el icosaedro regular. Esta curiosa propiedad permite obtener un poliedro regular a partir de otros. Uniendo los centros de tres caras concurrentes en un vértice del cubo, obtenemos un triángulo equilátero. Haciendo lo mismo con los ocho vértices obtenemos un poliedro de ocho caras concurriendo cuatro en cada vértice. Tendrá seis vértices y doce aristas. Es el octaedro regular. Igualmente haciendo esto con el octaedro obtenemos un cubo, y con el icosaedro nuevamente el dodecaedro. Por tanto el cubo y el octaedro, y por otro lado el icosaedro y dodecaedro son conjugados. El tetraedro es conjugado de sí mismo.

–

Pirámides: Si cortamos un ángulo poliedro convexo por un plano que no contenga al vértice queda delimitado un poliedro convexo llamado pirámide. El vértice del ángulo poliedro se llama vértice de la pirámide. La única cara que no contiene al vértice es la base y es un polígono convexo de n lados (tantas como caras tenga el ángulo poliedro). Las aristas que contienen al vértice se llaman aristas laterales, y las caras correspondientes, caras laterales. La distancia del vértice a la base es la altura de la misma. La pirámide se llama regular cuando la base es un polígono regular y el vértice está en la perpendicular al plano de la base, trazada por el baricentro de ella. Dicha recta es el eje de la pirámide y las caras laterales son triángulos isósceles. Paralelepípedo

Ortoedro

Un tipo especial de ortoedro es el cubo (el que tiene sus tres aristas iguales). Es un poliedro regular de seis caras cuadradas.



456

Poliedros

5.1. Elementos fundamentales de los poliedros regulares Además de las caras, vértices, aristas y de sus ángulos poliedros, se consideran elementos fundamentales de un poliedro regular las esferas: inscrita, circunscrita y tangente a sus aristas. Igualmente se consideran elementos fundamentales el centro de esas esferas y las distancias o ángulos entre unos y otros elementos. Para determinar los elementos fundamentales de un poliedro regular, se recurre a la búsqueda de planos de simetría que contengan el mayor número de elementos del mismo y a ejes de simetría del poliedro. Todos los poliedros regulares tienen centro de simetría, excepto el tetraedro, pero en todos los casos hay un punto O que equidista de las caras, vértices y aristas del poliedro, y que es centro de una esfera inscrita, circunscrita y tangente a las aristas. Veamos cómo se obtiene O: Sean a y b los planos de dos caras consecutivas de un poliedro regular y sean O1 y O2 sus respectivos centros. Sea AB la arista común. Sea g el plano perpendicular a AB en su punto medio M. Los planos a y b cortan a g en las rectasO1M y O2M , perpendiculares a AB (g por ser perpendicular a a y b contiene a las perpendiculares a estos planos en O1 y O2). Las rectas O1M y O2M por estar en un mismo plano y ser perpendiculares a rectas que se cortan, D

D

también se cortan en un punto O. Los triángulos OO1M y OO2M son iguales (ya que tienen un lado común y son rectángulos). Por tanto OO1 = OO2, entonces O equidista de las dos caras. Además OM Î g entonces es mediatriz de AB por lo que O también equidista de A y B. La igualdad de los cuadriláteros análogos al OO1MO2, correspondientes a cada par de caras, demuestra que O es común a todos ellos. Por tanto, O equidista de las caras, de los vértices y de los puntos medios de las aristas.

6. POLIEDROS ARQUIMEDIANOS Se llaman poliedros arquimedianos o semirregulares a los poliedros convexos formados por caras regulares, pero no del mismo número de lados (cada uno tiene más de un tipo de polígonos). Su nombre se debe a que Arquímedes fue el primero que los describió indicando el número de polígonos que concurren en cada vértice y el número de lados de estos polígonos. Kepler le dio nombre a estos poliedros y probó que hay trece poliedros semirregulares, además de los prismas y antiprismas de caras regulares. Algunos de estos poliedros arquimedianos se utilizan como elementos decorativos. El balón de fútbol actual es un poliedro arquimediano: el pequeño rombicosidodecaedro que está formado por veinte triángulos, treinta cuadrados y doce pentágonos. Este poliedro es el más redondeado de todos.

–

Suma de los ángulos de las caras de un poliedro convexo. Si el poliedro tiene c caras, y los números de lados de sus caras son n1, n2, ..., nc se tendrá que sumarán: S = ( n1+ n2+...+nc – 2c) × 2R Como se verifica que n1 + n2 + … + nc = 2 · a, pues cada arista es lado de dos caras. Por tanto: S = 4 ( a – c )× R = 4 ( v – 2 )× R Teorema de Euler

Relación válida incluso aunque no sea convexo pero sí euleriano.

“La suma de los ángulos de las caras de un poliedro convexo es igual a tantas veces cuatro rectos como vértices tiene el poliedro menos dos”. TEMARIO DE MATEMÁTICAS. PRUEBA A

457


458


En los poliedros arquimedianos se verifica:

Ø Ø Ø

Se trunca el dodecaedro o icosaedro y se obtiene el icosidodecaedro.

–

Las caras serán de dos o tres tipos diferentes (no pueden ser de cuatro tipos pues entonces sumarían más de cuatro rectos).

–

Los ángulos poliedros estarán formados por tres, cuatro o cinco caras (no pueden ser seis por la misma razón anterior).

–

Se trunca el cubo o octaedro y se obtiene el cuboctaedro. Se trunca el tetraedro y se obtiene el octaedro.

El corte se realiza por planos que pasan por los puntos medios de las aristas que concurren en un vértice. Los poliedros que se obtienen por este tipo de truncamiento son:

Estas limitaciones y el teorema de Euler nos dan 15 posibilidades, de las que consideramos sólo 13, designando cada poliedro con un número romano. Las otras dos posibilidades son:

Se llama truncamiento a la operación que consiste en cortar las esquinas de los poliedros regulares de manera que se obtengan poliedros que tengan todas las caras regulares (los cortes en torno a los vértices tienen que ser perpendiculares al eje de rotación que pasa por esos vértices). Estos cortes pasan por puntos de las aristas equidistantes del vértice. Dos tipos de truncamientos: a)

Una que no cierra el espacio.

b)

Cualquier prisma con base regular de cinco o más lados y caras laterales cuadrados. Cada uno de los ángulos poliedros está formado por:

6.1. Truncamiento

– – – – – – – – – – – – –

I. Tronco-tetraedro: un triángulo y dos hexágonos en cada vértice. II. Tronco-cubo: un triángulo y dos octógonos en cada vértice.

Todos ellos al prolongar las caras y/o aristas nos proporcionan los cinco poliedros regulares, luego los poliedros arquimedianos pueden obtenerse truncando los vértices y/o aristas de estos cincos poliedros. VIII. Tronco-dodecaedro: un triángulo y dos decágonos. V. Rombicuboctaedro: un triángulo y tres cuadrados.

X. Troncoicosaedro: un pentágono y dos hexágonos.

XII. Troncoicosidodecaedro: un cuadrado, un hexágono y un decágono.

III. Cuboctaedro: dos triángulos y dos cuadrados.

VI. Troncocuboctaedro: un cuadrado, un hexágono y un octógono.

IX. Icosidodecaedro: dos triángulos y dos pentágonos.

IV. Tronco-octaedro: un cuadrado y dos hexágonos.

VII. Cubo romo: cuatro triángulos y un cuadrado (a partir del hexaedro u octaedro).

– – – – – – – – – – – – –

XI. Rombicoicosidodecaedro: un triángulo, dos cuadrados y dos pentágonos.

XIII. Dodecaedro romo: cuatro triángulos y un pentágono (a partir del dodecaedro o icosaedro).

XIII. Dodecaedro romo: cuatro triángulos y un pentágono (a partir del dodecaedro o icosaedro).

VII. Cubo romo: cuatro triángulos y un cuadrado (a partir del hexaedro u octaedro). IV. Tronco-octaedro: un cuadrado y dos hexágonos.

IX. Icosidodecaedro: dos triángulos y dos pentágonos.

VI. Troncocuboctaedro: un cuadrado, un hexágono y un octógono.

III. Cuboctaedro: dos triángulos y dos cuadrados.

XII. Troncoicosidodecaedro: un cuadrado, un hexágono y un decágono.

XI. Rombicoicosidodecaedro: un triángulo, dos cuadrados y dos pentágonos.

X. Troncoicosaedro: un pentágono y dos hexágonos.

V. Rombicuboctaedro: un triángulo y tres cuadrados.

Todos ellos al prolongar las caras y/o aristas nos proporcionan los cinco poliedros regulares, luego los poliedros arquimedianos pueden obtenerse truncando los vértices y/o aristas de estos cincos poliedros. VIII. Tronco-dodecaedro: un triángulo y dos decágonos.

II. Tronco-cubo: un triángulo y dos octógonos en cada vértice. I. Tronco-tetraedro: un triángulo y dos hexágonos en cada vértice.

6.1. Truncamiento

Cada uno de los ángulos poliedros está formado por:

Se llama truncamiento a la operación que consiste en cortar las esquinas de los poliedros regulares de manera que se obtengan poliedros que tengan todas las caras regulares (los cortes en torno a los vértices tienen que ser perpendiculares al eje de rotación que pasa por esos vértices). Estos cortes pasan por puntos de las aristas equidistantes del vértice. Dos tipos de truncamientos: Cualquier prisma con base regular de cinco o más lados y caras laterales cuadrados.

b)

Una que no cierra el espacio.

a)

Estas limitaciones y el teorema de Euler nos dan 15 posibilidades, de las que consideramos sólo 13, designando cada poliedro con un número romano. Las otras dos posibilidades son:

–

El corte se realiza por planos que pasan por los puntos medios de las aristas que concurren en un vértice. Los poliedros que se obtienen por este tipo de truncamiento son:

Los ángulos poliedros estarán formados por tres, cuatro o cinco caras (no pueden ser seis por la misma razón anterior).

–

Las caras serán de dos o tres tipos diferentes (no pueden ser de cuatro tipos pues entonces sumarían más de cuatro rectos).

–

Ø Ø Ø

Se trunca el tetraedro y se obtiene el octaedro.

Se trunca el cubo o octaedro y se obtiene el cuboctaedro.

Se trunca el dodecaedro o icosaedro y se obtiene el icosidodecaedro.

En los poliedros arquimedianos se verifica: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


458

Poliedros

–

El corte se realiza por una distancia adecuada para que por cada cara del poliedro nos aparezca un polígono regular que tenga el doble número de lados que el polígono de las caras del poliedro de partida. Los poliedros obtenidos con este tipo de truncamiento son:

Ø Ø Ø Ø Ø

Tetraedro truncado (puede obtenerse cortando las aristas a 1/3 de cada vértice). Cubo truncado. Octaedro truncado. Dodecaedro truncado Icosaedro truncado.

Los restantes se obtienen truncando las aristas a distancia adecuada del vértice y después biselando las aristas, como por ejemplo el rombocuboctaedro.


459

TEMA

46 Distintas coordenadas para describir el plano o el espacio. Ecuaciones de curvas y superficies




462



INTRODUCCIÓN

2.

SISTEMAS DE COORDENADAS EN EL PLANO 2.1. Coordenadas cartesianas en el plano afín 2.2. Cambio del sistema de referencia 2.3. Coordenadas cartesianas en el plano euclídeo. Sistemas de referencia ortonormales 2.4. Cambio de sistema de referencia ortonormal: traslación y giro de ejes 2.5. Coordenadas polares en el plano

3.

SISTEMAS DE COORDENADAS EN EL ESPACIO 3.1. Coordenadas cartesianas en el espacio afín 3.2 Cambio del sistema de referencia 3.3. Coordenadas cartesianas en el espacio euclídeo. Sistemas de referencia ortonormales 3.4. Cambio de sistema de referencia ortonormal 3.5. Fórmulas de Euler 3.6. Coordenadas curvilíneas en el espacio: sistemas de coordenadas cilíndricas y polares

4.

CURVAS Y SUPERFICIES. GENERALIDADES 4.1. Distintas formas de definir curvas y superficies en el plano y en el espacio 4.2. Ecuaciones de una curva en el plano 4.3. Ecuaciones de una curva en el espacio 4.4. Ecuaciones de una superficie en el espacio

5.

ALGUNOS EJEMPLOS DE CURVAS PLANAS Y ALABEADAS 5.1. Algunos ejemplos de curvas en forma explícita 5.2. La recta y su ecuación polar 5.3. La circunferencia 5.4. Las cónicas 5.5. Curvas obtenidas por generación mecánica 5.6. Otras curvas planas interesantes ALGUNOS EJEMPLOS DE SUPERFICIES

6.

ALGUNOS EJEMPLOS DE CURVAS PLANAS Y ALABEADAS 5.1. Algunos ejemplos de curvas en forma explícita 5.2. La recta y su ecuación polar 5.3. La circunferencia 5.4. Las cónicas 5.5. Curvas obtenidas por generación mecánica 5.6. Otras curvas planas interesantes

5.

CURVAS Y SUPERFICIES. GENERALIDADES 4.1. Distintas formas de definir curvas y superficies en el plano y en el espacio 4.2. Ecuaciones de una curva en el plano 4.3. Ecuaciones de una curva en el espacio 4.4. Ecuaciones de una superficie en el espacio

4.

SISTEMAS DE COORDENADAS EN EL ESPACIO 3.1. Coordenadas cartesianas en el espacio afín 3.2 Cambio del sistema de referencia 3.3. Coordenadas cartesianas en el espacio euclídeo. Sistemas de referencia ortonormales 3.4. Cambio de sistema de referencia ortonormal 3.5. Fórmulas de Euler 3.6. Coordenadas curvilíneas en el espacio: sistemas de coordenadas cilíndricas y polares

3.

SISTEMAS DE COORDENADAS EN EL PLANO 2.1. Coordenadas cartesianas en el plano afín 2.2. Cambio del sistema de referencia 2.3. Coordenadas cartesianas en el plano euclídeo. Sistemas de referencia ortonormales 2.4. Cambio de sistema de referencia ortonormal: traslación y giro de ejes 2.5. Coordenadas polares en el plano

2.

INTRODUCCIÓN

1.

6.

ALGUNOS EJEMPLOS DE SUPERFICIES



462

Distintas coordenadas para describir el plano o el espacio

1. INTRODUCCIÓN Los griegos ya estudiaron las propiedades asombrosas de algunas curvas y superficies, desde un punto de vista geométrico y en relación con los problemas clásicos (trisección del ángulo, duplicación del cubo y cuadratura del círculo). Hay curvas, como la cuadratriz, la cisoide, la conchoide, etc., que van indisociablemente unidas a los nombres de geómetras helenos (Dinostrato, Diocles, Nicomedes, etc.). De igual manera hablamos de la espiral de Arquímedes, las cónicas de Apolonio o los ciclos y epiciclos de Ptolomeo. También la historia de la Matemática está jalonada de otros problemas de índole geométrica que han motivado el estudio de ciertas curvas o superficies, como es el caso de la cicloide. La mayoría de las curvas anteriores eran obtenidas por los matemáticos de la antigüedad como lugares geométricos, incluso llegando a ser representadas mediante sencillos instrumentos mecánicos. Por ello recibieron el nombre de curvas mecánicas. Parece ser que Apolonio en su obra Cónicas vislumbra lo que sería en cierto modo una anticipación a la moderna geometría analítica de Descartes. Pero las relaciones que da Apolonio no son más que formas retóricas de las ecuaciones analíticas de las curvas. En realidad el sistema de coordenadas se da a posteriori superpuesto a la curva, pues Apolonio toma como rectas de referencia el diámetro de la cónica, para las abcisas, y la tangente en un extremo, para las ordenadas. El no contar con los números negativos también supuso un hándicap importante. De cualquier manera, en la geometría griega las ecuaciones vienen determinadas por las curvas, pero no puede decirse que las curvas vengan determinadas por las ecuaciones. Tampoco les era suficiente definir curvas de manera abstracta como lugares geométricos, sino que para aceptarlas como tales los antiguos griegos consideraban necesario o bien producirlas de manera estereométrica como una sección de un sólido, o bien construirlas de manera cinemática. Más tarde, el nacimiento de la geometría analítica con Descartes (s. XVII) supuso un hito importantísimo en la historia de la matemática. La “aritmetización de la geometría” permitió superar las limitaciones anteriores y abordar el estudio de curvas y superficies mediante sus respectivas ecuaciones (cúbicas, cuárticas, etc.); es decir, sustituir el enfoque “sintético” griego por un moderno enfoque “algebraico”. Descartes llegó a distinguir entre curvas que nosotros llamaríamos ahora “algebraicas”, como la conchoide o la cisoide, y otras, como la cuadratriz o la espiral, que conocemos como “trascendentes”. A las primeras les concedió un estatus geométrico pleno, junto a la recta, la circunferencia y las cónicas, denominándolas curvas geométricas. A las del segundo tipo les negó el carácter geométrico bautizándolas despectivamente como curvas mecánicas. El propio Descartes profundiza en el estudio de curvas como la espiral equiangular y los óvalos. En la misma línea, Fermat desarrolla analíticamente el estudio de las cónicas como lugares geométricos y ya aplica rotaciones en los ejes para reducir las ecuaciones mediante el cambio de coordenadas. Luego surgiría el cálculo diferencial, que añadía nuevas posibilidades. Los métodos infinitesimales permiten tratar las nociones de tangente y normal, punto doble, punto singular, punto de retroceso, etc. Entre otros matemáticos del siglo XVII, Pascal y Huygens recuperan el interés por la cicloide y otras curvas mecánicas. Por su parte Newton y Leibniz profundizan en el estudio de curvas y superficies, atribuyéndosele al primero la introducción de lo que hoy se conoce como las coordenadas polares. Asimismo, conceptos tales como “curvatura”, “torsión”, “geodésica”, etc., aparecen en el estudio de curvas y superficies desde la perspectiva de la geometría diferencial elemental, que impulsan sobre todo Monge y Legendre a finales del siglo XVIII. Pero vamos a centrarnos en la perspectiva analítica, pues, tal como sugiere su título, el objetivo primordial del tema que nos ocupa es la introducción de los diferentes sistemas de coordenadas, posibilitando así la obtención de ecuaciones sencillas que caractericen a los tipos más interesantes de superficies y curvas, tanto planas como alabeadas.

2. SISTEMAS DE COORDENADAS EN EL PLANO 2.1. Coordenadas cartesianas en el plano afín Sea A2 el espacio afín real bidimensional o plano afín, que entenderemos como una estructura formada por la terna ( p 2 ,V2 , p), donde p 2 es el conjunto de puntos del plano “geométrico”,V2 es el espacio vecto-


463


464


rial de vectores libres del plano (espacio vectorial “subyacente” o “asociado”) y p la aplicación de p 2´p 2 enV2 que a cada par de puntos ( A , B) asocia el vector libreë AB û. Como axiomas establecemos: r 1. ë AB û= 0 Û A = B ì[OO '] = x ur + y ur 0 1 0 2 ïr r r íu'1= c11u1+ c21u2 r r ïr îu' 2= c12u1+ c22u2

[1]

Para cualesquiera A , B ,C Î p 2 se verifica ë AB û+ë BC û=ë AC û(Relación de Chasles). r r Para cualesquiera v Î V2 y A Î p 2 existe un único punto X Î p 2tal queë AX û= v .

2.

Supongamos que los vectoresë OO¢û, u1¢ y u¢2 se expresan en la base vectorial de V2, mediante:

3.

Si ( x, y) y ( x¢, y¢) son respectivamente las coordenadas de un punto P referidas a los anteriores sistemas, tratamos de encontrar fórmulas de paso de unas otras.

En A2 unr sistema de referencia cartesiano es cualquier conjunto r Â = {O; u1, u2}, donde O es un punto arbitrario de p 2 al que denomir r naremos origen de coordenadas y {u1, u2} una base del plano vectorial V2. Obviamente los vectores básicos deben ser linealmente independientes, y por tanto de distinta dirección. U El axioma 3 anterior garantiza la existencia y unicidad de senr r u2 dos puntosU1 y U 2 tales queë OU 1û= u1 yë OU 2 û= u2. Las rectas U OU1 y OU 2 se denominan ejes coordenados. O Las coordenadas cartesianas de un punto P del plano afín resu1 pecto del sistema de referencia anterior, se definen como las coordenadas o componentes de su vector de posiciónë OP ûrespecto de la Figura 1. r r r r base vectorial {u1, u2}. Es decir: sië OP û= xu1+ yu2, entonces decimos que el par (x, y) son las coordenadas cartesianas del punto P. Las coordenadas de un punto están unívocamente determinadas, lo que se justifica por la unicidad de la expresión de un vector dado como combinación lineal de los vectores de una base. Geométricamente, las coordenadas se obtendrían por proyección paralela del punto P sobre cada eje, como muestra la figura. Se Y obtendrían de manera unívoca sendos puntos P1 y P2 , de tal manera que las coordenadas de P serían las razones: OP OP P2 x=± 1 y=± 2 P(x,y) OU1 OU1 r r r r Sean dos sistemas de referencia del plano afín Â = {O; u1, u2} y Â¢ = {O¢; u1¢, u¢2}.

2.2. Cambio del sistema de referencia Figura 2.

O

U1

P1

X

Usualmente a la primera coordenada ( x) del punto P se le denomina abscisa y a la segunda ( y) ordenada. Los ejes coordenados OU1 y OU 2 se denominan respectivamente “eje de abscisas” y “eje de ordenadas”, denotándose habitualmente por OX y OY. El sistema de referencia se simboliza entonces por OXY.

( P1 o P2) esté en la misma o distinta semirrecta que el punto unidad (U1 o U 2) respecto del origen O.

U1

El signo es + o - según que la proyección en cada caso

En A2 un sistema de referencia cartesiano es cualquier conjunto r r Â = {O; u1, u2}, donde O es un punto arbitrario de p 2 al que denomir r naremos origen de coordenadas y {u1, u2} una base del plano vectorial V2. Obviamente los vectores básicos deben ser linealmente independientes, y por tanto de distinta dirección. U El axioma 3 anterior garantiza la existencia y unicidad de senr r u2 dos puntosU1 y U 2 tales queë OU 1û= u1 yë OU 2 û= u2. Las rectas U OU y OU 2 se denominan ejes coordenados. 1 O Las coordenadas cartesianas de un punto P del plano afín resu1 pecto del sistema de referencia anterior, se definen como las coordenadas o componentes de su vector de posiciónë OP ûrespecto de la Figura 1. r r r r base vectorial {u1, u2}. Es decir: sië OP û= xu1+ yu2, entonces decimos que el par (x, y) son las coordenadas cartesianas del punto P. Las coordenadas de un punto están unívocamente determinadas, lo que se justifica por la unicidad de la expresión de un vector dado como combinación lineal de los vectores de una base. Geométricamente, las coordenadas se obtendrían por proyección paralela del punto P sobre cada eje, como muestra la figura. Se Y obtendrían de manera unívoca sendos puntos P1 y P2 , de tal manera que las coordenadas de P serían las razones: OP OP 1 y=± 2 OU1 OU1 P(x,y)

x=±

X

O

P2

El signo es + o - según que la proyección en cada caso

( P1 o P2) esté en la misma o distinta semirrecta que el punto unidad (U1 o U 2) respecto del origen O.

U1

U1

P1

Figura 2.

Usualmente a la primera coordenada ( x) del punto P se le denomina abscisa y a la segunda ( y) ordenada. Los ejes coordenados OU1 y OU 2 se denominan respectivamente “eje de abscisas” y “eje de ordenadas”, denotándose habitualmente por OX y OY. El sistema de referencia se simboliza entonces por OXY.

2.2. Cambio del sistema de referencia

r r r r Sean dos sistemas de referencia del plano afín Â = {O; u1, u2} y Â¢ = {O¢; u1¢, u¢2}.

Si ( x, y) y ( x¢, y¢) son respectivamente las coordenadas de un punto P referidas a los anteriores sistemas, tratamos de encontrar fórmulas de paso de unas otras. 2. 1.

Para cualesquiera A , B ,C Î p 2 se verifica ë AB û+ë BC û=ë AC û(Relación de Chasles). r r Para cualesquiera v Î V2 y A Î p 2 existe un único punto X Î p 2tal queë AX û= v .

ë AB û= 0 Û A = B

ì[OO '] = x ur + y ur 0 1 0 2 ïr r r íu'1= c11u1+ c21u2 r r ïr îu' 2= c12u1+ c22u2

3.

Supongamos que los vectoresë OO¢û, u1¢ y u¢2 se expresan en la base vectorial de V2, mediante:

[1]

rial de vectores libres del plano (espacio vectorial “subyacente” o “asociado”) y p la aplicación de p 2´p 2 enV2 que a cada par de puntos ( A , B) asocia el vector libreë AB û. Como axiomas establecemos: r



464

Distintas coordenadas para describir el plano o el espacio Las expresiones [1] son únicas. Entonces tendremos: ë OP û=ë OO¢û+ë O¢P û= x0ur1+ y0ur2 + x¢ur1¢+ y¢ur2 = r r r r r r = x0u1+ y0u2 + x¢( c11u1+ c21u2) + y¢( c12u1+ c22u2) = r r = ( x0 + c11x¢+ c12 y¢) u1+ ( y0 + c21x¢+ c22 y¢) u2 r r La unicidad de la expresión del vectorë OP ûen la base {u1, u2} nos lleva a las fórmulas del cambio de coordenadas: ìx = x0 + c11x¢+ c12 y¢ í î y = y0 + c21x¢+ c22 y¢ las cuales se expresan matricialmente como sigue: æ x ö æ x0 ö æ c11 c12 öæ x¢ ö ÷ç ÷ ç ÷= ç ÷+ç è yø è y0 ø è c21 c22 øè y¢ø

Y

Y'

P

X'

O' O

X

Figura 3.

[ 2]

En forma abreviada escribiremos x = x 0 + Cx¢. æ c11 c12 ö ÷de cambio de coordenadas es regular ( C ¹ 0) ya que sus dos columnas son, La matriz C =ç è c21 c22 ø r r r r respectivamente, las coordenadas de los vectores u1¢ y u¢2 en la base {u1, u2 }y por tanto son vectores columna linealmente independientes. Ello significa que la matriz C es inversible. El cambio de coordenadas es æ c11 ¢ c12 ¢ö ÷, y las coordenadas de O en el sistema de referencia Â¢ por tanto reversible. En efecto, si C-1 = ç ¢ ¢ è c21 c22 ø r r ì[O 'O] = x ' u' 0 1+ y '0 u' 2 ïr r r y las ecuaciones de paso de coordenadas en Â a son ( x¢0 , y¢0), entonces se tendrá íu1 = c'11 u'1+c'21 u' 2 r r r ï îu2 = c'12 u'1+c'22 u' 2 æ x¢ ö æ x¢0 ö æ c11 ¢ c12 ¢ öæ x ö ÷ç ÷. coordenadas en Â¢ vendrán dadas matricialmente porç ÷= ç ÷+ç è y¢ø è y¢0 ø è c¢21 c¢22 øè yø Nota: la ecuación matricial del cambio de coordenadas [ 2] también podría expresarse de la forma æ 1 ö æ 1 0 0 öæ 1 ö ÷ç ÷ ç ÷ ç ç x ÷= ç x0 c11 c12 ÷ç x ' ÷ ç ÷ ç ÷ç ÷ è y ø è y0 c21 c22 øè y'ø

2.3. Coordenadas cartesianas en el plano euclídeo. Sistemas de referencia ortonormales Si al espacio lineal de vectores libres del plano V2 lo dotamos del producto escalar ordinario, tendremos el plano vectorial euclídeo E2. La estructura ( p 2 , E2 , p) recibirá ahora el nombre de “espacio afín eur r r r clídeo” y lo denotaremos por E2 . La norma asociada al producto escalar ( a = + a × a = a ) permite definir en E2 la métrica euclídea. Nos referiremos en adelante a E2 con la denominación de plano euclídeo. En E2 podemos definir vectores ortogonales (producto escalar nulo) y vector unitario (norma o módulo unidad). r r Entonces un sistema de referencia Â = {O; e1, e2}de E2 es ortonormal, si lo es la base vectorial de E2 r r r r asociada; esto es, si los vectores básicos son unitarios y ortogonales entre sí: e1 = e2 = 1 y e1× e2 = 0. TEMARIO DE MATEMÁTICAS. PRUEBA A

465


466


En r un rsistema r de referencia ortonormal del plano euclídeo, las componentes de cualquier vector unitario u = u1e1+ u2e2 son los cosenos directores de dicho vector, es decir, los cosenos de los ángulos que dicho vector forma con cada uno de los vectores básicos: r r u × e1 rr ( ) a = Ð u,e1 cos a = r r = u1 u e1 Y u r r u ×e r b = Ð( u¢, e2) cos b = r r 1 = u2 = sena b e2 u e1 a r El vector unitario u podrá expresarse, pues, de la forma r r r X u = cos ae1+ sen ae2. O e1 Un sistema de referencia OXY que sea ortonormal tiene como particularidades: Figura 4. Ð(OX ,OY ) = Ð(O¢X ¢,O¢Y ¢) = 90º

OU 2 = O¢U ¢2 = 1 OU 1 = O¢U1¢= 1

En consecuencia, la matriz C verifica Ct ×C = I; es decir, la matriz de paso debe ser una matriz ortogonal. Hemos de tener en cuenta que para transformar el sistema de referencia ortonormal OXY en otro O¢X ¢Y ¢ también ortonormal han de conservarse las longitudes OU 1 y OU 2 , así como el ángulo (recto) que forman los ejes coordenados. O sea: æ c11 c12 ö ÷, La matriz de cambio de coordenadas ( x¢, y¢) a ( x, y), según vimos en el epígrafe 2.2., esC= ç è c21 c22 ø r r r r siendo las columnas de dicha matriz las coordenadas de los vectores e1¢y e2¢ en la base{e1, e2}. Por ser ortonormales los sistemas de referencia, se tendrá: r 2 2 ì e' = c112+ c21 =1 ï 1 ïr 2 2 [ 3] í e' 2 = c122 + c22 =1 ïr r ïe'1×e' 2= c11× c12 + c21× c22 = 0 î

– –

Y

x

P(x,y) y

U2

U1

Los puntos unidad U1 y U2 están a igual distancia del origen O. Las coordenadas (x, y) de un punto P reciben ahora el nombre particular de coordenadas cartesianas rectangulares. Los puntos del plano tales que x > 0 e y > 0 constituyen el primer cuadrante. Los puntos del plano tales que x < 0 e y > 0 constituyen el segundo cuadrante. Los puntos del plano tales que x < 0 e y < 0 constituyen el tercer cuadrante. Los puntos del plano tales que x > 0 e y < 0 constituyen el cuarto cuadrante.

r r r r Sean Â = {O; e1, e2} y Â¢ = {O¢; e1¢, e2¢} dos sistemas de referencia ortonormales de E2. X

2.4. Cambio de sistema de referencia ortonormal: traslación y giro de ejes Figura 5.

– Los puntos unidad U1 y U2 están a igual distancia del origen O. Las coordenadas (x, y) de un punto P reciben ahora el nombre particular de coordenadas cartesianas rectangulares. Los puntos del plano tales que x > 0 e y > 0 constituyen el primer cuadrante. Los puntos del plano tales que x < 0 e y > 0 constituyen el segundo cuadrante. Los puntos del plano tales que x < 0 e y < 0 constituyen el tercer cuadrante. Los puntos del plano tales que x > 0 e y < 0 constituyen el cuarto cuadrante.

Figura 5.

2.4. Cambio de sistema de referencia ortonormal: traslación y giro de ejes U1

r r r r Sean Â = {O; e1, e2} y Â¢ = {O¢; e1¢, e2¢} dos sistemas de referencia ortonormales de E2.

O

O

Los ejes coordenados OX y OY son perpendiculares.

X

æ c11 c12 ö ÷, La matriz de cambio de coordenadas ( x¢, y¢) a ( x, y), según vimos en el epígrafe 2.2., esC= ç è c21 c22 ø r r r r siendo las columnas de dicha matriz las coordenadas de los vectores e1¢y e2¢ en la base{e1, e2}. Por ser ortonormales los sistemas de referencia, se tendrá: r 2 2 ì e' = c112+ c21 =1 ï 1 ïr 2 2 [ 3] í e' 2 = c122 + c22 =1 ïr r e' ×e' = c × c + c × c = 0 ï î 1 2 11 12 21 22 U2

y

x

P(x,y)

Y

–

Figura 4.

Los ejes coordenados OX y OY son perpendiculares.

Un sistema de referencia OXY que sea ortonormal tiene como particularidades:

e1

En r un rsistema r de referencia ortonormal del plano euclídeo, las componentes de cualquier vector unitario u = u1e1+ u2e2 son los cosenos directores de dicho vector, es decir, los cosenos de los ángulos que dicho vector forma con cada uno de los vectores básicos: r r u ×e rr a = Ð( u,e1) cos a = r r 1 = u1 u e1 Y u r r u ×e r b = Ð( u¢, e2) cos b = r r 1 = u2 = sena b e 2 u e1 a r El vector unitario u podrá expresarse, pues, de la forma r r r u = cos ae1+ sen ae2. O

X

En consecuencia, la matriz C verifica Ct ×C = I; es decir, la matriz de paso debe ser una matriz ortogonal. Hemos de tener en cuenta que para transformar el sistema de referencia ortonormal OXY en otro O¢X ¢Y ¢ también ortonormal han de conservarse las longitudes OU 1 y OU 2 , así como el ángulo (recto) que forman los ejes coordenados. O sea: OU 1 = O¢U1¢= 1

OU 2 = O¢U ¢2 = 1

Ð(OX ,OY ) = Ð(O¢X ¢,O¢Y ¢) = 90º



466

Distintas coordenadas para describir el plano o el espacio Ello nos lleva a pensar en una transformación isométrica. Es decir el cambio de sistema de referencia ortonormal se reducirá a un movimiento de ejes (traslación y/o giro), o a un movimiento más simetría axial. En lo que sigue veremos cómo se pueden obtener de manera sencilla las fórmulas de cambio de coordenadas rectangulares. Y

a)

Traslación de ejes r r OO '= x0e1+ y0e2 r r e'1= e1 r r e' 2= e2

P P y'

y

x'

X'

O'

y0

æ x ö æ x0 ö æ 1 0öæ x' ö ì x = x0 + x' ç ÷= ç ÷+ç ÷ç ÷Þ í è yø è y0 ø è 0 1øè y 'ø î y = y0 + y'

b)

Y'

O

X

x0 x

Figura 6.

Giro o rotación de ejes O = O' r r r e'1= cos ae1+ sen ae2

Y Y'

æ p ör r r r r e' 2= cosç a + ÷e1+ cos ae2 = -sen ae1+ cos ae2 è 2ø

a X' a

æ x ö æcos a –sen a öæ x ' ö ì x = x' cos a - y' sen a ç ÷= ç ÷ç ÷Þ í è yø èsen a cosa øè y 'ø î y = x' sen a + y' cos a

X

O

Figura 7. c)

Traslación más giro de ejes æ x ö æ x0 ö æcos a -sena öæ x¢ ö ÷ç ÷ ç ÷= ç ÷+ç è yø è y0 ø è sena cosa øè y¢ø ì x = x0 + x' cos a - y' sen a í î y = y0 + x' sen a + y' cos a

Y' Y X'

O'

Figura 8. d)

O

X

Simetría respecto de uno de los ejes coordenados O = O' r r e'1= e1 Y r r e' 2= - e2 æ x ö æ 1 0 öæ x ' ö ì x = x' ÷ç ÷Þ í ç ÷= ç è yø è 0 -1øè y 'ø î y = - y'

Figura 9.

O

X = X'

Y'

El sistema de referencia ortonormal OX¢Y¢ tiene los mismos ejes que el OXY, pero distinta orientación. Esto es, si en el OXY el ángulo que hay que girar con respecto al origen del semieje OX+ para hacerlo coincidir con el OY+ es +90º, en el OX¢Y¢ dicho ángulo es -90º. TEMARIO DE MATEMÁTICAS. PRUEBA A

467



e)

468

Movimiento de ejes más simetría Si combinamos las transformaciones de ejes de los apartados c) y d), tendremos un cambio de coordenadas dado por: X' æ x ö æ x ö æcos a -sen a öæ 1 0 öæ x' ö ç ÷= ç 0 ÷+ç ÷ç ÷ç ÷= è yø è y0 ø èsen a cos a øè 0 -1øè y'ø Se tiene r³ 0 y 0 £ q < 2p.

P = ( r, q)

Al origen O se le denomina polo, y a la semirrecta origen de ángulos orientados eje polar (en nuestro caso OX + ). Por definición, el origen de coordenadas tiene de módulo 0 y de argumento 0. Los números r y q así definidos se llaman coordenadas polares de P y escribimos Y

æ x0 ö æcos a sen a öæ x ' ö ÷ç ÷ = ç ÷+ç è y0 ø èsen a –cosa øè y 'ø

O'

ì x = x0 + x' cos a + y¢sen a í î y = y0 + x' sen a - y¢cos a

r donde OU 1 = u1 es el vector unitario que marca la dirección positiva del r r eje OX , en el sistema de referencia ortonormal {O; u1, u2}.

Figura 10.

Y' X

O

Figura 11.

q = Ð(OU1,OP)

La primera de las condiciones [ 3] permite asegurar la existencia de un ángulo a tal que c11 = cos a y c21 = sen a. Como no pueden ser nulos a la vez cos a y sen a , supongamos que cos a ¹ 0. Podemos poner entonces c22 = l cos a, y sustituyendo en la tercera de las condiciones [ 3]: c12 cos a + lsen a cos a = 0. Resulta que debiera ser c12 = - lsen a. La segunda de las condiciones [ 3] nos lleva ahora a que: O

U1

x

X

Asimismo se define el argumento o ángulo polar de P como el menor ángulo orientado q ³ 0 que forma el semieje positivo de abscisas y el segmento OP. Es decir:

q

r

v

P

2 c122 + c22 = ( l cos a) + ( – lsen a) = l2(cos 2 a + sen 2a) = l2 = 1 2

2

Si P es un punto del plano euclídeo distinto del origen O llamaremos módulo o radio polar de P al módulo del vector de posición OP, es decir la longitud del segmento OP. Denotaremos r= OP .

De donde l = ±1. Con l = +1, tendremos la transformación del apartado c), es decir, una transformación isométrica directa (movimiento). La matriz de cambio C es ortogonal, siendo en este caso C = +1. Con l = -1, tendremos la transformación del apartado d), es decir, una transformación isométrica inversa (con cambio de orientación de los ejes). La matriz de cambio C es ortogonal, siendo en este caso C = -1. Y

Es patente la analogía entre las coordenadas polares de un punto P en el plano y la forma polar o módulo-argumental de un número complejo.

2.5. Coordenadas polares en el plano

2.5. Coordenadas polares en el plano

De donde l = ±1. Con l = +1, tendremos la transformación del apartado c), es decir, una transformación isométrica directa (movimiento). La matriz de cambio C es ortogonal, siendo en este caso C = +1. Con l = -1, tendremos la transformación del apartado d), es decir, una transformación isométrica inversa (con cambio de orientación de los ejes). La matriz de cambio C es ortogonal, siendo en este caso C = -1.

Es patente la analogía entre las coordenadas polares de un punto P en el plano y la forma polar o módulo-argumental de un número complejo. Si P es un punto del plano euclídeo distinto del origen O llamaremos módulo o radio polar de P al módulo del vector de posición OP, es decir la longitud del segmento OP. Denotaremos r= OP .

Y

2

2

v

2 c122 + c22 = ( l cos a) + ( – lsen a) = l2(cos 2 a + sen 2a) = l2 = 1

P

Asimismo se define el argumento o ángulo polar de P como el menor ángulo orientado q ³ 0 que forma el semieje positivo de abscisas y el segmento OP. Es decir:

La primera de las condiciones [ 3] permite asegurar la existencia de un ángulo a tal que c11 = cos a y c21 = sen a. Como no pueden ser nulos a la vez cos a y sen a , supongamos que cos a ¹ 0. Podemos poner entonces c22 = l cos a, y sustituyendo en la tercera de las condiciones [ 3]: c12 cos a + lsen a cos a = 0. Resulta que debiera ser c12 = - lsen a. La segunda de las condiciones [ 3] nos lleva ahora a que: r

q

O

x

U1

X

Figura 11.

q = Ð(OU1,OP)

r donde OU 1 = u1 es el vector unitario que marca la dirección positiva del r r eje OX , en el sistema de referencia ortonormal {O; u1, u2}.

Figura 10.

ì x = x0 + x' cos a + y¢sen a í î y = y0 + x' sen a - y¢cos a

O

Y' X

Al origen O se le denomina polo, y a la semirrecta origen de ángulos orientados eje polar (en nuestro caso OX + ). Por definición, el origen de coordenadas tiene de módulo 0 y de argumento 0. Los números r y q así definidos se llaman coordenadas polares de P y escribimos æ x0 ö æcos a sen a öæ x ' ö ÷ç ÷ = ç ÷+ç è y0 ø èsen a –cosa øè y 'ø

O'

Y

Movimiento de ejes más simetría Si combinamos las transformaciones de ejes de los apartados c) y d), tendremos un cambio de coordenadas dado por: X' æ x ö æ x0 ö æcos a -sen a öæ 1 0 öæ x' ö ç ÷= ç ÷+ç ÷ç ÷ç ÷= è yø è y0 ø èsen a cos a øè 0 -1øè y'ø P = ( r, q)

Se tiene r³ 0 y 0 £ q < 2p.

468

e)



Distintas coordenadas para describir el plano o el espacio Las coordenadas polares ( r, q) de un punto P determinan unívocamente sus coordenadas cartesianas ( x, y), mediante las fórmulas de paso: ìx = rcos q í î y = rsen q Recíprocamente dadas las cartesianas ( x, y) determinan también unívocamente las polares ( r, q). En efecto, para el módulo es: r= + x2 + y2 El argumento se obtendría como sigue:

–

Si x = y = 0

: q = 0.

–

Si x > 0, y = 0 : q = 0.

–

Si x = 0, y > 0 : q = p 2

–

Si x < 0, y = 0 : q = p

–

Si x = 0, y < 0 : q = 3p 2

y y p p Si x e y son no nulas, entonces se tiene tgq = . Si denotamos por a = arc tg , siendo- £ a £ , x x 2 2 entonces según el cuadrante en que esté P se tiene:

–

æ pö Si x > 0, y > 0 Þ Primer cuadranteç 0 < a < ÷ è 2ø

–

æ p ö Si x < 0, y > 0 Þ Segundo cuadranteç- < a < 0÷ : è 2 ø

q = a+ p

–

æ pö Si x < 0, y < 0 Þ Tercer cuadranteç 0 < a < ÷ è 2ø

:

q = a+ p

–

æ pö Si x < 0, y < 0 Þ Cuarto cuadranteç 0 < a < ÷ è 2ø

:

q = a + 2p

:

q= a

a+p a+p

a

a +2p

a

Figura 12. El argumento q también puede venir determinado por: x y cos q = , sen q = , 0£ q < 2p 2 2 2 x +y x + y2


469


470


æ 1ö æ 1 ç ÷ ç ç x ÷ ç x0 ç y ÷= ç y ç ÷ ç 0 è z ø è z0

c21 c22 c31 c32

0 öæ 1 ö ÷ç ÷ c13 ÷ç x¢ ÷ c23 ÷ç y¢÷ ÷ç ÷ c33 øè z¢ø

3. SISTEMAS DE COORDENADAS EN EL ESPACIO 3.1. Coordenadas cartesianas en el espacio afín 0 c11

0 c12

Z

De manera similar a la seguida para el plano, partiremos del espacio afín tridimensional A3 = ( p 3 , V3 , p), donde un sistema der referencia cartesiano será ahora un r r conjunto Â = {O; u1, u2 , u3}, siendo O el origen de r r r coordenadas y {u1, u2 , u3} una base de V3 (es decir, una terna de vectores que forman un tetraedro). [OU1] = ur1; [OU 2] = ur2; [OU 3] = ur3

El cambio es, por tanto, reversible a través de la matriz inversa C-1. También puede ponerse: es regular.

öæ x¢ ö c13 ÷ ç ÷ c23 ÷ç y¢÷ ÷ç ÷ c33 øè z¢ø

Û

U1

x = x 0 + Cx¢

X

Figura 13.

æ ö æ ö æ ç x ÷ ç x0 ÷ ç c11 c12 ç y÷= ç y0 ÷+ç c21 c22 ç ÷ ç ÷ ç è z ø è z 0 ø è c31 c32

Y

U2

3x 3

O

donde la matriz C= ( cij)

U3

Las rectas OU1, OU 2 , OU 3 se denominan ejes coordenados y se denotan respectivamente por OX, OY, OZ. Asimismo los planos OXY, OXZ y OYZ reciben el nombre de planos coordenados. Las coordenadas cartesianas (x, y, z) de un punto P respecto del sistema de referencia Â, se definen como las componentes del vector de posiciónë OP û r r r en la base {u1, u2 , u3}.

el cambio de coordenadas se expresaría mediante la ecuación matricial Z

r r r r r r Al igual que vimos en el plano, si Â = {O; u1, u2 , u3} y Â = {O¢; u1¢, u¢2 , u¢3}son dos sistemas de referencia en el espacio afín, puede obtenerse la relación entre las coordenadas ( x, y, z) y ( x¢, y¢, z¢) de un punto P, referidas respectivamente a los sistemas Â y Â¢, si se conocen las expresiones (únicas) de los vecr r r r r r toresë OO¢û, u1¢, u¢2 y u¢3 en la base {u1, u2 , u3}. Entonces, pues, si ì[OO '] = x ur + y ur + z ur 0 1 0 2 0 3 ïr r r r ïu' = c u +c u +c u í 1 11 1 21 2 31 r3 r r r ïu' 2= c12u1+ c22u2 + c32u3 r r r ïr îu' 3= c13u1+ c23u2 + c33u3 P

O

y

Y

x

X

Es decir, la terna (x, y, z) son las coordenadas del punto P si, y sólo si, se tiene que ë OP û= xur1+ yur2 + zur3.

Figura 14.



z

r r r r r r Al igual que vimos en el plano, si Â = {O; u1, u2 , u3} y Â = {O¢; u1¢, u¢2 , u¢3}son dos sistemas de referencia en el espacio afín, puede obtenerse la relación entre las coordenadas ( x, y, z) y ( x¢, y¢, z¢) de un punto P, referidas respectivamente a los sistemas Â y Â¢, si se conocen las expresiones (únicas) de los vecr r r r r r toresë OO¢û, u1¢, u¢2 y u¢3 en la base {u1, u2 , u3}. Entonces, pues, si ì[OO '] = x ur + y ur + z ur 0 1 0 2 0 3 ïr ïu'1= c11ur1+ c21ur 2 + c31ur 3 ír r r r ïu' 2= c12u1+ c22u2 + c32u3 r r r r ïu' î 3= c13u1+ c23u2 + c33u3 Figura 14.

X

x

Y

y

P

Z

Figura 13.

X U

1

U2 O

Las rectas OU1, OU 2 , OU 3 se denominan ejes coordenados y se denotan respectivamente por OX, OY, OZ. Asimismo los planos OXY, OXZ y OYZ reciben el nombre de planos coordenados. Las coordenadas cartesianas (x, y, z) de un punto P respecto del sistema de referencia Â, se definen como las componentes del vector de posiciónë OP û r r r en la base {u1, u2 , u3}.

Y

[OU1] = ur1; [OU 2] = ur2; [OU 3] = ur3

De manera similar a la seguida para el plano, partiremos del espacio afín tridimensional A3 = ( p 3 , V3 , p), donde un sistema der referencia cartesiano será ahora un r r conjunto Â = {O; u1, u2 , u3}, siendo O el origen de r r r coordenadas y {u1, u2 , u3} una base de V3 (es decir, una terna de vectores que forman un tetraedro). es regular.

Z

El cambio es, por tanto, reversible a través de la matriz inversa C-1. También puede ponerse: æ 1ö æ 1 0 0 0 öæ 1 ö ÷ç ÷ ç ÷ ç ç x ÷ ç x0 c11 c12 c13 ÷ç x¢ ÷ ç y ÷= ç y c c c ÷ç y¢÷ ç ÷ ç 0 21 22 23 ÷ç ÷ è z ø è z 0 c31 c32 c33 øè z¢ø

U3

3x 3

z

Es decir, la terna (x, y, z) son las coordenadas del punto P si, y sólo si, se tiene que donde la matriz C= ( cij)

O

ë OP û= xur1+ yur2 + zur3.

el cambio de coordenadas se expresaría mediante la ecuación matricial æ x ö æ x0 ö æ c11 c12 c13 öæ x¢ ö ÷ç ÷ ç ÷ ç ÷ ç Û x = x 0 + Cx¢ ç y÷= ç y0 ÷+ç c21 c22 c23 ÷ç y¢÷ ç ÷ ç ÷ ç ÷ç ÷ ¢ è z ø è z 0 ø è c31 c32 c33 øè z ø

3.1. Coordenadas cartesianas en el espacio afín

3. SISTEMAS DE COORDENADAS EN EL ESPACIO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


470


3.3. Coordenadas cartesianas en el espacio euclídeo. Sistemas de referencia ortonormales Sea E3 = ( p 3 , E3 , p) el espacio euclídeo, esto es, el espacio afín tridimensional con el espacio vectorial subyacente dotado del producto escalar ordinario. De ese modo E3 queda dotado de la métrica euclídea. r r r Al igual que el plano, un sistema de referencia Â = {O; e1, e2 , e3} es ortonormal si se cumple ì1 si i = j r r i , j Î {1,2,3}, lo que equivale a que los vectores básicos sean unitarios y ortogoei × e j = dij = í î0 si i ¹ j nales dos a dos. r Un vector unitario uvendrá expresado en el sistema Â, a través de sus Z u cosenos directores, que son los cosenos de los ángulos a , b , y g que dicho g vector forma con los ejes coordenados r r r r r r r a u = u1e1+ u2e2 + u3e3 = cos ae1+ cos be2 + cos ge3. b Obviamente cos 2 a + cos 2 b + cos 2 g = 1. Para que el sistema de referencia OXYZ sea ortonormal, los ejes coordenados deben ser perpendiculares y los puntos unidad U1, U2 y U3 deben estar a la misma distancia del origen O. Las coordenadas de un punto P en dicho sistema de referencia se denominan coordenadas cartesianas ortogonales.

Y

X Figura 15.

3.4. Cambio de sistema de referencia ortonormal Al igualrque r en r el plano, si tenemos r r r dos sistemas de referencia ortonormales de E3, que denotaremos por Â = {O; e1, e2 , e3} y Â¢ = {O¢; e1¢, e2¢ , e3¢}, el paso de coordenadas de uno a otro puede concretarse en la ecuación matricial x = x 0 + Cx' donde la matriz C = ( cij) es ortogonal. Las columnas de dicha matriz son las componentes de los vecto3´3 r r r r r r res e'1 , e' 2 y e' 3 en la base {e1, e2 , e3}, o sea, los cosenos directores de cada uno de aquellos en el sistema de referencia ortonormal Â. Por ser ortonormales los sistemas de referencia dados, se cumplirá: 3

åc c

ij jk

j=1

ì1 si i = j = dik = í î0 si i ¹ j

Lo que significa que la matriz de paso C cumpleCt ×C = I, es decir, se trata de una matriz ortogonal. En particular:

–

Si la matriz C es la identidad, tendremos una traslación paralela de ejes coordenados y la ecuación de paso de coordenadas se reduce a x = x 0 + x¢, es decir: ìx = x0 + x¢ ï í y = y0 + y¢ ï î z = z 0 + z¢

–

Si O = O¢, entonces la ecuación de paso se reduce a x = Cx¢ y será un cambio de sistema de referencia ortonormal con origen fijo.

Como la matriz C es ortogonal se tendrá C = ±1. En caso de que sea C = +1decimos que los sistemas de referencia Â y Â¢ tienen la misma orientación. En caso de que C = -1, ambos sistemas tienen distinta orientación. TEMARIO DE MATEMÁTICAS. PRUEBA A

471


472


r r r En Física se utiliza la notación {O; i , j,k} para un sistema de referencia canónico (ortonormal).

De los nueve ángulos que intervienen en la matriz basta conocer r rtres de ellos r r . Los otros seis se pueden calcular a partir de ellos como consecuencia de las relaciones ei , e j = dij y ei¢, e¢j = dij. Euler encontró unas fórmulas para expresar los nueve coeficientes cij de un cambio de referencia ortonormal sin traslación ( a1 = a2 = a3 = 0), en función de tres parámetros independientes, que son las medidas de tres ángulos correspondientes a tres rotaciones alrededor de tres rectas que pasan por O. Dichos ángulos se conocen como ángulos de Euler. Sea XYZ el triedro primitivo y X ¢Y ¢Z¢ el nuevo triedro. Sea X 1 la intersección de los planos XY y X ¢Y ¢ y sean Y1 e Y1¢ las perpendiculares a X 1 trazadas por O en cada uno de los planos XY y X ¢Y ¢. Z

Z

(b)

(a)

X

Y

X

Y

Figura 16.

öæ 1 ö æ 1ö æ 1 0 0 0 ç ÷ ç r r r r r r ÷ç ÷ ç x ÷ ç a1 cos( e1, e1¢) cos( e1, e2¢) cos( e1, e3¢) ÷ç x¢ ÷ ç y÷= ç a cos( er , er¢) cos( er , er¢) cos( er , er¢) 1÷ç y¢÷ 2 1 2 2 2 3 ç ÷ ç 2 r r r r ÷ç ÷ r r è z ø è a3 cos( e3 , e1¢) cos( e3 , e2¢) cos( e3 , e3¢) øè z¢ø

Los ejes coordenados suelen tomarse de tal manera que si se girara un tornillo en el mismo sentido que el que habría que girar el semieje OX+ para hacerlo coincidir con OY+, entonces el avance de dicho tornillo se produciría según OZ+. En este caso el sistema der referencia r r se denomina dextrógiro o a derechas (figura 16a), y para el producto vectorial se tiene que i ´ j = k . es En caso contrario, si los ejes se toman de tal modo que al girar OX+ hacia OY+ el avance delr tornillo r r según OZ-, el sistema de referencia es levógiro o a izquierdas (figura 16b), siendo entonces i ´ j = –k . con lo cual, la ecuación matricial anterior se expresa así:

3.5. Fórmulas de Euler

Multiplicando escalarmente en las [ 4 ] tenemos r r r r ei × e¢j = cij = cos( ei , e¢j)

Si los vectores de la nueva base ortonormal son r r r r ìe¢= c11e1+ c21e2 + c31e3 ïr1 r r r íe2¢ = c12e1+ c22e2 + c32e3 r r r ïr îe3¢ = c13e1+ c23e2 + c33e3

æ x ö æ a1 ö æ c11 c12 ç ÷ ç ÷ ç ç y ÷= ç a2 ÷+ç c21 c22 ç ÷ ç ÷ ç è z ø è a3 ø è c31 c32

æ ¢ö c13 ö ÷ç x ÷ c23 ÷ç y¢÷ ÷ç ÷ c33 øè z¢ø

o

æ 1ö æ 1 ç ÷ ç ç x ÷ ç a1 ç y÷= ç a ç ÷ ç 2 è z ø è a3

0 0 c11 c12 c21 c22 c31 c32


[4]

la ecuación general del cambio de coordenadas puede ponerse matricialmente como

la ecuación general del cambio de coordenadas puede ponerse matricialmente como æ ö æ ö æ ç x ÷ ç a1 ÷ ç c11 c12 ç y ÷= ç a2 ÷+ç c21 c22 ç ÷ ç ÷ ç è z ø è a3 ø è c31 c32

æ 1ö æ 1 ç ÷ ç ç x ÷ ç a1 ç y÷= ç a ç ÷ ç 2 è z ø è a3

0 0 c11 c12 c21 c22 c31 c32


Si los vectores de la nueva base ortonormal son r r r r ìe1¢= c11e1+ c21e2 + c31e3 ïr r r r íe2¢ = c12e1+ c22e2 + c32e3 r r r ïr¢ îe3 = c13e1+ c23e2 + c33e3 öæ x¢ ö c13 ÷ ç ÷ c23 ÷ç y¢÷ ÷ç ÷ c33 øè z¢ø

o

3.5. Fórmulas de Euler

[4]

Multiplicando escalarmente en las [ 4 ] tenemos r r r r ei × e¢j = cij = cos( ei , e¢j)

es En caso contrario, si los ejes se toman de tal modo que al girar OX+ hacia OY+ el avance delr tornillo r r según OZ-, el sistema de referencia es levógiro o a izquierdas (figura 16b), siendo entonces i ´ j = –k . con lo cual, la ecuación matricial anterior se expresa así:

öæ 1 ö æ 1ö æ 1 0 0 0 ç ÷ ç r r r r r r ÷ç ÷ ç x ÷ ç a cos( e , e¢) cos( e , e¢) cos( e , e3¢) ÷ç x¢ ÷ 1 1 1 1 2 1 ç y÷= ç a cos( er , er¢) cos( er , er¢) cos( er , er¢) 1÷ç y¢÷ 2 1 2 2 2 3 ç ÷ ç 2 r r r r ÷ç ÷ r r è z ø è a3 cos( e3 , e1¢) cos( e3 , e2¢) cos( e3 , e3¢) øè z¢ø

Los ejes coordenados suelen tomarse de tal manera que si se girara un tornillo en el mismo sentido que el que habría que girar el semieje OX+ para hacerlo coincidir con OY+, entonces el avance de dicho tornillo se produciría según OZ+. En este caso el sistema der referencia r r se denomina dextrógiro o a derechas (figura 16a), y para el producto vectorial se tiene que i ´ j = k . Y

Y

X

Figura 16.

X

De los nueve ángulos que intervienen en la matriz basta conocer r rtres de ellos r r . Los otros seis se pueden calcular a partir de ellos como consecuencia de las relaciones ei , e j = dij y ei¢, e¢j = dij. Euler encontró unas fórmulas para expresar los nueve coeficientes cij de un cambio de referencia ortonormal sin traslación ( a1 = a2 = a3 = 0), en función de tres parámetros independientes, que son las medidas de tres ángulos correspondientes a tres rotaciones alrededor de tres rectas que pasan por O. Dichos ángulos se conocen como ángulos de Euler. Sea XYZ el triedro primitivo y X ¢Y ¢Z¢ el nuevo triedro. Sea X 1 la intersección de los planos XY y X ¢Y ¢ y sean Y1 e Y1¢ las perpendiculares a X 1 trazadas por O en cada uno de los planos XY y X ¢Y ¢. (a)

(b)

Z

Z

r r r En Física se utiliza la notación {O; i , j,k} para un sistema de referencia canónico (ortonormal).

472



Distintas coordenadas para describir el plano o el espacio La primera rotación, de ángulo j= Ð(OX ,OX 1), tiene lugar alrededor del eje OZ y en ella el triedro XYZ pasa al X 1Y1Z, siendo las fórmulas en este caso: ìx = x1cos j- y1sen j í î y = x1sen j+ y1cos j

[ 5]

La segunda rotación, de ángulo q = Ð(OZ ,OZ¢) = Ð(OY1,OY1¢), tiene lugar alrededor de OX 1, y en ella el triedro X 1Y1Z pasa al X 1Y1¢Z¢, mediante las fórmulas: ì y1 = y1¢cos q - z¢sen q í î z = y1¢sen q + z¢cos q

[ 6]

Z Z' q

Y' O

y

Y1'

q

j

y

X'

Y1

X

j

X1

Y

Figura 17.

La tercera rotación, de ángulo y = Ð(OX 1,OX ¢), alrededor de OZ¢, pasa en el triedro X 1Y1¢Z¢ a la posición definitiva X ¢Y ¢Z¢, siendo: ìx1 = x¢cos y - y¢sen y í î z = x¢sen y + y¢cos y

[ 7]

Eliminando x1, y1, y1¢ entre las relaciones [ 5], [ 6] y [ 7] se llega a las fórmulas de Euler: ìx = (cos jcos y - sen j sen y cos q) x¢- (cos j sen y + sen jcos y cos q) y¢+ sen j sen qz¢ ï í y = (sen jcos y + cosj sen y cos q) x¢- (sen j sen y + cosjcos y cos q) y¢- cosj sen qz¢ ï î z = sen y sen qx¢+ cos y sen qy¢+ cosqz¢ Las fórmulas anteriores tienen como aplicación interesante las secciones planas de superficies en el espacio, para las que basta hacer una transformación de coordenadas tomando por plano X ¢Y ¢ el de la sección, adoptando el eje X ¢ confundido con X 1. Con ello y = 0, por lo que se simplifica bastante. Como para obtener la sección plana hay que hacer z¢ = 0, resultan las fórmulas: ìx = x¢cos j- y¢senjcos q ï í y = x¢senj+ y¢cosjcos q ï î z = y¢senq que nos dan la ecuación de la curva de sección sustituyendo en la de la superficie x, y , z por los valores anteriores. TEMARIO DE MATEMÁTICAS. PRUEBA A

473


474


La terna de números ( r, q , j) son las coordenadas polares del punto P, siendo r > 0, 0 £ q £ p y 0 £ j < 2p. Al origen de coordenadas se le asignan las coordenadas polares ( 0,0,0), por definición.

Figura 19.

P = ( x, y, z) es un punto del espacio euclídeo tridimensional distinto del origen. Sea r el módulo de P (que por definición es el del vector OP). Denotaremos por j al argumento de P¢ respecto de las coordenadas polares en el plano OXY y por q (distancia cenital) al menor ángulo ( 0£ q £ p) que forma OP con el semieje positivo OZ+ . Los dos ángulos q y j se denominan respectivamente argumentos primero y segundo del punto P, o también colatitud y longitud. Al ángulo p - q se le denomina latitud. 2

j

En particular:

Si el plano de sección pasa por el eje de las x, entonces j= 0, y las fórmulas se reducen a x y

O

r

Si el plano secante pasa por el eje de las y, entonces j = p 2 y queda: ìx = - y¢cos q ï í y = x¢ ï î z = y¢sen q

q

–

P

z

b)

ìx = x¢ ï í y = y¢cos q ï î z = y¢sen q

P'

–

Coordenadas polares

3.6. Coordenadas curvilíneas en el espacio: sistemas de coordenadas cilíndricas y polares para determinar q se tendrá el cuadrante del plano OXY en que está situada la proyección P¢. ìr = + x2 + y2 ï ï y Las relaciones “recíprocas” son ítgq = z ï ïz = z î

a)

Coordenadas cilíndricas

Sea P = ( x, y, z) un punto del espacio euclídeo tridimensional, cuyas coordenadas cartesianas vienen r r r dadas en un sistema de referencia ortonormal{O; u1, u2 , u3}. Supondremos que P no está sobre el eje OZ. Si la proyección P¢ de P sobre el plano OXY tiene de coordenadas polares r y q, entonces las coordenadas cilíndricas o semipolares de P son ( r, q , z), donde r³ 0 y 0 £ q £ 2p. Las coordenadas cilíndricas determinan unívocamente las cartesianas y viceversa. ìx = rcos q ï En efecto, para el paso a cartesianas se tiene: í y = rsen q ï îz = z q

r

y

o

P

z

ìx = rcos q ï En efecto, para el paso a cartesianas se tiene: í y = rsen q ï îz = z

Si la proyección P¢ de P sobre el plano OXY tiene de coordenadas polares r y q, entonces las coordenadas cilíndricas o semipolares de P son ( r, q , z), donde r³ 0 y 0 £ q £ 2p. Las coordenadas cilíndricas determinan unívocamente las cartesianas y viceversa. q

x

y

r

x

o

P'

P

Figura 18.

z

ìr = + x2 + y2 ï ï y Las relaciones “recíprocas” son ítgq = z ï ïz = z î

P'

Sea P = ( x, y, z) un punto del espacio euclídeo tridimensional, cuyas coordenadas cartesianas vienen r r r dadas en un sistema de referencia ortonormal{O; u1, u2 , u3}. Supondremos que P no está sobre el eje OZ. a)

Figura 18.

Coordenadas cilíndricas

3.6. Coordenadas curvilíneas en el espacio: sistemas de coordenadas cilíndricas y polares para determinar q se tendrá el cuadrante del plano OXY en que está situada la proyección P¢. Coordenadas polares z

ìx = - y¢cos q ï í y = x¢ ï î z = y¢sen q

Si el plano secante pasa por el eje de las y, entonces j = p 2 y queda: y

j x

ìx = x¢ ï í y = y¢cos q ï î z = y¢sen q

r O

La terna de números ( r, q , j) son las coordenadas polares del punto P, siendo r > 0, 0 £ q £ p y 0 £ j < 2p. Al origen de coordenadas se le asignan las coordenadas polares ( 0,0,0), por definición.

Si el plano de sección pasa por el eje de las x, entonces j= 0, y las fórmulas se reducen a 474



Figura 19.

En particular:

P'

–

P

q

P = ( x, y, z) es un punto del espacio euclídeo tridimensional distinto del origen. Sea r el módulo de P (que por definición es el del vector OP). Denotaremos por j al argumento de P¢ respecto de las coordenadas polares en el plano OXY y por q (distancia cenital) al menor ángulo ( 0£ q £ p) que forma OP con el semieje positivo OZ+ . Los dos ángulos q y j se denominan respectivamente argumentos primero y segundo del punto P, o también colatitud y longitud. Al ángulo p - q se le denomina latitud. 2

–

b)

Distintas coordenadas para describir el plano o el espacio Para los puntos del eje OZ no estaría definido el argumento j. Puede asignarse en este caso el valor 0 a dicho argumento, por lo que las coordenadas de tales puntos serían de la forma ( r,0,0) para los del semieje OZ+ y ( r, p ,0) para los del semieje OZ-. Las coordenadas polares determinan de manera unívoca las coordenadas cartesianas, pues llamando ìx = rcos j ï r= OP¢, tendremos: í y = rsen j ï î z = rcos q Pero como r= rsen q, las fórmulas de paso de cartesianas a polares quedarán como sigue: ìx = rsen q cos j ï í y = rsen q sen j ï î z = rcos q Recíprocamente las coordenadas cartesianas determinan unívocamente las polares:

–

r= x2 + y2 + z 2

–

El longitud j se calcula a partir de x e y igual que en las coordenadas polares planas, es decir con y tgj= y teniendo en cuenta el cuadrante de OXY en que se encuentra la proyección P¢. x

–

Para calcular la colatitud q podemos optar por cualquiera de la fórmulas: cos q =

z = r

z x2 + y2 + x2

o

tgq =

r = z

x2 + y2 z

teniendo en cuenta que debe ser 0£ q £ p. Observaciones: a) Si en las coordenadas polares se toma la latitud p f = - q como primer argumento, en lugar de la cola2 titud q, entonces la terna ( r, f, j) son las coordenadas coordenadas esféricas. Se tendrá p p 0 £ j < 2p y- £ f £ . 2 2 Se observa la similitud con las “coordenadas geográficas” sobre la superficie terrestre. b)

P f j

Figura 20.

Un punto P del espacio puede venir dado también por su radio vector r= OP y por los tres ángulos a , b y g que el vector de posiciónOP forma con los semiejes OX+ ,OY+ y OZ+. Tales ángulos están ligados por la relación cos 2 a + cos 2 b + cos 2 g = 1.

4. CURVAS Y SUPERFICIES. GENERALIDADES 4.1. Distintas formas de definir curvas y superficies en el plano y en el espacio La definición de curvas y superficies puede hacerse desde varias perspectivas: a)

Geométrica El conjunto de puntos del plano o del espacio caracterizado mediante una determinada propiedad, se denomina lugar geométrico. Una curva o una superficie pueden ser definidas a veces como lugares geométricos. Así, pues, la circunferencia y la superficie esférica son, en el plano y en el espacio, respectiva-


475


476


ì f ( x , y , z) = 0 ï í ïg ( x, y, z) = 0 î

mente, los lugares geométricos definidos por la propiedad característica de equidistar de un punto fijo. Aunque hay que hacer notar que hay lugares geométricos que no son ni curvas ni superficies. También hay curvas o superficies obtenidas mediante transformaciones geométricas (isometrías, homotecias…).

Algebraica Las curvas y las superficies pueden también venir definidas como conjuntos de soluciones de ecuaciones o sistemas de ecuaciones de dos o tres incógnitas. Así, pues, ecuaciones como f ( x, y) = 0 o f ( x, y, z) = 0, pueden definir una curva en el plano o una superficie en el espacio. Sabido es que si f cumple ciertas condiciones, las ecuaciones anteriores definen, en cada caso, a y como función implícita de x, o a z como función implícita de x e y (véase en cualquier tratado de Análisis Matemático el importante teorema de la función implícita). Asimismo una curva alabeada en el espacio puede ser el conjunto de puntos solución de un sistema Dinámica

d)

b)

Desde este punto de vista una curva o una superficie se pueden entender como la gráfica de una función explícita de una o dos variables respectivamente.

Figura 21.

Figura 22. Algunas curvas planas o alabeadas se obtienen por generación mecánica; bastará pensar en la cicloide o en la hélice. Se puede entender una curva como la trayectoria de un punto móvil. Tal movimiento tendrá un solo grado de libertad. Si pensamos en un punto móvil con dos grados de libertad, el conjunto de posiciones posibles de dicho punto configurará una superficie en el espacio. También veremos cómo los movimientos en el plano y en el espacio (traslaciones, giros, rotaciones alrededor de un eje) pueden ser el fundamento de la definición de ciertas curvas o superficies. Pensemos por ejemplo en las espirales, en las cuádricas de revolución o en las superficies helicoides.

(x , y)

x

y

y =f(x)

z

Analítica

Analítica

c)

z =f(x, y)

c)

Algunas curvas planas o alabeadas se obtienen por generación mecánica; bastará pensar en la cicloide o en la hélice. Se puede entender una curva como la trayectoria de un punto móvil. Tal movimiento tendrá un solo grado de libertad. Si pensamos en un punto móvil con dos grados de libertad, el conjunto de posiciones posibles de dicho punto configurará una superficie en el espacio. También veremos cómo los movimientos en el plano y en el espacio (traslaciones, giros, rotaciones alrededor de un eje) pueden ser el fundamento de la definición de ciertas curvas o superficies. Pensemos por ejemplo en las espirales, en las cuádricas de revolución o en las superficies helicoides. z =f(x, y)

z

y =f(x)

y

x

(x , y)

Figura 22. Figura 21.

Desde este punto de vista una curva o una superficie se pueden entender como la gráfica de una función explícita de una o dos variables respectivamente. Algebraica Las curvas y las superficies pueden también venir definidas como conjuntos de soluciones de ecuaciones o sistemas de ecuaciones de dos o tres incógnitas. Así, pues, ecuaciones como f ( x, y) = 0 o f ( x, y, z) = 0, pueden definir una curva en el plano o una superficie en el espacio. Sabido es que si f cumple ciertas condiciones, las ecuaciones anteriores definen, en cada caso, a y como función implícita de x, o a z como función implícita de x e y (véase en cualquier tratado de Análisis Matemático el importante teorema de la función implícita). Asimismo una curva alabeada en el espacio puede ser el conjunto de puntos solución de un sistema ì ï f ( x , y , z) = 0 í ï îg ( x, y, z) = 0 b)

d)

Dinámica

mente, los lugares geométricos definidos por la propiedad característica de equidistar de un punto fijo. Aunque hay que hacer notar que hay lugares geométricos que no son ni curvas ni superficies. También hay curvas o superficies obtenidas mediante transformaciones geométricas (isometrías, homotecias…).



476


4.2. Ecuaciones de una curva en el plano La ecuación de una curva en el plano euclídeo, puede venir dada de varias formas:

–

En coordenadas cartesianas puede adoptar la forma explícita y = f ( x). En la forma implícita vendrá dada por F ( x, y) = 0, ecuación que, bajo determinadas condiciones de la función F , define implícitamente a y como función de x.

–

Asimismo, en coordenadas polares puede adoptar la forma explícita r = f ( q) o la forma implícita F ( r, q) = 0.

–

Finalmente, una curva puede venir dada por dos ecuaciones dependientes de un parámetro, como veremos a continuación. Una curva parametrizada (o en paramétricas) en E2 es una aplicación continua f:R ® E2. Si tomamos un sistema de referencia canónico en E2 y respecto de dicho sistema las coordenadas de f( t ) son ( x( t ) , y( t )), entonces una curva no es más que una aplicación que a cada número real t Î R hace corresponder un único punto ( x( t ) , y( t )), cuyas coordenadas son funciones del “parámetro” t, es decir: f( t ) = ( g1, g 2)( t ) = ( g1( t ) , g 2( t )) Ni que decir tiene que f es continua si lo son g1 y g 2. ìx = x( t ) = g1( t ) Las ecuaciones í reciben el nombre de ecuaciones paramétricas de la curva. Las î y = y( t ) = g 2( t ) funciones g1 y g 2 han de ser continuas. Si identificamos el parámetro t con el tiempo, podemos dar una interpretación cinemática de las ecuaciones paramétricas. La curva que definen será la trayectoria de un punto móvil. r Si denotamos por x( t ) al vector de posición de un punto genérico de la curva, la ecuación vectorial de la curva es r r r x( t ) = x( t ) e1+ y( t ) e2 Dada una curva parametrizada en el plano mediante su ecuación vectorial, se suele identificar dicha curva con el conjunto imagen de la aplicación f:R ® E2, dada por f( t ) = ( x( t ) , y( t )), es decir con el conjunto de puntos G = {( x , y) Î E2 $t 0 Î R , f( t 0) = ( x , y)}

x(t)

O Figura 23.

Si para un punto P de G es único el valor t 0 se dice entonces que P es un punto simple de la curva. En caso contrario decimos que P es un punto múltiple. Si las funciones x( t ) e y( t ) son continuas y la curva carece de puntos múltiples recibe el nombre de curva de Jordan. r r Si f está definida sobre el intervalo [ a , b ] siendo x( a) = x( b) decimos que la curva es cerrada, o que se tiene un bucle. ìx = cos t Por ejemplo, la aplicación f:[ 0,2p ] ® E2 dada por í P0 G î y = sen t Y x'(t0) es una curva cerrada, pues f( 0) = f( 2p) = (1,0). r r r La derivada de la función vectorial x( t ) = x( t ) e1+ y( t ) e2 x(t0) para t 0, si existe, es el límite: r r x( t 0 + h) - x( t 0) r r r = x¢( t 0) e1+ y¢( t 0) e2 x¢( t 0) = lim O X h ®0 h que nos da un vector tangente a la curva.


Figura 24.

477



La pendiente en un punto genérico será

478

dy y¢( t ) dy . = dt = x¢( t ) dx dx dt

ìx = x( t ) = g1( t ) ï Las ecuaciones í y = y( t ) = g 2( t ) reciben el nombre de ecuaciones paramétricas de la curva. Las ï î z = z( t ) = g 3 ( t ) funciones g1, g 2 y g 3 han de ser continuas. En forma vectorial una curva parametrizada G de E3 viene dada por: r r r r x( t ) = x( t ) e1+ y( t ) e2 + z( t ) e3 r siendo x( t ) el vector de posición de un punto genérico de dicha curva. En el espacio, una curva puede interpretarse como la trayectoria que describe un punto móvil. Así al parámetro “t” se le puede dar un G Z sentido físico, considerándolo como el tiempo. Las curvas contenidas en un plano se denominan curvas planas; las no planas se llaman curvas alabeadas. O Al igual que una recta puede expresarse como la intersección de dos planos, una curva en el espacio puede venir dada mediante la interX x(t) sección de dos superficies Y ì ïF1( x, y, z) = 0 í Figura 25. ï îF2( x, y, z) = 0

Si se tiene x¢( t 0) ¹ 0, decimos entonces que P0(x( t 0) , y( t 0)) es un punto ordinario de la curva G. En caso de que x¢( t 0) = 0, se dice que es un punto singular. En un punto ordinario la ecuación de la recta tangente es y- y( t 0) =

y¢( t 0) (x- x( t 0)) x¢( t 0)

En caso de un punto singular tal que

x¢( t 0) = x¢¢( t 0) = x¢¢¢( t 0) = K= x( n)( t 0) = 0;

x( n+1)( t 0) ¹ 0

la ecuación de la recta tangente vendrá dada por y- y( t 0) =

y( n+1)( t 0)

x( n+1)( t 0)

(x- x( t 0))

Supondremos que una “curva elemental” es la unión de un número finito de arcos de Jordan, de modo que tenga a lo sumo un número finito de puntos múltiples y un número finito de puntos sin tangente. f( t ) = ( g1, g 2 , g 3)( t ) = ( g1( t ) , g 2( t ) , g 3( t ))

4.3. Ecuaciones de una curva en el espacio

Una curva en E3 es una aplicación continua f:R ® E3. Si tomamos un sistema de referencia canónico en E3 y respecto de dicho sistema las coordenadas de f( t ) son ( x( t ) , y( t ) , z( t )), entonces una curva no es más que una aplicación que a cada número real t Î R hace corresponder un único punto ( x( t ) , y( t ) , z( t )), cuyas coordenadas son funciones del “parámetro” t, es decir:

Una curva en E3 es una aplicación continua f:R ® E3. Si tomamos un sistema de referencia canónico en E3 y respecto de dicho sistema las coordenadas de f( t ) son ( x( t ) , y( t ) , z( t )), entonces una curva no es más que una aplicación que a cada número real t Î R hace corresponder un único punto ( x( t ) , y( t ) , z( t )), cuyas coordenadas son funciones del “parámetro” t, es decir: f( t ) = ( g1, g 2 , g 3)( t ) = ( g1( t ) , g 2( t ) , g 3( t ))

4.3. Ecuaciones de una curva en el espacio

ìx = x( t ) = g1( t ) ï Las ecuaciones í y = y( t ) = g 2( t ) reciben el nombre de ecuaciones paramétricas de la curva. Las ï î z = z( t ) = g 3 ( t ) funciones g1, g 2 y g 3 han de ser continuas. En forma vectorial una curva parametrizada G de E3 viene dada por: r r r r x( t ) = x( t ) e1+ y( t ) e2 + z( t ) e3 r siendo x( t ) el vector de posición de un punto genérico de dicha curva. En el espacio, una curva puede interpretarse como la trayectoria que describe un punto móvil. Así al parámetro “t” se le puede dar un G Z sentido físico, considerándolo como el tiempo. Las curvas contenidas en un plano se denominan curvas planas; las no planas se llaman curvas alabeadas. O Al igual que una recta puede expresarse como la intersección de dos planos, una curva en el espacio puede venir dada mediante la intersección de dos superficies

Supondremos que una “curva elemental” es la unión de un número finito de arcos de Jordan, de modo que tenga a lo sumo un número finito de puntos múltiples y un número finito de puntos sin tangente. y- y( t 0) =

y( n+1)( t 0) (x- x( t 0)) x( n+1)( t 0)

la ecuación de la recta tangente vendrá dada por

x¢( t 0) = x¢¢( t 0) = x¢¢¢( t 0) = K= x( n)( t 0) = 0;

x( n+1)( t 0) ¹ 0

En caso de un punto singular tal que

y- y( t 0) =

y¢( t 0) (x- x( t 0)) x¢( t 0)

En un punto ordinario la ecuación de la recta tangente es

X

x(t)

Si se tiene x¢( t 0) ¹ 0, decimos entonces que P0(x( t 0) , y( t 0)) es un punto ordinario de la curva G. En caso de que x¢( t 0) = 0, se dice que es un punto singular. Y

Figura 25.

dy y¢( t ) dy . = dt = x¢( t ) dx dx dt

478

ìF1( x, y, z) = 0 ï í ïF2( x, y, z) = 0 î

La pendiente en un punto genérico será



Distintas coordenadas para describir el plano o el espacio Si las coordenadas utilizadas son cilíndricas o polares, una curva G vendrá definida respectivamente por dos ecuaciones de la forma ì ï f1( r, q , z) = 0 í ï f2( r, q , z) = 0 î

o

ì ïg1( r, q , j) = 0 í ïg 2( r, q , j) = 0 î

4.4. Ecuaciones de una superficie en el espacio Una superficie en el espacio se puede representar de forma paramétrica como ìx = x( t , s) = g1( t , s) ï í y = y( t , s) = g 2( t , s) ï î z = z( t , s) = g 3( t , s)

Z

En cierto modo, se pueden interpretar las expresiones anteriores considerando una superficie como una deformación de un plano, ya que los puntos del plano están descritos por dos parámetros. Una superficie parametrizada S (o en paramétricas) en el espacio euclídeo E3 viene dada por una aplicación continua j: ( t , s) ® ( x( t , s) , y( t , s) , z( t , s)) de un dominio D del plano euclídeo en E3. Se suele identificar la superficie con la imagen de dicha aplicación. r r r r En forma vectorial x( t , s) = x( t , s) e1+ y( t , s) e2 + z( t , s) e2.

P

O

Y X

Figura 26.

Para un punto P( x , y , z) de dicha superficie a ( t , s) se les denomina coordenadas intrínsecas de P.

Otra forma de describir una superficie en el espacio es mediante la ecuación implícita F( x , y , z) = 0 En determinadas condiciones para la función F, la ecuación anterior permitirá obtener la ecuación explícita z = f ( x, y). En tal caso una parametrización inmediata sería ìx = t ï íy= s ï î z = f ( t , s) También puede venir dada en cilíndricas f ( r, q , z) = 0 o en polares f ( r, q , j) = 0.

5. ALGUNOS EJEMPLOS DE CURVAS PLANAS Y ALABEADAS 5.1. Algunos ejemplos de curvas en forma explícita En la forma explícita una curva se interpreta como la gráfica de una función real de variable real. Si una curva viene dada en forma explícita y = f ( x), fácilmente se puede expresar en forma paramétrica ìx = t í î y = f ( t) No nos explayaremos aquí, sino que nos limitaremos a recoger de modo sucinto algunas curvas que se asocian con la gráfica de funciones conocidas. TEMARIO DE MATEMÁTICAS. PRUEBA A

479


480


.../...

Función

Denominación

Curva Y

Parábola cúbica

O

X

y = x2

y=3 x

Y

Parábola X O

X

O

Parábola (rama superior) y = x3

Y

Parábola cúbica O

1

X

O

Curva de Agnesi Y 1

Y

Hipérbola equilátera

-1

1

X

O

Gráfica de la función fraccionaria

1 -1 O

1 y= x

y =+ x

Y 1

X

1 y= 1+ x 2 -1

1

1 x2

y=

1

X

Y Y

Gráfica de la función fraccionaria O

Hipérbola equilátera

-1

-1

1 y= 2 x

1 -1 O

1

1 x

1

X

1

X

Y 1

1 y= 1+ x 2 X

Curva de Agnesi X O

1

1

Y

y =+ x

y=

Y O

Parábola cúbica

y = x3

Y

Parábola (rama superior) O

X

O X Y

Parábola y=3 x

Parábola cúbica

y = x2

O

X

Y

Función

Denominación

Curva

.../...

480



Distintas coordenadas para describir el plano o el espacio .../... Y

ìx = t 3 2 y = x 3í 2 îy=t

Parábola de Neil

X O Y

ìx = t 2 3 y = x 2í 3 îy=t

Parábola semicúbica

Y

y=cos x

y = senx y = cos x

X

O

y=sen x

1

Sinusoide y cosinusoide

p -¾

-p

p

p ¾

O

2

2

-1

y= tgx

y = tgx y = ctgxx

y= ctgx 3

Tangentoide y cotangentoide

2 1 p -p - ¾

3p -¾

0

2

2

p

p ¾ 2

3p ¾ 2

-1 -2 -3

Y 1 1

y = ln x

Curva logarítmica

O

e

X

y

y = ex y = e-x

Curvas exponenciales y= ex -1

1

y= e-x O

1

X

.../...


481


482


.../... u cos q + v sen q =

1 r

[ 8] y = e-x

y 1

Campana de Gauss

2

Según nuestras definiciones la recta sería la “curva” más sencilla. Tanto la forma cartesiana como la vectorial y paramétrica son de sobra conocidas. Nos limitaremos sólo a obtener la ecuación de la recta en polares. Si la recta pasa por el polo, su ecuación polar es q = q 0 (figura 27 a). Si partimos de la ecuación cartesiana en forma general Ax+ By+ C = 0 de una recta que no pasa por el polo, podemos efectuar el cambio a polares obteniendo Arcos q + Brsen q + C = 0, de donde la ecua-C . Al no pasar por el origen es C ¹ 0, ción polar de la recta puede expresarse como A cos q + B sen q = r -A -B y v= , quedando la ecuación polar de la forma: C C

por lo que podemos tomar u = -

O

1 ¾

1 ¾

2

2

Y

5

4

ex - e-x y = shx = 2 ex - e-x y = chx = 2

3

2

Gráficas de las funciones hiperbólicas

y= chx

-3

y= shx

1

-2

0

-1

1

2

X

3

-1

5.2. La recta y su ecuación polar -2

-3 -4

O

-5

a

Y

X

x y = ach a

Catenaria

5

Y

4

y=cthx

3

ex - e-x y = thx = x -x e +e ex + e-x y = cthx = x -x e -e


2

y=thx

1 -3

-2

0

-1

1

2

X

-4

-3

y= cthx

-2

-1

ex - e-x y = thx = ex + e-x ex + e-x ex - e-x

-1

-2

y = cthx =

y= cthx

-3

-4


-2

-3

-1

0

1

X

2

1

y=thx

2 3

Y

y=cthx

4 5

x a

Catenaria

Y

y = ach

a X O

-5 -4 -3

-2

5.2. La recta y su ecuación polar Gráficas de las funciones hiperbólicas

ex - e-x y = shx = 2 ex - e-x 2

Campana de Gauss

y = e-x

y = chx =

-1

-3

-2

-1

0

1

2

3

Según nuestras definiciones la recta sería la “curva” más sencilla. Tanto la forma cartesiana como la vectorial y paramétrica son de sobra conocidas. Nos limitaremos sólo a obtener la ecuación de la recta en polares. Si la recta pasa por el polo, su ecuación polar es q = q 0 (figura 27 a). Si partimos de la ecuación cartesiana en forma general Ax+ By+ C = 0 de una recta que no pasa por el polo, podemos efectuar el cambio a polares obteniendo Arcos q + Brsen q + C = 0, de donde la ecua-C . Al no pasar por el origen es C ¹ 0, ción polar de la recta puede expresarse como A cos q + B sen q = r -A -B y v= , quedando la ecuación polar de la forma: por lo que podemos tomar u = C C 1 [ 8] u cos q + v sen q = r 1

y= chx

X

y= shx

2

3

4

5

Y

2

-

2

1 ¾

2

O

1 ¾

1

y

.../... CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


482


r P

r

H

(b)

(a)

r

q0

j d

q

O

O

Figura 27.

También podemos llegar a la ecuación polar a partir de la distancia d del polo a la recta y del ángulo j que forma el eje polar y la perpendicular a la recta desde el polo (figura 27 b). En efecto, si P( r, q) es un punto de la recta r, considerando el triángulo OHP tendremos ÐPOH = j- q, de donde: cos( j- q) =

OH d = Þ OP r

r=

d

[ 9]

cos( j- q)

Si la ecuación viene dada de la forma anterior, para representar la recta bastaría determinar el punto H de coordenadas polares ( d ,j) y la recta sería la perpendicular por H a OH. Desarrollando [ 9] 1 cos( j- q) cos jcos q + sen j sen q = = r d d cos j sen q . , v= d d Veamos otra manera de llegar a la ecuación polar. De la ecuación cartesiana Ax+ By+ C = 0 llegamos a Arcos q + Br sen q + C = 0. Sabemos que

que se identifica con [ 8] poniendo u =

OD =

-C A2+B2

Þ

C = -OD A 2 + B 2

Las componentes del vector OD son (OD cos j,OD sen j). Pero como ese vector es perpendicular a la recta será proporcional al ( A , B) que también lo es. Entonces: A = kOD cos j, B = kOD sen j Þ A 2 + B 2 = k 2 ×OD Þ k ×OD = De donde A =

A 2 + B 2 cos j y B =

A2+B2

A 2 + B 2senj.

Si llevamos los valores de A, B y C a la ecuación polar de la recta: A=

A 2 + B 2 cos jrcos q + A 2 + B 2sen j rsen q - OD A 2 + B 2 = 0

Simplificando: r(cos jcos q + sen j sen q) - d = 0, donde d = OD. Queda, por tanto: rcos( q - j) - d = 0 TEMARIO DE MATEMÁTICAS. PRUEBA A

483


484


Hay una forma elegante de obtenerla como lugar geométrico sencillo: Tomemos dos circunferencias concéntricas con centro en O(0,0) y radios respectivos a y b (supondremos a > b). Toda semirrecta que parte de O y forma un ángulo t con el eje OX intercepta en las circunferencias dadas sendos puntos A( a cos t , asent ) y B( b cos t , bsent ).

5.3. La circunferencia Figura 29.

Las ecuaciones paramétricas

ìx = rcos t í î y = rsent

[10]

O

definen una curva cuyos puntos verifican x2 + y2 = r2(cos 2 t + sen 2t ) = r2, es decir, son las ecuaciones paramétricas de una circunferencia centrada en O(0,0) y de radio r.

a) Elipse

B

En el tema 54 se hace un estudio detallado de estas curvas, por lo que nos limitaremos tan sólo a algunos aspectos.

P

La ecuación cartesiana x 2 + y 2 = r2 contempla la circunferencia como lugar geométrico, mientras que las ecuaciones paramétricas [10] la describen como la trayectoria de un punto móvil. Si variamos t entre 0 y 2p la circunferencia se recorre en sentido positivo, es decir, contrario al de las agujas del reloj. Asimismo, ìx = rcos t describastaría cambiar t por -t, y las ecuaciones í î y = - rsent ben la misma circunferencia, aunque recorrida en sentido negativo, cuando t varía entre 0 y 2p. Una generalización de lo dicho anteriormente es una circunferencia de radio r centrada en ( x0 , y0), cuyas ecuaciones paramétricas son

5.4. Las cónicas

X

A

r C d

r2 + d 2 - 2 rd cos( q - a) = r2

q

( rcos q - d cos a) 2 +( rsen q - d sen a) 2 = r2

r

de donde resulta desarrollando:

a

O

( d ,a) donde x0 = d cos a e y0 = d sen a. Sustituyendo en la ecuación ( x- x0) + ( y- y0) = r2, tendremos 2

2

Si el polo no coincide con el centro de la circunferencia, entonces las coordenadas polares de éste serán

Figura 28.

ìx = x0 + rcos t í î y = y0 + rsen t

r= r = cte

Si tomamos como polo el centro de la circunferencia, el cambio a polares x = rcos q , y = rsen q, nos lleva, sustituyendo en la ecuación x2 + y2 = r2, hasta la ecuación polar: y cuya ecuación cartesiana implícita es, como sabemos: ( x- x0) + ( y- y0) = r2. 2

2

Si tomamos como polo el centro de la circunferencia, el cambio a polares x = rcos q , y = rsen q, nos lleva, sustituyendo en la ecuación x2 + y2 = r2, hasta la ecuación polar: y cuya ecuación cartesiana implícita es, como sabemos: ( x- x0) + ( y- y0) = r2. 2

r= r = cte

Figura 28.

2

ìx = x0 + rcos t í î y = y + rsen t 0

Si el polo no coincide con el centro de la circunferencia, entonces las coordenadas polares de éste serán

La ecuación cartesiana x 2 + y 2 = r2 contempla la circunferencia como lugar geométrico, mientras que las ecuaciones paramétricas [10] la describen como la trayectoria de un punto móvil. Si variamos t entre 0 y 2p la circunferencia se recorre en sentido positivo, es decir, contrario al de las agujas del reloj. Asimismo, ìx = rcos t bastaría cambiar t por -t, y las ecuaciones í descriî y = - rsent ben la misma circunferencia, aunque recorrida en sentido negativo, cuando t varía entre 0 y 2p. Una generalización de lo dicho anteriormente es una circunferencia de radio r centrada en ( x0 , y0), cuyas ecuaciones paramétricas son

( d ,a) donde x0 = d cos a e y0 = d sen a. Sustituyendo en la ecuación ( x- x0) + ( y- y0) = r2, tendremos 2

( rcos q - d cos a) 2 +( rsen q - d sen a) 2 = r2

O

2

a

q

de donde resulta desarrollando:

d

r

r2 + d 2 - 2 rd cos( q - a) = r2

C r

En el tema 54 se hace un estudio detallado de estas curvas, por lo que nos limitaremos tan sólo a algunos aspectos.

A

P

5.4. Las cónicas

X

definen una curva cuyos puntos verifican x2 + y2 = r2(cos 2 t + sen 2t ) = r2, es decir, son las ecuaciones paramétricas de una circunferencia centrada en O(0,0) y de radio r.

B

a) Elipse

O

ìx = rcos t í î y = rsent

Hay una forma elegante de obtenerla como lugar geométrico sencillo: Tomemos dos circunferencias concéntricas con centro en O(0,0) y radios respectivos a y b (supondremos a > b). Toda semirrecta que parte de O y forma un ángulo t con el eje OX intercepta en las circunferencias dadas sendos puntos A( a cos t , asent ) y B( b cos t , bsent ).

[10]

Las ecuaciones paramétricas

5.3. La circunferencia



484

Figura 29.

Distintas coordenadas para describir el plano o el espacio El lugar geométrico de los puntos que tienen la misma abscisa que A y la misma ordenada que B ìx = a cos t constituye una curva de ecuaciones paramétricas í , que resulta ser una elipse de centro O y seî y = bsent miejes a y b. Es fácil verlo, ya que eliminando el parámetro llegamos a la ecuación cartesiana implícita æ x ö æ yö cos 2 t + sen 2 t = ç ÷ +ç ÷ = 1 èaø è b ø 2

2

Þ

x2 y2 + =1 a2 b2

Asimismo una elipse de centro ( x0 , y0) y semiejes a y b, puede venir dada en forma paramétrica meìx = x0 + a cos t diante las ecuaciones í î y = y0 + b sent Para obtener la ecuación polar de la elipse, tomemos como polo uno de los focos F y como eje polar la semirrecta FA, siendo A el vértice de la elipse más próximo a F. Entonces las coordenadas polares del punto P( r, q) cumplen: ìPD = d- rcos q í , siendo d la distancia del foco F a la diîPF = r = r rectriz. Como se verifica PF = ePD, siendo e la excentricidad obtenemos r = e( d- rcos q), de donde r=

ed 1+ ecos q

P r

D

q

F

d

Figura 30.

que es la llamada ecuación polar o focal de la elipse. æa ö a 2 - c2 b 2 El numerador es también ed = eç - c÷= a - ec = = por lo que la ecuación anterior pueèe ø a a b2 x2 y2 , a la que también se llega efectuando en 2 + 2 = 1 el cambio a de ponerse en la forma r = a + ccos q a b ìx- c = rcos q polares í î y = rsen q

b) Hipérbola Una hipérbola que tiene su centro de simetría en el origen de coordenadas y sus focos en el eje OX, admite una parametrización sencilla utilizando las funciones hipérbolicas, a saber: ì et + e-t ï ïx = acht = a 2 í e t - e-t ï y = b sh t = b ï î 2 x2 y2 - = ch 2t - sh 2t = 1. a2 b2 ì a ïx = También sirven las í cos t , ya que entonces también sería: ï î y = btgt En efecto, tendríamos

x2 y2 a2 b 2tg 2t 1 sen 2t 1- sen 2t cos 2 t = =1 = = 2- 2 = 2 2 2 2 cos 2 t cos 2 t a b a cos t b cos t cos 2 t TEMARIO DE MATEMÁTICAS. PRUEBA A

485



que como vemos es similar a la de la elipse y la hipérbola para e = 1.

De manera similar a la elipse, para una hipérbola de eje real horizontal centrada en el origen de coordenadas, podemos expresar su ecuación en coordenadas polares, tomando como polo uno de los focos. Por ejemplo, para la rama de la izquierda, tomamos como polo el foco F ¢.

p p - rcos q + y se llega a la ecuación polar o focal: 2 2

Si P ( r, q) es un punto de la hipérbola se tiene ì ïPD = d- rcos q í , donde d es la distancia del foco F a ï îPF = r = r la directriz.

Figura 32.

F

X

p - rcos q 2

r

ed 1+ ecos q

Sea una parábola de eje de simetría OX y vértice en el origen de coordenadas. Tomamos como polo el foco F y como eje polar el eje de simetría. Si las coordenadas polares de un punto cualquiera de la parábola son P ( r, q), entonces:

P

r=

D

x=

p 2

Como se verifica PF = ePD, obtenemos r = e( d- rcos q), de donde

q

r = PF = PD = x+

Figura 31.

A

d

Sustituyendo r =

p 1+ cos q

q

r=

D

r

F

486

P

que es la ecuación polar o focal de la hipérbola. El numerador puede ponerse como

Y

æ aö c2 - a 2 b 2 ed = eç c - ÷= ec - a = = è eø a a ìx = t 2 2 p í îy= t

ìx = t í 2 îy= t 2p

por lo que la ecuación anterior quedaría en la forma

o

r=

b2 a + ccos q

La parábola es también fácilmente parametrizable. Así, pues, para la y2 = 2 px o la x2 = 2 py, por ejemplo, bastaría tomar respectivamente las ecuaciones paramétricas: x2 y2 - = 1 el cambio a polares x + c = rcos q e y = rsen q. a2 b2

c) Parábola

x2 y2 - = 1 el cambio a polares x + c = rcos q e y = rsen q. a2 b2

c) Parábola

a la que también se llega efectuando en

a la que también se llega efectuando en

La parábola es también fácilmente parametrizable. Así, pues, para la y2 = 2 px o la x2 = 2 py, por ejemplo, bastaría tomar respectivamente las ecuaciones paramétricas: b2 a + ccos q o

r=

ìx = t í 2 îy= t 2p

por lo que la ecuación anterior quedaría en la forma

ìx = t 2 2 p í îy= t

æ aö c2 - a 2 b 2 ed = eç c - ÷= ec - a = = è eø a a

Y

Sea una parábola de eje de simetría OX y vértice en el origen de coordenadas. Tomamos como polo el foco F y como eje polar el eje de simetría. Si las coordenadas polares de un punto cualquiera de la parábola son P ( r, q), entonces:

que es la ecuación polar o focal de la hipérbola. El numerador puede ponerse como ed 1+ ecos q

r

p p - rcos q + y se llega a la ecuación polar o focal: 2 2



486

D

que como vemos es similar a la de la elipse y la hipérbola para e = 1.

P

p 1+ cos q

r

De manera similar a la elipse, para una hipérbola de eje real horizontal centrada en el origen de coordenadas, podemos expresar su ecuación en coordenadas polares, tomando como polo uno de los focos. Por ejemplo, para la rama de la izquierda, tomamos como polo el foco F ¢. r=

p 2

q

Sustituyendo r =

r = PF = PD = x+

d

Si P ( r, q) es un punto de la hipérbola se tiene ìPD = d- rcos q ï í , donde d es la distancia del foco F a ï îPF = r = r la directriz.

Figura 32.

p - rcos q 2

F

F

x=

Figura 31.

A

X

Como se verifica PF = ePD, obtenemos r = e( d- rcos q), de donde

q

r=

P

D


5.5. Curvas obtenidas por generación mecánica Ya se dijo que una curva puede entenderse como la trayectoria de un punto móvil; es decir, como el lugar de las distintas posiciones del punto al variar el tiempo t . Pero hay curvas que pueden ser obtenidas mecánicamente con parámetros distintos del tiempo. Veremos algunos ejemplos interesantes.

a) La cicloide La cicloide, que es el lugar descrito por un punto P de una circunferencia (“ruleta”) que rueda sin deslizarse por una recta fija. Puede visualizarse pegando un adhesivo en un punto del borde de la rueda de una bicicleta; al correr con dicha bicicleta, el adhesivo describe una cicloide. Consideremos que en su posición inicial dicho punto es el punto de tangencia y coincide con el origen de coordenadas.

C

2a

X

Figura 33.

O A

D t

B

Sea a el radio de la circunferencia que rueda. Para una posición genérica X del punto P tomamos como parámetro el ángulo girado t en radianes, es decir t = ÐBCX . Entonces, teniendo en cuenta que OB = arco BX = at , las coordenadas ( x, y) de X vendrán dadas por: ìx = OA = OB - AB = OB - XD = at - asent = a( t - sent ) í î y = AX = BC - CD = a - a cos t = a(1- cos t ) Las ecuaciones paramétricas de la cicloide son, pues : ìx = a( t - sen t ) í î y = a(1- cos t ) Como vemos x e y son funciones continuas de t. Si hacemos variar t desde 0 hasta 2p obtenemos un arco de Jordan. Para t = 0 , tenemos la posición inicial (0,0) y para t = 2p la posición ( 2pa,0), en que la “ruleta” ha dado una vuelta completa y el punto P vuelve de nuevo a la posición de contacto con la recta fija. La ordenada máxima en ese intervalo es igual al diámetro; se obtiene obviamente para t = p, que es cuando la posición del punto es ( pa ,2a). Para valores de t superiores a 2p, la forma de la curva se va repitiendo de manera periódica. Los puntos obtenidos para t = 2kp, con k entero, se denominan puntos de retroceso de la cicloide. La cicloide tiene asombrosas propiedades tanto geométricas como físicas. Así, pues:

–

La longitud de cicloide entre dos puntos de retroceso consecutivos es 8 veces mayor que el radio de la circunferencia giratoria.

–

El área encerrada bajo el arco de cicloide es tres veces el área del círculo que la genera.


P1

P2

H Figura 34.

487


488


Epicicloide: la definición es similar a la anterior, con la diferencia de que la rodadura se produce por el exterior. La ruleta gira sin resbalar, permaneciendo siempre la tangente exterior a la circunferencia directriz.

–

Hipocicloide: la base y la ruleta son circulares, produciéndose la rodadura por el interior de la base. Se trata, pues, de la curva que describe un punto invariable de una circunferencia móvil, al rodar ésta en contacto interior con otra circunferencia.

–

– –

Si dejamos caer por su propio peso una bolita colocada sobre un arco de cicloide invertida, el tiempo que tarda en llegar al punto más bajo H es el mismo, independientemente del punto de partida. Decimos que se trata de una curva tautócrona. Asimismo, la cicloide es una curva isócrona. Esto quiere decir que un punto material que se desplace sobre ella por su propio peso, sigue un movimiento periódico cuyo período es independiente del punto de partida.

En general, un curva cíclica es la generada por un punto de una línea móvil, cuando ésta rueda sin resbalar sobre una línea situada en su mismo plano. A efectos de nomenclatura, se denomina “base” o directriz” de la rodadura al elemento fijo, mientras que al elemento móvil se le llama “ruleta” o elemento generador. Según vimos, en el caso de la cicloide la base es recta y la ruleta circular. Pero cuando la base es también circular se obtienen otras curvas cíclicas, que se denominan:

–

Si A y B son dos puntos de un plano vertical, el camino más corto es el segmento AB obviamente, pero no es el más rápido. La curva de descenso más rápido entre tales puntos es la cicloide.

La cicloide es una curva con mucha historia. Ptolomeo (200 a.C.) la utilizó para describir los movimientos de los planetas del sistema solar. El estudio de sus propiedades ocupó a muchos matemáticos y se vincula al nacimiento del cálculo de variaciones, que fue la antesala del nacimiento del cálculo infinitesimal, allá por el siglo XVII. Así, pues, Johan Bernouilli, en 1696, planteó el problema de la braquistócrona (del griego “tiempo breve”), curva de descenso más rápido entre dos puntos de un plano vertical. Con ello Johan Bernouilli retó a los matemáticos de la época a que le B enviaran en un plazo determinado la solución correcta. Se cree que la intención de Johan Bernouilli era derrotar a su hermano Jakob, o tal vez humillar al gran Newton. Este último le hizo llegar, no obstante, una de las Figura 35. cuatro soluciones que recibió aquel. Al final el propio Bernouilli reveló que la braquistócrona no era más que la cicloide de Huygens invertida. Efectivamente, Christian Huygens (1629-1695), físico-matemático holandés, con motivo de sus investigaciones sobre el movimiento pendular, había realizado un estudio minucioso de la cicloide. Llegó a demostrar que si un péndulo oscila entre dos topes en forma de cicloide invertida, ese período es el mismo sea cual sea la amplitud de las oscilaciones. Esto se conoce como péndulo isócrono de Huygens (figura 36). Si se elige el punto P bien en el interior de círculo o bien en la prolongación del radio, se obtienen variantes de la cicloide que se denominan trocoides (figura 37). Figura 36. A

b) Otros tipos de curvas cíclicas: hipocicloides y epicicloides Figura 37.

(b)

(a)

P

P

Figura 36.

La cicloide es una curva con mucha historia. Ptolomeo (200 a.C.) la A utilizó para describir los movimientos de los planetas del sistema solar. El estudio de sus propiedades ocupó a muchos matemáticos y se vincula al nacimiento del cálculo de variaciones, que fue la antesala del nacimiento del cálculo infinitesimal, allá por el siglo XVII. Así, pues, Johan Bernouilli, en 1696, planteó el problema de la braquistócrona (del griego “tiempo breve”), curva de descenso más rápido entre dos puntos de un plano vertical. Con ello Johan Bernouilli retó a los matemáticos de la época a que le B enviaran en un plazo determinado la solución correcta. Se cree que la intención de Johan Bernouilli era derrotar a su hermano Jakob, o tal vez humillar al gran Newton. Este último le hizo llegar, no obstante, una de las Figura 35. cuatro soluciones que recibió aquel. Al final el propio Bernouilli reveló que la braquistócrona no era más que la cicloide de Huygens invertida. Efectivamente, Christian Huygens (1629-1695), físico-matemático holandés, con motivo de sus investigaciones sobre el movimiento pendular, había realizado un estudio minucioso de la cicloide. Llegó a demostrar que si un péndulo oscila entre dos topes en forma de cicloide invertida, ese período es el mismo sea cual sea la amplitud de las oscilaciones. Esto se conoce como péndulo isócrono de Huygens (figura 36). Si se elige el punto P bien en el interior de círculo o bien en la prolongación del radio, se obtienen variantes de la cicloide que se denominan trocoides (figura 37). P

P

Figura 37.

(a)

(b)

b) Otros tipos de curvas cíclicas: hipocicloides y epicicloides

En general, un curva cíclica es la generada por un punto de una línea móvil, cuando ésta rueda sin resbalar sobre una línea situada en su mismo plano. A efectos de nomenclatura, se denomina “base” o directriz” de la rodadura al elemento fijo, mientras que al elemento móvil se le llama “ruleta” o elemento generador. Según vimos, en el caso de la cicloide la base es recta y la ruleta circular. Pero cuando la base es también circular se obtienen otras curvas cíclicas, que se denominan:

Si A y B son dos puntos de un plano vertical, el camino más corto es el segmento AB obviamente, pero no es el más rápido. La curva de descenso más rápido entre tales puntos es la cicloide.

–

Asimismo, la cicloide es una curva isócrona. Esto quiere decir que un punto material que se desplace sobre ella por su propio peso, sigue un movimiento periódico cuyo período es independiente del punto de partida.

–

Si dejamos caer por su propio peso una bolita colocada sobre un arco de cicloide invertida, el tiempo que tarda en llegar al punto más bajo H es el mismo, independientemente del punto de partida. Decimos que se trata de una curva tautócrona.

–

–

488

Hipocicloide: la base y la ruleta son circulares, produciéndose la rodadura por el interior de la base. Se trata, pues, de la curva que describe un punto invariable de una circunferencia móvil, al rodar ésta en contacto interior con otra circunferencia.

Epicicloide: la definición es similar a la anterior, con la diferencia de que la rodadura se produce por el exterior. La ruleta gira sin resbalar, permaneciendo siempre la tangente exterior a la circunferencia directriz. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


–

Distintas coordenadas para describir el plano o el espacio Nota: si la base es circular y la ruleta es recta, al contrario que la cicloide, se tiene la envolvente de la circunferencia. Vamos a suponer que el radio de la circunferencia fija o directriz es R y el de la móvil o ruleta es r. Si se trata de hipocicloides las ecuaciones paramétricas que se obtienen son

R

r t

ì æR ö x = ( R – r) cos t + rcosç – 1÷t ï ï èr ø í æ R ï y = ( R – r) sen t + rsenç – 1ö ÷t ï èr ø î

Figura 38.

Para diferentes razones de rodadura R r se obtienen tipos particulares de hipocicloides: (a)

(b)

P P

Figura 39.

–

Si R r= 3, tenemos la hipocicloide de tres retrocesos, también llamada deltoide o hipocicloide natural de Steiner (figura 39 a).

–

Si R r= 4, tenemos la hipocicloide de cuatro retrocesos o astroide (figura 39 b).

En caso de epicicloides destacaremos tres casos especiales:

–

Si R r< 1, es decir, si el radio de la ruleta es mayor que el de la directriz, se tiene la denominación de pericicloide.

–

Si R r= 1, es decir, la ruleta y la directriz tienen igual radio, se obtiene la cardioide.

–

Si R r= 2, es decir, si el radio de la directriz es el doble del de la ruleta, tenemos la nefroide. r

Vamos a obtener las ecuaciones particulares de algunas de ellas.

–

Astroide Haciendo R = 4r en las ecuaciones paramétricas de las hipocicloides tendremos ì x = 3rcos t + rcos 3t í î y = 3rsen t + rsen 3t Utilizando la fórmula de Moivre, a partir de (cos t + i sen t )3 = cos 3t + i sen 3t


R

Figura 40. 489


490


llegaremos fácilmente a cos 3t = 4 cos 3 t – 3cos t , sen 3t = 3sen t – 4 sen 3t que permiten llegar a una parametrización sencilla de la astroide: ì x = R cos 3 t í 3 î y = R sen t

ì x = r – 2rcos t + rcos 2t Por tanto, una parametrización de la cardioide sería í î y = 2rsen t – rsen 2t æ pö = 2rsen t – rcosç 2t – ÷= 2rsen t + rsen 2t è 2ø

y = AX = A ' X ' = A 'C ' – X 'C ' = 2rsen t – rcos(ÐA 'C ' X ) =

El paso a cartesianas es inmediato, quedando la ecuación implícita x2 3 + y2 3 = R 2 3. æ ö p = ( r – 2rcos t ) – rsenç 2t – ÷= r – 2rcos t + rcos 2t è 2ø

–

Cardioide La denominación de esta bella curva se debe a su forma de corazón. Se trata de un caso particular del llamado caracol de Pascal. Sean dos circunferencias de radio r tangentes entre sí, una fija y la otra que rueda sin resbalar permaneciendo tangente a aquella. El lugar geométrico de las diferentes posiciones de un punto de la circunferencia móvil es la cardioide. A partir de la figura adjunta vamos a obtener una parametrización de la cardioide. Sea c la circunferencia fija y c'la móvil. Suponemos que el punto de tangencia en la posición inicial es O y que, al moverse c' este punto va tomando posiciones X y describiendo la curva. x = – OA = OA ' – AA ' = (OC – A 'C ) – AA ' = ( r – 2rcos t ) – rsen (ÐA 'C ' X ) =

Entonces

Tomaremos como parámetro t el ángulo barrido por el segmento CC ' que une los centros de ambas circunferencias, es decir t = ÐOCC ' = ÐOCT , siendo T el punto de tangencia correspondiente a la posición X del punto que genera la cardioide. Ahora bien, se tiene arco OT = arco OX, por lo cual ÐOCT = ÐTC ' X = t . æp ö p Además ÐA 'C ' X = ÐCC ' X – ÐA 'C 'C = t – ç – t ÷= 2t – . è2 ø 2

Figura 41.

C’

X

X’ c

X

c

O t A’ C

c’

A’ C

A

A

c’

O t

Figura 41.

X’ C’

Tomaremos como parámetro t el ángulo barrido por el segmento CC ' que une los centros de ambas circunferencias, es decir t = ÐOCC ' = ÐOCT , siendo T el punto de tangencia correspondiente a la posición X del punto que genera la cardioide. Ahora bien, se tiene arco OT = arco OX, por lo cual ÐOCT = ÐTC ' X = t . æp ö p Además ÐA 'C ' X = ÐCC ' X – ÐA 'C 'C = t – ç – t ÷= 2t – . è2 ø 2

Cardioide La denominación de esta bella curva se debe a su forma de corazón. Se trata de un caso particular del llamado caracol de Pascal. Sean dos circunferencias de radio r tangentes entre sí, una fija y la otra que rueda sin resbalar permaneciendo tangente a aquella. El lugar geométrico de las diferentes posiciones de un punto de la circunferencia móvil es la cardioide. A partir de la figura adjunta vamos a obtener una parametrización de la cardioide. Sea c la circunferencia fija y c'la móvil. Suponemos que el punto de tangencia en la posición inicial es O y que, al moverse c' este punto va tomando posiciones X y describiendo la curva. Entonces

x = – OA = OA ' – AA ' = (OC – A 'C ) – AA ' = ( r – 2rcos t ) – rsen (ÐA 'C ' X ) =

–

æ pö = ( r – 2rcos t ) – rsenç 2t – ÷= r – 2rcos t + rcos 2t è 2ø

El paso a cartesianas es inmediato, quedando la ecuación implícita x2 3 + y2 3 = R 2 3. y = AX = A ' X ' = A 'C ' – X 'C ' = 2rsen t – rcos(ÐA 'C ' X ) = ì x = R cos 3 t í 3 î y = R sen t

æ pö = 2rsen t – rcosç 2t – ÷= 2rsen t + rsen 2t è 2ø

llegaremos fácilmente a cos 3t = 4 cos 3 t – 3cos t , sen 3t = 3sen t – 4 sen 3t que permiten llegar a una parametrización sencilla de la astroide:

ì x = r – 2rcos t + rcos 2t Por tanto, una parametrización de la cardioide sería í î y = 2rsen t – rsen 2t



490

Distintas coordenadas para describir el plano o el espacio Podemos obtener a partir de éstas la ecuación en polares de la cardioide. En efecto, el radio polar del punto X sería: r2 = x2 + y2 = ( r – 2rcos t + rcos 2t ) + ( 2rsen t + rsen 2t ) = 2

2

= r2 + 4 r2 cos 2 t + r2 cos 2 2t – 4 r2 cos t + 2r2 cos 2t – 4 r2 cos t cos 2t + 4 r2 sen 2t +

+r2 sen 2 2t – 4 rsen t sen 2t = 6r2 + 2r2(cos 2t – 2cos t – 2cos t cos 2t – 2sen t sen 2t ) Son conocidas las fórmulas trigonométricas cos 2t = cos 2 t – sen 2t = 2cos 2 t – 1 ; sen 2t = 2sen t cos t Sustituyendo queda: r2 = 6r2 + 2r2( 2cos 2 t – 1 – 2cos t – 4 cos 3 t + 2cos t – 4 sen 2 t ×cos t ) = = 6r2 + 2r2 ( 2cos 2 t – 1 – 4 cos 3 t – 4 sen 2t ×cos t ) = 4 r2 (1+ cos 2 t – 2cos 3 t – 2sen 2 t cos t ) = = 4 r2 (1+ cos 2 t – cos 3 t – 2cos t + cos 3 t ) = 4 r2 (1+ cos 2 t – 2cos t )= 4 r2 (1 – cos t )2 Finalmente r= 2r(1 – cos t ). De aquí podemos obtener la ecuación en polares de la cardioide polar, ya que x r – 2rcos t + rcos 2t r – 2rcos t + r( 2cos 2 t – 1) 2rcos t (–1+ cos t ) cos q = = = = = – cos t r 2r(1 – cos t ) 2r(1 – cos t ) 2r(1 – cos t ) Por tanto la ecuación quedaría: r = 2r(1+ cos q )

X

Esta ecuación polar puede obtenerse directamente si se toma el polo en O y como eje polar el eje de simetría OX0 de la cardioide. El punto de partida (para q = 0) será X0. Tendremos OX 0 = 4 r y ÐX 0OX = ÐC 0CC '. Entonces r= OX = OB + BX Como ÐOBA es recto, serácos q =

[11]

C' B O q

C

A

C0

P0

OB OB , de donde = 2r OA

[12] OB = 2rcos q Observemos que BX y CC ' son paralelas y además CB = C ' X , por lo cual en la figura BCC ' X es un paralelogramo, siendo

Figura 42.

[13] BX = CC ' = 2r Sustituyendo [12] y [13] en [11] llegaremos a r = 2r+ 2rcos q = 2r(1+ cos q )

–

Nefroide Según se dijo, se trata de la epicicloide cuando R = 2r. Recibe este nombre por su forma parecida a la de un riñón. Sus ecuaciones se obtienen de forma similar a la de la cardioide, resultando las que siguen: ì x = 3r cos q – r cos 3q í î y = 3r sen q – r sen 3q

Figura 43.


p

491


492

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA x

Figura 45.

x

c) Espirales y hélices

Las espirales son curvas planas que se forman en general cuando un móvil se desplaza girando alrededor de un “centro” o “polo”, a la vez que se va alejando de éste a cada vuelta. Es decir, es la trayectoria o curva descrita por un punto que se ve afectado simultáneamente por dos movimientos: uno lineal de desplazamiento sobre una recta, y otro angular. Así, pues, si el punto A(a,0) lo sometemos a un giro de ángulo t alrededor de O y a continuación a una homotecia de centro O y razón t, dicho punto se transformaría en el A '( at cos t , at sen t ). El lugar geométrico de los puntos del plano obtenidos para cada valor del parámetro t es una curva de ecuaciones paramétricas y

y

2p 2p

z

z

(b)

(a)

Se trata de una hélice cilíndrica (figura 45 a).

ì x = at cos t í î y = at sen t

Para cada valor de t la distancia del punto al eje OZ es a, por lo cual la hélice anterior está contenida en el cilindro circular de la ecuación x2 + y2 = a 2. ì x = a cos t ï í y = a sen t ï î z = bt

Se trata de la espiral de Arquímedes.

Figura 44.

Resulta la ecuación polar de la citada curva: r = aq. Además de la espiral arquimediana, hay otros tipos de espirales cuyas ecuaciones polares son bastana te sencillas. Tenemos la espiral logarítmica (r = eaq ) y la espiral hiperbólica (r = ). q Las hélices son curvas alabeadas que desde un punto de vista “mecánico” podrían considerarse como trayectorias de móviles en el espacio. Así, pues, un movimiento helicoidal es el que seguiría un punto sometido simultáneamente a un movimiento giratorio alrededor de un eje y a otro movimiento lineal de avance paralelo al eje de rotación. Puede incluso añadirse un tercer movimiento: el alejamiento respecto al eje de rotación. Si partimos del punto A(a,0,0) y lo sometemos a un giro de ángulo t y a un avance paralelo al eje OZ proporcional al ángulo girado, obtendremos el punto A '( a cos t , a sen t , bt ). Si hacemos que el parámetro t recorra todos los valores posibles, entonces el punto A' recorrerá una hélice circular de ecuaciones paramétricas: La ecuación polar se obtiene fácilmente, pues:

r2 = x2 + y 2 = a 2t 2 cos 2 t + a 2t 2 sen 2 t = a 2t 2, de donde r= at. tg q =

y at sen t = = tg t , de donde q = t. x at cos t

Resulta la ecuación polar de la citada curva: r = aq. Además de la espiral arquimediana, hay otros tipos de espirales cuyas ecuaciones polares son bastana te sencillas. Tenemos la espiral logarítmica (r = eaq ) y la espiral hiperbólica (r = ). q Las hélices son curvas alabeadas que desde un punto de vista “mecánico” podrían considerarse como trayectorias de móviles en el espacio. Así, pues, un movimiento helicoidal es el que seguiría un punto sometido simultáneamente a un movimiento giratorio alrededor de un eje y a otro movimiento lineal de avance paralelo al eje de rotación. Puede incluso añadirse un tercer movimiento: el alejamiento respecto al eje de rotación. Si partimos del punto A(a,0,0) y lo sometemos a un giro de ángulo t y a un avance paralelo al eje OZ proporcional al ángulo girado, obtendremos el punto A '( a cos t , a sen t , bt ). Si hacemos que el parámetro t recorra todos los valores posibles, entonces el punto A' recorrerá una hélice circular de ecuaciones paramétricas: tg q =

y at sen t = = tg t , de donde q = t. x at cos t

r2 = x2 + y 2 = a 2t 2 cos 2 t + a 2t 2 sen 2 t = a 2t 2, de donde r= at.

La ecuación polar se obtiene fácilmente, pues: Figura 44.

ì x = a cos t ï í y = a sen t ï î z = bt

Se trata de la espiral de Arquímedes. ì x = at cos t í î y = at sen t

Para cada valor de t la distancia del punto al eje OZ es a, por lo cual la hélice anterior está contenida en el cilindro circular de la ecuación x2 + y2 = a 2. Se trata de una hélice cilíndrica (figura 45 a).

Las espirales son curvas planas que se forman en general cuando un móvil se desplaza girando alrededor de un “centro” o “polo”, a la vez que se va alejando de éste a cada vuelta. Es decir, es la trayectoria o curva descrita por un punto que se ve afectado simultáneamente por dos movimientos: uno lineal de desplazamiento sobre una recta, y otro angular. Así, pues, si el punto A(a,0) lo sometemos a un giro de ángulo t alrededor de O y a continuación a una homotecia de centro O y razón t, dicho punto se transformaría en el A '( at cos t , at sen t ). El lugar geométrico de los puntos del plano obtenidos para cada valor del parámetro t es una curva de ecuaciones paramétricas z

(a)

(b)

z

2p

2p

y

492

x

Figura 45.



x

c) Espirales y hélices

y

Distintas coordenadas para describir el plano o el espacio Si modificamos las ecuaciones paramétricas anteriores, poniendo t en lugar de a, obtenemos ì x = t cos t ï í y = t sen t ï î z = bt

[14]

Observamos ahora que a medida que varía t el valor de z “avanza”. El punto móvil se aleja cada vez más del eje OZ, mientras que su proyección ( x, y ) sobre el plano OXY no describe ahora una circunferencia sino una espiral. 1 Además los puntos de la curva verifican la ecuación cartesiana x2 + y2 = 2 z 2 (que es la ecuación de b un cono circular de eje OZ y vértice en el origen). Las ecuaciones [14] son la ecuaciones paramétricas de una hélice cónica (figura 45 b).

5.6. Otras curvas planas interesantes a) Estrofoide

Y

Esta curva la definiremos como un lugar geométrico. Sea el punto A(a,0) desde el cual se trazarán semirrectas que corten al eje de ordenadas. Sea para una de tales semirrectas el punto Q de corte con OY. Tomemos sobre el mismo semiplano de A con respecto a OY el punto X de la semirrecta AQ tal que XQ = OQ, y sea X ' el simétrico de X respecto de Q. Tendremos, pues, que XQ = X 'Q = OQ. La estrofoide es el lugar geométrico de los puntos X y X '. Si las coordenadas polares de X son (r,q), se tendrá, teniendo en cuenta que el triángulo DOXQ es isósceles: ÐQOX = ÐQXO = p/2 -q ÐOQX = p - 2(p/2 -q ) = 2q

X

Figura 46.

Ahora pasemos al triángulo rectángulo DOAQ y se tendrá ÐOAQ = ÐOAQ = p/2 -2q. Entonces, por el teorema de los senos aplicado al triángulo DOAX: sen (ÐOAX ) sen (ÐOXA) sen ( p 2 – 2q ) sen ( p 2 – q ) cos 2q cos q = Þ = Þ = r a r a OX OA De aquí resulta la ecuación polar que quedaría: cos 2q r= a cos q La ecuación cartesiana es fácil de obtener, ya que sustituyendo cos q = x r y sen q = y r

( x r) – ( y r) cos 2q x2 – y2 =a =a Þ xr2 = a ( x2 – y2 ) cos q x r xr 2

r= a

2

Como r2 = x2 + y 2, quedará en forma implícita: x( x 2 + y 2 ) = a ( x 2 – y 2 ) a+ x Operando puede llegarse a y2 = x2 , que nos daría la forma explícita a– x y = ±x


a+ x a– x 493


494


r = r1 – r2 =

a a – a cos 2 q a(1 – cos 2 q) asen 2 q = Þ r= – a cos q = cos q cos q cos q cos q

b) Rosas

Son curvas cuya ecuación polar es de uno de los tipos r = a sen nq o r = a cos nJ . Según que n sea par o impar la rosa tiene 2n o n pétalos .

Para a > 0, consideremos el punto A ( a ,0 ), la circunferencia de diámetro OA y la recta d de ecuación x = a (su tangente en A). Si desde O trazamos una recta que corta a la circunferencia en el punto C y a la tangente en el punto D, podemos determinar de modo único un punto X de dicha recta tal que OX = CD. El lugar geométrico de todos los puntos X del plano así obtenidos es la cisoide. La ecuación polar de la cisoide de Diocles es fácil de obtener si partimos de la ecuación de la recta d a , y la de la circunferencia, que es r2 = acos q. Entonces el radio en coordenadas polares, que es r1 = cos q vector de los puntos de la cisoide será:

a

a

a

O

X

X

O

a

Figura 48.

Rosa de tres pétalos

Rosa de cuatro pétalos

r = asen 3q

r = a sen 2q Figura 47.

O

x A

X

c) Cisoide de Diocles

En general las cisoides constituyen una familia de curvas definidas como el lugar geométrico de los puntos cuyo radio vector es la suma o diferencia de los de dos curvas dadas C1 y C 2. En el caso particular de que la cisoide se obtenga por diferencia de los radios vectores de una recta ( x = a ) y una circunferencia ( x2 + y2 – ax = 0 ) obtenemos la cisoide de Diocles, descubierta por este matemático griego (s. III a.C) en su intento de resolver el problema de la duplicación del cubo. D

C

y

d

En general las cisoides constituyen una familia de curvas definidas como el lugar geométrico de los puntos cuyo radio vector es la suma o diferencia de los de dos curvas dadas C1 y C 2. En el caso particular de que la cisoide se obtenga por diferencia de los radios vectores de una recta ( x = a ) y una circunferencia ( x2 + y2 – ax = 0 ) obtenemos la cisoide de Diocles, descubierta por este matemático griego (s. III a.C) en su intento de resolver el problema de la duplicación del cubo. d

y

C

D

c) Cisoide de Diocles

X

Figura 47.

O

A x

r = a sen 2q

r = asen 3q

Rosa de cuatro pétalos

Rosa de tres pétalos Figura 48.

a

Para a > 0, consideremos el punto A ( a ,0 ), la circunferencia de diámetro OA y la recta d de ecuación x = a (su tangente en A). Si desde O trazamos una recta que corta a la circunferencia en el punto C y a la tangente en el punto D, podemos determinar de modo único un punto X de dicha recta tal que OX = CD. El lugar geométrico de todos los puntos X del plano así obtenidos es la cisoide. La ecuación polar de la cisoide de Diocles es fácil de obtener si partimos de la ecuación de la recta d a , y la de la circunferencia, que es r2 = acos q. Entonces el radio en coordenadas polares, que es r1 = cos q vector de los puntos de la cisoide será: O

O

a

X

X

a

a

Son curvas cuya ecuación polar es de uno de los tipos r = a sen nq o r = a cos nJ . Según que n sea par o impar la rosa tiene 2n o n pétalos .



494

a a – a cos 2 q a(1 – cos 2 q) asen 2 q = Þ r= – a cos q = cos q cos q cos q cos q

b) Rosas

r = r1 – r2 =

Distintas coordenadas para describir el plano o el espacio Al pasar ahora a cartesianas, fácilmente se tiene la ecuación cartesiana: rcos q = a sen 2 q Þ x = a

y2 Þ x( x2 + y 2) = ay2 x + y2 2

x3 . a– x Esta curva puede expresarse paramétricamente como sigue:

que puede ponerse incluso en la forma explícita y2 =

ì at 2 ïx = 1+ t 2 ï í ï at 3 ïy= î 1+ t 2 Eliminando el parámetro, es sencillo ver que queda la ecuación cartesiana anterior.

d) Folium de Descartes d

y

Se obtiene de forma similar a la anterior. Ahora la recta d es el diámetro perpendicular al OA. Si desde O trazamos una recta que corta a la circunferencia en el punto C y a la tangente en el punto D, podemos determinar de modo único un punto X de dicha recta tal que OX = CD. El lugar geométrico de todos los puntos X del plano así obtenidos es el folium de Descartes. Tomando como origen de coordenadas el punto doble de la curva y como ejes coordenados las tangentes en dicho punto (figura 50) podemos obtener una parametrización de la curva, a saber:

C D O'

X O

ì 3at ïx = 1+ t 3 ï í ï 3at 2 ïy= î 1+ t 3

A x

Figura 49.

Eliminando el parámetro se llega a la ecuación cartesiana: x3 + y 3 – 3axy = 0.

a

3 2 a

y

x

O

x+ y– a = O


495


496


r2 = 2a 2 cos 2q

e) Trisectriz de MacLaurin

Pasando a polares, la ecuación de la lemniscata queda como sigue:

Si la recta d es perpendicular al diámetro, pero pasando por el punto medio del segmentoOO', la curva que resulta se denomina trisectriz de MacLaurin. El nombre de esta curva se debe a que está vinculada al problema clásico de la trisección del ángulo, irresoluble con regla y compás. De igual manera, la cisoide vista antes resuelve otro de tales problemas: el de la duplicación del cubo. ( x,– y ), (– x, y ), (– x ,– y )

Los ejes coordenados son entonces los ejes de simetría de la curva, ya que si un par ( x, y ) es solución de tal ecuación, también lo son los pares

f) Lemniscata de Bernouilli Figura 52.

Sea una circunferencia de radio r y centrada en el punto de coordenadas (r, r). Trazamos por el origen una recta secante a la circunferencia en los puntos C y C '. El lugar geométrico de los puntos X tales que ë OX û=ë CC 'ûo queë OX û=ë C 'C ûes la lemniscata. C'

X

C

O

Y

( x 2 + y 2 )2 = 2a 2 ( x 2 – y 2 ) Si sometemos los ejes coordenados a un giro de 45º se obtiene la ecuación implícita en coordenadas cartesianas Figura 51.

Figura 51.

Si sometemos los ejes coordenados a un giro de 45º se obtiene la ecuación implícita en coordenadas cartesianas ( x 2 + y 2 )2 = 2a 2 ( x 2 – y 2 ) O

Y

C X

C'

ë OX û=ë CC 'ûo queë OX û=ë C 'C ûes la lemniscata.

Sea una circunferencia de radio r y centrada en el punto de coordenadas (r, r). Trazamos por el origen una recta secante a la circunferencia en los puntos C y C '. El lugar geométrico de los puntos X tales que Figura 52.

f) Lemniscata de Bernouilli Los ejes coordenados son entonces los ejes de simetría de la curva, ya que si un par ( x, y ) es solución de tal ecuación, también lo son los pares Si la recta d es perpendicular al diámetro, pero pasando por el punto medio del segmentoOO', la curva que resulta se denomina trisectriz de MacLaurin. El nombre de esta curva se debe a que está vinculada al problema clásico de la trisección del ángulo, irresoluble con regla y compás. De igual manera, la cisoide vista antes resuelve otro de tales problemas: el de la duplicación del cubo. ( x,– y ), (– x, y ), (– x ,– y )

Pasando a polares, la ecuación de la lemniscata queda como sigue:



496

e) Trisectriz de MacLaurin

r2 = 2a 2 cos 2q

Distintas coordenadas para describir el plano o el espacio Y

Y

2

Q P

2

K -a
P

Q

O

O

a
Y Y

k2-a2>a

O

X O

k=a

k> 2a

Figura 53. La lemniscata es un caso particular dentro de una familia de curvas conocidas como óvalos de Cassini, definidas como lugares geométricos por la propiedad característica de que el producto de distancias a dos puntos fijos (focos) es una constante k 2. Si la distancia focal es 2a, estas curvas tienen de ecuación cartesiana ( x2 + y2 + a 2 ) = 4 a 2x2 + k 4. La lemniscata es el caso particular de que k = a.

g) Conchoides o concoides En general son las curvas formadas por los puntos cuyos radios vectores se obtienen sumando o restando una constante a los radios vectores de otra curva C dada.

–

En particular si C es la recta x = a se tienen las conchoides de Nicomedes, que deben su nombre a este matemático griego (s. II a.C.) que las utilizó en el problema de la trisección del ángulo. Pueden obtenerse como sigue: Dado un punto O exterior a una recta d, se traza desde O una recta que corta a d en M. Tomamos dos puntos X y X ' sobre dicha recta tales que XM = X ' M = b, siendo b una constante dada. La conchoide es el lugar geométrico de los puntos X y X ' (figura 54). d

y

X' M X O

x

Figura 54.


497


498


La ecuación polar de dichas curvas (figura 55) sería a r= ±b cos q

A Hipias (s. V a.C.) se le atribuye la introducción de la primera curva, aparte de la circunferencia y la recta. A tal curva se le conoce como trisectriz de Hipias, y se obtiene de la siguiente manera: Sea el cuadrado ABCD. Supongamos que el lado DA gira uniformemente en sentido horario alrededor de D, y simultáneaA B mente el lado AB se desplaza paralelamente con movimiento uniforme, hasta que ambos acaban coincidiendo con DC en el P mismo intervalo de tiempo. En un instante cualquiera las posiB' ciones respectivas de los segmentos móviles son DA'' y A ' B ', y G el punto de intersección P. Entonces la trisectriz de Hipias es el M lugar geométrico de P a lo largo del movimiento. El nombre de la curva se debe a que una vez construida H N permite la trisección de un ángulo cualquiera. En efecto, si queremos trisecar el ángulo Ð( PDC ) simplemente tenemos que dividir el segmento B 'C en tres partes iguales mediante los puntos C D M y N y trazar por ellos dos paralelas al segmento A ' B '. EntonQ ces las rectas DG y DH trisecan el ángulo Ð( PDC ). La curva anterior sirve también para cuadrar el círculo, Figura 57. pero parece ser que Hipias desconocía esta aplicación, o tal vez no supiera justificarla. Sin embargo, Dinostrato sí fue capaz de y

y

o

x

o

x

b< a b= a

b> a

b> a

h) Cuadratriz de Dinostrato

b= a

b< a

En el caso particular de que la curva C sea la circunferencia x2 + y2 – ax = 0, se obtienen los caracoles de Pascal (figura 56), que tienen también relación con el problema de la trisección del ángulo. En polares vienen dados por la ecuación r = a cos q + b. Cuando b = a, la ecuación queda r = a(1+ cos q ), que corresponde a la cardioide (5.5.).

En el caso particular de que la curva C sea la circunferencia x2 + y2 – ax = 0, se obtienen los caracoles de Pascal (figura 56), que tienen también relación con el problema de la trisección del ángulo. En polares vienen dados por la ecuación r = a cos q + b. Cuando b = a, la ecuación queda r = a(1+ cos q ), que corresponde a la cardioide (5.5.). Figura 55.

–

Figura 56.

–

Figura 55.

Figura 56.

b< a

h) Cuadratriz de Dinostrato

b= a

b> a

b> a

A Hipias (s. V a.C.) se le atribuye la introducción de la primera curva, aparte de la circunferencia y la recta. A tal curva se le conoce como trisectriz de Hipias, y se obtiene de la siguiente manera: Sea el cuadrado ABCD. Supongamos que el lado DA gira uniformemente en sentido horario alrededor de D, y simultáneaA B mente el lado AB se desplaza paralelamente con movimiento uniforme, hasta que ambos acaban coincidiendo con DC en el P mismo intervalo de tiempo. En un instante cualquiera las posiB' ciones respectivas de los segmentos móviles son DA'' y A ' B ', y G el punto de intersección P. Entonces la trisectriz de Hipias es el M lugar geométrico de P a lo largo del movimiento. El nombre de la curva se debe a que una vez construida H N permite la trisección de un ángulo cualquiera. En efecto, si queremos trisecar el ángulo Ð( PDC ) simplemente tenemos que dividir el segmento B 'C en tres partes iguales mediante los puntos C D M y N y trazar por ellos dos paralelas al segmento A ' B '. EntonQ ces las rectas DG y DH trisecan el ángulo Ð( PDC ). La curva anterior sirve también para cuadrar el círculo, Figura 57. pero parece ser que Hipias desconocía esta aplicación, o tal vez no supiera justificarla. Sin embargo, Dinostrato sí fue capaz de b= a b< a

x

o

x

o

y

y

La ecuación polar de dichas curvas (figura 55) sería a ±b cos q r=



498

Distintas coordenadas para describir el plano o el espacio dar de manera detallada un método de cuadratura del círculo, por medio de la curva anterior. De ahí que se la suele conocer más como cuadratriz de Dinostrato. La ecuación en polares de la cuadratriz resulta ser: r=

2aq p sen q

siendo a el lado del cuadrado asociado a la curva. Si hacemos q ® 0, tendremos la longitud del segmento OQ, o sea: OQ = lím q ®0

2aq 2a = p sen q p

Como puede apreciarse, la longitud del arco AC, que es segmentos OQ y AB, ya que se cumple

pa , resulta ser la tercera proporcional de los 2

2a p a y por tanto = a pa 2 OQ AB = AB AC

Esto último fue lo que llegó a probar Dinostrato. En consecuencia puede construirse fácilmente un segmento b que sea una rectificación del arco AC, y entonces un rectángulo de lados 2b y a tendrá de área pa 2ba = 2 a = pa 2, que es el área del círculo de radio a. Construir un cuadrado de área igual a la del rec2 tángulo es un problema geométrico sencillo, pues bastaría tomar como lado la media proporcional de los lados del rectángulo. Hay que señalar que las soluciones aportadas por Hipias y Dinostrato a la trisección del ángulo y a la cuadratura del círculo fueron consideradas como sofismas, ya que sólo se aceptaba utilizar rectas y circunferencias. Pero en su intento de buscar soluciones “legítimas” los geómetras griegos fueron encontrando curvas nuevas en sus investigaciones. Una forma análoga de obtención mecánica de la cuadratriz es la que sigue: Supongamos que de un mismo punto A de una circunferencia parten dos puntos móviles M y M ', descriA biendo sendos movimientos uniformes a lo largo de la M circunferencia y a lo largo de su diámetro, respectiva' M mente, y llegando al mismo tiempo al otro extremo B del X diámetro. Es decir mientras que M recorre la semicircunferencia AMB el punto M ' recorre el diámetro AB. Denominamos X al punto que se obtiene en un instante determinado como intersección del radio OM y la recta perpendicular a AB desde M '. El lugar de los punB Figura 58. tos X es la cuadratriz.

i) La curva de Agnesi María Gaetana Agnesi nació en Milán en 1718, coetánea de Euler y Kant. A muy temprana edad empezó a dar muestras de su capacidad para las matemáticas. A los 30 años publicó con el dinero de su padre el primer tomo de una obra titulada Instituzioni Analitiche, que tenía forma de libro de texto y recogía de modo claro y riguroso la geometría cartesiana. Posteriormente publicó un segundo tomo que trataba sobre cálculo diferencial e integral, y que tuvo una excelente acogida en la Academia de Ciencias de París. Tras el éxito del libro, el papa Benedicto XIV la propuso para la cátedra de matemáticas de la Universidad de Bolonia, pero no se sabe si llegó a ejercer o no.


499


500


ì x = tg t ï é p pù Una parametrización de la curva podría ser í con t Îê – , ú. ë 2 2û ï 2 î y = cos t

Entre las dificultades que tuvo por su condición de mujer y el impacto producido por la muerte de su padre, a los 34 años abandonó las matemáticas y se dedicó al cuidado de mujeres pobres y enfermas. A lo largo de casi tres siglos, su nombre sólo ha trascendido por una curva que María Gaetana Agnesi analizó con detalle e intención didáctica. El nombre de dicha curva ha sido desgraciadamente adulterado. Se trata de la curva de la bruja de Agnesi. Dicha curva fue bautizada por Guido Grandi como versiera (que procede del latín vetere, girar, rodar). El italiano vulgar deformó el término y llegó a decirse avversiera, voz similar a avversiere, que significa esposa del demonio. Los traductores cayeron en esta confusión y para la posterioridad quedó el injusto calificativo de bruja. La curva agnesiana se genera de siguiente manera: y=

1 1+ x2

de donde resulta

Se tiene una circunferencia, un punto P de la misma y la recta tangente en el punto diametralmente opuesto de P. Se hace girar una semirrecta con origen en P, la cual va cortando respectivamente en puntos A y B a la circunferencia y a la recta tangente mencionada. Dos paralelas trazadas respectivamente desde esos dos puntos a la tangente y al diámetro, se intersecan en un punto X. El lugar geométrico descrito por X a medida que se mueve la semirrecta giratoria es la curva de Agnesi (figura 59). y (1 – y ) x

=

1 Þ y

y (1 – y ) = xy Þ y (1 – y ) = x 2 y 2 Þ 1 – y = x 2 y Þ 1= (1+ x 2 ) y

que sustituyendo nos da:

CA = PC ×QC =

y (1 – y )

y

Por el teorema de la altura aplicado al triángulo rectángulo DPAQ:

Q

B

1 QB PQ x = Þ = y CA PC CA

O C

Es fácil obtener la ecuación cartesiana de dicha curva, razonando sobre la figura, en la que supondremos que el diámetro de la circunferencia es la unidad. Por ser semejantes los triángulos DPQB y DPCA, tendremos:

A

X

P Figura 59.

Figura 59.

P Es fácil obtener la ecuación cartesiana de dicha curva, razonando sobre la figura, en la que supondremos que el diámetro de la circunferencia es la unidad. Por ser semejantes los triángulos DPQB y DPCA, tendremos:

X

A

O C

1 QB PQ x = Þ = y CA PC CA

B

Q

Por el teorema de la altura aplicado al triángulo rectángulo DPAQ:

y

CA = PC ×QC =

y (1 – y )

Se tiene una circunferencia, un punto P de la misma y la recta tangente en el punto diametralmente opuesto de P. Se hace girar una semirrecta con origen en P, la cual va cortando respectivamente en puntos A y B a la circunferencia y a la recta tangente mencionada. Dos paralelas trazadas respectivamente desde esos dos puntos a la tangente y al diámetro, se intersecan en un punto X. El lugar geométrico descrito por X a medida que se mueve la semirrecta giratoria es la curva de Agnesi (figura 59). que sustituyendo nos da: x

y (1 – y )

=

1 Þ y

y (1 – y ) = xy Þ y (1 – y ) = x 2 y 2 Þ 1 – y = x 2 y Þ 1= (1+ x 2 ) y

Entre las dificultades que tuvo por su condición de mujer y el impacto producido por la muerte de su padre, a los 34 años abandonó las matemáticas y se dedicó al cuidado de mujeres pobres y enfermas. A lo largo de casi tres siglos, su nombre sólo ha trascendido por una curva que María Gaetana Agnesi analizó con detalle e intención didáctica. El nombre de dicha curva ha sido desgraciadamente adulterado. Se trata de la curva de la bruja de Agnesi. Dicha curva fue bautizada por Guido Grandi como versiera (que procede del latín vetere, girar, rodar). El italiano vulgar deformó el término y llegó a decirse avversiera, voz similar a avversiere, que significa esposa del demonio. Los traductores cayeron en esta confusión y para la posterioridad quedó el injusto calificativo de bruja. La curva agnesiana se genera de siguiente manera: de donde resulta

y=

1 1+ x2

ì x = tg t ï é p pù Una parametrización de la curva podría ser í con t Îê – , ú. ë 2 2û ï 2 î y = cos t



500


6. ALGUNOS EJEMPLOS DE SUPERFICIES Algunas superficies en el espacio vienen dadas de manera tan simple como las siguientes:

–

En coordenadas cilíndricas: z = cte ® plano perpendicular a OZ. r = cte ® cilindro de revolución del eje OZ. q = cte ® semiplano de borde el eje OZ.

–

En coordenadas polares: r = cte ® superficie esférica de centro O y radio r. q = cte ® cono de revolución del eje OZ. j = cte ® semiplano de borde el eje OZ.

Sin ánimo de ser exhaustivos, vamos a ver algunos ejemplos de superficies que admiten ecuaciones sencillas bien en paramétricas, bien en cilíndricas o polares. Para un estudio más minucioso de superficies se puede consultar el tema 49 (volumen III).

a) Superficie esférica Como sabemos es el lugar de los puntos del espacio cuya distancia al centro C(a,b,c) es el radio constante R. La ecuación cartesiana es ( x – a )2 + ( y – b )2 + ( z – c )2 = R 2 Una expresión paramétrica se obtiene a partir de dos magnitudes angulares (que pueden interpretarse como las coordenadas geográficas que describen los puntos de la superficie terrestre): la longitud j y la latitud f. P

f r

j Figura 60. Si el centro de la esfera es el origen de coordenadas (0,0,0), las coordenadas de un punto P de la misma (figura 60) serán: ì x = rcos j ï í y = rsen j ï î z = R sen f y teniendo en cuenta que r = R cos f, llegamos a las ecuaciones paramétricas de la superficie esférica ì x = R cos fcos j ï í y = R cos fsen j ï î z = R sen f donde f Î [– p 2 ,+ p 2] y j Î [ 0,2p). Si el centro de la esfera es el punto C(a,b,c) la parametrización obtenida sería: ì x = a + R cos fcos j ï í y = b + R cos fsen j ï î z = c+ R sen f TEMARIO DE MATEMÁTICAS. PRUEBA A

501


502


ì x = t cos v ï í y = t sen v ï î z = bt

Figura 62.

b) Toro circular

Se trata de la superficie engendrada al girar una circunferencia alrededor de una recta contenida en su mismo plano. x

y

es un ejemplo de helicoide alabeado. Dicha superficie puede obtenerse sometiendo la semirrecta OX+ a un movimiento helicoidal de eje OZ. Así, pues, si partimos de un punto A ( t ,0,0 ) y lo giramos en el plano OXY un ángulo v alrededor del origen, llegamos r al punto A '( t cos v, t sen v ,0 ). Aplicando ahora una traslación de vector tb paralelo a OZ, llegamos al punto P ( t cos v, t sen v, bt ). Al variar los parámetros t y v obtenemos todos los puntos del helicoide. Por tanto sus ecuaciones paramétricas son

z

ì x = a cos t ï í y = a sen t ï î z = bt

z

x

La superficie formada por todas las rectas paralelas al plano z = 0 que se apoyan en el eje OZ y en la hélice de ecuaciones paramétricas

y Figura 61.

c) Superficie helicoidal

Supongamos la circunferencia de centro A ( a ,0,0 ) y radio r contenida en el plano OXZ, cuyas ecuaciones paramétricas son ì x = a + rcos t ï íy= 0 ï î z = rsen t Las ecuaciones [15] constituyen una parametrización de la superficie tórica. ì x = ( a + rcos t )cos s ï í y = ( a + rcos t )sen s ï î z = rsen t

[15]

Si un punto genérico de dicha circunferencia P ( a + rcos t ,0, rsen t ) describe un giro de ángulo s alrededor de OZ, llegamos al punto de coordenadas ì x = ( a + rcos t )cos s ï í y = ( a + rcos t )sen s [15] ï î z = rsen t

Si un punto genérico de dicha circunferencia P ( a + rcos t ,0, rsen t ) describe un giro de ángulo s alrededor de OZ, llegamos al punto de coordenadas ì x = a + rcos t ï íy= 0 ï î z = rsen t

Las ecuaciones [15] constituyen una parametrización de la superficie tórica. Supongamos la circunferencia de centro A ( a ,0,0 ) y radio r contenida en el plano OXZ, cuyas ecuaciones paramétricas son

c) Superficie helicoidal

La superficie formada por todas las rectas paralelas al plano z = 0 que se apoyan en el eje OZ y en la hélice de ecuaciones paramétricas ì x = a cos t ï z í y = a sen t ï î z = bt

y Figura 61.

x

es un ejemplo de helicoide alabeado. Dicha superficie puede obtenerse sometiendo la semirrecta OX+ a un movimiento helicoidal de eje OZ. Así, pues, si partimos de un punto A ( t ,0,0 ) y lo giramos en el plano OXY un ángulo v alrededor del origen, llegamos r al punto A '( t cos v, t sen v ,0 ). Aplicando ahora una traslación de vector tb paralelo a OZ, llegamos al punto P ( t cos v, t sen v, bt ). Al variar los parámetros t y v obtenemos todos los puntos del helicoide. Por tanto sus ecuaciones paramétricas son ì x = t cos v ï í y = t sen v ï î z = bt

z

y

Se trata de la superficie engendrada al girar una circunferencia alrededor de una recta contenida en su mismo plano. 502



Figura 62.

b) Toro circular

x


d) Superficie cónica de revolución

P

Supongamos que el cono de revolución tiene el vértice en el origen de coordenadas y su eje es OZ. Si a es el ángulo que forma dicho eje con cualquier generatriz entonces para cualquier punto genérico P(x,y,z) de la superficie cónica se tendrá: r OP × k z cos a = = 2 OP x + y2 + z 2

a

O

Figura 63.

que desarrollando nos da ö æ 1 z 2 = ( x2 + y 2 + z 2 )cos 2 a Þ x2 + y2 – ç 2 – 1÷z 2 = 0 Þ x 2 + y 2 – ( tg 2a ) z 2 = 0 è cos a ø y llamando m = tg a, llegamos a la ecuación cartesiana de la superficie cónica: x 2 + y 2 – m2 z 2 = 0 Si en las fórmulas de transformación de polares a cartesianas hacemos j = a tendremos ì x = rsen a cos q ï í y = rsen a sen q ï î z = rcos a de donde haciendo u = r y v = q, obtenemos una parametrización del cono de revolución. Éste será la imagen de la aplicación ( u , v ) ® ( u sen a cos v, u sen a sen v, u cos v) de [ 0,+¥) ´ [ 0,2p) en E3.

e) Superficie cilíndrica de revolución Si tomamos un cilindro de radio R y eje de simetría OZ, cualquier punto P(x,y,z) de la superficie cumple que su distancia al eje OY es R. El punto de mínima distancia será obviamente el de coordenadas (0,0, z) y por tanto deberá verificarse

( x – 0) 2 + ( y – 0) + ( z – z) 2 = R 2

de donde resulta la ecuación cartesiana de la superficie cilíndrica: x2 + y2 = R 2

z

Una parametrización sencilla de dicha superficie sería:

R P

ì x = R cos t ï í y = R sen t ï îz= s con s Î (– ¥+¥ , ) y t Î [ 0,2p).


Figura 64. x

y

503


504


f) Elipsoide ì x = a cos u cos v ï Las ecuaciones paramétricas del elipsoide son í y = b cos u sen v ï î z = csen u

z

y

x Figura 65. Eliminando los parámetros x2 y2 + = cos 2 u cos 2 v+ cos 2 u sen 2 v = cos 2 u (cos 2 v+sen 2 v ) = cos 2 u a2 b2 x2 y2 z 2 + + = 1, que es la ecuación cartesiana implícita de un elipsoide. a 2 b 2 c2

x2 y2 z 2 + + = 1, que es la ecuación cartesiana implícita de un elipsoide. a 2 b 2 c2 z2 =sen 2 u c2

Sumando ambas se llega a

Sumando ambas se llega a

z2 =sen 2 u c2

Eliminando los parámetros x2 y2 + = cos 2 u cos 2 v+ cos 2 u sen 2 v = cos 2 u (cos 2 v+sen 2 v ) = cos 2 u a2 b2 Figura 65.

x y z ì x = a cos u cos v ï Las ecuaciones paramétricas del elipsoide son í y = b cos u sen v ï î z = csen u

f) Elipsoide CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


504


CUADRO RESUMEN DE LAS CUÁDRICAS Nombre

Ecuación reducida

Figura Z

Elipsoide

x 2 y2 z2 + + =1 a2 b2 c2

Y

O X

z

Hiperboloide de una hoja

x 2 y2 z2 + – =1 a2 b2 c2

Hiperboloide de dos hojas

x 2 y2 z2 – – =1 a2 b2 c2

Cono elíptico

x 2 y2 z2 + – =0 a2 b2 c2

y

o x

z y o

x

z y

o

x

z

Paraboloide elíptico

x 2 y2 + – 2 pz = 0 a2 b2 x

o

y

.../...


505


506


.../... z y

x 2 y2 – – 2 pz = 0 a2 b2

Paraboloide hiperbólico

x

z

x 2 y2 + =1 a2 b2

Cilindro elíptico

y2 – 2 px = 0

x 2 y2 – =1 a2 b2

Cilindro parabólico

x

Cilindro hiperbólico

x 2 y2 – =1 a2 b2

y

y2 – 2 px = 0

Cilindro hiperbólico

o

Cilindro parabólico

x 2 y2 + =1 a2 b2

Cilindro elíptico

x o

y

z

Paraboloide hiperbólico

x 2 y2 – – 2 pz = 0 a2 b2

x y z

.../... CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


506

TEMA

47 Generación de curvas como envolventes




508



INTRODUCCIÓN

2.

DEFINICIONES PREVIAS

3.

ENVOLVENTE DE UNA FAMILIA DE CURVAS 3.1. Determinación de la envolvente 3.2. Cálculo de la envolvente mediante la diferenciación 3.3. Aplicaciones

4.

EVOLUTA DE UNA CURVA PLANA 4.1. Definiciones previas 4.2. Definición de evoluta 4.3. Caracterización de la evoluta 4.4. Aplicación

5.

CONCLUSIÓN

CONCLUSIÓN

5.

EVOLUTA DE UNA CURVA PLANA 4.1. Definiciones previas 4.2. Definición de evoluta 4.3. Caracterización de la evoluta 4.4. Aplicación

4.

ENVOLVENTE DE UNA FAMILIA DE CURVAS 3.1. Determinación de la envolvente 3.2. Cálculo de la envolvente mediante la diferenciación 3.3. Aplicaciones

3.

DEFINICIONES PREVIAS

2.

INTRODUCCIÓN

1.



508

Generación de curvas como envolventes

1. INTRODUCCIÓN La búsqueda de las envolventes generalmente se efectúa mediante la operación de diferenciación, una de las operaciones fundamentales en la matemática superior. El concepto de envolvente también es evidente geométricamente y puede ser aclarado con ejemplos sencillos que facilitan la comprensión.

2. DEFINICIONES PREVIAS Definición 1:

r Una función vectorial f : [ a , b ] Ì Â ® Â k r r t ¾¾® f ( t ) = x se denomina curva en Â k . También se llama curva al lugar geométrico de todos los puntos P de Â k , tal que existe un “t” en [a,b] con: r f ( t )= OP r r se dice entonces que dicho lugar geométrico tiene por ecuación vectorial x = f ( t ). Si el vector OP tiene coordenadas ( x1, x2 ,..., xk ), las ecuaciones paramétricas de la curva son: x1 = f1( t ) ü ï x2 = f2 ( t )ï ý – – – – – –ï xk = fk ( t )ï þ Eliminando el parámetro t obtenemos k – 1 ecuaciones que reciben el nombre de implícitas: h1( x1, x2 ,..., xk ) = 0 ü ï h2 ( x1, x2 ,..., xk ) = 0 ï ý – – – – – – – – – – –ï hk ( x1, x2 ,..., xk )= 0 ï þ Definición 2:

r r Se llama tangente en el punto P de la curva de ecuación x = f ( t )a la recta que más se aproxima a la curva en un entorno del punto. El vector director de la tangente viene dado por el límite: r r r f (t + h ) – f (t ) f '( t ) = lím h ®0 h r r r La recta tangente tiene por ecuación: x = f ( t )+ lf '( t ). Las ecuaciones paramétricas son: x1 = f1( t )+ lf1'( t ) ü ï x2 = f2 ( t )+ lf2 '( t )ï ý – – – – – – – – – – –ï xk = fk ( t )+ lfk '( t )ï þ TEMARIO DE MATEMÁTICAS. PRUEBA A

509


510


Eliminando el parámetro l se tienen las ecuaciones implícitas: x1 – f1( t ) x2 – f2 ( t ) x – fk ( t ) = =...= k f1'( t ) f2 '( t ) fk '( t ) L R

Definición 3:

r Una función vectorial f : [ a , b ] Ì Â ® Â 2 r r t ¾¾® f ( t ) = x = ( x , y )

2.

se denomina curva plana. c

En lo que sigue consideraremos siempre que la curva viene definida por una función vectorial diferenciable y con derivada continua. C

1. Ejemplos:

3. ENVOLVENTE DE UNA FAMILIA DE CURVAS Definición:

Se familia de curvas de parámetro l al conjunto de curvas que vamos a designar como r r llama x = f ( t , l ). Si vamos dando a l todos los valores posibles, obtenemos para cada uno de estos valores un vector de posición que es función de t, y que representará una curva.

Sea {C l } una familia de curvas planas. Se dice que una curva C es la envolvente de la familia si en cada uno de sus puntos es tangente al menos a una curva de la familia y si cualquier segmento de la misma es tangente a un conjunto infinito de curvas de la familia. Definición:

La familia de curvas puede venir dada en forma explícita como y = f ( x , l ) o también en forma implícita como f ( x, y , l ) = 0. Denominaremos a este conjunto {C l }.

Denominaremos a este conjunto {C l }.

La familia de curvas puede venir dada en forma explícita como y = f ( x, l ) o también en forma implícita como f ( x, y , l ) = 0. Definición:

Sea {C l } una familia de curvas planas. Se dice que una curva C es la envolvente de la familia si en cada uno de sus puntos es tangente al menos a una curva de la familia y si cualquier segmento de la misma es tangente a un conjunto infinito de curvas de la familia.

Se familia de curvas de parámetro l al conjunto de curvas que vamos a designar como r r llama x = f ( t , l ). Si vamos dando a l todos los valores posibles, obtenemos para cada uno de estos valores un vector de posición que es función de t, y que representará una curva. Definición:

3. ENVOLVENTE DE UNA FAMILIA DE CURVAS

Ejemplos: 1.

C

En lo que sigue consideraremos siempre que la curva viene definida por una función vectorial diferenciable y con derivada continua. c

se denomina curva plana. Definición 3: r Una función vectorial f : [ a , b ] Ì Â ® Â 2 r r t ¾¾® f ( t ) = x = ( x , y )

2. R L

x – f (t ) x – f (t ) x – fk ( t ) 1 2 = 2 =...= k f1'( t ) f2 '( t ) fk '( t ) 1

Eliminando el parámetro l se tienen las ecuaciones implícitas: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


510

Generación de curvas como envolventes La envolvente de una familia de circunferencias de un mismo radio R con centros en una recta dada L, se compone de dos rectas paralelas que se encuentran a la distancia R de la recta L. 3.

A partir de la familia compuesta por todas las rectas que pasan a una misma distancia R respecto al punto O, se obtiene como envolvente una circunferencia de radio R y centro O.

R O

3.1. Determinación de la envolvente Vamos a obtener la envolvente de una familia de curvas, sin utilizar técnicas de diferenciación. Sea C la envolvente de cierta familia de curvas. Si C a es una curva de dicha familia entonces corta a la envolvente C en un punto M. Si tomamos otro punto M ' de C próximo a M, entonces existe otra curva C b que corta a la envolvente en M '. Esta curva C b estará próxima a C a . Si en las proximidades de M la curva C b estuviera totalmente hacia un lado de C a , resultaría que C b o bien no tendría puntos comunes con C o bien tendría una doble intersección (ver figura 1). Pero llegamos a contradicción ya que la curva C b corta a la envolvente en un punto por definición. Por tanto, C b corta a C a en un punto P (ver figura 2). A medida que C b se aproxima a C a más cerca está P de M. C

C M'

M

M

Ca

P

Cb

Ca

Figura 1.


Figura 2.

511


512


Podemos concluir: Proposición: Todo punto M de la envolvente es un punto de intersección de dos curvas infinitamente próximas de la familia. O

X

Ejemplo: Sea una familia de circunferencias de centro en el eje OX y radio R, es decir ( x – l) + y2 = R 2 (centro (l, 0) y radio R, donde l es el parámetro). 2

Y

Tenemos desarrollando:

Resolviendo el sistema se obtiene y2 = R 2 y se descompone en y = R, y = – R, que representa dos rectas paralelas al eje OX. x 2 + y 2 – 2 lx+ l2 – R 2 = 0

x2 + y2 – 2 lx+ l2 – R 2 = 0ü ý –2x+ 2 l = 0 þ

Consideramos dos circunferencias de esta familia próximas entre sí: ü x2 + y2 – 2 lx+ l2 – R 2 = 0 ý e muy pequeño. x2 + y2 – 2( l + e )x+ ( l + e )2 – R 2 = 0þ

Como tenemos que aproximar infinitamente las dos circunferencias, hacemos tender e ® 0y nos queda: x2 + y2 – 2 lx+ l2 – R 2 = 0ü ý –2x+ 2 l + e = 0 þ

Restamos a la segunda ecuación la primera y obtenemos:

x 2 + y 2 – 2 lx+ l2 – R 2 = 0ü ý e distinto de cero, por lo que: –2ex + 2el + e 2 = 0 þ x 2 + y 2 – 2 lx+ l2 – R 2 = 0ü ý e distinto de cero, por lo que: –2ex + 2el + e 2 = 0 þ x2 + y2 – 2 lx+ l2 – R 2 = 0ü ý –2x+ 2 l + e = 0 þ

Restamos a la segunda ecuación la primera y obtenemos:

Como tenemos que aproximar infinitamente las dos circunferencias, hacemos tender e ® 0y nos queda: ü x2 + y2 – 2 lx+ l2 – R 2 = 0 ý e muy pequeño. 2 2 2 2 x + y – 2( l + e )x+ ( l + e ) – R = 0þ x2 + y2 – 2 lx+ l2 – R 2 = 0ü ý þ –2x+ 2 l = 0

Consideramos dos circunferencias de esta familia próximas entre sí: x 2 + y 2 – 2 lx+ l2 – R 2 = 0

Resolviendo el sistema se obtiene y2 = R 2 y se descompone en y = R, y = – R, que representa dos rectas paralelas al eje OX. Tenemos desarrollando:

Y

Sea una familia de circunferencias de centro en el eje OX y radio R, es decir ( x – l) + y2 = R 2 (centro (l, 0) y radio R, donde l es el parámetro). 2

Ejemplo: O

X

Todo punto M de la envolvente es un punto de intersección de dos curvas infinitamente próximas de la familia. Proposición: Podemos concluir: 512




3.2. Cálculo de la envolvente mediante la diferenciación

r r Sea la familia de curvas dependientes de un parámetro x = f ( t , l ). Para determinar la envolvente consideramos un punto M de la curva de la familia que corresponde a un valor de l y supongamos que a dicho punto corresponde, a su vez, un cierto valor de t. Para que el punto M sea de contacto de la curva de la familia con la envolvente, es preciso que entre los citados valores de l y t exista cierta relación que vendrá expresada en la forma: l = l ( t ). r r Por tanto, la ecuación de la envolvente será x = f (t , l(t )). Por otra parte, en M coinciden las rectas a la curva de la familia y a la envolvente, por tanto r tangentes r ¶f ¶f ¶l el vector tangente a la envolvente que es + debe ser proporcional al vector tangente a la curva que ¶t ¶l ¶t r ¶f es , es decir: ¶t r r r r r r r r ¶f ¶f ¶l ¶f ¶f ¶f ¶l ¶f ¶f ¶f han de ser colineales + = k× Þ , = ( k – 1) × Þ los vectores y ¶t ¶l ¶t ¶t ¶t ¶l ¶t ¶t ¶t ¶l r r æ ¶f ¶f ö ç Þ detç , ÷ ÷= 0 è ¶t ¶l ø

[1]

Eliminando l y t entre las ecuaciones r r ü x = f (t , l ) r r ï æ ¶f ¶f ö ý ç ÷ detç , ÷= 0ï è ¶t ¶l ø þ obtenemos la ecuación implícita de la envolvente.

•

Dos casos: a)

b)

Si la familia de curvas viniera dada por su ecuación explícita y = f ( x, l), podremos reducirlo al caso anterior haciendo x = x. 1 0 ¶f ( x, l) = 0, y entre esta condiLa ecuación [1] toma en este caso la forma ¶f ¶f = 0 Þ ¶l ¶x ¶l ción y la y = f ( x, l), eliminamos l, obteniendo así la ecuación implícita de la envolvente. Si la familia de curvas viniera dada en forma implícita f ( x, y, l) = 0, ya hemos visto que la envolvente es una curva tangente a todas ellas. También hemos visto que la envolvente puede considerarse como el lugar geométrico de las posiciones límites de las intersecciones de cada dos curvas de la familia cuando tienden a confundirse. En efecto, sean f ( x, y, l) = 0 y f ( x, y, l + Dl) = 0 dos curvas. La curva f ( x, y, l + Dl) – f ( x, y, l) =0 Dl


513


514


que es una combinación lineal de las anteriores pasa evidentemente por el punto común a las curvas dadas y cuando Dl ® 0, es el movimiento que lleva a la segunda a confundirse con la primera, de modo que la posición límite del punto común será:

f ( x, y, l) = 0ü ï ý de aquí se obtienen las ecuaciones paramétricas de la Recíprocamente, si se verifica ¶f =0 ï þ ¶l línea x = x( l), y = y( l) cuyos puntos satisfacen f ( x( l ), y( l ), l) = 0, y derivando respecto l, se ¶f ¶y ¶f ¶x ¶f ¶y ¶f ¶f ¶ x ¶l tiene + + = 0 y como = 0 Þ = – , que nos dice que la curva obtenida y ¶f ¶x ¶x ¶l ¶y ¶l ¶l ¶l ¶y ¶l cada una de las de la familia son tangentes. ü f ( x, y, l) = 0ï ý ¶f =0 ï þ ¶l

que son precisamente las condiciones de envolvente de una familia de curvas. Por lo tanto, la ecuación de la envolvente se obtiene eliminando el parámetro l en el sistema anterior.

Nota: por tanto, conviene, cuando hallamos la envolvente de una familia de curvas, eliminar el lugar de los posibles puntos singulares de las curvas de la familia.

Nota: conviene indicar que no todos los puntos de intersección de dos curvas próximas se desplazan hacia una envolvente cuando Dl ® 0, por tanto habrá que comprobar en cada caso particular si las curvas obtenidas son tangentes a las de la familia. ¶f = 0, que es la condición de envolvente. ¶l

Teorema:

queda

La envolvente contiene al lugar geométrico de los puntos singulares de las curvas. Demostración:

ü ¶f = 0ï ¶f ¶x ¶f ¶y ¶f ¶x ý + + = 0, y al ser ¶f ¶x ¶l ¶y ¶l ¶l = 0ï ¶y þ

Dada la familia de curvas f ( x, y, l) = 0, sabemos que los puntos singulares vienen dados por las ¶f ¶f = 0, = 0. ¶x ¶y

Si en estas ecuaciones despejamos x e y en función de l, obtenemos un punto singular para cada valor de l, el cual debe satisfacer la ecuación de la familia, esto es f ( x( l ), y( l ), l) = 0, y derivando respecto a l: condiciones

Si en estas ecuaciones despejamos x e y en función de l, obtenemos un punto singular para cada valor de l, el cual debe satisfacer la ecuación de la familia, esto es f ( x( l ), y( l ), l) = 0, y derivando respecto a l:

Dada la familia de curvas f ( x, y, l) = 0, sabemos que los puntos singulares vienen dados por las ¶f ¶f condiciones = 0, = 0. ¶x ¶y ü ¶f = 0ï ¶f ¶x ¶f ¶y ¶f ¶x ý + + = 0, y al ser ¶f ¶x ¶l ¶y ¶l ¶l = 0ï ¶y þ

Demostración:

La envolvente contiene al lugar geométrico de los puntos singulares de las curvas. queda

¶f = 0, que es la condición de envolvente. ¶l

Teorema:

Nota: conviene indicar que no todos los puntos de intersección de dos curvas próximas se desplazan hacia una envolvente cuando Dl ® 0, por tanto habrá que comprobar en cada caso particular si las curvas obtenidas son tangentes a las de la familia.

Nota: por tanto, conviene, cuando hallamos la envolvente de una familia de curvas, eliminar el lugar de los posibles puntos singulares de las curvas de la familia. ü f ( x, y, l) = 0ï ý de aquí se obtienen las ecuaciones paramétricas de la Recíprocamente, si se verifica ¶f =0 ï þ ¶l línea x = x( l), y = y( l) cuyos puntos satisfacen f ( x( l ), y( l ), l) = 0, y derivando respecto l, se ¶f ¶y ¶x = – ¶l , que nos dice que la curva obtenida y ¶f ¶x ¶y ¶l

que son precisamente las condiciones de envolvente de una familia de curvas. Por lo tanto, la ecuación de la envolvente se obtiene eliminando el parámetro l en el sistema anterior. f ( x, y, l) = 0ü ï ý ¶f =0 ï þ ¶l

¶f ¶x ¶f ¶y ¶f ¶f tiene + + = 0 y como = 0 Þ ¶x ¶l ¶y ¶l ¶l ¶l

que es una combinación lineal de las anteriores pasa evidentemente por el punto común a las curvas dadas y cuando Dl ® 0, es el movimiento que lleva a la segunda a confundirse con la primera, de modo que la posición límite del punto común será: cada una de las de la familia son tangentes.

514




3.3. Aplicaciones Veamos ahora algunas aplicaciones de tipo práctico para construir algunas curvas. a)

La circunferencia como envolvente. Dada la familia de rectas de parámetro t: x cos t + y sen t = R

(R constante)

su envolvente es una circunferencia de centro el origen y radio R. Derivamos respecto del parámetro t: –x sen t + y cos t = 0. Obtenemos el sistema:

xcos t + ysen t = R ü ý – x sen t + y cos t = 0þ

Multiplicamos la primera ecuación por “x” y la segunda por “y”, sumamos miembro a miembro. Multiplicamos la primera ecuación por “y” y la segunda por “–x”, y sumamos miembro a miembro. Resulta: cos t ( x 2 + y 2) = Rx ü ý sen t ( x 2 + y 2) = Ry þ Elevando al cuadrado y sumando las dos ecuaciones: x2 + y2 = R 2 cqd. b)

La parábola como envolvente. Veamos que la envolvente de una familia de rectas que son los lados de un ángulo recto que se desplaza por el plano de modo que uno de sus lados pase por un punto fijo y el ángulo recto circunscriba una recta, es una parábola. Demostración: Elegimos un sistema de referencia adecuado tal que el punto fijo sea F(p, 0) y el eje Y la recta dada (x = 0). El vértice del ángulo recto será P(0, t). La recta que pasa por los puntos P y F tiene como vector director (p, –t). Su ecuación es: x– p y = p –t

Þ

y=

( p – x) × t p

La recta perpendicular a la anterior que tiene como vector director (t, p) y pasa por el punto P es: x y– t = t p

Þ

yt – px = t 2

[1]

Derivando [1] respecto de t obtenemos: y = 2t y sustituimos esta expresión en [1] obteniendo: y y2 y× – px = 2 4

Þ 2× y2 – 4 px = y2 Þ

y2 = 4 px

que es la ecuación de una parábola cqd.


515


516


x y + = 1 Þ xsen t + ycos t = 2asen t cos t 2a cos t 2a sen t

La hipérbola como envolvente.

x – 2a cos t y = –2a cos t 2a sen t

Þ

c)

Consideramos un sistema de referencia en Â 2, OXY y se trazan todas las rectas posibles que corten a los ejes OX y OY, cuya área es constante. La envolvente de todas estas rectas es una hipérbola equilátera.

(1)

PQ (–2a cos t ,2asen t ) Demostración:

Consideramos un sistema de referencia ortonormal y a Î Â+ . Sea la familia de rectas que cortan a los ejes en dos puntos tal que la distancia entre ellos es igual a 2a. Una recta de la familia corta a los ejes en los puntos P y Q (d(P, Q) = 2a). Entonces las coordenadas de M son ( a cos t , a sen t ). Por tanto P(2a cos t , 0), Q(0, 2a sen t) y la ecuación de la recta que pasa por los puntos P y Q es:

Sean A( a,0) y B( 0, b) los puntos de corte de una recta genérica con los ejes. La recta AB tiene de ecuación: ay+ bx – ab = 0. O

P

Por otro lado, el área de los triángulos es constante, e igual a k: ab = 2k. t

El cálculo de la envolvente supone eliminar a y b del sistema:

d)

La astroide como envolvente.

M

ü ay+ bx – ab = 0 ï ý ab = 2k ï f 'a×g ' b – g 'a× f ' b= 0(*)þ

Q

donde f ( x, y, a , b) = ay + bx – ab y g ( a , b) = ab – 2k.

Ahora sustituyendo en (2): ( 2 y )× ( 2x ) = 2k Þ xy =

k que es una hipérbola equilátera cqd. 2

Nota: (*) es la derivación correspondiente a la utilización de dos parámetros a y b. A(a, 0)

(1) – ( 2 ) Þ

b= 2y

1 bx = ab Þ a = 2x 2

Obtenemos:

ay+ bx – ab = 0 ® (1) ü ï ý ab = 2k ® ( 2 ) ï ay+ bx = 0 ® ( 3 ) þ

b= 2y

K

1 (1)+ ( 2 ) Þ ay = ab Þ 2

B(0, b)

1 (1)+ ( 2 ) Þ ay = ab Þ 2

B(0, b)

K

1 bx = ab Þ a = 2x 2

(1) – ( 2 ) Þ

Obtenemos:

ay+ bx – ab = 0 ® (1) ü ï ý ab = 2k ® ( 2 ) ï ay+ bx = 0 ® ( 3 ) þ

A(a, 0)

Nota: (*) es la derivación correspondiente a la utilización de dos parámetros a y b. Ahora sustituyendo en (2): ( 2 y )× ( 2x ) = 2k Þ xy =

k que es una hipérbola equilátera cqd. 2

donde f ( x, y, a , b) = ay + bx – ab y g ( a , b) = ab – 2k.

La astroide como envolvente.

ü ay+ bx – ab = 0 ï ý ab = 2k ï f 'a×g ' b – g 'a× f ' b= 0(*)þ

d)

Consideramos un sistema de referencia ortonormal y a Î Â+ . Sea la familia de rectas que cortan a los ejes en dos puntos tal que la distancia entre ellos es igual a 2a. Una recta de la familia corta a los ejes en los puntos P y Q (d(P, Q) = 2a). Entonces las coordenadas de M son ( a cos t , a sen t ). Por tanto P(2a cos t , 0), Q(0, 2a sen t) y la ecuación de la recta que pasa por los puntos P y Q es:

Q M

El cálculo de la envolvente supone eliminar a y b del sistema: t

Por otro lado, el área de los triángulos es constante, e igual a k: ab = 2k. O

P

Sean A( a,0) y B( 0, b) los puntos de corte de una recta genérica con los ejes. La recta AB tiene de ecuación: ay+ bx – ab = 0. Demostración:

PQ (–2a cos t ,2asen t ) x y + = 1 Þ xsen t + ycos t = 2asen t cos t 2a cos t 2a sen t

La hipérbola como envolvente.

(1)



516

Þ

c)

Consideramos un sistema de referencia en Â 2, OXY y se trazan todas las rectas posibles que corten a los ejes OX y OY, cuya área es constante. La envolvente de todas estas rectas es una hipérbola equilátera. x – 2a cos t y = –2a cos t 2a sen t

Generación de curvas como envolventes xcos t – ysen t = 2a (cos 2 t – sen 2 t )

Derivamos respecto a t:

(2).

El sistema formado por (1) y (2) se resuelve, obteniendo la ecuación de la envolvente en paramétricas: x( t ) = 2a cos 3 t ü ý y( t ) = 2asen 3 t þ Dicha envolvente se llama astroide.

4. EVOLUTA DE UNA CURVA PLANA Un caso especial de curva envolvente es cuando la familia de curvas está formada por las rectas normales a una curva dada g. En este caso la envolvente coincide con una curva relacionada con g llamada evoluta. Veamos algunas definiciones previas.

4.1. Definiciones previas Definición 1:

r r Se llama elemento de arco de la curva x = f ( t ) a un nuevo parámetro s. Contando a partir de un t r cierto punto t ', se define s( t ) = ò f '( t ) dt . t'

r r Por tanto, s'( t ) = f '( t ) . Además ds = f '( t ) dt . Definición 2: Sean P y Q dos puntos de la curva, es decir:

r OP = f ( a ) r OQ = f ( b )

Se llama longitud del arco P,Q de la curva a: b

L( P ,Q ) = ò f '( t ) dt a

r El parámetro “s” permite calcular las derivadas de f ( t ) respecto a esa nueva variable. r r r r 1 df ( t ) df ( t ) dt f '( t ) = = f '( t ) r = r ds dt ds f '( t ) f '( t ) r r df ( t ) r Llamamos T = , luego T es un vector que tiene la misma dirección de la tangente a la curva y ds además es unitario. r r f '( t ) T = r =1 f '( t ) Lo llamamos vector tangente.


517


518


r r Si multiplicamos escalarmente el vector tangente por sí mismo tenemos: T ×T = 1(1), ya que teniendo en cuenta las propiedades del producto escalar y de la norma asociada: r 2 r r r r f '( t ) df ( t ) df ( t ) f '( t )× f '( t ) × = = r r 2 2 =1 ds ds f '( t ) f '( t ) ( D 'a ):– x sen a + y cos a = r'( a )

De donde se obtiene (1). La envolvente se obtiene resolviendo el sistema formado por (1) y la que se deduce de ella derivando respecto al parámetro: Da

– i

r r Sea un sistema de referencia ortonormal {O , i , j} y la r r r familia de rectas ( Da ) donde a = ang ( i , u), siendo u un vector unitario normal a Da . La ecuación de Da es: x cos a + y sen a = r(a) (1), donde r(a) es la distancia de O a la recta. r Esto es debido a que las coordenadasr de u son (cos a, sen a), por tanto el vector perpendicular a u que determina la recta Da es (–sen a, cos a) y un punto por el que pasa la recta es (r(a)cos a, r(a)sen a). Por tanto:

r dT Por tanto el vector es perpendicular al vector tangente. ds

O

x – r( a )cos a y – r( a )sen a = – sen a +cos a

Si derivamos la expresión (1) respecto a s obtenemos: r r dT r dT r 2 ×T = 0 Þ ×T = 0 ds ds

– – j u r(a)

r r dT y módulo 1. A este vector lo llamamos vector normal. Sea N el vector con la dirección de ds r r r dT dT 1 r A la inversa del módulo de lo llamamos radio de curvatura r en f ( s ), es decir: = N, y ds ds r r r como T × N = 0, será (derivando respecto a s): r r r r dT r r dN 1 r dN dN 1r × N +T = 0 Þ – =T× Þ =– T ds ds r ds ds r

Definición: r r r Dado un arco x = f ( t )donde f es dos veces derivable, el conjunto de normales a este arco es una familia de rectas dependientes de un parámetro. r r Esta familia posee, en general, una envolvente que llamaremos evoluta del arco x = f ( t ).

4.2. Definición de evoluta

4.2. Definición de evoluta Definición:

r r r Dado un arco x = f ( t )donde f es dos veces derivable, el conjunto de normales a este arco es una familia de rectas dependientes de un parámetro. r r Esta familia posee, en general, una envolvente que llamaremos evoluta del arco x = f ( t ).

r r dT y módulo 1. A este vector lo llamamos vector normal. Sea N el vector con la dirección de ds r r r dT dT 1 r A la inversa del módulo de lo llamamos radio de curvatura r en f ( s ), es decir: = N, y ds ds r r r como T × N = 0, será (derivando respecto a s): r r r r dT r r dN 1 r dN dN 1r × N +T = 0 Þ – =T× Þ =– T ds ds r ds ds r r dT es perpendicular al vector tangente. ds

Si derivamos la expresión (1) respecto a s obtenemos: r r dT r dT r ×T = 0 Þ ×T = 0 ds ds

Da

2

– i

Por tanto el vector

r(a) – – j u O

r r Sea un sistema de referencia ortonormal {O , i , j} y la r r r familia de rectas ( Da ) donde a = ang ( i , u), siendo u un vector unitario normal a Da . La ecuación de Da es: x cos a + y sen a = r(a) (1), donde r(a) es la distancia de O a la recta. r Esto es debido a que las coordenadasr de u son (cos a, sen a), por tanto el vector perpendicular a u que determina la recta Da es (–sen a, cos a) y un punto por el que pasa la recta es (r(a)cos a, r(a)sen a). Por tanto: x – r( a )cos a y – r( a )sen a = – sen a +cos a

De donde se obtiene (1). La envolvente se obtiene resolviendo el sistema formado por (1) y la que se deduce de ella derivando respecto al parámetro:

r r Si multiplicamos escalarmente el vector tangente por sí mismo tenemos: T ×T = 1(1), ya que teniendo en cuenta las propiedades del producto escalar y de la norma asociada: r 2 r r r r f '( t ) df ( t ) df ( t ) f '( t )× f '( t ) × = = r r 2 2 =1 ds ds f '( t ) f '( t ) ( D 'a ):– x sen a + y cos a = r'( a )



518

Generación de curvas como envolventes r r La recta D'a es normal al vector u' y pasa por r'( a )u ', con lo que la envolvente de la familia ( Da ) admite ( D'a ) como familia de normales. r r Para hallar la envolvente de ( D'a ) (evoluta de x = f ( t )) derivamos de nuevo, obteniendo: ( D ''a ): – xcos a – y sen a = r''( a ) r r r r r La recta D''a es normal a u, y pasa por – r''( a )u. La evoluta c del arco x = f ( t )está definida por la solución del sistema ( D 'a , D ''a ).

4.3. Caracterización de la evoluta Teorema 1: La evoluta de una curva plana es el conjunto de los radios de curvatura de la curva. Demostración:

r La ecuación vectorial de la normal a f es: r r r p ( s ) = f ( s )+ lN Determinamos l para ello derivamos respecto a s: r r r r æ 1 ö r dl r æ l ö r dl r dp df dN dl r = +l + N = T + lç ç1– ÷ ÷T + N ç– ÷ ÷T + N = ç ds ds ds ds ds ds è rø è rø

Como debe ser

r r dp colineal con N ds

Þ 1–

l =0 Þ r

l = r.

r Por tanto, la envolvente de las normales viene determinada por los radios de curvatura en f ( s ).

Teorema 2: El arco de evoluta es igual a la diferencia entre los radios de curvatura correspondientes a los extremos del arco de evoluta. Demostración: r r r r r Sea la curva x = f ( s ) y la ecuación de su evoluta p ( s ) = f ( s )+ rN . Vamos a demostrar que el arco CD de dicha evoluta es igual a la diferencia de los radios de curvatura en A y B. Derivando:

r r r dr r æ dp r dr r dN =T+ N+r = T + N + rç ç– ds ds ds ds è

r dr r 1ö ÷ N ÷T = rø ds

Ahora llamamos s al arco de evoluta entre C y D 1 ds dr = Þ s CD = ò dr = rB – rA ds ds s0

s

Þ


519



4.4. Evoluta de la elipse

520

æ ax ö3 ÷ cos t = ç 2 è a – b2 ø

Consideramos la elipse de ecuaciones:

x = a cos t ü ý y = b sen t þ

Por tanto:

1

æ – by ö3 ÷ sen t = ç 2 è a – b2 ø

La recta normal en el punto (a cos t, b sen t) tiene dirección perpendicular a la tangente es ese punto. La tangente tiene la dirección del vector derivada, es decir (–a sen t, b cos t). El vector perpendicular a éste es (b cos t, a sen t), que será la dirección de la normal. Por tanto, la ecuación de la normal es: 1

sen 3 t =

– by a2 – b2

x – a cos t y – b sen t = b cos t a sen t

– by = ( a 2 – b 2) sen 3 t

xa sen t – a 2 sen t cos t = yb cos t – b 2 cos t sen t

Si ahora multiplicamos (1) por cos t y (2) por sen t, y restamos miembro a miembro, obtenemos: axsen t – by cos t – ( a 2 – b 2) cos t sen t

( Dt ): axsen t – bycos t – ( a 2 – b 2) cos t sen t = 0

( a 2 – b 2) ax

Derivando la ecuación:

cos 3 t =

ax = ( a 2 – b 2) cos 3 t

( D 't ): axcos t + bysen t +( a 2 – b 2) sen 2 t – ( a 2 – b 2) cos 2 t = 0

Multiplicamos (1) por sen t y (2) por cos t, y sumamos miembro a miembro obteniendo:

( D 't ): axcos t + bysen t +( a 2 – b 2)(sen 2 t – cos 2 t ) = 0 axcos t + by sen t – ( a – b 2

2

)(cos

2

t – sen t ) = 0

(2)

2

Ahora los puntos de la envolvente de esta familia deben satisfacer el sistema: axsen t – by cos t – ( a 2 – b 2) cos t sen t = 0

(1)

axsen t – by cos t – ( a 2 – b 2) cos t sen t = 0

(1)

Ahora los puntos de la envolvente de esta familia deben satisfacer el sistema: axcos t + by sen t – ( a 2 – b 2)(cos 2t – sen 2 t ) = 0

(2)

( D 't ): axcos t + bysen t +( a 2 – b 2)(sen 2 t – cos 2 t ) = 0 Multiplicamos (1) por sen t y (2) por cos t, y sumamos miembro a miembro obteniendo:

( D 't ): axcos t + bysen t +( a 2 – b 2) sen 2 t – ( a 2 – b 2) cos 2 t = 0 ax = ( a 2 – b 2) cos 3 t cos 3 t =

Derivando la ecuación:

ax

( a 2 – b 2)

( Dt ): axsen t – bycos t – ( a 2 – b 2) cos t sen t = 0 axsen t – by cos t – ( a 2 – b 2) cos t sen t

Si ahora multiplicamos (1) por cos t y (2) por sen t, y restamos miembro a miembro, obtenemos: xa sen t – a 2 sen t cos t = yb cos t – b 2 cos t sen t – by = ( a 2 – b 2) sen 3 t

x – a cos t y – b sen t = b cos t a sen t – by sen 3 t = 2 a – b2

La recta normal en el punto (a cos t, b sen t) tiene dirección perpendicular a la tangente es ese punto. La tangente tiene la dirección del vector derivada, es decir (–a sen t, b cos t). El vector perpendicular a éste es (b cos t, a sen t), que será la dirección de la normal. Por tanto, la ecuación de la normal es: 1

æ – by ö3 ÷ sen t = ç 2 è a – b2 ø x = a cos t ü ý y = b sen t þ

Por tanto:

1

æ ax ö3 ÷ cos t = ç 2 è a – b2 ø

Consideramos la elipse de ecuaciones:

520

4.4. Evoluta de la elipse



Generación de curvas como envolventes Sustituyendo estas dos expresiones en (1), tenemos: 1

1

1

1

æ – by ö3 æ ax ö3 æ – by ö3æ ax ö3 ÷ – byç 2 ÷ = ( a 2 – b 2)ç 2 ÷ç ÷ axç 2 2 2 èa – b ø èa – b ø è a – b2 ø è a2 – b2 ø 1

1

æ – by ö3æ ax ö3 ÷ç ÷ y queda: Lo dividimos todo por: ( a – b )ç 2 è a – b2 ø è a2 – b2 ø 2

2

ax

( a 2 – b 2)

2

( ax)

(a

2

+

1 3

–b

2

)

1 3

by

=1

1

( a 2 – b 2)

( by) 3 1

( a 2 – b 2) 3

2

æ ax ö3 æ by ö3 ÷ +ç ÷ = 1 que es la ecuación de la evoluta de la elipse. Por tanto:ç 2 è a – b2 ø è a2 – b2 ø

5. CONCLUSIÓN Este tema lo hemos iniciado con algunas definiciones previas para definir después el concepto de envolvente de una familia de curvas. A continuación hemos visto cómo determinar la envolvente de una familia de curvas acompañado de algunos ejemplos. Un caso particular de envolvente es cuando la familia de curvas está formada por las rectas normales a una curva dada y recibe el nombre de evoluta. Para su estudio hemos visto algunos conceptos previos. Hemos acabado el tema con un ejemplo práctico de cálculo de la evoluta.


521

TEMA

48 Espirales y hélices. Presencia en la naturaleza, en el arte y en la técnica




524



INTRODUCCIÓN HISTÓRICA

2.

ECUACIONES DE UNA CURVA EN EL PLANO Y EN EL ESPACIO

3.

ESPIRALES

4.

LA ESPIRAL DE ARQUÍMEDES 4.1. Ecuación polar 4.2. El paso de lo discreto a lo continuo 4.3. Propiedades características 4.4. Construcción de la espiral arquimediana 4.5. Espiral de Arquímedes y trisección del ángulo

5.

LA ESPIRAL LOGARÍTMICA O EQUIANGULAR 5.1. Ecuación polar 5.2. Propiedades características 5.3. Trazado de la espiral logarítmica

6.

OTRAS ESPIRALES

7.

HÉLICES 7.1. Ecuaciones paramétricas de una hélice 7.2. Estudio particular de la hélice circular 7.3. Otras formas helicoidales

8.

PRESENCIA EN LA NATURALEZA, LA TÉCNICA Y EL ARTE 8.1. En la Naturaleza 8.2. En la Técnica 8.3. En el Arte

PRESENCIA EN LA NATURALEZA, LA TÉCNICA Y EL ARTE 8.1. En la Naturaleza 8.2. En la Técnica 8.3. En el Arte

8.

HÉLICES 7.1. Ecuaciones paramétricas de una hélice 7.2. Estudio particular de la hélice circular 7.3. Otras formas helicoidales

7.

OTRAS ESPIRALES

6.

LA ESPIRAL LOGARÍTMICA O EQUIANGULAR 5.1. Ecuación polar 5.2. Propiedades características 5.3. Trazado de la espiral logarítmica

5.

LA ESPIRAL DE ARQUÍMEDES 4.1. Ecuación polar 4.2. El paso de lo discreto a lo continuo 4.3. Propiedades características 4.4. Construcción de la espiral arquimediana 4.5. Espiral de Arquímedes y trisección del ángulo

4.

ESPIRALES

3.

ECUACIONES DE UNA CURVA EN EL PLANO Y EN EL ESPACIO

2.

INTRODUCCIÓN HISTÓRICA

1.



524

Espirales y hélices

1. INTRODUCCIÓN HISTÓRICA Aunque en el libro II de los Elementos, Euclides ilustra una propiedad iterativa de la sección áurea con una figura que conduce a una espiral, es Arquímedes en su tratado Sobre las espirales quien hace un primer estudio exhaustivo de la espiral que lleva su nombre. Atraído por los tres famosos problemas clásicos, y en concreto el de la trisección del ángulo, trató de dar solución a éste utilizando la espiral, que él mismo atribuyó a su amigo Conon de Alejandría. El libro Sobre las espirales fue muy admirado, pero poco leído, ya que se consideró la más difícil de todas las obras de Arquímedes. En cualquier caso fue la que más impresionó a sus sucesores. En ella determinaba Arquímedes la tangente a la espiral por medio de consideraciones cinemáticas que son un auténtico precedente del cálculo diferencial. Considerado un punto de la espiral sometido simultáneamente a un movimiento radial uniforme de alejamiento y a un movimiento circular de centro el origen, halló la dirección instantánea del movimiento y por lo tanto la dirección de recta tangente. Parece ser la primera vez que se determinó la tangente a una curva que no fuera una circunferencia. También hay en el libro varias proposiciones referentes a áreas relacionadas con la espiral. Por ejemplo, se demuestra que el área barrida por el radio vector en su primera vuelta completa es igual a un tercio del área del “primer círculo”, es decir, del círculo de centro el polo y radio la longitud del radio vector al finalizar la primera vuelta. Aunque es fácil probarlo ahora, teniendo en cuenta que el área es la integral 1 2p 2 ò r dq, hay que tener en cuenta que Arquímedes demostró ese resultado por el método más difícil de ex20 hausción. En el Renacimiento se recupera el interés por estas curvas en relación con el arte (Pacioli, Da Vinci, Durero,…). Así por ejemplo, este último obtuvo diversas espirales proyectando hélices. No obstante, en este período pasó un tanto desapercibida la posibilidad de desarrollar la geometría pura en la dirección que sugería el arte y la perspectiva. Posteriormente Cavalieri, a mediados del siglo XVII, obtuvo otro resultado que iba a tener consecuencias importantes. La espiral de Arquímedes P r = aq y la parábola de Apolonio x2 = ay eran curvas conocidas desde la antigüedad, pero nadie había descubierto ninguna relación entre ellas, hasta que Cavalieri tuvo la idea de compararlas. Si se deseara, por ejemplo, torcer la parábola x2 = ay en torno al vértice O dándole la forma de una espiral, de modo que O permanezca fijo y P pase a ocupar la posición P', entonces las ordenadas de los puntos de la parábola las O P' podemos considerar como transformadas en radios vectores por medio de las relaciones x = r e y = rq entre lo que llamamos ahora coordenadas cartesianas y polares. Aquí se aprecia una interacción entre elementos de geometría analítica Figura 1. con otros que corresponden al cálculo diferencial, cuando ambas ramas de la matemática no se habían iniciado formalmente. Descartes (1596-1650) tropezó con una “curva mecánica” que era rectificable después de todo. Se había divulgado y discutido ampliamente el problema de la trayectoria de caída de un cuerpo a través de una tierra en rotación (suponiendo dicha tierra permeable al movimiento), problema que condujo a Descartes a la espiral equiangular o logarítmica r = aebq como posible trayectoria. Si Descartes no se hubiese mantenido tan firme en rechazar tales curvas no-geométricas, podría haberse anticipado a Torricelli en descubrir, en 1645, la primera rectificación de una curva de la era moderna. Torricelli obtuvo, utilizando los métodos infinitesimales que había aprendido de Arquímedes, Galileo y Cavalieri, la longitud total de la espiral logarítmica desde q = 0 hacia atrás, según se enrolla asintóticamente en torno al polo. Durante la década de los 1640 Cavalieri había probado que la longitud de la primera vuelta de la espiral r = aq es igual a la longitud de la parábola x2 = ay desde x = 0 a x = 2pa. Gregory llegó precisamente a la curva y = lnx a partir de la espiral equiangular r = e q . Por una transformación geométrica que consiste en hacer la abscisa x igual al radio vector r de un punto variable, y la ordenada y igual al arco q. Jacques Bernoulli (1654-1705) estaba extraordinariamente interesado tanto en el cálculo como en el estudio de curvas. La que atrajo más fuertemente su imaginación fue la espiral logarítmica. Esta curva había sido mencionada ya por Descartes y había sido rectificada por Torricelli, pero Bernoulli profundiTEMARIO DE MATEMÁTICAS. PRUEBA A

525


526


Exigimos que las funciones anteriores del parámetro t sean continuas y derivables. Una curva en el espacio puede estar contenida en un plano; se denominaría entonces curva plana. En caso contrario tendríamos una curva alabeada. En el presente tema estudiaremos dos tipos de curvas, unas planas (espirales) y otras alabeadas (hélices) que suelen obtenerse por generación mecánica; o sea vinculadas al movimiento (rotación + traslación), y que podemos englobar bajo el rótulo de “formas enrolladas”.

zó en su estudio y mostró que tenía varias propiedades sorprendentes que no habían sido observadas con anterioridad: 1. 2. 3.

La evoluta de una espiral logarítmica es otra espiral logarítmica igual. La curva pedal de una espiral logarítmica con respecto a su polo (es decir, el lugar geométrico de las proyecciones del polo sobre las tangentes a la curva dada) es otra espiral logarítmica igual. La cáustica de reflexión para los rayos que parten del polo (es decir, la envolvente de los rayos reflejados en puntos de la curva dada) es otra espiral logarítmica igual. La cáustica de refracción para los rayos que surgen del polo (es decir, la envolvente de los rayos refractados en puntos de la curva) es otra espiral logarítmica igual.

Se entiende, pues, que la curva es la trayectoria que sigue un punto móvil en el plano. En el espacio, podemos decir lo mismo con tan sólo cambiar a tres el número de coordenadas, es decir r r r r r ( t ) = ( x( t ), y( t ), z ( t )) = x( t )i + y( t ) j+z(t)k 4.

Escribe Bernoulli: Me gusta de modo tan sorprendente esta maravillosa espiral, por sus propiedades singulares y admirables que apenas puedo saciarme de su contemplación. Resulta fácil comprender los sentimientos que le llevaron a pedir que grabaran sobre su tumba de Basilea la spira mirabilis junto con la inscripción Eadem mutata resurFigura 2. go (“Aun siendo modificada, surjo de nuevo la misma”). Jacques Bernoulli se vio conducido a un tipo de espiral diferente al repetir el procedimiento de Cavalieri de “doblar” la mitad de la parábola x2 = ay alrededor del origen para obtener una espiral de Arquímedes, pero con la diferencia de que, mientras que Cavalieri había estudiado esta transformación por métodos esencialmente sintéticos, Bernoulli utilizó en cambio coordenadas rectangulares y polares. Newton había usado ya anteriormente las coordenadas polares (quizá tan tempranamente como en 1671), pero la prioridad en la publicación parece corresponder a Bernoulli, que propuso medir las abscisas a lo largo de la circunferencia de un círculo fijo, y las ordenadas radialmente a lo largo de las llamas normales, en el Acta Eruditorum de 1691. Tres años más tarde propuso en la misma revista una modificación que estaba más de acuerdo con el sistema de Newton; la coordenada y era ahora la longitud del radio vector del punto, y x era el arco determinado por los lados del ángulo vectorial en una circunferencia de radio a trazada con centro en el polo. Estas coordenadas eran esencialmente lo que hoy escribiríamos como ( r, aq ). Bernoulli, lo mismo que Newton, estaba interesado principalmente en las aplicaciones de este nuevo sistema al cálculo, y dedujo por lo tanto fórmulas para la longitud del arco y para el radio de curvatura de una curva en coordenadas polares. Para el caso de su “espiral parabólica” r2 = aq, observó que el cálculo de la longitud del arco mediante la fórmula ds = dr2 + r2dq 2 , conduce a una integral en la que figura la raíz cuadrada de un polinomio de cuarto grado, primer ejemplo concreto de lo que llamamos ahora una integral elíptica.

En el plano, las ecuaciones paramétricas de una curva nos dan la posición de cada punto de la misma en función del parámetro t. Si damos a t el sentido físico del tiempo, podemos considerar que una curva viene dada por el vector de posición variable r r r r ( t ) = ( x( t ), y( t )) = x( t )i + y( t ) j

2. ECUACIONES DE UNA CURVA EN EL PLANO Y EN EL ESPACIO

Escribe Bernoulli: Me gusta de modo tan sorprendente esta maravillosa espiral, por sus propiedades singulares y admirables que apenas puedo saciarme de su contemplación. Resulta fácil comprender los sentimientos que le llevaron a pedir que grabaran sobre su tumba de Basilea la spira mirabilis junto con la inscripción Eadem mutata resurFigura 2. go (“Aun siendo modificada, surjo de nuevo la misma”). Jacques Bernoulli se vio conducido a un tipo de espiral diferente al repetir el procedimiento de Cavalieri de “doblar” la mitad de la parábola x2 = ay alrededor del origen para obtener una espiral de Arquímedes, pero con la diferencia de que, mientras que Cavalieri había estudiado esta transformación por métodos esencialmente sintéticos, Bernoulli utilizó en cambio coordenadas rectangulares y polares. Newton había usado ya anteriormente las coordenadas polares (quizá tan tempranamente como en 1671), pero la prioridad en la publicación parece corresponder a Bernoulli, que propuso medir las abscisas a lo largo de la circunferencia de un círculo fijo, y las ordenadas radialmente a lo largo de las llamas normales, en el Acta Eruditorum de 1691. Tres años más tarde propuso en la misma revista una modificación que estaba más de acuerdo con el sistema de Newton; la coordenada y era ahora la longitud del radio vector del punto, y x era el arco determinado por los lados del ángulo vectorial en una circunferencia de radio a trazada con centro en el polo. Estas coordenadas eran esencialmente lo que hoy escribiríamos como ( r, aq ). Bernoulli, lo mismo que Newton, estaba interesado principalmente en las aplicaciones de este nuevo sistema al cálculo, y dedujo por lo tanto fórmulas para la longitud del arco y para el radio de curvatura de una curva en coordenadas polares. Para el caso de su “espiral parabólica” r2 = aq, observó que el cálculo de la longitud del arco mediante la fórmula ds = dr2 + r2dq 2 , conduce a una integral en la que figura la raíz cuadrada de un polinomio de cuarto grado, primer ejemplo concreto de lo que llamamos ahora una integral elíptica.

2. ECUACIONES DE UNA CURVA EN EL PLANO Y EN EL ESPACIO

En el plano, las ecuaciones paramétricas de una curva nos dan la posición de cada punto de la misma en función del parámetro t. Si damos a t el sentido físico del tiempo, podemos considerar que una curva viene dada por el vector de posición variable r r r r ( t ) = ( x( t ), y( t )) = x( t )i + y( t ) j Se entiende, pues, que la curva es la trayectoria que sigue un punto móvil en el plano. En el espacio, podemos decir lo mismo con tan sólo cambiar a tres el número de coordenadas, es decir r r r r r ( t ) = ( x( t ), y( t ), z ( t )) = x( t )i + y( t ) j+z(t)k 4. 3.

La evoluta de una espiral logarítmica es otra espiral logarítmica igual. La curva pedal de una espiral logarítmica con respecto a su polo (es decir, el lugar geométrico de las proyecciones del polo sobre las tangentes a la curva dada) es otra espiral logarítmica igual. La cáustica de reflexión para los rayos que parten del polo (es decir, la envolvente de los rayos reflejados en puntos de la curva dada) es otra espiral logarítmica igual. La cáustica de refracción para los rayos que surgen del polo (es decir, la envolvente de los rayos refractados en puntos de la curva) es otra espiral logarítmica igual.

Exigimos que las funciones anteriores del parámetro t sean continuas y derivables. Una curva en el espacio puede estar contenida en un plano; se denominaría entonces curva plana. En caso contrario tendríamos una curva alabeada. En el presente tema estudiaremos dos tipos de curvas, unas planas (espirales) y otras alabeadas (hélices) que suelen obtenerse por generación mecánica; o sea vinculadas al movimiento (rotación + traslación), y que podemos englobar bajo el rótulo de “formas enrolladas”. 1. 2.

zó en su estudio y mostró que tenía varias propiedades sorprendentes que no habían sido observadas con anterioridad:



526

Espirales y hélices En el plano podemos comparar las ecuaciones paramétricas siguientes con t ³ 0: ì x = r cos t [1]í î y = r sen t

ì x = t cos t [ 2]í î y = t sen t

ì x = t 2 cos t [ 3]í 2 î y = t sen t

Las ecuaciones [1] corresponden a un circunferencia de radio r, mientras que las otras dos son ecuaciones paramétricas de espirales en el plano. Mas observemos que en [2] el radio vector OP crece uniformemente, lo cual no ocurre en [3] en que el radio crece cada vez “más deprisa”. Por las características de tales curvas las coordenadas más adecuadas para expresar su ecuación son las polares.

3. ESPIRALES De manera aproximada podemos definir la espiral como una curva plana que se forma al desplazarse un punto alrededor de otro (o de varios puntos), llamado centro o polo, alejándose de éste a cada vuelta. Es decir, es la trayectoria o curva descrita por un punto que se ve afectado simultáneamente por dos movimientos: uno lineal de desplazamiento sobre una recta, y otro angular. Aunque una espiral puede ser plana o alabeada, nos referiremos aquí a la primera. Cada vuelta de la curva se denomina “espira”, y llamaremos “paso” a la distancia radial entre el principio y el fin de una espira o vuelta. La espiral variará según sean los movimientos de desplazamiento y de rotación. A efectos gráficos se suelen también considerar como espirales otras curvas abiertas compuestas por arcos de circunferencias enlazadas. Existen mucho tipos de espirales, que pueden agruparse más o menos de la forma siguiente: a) b)

c) d) e) f)

Espirales aproximadas o falsas espirales: se parte como base de un polígono, generalmente regular, y haciendo centros en sus vértices se van enlazando arcos de circunferencia. Evolvente de la circunferencia: es la curva descrita por un punto de una recta móvil (“ruleta”) que va siendo constantemente tangente a una circunferencia base. Se forma así una curva indefinida que, partiendo de un punto de la circunferencia completa infinitas vueltas alrededor de ella y alejándose. Volutas: son falsas espirales utilizadas en ornamentación y arquitectura. Hay procedimientos de trazado específicos (Vignola, Golman...) más propios del dibujo técnico. Espirales arquimedianas: cuando a ángulos iguales descritos en el giro corresponden aproximaciones o alejamientos del punto generador también iguales. Espirales especiales: exigen un cálculo previo, como la parabólica, hiperbólica, logarítmica... En esta última el radio-vector crece en progresión geométrica, mientras el ángulo lo hace en progresión aritmética. Hélices: son espirales dibujadas sobre superficies cilíndricas, cónicas o esféricas.

4. LA ESPIRAL DE ARQUÍMEDES 4.1. Ecuación polar Ya sabemos que la espiral que debe su nombre al gran genio de Siracusa es la más antigua conocida (s. III a.C). Veamos cómo llegar de un modo sencillo a su ecuación polar, tratándose de una curva de generación mecánica. Sea un punto móvil P que parte de la posición inicial O y está sometido simultáneamente a un movimiento de giro de velocidad angular w y a un crecimiento uniforme del radio-vector r= OP . Si denominamos v a la velocidad constante con que crece r, entonces se tienen: ìq = wt í î r = vt


2p 4p 6p

Figura 3.

527


528


q v donde q es el ángulo de giro en radianes y t el tiempo. Si eliminamos el tiempo se llega a r = v× = q = aq. w w Luego la ecuación polar de una espiral de Arquímedes que parte del origen es

Uniendo mediante segmentos de recta los puntos O, H1, H3, H5,... o los O, H2, H4, H6,… tendremos una línea poligonal que se va enrollando sobre sí misma (“espiral poligonal”). Figura 5.

r = aq

(q ³ 0)

donde a es un número real no nulo, que adquiere un significado dinámico como cociente entre dos velocidades. H2 H1

O

O

H3

O

H2

H1

Nota: si cambiamos el sentido de giro (como el de las agujas del reloj o el contrario) obtendremos espirales simétricas entre sí H4

H3

H4

H5 H5

H6

H6

H7 H8

H7

H8

Figura 4.

t 0 ,G( O ,j ) , t1,G( O ,j ) , t 2 ,G( O ,j ) , t 3...

Vamos a hacer una pequeña reflexión sobre la propia definición de la espiral, que encierra tal vez más complejidad de lo que aparenta, pues implica la simultaneidad de dos movimientos continuos y uniformes. En principio puede ser interesante, al menos desde un punto de vista de la simplificación didáctica, asociar la espiral con el recorrido de una hormiga deslizándose sobre una varilla, la cual está fija en un extremo y gira alrededor de él, al mismo tiempo que la hormiga se aleja del extremo fijo. Sea un ángulo determinado Dq = j y una longitud determinada Dr = d. Supongamos que, partiendo de un extremo O de la varilla, la hormiga avanza una distancia d, llega a la posición H1 y se para. Después la varilla gira una ángulo j, transportando a la hormiga hasta la posición H2. La varilla se detiene y nuevamente la hormiga se aleja de O otra distancia d (H3). A continuación otro giro de varilla hasta H4, y así sucesivamente. r Consideramos que la posición inicial de la varilla es la dirección positiva del eje OX y llamemos vk al vector de módulo d y argumento kj. r Sea G(O, j) el giro de centro O y ángulo j, y sea t k la traslación de vector vk . Entonces la secuencia de posiciones H1, H2, H3, H4,... que va ocupando la hormiga se obtiene a partir de la inicial H0 en O, aplicando sucesivamente las transformaciones

4.2. El paso de lo discreto a lo continuo

Vamos a hacer una pequeña reflexión sobre la propia definición de la espiral, que encierra tal vez más complejidad de lo que aparenta, pues implica la simultaneidad de dos movimientos continuos y uniformes. En principio puede ser interesante, al menos desde un punto de vista de la simplificación didáctica, asociar la espiral con el recorrido de una hormiga deslizándose sobre una varilla, la cual está fija en un extremo y gira alrededor de él, al mismo tiempo que la hormiga se aleja del extremo fijo. Sea un ángulo determinado Dq = j y una longitud determinada Dr = d. Supongamos que, partiendo de un extremo O de la varilla, la hormiga avanza una distancia d, llega a la posición H1 y se para. Después la varilla gira una ángulo j, transportando a la hormiga hasta la posición H2. La varilla se detiene y nuevamente la hormiga se aleja de O otra distancia d (H3). A continuación otro giro de varilla hasta H4, y así sucesivamente. r Consideramos que la posición inicial de la varilla es la dirección positiva del eje OX y llamemos vk al vector de módulo d y argumento kj. r Sea G(O, j) el giro de centro O y ángulo j, y sea t k la traslación de vector vk . Entonces la secuencia de posiciones H1, H2, H3, H4,... que va ocupando la hormiga se obtiene a partir de la inicial H0 en O, aplicando sucesivamente las transformaciones

4.2. El paso de lo discreto a lo continuo

t 0 ,G( O ,j ) , t1,G( O ,j ) , t 2 ,G( O ,j ) , t 3...

Figura 4. H8

H7

H8

H7 H6

H6

H5 H5

H4

H3

H4

Nota: si cambiamos el sentido de giro (como el de las agujas del reloj o el contrario) obtendremos espirales simétricas entre sí H2 H1

H3

O

H1

O

H2

donde a es un número real no nulo, que adquiere un significado dinámico como cociente entre dos velocidades. r = aq

O

(q ³ 0)

Figura 5.

Luego la ecuación polar de una espiral de Arquímedes que parte del origen es q v donde q es el ángulo de giro en radianes y t el tiempo. Si eliminamos el tiempo se llega a r = v× = q = aq. w w

Uniendo mediante segmentos de recta los puntos O, H1, H3, H5,... o los O, H2, H4, H6,… tendremos una línea poligonal que se va enrollando sobre sí misma (“espiral poligonal”). CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


528

Espirales y hélices Imaginemos ahora que tanto el ángulo j como la distancia d se reducen a la mitad. El primer tramo de O a H2 puede descomponerse en dos más pequeños: avanzar d 2 , girar

j

2

j ; avanzar d 2 , girar 2

Luego podemos hacer lo mismo que antes y tendremos cada uno de estos descompuesto en otros dos: avanzar d 4 , girar

j

4

j ; avanzar d 4 , girar 4

En el límite de este proceso el desplazamiento y el giro serán simultáneos y las espirales poligonales se aproximarán a la curva espiral arquimediana.

4.3. Propiedades características a)

Espiral y proporcionalidad Se observa un paralelismo entre la ecuación polar r = aq y la ecuación en cartesianas y = ax, que es como sabemos la ecuación de una recta que pasa por el origen O. En ambos casos está presente la proporcionalidad directa: abscisa y ordenada en la recta, ángulo y radio en la espiral.

b)

Paso de la espiral La propiedad más peculiar de esta espiral y que la distingue de otras espirales es que la distancia entre espiras, es decir, el paso de la espiral es constante. En efecto, tal paso depende del valor de la constante a. Si a partir de una posición dada por P( r, q ) se efectúa una vuelta completa llegaremos a otro punto P'( r', q + 2p ). Los puntos P y P' están alineados con O y la distancia entre ellos es r'– r = a ( q + 2p ) – aq = 2pa lo que prueba que la “anchura” de la espiral es constante.

c)

Similitud con la circunferencia Sean los dos puntos P y P'determinados en dos espiras “consecutivas” al cortar por una semirrecta de origen O. Obviamente OP'= OP+ d , y si las espiras son muy exteriores, d será muy pequeño frente a OP y OP', por lo cual OP'@ OP. Podemos decir lo mismo para todos los puntos Q del arco PP', es decir OQ @ OP. Con ello probamos que el arco PP' es aproximadamente una circunferencia. Asimismo a medida que una espira es más exterior, el ángulo que forma en cada uno de sus puntos la tangente con el radio se acerca más a 90º, es decir, tiende a cumplirse la propiedad, exclusiva de la circunferencia, de que en cada punto la tangente y el radio trazado al punto de tangencia son perpendiculares. Cuanto más aumenta r más se asemejan las espiras a circunferencias.

d)

Similitud entre arcos de espirales Denotaremos por A(O; d ) a una transformación sencilla en el plano: “alejarse una distancia d del origen”. Salvo el punto O, cualquier otro punto P se transforma de manera unívoca en otro P' definido como el único punto alineado con O y P y en la misma semirrecta que P, tal que PP ' = d . La transformación anterior no es una traslación, pues cada punto se mueve en un dirección distinta aunque sea siempre la misma la magnitud del desplazamiento. Tampoco es una homotecia, pues el alargamiento no es proporcional a la distancia al origen, sino constante.


P' P

d

O

Figura 6. P' P

Q' Q

O R R'

Figura 7. 529


530


Ahora bien, tal transformación está presente, como vimos, en los movimientos que generan la espiral de Arquímedes o en los procedimientos para imitarlos. Una característica fundamental de las formas enrolladas es que al crecer, la B3 parte “nueva” tiene la misma forma que lo que ya había. A3 Vamos a fundamentar más esta aseveración. Supongamos dos arcos de espira consecutivos. Dividamos el ángulo en dos A2 B 2 partes iguales de medida j. Si giramos el arco B1B2 con respecto al origen un a ángulo j se transforma en el trozo A2A3 de la espira anterior. Usando la transa formación “alejarse” se obtiene el trozo B2B3. A 1 B1 Es decir, el proceso es:

Procedimientos dinámicos: a) Método del alfarero: el alfarero centra el plato a decorar en el torno y lo pone a girar. Coloca el dedo en el centro del plato y los desliza hacia fuera siguiendo una dirección fija (hacia él por ejemplo) y a velocidad constante. Se puede simular con un tocadiscos o cualquier aparato que gire. Adosando un papel y con la ayuda de una regla, deslizamos un lápiz en línea recta, desde el pivote hacia fuera, procurando que lleve una velocidad constante. Se puede cambiar la velocidad de giro del tocadiscos y combinarla con desplazamientos más o menos rápidos del lápiz. No deja de ser inquietante que siendo nuestro trazo “recto”, exactamente desde el pivote central hasta el borde en que acaba el papel, paradójicamente la línea que aparece en el dibujo tenga una longitud mucho mayor.

3.

Con programas informáticos (LOGO).

2.

O

B1B2

Figura 8.

G(O ,j )

¾¾¾ ¾® A 2A 3

A(O,d )

¾¾¾ ¾® B2B3

Figura 10.

Figura 9.

De esta manera el trozo B1B2 genera al B2B3 y éste al siguiente, etc. No podemos decir estrictamente que el arco B1B2 tiene la misma forma que el B2B3, pues en el primer paso del proceso sí se trata de un giro, pero el segundo no es ni un giro ni un movimiento. Lo que sí podemos decir es que a partir de un arco de espiral se puede generar toda ella mediante transformaciones sucesivas.

4.4. Construcción de la espiral arquimediana Hay varios procedimientos para la visualización y el trazado de la espiral, algunos de ellos interesantes sobre todo desde un punto de vista didáctico. A partir de la ecuación polar: con papel “polar” o marcando con ayuda de un semicírculo graduado ángulos cada 5º y determinando los radios correspondientes. Es un procedimiento parecido al que utiliza la araña para construir sus telas o los cesteros de mimbre para hacer los fondos de las cestas. El papel polar es un tipo de papel gráfico especial que se comercializa al igual que el papel milimetrado, aunque un poco más caro. Lo que hacemos es aproximar la espiral arquimediana por una poliespiral (formada por segmentos). 1.

1.

A partir de la ecuación polar: con papel “polar” o marcando con ayuda de un semicírculo graduado ángulos cada 5º y determinando los radios correspondientes. Es un procedimiento parecido al que utiliza la araña para construir sus telas o los cesteros de mimbre para hacer los fondos de las cestas. El papel polar es un tipo de papel gráfico especial que se comercializa al igual que el papel milimetrado, aunque un poco más caro. Lo que hacemos es aproximar la espiral arquimediana por una poliespiral (formada por segmentos).

Hay varios procedimientos para la visualización y el trazado de la espiral, algunos de ellos interesantes sobre todo desde un punto de vista didáctico.

4.4. Construcción de la espiral arquimediana De esta manera el trozo B1B2 genera al B2B3 y éste al siguiente, etc. No podemos decir estrictamente que el arco B1B2 tiene la misma forma que el B2B3, pues en el primer paso del proceso sí se trata de un giro, pero el segundo no es ni un giro ni un movimiento. Lo que sí podemos decir es que a partir de un arco de espiral se puede generar toda ella mediante transformaciones sucesivas. Figura 9.

Figura 10.

Figura 8.

B1B2

¾¾¾ ¾® A 2A 3 G(O ,j )

¾¾¾ ¾® B2B3 A(O,d )

2.

Con programas informáticos (LOGO).

3.

Procedimientos dinámicos: a) Método del alfarero: el alfarero centra el plato a decorar en el torno y lo pone a girar. Coloca el dedo en el centro del plato y los desliza hacia fuera siguiendo una dirección fija (hacia él por ejemplo) y a velocidad constante. Se puede simular con un tocadiscos o cualquier aparato que gire. Adosando un papel y con la ayuda de una regla, deslizamos un lápiz en línea recta, desde el pivote hacia fuera, procurando que lleve una velocidad constante. Se puede cambiar la velocidad de giro del tocadiscos y combinarla con desplazamientos más o menos rápidos del lápiz. No deja de ser inquietante que siendo nuestro trazo “recto”, exactamente desde el pivote central hasta el borde en que acaba el papel, paradójicamente la línea que aparece en el dibujo tenga una longitud mucho mayor.

O

Ahora bien, tal transformación está presente, como vimos, en los movimientos que generan la espiral de Arquímedes o en los procedimientos para imitarlos. Una característica fundamental de las formas enrolladas es que al crecer, la B3 parte “nueva” tiene la misma forma que lo que ya había. A3 Vamos a fundamentar más esta aseveración. Supongamos dos arcos de espira consecutivos. Dividamos el ángulo en dos A2 B 2 partes iguales de medida j. Si giramos el arco B1B2 con respecto al origen un a ángulo j se transforma en el trozo A2A3 de la espira anterior. Usando la transa formación “alejarse” se obtiene el trozo B2B3. A 1 B1 Es decir, el proceso es:



530


Figura 11. b)

4.

Figura 12.

Desenrollando un hilo: Tomamos un pivote rígido sobre el que se enrolla el hilo y se mantiene perpendicular al plano y con el punto de apoyo fijo. Por el extremo libre se sujeta un lápiz o punzón como indica la figura. Manteniendo tenso el hilo se hace girar suavemente para que se vaya desenrollando el hilo. La línea obtenida se aproxima a una espiral cuyo paso será precisamente el perímetro del pivote.

Figura 13.

Procedimiento gráfico: Para el trazado consideramos como elemento básico el paso OL. Dividimos éste en un determinado número de partes iguales, por ejemplo doce, aunque cuanto mayor sea el número de divisiones la espiral quedará mejor concretada a efectos de trayectoria y trazado. Dibujamos circunferencias concéntricas, de centro O y radios r, para la primera, 2r para la segunda, 3r para la tercera, etc. Dividimos también estas circunferencias en las doce partes inicialmente adoptadas mediante rectas que pasen por O y unimos, mediante un arco, el punto O con el punto de corte entre la recta y la primera circunferencia, con otro arco este punto y el de corte con la segunda circunferencia, así sucesivamente. B' 31

41

21

A' 51 11 C

D

B

E

A

F

61

0

1 2 3 4

5 6 7

1 8 9 10 11 12 1' 2'

G K 71

111

H I 81

Figura 14.


J

101 91

531


532


4.5. Espiral de Arquímedes y trisección del ángulo

Ángulo q0 = 0º q1 = j q2 = 2j ... qj = jj

Radio OP0 = r0 OP1 = r1 = r0(1 + k) OP2 = r2 = r0(1 + k)2 ... OPj = rj = r0(1+k)j

Las espirales arquimedianas son una de las curvas que permiten resolver uno de los clásicos problemas, el problema de la trisección de un ángulo. El procedimiento es el siguiente: Situemos el ángulo de manera que el vértice y el lado inicial coincidan con el origen O de la espiral y la posición OA de la semirrecta que gira. Sea P el punto de intersección del segundo lado del ángulo con la espiral, y dividamos el segmento OP en tres partes iguales por medio de los puntos R y S. Sean RS y SV arcos de circunferencias de centro O y radios OR y OS respectivamente. Si estas circunferencias cortan a la espiral en los puntos U y V, entonces las semirrectas OU y OV trisecan el ángulo ÐAOP. El valor k tiene como significado el porcentaje de crecimiento del radio. Entonces podemos establecer la relación entre ángulo q (múltiplo de j) y radio r, teniéndose: rn = 1+ k rn–1

Figura 16.

P

Esta espiral se genera de manera similar a la arquimediana, combinando un movimiento rotatorio respecto a un polo O con un alejamiento simultáneo. La diferencia estriba en que no se mantiene la distancia entre espiras, es decir, el paso no es constante. Vamos a llegar a la ecuación polar de esta espiral por un proceso de aproximación. Supongamos un conjunto de n semirrectas con vértice en O, for360º 2p mando entre cada dos consecutivas un ángulo j = = rad. p p Siguiendo el sentido de giro contrario al de las agujas del reloj, vamos tomando radios OP0 , OP1, OP2 ,... de modo que formen progresión geométrica de razón mayor que la unidad, es decir

P5 P4

V

j j P1

P2

5. LA ESPIRAL LOGARÍTMICA O EQUIANGULAR

j

P0

Figura 15.

O

A

j

U

O

j

R

P3

(k > 0)

S

5.1. Ecuación polar

Esta espiral se genera de manera similar a la arquimediana, combinando un movimiento rotatorio respecto a un polo O con un alejamiento simultáneo. La diferencia estriba en que no se mantiene la distancia entre espiras, es decir, el paso no es constante. Vamos a llegar a la ecuación polar de esta espiral por un proceso de aproximación. Supongamos un conjunto de n semirrectas con vértice en O, for360º 2p mando entre cada dos consecutivas un ángulo j = = rad. p p Siguiendo el sentido de giro contrario al de las agujas del reloj, vamos tomando radios OP0 , OP1, OP2 ,... de modo que formen progresión geométrica de razón mayor que la unidad, es decir

5.1. Ecuación polar

P0

Figura 15.

O j

U

P4

R

P1 j

A

j

j

O

j

V

P5

S

P3

5. LA ESPIRAL LOGARÍTMICA O EQUIANGULAR

P2

rn = 1+ k rn–1 P

Figura 16.

(k > 0)

Situemos el ángulo de manera que el vértice y el lado inicial coincidan con el origen O de la espiral y la posición OA de la semirrecta que gira. Sea P el punto de intersección del segundo lado del ángulo con la espiral, y dividamos el segmento OP en tres partes iguales por medio de los puntos R y S. Sean RS y SV arcos de circunferencias de centro O y radios OR y OS respectivamente. Si estas circunferencias cortan a la espiral en los puntos U y V, entonces las semirrectas OU y OV trisecan el ángulo ÐAOP. El valor k tiene como significado el porcentaje de crecimiento del radio. Entonces podemos establecer la relación entre ángulo q (múltiplo de j) y radio r, teniéndose: Ángulo q0 = 0º q1 = j q2 = 2j ... qj = jj

Radio OP0 = r0 OP1 = r1 = r0(1 + k) OP2 = r2 = r0(1 + k)2 ... OPj = rj = r0(1+k)j

Las espirales arquimedianas son una de las curvas que permiten resolver uno de los clásicos problemas, el problema de la trisección de un ángulo. El procedimiento es el siguiente:

4.5. Espiral de Arquímedes y trisección del ángulo CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


532

Espirales y hélices Así pues, los puntos Pj ( rj , q j ) cumplen que mientras los ángulos crecen en progresión aritmética, los radios lo hacen en progresión geométrica. Por otro lado, hemos de notar que los triángulos OPj–1Pj y OPjPj+1 son semejantes, pues tienen igual el OPj OPj+1 ángulo en O y dos de sus lados son proporcionales = = 1+ k. Por consiguiente los otros lados OPj–1 OPj también están en la misma razón, o sea:

PjPj+1 Pj–1Pj

= 1+ k. Como consecuencia los ángulos girados en Pj–1 y en

Pj son iguales. Vamos a pasar ahora de lo discreto a lo continuo para llegar a la ecuación de la curva. Según obtuvimos anteriormente, si q es múltiplo de j el radio viene dado por r = r0 (1+ k )q j Para pasar de la espiral poligonal a la curva, hemos de suavizarla, pero conservando las mismas reglas de juego. Podemos subdividir el ángulo j en n partes iguales (giros más pequeños) y asimismo reducir k también a el porcentaje de crecimiento del radio. n Entonces la expresión [4] del radio se convertirá ahora en

[4]

Figura 17. nq

æ k öj r = r0ç1+ ÷ è nø

[5]

Si continuamos este proceso de subdivisión de manera indefinida, la espiral poligonal tenderá a la espiral logarítmica cuando n ® ¥, en cuyo caso la expresión del radio en función de q queda nq

q æ k öj r = lím r0ç1+ ÷ = r0e j n ®¥ è nø k

de donde la ecuación polar de dicha espiral podrá ponerse como r = r0ebq

[6]

El nombre de “logarítmica” proviene de la relación entre radio y ángulo que se expresa a través del lo1 r garitmo: q = ln . b r0 En general la ecuación polar de una espiral equiangular puede expresarse mediante una exponencial de base cualquiera, por ejemplo: r = r0a q , siendo a un número real positivo (a ¹ 1).

5.2. Propiedades características La propiedad fundamental que tienen estas espirales, de ahí su nombre (equiangulares), es la siguiente: En cualquier punto el ángulo que forma la recta tangente con la recta que une ese punto con el centro es constante.


Figura 18. O 533


534 B


Figura 20.

Veamos ahora otra propiedad importante relacioR nada con la similitud entre diferentes trozos de una espiQ' Q ral de este tipo. P' Puede decirse que la espiral logarítmica es la forma que tienen las conchas de las mayoría de los caracoles, así como la forma de disponerse las semillas de girasol o P incluso la forma que adopta una galaxia en su expansión. Cuando un caracol crece no sólo respeta la parte de la concha anterior, que permanece invariable, sino O que además el trozo nuevo que segrega es una repetición, ampliada, de lo anterior. En este caso, la repetición es una semejanza en el estricto sentido matemático de la palabra. Recordemos que ello no ocurría en la esFigura 19. piral de Arquímedes. En efecto, sean dos trozos “consecutivos” PQ y QR correspondientes a un mismo ángulo j. Recordemos OQ OR . Si giramos el arco PQ un ángulo j, se transforma en P 'Q ', siendo P 'Q 'y QR según vimos antes que = OP OQ homotéticos respecto del origen. En resumen, del trozo “viejo” PQ se llega al “nuevo” QR mediante un giro y una homotecia de centro O, o sea: G ( O,j ) H(O ,k ) ¾® P 'Q ' ¾ ¾ ¾® QR PQ ¾ ¾ ¾ F

C

X

G

I

H

E

A

D

Y

No es sencillo obtener espirales de este tipo por procedimientos dinámicos. Necesitaríamos además de un giro uniforme y continuo, un desplazamiento radial continuo cuya velocidad creciera exponencialmente. Por ello se recurre a procedimientos gráficos aproximados como el siguiente:

5.3. Trazado de la espiral logarítmica

Si fijamos un r1 (valor del radio r para un ángulo q1), entonces para cualquier otro q > q1, tendremos bq ' . Lo cual significa que a partir del punto P1( r1, q1 ), la q = q1+ q ', con lo que r = r0eb( q1+ q ') = r0e bq1 × e bq ' = re 1 espiral es una copia ampliada de la espiral inicial. Por todo lo anterior se justifica el hecho de que algunos autores hayan bautizado a la espiral logarítmica como la “curva del crecimiento armonioso”.

Concluimos que los trozos PQ y QR son semejantes. Lo anterior se puede justificar de manera equivalente si tomamos la ecuación en polares de la espiral equiangular r = r0ebq . A partir de un punto P( r, q ), al cabo de una vuelta completa llegamos al P'( r', q + 2p ), cumpliéndose:

Concluimos que los trozos PQ y QR son semejantes. Lo anterior se puede justificar de manera equivalente si tomamos la ecuación en polares de la espiral equiangular r = r0ebq . A partir de un punto P( r, q ), al cabo de una vuelta completa llegamos al P'( r', q + 2p ), cumpliéndose: r' r0eb( q+ 2p ) = = e2bp = cte r r0ebq r' r eb( q+ 2p ) = 0 bq = e2bp = cte r r0e

Si fijamos un r (valor del radio r para un ángulo q1), entonces para cualquier otro q > q1, tendremos 1 bq ' . Lo cual significa que a partir del punto P1( r1, q1 ), la q = q1+ q ', con lo que r = r0eb( q1+ q ') = r0e bq1 × e bq ' = re 1 espiral es una copia ampliada de la espiral inicial. Por todo lo anterior se justifica el hecho de que algunos autores hayan bautizado a la espiral logarítmica como la “curva del crecimiento armonioso”.

Veamos ahora otra propiedad importante relacionada con la similitud entre diferentes trozos de una espiQ ral de este tipo. P' Puede decirse que la espiral logarítmica es la forma que tienen las conchas de las mayoría de los caracoles, así como la forma de disponerse las semillas de girasol o P incluso la forma que adopta una galaxia en su expansión. Cuando un caracol crece no sólo respeta la parte de la concha anterior, que permanece invariable, sino O que además el trozo nuevo que segrega es una repetición, ampliada, de lo anterior. En este caso, la repetición es una semejanza en el estricto sentido matemático de la palabra. Recordemos que ello no ocurría en la esFigura 19. piral de Arquímedes. En efecto, sean dos trozos “consecutivos” PQ y QR correspondientes a un mismo ángulo j. Recordemos OQ OR . Si giramos el arco PQ un ángulo j, se transforma en P 'Q ', siendo P 'Q 'y QR según vimos antes que = OP OQ homotéticos respecto del origen. En resumen, del trozo “viejo” PQ se llega al “nuevo” QR mediante un giro y una homotecia de centro O, o sea: G ( O,j ) H(O ,k ) ¾® P 'Q ' ¾ ¾ ¾® QR PQ ¾ ¾ ¾

5.3. Trazado de la espiral logarítmica

No es sencillo obtener espirales de este tipo por procedimientos dinámicos. Necesitaríamos además de un giro uniforme y continuo, un desplazamiento radial continuo cuya velocidad creciera exponencialmente. Por ello se recurre a procedimientos gráficos aproximados como el siguiente: Y

D

H

C

I

A

E

G

X

F

R Q'

B

Figura 20.

534



Espirales y hélices Partiendo de unos ejes coordenados, trazamos un segmento que corte al semieje positivo de abscisas en A y al negativo de ordenadas en B. Por B trazamos la perpendicular a este segmento que corta al semieje negativo de abscisas en C. Por C trazamos la perpendicular al segmento BC que corta al semieje positivo de ordenadas en D, y continuando con este proceso, obtenemos los puntos E, F, G, H. Uniendo, mediante arcos o segmentos curvilíneos, los puntos A, E, C, D, E..., obtenemos la espiral logarítmica o equiangular. Si nos basamos en la propiedad fundamental podemos hacer una construcción aproximada como la que se muestra en la figura siguiente, trazando semirrectas con igual separación angular y formando un “caracol” con triángulos semejantes “adosados”.

Figura 21.

6. OTRAS ESPIRALES Entre las numerosas espirales que existen, de Cornu, de Côtes o espiga, de Fermat, de Galileo, de Sturm, etc., hacemos mención de la espiral hiperbólica, de ecuación r× q = a o r = a q, siendo a un número real positivo. Consta, como puede verse en el dibujo del margen, de una asíntota que es una recta paralela al eje polar y alejada de él una distancia a.

y

a x

O

Figura 22. Una imitación de las espirales estudiadas son las falsas espirales, llamadas así por ser curvas “a trozos”. Así por ejemplo la “falsa espiral lineal” o de dos centros se construye partiendo como base de un segmento AB, en cuyos extremos están los centros. Prolongando el segmento AB por ambos lados y haciendo centro en A, trazamos una semicircunferencia de radio AB, que corta a la prolongación del segmento en un punto C. Haciendo centro en B y con radio BC se traza otra semicircunferencia que corta a la prolongación del segmento en D. Continuamos el proceso alternando los centros en A y en B.

D

B

A

C


535


536


Tomando como base un polígono regular y por un procedimiento análogo pueden construirse falsas espirales de tres o más centros. Figura 26.

C D

A

C

B

BA

F 1 A 2 B D C E

Si sustituimos los arcos de circunferencia por segmentos y utilizando procedimientos de construcción inspirados en las espirales anteriores podemos obtener otras formas enrolladas: las espirales poligonales o poliespirales. Par ejemplo, partamos de un punto P0 y desplacémonos hacia la derecha hasta un nuevo punto P1, después hacia arriba hasta otro punto P2, a continuación hacia la izquierda hasta P3, y así sucesivamente de modo que cada paso cambiamos la dirección girando 90º. Si procuramos que cada desplazamiento sea siempre mayor (Pi–1Pi > PP i i+1) o siempre menor (Pi–1Pi < PP i i+1) que el precedente, tendremos una forma que se va enrollando sobre sí misma de dentro hacia fuera o de afuera hacia adentro. Se trata de una poliespiral cuadrada. Figura 24.

Hay otras falsas espirales interesantes, que se construyen enlazando arcos de circunferencia cuyos radios, y por ende sus longitudes, están en progresión geométrica de una razón dada. Tenemos como ejemplos la espiral áurea, la espiral de Durero (construida a partir de los números de Fibonacci), o la espiral de paso gnómico 2. Todas ellas son aproximaciones de la espiral equiangular. 3

Figura 25. 8

5

1

2 1

1 2

1

5

8

Figura 25. 3

Si sustituimos los arcos de circunferencia por segmentos y utilizando procedimientos de construcción inspirados en las espirales anteriores podemos obtener otras formas enrolladas: las espirales poligonales o poliespirales. Par ejemplo, partamos de un punto P0 y desplacémonos hacia la derecha hasta un nuevo punto P1, después hacia arriba hasta otro punto P2, a continuación hacia la izquierda hasta P3, y así sucesivamente de modo que cada paso cambiamos la dirección girando 90º. Si procuramos que cada desplazamiento sea siempre mayor (Pi–1Pi > PP i i+1) o siempre menor (Pi–1Pi < PP i i+1) que el precedente, tendremos una forma que se va enrollando sobre sí misma de dentro hacia fuera o de afuera hacia adentro. Se trata de una poliespiral cuadrada.

Hay otras falsas espirales interesantes, que se construyen enlazando arcos de circunferencia cuyos radios, y por ende sus longitudes, están en progresión geométrica de una razón dada. Tenemos como ejemplos la espiral áurea, la espiral de Durero (construida a partir de los números de Fibonacci), o la espiral de paso gnómico 2. Todas ellas son aproximaciones de la espiral equiangular. Figura 24.

C BA D

B A

D E

C

F 1 A 2 B

C

Tomando como base un polígono regular y por un procedimiento análogo pueden construirse falsas espirales de tres o más centros. Figura 26.



536

Espirales y hélices Obtendríamos una similitud con la espiral arquimediana, en cuanto a la regla de formación, si las longitudes de los tramos sucesivos estuviesen en progresión aritmética. También podemos fijar la razón de crecimiento, al igual que hicimos en la formación de la espiral equiangular, en cuyo caso las longitudes de los tramos estarían en progresión geométrica. Si tomamos el ángulo de giro de 60º, en lugar de 90º, obtendríamos poliespirales hexagonales. En ge360º neral el ángulo de giro puede ser y tendríamos espirales poligonales, bien de paso constante o de paso n creciente (con cierta razón de crecimiento).

Figura 27.

Figura 28.

Las citadas formas pueden obtenerse con la ayuda de programas informáticos (LOGO, por ejemplo) y para n grande constituyen buenas aproximaciones discretas de las curvas espirales.

7. HÉLICES Las hélices constituyen un tipo de curvas alabeadas (no planas) que se englobarían dentro de las formas enrolladas estudiadas. Podemos decir que las hélices son espirales espaciales. Desde un punto de vista “mecánico” la hélice sería la trayectoria de un punto sometido simultáneamente a un movimiento giratorio alrededor de un eje y a otro movimiento lineal de avance paralelo al eje de rotación. Puede incluso añadirse un tercer movimiento: el alejamiento respecto al eje de rotación.

7.1. Ecuaciones paramétricas de una hélice La ecuación cartesiana x2 + y2 = r2 define en el espacio un cilindro circular recto de eje OZ. Una “paì x = r cos q ï rametrización” de dicha superficie sería í y = r sen q . ï îz= b Observemos que tales ecuaciones son las ecuaciones paramétricas de una superficie, ya que incluyen dos parámetros arbitrarios. En la ecuación implícita observamos que no interviene la variable z; dicha variable tiene “completa libertad”. ¿Qué pasa si en las ecuaciones del cilindro cambiamos b por el propio q ? Tendríamos ahora las ecuaciones paramétricas ì x = r cos q ï í y = r sen q ï îz= q

[7]

que no definen ahora una superficie sino una curva. La z va aumentando paulatinamente conforme la proyección ( x, y ) sobre el plano OXY va describiendo circunferencias. TEMARIO DE MATEMÁTICAS. PRUEBA A

537


538


Las ecuaciones [7] determinan una curva alabeada en el espacio denominada “hélice circular”. Cada intervalo de q de amplitud 2p se tiene una “espira”.

Z

que corresponden también a una hélice cónica, contenida en el cono de ecuación cartesiana x2 + y2 = ì x = q cos q ï í y = q sen q ï î z = bq

1 2 z . b2 [10]

2p

Además los puntos de la curva verifican la ecuación cartesiana x 2 + y 2 = z 2, que es la ecuación de un cono circular recto de eje OZ y vértice (0,0,0), que en paramétricas sería x = b cos q, y = b sen q, z = b. Por tanto, las ecuaciones [9] definen una curva contenida en dicho cono, que se denomina “hélice cónica”. En general podemos introducir una ligera modificación en las ecuaciones [9] y tendríamos las ecuaciones 2p

O

Figura 29.

Figura 30.

X

X

Y

Si modificamos ligeramente las ecuaciones [7] y ponemos Y

ì x = rcos q ï í y = rsen q ï î z = bq

[8]

seguimos teniendo una hélice. En caso de que sea b > 0 la hélice se llama “dextrógira” y en caso de que b < 0 “levógira”. Tanto [7] como [8] están contenidas en el cilindro de partida, por ellos se llaman hélices cilíndricas. Modifiquemos ahora de nuevo las ecuaciones paramétricas de las hélices anteriores y pongamos Z

Observamos ahora que a medida que varía a el valor de z “avanza” mientras que la proyección ( x, y ) sobre el plano OXY no describe ahora una circunferencia sino una espiral. ì x = q cos q ï í y = q sen q ï îz= q

ì x = q cos q ï í y = q sen q ï îz= q

[9]

[9]

seguimos teniendo una hélice. En caso de que sea b > 0 la hélice se llama “dextrógira” y en caso de que b < 0 “levógira”. Tanto [7] como [8] están contenidas en el cilindro de partida, por ellos se llaman hélices cilíndricas. Modifiquemos ahora de nuevo las ecuaciones paramétricas de las hélices anteriores y pongamos

Observamos ahora que a medida que varía a el valor de z “avanza” mientras que la proyección ( x, y ) sobre el plano OXY no describe ahora una circunferencia sino una espiral. Z

ì x = rcos q ï í y = rsen q ï î z = bq

[8]

Y

Si modificamos ligeramente las ecuaciones [7] y ponemos Figura 30.

Figura 29.

X

X

Además los puntos de la curva verifican la ecuación cartesiana x 2 + y 2 = z 2, que es la ecuación de un cono circular recto de eje OZ y vértice (0,0,0), que en paramétricas sería x = b cos q, y = b sen q, z = b. Por tanto, las ecuaciones [9] definen una curva contenida en dicho cono, que se denomina “hélice cónica”. En general podemos introducir una ligera modificación en las ecuaciones [9] y tendríamos las ecuaciones Y

O

2p

2p

ì x = q cos q ï í y = q sen q ï î z = bq

[10]

Las ecuaciones [7] determinan una curva alabeada en el espacio denominada “hélice circular”. Cada intervalo de q de amplitud 2p se tiene una “espira”.

que corresponden también a una hélice cónica, contenida en el cono de ecuación cartesiana x2 + y2 = Z



538

1 2 z . b2


7.2. Estudio particular de la hélice circular Z

Partamos de un cilindro de revolución de radio r y fijemos una de sus generatrices g. Sea P un punto de dicha superficie y R su proyección sobre un plano fijado que sea perpendicular al eje del cilindro. El punto P vendrá determinado por el arco QR = s (“abscisa curvilínea”) y la cota RP = z. Convendremos en asignar para s sentido positivo el usual, es decir, contrario a las agujas del reloj. La hélice cilíndrica circular es, por definición, la línea contenida en la superficie cilíndrica tal que todos sus puntos cumplen z = ks.

Q'

P

La longitud del segmentoQQ '= h comprendido entre dos puntos sucesivos de la hélice en una misma generatriz se denomina “paso” y es igual a h = k ×2pr. Entonces z=

Y X

R

Q

h h h s= rq = q = bq 2pr 2pr 2p

Figura 31.

Como las coordenadas ( x, y ) de la proyección R, referidas a los ejes OX y OY son x = r cos q ,

y = r sen q

tendremos las ecuaciones paramétricas de la hélice. Hemos de hacer notar la siguiente propiedad: En el desarrollo plano del cilindro la hélice se transforma en una recta.

En efecto, pues para cualquier punto P se cumple: RP z = = k = cte QR s Al desarrollar, tendremos R1P1 = x2

h P1

, Q1R1 = x2

cumpliéndose también: RP RP = k = 1 1 = tg a QR Q1R1

Q1

A

R1 2pr

Figura 32.

de donde x2 = kx1, que es la ecuación de una recta. El ángulo a se llama “inclinación” de la hélice. Veamos además cuáles son las proyecciones de la hélice sobre los tres planos coordenados: a)

Proyección sobre el plano OXY: El punto P ( r cos q , r sen q , bq ) se proyecta en el punto P ( rcos q , rsen q ,0 ), obteniéndose la curva ì x = r cos q ìx2 + y2 = r2 ï í y = r sen q que es la circunferencia contenida en el plano OXY dada por í . îz = 0 ï îz= 0

b)

Proyección sobre el plano OYZ: ìx= 0 ì ï x= 0 ï z. í y = rsen q . Se obtiene la sinusoide contenida en el plano OYZ dada por í y = r sen ï ï î b î z = bq


539


540


c)

Proyección sobre el plano OXZ: ìx = r cos q ì ï ïx = r cos z í y= 0 . Se obtiene la cosinuoide contenida en el plano OXZ dada por í b. ïy= 0 ï î î z = bq

Por tanto es muy fácil hacer la plantilla plana sobre cartulina, sin más que tener en cuenta que los puntos A y A', B y B', etc., estén a la misma altura para que casen bien al hacer el cilindro. Lo anterior sugiere además que si se dan dos puntos A y B de un cilindro circular recto, la trayectoria más corta para ir desde A hasta B sobre la superficie del cilindro es un segmento de hélice.

Figura 34.

ìr= r ï En coordenadas cilíndricas ( r, q , z ) cualquier punto de la hélice verifica: íq = t que se reducen a ï î z = bt ìr = r í que son las ecuaciones de la hélice. î z = bq A´

A

B´

B

C´

C

D´

D

E´

E

Para un mismo radio r, lo que cambia de una hélice a otra es la separación entre las espiras. Al variar b, éstas se comprimen o estiran. El “paso de la hélice” o “paso de rosca” es lo que varía z cuando el argumento pasa de q a q + 2p, es decir:

Podemos construir un modelo que simule una hélice circular, con la ayuda de una plantilla rectangular de cartulina que se enrollará hasta formar un cilindro. La hélice (de paso constante) se visualizará dibujada sobre dicho cilindro. Si damos un corte a dicho cilindro por una generatriz y desplegamos las espiras se convierten en rectas paralelas. b( q + 2p) – bq = 2pb

Para obtener la longitud de una espira podemos suponer la hélice dibujada sobre un cilindro, que cortamos por una de sus generatrices y desenrollamos:

Figura 33.

2pr L L

L = 2p r2 + b 2

2p

L = 2p r2 + b 2

2p 2pr

Para obtener la longitud de una espira podemos suponer la hélice dibujada sobre un cilindro, que cortamos por una de sus generatrices y desenrollamos:

Figura 33.

Podemos construir un modelo que simule una hélice circular, con la ayuda de una plantilla rectangular de cartulina que se enrollará hasta formar un cilindro. La hélice (de paso constante) se visualizará dibujada sobre dicho cilindro. Si damos un corte a dicho cilindro por una generatriz y desplegamos las espiras se convierten en rectas paralelas. b( q + 2p) – bq = 2pb

Para un mismo radio r, lo que cambia de una hélice a otra es la separación entre las espiras. Al variar b, éstas se comprimen o estiran. El “paso de la hélice” o “paso de rosca” es lo que varía z cuando el argumento pasa de q a q + 2p, es decir: D´ C´

E

ìr = r í que son las ecuaciones de la hélice. î z = bq

E´

D C

ìr= r ï En coordenadas cilíndricas ( r, q , z ) cualquier punto de la hélice verifica: íq = t que se reducen a ï î z = bt B´

A´

B

A

Figura 34.

ìx = r cos q ì z ï ï x = r cos í y= 0 . Se obtiene la cosinuoide contenida en el plano OXZ dada por í b. ïy= 0 ï î î z = bq

Por tanto es muy fácil hacer la plantilla plana sobre cartulina, sin más que tener en cuenta que los puntos A y A', B y B', etc., estén a la misma altura para que casen bien al hacer el cilindro. Lo anterior sugiere además que si se dan dos puntos A y B de un cilindro circular recto, la trayectoria más corta para ir desde A hasta B sobre la superficie del cilindro es un segmento de hélice. c)

Proyección sobre el plano OXZ:



540

Espirales y hélices En una hélice circular todos los trozos tienen la misma forma. En efecto, si la sometemos a una traslación de vector paralelo al eje y módulo el paso de rosca d, la hélice permanece invariante, pues cada espira completa se transforma en la siguiente espira. Así pues, una única espira genera toda la hélice. Pero podemos tomar un trozo más pequeño, por ejemplo media espira, y trasladarla una paralelamente al eje una distancia d 2girando a la vez 180º. Podría hacerse también con un cuarto de espira (subiendo d 4 y girando 90º). La hélice es pues invariante para infinidad de pares giro-traslación.

7.3. Otras formas helicoidales A veces se utiliza el término “helicoide” al referirse a formas enrolladas sobre superficies no cilíndricas (conos o esferas). Si bien la proyección de una hélice circular sobre cualquier plano perpendicular a su eje es una circunferencia, en los helicoides la proyección es una espiral. Por ello la foto de un caracol tomando como visual el eje sirve como modelo de espiral. 23 23 22 21 20 19 18 17 18 16 15 17 16 14 13 15 12 14 13 11 12 10 9 8 7 6 5 5 6 4 4 3 3 2 1 1 2

22 21 20 19

9

10 8

11

7

12

11

1 13

Figura 35. Proyección plana del caracol “Facelaria”.

Figura 36. Dibujo de Alberto Durero. Proyección de un helicoide sobre un plano.

2

10

21

9

20 8

22

14

17

18 7

15

23

19

6

16

3

4

5

Si cortamos un cono, sobre el que se ha dibujado una hélice cónica, por una generatriz, al igual que hicimos en el caso de la hélice circular, obtendríamos una plantilla sobre la que aparecen unos trazos que tienen apariencia de espirales. La única diferencia es que aquí no damos “vueltas” de 360º , sino del ángulo b que tenga la plantilla. Por eso, para que al plegar casen los trozos el final de cada tramo debe estar a la misma distancia de O que el principio de tramo siguiente. Si los tramos son espirales arquimedianas obtendremos helicoides sobre anchura constante entre espiras.

Figura 37.


Figura 38.

541


542


8. PRESENCIA EN LA NATURALEZA, LA TÉCNICA Y EL ARTE

Cuando un insecto es atraído por un foco de luz se orienta en cada momento por la dirección de los rayos que recibe, girando respecto de ellos un ángulo constante. Su trayectoria es una espiral equiangular.

Figura 40.

8.1. En la Naturaleza

Existen en la naturaleza numerosos ejemplos de formas enrolladas, cuya representación gráfica es una espiral o una hélice. Se trata en casi todos los casos de un crecimiento en forma de giro ligado a una expansión, por ejemplo en organismos que crecen fundamentalmente por un solo extremo, conservando sin modificar los estadios anteriores, o en algunos fenómenos tipo “turbulencias” como los huracanes o la expansión de ciertas galaxias. Las espirales son curvas muy conocidas por su presencia en nuestro entorno. Pueden observarse espirales en las telarañas, en las conchas de los caracoles, en la disposición de las semillas de las tortas de girasol, etc. Hay que señalar que en la naturaleza, la espiral de Arquímedes se presenta, salvo excepciones, de manera “artificial”. Es decir no forma parte de los seres vivos, sino que es creada esporádicamente y de forma reversible por ellos. Concha de nautilus.

Amonites.

En cambio más frecuente es la presencia de la espiral equiangular. Así por ejemplo, en los caracoles planos la forma típica de la concha es una espiral en que las espiras se van ensanchando a medida que dan vueltas, es decir una espiral logarítmica. Los caracoles planos (planispirales) son muy raros, pero suele casi siempre ser una espiral de este tipo su proyección plana. Ocurre igualmente con algunos fósiles (amonites, numulites, etc.). En concreto, la concha del Nautilus pompilius es la más hermosa que existe, crece como una espiral áurea. Se trata de un cefalópodo con cámara de aire del que hace millones de años existían unas diez mil especies. Hoy día tan sólo hay una especie que puede encontrarse en las profundidades de Océano Pacífico (a unos 500 m de la superficie) o en una barrera coralina en la isla de Nueva Caledonia, donde puede encontrarse a tan sólo 15 ó 20 m de profundidad. Figura 39.

En cambio más frecuente es la presencia de la espiral equiangular. Así por ejemplo, en los caracoles planos la forma típica de la concha es una espiral en que las espiras se van ensanchando a medida que dan vueltas, es decir una espiral logarítmica. Los caracoles planos (planispirales) son muy raros, pero suele casi siempre ser una espiral de este tipo su proyección plana. Ocurre igualmente con algunos fósiles (amonites, numulites, etc.). En concreto, la concha del Nautilus pompilius es la más hermosa que existe, crece como una espiral áurea. Se trata de un cefalópodo con cámara de aire del que hace millones de años existían unas diez mil especies. Hoy día tan sólo hay una especie que puede encontrarse en las profundidades de Océano Pacífico (a unos 500 m de la superficie) o en una barrera coralina en la isla de Nueva Caledonia, donde puede encontrarse a tan sólo 15 ó 20 m de profundidad. Figura 39.

Concha de nautilus.

Amonites.

Existen en la naturaleza numerosos ejemplos de formas enrolladas, cuya representación gráfica es una espiral o una hélice. Se trata en casi todos los casos de un crecimiento en forma de giro ligado a una expansión, por ejemplo en organismos que crecen fundamentalmente por un solo extremo, conservando sin modificar los estadios anteriores, o en algunos fenómenos tipo “turbulencias” como los huracanes o la expansión de ciertas galaxias. Las espirales son curvas muy conocidas por su presencia en nuestro entorno. Pueden observarse espirales en las telarañas, en las conchas de los caracoles, en la disposición de las semillas de las tortas de girasol, etc. Hay que señalar que en la naturaleza, la espiral de Arquímedes se presenta, salvo excepciones, de manera “artificial”. Es decir no forma parte de los seres vivos, sino que es creada esporádicamente y de forma reversible por ellos.

8.1. En la Naturaleza

Cuando un insecto es atraído por un foco de luz se orienta en cada momento por la dirección de los rayos que recibe, girando respecto de ellos un ángulo constante. Su trayectoria es una espiral equiangular.

8. PRESENCIA EN LA NATURALEZA, LA TÉCNICA Y EL ARTE



542

Figura 40.

Espirales y hélices En cuanto a la hélice, está presente en multitud de situaciones y fenómenos naturales tales como el crecimiento de los zarzillos de las plantas trepadoras a lo largo de un soporte o el crecimiento de las astas de los carneros. Las brácteas de las piñas y otros frutos, así como la clorofila de algunas algas, se disponen helicoidalmente, como cuando soltamos la peladura de una naranja. En Botánica se llama hélice fundamental de un planta a la línea obtenida al ir uniendo alrededor del tallo los puntos de imbricación de las hojas. No se trata en general de una hélice de paso constante, sino que las espiras se van apretando más hacia el extremo joven del tallo. Asimismo sabemos también que las moléculas de ADN se disponen en forma de doble hélice. La Vía Láctea se desplaza por el Universo, el resultado es la trayectoria en hélice. La mayoría de la galaxias se expanden helicoidalmente.

Una forma sencilla de construir una hélice es imitando los tallos trepadores.

Fotografía de un huracán tomada desde un satélite. Las moléculas que forman el ADN están unidas por enlaces de oxígeno formando una hélice doble.

Sol

El sol describe una órbita cada 200 millones de años. A su vez, la Vía Láctea se desplaza por el Universo. El resultado es la trayectoria en hélice.


543


544


Tanto la mayoría de los caracoles como la disposición de las hojas sobre troncos cónicos adoptan formas de helicoides.

Esto también se aplica por los alfareros, siendo un motivo ornamental frecuente en la cerámica popular. Como la construcción de la espiral arquimediana es tan sencilla, aparece dibujada o tallada en numerosas obras de arte, incluso las más primitivas (por ejemplo: vasijas estruscas, etc.) y en muchos adornos y construcciones (barandas, rejas, etc.). Otro ejemplo de presencia en manifestaciones artísticas son las volutas en arquitectura.

8.3. En el Arte Figura 43. Construcción moderna en espiral. Figura 42.

8.2. En la Técnica

Igualmente, el hombre ha necesitado también de estas formas, unas veces por necesidades prácticas y otras por necesidades estéticas. El diseño de una escalera de caracol, construcción de muelles y solenoides, el sacacorchos, etc., son algunos de los múltiples ejemplos de utilización de las hélices en la técnica. Las espirales arquimedianas se usan a menudo en artificios mecánicos de determinadas máquinas, por ejemplo, las máquinas de coser, ya que transforman el movimiento circular en movimiento lineal.

Igualmente, el hombre ha necesitado también de estas formas, unas veces por necesidades prácticas y otras por necesidades estéticas. El diseño de una escalera de caracol, construcción de muelles y solenoides, el sacacorchos, etc., son algunos de los múltiples ejemplos de utilización de las hélices en la técnica. Las espirales arquimedianas se usan a menudo en artificios mecánicos de determinadas máquinas, por ejemplo, las máquinas de coser, ya que transforman el movimiento circular en movimiento lineal.

8.2. En la Técnica

Figura 42. Figura 43. Construcción moderna en espiral.

8.3. En el Arte Esto también se aplica por los alfareros, siendo un motivo ornamental frecuente en la cerámica popular. Como la construcción de la espiral arquimediana es tan sencilla, aparece dibujada o tallada en numerosas obras de arte, incluso las más primitivas (por ejemplo: vasijas estruscas, etc.) y en muchos adornos y construcciones (barandas, rejas, etc.). Otro ejemplo de presencia en manifestaciones artísticas son las volutas en arquitectura.

Tanto la mayoría de los caracoles como la disposición de las hojas sobre troncos cónicos adoptan formas de helicoides.



544

Espirales y hélices Han sido halladas bóvedas en espiral en un complejo funerario del arte prehistórico irlandés, que indican que la espiral de Arquímedes se conocía mucho antes. Posteriormente se han encontrado también en cruces célticas de Monasterboice (1000 d.C.). En la Basílica de San Marcos en Venecia, las bóvedas interiores decoradas por Paolo Ucello contienen motivos con espiral. También está presente en los platos de filigrana, llamada de redecilla, de los maestros vidrieros de Murano. Aunque con mucha menos frecuencia que las arquimedianas, también encontramos espirales equiangulares en el arte.

Piedra esculpida de un túmulo fechada en la Edad de Bronce.

Dos espirales unidas en una vasija etrusca.

Testero de un violín.

Detalle de una fachada francesa del siglo XV.

Figura 44.


545

Bibliografía

BIBLIOGRAFÍA Abellanas, P.: Introducción a la Matemática. S.A.E.T.A. Madrid. 1960. Alsina, C. y Trillas, E.: Lecciones de Álgebra y Geometría. Gustavo Gili. Barcelona. 1984. Alsina, C. y otros: Simetría dinámica. Síntesis. Madrid.1989. Apóstol, T. M.: Calculus. Reverté. Barcelona. 1998. AA. VV.: Las Matemáticas en la vida cotidiana. Addison-Wesley y Universidad Autónoma de Madrid. Madrid. 1998. AA.VV.: Cálculo I. CLAGSA. Madrid. 1998. Boyer, Carl B.: Historia de la Matemática. Alianza Universidad. Madrid. 1986. Burden, R.L. y Faires, J.D.: Análisis Numérico. Grupo editorial Iberoamericano. Capra, S.C. y Canale, R.P.: Métodos numéricos para ingenieros. McGraw-Hill. Castelnuovo, E.: La Matemática. Geometría. Ketrés. Barcelona. 1981. Coxeter, H.S.M.: Fundamentos de Geometría. Limusa Wiley.México. 1971. D’Arcy Thompson: Sobre el crecimiento y la forma. Hermann Blume. Barcelona. 1986. Ghyka, M.C.: Estética de las proporciones en la Naturaleza y el Arte. Poseidón. Barcelona. 1983. De Burgos, J.: Curso de Algebra y Geometría. Alhambra Universidad. Madrid. 1996. De Burgos, J.: Cálculo Infinitesimal de una variable. McGraw Hill Interamericana de España S.A.U. Madrid. 1998. Dieudonné, J.: Algebra lineal y geometría elemental. Selecciones Científicas. Madrid. 1971. Ernst, B.: El espejo mágico de M.C.Escher. Taco. Berlín. 1989. Etayo, J., Colera, J. y Ruiz, A.: Matemáticas COU. Anaya. Madrid.1978. Eves, H.: Estudio de las Geometrías. UTEHA. México. 1979. Fernández Viña, J. A.: Lecciones de Análisis Matemático I. Tecnos. Madrid. 1981. García del Vilar: Curvas planas notables. Cetum. Sevilla. 1971. García Pradillo, J.: Geometría y su metodología. Madrid. Gardner, M.: Mosaicos de Penrose y escotillas cifradas. Labor. Barcelona.1990. Geometría Segundo grado. Edelvives Ed. Luis Vives S.A. Geometría tercer grado. Editorial Bruño. Geometría. Curso superior. Ed. Bruño. Ghyka, M. C.: Estética de las proporciones en la Naturaleza y el Arte. Poseidón. Barcelona. 1983. Ghyka, M. C.: El número de oro. Poseidón. Barcelona. 1992. Grupo Cero.: De 12 a 16: un proyecto de currículum de matemáticas. Mestral. Valencia. 1987. Hultquist, P. J.: Numerical methods for enginners and computer scientists. Ed. Benjamin-Cummings. TEMARIO DE MATEMÁTICAS. PRUEBA A

547


548


Huntley, H. E.: The divine proportion. Dover Books. New York.1970. Jaime Pastor, A. y Gutiérrez Rodríguez, A.: El grupo de las isometrías en el plano. Síntesis. Madrid. 1996. Zoroa Terol, P.: Geometría. Ed. Álvarez Biedma. Murcia. 1966.

Klein, F.: Famous Problems of Elementary Geometry. Dover Publications Inc. Nueva York.1956. Zemanski: Matemáticas generales. Montaner y Simón. Barcelona. 1974.

Klinger, F.: ¿La Geometría? ¡Pero si es muy fácil! Marcombo. Barcelona. 1979.

Wylie, C. R.: Matemáticas superiores para la ingeniería. Ed. Del Castillo. Madrid. 1969.

Larson, R. E. y otros: Cálculo y Geometría Analítica. McGraw Hill Interamericana de España S.A.U. Madrid. 1999. Wiscamb, M.: Geometría. Un enfoque intuitivo. Trillas. México. 1976.

Linés, E.: Principios de Análisis Matemático. Reverté. Barcelona. 1991.

Vizmanos et al.: Funciones 3. Matemáticas 3º BUP. S. M. Madrid.

Macia, R.: Análisis Matemático I. Madrid. UNED, 1986.

Spivak,M.: Calculus. Reverté. Barcelona. 1998.

Martínez Carracedo,C. y Sanz Alix, M.A.: Análisis de una variable real. Reverté. Barcelona. 1991. Spiegel, M.: Cálculo Superior. México. McGraw-Hill. Col. Schaum, 1975.

Segura, S.: Matemáticas. Curso Preuniversitario. Tomo 2. Ecir. Valencia.1967.

Martínez Salas, J.: Elementos de Matemáticas. Lex Nova. Valladolid. 1995.

Sánchez Sordo, M.: Cómo dominar la geometría. Ed. Playor.

Materiales M.E.C.

Queysanne, M. y Revuz, A.: Geometría. CECSA. Barcelona. 1976

Moise, E.: Geometría elemental desde un punto de vista superior. Ed. CECSA.

Puig Adam, P.: Curso de Geometría métrica. (Vol. I). Ed. Puig Adam. Madrid. 1961.

Negro, A. y Zorio, V.: Curso de Matemáticas. Orientación Universitaria. Alhambra. Madrid. 1978. Puig Adam, P.: Geometría Métrica (Vol. I). Euler Editorial. 1986.

Nomdedeu, X.: Mujeres, manzanas y matemáticas. Entretejidas. Nivola. Madrid. 2000. Puig Adam: Geometría Métrica. Nuevas Gráficas. Madrid. 1972.

Piskunov, N.: Cálculo diferencial e Integral. Montaner y Simón, S.A. Barcelona. 1983. Pedoe, D.: La Geometría en el Arte. Gustavo Gili. Barcelona. 1979.

Pinilla: Lecciones de Programación Lineal, Cónicas, Cuádricas, Curvas y Superficies. Varicop. Madrid. 1971.

Pita Ruiz, C.: Cálculo de una variable. Prentice Hall Hispanoamericana. México. 1998.

Pita Ruiz, C.: Cálculo de una variable. Prentice Hall Hispanoamericana. México. 1998.

Pinilla: Lecciones de Programación Lineal, Cónicas, Cuádricas, Curvas y Superficies. Varicop. Madrid. 1971.

Piskunov, N.: Cálculo diferencial e Integral. Montaner y Simón, S.A. Barcelona. 1983. Pedoe, D.: La Geometría en el Arte. Gustavo Gili. Barcelona. 1979.

Nomdedeu, X.: Mujeres, manzanas y matemáticas. Entretejidas. Nivola. Madrid. 2000. Puig Adam: Geometría Métrica. Nuevas Gráficas. Madrid. 1972.

Puig Adam, P.: Geometría Métrica (Vol. I). Euler Editorial. 1986.

Negro, A. y Zorio, V.: Curso de Matemáticas. Orientación Universitaria. Alhambra. Madrid. 1978.

Puig Adam, P.: Curso de Geometría métrica. (Vol. I). Ed. Puig Adam. Madrid. 1961. Moise, E.: Geometría elemental desde un punto de vista superior. Ed. CECSA.

Queysanne, M. y Revuz, A.: Geometría. CECSA. Barcelona. 1976

Materiales M.E.C.

Sánchez Sordo, M.: Cómo dominar la geometría. Ed. Playor.

Martínez Salas, J.: Elementos de Matemáticas. Lex Nova. Valladolid. 1995.

Segura, S.: Matemáticas. Curso Preuniversitario. Tomo 2. Ecir. Valencia.1967.

Martínez Carracedo,C. y Sanz Alix, M.A.: Análisis de una variable real. Reverté. Barcelona. 1991. Spiegel, M.: Cálculo Superior. México. McGraw-Hill. Col. Schaum, 1975. Spivak,M.: Calculus. Reverté. Barcelona. 1998.

Macia, R.: Análisis Matemático I. Madrid. UNED, 1986.

Vizmanos et al.: Funciones 3. Matemáticas 3º BUP. S. M. Madrid.

Linés, E.: Principios de Análisis Matemático. Reverté. Barcelona. 1991.

Wiscamb, M.: Geometría. Un enfoque intuitivo. Trillas. México. 1976.

Larson, R. E. y otros: Cálculo y Geometría Analítica. McGraw Hill Interamericana de España S.A.U. Madrid. 1999.

Wylie, C. R.: Matemáticas superiores para la ingeniería. Ed. Del Castillo. Madrid. 1969. Klinger, F.: ¿La Geometría? ¡Pero si es muy fácil! Marcombo. Barcelona. 1979.

Zemanski: Matemáticas generales. Montaner y Simón. Barcelona. 1974.

Klein, F.: Famous Problems of Elementary Geometry. Dover Publications Inc. Nueva York.1956. Zoroa Terol, P.: Geometría. Ed. Álvarez Biedma. Murcia. 1966.

Jaime Pastor, A. y Gutiérrez Rodríguez, A.: El grupo de las isometrías en el plano. Síntesis. Madrid. 1996. Huntley, H. E.: The divine proportion. Dover Books. New York.1970. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA


548

Matemáticas PES Volumen II

Recommend Documents