> n0 ’+n1 ’b+n2 ’b2 +n3 ’b3 +…+ni’bi = n’* Por tanto n>n’ 9.1. Cambio de Sistemas de Numeración. a) Dado un número en una base cualquiera b, hallar su expresión en base decimal. Sea n=np np-1…n2 n1 n0 0 ⇒ pr < qs r < s ⇒ qr < qs q > 0 p < q ⇒ p + r < q + r r Análogamente r < s ⇒ q + r < q + s q 1 PROP Sea p∈Q. p>0 ⇒ >0 p Dem np>q>x⇒ny>x. x
en base b.
Escrito en forma polinómica tenemos: n=n0 +n1 b+n2 b2 +n3 b3 +…+np bp Efectuando las operaciones indicadas en la expresión de n obtenemos el número decimal equivalente. 16/ 18
También podemos calcular el valor del polinomio con sólo obtener el resto de la división del polinomio por la base, utilizando para ello la regla de Ruffini. b) Dado un número en base 10, hallar su expresión en una base cualquiera b. Dado el número n en base 10, consiste en calcular los coeficientes del polinomio n=n0 +n1 b+n2 b2 +n3 b3 +…+np bp Basta dividir el número sucesivamente hasta conseguir un cociente que sea menor que b. El número en base b estará formado por el último cociente y la sucesión de restos obtenida en orden inverso. c) Dado un número n en base b, hallar su expresión en otra base b’. Este cambio se realiza pasando el número n en base b a base decimal y luego de base decimal a base b’. 9.2. Operaciones básicas entre números en una base cualquiera. a) Suma. En un sistema de base b, para sumar dos números se procede de forma análoga a como se hace en el sistema decimal. En cualquier base se usan las mismas reglas ya establecidas para el sistema decimal. b) Producto. Las reglas de la multiplicación en una base cualquiera son análogas a las del sistema decimal. Es necesario saber las tablas de multiplicar para los números menores que la base. 9.3. Sistemas de Numeración más utilizados. El sistema binario (base 2) es el más utilizado como lenguaje interno de los ordenadores (código máquina). Los símbolos que utiliza son 0 y 1. Debido a la cantidad de dígitos que se requieren para representar en binario la información en un ordenador, se recurre a usar los sistemas octal y hexadecimal. El sistema octal es el sistema de numeración en base 8 y utiliza por tanto ocho símbolos para representar las cantidades. Los símbolos utilizados son 0, 1, 2, 3, 4, 5, 6 y 7. Cada cifra octal corresponde a tres dígitos binarios. El sistema hexadecimal es el sistema de numeración en base 16 y utiliza dieciseis símbolos para representar las cantidades. Los símbolos utilizados son 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E y F. Cada cifra hexadecimal corresponde a 4 dígitos binarios.
17/ 18
Bibliografía. Matemáticas Básicas, curso de acceso. UNED Estructura y tecnología de Computadores I. UNED. Análisis Matemático I. Aut: J. A. Fernández Viña Análisis Matemático. Aut. Julio Rey Pastor, Pedro Pi, Cesar Trejo. Ed. Kapelusz Análisis Matemático I. Aut. Jesús Fernández Novoa. Ed. UNED
18/ 18
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 2 FUNDAMENTOS Y APLICACIONES DIAGRAMAS EN ARBOL.
DE
1. Introducción. 2. Definición de grafo. 2.1. Grafo Simple. 2.2. Grafo General. 2.3. Grafo Orientado. 2.4. Grafo Nulo. 2.5. Grafo Completo. 2.6. Grafo Regular. 2.7. Grafo Bipartido. 3. Operaciones entre Grafos. 3.1. Isomorfismos y homomorfismos. 3.2. Combinaciones. 3.3. Supresiones y Contracciones. 3.4. Complementos. 4. Trayectorias. Grafos Eulerianos y Hamiltonianos. 4.1. Trayectorias. 4.2. Los puentes de Königsberg. 4.3. Grafos Eulerianos. 4.4. Grafos Hamiltonianos. 5. Matrices y Grafos. 5.1. Matriz de Adyacencia. 5.2. Matriz de Incidencia. 6. Planaridad y dualidad. 6.1. Grafos Planares. 6.2. Grafos Duales. 7. Diagramas en árbol. 7.1. La enumeración de árboles. 8. Coloreado de Grafos. 9. Aplicaciones de la teoría de Grafos. 9.1. El teorema matrimonial de Hall. 9.2. El teorema de Menger. 9.3. La teoría de matroides.
1/17
LA
TEORIA
DE
GRAFOS.
TEMA 2 FUNDAMENTOS Y APLICACIONES DIAGRAMAS EN ARBOL.
DE
LA
TEORIA
DE
GRAFOS.
1. INTRODUCCIÓN. La teoría de grafos, que nació como una rama de la Topología, se ha convertido hoy en día en una herramienta matemática indispensable en campos tan diversos como la investigación operativa, la lingüística, la química, la física, la genética, la teoría de redes o la teoría de la decisión. Es por ello, que para casi cualquier rama de la ciencia, se hace indispensable el conocimiento, a través de conceptos globales, de las ideas básicas que sustentan a la denominada teoría de grafos. Este tema tiene por objetivo introducir al lector en estos conocimientos básicos a través de una breve pero, esperamos, clara exposición de las líneas generales de esta teoría. 2. DEFINICIÓN DE GRAFO. Se denomina grafo G al par (V(G), E(G)), en el que V(G) es un conjunto no vacío de elementos denominados vértices (también llamados nodos o puntos) y E(G) es un conjunto finito de pares no ordenados de elementos de V(G) denominados aristas (igualmente líneas). Al conjunto de elementos de V(G) se le denomina conjunto de vértices y al conjunto de elementos de E(G) conjunto de aristas. Así, sea el conjunto de vértices V(G)={u, v, w, z} y el conjunto de aristas E(G)={{u, v}, {u, w}, {w, z}}, se dice que {u, v} es la arista que une los puntos u y v, y se le designa de forma abreviada por uv. Si u=v la arista recibe el nombre de lazo. La representación de dicho grafo es la siguiente: Se dice que dos vértices u y w de un grafo G son adyacentes si el grafo contiene una arista que los une. Se dice también que los vértices son incidentes en dicha arista. Análogamente, se dice que dos aristas son adyacentes si tienen, al menos, un vértice en común. Se denomina grado de un vértice v de G al número de aristas que inciden en v, y se designará g(v) (un lazo en v contribuye de manera doble al grado de v). A un vértice de grado 0 se le denomina vértice aislado. A un vértice de grado 1 se le denomina vértice terminal o extremo. Un subgrafo de un grafo G, es un grafo cuyos vértices pertenecen a V(G) y cuyas aristas pertenecen a E(G).
2/17
En los siguientes apartados de este punto se expone la tipología más común de los grafos. 2.1. Grafo Simple. Se denomina grafo simple al grafo G={V(G), E(G)} que verifica que para todo u, v perteneciente a V(G), existe a lo sumo una única arista {u, v} de E(G) que los une. Grafo Simple ⇔ [∀u, v∈V(G) ⇒ ∃!{u, v}∈E(G)] Ejemplos de grafos simples serían los siguientes:
2.2. Grafo General. Se denomina grafo general o simplemente grafo, al grafo G=(V(G), E(G)), con V(G) conjunto de vértices y E(G) conjunto de aristas. De esta forma, un grafo general puede representar dos vértives unidos por más de una arista. Igualmente, una arista no tiene porque unir dos vértices diferentes, pudiéndose hablar de la arista {u, u}. A la arista que une un vértice consigo mismo se le denomina Lazo. La representación gráfica de este tipo sería:
2.3. Grafo Orientado. Un grafo orientado D, también denominados redes o digrafos, se define par (V(D), A(D)), donde V(D) es un conjunto finito no vacío de elementos vértices, y A(D) es una familia finita de pares ordenados de elementos llamados arcos (o aristas orientadas o di-aristas). En base a la existencia o no podremos hablar de digrafos generales o digrafos simples.
como un llamados de V(D) de lazos,
A continuación se muestra el diagrama del digrafo general (V(D), A(D)), con V(D)={u, v, w, z} y A(D)={uv, vv,uw, vw, wv, wu, wz}
3/17
2.4. Grafo Nulo. Se denomina grafo nulo a un grafo donde E(G) es vacío, es decir, el conjunto de aristas es el conjunto vacío. Obviamente en este tipo de grafo todo vértice es aislado. 2.5. Grafo Completo. Un grafo completo es un grafo simple en el que cualquier par de vértices son adyacentes. Un grafo completo de n vértices n n·( n − 1) tiene = aristas. El resultado se 2 2 obtiene por combinaciones de n vértices tomados de dos en dos. 2.6. Grafo Regular. Se llama grafo regular a un grafo cuyos vértices tienen todos el mismo grado. Si el grado de cada vértice es r, se tiene un grafo regular de grado r. Todo grafo nulo es un grafo regular de grado 0. Todo grafo completo con n vértices es un grafo regular de grado n-1.
Especial mención merece un tipo de grafo regular llamado grafo platónico, grafos formados por los cinco sólidos regulares (tetraedro, cubo, octaedro, dodecaedro e icosaedro). 2.7. Grafo Bipartido. Sea un grafo G y sea su conjunto de vértices V(G) que puede ser expresado como la unión disjunta de dos subconjuntos de vértices V1 y V2 de forma que cada arista de G une un vértice de V1 con otro de V2 , entonces se dice que G es un grafo bipartido y se escribe G(V1 , V2 ). 3. OPERACIONES ENTRE GRAFOS. 3.1. Isomorfismo y Homomorfismo. Se dice que dos grafos G1 y G2 son isomorfos si existe una correspondencia biunívoca entre los vértices de G1 y los de G2 , con la propiedad de que el número de aristas que unen cada dos vértices de G1 es igual al número de aristas que unen los vértices correspondientes de G2 .
4/17
Veamos el ejemplo siguiente, donde G1 tiene el conjunto de vértices {u, v, w, x, y, z} y G2 tiene {l, m, n, p, q, r}. G1 y G2 son isomorfos bajo la correspondencia u→l, v→m, w→n, x→p, y→q, z→r
Dos grafos son homomórficos (o idénticos salvo vértices de grado 2) si ambos pueden ser obtenidos a partir del mismo grafo insertando nuevos vértices de grado dos en sus aristas. Ejemplo: Sea el grafo G representado por el siguiente diagrama: G(V(G), E(G)) V(G)={v1 , v2 , v3 , v4 } E(G)={v1 v2 , v1 v3 , v3 v2 , v2 v4 }
Construimos dos grafos homomórficos entre sí G1 y G2 a partir del anterior grafo G. Para ello, y partiendo de G, tomamos algunas de sus aristas y le insertamos un vértice de grado dos. Construimos G1 : Sea la arista v1 v2 del grafo G, insertamos un nuevo vértice v’ de grado 2, de tal forma que el grafo G1 resultante sería: De igual manera construimos G2 : Sea la arista v1 v3 ∈G, insertamos el vértice v’’ de grado 2 de tal forma que el grafo resultante G2 es: Se concluye que G1 y G2 son homomórficos. 3.2. Combinaciones. Sean dos grafos G1 =(V(G1 ); E(G1 )) y G2 =(V(G2 ), E(G2 )) con V(G1 ) y V(G2 ) disjuntos. Se define el grafo unión como G1 ∪G2 tal que G1 ∪G2 =(V(G1 )∪V(G2 ), E(G1 ), E(G2 )).
5/17
Se dice que un grafo es conexo si no puede ser expresado como la unión de dos grafos, en caso contrario será inconexo. Cualquier grafo inconexo G puede verse expresado como la unión de un conjunto finito de grafos conexos. Un grafo circuito es un grafo conexo regular de grado dos. El grafo circuito de n vértices es designado Cn . Igualmente, sean los grafos G1 y G2 , se define el grafo suma, y se denota por G1 +G2 como la unión de ambos grafos, trazándose a continuación una arista entre cada vértice de G1 y cada vértice de G2 . Sean los grafos G1 =(V(G1 ), E(G1 )) con V(G1 )={u, v, w, x, y, z} y G2 =(V(G2 ), E(G2 )) con V(G2 )={l, m, n} representados de la forma siguiente:
Se representa el grafo G1 ∪G2 de la forma:
Y el grafo G1 +G2 como:
3.3. Supresiones y Contracciones. Sea F un conjunto de aristas del grafo G, se denomina G-F al grafo que se obtiene cuando se suprime en G el conjunto de aristas F. Análogamente, sea H un conjunto de vértices del grafo G, se denomina G-H al grafo que resulta cuando se suprimen en G los vértices que hay en H y las aristas que inciden en ellos. Sea el grafo G y en él la arista e, se denomina G/e al grafo obtenido de contraer en él la arista e, es decir, eliminar la arista, identificando a continuación sus extremos v y w, de forma que el vértice resultante es incidente a aquellas aristas que originalmente eran incidentes a v y w (excepto la propia arista e). En consecuencia, se llama 6/17
contracción de G a cualquier grafo que se obtiene a partir de G, después de efectuar contracciones de algunas de sus aristas. Sea el grafo G1 =(V(G1 ), E(G1 )) con V(G1 )={u, v, w, x} y E(G1 )={uu, uv, vw, wu, wx, xv} y sea F={uw, xv}, se representa el grafo supresión GF de la forma siguiente: 3.4. Complemento. Sea G un grafo simple, cuyo conjunto de vértices es V(G), el complemento(G) de G (denotado por G ) es el grafo simple que tiene a V(G) como conjunto de vértices, en el cual dos vértices son adyacentes si y sólo si no son adyacentes en G. Con el grafo G definido en el apartado anterior, se construye el grafo complemento de G de la siguiente forma:
4. TRAYECTORIAS. GRAFOS EULERIANOS Y HAMILTONIANOS. 4.1. Trayectorias. Sea una secuencia de aristas v0 v1 , v1 v2 ,..., vm-1vm, en la que todas las aristas son diferentes, entonces se le denomina cola. Si además los vértices v0 , v1 ,..., vm, son diferentes (excepto el primero y el último que pudieran coincidir), la secuencia de aristas resultante se llama trayectoria. Una trayectoria es cerrada si v0 =vm, y una trayectoria cerrada que posee al menos un lado es denominada circuito. Los siguientes ejemplos ilustran estas definiciones: Cola:
Trayectoria:
7/17
Trayectoria cerrada:
Al vértice v0 se le denomina vértice inicial y al vm vértice final. La longitud de una secuencia de aristas es el número de aristas que posee. TEOREMA: Si G(V1 , V2 ) es un grafo bipartido, todo circuito en G tiene longitud par. TEOREMA: Sea G un grafo simple de n vértices, si G tiene k componentes (subgrupos disjuntos) el número de aristas de G cumple la siguiente relación: n−k ≤m ≤
1 ( n − k )·( n − k + 1) 2
m = número de aristas
Se denomina conjunto desconectador de un grafo conexo G al conjunto de aristas de G cuya eliminación desconecta a G. Un conjunto corte será un conjunto desconectador del que ningún subconjunto suyo es un conjunto desconectador. Sea el grafo G, donde V(G)={v, w, x, y, z} y E(G)={vw, vx, wy, yz, wx, wz, xy, xz}, el conjunto de aristas D={wy, wz, xy, xz} es un conjunto desconectador de G, ya que si en G procedemos a la eliminación de las aristas de D queda el grafo inconexo que a continuación se expone.
4.2. Los Puentes de Königsberg. En el siglo XVIII, la ciudad de Königsberg, en Prusia, tenía dos islas y siete puentes según indica la figura: El alcalde de la ciudad escribió a Euler planteándole la siguiente cuestión: ¿Es posible que una persona cruce los siete puentes pasando por cada uno de ellos una sola vez?
8/17
Euler probó que era imposible lo que el alcalde proponía. Sustituyó la isla y las orillas por puntos y los puentes por líneas que unían dichos puntos, obteniendo así el siguiente grafo: El grafo será recorrible si existe un camino que contenga todos los vértices y que pase por cada arista exactamente una vez.
Supongamos que haya un camino que no empiece ni termine en un vértice u. Cada vez que el camino llegue a u debe de salir por otro que no haya sido utilizado. De esa manera, las aristas del camino incidentes con u deben aparecer de dos en dos, es decir, u es par. Así, si v es impar, el camino debe empezar y terminar en Q. Basándose en ese razonamiento, se deduce que no puede haber más de dos vértices que sean impares. El grafo anterior tiene cuatro vértices impares, por lo que no es recorrible. 4.3. Grafo Euleriano. Se denomina grafo euleriano, a un grafo conexo G que tiene una cola cerrada que incluye todas las aristas de G. TEOREMA de Euler: Un grafo es euleriano si y sólo si cada vértice es de grado par. Si tiene exactamente dos vértices impares es recorrible (la cola no será cerrada) y se llama semieuleriano. A continuación se muestran ejemplos de grafos no eulerianos, semieulerianos y eulerianos respectivamente.
4.4. Grafo Hamiltoniano. Se denomina grafo hamiltoniano, si existe un camino cerrado que contiene todos los vértices una sola vez (no tiene porque contener todas las aristas). Un grafo que posea una trayectoria que pase a través de cada vértice es denominado semihamiltoniano. Los siguientes ejemplos corresponden a semihamiltoniano y hamiltoniano respectivamente.
9/17
un
grafo
no
hamiltoniano,
5. MATRICES Y GRAFOS. Dado un grafo G con m vértices y n aristas, podemos asociar matrices a G, muy útiles para el cálculo. 5.1. Matriz de Adyacencia. Es la matriz A=(aij ) de orden mx m definida por: donde k es el número de aristas que unen el vértice vi con el vj
k si vi es adyacente a v j aij = 0 en caso contrario
La matriz de adyacencia es muy útil para decidir cuestiones de conexión, pues si A es la matriz de adyacencia de un grafo con m vértices donde m>1, entonces el término aij de la matriz An nos da el número de caminos de longitud n que van del vértice vi al vértice vj. La demostración se puede hacer por inducción en n. 5.2. Matriz de Incidencia. Es la matriz M=(mij ) de orden mx m tal que mij es 1 si el vértice vi es incidente con la arista ej y cero en caso contrario. 6. PLANARIDAD Y DUALIDAD. 6.1. Grafos Planares. Se denomina grafo planar a un grafo trazado en el plano de forma que ningún par de aristas se cortan geométricamente, excepto en el vértice que ambas inciden. Ejemplos de grafos planares son:
Igualmente se dice que un grafo es planar si puede ser empotrado en el plano, es decir, dibujado sin cruces. A continuación se exponen algunos teoremas y corolarios referentes a la teoría de grafos planos. TEOREMA: El grafo K3,3 (grafo bipartido completo con seis vértices y nueve aristas) y el grafo K5 (grafo regular de grado cuatro, cinco vértices y diez aristas) son no planares.
10/ 17
La demostración de este teorema (que omitiremos en este tema dada su complejidad) se puede realizar de dos maneras distintas, por el teorema de Jordan o por la fórmula de Euler. TEOREMA de Kuratowski: Un grafo es planar si y sólo si no contiene ningún subgrafo que sea homomórfico a K5 y K3,3. Fórmula de Euler: el teorema o fórmula de Euler, relaciona el número de vértices, aristas y caras de un grafo plano conexo G. Sea un punto del plano x, se dice que x es disjunto de G si x no representa ni un vértice de G ni un punto que pertenezca a una arista de G. En este contexto, se define cara de G que contiene a x como al conjunto de todos los puntos del plano que pueden ser alcanzados desde x siguiendo una curva de Jordan, cuyos puntos sean todos disjuntos de G. Dos puntos del plano x e y son equivalentes si ambos son disjuntos de G y pueden ser unidos por una curva de Jordan cuyos puntos sean todos disjuntos de G. Esta relación de equivalencia sobre los puntos del plano disjuntos de G define clases de equivalencia a las que se denominan caras de G. TEOREMA: Si G es un grafo plano conexo, y sea n el número de vértices, m el número de aristas y f el de caras de G, se cumple la siguiente relación: n-m+f=2
(vértices – aristas + caras = 2)
dem. La demostración de este teorema se hace por la técnica matemática de la inducción, en este caso sobre el número de aristas m. Caso m=0 Sea el número de aristas m=0, y dado que G es conexo, se tiene que el número de vértices n=1 y f=1. Por tanto el teorema queda demostrado para m=0. Caso m-1 Hipótesis de inducción, suponemos ahora el teorema cierto para todos los grafos planos conexos tales que tiene m – 1 aristas: n – ( m – 1) + (f – 1) = 2 Caso m Sea ahora G un grafo planar conexo, y e una arista contenida en algún circuito de G. Entonces G – e es un grafo planar conexo con n vértices, m – 1 aristas y f – 1 caras, de forma que G –e verifica: n – ( m – 1) + (f – 1) = 2
por la hipótesis de inducción.
De aquí se desprende que G cumple el teorema: n – m + f = 2.
11/ 17
COROLARIO: Si G es un grafo plano con n vértices, m aristas, f caras y k componentes, se cumple que: n – m + f = k +1 COROLARIO: Si G es un grafo planar conexo simple de n vértices (n≥3) y m aristas, se cumple m ≤ 3·n – 6. TEOREMA: Todo grafo planar simple contiene un vértice cuyo grado es a lo sumo cinco. dem. Se supone, sin pérdida de generalidad, que el grafo es plano y conexo, y que contiene al menos tres vértices. Si todo vértice tuviera grado 6 como mínimo, se tendría que 6n≤2m, con lo que se llega a una contradicción. Por tanto se tiene que el grado es a lo sumo de cinco. 6.2. Grafos Duales. Sea G un grafo plano, se llama grafo dual de G y se denota por G* , aquel construido de la siguiente manera: a) Se elige un punto vi en cada cara Fi de G. Estos puntos son los vértices de G* . b) Por cada arista e∈G se traza una línea e* que atraviesa únicamente la arista e, y se unen los vértices vi pertenecientes a las caras adjuntas a e. Estas líneas son las aristas de G* . A continuación se ilustra este procedimiento de construcción con un ejemplo:
Como teoremas significativos dentro de la teoría de grafos duales, se comentan los siguientes: TEOREMA: Si G es un grafo plano de n vértices, m aristas y f caras, y su dual G* tiene n* vértices, m* aristas y f* caras, se cumplen las siguientes relaciones: n* = f
m* = m
f* = n
dem. La demostración de las dos primeras expresiones salen directamente a partir de la aplicación de la definición de dualidad. Para demostrar la tercera expresión, se ha de sustituir las dos primeras en la denominada fórmula de Euler.
12/ 17
7. DIAGRAMAS EN ÁRBOL. La teoría de árboles fue enunciada y elaborada por Cayley. Un grafo que no posee ningún circuito se denomina bosque, si además es un bosque conexo, se denomina árbol. Como ejemplos representativos de árboles se tienen los siguientes:
Algunas de las propiedades características de los árboles son las siguientes: TEOREMA: Sea T un grafo con n vértices. Los siguientes enunciados son equivalentes: 1) 2) 3) 4) 5) 6)
T es un árbol. T no contiene ningún circuito, y posee n – 1 aristas. T es conexo y tiene n – 1 aristas. T es conexo y cada arista es un istmo. Cada dos vértices de T están conectados por una única trayectoria. T no contiene ningún circuito, pero la adición de cualquier nueva arista crea exactamente un circuito.
dem. Si n = 1 los seis enunciados son triviales. Supondremos, por tanto, que n≥2. Para la demostración del teorema, demostraremos consecutivas, es decir, 1) ⇒ 2) ⇒ 3) ⇒ 4) ⇒ 5) ⇒ 6) ⇒ 1).
las
implicaciones
1) ⇒ 2) T es árbol y por definición no contiene ningún circuito. Esto conlleva que la eliminación de cualquier arista va a dividir a T en dos grafos. Cada uno de estos grafos es un árbol. Por ello, y por inducción, el número de aristas en cada uno de los árboles es menor, en una unidad, que el número de vértices que tiene el grafo total. Por tanto, el número total de aristas de T es n – 1. 2) ⇒ 3) Si T fuera inconexo, entonces cada componente de T sería un grafo conexo sin ningún circuito y, por tanto, según se ha demostrado antes, el número de vértices de cada componente excedería en 1 del número de aristas. Por tanto, el número total de vértices de T excedería en al menos 2 del número total de aristas. Hemos llegado a una contradicción, pues T tiene n – 1 aristas. Esto es porque se parte de una premisa falsa, es decir, el hecho de que T fuera inconexo. Por tanto T es conexo.
13/ 17
3) ⇒ 4) La eliminación de cualquier arista daría lugar a un grafo con n vértices y n – 2 aristas, que será inconexo. 4) ⇒ 5) Como T es conexo, se sigue que cada par de vértices han de estar conectados por al menos una trayectoria. Dados dos vértices, si estos estuvieran conectados por dos trayectorias, entre ellos habría un circuito, contradicción con que toda arista es un istmo. 5) ⇒ 6) Por reducción al absurdo, si T tuviese un circuito, cualquier par de vértices incluidos en el circuito estarían conectados por, al menos, dos trayectorias, lo que es una contradicción con las premisas. Si añadimos una arista e a T, se creará un circuito ya que los vértices incidentes a e ya están conectados en T. 6) ⇒ 1) Supongamos que T no es un árbol, por tanto es inconexo. Si le añadimos cualquier arista que una un vértice de una componente a un vértice de otra, no se creará ningún circuito. Sin embargo, por el punto 6) se tiene que al añadir una nueva se crea un circuito, por tanto tenemos una contradicción. COROLARIO: Un bosque G con n vértices y k componentes tiene n – k aristas. TEOREMA: Todo árbol G tiene al menos un vértice de grado 1. dem. Sean los vértices del árbol v1 , v2 ,...,vn . Partiendo de v1 vamos a su vecino v2 . Si el grado de v2 es 1, ya está probado el teorema. En cualquier otro caso, vamos al vértice v3 a través de otra arista. De esta forma se puede obtener el camino v1 v2 v3 ... en el que ninguno de los vi son iguales por la definición de árbol. Como el número de vértices es finito, el camino tiene un último vértice vj. Evidentemente, éste tendrá grado 1, ya que se ha llegado a él y no se puede dejar. TEOREMA: Existe un único camino entre dos vértices cualesquiera v y w de un árbol. TEOREMA: Sea G un grafo conecto (dos vértices cualesquiera se encuentran unidos por un camino) de n vértices y n – 1 aristas, entonces es un árbol. 7.1. La enumeración de árboles. La enumeración de grafos tiene por objeto encontrar el número de grafos no isomorfos que poseen una propiedad determinada.
14/ 17
En general, se denomina grafo etiquetado de n vértices a un grafo a cuyos vértices se le asignan números enteros de 1 a n, es decir, se trata de una aplicación biunívoca del conjunto de vértices de G sobre el conjunto {1, 2, 3,..., n}. El grafo etiquetado se designa (G,&) donde & es el etiquetado. Ejemplo de árbol etiquetado: TEOREMA: El número de árboles en los cuales el vértice vi tiene grado di+1, v2 tiene grado d2 +1,..., vn tiene grado dn +1 viene determinado por el número combinatorio: n−2 ( n − 2)! = d1 , d 2 ,..., d n d1 ! d 2 !...d n ! dem. Como el grado de cada vértice es por lo menos 1, di son enteros no negativos. Si se añaden los grados de cada vértice y se cuentan cada una de las n – 1 aristas dos veces, se tiene (d1 +1)+(d2 +1)+...+(dn +1) = 2(n – 1) A partir de aquí se tendrá la demostración del teorema. Ejemplo: Número de árboles con grado para el primer vértice 3, para el segundo 3 y del tercero al sexto 1. Como d1 =d2 =2 y d3 =d4 =d5 =d6 =0, 4 4! = =6 2,2,0,0,0,0 2!2!
entonces
el
número
de
árboles
es
Dichos árboles son:
TEOREMA de CAYLEY: Existen nn vértices.
– 2
árboles etiquetados diferentes de n
Existen varios métodos de demostración para este teorema. Uno de ellos debido a Prufer y Clarke, y es: Se establece una correspondencia biunívoca entre el conjunto de árboles etiquetados de orden n y el conjunto de todos los símbolos ordenados (a1 , a2 ,..., an-2)
15/ 17
donde ai está definido como entero entre 1 y n. Dado que existen n·n·n···n (n – 2 veces) de tales símbolos, la demostración se tiene casi inmediata. 8. COLOREADO DE GRAFOS. Se dice que un grafo G sin lazos es k-coloreable si puede asignarse a cada uno de sus vértices uno de k colores dados de forma que ningún par de vértices adyacentes tengan el mismo color. Si es coloreable de grado k pero no de grado k – 1, entonces G es k-cromático. Como ejemplo, sea el siguiente grafo 4-cromático. TEOREMA: Un grafo G cuyo máximo grado de vértice es &, entonces es (&+1)coloreable. dem. Utilizaremos la inducción sobre el número de vértices. Si G tiene n vértices, si se suprime un vértice, el mayor grado para éste será &. Por hipótesis de inducción, este grafo es (&+1)-coloreable. TEOREMA: Si G es un grafo simple conexo no completo, si el mayor de los grados de sus vértices es & (≥3), entonces es &-coloreable. TEOREMA: Todo grafo planar es 5-coloreable. 9. APLICACIONES DE LA TEORÍA DE GRAFOS. Son varias las aplicaciones y usos que las distintas ciencias o áreas hacen de la teoría de grafos. La aplicación más importante dentro de la matemática moderna se encuentra en el campo de la combinatoria. Veamos algunos de los ejemplos más importantes: 9.1. El Teorema Matrimonial de Hall. Sea un conjunto finito de muchachos, cada uno de los cuales conoce a varias chicas. ¿En qué condiciones se pueden formar los matrimonios de tal forma que cada uno de los muchachos se case con la chica que conoce? TEOREMA de Hall Una condición necesaria y suficiente para la solución del problema matrimonial es que cada conjunto de k jóvenes conozca colectivamente k chicas al menos (1≤k≤m). 9.2. El teorema de Menger. Determinación del número de trayectorias que unen dos vértices dados u, v de un grafo G.
16/ 17
TEOREMA de Menger. El número máximo de trayectorias de vértices disjuntos que conectan dos vértices diferentes no adyacentes v y w de G es igual al número mínimo de vértices de un subconjunto separador vw. TEOREMA: El teorema de Menger implica el teorema de Hall. 9.3. La teoría de Matroides. Aplicación de ciertos resultados de la teoría de grafos a la teoría transversal, donde aparece el concepto de matroide como un conjunto dotado de una estructura de independencia. Bibliografía. Algoritmos en Grafos y Redes. Aut. Blas Pelegrín, Lázaro Cánovas. Edit. P.P.U. Matemática Discreta y Combinatoria. Aut. Ralph Grimaldi. Edit. Addison-Wesley Iberoamericana. Lecciones de Optimización. Aut. Juan José Salazar. Edit. Universidad de La Laguna Graphs and Algorithms. Aut. M. Gondron, M. Minoux. Edit. Wiley-Intercience. Algebra y Matemática Discreta. Aut. J.A. Aledo Sánchez, J.C. Valverde Fajardo. Edit. Popular Libros.
17/ 17
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 3 TÉCNICAS DE RECUENTO. COMBINATORIA. 1. Introducción. 2. Técnicas de Recuento. 3. Variaciones. 3.1. Variaciones Ordinarias. 3.2. Variaciones con Repetición. 4. Permutaciones. 4.1. Permutaciones Ordinarias. 4.2. Permutaciones con Repetición. 5. Combinaciones. 5.1. Combinaciones Ordinarias. 5.2. Números Combinatorios. 5.3. Combinaciones con Repetición. 6. Combinatoria Clásica y algunas tendencias actuales de la combinatoria. Bibliografía Recomendada.
1/18
TEMA 3 TÉCNICAS DE RECUENTO. COMBINATORIA. 1. INTRODUCCIÓN. El Análisis Combinatorio, o Combinatoria, estudia las diferentes formas en que podemos ordenar o agrupar unos elementos dados siguiendo unas determinadas reglas establecidas. Se prescinde de la naturaleza de los elementos u objetos, pero no del orden. Es por ello que resulta necesario distinguir entre si los objetos del mismo conjunto, ya que no son equivalentes. La combinatoria nos va a permitir contestar a preguntas del tipo: • •
¿Cuántos números de dos cifras se pueden formar con los dígitos 0, 1, 2 y 3? ¿Cuántas clasificaciones distintas se dan entre cinco equipos de futbol?
Resumiendo, la combinatoria nos proporciona algoritmos para averiguar la cantidad de agrupaciones que, bajo determinadas condiciones, se pueden formar con los elementos de un conjunto. Según las características de los grupos y la naturaleza de los elementos, nos podemos encontrar con variaciones, permutaciones y combinaciones. 2. TÉCNICAS DE RECUENTO. Las técnicas de recuento tratan del estudio de las ordenaciones de los elementos de un conjunto. A lo largo de las distintas situaciones que pueden darse, son dos los tipos de problemas que nos podemos encontrar. Por un lado tenemos los llamados problemas de existencia, que analizan la posibilidad de la existencia de las agrupaciones pedidas. Por otro lado, los problemas de enumeración que nos van a permitir determinar el número de clasificaciones posibles. Las técnicas de recuento más utilizadas son: a) Paridad. Esta técnica nos permite resolver los problemas de existencia nombrados anteriormente. Un conjunto puede tener un número par o impar de elementos. Si probamos que tiene un número impar, estamos en condiciones de afirmar que al menos hay uno. Quedaría así demostrada su existencia. b) Correspondencia uno a uno. Técnica utilizada para el recuento de elementos dentro de un conjunto. Se trata de conseguir establecer una aplicación biyectiva entre el conjunto de estudio y una sección S(n) de –. En caso de que podamos establecerla, diremos que el 2/18
conjunto tiene n elementos, o lo que es lo mismo, el cardinal del conjunto (Card(A)) es n. c) Regla del producto. Sea P un conjunto con n elementos y Q otro conjunto con m elementos. El número de elecciones distintas de un elemento de P y otro de Q es m·n. Esta regla se puede extender a más de dos conjuntos. Puede resultar útil cuando el conjunto del cual queremos hallar su cardinal no está ordenado o no resulta sencillo establecer una biyección con alguna sección de –. 3. VARIACIONES. 3.1. Variaciones Ordinarias. DEF Sea A un conjunto con m elementos, A={a1 , a2 ,…, am}. Llamaremos variaciones n-arias (de orden n) de los m elementos del conjunto A a todo conjunto ordenado formado por n elementos cualesquiera elegidos entre ellos sin elegir más de una vez un elemento. Consideraremos distintas dos variaciones si difieren en algún elemento o, si teniendo los mismos elementos, difieren en el orden de colocación de los mismos. Al número de variaciones n-arias formadas por m elementos cualesquiera, lo representaremos por Vm,n o Vmn Ejemplo: Si un aula tiene 5 sillas en primera fila y entran 25 niños, ¿De cuántas formas distintas podemos componer esa primera fila? Sol: Aquí nos encontramos con variaciones ordinarias de 25 elementos tomados de 5 en 5. Sería V25,5 o V255 Veamos ahora como podemos calcular ese número. PROP El número de variaciones n-arias o de orden n que se pueden formar con m objetos cualesquiera, es igual al número de variaciones de orden n-1 que se pueden formar con los m objetos multiplicando por m-n+1. Vm,n = (m-n+1)·Vm,n-1 dem. Sea A el conjunto formado por los m elementos A={a 1 , a2 ,…, am}. Vamos a realizar la demostración por inducción en n. Para n=1
Está claro que existen m formas diferentes de elegir 1 sólo elemento entre m. Luego Vm,1 =m
Para n=2
Para conseguir todas las variaciones de orden 2 basta añadir a las de orden 1 un nuevo elemento del conjunto A elegido entre los m-1 no
3/18
usados. Como para la elección del primer elemento tenemos m objetos y para elegir el segundo m-1, según la regla del producto, obtendremos m·(m-1) variaciones binarias. Luego Vm,2 =m·(m-1) que es lo mismo que Vm,2=Vm,1·(m-1) Supongamos cierto para n-1 Para n
Análogo al caso n=2. Para conseguir todas las variaciones de orden n basta añadir a las variaciones de orden n-1 un nuevo elemento del conjunto A elegido entre los m-n+1 no utilizados. Por tanto Vm,n =Vm,n1 (m-n+1)
PROP El número de variaciones de orden n de m elementos es Vm,n =m·(m-1)·(m-2)·…·(m-n+1) dem. Como por la proposición anterior tenemos que Vm,n=Vm,n-1(m-n+1) Vm,n-1=Vm,n-2(m-n+2) … Vm,2=Vm,1(m-1) Vm,1 =m
Variaciones n-arias Variaciones (n-1)-arias … Variaciones binarias Variaciones unitarias.
Sustituyendo reiteradamente obtenemos: Vm,n=m·(m-1)·(m-2)·…·(m-n+1) Ejemplo: Dados cuatro amigos: Juan, David, Ivan y Alberto, deciden hacer un torneo de Ping-Pong. Obtener las diferentes clasificaciones que se pueden dar para los tres primeros puestos. Para obtener las variaciones de orden 3 siguiendo el método de la proposición, hay que obtener primero las de orden 2. Y para conseguir éstas, hemos de partir de las de orden 1. Variaciones orden 1
de Variaciones de orden 2
Juan, David, Ivan Juan, David, Alberto Juan, Ivan, David Juan, Ivan, Alberto Juan, Alberto, David Juan, Alberto, Ivan David, Juan, Ivan David, Juan, Alberto David, Ivan, Juan David, Ivan, Alberto
Juan, David Juan
Juan, Ivan Juan, Alberto
David
Variaciones de orden 3
David, Juan David, Ivan
4/18
David, Alberto, Juan David, Alberto, Ivan Ivan, Juan, David Ivan, Juan, Alberto Ivan, David, Juan Ivan, David, Alberto Ivan, Alberto, Juan Ivan, Alberto, David Alberto, Juan, David Alberto, Juan, Ivan Alberto, David, Juan Alberto, David, Ivan Alberto, Ivan, Juan Alberto, Ivan, David 4·3·2 m·(m-1)·(m-2)
David, Alberto Ivan, Juan Ivan
Ivan, David Ivan, Alberto Alberto, Juan
Alberto
Alberto, David Alberto, Juan 4 M
4·3 m·(m-1)
PROP Sean los conjuntos A=S(n) (con S(n)={1, 2, …, n}) y B={b 1 , b2 ,…,bm} tal que Card(A)=n y Card(B)=m con 1≤n≤m. El número de aplicaciones inyectivas entre A y B coincide con el número de variaciones de orden n de m elementos. dem. Recordemos que f:A→B en inyectiva siempre que se verifique que ∀a1 ,a2 ∈A con a1 ≠a2 ⇒ f(a1 )≠f(a2 ). Es decir, a elementos distintos en A, imágenes diferentes en B. Vamos a realizar la demostración por inducción en Card(A)=n Para n=1
f:{1}→{b1 , b2 ,…,bm}. Podemos tomar como imagen del 1, f(1)=bi con i:1,…,m Por tanto obtenemos m aplicaciones inyectivas diferentes. Número de aplicaciones inyectivas = m = Vm,1
Hipótesis de inducción. Sea f:{1, 2, …, n-1}→{b1 , b2 ,…,bm} Inyectivas. Supongamos que el número de aplicaciones f inyectivas es Vm,n-1. Para n tenemos f:{1, 2, …, n}→{b1 , b2 ,…,bm} inyectiva. Para calcular su número basta tener en cuenta que las imágenes de elementos {1, 2, …,n-1} se pueden elegir de Vm,n-1 maneras distintas (hipótesis de inducción) y que una vez elegidas estas imágenes quedan en el conjunto B m-(n-1) elementos que no son imagen de ningún elemento del conjunto {1, 2, …, n-1}. Por tanto, la imagen del elemento n se puede elegir de m-n+1 formas distintas. Luego el número de aplicaciones inyectivas f distintas sería Vm,n-1·(m-n+1) que es lo mismo que Vm,n.
5/18
3.1 Variaciones con Repetición. DEF Dado un conjunto A con m elementos, A={a 1 , a2 ,…, am}, llamamos variaciones con repetición n-arias a los distintos conjuntos ordenados que se pueden formar con n elementos, considerando que cada elemento puede figurar cualquier número de veces en una misma variación. Al número de variaciones con repetición n-arias que se pueden formar con m elementos se representa por VRm,n . PROP El número de variaciones con repetición n-arias que se pueden formar com m objetos cualesquiera es igual al número de variaciones con repetición de orden n-1 que se pueden formar con m objetos, multiplicando por m. VRm,n =VRm,n-1 ·m dem. La demostración es análoga a la de variaciones ordinarias. Vamos a realizar la demostración por inducción en n. Para n=1
Trivialmente VRm,1 =m
Para n-1
Por hipótesis de inducción VRm,n-1=VRm,n-2 ·m
Para n
Supongamos ya formadas las variaciones con repetición de orden n-1. Para obtener las variaciones con repetición de orden n bastará con añadir a cada una de ellas un elemento cualquiera de entre los m que disponemos. Así, por cada variación con repetición de orden n-1 obtenemos m variaciones con repetición de orden n. Las variaciones narias así formadas son todas, ya que si hubiera una que no estuviese, quitándole el último elemento obtenemos una (n-1)-aria y como el elemento está entre los m a elegir, llegamos a una contradicción. Por tanto, podemos afirmar que VRm,n =VRm,n-1 ·m
PROP El número de variaciones con repetición de orden n de m elementos es VRm,n =mn . dem. Aplicando el resultado obtenido en la proposición anterior: VRm,1 =m VRm,2 =VRm,1·m … VRm,n=VRm,n-1 ·m Al final, sustituyendo en la expresión inferior la anterior a ella, obtenemos VRm,n =mn
6/18
Ejemplo. Dados cuatro amigos, Juan, David, Ivan y Alberto, deciden jugar dos torneos de Ping-Pong. Obtener los posibles campeones de ambos torneos. En este caso hemos de calcular las variaciones con repetición de 4 elementos tomados de 2 en 2. Aplicando el procedimiento constructivo de la proposición anterior tenemos: VR de orden 1 Juan
David
Ivan
Alberto
VR de orden 2 Juan, Juan Juan, David Juan, Ivan Juan, Alberto David, Juan David, David David, Ivan David, Alberto Ivan, Juan Ivan, David Ivan, Ivan Ivan, Alberto Alberto, Juan Alberto, David Alberto, Ivan Alberto, Alberto
PROP Sean los conjuntos A=S(n) y B={b 1 , b2 ,…,bm} tal que Card(A)=n y Card(B)=m. El número de aplicaciones entre A y B coincide con el número de variaciones con repetición de m elementos de orden n VRm.n. dem. Vamos a realizar la demostración contando el número de aplicaciones distintas. Sea f: {1, 2, …, n} → {b1 , b2 ,…,bm} aplicación. Para 1∈A, el número de posibles imágenes, f(1), puede ser m, ya que f(1)=bj para algún j: 1, …, m. Para 2∈A, tenemos que f(2) puede también tomar como valor cualquier bj con j:1, …, m. Al no requerir para f la inyectividad, podemos permitir que 1 y 2 tengan la misma imagen. Lo mismo podemos decir para el resto de elementos de A. Por tanto f(i)=bj con i:1,…,n y j:1,…,m Como cada elemento de A tiene m posibilidades de elegir la imagen y A tiene n elementos, resulta mn formas distintas de elegir las imágenes para todos los elementos de A.
7/18
El número total de aplicaciones entre A y B es mn =Card(B)Card(A) y mn =VRm,n. 4. PERMUTACIONES. 4.1.Permutaciones Ordinarias. DEF Llamaremos permutaciones ordinarias de n elementos a las variaciones de n elementos de orden n. Lo representaremos por Pn . Las permutaciones ordinarias son un caso particular de las variaciones ordinarias. OBS Dado un conjunto A={a 1 , a2 , …, an }, dos permutaciones de los elementos de A sólo se diferencian en el orden de colocación de sus elementos ya que todas estarán formadas por todos ellos. DEF Sea n∈–. Se llama factorial de n, y se representa por n!, al producto de los n primeros números naturales, comenzando en el 1. n!=n·(n-1)·(n-2)·…·3·2·1 DEF Definimos el factorial de 0 como 0!=1. PROP Se verifica: 1) n!·(n+1) = (n+1)! 2) n!·(n+1)·(n+2)·…·m = m!
con m>n
dem. Inmediata a partir de la definición. Con esta nueva notación podemos expresar las variaciones de m elementos de orden n de la siguiente manera: m! Vm , n = ( m − n )! PROP El número de permutaciones de n elementos es n!. dem. Por definición de permutaciones tenemos que Pn = Vn , n =
n! n! = = n! ( n − n)! 0!
Veamos ahora un método constructivo para formar permutaciones: PROP Sea el conjunto A={a 1 , a2 , …, an }. Supongamos formadas todas las permutaciones con los n-1 elementos primeros. Para obtener todas las permutaciones de
8/18
orden n, tomaremos el elemento an , y en cada una de las permutaciones de orden n-1 colocaremos el elemento an de todas las formas posibles. dem. Vamos a realizar la demostración por inducción en n. Para n=1
A={a1 }. Como el conjunto A consta de un solo elemento, existirá una sola permutación P1 =1!=1
Para n=2
A= {a1 , a2 }. Dada la única permutación de orden 1, para obtener las de orden 2 tendremos que colocar a2 en todas las posiciones posibles con respecto a a1 : a1 a2 y a2 a1 . P2 =2!=2
Para n=3
Igualmente, partiendo de las dos permutaciones de orden 2, colocaremos a3 en todos los lugares posibles: a1 a2 → a1 a2 a3 a1 a3 a2 a3 a1 a2 a2 a1 →a2 a1 a3 a2 a3 a1 a3 a2 a1 P3 =3!=6
Para n
Repetimos el proceso anterior. Partiendo de una permutación de orden n1, colocamos an en todos los lugares posibles, que son n sitios distintos. Luego por cada permutación de orden n-1 obtenemos n de orden n. Pn =Pn-1·n=(n-1)!·n=n! Comprobemos que son todas. Sea a1 a2 …an una permutación cualquiera de orden n. Eliminando el elemento a1 obtenemos una permutación de orden n-1. Sabiendo lo anterior, si tenemos dos permutaciones de orden n que proceden de la misma permutación de orden n-1, al eliminar an obtendríamos la permutación de orden n-1 de la que parten. Luego para que las permutaciones de orden n-1 sean distintas, tienen que diferir en el lugar de colocación de an .
Para la proposición siguiente hemos de tener en cuenta este resultado, que no vamos a demostrar. LEMA Dados dos conjuntos finitos y no vacios A y B, que tienen el mismo cardinal (Card(A)=Card(B)=n con n∈–), se verifica para f: A → B que f es biyectiva si y sólo si es inyectiva. PROP Sean A y B dos conjuntos finitos y con el mismo cardinal n. El número de aplicaciones biyectivas f: A → B coincide con el número de permutaciones de orden n. dem. Por el resultado anterior, al ser A y B finitos y con el mismo cardinal n, el número de aplicaciones biyectivas entre A y B coincide con el número de aplicaciones inyectivas entre los mismos conjuntos. Pero ese número coincide con las variaciones de orden Card(A) de Card(B) elementos. Pero como ambos cardinales son iguales, esas
9/18
variaciones son permutaciones de orden n. Por tanto obtenemos como resultado lo que queríamos probar. Con este resultado podemos dar una nueva definición de permutación. DEF Sea A={a 1 , a2 , …, an }, un conjunto con n elementos, n∈–. Llamaremos permutación de los elementos del conjunto A a cada una de las biyecciones del conjunto A en si mismo. DEF Dadas dos permutaciones distintas p1 y p2 de los elementos del conjunto A={a 1 , a2 , …, an }, diremos que los elementos ai y aj forman inversión en la permutación p1 con respecto a p2 si el orden en el que figuran en ambas es inverso. En caso contrario se dice que forman permanencia. Ejemplo. Sea A={a 1 , a2 , a3 , a4 , a5} y sean dos permutaciones p1 =a1 a4 a3 a2 a5 y p2 =a1 a2 a3 a5 a4 Pares que forman inversión: (a4 , a3 ), (a4 , a2 ), (a4 , a5 ), (a3 , a2 ) Pares que forman permanencia: (a1 , a4 ), (a1 , a3 ), (a1 , a5 ), (a3 , a5 ), (a2 , a5 ) DEF Se llama Índice de la permutación pi con respecto a la permutación pj al número total de inversiones de la primera con respecto a la segunda. DEF Se dice que dos permutaciones son de la misma clase cuando el índice de una de ellas con respecto a la otra es cero o número par. DEF Una permutación es de Clase Par cuando el número de inversiones de ésta con respecto a otra, tomada como referencia, es cero o un número par. En caso contrario se dice que es de Clase Impar. OBS Suele ser común tomar como permutación de referencia aquella que sigue el orden de los números naturales. DEF Se llama Característica de una permutación con respecto a otra al número (-1)i siendo i el índice de la primera permutación con respecto a la segunda. DEF Si en una permutación se cambian entre sí dos elementos cualesquiera para obtener una nueva permutación, se dice que se ha efectuado una trasposición. PROP Si dada una permutación, realizamos una trasposición, la nueva permutación cambia de clase con respecto a la primera. dem. Caso 1: Los elementos que permutamos son consecutivos. Supongamos que la permutación ya tiene k inversiones con respecto a la de referencia. Si entre los elementos que permutamos ya había inversión, ésta desaparece, quedando k-1 inversiones. Si no la había, generamos una nueva, quedando k+1 inversiones. En ambos casos, al variar sólo en una unidad el
10/ 18
número de inversiones, la clase de la nueva permutación es par si la inicial era impar o al revés. Caso 2: Los elementos que permutamos no son consecutivos. Sea la permutación (…, ai, …, aj, …). Queremos intercambiar ai y aj sabiendo que entre ellos hay k elementos. Realizando k+1 inversiones situamos aj inmediatamente antes de ai (…, aj, ai, …). Realizando k inversiones situamos ai en el sitio inicial de aj volviendo a situar entre ambos k elementos. En total hemos realizado 2k+1 inversiones. Si la permutacion inicial ya tuviese m inversiones con respecto a la de referencia, la nueva permutación tendría m+2k+1 inversiones. Si m es par → m+2k+1 es impar Si m es impar → m+2k+1 es par En cualquier caso, la permutación cambia de clase. OBS Dado el conjunto A={a 1 , a2 , …, an }, existe el mismo número de permutaciones de clase par que de impar. 4.2.Permutaciones con Repetición. DEF Llamaremos permutaciones de n elementos entre los que hay r1 iguales entre sí, r2 iguales entre sí, …, rp iguales entre sí con r1 +r2 +…+rp = n a los distintos conjuntos ordenados que se pueden formar con los n elementos entre los que figuran repetidos r1 , r , r ,..., r r2 , …, rp elementos. Se denotará por Pn 1 2 p . OBS Consideraremos distintas dos permutaciones cuando difieran en el orden de colocación. PROP El número de permutaciones distintas que se pueden formar con n elementos n! donde existe uno de ellos repetido r veces es Pnr = . r! dem. Sean a1 , a2 , …, an los n elementos de los cuales a1 , a2 , …, ar con r
11/ 18
Tendremos Entonces Pnr =
n! n! clases o, lo que es lo mismo, permutaciones distintas. r! r!
n! . r!
PROP El número de permutaciones distintas que se pueden formar con n elementos donde existen r1 elementos iguales entre sí, r2 iguales entre sí, … y rp iguales entre sí es Pnr1 , r2 ,..., r p =
n! r1!·r2 !·...·rp !
con r1 + r2 + ... + rp = n
dem. Realizando el mismo razonamiento que en la proposición anterior, tendremos que intercambiando entre sí el elemento que se repite ri veces (∀i:1,..,p) obtendremos ri ! permutaciones iguales. Por tanto, el número de permutaciones totales tendrá que ser dividido por ri! ∀i:1,…,p para obtener el número de permutaciones distintas que hay. Dividir n! por r1 !, y luego por r2 ! y así sucesivamente hasta llegar a rp ! es lo mismo que dividir n! por el producto de los ri!. Queda, por tanto, lo que queríamos demostrar. PROP El número de permutaciones con repetición del conjunto B={b 1 , b2 , …, bp} con el elemento bi repetido ri veces i: 1, …, p coincide con el número de aplicaciones suprayectivas f:S(n) → B verificando que cada bi tiene ri antiimágenes y que n=r1 +r2 +…+rp 5. COMBINACIONES. 5.1.Combinaciones Ordinarias. DEF Dado un conjunto A={a 1 , a2 , …, an } de n elementos, llamaremos combinaciones de n elementos tomados de k en k a todos los subconjuntos de k elementos que se pueden formar con los n elementos. Consideraremos dos combinaciones diferentes cuando los conjuntos que las forman sean distintos, es decir, cuando difieran en algún elemento. Las representaremos por Cn,k . OBS En las combinaciones, al igual que en los conjuntos, no influye el orden de sus elementos. Por tanto, consideraremos a partir de ahora que los elementos de los subconjuntos están en el mismo orden que los del conjunto inicial. PROP Dado el conjunto A={a 1 , a2 , …, an }, obtendremos las combinaciones de k elementos a partir de las de k-1 elementos, sin más que colocar, uno a uno, todos los elementos que siguen, según el orden del conjunto A, al último de la combinación de k-1 elementos considerada. dem. Para k=1
Son las combinaciones de n elementos tomadas de uno en uno o, por definición, los subconjuntos de un elemento. Como hay n sunconjuntos distintos de 1 elemento, será n el número de combinaciones Cn,1 .
12/ 18
Para k=2
Son las combinaciones de n elementos tomados de 2 en 2. Para obtenerlas, partimos de las combinaciones unitarias y agregamos a cada elemento, uno a uno, los siguientes a él. A partir de {a 1 } → {a1 , a2 }, {a 1 , a3}, …, {a 1 , an } A partir de {a 2 } → {a2 , a3 }, {a 2 , a4}, …, {a 2 , an } Y así sucesivamente.
El mismo proceso se sigue para obtener las combinaciones de n elementos de k en k. A partir de {a 1 , a2 , …, ak-1 } → {a1 , a2 , …, ak-1, ak }, {a 1 , a2 , …, ak-1, ak+1} PROP El número de variaciones de orden k que se pueden formar con n elementos, A={a1 , a2 , …, an }, es igual al número de combinaciones k-arias que se pueden formar con los n elementos, multiplicando por el número de permutaciones de orden k, con 1≤k≤n. Vn,k = Cn,k · Pk dem. La demostración es evidente sin más que tener en cuenta que a partir de cada combinación (conjunto no ordenado de k elementos) obtenemos k! conjuntos ordenados escribiendo sus elementos de todas las formas posibles (permutaciones de k elementos). Así conseguimos todas las variaciones de n elementos tomados de k en k (recordemos que la definición de variación nos decía que eran subconjuntos de k elementos ordenados). COROLARIO
El número de combinaciones de n elementos tomados de k en k es Cn , k =
n! k!·(n − k )!
dem. Según la proposición anterior Vn,k = Cn,k · Pk
Por tanto
Cn , k
n! V (n − k )! n! = n ,k = = Pk k! k !·(n − k )!
5.2.Números Combinatorios. DEF A los números
n! se les llama números combinatorios. Se representan k!·(n − k )!
n por y se lee “n sobre p”. El número n recibe el nombre de base y el número p de k orden. n OBS Según esta nueva notación Cn, k = . k
13/ 18
n n PROP = 1 y = 1 0 n dem. n n! n! = = =1 0 0!·( n − 0)! 1·n! n n! n! = = =1 n n!·(n − n)! n!·0! n n PROP = n −k k dem. n n n! n! = = = n − k (n − k )!·(n − ( n − k ))! ( n − k )!·k! k n PROP = n 1
n y = n n − 1
dem. n n! n·( n − 1)! = = =n 1 1!·(n − 1)! 1·( n − 1)! n n y por la proposición anterior = = n n − 1 1 n n − 1 n − 1 PROP = + k k − 1 k dem. n − 1 n − 1 ( n − 1)! (n − 1)! ( n − 1)!·k ( n − 1)!·( n − k ) + = + = + = k !·(n − k )! k − 1 k ( k − 1)!·(n − 1 − k + 1)! k!·( n − 1 − k )! k!·( n − k )! =
n ( n − 1)!·k + ( n − 1)!·(n − k ) ( n − 1)!·[k + (n − k )] n! = = = k!·( n − k )! k!·( n − k )! k !·(n − k )! k
14/ 18
n n − 1 n − 2 n − 3 k k − 1 PROP = + + + ... + + k k − 1 k − 1 k − 1 k − 1 k − 1 dem. Aplicando el resultado de la proposición anterior, tenemos n n − 1 n − 1 = + k k − 1 k n − 1 n − 2 n − 2 = + k k −1 k n − 2 n − 3 n − 3 = + k k − 1 k … k + 1 k k = + k k − 1 k Si sumamos miembro a miembro todas las ecuaciones anteriores, y teniendo en k − 1 k cuenta que = obtenemos la fórmula a demostrar. k − 1 k OBS Si escribimos por filas los números combinatorios, situando en cada fila los que tengan la misma base y en la fila de debajo los de base una unidad mayor, resultará que cada número combinatorio es suma de los dos que tiene encima de él (aplicando la penúltima proposición) quedando de la siguiente manera: 1 1 0 1 2 2 2 0 1 2 3 3 3 3 0 1 2 3 … Los números combinatorios de los extremos, según la primera proposición, valen 1. Esta distribución en forma de triángulo recibe el nombre de triángulo de Tartaglia (en honor de Nícola de Fontana, que lo llamaban Tartaglia debido a su tartamudez), siendo también conocido como triángulo de Pascal. Sustituyendo los números combinatorios por sus valores, quedaría
15/ 18
1 1 1
1 2
3
1 3
1
… A partir del triángulo de Tartaglia, obtenemos los coeficientes del desarrollo de la potencia del binomio (a+b)n , llamado Binomio de Newton. (a+b)1 = a+b (a+b)2 = a2 +2ab+b2 (a+b)3 = a3 +3a2 b+3ab2 +b3 …
1 1 1
→ → →
1 2 3
1 3
1
n n −i i a b i= 0 i n
Por tanto
(a + b )n = ∑
Leibniz extendió este resultado a:
(a + a 1
+ ... + a p ) = n
2
r1 , r 2 ,..., r p n a1 + a 2 +... + a p = n
∑ PR
r
·a1r1 ·a2r2 ·...·a pp
5.3.Combinaciones con Repetición. DEF Sea A={a 1 , a2 , …, an }. Llamaremos combinaciones con repetición de los n elementos de A, a los distintos subconjuntos de k elementos donde los elementos se pueden repetir hasta k veces, siendo dos subconjuntos iguales cuando estén formados por los mismos elementos y repetidos el mismo número de veces. Se denota por CRn,k . OBS El número k de elementos de cada subconjunto puede ser mayor que n. Cuando esto sucede, entre las combinaciones con repetición se encuentran las combinaciones sin repetición de n elementos tomados de k en k. PROP En número de combinaciones con repetición de n elementos tomados de k en k que se pueden formar con los elementos A={a 1 , a2 , …, an } es n + k − 1 CRn , k = k dem. Para k=1
Las combinaciones con repetición de n elementos tomados de uno en uno coinciden con las combinaciones sin repetición y son n.
Para k-1
Supongamos formadas para k-1, y colocados sus elementos (en cada combinación) en el mismo orden que aparecen en el conjunto A
Para k
Para formar los de k elementos, partiendo de las anteriores, añadiremos a cada una el último elemento que en ellas aparece y, sucesivamente, cada uno de los que le siguen según el orden establecido en A. Obtenemos así todas las combinaciones con repetición. 16/ 18
Para poder contarlas, ideamos la siguiente manera: Vamos a establecer una biyección f: CRn,k → Cn+k-1,k de tal forma que a cada combinación con repetición de CRn,k le hacemos corresponder la combinación sin repetición obtenida colocando como subíndice de cada elemento el número que tenía incrementado en tantas unidades como elementos le preceden. n + k − 1 Así f es biyectiva y CRn , k = k Ejemplo. Queremos calcular CR3,6 (combinaciones con repetición de 3 elementos de 6 en 6). Dados los siguientes elementos, sus imágenes en C8,6 son: a1 a1 a2 a2 a3 a3 → a1 a2 a4 a5 a7 a8 Al primer elemento no le sumamos nada a su subíndice ya que no tiene elementos a su izquierda, al segundo le sumamos 1, al tercero 2, al cuarto 3 y así sucesivamente. 6. COMBINATORIA CLÁSICA Y ALGUNAS TENDENCIAS ACTUALES DE LA COMBINATORIA. Se entiende por Combinatoria o Análisis Combinatorio a la parte de las matemáticas que trata del estudio y determinación de las distintas agrupaciones que pueden formarse con un número finito de elementos siguiendo unas determinadas reglas. La Combinatoria estudia las propiedades de los diversos grupos que pueden formarse, incidiendo de forma especial en hallar la regla que permita formar todos los grupos y su número. El interés por la combinatoria surge en la India, donde el matemático Bhaskara (S. XI-XII) escribe sobre la utilidad de hallar variaciones de los diferentes metros en la versificación. Este interés viene debido a que sus obras (sobre álgebra o aritmética entre otras) están escritas siguiendo la tradición india, en verso. En Europa aparece la combinatoria poco después, desarrollándose en la Edad Media debido a los estudios judíos sobre la Cabala. El motivo hay que buscarlo en las especiales características del idioma Hebreo. Sus palabras carecen de vocales y las básicas están formadas por tres letras. Cuando dos palabras tienen las mismas letras pero en orden diferente es que existe algún tipo de relación conceptual entre ellas. En esta propiedad se basa el primero de los métodos cabalísticos, la Temurá, o arte de las permutaciones y combinaciones de letras. También el filósofo y teólogo Ramón Llul (nacido en Palma de Mallorca en 1233) trató la combinatoria en su obra Ars Magna. Parte de la combinación de términos simples. Establece unas tablas en las cuales aparecen una serie de términos susceptibles de combinación: nueve términos absolutos, nueve relativos, nueve cuestiones, nueve sujetos, nueve virtudes y nueve vicios. Filósofos y matemáticos se han fijado en esta obra del mallorquín, entre ellos Leibniz. 17/ 18
La combinatoria moderna aparece con Blaise Pascal (1623-1662). Científico y n filósofo francés, estudió en 1654 la expresión , desarrollando la teoría de las k combinaciones. En ella trata los números combinatorios, el triángulo de Tartaglia y el desarrollo de la potencia de un trinomio. Pero fue Jacobo Bernouilli (1654-1705) en su obra Ars Conjectandi (arte de la conjetura) el mayor impulsor de la combinatoria en el siglo XVII. Consiguió obtener y demostrar el desarrollo del binomio (x+a)n siendo n un número natural. Actualmente, nos encontramos con problemas de combinatoria que tienen que ver con grafos, dando lugar a la Teoría de Grafos. En el tema 2 se ha visto el problema de los Puentes de Königsberg. Otros problemas de combinatoria se mezclan con Geometría, dando lugar a la Geometría Combinatoria.
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa, Noemí Zoroa. Ed. PPU Introducción a la Teoría de la Estadística. Aut. Alexander M. Mood, Franklin A. Graybell. Ed. Aguilar.
18/ 18
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 4 NÚMEROS ENTEROS. DIVISILIBIDAD. NÚMEROS PRIMOS. CONGRUENCIA. 1. Introducción. 2. Los Números Enteros. 2.1. Construcción de 9. 2.2. El Grupo Aditivo de los Números Enteros. 2.3. El Semigrupo Multiplicativo de los Números Enteros. 2.4. El Anillo de los Números Enteros. 2.5. Ideales en el Anillo de los Números Enteros. 3. Divisibilidad. 3.1. Divisibilidad de Números Enteros. 3.2. Divisibilidad en el Anillo de los Números Enteros. 3.3. Máximo Común Divisor y Mínimo Común Múltiplo. 4. Números Primos. 5. Congruencias. 6. Criterios de Divisibilidad. Bibliografía Recomendada.
1/35
TEMA 4 NÚMEROS ENTEROS. DIVISILIBIDAD. NÚMEROS PRIMOS. CONGRUENCIA. 1. INTRODUCCIÓN. Este tema se divide en cinco partes fundamentales. La primera parte son Los Números Enteros. Comenzaremos definiendo el conjunto de los números enteros. Definiremos en él la operación de suma, que lo convertirá en grupo abeliano. Luego la operación producto, constituyendo un grupo multiplicativo abeliano con elemento unidad. Ambas operaciones nos crearán el anillo de los números enteros. Y al final trataremos de los ideales en el anillo, que se caracterizan por ser subconjuntos formados por los múltiplos de un número entero. La segunda parte es la Divisibilidad. La divisibilidad en el anillo de los números enteros se define de forma precisa en términos de ideales. Por último veremos la existencia y unicidad del Máximo Común Divisor y Mínimo Común Múltiplo. En la tercera parte definiremos los números primos y veremos sus propiedades. Aquí hemos de resaltar el teorema fundamental de la aritmética. En la cuarta parte trataremos con congruencias y en la última veremos los criterios de divisibilidad más importantes. 2. LOS NÚMEROS ENTEROS. En el tema 1 definimos el conjunto de los números naturales, el cual tiene estructura de Semianillo conmutativo. Ahora tenemos que ampliar dicho conjunto. El motivo es que ecuaciones del tipo x+m=n donde se verifica que m>n no tendrían solución. Por tanto, hemos de construir un nuevo conjunto en el cual esas ecuaciones siempre tengan solución. Ese conjunto ha de estar dotado de una operación interna (suma) que sea extensión de la operación interna de – y que verifique que todo elemento tiene simétrico. 2.1. Construcción de 9 . DEF Sea el conjunto –x–={(a,b) / a∈–, b∈–}. Sobre este conjunto definimos la relación R (a,b)R(c,d) ⇔ a+d = b+c PROP La relación R es una relación de equivalencia. Dem. Para que R sea una relación de equivalencia, debe verificar las propiedades reflexiva, simétrica y transitiva. a) Reflexiva.
a+b=b+aya que – es conmutativo ⇒ (a,b)R(a,b)
2/35
b) Simétrica
(a,b)R(c,d) ⇒ a+d=b+c ⇒b+c=a+d ⇒
Aplicando la conmutatividad c+b=d+a ⇒ (c,d)R(a,b) c) Transitividad (a,b)R(c,d) ⇒ a+d=b+c (c,d)R(e,f) ⇒ c+f=d+e Sumando ambas expresiones miembro a miembro a+d+c+f=b+c+d+e ⇒
a+f=b+e ⇒
(a,b)R(e,f)
Por tanto R es una relación de equivalencia. COROLARIO La relación R sobre –x– define un conjunto cociente cuyos elementos son las clases de equivalencia [(a,b)] donde [(a,b)]={(m,n) ∈–x– / (m,n)R(a,b)} DEF Se define el conjunto de los números enteros, y lo representamos por 9, como el conjunto cociente –x–/R. Es decir 9=–x–/R OBS Sabemos que toda clase de equivalencia queda determinada dando un representante cualquiera de la misma. Por convenio, los representantes de las clases de equivalencia serán aquellos pares ordenados que tengan al menos una de sus componentes nula. Se pueden dar tres casos, dado (a,b)∈–x– 1) a>b En este caso existe m∈– tal que a=b+m. Entonces se verifica (a,b)R(m,0). Todos los elementos de [(m,0)] son de la forma [(m,0)]={(b+m,b) / b∈–}. Al representante de [(m,0)] lo denotaremos con el símbolo +m, o simplemente, m. El conjunto 9+={[(m,0)] / m∈–} lo llamaremos conjunto de los números enteros positivos. 2) a
3/35
3) a=b Se verifica que (a,b)R(0,0). Todos los elementos de [(0,0)] son de la forma [(0,0)]={(a,a) / a∈–}. Al representante de [(0,0)] lo denotaremos con el símbolo 0. Ahora ya estamos en condiciones de afirmar que 9=9+∪{0}∪9PROP El conjunto 9 es una extensión de –. Dem. Basta ver que –⊂9 lo cual es evidente ya que 0∈– ⇒ 0∈9 ∀n∈–-{0} ⇒ [(n,0)]∈9+ ⊂9 2.2. El Grupo Aditivo de los Números Enteros. Vamos a definir en 9 la suma para dotarlo de estructura de grupo. DEF Definimos la suma en 9 como +: 9x9 → 9 con (a,b)x(c,d)∈9x9, entonces +((a,b),(c,d))=(a+c,b+d) Notación: La expresión +((a,b),(c,d)) se representa por (a,b)+(c,d). PROP La suma así definida no depende del representante elegido. Dem. Sean (a,b)R(a’,b’) y (c,d)R(c’,d’) Para ver que [(a,b)+(c,d)]=[(a’,b’)+(c’,d’)] tendremos que probar que ((a,b)+(c,d))R((a’,b’)+(c’,d’)) (a,b)R(a’,b’) ⇒ a+b’=a’+b (c,d)R(c’,d’) ⇒ c+d’=c’+d sumando ambas expresiones miembro a miembro a+c+b’+d’ = a’+c’+b+d ⇒ (a+c,b+d)R(a’+c’,b’+d’) ⇒ ⇒ ((a,b)+(c,d)) R ((a’,b’)+(c’,d’))
4/35
PROP La operación de suma definida anteriormente verifica las siguientes propiedades: 1) Asociativa: [(a,b)]+([(c,d)]+[(e,f)])=([(a,b)]+[(c,d)])+[(e,f)] 2) Conmutativa:
[(a,b)]+[(c,d)]=[(c,d)]+[(a,b)]
3) Elemento Neutro: [(0,0)], ya que [(a,b)]+[(0,0)]=[(a,b)]=[(0,0)]+[(a,b)] 4) Elemento Opuesto:
∀[(a,b)] ∃[(b,a)] tal que [(a,b)]+[(b,a)]=[(0,0)]
Dem. 1)
[(a,b)]+([(c,d)]+[(e,f)]) = [(a,b)]+([(c+e,d+f)]) = [(a+(c+e),b+(d+f))] = = [((a+c)+e,(b+d)+f)] = [(a+c,b+d)]+[(e,f)] = ([(a,b)]+[(c,d)])+[(e,f)]
2)
[(a,b)]+[(c,d)] = [(a+c,b+d)] = [(c+a,d+b)] = [(c,d)]+[(a,b)]
3)
[(a,b)]+[(0,0)] = [(a+0,b+0)] = [(a,b)] [(0,0)]+[(a,b)] = [(0+a,0+b)] = [(a,b)] Por lo tanto [(0,0)] es el elemento neutro y se representa por 0
4)
∀[(a,b)]
[(a,b)]+[(b,a)] = [(a+b,b+a)] = [(0,0)]
Luego el opuesto de [(a,b)] es [(b,a)] Es el llamado elemento simétrico con respecto a la operación de suma. PROP El simétrico de cada número es único. Dem. Sea [(a,b)].
Supongamos que admite dos simétricos: [(b,a)] y [(c,d)]
[(a,b)]+[(b,a)] = [(0,0)] = [(a,b)]+[(c,d)] ⇒ [(a+b,b+a)] = [(a+c,b+d)] Y para que las clases sean iguales, sus elementos han de estar relacionados: (a+b,b+a) R (a+c,b+d) lo que significa que
a+b+b+d = b+a+a+c
Aplicando la ley de simplificación en –
b+d = a+c
y eso es
(b,a) R (c,d)
y por tanto
[(b,a)] = [(c,d)]
y ambos elementos son el mismo.
5/35
OBS En general ∀n∈9, se designa a su simétrico por –n Como conclusión, la operación suma definida junto con las operaciones que hemos comprobado que verifica, nos indican que (9,+) es un Grupo Abeliano. Una consecuencia de la definición de suma, y por ser (9,+) un grupo, se verifica la propiedad cancelativa en la suma de números enteros. PROP ∀p,q,r∈9. p+q=p+r ⇒ q=r Dem. Como p∈9 ⇒ ∃(-p)∈9 / p+(-p)=0 p+q=p+r ⇒ (-p)+(p+q) = (-p)+(p+r) ⇒ Aplicando la propiedad asociativa ((-p)+p)+q = ((-p)+p)+r ⇒ Aplicando la propiedad de existencia de opuesto 0+q = 0+r ⇒ Aplicando la propiedad de existencia de neutro q=r Ahora que ya tenemos a (9.+) como grupo podemos afirmar: 1) Existe una operación inversa a la adición, que llamaremos diferencia. ∀m,n∈9
m-n = m+(-n)
2) La ecuación x+m=n con m,n∈9 es resoluble en 9, siendo la solución x=n+(-m) y es única. DEF Se define la sustracción o resta de números enteros como la suma del primero con el opuesto del segundo. m-n = m+(-n) Esta operación es interna en 9, pero no verifica las propiedades conmutativa y asociativa. Veamos que la suma de números enteros se corresponde con la construcción que hicimos de 9: 1) +m+n = [(m,0)]+[(n,0)] = [(m+n,0)] = +(m+n) 2) –m+(-n) = [(0,m)]+[(0,n)] = [(0,m+n)] = -(m+n) 3) +m+(-n) = [(m,0)]+[(0,n)] = [(m,n)] a) Si m>n ⇒ [(m,n)] = +(m-n) b) Si m
2.3. El Semigrupo Multiplicativo de los Números Enteros. Vamos a definir en 9 una operación producto tal que (9,·) sea un semigrupo conmutativo con elemento unidad, prolongando el producto definido en –. DEF Definimos la multiplicación de números enteros como: ·: 9x9 → 9 con (a,b)x(c,d)∈9x9, entonces ·((a,b),(c,d))=(ac+bd,ad+bc) Notación: La expresión ·((a,b),(c,d)) se representa por (a,b)·(c,d). PROP El producto así definido no depende de los representantes elegidos. Dem. Sean (a,b)R(a’,b’) y (c,d)R(c’,d’) Para ver que
[(a,b)·(c,d)]=[(a’,b’)·(c’,d’)]
tendremos que probar que que es equivalente a
((a,b)·(c,d))R((a’,b’)·(c’,d’)) ac+bd+a’d’+b’c’ = ad+bc+a’c’+b’d’
Vamos a ver que se verifica esa igualdad en dos pasos: Paso 1: Comprobar:
(a,b)R(a’,b’) y (c,d)R(c,d) ⇒ (a,b)⋅(c,d) R (a’,b’)⋅(c,d) ac+bd+a’d+b’c = (a+b’)c+(b+a’)d =
Como (a,b)R(a’,b’) ⇒ a+b’=b+a’ = (b+a’)c+(a+b’)d = ad+bc+a’c+b’d Uniendo ambos extremos: ac+bd+a’d+b’c = ad+bc+a’c+b’d Que es lo mismo que (a,b)·(c,d) R (a’,b’)·(c,d) Paso 2: Comprobar:
(a’,b’)R(a’,b’) y (c,d)R(c’,d’) ⇒ (a’,b’)·(c,d) R (a’,b’)·(c’,d’)
La demostración de este paso es análoga a la anterior. Como la relación R es transitiva, tenemos que: (a,b)·(c,d) R (a’,b’)·(c,d) y (a’,b’)·(c,d) R (a’,b’)·(c’,d’) ⇒ 7/35
⇒ (a,b)·(c,d) R (a’,b’)·(c’,d’) que era lo que queríamos comprobar. PROP La multiplicación de números enteros cumple las siguientes propiedades: 1) Asociativa:
∀m,n,p∈9
(m·n)·p=m·(n·p)
2) Conmutativa:
∀m,n∈9
m·n=n·m
3) Elemento Neutro:
∃e∈9 ∀m∈9
m·e=m=e·m siendo e=1
Dem. Sea m un representante de la clase [(a,b)], n de [(c,d)], p de [(e,f)] y e de [(e1 ,e2 )] 1) (m·n)·p = ([(a,b)]·[(c,d)])·[(e,f)] = [(ac+bd , ad+bc)]·[(e,f)] = = [((ac+bd)e+(ad+bc)f , (ac+bd)f+(ad+bc)e)] = = [(ace+bde+adf+bcf , acf+bdf+ade+bce)] = = [(a(ce+df)+b(de+cf) , a(cf+de)+b(df+ce))] = [(a,b)]·[(ce+df , de+cf)] = [(a,b)]·([(c,d)]·[(e,f)]) = m·(n·p) 2)
m⋅n=[(a,b)]⋅[(c,d)]=[(ac+bd, ad+bc)]=[(ca+db, da+cb)]=[(c,d)]⋅[(a,b)]=n⋅m
3)
m⋅e=m ⇒ [(a,b)]⋅[(e1 ,e2 )]=[(a,b)] ⇒
ae1 + be2 = a ⇒ ae2 + be1 = b
Para resolver el sistema de ecuaciones multiplicamos la primera por a y la segunda por b a 2 e1 + abe2 = a 2 ⇒ ⇒ abe2 + b 2 e1 = b 2 restando ambas ecuaciones: a2 e1 -b2 e1 =a2 -b2 ⇒ e1 =1 sustituyendo en la primera ecuación obtenemos e2 =0 Luego Por conmutatividad
e=[(1,0)]=1∈9 m·e=e·m
Ya estamos en condiciones de poder afirmar que (9,·) es un semigrupo conmutativo con elemento unidad.
8/35
PROP Otras propiedades del producto de números enteros son: 1) Ley de Simplificación: ∀m,n,p∈9-{0}, si m·n=m·p ⇒ n=p 2) El cero es un elemento absorbente: 3) 9 no posee divisores de cero:
∀m∈9 m·0=0
∀m,n∈9, si m·n=0 ⇒ m=0 ó n=0
Dem: A demostrar por el lector OBS Teniendo en cuenta la definición que hemos dado de números enteros (tanto positivos como negativos) y la definición de producto, podemos obtener la Regla de los Signos: 1) +m⋅+n=[(m,0)]⋅[(n,0)]=[(m⋅n,0)]=+(m⋅n) 2) +m⋅(-n)=[(m,0)]⋅[(0,n)]=[(0,m⋅n)]= −(m⋅n) 3) -m⋅+n=[(0,m)]⋅[(n,0)]=[(0,m⋅n)]= −(m⋅n) 4) -m⋅(-n)=[(0,m)]⋅[(0,n)]=[(m⋅n,0)]=+(m⋅n) PROP
Propiedad distributiva del producto respecto de la suma: ∀m, n, p ∈ 9
1) m⋅(n+p)=m⋅n+m⋅p 2) (m+n) ⋅p=m⋅p+n⋅p
(por la izq.) (por la der.)
Dem Como ambas demostraciones son análogas, sólo haremos una: 1) Sea m un representante de la clase [(a,b)], n de la clase [(c,d)] y p de [(e,f)] m⋅(n+p)=[(a,b)]⋅([(c,d)]+[(e,f)])=[(a,b)]⋅[(c+e,d+f)]= =[(a⋅(c+e)+b⋅(d+f), a(d+f)+b(c+e)]=[(ac+ae+bd+bf, ad+af+bc+be)]= =[(ac+bd+ae+bf, ad+bc+af+be)]=[(ac+bd, ad+bc)]+[(ae+bf, af+be)]= =[(a,b)]⋅[(c,d)]+[(a,b)]⋅[(e,f)]= m⋅n+m⋅p PROP El conjunto 9, con las operaciones de suma y producto definidas es una extensión de –, con sus dos operaciones de suma y producto. Dem Definamos la aplicación f: –→9 con f(n)=+n Es fácil comprobar que:
f(m+n)=f(m)+f(n) 9/35
y
f(m⋅n)=f(m)⋅f(n)
∀m,n∈–
Basta tener en cuenta la definición de suma y producto en 9. 2.4. Anillo de los Números Enteros. Como (9,+) es un grupo abeliano, (9,⋅) es un semigrupo conmutativo con elemento unidad y se verifica la propiedad distributiva por ambos lados, entonces (9,+,⋅) tiene estructura de Anillo Conmutativo unitario. Veamos algunas de las propiedades de (9,+,⋅) PROP El anillo de los números enteros no posee divisores de cero. Es decir: ∀m,n∈9
Si m⋅n=0
m=0 ó n=0
⇒
DEF (9,+,⋅) es un dominio de integridad, ya que es un anillo conmutativo con elemento unidad y sin divisores de cero. PROP El cero es un elemento absorbente. Es decir: ∀a∈9 a⋅0=0⋅a=0 Dem Sabemos que ∀b∈9 se verifica que b+0=0+b=b Teniendo en cuenta esto:
a⋅b=a⋅(b+0)=a⋅b+a⋅0
Aplicando la ley simplificativa:
0=a⋅0
De forma análoga para :
0=0⋅a
PROP ∀a,b∈9 ⇒ a⋅(-b)=-(a⋅b)=(-a)⋅b Dem Sabemos que ∀b∈9 ∃(-b)∈9 / b+(-b)=0 b+(-b)=0 ⇒ a⋅[b+(-b)]=a⋅0
⇒
ab+a(-b)=0 ⇒ a⋅(-b)=-(ab)
De forma análoga se comprueba que PROP
∀a∈9
(-a)⋅b=-(ab)
(-a)⋅(-b)=ab
2.5 Ideales en el Anillo de los Números Enteros. Sabemos que 9 es un anillo conmutativo unitario y además es un dominio de integridad, ya que no posee divisores de cero. Vamos a definir ahora el concepto de ideal. 10/ 35
DEF Sea I un subconjunto de 9. Se dice que I es un ideal de 9 si verifica: a) I es un subgrupo aditivo de 9. b) ∀a∈9 ∀x∈I se cumple a⋅x∈I OBS El subgrupo de 9 formado por todos los múltiplos de un entero cualquiera m∈9 es un ideal de 9. La comprobación es trivial. El ideal lo representamos por (m). Ya que los múltiplos de m coinciden con los de (-m), por convenio, al hablar del ideal (m) tomaremos un positivo. Comprobemos que todo ideal de 9 es de la forma (m). PROP Dado un ideal I de 9, se verifica que I=(m) para un entero m convenientemente elegido. Dem Por ser I un ideal, se verifica I⊂9. Si I=(0), la proposición queda demostrada. Supongamos pues que I≠(0). Entonces I deberá contener enteros positivos. Sea m el menor de los enteros positivos de I. Comprobemos que I=(m), y lo haremos por doble inclusión. (m)⊂ I
Como m∈I e I es un ideal ⇒ (m)⊂ I
I⊂(m)
Supongamos que I⊄(m) y llagaremos a una contradicción. Como I⊄(m) ⇒ ∃a∈(m) / a∈(m) Si dividimos a por p obtenemos: Si r=0 ⇒ a=mq ⇒ a∉(m)
a=m⋅q+r
Falso
con r
luego 0
Sea el número entero r=a-mq Como a∈I, m∈I ⇒ a-mq∈I ⇒ r∈I Pero r
11/ 35
Los ideales (0) y (1) se llaman ideales impropios. Los restantes, si existen, se llaman ideales propios. DEF Sea I un ideal. Diremos que I es un ideal principal si está engendrado por un solo elemento. COROLARIO Todo ideal de 9 es un ideal principal. DEF (a) es un subideal de (b) si (a)⊂(b) Con los ideales de 9 podemos definir las operaciones de suma e intersección de ideales, dando como resultado un nuevo ideal. 1) (a)+(b)={p∈9 / p=m+n, m∈(a), n∈(b)} es un ideal
PROP
2) (a)∩(b)={p∈9 / z∈(a) y z∈(b)} es un ideal Dem 1) Sean m,n∈(a)+(b) ⇒ m=a1 +b1 y n=a2 +b2 con a1 ,a2 ∈(a) y b1 ,b2 ∈(b) m-n=(a1 +b1 )-(a2 +b2 )=(a1-a2 )+(b1-b2 ) Como: a1 -a2 ∈(a) y b1 -b2 ∈(b)
por ser (a) y (b) ideales se verifica que: m-n∈(a)+(b)
(1)
Sea n∈(a)+(b) ⇒ n=a1 +b1 con a1 ∈(a) y b1 ∈(b) ∀c∈9 Se verifica que entonces:
c.n=c(a1 +b1 ) ⇒ c.n=ca1 +cb1 ca1 ∈(a) y cb1 ∈(b) c.n∈(a)+(b)
(2)
De (1) y (2) se deduce que (a)+(b) es un ideal. 2) Sean m,n∈(a)∩(b) ⇒ m,n∈(a) y m,n∈(b) ⇒ m-n∈(a) y m-n∈(b) ⇒ ⇒ m-n∈(a)∩(b)
(1)
Sea n∈(a)∩(b) y c∈9 ⇒ Como n∈(a) y n∈(b) se verifica que: n.c∈(a) y n.c∈(b) ⇒ n.c∈(a)∩(b) De (1) y (2) se deduce que (a)∩(b) es un ideal.
12/ 35
(2)
Veamos ahora algunos ideales especiales DEF Diremos que un ideal I es primo si verifica: 1) I≠9 2) n⋅n∈I ⇒ m∈I ó n∈I. PROP I=(m) es un ideal primo de 9 si y sólo si m es un número primo. Dem OBS Como 9 es un dominio de integridad, los ideales impropios son primos y por tanto los excluiremos de la demostración. “⇒” Demostrar: (m) es ideal primo ⇒ (m) es número primo. Es equivalente a: m no es número primo ⇒ (m) no es ideal primo. Si m no es un número primo ⇒ ∃a,b∈9 / m=a+b con a≠±1 y b≠±1. Podemos considerar a y b positivos, luego: m∈(m) y m=a⋅b Pero a∉(m) y b∉(m) ya que m es el entero positivo más pequeño. Por tanto (m) no es primo al no verificar la segunda condición de la definición. “⇐” Sea m un número primo y a⋅b∈(m) ⇒a⋅b=r⋅m Como m es primo, debería dividir a a o b ⇒ a∈(m) ó b∈(m) DEF Diremos que un ideal M es maximal si verifica: 1) M≠9 2) ∀I∈9 ideal y M⊂I ⇒ I=9 ó I=M DEF Llamaremos números primarios a los números de la forma pn con p primo y n∈–* (–*=–-{0}) DEF Los ideales primarios de 9 son los generados por el 0 y las potencias positivas de los números primos.
13/ 35
3. DIVISIBILIDAD. 3.1. Divisibilidad de Números Enteros. DEF Sean a,b∈9, diremos que “a divide a b” o “a es un divisor de b” ó “b es un múltiplo de a” y lo denotaremos por ser a/b ó b= a& si: ∃c∈9 / b=a⋅c OBS A partir de la definición es fácil comprobar que: 1) 1/a ∀a∈9
1/a ya que ∃a∈9 / a=1⋅a
2) a/0 ∀a∈9
a/0 ya que ∃0∈9 y se verifica 0=a⋅0
PROP ∀a,b,c∈9 se verifica: 1) ∀a∈9 a/a 2) Si a/b y b/c ⇒ a/c 3) Si a/b y b/a ⇒ a=±b Dem 1) ∀a∈9 ∃1∈9 / a=1⋅a 2) Si a/b ⇒ ∃n1 ∈– / b=a⋅n1 ⇒ c=(a⋅n1 )⋅n2 ; c=a(n1 ⋅n2 ) Si b/c ⇒ ∃n2 ∈– / c=b⋅n2 Como:
n1 ⋅n2 ∈9 ⇒ a/c
3) Si a/b ⇒ ∃n1 ∈– / b=a⋅n1 ⇒ a=b⋅⋅n2 ; a=(a⋅n1 )⋅n2 Si b/a ⇒ ∃n2 ∈– / a=b⋅n2 ⇒ a=a⋅(n1 ⋅n2 ) ⇒ a=a⋅(n1 ⋅n2 )=0 ⇒ a(1−n1 ⋅n2 )=0 Si a=0 ⇒ como b=a⋅n1 tenemos b=0 Si a≠0 ⇒ 1−n1 ⋅n2 =0 por ser 9 un dominio de integridad ⇒ ⇒ n1 ⋅n2 =1 ⇒ n1 =n2 =1 ó n1 =n2 =−1 Se deduce pues que
a=b ó a=−b
Si consideramos el par (9,/), vemos que verifica la propiedad reflexiva (apartado 1 de la proposición anterior) y la propiedad transitiva (apartado 2 de la proposición 14/ 35
anterior). En cambio no verifica la propiedad antisimétrica. Por tanto, (9,/) es un conjunto preordenado. Si un número entero y su opuesto fuesen el mismo se verificaría la propiedad antisimétrica y (9,/) sería un conjunto ordenado. Eso no es posible, pero vamos a evitar esa dificultad considerando equivalentes un número y su opuesto. DEF Diremos que dos números enteros, a y b, son asociados si verifican a/b y b/a. OBS Los números asociados se obtienen multiplicando por 1 y por –1. Al conjunto formado por el 1 y –1 lo vamos a denotar por U={1,-1} y forman un grupo multiplicativo. DEF Definimos la relación “ser asociados” y la denotaremos por ∪ a : a∪b ⇔ a/b y b/a PROP La relación ∪ es una relación de equivalencia. Dem Reflexiva:
Dado a∈9 se verifica a/a ⇒ a∪a
Simétrica:
a∪b ⇒ a/b y b/a ⇒ b/a y a/b ⇒ b∪a
Transitiva:
a∪b ⇒ a/b y b/a b∪c ⇒ b/c y c/b
Como a/b y b/c ⇒ a/c Entonces:
y como c/b y b/a ⇒ c/a a∪c
La relación de equivalencia “ser asociados” define clases de equivalencia donde ∀a∈9 subclase de equivalencia la denotaremos a y 9/∪ es el conjunto cociente. A los elementos del conjunto cociente (las clases de equivalencia) se les llama números asociados.
a ={b∈9 / a⋅u=b con u∈ U} Si: a=0 ⇒ 0 ={0} Si: a≠0 ⇒ a ={a,-a} Ya estamos en condiciones de generalizar la relación de divisibilidad definida en 9 al conjunto 9/∪ DEF Dados a , b ∈9/∪, diremos que a divide a b si ∃c∈9 tal que b = a ⋅c
15/ 35
Con esta nueva relación de divisibilidad podemos afirmar: PROP La relación de divisibilidad definida es una relación de orden y el conjunto (9/∪, /) es un conjunto ordenado. OBS En la práctica, no hablamos de divisibilidad de números asociados, pero al tratar la propiedad antisimétrica, se considerarán las clases (o números asociados), no los números entre sí PROP La divisibilidad entre números enteros verifica: 1) Si a/b y a/c ⇒ a/b+c y a/b-c 2) Si a/b ∀c∈9 ⇒ a/b⋅c Dem 1)
a/b ⇒ ∃n1 ∈9 / b=a⋅n1 a/c ⇒ ∃n2 ∈9 / c=a⋅n2 b+c=a⋅n1 +a⋅n2 = a⋅(n1 +n2 ) ; Como n1 +n2 ∈9 ⇒ a/b+c b-c=a⋅n1 -a⋅n2 = a⋅(n1 -n2 ) ; Como n1 -n2 ∈9 ⇒ a/b-c
2)
a/b ⇒ ∃n1 ∈9 / b=a⋅n1
Al multiplicar ambos miembros por c∈9 b⋅c=(a⋅n1 )⋅c ; b⋅c=a⋅(n1 ⋅c)
y como
n1 ⋅c∈9 ⇒ a/b⋅c
3.2. Divisibilidad en el Anillo de los Números Enteros. DEF Sean a,b∈9. Diremos que “a divide a b” y se escribe a/b cuando (b)⊂(a). Ejemplo: 5/10 ya que (10)⊂(5) PROP Sean a,b∈9. Las definiciones vistas: 1) a/b si ∃c∈9 / b=a⋅c 2) a/b si (b)⊂(a)
son equivalentes
Dem 1) ⇒ 2) Si a/b ⇒ ∃c∈9 / b=a⋅c ⇒ b⊂(a) ⇒ (b)⊂(a) por ser 9 un anillo principal.
16/ 35
2) ⇒ 1) Si a/b ⇒ (b)⊂(a) ⇒ b∈(a) ⇒ ∃c∈9 / b=a⋅c por ser 9 un anillo principal. PROP Dados a,b∈9, son asociados ⇔ (a)=(b) Dem “⇒” a/b ⇒ (b) ⊂ (a) Como a y b son asociados ⇒ a∪b ⇒ ⇒ (b)=(a) b/a ⇒ (a) ⊂ (b) “⇐” (a) ⊂ (b) ⇒ b/a (a)=(b) ⇒ ⇒ a∪b ⇒ a y b son asociados. (b) ⊂ (a) ⇒ a/b OBS Un ideal en 9 está engendrado por un elemento o por su opuesto (son los que pertenecen a la misma clase según la relación de equivalencia “ser asociado”). DEF Se dice que a divide a b , y se escribe a b cuando (b)⊂(a) PROP ∀a,b∈– con a/b se verifica: 1) a/bn con n∈– 2) a/|b| 3) |a|/|b| 4) b≠0 ⇒ |a|≤|b| Dem 1) Como a/b ⇒ ∃n1 ∈– / b=a⋅n1 n=1 trivial n=k-1 supongamos cierto que a/bk-1 n=k como a/bk-1 ⇒ ∃nk-1 ∈– / bk-1 =a⋅nk-1 bk =b.bk-1=a⋅n1 ⋅a⋅nk-1 bk =a⋅nk ⇒ a/nk
Sea: nk = a⋅n1 ⋅nk-1∈9 2) Si b≥0
a/b por hipótesis 17/ 35
Si b<0
como a/b
entonces:
∃n1 ∈9 / b=a⋅n1 ⇒ -b=a⋅(-n1 ) ⇒ a/-b
a/|b|
3) y 4) Son análogas. 3.3. Máximo Común Divisor y Mínimo Común Múltiplo. DEF Sean a,b∈9. Llamaremos “Máximo Común Divisor” de a y b a d∈9 verificando las siguientes condiciones: 1) d/a y d/b 2) ∃s∈9 / s/a y s/b ⇒ s/d OBS d es el mayor de los divisores comunes de a y b. Podemos fácilmente extender la definición a un número de elementos de 9. DEF Sean a1 , a2 , a3 ,…, an ∈9. Llamaremos M.C.D. de a1 → an a d∈9 verificando: 1) d/ai ∀i :1,…,n 2) ∃s∈9 / s/ai ∀i :1,…,n ⇒ s/d Diremos que d=mcd(a1 → an ) Las proposiciones que siguen vamos a demostrarlas para dos elementos, siendo su extensión a n elementos, inmediata. PROP Sean a,b∈9. (a)+(b)=(d) si y sólo si d=mcd(a,b) Dem “⇒” Hemos de probar que se verifican las siguientes condiciones de la definición: a ∈ (d) ⇒ a = d ⋅ n 1 ⇒ d/a 1) Como (a)+(b)=(d) ⇒ a,b∈(d) ⇒ b ∈ (d) ⇒ b = d ⋅ n 2 ⇒ d/b 2) Supongamos que ∃s∈9 tal que s/a y s/b s/a ⇒ a=s⋅m1 s/b ⇒ b=s⋅m2 como (a)+(b)=(d) ⇒ d=a⋅n1 +b⋅n2 =s⋅m1 ⋅n1 +s⋅m2 ⋅n2 ⇒ d=s(m1 ⋅n1 +⋅m2 ⋅n2 ) ⇒ s/d
18/ 35
“⇐” Como d=m.c.d(a,b) ⇒ d/a y d/b ⇒ a∈(d) y b∈(d) ⇒ (a)⊂(d) y (b)⊂(d) ⇒ ⇒ (a)+(b)⊂(d) Para ver la inclusión al contrario: como la suma de ideales es un nuevo ideal y en 9 los ideales son todos principales ⇒ pero entonces
∃s∈9 / (a)+(b)=(s)
s/a y s/b
Por ser d=mcd(a,b) ⇒ s/d ⇒ (d)⊂(s)=(a)+(b) por tanto (d)=(a)+(b) OBS La proposición anterior demuestra la existencia de mcd de un número finito de elementos de 9. PROP Sean a,b∈9. Se verifica que el mcd(a,b) es único, salvo factores unidad de 9. Dem Supongamos ∃d,d’∈9 / d=mcd(a,b) y d’=mcd(a,b) De la proposición anterior
(a)+(b)=(d)=(d’)
d ∈ (d' ) ⇒ d = d1 ⋅ d' Como (d)=(d’) ⇒ d'∈ (d) ⇒ d' = d 2 ⋅ d
⇒
d=d1 ⋅d2 ⋅d
Por ser 9 un dominio de integridad ⇒ d1 ⋅d2 =1 ⇒ d1 =d2 =1 ó d1 =d2 =-1 Por tanto d y d’ o son iguales o difieren en un factor unidad. Por convenio, se toma como mcd el número positivo. Teorema de BEZOUT. Si d=mcd(a,b) entonces existen dos números λ,µ∈9 tales que d=λa+µb Dem d=mcd(a,b) ⇒ (d)=(a)+(b) ⇒ ∃m,n∈9 tal que d=m+n con n∈(a) y n∈(b) ⇒ m=a⋅λ para algún λ∈9 y n=b⋅µ para algún µ∈9 ⇒ d=λa+µb Algoritmo de la División Sean a,b∈9 con b>0. Entonces existen q,r∈9 únicos tales que: a=b⋅q+r con 0≤r
Dem Existencia
Sean a,b∈9 con b>0
Construimos el conjunto S={a-bn / n∈9 y a-bn es un número Natural} Es fácil comprobar que S no es vacío: Si a=0 ⇒ tomando n=-1 a-b(-1)≥0 Si a≠0 ⇒ tomando n=-a2 a-b(-a2 )=a+b.a2 ≥0 Aplicando el principio de buena ordenación de –, que dice que todo subconjunto de – no vacío, tiene un mínimo, existe r=mín S Luego r=a-b⋅q para un determinado q∈9 y r≥0 Por tanto: a=b⋅q+r con r≥0. Comprobemos ahora que r0 Pero sabemos que r=min S luego eso es imposible. Por tanto la suposición es falsa y r
a b mcd , = 1 d d
Dem Si mcd(a,b)=d ⇒ d/a
d/b
20/ 35
Por el Teorema de Bezout:
∃λ,µ∈9 / d=λa+µb ⇒
a b a b ⇒ 1 = λ + µ ⇒ (1) ⊂ + d d d d ⇒ a b y como (1) = Ζ ⇒ + ⊂ (1) d d
a + b = (1) ⇒ d d
a b ⇒ mcd , = 1 d d Teorema de EUCLIDES.
Si a/b⋅c y mcd(a,b)=1 ⇒ a/c
Dem Como mcd(a,b)=1. Por el teorema de Bezout ∃λ,µ∈9 / 1=λa+µb Al multiplicar la expresión por c ⇒ c=λac+µbc
Por hipótesis
a a ⇒ a λac ⇒ a λac + µbc ⇒ a/c a bc ⇒ a µbc
DEF Sean a,b∈9. Llamaremos “Mínimo Común Múltiplo” de a y b a m∈9 si se verifican las siguientes condiciones: 1) a/m y b/m 2) ∃n∈9 tal que a(n y b/n ⇒ m/n OBS m es el menor de los múltiplos comunes de a y b. Es inmediato extender la definición a un número k de elementos de 9. DEF Sean a1 , a2 , a3 ,.., ak ∈9. Llamaremos mínimo común múltiplo de a1 → ak a m∈9 verificando las siguientes condiciones: 1) ai/m ∀i :1,…,k 2) ∃n∈9 tal que ai/n ∀i :1,…,k ⇒ m/n Diremos que m=mcm(a,b) Al igual que he mos hecho con el mcd, las proposiciones que siguen vamos a demostrarlas para dos elementos, siendo inmediato la extensión a n elementos. PROP Sean a,b∈9. (a)∩(b)=(m) si y sólo si m=mcm(a,b) Dem “⇒”
Hemos de probar que se verifican las dos condiciones de la definición: 21/ 35
1) Como
(a)∩(b)=(m)
⇒
(m) ⊂ (a) ⇒ m ∈ (a) ⇒ a/m (m) ⊂ (b) ⇒ m ∈ (b) ⇒ b/m
2) Supongamos que ∃n∈9 / a/n y b/n Como a/n ⇒ n ∈ (a) ⇒ (n) ⊂ (a) ⇒ (n)⊂(a)∩(b)=(m) ⇒ Como b/n ⇒ n ∈ (b) ⇒ (n) ⊂ (b) ⇒ (n)⊂(m) ⇒ n∈(m) ⇒ m/n “⇐”
Como
m=mcm(a,b)
⇒
a/m y b/m
⇒ m∈(a) y m∈(b) ⇒
⇒ (m)⊂(a)∩(b) Veamos la inclusión al revés. Como la intersección de ideales es un nuevo ideal y en 9 todos los ideales son principales, supongamos que ∃t∈9. (t) ⊂ (a) ⇒ t ∈ (a) ⇒ a t (a)∩(b)=(t) ⇒ (t) ⊂ (b) ⇒ t ∈ (b) ⇒ b t Pero como m=mcm(a,b) se verifica m/t ⇒ (t)⊂(m) y como (t)=(a)∩(b)
tenemos (a)∩(b)⊂(m)
COROLARIO Dados a,b∈9, a/b si y sólo si mcm(a,b)=b Dem a/b ⇔ (b)⊂(a) ⇔ (a)∩(b)=(b) ⇔ mcm(a,b)=b PROP Si mcm(a,b)=m ⇒ mcm(a⋅c, b⋅c)=m⋅c
con c≠0
Dem Como mcm(a,b)=m ⇒ (a)∩(b)=(m) ⇒ (a.c)∩(b.c)=(m.c) ⇒ ⇒ mcm(ac,bc)=mc a b m PROP Si mcm(a,b)=m y ∃c / c/a y c/b ⇒ mcm , = c c c Dem
Análoga a la anterior.
Veamos ahora la relación que existe entre el mcd y el mcm de dos números enteros.
22/ 35
Teorema Dados a,b∈9 mcd(a,b)⋅mcm(a,b)=a⋅b Dem Sea mcd(a,b)=d y mcm(a,b)=m Si mcd(a,b)=d ⇒
d/a ⇒ a = a'.d a b verificando mcd , = 1 d/b ⇒ b = b'.d d d
que es lo mismo que mcd(a’,b’)=1 a = a' d ⇒ a.b' = a' d.b' ⇒ a a' d.b' Si b = b' d ⇒ b.a' = b' d.a' ⇒ b a' d.b' Sea k un múltiplo cualquiera de a y b. Entonces: k = a.r ⇒ k = a' d.r ∃r,s∈9 tales que ⇒ a’d.r=b’d.s ⇒ a’r=b’s ⇒ k = b.s ⇒ k = b' d.s ⇒ a’/b’s y como mcd(a’,b’)=1, por el teorema de Euclides tenemos que: a’/s ⇒ ∃t∈9 tal que s=a’t Por tanto k=b.s=b.a’t=b’d.a’t ⇒ k/b’d.a’ Podemos decir que mcm(a,b)=d.a’b’ Ya estamos en condiciones de comprobar la igualdad, que es d.m=a.b d.m=d.d.a’b’=d.a’.d.b’=a.b COROLARIO
cqd
a,b∈9 son coprimos ⇔ mcm(a,b)=a.b
Dem a,b son coprimos ⇔ mcd(a,b)=1 ⇔ mcm(a,b)=a.b Vamos a ver ahora un teorema que nos va ha dar un método práctico para calcular el mcd de dos números y, aplicando el teorema anterior, podremos calcular a su vez, el mcm. Consiste en las divisiones sucesivas. Teorema del Algoritmo de EUCLIDES. Si r es el resto de la división entera de a por b, entonces mcd(a,b)=mcd(b,r) Dem
Dados a,b∈9 ∃q,r∈9 / a=b.q+r 0≤r
r=a-b.q=a.1+b.(-q)
luego todo divisor de a y b es también divisor de r.
r∈(a)+(b) ⇒ r∈(d) siendo d=mcd(a,b) ⇒ (r)⊂(d) ⇒ d/r ⇒ ⇒ mcd(b,r)=d=mcd(a,b) Llamaremos Algoritmo de Euclides al proceso de divisiones sucesivas que nos va a permitir calcular el mcd de dos números. Algoritmo de Euclides: Dados a,b∈9 ∃q1 ,r1
a=bq1 +r1 0≤r1
∃q2 ,r2
b=r1 q2 +r2 0≤r2
Después de n pasos llegaremos a que: rn-2=rn-1 .qn +rn con rn =0 ⇒ mcd(a,b)=mcd(b,r1 )=…=mcd(rn-1,0)=rn-1 4. NÚMEROS PRIMOS. DEF Sea p∈9-{0,1,-1}. Diremos que p es un número primo si sólo es divisible por unidades y por sus asociados. OBS p es primo si sus únicos divisores son {-1, 1, p, -p} DEF Sea q∈9-{0,1,-1}. Diremos que q es compuesto si no es un número primo. OBS Los números -1,0,1∈9 no son números primos ni son números compuestos. Veamos algunas propiedades de los Números Primos. PROP Sea p∈9 un número primo. Si p/a ⇒ mcd(p,a)=p Dem Vamos a suponer que p>0 ya que no afecta. Sea mcd(a,p)=d ⇒ d es el mayor de los divisores comunes a a y p. d/a ⇒ por ser p primo d∈{1,-1,p,-p} Como p/a tenemos que todos los divisores de p son divisores de a. Luego todos los divisores de p y de a son {-1,1,-p,p}. 24/ 35
Como d es el mayor de todos, entonces d=p. Por tanto mcd(a,p)=p PROP Sea p∈9 un número primo. Si p/a.b ⇒ p/a ó p/b Dem Si p/a entonces la proposición ya está demostrada. Supongamos que p no divide a a, entonces mcd(p,a)=1. Aplicando el Teorema de Euclides:
p/a.b y mcd(p,a) ⇒ p/b
PROP El conjunto de los números primos es infinito. Dem Supongamos que el conjunto de los números primo es finito Sea P={p 1 ,p2 ,…,pn} todos los números primos. Sea q=p1 ⋅p2 ⋅…⋅pn +1. Vamos a comprobar que q es primo, lo que supondrá una contradicción, ya que q∉P Si q no es primo ⇒ ∃i∈{1,…n} / pi/q ⇒ ∃c∈9 / q=pi ⋅c Entonces: ⇒ c=
pi ⋅c=p1 ⋅p2 ⋅…⋅pn +1
⇒
p1 ⋅ p 2 ⋅ ... ⋅ p n 1 1 + = p1 ⋅…⋅pi-1⋅pi+1 ⋅… ⋅pn + pi pi pi ⇒
⇒
1 =c-p1 ⋅…⋅pi-1⋅pi+1 ⋅… ⋅pn ∈9 pi
⇒ pi/1 con pi primo, lo que es una contradicción ⇒ q es primo ⇒ ⇒ El conjunto de los números primos es infinito Para poder obtener todos los números primos inferiores a uno dado existe un método práctico que recibe el nombre de Criba de Erastótenes. Criba de Erastótenes. Se escribe la sucesión de los números naturales hasta el número dado. A continuación tachamos todos los múltiplos de 2 comenzando en su cuadrado 22 =4. A continuación del 2, el primer número sin tachar es el 3, entonces eliminamos los múltiplos de 3 comenzando en su cuadrado 32 =9. Repetimos el proceso hasta llegar a un número cuyo cuadrado no esté en la lista. Aquellos números que permanezcan sin tachar son números primos.
25/ 35
Dado un número entero, para comprobar si es número primo sin tener que realizar la criba de Erastótenes, basta con comprobar si es divisible por los primeros números primos (2,3,5,7,…) hasta que se llegue a un número cuadrado sea superior al propio número dado. Teorema
En 9 se verifica: p es primo ⇔ (p) es ideal maximal
Dem “⇒” Como p es primo ⇒ (p)≠9 ya que p≠±1 Sea (q) un ideal tal que (p)⊂(q)⊂9. Como (p)⊂(q) ⇒ q/p pero al ser p primo q∈{1,-1,p,-p} q = u ⇒ (q) = (u) = Æ Sea u∈{-1,1} ⇒ q = u ⋅ p ⇒ (p) = (q) Entonces (p) es ideal maximal al verificar las dos condiciones de la definición. “⇐” Sea q un divisor de p ⇒ q/p ⇒ (p)⊂(q) Como (p) es maximal ⇒ Si (p)⊂(q) se verifica que (q)=(p) ó (q)=9 Si (q)=(p) ⇒ p/q y q/p ⇒ p y q son asociados ⇒ p es sólo divisible por sus asociados. Si (q)=9 ⇒ q=u ⇒ (p)⊂(u) ⇒ u/p entonces p es sólo divisible por las unidades o por sus asociados ⇒ p es primo DEF Se llaman números primarios a las potencias de la forma pn siendo p un número primo y n∈–-{0} OBS Todo número primo es número primario, sin más que tomar n=1. Ahora vamos a ver un resultado que nos va a permitir decir que todo número compuesto admite una descomposición en factores primarios y que dos descomposiciones del mismo número son iguales salvo en el signo de los factores. Si traducimos esto a ideales, es lo mismo que decir que todo ideal propio de 9 admite una descomposición como intersección finita de ideales primarios. Por ejemplo: (50)=(2)∩(52 ) siendo (2) y (52 ) ideales primarios.
26/ 35
Teorema Fundamental de la Aritmética. a) Existencia: Todo número compuesto se puede descomponer en un producto de factores primos. b) Unicidad: La descomposición anterior es única, salvo el orden o signo de los factores. Dem a) Existencia. Sea m un número compuesto y p el divisor primo de m, más pequeño. Entonces m=p1 .n1 con n1 ∈9 Si n1 es primo, ya está demostrado. m sería el producto de dos primos Si n1 no es primo, repetimos el proceso para n1 . Sea p2 el divisor primo de n1 más pequeño: Entonces n1 =p2 .n2 con n2 ∈9
luego
m=p1 .p2 .n2
Repetimos el proceso hasta obtener nk ∈9 número primo para algún k o es una unidad. El proceso es finito, ya que, por ejemplo, si usáramos el método de la Criba de Erastótenes, obtendríamos un número finito de números primos, que son los candidatos a ser divisores de m (los números primos mayores que m no pueden dividirlo) Si nk es una unidad ⇒ m=p1 .p2 .p3 ….pk Si nk es número primo ⇒ pk+1 =nk y m= p1 .p2 .p3 ….pk..pk+1 . b) Unicidad. Una vez comprobado que m se puede descomponer como producto de números primos, veamos que dicha descomposición es única. Sea
m= p1 .p2 .p3 ….pn =q1 .q2 .q3 ….qk .
n
Para ver que la descomposición es única debemos demostrar que: i) n=k ii) pi=qi.ui para i=1,…,n y ui∈{1,-1} unidades de 9. Como p1 ...pn =q1 …qk ⇒ p1 /q1 …qk y como p1 es primo ⇒
27/ 35
⇒ ∃j∈{1,…,k} / p1 /qj y como qj también es primo ⇒ ⇒ p1 y qj son asociados ⇒ p1 =qj.u con u∈{-1,1}. Reordenando los números primos podemos afirmar que p1 =q1 .u1 Entonces: p1 .(p2 …pn )=q1 .(q2 …qk ) se transforma en: q1 .u1 .(p2 …pn )=q1 .(q2 …qk ) quedando: u1 .p2 …pn =q2 …qk Repitiendo todo este proceso n veces obtenemos: u1 .u2 …un =qn+1 …qk Luego:
qn+1 …qk =1
ó
qn+1 …qk =-1
Entonces ∀j∈{n+1,…,k} tenemos qj/1 ó qj /-1 Por tanto: qj=u con u∈{1,-1} y j∈{n+1,…,k} Obtenemos que m=p1 …pn =q1 …qn
y pi=qi.ui ∀i:1…n
c.q.d.
COROLARIO Si en la descomposición de un número compuesto aparecen varios números primos repetidos, se pueden asociar y el número se escribe así: m = p1a1 .p a2 2 ....p an n
siendo ai el número de veces que se repite pi
i:1,…,n
Dem Dado m∈9 número compuesto, como la descomposición es única, si ordenamos los números primos de menor a mayor, tenemos: a
a
a
m = p1 .. 1..p1 .p 2 .. 2 ..p 2 ......p n .. n ..p n = p1a1 .pa22 .....p an n COROLARIO Todo número compuesto se puede descomponer de manera única como producto de números primos. Dem Igual que la demostración anterior. COROLARIO Todo ideal propio de 9 se puede poner como intersección finita de ideales primarios
28/ 35
Dem Dado m∈9 y aplicando el corolario anterior:
m = p1a1 .p a2 2 .....p an n
mcd(p 1a1 .p a2 2 .....p an n ) = 1
Es evidente que
ya que los pi son todos distintos: pi≠pj i≠j. Entonces, como
mcd(p 1a1 .p a2 2 .....p an n ) ⋅ mcm(p 1a1 .pa22 .....p an n ) = p1a1 .p a2 2 .....p an n mcm(p 1a1 .pa2 2 .....p an n ) = m
tenemos que:
Por un teorema anterior comprobamos que y aplicándolo obtenemos:
mcm(a,b)=m ⇔ (m)=(a)∩(b)
( ) ( )
( )
(m)= p1a1 ∩ p a2 2 ∩ ..... ∩ p an n
c.q.d.
Una consecuencia práctica de todo esto es la siguiente: Dado a,b∈9 sabemos que mcd(a,b)=d es el mayor de los divisores comunes de a y b; mcm(a,b)=m es el menor de los múltiplos comunes distintos de cero de a y b. Entonces el mcd(a,b)=d se puede obtener multiplicando los factores primos comunes con el menor exponente, de los que aparecen al descomponer a y b. A su vez, el mcm(a,b)=m se puede obtener multiplicando los factores comunes y no comunes con el mayor exponente de los que aparecen en las descomposiciones de a y b. 5. CONGRUENCIAS. DEF Sean a,b,n∈9 con n>0. Diremos que a es congruente con b módulo n, y se escribe a≡b(mod n) si n divide a a-b, n/a-b, o lo que es lo mismo a-b∈(n) PROP Sean a,b,n∈9 con n>0. a≡b(mod n) ⇔ a y b dan el mismo resto al dividirlos por n. Dem “⇒” Sea a≡b(mod n) ⇔ n/a-b ⇒ ∃c∈9 / a-b=n.c Si dividimos b por n
∃q,r∈ a≡b(mod n) / b=n.q+r con 0≤r
Hemos de comprobar que al dividir a por n también nos da de resto r. Como a-b=n.c ⇒ a=n.c+b ⇒ a=n.c+n.q+r ⇒ a=n.(c+q)+r con 0≤r
“⇐” Para ver que a≡b(mod n) basta comprobar que a-b∈(n) Por hipótesis
∃q1 ,r∈9 / a=q1 .n+r
0≤r
∃q2 ∈9 / b=q2 .n+r Si restamos ambas expresiones:
a-b=n(q1 -q2 ) ⇒ a-b∈(n)
c.q.d.
PROP La relación de congruencia módulo n, es una relación de equivalencia que tienen exactamente n clases. Dem Usando el resultado de la proposición anterior, es trivial comprobar que la relación de congruencia verifica las propiedades reflexiva, simétrica y transitiva. Reflexiva:
a≡a(mod n) ya que ambos (el propio a) tiene el mismo resto al ser divididos por n
Simétrica: Si a y b tienen el mismo resto, también b y a. a≡b(mod n) ⇒ b≡a(mod n) Transitiva: Si a y b tienen el mismo resto y b y c también, entonces es claro que a y c lo van a tener. a≡b(mod n) y b≡c(mod n) ⇒ a≡c(mod n) Veamos que tiene exactamente n clases. Sea a∈9 arbitrario y n>0. Por el algoritmo de la división: ∃q,r∈9 / a=n.q+r con 0≤r
a ≡ a' (mod n) n a - a' ⇒ b ≡ b' (mod n) n b - b'
⇒ n (a - a' ) + (b - b' ) ⇒
⇒ n (a + b) − (a'+b' ) ⇒ a+b≡a+b’ (mod n) 30/ 35
ii)
a ≡ a' (mod n) n a - a' n b.(a - a' ) ⇒ ⇒ n b(a - a' ) + a' (b - b' ) ⇒ ⇒ b ≡ b' (mod n) n b - b' n a.(b - b' ) ⇒ n ab - a' b' ⇒ ab≡a’b’(mod n)
COROLARIO Sean a,b,c,n∈9 con n>0. Se verifica: 1) a≡b(mod n) ⇔ ∀c∈9 a+c≡b+c (mod n) 2) a≡b(mod n) ⇒ ∀c∈9 a⋅c≡b⋅c (mod n) Dem 1) “⇒” ∀c∈9 se verifica n/c-c
ya que c-c=n.0 ⇒ c≡c(mod n)
Aplicando i) de la proposición anterior a a + c ≡ b + c(mod n) ⇒ a+c≡b+c(mod n) c ≡ c(mod n)
∀c∈9
“⇐” Análogamente podemos obtener que ∀c∈9 -c≡-c(mod n) Aplicando i) de la proposición anterior a a + c ≡ b + c(mod n) ⇒ a≡b(mod n) - c ≡ −c(mod n) 2) ∀c∈9 c≡c(mod n) Aplicando ii) de la proposición anterior a: a ≡ b(mod n) ⇒ a.c≡b.c(mod n) c ≡ c(mod n) OBS El recíproco de 2) no se puede obtener si no añadimos alguna condición adicional. Veámoslo: Sean a,b,c,n∈9 con n>0. Se verifica: ac=bc(mod n) y c y n son coprimos ⇒ a≡b(mod n)
31/ 35
Dem c y n son coprimos ⇔ mcd(c,n)=1 ⇔ aplicando el teorema de Bezaut ⇔ ∃λ,µ∈9 / 1=λ.c+µ.n
1+λc=µn ⇔ n/1-λ.c ⇔ 1≡λc(mod n)
Como a,b∈9, se verifica
a ≡ a(mod n) b ≡ b(mod n)
De 1≡λc(mod n) y a≡a(mod n) obtenemos a≡λca(mod n) De 1≡λc(mod n) y b≡b(mod n) obtenemos b≡λcb(mod n) Por hipótesis a.c ≡ b.c(mod n) como λ∈ Z λ ≡ λ(mod n)
⇒
λac≡λbc(mod n)
Aplicando la propiedad transitiva que verifica la relación de congruencia: a ≡ λca (mod n) b ≡ λcb (mod n) ⇒ a≡b(mod n) λca ≅ λcb(mod n) PROP Sean a,b,k,n∈9 con n>0. a ≡ b mod (kn) k≠0
⇒
a≡b(mod n)
Dem a≡b(mod kn) ⇔ kn/a-b ⇒ ∃c∈9 / a-b=ckn ⇒ a-b=(c.k).n ⇒ ⇒ n/a-b ⇒ a≡b(mod n) Análogamente
a≡b(mod k)
6. CRITERIOS DE DIVISIBILIDAD. Antes de poder tratar los criterios de divisibilidad, hemos de obtener unos resultados previos, DEF Sea p un número entero estrictamente positivo. Llamaremos restos potenciales de p, módulo n a los deferentes restos que se obtienen al dividir las sucesivas potencias de p por n. Por ejemplo: Sea p=3 y n=10 32/ 35
30 ≡1 (mod 10) 31 ≡3 (mod 10) 32 ≡9 (mod 10) 34 ≡7 (mod 10) A partir de esta definición podemos obtener las siguientes consecuencias: 1) El primero de los restos r0 es siempre r0 =1 Dados p y n, siempre se verifica que p0 ≡1 (mod 10) 2) El número de posibles restos potenciales distintos es finito, pues tienen que ser menores que n. 3) Si llamamos rk al resto potencial que se obtiene al dividir pk por n, entonces: pk ≡rk (mod n) Se verifica que pk+1 ≡rk (mod n) lo que nos da un método recurrente de hallar un resto a partir del anterior. rk . p≡rk+1 (mod n) Es evidente que si algún resto es nulo, lo serán todos los siguientes. PROP Sea
m=a0 p0 + a1 p1 +….+ak pk un número entero escrito en base p.
Si r0 , r1 ,…,rk son los restos potenciales de p modulo n, entonces: m≡a0 r0 +a1 r1 +…+ak rk (mod n) Dem pi≡ri(mod n) ∀i :0,…,k ⇒ ai.pi≡airi(mod n)
∀i :0,…,k
Al sumar las k+1 congruencias: a0 p0 + a1 p1 +….+ak pk ≡ a0 r0 +a1 r1 +…+ak rk (mod n) lo que es lo mismo que: m≡a0 r0 +a1 r1 +…+ak rk (mod n) COROLARIO m es divisible por n si y sólo si a0 r0 +a1 r1 +…+ak rk es divisible por n. Dem “⇒” m es divisible por n ⇔ m ≡ 0 (mod n) como m ≡ a 0 r0 + ... + a k rk (mod n ) 33/ 35
⇒
Aplicando la propiedad transitiva: ⇒ a0 r0 +…+ak rk (mod n) ⇒ a0 r0 +…+ak rk es divisible por n “⇐” Demostración análoga. Vamos a aplicar todo lo visto al sistema decimal, es decir: p=10 En la tabla siguiente aparecen los restos potenciales de 10 respecto de los módulos 2,3,4,5,8,9 y 11. n\ri 2 3 4 5 8 9 11
r0 1 1 1 1 1 1 1
r1 0 1 2 0 2 1 10
r2 0 1 0 0 4 1 1
r3 0 1 0 0 0 1 10
r4 0 1 0 0 0 1 1
r5 0 1 0 0 0 1 10
r6 0 1 0 0 0 1 1
Al expresar m en base 10 tenemos: m=a0 +a1 .10+a2 .100+….+ak .10k siendo a0 las unidades, a1 las decenas, a2 las centenas y así sucesivamente. a) Criterio de divisibilidad por 2. Como m≡a0 (mod 2), para que m sea divisible por 2 basta con que a0 sea múltiplo de 2. Es decir, las unidades de m ha de ser un número múltiplo de 2. b) Criterio de divisibilidad por 3. Como m≡a0 +a1 +…+ak (mod 3), la suma de todas las cifras de m ha de ser múltiplo de 3. c) Criterio de divisibilidad por 4. Como m≡a0 +2a1 (mod 4), la suma de las unidades mas el doble de las decenas ha de ser múltiplo de 4 d) Criterio de divisibilidad por 5. Como m≡a0 (mod 5), la cifra de las unidades ha de ser múltiplo de 5, es decir ha de ser 0 ó 5. e) Criterio de divisibilidad por 8.
34/ 35
Como m=a0 +2a1 +4a2 (mod 8), la suma de la cifra de las unidades mas el doble de las decenas mas el cuádruple de las centenas ha de ser múltiplo de 8 f) Criterio de divisibilidad por 9. Como m≡a0 +a1 +…+ak (mod 9), la suma de todas las cifras de m ha de ser un múltiplo de 9 g) Criterio de divisibilidad por 11. Como m=a0 +10a1 +a2 +10a3 +….(mod 11) 10≡-1(mod 11) quedaría
y teniendo en cuenta que:
m=a0 -a1 +a2-a3 +….+(-1)k ak (mod 11) Por tanto, un número m es divisible por 11 si la suma de sus cifras que ocupan lugar impar menos la suma de las cifras que ocupan lugar par, es un múltiplo de 11.
BIBLIOGRAFÍA RECOMENDADA. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Curso de Álgebra y Geometría. Aut. Juan de Burgos. Ed. Alhambra. Algebra Moderna. Aut. A. Lentín, J. Rivaud, Ed. Aguilar.
35/ 35
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 5 EL NÚMERO RACIONAL. 1. Introducción. 2. El Cuerpo de los Números Racionales. 2.1. Construcción de Q. 2.2. El grupo aditivo de los Números Racionales. 2.3. El grupo multiplicativo de los Números Racionales. 2.4. El Cuerpo de los Números Racionales. 3. Q como ampliación de 9. 4. Relación de Orden en Q 5. Propiedades de Q. 5.1. Propiedades de las Fracciones 5.2. Q es numerable. 5.3. Q es arquimediano. 5.4. Q es denso. 5.5. Propiedades de monotonía. 5.6. Valor absoluto de Q. 5.7. Supremo e Infinito. 6. Números Decimales. 6.1. Expresión decimal de los Números Racionales. Bibliografía Recomendada.
1/23
TEMA 5 EL NÚMERO RACIONAL. 1. INTRODUCCIÓN. En el tema 1 construimos el conjunto – y lo dotamos de las operaciones de suma y producto, constituyendo (–,+) un semigrupo abeliano. En el Tema 4, tuvimos que ampliar el conjunto –. El motivo era que ecuaciones del tipo x+m=n con m>n no tenían solución en –. Creamos el conjunto 9, ampliación del –, con más operaciones suma y producto que eran extensión de las de –. (9,+,ü) tenía estructura de anillo conmutativo con elementos de integridad. Es más, vimos que era un dominio de integridad y todos sus ideales principales, Ahora, en 9, nos encontramos con el siguiente problema: Sean a,b∈9 tal que a no divide a b y a≠0. Entonces las ecuaciones de la forma: ax=b no tienen solución en 9. La solución está en construir un nuevo conjunto que amplíe 9, y que las operaciones de suma y producto que definamos en él sean extensión de las de 9. En la construcción de este nuevo conjunto, también hemos de poner como condición que sea el menor de todos los posibles. Comenzaremos el tema con la construcción de ese conjunto que llamaremos Q, y a sus elementos números racionales, y comprobaremos que (Q,+) es un grupo abeliano. Luego definiremos el producto de números racionales, siendo (Q*,ü) grupo multiplicativo. Enlazaremos ambas operaciones con la propiedad distributiva para terminar afirmando que (Q,+,ü) es un grupo conmutativo. En la segunda parte del tema comprobaremos que podemos definir una relación de orden en Q, que Q es extensión de 9 y diversas propiedades más. Terminaremos viendo los números racionales enteros, es decir, aquellos que tienen cifras decimales. 2. EL CUERPO DE LOS NÚMEROS RACIONALES. 2.1. Construcción de Q . DEF Llamaremos 9* al conjunto de los enteros sin el cero. 9*=9−{0} DEF Establecemos en el conjunto 9×9* la siguiente relación R. Sean (a,b),(c,d)∈ 9×9*. Entonces (a,b)R(c,d)⇔ad=bc PROP La relación R definida en 9×9* es una relación de equivalencia
2/23
Dem: 1) Reflexiva: (a,b)R(a,b)⇔ab=ba lo cual es cierto ya que el producto en 9 es conmutativo. 2) Simétrica: (a,b)R(c,d) ⇒ ad=bc ⇒ bc=ad ⇒ cb=da ⇒ (c,d)R(a,b) 3) Transitiva: (a,b)R(c,d) ⇒ ad=bc (c.d)R(e,f) ⇒ cf=de multiplicando la primera ecuación por f, obtenemos: adf=bcf ⇒ Como cf=de
adf=bde ⇒
como d≠0
af=be ⇒ (a,b)R(e,f)
La relación R en 9×9* es una relación de equivalencia. DEF Definimos un conjunto Q como Q=9×9*/R y llamaremos a cada clase de equivalencia de Q, número racional, siendo Q el conjunto de los números racionales. Si p∈Q y (a,b) es un elemento de la clase de p, por convenio se escribe p = tomásemos otro elemento de la misma clase (c,d) entonces p =
a y si b
c verificándose que d
a.d=b.c DEF Al término
a se le llama fracción siendo a el numerador y b el denominador. b
PROP El conjunto Q es una extensión del conjunto 9. Dem Sea
f: 9→Q a → [(a,1)]
Basta comprobar que f es inyectiva para que 9⊂Q. Sean a,b∈9 con f(a)=f(b) ⇒ [(a,1)]=[(b,1)] ⇒ a.1=b.1 ⇒ a=b c.q.d. 2.2. El grupo aditivo de los números racionales. DEF
Sean [(a,b)],[(c,d)]∈ Q, se define la suma como sigue: [(a,b)]+[(c,d)]=[(ad+bc,bd)]
OBS La definición también la podíamos haber hecho de la siguiente manera:
3/23
Sean p,q∈Q ⇒ p + q =
a c ad + bc + = b d bd
OBS La operación está bien definida ya que b.d∈9* puesto que b,d∈9* y el producto es una operación interna PROP La operación suma definida anteriormente no depende del representante elegido. Dem: Sean
[(a,b)]=[(a’,b’)] ⇒ ab’=ba’ [(c,d)]=[(c’,d’)] ⇒ cd’=dc’ [(a,b)]+[(c,d)]= [(ad+bc,bd)]=…
Como ab’=ba’ ⇒ multiplicando por dd’ queda dd’ab’=dd’ba’ Como cd’=dc’ ⇒ multiplicando por bb’ queda bb’cd’=bb’dc’ Sumando ambas ecuaciones: y reordenando términos queda:
dd’ab’+bb’cd’=dd’ba’+bb’dc’ (ad+bc)b’d’=(a’d’+b’c’)bc =…
…=[(a’d’+b’c’,b’d’)]=[(a’,b’)]+[(c’,d’)] OBS Podemos realizar la demostración en términos de fracciones en lugar de clases a de equivalencia, con sólo cambiar [(a,b)]= y el resto igual. b PROP La operación suma definida anteriormente verifica las siguientes propiedades: a) Conmutativa b) Asociativa. c) Elemento Neutro d) Elemento Opuesto Dem. Las dos primeras propiedades las vamos a demostrar utilizando clases de equivale ncia y las dos últimas mediante fracciones. Dejemos al lector como ejercicio la posibilidad de hacerlo al revés. 1) Conmutativa. Sean
[(a,b)],[(c,d)]∈ Q [(a,b)]+[(c,d)]=[(ad+bc,bd)]=…
4/23
aplicando la conmutatividad de la suma y del producto de números enteros …=[(cb+da,db)]=[(c,d)]+[(a,b)] 2) Asociativa: Sean: [(a,b)], [(c,d)], [(e,f)] ∈Q,
([( a,b)]+[(c,d ) ]) +[(e,f)]=[(ad+bc,bd)]+[(e,f)]=[(adf+bcf+bde, bdf)]=… …=[(a,b)]+[(cf+de,df)]=[(a,b)]+ ([( c,d)]+[(e,f ) ]) 3) Elemento Neutro: Sea e∈Q el elemento neutro. Se debe verificar que ∀p∈Q: p+e = p = e+p Sea p=
a b
y como
si e=
c d
p+e=p ⇒
⇒ p+e = e+p= ad + bc a = bd b
ad + bc bd
bc = a ⇒ ⇒ ad +bd = b
e bd=b obtenemos d=1 (pues b∈9*) y de a+bc=a ⇒ bc=0 y como b∈9* se deduce que c=0.
Luego e=
0 1
Pero no es el único posible ya que (0,1)∈[(0.1)] ⇒ e puede ser un elemento cualquiera de esa clase. 4) Elemento Opuesto. Debe verificarse que ∀p∈Q ∃q∈Q / p+q =0 Representaremos q por −p Si p =
a -a a comprobaremos que −p= = = b b -b
p+(-p)=
a (-a) ab + b(−a) 0 0 + = = 2 = =0 b b 1 b2 b
CONCLUSIÓN (Q,+) es un grupo conmutativo.
5/23
(pues (0, b
2
)
) ∈ [( 0,1)]
2.3. El grupo multiplicativo de los números Racionales. DEF Sean [(a,b)], [(c,d)]∈Q. Definimos el producto de Números Racionales: [(a,b)]∗[(c,d)]=[(ac,bd)] OBS La operación producto se podía haber definido mediante fracciones de la siguiente forma: Sean: p,q∈Q con p= OBS
a c a.c y q= . Entonces: p.q= b d b.d
La operación está bien definida ya que b.d∈9*
PROP La operación producto definida anteriormente no depende del representante elegido: Dem
Sean [(a,b)]=[(a’,b’)] ⇒ ab’=ba’ [(c,d)]=[(c’,d’)] ⇒ cd’=dc’ [(a,b)]•[(c,d)]=[(ac,bd)]=…
Como ab’=ba’ y cd’=dc’ multiplicando miembro a miembro ambas ecuaciones obtenemos: ab’cd’=ba’dc’ y reordenando los términos:
ac.b’d’=bd.a’c’
…=[(a’c’,b’d’)]=[(a’,b’)]•[(c’,d’)] OBS Al igual que con la suma, podemos realizar la demostración en términos de fracciones en lugar de clases de equivalencia. PROP La operación producto definida anteriormente verifica las siguientes propiedades: 1) Conmutativa 2) Asociativa. 3) Elemento Neutro. 4) Elemento Simétrico. Dem. Las dos primeras propiedades las vamos a demostrar utilizando clases de equivalencia y las dos últimas mediante fracciones. 1) Conmutativa.
6/23
Sean
[(a,b)],[(c,d)]∈ Q [(a,b)]•[(c,d)]=[(ac,bd)]=[(ca,db)]=[(c,d)]•[(a,b)]
2) Asociativa: Sean: [(a,b)], [(c,d)], [(e,f)] ∈Q,
([( a,b)]•[(c,d ) ]) +[(e,f)]=[(ac,bd)]•[(e,f)]=[((ac)•e, (bd)•f)]=… …=[(a•(ce), b•(df)]= [(a,b)]•[((ce,df)]=[(a,b)]• ([( c,d)]•[(e,f ) ]) 3) Elemento Neutro: Debe existir e∈Q tal que p.e=p=e.p
∀p∈Q.
Por la propiedad conmutativa demostrada antes, tenemos que p.e=e.p luego sólo hemos de ver que p.e=p. i) ii)
0 0 e 0e 0 ⇒ p.e= . 1 = 1 = = 0=p 1 1 e 2 1e 2 e2 a Si p≠0 entonces p= con a≠0. b a e a ae1 a p.e= . 1 = ⇒ = ⇒ ae1 b=abe2 ⇒ abe1 =abe2 b e2 b be 2 b Si p=0=
y como ab≠0 ⇒ e1 =e2 entonces e= podemos definir e=
e1 e1
pero como [(e1 ,e1 )]=[(1,1)]
1 y lo demostraremos por e=1 1
4) Elemento Simétrico. ∀p∈Q−{0} Si p=
∃p∈Q/p.q=1
a c ac 1 y q= ⇒ p.q=1 se traduce por = b d bd 1
Basta tomar c=b y d=a para que ac.1=bd.1 sea ab=ba y por tanto se verifique la igualdad El número q=
b lo demostraremos por p-1 a p.p-1=1
CONCLUSIÓN
7/23
(Q−{0},•) tiene estructura de grupo multiplicativo conmutativo 2.4. El Cuerpo de los números racionales. Una vez visto que (Q,+) y (Q*,•) tienen estructura de grupo abeliano respecto de sus operaciones, veamos como podemos relacionar la suma y el producto de los números racionales. PROP En Q se verifica la propiedad distributiva del producto respecto de la suma. Dem Hemos de probar que ∀p,q,r∈Q se verifica (p+q).r=p.r+q.r Sean: a,c,e∈9 y b,d,f,e∈9* tales que p =
a c e ,q= y r= b d f
a c e ad + bc e ade + bce (p+q).r= + . = ⋅ = bd f bdf b d f
(1)
a e c e ae ce aedf + bfce ⋅ + ⋅ = + = b f d f bf df bfdf
(2)
p.r+q.r=
Para ver que (1) y (2) representan el mismo número racional, aplicaremos la relación de equivalencia: (ade+bce).bfdf=(aedf+bfce).bdf Simplificando, ya que b,d,f∈9* (ade+bce).f=aedf+bfce y al multiplicar por f en el primer miembro, comprobamos que la igualdad es cierta. Por tanto (1) y (2) son iguales, y por extensión: (p+q).r=pr+qr CONCLUSIÓN Como (Q,+) es un grupo abeliano, (Q*,•) es un grupo abeliano y se verifica la propiedad distributiva del producto respecto de la suma, podemos afirmar que (Q,+,•) tiene estructura de grupo conmutativo. Diremos que Q es el Cuerpo de los Números Racionales. 3. Q COMO AMPLIACIÓN DE 9 . Anteriormente comprobamos que el conjunto Q suponía una extensión del conjunto 9. Ahora vamos a comprobar que el cuerpo (Q,+,•) es una extensión del anillo (9,+,•).
8/23
Para ello vamos a definir una función ϕ entre (9,+,•) y (Q,+,•) tal que sea un homomorfismo inyectivo. DEF Sea ϕ:(9,+,•) → (Q,+,•) una aplicación definida por ∀a∈9 a ϕ(a)= ∈Q 1 PROP La aplicación ϕ es un homomorfismo inyectivo. Dem 1) ϕ es inyectiva. ∀a,b∈9
2) ∀a,b∈9
ϕ(a+b)=
3) ∀a,b∈9
ϕ(a⋅b)=
ϕ(a)= ϕ(b) ⇒
a b = ⇒ a=b 1 1
a + b a.1 + b.1 a b = = + = ϕ(a)+ϕ(b) 1 1.1 1 1
a ⋅b a ⋅b a b = = ⋅ = ϕ(a)⋅ϕ(b) 1 1⋅1 1 1
Por tanto, ϕ(9)⊂Q es un subanillo de Q isomorfo a 9, o lo que es lo mismo, 9 es una inmersión en Q ó Q es una extensión de 9. OBS
Esta aplicació n ϕ nos permite identificar el entero a∈9 con el racional
a ∈Q 1
∀a∈9 PROP La aplicación ϕ conserva el orden de 9. Dem Sean a,b∈9 tales que a≤b Entonces b-a≥0 que es lo mismo que b+(-a)≥0 y equivalente a: y
b + (-a) 0 ≥ 1 1
b + (-a) b −a b a ≥0 ⇒ + ≥0 ⇒ ≥ ⇒ ϕ(b)≥ϕ(a) 1 1 1 1 1
Luego si a≤b ⇒ ϕ(a)≤ϕ(b)
por tanto ϕ es un morfismo de orden.
Como en Q se conservan las operaciones de suma y producto y el orden definido en 9, podemos decir que Q es una ampliación efectiva de 9. 4. RELACION DE ORDEN EN Q .
9/23
Acabamos de ver que en un subanillo de Q existe un orden entre sus elementos, que es el que proviene de 9. Vamos a extender dicho orden a todo el cuerpo Q. Veremos, por tanto, que Q es un cuerpo ordenado. DEF Un número racional es positivo si puede encontrarse un representante del mismo con numerador y denominador positivo. PROP Si p∈Q es positivo y p=
a , entonces se verifica que signo(a)=signo(b). b
Dem Sea p=
Si
a a' = con p∈Q positivo b b'
a a' = ⇒ a.b’=b.a’ b b'
Como p es positivo, tenemos que a y b son positivos Entonces para que se verifique a.b’=b.a’ debe ocurrir que a’ y b’ tengan el mismo signo, ya sea positivo o negativo. DEF El subconjunto de Q formado por todos los números racionales positivos lo representaremos por Q+. DEF Sean p,q∈Q. Diremos que p≤q si q+(-p)∈ Q+∪{0} OBS La relación ≤ tiene sentido entre los números racionales, ya que hemos comprobado anteriormente que la suma de números racionales no depende de los representantes elegidos. PROP La relación ≤ es una relación de orden en Q. Dem 1) Reflexiva: ∀p∈Q
p≤p ⇒ p+(-p)=0 ∈Q+∪{0}
2) Antisimétrica: ∀p,q∈Q
Si p≤q y q≤p ⇒
⇒ p+(-q)∈Q+∪{0} y q+(-p) ∈Q+ ∪{0} ⇒ [p+(-q)]+[q+(-p)]∈Q+∪{0} Pero: p+(-q)+q+(-p)=0 Si la suma de dos números racionales positivos o cero da cero es porque ambos han de ser nulos. ⇒ p+(-q)=0=q+(-p) ⇒ p=q 3) Transitiva: ∀p,q,r∈Q
Si p≤q y q≤r ⇒
10/ 23
⇒ p+(-q)∈Q+∪{0} y q+(-r) ∈Q+∪{0} ⇒ [p+(-q)]+[q+(-r)]∈Q+∪{0} es decir: p+(-r)∈Q+ ∪{0} ⇒ p≤r PROP La relación ≤ es una relación de orden total. Dem Hay que ver que ∀p,q ∈Q se verifica p≤q ó q≤p Si p≠q ⇒ q-p∈Q. Sea
a un representante de q-p: b
q-p=
a b
Si signo(a)=Signo(b) ⇒ q-p∈Q+ ⇒ p≤q Si signo(a)≠Signo(b) ⇒ p-q∈Q+ ⇒ q≤p Por tanto (Q,≤) es un cuerpo ordenado. 5. PROPIEDADES DE Q . 5.1. Propiedades de las Fracciones. PROP Se verifica ∀a∈Q y b,c∈9* 1)
−a a = b −b
2)
a.c a = b.c b
Dem Si ambas fracciones son iguales es porque pertenecen a la misma clase −a a = b −b a.c a = b.c b
⇒ (-a).(-b)=b.a ⇒ ab=ba
⇒ acb=bca
Como ambas igualdades de fracciones verifican la relación de equivalencia ⇒ son iguales OBS Por convenio, si p es un número racional negativo, se puede escribir como a p=− con a,b∈9+ b 11/ 23
PROP Todo número racional tiene un representante con denominador positivo. Dem Sea p∈Q con p=
a b
Caso 1) Si a=0 ⇒ p=0 ⇒ p=
0 1
Caso 2) Si signo(a)=signo (b) negativos
puede ocurrir que sean ambos positivos o
i)
Si son positivos ya está demostrado
ii)
Si son negativos escribimos p=
−a con a,b∈– −b
−1 ∈[(1,1)] que es la clase del neutro del producto en Q. −1 Al multiplicar p por el neutro nos da de nuevo p, aunque con otro representante : Sabemos
p.
−1 − a −1 a =p ⇒ . = cuyo denominador es positivo. −1 − b −1 b
Caso 3) Si signo(a)≠signo (b) Si b∈– ⇒ p=
Si b∈ / – ⇒ p=
−a b
con a,b∈– y ya está.
a a a −1 − a con b∈– y por la prop. anterior = ⋅ = −b − b − b −1 b ⇒ p=
−a b
⇒
con a,b∈–
Luego, en cualquier caso, siempre podemos elegir para p∈Q un representante cuyo denominador sea positivo. COROLARIO Sea p,q∈Q con p=
a c , q= y b, d positivos. b d
Si p≤q ⇒ bc-ad≥0 Dem Dados p,q∈Q elegimos representantes con denominador positivo:
12/ 23
p=
a c y q= b d
con b, d positivos
Como p≤q ⇒ q+(-p)∈Q+∪{0} q+(-p)=
c a bc − ad - = ∈Q+ ∪{0} d b bd
Si
bc − ad =0 ⇒ bc-ad=0 bd
Si
bc − ad bc − ad ≠0 ⇒ ∈Q+ ⇒ signo (bc-ad)=signo(bd) bd bd
(1)
Y como b,d son positivos ⇒ bd es positivo ⇒ bc-ad>0 De (1) y (2)
bc-ad≥0
(2)
c.q.d.
PROP Dos números racionales cualesquiera siempre pueden escribirse con el mismo denominador. Dem Sean p,q∈Q con p=
a c y q= . b d
Por un resultado anterior, podemos afirmar que a ad p= = b bd
y q=
c cb = d db
c.q.d.
PROP Para todo número racional siempre podemos encontrar un representante tal que su numerador y denominador sean coprimos. Dem Sean p∈Q con p=
a b
Como a y b son números enteros, aplicamos el teorema fundamental de la aritmética y los descomponemos de forma única como producto de números primos. Los factores primos los reordenamos (usando la propiedad conmutativa del producto de números naturales) situando al principio los que sean comunes a ambos (si los hay). En caso de que a y/o b fuesen primos, sólo tendrá un factor y con exponente unidad. a= pá1 1 ......pán n .qâ1 1 ......qâmm
13/ 23
b= pá1 1 ' ......pán n '.r1ã 1 ......rsã s a pá1 1 ......pán n .qâ1 1 ......qâmm Como: p = = á1' b p1 ......pán n '.r1ã 1 ......rsã s ac a Aplicando la propiedad demostrada antes, que: = bc b nos queda:
Si α i−α i’>0 ⇒ el factor pái i −á i ' aparece en el numerador. Si α i−α i’=0 ⇒ No aparece el número primo p i Si α i−α i’<0 ⇒ el factor pái i '−á i aparece en el denominador. â
Los factores q j j quedan en el numerador ∀j:1,…,m Los factores rkã k quedan en el denominador ∀k:1,…,s El numerador y el denominador son coprimos ya que no tienen divisores comunes salvo la unidad. a y mcd(a,b)=1 diremos que la fracción que representa a p b es irreductible o que es un representante canónico de la clase de p. DEF Dado p∈Q con p=
5.2. Q es numerable. PROP El conjunto Q de los números racionales es numerable. Dem Vamos a establecer una biyección entre los elementos de –* que sabemos que es numerable y los elementos de Q+. Con esto conseguiremos demostrar que Q también es numerable, ya que Q=Q−∪{0}∪Q+. Lo haremos de una manera gráfica. Nos creamos una tabla de tal forma que al elemento aij le corresponde el número racional: aij= j i Posteriormente, volvemos a escribir la tabla en diagonal, comenzando por a11 como primera diagonal, a12 y a21 como segunda diagonal y así sucesivamente. Cuando lleguemos a un elemento cuya fracción haya sido considerada anteriormente, se salta. La tabla primera sería:
14/ 23
1 2 3 4 1 1 1 1 1 2 3 4 2 2 2 2 1 2 3 4 3 3 3 3 1 2 3 4 4 4 4 4 .... .... .... ....
..... ..... ..... ..... .....
Una vez reducida queda: 1 2 3 4 1 1 1 1 1 1 3 2 2 1 2 1 1 2 1 4 3 3 1 3 1 1 3 1 4 2 4 1 .... .... .... ....
..... ..... ..... ..... .....
ϕ:–−{0}→Q+
y la biyección sería
1 2 1 3 1 ϕ(1)= , ϕ(2)= , ϕ(3)= , ϕ(4)= , ϕ(5)= , …. 1 1 2 1 3 5.3. Q es arquimediano PROP Sean p,q∈Q con q≠0. Entonces: ∃n∈9/p
a c y q= ≠ 0 b d
Por una propiedad anterior, vamos a suponer b y d positivos. Como la propiedad a demostrar se verifica en 9 (9 es Arquimediano) y ad,bc∈9/ad<(bc)⋅n ⇒ ⇒
ad<(bc)⋅n ⇒ (bc)⋅n-ad>0
pero sabemos que, como bd>0 ⇒
⇒
(bc) ⋅ n − ad >0 ⇒ bd
cn a c a − >0 ⇒ ⋅n > d b d b 15/ 23
⇒ q⋅n>p
5.4. Q es Denso. Dem Para demostrar que Q es denso, hemos de ver que ningún número racional tiene anterior ni siguiente. Es decir: ∀p,q∈Q con p
p=
y como p
Si a
Sean
Tomamos:
r=
a −1 2a + 1 b +1 , s= , t= d 2d d
c.q.d.
5.5. Propiedades de Monotonía. PROP Sean p,q∈Q con p≤q. Se verifica: i)
p+r≤q+r
∀r∈Q
ii) s.p≥s.q
si s<0
s.p=s.q=0
si s=0
s.p≤s.q
si s>0
Dem i) p≤q ⇒ Por definición de la relación ≤ se verifica que: q+(-p)∈Q+∪{0} q+(-p)=q+(-p)+r+(-r)=q+r+(-p)+(-r)=q+r+(-(p+r)) entonces: q+r+(-(p+r))∈Q+∪{0} ⇒ p+r≤q+r
16/ 23
ii) Sean p=
a c e , q= , s= con b,d y f positivos. b d f
Como p≤q ⇒ bc-ad≥0
• Si s=
y
s.p=
ae ce ; s.q= bf df
e es positivo ⇒ Signo(e)=Signo(f) ⇒ e.f>0 f bc-ad∈9+∪{0} e.f∈9
bc-ad≥0 ef>0
luego:
e.f.(bc-ad)∈9+∪{0} Pero: ef.(bc-ad)=bc.ef-ad.ef=ce.bf-ae.df∈9+ ∪{0} ⇒ ⇒ ce,bf-ae.df≥0 ⇒ sp≤sq • Si s=0 ⇒ s.p=0 y s.q=0 ⇒ sp=sq=0 • Si s=
e es negativo ⇒ Signo(e)≠Signo(f) ⇒ ef<0 ⇒ −ef>0 f bc - ad ≥ 0 ⇒ -ef.(bc-ad)∈9+∪{0} - ef > 0
-ef.(bc-ad)=ad.ef-bc.ef=ae.df-ce.bf∈9+∪{0} ⇒ ae.df-ce.bf≥0 ⇒ s.p≥s.q COROLARIO Sean p,q,r,s∈Q con 0
17/ 23
⇒ p+ r< q+s
Supongamos que
1 1 1 < 0 ⇒ Signo(p)≠Signo ⇒ p ⋅ <0 p p p
1 Pero p ⋅ =1>0 contradicción, luego p
1 >0 p
5.6. Valor Absoluto de Q . Sabemos que si p∈Q, debe ocurrir que p>0 ó p=0 ó p<0. DEF Definimos el valor absoluto de p∈Q, y se representa por ipi como: p si p ≥ 0 ipi= - p si p < 0 PROP Dados p,q∈Q, 1) ipi≥0 y ipi=0 ⇔ p=0 2) ip.qi=ipi.iqi 3) ip+qi≤ipi+iqi Dem 1) ipi≥0 ya que si
• p≥0 ⇒ ipi=p≥0 • Si p<0 ⇒ ipi=−p>0
ipi=0 ⇔ p=0 tiene una demostración trivial
2)
p.q p.q ≥ 0 ip.qi= - p.q p.q < 0
(1)
p.q si p ≥ 0 q ≥ 0 p.q - p.q si p < 0 q ≥ 0 - p.q ipi.iqi= = p.(-q) si p ≥ 0 q < 0 - p.q (-p)(-q) si p < 0 q < 0 p.q
si p. q ≥ 0 si p.q < 0 si p.q < 0
(2)
si p.q ≥ 0
Las expresiones (1) y (2) son iguales. 3) Es fácil ver que p≤ipi con sólo sustituir ipi por su función, y que -ipi≤p
18/ 23
Luego:
p ≤ p ⇒ p + q < p + q q ≤ q ⇒ p+q ≤ p + q - p ≤ p ⇒ - p - q ≤ p + q - q ≤ q
OBS El valor absoluto en Q es una extensión del valor absoluto definido en 9. 5.7. Supremo e Ínfimo. Sea (Q,<) un cuerpo ordenado DEF Sea A⊂Q un subconjunto y sea x∈Q. Diremos que x es Cota Superior de A si ∀a∈A a≤x. DEF Sea A⊂Q un subconjunto y sea y∈Q. Diremos que y es Cota Inferior de A si ∀a∈A y≤a. Si existe una cota superior para el conjunto A⊂Q, diremos que A está acotado superiormente. Si existe una cota inferior para el conjunto A⊂Q, diremos que A está acotado inferiormente. Si A⊂Q está acotado es que lo está superior e inferiormente. DEF Dado A⊂Q, definimos el extremo superior de A como la mínima de todas sus cotas superiores. DEF Dado A⊂Q, definimos el extremo inferior de A como la máxima de todas sus cotas inferiores. DEF Dado x∈Q, diremos que x es el máximo de A⊂Q si x es cota superior de A y x∈A. Se denota por x=max(A). DEF Dado y∈Q, diremos que y es el mínimo de A⊂Q si y es cota inferior de A e y∈A. Se denota por y=min(A). 6. NÚMEROS DECIMALES. 6.1. Expresión Decimal de los Números Racionales. DEF Llamaremos número decimal a un número de la forma: ∞
ci i i =1 10
a+∑
con 0≤ci≤9
19/ 23
y se representa por:
a’c1 c2 c3 …
donde a recibe el nombre de “parte entera” del número decimal y ci son los decimales. PROP Todo número racional se puede expresar como un número decimal. Dem Sea p∈Q+ con p=
m fracción irreducible y m,n positivos. n
∃a,r1 ∈9 tal que m=a.n+r1 con 0≤r1
a es la parte entera del nº decimal
∃c1 ,r2 ∈9/10r1 =c1 .n+r2
Es claro que 0≤ci≤9 ya que:
con 0≤r2
0≤r1
⇒ 0≤c1 .n+r2 <10n ⇒ 0≤r2 <10n-c1 .n ⇒ 0≤r2 <(10-c1 )n (10 − c1 )n > 0 ⇒ 10-c1 >0 ⇒ c1 <10 ⇒ c1 ≤9 n > 0 y como m y n son positivos ⇒ a es positivo o cero ⇒ c1 ≥0 Repitiendo el proceso para 10r2 y n ∃c2 ,r3 ∈9/10r2 =c2 .n+r3
con 0≤r3
Y así sucesivamente: 10ri=ci.n+ri+1
∀i
Entonces p se puede escribir como a’c1 c2 c3 … Si p∈Q−, -p∈Q+ ⇒ p=-a’c1 c2 c3 … DEF Un número decimal es exacto si tiene un número finito de cifras decimales. PROP Un número racional es de la forma
b si y sólo si es un número decimal 10n
exacto. Dem “⇒” Como b∈9, sea b=b0 +10b1 +102 b2 +103 b3 +…+10n bn polinómica de b en base 10 por hipótesis p∈Q es p=
la descomposición
b b 0 + 10b1 + 10 2 b 2 + 10 3 b 3 + ... + 10 n b n = =… 10 n 10n 20/ 23
…=
b0 b b b b + n1−1 + n2− 2 + n3−3 + ... + ni −i + ... + b n n 10 10 10 10 10
El número decimal es bn ,bn-1,bn-2 ,…b0 parte decimal, que es finita.
siendo bn la parte entera y bn-1…b0 la
“⇐” Sea el número decimal exacto a’c1 c2 c3 …cn entonces: c1 c 2 c a.10n + c1 .10 n −1 + c 2 .10 n -2 + ... + c n + 2 + ... + nn = 10 10 10 10 n b = a.10 n + c1 .10 n −1 + c 2 .10 n − 2 + ... + cn ⇒ b∈9 y el decimal es
a’c1 c2 c3 …cn =a+ Si tomamos de la forma:
b 10n Ejemplos: 1) Sea p=
43452 10 4
⇒ p=4’3452
2) Sea el número decimal exacto: 3’14159 ⇒ 3’14159=
PROP Sea p∈Q con p=
314159 10 5
a . P es un número decimal exacto si y sólo si b b=2m.5n con m,n∈–
Dem “⇒” Si p es un decimal exacto ⇒ p=
c ⇒ b=10n ⇒ b=2n 5n 10n
“⇐” Sea
p=
a m n 2 5
⇒ p=
⇒ p=
a a 2 n 5m = ⋅ 2m 5 n 2 m 5n 2 n 5m
a.2 n .5m 10 n +m
⇒ p=
a.2n .5 m 2 n +m 5 n + m
⇒ p es un decimal exacto.
COROLARIO
21/ 23
⇒
a . p es un número decimal con infinitas cifras decimales si y sólo b si dado b= p1a1 .p a2 2 ....p an n ∃i:1,2,…,n /pi≠2 y pi≠5 (la descomposición de b tiene algún factor distinto de 2 y 5). Sea p∈Q con p=
OBS Como p=
a b
⇒ ∃c0 ,r1 ∈9/a=c0 b+r1 ⇒
a r = c0 + 1 b b
Repetimos para 10r1 y b ⇒ ∃c1 ,r2 ∈9/10r1 = c1 b+r2 ⇒
Entonces
r1 1 r = c1 + 2 b 10 b
a c r = c0 + 1 + 2 b 10 10b
y así sucesivamente. Como b tiene algún factor que no es ni 2 ni 5, este proceso continúa indefinidamente. • ri≠0 ∀i, ya que si ∃j∈–/ri=0 ⇒
a j -1 ci =∑ y tendría finitas cifras decimales, lo b i = 0 10 i
cual es falso. • Como ri
43 ⇒ 99
43 = 0' 43 99
para indicar el periodo del número
22/ 23
2) 0'1234 ⇒ Si x= 0'1234 entonces 100x= 12' 34 100x es periódico puro 10000x = 1234' 34 ⇒ 9900x=1222 ⇒ 100x = 12' 34
x=
1222 9900
⇒
1222 = 0'1234 9900
Existe un caso particular que hemos de resaltar: el periodo está formado solame nte por el número 9. ) ) ) Si x= 0'9 ⇒ 10x= 9'9 ⇒ 10x=9+x ⇒ 9x=9 ⇒ x=1 obtenemos 1= 0'9 Para que esto tenga sentido, necesitamos una topología en Q que permita asegurar el paso al límite. Eso podemos hacerlo teniendo en cuenta el orden definido en Q y la densidad de Q. Así podemos asegurar que la sucesión 0’9, 0’99, 0’999, 0’9999, … tiene por límite 1.
BIBLIOGRAFIA RECOMENDADA. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos. Análisis Matemático. Aut. M. de Guzmán – B. Rubio. Ed. Pirámide. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill. Introducción al Análisis Matemático. Aut. J. M. Ortega. Ed. Labor.
23/ 23
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 6 EL NÚMERO REAL. TOPOLOGÍA DE LA RECTA REAL. 1. Introducción. 2. El Cuerpo de los números reales. 2.1. Construcción de R. 2.1.1. Sucesiones fundamentales o de Cauchy en Q. 2.1.2. Relación de equivalencia en Sc. 2.2. El grupo aditivo de números reales. 2.3. El grupo multiplicativo de números reales. 2.4. El Cuerpo de números reales. 3. Orden de R. 4. Propiedades de R. 4.1. Q es denso en R. 4.2. ℜ es Arquimediano. 4.3. Valor absoluto en R. 4.4. ℜ es completo. 5. Topología de la recta real. 5.1. Subconjuntos cerrados de R. 5.2. Subconjuntos abiertos de R. 5.3. Entornos. 5.4. Puntos especiales. 5.5. Conjuntos compactos. Bibliografía Recomendada.
1/32
TEMA 6 EL NÚMERO REAL. TOPOLOGÍA DE LA RECTA REAL. 1. INTRODUCCIÓN. Dibujemos una recta de puntos. Situemos en algún lugar de ella el número cero como un punto cualquiera de la recta real. A partir de la longitud del segmento limitado por los puntos 0 y 1 podemos situar los demás números naturales. El número 2 estará situado a la derecha del 1 y el segmento limitado por 1 y 2 coincide en longitud con el segmento limitado por el 0 y 1. Por tanto, el segmento de n σ(n), verificará que está situado a la derecha de n y el segmento entre n y σ(n) coincide con el que hay entre 0 y 1. De forma similar, podemos situar los números enteros en la recta. Para identificar puntos de la recta con números racionales podemos utilizar el teorema de Thales, que se basa en el uso de rectas paralelas. Como entre cada dos números racionales, al menos hay otro (Q es denso) se pensó que todos los puntos de la recta se podían identificar con números racionales. Hasta que llegó Pitágoras. Pitágoras indicó que en la recta debía haber un punto que se identificase con un número, tal que el cuadrado de dicho número fuese 2. Al comprobar que ese número (que representaremos como 2 ) no era racional, demostró que en la recta había más puntos que números racionales (no existía por tanto una biyección). La necesidad de construir un conjunto más grande que Q también se puede motivar planteando el siguiente problema. Dada la ecuación x2 =2, el número x no es racional. Sea A⊂Q tal que A={p∈Q / p2 <2} y sea B⊂Q tal que B={q ∈Q / q2 >2} El conjunto A está acotado superiormente, por ejemplo 2∈B, 2>p ∀p∈A, y análogamente B está acotado inferiormente ya que 1∈A y 1
2/32
PROP Sea S= {(an ) / (an ) es una sucesión de números racionales}. Si definimos en S la suma como (an )+(bn ) = (an +bn ) y el producto como (an )·(bn )=(an·bn), entonces S tiene estructura de anillo conmutativo con elementos unidad. Dem. A Realizar por el Lector. DEF Diremos que una sucesión (an )∈S es acotada si existe r∈Q+ tal que ∀n∈N se verifica |an |
(1)
|an +bn |≤|an |+|bn |
3/32
Dem. Sea (an ) una sucesión convergente . Lim an =L. Supongamos que Lim an =L´, con L≠L´ ⇒|L-L´|=d. Lim an =L⇒∀ε>0 (ε∈Q) ∃n0 ∈N / ∀n>n0 ⇒|an -L|<ε
(1)
Lim an =L´⇒∀ε´>0 (ε´∈Q) ∃n0 ´∈N / ∀n>n0 ´⇒|an -L´|<ε´ (2) Tomemos ε, ε´ < d/2 ⇒ |an - L| < d/2 y |an - L´| < d/2. Es claro que (L-d/2, L+d/2) y (L´-d/2, L+d/2) no tienen puntos en común. Según (1) ∀n>n0 an ∈(L-d/2, L+d/2) Sea N=max{n0 , n0 ´}⇒si n≥N ⇒an ∈(L-d/2, L+d/2)∩ ∩(L´-d/2, L´+d/2)=∅, lo cual es imposible. y según (2) ∀n>n0 ´ an ∈(L´-d/2, L´+d/2) Al llegar a una contradicción, la suposición es falsa y L=L´. PROP Toda sucesión convergente es acotada. Dem Sea (an ) convergente. Entonces Lim an =L. Lim an =L⇔∀ε>0 (ε∈Q) ∃n0 ∈N / ∀n>n0 ⇒ |an -L|<ε ⇒ ∀n>n0 an ∈(L-ε, Lε). Sea m=min{a 1 ,..,ano,L-ε}y n=max{a 1 ,..,ano,L+ε}, entonces ∀n∈N m≤an ≤n PROP El conjunto C de sucesiones convergentes es subanillo de S. Dem i) Sea an ∈C una sucesión convergente ⇒ an es una sucesión de números racionales ⇒ an ∈S. ii) Sean an ∈C y bn ∈C dos sucesiones de números racionales convergentes, es decir: ∀ε>0 ∃n0 ´∈N / si n≥n0 ´ ⇒|an -L|<ε y ∀ε>0 ∃n0 ´´∈N / si n≥n0 ´´ ⇒|bn -L´|<ε entonces si tomamos n0 =max{n0 ´, n0 ´´} se tiene que: ∀ε>0 ∃n0 ∈N / si n≥n0 |an +bn-(L+L´)| = |(an -L)+(bn -L´)|≤|an -L|+|bn -L´|<ε+ε= 2ε
4/32
Por lo tanto si definimos ε´=2ε se tiene que: ∀ε´>0 ∃n0 ∈N / si n≥n0 ⇒|(an +bn )-(L+L´)|<ε´⇒(an +bn )∈C iii) Sean an ∈C y bn ∈C dos sucesiones de números racionales convergentes, es decir:
y
∀ε>0 ∃n0 ´∈N / si n≥n0 ´ ⇒|an -L|<ε ∀ε>0 ∃n0 ´´∈N / si n≥n0 ´´ ⇒|bn -L´|<ε
entonces si tomamos n0 =max{n0 ´, n0 ´´} y como bn es acotada por ser convergente (∃K∈Q+ / |bn |
OBS El recíproco no es cierto, ya que la sucesión 1, 1´4, 1´41, 1´414 se aproxima a 2 , es de Cauchy pero no es convergente al no ser 2 un número racional. PROP El conjunto Sc de sucesiones de Cauchy racionales es un subanillo de S. Dem i) Sea an ∈Sc una sucesión de Cauchy de números racionales⇒ ⇒an es una sucesión de números racionales⇒ an ∈S. ii) Sean an ∈Sc y bn ∈Sc dos sucesiones de Cauchy de números racionales ⇒ ⇒ y
∀ε>0 ∃n0 ´∈N / si n,m≥n0 ´ ⇒|an -am|<ε ∀ε>0 ∃n0 ´´∈N / si n,m≥n0 ´´ ⇒|bn -am|<ε
si tomamos no =max{n0 ´, n0 ´´} entonces ∀ε>0 ∃n0 ∈N / si n,m≥n0 |(an +bn )-(am+bm)|=| (an +am)+(bm+bn )|≤ |an -am|+|bn-bm|≤ε+ε=2ε Tomando entonces ε´=2ε tendremos: ∀ε´>0 ∃n0 ∈N / si n,m≥n0 ⇒|(an +bn )- (am+bm)|<ε´⇒ ⇒(an +bn ) es de Cauchy⇒(an +bn )∈Sc. iii)Sean an ∈Sc y bn ∈Sc dos sucesiones de Cauchy de números racionales⇒ ⇒∀ε>0 ∃n0 ´∈N / si n,m≥n0 ´⇒|(an -am|<ε y ∀ε>0 ∃n0 ´´∈N / si n,m≥n0 ´´⇒|(bn -bm|<ε Si tomamos no =max{n0 ´, n0 ´´} y como an y bn están acotadas al ser de Cauchy (∃K,K´∈Q+ / |an |
⇒Sc es un subanillo de S. DEF Llamamos sucesión nula a una sucesión que tiene por límite 0. El conjunto de las sucesiones nulas lo denotaremos por S0 . PROP La suma de sucesiones nulas es una sucesión nula. Dem Sean an ∈S0 y bn ∈S0 entonces: ∀ε>0 ∃n0 ´∈N / si n≥n0 ´⇒|an |<ε y ∀ε>0 ∃n0 ´´∈N / si n≥n0 ´´⇒|bn |<ε Si tomamos no =max{n0 ´, n0 ´´} entonces: ∀ε>0 ∃n0 ∈N / si n≥n0 |an +bn |≤ |an |+|bn |<ε+ε=2ε Por lo tanto si llamamos ε´=2ε se tiene que: ∀ε´>0 ∃n0 ∈N /|an +bn |<ε´ ⇒(an +bn )∈S0 OBS En concreto podemos decir que S0 es un subanillo de S. PROP El producto de una sucesión nula por otra de Cauchy es una sucesión nula. Dem Sea (an ) una sucesión de Cauchy y (bn ) una sucesión nula. (an ) es de Cauchy⇒(an ) es acotada⇒∃M>0 / |an |
2.1.2. Relación de equivalencia en Sc DEF Definimos la siguiente relación en Sc ∀(an bn )∈Sc (an )R(bn )⇔(an -bn )∈S0 PROP La relación R definida en Sc es una relación de equivalencia. Dem i) Reflexiva: ∀(an )∈Sc⇒(an -an )=0∈S0 ⇒an Ran ii) Simétrica: ∀(an )∈Sc y (bn )∈Sc, si an Rbn ⇒(an -bn )∈S0 ⇒(bn -an )∈S0 ⇒ bn Ran iii)Transitiva: ∀(an ), (bn ) y (cn )∈Sc con a n Rbn ⇒ ( an − bn ) ∈ S 0 ⇒ ( a n − bn ) + (bn − c n ) = ( a n − c n ) ∈ S 0 bn Rc n ⇒ ( bn − c n ) ∈ S 0 ⇒an Rcn ⇒R es una relación de equivalencia DEF Llamaremos a cada clase de equivalencia número real y Sc/R es el conjunto de los números reales, y se representa por ℜ. Notación: de aquí en adelante, notaremos los números reales por letras como x, y ó z en lugar de [an ], [bn ] y [cn ]. 2.2. El grupo aditivo de los Números Reales. DEF Definimos la suma en ℜ como: Dados x=[an ] e y=[bn ]
x+y=[an +bn ]
PROP La definición de suma no depende del representante elegido. Dem. Sean (an ), (an ´)∈[an ] y (bn ), (bn ´)∈[bn ]. Entonces se verifica que (an )-(an ´)∈S0 y (bn )-(bn ´)∈S0. Como S0 es un ideal, la suma es interna⇒((an )-(an ´))+((bn )-(bn ´)) y es lo mismo que ((an )+(bn ))-((an ´)+(bn ´))∈S0 y aplicando la suma (an +bn )-(an ´+bn ´)∈S0 , siendo equivalente a (an +bn )R(an ´+bn ´)⇔ [an +bn ]=[an ´+bn ´], luego no depende del representante elegido.
8/32
PROP La suma en ℜ verifica las siguientes propiedades: i) Conmutativa. ii) Asociativa. iii) Elemento neutro. iv) Elemento simétrico. Dem 1) Conmutativa: Sean x,y∈ℜ entonces x=[an ] e y=[bn ] ⇒ ⇒x+y=[an +bn ]=[bn +an ]=y+x⇒x+y=y+x 2)Asociativa: Sean x,y,z∈ℜ entonces x=[an ], y=[bn ], z=[cn ] ⇒ ⇒x+(y+z)=x+[bn +cn ]=[an +(bn +cn )]= [(an +bn )+cn ]= [an +bn ]+z=(x+y)+z= =x+(y+z) 3)Elemento neutro: Sea x∈ℜ definido por x=[an ]. Si definimos 0=[0] entonces x+0=[an +0]= [an ]=x⇒0 es el elemento neutro de la suma. 4)Elemento simétrico: Sea x∈ℜ definido por x=[an ], si denotamos por (-x)== [-an ]: x+(-x)= =[an +(-an )]=[0]=0⇒(-x) es el elemento simétrico de la suma. OBS Por tanto (ℜ,+) es un grupo abeliano. PROP El grupo abeliano (ℜ,+) contiene al grupo aditivo (Q,+). Dem Sea ϕ: Q→ℜ q→[q] La definición tiene sentido ya que si por ejemplo an ∈[q]⇒ an =q∀n∈N que trivialmente es de Cauchy. ϕ es homomorfismo: 9/32
ϕ(p+q)=[p+q]=[p]+[q]=ϕ(p)+ϕ(q) ϕ es inyectiva: Si ϕ(p)=ϕ(q) ⇒ [p]=[q]⇒(p)-(q)∈S0 ⇒(p-q)∈S0 ⇒p-q=0 ya que el límite de (p-q) es el número racional p-q ⇒p=q DEF Definimos el valor absoluto de un número real x, que denotaremos por |x|, como x x ≥ 0 | x |= − x x < 0 2.3 El grupo multiplicativo de los números reales. DEF Definimos el producto en ℜ como : dados x=[an ] e y=[bn ] x·y=[an ·bn ] PROP La definición del producto no depende del representante elegido. Dem. Sean (an ), (an ´)∈[an ] y (bn ), (bn ´)∈[bn ]. se verifica que (an -an ´)∈S0 y (bn -bn ´)∈S0 . Para ver que [an ·bn ]= [an ´·bn ´] hemos de comprobar que su diferencia es una sucesión nula. |an bn - an ´bn ´|=| an bn- an ´bn + an ´bn- an ´bn ´|= |(an -an ´)bn +(bn-bn ´)≤|an-an ´| |bn | + + |bn -bn ´| |an ´|. Como an ´, bn ∈Sc⇒ an ´, bn son acotadas⇒∃MM´ / |an ´|
Se deja como ejercicio al lector. OBS (R-{0}, ·) es un grupo multiplicativo abeliano. PROP Dados a, b∈R con a≠0, la ecuación ax=b admite soluciones en R. Dem Como a≠0 y (R-{0,·}) es grupo abeliano ⇒ ∃a-1 inverso de a. a-1 (ax)=a-1b (a-1a)x = a-1 b x=b a-1 DEF El número ba-1 recibe el nombre de cociente del número real b por el número real a y se representa por b÷a o b:a. PROP El grupo abeliano (R-{0},·) contiene al grupo abeliano (Q-{0},·). Dem Sea ϕ: Q→R q→[q] ϕ(p·q)=[pq]= [p]·[q]=ϕ(p)·ϕ(q) Luego es homomorfismo. ϕ es inyectiva (ya visto). 2.4 El Cuerpo de los Números Reales. Una vez visto que (R,+) y (R*,·) tienen estructura de grupo abeliano respecto de sus operaciones, veamos como podemos relacionar la suma y el producto de números reales. PROP En R se verifica la propiedad distributiva del producto respecto de la suma. Dem Sean x,y,z∈R con x=[an ], y=[bn ] y z=[cn ] x(y+z)= [an ]([bn ]+[cn ])= [an ]· [bn +cn ] = [an (bn +cn )] = [an ·bn +an ·cn ] = =[an bn ]+ [an cn ]= [an ] [bn ]+ [an ] [cn ]= xy + xz
11/ 32
Podemos afirmar que (R,+,·) tiene estructura de cuerpo conmutativo con elemento de unidad. PROP El cuerpo (R,+,·) contiene a (Q,+,·). Dem Sea ϕ: Q→R q→[q] Ya sabemos que ϕ es homomorfismo inyectivo. 3. ORDEN EN R. Vamos a definir en el conjunto R una relación de orden total que sea compatible con su estructura. Antes de poder definir un orden en R, necesitamos conocer cuál es el conjunto de números reales positivos. Para ello, nos vamos a apoyar en Q. PROP Sea (an ) una sucesión de Cauchy no nula. Entonces existe un elemento en la sucesión tal que a partir de él son todos del mismo signo. Dem Sea (an )∈Sc y (an )∉S0 .Como (an )∈Sc ⇒ ∀ε>0 (ε∈Q) ∃n0 ∈N / ∀n,m≥n0 ⇒|an -am|<ε. Supongamos que la tesis es falsa: siempre podemos encontrar m∈N con am>0 y un n∈N con an <0. Entonces ε>|an -am|= |an | + |am| ⇒ (an )∈S0 y eso es una contradicción. Luego ∃n0 ∈N / ∀≥n0 ⇒ an >0 (ó an <0). Por tanto, en Sc podemos distinguir: • • •
Sucesiones de Cauchy positivas ⇔∃n0 ∈N / n≥n0 ⇒ an >0. Sucesiones de Cauchy negativas ⇔∃n0 ∈N / n≥n0 ⇒ an <0. Sucesiones de Cauchy ni positivas ni negativas.
PROP Dos sucesiones de Cauchy equivalentes y no nulas son ambas positivas o ambas negativas. Dem Sean (an ), (bn )∈Sc Como (an )∉S0 ⇒ ∃n0 ∈N / ∀n≥n0 ⇒ |an |>k (bn )∉S0 ⇒ ∃n0 ´∈N / ∀n≥n0 ´ ⇒ |bn |>k´
12/ 32
Supongamos que (an ) es positiva y (bn ) es negativa. Entonces ∀n≥max{n0 , n0 ´}⇒|an -bn | = |an | + |bn | >k+k´ Lo cual no puede ser ya que (an ) y (bn ) son equivalentes (⇔(an -bn )∈S0 ). La suposición es falsa y por tanto (an ) y (bn ) son del mismo signo. DEF Definimos el conjunto de los números reales positivos y lo denotamos por R+, a R+={x∈R / x=[an ] y (an ) es positiva}. Análogamente DEF Definimos el conjunto de los números reales negativos y lo denotamos por R-, a R-={y∈R / y=[bn ] y (bn ) es negativa}. También como R-={y∈R / -y∈R+}. Con estas definiciones tenemos que R = R-∪{0}∪R+. PROP La suma y el producto en R+ son operaciones internas. Con todas estas consideraciones, ya podemos definir una relación en R y comprobar que es de orden. DEF Definimos en R la relación ≤ como: ∀a,b∈R a≤b ⇔ b-a∈R+∪{0}. PROP La relación ≤ definida en R es de orden. Dem: Para comprobarlo hemos de demostrar que verifica las propiedades reflexiva, antisimétrica y transitiva: 1)Reflexiva: 0∈R+∪{0} ⇒ a-a∈R+ ∪{0} ⇒ a≤a 2)Antisimétrica:
si a≤b⇒b-a∈R+∪{0} si b-a=0 ⇒ b=a si b-a∈R+ ⇒a-b∈R- luego no se verifica que b≤a con b≠a.
3) Transitiva: si a≤b⇒b-a∈R+∪{0} si b≤c⇒c-b∈R+∪{0} ⇒(c-b)+(b-a)∈R+∪{0} ⇒ c-a∈R+ ∪{0} ⇒ c-a∈R+ ∪{0} ⇒ a≤c
13/ 32
PROP La relación ≤ es de orden total. Dem
∀a,b∈R, b-a ∈
{0}⇒ a=b R+ ⇒ a≤b R- ⇒ b≤a
PROP El orden definido en R es compatible en las operaciones de suma y producto. Dem i) ∀a,b∈R con a≤b ⇒ b-a ∈R+ ⇒ (b+c-c-a)∈R+ ⇒ (b+c)-(c+a)∈R+ ⇒ ⇒ a+c ≤ b+c ∀c∈R. ii) ∀a,b∈R con a≤b y con c∈R+∪{0} ⇒ b-a∈R+ ⇒ c(b − a) ∈ R + ⇒ cb − ca ∈ R + ⇒ ac ≤ bc ⇒ ⇒ ac ≤ bc c(b − a) ∈ {0} ⇒ cb − ca = 0 ⇒ ac = bc Conclusión: (R, ≤) es un cuerpo ordenado. PROP (R,≤) amplia a (Q,≤). Dem Sea ϕ: Q→R q→[q] Ya sabemos que ϕ es homomorfismo inyectivo. Sean p,q∈Q con p≤q ⇒ q-p∈ Q+∪{0} ⇒ϕ(q-p)∈R+∪{0} ⇒ ϕ(q)-ϕ(p) ∈ R+∪{0} ⇒ ϕ(q)≤ϕ(p) El conjunto ϕ(Q)⊂R es un subcuerpo ordenado de R, y es isomorfo a Q. Como Q≅ϕ(Q) por convenio se toma ϕ(Q)≡Q y por tanto los números reales son una ampliación de los números racionales.
14/ 32
4. PROPIEDADES DE R. 4.1 Q es denso en R. PROP Dados x,y∈R con x≤y y x≠y, ∃q∈Q / x0 ∃n0 ∈N / ∀n≥n0 ⇒bn -an > ε Además como (an ), (bn )∈Sc ⇒ ∀ε 1 >0 ∃n1 ∈N / ∀n,m≥n1 ⇒ |an -am|<ε 1 ∀ε 2 >0 ∃n2 ∈N / ∀n,m≥n2 ⇒ |bn -bm|<ε 2 Tomemos ε 1 =ε 2 =ε/2 y sea n3 =max{n0 ,n1 ,n2 }. Definiendo q∈Q como + a + bn 3 a + bn 3 bn 3 − a n q = a n 3 bn 3 tenemos que ∀n≥n3 q − a n = n 3 − a n = n3 + 2 2 2 2 >
−ε/ 2 ε ε + = ⇒q-an > ε/4 ⇒ x
(tengamos en cuenta que |an3 -an |<ε/2 ⇒|an3-an |>-ε/2). Análogamente ∀n≥n3 bn -q=bn-
an 3 + bn 3 bn − a n 3 bn − bn 3 ε ε/ 2 ε = + > − = 2 2 2 2 2 4
⇒ bn-q>ε/4 ⇒ q
15/ 32
∃ q ∈ Q / 0 < p < y - Si x>0⇒como Q es denso . Como p,q∈Q+ y Q es ∃ q ∈ Q / x < q 0 < np < ny arquimediano ⇒∃n∈N / n·p>q 00 e y >0 ⇒ xy=|x| |y| ⇒ |xy| =|x| |y| -Si x>0 e y>0 ⇒xy=|x|(-|y|) ⇒|xy|=|x| |y| -Si x<0 e y <0 ⇒xy=(-|x|)(-|y|) ⇒|xy|= |x| |y|
16/ 32
-Si x<0 e y>0 ⇒xy=(-|x|)|y| ⇒|xy|=|x| |y| Luego |xy|=|x| |y| ∀x,y∈R 4.4 R es completo. DEF Sea (xn ) una sucesión de números reales. Diremos que (xn ) converge hacia a y se denota por limxn =a, si ∀ε>0 (ε∈R) ∃n0 ∈N / ∀n≥n0 ⇒|xn -a|<ε PROP Todo número x∈R es límite de alguna sucesión de Cauchy de racionales. Dem Sea x=[an ] y (an ) una sucesión racional de Cauchy ((an )∈Sc). Vamos a comprobar que lim an =x. (an )∈Sc ⇒∀ε>0 ∃n0 ∈N / ∀ m,n ≥n0 ⇒ |am-an |ε Si fijamos n≥n0 ⇒ el número real |x-an | viene determinado por la sucesión (|am-an |) que es de Cauchy. Supongamos que lim an ≠x ⇔ ∃ε>0 ∃n1 ∈N / ∀n≥n1 ⇒ |an -x|>ε Como Q es denso en R, ∃q∈Q / ε0 / ∀m≥n2 ⇒ |an - am| -q > k ⇒ |an -am|> q+k Si elegimos n3 =max{n1 ,n2 } ⇒ (an ) no es de Cauchy. CONTRADICCIÓN. La suposición es falsa y por tanto lim an =x, cqd. PROP Toda sucesión de Cauchy de números reales es convergente. Dem Sea (xn ) una sucesión de Cauchy de números reales.∀ε>0 ∃n0 / ∀n,m≥n0 ⇒ |xn -xm|<ε ∀n∈N ∃qn ∈Q / xn -1/n < qn < xn +1/n ya que Q es denso en R. Conseguimos una sucesión (qn ) de números racionales que verifican: 17/ 32
∀m,n≥n0 |qm-qn | = |qm-xm+ xm+ xn - xn +- qn | ≤ ≤ |qm-xm| + |xm-xn | + |xn -qn | < 1/m + ε + 1/n < ε´ Entonces (qm) es de Cauchy. Sea x=[(qn )] |xn -x| ≤ |xn -qn | + |qn-x| < 1/n + ε < ε´´ ⇒(xn ) es convergente y su límite es x ⇒ lim xn =x. PRINCIPIO DE LOS INTERVALOS ENCAJADOS Sea (In ) una sucesión de intervalos encajados (In =[an ,bn ] con In+1 ⊂ In ∀n) cerrados y acotados. Entonces ∏n In ≠∅. Si además |In | =bn -an con lim |In | = 0 entonces existe x∈R / {}∈∏ In Dem Como In+1 ⊂ In ∀n∈N y In =[an ,bn ] ⇒ (an ) es una sucesión de números reales creciente y acotada superiormente por b1 ⇒ ∃lim (an ) = a. Fijamos m∈N / ∀n≥m ⇒ an ≤bn ≤bm ⇒ a≤bm ∀m∈N. (bn ) es una sucesión de números reales decreciente y acotada inferiormente por a1 ⇒ ∃ lim bn = b. Como bm ≥ a ∀m∈N ⇒ b≤a Sea I=[a,b]. Como b≥a ⇒ I≠∅ Es más, podemos afirmar que I⊂ In ∀n∈N ya que an ≤ a≤b≤bn ∀n,m. Entonces I ⊂∏ In y como I≠∅ entonces ∏ In ≠∅. a n ≤ x ≤ bn ⇒ x = a = b Como caso particular, si a=b ⇒ I={a} y si x,y∈∏ In ⇒ a n ≤ y ≤ bn ⇒ y = a = b La intersección por tanto está construida por un sólo punto. TEOREMA DEL EXTREMO Todo subconjunto no vacío de R acotado superiormente tiene supremo. 18/ 32
Dem Sea C ⊂ R con C≠∅. Como C está acotado superiormente, ∃b1 ∈R / b1 es cota superior de C. Podemos encontrar un nº a1 ∈R tal que el intervalo [a1 ,b1 ] verifica: a) Contiene puntos de C. b) b1 es cota superior de C. Dividimos [a1 ,b1 ] en dos nuevos intervalos por su punto medio. A aquella mitad que verifique a) y b) la llamamos [a2 ,b2 ]. a1 + b1 a +b es cota superior de C ⇒ a2 =a1 ⇒ y b2 = 1 1 y si no es 2 2 a +b cota superior ⇒a2 = 1 1 y b2 =b1 ). 2 (Es claro que si
Se verifica que b2 -a2 =
1 1 (b1 -a1 ) y a2 -a1 ≤ (b1 -a1 ). 2 2
Repitiendo el proceso, obtenemos una sucesión de números reales (an ) que verifica |am-an | ≤
1 2 n −1
(b1 -a1 ) ⇒ (an ) es una sucesión de Cauchy.
Como toda sucesión de números reales de Cauchy es convergente tenemos que ∃∈R / lim an = x. Supongamos que x ≠ Sup C. Como también lim bn = x ⇒∃y∈C / x< bn
19/ 32
DEF Un espacio topológico es un par ordenado (X,τ) formado por un conjunto y una topología sobre él. 5.1. Subconjuntos Cerrados de ℜ . DEF Dado A⊂R subconjunto con A≠∅ , diremos que A es cerrado si para cada sucesión (xn ) convergente contenida en A también contiene su límite. OBS El conjunto [a, b) definido como [a,b)={x∈R / a≤xb (Análogamente si x0 ∃n0 ∈N / |xn -x|<ε si n≥n0 , entonces si tomamos ε= d/2 ⇒ ∃n0 ∈N / xn ∈(x-ε, x+ε) si n≥n0 ⇒ xn >b si n≥n0 ⇒ xn ∉[a,b] si n≥n0 !! (contradicción) ⇒[a,b] es cerrado. PROP La unión de dos subconjuntos cerrados es un subconjunto cerrado. Dem Sean A1 y A2 subconjuntos de R cerrados, y sea A=A1 ∪A2 . Sea (xn )⊂A una sucesión convergente, y sea x= lim xn . -Si (xn )⊂A1 ⇒x∈A1 ⊂A -Si (xn )⊂A2 ⇒x∈A2 ⊂A En caso contrario, sea (xnk ) una subsucesión de(xn ) contenida en A1 . Sabemos que x = limk xnk . Como (xnk )⊂A1 convergente y A1 es cerrado ⇒ x∈A1 ⇒ x∈A, y al ser lim xnk = x = lim xn ⇒ (xn )⊂A verifica que x∈A. Por tanto A es cerrado.
20/ 32
Nota: hemos usado que si xn →x entonces xnk → x la demostración se deja como ejercicio al lector. COROLARIO La unión de una familia finita de subconjuntos cerrados es también cerrado. Dem n
Sean A1 , A2 → An subconjuntos de R cerrados y sea A= U Ai . i =1
Sea (xn )⊂A una sucesión convergente y sea x= limn→∞ xn : -Si (xn )⊂A, para algún i⇒x∈Ai por ser cerrado ⇒x∈A⇒A es cerrado. -En caso contrario, sea xnk una sucesión de xn tal que xnk ⊂Ai para algún i ⇒ como limn→∞ xnk =x y Ai es cerrado ⇒x∈Ai ⇒x∈A⇒A es cerrado. OBS La unión infinita de cerrados no es cerrada. Por ejemplo, sean An =[2+1/n, 4- 1/n] ∀n∈N. Entonces Ai=[3,3]⊂A2 =[2´5,3´5]⊂... Como lim(2+1/n)=2 y lim (4- 1/n)=4 ⇒∪An =(2,4). Como (2,4) es un intervalo abierto, el conjunto unión no es cerrado. PROP Sea {Ai / i∈I} una familia (finita o infinita) de conjuntos cerrados en R. Entonces A=∏Ai es cerrado. Dem Sea (xn )⊂A una sucesión convergente con x=limxn . Entonces (xn )⊂Ai ∀i∈N ⇒ x∈ Ai ∀i∈N ya que los Ai son todos cerrados ⇒x∈A ⇒A es cerrado. 5.2 Subconjuntos abiertos de R. DEF Un subconjunto V de la recta real V⊂R diremos que es abierto si su complementario, R-V, es cerrado. PROP (a,b)={x∈R / a
Dem n
n
k =1
k =1
Sea V= IVk . Como R-V= R- IVk siendo R-V=
n
U (R − V
k
) unión de conjuntos
k =1
cerrados ⇒ R-V es cerrado ⇒ V es abierto PROP La unión de una familia de conjuntos abiertos (finita o infinita) es un conjunto abierto. Dem Sea V= ∪Vi ⇒ R-V = R-∪Vi= ∩(R-Vi). Como la intersección de cerrados es cerrada ⇒ R-V es cerrado ⇒V es abierto. OBS El conjunto R y el vacío son abiertos y cerrados, y son los únicos que son de los dos tipos. R es abierto porque ∅ es cerrado y ∅ es abierto porque R es cerrado. Esto no es contradictorio ya que existen conjuntos que no son ni abiertos ni cerrados. COROLARIO Dado τ={A⊂R / a es abierto} es una topología para R. TEOREMA A es abierto ⇔∀x∈A ∃ε>0 / (x- ε,x+ε)⊂A. Dem "⇒" Supongamos que la tesis no es cierta ∃ε>0 / (x-ε,x+ε)⊄A. . Tomemos ε=1 ∃x1 ∈(x-1,x+1) tal que x1 ∉A. Reiterando el proceso para ε= 1/n ∃xn ∈(x-1/n, x+1/n) con xn ∉A. La sucesión (xn )⊂R-A. El conjunto R-A es cerrado. (xn ) es convergente ya que |xn -x|< 1/n ∀n∈N Entonces x∈R-A lo cual es una contradicción y por tanto nuestra suposición es falsa. "⇐" Supongamos que a no es abierto. Entonces R-A no es cerrado ⇒∃(xn )⊂R-A convergente hacia x∉R-A⇒x∈A. Por hipótesis ∃ε>0 / (x- ε, x+ε)⊂A. Por ser (xn ) convergente, dado ese ε>0 22/ 32
∃n0 ∈N / ∀n≥n0 |xn -x|<ε, pero |xn -x|<ε es lo mismo que -ε
23/ 32
TEOREMA (∀U∈Ux ∃n0 ∈N / ∀n≥n0 ⇒ xn ∈U) ⇔ (xn ) converge hacia x. Dem "⇒" ∀ε>0 (x-ε, x+ε)=U∈Ux ∃n0 ∈N / ∀n≥n0 ⇒ xn ∈U = (x-ε, x+ε) y que xn ∈(x-ε,x+ε) es lo mismo que |xn -x|<ε. Luego (xn ) es convergente y tiene por límite x. "⇐" (∀U∈Ux ∃ε>0 (x-ε,x+ε)⊂U y ∃n0 ∈N / ∀n≥n0 |xn -x|<ε y |xn -x|<ε es xn ∈(xn -ε,x+ε)⊂U. DEF Llamamos entorno de centro a y radio r>0 al conjunto E(a,r)={x∈R / a-r
24/ 32
PROP El conjunto V⊂R es abierto ⇔ V=Int(V). Dem "⇒" Por la propia definición de Int(V) se cumple que ∀x∈Int(V)⇒x∈V⇒ ⇒ Int(V)⊆V Como V es abierto ⇒R-V es cerrado, esto quiere decir que cualquier sucesión {xn }⊂R-V que sea convergente cumple que su límite está contenido en R-V. Por lo tanto si x∈V se cumple que ∃ε>0 / (x-ε,x+ε)⊂V, porque de no ser así podríamos establecer una sucesión {xn }⊂ R-V convergente cuyo límite fuese x∉R-V, pero esto es contradictorio con lo anteriormente expuesto, por lo tanto x es un punto interior de V ⇒ x∈Int(V) ⇒ V⊆Int(V) ⇒Int(V)=V. "⇐" Sea {xn }⊂ R-V una sucesión convergente a x. Supongamos que x∈V = Int(V) ⇒ ∃Ux entorno de x tal que Ux ⊂V ⇒ xn ∉Ux ∀n∈N !! (porque el límite de xn es x) ⇒ x∈R-V⇒R-V es cerrado⇒ V es abierto. DEF Sea A⊂R. Diremos que x∈R es adherente al conjunto A si x es límite de alguna sucesión contenida en A. DEF Llamaremos A al conjunto formado por todos los puntos adherentes de a. A ={x∈R / x es adherente a A} PROP Dado A⊂R se verifica que A⊂ A . Dem Dado x∈A sea (xn ) con xn =x ∀n∈N. Trivialmente (xn ) es convergente, lim xn = x y (xn )⊂A. Entonces x∈ A ∀x∈A.
PROP A es cerrado ⇔ A= A . Dem
25/ 32
"⇒" Como ya sabemos, por la proposición anterior, que A⊂ A . Veamos el recíproco: Sea x∈ A ⇒∃{xn }⊂A sucesión convergente a x, pero como A es cerrado ⇒x∈A ⇒A⊂ A , entonces A= A "⇐" Sea {xn }⊂A una sucesión convergente a x. Como x es el límite de una sucesión de términos de A ⇒ x∈ A =A ⇒ x∈A ⇒ A es cerrado. PROP Dados A,B,⊂ R, se verifica 1) A ∪ B = A ∪ B 2) A ∩ B = A ∩ B Dem 1) "⊆" Sea x∈ A ∪ B ⇒∃{xn }⊂A∪B que converge a x. a) Si {xn }⊂A ∀n∈N ⇒x∈ A b) Si {xn }⊂B ∀n∈N ⇒x∈ B c) Si {xn }⊂A∪B ⇒ ∃{xnk }⊂A (por ejemplo) tal que el límite de {xnk } es x ⇒x∈ A ⇒ A ∪ B ⊂ A ∪ B "⊇" Sea x∈ A ∪ B entonces a) Si x∈ A ⇒ ∃{xn }⊂A que converge a x ⇒ {xn }⊂ A∪B ⇒x∈ A ∪ B b) Si x∈ B ⇒ ∃{xn }⊂B que converge a x ⇒ {xn }⊂ A∪B ⇒x∈ A ∪ B ⇒ A∪ B⊂ A∪ B⇒ A∪ B= A∪ B 2) Sea x∈ entonces A ∩ B ⇒ ∃{xn }⊂ A∩B que converge a x, entonces: {x n } ⊂ A ⇒ x ∈ A ⇒x∈ A ∩ B ⇒ A ∩ B ⊂ A ∩ B {x n } ⊂ B ⇒ x ∈ B 26/ 32
OBS La inclusión A ∩ B ⊂ A ∩ B no se verifica. Veámoslo con un ejemplo. Sea A=(1,2) y B=(2,3) ⇒ A =[1,2] y B =[2,3] A ∩ B ={2}, pero A∩B=∅ luego A ∩ B = ∅. Por tanto, no se puede hablar de igualdad. OBS Los puntos adherentes también reciben el nombre de puntos de aglomeración. DEF Sea A⊂R y x∈R. Diremos que x es un punto de acumulación de A si ∀ε>0 el conjunto {a∈A / |x-a|<ε} es infinito. Comentario: el conjunto {a ∈A / |x-a|<ε} es finito si y sólo si ∀ε>0 ∃a∈A / x≠a y |x-a|<ε PROP Todo punto de acumulación es adherente. Dem Sea x∈A un punto de acumulación de A ⇒ ∀ε>0 {a∈A / |x-a| < ε con x≠a} es infinito. Sea ε= 1/n y sea xn ∈A un elemento distinto de x y tal que |x-xn |<ε ∀n∈N ⇒{xn }⊂A y converge a x⇒ x es un punto adherente a A. El recíproco no es cierto. Sea A={1}. Si xn =1 ∀∈N⇒ (xn )⊂A y lim xn =1 ⇒ 1∈ A . Pero 1 no es punto de acumulación ya que el conjunto {a∈A / |1-a|<ε}={1} y no es infinito. DEF Llamaremos puntos aislados a los números reales que son adherentes a un conjunto A⊂R y no son de acumulación en A. DEF Llamaremos conjunto derivado de A⊂R y lo denotaremos por A´, al conjunto A⊂R de los puntos de acumulación de A. PROP El supremo de un conjunto es adherente al conjunto. Dem Sea A⊂R acotado superiormente y x=SupA. -Si x∈A ⇒ x∈ A -Si x∉A Como x=Sup A por definición de supremo, podemos encontrar elementos en A tan próximos a x como queramos. Sea xn ∈A / |xn -x|< 1/n y se verifica que xn
27/ 32
TEOREMA DE BOLZANO – WEIERSTRASS Todo subconjunto A⊂R, infinito y acotado posee al menos un punto de acumulación. Dem A es acotado ⇒ A⊂[a,b] A partir de [a,b] y dividiendo por la mitad, de forma reiterada formamos una sucesión In =[an ,bn ] de intervalos encajados que tienen como característica que todos ellos contienen infinitos puntos. ([a1 ,b1 ] es aquella mitad de [a,b] que contiene infinitos puntos). La sucesión (an ) es de Cauchy y lim an =a ⇒ a es un punto de acumulación de a, a∈A´, ya que dado ε>0 ∃n0 ∈N / ∀n≥n0 se verifica {a n ∈A / |an -a|<ε} es infinito (están todos a partir de n0 ). 5.5 Conjuntos compactos. DEF Sea K⊂R un subconjunto. Diremos que K es compacto si toda sucesión (xn )⊂K posee una subsucesión convergente hacia un x∈K. TEOREMA FUNDAMENTAL Sea K⊂R. K es compacto ⇔ K es cerrado y acotado. Dem “⇒” Probemos que K compacto ⇒ K acotado. Supongamos que K no es acotado. Entonces ∀n∈N se verifica que K⊄[-n,n]. Entonces ∃xn ∈K /xn ∉[- n,+n] ⇒ |xn |≥n ∀n∈N. Tenemos por tanto una sucesión (xn ) de K. Por definición de compacto ∃(xnk )⊂(xn ) con (xnk ) convergente siendo x∈K su límite. Pero eso es falso ya que como |xnk | ≥ nk resulta que (xnk ) no es acotada.
28/ 32
CONTRADICCIÓN. Por tanto, la supresión es falsa y K es acotado. Probemos ahora que K compacto ⇒ K cerrado. Supongamos que K no es cerrado. Entonces ∃(xn )⊂K convergente con lim xn = x y x∉K. Como K es compacto (xnk )⊂ (xn ) convergente, lim xn = y, y ∈K. Sabemos que y=x porque cualquier subsucesión de una sucesión convergente es convergente y con el mismo límite. Luego x = y, x∉K, y∈K. CONTRADICCIÓN. Por tanto la suposición es falsa y K es cerrado. “⇐” Sea (xn )⊂K una sucesión cualquiera. Como K es acotado ⇒ (xn ) es una sucesión acotada. Sea el conjunto A={xn / n∈N}. Sabemos que A⊂K. (A={(xn )}). Como A tiene infinitos elementos y es acotado, por el teorema de Bolzano-Weierstrass, A posee al menos un punto de acumulación. Sea x∈A´. Por definición de punto de acumulación ∃(xnk )⊂A convergente hacia x. Como (xnk )⊂ (xn ) =A∪K y K es cerrado ⇒ x∈K. Luego de una sucesión cualquiera hemos podido extraer una subsucesión convergente a un punto del conjunto ⇒ K es compacto. DEF Sea A⊂R. Llamamos a {Vi : i∈I}, familia de subconjuntos de R, recubrimiento de A si a⊂U{ Vi : i∈I }. Es decir ∀a∈A ∃i∈I / a∈Vi. Si cada Vi es un conjunto abierto, diremos que el recubrimiento es abierto. DEF Llamaremos subrecubrimiento de A, extraído del recubrimiento {Vi : i∈I}, al recubrimiento de A {Vj : j∈H} y H⊂I. Ejemplo: {(-n,n): n∈N} es un recubrimiento de R. TEOREMA DEL RECUBRIMIENTO Sea K⊂R. K es compacto ⇔. De todo recubrimiento abierto de K es posible extraer un subrecubrimiento finito.
29/ 32
Dem “⇒” Sea {Vi : i∈I}recubrimiento abierto de K. Como K es compacto ⇒ K es acotado ⇒ K⊂[a,b]. Supongamos que no es posible extraer un subrecubrimiento finito de K (demostración por reducción al absurdo). Como K ⊂[a,b]⇒[a,b] tampoco se puede recubrir con un recubrimiento finito de {Vi : i∈I}. Al dividir [a,b] en dos mitades iguales, al menos una de las dos no se puede recubrir con un recubrimiento finito. (Si ambas mitades tuvieran un recubrimiento finito, la unión de ambos nos daría un recubrimiento finito para [a,b], lo que no puede ser). Llamemos [a1 ,b1 ] a la mitad que no dispone de recubrimiento finito, tal que [a1 ,b1 ]∩K=∅. Repitiendo el proceso obtenemos una sucesión (In ) con In =[an ,bn ], bn-an = 1 (bn −1 − a n −1 ) , In ∩K≠∅ ∀n∈N y ningún In tiene un recubrimiento finito. Por el 2 principio de los intervalos encajados ∃x∈R / x=∩In . Como In ∩K≠∅ ∀n∈N, sea xn ∈In ∩K. Como xn ,x∈In ∀n ⇒ |xn -x| ≤ (bn -an ) 0
1 (b-a) ⇒ x = lim xn . 2n
Pero (xn )⊂K que es compacto ⇒ (xn )⊂K cerrado ⇒ x∈K. Si x∈K ⇒ ∃i0 ∈I / x∈Vio Vi0 es abierto ⇒ ∃ε > 0 / ( x − ε, x + ε) ⊂ Vio ⇒ Ino ⊂ Vio , lo cual es una Dado ese ε > 0 ∃n0 ∈ N / I no ⊂ ( x − ε, x + ε) contradicción ya que hemos demostrado que Ino está recubierto por un abierto (y por tanto un finito) y por hipótesis no podrá ser. Luego la suposición es falsa y existe un subrecubrimiento abierto y finito K.
30/ 32
“⇐” -K es acotado. Supongamos que K no es acotado. {Vn =(-n,n) / n∈N} es un recubrimiento de R y por tanto de K. Si existiera un recubrimiento finito de K, sea {Vno , Vn1 ,..., Vnk} dicho recubrimiento. Tomamos m=max{ n0 , n1 ,...,nk }⇒ k⊂ Vm = (-m,m) ⇒ K es acotado. Contradicción con nuestra suposición. Entonces es falsa y K es acotado. -K es cerrado. Supongamos que K no es cerrado. ∃(xn )⊂K convergente y x = lim xn tal que x∉K. 1 1 Tomamos Fn =[ x − , x + ] y definimos Vn =R- Fn . n n Los Fn son cerrados ⇒ Vn son abiertos con ∪Vn = R –{x} ⇒ para cada xi≠x ∃n / xi ∈Vn . Como x∉K ⇒ K⊂ R-{x} ⇒ {Vn : n∈N} es un recubrimiento abierto de K. k
Por hipótesis ∃ Vn1 ,Vn2 ,..., Vnk / K⊂ U Vnj = Vm con m=max{n1 ,...,nk }. j=1
Como x = lim xn ⇒∃n0 ∈N / ∀n≥n0 ⇒ |xn -x| < 1/n ⇒ xn ∈ (x–1/n,x+1/n) ⊂Fn . Tomando n´=max{n0 ,m} tenemos que dado n>n´ xn ∉Vn ⇒ xn ∉Vm ⇒ xn ∉K. Contradicción, ya que (xn )⊂K. La suposición es falsa y K cerrado. Por ser K cerrado y acotado ⇒ K es compacto Teniendo en cuenta este teorema podríamos haber dado como definición de conjunto compacto la siguiente: DEF Un conjunto K⊂R es compacto si dado un recubrimiento abierto de K puede obtenerse un recubrimiento finito.
31/ 32
BIBLIOGRAFIA RECOMENDADA. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos. Análisis Matemático. Aut. M. de Guzmán – B. Rubio. Ed. Pirámide. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill. Introducción al Análisis Matemático. Aut. J. M. Ortega. Ed. Labor. Curso de Análisis Matemático I. Aut. E.L. Lima. Ed. Edunsa. Calculus. Aut. M. Spivak. Ed. Reverté.
32/ 32
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 7 APROXIMACIÓN DE NÚMEROS. ERRORES. NOTACIÓN CIENTIFICA. 1. 2. 3. 4. 5.
Introducción. Error Absoluto. Cifras Exactas. Error Relativo. Problema directo e inverso. 5.1. Problema directo. 5.2. Problema inverso. 6. Operaciones con números aproximados. 6.1. Suma de números aproximados. 6.2. Resta de números aproximados. 6.3. Producto de números aproximados. 6.3.1. Producto de un número exacto por otro aproximado. 6.3.2. Producto de dos números aproximados. 6.3.3. Producto de n números aproximados. 6.4. Cociente de números aproximados. 6.4.1. Cociente de un número exacto y otro aproximado. 6.4.2. Cociente de dos números aproximados. 6.5. Potencia de números aproximados. 6.6. Raíces de números aproximados. 7. Notación Científica. Bibliografía Recomendada.
1/22
TEMA 7 APROXIMACIÓN DE NÚMEROS. ERRORES. NOTACIÓN CIENTIFICA. 1. INTRODUCCIÓN. A la hora de realizar operaciones numéricas, nos podemos encontrar con números enteros, racionales y reales no racionales (irracionales). Para mayor comodidad, podemos expresar los números racionales de forma decimal. El problema surge con los números irracionales, ya que no podemos manejarlos al tener infinitos decimales. Es por tanto necesario truncarlos para poder operar con ellos. Pero entonces ya no manejamos los números originales, sino aproximaciones. Por ello, en el resultado final se comete un error. Si a esto añadimos que muchas veces los valores con los que trabajamos provienen de mediciones, el error se va acumulando. El objetivo de la teoría de errores es conocer el error que se comete en un resultado cuando los datos con los que se trabaja se han tomado con una aproximación dada. Y recíprocamente, averiguar la aproximación con la que hay que tomar los datos de una operación para que el error del resultado no exceda de un valor fijado inicialmente. El primero recibe el nombre de problema directo y el segundo de problema inverso. 2. ERROR ABSOLUTO. DEF Llamaremos número exacto a la cifra que representa el valor íntegro o completo de la cantidad. DEF Llamaremos número aproximado al que no es exacto y se emplea para representar a éste. DEF Definimos el error absoluto como la diferencia, en valor absoluto, de un número exacto y su aproximado. Si A es un número exacto y A’ su aproximación ⇒ e=A-A’ siendo e el error absoluto. DEF Diremos que la aproximación A’ de un número exacto A es por defecto si A-A’>0 DEF Diremos que la aproximación A’ de un número exacto A es por exceso si A-A’<0 Obs. Hay que destacar que el error que se comete al aproximar un número exacto nos resulta desconocido, ya que no conocemos el propio número exacto. Resulta, por tanto, necesario acotar el error. DEF Llamamos límite del error absoluto a un número que es una unidad de un orden tal que el error cometido no llegue a valer una unidad de ese orden. Suelen adoptarse como límites de error números de la forma 10n con n entero.
2/22
Ejemplo. Números como e ó π tienen infinitas cifras decimales, y por tanto nos son desconocidos. Como π=3’14159…, el número 3’141 es una aproximación de π. Su error absoluto viene dado por e=3’14159… – 3’141 = 0’00059… El error, como podemos comprobar, también nos es desconocido. Al ser el error positivo, la aproximación es por defecto, y verifica que e<0’001, siendo, por tanto, 0’001 ó 10-3 el límite del error absoluto. DEF Llamaremos grado de aproximación al orden decimal a que corresponde el límite del error absoluto. Ejemplo. Siguiendo con el ejemplo anterior, el grado de aproximación es –3 que corresponde a las milésimas. Si en la expresión decimal de un número se reemplazan las cifras que siguen a una de ellas por ceros, diremos que el número ha sido redondeado al orden de la última cifra conservada. Ejemplo. Dado π=3’141592…, si escribimos 3’141000… el número π ha sido redondeado a las milésimas, ya que la tercera cifra decimal es la última conservada. El redondeo puede ser: a) Por defecto, cuando la última cifra conservada no se modifica. b) Por exceso, cuando la última cifra conservada se incrementa en una unidad, con la consiguiente repercusión en las anteriores (las de su izquierda). c) Al valor más próximo, que será por defecto cuando la última cifra sea inferior a cinco (<5) o por exceso cuando la última cifra sea mayor o igual a cinco (≥5). TEOREMA FUNDAMENTAL. En todo redondeo el error no supera una unidad del orden decimal correspondiente. dem n
∞
j =0
j =1
Sea A el número escrito en forma polinómica como A = ∑ a j ·10 j + ∑ a− j 10− j
3/22
siendo el primer sumatorio la parte entera de A y el segundo la parte decimal. Por comodidad llamaremos E a la parte entera de A. Sea k∈–-{0}. Podemos afirmar que: k
k
j =1
j =1
E + ∑ a− j 10 − j ≤ A < E + ∑ a− j 10− j + 10 − k Lo que hemos hecho es quedarnos con los k primeros decimales de A, que siempre será menor o igual a A, y sumarle 1 al decimal de lugar k, a-k, que dará un número mayor que A. k
El número E + ∑ a− j 10− j es el redondeo por defecto de A. j =1
k A − E + ∑ a− j 10 − j = j =1
∞
∑a
−j
10− j < 10 − k
c.q.d.
j = k +1
k
El número E + ∑ a− j 10− j + 10 − k es el redondeo por exceso de A. j =1
k
∞
E + ∑ a− j 10 − j + 10− k − A = j =1
∑ (10 − a
−j
)10 − j < 10− k
j = k +1
Veamos ahora el caso del redondeo al valor más próximo. Si ak+1 <5, le sumaremos 1 a ak+1 en lugar de al término ak k +1
k +1
j =1
j =1
E + ∑ a− j 10 − j ≤ A < E + ∑ a− j 10 − j + 10− ( k +1) k
∑a
−j
10 − j
j =1
Y restando la expresión a A queda: k +1
A − E − ∑ a− j 10− j < 0 ≤ 5·10− ( k +1 ) j =1
y es claro que 5·10-(k+1)<10-k Si ak+1 ≥5 k +1
k +1
j =1
j =1
E + ∑ a− j 10 − j ≤ A < E + ∑ a− j 10− j
4/22
c.q.d.
Y restando A a la expresión anterior: k +1
E + ∑ a− j 10 − j − A ≤ 0 < 5·10− ( k +1) j =1
siendo 5·10-(k+1) <10-k Por tanto, y resumiendo lo obtenido en los tres casos, al redondear al decimal de lugar k, el error es inferior a 10-k, que es una unidad del orden decimal. 3. CIFRAS EXACTAS. DEF Llamaremos cifras exactas de un nú mero aproximado a las que tiene (enteras o decimales) desde la primera cifra significativa de la izquierda hasta la que da el grado de aproximación inclusive. Notación. La cifra que da el grado de aproximación o límite del error absoluto se suele señalar con un punto encima, sea o no la última de las cifras escritas. DEF Diremos que un número tiene exactas todas sus cifras cuando su error absoluto es inferior a una unidad del orden de la última de ellas. Ejemplo. Sea a=12’123456… un número irracional, del que no conocemos su expresión exacta. Una aproximación por defecto al número a con un error inferior a las diezmilésimas es 12’1234 y otra sería 12’1234111 Ambas tienen 6 cifras exactas (2 cifras enteras y 4 decimales) y se denotan así: •
•
12'123 4 y 12'123 4111 •
Es más, podemos afirmar que el número 12'123 4 tiene exactas todas sus cifras. •
Obs. Dado el número a=0’012345… y una aproximación 0'012 3 33 , según la definición de cifras exactas, el número aproximado tendrá 3 cifras exactas. DEF Llamamos cifras decimales exactas a las cifras que tiene a partir de la coma decimal hasta la que da el grado de aproximación inclusive. Obs. En esta última definición no hacemos referencia a cifras significativas, luego también contaremos los ceros. Ejemplo. •
El número 12'123 4 33 tiene 6 cifras exactas y cuatro cifras decimales exactas. •
El número 0'012 3 33 tiene 3 cifras exactas y 4 cifras decimales exactas.
5/22
Ahora vamos a plantearnos el siguiente problema: Dado un número a del que conocemos una aproximación a’ con cifras exactas e inexactas, obtener otra aproximación con el mismo grado que la anterior pero con todas sus cifras exactas. Se trata, por tanto, de suprimir las cifras inexactas de un número aproximado sin perder el grado de aproximación. Este problema surge debido a que al operar con números aproximados, el resultado sólo vendrá aproximado hasta un orden dado, siendo el resto de las cifras de órdenes inferiores inexactas. Esto conlleva a que se desperdicie tiempo de procesamiento (por ejemplo en los ordenadores) al operar con esas cifras inexactas. PROP Dado a número exacto, sea a’ una aproximación por defecto y a’’ por exceso tales que sus primeras cifras no iguales son consecutivas. Entonces, el número formado por las cifras comunes a a’ y a’’ y la siguiente de a’’ es un valor aproximado de a con todas sus cifras exactas. dem Sea
y sea
n
m
j =1
j =1
a ' = E + ∑ a− j 10− j + b0 10− ( n +1 ) + ∑ b− j 10− ( n +1 + j ) n
m'
j =1
j =1
a ' ' = E + ∑ a− j 10 − j + ( b0 + 1)10− ( n +1 ) + ∑ c− j 10− ( n +1 + j )
Como a’ es una aproximación por defecto y a’’ por exceso, se verifica a’
E+
∑a
− j
10 − j + (b0 + 1)10 − ( n + 1)
j =1
queda: m −1
n m' −( n +1+ j ) −m −j −(n +1) [ ] + 1 ) 10 + 10 − b 10 < a − E + a 10 + ( b + 1 ) 10 < c− j 10−(n +1 + j ) ∑ ∑ −j −m −j 0 j =1 j =1
∑[10− (b j =1
]
Y de ambas desigualdades deducimos: n a − E + ∑ a− j 10 − j + ( b0 + 1)10− ( n +1 ) < 10− ( n +1 ) j =1
6/22
n
El valor aproximado es E +
∑a
− j
10 − j + (b0 + 1)10 − ( n + 1) y tiene todas sus
j =1
cifras exactas. Ejemplo. •
1) Sea a’= 12'123 4 44 una aproximación por defecto de a. Como la aproximación a’ es con un error menor que una diezmilésima, al sumar una diezmilésima a a’ obtenemos una aproximación por exceso, que llamaremos a’’. Entonces: •
•
12'123 4 44 < a < 12'123 5 44 •
Si al número a’ le quitamos las dos últimas cifras inexactas queda 12'123 4 < a •
12'123 4 44 •
Si al número a’’ le quitamos las dos últimas cifras inexactas queda 12'123 5 que •
no sabemos si es mayor o menor que a. Pero como a < 12'123 5 44
se verifica que
•
a < 12'123 6 añadiendo otra diezmilésima. •
•
Así tenemo s que 12'123 4 < a < 12'123 6 Al restar 12’1235 queda − 10 −4 < a − 12'1235 < 10 −4 Entonces a − 12'1235 < 10 −4 •
Luego 12'123 5 es una aproximación del número a hasta el orden de las diezmilésimas con todas sus cifras exactas. •
2) Sea a ' ' = 4'34 5 67 una aproximación por exceso de a. Como el error es menor •
que una diezmilésima, el número 4'34 4 67
es otra aproximación por defecto de a. •
Procediendo análogamente al ejemplo anterior, obtenemos 4'34 5 es una aproximación de a con todas sus cifras exactas. Obs. Hemos de tener en cuenta que al suprimir las cifras inexactas se pierde el sentido de la aproximación, ya que no podemos afirmar si el número obtenido es por defecto o por exceso. Si queremos recuperar dicho sentido, hay que perder un grado en la aproximación. Veamos ahora dos corolarios que justifican lo dicho anteriormente. 7/22
Corolario 1) Si el error absoluto de un valor aproximado por defecto es inferior a una unidad de un cierto orden, se obtiene otro con todas las cifras exactas incrementando en uno la cifra del orden considerado y sustituyendo las siguientes por ceros. 2) Si el error es por exceso, conservando sin alteración las cifras hasta la del orden considerado y sustituyendo las siguientes por ceros. Corolario. Si se desconoce el sentido de aproximación de un valor aproximado con error menor que una unidad de un cierto orden, se obtienen otros dos, con todas sus cifras exactas, conservando hasta la penúltima cifra del orden considerado o aumentando la penúltima en 1 y sustituyendo las siguientes por ceros. 4. ERROR RELATIVO. DEF Se llama error relativo de un número aproximado, al cociente que se obtiene de e dividir el error absoluto, e, por el número exacto, a. Se denota por la letra ε. ε = a La cuantía del error absoluto no mide bien el grado de exactitud del número aproximado. Es por ello que necesitamos del error relativo, que nos da una medida del error absoluto por unidad. Si comparamos el error absoluto con el relativo, observamos que el primero sólo nos dice cual es el error cometido. Pero este valor no nos dice si el error es grande o pequeño. El error relativo establece una comparación entre el error que se comete y el número en el que se comete, pudiendo obtener un valor más exacto sobre la precisión de la medida. El número que nos da el error relativo es desconocido, ya que no conocemos el valor del número a y el valor del error absoluto e. Para poder utilizar dicho error en cálculos, hemos de sustituirlo por un límite superior. El límite superior del error relativo será un valor mayor que el verdadero valor y vendrá dado por una expresión sencilla y fácil de obtener. PROP El error relativo de un número no varía al multiplicar o dividir éste por un número real cualquiera. dem ∀k∈3 ε' =
ke e = =ε ka a
Esta propiedad nos va a permitir hacer enteras todas las cifras exactas de un número aproximado, al multiplicarlo por 10n siendo n el número de cifras decimales exactas, manteniendo el error relativo. Ejemplo.
8/22
Veamos un ejemplo de esto: Número Aproximado
Cifras Exactas
•
Cifras Decimales exactas
3
1'1 2 •
•
ε=
e<10
e<10-3
3
3
0'011 2
-2
2
3
0'11 2
Error Absoluto Error Relativo ε e
ε=
e<10-4
4
ε=
10− 2
=
•
1'1 2 10−3 •
0'11 2 10−4 •
0'011 2
1 112
=
1 112
=
1 112
Como podemos comprobar, el error absoluto depende del número de cifras decimales exactas. En cambio, el error relativo depende únicamente del número de cifras exactas, sin tener en cuenta el punto decimal. 5. PROBLEMA DIRECTO E INVERSO. 5.1. Problema Directo. TEOREMA 1 , a0 ·10 n −1 siendo a0 la primera cifra significativa de la izquierda y n el número de cifras exactas. Un límite superior del error relativo de un número aproximado es ε <
dem e con e el error absoluto y A ε el error relativo. También podemos suponer que todas las cifras exactas de A son 1 enteras, ya que su error relativo sigue siendo el mismo. Entonces e<1 y ε < . A Sea A el número exacto. Entonces sabemos que ε =
∞
Sea A = ∑ a j 10 n −1 − j
(escribimos como exponente n-1-j para que el número A
j =0
tenga n cifras enteras, que son todas exactas). Es claro que a0 10n −1 < A ⇒
1 1 < A a0 10 n −1
⇒ ε<
1 a010 n −1
Obs. A partir de este resultado, para conocer un límite superior del error relativo no es necesario conocer dicho error, sino sólo el número de cifras exactas. Ejemplo. •
Dado el número 7'12 3 45 , calcular un límite superior del error relativo. 9/22
sol Como el número tiene como primera cifra significativa un 7 y 4 cifras exactas, 1 entonces ε < 7·103 Obs. También, el teorema anterior nos sirve para obtener el error relativo a partir del error absoluto. Ejemplo. El número
5 está aproximado con e<10-4. Obtener el límite del error relativo.
sol Sabemos que 5 tiene como primera cifra significativa un 2 y es la única que es entera. Como e<10-4, significa que la aproximación tiene cuatro cifras decimales exactas. Sumando tenemos que la aproximación tendrá cinco cifras exactas. Entonces: ε<
1 2·104
TEOREMA m
Si un límite del error relativo aplicado al número a = ∑ a j ·10m − j es de la forma j =0
ε<
1 , el número podrá tener: b0 ·10 n 1) n cifras exactas si b0 ≤a0 . 2) n+1 cifras exactas si b0 >a0 . dem Sabemos que ε <
e siendo A el número exacto. A
Entonces e=ε·A y como ε <
1 b0 ·10n
⇒ e<
1) Si b0
A b0 ·10n
b0 ·10n = 1 ⇒ Si e<1 es porque el número b0 ·10n
tiene n cifras exactas.
10/ 22
b0 ·10n 2) Si b0 =a0 ⇒ A
b0 ·10 n −1 = 0'1 ⇒ El número tiene n cifras b0 ·10 n enteras más una decimal exactas, es decir (n+1) cifras exactas.
3) Si b0 >a0 ⇒ A
Ejemplo. ¿Con cuántas cifras nos aproximamos al número 4’12345… si ε < ε<
1 ? ¿Y si 5·10 3
1 ? 3·10 4 sol •
1) Como 5>4 (caso b0 >a0 ) será con n+1, es decir 3+1=4 ⇒ a = 4'12 3 •
2) Como 3<4 (b0
1 , entonces el número b0 ·10n
aproximado se calculará con: 1) n+1 cifras exactas si b0 ≤a0 . 2) n+2 cifras exactas si b0 >a0 . siendo a0 la primera cifra significativa del número. dem Sea m el número de cifras exactas del número aproximado. Por el teorema del 1 1 1 1 caso directo tenemos ε < . Si ≤ se verifica que ε < . m −1 m −1 n a0 ·10 a0 ·10 b0 ·10 b0 ·10n Podemos deducir entonces que b0 ·10n ≤ a0 ·10m −1 . Entonces: 1) Si b0 ≤a0 ⇒ n=m-1 ⇒ m=n+1 cifras exactas. 2) Si b0 >a0 ⇒ n+1=m-1 ⇒ m=n+2 cifras exactas.
11/ 22
Obs. El teorema anterior permite pasar del error relativo al número de cifras exactas y de aquí al error absoluto. El teorema del caso directo nos permite pasar del error absoluto al número de cifras exactas y de aquí al error relativo. 6. OPERACIONES CON NÚMEROS APROXIMADOS. 6.1. Suma de Números Aproximados. Lema El error absoluto de la suma de varios números aproximados es la suma de los errores absolutos de cada número. dem Sean los números aproximados Ai+ai con i:1,…,n Con esta notación, Ai es el número exacto y ai el error absoluto. Si ai es positivo, el número aproximado es por exceso y si es negativo es por defecto. Supongamos que todos son por exceso. n
n
n
e = ∑ ( Ai + ai ) − ∑ Ai = ∑ ai i =1
i =1
i =1
Luego el error de la suma es la suma de los errores. Lema Un límite superior del error de la suma de varios números aproximados es la suma de los límites superiores de los errores de cada número. dem Sean Ai+ai con i:1,…,n los números aproximados y ai’ los límites superiores del error de cada número. Se verifica que ai
n
e = ∑ ai < ∑ ai ' i =1
i =1
Obs. Si los límites superiores de cada número son de diferentes órdenes, entonces este resultado no es representativo. Lema Un límite superior del error absoluto de la suma de n números aproximados, es igual al mayor de los límites (grado de aproximación menor) multiplicado por el número de sumandos. dem Sean Ai+ai con i:1,…,n los números aproximados y ai’ los límites superiores. Sea a1 ’ el mayor de los límites superiores (si no lo fuese se reordenan los sumandos).
12/ 22
Entonces a1 ’≤ai’ ∀i:1,…,n n
n
Por tanto e < ∑ ai ' ≤ ∑ a1 ' = n·a1 ' i =1
i =1
A partir de este último lema vamos a obtener una regla práctica para conseguir un límite superior de la suma. Se hará sustituyendo n·a1 ’ por un número mayor. Cambiaremos n por 10 si n<10 (disminuyendo en un orden la aproximación), por 100 si n<100 y en general por 10k si 10k-1≤n<10k . Podemos ahora enunciar la siguiente regla. Regla general para la Suma: El límite superior del error absoluto de la suma de varios números es el mayor de los límites superiores de los sumandos, multiplicados por 10k si el número de sumandos se encuentra comprendido entre 10k-1 y 10k con k∈–. Problema Directo de la Suma: Si tenemos varios números aproximados con órdenes de aproximación distintos cada uno, la suma tendrá k cifras decimales exactas menos que el sumando que tiene menos cifras decimales exactas, siendo el número de sumandos inferior a 10k . Problema Inverso de la Suma: Para obtener la suma de varios números aproximados con error absoluto menor que 10-n, se tomará cada sumando con n+k cifras decimales exactas y se efectúa la suma, obteniéndose un número con n cifras decimales exactas y k inexactas, siendo el número de sumandos inferior a 10k . 6.2. Resta de Números Aproximados. Sea A1 +a1 una aproximación por exceso de A1 y A2 -a2 una aproximación por defecto de A2 . Lema El error absoluto de la diferencia entre A1 +a1 y A2 -a2 es la suma de los errores absolutos de cada número. dem e = [( A1 + a1 ) − ( A2 − a2 )] − [A1 − A2 ] = a1 + a2 Lema El límite superior del error de la resta de dos números aproximados es la suma de los límites superiores de los errores de cada número. dem Si a1
13/ 22
Lema Un límite superior del error absoluto de la resta de dos números aproximados es igual al mayor de los dos límites superiores, multiplicado por 10. dem Supongamos que a1 ’>a2 ’. Entonces: e=a1 +a2
a1 A2 a1 = = ε1 A1 A2 A1
Obs. Si el número A1 +a1 está aproximado por defecto y ε1 ’ es un límite superior de su error relativo, entonces el error relativo del producto ε=ε1 <ε1 ’ tiene como límite superior a ε1 . Problema Directo PROP Sea a0 la primera cifra significativa de la izquierda del número aproximado y p0 la primera cifra significativa del producto. Si el número aproximado A1 +a1 tiene m cifras exactas, el producto tendrá 14/ 22
1) m-1 cifras exactas si a0
n −1
(A1 +a1 ) A2 = p siendo ( ∑ aj ⋅ 10m + j ) ⋅ A2 = ∑ p j ⋅10 n −1− j j =0
Entonces ε ≤
j =0
1 1 ≤ ⇒ a 0 ⋅ 10 m −1 ≥ p0 ⋅10 n −1 m −1 n −1 a0 ⋅ 10 p0 ⋅10
1) Si a0
6.3.2. Producto de dos números aproximados. PROP Un límite superior del error relativo del producto de dos números aproximados es la suma de los limites superiores de los errores relativos de los factores. dem. Sean A1 +a1 y A2 +a2 los dos factores, que vamos a suponer aproximados por exceso. El error absoluto del producto, e, es: e = (A1 +a1 )·(A2 +a2 ) - A1 A2 = a1 A2 +a2 A1 +a1 a2 y el error relativo del producto, å, es: å=
a1 A2 + a 2 A1 + a1 a 2 a1 a2 a1 a 2 = + + ⋅ = ε1 + ε2 + ε1 ⋅ ε2 A1 A2 A1 A2 A1 A2 15/ 22
siendo ε1 el error relativo de A1 + a1 y ε2 el error relativo de A2 + a2 . Sean ε1 ' y ε2 ' límites superiores de ε1 y ε2 respectivamente. 1 Sabemos que ε1 < con a1, 0 la primera cifra significativa de ( A1 + a1 ) y a1, 0 ⋅ 10n −1 n el número de cifras exactas. 1 Y ε2 < con a 2 , 0 la primera cifra significativa de ( A2 + a2 ) y n’ el ' n −1 a2 , 0 ⋅10 número de cifras exactas. El producto de ε1 y ε2 será de un orden decimal bastante menor, de tal manera que si suprimimos el sumando ε1 ⋅ ε2 en å desaparecen unidades de ordenes menores a ε1 y a ε2 . Por otro lado, sabemos que ε1 < ε1 ' y ε2 < ε2 ' . Si sustituimos ε1 por ε1 ' y ε2 por ε2 ' añadimos unidades del mismo orden, con lo cual se verifica que: ε = ε1 + ε2 + ε1 ⋅ ε2 < ε1 ' + ε2 ' Problema Directo PROP Sean ( A1 + a1 ) y ( A2 + a2 ) dos factores aproximados con m cifras exactas cada uno. m −1
m −1
j= 0
j =0
A1 + a1 = ∑ a1 , j ⋅10 m −1 − j y A2 + a2 = ∑ a2 , j ⋅ 10m −1 − j Si p0 es la primera cifra significativa por la izquierda del producto, se verifica: a1, 0 − a2 , 0 ≥ p0 ⇒ n = m a1, 0 + a2 , 0 a − a2 , 0 2) Si 1, 0 < p0 ⇒ n = m − 1 a1, 0 + a2 , 0 1) Si
dem. Sabemos que: ε<
a2 , 0 + a1, 0 1 1 1 1 + ≤ ⇒ ≤ ⇒ m −1 m −1 n −1 m −1 a1 , 0 ⋅ 10 a2 , 0 ⋅ 10 p0 ⋅10 a1 , 0 ⋅ a 2 , 0 ⋅ 10 p 0 ⋅ 10 n −1
⇒ p0 ⋅10 n −1 ≤
a1 , 0 ⋅ a 2 , 0 ⋅ 10 m −1 a2 , 0 + a1, 0
16/ 22
Entonces, 1) Si
a1, 0 ⋅ a2 , 0 ≥ p 0 ⇒ m − 1 = n − 1 ⇒ n = m cifras exactas a1 , 0 + a2 ,0
2) Si
a1, 0 ⋅ a2 , 0 < p 0 ⇒ m − 1 = n ⇒ n = m − 1 cifras exactas a1 , 0 + a2 ,0
Problema Inverso Consiste en hallar el número m de cifras exactas que ha de tener cada factor para que el producto tenga n cifras exactas. PROP Con la notación de la proposición anterior, si el producto de dos números aproximados tiene n cifras exactas, entonces: 1) m = n cifras exactas si
a1, 0 ⋅ a2 , 0 ≥ p0 a1 , 0 + a 2 ,0
2) m = n+1 cifras exactas si
a1, 0 ⋅ a2 , 0 < p0 a1 , 0 + a 2 ,0
dem. Inmediata, a partir de la proposición anterior. 6.3.3. Producto de n números aproximados PROP Dados K factores aproximados Ai + ai i = 1, ...., K, un límite superior del error relativo del producto es la suma de los límites superiores de los errores relativos de los factores. dem. Efectuamos el producto de los dos primeros, el resultado por el tercero, y así sucesivamente. Al aplicar reiteradamente la proposición del caso anterior se obtiene: ' ' ' ε < ε1 + ε2 + .... + εk
17/ 22
Problema Directo PROP Sean (Ai + ai) i = 1, …, K. K números aproximados con m cifras exactas cada uno. Se verifica: 1) n = m si
∏ ai , 0 ≥p ∑ ai, 0 0
2) n = m-1 si
∏ ai ,0
Problema Inverso PROP Si el producto de K números aproximados tiene n cifras exactas entonces: 1) n = m si
∏ ai , 0 ≥p ∑ ai, 0 0
2) m = n+1 si
∏ ai ,0
6.4. Cociente de números aproximados. Como la división de dos números es lo mismo que multiplicar uno de ellos por el inverso del otro, las reglas de la división son las mismas que las del producto. Al dividir dos números que tengan el mismo sentido de aproximación, no conocemos el sentido de aproximación al cociente. Éste sólo se conocerá, y coincidirá con el del dividendo, en caso de que dividendo y divisor tengan sentidos de aproximación diferentes. Al igual que en el producto, vamos a distinguir varios casos. 6.4.1. Cociente de un número exacto y otro aproximado. PROP Un límite superior del error relativo del cociente es el mismo límite superior del error relativo de número aproximado. dem. En la demostración vamos a distinguir dos situaciones: 1) Dividendo A + a aproximado y divisor B exacto. A+a A a + B B = B = a = ε <ε ' ε= a a A A A B B
18/ 22
2) Dividendo A exacto y divisor B-b aproximado. bA A A AB − AB + bA + B( B − b) B ( B − b) b 1 1 ε ε = B −b B = = = = = = b A A A B − b B −1 1 − 1 1 − εb B B B b εb
Luego ε =
εb ' < εb 1 − εb '
Al cambiar el numerador, εb , por el εb lo que hacemos es añadir unidades del mismo orden de εb . Pero al cambiar 1- εb por 1 en el denominador, el denominador sólo disminuye en algún orden menor que εb , luego la desigualdad se verifica y å< εb . Las siguientes proposiciones no las vamos a demostrar, al ser ésta igual a la del producto. PROP Si llamamos a0 a la primera cifra significativa de la izquierda del número aproximado y C0 a la primera cifra significativa del cociente, tendremos que: 1 1 ≤ m −1 a0 ⋅10 C0 ⋅10n −1 siendo m el número de cifras exactas del número aproximado y n las del cociente. ε<
Problema Directo PROP Al dividir un número exacto por otro aproximado, o viceversa, el cociente tendrá: 1) n = m cifras exactas si C0 a0 2) n = m-1 cifras exactas si C0 > a0 PROP Si el cociente tiene n cifras exactas, el número aproximado ha de tener: 1) m = n cifras exactas si C0 a0 2) m = n+1 cifras exactas si C0 > a0 6.4.2. Cociente de dos números aproximados. PROP Un límite superior del error relativo de un cociente de números aproximados es la suma de los límites superiores de los errores relativos de ambos números, dividendo y divisor.
19/ 22
dem. Sean los números aproximados A + a el dividendo y B – b el divisor. Como el error relativo de un número es el cociente del error absoluto del número y el propio número, vamos a calcular el primer error absoluto del cociente: e=
A + a A AB + aB − AB + bA aB + bA − = = B −b B B( B − b) B( B − b)
Por tanto, el error relativo del cociente es: aB + bA e B ( B − b) aB + bA aB b B b 1 1 ε = = = = + = εa ⋅ + = εa ⋅ + = A A 1 A(B − b ) A( B − b) B − b B −b B −b 1 − εb −1 B B εb =
εa ε ε + εb + b = a < ε a ' + ε 'b 1− εb 1 − εb 1− εb
Y la explicación de la desigualdad coincide con la proposición vista en 6.4.1. PROP Si llamamos a0 a la primera cifra significativa del número aproximado que hace de dividendo, b0 a la primera cifra significativa del número aproximado que hace de divisor y c0 a la primera cifra significativa del número aproximado obtenido como cociente, entonces se verifica: ε<
1 1 1 + ≤ m −1 m −1 a0 ⋅10 b0 ⋅10 c0 ⋅10 n −1
siendo m en número de cifras exactas de ambos números aproximados y n las del cociente. Problema Directo PROP Al dividir dos números exactos de m cifras exactas cada uno, el cociente tendrá: 1) n = m cifras exactas si
a0 ⋅ b0 ≥ c0 a0 + b0
2) n = m-1 cifras exactas si
a0 ⋅ b0 < c0 a0 + b0
Problema Inverso 20/ 22
PROP Si el cociente de una división tiene n cifras exactas, entonces ambos números aproximados han de tener: 1) m = n cifras exactas si c 0 ≤
a 0 ⋅ b0 a0 + b0
2) m = n+1 cifras exactas si c 0 >
a 0 ⋅ b0 a 0 + b0
6.5. Potencia de números aproximados. La potencia de un número es un caso particular del producto de m números aproximados, siendo ahora dichos números todos iguales. 1 1 Por tanto, ε < ⋅ m a0 ⋅ 10n −1 así pues, por ejemplo, el cuadrado de un número aproximado tiene como límite superior del error relativo el doble del límite superior del número aproximado. En el caso del cubo de un número aproximado, su límite superior del error relativo es el triple del límite superior del número aproximado. Y así sucesivamente. PROP La potencia m-ésima de un número aproximado tiene como límite superior del error relativo el límite superior del error relativo del número aproximado multiplicado por el factor m. 6.6. Raíces de números aproximados. La raíz m-ésima de un número aproximado se puede escribir como la potencia de 1 exponente del mismo número aproximado. m 1 1 Por tanto, ε < ⋅ m a0 ⋅ 10n −1 Análogamente al caso anterior, podemos afirmar. PROP La raíz m-ésima de un número aproximado tiene como límite superior del error relativo el límite superior del error relativo del número aproximado multiplicado por el 1 factor . m 7. NOTACIÓN CIENTÍFICA. Hemos visto dentro de la teoría de Errores , que desarrollamos en este tema, una serie de símbolos específicos y formas de escribir, que se utilizan asiduamente en cualquier ciencia que haga uso de las técnicas del cálculo numérico. 21/ 22
Estos símbolos nos permiten interpretar correctamente los resultados y homogenizan las diferentes maneras de escribir los datos. Llamaremos notación al simbolismo empleado para expresar una idea de forma mas breve y precisa. Una de las notaciones más importantes y usuales es la basada en las distintas potencias enteras de 10. Si el exponente es positivo (de cero en adelante) obtenemos las unidades, decenas, centenas, millares, etc. Si el exponente es negativo, obtenemos las décimas, centésimas, milésimas, etc. Este tipo de notación descrita que nos permite representar números ya sean exactos o aproximados, la llamaremos Notación Científica. Por convenio, la notación científica consiste en escribir un número como producto de un número decimal cuya parte entera tiene un solo dígito multiplicado por una potencia de 10. La Notación Científica muestra el orden de magnitud y las cifras significativas. Las operaciones descritas en el punto anterior son mucho más fáciles de realizar y también facilita la comparación entre números.
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Edit. Tecnos. Introducción al Análisis Matemático. Aut. J.M. Ortega. Edit. Labor. Cours de Mathematiques Elementaries. Aut. F.M.G.
22/ 22
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 8 SUCESIONES. TÉRMINO GENERAL Y FORMA PROGRESIONES ARITMÉTICAS Y GEOMÉTRICAS. 1. 2. 3. 4. 5.
RECURRENTE.
Sucesiones de Números Reales. Progresiones Aritméticas. Progresiones Armónicas. Progresiones Geométricas. Series Aritméticas y Geométricas. 5.1. Series Aritméticas. 5.2. Series Geométricas. 6. Aplicaciones de las progresiones. 6.1. Cálculo de las fracciones generatrices de números decimales periódicos. 6.2. Aplicaciones de matemática financiera. 7. Progresiones Hipergeométricas. 8. Progresiones Aritmético-Geométricas. Bibliografía Recomendada.
1/19
TEMA 8 SUCESIONES. TÉRMINO GENERAL Y FORMA PROGRESIONES ARITMÉTICAS Y GEOMÉTRICAS.
RECURRENTE.
1. SUCESIONES DE NÚMEROS REALES. A lo largo de este tema vamos a considerar que en conjunto – no contiene al elemento 0. Por tanto –={1, 2, 3, …}. DEF Llamaremos sucesión de Números Reales a toda aplicación f: – → 3. Es claro que a cada número natural i∈– le corresponde una única imagen f(i), ya que en caso contrario f no sería aplicación. Aunque hemos definido como sucesión a la aplicación f, por extensión del lenguaje también llamaremos sucesión al conjunto de las imágenes de f, que mantienen el orden de – inducido por f {f(n)} n∈–. Cada una de las imágenes, f(k), recibe el nombre de término de la sucesión, y también se pueden denotar por ak . Si podemos encontrar una expresión o fórmula que nos permita obtener cualquier término de la sucesión en función de n∈–, se denotará por an y se llamará término general de la sucesión. Ejemplos. 1) Sea f :– → 3 con f (n ) =
f(1)=a1 =1 f(2)=a2 =
an =
1 2
1 n
…
son los términos de la sucesión.
1 1 es el término general de la sucesión y es la sucesión. n n n∈ N
(−1)n 2) Otro ejemplo de sucesión puede ser . Entonces el término general es n n ∈ N n (−1) 1 −1 1 an = y los términos serían − 1, , , ,… n 2 3 4 2n + 1 Si n es par 3) 2 Si n es impar n
2n + 1 n par Entonces an = 2 n impar n
y los términos son 1, 5, 9, 9, 25, 13, …
2/19
Como podemos comprobar en este ejemplo, a veces es necesario más de una fórmula para poder definir la sucesión o término general. Podemos plantearnos la siguiente pregunta ¿Es posible determinar una sucesión a partir de un número finito de sus términos sin conocer el término general? Antes de contestar esta pregunta necesitamos saber que es determinar una sucesión. DEF Una sucesión está definida si y sólo si es posible escribir sus términos en orden hasta el término que se quiera. Intentemos contestar ahora a la pregunta. 1 1 1 , , , ... Para poder afirmar que son sucesión necesitamos conocer la 2 3 4 1 expresión para an . La más intuitiva es a n = , pero ¿es única? n Sean 1,
Si fuese única, la sucesión ya estaría totalmente determinada. Pero resulta que 25 35 5 1 3 an = − n − n2 − n es otra sucesión tal que sus cuatro primeros términos 12 24 12 24 1 1 1 1 también son 1, , , , ... y no es la única. Podemos ver que a n = n n ≤ 4 sería otra. 2 3 4 5 n > 4 Como conclusión, podemos afirmar que a partir de un número finito de términos no podemos obtener el término general de la sucesión. Luego esa manera no nos permite definir una sucesión. Veamos como poder definir una sucesión. a) Conocer el término general. Esta forma es la que hemos visto hasta ahora. Consiste en dar una expresión matemática función n∈–, que permite obtener las imagenes de la función f: – → 3 sustituyendo en dicha expresión n por cualquier número natural. b) Ley de Recurrencia. Consiste en obtener el valor de un término de la sucesión en función del anterior o anteriores. Si el término general depende del anterior, es necesario conocer el valor del primer término de la sucesión, a1 . Si el término depende de los k términos anteriores, la sucesión sólo quedará completamente definida si también conocemos los k primeros términos, a1 , a2 , a3 , …, ak .
3/19
Ejemplos. 1) Sea
a1 = 3 ⇒ a1 =3, a2 =2·3-1=5, a3 =2·5-1=9, … an = 2an −1 − 1
2) Una sucesión muy importante y conocida que sigue una ley de recurrencia es la sucesión de Fibonacci. a1 =1
a2 =1
y
an =an-1+an-2 ∀n≥3
Así, la sucesión de Fibonacci es: 1, 1, 2, 3, 5, 8, 13, 21, … 2. PROGRESIONES ARITMÉTICAS. DEF Diremos que una sucesión de números reales {an }n∈– es una progresión aritmética si la diferencia entre un término de la sucesión y el inmediatamente anterior es un valor constante. De la definición de progresión aritmética obtenemos que la sucesión {an }n∈–: {an }n∈– es una progresión aritmética ⇔ ak+1 -ak = d ∀k∈– El número d recibe el nombre de diferencia de la progresión aritmética. A partir de la definición de progresión aritmética, obtenemos una ley de recurrencia para las mismas. PROP Dada una progresión aritmética de diferencia d, el término general viene expresado por la ley de recurrencia an =an-1 +d dem. Como {an }n∈– es una progresión aritmética de diferencia d ⇒ an+1 -an = d ⇒ ⇒ an+1 =an +d que es lo mismo que an =an-1 +d PROP Toda progresión aritmética de diferencia d tiene como término general an =(n-1)·d+a1 dem. Como an =an-1+d Para n=2 Para n=3 Para n=4 … Para n
a2 = a1 +d a3 = a2 +d = a1 +d+d = a1 +2d a4 = a3 +d = a1 +2d+d = a1 +3d an =an-1+d = a1 +(n-2)·d+d = a1 +(n-1)·d 4/19
Luego an = a1 +(n-1)·d Así pues, podemos determinar completamente una progresión aritmética conociendo el primer término de la sucesión y la diferencia. COROLARIO Dados dos términos cualesquiera, ar y as con r
y
b = a1 – d
nos queda an = a·n+b con a≠0 Un problema que podemos plantearnos es el llamado problema de interpolación. Consiste en intercalar n términos consecutivos entre a y b de tal forma que los n+2 términos formen parte de una progresión aritmética. Los términos que intercalamos entre los extremos a y b reciben el nombre de medios aritméticos. Para resolver este problema, lo único que necesitamos es poder obtener la diferencia d. PROP Dados dos números a y b, si intercalamos n números tal que los n+2 números b−a formen parte de una progresión aritmética, entonces la diferencia es d = n +1 dem. Llamaremos a1 =a y an+2 =b de tal forma que los n términos que intercalamos sean a2 , a3 , …, an+1
5/19
Sabemos que an+2 =a1 +(n+1)·d ⇒ d =
an + 2 − a1 b − a = n +1 n +1
Los medios aritméticos serán a+d, a+2d, a+3d, …, a+nd Otro problema que también podemos plantearnos es el de calcular la suma de un número finito de términos de una progresión aritmética. PROP La suma de dos términos cualesquiera que equidistan de a1 y an es igual a la suma de éstos. dem. Tenemos que demostrar que dado p∈– con 0
n·(a1 + an ) 2
Ejemplo 1) Calcular la suma de los n primeros múltiplos de 3, comenzando en 3. sol Como a1 =3, a2 =6, a3 =9, … ⇒ d=3 y an = 3+(n-1)·3 Sn =
n·( 3 + 3 + ( n − 1)·3) 3n 2 + 3 = 2 2
2) Calcular la suma de los n primeros números impares. 6/19
sol 1, 3, 5, 7, … ⇒ a1 =1 y d=2 ⇒ an = 1+(n-1)·2 = 2n-1 Sn =
n·(1 + 2n − 1) 2n 2 = = n2 2 2
3. PROGRESIONES ARMÓNICAS. DEF Llamaremos progresión armónica a una sucesión de números reales {an }n∈– cuyo término general es de la forma 1 an = con a, b ∈ ℜ y a ≠ 0 an + b Como vemos, una progresión armónica está formada por los recíprocos de una progresión aritmética. Ejemplo 1) a n =
1 n
2) a n =
1 2n + 1
es una progresión armónica con a=1 y b=0
es también una progresión armónica.
4. PROGRESIONES GEOMÉTRICAS. DEF Diremos que una sucesión de números reales {an }n∈– es una progresión geométrica si el cociente entre un término de la sucesión y el inmediatamente anterior es un valor constante. De la definición de progresión geométrica obtenemos que la sucesión {an }n∈–: {an }n∈– es una progresión geométrica ⇔
ak +1 = r ∀k∈– ak
El número r recibe el nombre de razón de la progresión aritmética. Ejemplo. La sucesión 3, 9, 27, 81, …, 3n , … es una progresión geométrica ya que an 3n = n −1 = 3 ⇒ La razón es r=3 an −1 3 Vamos a realizar un estudio similar al ya visto para las progresiones aritméticas. A partir de la definición de progresión geométrica obtenemos una ley de recurrencia para las mismas. 7/19
PROP Dada una progresión geométrica de razón r, el término general viene expresado por la ley de recurrencia an =an-1 ·r dem. Como {an }n∈– es una progresión geométrica de razón r ⇒ ⇒ an+1 =an ·r
an +1 =r ⇒ an
que es lo mismo que an =an-1 ·r
PROP Toda progresión geométrica de razón r tiene como término general an =a1 ·rn-1 dem. Como an =an-1·r Para n=2 Para n=3 Para n=4 … Para n
a2 = a1 ·r a3 = a2 ·r = a1 ·r·r = a1 ·r2 a4 = a3 ·r = a1 ·r2 ·r = a1 ·r3 an =an-1·r = a1 ·rn-2 ·r= a1 ·rn-1
Luego an = a1 ·rn-1 Por tanto, podemos determinar completamente una progresión geométrica conociendo el primer término de la sucesión y la razón. COROLARIO Dados dos términos cualesquiera, ap y a q con p1
La sucesión es divergente. Cada término es mayor (menor) que el anterior si a1 >0 (a1 <0).
2) Si r=1
La sucesión tiene todos sus términos iguales.
8/19
3) Si 0
La sucesión es convergente, y tiene por límite 0. . Cada término es menor (mayor) que el anterior si a1 >0 (a1 <0).
4) Si r=0
La sucesión es la sucesión nula.
5) Si –1
La sucesión es oscilante y con los términos en valor absoluto iguales.
7) Si r<-1
La sucesión es oscilante y divergente, ya que cada término es mayor (en valor absoluto) que el anterior.
En las progresiones geométricas, al igual que en las aritméticas, podemos plantearnos el problema de la interpolación. PROP Dados dos números a y b (a,b∈3 y a≠0) si intercalamos n números tal que los b n+2 números formen parte de una progresión geométrica, entonces la razón es r = n +1 a dem. Sea a1 =a y an+2 =b de tal forma que los n términos que intercalamos sean a2 , a3 , …, an+1 Sabemos que an+2 = a1 ·rn+1 ⇒ r n +1 =
an + 2 a b ⇒ r = n +1 n + 2 = n +1 a1 a a1
Los números que intercalamos reciben el nombre de medios geométricos y son a·r, a·r2 , a·r3 , …, a·rn . Ahora vamos a obtener tanto la suma como el producto de n términos de una progresión geométrica. PROP El producto de dos términos equidistantes de a1 y an es igual al producto de éstos. dem. Tenemos que demostrar que dado p∈– con 0
9/19
a1+ p a1 ·r p = an an − p ·r p
⇒
a1+ p a = 1 ⇒ a1 ·an = a1+p ·an-p an an − p
PROP El producto de n términos consecutivos de una progresión geométrica es igual a la raíz cuadrada de la potencia n-ésima del producto de sus extremos. dem. Sean a1 , a2 , …, an los términos de la progresión geométrica que queremos multiplicar. Pn = a1 ·a2 ·…·an Pn = an ·an-1 ·…·a1 Pn 2 = (a1 ·an )·(a2 ·an-1 )·…·(an ·a1 ) Aplicando la proposición anterior: n
Pn2 = (a1 ·an )
⇒ Pn =
(a1·an )n
PROP La suma de n términos consecutivos de una progresión geométrica es 1− r n S n = a1 · siendo a1 el primero de los términos. 1− r dem. Sean a1 , a2 , …, an los términos de la progresión geométrica que queremos sumar. Sn = a1 +a2 +…+an r· Sn = a2 +…+an +an+1 Sn – r·Sn = a1 – an+1 ⇒ Sn ·(1-r) = a1 – a1 ·rn ⇒ Sn ·(1-r) = a1 ·(1-rn ) ⇒ 1− r n S n = a1 · 1− r COROLARIO La suma de n términos consecutivos de una progresión geométrica de razón r=1 es Sn =n·a1 dem. En este caso, al ser r=1, no nos sirve la proposición anterior, al ser el denominador 0. Sabemos que todos los términos de una progresión geométrica de razón r=1 son iguales. Entonces Sn = a1 +a2 +…+an = n·a1 ⇒ Sn = n·a1 10/ 19
COROLARIO La suma de n términos consecutivos de una progresión geométrica de razón r=-1 es Sn =0 si n es par ó Sn =a1 si n es impar. dem. 1− r n 1 − ( −1) n Sabemos que S n = a1 · ⇒ Sn = a1 · 1− r 2 Si n es par ⇒ (-1)n = 1 ⇒ Sn = 0 Si n es impar ⇒ (-1)n = -1 ⇒ Sn = a1 5. SERIES ARITMÉTICAS Y GEOMÉTRICAS. DEF Llamaremos serie al par ({an }, {Sn }) siendo {an } una sucesión de números reales n
y S n = ∑ ak . k =1
DEF La sucesión {Sn } recibe el nombre de sucesión de sumas parciales de la sucesión {an }. Si la sucesión {an } es una progresión aritmética, entonces la serie se llama serie aritmética. Si la sucesión {an } es una progresión geométrica, entonces la serie se llama serie geométrica. DEF Diremos que la serie({an }, {Sn }) es sumable si la sucesión {Sn } es convergente. ∞
Si {Sn } es convergente, entonces existe S=LimS n y se representa por S = ∑ a n n =1
5.1. Series Aritméticas. Si {an } es una progresión aritmética, entonces Sn =
n·(a1 + an ) 2
PROP Una serie aritmética no es sumable. dem. Para ver si es sumable, vamos a calcular LimS n LimSn = Lim
(a1 + an )·n ( a + a + ( n − 1)·d )·n 2a n + dn2 − dn = Lim 1 1 = Lim 1 = 2 2 2
11/ 19
dn 2 + ( 2a1 − d )·n = Lim =∞ 2 El límite será +∞ si d>0 y será -∞ si d<0 Luego la serie no es sumable al no ser {Sn } convergente. 5.2. Series Geométricas. PROP Una serie geométrica es sumable si r<1. dem. Sea {an } una progresión geométrica y {Sn } la sucesión de sumas parciales de {an }. Para que la serie sea sumable debe existir limS n . 1− r n Como {an } es una progresión geométrica, sabemos que S n = a1 · 1− r 0 ∞ n Lim r = 1 No Existe No Existe
si r < 1 si r > 1 si r = 1 si r < −1 si r = −1
Teniendo en cuenta el Lim rn , podemos calcular el Lim Sn en función del valor que tenga r. 1) Si r<1 ⇒ Lim Sn =
a1 1−r
∞
⇒
∑a
n
=
n =1
a1 1−r
2) Si r<1
⇒ Sn no es convergente ⇒ Lim Sn no es finito
3) Si r=1
⇒ Lim Sn = Lim (a1 ·n) que no es finito
4) Si r<-1
⇒ Sn no es convergente ⇒ Lim Sn no es finito
5) Si r=-1
⇒ Sn no tiene límite, al ser una sucesión oscilante de 0 y a1 .
6. APLICACIONES DE LAS PROGRESIONES. 6.1. Cálculo de las fracciones generatrices de números decimales periódicos. a) Decimal Periódico Puro. Sea el número x = 4'18
12/ 19
Como x=4’1818181818… lo podemos escribir como x = 4 + 0’18 + 0’0018 + 0’000018 + … y es lo mismo que x = 4 +
y por tanto x = 4 +
18 18 18 18 + 4 + 6 + ... + 2 n + ... 2 10 10 10 10
18 1 1 1 · 1 + 2 + 4 + ... + 2 n + ... 2 10 10 10 10
Lo que tenemos en el interior del paréntesis es la suma de una progresión 1 geométrica de razón r = 2 y primer término a1 . 10 Sabemos que la suma de dicha progresión geométrica es: 1 1 102 = = ∑ 2n 1 n = 0 10 1 − 2 99 10 ∞
Por tanto x = 4 +
18 102 · 102 99
⇒
x = 4+
18 414 = 99 99
b) Decimal periódico mixto Sea el número x = 4'18 como x = 4’1888888… lo podemos escribir como x = 4 +0’1 + 0’08 + 0’008 + 0’0008 + … y es lo mismo que x = 4 +
y por tanto x = 4 +
1 8 8 8 + 2 + 3 + ... + n + ... 10 10 10 10
1 8 1 1 1 + 2 ·1 + + 2 + ... + n + ... 10 10 10 10 10
Lo que tenemos en el interior del paréntesis es la suma de una progresión 1 geométrica de razón r = y primer término a1 =1 10 ∞
Sabemos que la suma de dicha progresión geométrica es
Por tanto x = 4 +
1 8 10 1 8 377 + 2· =4+ + = 10 10 9 10 90 90 13/ 19
1 10 1 = = n 9 1− 1 n= 0 10
∑ 10
6.2. Aplicaciones de Matemática Financiera. Los bienes económicos tienen una utilidad que medimos en unidades monetarias (por ejemplo, euros o pesetas). Está claro que esta utilidad es mayor siempre que dispongamos de dicho bien. Es por ello que el tiempo influye en la apreciación positiva o negativa de los bienes económicos. Definimos al capital financiero como la medida de cualquier activo, real o financiero, expresada por su cuantía y por su vencimiento o momento de disponibilidad. Por tanto, representaremos cualquier capital por el par ordenado (C,t) siendo C la cuantía del capital (en unidades monetarias) y t el momento de disponibilidad del capital (en años). En la actividad financiera que se realiza día a día, se efectúan gran cantidad de operaciones con capitales. Los agentes económicos han de disponer de herramientas que les permitan comparar capitales, sustituir varios de ellos por uno sólo equivalente, etc. Las expresiones matemáticas que realizan esa labor son las llamadas Leyes financieras. Podemos distinguir entre leyes de capitalización y de descuento, en función de si necesitamos conocer el valor de un capital actual en el futuro o en el pasado, respectivamente. Son varias las funciones matemáticas que podemos utilizar como leyes financieras. Aquí veremos las leyes sumativas y las leyes multiplicativas. Las primeras se aplican cuando en el intervalo considerado no se acumulan intereses para producir nuevos intereses. Las segundas se utilizan cuando se acumulan los intereses. Como ejemplos tenemos la capitalización simple y el descuento comercial como leyes sumativas, y la capitalización compuesta y el descuento compuesto, como leyes multiplicativas. a) Capitalización Simple. La expresión matemática es
L1 (t) = 1+i·t
donde t es el tiempo en años e i el interés o tanto. Llamaremos montante al capital equivalente a C dentro de t años:
M = C·(1+i·t)
b) Capitalización Compuesta La expresión matemática es
L2 (t) = (1+i) t
Siendo el Montante dentro de t años:
M = C(1+i) t
Ejemplos: 1) Tenemos una persona que alquila un piso durante un año. Cada mes le pagan 500 €más el 5% mensual. ¿Qué cantidad obtendrá al final del año?
14/ 19
El primer mes cobra El segundo mes cobra El tercer mes cobra ... El último mes cobra
500 € = 100(1+0’05(1-1)) 500(1+0’05(2-1)) 500(1+0’05(3-1)) 500(1+0’05(12-1))
En general, el mes t (con t:1,...,12) cobrará at = 500(1+0’05(t-1)) y at = 25t+475 El dinero que obtendrá será a1 +a2 +...+a12 que es la suma de los 12 primeros términos de una progresión aritmética de término general an = 250n+250. Entonces como Sn =
n·(a1 + an ) 12(500 + 800) será S12 = = 7.800 € 2 2
2) Una persona con 55 años decide invertir 5.000€ anuales en un fondo de pensiones al 7’5% de interés anual. Como el dinero no lo puede rescatar hasta los 65 años, ¿Cuánto dinero obtendrá al cabo de esos diez años? Como en este caso los intereses que se obtienen cada año son reinvertibles, hemos de utilizar la ley de capitalización compuesta. Vamos a calcular el dinero que será cada anualidad ingresada dentro de diez años. La primera anualidad será: 5.000(1+0’075)11-1 La segunda anualidad será: 5.000(1+0’075)11-2 ... La décima y última anualidad será: 5.000(1+0’075)11-10 En general, cada anualidad se convierte, dentro de 11-t años en at = 5.000(1+0’075)11-t € El dinero que obtendrá será a1 , a2 , ..., a10 que es la suma de los diez primeros términos de una progresión geométrica de término general bn = 5.000(1’075)n con bi=a11-i. 1− r n 1 − 1'07510 Como S n = a1 · tenemos que S10 = 5.000 = 70.735'44 € 1 − 1'075 1− r 7. PROGRESIONES HIPERGEOMÉTRICAS. DEF Diremos que una sucesión {an }n∈– es una progresión hipergeométrica si el cociente de cada término por el inmediatamente anterior es una expresión de la forma: an +1 a·n + b = an a·n + c
con a,b,c∈3 y
a y c no simultáneamente nulos.
OBS Las progresiones geométricas son un caso particular de las progresiones hipergeométricas ya que se obtienen para a=0, siendo la razón r=b/c.
15/ 19
PROP Dada la sucesión {an } que forma una progresión hipergeométrica, la suma de m términos consecutivos es a ·( m·a + c) − a1 ·c Sm = m +1 a + b −c siendo a1 el primero de ellos. dem. Como {an } es una progresión hipergeométrica, se verifica que
an +1 a·n + b = an a·n + c
Dando a n los valores 1, 2, 3, …, m obtenemos a1 ·(a+b) = a2 ·(a+c) a2 ·(2a+b) = a3 ·(2a+c) … am-1 ·((m-1)·a+b) = am·((m-1)·a+c) am·(m·a+b) = am+1 ·(m·a+c) Sumando miembro a miembro y eliminando los sumandos comunes que figuran en ambos miembros, queda: Sm·(a+b) = Sm·c-a1 ·c+am+1 (m·a+c) Sm·(a+b) –Sm·c = am+1 (m·a+c) – a1 ·c Sm =
am +1 ·( m·a + c) − a1 ·c a + b −c
8. PROGRESIONES ARITMÉTICO-GEOMÉTRICAS. DEF Diremos que una sucesión {an }n∈– es una progresión aritmético-geométrica si el término general es de la forma: an = (a·n+b)·xn donde a,b,x∈3 y tales que a y x no se anulan simultáneamente. OBS Si tomamos a=0 obtenemos una progresión geométrica y si tomamos x=1 obtenemos una progresión aritmética. PROP La suma de m términos consecutivos de una progresión aritmético-geométrica es 1 − xm a· x· − m·x m + b·x· 1 − x m 1− x Sm = 1− x
(
dem.
16/ 19
)
Si la sucesión {an } es una progresión aritmético-geométrica, se verifica que an = (a·n+b)·xn m
m
n =1
n =1
Como Sm = ∑ an = ∑ ( a·n + b)· x n m
m
n =1
n =1
Sm = a·∑ n· xn + b·∑ xn
Entonces
m
m
n =1
n =1
x·S m = a·∑ n·x n +1 + b·∑ x n +1
y
m m Sm − x·Sm = a· ∑ (n· xn − n· xn +1 ) + b·∑ ( x n − x n + 1 ) ⇒ n =1 n =1
Restando tenemos m
m
n =1
n =1
⇒ Sm ·(1 − x ) = a·∑ ( n·x n − n·x n +1 ) + b·∑ ( x n − x n +1 )
(1)
Calculemos aparte ambos sumatorios: m
m
m
n =1
n =1
n =1
∑ (n·x n − n·x n +1) = ∑ n·x n − ∑ n·x n +1 =
(
) (
)
= x + 2 x 2 + 3 x3 + ... + mxm − x 2 + 2 x3 + ... + (m − 1) x m + mx m +1 =
m
∑(x
n
1 − xm = x + x2 + x 3 + ... + x m − mxm +1 = x· − mxm +1 1− x
(2)
− x n +1 ) = ( x − x2 ) + ( x 2 − x3 ) + ... + ( xm − x m + 1 ) = x − x m +1
(3)
n =1
Sustituyendo (2) y (3) en (1) nos queda: 1− xm (1 − x )·Sm = a· x· − mxm +1 + b·( x − x m +1 ) 1− x 1 − xm a· x· − m·x m + b·x· 1 − x m 1− x Sm = 1− x
(
)
Corolario
Si la sucesión {an }n∈– es una progresión aritmético-geométrica con ax + bx(1 − x ) x<1 entonces Lim Sn = (1 − x) 2 17/ 19
dem. Si {an } es una progresión 1− xn a·x· − n·x n + b·x· 1 − x n 1− x Sn = 1− x
(
aritmético-geométrica,
se
verifica
que
)
y como x<1 ⇒ Lim x n = 0 n
1 ax a·x· − 0 + b· x·(1 − 0 ) + bx ax + bx (1 − x) 1− x Por tanto Sn = = 1− x = 1− x 1− x (1 − x) 2 El resultado anterior se puede generalizar de la siguiente forma: DEF Sea {an }n∈– una sucesión. Diremos que es una progresión aritmético-geométrica si su término general es de la forma: an = P(n)·xn donde P(n) es un polinomio de variable natural. Para obtener Sn , se sigue un proceso similar al caso más específico, visto antes. Sólo hay que tener en cuenta que el proceso se reitera tantas veces como indica el grado de P(n). Veámoslo mediante un ejemplo. Ejemplo. Sea an =(2n2 +3)·xn m
m
m
m
n =1
n =1
n =1
n =1
Sm = ∑ an = ∑ ( 2n2 + 3)· x n = 2·∑ n2 x n + 3·∑ x n m
m
m
m
n =1
n =1
n =1
n =1
x·S m = x·∑ an = ∑ ( 2 n2 + 3)· x n +1 = 2·∑ n2 x n +1 + 3·∑ x n +1 m m m Sm ·(1 − x) = 2· ∑ n2 x n − ∑ n 2 x n +1 + 3· ∑ ( x n − xn +1 ) = n =1 n =1 n =1
(
) (
)
= 2· x + 4 x 2 + 9 x 3 + ... + m2 x m − x 2 − 4 x 3 − 9 x 4 − ... − m2 x m +1 + 3· x − x m +1 =
(
)
(
= 2· x + 3x 2 + 5 x 3 + ... + ( 2m − 1) x m − m2 x m +1 + 3 x 1 − x m
)
Luego Sm ·(1 − x ) = 2 x + 2·(3x 2 + 5x 3 + ... + ( 2m − 1) x m ) − 2m2 x m +1 + 3x (1 − x m )
18/ 19
y
x·S m ·(1 − x) = 2·(x 2 + 3x 3 + 5 x 4 + ... + ( 2m − 1) x m +1 − m 2 x m + 2 ) + 3 x 2 (1 − x m ) Restando queda:
Sm ·((1 − x ) − x(1 − x ) ) = 2 x + 2(2 x 2 + 2 x 3 + ... + 2 x m ) − 2( 2m − 1) x m +1 − 2 m2 x m +1 +
(
+ m 2 xm + 2 + 3x 1 − x m − x + x m +1
)
2 1 − x m −1 Sm (1 − x) = 2 x + 2·2 x · − 2 x m +1 2m − 1 + m + m2 x m + 2 + 3 x 1 − x − x m + x m +1 1− x
2
2
(
)
(
)
1 − x m −1 2x + 4x2 · − 2 xm +1 (m2 + 2m − 1) + m2 x m + 2 + 3 x(1 − x )(1 − x m ) 1− x Sm = (1 − x) 2 Si x<1 la serie ({an },{Sn }) es sumable, siendo en este caso concreto 2x + Lim Sn =
4x2 + 3x (1 − x) 2 x (1 − x) + 4 x2 + 3x (1 − x) 2 x(3 x 2 − 4 x + 5) 1− x = = (1 − x ) 2 (1 − x) 2 (1 − x ) 2
BIBLIOGRAFÍA RECOMENDADA. Análisis Matemático I. Aut. J.A. Fernández Viña. Edit. Tecnos. Análisis Matemático. Miguel de Guzmán-B. Rubio. Edit. Pirámide. Curso de Análisis Matemático I. Edit. Edunsa. Lecciones de Cálculo Infinitesimal I. Manuel Franco-Roque Molina. Edit. Universidad de Murcia.
19/ 19
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 9 EL NÚMERO COMPLEJO. APLICACIONES. 1. Introducción. 2. El Cuerpo de los números complejos. 2.1. El grupo aditivo de los números complejos. 2.2. El grupo multiplicativo de los números complejos. 2.3. El cuerpo multiplicativo de los números complejos. 3. Inversión de 3 en ". 4. El espacio vectorial de los números complejos. 5. Representación de un número complejo en forma binaria. 6. Orden en ". 7. Geometrica de los números complejos. El plano complejo. 8. Números complejos conjugados. 9. Valor absoluto en ". 10. Representación de un número complejo en forma polar y trigonométrica. 10.1. Operaciones con números complejos en forma polar y trigonométrica. 11. Aplicaciones de los números complejos. 11.1. Resolución de ecuaciones polinómicas de 2º grado. 11.2. Aplicaciones geométricas. Bibliografía Recomendada.
1/20
TEMA 9 EL NÚMERO COMPLEJO.APLICACIONES. 1. INTRODUCCIÓN. En el tema 1 se definieron los números naturales. En el tema 4 ampliamos a los enteros y en el tema 5 a los racionales. La última extensión la realizamos en el tema 6, construyendo el cuerpo de los números reales. Cada una de las sucesivas ampliaciones surgió porque el conjunto original no era capaz de resolver una determinada ecuación. Ahora nos sucede lo mismo. Partiendo del conjunto de los números reales, nos encontramos que ecuaciones como ésta, x2 +1=0, no tienen solución. Ello es debido a que los números negativos no tienen raíz cuadrada. Podemos generalizar este resultado a: los números negativos no tienen raíz de índice par. Es decir n − m con n par y m positivo. Es claro, ya que si existiera, n − m = k, entonces se debe verificar que (k)n =-m. Y sabemos por la regla de los signos, que la potencia par de un número no es negativa. Hemos de ampliar 3 para que se puedan calcular dichas raíces. Eso nos dará el conjunto de los números complejos. Ya en el siglo XVI se intentó dar una solución a este problema, definiendo el símbolo − 1 , que luego se representaría con la letra i. Al número i se le consideró un número ficticio o imaginario, ya que no se podía calcular. Pero permitía resolver ecuaciones como x2 +1 = 0 dando como resultado que x2 +1 0 (x+i)(x-i), siendo ±i las dos soluciones de la ecuación. Estos números, como +i, -i o también 1+2i, 3-i,... recibieron el nombre de números complejos. Pero no fue hasta el siglo XIX cuando, tanto Gauss como Hamilton, definieron de una forma precisa los números complejos. Se definieron como pares de números reales, (a,b), con una serie de propiedades. 2. EL CUERPO DE LOS NÚMEROS COMPLEJOS. DEF Llamaremos conjunto de los números complejos a " = 3x3. Es decir "={(a,b) / a∈3} 2.1. El grupo aditivo de los números complejos. DEF Definimos en " la operación suma como +: "x"→" ∀(a,b), (c,d)∈ " (a,b)+(c,d) = (a+c, b+d). PROP La operación suma definida anteriormente verifica las siguientes propiedades: i) Asociativa. 2/20
ii) Conmutativa. iii) Elemento neutro. iv) Elemento simétrico u opuesto. Dem i) ∀(a,b), (c,d), (e,f)∈ " [(a,b)+(c,d)]+(e,f) = (a+c, b+d) + (e,f) = ((a+c)+e, (b+d)+f ) = como en 3 se verifica la propiedad sociativa = ( a+(c+e), b+(d,f) ) = (a,b) + (c+e, d+f) = (a,b) + [(c,d)+(e,f)] ii) ∀(a,b), (c,d) ∈3 (a,b) + (c,d) = (a+c, b+d) = como en 3 se verifica la propiedad conmutativa =(c+a, d+b) =(c,d) + (a,b) iii) ∀(a,b)∈ " Sabemos que 0∈3 es el neutro de la suma en 3, ∀x∈3 x+0 = x. Definimos (0,0)∈ ". Comprobamos que es el neutro: (a+b)+(0,0) = a+0,b+0) = (a,b) iv) ∀(a,b)∈ " ⇒a,b∈3 ⇒ ∃-a, -b∈3 / a+(-a) = 0 y b+(-b) = 0. Sea (-a, -b)∈ ". Comprobamos que es el opuesto: Dado (a,b)∈ " ∃(-a,-b)∈ " con (a,b) + (-a,-b) = (a+(-a),b+(-b)) = (0,0). Luego (-a, -b) es elemento opuesto de (a,b). Conclusión: El conjunto " con la operación interna suma definida (",+) tiene estructura de grupo abeliano. Recibe el nombre de grupo aditivo de los números complejos. PROP El grupo abeliano (",+) contiene a (3,+). Dem Sea ϕ:(3,+)→( ",+) con ∀a∈(3,+) ⇒ ϕ(a) = (a,0)
3/20
- ϕ es inyectiva: ϕ(a) =ϕ(b) ⇒(a,0) = (b,0) ⇒ a=b. - ϕ es homomorfismo: ϕ(a+b) = (a+b,0) = (a,0) + (b,0) = ϕ(a) + ϕ(b). Luego (3,+)⊂( ",+). 2.2 El grupo multiplicativo de los números complejos. DEF Definimos en " la operación producto como ·:"x"→" ∀ (a,b), (c,d)∈ " (a,b)·(c,d) = (ac-bd, ad+bc). PROP La operación producto definida propiedades:
anteriormente
verifica
las
i) Asociativa. ii) Conmutativa. iii) Elemento neutro. iv) Elemento simétrico. Dem i) ∀(a,b), (c,d), (e,f)∈ " [(a,b)·(c,d)](e,f) = (ac-bd, ad+bc) = = ( (ac-bd)·e-(ad+bc)f, (ac-bd)f+(ad+bc)e) = = (ace-bde-adf-bcf, acf-bdf+ade+bce) = = (a,b)·(cd-df,cf+de) = (a,b)·[(c,d)·(e,f)] ii) ∀(a,b), (c,d)∈ " (a,b)·(c,d) = (ac-bd, ad+bc) = (ca-db, da+cb) = (c,d)·(a,b) iii) ∀(a,b)∈ " (a,b)·(x,y) = (a,b) ⇒ (ax-by, ay+bx) = (a,b) ⇒
4/20
ax − by = a ⇒ ay + bx = b
siguientes
a 2 x − aby = a 2 2 2 2 2 ⇒ a x+b x = a +b ⇒ x=1. 2 2 aby + b x = b Si x=1 ⇒ ax-by = a ⇒ -by=0 ⇒ b=0 ó y=0. Pero ⇒ ay+bx = b ⇒ ay=0 ⇒ a=0 ó y=0. Por tanto, si (a,b)≠(0,0) ⇒ El neutro es (1,0)∈ ". Por la propiedad conmutativa se verifica (a,b)·(1,0) =(a,b) = (1,0)·(a,b). iv) ∀(a,b)∈ "* ("-* = "-{ (0,0) } ) (a,b)·(x,y) = (1,0) ⇒ (ax-by, ay+bx) = (1,0) ⇒
ax − by = 1 ⇒ ay + bx = 0
a 2 x − aby = a a 2 2 ⇒(a +b )x = a ⇒ x= 2 2 a + b2 aby + b x = 0 ax − by = 1 − abx + b 2 y = −b −b 2 2 ⇒ ⇒ (a +b )y = -b ⇒ y= 2 ay + bx = 0 a + b2 a 2 y + abx = 0 Como (a,b)≠(0,0) ⇒ a2 +b2 ≠ 0. a −b Por tanto el elemento simétrico de (a,b) es 2 , 2 2 2 a + b a +b Conclusión: El conjunto "* con la operación producto, (",·) tiene estructura de grupo conmutativo. ("*,·) recibe el nombre de grupo multiplicativo abeliano de los números complejos. PROP El grupo ("*,·) contiene a (3,·). Dem Sea ϕ:(3*,·)→("*,·) con ∀a∈(3,·) ⇒ ϕ(a) =(a,0). - ϕ es inyectiva: ϕ(a) =ϕ(b) ⇒ (a,0) = (b,0) ⇒a=b. - ϕ es homomorfismo: ϕ(a·b) = (a·b,0) =(a,0) * (b,0) = ϕ(a)·ϕ(b)
5/20
Luego (3*,·) ⊂ ("*,·) 2.3. El cuerpo de los números complejos. Una vez visto que (",+) y ("*,·) tienen estructura de grupo abeliano respecto de sus operaciones, veamos como podemos relacionar la suma y el producto de los números complejos. PROP En " se verifica la propiedad distributiva del producto respecto de la suma. Dem Hemos de probar que ∀(a,b), (c,d), (e,f)∈ " se verifica [(a,b)+(c,d)]·(e,f) = (a,b)·(e,f)+(c,d)·(e,f). Veámoslo: [(a,b)+(c,d)]·(e,f) = (a+c, b+d)·(e,f) = ((a+c)e-(b+d)f, (a+c)f+(b+d)e) = = (ae+ce-bf-df, af+cf+be+de) = (ae-bf, af+be) + (ce-df, cf+de) = =(a,b)·(e,f) + (c,d)·(e,f) Conclusión: Como (",+) es un grupo abeliano, ("*,·) es un grupo abeliano, y se verifica la propiedad distributiva del producto respecto de la suma, podemos afirmar que (",+,·) tiene estructura de cuerpo conmutativo. Diremos que " es el cuerpo de los números complejos. 3. INVERSÓN DE 3 EN " . PROP El cuerpo (",+,·) contiene a (3,+,·). Dem Sea ϕ: 3→" con ∀a∈3 ϕ(a) = (a,0). En dos proposiciones previas ya comprobamos que: - ϕ es inyectiva - ϕ es homomorfismo 1) ϕ(a+b) = ϕ(a)+ϕ(b) 2) ϕ(a·b) = ϕ(a)·ϕ(b) Como ya está visto, no lo vamos a volver a demostrar. 6/20
Como Imϕ = 3x{0}, llamaremos números reales a los números complejos cuya segunda componenete sea nula. Cuando sea al revés, primera componenete nula,diremos que el número complejo es imaginario puro. 4. EL ESPACIO VECTORIAL DE LOS NÚMEROS COMPLEJOS. Ya hemos visto que sobre el conjunto " tenemos definidos dos leyes internas, la suma y el producto. Considerando sólo la primera de ellas, (",+) es un grupo abeliano. Ahora vamos a definir sobre (",+) una ley externa. DEF Definimos sobre " la ley externa, llamada producto por un escalar, como ·: 3x"→" donde ∀x∈3 y ∀(a,b)∈ " x·(a,b) = (x·a, x·b). PROP La operación producto por un escalar definida anteriormente verifica las siguientes propiedades: 1) Distributiva del producto con respecto a la suma. 2) Distributiva de la suma con respecto al producto. 3) Pseudo asociativa. 4) Elemento unidad. Dem 1) ∀x∈3 ∀(a,b), (c,d)∈ " x·[(a,b)+(c,d)]= x·(a+c, b+d)= (x(a+c), x(b+d)) = (xa+xc, xb+xd) = = (xa,xb)+(xc,xd) = x(a,b)+x(c,d) 2)∀x,y∈3 ∀(a,b)∈ " (x+y)·(a,b) = ((x+y)a, (x+y)b) = (xa+ya, xb+yb) = (xa,xb)+(ya,yb)= = x(a,b) + y(a,b) 3) ∀x,y∈3 ∀(a,b)∈ " x·(y·(a,b)) = x(ya,yb) = (x(ya), x(yb)) = ((xy)a, (xy)b) = (xy)(a,b) 4) Dado 1∈3 ∀(a,b)∈ " 1·(a,b) = (1·a,1·b) = (a,b) Las demostraciones están hechas por la izquierda siendo necesario realizarlas también por la derecha. Como son análogas, se omiten.
7/20
Conclusión: El conjunto (",+,·3) posee estructura de espacio vectorial sobre el cuerpo de los reales. Esto da lugar a: PROP " es isomorfo a 32 . Dem Sea ϕ: "→32 . Hemos de demostrar que ϕ es biyectiva.
5. REPRESENTACIÓN BINÓMICA.
DE
UN
NÚMERO
COMPLEJO
EN
FORMA
Hasta ahora hemos estado viendo que los números complejos son de la forma (a,b). Teniendo en cuenta las definiciones de las diferentes operaciones sobre ", El número (0,1)∈ " tiene como cuadrado (0,1)·(0,1) =(-1,0). Por tanto la raíz cuadrada -1, denotaremos por la letra i, (0,1)=i.
− 1 , es (0,1). A ese número imaginario lo
PROP ∀(a,b)∈ ", se puede escribir de forma única como a+bi, considerando que ∀x∈3 x≡(x,0). Dem Dado un complejo cualquiera (a,b) (a,b) = (a,0)+(0,b) = (a,0)+(b,0)(0,1) = a+bi. Y es único, ya que si (c,d) = a+bi ⇒ (c,d) = (a,b) ⇒ c=a y d=b. DEF Dado un número complejo a+bi, diremos que está escrito en forma binómica. DEF Se llama parte real de un número complejo, a+bi, y se denota por Re(a+bi), al número a. Re(a+bi) = a, siendo Re: "→3. DEF Se llama parte imaginaria de un número complejo a+bi, y se denota por Im(a+bi), al número b. Im(a+bi)=b, siendo Im: "→3. 6. ORDEN EN " . PROP " no es un cuerpo ordenado. Dem Supongamos que " fuese un cuerpo ordenado, es decir que existiese ua relación
8/20
de orden total, denotada por<. Entonces, como 0∈" y i∈", por la relación de orden deben ser comparables. Si i>0 ⇒ al multiplicar esa desigualdad por sí misma se obtiene i2 >0 ⇒ ⇒ como i2 =-1, sustituyendo: -1>0 ⇒ si de nuevo multiplicamos esa desigualdad por sí misma (-1)2 >0 ⇒ 1>0. Luego 1>0. (1). Partiendo de la desigualda -1>0, si sumamos a ambos miembros 1∈" se obtiene (-1)+1>0+1 ⇒ 0>1. (2). De (1) y (2) se llega a una contradicción, luego i no es mayor estricto que 0. Entonces si i no es mayor estricto que 0, debe darse i<0 (ya que sabemos i≠0). Comprobémoslo: i<0 ⇒ i2 >0 ⇒ -1>0 ⇒ (-1)2 >0 ⇒ i>0. Pero si -1>0 ⇒(-1)+1 >0+1 ⇒ 0>1. De nuevo llegamos a una contradicción ⇒ i no es menor estricto que 0. Pero si 0 e i no son comparables es porque no tiene una relación de orden con las mismas propiedades que la relación de orden definida en 3. Por tanto, la relación de orden en 3 no se puede extender a ". Sabemos que " y 32 son isomorfos. Entonces podemos definir en " una relación de orden propia del producto cartesiano. DEF Definimos en " la relación ≤ como sigue: ∀(a,b), (c,d)∈ " (a,b)≤(c,d) ⇔ a
9/20
a < c Como (a,b)≤(c,d) ⇒ (1) a = c y b ≤ d
c < a Como (c,d)≤(a,b) ⇒ (2) c = a y d ≤ b Si a
(3)
c < e (c,d)≤(e,f) ⇒ (4) c = e y c ≤ e Distingamos cuatro casos: a) Si a
Si a=c ⇒ "omparamos b y d. Si b
(a,b)
α 0
a
Ahora podemos relacionar los conceptos de módulo y argumento de los vectores en V2 con los números complejos. DEF Dado el número complejo a+bi, llamaremos módulo del número complejo, y se denota por |a+bi|, al número real positivo |a+bi|= a 2 + b 2 . DEF Dado el número complejo a+bi, llamaremos argumento del número complejo al ángulo que forman los vectores u 1 y a u 1 +b u 2 .El argumento está definido módulo 2π, y es único. Se representa por arg(a+bi). 8. NÚMEROS COMPLEJOS CONJUGADOS. Notación: Vamos a representar a los números complejos de la forma z∈" con z=a+bi. 11/ 20
DEF Llamamos conjugado de un número complejo z=a+bi, y se denota por z , al número z =a-bi. PROP La aplicación ϕ:"→" con ϕ(z)= z es un automorfismo que deja invariantes a los elementos de 3. Dem Sean z y z´ números complejos con z=a+bi y z´=a´+b´i. -ϕ es inyectiva: ϕ(z) = ϕ(z´) ⇒a-bi = a´-b´i ⇒ a=a´ y b=b´ ⇒ a+bi =a´+b´i ⇒ z=z´ -ϕ es suprayectiva. Dado c+di∈" como d∈3 ⇒ ∃(-d) opuesto de d ⇒ ϕ(c-di) = c+di. Entonces ϕ es biyectiva. -ϕ es homomorfismo. ϕ(z+z´) = ϕ(a+a´+(b+b´)i) = a+a´-(b+b´)i = a+bi+a´-b´i = z + z´ = ϕ(z)+ϕ(z´) ϕ(z·z´)= ϕ((a+bi)·(a´+b´i)) = ϕ((aa´-bb´)+(ab´+a´b)i) = (aa´-bb´)-(ab´+a´b)i = (aa´-bb´)+(-ab´-a´b)i = (a-bi)·(a´-b´i) = z · z´ = ϕ(z)·ϕ(z´). -ϕ es involutivo (ϕ2 =1ID) ϕ2 (z) = ϕ2 (a+bi) = ϕ(ϕ(a+bi)) = ϕ(a-bi) = a+bi = z. -ϕ deja invariantes los elementos de 3. ∀x∈3 sea x = z = x+0i ϕ(x) = ϕ(x+0i) = x-0i = x ⇒ ϕ(x) = x PROP Se verifica: 1) Re( z ) = Re(z). 2) Im( z ) = -Im(z). 1 3) Re(z) = ( z + z ) . 2
12/ 20
1 4) Im(z) = Im ( ( z + z ) ). 2 Dem Sea z∈" con z=a+bi. 1) Re( z )=a y Re(z)=a ⇒ Re( z )=Re(z) 2) Im( z ) = -b y Im(z)=b ⇒Im( z )=-Im(z) 3)
1 1 1 ( z + z ) = (a+bi+a-bi = ·2a = a=Re(z). 2 2 2
4)
1 1 1 1 ( z − z ) = (a+bi-a+bi) = 2bi=bi ⇒ Im(z) = Im ( z − z ) 2 2 2 2
PROP 1) Un número complejo es real ⇔ z= z 2) Un número complejo es imaginario ⇔z+ z =0. Dem 1) "⇒" Si z es real, ϕ(z)=z ⇒ z =z "⇐" Si z= z ⇒ a+bi = a-bi ⇒ a=a y b=-b ⇒ 2b = 0 ⇒ b=0, luego z=a que es real. 2)"⇒" Si z es imaginario ⇒z=bi ⇒z+ z =bi+(-bi) = 0 "⇐" Si z=a+bi ⇒ z+ z =0 es (a+b)+(a-bi) = 0 ⇒ 2a=0 ⇒a=0⇒z=bi. PROP Los únicos automorfismos de " que dejan invariantes los números reales son la identidad y ϕ. Dem Sea ϕ: "→" un automorfismo de " que deja invariante a 3. Como ϕ es un homormorfismo ϕ(a+bi) = a+bϕ(i). Sabemos que i2 =-1 y como ϕ deja invariantes los números reales, se verifica que ϕ(i2 )=-1. Pero ϕ(i2 ) = ϕi·i)=ϕ(i)·ϕ(i) = ϕ(i)2 Luego ϕ(i)2 =-1 ⇒ ϕ(i)=i ó ϕ(i)=-i. 13/ 20
Si ϕ(i)=i ⇒ ϕ(a+bi) = a+bi ⇒ϕ=1ID Si ϕ(i)=- i ⇒ ϕ(a+bi) = a-bi ⇒ϕ=ϕ PROP z· z =a2 +b2 Dem Sea z=a+bi ⇒z· z = (a+bi)(a-bi)=a2 +b2 +abi-abi = a2 +b2 COROLARIO Dado z=a+bi∈", su inverso es
1 a − bi = 2 z a + b2
Dem 1 z a − bi = = 2 z z· z a + b 2 9. VALOR ABSOLUTO EN " . En el punto 7 hemos definido el módulo de un número complejo z=a+bi como |z|= a 2 + b 2 . PROP |z|= z·z Dem Como z· z =a2 +b2 ⇒ |z|2 =z· z ⇒ |z|= z·z Este resultado lo podríamos haber dado como definición del módulo de z. PROP El valor absoluto definido en " verifica ∀z,z´∈" 1) |z|≥0 2) |z|=0 ⇔ z=0. 3) |z·z´| = |z|·|z´| 4) |z+z´| ≤ |z|+|z´| Dem 1) |z| =
a 2 + b 2 ≥0 ya que sabemmos ∀x∈3 x2 ≥0 14/ 20
2) "⇒" |z|=0 ⇒ |z| 2 =0 ⇒ a2 +b2 =0⇒ a=b=0 ⇒ z=0 "⇐" Si z=0 ⇒ z=0+0i ⇒ |z|= 0 2 + 0 2 =0
( )
3) |z·z´|2 = (z·z´)· z ·z´ = z·z´· z · z´ = z· z ·z´· z´ = |z|2 ·|z´|2 Si |z·z´|2 "|z|2 ·|z´|2 por 1) |zz´| = |z|·|z´| 4) |z+z´|2 =(z+z´)( z ·z´ ) = (z+z´)( z + z´ )=z· z +z· z´ +z´ z +z´ z´ = = |z2 | + |z´|2 +z z´ +z´ z = Si z=a+bi y z´=a´+b´i ⇒zz´ = (a+bi)(a´-b´i) = aa´+bb´-ab´i+a´bi = = (aa´+bb´)+(a´b-ab´) z ·z´= (a-bi)(a´+b´i) = (aa´+bb´)+(ab´-a´b)i Luego z ·z´ = z ·z´ ⇒ z· z´ +z´ z = 2Re(z· z´ ) = |z|2 +|z´|2 +2Re(z· z´ ) ≤ Re(z·z´) ≤ |Re(z·z´)| ≤|z· z ´| = |z|·|z´| ≤ ≤ |z|2 +|z´|2 +2|z|·|z´| = (|z|+|z´|)2 ⇒ |z+z´| ≤ (|z|+|z´|)2 ⇒ |z+z´| ≤ |z|+|z´| Conclusión: El valor absoluto así definido extiende de manera natural el valor absoluto definido en 3. COROLARIO ∀zi∈" con i: 1,...,m se verifica |z1 +z2 +...+zn | ≤ |z1 |+|z2 |+...+|zn | Dem La demostración se realiza por inducción, aplicando el punto 4 de la proposición anterior. PROP El conjunto U={z∈" / |z|=1} es un grupo multiplicativo. Dem Para comprobar que U es un subgrupo de "*, basta ver que ∀z1,z2 ∈U⇒ z1,z2 -1∈U |z1,z2 -1| = | z1 |·
1 =1·1=1 ⇒ z1,z2 -1∈U ⇒ U es un subgrupo de "*. | z2 |
COROLARIO Todo número complejo z∈" puede escribirse como z = |z|·u con u∈U.
15/ 20
10. REPRESENTACIÓN DE UN NÚMERO COMPLEJO EN FORMA POLAR Y TRIGONOMÉTRICA. Cuando vimos la representación geométrica de un número complejo establecimos los siguientes resultados; dado un complejo z= a+bi: 1) z=a+bi se puede escribir como a u 1 +b u 2 . 2) El módulo de z es |z|= a 2 + b 2 . 3) El argumento de z es el ángulo que forman u 1 y a u 1 +b u 2 módulo 2π. PROP Todo número complejo queda completamente determinado por su módulo y su argumento. DEF Diremos que un número complejo z∈", está representado en forma trigonométrica si z=r(cosα+isenα) con r=|z| y α=arg(z). DEF Diremos que un número complejo z∈" está representado en forma polar si z=rα y α=arg(z). Por la proposición anterior, las fórmulas de paso de forma binómica a polar son r= a 2 + b 2 y α=arctg
b a
y las fórmulas de paso de forma polar a binómica. a=r·cosα y b=r·senα 10.1 Operaciones con números complejos en forma polar y trigonométrica. Utilizando la forma trigonométrica de los números complejos, es posible realizar la operación de producto de números complejos sin tener que emplear la fórmula que vimos. Se utiliza la forma polar para que la represntación sea más compacta. a) Producto. PROP Dados z1 y z2 números complejos con z1 =r1α1 y z2 =r2α2 se veerifica que z1 ·z2 = (r1 ·r2 )α1+α2 . Dem Para la demostración usaremos la forma trigonométrica. z1 ·z2 =r1 (cosα 1 +isenα 2 )·r2 (cosα 2 +isenα 2 ) = = r1 r2 (cosα1 · cosα2 - senα1 ·senα 2 +i(cosα 1 · senα 2 + senα 1 · cosα2 )) =
16/ 20
= r1 r2 (cos(α 1 +α2 )+isen(α 1 +α 2 )) = (r1 r2 )α1+α2 . COROLARIO Sean zi∈" con i:1,...,n números complejos con zi=riαi ∀i: 1,...,n. n n Entonces ∏ z i = ∏ ri n . i =1 i =1 ∑ α i i =1
Dem Se demuestra utilizando el método de inducción y aplicando la proposición anterior. b) Potencia. TEOREMA. FÓRMULA DE MOIVRE. Dado z∈" y n∈Z, zn =(rn )nα. Dem Para n∈N ya está demostrado por el corolario anterior. Para n=-1, z-1=
1 z r (cos α − isen α) = = = r −1 (cos α − isenα) = ( r −1 ) −α z z· z r2
Para n<-1 zn =(z-n)-1 con -n∈N ⇒ zn =(z-n)-1=[r-n(cos(-nα)+isen(-nα))]-1= Aplicando el caso anterior: rn (cosnα+isen nα)=(rn )nα c) División. COROLARIO Dados z1 y z2 números complejos con z1 =r1α1 y z2 =r2α2 se verifica que z 1 r1 = . z 2 r2 α1 −α 2 Dem Aplicando la fórmula de Moivre para obtener el inverso de un número complejo. z1 =z1 ·z2 -1= r1α1 ·(r2-1)-α2 = (r1 ·r2 -1)α1-α2 = z2
r1 r2 α1 −α 2
d) Raíces. PROP Sea z=rα un número complejo. Si z´=r´α´ es otro número complejo tal que α + 2 kπ z´= n z entonces r´= n r y α´= . n 17/ 20
Dem Si z´= n z ⇒ z=(z´)n ⇒ rα=(r´α´) ⇒ rα=(r´n )nα´ ⇒ r=r´n y α+2kπ=nα´ ⇒ ecordemos que arg(z) es un valor comprendido entro 0 y 2π módulo 2π. ⇒ r´= n r y α´=
α + 2 kπ . El valor de k varía entre k∈{0,...,n-1} ya que n
Si k=0 ⇒ α´0 =
Si k=n ⇒ α n =
α n
α + 2 nπ α = + 2π . n n
Luego α´0 =α´n .
zi=
Por tanto el número complejo z tiene n raíces n-ésimas y son z1 ,z2 ,...,zn-1 con r α + 2 i π con i:0,1,...,n-1.
( ) n
n
11. APLICACIONES DE LOS NÚMEROS COMPLEJOS. 11.1. Resolución de ecuaciones polinómicas de 2º grado. Toda ecuación polinómica de 2º grado de la forma ax2 +bx+c=0 con a,b,c∈3 puede resolverse formalmente, siendo las soluciones x s =
− b ± b 2 − 4ac . 2a
Si b2 -4ac≥0, las soluciones son reales. Si b2 -4ac<0, hemos de introducir los complejos, siendo las soluciones xs =
− b ± 4 ac − b 2 i . 2a
Si las dos soluciones son complejas, una es la conjugada de la otra. 11.2. Aplicaciones geométricas. Recordemos que existe una aplicación biyectiva entre V2 y ", siendo z=a+bi el vector a u 1 +b u 2 , con { u 1 , u 2 } base ortonormal de V2 . Por tanto, identificaremos los números complejos con vectores de V2 , abusando de la notación.
11.2.1. Traslaciones. Sea v∈" con v=v1 +v2 i. 18/ 20
Definimos ϕv : "→" como ∀z∈" ϕv (z)=z+v. Si z=a+bi ⇒ ϕv (z)=(a+v1 )+(b+v2 )i. Entonces, como ϕv (z)∈ ", ϕv (z)=x+yi y por tanto x = a + v1 y = b + v2 La aplicación ϕv con v∈" recibe el nombre de traslación de "vector v" en el plano complejo. 11.2.2. Giros. Sea U={z∈" / |z|=1}. Tomemos u∈U. Definimos θU : "→" como z∈" θU(z)=U·z Si za+bi=rα y U=1β ⇒ θU(z)=rα+β Se obtiene un número complejo con el mismo módulo. La aplicación θU recibe el nombre de giro de ángulo β(siendo u=1β ). 11.2.3. Homotecias con centro el origen. Sea k∈3*. Definimos ψ k : "→" como ∀z∈" Ψk (z)=k·z. Si z=a+bi y ϕk (z)=x+yi se verifica
x = ka . y = kb
La aplicación ψ k con k∈3* recibe el nombre de homotecia de centro 0 y razón k en el plano complejo. Si componemos ϕv y ψ k en cualquier orden, obtenemos aplicaciones del tipo ∅:"→" con z∈" ∅(z)=kz+w k∈3* y w∈". (ϕv o ψ k )(z) = ϕv (ψk (z)) = ϕv (kz) = kz+v. (ψ k o ϕv )(z) = ψ k (ϕv (z)) = ψ k (z+v) = k(z+v) = kz+kv = kz+w La aplicación ∅ recibe el nombre de homotecia de razón k y centro w(entendiendo por centro w, el afijo del número complejo w). 11.2.4. Semejanzas con centro en el origen. Una semejanza con centro en el origen es la composición de una homotecia con centro en el origen y un giro. 19/ 20
Basta pues componer ϕv y ψ k en cualquier orden, ya que el resultado será el mismo. OBS (ψ kºθv )(z) = k·u·z = (θv ºψk )(z) Y como u=1β y k∈3* ⇒ k·u escrito en forma polar es kβ . Por tanto, si z´=ku ⇒ ψ kºθv = µz´ y µz´: "→" con µz´=z´z. Podemos extender este resultado para obtener una semejanza con origen en un punto arbitrario. Basta componer una semejanza con origen en cero con una traslación de vector v. Dará lugar a una aplicación η: "→" con η(z)=z´·z+v y z´,v∈".
BIBLIOGRAFIA RECOMENDADA. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos. Análisis Matemático. Aut. M. de Guzmán – B. Rubio. Ed. Pirámide. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill. Introducción al Análisis Matemático. Aut. J. M. Ortega. Ed. Labor. Curso de Análisis Matemático I. Aut. E.L. Lima. Ed. Edunsa.
20/ 20
TEMAS DE MATEMÁTICAS (oposiciones de secundaria) TEMA 10 SUCESIVAS AMPLIACIONES DEL CONCEPTO DE NÚMERO. EVOLUCIÓN HISTÓRICA Y PROBLEMAS QUE RESUELVE CADA UNA. 1. Introducción. 2. Desarrollo histórico del concepto de número. 2.1. El Hombre de Cromañon. 2.2. Los Sumerios. 2.3. Los Semitas. 2.4. Los Egipcios. 2.5. Los Griegos. 2.5.1. La Numeración Ática. 2.5.2. La Numeración Jónica o Alfabética. 2.5.3. Aportaciones de los Griegos. 2.6. Los Romanos. 2.7. Los Hebreos. 2.8. Los Chinos. 2.8.1. Sistema Multiplicativo, 2.8.2. sistema Posicional. 2.9. Los Hindúes. 2.10. Los Árabes. 2.11. Los Mayas. 3. Sucesivas ampliaciones del concepto de Número. 3.1. Los Números Naturales. 3.2. Los Números Enteros. 3.3. Los Números Racionales. 3.4. Los Números Reales. 3.5. Los Números complejos.
1/15
TEMA 10 SUCESIVAS AMPLIACIONES DEL CONCEPTO DE NÚMERO. EVOLUCIÓN HISTÓRICA Y PROBLEMAS QUE RESUELVE CADA UNA. 1. INTRODUCCIÓN. Habitualmente, presentamos los diferentes conjuntos de números de una manera didáctica. Construimos los conjuntos y los dotamos de unas propiedades. Luego, planteamos un problema tal que su solución es la construcción de un nuevo conjunto que amplíe el anterior. Comenzamos con el conjunto de los números naturales, que es un semianillo abeliano. La ecuación x+a=b con a>b no tiene solución. Ampliamos con el conjunto de los números enteros, que es un anillo conmutativo con elemento unidad. La ecuación ax=b con a no divisor de b no tiene solución. Aparece el conjunto de los números racionales, que tiene estructura de cuerpo. Y resulta que el número π que todos conocemos, o el número 2 que es la diagonal del cuadrado de lado 1, no están en ese conjunto. Se amplía con los números irracionales, formando el conjunto de los reales. Y por último, este conjunto no soluciona la ecuación x2 +1=0. Realizamos la última ampliación, apareciendo el conjunto de los números complejos. En este tema, vamos a ver la evolución histórica que ha habido del número. Y no coincide con la didáctica. En ambas comenzaremos por el número natural, ya que éste surge debido de la necesidad humana de contar. Desde que el hombre se puede considerar como tal, ha existido dicha necesidad. Pero a partir de aquí todo lo demás es diferente. El número cero surge mucho después que otros, las fracciones aparecen antes que los negativos, etc. Para ver esta evolución histórica, repasaremos los descubrimientos que han realizado las civilizaciones más importantes, en orden cronológico. En la segunda parte del tema trataremos las sucesivas ampliaciones del concepto de número y veremos que problemas resuelve cada una de ellas. 2. DESARROLLO HISTÓRICO DEL CONCEPTO DE NÚMERO. Antiguamente, se definía la matemática como la ciencia del número, la magnitud y la forma. Estos conceptos comenzaron a desarrollarse primero a partir de diferencias y contrastes entre elementos del entorno del hombre primitivo, y luego a partir de semejanzas. El primer procedimiento aritmético de la historia comenzó con el artificio que llamamos correspondencia biunívoca miembro a miembro. Este procedimiento permitía a cualquier persona la posibilidad de comparar dos conjuntos, aunque no tuviesen la misma naturaleza. Se evitaba así contar de forma abstracta, ya que no se sabía. 2.1. El Hombre de Cromañon. Los dedos de la mano pueden utilizarse fácilmente para representar conjuntos de hasta 5 ó 10 elementos (dependiendo de sí se usan una o las dos manos) y hasta 20 añadiendo los dedos de los pies. Cuando los dedos eran insuficientes, se recurrían a otros métodos, como era usar montones de piedras, de conchas o de cualquier otro 2/15
elemento. Los montones eran grupos de cinco o diez piedras, lo cual significaba que empezaban a utilizar, sin saberlo, un sistema quinario o decimal, como consecuencia de contar con una o dos manos. Pero estos montones eran un método efímero de conservar información. Así que comenzaron a realizar muescas en huesos. Está comprobado que el hueso o pedazo de madera tallado, es el método más utilizado en la historia de la contabilidad. Los restos más antiguos datan del 35.000 - 20.000 a.C. Las muescas podían representar un censo de personas, cosas o animales. O estar hechas por un guerrero y representar sus armas. O por un cazador y llevar así la contabilidad de las piezas de caza. 2.2. Los Sumerios. La primera escritura conocida apareció poco antes de finales del IV milenio en el país de Sumer, situado en la baja Mesopotamia, entre las cuencas inferiores de los ríos Tigris y Eufrates. La escritura se realizaba en tablillas de arcilla, que eran el “papel” de la época. Esas tablillas se utilizaban para realizar anotaciones de cantidades asociadas a diversas clases de mercancías, siendo las primeras actas contables que se conocen. Veamos como se realizaban dichos apuntes. Los sumerios contaban utilizando la base 60 (sistema sexagesimal) en lugar de la base quinaria o decimal. Todavía quedan restos de esa base, por ejemplo en la forma de medir un ángulo o en la medida del tiempo. La utilización de la base 60 implicaba el conocimiento de 60 signos y palabras distintas para nombrar a los números del 1 al 60 (todavía no se conocía el cero). Esto se resolvía usando el 10 como unidad auxiliar. Así, se tenían diez palabras para los números del 1 al 10. El sistema da nombre a los múltiplos de 10 hasta el 60 incluido. El 60 implica un nuevo orden. Del 60 se alcanza el 600. Del 600 al 3600. Y así sucesivamente. La forma de obtener las unidades del sistema eran 1 – 10 – 60 (10x6) – 600 (10x6x10) – 3600 (10x6x10x6) – 36000 (10x6x10x6x10)... Pero, ¿Cómo se escribían estos números que ya tenían nombre?. Los sumerios asignaron a cada numero de la serie anterior (1, 10, 60, 600, 3600, 36000, 216000) un símbolo. Al principio, entre los años 3.200 – 3.100 a.C. las cifras se representaban mediante unos símbolos dispuestos verticalmente. A parir de la primera mitad del III milenio a.C. cambiaron a una disposición horizontal. Y en el siglo XXVII a.C. apareció la escritura cuneiforme, debido simplemente a un cambio en el instrumento de escritura. El sistema se basaba en el principio aditivo. Los nueve primeros números naturales se representan repitiendo el signo de la unidad tantas veces como sea preciso; los números 20, 30, 40 y 50 repitiendo el de las decenas; los números 120, 180, etc. repitiendo el signo de la sesentena, y así sucesivamente. Era bastante usual que esta forma de escritura exigiera repeticiones desmesuradas de signos. Así, para representar el número 3599 se empleaban 26 cifras. Por tanto, surgió el método sustractivo, representando, por ejemplo el 9 como 10 – 1. Apareció un nuevo signo que equivalía a nuestro signo menos actual. 3/15
Fig. 1. Evolución gráfica de las cifras de origen sumerio
2.3. Los Semitas. Por semitas, entendemos varios pueblos diferentes, como los acadios, los asirios, los babilonios y otros más. Cuando estos pueblos (por el orden en que los hemos nombrado) llegaron a Sumeria, se produjo un cambio en los sistemas de numeración. Se produjeron tres etapas fundamentales, debido a que los semitas utilizaban un sistema decimal. La primera etapa corresponde a una asimilación por los acadios de la cultura sumeria, adoptando el sistema sexagesimal. En la segunda etapa, se produce la convivencia de los sistemas sexagesimal y decimal. Y en la tercera etapa, se elimina por completo el sistema sexagesimal. A pesar de lo dicho anteriormente, en la época babilónica, los eruditos utilizaban un sistema de numeración posicional muy parecido al nuestro. Sólo se diferenciaba en que la base usada era la 60. Es difícil determinar con precisión cuando se produjo, pero en esta época apareció el primer cero, para significar la ausencia de unidades sexagesimales de cierto rango. Cada vez que faltaba una potencia de 60, representaban mediante este símbolo la ausencia de la misma, en lugar del espacio vacío. El símbolo tenía la significación de vacío, pero todavía no estaba pensado en el sentido de nada.
4/15
2.4. Los Egipcios. Casi al mismo tiempo que en Mesopotamia, los egipcios inventaron un sistema de numeración, hacia el 3.000 a.C. Aunque había contacto con los sumerios, el sistema que se desarrolló no fue tomado de ellos, sino que es autóctono de los egipcios. El sistema es decimal, pudiendo representar números superiores a 106 . De hecho, poseían jeroglíficos para representar el 1 y las seis primeras potencias de 10.
Fig. 2. Cifras fundamentales de la numeración jeroglífica egipcia y variantes
Esta notación era una manera de representar por escrito la forma de contar que tenían desde épocas arcaicas. Consistía en escribir los números por alineación o acumulación de objetos (piedras, conchas, guijarros, etc.) asociados cada uno de ellos al orden de la unidad utilizada.
Fig. 3. Representación de unidades consecutivas de cada orden decimal.
Los hombres de la edad de piedra no representaron las fracciones, ya que no tenían necesidad de ellas. Fue en la edad del Bronce, al adquirir algunos pueblos un nivel cultural más elevado, cuando apareció dicha necesidad. En los jeroglíficos egipcios encontramos inscripciones que representan fracciones unitarias. Las fracciones 5/15
unitarias son aquellas cuyo numerador es 1. Para representarlas se utilizaba un jeroglífico con forma de boca situado encima del número que actúa como denominador. Algunas fracciones, como ½ó ¼, tenían símbolos especiales.
Fig. 4. Ejemplos de Fracciones Egipcias.
En Egipto existía otra notación numérica diferente de la que hemos descrito. Era utilizada por los escribas y se llamaba escritura hierática. Los escribas, desde el principio de las dinastías faraónicas, simplificaron el trazo, dando lugar a signos distintos de los jeroglíficos, con el paso del tiempo. 2.5. Los Griegos. Los griegos emplearon varios sistemas de numeración a lo largo de su historia. Veamos los más importantes. 2.5.1. La Numeración Ática. Este tipo de numeración atribuye un signo gráfico diferente a cada uno de los números 1, 5, 10, 50, 100, 500, 1.000, 5.000, 10.000, 50.000 y emplea el principio de adición.
Fig. 5. Sistema de notación numérica de inscripciones del Ática.
Este sistema presenta una particularidad: exceptuando a la unidad, los símbolos que sirven para representar el 5 y las potencias de 10 corresponden a la inicial del nombre griego que sirve para nombrarlas, o es una combinación de esas letras numerales. Es lo que se llama el principio de acrofonía. Los símbolos 50, 500, 5.000 y 50.000 se denotan mediante signos que siguen el principio multiplicativo. Para quintuplicar una potencia
6/15
de 10 bastaba con incluir el símbolo que representa dicha potencia dentro del símbolo que representa al 5. 2.5.2. La Numeración Jónica o Alfabética. Este sistema de numeración es en base 10 y aditivo. Existen símbolos para las cifras del 1 al 9, del 10 al 90 (sólo múltiplos de 10) y del 100 al 900 (sólo múltiplos de 100). En total son 27 símbolos. Cuando el número a escribir era superior a 1.000, sólo tenían que escribir un número y precederlo del acento. Eso indicaba que dicho número estaba multiplicado por 1.000. Así, se podían representar todos los números inferiores a 10.000 con tan sólo cuatro símbolos. Los 27 símbolos que se usaban correspondían con el alfabeto griego. El alfabeto actual sólo tiene 24 letras, pero se utilizaba el arcaico, que disponía de tres más. 2.5.3. Aportaciones de los Griegos. Los griegos también utilizaban fracciones. Comenzaron, al igual que los egipcios, con fracciones unitarias, escribiendo el número y a continuación un acento o señal diacrítica. Poco después comenzaron a usar fracciones de cualquier tipo. Establecieron la equivalencia de fracciones, a partir de las proporciones. Esto surgió debido al interés de convertir un rectángulo de lados a y b en un cuadrado, para lo que a x se precisaba resolver = x b Uno de los fundamentos del pitagorismo era explicar todas las cosas por medio de las propiedades de los números naturales y de sus razones. Todo esto se vino abajo cuando descubrieron que había elementos, como la diagonal de un cuadrado de lado 1, que no eran medibles. A esos números se les llamó inconmensurables. Posteriormente, Euclides, en el Libro X de Los Elementos realiza una clasificación de los números inconmensurables o irracionales. 2.6. Los Romanos. Las cifras romanas, al igual que algunos sistemas de numeración precedentes, no permitieron a sus usuarios realizar cálculos. Ello es debido a que son abreviaturas destinadas a anotar y retener números. Inicialmente, la numeración romana se regía por el principio de adición. Posteriormente complicaron el sistema introduciendo una regla. Todo signo numérico colocado a la izquierda de una cifra de valor superior se resta. Así consiguieron no repetir más de tres veces el mismo signo. Las cifras romanas nacieron mucho antes que la civilización romana. Provenían de los etruscos, y en general, de pueblos itálicos. Y estas, a su vez, tenían su origen en las griegas.
7/15
Si nos fijamos, la cifra más alta es M que representa 1.000. Para representar números grandes, surgieron varias iniciativas. La que más importancia tuvo fue la que consistía en multiplicar por 1.000 toda expresión numérica que tuviese encima una barra horizontal. 2.7. Los Hebreos. En la época real (s. X-VI a.C.) los hebreos utilizaron las cifras hieráticas egipcias, desde la dominación persa a la época helenística (s. V-II a.C.) fueron las cifras arameas, y durante los primeros siglos de la era cristiana, gran parte de ellos manejaban las letras numerales griegas. Para justificar esos cambios, hemos de saber que el pueblo de Israel, aunque desempeñó un papel de primer orden en la historia de las religiones, ha sufrido durante toda su historia las influencias de sus pueblos vecinos, ya fuesen aliados, huéspedes o conquistadores. 2.8. Los Chinos. En China coexistieron dos esquemas de notación numérica. En el primero de ellos predominaba el principio multiplicativo y en el otro se utilizaba un sistema de notación posicional. 2.8.1. Sistema Multiplicativo. Para expresar los números utilizan un sistema decimal formado por 13 signos que corresponden a las nueve unidades y a las primeras cuatro potencias de 10. A la hora de representar un número, los chinos proceden por adición y multiplicación a la vez. Por ejemplo:
Fig. 7. Representación de un número
Fig. 6. Los 13 signos numéricos chinos.
Debido a la influencia china, los pueblos limítrofes adoptaron sistemas de numeración iguales o muy similares. Entre ellos tenemos a los japoneses, los habitantes del reino de Anam (antiguo Vietnam), etc. Para representar los números grandes, los chinos no necesitaron añadir ningún símbolo nuevo a los trece que ya disponían para poder escribir números hasta 1011 .
8/15
Consistía en considerar la decena de millar como una nueva unidad de cuenta. Así, representaban los números compuestos de la siguiente forma:
Fig. 8. Representación de un número grande compuesto.
2.8.2. Sistema Posicional. Se dispone de documentación de este método del siglo II a.C. Es un sistema análogo a nuestra numeración moderna. Es en base 10 y el valor de sus cifras viene determinado por la posición que ocupan. Se utilizan 18 símbolos, para representar los dígitos del 1 al 9 y los 9 primeros múltiplos de 10. La ausencia de un símbolo para indicar las unidades ausentes podía producir confusión. Inicialmente se dejaban espacios en blanco, pero después se idearon otros métodos. Uno de ellos fue disponer los símbolos en cuadrículas, de tal manera que una cuadrícula vacía significaba ausencia de cifra. Conocían bien las fracciones, siendo capaces de obtener el mínimo común denominador de varias de ellas. Pero tenían preferencia por su escritura decimal. Los números negativos también fueron usados por los chinos, y probablemente sin muchos problemas, ya que estaban acostumbrados a calcular utilizando dos tipos de varillas, unas de color rojo para los positivos y otras de color negro para los negativos. También estudiaron a fondo el número π, dando una aproximación de él que no se vio superada hasta el siglo XV. Fue en el siglo VIII d.C. cuando los sabios chinos introdujeron un signo especial para escribir la ausencia de unidades (representado por un pequeño círculo). La idea, sin lugar a dudas, la tomaron de los matemáticos de la civilización India. Es a partir de este momento cuando comenzaron a representar números fraccionarios e irracionales de una forma similar a la actual occidental. 2.9. Los Hindúes. El sistema de numeración hindú es el que hemos heredado hoy en día. Comenzaron en el siglo III a.C. con nueve cifras, propias de la escritura brahmi. Hasta los siglos VI y VII d.C. el principio de notación numérica fue muy rudimentario. Se trataba de una notación en base decimal en la que utilizaban el principio de adición, atribuyendo un signo gráfico para cada uno de los números siguientes: 1 10 100 1000 10000
2 20 200 2000 20000
3 30 300 3000 30000
4 40 400 4000 40000
5 50 500 5000 50000
9/15
6 60 600 6000 60000
7 70 700 7000 70000
8 80 800 8000 80000
9 90 900 9000 90000
Se cree que el sistema de numeración posicional y el concepto de cero aparecieron en el siglo V d.C. ya que el documento Lokavibhaga (tratado de cosmología) así lo demuestra. De hecho, el propio documento indica que apareció el Lunes 25 de Agosto de 458. Y fue en el año 510 cuando el astrónomo indio Aryabhata inventa una notación numérica que precisa de un conocimiento perfecto del cero y del principio de posicionamiento en base decimal. Esta notación le permite realizar fácilmente raíces cuadradas y cúbicas. En el año 628, el matemático y astrónomo Brahmagupta utiliza asiduamente este sistema de numeración posicional. Describe métodos de cálculo con las 9 cifras y el cero (muy similares a los actuales). Da las reglas algebraicas fundamentales, de números positivos y negativos, en las que el cero está presente como concepto matemático, y define el infinito matemático como el inverso del cero. Fue en este momento cuando se formaliza el uso de los números negativos. En el año 875-876 se realizan las inscripciones de Gwalior. Son inscripciones en piedra propiamente indias donde aparece por primera vez el cero en forma de un pequeño círculo. 2.10.
Los Árabes.
Un siglo después de la muerte del profeta Mahoma, los árabes del Islam habían conquistado un vasto imperio. En el siglo VIII se extendía desde los Pirineos hasta China. Es normal entonces, que un pueblo salido de las arenas del desierto de Arabia, asimilara rápidamente la cultura de los pueblos conquistados. En lo que se refiere a su sistema de numeración, conocieron varios (egipcio, babilonio, griego, etc.) pero terminó imponiéndose el hindú, ya que era mucho más sencillo para escribir y para realizar operaciones que los demás. Fueron ellos los que trajeron al mundo occidental la forma de escritura que tenemos actualmente de los dígitos del 0 al 9. Y esta forma de escritura provenía de la escritura Brahmi.
Fig. 9. Genealogía de nuestros dígitos
10/15
Los primeros en usar esta forma de numeración fueron los árabes orientales, que tenían como capital Bagdad. Gracias a las peregrinaciones a La Meca, alrededor del siglo IX se extendió al resto del Islam, alcanzando el arco mediterráneo. Así fue como entró en Europa el sistema de notación numérica posicional, el cero y las reglas aritméticas con números negativos de los hindúes. 2.11.
Los Mayas.
Los Mayas fueron un pueblo que por su situación no pudieron recibir influencias del resto de las civilizaciones aquí descritas. Los mayas contaban en base 20 debido a la costumbre que habían adquirido de contar no sólo con los dedos de las manos sino también con los de los pies. A pesar de trabajar en base 20, no tenían necesidad de 20 símbolos diferentes. Representaban la unidad mediante un punto y se ayudaban de una barra para representar el cinco. Combinaciones de estos dos elementos generaban los dígitos del 1 al 19.
Fig. 10. Números Mayas.
El sistema de numeración era posicional, escribían de arriba hacia abajo, y tenían una irregularidad: el tercer nivel no correspondía al 202 (=20x20) sino al 360 (=18x20). Sólo sucedía en ese nivel ya que el cuarto y sucesivos era el anterior multiplicado por 20 (así, el cuarto nivel era 360x20=7200). Para el caso en los que faltaba un número en una posición, los especialistas mayas inventaron el cero, y lo representaron mediante una concha o caparazón de caracol. 3. SUCESIVAS AMPLIACIONES DEL CONCEPTO DE NÚMERO. Hasta ahora hemos visto como en las diferentes culturas se formalizó la acción de contar, creando sistemas de numeración. Al final prevaleció el sistema inventado por los hindúes, que consistía en los dígitos del 1 al 9 y otro para el cero siendo un sistema de numeración posicional en base 10. Ahora vamos a ver como surgieron los diferentes conjuntos de números tal cual los conocemos. 3.1. Los Números Naturales. El número natural surge por la necesidad humana de contar. Hemos estado viendo como aparece en las diversas culturas y la forma que tienen de escribirlo. Al final
11/15
prevaleció la hindú, al ser la más sencilla. Pero ese proceso duró varios siglos. Y tardó varios más en introducirse en Europa. El matemático italiano Leonardo de Pisa, conocido como Fibonacci, realiza varios viajes al norte de África y Oriente Próximo y durante estos viajes se inicia en el arte del cálculo por medio de las nueve cifras más el cero, de origen hindú. En el año 1202 publica su tratado Liber Abaci (Tratado del Ábaco) que contribuirá al desarrollo de la aritmética y del álgebra en Europa occidental durante tres siglos. En él afirma: “Es de esta forma, con estas nueve cifras, y con este signo 0, que recibe el nombre de zephirum en árabe, como se escriben todos los números que se quieran”. Casi desde el comienzo de la utilización de las cifras, se sabía sumar y multiplicar, aunque algunos de los diferentes sistemas de numeración antiguos no lo permitieran o no fuese fácil, como el romano. 3.2. Los Números Enteros. Los números enteros surgen por la necesidad de restar dos cantidades. Los griegos ya realizaban esa operación, pero fueron de nuevo los hindúes los que aportaron los números negativos como resultado de operaciones de medida en condiciones absurdas (a-b si a
12/15
Los babilonios fueron los primeros en usar una notación racional para los números fraccionarios, dividiendo la unidad en potencias sucesivas de 60. Los griegos, intentaron elaborar una notación general para cualquier tipo de fracción (no sólo las unitarias), pero su numeración alfabética no era apta, por lo que tuvieron que abandonar dicho intento y adoptar la notación en base 60 de los babilonios (para las fracciones). Hoy en día todavía nos quedan reminiscencias en la forma de medir ángulos o tiempos. La notación moderna de las fracciones se la debemos de nuevo a los hindúes, quienes, con su notación posicional, simbolizaban las fracciones casi como nosotros. Esta notación fue adoptada por los Árabes, quienes introdujeron la famosa barra horizontal para separar numerador y denominador. Cuando se descubrieron las fracciones decimales (las que tienen denominador potencia de 10) se hizo patente la necesidad de prolongar la numeración posicional decimal hindú en el otro sentido (ahora se diría: “a la derecha de la coma”). Así se puede anotar con facilidad todas las fracciones y los números enteros serían un tipo particular de números: los que no poseen cifras significativas a la derecha de las unidades. Este tipo de fracciones ya se usaban en China, en la Arabia Medieval y en la Europa renacentista. En 1579, François Viète, proclama su decidido apoyo a estas fracciones. Fueron Bürgi y Stevin dos matemáticos a caballo entre el siglo XVI y XVII los que contribuyeron al desarrollo y divulgación de las fracciones decimales. Y éste último, en 1585, solicitó el uso de una escala en base 10 para las fracciones, como ya lo estaba para los enteros. Fue precisamente Simon Stevin el primero en franquear el paso decisivo hacia nuestra notación actual escribiendo los números decimales sin denominador, sino que encerraba en un círculo, a continuación de cada dígito, la potencia de 10 que debía llevar como divisor. Así: El número 237’941 lo escribía 237 (0) 9 (1) 4 (2) 1 (3) El suizo Jost Bürgi simplificó la notación, eliminando la mención al orden de las cifras y sustituyéndolo por un circulito situado en la parte superior de las unidades: ο
23 7 941 Y poco tiempo después, el cartógrafo italiano Magini (1555-1617), sustituyó el redondelito por el punto situado entre las unidades y las décimas, que ha perdurado hasta nuestros días. En cuanto a la coma, el primero que la utilizó fue el holandés Willebrod Snellius, a comienzos del siglo XVII. La definición formal de número racional se hizo a partir de la de número entero, pues es de la misma manera. Se definieron como clases de pares de números enteros relacionados mediante una relación de equivalencia que permitía simetrizar el producto, es decir, realizar la división. La relación de equivalencia es (a,b)R(c,d) ⇔ ad = bc a donde (a,b) y (c,d) pertenecen a 9x9 y define el número racional como r = b
13/15
3.4. El Número Real. Desde el siglo VI a.C., los matemáticos griegos habían descubierto que la diagonal de un cuadrado de lado 1 no tiene medida conocida, es decir, es inconmensurable. Fue así como descubrieron los que hoy llamamos números irracionales, aquellos que no son ni enteros ni racionales. Como es natural, este descubrimiento causó consternación entre los pitagóricos, ya que creían que el número rige el universo, pensando sólo en los números enteros y sus combinaciones los racionales. Aunque decidieron no darle publicidad al hallazgo, otros si lo hicieron, dándolos a conocer. Se admitión entonces la existencia de estos números, siendo algunos ejemplos 2 , 5 , 3 10 , π . Estos números formaban una categoría más bien imprecisa, debido a que los sistemas de numeración de la época no resultaban ser los más adecuados. Los europeos, beneficiándose del sistema de numeración posicional hindú de base 10 que habían adoptado fueron capaces de definirlos con precisión: esos números podían expresarse en forma decimal, siendo infinitas las cifras tras la coma, sin que se reprodujeran nunca en el mismo orden. Esa era la diferencia que tenían con los números racionales. A lo largo del siglo XIX se consiguió dar una definición formal de número real. En 1830, Bolzano intentó desarrollar una teoría de números reales como límites de sucesiones de números racionales, aunque no se publicó hasta 1962. Fue en el año 1872 cuando cinco matemáticos (Mèray, Weierstrass, Heine, Cantor y Dedekind) dieron con la definición formal de número real. Mèray definió el limite de una sucesión como un número real. Y demostró que toda sucesión de Cauchy era convergente. Weierstrass separó la definición de número real del concepto de límite y definió los números irracionales de forma general como conjuntos de racionales. Heine y Cantor realizaron trabajos similares a los dos descritos. Un planteamiento completamente distinto fue el desarrollado por Dedekind. Consiguió definir los números reales por medio de cortaduras. Consiste en obtener una partición de los números racionales en dos clases disjuntas, A y B, tales que todo número de la primera clase A es menor que todo número de la segunda clase B. Entonces existe uno y sólo un número real tal que si en A existe máximo o en B mínimo, el número real coincide con el máximo o mínimo y por tanto es racional, y en caso contrario el número real no está ni en A ni en B y es irracional. 3.5. El Número Complejo. El primero en introducir los números complejos es Cardano, que en año 1545 publica su obra Ars Magna, en la que explica como resolver los diferentes casos de ecuaciones cúbicas. Como soluciones a esas ecuaciones obtenía raíces cuadradas negativas que él mismo denominó sofisticas. En su época, los números irracionales habían sido aceptados, ya que se podían aproximar por racionales, los enteros producían más dificultades, pero de pronto se toparon con raíces cuadradas negativas al aplicar las fórmulas de Cardano-Tartaglia para la resolución de dichas ecuaciones cúbicas.
14/15
A través de un ingenioso razonamiento, Bombelli obtiene propiedades de los números complejos conjugados, aunque en ese momento (comtemporáneo de Cardano) no sirvieron de mucho. Desde la época de Albert Girard (1590-1633) ya se sabía que los números reales, positivos, cero y negativos se pueden representar en correspondencia con los puntos de una recta. Wallis sugirió que los números imaginarios puros se podían representar por los puntos de una recta perpendicular al eje de los números reales. Pero fueron Wessel y sobre todo Gauss los que establecieron la correspondencia entre los números complejos y los puntos del plano. En 1777 Leonhard Euler introdujo el símbolo i para representar a − 1 y formuló la expresión e πi + 1 = 0 , donde aparecen los cinco números más importantes de la historia de las Matemáticas. El matemático alemán Carl F. Gauss, en su tesis doctoral de 1799, demostró su famoso teorema fundamental del álgebra, que dice que todo polinomio con coeficientes complejos tiene al menos una raíz compleja. Bibliografía. • • •
Historia de la Matemática. Carl B. Boyer (Alianza Editorial). Historia Universal de las Cifras. Georges Ifrah (Espasa) Elementos de historia de las Matemáticas. N. Bourbaki (Alianza Universidad)
15/15
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 11 CONCEPTOS BASICOS DE LA TEORIA DE CONJUNTOS. ESTRUCTURAS ALGEBRAICAS. 1. Introducción. 2. Conjuntos. 2.1. Operaciones con conjuntos. 2.1.1. Intersección. 2.1.2. Unión. 2.1.3. Complementación. 2.1.4. Diferencia. 2.2. Algebra de Boole de las partes de un conjunto. 3. Producto Cartesiano de Conjuntos. 4. Correspondencias y Relaciones entre conjuntos. 4.1. Correspondencias. 4.2. Relaciones. 4.2.1. Relaciones de Equivalencias. 4.2.2. Relaciones de Orden. 5. Aplicaciones entre Conjuntos. 6. Leyes de Composición. 6.1. Leyes de Composición Interna. 6.2. Leyes de Composición Externa. 7. Estructuras Algebraicas. 7.1. Estructuras Algebraicas con una operación interna. 7.2. Estructuras Algebraicas con dos operaciones internas. 7.2.1. Anillos. 7.2.2. Cuerpos. 7.2.3. Retículos. 7.3. Estructuras Algebraicas con una operación interna y otra externa. 7.3.1. Módulos. 7.3.2. Espacios vectoriales.
1/22
TEMA 11 CONCEPTOS BASICOS DE LA TEORIA DE CONJUNTOS. ESTRUCTURAS ALGEBRAICAS. 1. INTRODUCCIÓN. El precursor de la teoría de conjuntos fue George Cantor (1845-1918). La desarrolló como una rama autónoma de la matemática y le dio el nombre de Mengenlehre (teoría de conjuntos). Cantor definió conjunto como “una colección de objetos determinados y perfectamente diferenciables en nuestra contemplación o en nuestro pensamiento, que constituyen una totalidad”. Esta intuitiva definición de Cantor dio lugar a la aparición de paradojas, que fueron solucionadas por Poincaré. Este puso en evidencia que la raíz de las paradojas que se plantearon estaba en el hecho de que se definía un objeto en términos de una clase de objetos que incluía al propio objeto definido. Una paradoja famosa, planteada por Bertrand Russell fue: “Un barbero ha de afeitar a todos aquellos y sólo a aquellos habitantes del pueblo que no se afeitan a si mismos ¿Ha de afeitarse el barbero a si mismo o no?”. Cualquiera que sea la respuesta se llega a una contradicción. 2. CONJUNTOS. Los conjuntos están formados por colecciones de objetos, atendiendo a la definición de Cantor, y a los objetos los llamo elementos. Notación. Nombraremos a los conjuntos mediante letras mayúsculas y a los elementos con minúsculas. Indicaremos que un elemento a esta o pertenece a un conjunto C y mediante a∈C, y su negación se representa por a∉C. OBS Un conjunto queda completamente definido cuando se conocen todos sus elementos. Y se pueden conocer de dos maneras diferentes: 1) Por extensión, cuando se enumeran todos sus elementos. Por ejemplo A = {a, b, c}. 2) Por Compresión, cuando se da una propiedad que define inequívocamente a los elementos del conjunto. Por ejemplo: A = {;∈–/; mod 2 = 0} DEF
Se define el conjunto vacío, Ø, como un conjunto sin elementos. Ø = {}
DEF Diremos que el conjunto A está incluido en B, o A es subconjunto de B, si todo elementos de A está en B. Lo denotaremos por A⊂B. Es decir: 2/22
A⊂B ⇔ {∀x∈Α ⇒ x∈B} Todo conjunto A tiene dos subconjuntos especiales que llamaremos impropios. Son el conjunto vacío, Ø, y el propio conjunto. DEF
Diremos que B es un subconjunto propio de A si no es vacío B⊂A y B≠A.
PROP Sean A, B y C conjuntos. Se verifican las siguientes propiedades: 1) A⊂A 2) A⊂B y B⊂A ⇔ A = B 3) A⊂B y B⊂C ⇒ A⊂C Dem. La demostración es inmediata a partir de la definición. La propiedad uno recibe el nombre de Reflexiva y la tres de transitiva. La segunda se llama antisimétrica y se utiliza para demostrar la igualdad entre dos conjuntos. DEF Llamaremos conjunto de las partes de A, siendo A un conjunto, al conjunto que tiene por elementos todos los subconjuntos de A, y se denota por P(A). Entonces B∈P(A) ⇔ B⊂A 2.1. Operaciones con conjuntos. Sea u un conjunto, que llamaremos universal. Consideraremos P(u). 2.1.1. Intersección. DEF Sean A y B dos conjuntos tales que A, B ∈ P(u). Definimos la intersección de A y B como el conjunto formado por los elementos comunes a A y B. Se representa por U. ∈u
AUB = {x /x∈A y x∈B} PROP La operación de intersección definida anteriormente, verifica las siguientes propiedades ∀Α, B, C ∈ P(u). 1) Idempotente:
A∩A = A
2) Conmutativa:
A∩B = B∩A
3) Asociativa:
(A∩B)∩C = A∩(B∩C)
4) Elemento Neutro U: A∩U = A 5) Elemento Absorbente Ø: A∩Ø = Ø
3/22
DEF Dados A y B que pertenecen a P(u), diremos que son disjuntos si su intersección es vacía. Es decir, A y B son disjuntos si A∩B = Ø. 2.1.2. Unión. DEF Sean A y B dos conjuntos tales que A, B ∈ P(U). Definimos la unión de A y B como el conjunto formado por los elementos que pertenecen al menos a uno de los dos conjuntos. Se representa por ∪. A∪B = {x∈U/x∈A ó x∈B} PROP La operación de unión definida anteriormente verifica las siguientes propiedades ∀A, B, C ∈ P(U): 1) Idempotente:
A∪A = A
2) Conmutativa: A∪B = B∪A 3) Asociativa:
(A∪B)∪C = A∪(B∪C)
4) Elemento neutro, Ø: A∪Ø = A 5) Elemento Absorbente, U: A∪U = U
2.1.3. Complementación. DEF Sea A∈P(U). Llamaremos complemento de A respecto de U, y lo denotaremos por A o Ac, al conjunto Ac = {x∈U/x∉A} PROP La operación de complementación definida anteriormente verifica las siguientes propiedades ∀Α, B, C ∈ P(U). 1) A∪Ac = U y
A∩Ac = Ø
2) Øc = U y Uc = Ø 3) (Ac)c = A 4) A ⊂ B ⇒ Bc ⊂ Ac 5) Leyes de Morgan: (A∪B)c = Ac ∪Bc y (A∩B)c = Ac∩Bc
2.1.4. Diferencia. DEF Sean A y B dos conjuntos tales que A, B ∈ P(U). Definimos la diferencia de A menos B al conjunto formado por los elementos de A que no están en B. 4/22
A – B = {x∈A/x∉B} DEF Sean A y B dos conjuntos tales que A, B ∈ P(U). Definimos la diferencia simétrica de A y B al conjunto formado por los elementos que pertenecen a A o a B pero no a ambos. Se representa por ∆ A ∆ B = {x∈A∪B/ x∉A∩B} PROP A ∆ B = (A – B) ∪ (B – A) 2.2. Algebra de Boole de las partes de un conjunto. PROP Se verifica: 1) Leyes de Absorción: ∀Α, B∈ P(U) a) A∪(A∩B) = A b) A∩(A∪B) = A 2) Propiedades distributivas: ∀A, B, C ∈ P(U) a) A∩(B∪C) = (A∩B) ∪ (A∩C) b) A∪(B∩C) = (A∪B) ∩ (A∪C) DEF El conjunto P(U) con las operaciones de unión e intersección tiene estructura de Algebra de Boole. 3. PRODUCTO CARTESIANO DE CONJUNTOS. DEF Definimos par ordenado como el objeto matemático formado por dos elementos u objetos en un orden determinado. Se denota por (a, b). Los elementos a y b reciben el nombre de componentes o coordenadas del par (a, b). (a, b) = (x, y) ⇔ a = x
y b=y
Podemos generalizar la definición anterior a n elementos. DEF Definimos la ;- tupla ordenada por (x1 , x2 ,…., xn ) siendo x1 , x2 ,…xn ; elementos u objetos en un orden determinado. DEF Sean A y B dos conjuntos cualesquiera. Llamaremos Producto Cartesiano de A y B, y se representa por AxB, al conjunto formado por todos los pares ordenados (a, b) tales que a∈A y b∈B. AxB = {(a, b)/ a∈A y b∈B} Se puede observar fácilmente que si el conjunto A tiene n elementos y el conjunto B tiene m elementos, entonces el conjunto AxB tendrá n x m elementos.
5/22
Igualmente, podemos generalizar la definición de producto cartesiano a n conjuntos. DEF Sean A1 , A2 ,….An n conjuntos cualesquiera. Llamaremos producto cartesiano de A1 , A2 ,….An , y se representa por A1x A2x ….x An , al conjunto formado por todas las ntuplas (x1 , x2 ,…., xn ) tales que x1 ∈A1 , x2 ∈A2 ,….xn ∈An . A1x A2x ….x An = {(x1 , x2 ,…xn )/xi∈Ai ∀i: 1,…,n } Para poder representar el producto cartesiano de dos conjuntos tenemos dos posibles formas: 1) Mediante un diagrama cartesiano. Son análogos a los utilizados para representar las coordenadas del plano cartesiano, con la diferencia de que ahora solo utilizamos el 1er cuadrante. 2) Mediante un diagrama sagital. Se representan los conjuntos por medio de diagramas de Venn y se unen a los elementos del primer conjunto con los del segundo conjunto mediante flechas. PROP A x B = Ø ⇔ A = Ø ó B = Ø Dem. Si A x B = Ø ⇔ No existe ningún par ordenado (a, b) ∈ A x B ⇔ A = Ø ó B = Ø PROP A x B ⊂ A´ x B´ ⇔ A ⊂ A´ y B ⊂ B´ Dem. Sean a∈A y b∈B ⇒ (a, b) ∈ A x B ⇒ Por hipótesis (a, b) ∈ A´ x B´ ⇒ ⇒ a∈A´ y b∈B´ Luego A⊂A´ y B⊂B´ Sea (a, b) ∈A x B ⇒ a∈A y b∈B ⇒ Por hipótesis a∈A´ y b∈B´ ⇒ (a, b) ∈A´ x B´ Luego A x B ⊂ A´ x B´ PROP Propiedad distributiva del producto cartesiano respecto de la intersección: 1) Ax (B∩C) = (AxB) ∩ (AxC) 2) (BnC) x A= (BxA) ∩ (CxA) Dem. 1) El conjunto Ax(B∩C) está formado por 6/22
Ax (B∩c) = {(a, x)/a∈A y x∈B∩C} y {(a, x)/a∈A y x∈BnC} = {(a, x)/a∈B y x∈C} = = {(a, x)/(a∈A y x∈B) y (a∈A y x∈C)} = = {(a, c)/a∈A y x∈B} ∩ {(a, x)/ a∈A y x∈C} = = (AxB) ∩ (AxC) Luego Ax (B∩C) = (AxB) ∩ (AxC) 2) Análogo al anterior. PROP Propiedad distributiva del producto cartesiano respecto de la unión. 1) Ax (B∪C) = (AxB) ∪ (AxC) 2) (B∪C) xA = (BxA) ∪ (CxA) Dem. 2) (B∪C) xA = {(x, a)/ x∈B∪C y a∈A} = {(x, a)/(x∈B ó x∈C) y a∈A} = = {(x, a)/(x∈B y a∈A) ó (x∈C y a∈A)} = {(x, a)/x∈B y a∈A} ∪ {x, a)/ x∈C y a∈A} = (BxA) ∪ (CxA) 1) Análogo al anterior. PROP Propiedades distributiva del producto cartesiano respecto de la diferencia. 1) Ax (B – C) = (AxB) – (AxC) 2) (B – C) xA = (BxA) – (CxA) Dem. 1) Ax (B – C) = {(a, x) / a∈A y x∈ (B – C)} = {(a, x) / a∈A y (x∈B y x∉C)} = = {(a, x) / (a∈A y x∈B) y (a∈A y x∉C)} = (AxB) – (AxC)j 2) Análogo al caso anterior. 4. CORRESPONDENCIAS Y RELACIONES ENTRE CONJUNTOS. 4.1. Correspondencias. DEF
Llamaremos Grafo, G, a todo conjunto compuesto por pares ordenados. 7/22
Según la definición, dados A y B conjuntos, un grafo es cualquier subconjunto de AxB. DEF Sean A y B dos conjuntos. Un subconjunto G de AxB, G⊂AxB llamado grafo, define una correspondencia entre A y B. El conjunto G recibe el nombre de grafo de al correspondencia. La correspondencia se denota por la terna (A, B, G). Dada la correspondencia (A, B, G), podemos definir: 1) El conjunto {a ∈A / ∃b∈B con (a, b)∈G}, subconjunto de A, recibe el nombre de Dominio de la Correspondencia. Se denota por Dom (A, B, G). 2) El conjunto {b ∈B / ∃a∈A con (a, b)∈G}, subconjunto de B, recibe el nombre de Imagen de Correspondencia. Se denota por Im (A, B, G). 3) Dado a∈A, el conjunto {b ∈B / (a, b)∈G} recibe el nombre de imagen de a. Se denota por Im (a). La correspondencia (A, B, G) se suele denotar por f, escribiéndose donde para cada (a, b)∈G, b se puede escribir como b = f(a).
f: A → B,
DEF Dada la correspondencia (A, B, G) definimos la correspondencia inversa como (B, A, G-1) siendo G-1 = {(b, a) / (a, b)∈G}. También se suele denotar por f-1. Es claro que el conjunto Dom (f) = Im (f-1) y que Im (f) = Dom (f-1) por la propia definición del conjunto G-1. 4.2. Relaciones. DEF Sean A y B dos conjuntos. Llamaremos relación entre a∈A y b∈B, y se denota por aRb, a toda propiedad definida sobre AxB. Toda relación lleva asociado un subconjunto G⊂AxB siendo G = {(a, b)∈AxB / aRb}. DEF El conjunto G asociado a una relación R entre A y B recibe el nombre de Gráfica de la Relación. DEF Llamaremos Relación Binaria al caso particular de una relación entre elementos del mismo conjunto, (caso A = B). Una relación binaria definida sobre A puede verificar las siguientes propiedades: 1) Reflexiva:
∀a∈A se verifica
(a, a)∈G ó
aRa.
2) Simétrica:
∀(a, b)∈G
(b, a)∈G
(∀aRb ⇒ bRa).
⇒
3) Antisimétrica: Si (a, b)∈G y (b, a)∈G ⇒ 8/22
a = b (aRb y bRa ⇒ a = b).
4) Transitiva:
Si (a, b)∈G y (b, c)∈G ⇒
(a, c)∈G.
5) Convexa:
∀a, b∈A (a, b)∈G ó (b, a)∈G.
4.2.1. Relaciones de Equivalencia. DEF Una Relación de Equivalencia es una Relación binaria que verifica las propiedades reflexiva, simétrica y transitiva. DEF Sea A un conjunto y R una relación de equivalencia definida en A. Para cada a∈A definimos la clase de equivalencia de a como el conjunto de elementos x∈A tales que aRx. Se representa por [a]. [a] = {x∈A / aRx} PROP Sea A un conjunto y R una relación de equivalencia definida en A. Si a y a´ son elementos de A, son equivalentes: 1) aRa´ 2) a∈[a´] 3) [a] = [a´] Dem. 1) ⇔ 2) Es cierta por definición de clase de equivalencia. 2) ⇔ 3) Sea x∈[a] ⇒ xRa ⇒ xRa´ ⇒ x∈[a´] Por hipótesis a∈[a´] ⇒ aRa´ Luego [a´] ⊂ [a] Si x ∈ [a´] ⇒ xRa´ ⇒ xRa ⇒ x ∈ [a ] Por hipótesis aRa´⇒ a´Ra Luego [a´]⊂[a] Como [a]⊂[a´] y [a´]⊂[a] ⇒ [a] = [a´] 3) ⇒ 2) Como a∈[a] y por hipótesis [a] = [a´] ⇒ a∈[a´] COROLARIO. Dos clases de equivalencia o son iguales o son distintas. Dem. Sean [a] y [b] dos clases de equivalencia con a∈[a] y 9/22
b∈[b].
Si [a] ∩ [b] ≠ Ø, sea x∈[a]∩[b] ⇒
x ∈ [a ] ⇒ [x ] = [a] ⇒ [a ] = [b] x ∈ [b] ⇒ [x ] = [b ]
DEF El conjunto formado por todas las clases de equivalencia que resultan de una relación de equivalencia R sobre el conjunto A, se llama Conjunto Cociente de A por la relación de equivalencia R, y se representa por A/R. COROLARIO. La igualdad
U [a ] = A es cierta
[a ]∈ A R
Dem. Como
[a ] = {a´∈ A / aRa´} ⇒ [a ] ⊂ A ⇒
Para cada x∈A se verifica que
U [a ] ⊂ A
[a ]∈ A R
x∈[x] ⇒ x ∈ U [a ] ⇒ A ⊂ U [a] [a ]∈ A R
[a ]∈A R
Luego se da la igualdad. 4.2.2. Relaciones de Orden. DEF Una Relación de Preorden es una relación binaria que verifica las propiedades Reflexiva y Transitiva. DEF Una Relación de Orden es una relación binaria que verifica las propiedades Reflexiva, Antisimétrica y Transitiva. DEF Una Relación de Orden Total es una Relación de Orden que además verifica la propiedad Conexa. Las relaciones de orden se suelen denotar por el símbolo ≤. DEF Un elemento a∈A diremos que es mínimo si a ≤ x ∀x∈A. Es máximo si x ≤ a ∀x∈A. DEF Un elemento a∈A diremos que es minimal si no existe x ≠ a tal que x ≤ a. Diremos que es maximal si no existe x ≠ a tal que a ≤ x. OBS Elemento mínimo, si existe, es único. Para que exista, debe ser comparable con todos, y ser el más pequeño. En cambio, elemento minimal es el más pequeño de todos con los que se puede comparar. Puede haber más de uno. DEF Llamaremos Cadena a toda parte totalmente ordenada de un conjunto con una Relación de Orden. Si la relación definida en el conjunto A es de orden total, existe una única cadena y la representación se puede realizar en línea recta (por ejemplo –, 9, Q ó 3).
10/22
5. APLICACIONES ENTRE CONJUNTOS. DEF Sea f una correspondencia entre los conjuntos A y B (f: A → B). Diremos que f es una aplicación de A en B si verifica que para cada a∈A existe un único b∈B tal que f(a) = b. Por tanto, si f es una aplicación, para cada a∈A el conjunto Im(a) tiene un único elemento. DEF Sea f: A → B una aplicación y A´⊂ A un subconjunto. La aplicación f´: A → B definida por f´(x) = f(x) recibe el nombre de Restricción de f a A´, y se denota por f´ = fA´. DEF Dos aplicaciones f: A → B y g: C → D ∀a∈A f(a) = g(a). Se denota por f = g.
son iguales si A = C, B = D y
DEF Diremos que la aplicación f: A → B es constante si ∀a∈A se verifica que f(a) = b, para un cierto b∈B. PROP Si f es una aplicación constante, el conjunto Dom(f) está formado por un solo elemento. Dem. Inmediata. Una aplicación importante es la aplicación identidad. Es una aplicación de un conjunto en si mismo, f: A → A, donde a cada elemento le hace corresponder como imagen él mismo, f(x) = x∀x∈A. Se representa por IA. DEF
Sean A y B dos conjuntos y f: A → B una aplicación:
1) Diremos que f es inyectiva si de f(a) = f(a´) con a, a´∈A se deduce a = a´. 2) Diremos que f es suprayectiva si ∀b∈B ∃a∈A tal que f(a) = b. El elemento a∈A no tiene porqué ser único. 3) Diremos que f es biyectiva si es simultáneamente inyectiva y suprayectiva. A la vista de al definición podemos decir que una aplicación f: A → B es inyectiva si elementos distintos de A tienen imágenes distintas en B. Y es suprayectiva si todo elemento de B es imagen de alguno de A. PROP Sean A y B dos conjuntos y f una aplicación de A en B biyectiva. La correspondencia inversa, f-1, es una aplicación de B en A. Dem. Como f es biyectiva, en particular es suprayectiva. Entonces, 11/22
∀b∈B ∃a∈A / f(a) = b. Y f-1(b) = a. Si ∃a´∈A / f-1(b) = a´
tenemos:
1) f −1 (b) = a ⇒ f (a ) = b ⇒ f ( a ) = f ´( a´) y como f es inyectiva 2) f −1 ( b) = a´⇒ f ( a´) = b
a = a´.
Luego a cada elemento b∈B le corresponde un único elemento a∈A tal que f (b) = a, que es la definición de aplicación para f-1. -1
PROP Sea f: A → B una aplicación biyectiva. La aplicación inversa f-1 : B → A es también biyectiva, y (f-1)-1 = f. DEF Sean A, B, C y D conjuntos, f: A → B y g: C → D aplicaciones y Imf⊂C. Llamaremos Aplicación Compuesta de f y g a h: A → D definida por ∀x∈A h(x) = g(f(x)). Se denota por h = g ó f. PROP Sean A, B, C y D conjuntos de f: A → B, g: B → C y h: C → D aplicaciones. Se verifica la propiedad asociativa para la operación de composición de aplicaciones. ho(g o f) = (h o g)of Dem. ∀x∈A
(h o (g o f) (x) = h((g o f)(x)) = h(g(f(x))) ((h o g) o f) (x) = (h o g)(f(x)) = h(g(f(x))
Luego h o (g o f) = (h o g) o f Si la aplicación f está definida de A en su mismo, f: A → A, entonces f o f = f2 y F = fn-1 o f. n
PROP Sean A y B dos conjuntos y f: A → B y g: B → A dos aplicaciones. Se verifican las siguientes propiedades: 1) IB o f = f o IA = f 2) f es biyectiva ⇒ f-1 o f = IA y f o f-1 = IB 3) g o f = IA ⇒ f es inyectiva y g suprayectiva. 4) g o f = IA y f o g = I B ⇒ f y g son biyectivas con g = f-1. Dem. 1) (IB o f) (x) = IB (f(x)) = f(x) = f(IA(x)) = (f o IA)(x)
12/22
∀x∈A
2) (f-1 o f)(x) = f-1(f(x)) = x = IA(x)
∀x∈A
Como f es biyectiva (f-1)-1 = f ⇒ f o f-1 = (f-1)-1 o f-1 = IB aplicando lo demostrado en este mismo apartado. 3) Sean a, a´∈A con f(a) = f(a´) ⇒ g(f(a)) = g(f(a´)) ⇒ (g o f)(a) = (g o f)(a´) ⇒ ⇒ IA(a) = IA(a´) ⇒ a = a´ ⇒ f es inyectiva. Dado a∈A ⇒ f(a) = b para algún b∈B ⇒ g(f(a)) = g(b) ⇒ (g o f)(a) = g(b) ⇒ ⇒ IA(a) = g(b) ⇒ g(b) = a ⇒ g es suprayectiva. 4) Como g o f = IA ⇒ f es inyectiva y g suprayectiva. Como f o g = IB ⇒ g es inyectiva y f suprayectiva. Luego f y g son biyectivas siendo f-1 = f-1 o IB = f-1 o (f o g) = (f-1 o f) o g = IA o g = g COROLARIO. Sea A, B y C conjuntos con f: A → B, g: B → C aplicaciones biyectivas. Entonces g o f es biyectiva y verifica (g o f)-1 = f-1 o g-1. Dem. (g o f) o (f-1 o g-1) = ((g o f) o f-1) o g-1 = g o IB o g-1 = g o g-1 = IC (f-1 o g-1) o (g o f) = ((f-1 o g-1) o g) o f = f-1 o IB o f = f-1 o f = IA Por el apartado 4) de la proposición anterior g o f es biyectiva y (g o f)-1 = f-1 o g-1
6. LEYES DE COMPOSICIÓN. DEF Llamamos operación entre los conjuntos A y B con valores en C a toda aplicación de AxB en C. DEF Llamamos operación interna, o ley de composición interna, definida en A a toda aplicación de AxA en A. DEF Llamamos operación externa, o ley de composición externa, definida sobre A por la derecha a toda aplicación de AxB en A. Será por la izquierda si la aplicación es de BxA en A. El conjunto B recibe el nombre de dominio de operadores. 6.1. Leyes de Composición Interna. Una operación interna definida sobre A, por definición, hace corresponder a cada par de elementos de A, es decir, un elemento de AxA, un único elemento de A. 13/22
Si (x, y)∈AxA, su imagen por la aplicación que define la operación externa se suele indicar mediante alguno de los siguientes símbolos: x · y, x + y, x⊥ y, x o y, etc. Si se escribe x + y la operación interna recibe el nombre de “suma”, y se lee “x mas y”. Si se escribe x · y la operación interna recibe el nombre de “producto”, y se lee “ x por y” ó “ x multiplicado por y”. Veamos las propiedades que puede verificar una ley de composición interna. Sea S una operación interna sobre A. 1) Diremos que S verifica la propiedad asociativa en A si ∀x, y, z∈A (xSy)Sz = xS(ySz) 2) Diremos que S es conmutativa si ∀x, y∈A
xSy = ySx
3) Diremos que S admite Ele mento Neutro o Unidad si ∃e∈A tal que ∀x∈A eSx = xSe = x 4) Diremos que S admite elemento Simétrico si ∀x∈A Por la izquierda ∃x´∈A tal que x´Sx = e Por la derecha ∃x´∈A tal que xSx´ = e 5) Diremos que S admite Elemento regular o Simplificable si ∀x, y∈A r es Regular por la izquierda en A si rSx = rSy ⇒ x = y r es Regular por la derecha en A si xSr = ySr ⇒ x = y r es regular si y solo si lo es por ambos lados. 6) Diremos que S admite la propiedad idempotente si ∀x∈A xSx = x 7) Diremos que S admite la propiedad distributiva respecto de otra operación interna T de A si: Por la derecha: (xTx)Sz = (xSz)T(ySz) Por la izquierda: xS(yTz) = (xSy)T(xSz) Notación Dado un conjunto A con una operación interna S, se denotará por (A, S). Como ejemplos tenemos (–, +) ó (3, +) ó (9, ·).
14/22
6. 2. Leyes de Composición Externa. Según la definición, en el conjunto A hay definida una operación externa si tenemos un conjunto B que será el dominio de operadores y una aplicación de AxB (o BxA) en A. Los elementos del dominio de operadores se suelen denotar mediante letras griegas. Veamos algunas de las propiedades que puede verificar una ley de composición externa, que denotaremos por T. 1) Conmutativa. ∀α∈B ∀x∈A
αTx = xTα
2) Pseudoasociativa. αT (βTx ) = (αRβ )Tx ∀α, β ∈ B ∀x ∈ A ( xTα)Tβ = xT (αRβ) siendo R una operación interna en B. 3) Elemento Unidad. ∃:∈B ∀x∈A :Tx = x = xT: 4) Distributiva respecto de S, operación interna en A. ∀α ∈ B y ∀x, y ∈ A
Por la izquierda αT ( xSy) = (αTx )S (αTy ) Por la derecha ( xSy)Tα = (xTα)S ( yTα)
5) Distributiva la operación interna R de B respecto de T. ∀α, β ∈ B
Por la izquierda (αRβ)Tx = (αTx )S (βTx ) ∀x ∈ A Por la derecha xT (αRβ) = (xTα)S ( xTβ)
7. ESTRUCTURAS ALGEBRAICAS. 7.1. Estructuras Algebraicas con una operación interna. A lo largo de este punto vamos a denotar la operación interna mediante el símbolo ∗. Entonces, el par (A, ∗) denota al conjunto A con la operación interna ∗. DEF
El par (A, ∗) es un Semigrupo si la operación interna es asociativa en A.
DEF El par (A, ∗) es un Semigrupo Conmutativo si además verifica la propiedad Conmutativa. DEF
Diremos que (A, ∗) es un Monoide si es un semigrupo con elemento neutro.
Ejemplos: 1) (–∗ , +) es un semigrupo conmutativo. 15/22
2) (–, ·) es un Monoide. DEF Diremos que (G, ∗) es un grupo si se cumplen las propiedades asociativa, existencia de elemento neutro y existencia de elemento simétrico. Si además se verifica la propiedad conmutativa, diremos que es un grupo abeliano o conmutativo. PROP En un grupo (G, ∗) el elemento neutro es único. Dem. Sabemos que e∈G es el elemento neutro. Sea e´∈G un elemento tal que Entonces se da que
e´∗x = x∗e´ = x
e´ = e´∗e = e
∀x∈G
y por tanto el neutro es único.
PROP Cada elemento de G admite un único inverso. Dem. ∃x-1∈G / x∗x-1 = e = x-1∗x
sabemos que
∀x∈G
Sea x´ -1∈G
otro inverso de x.
X´-1 = x´-1∗e = x´-1∗(x∗x-1) = (x´-1∗x)∗x-1 = e∗x-1 = x-1 Por tanto el inverso es único. PROP Dado (G, ∗) un grupo y
x, y, z∈G elementos cualesquiera, se verifica:
1) Si
x∗y = e ⇒ x = y-1 , y = x-1
2) Si
x∗y = x∗z ⇒ y = z
3) Si para algún y∈G
x∗y = y ⇒ x = e (análogamente y∗x = y)
4) (x∗y)-1 = y-1∗x-1 Dem. 1) x∗y = e ⇒ x∗y = e
(x∗y)∗y-1 = e∗y-1 ⇒ x∗(y∗y-1) = y-1 ⇒ x∗e = y-1 ⇒ x = y-1
⇒ x-1∗(x∗y) = x-1∗e ⇒ (x-1∗x)∗y = x-1 ⇒ e∗y = x-1 ⇒ y = x-1
2) x∗y = x∗z ⇒ x-1∗(x∗y) = x-1∗(x∗z) ⇒ (x-1∗x)∗y = (x-1∗x)∗z ⇒ e∗y = e∗z ⇒ ⇒y=z 3) x∗y = y ⇒ (x∗y)∗y-1 = y∗y-1 ⇒ x∗(y∗y-1) = e ⇒ x∗e = e → x = e 16/22
4) (x∗y)∗(y-1∗x-1) = (x∗(y∗y-1))∗x-1 = (x∗e)∗x-1 = x∗x-1 = e Aplicando 1) y-1∗x-1 = (x∗y)-1 COROLARIO
∀x∈G con (g, ∗) grupo, se verifica (x-1)-1 = x
Dem. Tomando y = x-1 y aplicando el apartado 1) de la proposición anterior se obtiene. DEF Llamaremos Orden del Grupo (G, ∗) al número de elementos de G, en caso de que sea finito. DEF Sea (G, ∗) un grupo y HCG un subconjunto no vacío. Diremos que (H, ∗) es un Subgrupo de (G, ∗) si 1) ∀x, y∈H ⇒ x∗y∈H 2) e∈H 3) ∀x∈H ∃x-1∈H PROP Sea (G, ∗) un grupo y HCG un subgrupo no vacío. (H, ∗) es un subgrupo de (g, ∗) si y solo si ∀x, y∈H x∗y-1∈H. Dem. “⇒” Como (H, ∗) es subgrupo ⇒ ∀x, y∈H
x, y-1∈H ⇒ x∗y-1∈H.
“⇐” Sea x∈H. Entonces por hipótesis x∗x-1∈H ⇒ e∈H. Sea x∈H y e∈H por hipótesis e∗x-1∈H ⇒ x-1∈H Sea x, y∈H ⇒ por lo anterior y-1∈H ⇒ Aplicando la hipótesis x∗(y-1)-1∈H ⇒ ⇒ x∗y∈H. Como (H, ∗`) verifica las tres condiciones ⇒ (H, ∗) es subgrupo de (G, ∗). 7.2. Estructuras Algebraicas con dos operaciones internas. A lo largo de este punto vamos a denotar las dos operaciones internes mediante símbolos ∗ y o . 7.2.1. Anillos. DEF
La terna (A, ∗, o ) es un Semianillo si se verifican
1) (A, ∗) es un semigrupo conmutativo con neutro. 17/22
2) (A, o ) es un semigrupo. 3) La operación o es distributiva respecto de la operación ∗. DEF (A, ∗, o ) es un Semianillo conmutativo si (A, ∗, o ) es un semianillo y (A, o ) es un semigrupo conmutativo. DEF (A, ∗, o ) es un Semianillo con elemento unidad si (A, ∗, o ) es un Semianillo y (A, o ) es un semigrupo con elemento neutro. Ejemplo. (–, +, ·)es un semianillo conmutativo con elemento unidad. DEF
Llamamos Anillo a la terna (A, ∗, o ) verificando:
1) (A, ∗) es un grupo conmutativo. 2) (A, o ) es un semigrupo. 3) La operación o es distributiva respecto de la suma. Si además, la operación o es conmutativa, el anillo es Conmutativo; si la operación o tiene elemento neutro, es un anillo unidad; y si verifica ambas, es un anillo
conmutativo con elemento unidad. Ejemplo:
Los conjuntos 9, Q, 3 y " con la suma y el producto forman Anillos Conmutativos con elemento Unidad. PROP Sea (A, +, ·) un anillo. ∀x, y, z∈A se verifican las siguientes propiedades: 1) O · x = x · O = O 2) (- x) · y = x · (- y) = - (xy) 3) (- x) · (- y) = xy 4) x · (y – z) = xy – xz
y
(x – y) · z = x · z – y · z
Dem. 1) x · O = x · ( O + O) = x · O + x · O ⇒ x · O = O O · x = (O + O) · x = O · x + O · x ⇒ O · x = O 2) (- x) · y + x · y = (- x + x) · y = O · y = O ⇒ (- x) · y = - (xy) x · y + x · (- y) = x · (y – y) = x · O = O ⇒ x · (- y) = - (xy) 3) (- x) · (- y) = - (x · (- y)) = - (- (x · y)) = x · y 18/22
4) x · (y – z) = x · (y + (- z)) = x · y + x · (- z) = x · y + (- x · z) = x · z – y · z (x – y) · z = (x + (- y)) · z = x · z + (- y) · z = x · z + (- y · z) = x · z – y · z DEF Diremos que a, b∈A, con (A, ∗, o ) anillos, son Divisores de Cero si a ≠ e0 , b ≠ e0 y a o b = e0 (con e0 es neutro de la operación o . OBS Si utilizamos las operaciones habituales de suma y producto (al igual que en la proposición anterior), la definición dice que las divisiones de cero son aquellas que verifican a ≠ 0, b ≠ o y a · b = 0. DEF (A, ∗, o ) es un Dominio de integridad si es un Anillo conmutativo con elemento unidad y no posee divisores de cero. DEF Sea (A, ∗, o ) un Anillo y SCA un subconjunto no vacío. Diremos que (S, ∗, o ) es un Subanillo de (A, ∗, o ) si 1) (S, ∗) es un subgrupo de (A, ∗) 2) ∀x, y∈S se cumple que x o y∈S. Si además, (A, ∗, o ) es un Anillo con unidad, (S, ∗, o ) lo será si e0 ∈SEjemplos: (9, +, ·) es un subanillo conmutativo con unidad de (Q, +, ·). DEF Diremos que un subconjunto no vacío I⊂A, con (A, ∗, o ) anillo, es un Ideal de A si cumple 1) (I, ∗) es un subgrupo de (A, ∗) 2A) ∀x∈I y ∀a∈A
a o x∈I
2B) ∀x∈I y
x o a∈I
∀a∈A
Si sólo verifica 1 y 2A diremos que es ideal por la izquierda y si sólo verifica 1 y 2B será ideal por la derecha. Ejemplo: Todos los ideales de 9 son los conjuntos I = (a) con (a) = {a · n / n∈9} PROP Sea (A, ∗, o ) un anillo. Todo ideal I del anillo es un subanillo. Dem. Inmediatamente a partir de ambas definiciones.
19/22
OBS El recíproco de la proposición anterior no es cierto. DEF Sea (A, ∗, o ) un anillo y B⊂a un subconjunto. Llamamos ideal engendrado por el subconjunto B al menor ideal que contiene a B. DEF Diremos que un ideal I es principal si es un ideal engendrado por un subconjunto con un solo elemento. DEF Un Anillo (A, ∗, o ) es Principal si es un dominio de integridad y todos sus ideales son principales. DEF Sea (A, ∗, o ) un anillo conmutativo e I un ideal de A. Diremos que I es Ideal Maximal si I ≠ A y no está contenido estrictamente en un ideal propio. DEF Sea (A, ∗, o ) un anillo conmutativo e I un ideal de A con I ≠ A. Diremos que I es un ideal primo si la relación x o y∈I implica que x∈I o y∈I. 7.2.2. Cuerpos. DEF Diremos que un anillo (K, ∗, o ) es un Cuerpo si todo elemento no nulo de K admite inverso para la operación o . El Cuerpo es conmutativo si la operación o es conmutativa. También podemos prescindir de la noción de Anillo y dar como definición de Cuerpo la siguiente. DEF
Diremos que la terna (K, ∗, o ) es un Cuerpo si se verifica:
1) (K, ∗) es un grupo conmutativo. 2) (K – { o }, o ) es un grupo. 3) La operación o es distributiva respecto de ∗. Si además (K – { o }, o ) es conmutativo, diremos que (K, ∗, o ) es un Cuerpo Conmutativo. DEF
Un subconjunto K0 ⊂K con (K, ∗, o ) es un subcuerpo si (K 0 , ∗, o ) es un cuerpo.
7.2.3. Retículo. DEF 1) 2) 3) 4)
Llamaremos Retículo a la terna (A, ∗, o ) verificando: Las dos operaciones internas son asociativas. Las dos operaciones internas son conmutativas. Las dos operaciones internas son idempotentes. Las dos operaciones internas son absorbentes.
OBS Para que una operación interna sea idempotente debe verificar que ∀a∈A 20/22
a∗a = a ó a o a = a. Para que ∗ y o sean absorbentes (verifiquen la propiedad de absorción) debe cumplirse que ∀a, b∈A (a∗b) o a = a y (a o b)∗a = a Ejemplo: Dado un conjunto U, tenemos que (P(U), ∪, ∩) es un retículo. DEF La terna (A, ∗, o ) es un retículo distributivo cuando, además de ser retículo, ambas operaciones internas verifican la propiedad distributiva de una respecto a la otra. DEF Llamaremos Elemento Infinito del retículo (A, ∗, o ) y lo representaremos por i, al elemento neutro de al operación ∗. DEF Llamaremos Elemento Universal del retículo (A, ∗, o ), y lo representaremos por u, al elemento neutro de la operación o . PROP Sea (A, ∗, o ) un retículo con elemento ínfimo y elemento universal. Dado a∈A se verifica 1) a o i = i 2) a∗u = u Dem. Como i es el elemento neutro de ∗ se verifica ∀a∈A a∗i = a Por la propiedad de absorción (i∗a) o i = i ⇒ a o i = i Como u es el elemento neutro de o se verifica ∀a∈A a o u = a Por la propiedad de absorción (u o a)∗u = u ⇒ a∗u = u DEF Diremos que (A, ∗, o ) es un retículo Complementario si es un retículo con elementos ínfimo y universal y además verifica: ∀a∈A ∃ac∈A / a∗ac =u y a o ac = i 7.3. Estructuras Algebraicas con una operación interna y otra externa. En este punto vamos a denotar por • a la operación externa, teniendo como subíndice el conjunto sobre el que está definida. 7.3.1. Módulos. DEF Sea (A, ∗, o ) un anillo conmutativo con unidad y M un conjunto sobre el que hay definida una operación interna, ∗ M, y una operación externa • A, con dominio de operadores A. Diremos que (M, ∗ M, • A) es un A-Módulo si verifica
21/22
1) (M, ∗ M) es un grupo conmutativo. 2) La Ley externa verifica la propiedad distributiva (por ambos lados) respecto de ∗M, la propiedad pseudoasociativa y existe elemento unidad. Si además, la operación externa es conmutativa, diremos que (M, ∗ M, •A) es un AMódulo Conmutativo. DEF Si (M, ∗ M, •A) es un A-Módulo y S⊂M es no vacío, diremos que S es un submódulo de M si S, con las operaciones de M restringidas, es un A-Módulo. 7.3.2. Espacios Vectoriales. DEF Sea (M, ∗ M, •A) un A-Módulo. Diremos que es un Espacio Vectorial si el dominio de operadores A tiene estructura del Cuerpo. Una definición alternativa sin que aparezca el concepto de Módulo sería: DEF
La terna (V, ∗ V, • K) es un K-Espacio Vectorial si verifica:
1) (K, ∗ K), o ) es un cuerpo. 2) (V, ∗ V) es un grupo conmutativo. 3) La ley externa verifica la propiedad distributiva (por ambos lados) respecto de ∗ V, la propiedad pseudoasociativa y existe elemento unidad. DEF Si (V, ∗ V, • K) es un K-espacio vectorial y W⊂V es no vacío, diremos que W es un subespacio vectorial de V si W, con las operaciones de V restringidas, es un Kespacio vectorial. PROP W es un Subespacio vectorial de (V, ∗ V), • K) si y solo si verifica: 1) ∀x, y∈W ⇒ x∗ V y ∈W 2) ∀α∈K ∀x∈W ⇒ α• K x∈W
22/22
TEMA 12 (Oposiciones de Matemáticas) ESPACIOS VECTORIALES. 1. Espacios Vectoriales. 2. Subespacios Vectoriales. 2.1. Intersección de Subespacios. 2.2. Unión de Subespacios. 2.3. Suma de Subespacios. 2.4. Suma Directa de Subespacios. 3. Aplicaciones Lineales. Espacio Cociente. 4. Teoremas de Isomorfía. 5. Bases de un Espacio Vectorial. 5.1. Combinaciones Lineales. 5.2. Dependencia e Independencia Lineal. 5.3. Bases y Dimensión. 5.4. Bases y Aplicaciones lineales. 5.5. Dimensión de Subespacios y Espacios Cociente. 6. Subespacios Vectoriales Complementarios.
1/27
TEMA 12 ESPACIOS VECTORIALES. A lo largo de este tema 12 denotaremos mediante la letra K un cuerpo conmutativo, (K, +, ·). 1. ESPACIOS VECTORIALES. DEF Llamamos K-espacio vectorial a la terna formada por un conjunto V, una ley de composición interna +, y una ley de composición externa · : KxE → E, verificando las propiedades: 1) (V, +) es un grupo conmutativo. 2) La ley de composición externa satisface las propiedades r r a) Pseudoasociativa: λ·(µ· v ) = (λ·µ)· v r r r r b) Distributiva: λ·( v + w ) = λ v + λw r r r (λ + µ) v = λv + µv r r c) Elemento Unidad: 1· u = u ∀λ, µ∈K
y
r r ∀v , w ∈ V
Lo denotaremos por (V, +, ·K). r rLos r elementos de V reciben el nombre de vectores y se suelen denotar con las letras u , v , w . Los elementos de K reciben el nombre de escalares y se representan mediante letras griegas. La operación externa se llama producto por escalares. r Denotaremos el neutro de (V, +) por O y el neutro de (K, +) por O. PROP Si V es un K-espacio vectorial se satisfacen las siguientes propiedades; ∀λ, r r µ∈K y ∀u , v ∈ V . r r r 1) O ⋅ u = λ ⋅ O = O 2)
(− λ) ⋅ ur = λ ⋅ (− ur ) = −λur
r r r r 3) λ(u − v ) = λu − λv 4)
(λ − µ)ur = λur − µur
r r 5) λu = O ⇒ λ = O ó
r r u =O
Dem. 2/27
r r r r r r 1) O ⋅ u = (O + O)u = Ou + Ou ⇒ Ou = O r λ ⋅ O = λ(O + O) = λO + λO ⇒ λO = O 2)
r
(− λ)ur + λur = (− λ + λ)ur = Our = O ⇒ (− λ)ur = −λur r r r r r r r λ(− u ) + λu = λ(− u + u ) = λ ⋅ O = O ⇒ λ(− u ) = −λu
r r r r r r r r 3) λ(u − v ) = λ(u + (− v )) = λu + λ(− v ) = λu − λv 4)
(λ − µ)ur = (λ + (− µ))ur = λur + (− µ)ur = λur − µur
r r 5) Si λu = O y λ ≠ O ⇒ ∃λ−1 ∈ K por ser K un cuerpo r r r r r r r λ−1 ⋅ (λu ) = λ−1 ⋅ O ⇒ (λ−1 ⋅ λ)u = O ⇒ 1 ⋅ u = O ⇒ u = O Ejemplos: 1) Sea el conjunto Kn = Kx …… xK. Definimos una operación interna y otra externa con cuerpo de operadores K, como sigue: +: Kn x Kn → Kn
(u1 , u2 , …, un ) + (v1 , v2 , …, vn ) = (u1 + v1 , u2 + v2 , …., un + vn )
·: K x Kn → Kn
λ·(u1 , u2 , …un ) = (λu1 , λu2 , ….λun )
Es inmediato comprobar que (K n , +, ·) es un K-espacio vectorial. 2) Sea V un K-espacio vectorial y A un conjunto. Definimos VA = {f: A → E/f es aplicación} Si definimos la operación interna +: VA x VA → VA
(f + g) (x) = f(x) + g(x)
∀x∈A
y la operación externa ·: K x VA → VA
(λf) (x) = λ·f(x)
∀x∈A
entonces (VA, +, ·) es un K-espacio vectorial. 3) (", +, ·) puede ser un 3-espacio vectorial y también un Q-espacio vectorial, col las operaciones suma y producto habituales. PROP Sea V un K-espacio vectorial. Entonces verifica las leyes de simplificación, que son: 3/27
r r r 1) ∀u , v , w ∈ V
r r r r r r u+v = u+w⇒v = w
r r r 2) ∀α, β ∈ K y ∀u ∈ V no nulo αu = βu ⇒ α = β r r 3) ∀α ∈ K no nulo ∀u , v ∈ K
r r r r αu = αv ⇒ u = v
Dem. r r r r r 1) u + v = u + w ⇒ Como (V, +) es grupo Conmutativo ∃(− u ) ∈ V
(− ur) + (ur + vr ) = (− ur ) + (ur + wr ) ⇒ (− ur + ur ) + vr = (− ur + ur ) + wr ⇒ r r r r r r ⇒O+v = O+w⇒v = w r r r r r r r r r r 2) αu = βu ⇒ αu + (− βu ) = βu + (− βu ) ⇒ αu − βu = βu − βu ⇒ r r r ⇒ (α − β )u = O y como u es un no nulo ⇒ α - β = O ⇒α = β r r 3) αu = αv ⇒ como K es cuerpo y α es no nulo ∃α−1 ∈ K tal que r r r r r r r r α−1 (αu ) = α−1 (αv ) ⇒ α−1α u = α−1α v ⇒ 1u = 1v ⇒ u = v
(
) (
)
2. SUBESPACIOS VECTORIALES. DEF Sea V un K-espacio vectorial y WCV subconjunto no vacío. Diremos que W es un Subespacio Vectorial de V si satisface: 1) (W, +) es subgrupo de (V, +) r r 2) ∀λ ∈ K y ∀u ∈ W ⇒ λu ∈ W Es claro que (W, +, ·) es un K-espacio vectorial con la suma de V y el producto porescalares restringidos a W. r Todo K-espacio vectorial V admite dos subespacios que llamaremos triviales, el O y el propio V.
{}
Ejemplo. (3, +, ·) es un subespacio vectorial de (", +, ·), siendo el cuerpo de operadores, por ejemplo, Q ó 3. PROP Sea V un K-espacio vectorial, W⊂V con W ≠ Ø. Son equivalentes: 1) W es un subespacio vectorial de V. r r 2) ∀u , v ∈ W
y ∀λ ∈ K
r r u + v ∈W
r y λ ⋅ u ∈W
4/27
r r 3) ∀u , v ∈ W
r r λu + µv ∈ W
y ∀λ, µ ∈ K
Dem. 1) ⇒ 2) Como W es un subespacio, las operaciones de suma y producto por un escalar son cerradas. Luego trivialmente se verifica 2). 2) ⇒ 3) r r r r ∀u , v ∈ W y ∀λ, µ ∈ K , por hipótesis λu ∈ W y µv ∈ W y de nuevo aplicando r r 2) λu + µv ∈ W 3) ⇒ 4) Para ver que W es un subespacio. (w, +) es subgrupo r r ∀u , v ∈ W si tomamos λ = 1 y µ = -1 ⇒ u − v ∈ W Para comprobar que la operación externa es cerrada r ∀u , v ∈ W tomamos µ = O ⇒ λu ∈ W ∀λ ∈ K 2.1. Intersección de Subespacios. DEF Sea V un K-espacio vectorial y {W i ≠ i: 1,…, n} una familia de subespacios de V. Definimos la intersección de subespacios como: n r r W = ∩ Wi = {u ∈ v / u ∈ Wi ∀i : 1,...., n} i =1
PROP Sea V un K-espacio vectorial y {W i ≠ i:1,…., n} una familia de subespacios de n
V. Entonces, la intersección, W = ∩ Wi , de subespacios es un subespacio vectorial V. i =1
Dem. r r W ≠ Ø ya que O ∈ Wi ∀ i por ser un subespacio ⇒ O ∈ W . r r r r r r r r Sea u , v ∈ W ⇒ u , v ∈ Wi ∀ i ⇒ λu + µv ∈ Wi ∀λ, µ ∈ K ∀ i ⇒ λu + µv ∈ W W es un subespacio. DEF Sea V un K-espacio vectorial y A⊂V un subconjunto no vacío. Llamamos Subespacio Engendrado por A al menor de los subespacios vectoriales que contienen a A. Se denota por [A]. Es claro que el conjunto [A] es un subespacio de V que contiene al conjunto A, y si existe otro subespacio W de V que también contiene a A, entonces [A]⊂W. PROP Sea V un K-espacio vectorial y A un subconjunto no vacío de V. Sean {Wi/Wi es subespacio y A⊂Wi ∀i∈I. Entonces [A] = ∩ Wi i∈ I
5/27
Dem. Inmediata DEF Sea W un subespacio vectorial de V, K-espacio vectorial, y A⊂V tal que [A] = W. Diremos que el conjunto A engendra W o es un Sistema de Generadores de W. 2.2. Unión de Subespacios. DEF Sea V un K-espacio vectorial y {W i /i∈I} una familia de subespacios de V. Definimos la unión de subespacios como: r r ∪ Wi = {u ∈ V / ∃i ∈ I , u ∈ Wi } No podemos afirmar que la unión de subespacios sea un nuevo subespacio. Ejemplo. Sea V = 32 y U, W subespacios de V con U = 3x{o} y W = {o}x3. Entonces (u, o) ∈U y (o, w)∈W. En cambio (u, o) + (o, w) = (u, w) ∉U∪W. 2.3. Suma de Subespacios. DEF Sea V un K-espacio vectorial y {W i /i:1,…., n} una familia de subespacios de V. Definimos la suma de subespacios como: r r r ∑ W = {u ∈ V / u = ∑ u n
i
i
con ui ∈ Wi ∀ i : 1,...., n}
i =1
PROP Sea V un K-espacio vectorial y {W i /i:1,…, n} una familia de subespacios de V. n
Entonces la suma de subespacios W = ∑ Wi es un subespacio de V. i =1
Dem. Vamos a realizar la demostración por inducción en el número de subespacios, n. Para
n=2
W = W1 + W2
r r r r r 1) Como O ∈ W1 y O ∈ W2 ⇒ O = O + O ∈ W ⇒ W ≠ Ø 2) W1 ⊂ V y W2 ⊂ V ⇒ W1 + W2 ⊂ V ⇒ W ⊂ V r r r r r r r r r r 3) Sea u , v ∈ W ⇒ u = u1 + u 2 y v = v1 + v 2 con u1 , v1 ∈ W1 y u2 , v 2 ∈ W2 ⇒
6/27
⇒ u1 + v1 ∈ W1 y u2 + v2 ∈ W2 ⇒ u + v = (u1 + u 2 ) + (v1 + v2 ) = = (u1 + v1 ) + (u2 + v2 ) ∈ W1 + W2 ⇒ u + v ∈ W 4) Sea λ∈K y u∈W ⇒ u = u1 + u2 con u1 ∈W1 y u2 ∈W2 ⇒ ⇒ λu1 ∈W1 y λu2 ∈W2 ⇒ λu = λ(u1 + u2 ) = λu1 + λu2 ∈W1 + W2 ⇒ ⇒ λu∈W Por tanto W es un subespacio. n −1
Para n – 1, por hipótesis de Inducción, W = ∑ Wi es subespacio vectorial i =1
Para n n
n −1
W = ∑ Wi = ∑ Wi + Wn i =1
i =1
Ambos sumandos son subespacios vectoriales, y como la suma de dos subespacios es otro subespacio (caso n = 2) entonces W es subespacio vectorial de V. PROP Sea V un K-espacio vectorial y U, W subespacios vectoriales de V. Se verifica que U + W = [U∪W] Dem. “⊂”
r r r r r Sea v ∈U + W ⇒ v = u + w con u ∈ U
y
r w ∈W ⇒
r r r r r ⇒ u ∈ U ∪ W y w ∈ U ∪ W ⇒ u + w[U ∪ W ] ⇒ v ∈ [U ∪ W ] “⊃”
r r r r r Sea v = [U ∪ W ] ⇒ ∃u ∈ U y ∃w ∈ W / v = λu + µw ∈ [U ∪ W ] ⇒
r r r r r ⇒ λu ∈ U y µv ∈ W → λu + µv ∈ U + W ⇒ v ∈ U + W 2.4. Suma Directa de Subespacios. DEF Sea V un K-espacio vectorial y W1 , W2 dos subespacios de V. Diremos que el subespacio W es suma directa de W1 y W2 , y lo representaremos por W = W1 ⊕W2 , si se verifica: 1) W = W1 + W2 r 2) W1 ∩W2 = {o } PROP Sea V un K-espacio vectorial y W, W1 , W2 subespacios de V. r r r r r r W = W1 ⊕W2 ⇔ ∀w ∈ W ∃• w1 ∈ W1 y ∃• w2 ∈ W2 / w = w1 + w2 Dem.
7/27
“⇒”
Como W = W1 ⊕W2 , entonces en particular W = W1 + W2 .
r r r r r r Sea w∈ W ⇒ w = w1 + w2 con w1 ∈ W1 y w2 ∈ W Para ver que esa expresión es única, vamos a suponer que existe otra: r r r r w = w1 ´+ w2 ´ con w1´∈ W1 y w2 ´∈ W2
Sea
r r r r r r r r Entonces w1 + w2 = w1 ´+ w2 ´⇒ w1 − w1 ´= w2 − w2 ´ r r Como w1 − w1 ´∈ W1
r r r r y w2 − w2 ´∈ W2 y ambos son iguales ⇒ w1 − w1 ´∈ W1 ∩ W2 y
r r w2 − w2 ´∈ W1 ∩ W2 r r r r r Pero como la suma es directa se da que W1 ∩ W2 = {o} ⇒ w1 − w1 ´= 0 y w2 − w2 ´= 0 r r r r ⇒ w1 = w1 ´ y w2 = w2 ´ Por tanto la expresión es única. “⇐” r 1) Como ∀w ∈ W
r r r r r w = w1 + w2 con w1 ∈ W y w2 ∈ W2 ⇒ W = W1 + W2
r r r r r Como w ∈ W1 ⇒ w = w1 + o 2) Sea w ∈ W1 ∩ W2 r r r r Como w ∈ W2 ⇒ w = o + w2 r r r r r Y al ser la expresión única w1 = o, w2 = o ⇒ w = o
r ⇒ W1 ∩ W2 = {o}
Lo visto de suma directa de dos subespacios se puede generalizar fácilmente a un conjunto de ∩ subespacios. DEF Sea V un K-espacio vectorial y {W i /i:1,….,n} una familia de subespacios de V. Diremos que el subespacio W es suma directa de los subespacios {W i / i:1,…..,n}, y se n
representa por
W = ⊕ Wi si se verifica i =1
n
1) W = ∑ Wi i =1
n r 2) Wi ∩ ∑ W j = {o } jj =1 ≠i PROP Sea V un K-espacio vectorial y W, {W i /i:1,…., n} subespacios de V.
8/27
n n r r r r W = ⊕ Wi ⇔ ∀w ∈ W ∃• wi ∈ Wi ∀ i : 1,..., n / w = ∑ wi i =1
i =1
Dem. Análoga a la anterior COROLARIO
Sea V un K-espacio vectorial y {W i / i:1,…., n}, W subespacios de n r r r r r V. W = ⊕ Wi ⇔ Si ∑ wi = o con wi ∈ Wi ∀ i implica wi = o ∀ i n
i =1
i =1
Dem. r r r r Solo hemos de tener en cuenta que o = o + o + ....... + o . 3. APLICACIONES LINEALES. ESPACIO COCIENTE. DEF Sean V1 y V2 K-espacios vectoriales. Diremos que la aplicación f: V1 → V2 es un homomorfismo de espacios vectoriales (o simplemente lineal) si: r r r r r r 1) f (u + v ) = f (u ) + f (v ) ∀ u , v ∈ V1 r r 2) f (λu ) = λf (u )
∀λ ∈ K
r ∀ u ∈ V1
OBS La condición 1) nos indica que f es un hormomorfismo de grupos entre (V1 , +) y (V2 , +). PROP Sean V1 y V2 K-espacios vectoriales y f: V1 → V2 una aplicación lineal. Si {vri / i :1,....., n} son vectores de V1 y {λ1 / i :1,....., n} escalares se verifica n r n r f ∑ λi vi = ∑ λi f (vi ) i =1 i =1 Dem. Inmediata. PROP Sean V1 y V2 K-espacios vectoriales y f: V1 → V2 una aplicación lineal. Se satisfacen las siguientes propiedades. r r 1) f (o ) = o r r r 2) f (− v ) = − f (v ) ∀v ∈ V1 r r r r r r 3) f (v − w) = f (v ) − f (w) ∀v , w ∈ V1 Dem.
9/27
r 1) ∀v ∈ V1
r r r r r r r f (v ) = f (o + v ) = f (o ) + f (v ) ⇒ f (o ) = o
r 2) ∀v ∈ V1
r r r r r r r f (o ) = f (v + (− v )) = f (v ) + f (− v ) ⇒ f (v ) + f (− v ) = o
por 1)
r r ⇒ f (− v ) = − f (v ) r 3) ∀v, w ∈ V1
r r r r r r r r f (v − w) = f (v + (− w)) = f (v ) + f (− w) = f (v ) − f (w) .
PROP Sean V1 y V2 K-espacios vectoriales. r r r r r r F: V1 → V2 es lineal ⇔ ∀v , w ∈ V1 y ∀λ, µ ∈ K f (λv + µw) = λf (v ) + µf (w) Dem. r r r r r r “⇒” f (λv + µw) = f (λv ) + f (µw) = λf (v ) + µf (w) “⇐” r r r r r r • Si λ = µ = 1 ⇒ f (1v + 1w) = 1 f (v ) + 1· f ( w) = f (v ) + f (w) r r r r r • Si µ = 0 ⇒ f (λv + ow) = λf (v ) + o· f ( w) = λf (v ) Luego f es lineal. PROP Sean V1 y V2 K-espacios vectoriales y f: V1 → V2 una aplicación lineal. Se satisfacen: 1) Si W1 es un subespacio vectorial de V1 ⇒ f(W1 ) es un subespacio vectorial de V2 . 2) Si W2 es un subespacio vectorial de V2 ⇒ f-1(W2 ) es un subespacio vectorial de V1 . Dem. 1) Como f, en particular, es un homomorfismo de grupos, se verifica que f(W1 ) es un subgrupo de V2 . r r Sea λ∈K y f (v ) ∈ f(W1 ) con v ∈ W1 r r Entonces λ· f (v ) = f (λv ) ∈ f (W1 ) Luego f(W1 ) es un subespacio vectorial de V2 . 2) Igualmente, f-2 (W2 ) es un subgrupo de V1 . r r Sea λ∈K y v ∈ f −1 (W2 ) ⇒ f (v ) ∈ f f −1 (W2 ) = W2 ⇒
(
)
r r r ⇒ λ· f (v ) = f (λv ) ∈ W2 ⇒ λv ∈ f − 1 (W2 ) 10/27
DEF Si f: V1 → V2 es una aplicación lineal entre K-espacios vectoriales, definimos el r r r núcleo del f, y se denota por Kerf, al conjunto de los v ∈ V1 tales que f (v ) = o . Y la Imagen de f, Imf, como el conjunto formado por las imágenes de f. r r r Kerf = {v ∈ V1 / f (v ) = o }
r r r Im f = {w ∈ V2 / ∃v V1 con f (v ) = w} = f (V1 )
COROLARIO Sea f: V1 → V2 una aplicación lineal entre K-espacios vectoriales. Los conjuntos Kerf e Imf son subespacios vectoriales. Dem. Kerf = f-1
({or}) y {or} es un subespacio de V2
Imf = f(V1 ) y V1 es un subespacio de V1 . PROP Si V1 , V2 y V3 son K-espacios vectoriales y f: V1 → V2 , g: V2 → V3 aplicaciones lineales, la aplicación compuesta g o f : V1 → V3 es lineal. Dem. Inmediata. PROP Si V1 y V2 son K-espacios vectoriales y f: V1 → V2 es una aplicación lineal biyectiva, la aplicación inversa f-1 : V2 → V1 es lineal. Dem. Sabemos que f-1 : V2 → V1 es un homomorfismo de grupos, luego solo hemos de probar el producto por un escalar. r Si w ∈ V2 Sea λ∈K DEF 1) 2) 3) 4) 5)
r ∃v ∈ V1
r r / f (v ) = w
r r r r r f −1 (λw) = f −1 (λ ⋅ f (v )) = f −1 ( f (λ ⋅ v )) = λ ⋅ v = λ ⋅ f −1 (w)
Sean V1 y V2 K-espacios vectoriales y f: V1 → V2 aplicación lineal. f es monomorfismo si f es inyectiva. F es epimorfismo si f es suprayectiva. F es isomorfismo si f es biyectiva. F es endomorfismo si V1 = V2 F es automorfismo si es simultáneamente isomorfismo y endomorfismo.
PROP Sea V un K-espacio vectorial y N⊂V un subespacio vectorial. Existe entonces un K-espacio vectorial, W, y una aplicación lineal θ: V → W tal que Ker θ = N. Dem.
11/27
Vamos a realizar la demostración en dos pasos; primero construiremos W y después θ. 1) Construcción de W. Por ser N subespacio vectorial de V ⇒ (N, +) es un subgrupo de (N, +) y como es conmutativa ⇒ N es un divisor normal de V. Vamos a considerar el conjunto cociente V/N, siendo sus elementos clases de equivalencias de V respecto de la relación R definida por r r ∀v , v ∈ V
r r r r v Rv´⇔ v − v´∈ N
La suma de clases estaría definida por
[vr ] + [vr´] = [vr + vr´] siendo (V/N, +) grupo conmutativo Definimos la operación externa ∀λ ∈ K
r r λ ⋅ [v ] = [λ ⋅ v ]
r r r r r r y esta bien definida ya que si [v ] = [v ´] ⇒ v − v´∈ N ⇒ λ ⋅ (v − v ´) ∈ N al ser subespacio r r r r ⇒ λv − λv´∈ N ⇒ [λv ] = [λv´] . La operación externa que acabamos de definir verifica las propiedades Pseudoasociativas, distributivas (de la suma respecto del producto por escalares y viceversa) y existencia de elemento unidad. Su demostración es inmediata y no la hacemos. Por tanto, el conjunto (V/N, +, • K) es un K-espacio vectorial. Tomaremos W = V/N. 2) Construcción de θ. r r r Definimos θ: V → V/N como θ(v ) = [v ] ∀v ∈ V . Así definida, θ es una aplicación lineal: r r r r r r r r r r θ(v + v´) = [v + v´] = [v ] + [v´] = θ (v ) + θ(v´) ∀v , v´∈ V r r r r θ(λv ) = [λv ] = λ[v ] = λ ⋅ θ(v ) ∀λ ∈ K
r ∀v ∈ V
Es claro que Kerθ = N r r r r r r r v ∈ Kerθ ⇔ θ(v ) = o ⇔ [v ] = [o ] ⇔ v − o ∈ N ⇔ v ∈ N DEF El espacio vectorial V/N recibe el nombre de Espacio Vectorial Cociente de V por N.
12/27
DEF La aplicación θ:V → V/N recibe el nombre de Proyección Natural del espacio vectorial V sobre V/N. r OBS Si N = {o} ⇒ θ es inyectiva y V {r} ≅ V o 4. TEOREMAS DE ISOMORFÍA. Teorema: 1e r Teorema de Isomorfía. Sean V y W K-espacios vectoriales y f: V → W aplicación lineal. Entonces existe ~ ~ un único isomorfismo de espacios vectoriales f : V → Im ( f ) tal que f = f o θ , Kerf siendo θ:V → V/Kerf la proyección natural de V en V/Kerf. Brevemente escribimos V ≅ Im ( f ) . Kerf Dem. ~ Construyamos la aplicación f y comprobemos que es isomorfismo y única. ~ Definimos f : V
Kerf
~ r r → Im ( f ) con f ([v ]) = f (v ) ∀[v ] ∈ V
Kerf
~ • f esta bien definida. r r r r r r r r Si [v ] = [v ´] ⇒ v − v´∈ Kerf ⇒ f (v − v ´) = o ⇒ f (v ) − f (v´) = o ⇒ r r ~ r ~ r ⇒ f (v ) = f (v´) ⇒ f ([v ]) = f ([v´]) ~ • f es lineal. r r Sean λ, µ∈K y [v ], [v ] ∈ V
Kerf
~ r r ~ r r r r r r ~ r ~ r f (λ[v ] + µ[v´]) = f ([λv + µv ]) = f (λv + µv´) = λf (v ) + µf (v´) = λ ⋅ f ([v ]) + µf ([v ´]) ~ • f es suprayectiva. r r r r r Sea w ∈ Im ( f ) ⇒ ∃v ∈ V / w = f (v ) ⇒ ∃[v ]∈ V ~ Luego f : V
Kerf
Kerf
~ r r r tal que f ([v ]) = f (v ) = w
→ Im ( f ) es un isomorfismo, que además hace conmutativo el
diagrama ~ f = f oθ
13/27
( ~f o θ)(vr) = ~f (θ(vr )) = ~f ([vr ]) = f (vr ) ~ • f es único. ~ Supongamos que ∃f ´: V
Kerf
~ → Im f / f = f o θ
~ r ~ r r ~ r ~ r Entonces f o θ (v ) = f ´([v ]) = f (v ) = f ([v ]) = f o θ (v )
(
)
(
)
~ ~ Luego f ´= f OBS Sea V un K-espacio vectorial y U, W subespacios vectoriales de V con U⊂W. Podemos definir una aplicación ϕ: V/U → V/W de forma natural con r r r ϕ(v + U ) = v + W , v ∈ V . r r r r r r La definición es correcta pues si v + U = u´+U ⇒ v − v ´∈ U ⇒ v − v ´∈ W ⇒ r r r r ⇒ v + W = v ´+W ⇒ ϕ(v + U ) = ϕ(v´+U ) Además, ϕ es lineal y suprayectiva (epimorfismo) y su núcleo es W/U ya que r r r r r r r r Kerfϕ = {v + U / ϕ(v + U ) = o + W } = {v + U / v + W = o + W } = {v + U / v ∈ W } = W / U COROLARIO
2º Teorema de Isomorfía.
Sea V un K-espacio vectorial y U, W subespacios de V con U⊂W. Dada ~ VU V V V ϕ : U → W lineal, existe un único isomorfismo f : W → W tal que U V ~ ϕ = f o θ donde θ es la proyección natural de V/W en U W V
( )
( )
( )
( )
Dem. La demostración es inmediata aplicando el 1er teorema de isomorfia y teniendo en cuenta que Kerϕ = W/U. Teorema. 3e r Teorema de Isomorfía. Sea V un K-espacio vectorial y U, W subespacios de V. Entonces los espacios U +V y W U U ∩ W son isomorfos. Dem. r r Consideremos la proyección θ: V → V/U con θ(v ) = [v ],θ es lineal. Si lo restringimos a W obtenemos la aplicación lineal 14/27
r r r θ w : W → V U θ w(v ) = [v ] ∀ v ∈ W 1) Comprobemos que Im (θ w) = U + W U r r r r r r r r Si [v ]∈ Im (θ w) ⇔ [v ] = θ w ( w) = [w] con w ∈ W ⇔ v − w = u ∈ U ⇒ r r r r r r r ⇒ v = u + w con u ∈ U y w ∈ W ⇔ v ∈ U + W ⇔ [v ] ∈ U + W U 2) Comprobemos que Ker (θ w) = U ∩ W r v ∈W r • Si v ∈ Ker (θ w) ⇒ r r r r r ⇒ θ w (v ) = [o ] ⇒ [v ] = [o ] ⇒ v − o ∈ U r ⇒ v ∈ U ∩ W ⇒ Ker(θ w) ⊂ U ∩ W r r r r r r r • Si v ∈ U ∩ W ⇒ θ w (v ) = θ (v ) = [v ] y como v ∈ U ⇒ [v ] = [o ] ⇒ r ⇒ v ∈ Ker (θ w) ⇒ U ∩ W ⊂ Ker (θ w) Luego Ker (θ w) = U ∩ W Aplicando el 1er teorema de isomorfia a la aplicación θ w W que resulta ser: W U ∩ W ≅ U + W U Ker (θ w) ≅ Im (θ w)
obtenemos
5. BASES. DIMENSIÓN. 5.1. Combinaciones lineales. r r DEF Sea V un K-espacio vectorial y {vi / i : 1,...., n} vectores de V. Diremos que v ∈ V Es combinación lineal de los vectores {vi / i : 1,..., n} si existen {λi / i : 1,..., n} escalares r n r del cuerpo K, tales que v = ∑ λi ⋅ v i . Los λi reciben el nombre de coeficientes de la i =1
combinación Lineal. PROP El vector nulo es Combinación lineal de cualquier conjunto de vectores. Dem. Sea
{v1 , v2 ,..., vn }
un conjunto del K-espacio vectorial V. Basta tomar los r n r coeficientes todos cero para que o = ∑ o ⋅ vi . i =1
15/27
PROP 1) Un vector cualquiera es combinación lineal de si mismo. 2) Un vector pertenece a un conjunto es Combinación lineal de dicho conjunto. Dem. r r r r 1) v = 1 ⋅ v ⇒ v es combinación lineal de {v } r r r 2) Sea {v1 , v2 ,..., vn } un conjunto. r i −1 vi = ∑ o ⋅ v j + 1 ⋅ vi + j =1
n
r
∑o ⋅v
j
∀i : 1,..., n
j =i +1
r r r Luego vi es Combinación lineal de {v1 ,..., vn } r PROP Si un vector w es Combinación Lineal del conjunto r r vi es combinación lineal del conjunto {u1 ,..., um } , entonces {ur1...., urm }
{vr1 ,..., vrn }
y cada uno de los r w es combinación lineal de
Dem. n m r r r r Sabemos que w = ∑ λi vi y cada vi = ∑ µij u j
∀ i : 1,..., n
j =1
i =1
n n m m r r r n m r n r Entonces w = ∑ λi vi = ∑ λi ⋅ ∑ µij u i = ∑ ∑ λi ⋅ µij u j = ∑ ∑ λi µij ⋅ u j i =1 i =1 j =1 i =1 j =1 i =1 j =1
PROP Sea V un K-espacio vectorial y A un subconjunto no vacío de V. El subespacio engendrado por A, [A], es el conjunto de todos los vectores V que se pueden escribir como combinación lineal de los vectores de A. Dem. r r Sea A = {v1 ,....., vn } r r n r Definimos S = v ∈ V / ∃(λi )i :1,.., n ∈ K con v = ∑ λi vi i =1 Hemos de comprobar que S = [A], para lo cual hay que verificar tres condiciones. S es un subespacio de V. r r r n r r n r Sean u , v ∈ S ⇒ u = ∑ λi vi y v = ∑ µi vi i =1
i =1
16/27
n n n r r r u + v = ∑ λi vi + ∑ µi vi = ∑ (λi + µi )vi ∈ S i =1
i =1
n n r r λ ⋅ u = λ ⋅ ∑ λi vi = ∑ (λ ⋅ λi )vi ∈ S i =1
ya que (λi + µi ) ∈ K ∀ i
i =1
ya que λ ⋅ λi ∈ K ∀i
i =1
Entonces S es subespacio vectorial de V. • A⊂S Por una proposición anterior, todo vector de un conjunto, se puede escribir como combinación lineal de dicho conjunto. • S es el más pequeño que lo verifica. Sea S´ un subespacio vectorial de V tal que A⊂S´. r r Si v ∈ A y λi ∈ K ⇒ λi ⋅ vi ∈ S´ ∀ i n
Entonces
r
∑ λ v ∈ S´⇒ S ⊂ S´ i i
i =1
r r OBS El conjunto A = {v1 ,...., vn } es un sistema de generadores de S. 5.2. Dependencia e Independencia Lineal. DEF
r r Sea V un K-espacio vectorial. El conjunto {u1 ,...., un } de vectores de V diremos n
que es Linealmente Independiente si la relación
r
∑ λu i
i
r = o se verifica solamente para
i =1
λi = o ∀ i . r r DEF El conjunto {u1 ,....un } es Linealmente Dependiente cuando no es Linealmente Independiente. r r OBS Es lo mismo decir que {u1 ,....un } es un conjunto Linealmente independiente y r que los vectores {u1 ,...., un } son linealmente independientes. r OBS Si un conjunto de vectores es Linealmente independiente, el vector o se expresa de forma única como combinación lineal de los mismos. En caso de que el vector nulo no se exprese de forma única es cuando decimos que el conjunto es linealmente dependiente. PROP Sea V un K-espacio vectorial. Se verifica: r 1) {o} es un conjunto linealmente dependiente.
17/27
r r r 2) {u} con u ≠ o es un conjunto linealmente independiente. Dem. r r r 1) 1 ⋅ o = o es una combinación lineal del o Linealmente Dependiente.
con escalar no nulo ⇒
{or}
es
r r r r r 2) Una combinación lineal de {u} es λu y λu = o si λ= 0 ya que u ≠ o ⇒ {u } es Linealmente Independiente. PROP Sea V un K-espacio vectorial. Se verifica 1) Todo subconjunto de un conjunto Linealmente independiente es linealmente independiente. 2) Un conjunto que contenga un subconjunto linealmente dependiente es linealmente dependiente. Dem. Inmediata. COROLARIO
Sea V un K-espacio vectorial. Se verifica:
1) Todo vector de un conjunto linealmente independiente es no nulo. r 2) Si un conjunto contiene al vector o es linealmente dependiente. Dem. Inmediata. r r PROP Sea V un K-espacio vectorial. El conjunto {u1 ,..., un } es linealmente dependiente si y sólo si al menos uno de ellos es combinación lineal del resto. Dem. “⇒”
n r r r r Si {u1 ,..., un } son L. D. ⇒ ∃λ1 ,…, λn ∈K no todos nulos tal que ∑ λi ui = o i =1
Sea λj ≠ o con j ∈ {1,..., n} ⇒ ∃λ−1j ∈ K n n n n r r r r r r r λ−j1 ⋅ ∑ λi ui = λ−j1 ⋅ o ⇒ ∑ (λ−j 1λi )ui = o ⇒ u j + ∑ (λ−j1 λi )ui = o ⇒ u j = − ∑ (λ−j1λi )ui i =1
“⇐”
i =1
i =1 i≠ j
Supongamos que uj es combinación lineal del resto.
18/27
i =1 i≠ j
n r Entonces ∃(λi ) ∈ K / u j = ∑ λi ⋅ ui ⇒ Si tomamos λj = -1 podemos escribir i =1 i≠ j
n
r
∑ λu i
i
r r r = o y no todos los escalares son nulos ⇒ {u1 ,..., un } son L. D.
i =1
PROP Sea V un K-espacio vectoria l. Si un vector es combinación lineal de un conjunto {ur1 ,..., urn } de vectores linealmente independientes entonces dicha combinación lineal es única. Dem. r r n r Sea u ∈ V un vector tal que u = ∑ λi ui con λi ∈ K ∀ i . i =1
r n r Supongamos que ∃µ1 ,..., µn ∈ K tal que u = ∑ µi u i i =1
n n r r r n r r o = u − u = ∑ λi u i − ∑ µi ui = ∑ (λi − µi )ui i =1
i =1
i =1
Como {u1 ,....., un } son L. I. ⇒ λi - µi = o ∀i ⇒ λi = µi ∀i Por tanto, la C. L. es única. PROP Si el conjunto {u1 ,...., un } es linealmente dependiente y es un sistema generador para el K-espacio vectorial V, entonces existe un vector uj∈{u1 ,….,un } tal que el conjunto {u1 ,…, uj-1, uj+1 ,…, un } sigue siendo un sistema generador de V. Dem. n r Como {u1 ,....., un } es L. D. ∃u j ∈ {u1 ,...., un } / u j = ∑ λi ui i =1 i≠ j
Vamos a comprobar que {u1 ,...., u j −1 , u j +1 ,..., u n } es Sist. Generador de V. r ∀u ∈ V
∃µi ∈ K
r n r ∀ i : 1,...., n / u = ∑ µi u i ya que {u1 ,...., un } es S. G de V. i =1
n n n n r n r r r r r r u = ∑ µi u i = ∑ µi u i + µ j u j = ∑ µi u i + µj ⋅ ∑ λi ui = ∑ (µi + µ j λi )ui i =1
i =1 i≠ j
r Entonces ∀u ∈ V generadores de V.
i= j i≠ j
r u es C. L. de
i =1 i≠ j
{u ,..., u 1
19/27
j −1
i =1 i≠ j
, u j +1 ,...., u n } luego es un sistema de
r r PROP Sea V un K-espacio vectorial, L = {u1 ,...., u n } un conjunto linealmente r r r independiente y v ∈ V tal que v ∉ L siendo L ∪ {v } un conjunto linealmente r dependiente. Entonces v ∈ [L] . Dem. n
Sea
r
∑λu i
i
r r r + λo v = o una combinación lineal del vector o .
i =1
r Como L ∪ {v } es L. D. ⇒ ∃λj ∈ K con j: 0,…., n no nulo. • Si λo = 0 ⇒ Es escalar no nulo tendría que ser λj con j 1,…., n pero eso entra en contradicción con que L es L. I. • Luego λo ≠ 0 ⇒ ∃λ−1 o ∈ K y por tanto r n r v = ∑ (− λ−o1 ⋅ λi )ui ∈ [L ] i =1
5.3. Bases y Dimensiones. r r DEF Sea un conjunto B = {u1 ,....., un } de vectores del K-espacio vectorial V. Diremos que B es una Base de V si B es un conjunto Linealmente Independiente y Sistema Generador de V. r OBS Si v ∈ V
r n r r r es v = ∑ λi ui con {u1 ,...., un } base de V, la expresión es única y λi i =1
r recibe el nombre de componente i-ésima del vector v en la base {u1 ,...., un } . DEF Diremos que el K-espacio vectorial V es finitamente generado si existe {ur1 ,....., urm } un conjunto finito sistema generador de V. PROP Sea V un K-espacio vectorial, S un conjunto finito sistema generador de V y L⊂S un subconjunto linealmente independiente. Entonces una base B tal que L⊂B⊂S. Dem. Vamos a considerar el conjunto de conjuntos C (G ) = {G / L ⊂ G ⊂ S y G es L.I .} Este conjunto es no vacío ya que, al menos, A pertenece a él. Sea B∈C(G) un conjunto tal que Card (B) ≥ Card (G) ∀G∈C(G) • B es L. I. ya que B∈C(G) • Si Card (B) = Card (S) ⇒ B = S y B es S. G. de V. 20/27
r r Supongamos B ≠ S. Sea v ∈S – B. ⇒ B ∪ {v } es L. D. ⇒ Por una proposición r anterior v ∈ [B] .
r r u ∈V ⇒ u =
=
r
r
∑ λu = ∑ λu
r ui ∈S
i i
r u i∈B
i
i
+
r
∑
r u i∈S − B
r λi ui =
∑ λu
r ui∈ B
i i
+
r λi ⋅ ∑ µ j u j = r u ∈B u∈ S − B j
∑
r
∑ λ u + ∑ ∑ λ µ ⋅ u = ∑ λ + ∑ λ µ ⋅ u ∈ [B]
r u i∈B
i
i
r r u i∈ B u i∈S − B
i
j
i
r ui ∈B
i
r u K∈ S − B
K
j
i
Entonces B es S. G. de V. Si B es L. I. y S. G. de V ⇒ B es base de V. COROLARIO posee una base.
r Todo K-espacio vectorial V finitamente generado y no nulo (V ≠ {o} )
Dem. Como V es finitamente generado, sea S un conjunto finito de generadores de V. r r r r r Como V = {o} ⇒ ∃u ∈ V / u ≠ o . Sea L = {u} que es L. I. Aplicando la proposición anterior, existe B base tal que L⊂B⊂S. COROLARIO Sea V un K-espacio vectorial finitamente generado y N un subconjunto finito linealmente independiente de V. Entonces existe un subconjunto finito N´ de V tal que N∪N´ es base de E. Dem. Como V es finitamente generado, sea S un conjunto S. G. de V. Aplicando la proposición anterior tomando S = S∪N y L = N entonces ∃B base tal que N⊂B⊂S∪N Basta tomar N´ = B – N para demostrar lo pretendido. OBS Podemos deducir que este corolario que dado un conjunto de vectores linealmente independientes de un K-espacio vectorial V finitamente generado, siempre se puede extender ese conjunto a una base, añadiendole vectores adecuados. Veamos ahora que relación existe entre dos conjuntos que sean base de un mismo K-espacio vectorial V.
21/27
TEOREMA Teorema de la Base. Todas las bases de un mismo K-espacio vectorial finitamente generado tienen el mismo número de elementos. Dem. Sean B y B´ dos bases de V. Si comprobar que n = m. r Sea B = {u1 ,....., un }
y
n r r r ∀v j ∈ B´ v j = ∑ λij u j
Card (B) = n
y
Card (B´) = m hemos de
r r B´= {v1 ,....., vm } r r por ser B = {u1 ,...., un } base de V.
i =1
r Sea el conjunto B ∪ {v1 } que es S. G. ya que B es S. G. y L. D. ya que v1 es combinación lineal de B. r r r Podemos extraer una base B1 = {v1 , u1 ,....., u p } con p < n y 1 + p ≤ n. r Repitiendo el proceso, el conjunto B1 ∪ {v2 } es S. G. y L. I. r r r r Podemos extraer una base B2 = {v1 , v2 , u1 ,...., us } s < p y 2 + s ≤ n. Reiterando el proceso m veces encontramos una base r r r r r Bm = {v1 , v 2 ,...., vm , u1 ,...u r } con m ≤ m + r ≤ n ⇒ m ≤ n. Si realizamos el mismo razonamiento, pero invirtiendo los papeles de B y B´ llegamos, después de n pasos, a una base r r r r Bn ´= {u1 ,..., u n , v1 ,..., vt } con n ≤ n + t ≤ ⇒ n ≤ m Luego n = m. DEF Llamamos dimensión de un K-espacio vectorial finitamente generado al número de vectores de una cualquiera de sus bases. Se representa por dim V. COROLARIO Si V es un K-espacio vectorial de dimensión n y B es un conjunto de vectores linealmente independientes tal que Card (B) = n, entonces B es base de V. Dem. Por un corolario previo, existe B´ finito tal que B∪B´ es base de V. Entonces Card (B∪B´) = n
22/27
Y como Card (B) = n ⇒ B´ ≠ Ø y B es base de V. COROLARIO Si V es un K-espacio vectorial de dimensión finita y K es un conjunto de vectores linealmente independientes, entonces Card (L) ≤ dim V. Dem. Supongamos que Card (L) > dim V ⇒ ∃L´⊂L formado por dim V vectores y L. I. Por el corolario anterior L´ es base. Sea v∈L – L´ ⇒ v es C. L. de los vectores de L´ ⇒ ⇒ L´∪{v} es L. D. y como L´∪{v}⊂⇒ L es L. D. lo que es una contradicción con la hipótesis. Luego la suposición es falsa y Card (L) ≤ dim V. 5.4. Bases y Aplicaciones Lineales. r r PROP Sean V1 y V2 K-espacios vectoriales de dimensión finita, B1 = {u1 ,...., un } una r r base de V1 y B2 = {v1 ,..., vn } un conjunto de vectores que V2 . Entonces existe una única r r aplicación lineal f: V1 → V2 tal que f (ui ) = vi ∀i = 1,..., n verificándose que f es un isomorfismo si y solo si B2 es base de V2 . Dem. • Existencia de f. r Sabemos que ∀u ∈ V1
r n r u = ∑ λi ui
con λi ∈ K ∀i
i =1
n r r Definimos f (u ) = ∑ λi vi i =1
- f es lineal r n r Sean u = ∑ λi ui i =1
r n r y v = ∑ µi u i vectores de V1 y λ∈K. i =1
n n n r n r r r r r f (u + v ) = f ∑ (λi + µi )ui = ∑ (λi + µi )vi = ∑ λi vi + ∑ µi vi = f (u ) + f (v ) i =1 i =1 i =1 i =1
n r n r n r r r f (λ ⋅ u ) = f ∑ (λ ⋅ λi )ui = ∑ λλi vi = λ ⋅ ∑ λi vi = λf (u ) i =1 i =1 i =1
23/27
r r - Podemos afirmar que f (ui ) = vi
∀i
• Unicidad de f. r r Sea g: V1 → V2 lineal tal que g (ui ) = vi
∀i
r n r Dado u = ∑ λi ui i =1
n n r r r g (u ) = ∑ λi g (u i ) = ∑ λi vi = f (u ) i =1
i =1
Por tanto g = f. Veamos ahora la segunda parte. Es fácil comprobar que; * Si quieres compruébalo* 1) f inyectiva ⇔ B2 es L. I. 2) f suprayectiva ⇔ B2 es S. G. Por tanto, se deduce que f es biyectiva ⇔ B2 es base de V2 . COROLARIO
Sean V1 y V2 K-espacios vectoriales de dimensión finita. V1 ≅ V2 ⇔ dim V1 = dim V2
Dem. “⇒”
r r Sea f: V1 → V2 isomorfismo y B1 = {u1 ,...., un } base de V1 . r r Por el teorema anterior B2 = { f (u1 ),..., f (un )} es base de V2 . Es claro que Card (B1 ) = Card (B2 ) ⇒ dim V1 = dim V2 .
r r r r “⇐” Sea B1 = {u1 ,...., un } y B2 = {v1 ,...., vn } bases de V1 y V2 respectivamente. El teorema anterior nos dice que la única aplicación lineal f: V1 → V2 tal que r f (ui ) = vi ∀ i : 1,...., n tiene que ser isomorfismo. Entonces V1 y V2 son isomorfos.
5.5. Dimensión de Subespacios y Espacios Cociente. PROP Sea V un K-espacio vectorial, B base de V, W el subespacio vectorial engendrado por un subconjunto B´ de B con B´ ≠ B. Entonces el conjunto B – B´ es base de V/W.
24/27
Dem. r r r r Sea B = {u1 ,...., un } y, por ejemplo, B´= {u1 ,..., us } con s < n. r r Por hipótesis W = [B´] y B − B´= {us +1 ,...., u n } • Comprobemos que B – B´ es S. G. de V/W. r r n r Sea [v ] ∈ V/W. Como B es base de V ⇒ v = ∑ λi ui i =1
n r r Por tanto [v ] = ∑ λi ⋅ [u i ] = i =1
n
r
∑ λ [u ] i
i
i =S +1
r r r ya que [ui ] = [o ] ∀i : 1,..., S porque ui ∈ W
∀ i : 1,..., S
• B – B´ es L. I. r r ∑ λi [u i ] = [o ] ⇒ n
Sea
i = S +1
r
n
∑ λ u ∈W i i
i =S +1
S S r r r λ u = λ u ⇒ ∑ i i ∑ i i ∑ λiu i − n
Como B´ es base de W
i = S +1
i =1
i =1
n
r
∑ λu i
i
r =o
i = S +1
Por ser B base de V, en particular son L. I. ⇒ λi = 0 ∀i: 1,…..,n Entonces λi = 0 ∀i: S+1,….,n y B – B´ son L. I. Por tanto B – B´ es base de V/W. PROP Sea V un K-espacio vectorial de dimensión finita y W un subespacio vectorial de V. Se verifica la relación dim V = dim W + dim V/W Dem. r Si W = {o} ⇒ V {or} ≅ V y dim W = 0, dim V W = dim V r Si W = V ⇒ V V ≅ {o} y dim V W = 0, dim V = dim W r r r r r En caso contrario, sea {u1 ,..., us } base de W y se puede extender a {u1 ,..., us ,..., u n } base de V. Por la proposición anterior {u s +1 ,...., un } es base de V/W y
25/27
dim · V = n, dim W = S dim V/W = n – S verificándose la igualdad dim V = dim W + dim V/W COROLARIO la igualdad
Si U1 y U2 son subespacios de un K-espacio vectorial V, se satisface dim (U1 + U2 ) + dim (U1 ∩U2 ) = dimU1 + dimU2
Dem. Por el 3er teorema de isomorfía: U1 + U 2
U1 ≅
U2
U1 ∩ U 2
y podemos afirmar que dim U1 + U 2 U = dim U 2 U ∩ U 1 1 2 Aplicando la proposición anterior obtenemos dim (U1 + U 2 ) − dim U1 = dim U 2 − dim (U1 ∩ U 2 ) de lo cual se deduce la igualdad a comprobar. OBS Si la suma es directa ⇒ dim (U1 ⊕ U2 ) = dim U1 + dim U2 6. ESPACIOS VECTORIALES COMPLEMENTARIOS. DEF Sea V un K-espacio vectorial y W un subespacio vectorial de V. Diremos que U es un subespacio vectorial complementario de W si V = W⊕U. PROP Sea V un K-espacio vectorial de dimensión finita. Todo subespacio W de V admite complementario. Dem. Denotemos por U el complementario de W. r Si W = {o} ⇒ U = V r Si W = V ⇒ U = {o} Supongamos que W es un subespacio no trivial. Sea B una base de W (W es una dimensión finita al serlo V). 26/27
∃B´ subconjunto de V B ∪ B´ es base de V. Veamos que U = [B´] r • ∀u ∈ V
r r r u = ∑ λv ⋅ v + ∑ λv´ ⋅ v´⇒ V = W + U r v∈B
r v∈B ´
r • dim (W ∩ U ) = dim W + dim U − dim (W + U ) = 0 ⇒ W ∩ U = {o }
27/27
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 13 POLINOMIOS. OPERACIONES. FÓRMULAS DE NEWTON. DIVISIBILIDAD DE POLINOMIOS. FRACCIONES ALGEBRAICAS. 1. El Anillo de los Polinomios de una variable. 1.1. Suma de Polinomios. 1.2. Producto de Polinomios. 1.3. El anillo de los polinomios. 1.4. Otras Estructuras de A[x]. 1.5. Notación Clásica de los Polinomios. 2. Fórmulas de Newton. 2.1. Números Combinatorios. 2.2. Fórmula de Newton. 2.3. Fórmula de Leibniz. 3. Divisibilidad de Polinomios. 3.1. División Enclidea. 3.2. Relaciones de K[x]. 3.3. Máximo Común Divisor y Mínimo Común Múltiplo de Polinomios. 3.4. Descomposición factorial en K[x]. 4. Razones Algebraicas. 4.1. El cuerpo de las razones algebraicas. 4.1.1. Suma de Razones Algebraicas. 4.1.2. Producto de Razones Algebraicas. 4.1.3. El cuerpo ce las Razones algebraicas. 4.2. Descomposición en Fracciones Simples. Bibliografía Recomendada.
1/28
TEMA 13 POLINOMIOS. OPERACIONES. FÓRMULAS DE NEWTON. DIVISIBILIDAD DE POLINOMIOS. FRACCIONES ALGEBRAICAS. 1. EL ANILLO DE LOS POLINOMIOS DE UNA VARIABLE. Vamos a considerar por la letra A un anillo conmutativo con elemento unidad, (A, +, ·). Representaremos por 0 al elemento neutro de (A, +) y por 1 al neutro de (A, ·). Es evidente que todo lo que digamos sobre A, serán válidas para un cuerpo K (siendo habitualmente 3 ó "). DEF Llamaremos Polinomio de una indeterminada con coeficientes en A a toda sucesión (am)m∈– de elementos de A verificando que existe un cierto n∈– tal que am = 0 ∀m > n. NOTACIÓN El conjunto de los polinomios de una indeterminada con coef. en A se denota por A[x]. Ejemplos. (2, 3, -1, 0, 0,….) y (0, -1, 0, 1, 2, 0, 0,…) son dos polinomios con coeficientes en el anillo de los números enteros, 9. DEF Los elementos am∈A de un polinomio reciben el nombre de coeficientes. El elemento ao se llama término independiente y el elemento an tal que am = 0 ∀m > n recibe el nombre de coeficiente principal. DEF Llamaremos grado de un polinomio al nº n, siempre que an sea el coeficiente principal del mismo. 1.1. Suma de Polinomios. DEF Dados P, Q∈A[x] polinomios con P = (am)m∈– y Q = (bm)m∈– definimos la suma +: A[x] x A[x] → A[x] como P + Q = (ao + bo , a1 + b1 , a2 + b2 ,…..) = (am + bm)m∈– La suma está bien definida ya que ∃n ∈ – / am = 0 ∀m > n ∃n´ ∈ – / bm = 0 ∀m > n´ Entonces am + bm = 0 ∀m > max (n, n´) ⇒ P + Q ∈ A[x] PROP La suma de polinomios de A[x] verifica las siguientes propiedades, siendo P, Q y R elementos de A[x]:
2/28
1) Conmutativa: P + Q = Q + P 2) Asociativa: (P + Q) + R = P + (Q + R) 3) Existencia de Elemento neutro: P + 0 = P 4) Existencia de Elemento Simétrico: P + (-P) = 0 Dem. Sean P = (am)m∈–, Q = (bm)m∈– y R = (cm)m∈– 1) P + Q = (am + bm)m∈– = (bm + am)m∈– = Q + P 2) Análogo 3) Sea 0 = (0, 0, 0,….) el polinomio con todos sus coeficientes nulos. Así definido, el polinomio 0 verifica que es el polinomio neutro para la suma. 4) Sea - P = (- am)m∈– el polinomio con todos sus coeficientes con signo contrario a los de P. Trivialmente verifica que P + (- P) = 0 El conjunto A[x] con la ley de composición interna así definida (A[x], +) tiene estructura de grupo conmutativo. 1.2. Producto de polinomios. DEF Dados P, Q∈A[x] polinomios con P = (am)m∈– y Q = (bm)m∈– definimos el producto ·: A[x] x A[x] → A[x] como P
m
P · Q = (ao · bo , ao · b1 + a1 · bo ,…., ∑ ai ⋅ bp −i ,.... ) = ( ∑ ai bm −i )m∈– i= 0
i= 0
El producto está bien definido ya que ∃n∈– / am = 0 ∀m>n ∃n´∈– / am = 0 ∀m>n´ P
Entonces
∑ab i
i= 0
p −i
m = 0 ∀ p > n + n´⇒ ∑ ai bm −i i= 0
m∈–
∈A[x]
PROP El producto de polinomios definido en A[x] verifica las siguientes propiedades, con P, Q, R∈A[x].
3/28
1) Conmutativa
P·Q= Q·P
2) Asociativa
(PQ)R = P(QR)
3) Existencia de elemento neutro
P·1=P
Dem. En la demostración tendremos en cuenta que m
∑ab
i m− i
i= 0
1) P ⋅ Q = ∑ ai b j m∈– = i+ j
= ∑ ai b j i+ j
∑ b j ai m∈– = ∑ bi a j m∈– = P ⋅ Q i+ j i+ j= m
2) ( PQ)R = ∑ ∑ ai b j ⋅ c K m∈– = ∑ ∑ ai b j c K m∈– = ∑ ai b j cK K + p =m i + j = p K + p =m i + j = p i + j + K =m =
∑ a ⋅ ∑ b c
q +i = m
i
j K
j + K =q
m∈– =
= P ⋅ (QR )
3) Sea 1∈K[x] definido como 1 = (1, 0, 0, 0,….) Entonces verifica que P · 1 = P
∀P∈A[x].
El conjunto A[x] con la ley de composición interna así definida (A[x], ·) tiene estructura de semigrupo conmutativo. 1.3. El Anillo de Polinomios. PROP Dado A[x] con la suma y el producto definidos, se verifica la propiedad distributiva del producto respecto de la suma. Dem. ∀P, Q, R∈A[x], hemos (P + Q)R = PR + QR.
de
comprobar
P · (Q + R) = PQ + PR y
Al verificarse la propiedad conmutativa tanto para la suma como para el producto, solo es necesario comprobar una de ellas. P(Q + R) = ∑ ai ⋅ ∑ b j + ∑ cK = ∑ ai ⋅ ∑ (b j + c j ) = ∑ ai (b j + c j ) = i∈Ν k∈ Ν i+ j= m j ∈N
4/28
=
∑ ab i
i + j =m
j
+
∑a c i
j
= PQ + PR
i + j =m
Como conclusión podemos afirmar que (A[x], +, ·) tiene estructura del Anillo conmutativo con elemento unidad. A[x] recibe el nombre del anillo de los polinomios en una indeterminada. PROP Si A es un dominio de Integridad ⇒ A[x] es un dominio de Integridad. Dem. Sean P, Q ∈ A[x] dos polinomios no nulos. P = (am)m∈– = (ao , a1 ,….,an , 0,…) con am = 0 ∀m > n y an ≠ 0 Q = (bm)m∈– = (bo , b1 ,…..,bp , 0,…) con bm = 0 ∀m > p y bp ≠ 0 P · Q = ∑ ai b j m∈–= (….., an · bp ,….) y an · bp ≠ 0 ⇒ PQ ≠ 0 i+ j= m OBS Si A[x] es un dominio de integridad, podemos afirmar que grad (P · Q) = grad (P) + grad (Q) ∀P, Q ∈ A[x] no nulos. 1.3. Otras Estructuras de A[[ x]]. Comprobemos que el anillo A se puede identificar con un subconjunto de A[x]. PROP Sea f: A → A[x] mediante f(a) = (a, 0, 0,….). Entonces f es un monomorfismo. Dem. • f(a + b) = (a + b, 0, 0,….) = (a, 0, 0, 0,….) + (b, 0, 0,…) = f(a) + f(b) • f(a · b) = (ab, 0, 0,….) = (a, 0, 0,….) · (b, 0, 0,…) = f(a) · f(b) • f(1) = 1 siendo 1 = (1, 0, 0,….., 0) • f es inyectiva. f(a) = f(b) ⇒ (a, 0, 0,….) = (b, 0, 0,…) ⇒ a = b OBS Si identificamos el elemento a con el polinomio (a, 0, 0,….) podemos considerar que A⊂A[x]. Los llamaremos polinomios constantes. Según lo anterior, los elementos de A son polinomios de grado cero, excepto el 0 = (0, 0, 0,….) que no tiene grado.
5/28
DEF Definimos la operación externa • A : AxA[x] → A[x] como ∀a∈A ∀(bm)m∈–∈A[x] a· (b1 , b2 , b3 ,….) = (a, 0, 0, 0,…) (b1 , b2 , b3 ,….) = (ab1 , ab2 , ab3 ,…). PROP La operación externa definida anteriormente verifica las siguientes propiedades; dados ∀λ, µ∈A y ∀P, Q∈A[x]. 1) Distributiva respecto de las Escalares:
(λ + µ) ⋅ P = λP + µP
2) Distributiva respecto de los polinomios: λ( P + Q) = λP + λQ 3) PseudoAsociativa: λ ⋅ ( µP ) = (λµ) ⋅ P 4) Elemento Unidad: 1 ⋅ P = P Dem. Inmediata. Como A es un anillo y (A[x], +) es un grupo conmutativo, entonces (A[x], +, • A) tiene estructura de A-módulo. Si A tuviese estructura de cuerpo (habitualmente utilizaremos como dominio de operadores el cuerpo 3 o el cuerpo ") lo denotaremos por K, y entonces (A[x], +, • K) es un espacio vectorial sobre K. Y aun podemos definir otra nueva estructura algebraica sobre A[x]. Como es un anillo conmutativo y unitario que verifica λ( PQ) = (λP)Q = P(λQ) ∀λ ∈ A
y ∀ P, Q ∈ A[ x]
entonces A[x] es un A-álgebra, o álgebra de los polinomios con una indeterminada sobre el anillo A. 1.4. Notación Clásica de los Polinomios. DEF Sea X el polinomio de A[x] que tiene todos sus coeficientes nulos menos el segundo, cuyo valor es 1 (Neutro del producto en A). Es decir, X = (0, 1, 0, 0,….). ( PROP X = (0, 0,…,0, 1 , 0,…) n
n +1
∀n∈–
Dem. Inmediata. Dado P∈A[x] con P = (am)m∈– podemos escribirlo como P = (a0 , a1 , a2 ,…) = (a0 , 0, 0,…) + (0, a1 , 0,…) + (0, 0, a2 ,…) + ….= a0 + a1 (0, 1, 0,…) + a2 (0, 0, 1,…) +... = 6/28
= a0 + a1 x + a2 x2 +…. + an xn sabiendo que am = 0 ∀m > n PROP Se verifica: 1) aKxK + bK xK = (aK + bK)xK
∀k∈–
2) (aKxK ) · (bp xp ) = aK · bp · xK+p
∀k, p∈–
Dem. Inmediata. Si tomamos X0 = 1 por convenio, junto con la proposición anterior, obtenemos una forma cómoda de realizar la suma y el producto de polinomios. DEF Un polinomio P∈A[x] recibe el nombre de Monomio si todos sus coeficientes son nulos menos uno. DEF
Llamaremos Polinomio a una suma finita de monomios.
Ejemplo. 1) aixi es un monomio y a0 + a1 x +….+ an xn un polinomio. 2. FORMULA DE NEWTON. Antes de llegar a obtener la fórmula de Newton para el desarrollo, la potencia de un binomio, o su generalización a la potencia de un polinomio mediante la fórmula de Leibniz, veamos unos resultados previos. 2.1. Números Combinatorios. Debido a que en la fórmula de Newton aparecen los números combinatorios, comenzaremos el repaso por éstos, remitiendo al lector al tema 3 del temario específico si desea encontrar las demostraciones de las propiedades que enumeremos. Sabemos que los números combinatorios se definen como n n! = K K! (n − K )! siendo sus propiedades más importantes: n 1) = 1 0
n y = 1 n
7/28
n n 2) = K n − K n n − 1 n − 1 3) = + Llamada fórmula de Stiefel. K K − 1 K n n −1 n − 2 K K − 1 4) = + + ..... + + K K − 1 K − 1 K − 1 K − 1 Si escribimos los números combinatorios en forma de triángulo 1 0 2 0 3 0 4 0
2 1
3 1
4 1
1 1 2 2
3 2
4 2
3 3
4 3
4 4
…………. Y aplicando la fórmula de Stieffel, obtenemos que cada número combinatorio es suma de los dos que tiene encima, quedando 1 1 1 2 1 1 3 3 1 1 4 6 4 1 …….. que se conoce como triángulo de Tartaglia (Nicola de Fontana) o triángulo de Pascal. 2.2. Fórmula de Newton. Vamos ahora a obtener el desarrollo del binomio de Newton, para lo cual utilizaremos las propiedades de los números combinatorios. n n− K K a ·b K =0 K n
PROP Se verifica
(a + b )n = ∑
Dem. 8/28
Realizaremos la demostración por inducción en el exponente, n. 1 1 1 1 a + b = ∑ a1 −K ·b K K=0 K 0 1
Para n = 1
(a + b )1 = a + b = 1 ⋅ a + 1·b =
Para n = 2
(a + b )2 = a 2 + 2ab + b 2 =
2 2 2 2 2 2 a + ab + b 2 = ∑ a 2 −K ⋅ b K K =0 K 0 1 2
Supongamos que
(a + b )
n −1
n − 1 n −1 n − 1 n − 2 n − 1 n − 2 n − 1 n −1 = a + a ·b + .... + ab + b = n 1 n − 2 n − 1
Veamos para n
n − 1 ∑ K =0 K n −1
(a + b )n = (a + b )n−1·(a + b ) = (a + b )n−1·a + (a + b )n−1 ·b =
n −1 n − 1 n − K K n −1 n − 1 n −1− K K +1 = ∑ a ·b + ∑ a ·b = K =0 K K=0 K
n − 1 n n −1 n − 1 n − K K n −2 n − 1 n −( K +1 ) k +1 n − 1 n = a + ∑ a ·b + ∑ a ·b + b = K =1 K K=0 K 0 n − 1 n − 1 n n −1 n − 1 n − K K n −1 n − 1 n − K K n − 1 n = a + ∑ a ·b + ∑ a ·b + b = K =1 K K =1 K − 1 0 n − 1 n − 1 n n −1 n − 1 n − 1 n − K K n − 1 n a + ∑ + a ·b + b = = K 01 K 0 K − 1 n − 1 Aplicando la fórmula de Stiefel. n − 1 n n −1 n n − K K n − 1 n = a + ∑ a b + b = K =1 K 0 n − 1 n − 1 n Y teniendo en cuenta que = 0 0
n − 1 n y = queda n − 1 n
n −1 n n n n n = a n + ∑ a n − K ·b K + b n = ∑ a n −K ·b K . K =1 K K=0 K 0 n
9/28
n −1− K
·b K
El resultado anterior lo podemos particularizar a los binomios de A[x]. n K n·(n − 1) 2 x = 1 + nx + x + ..... + nx n −1 + x n 2 K =0 K n
(1 + x )n = ∑ n
n
K=0
(a + x )n = ∑ a n−K · x K K n
n
K=0
= a n + na n −1 ·x +
(a + bx )n = ∑ a n−K ·(bx )K K
n(n − 1) n −2 2 a · x + .... + nax n −1 + x n 2
= a n + na n −1 ·b·x + .... + nab n −1 · x n −1 + b n x n
Y en general:
(ax
i
+ bx j
) = ∑ Kn (ax ) ·(bx ) n
n
i n− K
j K
=a n ·x ni + na n −1 ·b· x ni −i + j + .... + nab n −1 x nj +i − j + b n x nj
K=0
2.3. Fórmula de Leibniz. La fórmula de Newton se puede generalizar a un polinomio cualquiera. Vamos a explicar como se obtiene el desarrollo de la potencia n-ésima de un polinomio formado por m términos, sin entrar en demostraciones farrangosas. m
Sea el polinomio (a1 + a2 +….+ am) que lo expresaremos por
∑ a . Queremos i
i =1
calcular su potencia n-ésima. n
m ∑ ai = (a1 + .... + am )·(a1 + ..... + a m )·.....·(a1 + ..... + am ) i =1 siendo un producto de n factores. Si aplicamos de forma reiterada la propiedad distributiva obtenemos que cualquier sumando del desarrollo es de la forma: m
a1α1 ·a α2 2 ·......·aαmm = Π aαi i i =1
(1)
verificándose que la suma de exponentes es n m
∑α
i
=n
i =1
Para ver el coeficiente que antecede a cada sumando, hemos de contar las veces que aparece repetido. Para ello, tengamos en cuenta que el término (1) proviene de una
10/28
permutación de los (ai )i :1,..., m en los que cada ai aparece repetido α i veces. Ese número de permutaciones es Pnα1 ,α2 ,..., αm =
n! α1!α2 !·....·αm !
3. DIVISIBILIDAD DE POLINOMIOS. A lo largo de este punto, trabajaremos con el cuerpo K en lugar del anillo conmutativo A. Por tanto, llamaremos K[x] al anillo de los polinomios en una indeterminada (sobre el cuerpo K). 3.1. División Enclíde. PROP Sean A y B polinomios de K[x] con B ≠ 0. Existen y son únicos dos polinomios C y R de K[x] verificando A = B· C + R
y
grad (R) < grad (B) si R ≠ 0
Dem. • Existencia. Consideremos el conjunto de los polinomios de la forma A – BQ donde Q recorre k[x]. Se pueden dar dos casos: a) Existe C∈K[x] tal que A - BC = 0 Entonces A = BC y tenemos demostrada la existencia. En este caso R = 0. b) ∀ Q∈K[x] A – BQ ≠ 0 ⇒ ∃⊂∈K[x] /grad (A – BC) ≤ grad (A – BQ) ∀Q∈K[x] Escribamos A = BC + R. Comprobemos que grad (R) < grad (B). Supongamos que grad (R) ≥ grad (B). Si grad (B) = m ⇒ grad (R) = m + K con K ≥ 0. Entonces B = bo + b1 x + ... + bm x m con bm ≠ 0 R = ro + r1 x + .... + rm + K ·x m + K con rm + K ≠ 0
(K ≥ 0)
Si multiplicamos el polinomio B por el monomio −1 m
c K = rm + K ·b ), obtenemos que (R´) < grad (R), de donde
K
R´= R − c K x ·B
−1
rm + K ·(bm ) x K
(llamaremos
es un polinomio tal que grad
A = BC + R = BC + R´ + CK xK · B = B(C + CKxK) + R´= BC´ + R´
11/28
que puede escribirse como A – BC´ = R´ Siendo, por hipótesis, R´ ≠ 0 Pero grad (R´) < grad (R) con lo que Grad (A – BC´) < grad (A – BC) lo que es una contradicción con la elección que hemos de C. Por tanto ∃C∈ K[x] / A = BC + R con grad (R) < grad (B) • Unicidad. Supongamos que ∃C1 R1 ∈K[x] /A = BC 1 + R1 con grad (R1 ) < grad (B) Entonces R – R1 = B (C 1 – C) Si C1 ≠ C ⇒ grad (R – R1 ) ≥ grad (B) Y llegamos a una contradicción. Entonces C1 = C y por tanto R1 = R, siendo únicos. Si realizamos la división euclidea de A entre B, llamamos cociente al polinomio C y Resto al polinomio R, tal que A = BC + R. 3.2. Relaciones en K[[ x]]. DEF Diremos que dos polinomios P, Q∈K[x] son Asociados cuando sólo se diferencian en el producto de constantes. Es decir, P = a · Q con a∈ ∈ K. Podemos definir en K[x] la relación siguiente: DEF Dados P, Q∈K[x], P ∼ Q si y solo si ∃a∈K / P = a · Q. La relación recibe el nombre de “ ser asociado”. PROP La relación definida anteriormente es una relación de equivalencia. Dem. Inmediata. DEF Sean P y Q dos polinomios de K[x]. Diremos que Q divide a P si existe C∈K[x] tal que P = QC. Lo denotaremos por Q/P.
12/28
PROP La relación “divide a” es una relación de orden en K[x]. Dem. Inmediata. 3.3. Máximo Común Divisor y Mínimo Común Múltiplo de Polinomios. Como K[x] es un anillo, definiremos los términos de MCD y mcm en función de los ideales de K[x]. PROP Sea I un ideal de K[x]. Entonces existe un polinomio P∈K[x] tal que I es el conjunto de todos los múltiplos de P. Dem. • Si I = {0} ⇒ P = 0 • Si I ≠ {0} ⇒ Sea P∈I un polinomio tal que grad (P) ≤ grad (Q) ∀Q∈I. Entonces P es un polinomio de grado mínimo en I. ∀Q∈P, al realizar la división euclidea. ∃C, R∈K[x] tal que Q = P · C + R con grad (R) < grad (P) Si R ≠ 0 sea R = Q – P · C P∈I, Q∈I, C∈K[x] ⇒ Como I es ideal P · C∈I ⇒ R∈I Contradicción: Hemos llegado a la conclusión de que R∈I con grado menor que el de P. Entonces R = 0 y Q = P · C ⇒ Q∈(P) ⇒ I⊂(P) Como trivialmente P∈I ⇒ (P) ⊂ I. Obtenemos que I = (P). El polinomio P es único, salvo asociados. DEF Llamamos Base de ideal I (con I ≠ {0}) al polinomio normalizado P tal que I = (P). (Polinomio Normalizado es el polinomio de coeficiente principal 1). En caso de que I = {0}, el polinomio base de I será P = 0. DEF Sean P y Q polinomios de K[x]. Llamamos máximo común divisor de P y Q y se representa por MCD (P, Q), al polinomio base del ideal (P) + (Q).
13/28
PROP Sea D = MCD (P, Q) siendo P, Q∈K[x] dos polinomios. El polinomio D verifica: 1) ∃A, B∈K[x] dos polinomios tales que D = PA + QB 2) D/P y D/Q. 3) Si ∃D´∈K[x] / D´/P y D´/Q ⇒ D´/D (D es el mayor de los divisores comunes). Dem. 1) Sabemos que (P) + (Q) es un ideal de K[x], por lo que existirá D∈K[x] tal que (P) + (Q) = (D). Como D ∈ (D) ya que D = D · 1 ⇒ D∈ (P) + (Q) Si D ∈ (P) + (Q) ⇒ ∃A, B∈K[x] / D = P · A + Q · B D se expresa como un polinomio de (P) más otro de (Q). 2) P ∈ (P) + (Q) ⇒ P ∈ (D) ⇒ D/P Q ∈ (P) + (Q) ⇒ Q ∈ (D) ⇒ D/Q 3) Sea D´∈K[x] tal que D´/P y D´/Q. Entonces ∃G, H∈K[x] tales que P = D´G y Q = D´H Siendo D = P · A + Q · B = (D´G)A + (D´H)B = D´(GA + HB) Y como GA + HB ∈ K[x] ⇒ D´/D DEF
Diremos que dos polinomios P, Q∈K[x] son primos entre si MCD (P, Q) = 1.
PROP Sean P y Q dos polinomios de K[x] y D = MCD (P, Q). Si D ≠ 0 y escribimos P = P´D y Q = Q´D entonces P´ y Q´ son primos entres si. Dem. Dados P y Q
∃A, B∈K[x] / D = P · A + Q · B
D = P´DA + Q´DB ⇒ 1 = P´A + Q´B ⇒ MCD (P´, Q´) = 1 PROP Sean A, P, Q∈ K[x] A/PQ y MCD (A, P) = A/Q Dem.
14/28
Como MCD (A, P) = 1 ⇒ ∃G, H ∈ K[x] / 1 = A · G + PH Al multiplicar por Q resulta Q = AQG + PQH Como A/PQ ⇒ ∃C ∈ K[x] / PQ = AC Luego Q = AQG + ACH ⇒ A = A · (QG + CH) Y como (QG + CH)∈ K[x] ⇒ A/Q COROLARIO
Si A ∈K[x] es primo con P, Q ∈ K[x] entonces A es primo con P·Q.
DEF Sea P y Q dos polinomios de K[x]. Llamamos mínimo común múltiplo de P y Q, y se re presenta por mcm (P, Q), al polinomio base del ideal (P) ∩ (Q). PROP Sean P y Q dos polinomios de K[x] y M = mcm (P, Q). El verifica:
polinomio M
1) P/M y Q/M (M es múltiplo de P y Q). 2) Si ∃M´∈K[x] / P/M´ y Q/M´ ⇒ M/M´ Dem. 1) Por definición de M se tiene (P) ∩ (Q) = (M) M ∈ (P ) ⇒ P / M M ∈ (M) ⇒ M ∈ (P) ∩ (Q) ⇒ M ∈ (Q ) ⇒ Q / M 2) Si ∃M´∈K [x] / P/M´ y Q/M´ ⇒ M´∈ (P) y M´∈(Q) Entonces M´∈(P) ∩ (Q) ⇒ M´∈(M) ⇒ M/M´ Dados dos polinomios de K[x], vamos a ver un método para calcular su máximo común divisor. PROP Sean P y Q dos polinomios de K[x]. Si existen C, R∈K[x] tales que P = QC + R, entonces mcd (P, Q). Dem. Sean D = mcd (P, Q) y D´= mcd (Q, R) Es claro que D/P y D/Q ⇒ D/P y D/QC ⇒ D/P-QC ⇒ D/R Entonces D/Q y D/R ⇒ D/D´. (1) De forma Análoga; como D´/Q y D´/R ⇒ D´/P
15/28
Entonces D´/Q y D´/P ⇒ D´/D (2) Como D y D´ son dos polinomios normalizados, de (1) y (2) se deduce que D = D´. Una vez que sabemos calcular el máximo común divisor, podemos calcular el mínimo común múltiplo de la siguiente forma. m
n
PROP Sean P, Q∈K[x] con P = ∑ ai x
i
i= 0
y Q = ∑ b j x j siendo an ≠ 0 y bm ≠ 0. Si j= 0
D = MCD (P, Q) y M = mcm (P, Q) entonces se verifica la igualdad an · bm · MD = PQ Dem. Sea M´= PQ´ = P´Q ya que P = P´D y Q = Q´D Es claro que el coeficiente principal de M´ es an bm y que PQ = M´· D Por definición de M´ se verifica que M´ es múltiplo de P (P/M´) y de Q (Q/M´), por tanto M´ es múltiplo de M (M/M´) (1). Como M es múltiplo de P y Q ⇒ ∃A, B∈K[x] / M = PA = QB PA = QB ⇒ P´DA = Q´DB ⇒ P´A = Q´B Pero como P´ y Q´ son primos entre si F ⇒ ∃G, H∈K[x] / B = P´G y A = Q´H Entonces M = PA = QB ⇒ M = PQ´H = QP´G ⇒ M = M´H = M´G Luego M es múltiplo de M´ (M´/M) (2) De (1) y (2) se obtiene que M´= an bm M Como PQ = M´D ⇒ PQ = an bm MD 3.4. Descomposición Factorial de K[[ x]] . DEF Diremos que un Polinomio P∈K[x] es Irreducible o Primo si grad (P) ≥ 1 y no es posible escribirlo como producto de dos polinomios P1 , P2 ∈ K[x] tales que grad (Pi) < grad (P) i: 1, 2. En caso contrario diremos que el polinomio es reducible o descomponible en K[x]. PROP Los polinomios de primer grado, X – a, con a∈K son primos o irreducibles en K[x] (cualquiera que sea K). Dem.
16/28
Sea P = X – a con grad (P) = 1. Supongamos que P es reducible: Grad (Pi) < grad (P) ∀i: 1, 2.
∃P1 P2 ∈ K[x] / P = P1 · P2
y
Si P = P1 · P2 ⇒ grad (P) = grad (P1 ) + grad (P2 ) Entonces 1 = grad (P1 ) + grad (P2 ). Caben dos posibilidades: Si grad (P1 ) = 1 y grad (P2 ) = 0 ⇒ Contradicción: grad (P) = grad (P1 ) Si grad (P1 ) = 0 y grad (P2 ) = 1 ⇒ Contradicción: grad (P) = grad (P2 ) Luego P es irreducible. DEF Diremos que K[x] es Algebraicamente Cerrado si sus únicos polinomios irreducibles son de grado 1. El que K[x] sea algebraicamente cerrado depende del cuerpo K. Es decir, el concepto de irreducibilidad de un polinomio depende de K.
(
Por ejemplo, x2 – 5 es irreducible en x2 − 5 = x + 5 x − 5
(
Y también x2 + 5 x2 + 5 = x + i 5 x − i 5 .
( (
)(
)(
Q[x] pero no en 3[x]
))
es
irreducible
en
3[x]
pero
no
en
"[x]
))
"[x] es algebraicamente cerrado. PROP Para todo polinomio P ∈ K[x] tal que grad (P) > 0, existe λ∈K, P1 ,…,Pm∈K[x] polinomios primos normalizados y α 1 , α 2 ,…., αm enteros mayores de 1 únicos tales que P = λ ⋅ P1α1 ⋅ ..... ⋅ Pmα m Dem. • Existencia. Vamos a realizar la demostración por inducción en el grado de P. Si grad (P) = 1 la proposición es trivialmente cierta. Supongamos cierta la proposición para todos los polinomios de grado n – 1. Si grad (P) = n En caso de que P sea irreducible, la descomposición es inmediata. Supongamos pues, que P es descomponible o reducible.
17/28
Entonces ∃Q∈K[x] con 0 < grad (Q) < grad (P) y verificando que el grado de Q es el menor de entre todos los divisores de P que cumplan la condición anterior para los grados. Con esas condiciones podemos decir que Q es irreducible pudiendo escribir P = Q · P´ Pero grad (P´) < grad (P) y aplicando la hipótesis de inducción tenemos P´= λ´P1β1 ⋅ ..... ⋅ Pmβ´m´ donde Q puede coincidir con algún Pi o no . Entonces P = Q ⋅ P´= λP1α1 ⋅ .... ⋅ Pmαm siendo normalizados y 0 < α i enteros ∀i: 1,…., m.
Pi
polinomios irreducibles
• Unicidad. Igualmente realizaremos la demostración por inducción en el grado de P. Si grad (P) = 1 la proposición se cumple de forma evidente. Supongamos que es cierto para grad (P) = n – 1. Si grad (P) = n Supongamos P = λP1α1 ⋅ ..... ⋅ Pmα m = µQ1β1 ⋅ .... ⋅ Qmβ´m´ Como los polinomios Pi i: 1,…., m y Qj j: 1,…, m´ están normalizados, debe de ocurrir que λ = µ. Dados dos polinomios A y B que son irreducibles y normalizados, si A ≠ B entonces A y B son primos entre si. Teniendo en cuenta esto, P1 es primo, normalizado y P1 / Q1β1 ⋅ .... ⋅ Qmβ´m´ Entonces, aplicando una proposición anterior, P1 debe coincidir con algún Qj 1 ≤ j ≤ m´. Sea P1 = Q1 (Reordenamos si es necesario). Entonces queda P1α1 −1 ⋅ P2α 2 ⋅ .... ⋅ Pmαm = Q1β1 −1 ⋅ .... ⋅ Qmβ´m´ Como ahora ambos polinomios tienen un grado menos, aplicamos la hipótesis de inducción.
18/28
Pi = Qi ∀i: 1,…., m,
m = m´
y
αi = β i
∀i: 1,…., m.
Siendo la descomposición única. COROLARIO
Sean A y B dos polinomios de K[x] con A = λP1α1 ⋅ .... ⋅ Pmα m y
B = µ ⋅ P1 β1 ⋅ ..... ⋅ Pmβ m
siendo Pi polinomios irreducibles normalizados, y α i, β i ∈ – - {0} para todo i: 1,…, m. Entonces: Q/P ⇔ β i ≤ α i
∀i: 1,…., m
Hasta ahora hemos estado hablando de polinomios en una indeterminada. Para cada polinomio podemos definir una función como sigue: ∀P∈K[x] definimos P* : K → K aplicación tal que si P = ao + a1 X +….+ an Xn entonces P* (x) = ao + a1 x +….+ an xn
∀x∈K
DEF La aplicación P* recibe el nombre de función polinómica asociada al polinomio P∈K[x]. La suma y producto de funciones polinómicas se realiza como sigue: (P* + Q* ) (x) = P* (x) + Q* (x) (P* Q* ) (x) = P* (x) · Q* (x) Habitualmente, se escribe P(x) en lugar de P* (x). Aun así, debemos ser conscientes de la diferencia, P(x) es una función y P(X) es una función del anillo K[x]. Por abuso de notación llamaremos polinomio a ambos, y los denotaremos igual. DEF Llamaremos valor numérico de un polinomio en una indeterminada, al valor que se obtiene al sustituir la variable por su valor correspondiente. TEOREMA. Teorema del Resto. El resto de la división de un polinomio es X por el binomio X – a coincide con el valor numérico del polinomio en x = a. Dem. Sea P∈K[x]. grad(R) = 0
Al dividir P entre
(X – a) tenemos
Tomando ahora P(a) = (a – a) Q(a) `R ⇒ R = P(a)
19/28
P = (X – a) · Q + R
con
DEF Dado un polinomio P(x), llamaremos raíces o ceros del polinomio a los valores de la indeterminada x, para los que el valor numérico de P(x) es cero. TEOREMA. Teorema del Factor. Sea P∈K[x]. a∈K es raíz de P(x) ⇔ (x – a) / P. Dem. “⇒” Si a∈K es raíz de P ⇒ P(a) = 0 Como P = (x – a) Q + R y P(a) = 0 ⇒ R = 0 Luego P = (X – a) Q ⇒ X – a / P “⇐” Si (X – a) / P ⇒ P = (X – a) · Q Entonces P(a) = (a – a) · Q(a) ⇒ P(a) = 0 ⇒ a es raíz de P. PROP Sea P∈K[x] con P = ao + a1 X +…..+ an Xn con ai∈K i: 1,…, n. Si P admite m raíces distintas x1 , x2 ,…., xm con m ≤ n, entonces P = (X – x1 ) (X – x2 ) ·……· (X – xm)H con H = an · Xn-m +…. Dem. Como x1 ∈K es una raíz de P ⇒ X – x1 / P ⇒ ⇒ P = (X – x1 ) · H1 siendo H1 = an Xn-1 +…. Como x2 ∈K es otra raíz de P ⇒ X – x2 / P ⇒ X – x2 / (X – x1 )H1 Y como X – x2 no divide a X – x1 ⇒ X – x2 /H1 ⇒ H1 = (X – x2 ) H2 con H2 = an Xn-2 +…. ⇒ P = (X – x1 ) (X – x2 ) H2 Reiterando el proceso m veces obtenemos que P = (X x1 ) ·….· (X – xm) · H con H = an Xn-m +…. PROP Todo polinomio de grado n de K[x] admite a lo sumo n raíces. Dem.
20/28
Si grad (P) = n ⇒ P = an Xn +….+ a1 X + ao Si P admite n raíces x1 ,…., xn , por la proposición anterior P = an (X – x1 ) ·….· (X – xn ) Veamos que no puede tener más raíces. Sea r otra raíz de P. Entonces r ≠ xi ∀i: 1,…, n. P(R) = 0 por ser r raíz de P P(r) = an (r – x1 ) (r – x2 )……(r – xn ) ≠ o ⇒ Contradicción, r no es raíz de P, y por tanto P tiene a lo sumo n raíces. 4. FRACCIONES ALGEBRÁICAS. DEF Llamaremos fracción algebraica a un par de polinomios N, D∈K[x] con D ≠ 0. El primero, N, recibe el Nombre de Numerador y el segundo, D, de denominador. Se N representa por . D DEF Definimos en el conjunto K[x] x K[x]* la relación de equivalencia R dada por (siendo K[x]* = K[x] - {0}): N N´ R ⇔ N ⋅ D´= DN ´ D D´ PROP La relación R definida en K[x] x K[x]* es una relación de equivalencia. Dem. Inmediata. DEF Cada clase de K[x] x K[x]* /R recibe el nombre de razón algebraica, siendo K[x] x [x]* /R el conjunto de razones algebraicas. 4.1. El Cuerpo de las Razones Algebraicas. 4.1.1. Suma de razones algebraicas. DEF Definimos en K[x] x K[x]* / R la ley de composición interna que llamaremos suma como A C ∀ , ∈ K [ x]xK[x ]* / R B D
A + C = A· D + B·C B D B·D
21/28
La operación está bien definida. • AD + BC ∈ K[x] y B ≠ 0, D ≠ 0 ⇒ BD ≠ 0 ⇒ BD ∈ K[x]* • No depende del representante elegido. Si A R A´ B B´
y
C R C´ ⇒ A + C = AD + BC y A´ + C´ = A´D´+ B´C´ D D´ B D BD B´ D´ B´ D´
Como AB´ = BA´ y CD´ = DC´ Multiplicando la 1ª igualdad por DD´
ADB´D´ = BDA´D´
Multiplicando la 2ª igualdad por BB´
BCB´D´ = BDB´C´
Sumando y sacando factor común queda B´D´ (AD + BC) = BD (A´D´ + B´C´) Y equivale a AD + BC R A´D´+ B´C´ BD B´D´ Luego la suma no depende del representante elegido. PROP La suma definida en K[x] x K[x]* / R verifica las propiedades 1) 2) 3) 4)
Asociativa Conmutativa Existencia de Elemento Neutro Existencia de Elemento Simétrico.
Dem. Inmediata. El conjunto (K[x] x K[x]* / R, +) tiene estructura de grupo conmutativo. 4.1.2. Producto de Razones Algebraicas. DEF Definimos en K[x] x K[x]* / R la ley de composición interna que llamaremos producto como A C ∀ , ∈ K [x ]xK[x ]* / R B D
A ⋅ C = A⋅ C B D BD
La operación está bien definida 22/28
•
A, C∈K[x] ⇒ A· C∈K[x] B, D∈K[x]* ⇒ B ≠ 0, D ≠ 0 ⇒ BD ≠ 0 ⇒ BD∈K[x]*
•
No depende del representante elegido. A R A´ y C R C´ ⇒ AB´= A´B y CD´= C´D ⇒ B B´ D D´
Multiplicando ambas igualdades ACB´D´ = A´C´BD ⇒ AC A´C´ ⇒ AC · B´D´ = A´C´ · BD ⇒ R BD B´D´ PROP El producto definido en K[x] x K[x]* / R verifica las siguientes propiedades: 1) 2) 3) 4)
Asociativa. Conmutativa. Existencia de Elemento Neutro. Existencia de Elemento Neutro (si la razón es no nula).
Dem. Inmediata. El conjunto (K[x] x K[x]* , ·) tiene estructura de grupo conmutativo. 4.1.3. El Cuerpo de las Razones Algebraicas. PROP En el conjunto K[x] x K[x]* / R se verifica la propiedad distributiva del producto respecto de la suma (por ambos lados). Dem. Inmediata. El conjunto (K[x] x K[x]* /R, +, ·) tiene estructura de cuerpo conmutativo. Recibe el nombre de Cuerpo de las Razones Algebraicas, y se representa por K(x). 4.2. Descomposición en fracciones simples. PROP Dado
A A AP ∈ K ( x ) y P∈K[x] con P ≠ 0, se verifica que = . B B BP
Dem. Inmediata.
23/28
COROLARIO
Para cada
A ∈ K ( x ) , existen dos únicos polinomios A´, b´∈K[x] B
tales que: A A´ = con mcd (A´, B´) = 1 y B´ normalizado B B´ Dem. • Existencia. Sea D = mcd (A, B) ⇒ A = A´D y B = B´D con mcd (A´, B´) = 1 Trivialmente
A A´ = B B´
• Unicidad. Si
A A´´ = con mcd (A´´, B´´) = 1 y B´´ normalizado ⇒ A´B´´ = A´´B´ ⇒ B B´´
⇒ A´ = A´´ y B´ = B´´ A ∈ K ( x ) con mcd (A, B) = 1. Dicha razón algebraica recibe el nombre de B fracción simple, o forma reducida. DEF
Sea
PROP Todo elemento
A (fracción simple) de K(x) se puede escribir de forma única B
como A = P+ R B donde P∈K[x] y R es una fracción simple
A´ , con grad (A´) < grad (B) si R ≠ 0. B
Dem. • Existencia. Sea
A una fracción simple. B
Por la división enclidea ∃P, A´∈K[x] / A = B · P + A´ con grad (A´) < grad (B) Entonces
A A´ = P+ B B
24/28
Y como mcd (A, B) = mcd (B, A´) ⇒
A´ es una fracción simple. B
• Unicidad. A = P + R = Q + S con Q∈K[x] B irreducible y grad (C) < grad (D). Si S ≠ 0. Sea
Entonces P +
Y P−Q=
y
S∈K[x]
siendo
S=
C fracción D
A´ C =Q+ B D
C A´ CB − A´D − ⇒ P −Q = DB D B
En caso de que P ≠ Q ⇒ grad (CB – A´D) = grad ((P – Q) · DB) Y grad ((P – Q) · DB) = grad (P – Q) + grad (D) + grad (B) ≥ grad (D) + grad (B) Siendo grad (CB – A´D) ≥ grad (D) + grad (B)
(1)
CB − A´ D verifica grad (CB – A´D) < grad (DB) lo que es lo mismo DB que grad (CB – A´D) < grad (D) + grad (B) (2) Por otro lado
De (1) y (2) se deduce una contradicción, que viene de suponer P ≠ Q. Entonces P = Q y R = S. DEF
El polinomio P que nos da la proposición anterior se llama parte entera de
A . B
A ∈ K ( x ) con grad (A) < grad (B) sí A ≠ 0. Sea B = B1 · B2 con B1 y B A B2 primos entre sí. Entonces se descompone de forma única como B LEMA
Sea
A N1 N2 = + B B1 B2 con grad (N i) < grad (Bi) si Ni ≠ 0 ∀i: 1, 2. Dem. • Existencia.
25/28
Como B1 y B2 son coprimos, ∃P, Q∈K[x] tales que 1 = B1 P + B2 Q Y entonces A = AB1 P + AB2 Q
(1)
Si dividimos AP entre B2 (por ser B2 ≠ 0) tenemos ∃C, N∈K[x] / AP = B2 C + N2 con grad (N 2 ) < grad (B2 ) (2) Al sustituir (2) en (1) A = (B2 C + N2 ) B1 + AB2 Q A = B1 B2 C + N2 B1 + AB2 Q A = (B1 C + AQ) B2 + N2 B1 Llamando N1 = B1 C + AQ queda A = N1 B2 + N2 B1
(3)
Si grad (N 1 ) ≥ grad (B1 ) ⇒ grad (A) ≥ grad (B1 ) + grad (B2 ), grad(N 2 ) < grad (B2 ) si N2 ≠ 0, lo que contradice la hipótesis.
pues
Por tanto si N1 ≠ 0 grad (N 1 ) ≥ grad (B1 ) De la expresió n (3) se deduce que
A N1 N2 = + B B1 B2
• Unicidad. Supongamos que
A N1 N2 N1´ N 2 ´ = + = + con grad (N i´) < grad (Bi) si Ni´ ≠ 0 B B1 B2 B1 B2
∀i:1, 2. Entonces
N1 − N1´ N2 ´− N2 = B1 B2
verificándose B2 (N 1 – N1 ´= B1 (N 2 ´ - N 2 ) Y como N2 ´= N2 .
B1 y B2
son coprimos, la igualdad sólo puede ser cierta si N1 = N1 ´ y
A ∈ K ( x ) con grad (A) < grad (B) si A ≠ 0. Sea B = B1 · B2 · ….· Bp B A con Bi y Bj coprimos ∀i ≠ j. Entonces se descompone de modo único como B LEMA
Sea
26/28
N A N1 = + ..... + p B B1 Bp con grad (N i) < grad (Bi) si Ni ≠ 0 ∀i: 1,…., p. Dem. Inmediata aplicando inducción. A A ∈ K ( x ) con grad (A) < grad (Bm) sí A ≠ 0. Entonces m se m B B descompone de forma única como LEMA
Sea
A N N N = 1 + 22 + ...... + mm m B B B B siendo grad (N i) < grad (B) si Ni ≠ 0 ∀i: 1,…, m. Dem. Vamos a demostrar el lema mediante inducción en m. Para siendo N1 = A.
m = 1. Es evidente,
Supongamos cierto el lema cierta para m – 1. Para m. • Existencia. Si realizamos la división enclidea de A entre B ∃C, R∈K[x] / A = BC + R con grad (R) < grad (B) si R ≠ 0. Entonces
A C R = n −1 + n n B B B
(1)
C A− R = y como grad (A) < grad (Bn ) y grad (R) < grad (Bn ), n −1 B Bn entonces grad (C) < grad (Bn-1) si C ≠ o. Despejando
C la hipótesis en inducción y sustituyendo en (1) obtenemos la B n −1 descomposición pedida. Aplicamos a
• Unicidad.
27/28
Supongamos que
A N N N´ N ´ = 1 + .... + mm = 1 + .... + mm con grad (N i´) < grad (B) m B B B B B
si Ni ≠ 0 ∀i: 1,…., m Si multiplicamos por Bm la expresión anterior Nm + BP = Nm´ + BQ con P, Q∈K[x], verificándose Nm – N m´ = B(Q – P) Y teniendo en cuenta las relaciones entre los grados, la igualdad anterior solo es cierta si Nm - Nm´ = 0 ⇒ Nm = Nm´ y P = Q Aplicando ahora la hipótesis de inducción a
P Q = n −1 obtenemos Ni = Ni´ n −1 B B
∀i:1,…, m – 1. TEOREMA. Teorema de Descomposición. A A ∈K[x] fracción simple. Supongamos que E es la parte entera de y que B B B = λB1α1 ·......· Bsαs es su descomposición en factores primos con λ∈K. Entonces, la descomposición Sea
N N N A N N N = E + 11 + ...... + 1αα11 + 21 + .... + 2αα22 + .... + S 1 + .... + SααSS B B1 B B2 B2 BS BS es única donde grad (N ij) < grad (Bi) si Nij ≠ 0
∀j: 1,…., α i
∀i:1,…., s.
Dem. Este resultado es una consecuencia inmediata de la última proposición y de los dos últimos lemas.
Bibliografía Recomendada. Álgebra. Aut. Serge Lang. Ed. Aguilar. Algèbre. Aut. S. MacLane, G. Birkhoff. Ed. Gauthier Villars. Curso de Álgebra Moderna. Aut. Peter Hilton. Ed.Reverté. Álgebra. Aut. Thomas W. Hungerford. Ed. Springer-Verlag.
28/28
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 14 ECUACIONES. RESOLUCIÓN DE ECUACIONES. APROXIMACIÓN NUMÉRICA DE RAÍCES. 1. Introducción. 2. Ecuaciones Algebraicas. Raíces. 2.1. Ecuaciones de Cardano-Vieta. 3. Resolución de Ecuaciones. 3.1. Ecuaciones de primer grado. 3.2. Ecuaciones de segundo grado. 3.3. Ecuaciones de tercer grado. 4. Aproximación Numérica de Raíces. 4.1. Cálculo de las raíces enteras y racionales de un polinomio con coeficientes Racionales. 4.1.1. Raíces enteras. 4.1.2. Raíces Racionales. 4.2. Acotación de las Raíces Reales. 4.2.1. Método de Laguerre. 4.2.2. Método de Newton. 4.3. Separación de las Raíces Reales. 4.3.1. Separación de las raíces de un polinomio por medio de su derivada. 4.3.2. Método de Budan-Fourier. 4.3.3. Método de Sturns. 4.3.4. Método de Harrior-Descartes. 4.4. Aproximación de las Raíces Reales. 4.4.1. Método de Newton. 4.4.2. Método de las Regula Falsi. 4.4.3. Método general de Iteración.
1/21
1. INTRODUCCIÓN. Sea K[x] el anillo de los polinomios en una indeterminada, sobre el cuerpo K. Si P∈K[x], P recibe el nombre de Polinomio. Sabemos que ∀P∈K[x] con P = ao + a1 X + a2 X2 +….+ an Xn existe una función polinómica P* : K → siendo ∀ x ∈ K P( x ) = ao + a1 x + a2 x 2 + .... + an x n donde el polinomio P sustituimos la indeterminada X por la variable x. Las funciones polinómicas se pueden sumar y multiplicar siguiendo las reglas:
(
)
1) P* + Q* ( x ) = P * (x ) + Q* ( x )
x∈ K
2) ( PQ)* = P* ⋅ Q* Dem. n
n
i =1
i =1
Sea P = ∑ ai X i y Q = ∑ bi X i (pudiendo ocurrir que an = 0 ó bn = 0) 1)
n
n
n
i =1
i =1
i =1
( P + Q)* ( x ) = ∑ (ai + bi )x n = ∑ ai x n + ∑ bi x n = P * ( x) + Q* ( x ) = (P * + Q* )(x ) 2n
2)
K
2n
∀x ∈ K
K
( PQ)* ( x ) = ∑ ∑ al bK −l x K = ∑ ∑ al bK −l x K = K=0
l =0
K =0
l =0
2n
=
n K n l K −l i a x ⋅ b ⋅ x = a x b j x j = ∑ ∑ ∑ ∑ l K −l i K =0 l =0 i= 0 j = 0
(
)
= P* ( x )Q* ( x ) = P* Q* ( x ) ∀ x ∈ K Como vemos, no es lo mismo P o P(X) que es un elemento de K[x] que P* (x) que es una función. En la práctica, llamaremos a P* (x) polinomio (en lugar de función polinómica) y lo denotaremos por P(x). Igualmente, cuando hablemos del valor del polinomio en un punto, estamos queriendo decir el valor de la función polinómica en un punto o elemento de K. DEF Sea P∈K[x] con P = ao + a1 X +…..+an Xn . Llamaremos Polinomio derivada de P al polinomio de P´∈K[x] definido por P´ = a1 + 2a2 X +….+ nan Xn-1 DEF
Sea P∈K[x]. Llamaremos Polinomio derivada m-esima a Pn) = (Pm-1))
2/21
OBS A partir de la definición se puede ver que si P∈K[x] con grad(P) = n se verifica Pn) = an · n! y que Pm) = 0 ∀m > n. PROP Sean P, Q∈K[x], se verifica: 1) (P + Q)´ = P´ + Q´ 2) (λP)´ = λP´ ∀λ∈K 3) (PQ)´ = P´Q + PQ´ Dem. Inmediata. COROLARIO
Sea P∈K[x]. (Pm)´ = mP m-1 · P´
Dem. Inmediato. Se realiza por inducción. TEOREMA. Fórmula de Taylor. Sea P∈K[x] con P = ao + a1 X +…..+an Xn , a∈K y K un cuerpo de característica cero. Se verifica la igualdad. P = P (a ) +
n) P´(a ) ( X − a ) + P´´(a ) ( X − a )2 + ..... + P (a ) ( X − a )n 1! 2! n!
Dem. Sea V = {P ∈ K [ x] / gra d (P ) ≤ n} . Es inmediato ver que (V, +, • K) es un K-espacio vectorial, que dim V = n + 1 y que B = 1, X , X 2 ,...., X n es una base.
{
}
{
}
Probemos que B´= 1, X − a, ( X − a )2 ,....., ( X − a )4 es también base de V. Sea ao + a1 (X – a) +…..+ an (X – a)4 = 0 una combinación lineal de B´ del vector nulo. El coeficiente de Xn del polinomio de la izquierda es an , luego an = 0. Queda ao + a1 (X – a) +….+ an-1(X – a)n-1 = 0. Repitie ndo lo anterior n veces obtenemos que aj = 0 ∀j : 0,…,n. Luego B´ es base de V.
3/21
Entonces podemos escribir P como n
P = ∑ bi ( X − a )i con bi ∈ K
∀i : 0,..., n
i =0
Tomando ahora el valor de P y sus derivadas sucesivas en a∈K obtenemos P(a) = bo P´(a) = b1 · 1! Pn)(a) = bn · n! Y como K es de característica 0 P = P (a ) +
n) P´(a ) ( X − a ) + ..... + P (a ) ( X − a )n 1! n!
DEF Sea P∈K[x] no nulo. Un elemento a∈K se dice que es raíz de P si P(a) = 0. También se llama cero del polinomio. PROP Sea P∈K[x], y a∈K a es raíz de P ⇔ X – a/P Dem. “⇒” Si a es raíz de P ⇒ P(a) = 0 Si realizamos la división euclidea de P entre (X – a) ∃C, R ∈ K [x] / P = ( X − a )C + R con grad(R) = 0 ⇒ R∈K Como P(a) = R ⇒ R = 0 y X – a/P “⇐” Si X – a/P ⇒ P = (X – a)Q
con Q∈K[x]
Trivialmente P(a) = 0 ⇒ a es raíz de P. DEF Sea P∈K[x], mR∈– con Rm > 0 y a∈K. Diremos que a es una raíz múltiple de orden Rm de P, si P es divisible por (X – a)m pero no lo es por (X – a)m+1 . PROP Sea Car (K) = 0, a∈K, P∈K[x] y m∈– con m > 0.
4/21
a es raíz de orden m de P ⇔ P(a) = P´(a) = ….= Pm-1)(a) = 0 y Pm)(a) ≠ 0. Dem. “⇒” Como a
es raíz de orden m de P ⇒ P = (X – a)m · Q
Q(a) ≠ 0 ya que en caso contrario X – a/Q ⇒ (X – a)m+1 /P lo cual no en contra de la hipótesis. P´ = m(X – a)m-1 · Q + (X – a)m Q´ = m(X – a)m-1 · Q + R1
con R1 (a) = 0
P´´= m(m - 1)(X – a)m-2 · Q + R2 con R2 (a) = 0 ……… Pm-1) = m(m – 1)….. 2(X – a)Q + Rm-1 Pm) = m!: Q + Rm
con Rm-1(a) = 0
con Rm(a) = 0
Y Pm)(a) = m! Q ≠ 0
(ya que car(K) = 0)
“⇐” La Fórmula de Taylor aplicada a P∈K[x] en el punto a∈K P=
n) P m ) (a ) ( X − a )m + ..... + P (a ) ( X − a )n m! n!
Es claro que (X – a)m/ P y P = (X – a)m · Q divide a P. ⇒ a es raíz de orden m de P.
con Q(a) ≠ 0 ⇒ (X – a)m+1 no
2. ECUACIONES ALGEBRAICAS. RAICES. DEF Llamamos Ecuación Algebraica de grado n a toda expresión de la forma P(x) = 0 donde P(x) es un polinomio de grado n (función polinómica) con coeficientes reales. Los valores reales o complejos que sustituidos en x hacen que la ecuación algebraica sea una igualdad numérica las llamamos raíces o ceros de la ecuación. El proceso de cálculo de las raíces recibe el nombre de resolución de la ecuación. Podemos generalizar la definición anterior como sigue: DEF Llamamos ecuación a toda expresión de la forma f(x) = g(x) que, mediante transformaciones algebraicas, se puede transformar en la forma P(x) = 0 siendo P(x) un polinomio. OBS A partir de la definición de ecuación algebraica podemos afirmar que las raíces (simples o múltiples) del polinomio P(x) coinciden con las de la ecuación P(x) = 0. Es
5/21
por ello que hablamos de forma indistinta de raíces o ceros de un polinomio P(x) y raíces o ceros de la ecuación algebraica P(x) = 0. En lo que queda de tema vamos a tratar de hallar las raíces de una ecuación algebraica. A lo largo de toda la historia del Algebra, entre otros, han existido dos problemas muy importantes ligados entre sí. Uno era demostrar la existencia de raíces de una ecuación algebraica, y el otro hallarlas por métodos algebraicos. El primer problema lo solucionó Gauss en 1799 demostrando el “Teorema fundamental del Algebra: Toda ecuación algebraica tiene al menos una solución (real o compleja)”. El teorema viene a decir que toda ecuación algebraica de grado n tiene n raíces o ceros. El segundo problema lo resolvieron simultáneamente Niels Henrik Abel y Erariste Galois demostrando que toda ecuación algebraica de grado superior a 4 no eran, en general, resolubles por métodos algebraicos. 2.1. Ecuaciones de Cardano-Vieta. El teorema fundamental del álgebra demostrado por Gauss nos dice que dado un polinomio P(x) de grad (P) = n, P = ao + a1 x +……+an xn , existen n raíces, x1 ,…., xn , que pueden ser reales o complejas, pudiendo entonces escribir el polinomio como P( x ) = a n ( x − x1 )......( x − xn ) . Partiendo de la expresión
P( x ) = a n ( x − x1 )......( x − xn ) y multiplicando los
n− 2 n n −1 n n n paréntesis P( x ) = an x − ∑ xi x + ∑ xi x j x + .... + (− 1) · x1 · x2 ·....· xn i =1 ii ,≠j j=1 Como la expresión general de P(x) es P( x ) = a o + a1 x + a2 x 2 + .... + an x n Igualando ambos polinomios obtenemos n a n −1 = a n − ∑ xi i =1 n an − 2 = an ∑ xi x j ii ,≠j =j 1 ..................... a o = an (− 1)n x1 x2 .....x n
(
)
Estas expresiones se conocen con el nombre de ecuaciones de Cardano-Vieta, y nos dan una relación entre coeficientes de un polinomio y sus raíces.
6/21
Las ecuaciones de Cardano-Vieta adolecen de un defecto: No sabemos si las raíces que se obtienen como solución de ese sistema de ecuaciones son reales o complejas. Veamos un resultado que nos permitirá aclarar un poco este problema. PROP Sea P(x) = 0 una ecuación algebraica de grado n, con coeficientes reales. Si xj = a + bi es una raíz compleja de orden p de P(x) = 0 entonces a – bi es también raíz compleja de orden p de la misma ecuación. Dem. Según el teorema de Gauss, el polinomio P(x) de grado n tiene x1 ,…, xm raíces (reales o complejas), con K1 ,….., Km el índice de multiplicidad y ∑ K i = n . Así, P(x) se puede escribir como: K
K
P( x ) = a n ( x − x1 ) 1 ·(x − x 2 ) 2 ·......·(x − xm )
Km
Como P(x) tiene coeficientes reales (P(x) ∈3[x]) K K K P (x ) = an ( x − x1 ) 1 ·( x − x2 ) 2 ·.....·(x − x m ) m
se verifica que
P=P y
Y como la descomposición de P(x) es única, podemos tener dos situaciones 1) xi = xi ⇒ xi ∈ 3 y la raíz es real. 2) xi = x j i ≠ j K i = K j ⇒ xi = x j = x j ⇒ xi y x j conjugadas de P(x) y con el mismo índice de multiplicidad.
son raíces complejas
Por tanto P(x) = 0 tiene raíces reales y/o parejas de raíces complejas conjugadas con el mismo índice de multiplicidad. Se deduce que si (x – (a + bi))P es un factor de P(x), también lo será (x – (a – bi))P . Multiplicando ambos queda ((x – a)2 + b2 )P . Por tanto, podemos afirmar que ∀P(x) ∈3[x], P(x) se puede descomponer como producto de factores de primer grado y/o de segundo grado con coeficientes reales y siendo su discriminante negativo. Es lo mismo decir que los polinomios (X – a) y (aX2 + bX + c) con b2 – 4ac < 0 son los únicos polinomios irreducibles en 3[x]. 3. RESOLUCIÓN DE ECUACIONES. En este punto vamos a resolver por métodos algebraicos las ecuaciones algebraicas de grado 1, 2 y 3. 3.1. Ecuación de primer grado. Una ecuación de primer grado es de la forma 7/21
ax + b = 0 y trivialmente x= −
b a
siendo única la solución. 3.2. Ecuaciones de segundo grado. Una ecuación de segundo grado es de la forma ax2 + bx + c = 0
(1)
Veamos como se resuelve: 4a2 x2 + 4abx + 4ac = 0
Multiplicamos (1) por 4a:
Completamos los dos primeros sumandos para obtener un cuadrado perfecto, sumando y restando b2 4 a 2 x 2 + 4abx + b 2 − b 2 + 4ac = 0
(2ax + b)2
= b 2 − 4 ac
2 ax + b = ± b 2 − 4ac 2 ax = −b ± b 2 − 4ac − b ± b 2 − 4ac x= 2a Las dos raíces serán reales si contrario. Si b 2 − 4 ac < 0 ⇒
x=
b 2 − 4 ac ≥ 0 y complejas conjugadas en caso
−b 4ac − b 2 ± i 2a 2a
3.3. Ecuación de tercer grado. Una ecuación de tercer grado es de la forma: ax 3 + bx 2 + cx + d = 0
8/21
Para simplificar las operaciones que vamos a realizar, y puesto que siempre es posible, vamos a considerar que el polinomio de tercer grado es normalizado, siendo la ecuación: x 3 + ax 2 + bx + c = 0 Lo primero es cambiar x = x´−
a , pudiendo eliminar el término de segundo grado de 3
la ecuación: 3
2
x´− a + a x´− a + b x´− a + c = 0 3 3 3 1 1 2 1 1 x´3 −ax´2 + a 2 x´− a 3 + ax´2 − a 2 x´+ a 3 + bx´− ab + c = 0 3 27 3 9 3 1 2 1 3 1 3 1 x´3 + a 2 − a 2 + b x´+ − a − a − ab + c = 0 3 9 3 3 27 1 2 3 1 Sea p = b − a 2 y q = a − ab + c 3 27 3 x´3 + px´+ q = 0 Realicemos ahora un nuevo cambio de variable x´ = u + v
(ù + v )3 + p (u + v ) + q = 0
Y desarrollando u 3 + 3u 2 v + 3uv 2 + v 3 + pu + pv + q = 0 u 3 + v 3 + 3uv (u + v ) + p (u + v ) + q = 0 u 3 + v 3 + q + (3uv + p )(u + v ) = 0 Como variando los valores de u y v, cualquiera que sea la suma u + v, siempre es posible fijar u · v, tomemos 3uv + p = 0. Entonces u 3 + v 3 = −q u 3 + v 3 = − q p ⇒ 2 3 p3 uv = − u ·v = − 3 27 Teniendo en cuenta las relaciones de Cardano-Vieta, podemos afirmar que u3 y v3 son raíces de la ecuación
9/21
p3 y + qy − =0 27 2
Al ser una ecuación de 2º grado sabemos resolverla siendo q u =− + 2 3
q2 p3 + 4 27
y
q q 2 p3 v =− − + 2 4 27 3
Entonces q q2 p3 u= − + + 2 4 27
y
3
q q2 p3 v= − − + 2 4 27 3
Como x´ = u + v tenemos
x´= 3 −
q q2 p3 3 q q2 p3 + + + − − + 2 4 27 2 4 27
Y al ser x = x´−
a 3
1 p = b − a2 3
y
q=
2 3 1 a − ab + c 27 3
Sustituyendo obtenemos las tres raíces de la ecuación. La ecuación de cuarto grado, debido a su complejidad y no demasiado interés, no la vamos a resolver. 4. APROXIMACIÓN NUMÉRICA DE RAÍCES. Dada una ecuación algebraica P(x) = 0 de grado n con coeficientes reales, vamos a tratar de resolverla, lo que significa calcular todas sus raíces o aproximarlas. 4.1. Cálculo de las raíces enteras y racionales de un polinomio con coeficientes racionales. Sea P(x) = 0 una ecuación algebraica de grado n con coeficientes en Q. Multiplicando por el mínimo común múltiplo de los denominadores, obtenemos otra ecuación con los coeficientes enteros, luego podemos considerar que P(x) = 0 es una ecuación algebraica con los coeficientes enteros. 4.1.1. Raíces Enteras. Sea P( x ) = a o + a1 x + a2 x 2 + ..... + an x n con ai ∈9 ∀i: 1,…, n. Si m∈9 es raíz de P(x) ⇒ P(m) = 0
10/21
Como P(m) = ao + a1 m + a2 m2 + ...... + a n m n ⇒ ao + a1 m + a2 m2 + ..... + an m n = 0 ⇒ ao = −a1 m − a2 m2 − ..... − an mn ⇒ a o es un múltiplo de m ó m/ao . Además P(x) = (x – m) Q(x), siendo Q(x) de grado n – 1. P(1) = (1 – m) Q(1) ⇒ P(1) es múltiplo de (1 - m) ó 1 – m/P(1) P(-1) = (-1 – m) Q(-1) ⇒ P(-1) es múltiplo de (1 + m) ó 1 + m/P(-1) Resumiendo, si m∈9 es un cero de la ecuación P(x) = 0 con coeficientes enteros, se debe verificar 1) m/ao 2) 1 – m/P(1) 3) 1 + m/P(-1) Luego basta descomponer en factores ao e ir probando sus posibles divisores como soluciones de la ecuación en caso de que verifiquen también 2) y 3). Esas serán todas las soluciones enteras, si las hay. 4.1.2. Raíces Racionales. Sea
p p una raíz o cero de P(x) = 0 (con irreducible). q q 2
n
p p p Entonces a o + a1 + a2 + ..... + an = 0 q q q Y multiplicando por qn
a o q n + a1 q n −1 · p + a2 q n −2 · p 2 + ...... + an p n = 0
Como mcd (p, q) = 1 por ser
p irreducible tenemos: q
1) a o q n = −a1 q n −1 · p − a2 q n −2 · p 2 − ...... − an p n ⇒ p a o 2) a n p n = −ao q n − a1 q n −1 · p − a2 q n − 2 · p 2 + ..... ⇒ q a n p Q( x ) Además P( x ) = x − Q(x ) ⇒ P( x ) = (qx − p ) q q 11/21
1) P(1) = (q − p )
Q(1) q − p ⇒ P(1) q
2) P(− 1) = (− q − p )
Q(− 1) q + p ⇒ P(− 1) q
Resumiendo, para que
p irreducible sea una raíz de la ecuación P(x) = 0 debe q
verificar: 1) p/ao 2) q/an 3) q – p/P(1) 4) q + p/P(-1) Observemos que si el coeficiente principal es 1, an = 1, la ecuación no tiene raíces racionales, ya que no hay ningún número q/1 salvo el propio 1 ó -1, siendo entonces p un entero. q Para obtener todas las raíces racionales, descomponemos ao y a1 en factores y escribimos todas las fracciones posibles formadas por los divisores de ao entre los divisores de an . Comprobamos que verifican 3) y 4) y esas serán las posibles raíces racionales. 4.2. Acotación de las Raíces Reales. Una vez visto el caso particular de obtener las raíces enteras y racionales de una ecuación algebraica con coeficientes racionales, vamos a resolver el caso general. Tenemos una ecuación algebraica P(x) = 0 con coeficientes reales. Para determinar sus raíces, realizaremos tres pasos. El primer paso consiste en acotar las posibles raíces. Las raíces positivas estarán acotadas superiormente por L e inferiormente por l, y las raíces negativas lo serán superiormente por L´ e inferiormente por l´. Es evidente que sólo vamos a describir métodos sobre P(x) para calcular la cota superior de las raíces positivas L, ya que l se calcula igual pero sobre P(1/x), l´ se calcula sobre P(- x) y L´ sobre P(-1/x). Veamos pues que esas cuatro cotas se pueden obtener sobre polinomios distintos.
12/21
4.2.1. Método de Laguerre. PROP Sea P(x)∈3. S al dividir P(x) por x – L obtenemos un polinomio cociente con todos sus coeficientes positivos y el resto también es positivo, entonces L es una cota superior para las raíces positivas de P(x). Dem. n −1
Sea P(x) = (x – L) Q(x) + R siendo Q( x ) = ∑ bi x i con bi > 0 ∀i y R > 0. i= 0
Entonces ∀xo ∈3 con xo > L se verifica que (xo – L) > 0 y Q(xo ) > 0 ⇒ P(xo ) > 0 Luego P(x) no puede tener una raíz positiva mayor que L. L es cota superior de todas las raíces positivas. 4.2.2. Método de Newton. PROP Si un nº L∈3+ hace positivos P(x)∈3[x] y todas sus derivadas, entonces L es una cota superior de las raíces positivas de P(x). Dem. Consideremos el desarrollo de Taylor para el polinomio P(x) en L. P ( x ) = P ( L) +
n) P´(L ) (x − L ) + P´´( L) (x − L ) + .... + P (L ) ( x − L ) 1! 2! n!
Como por hipótesis PK(L) > 0 ∀xo > L
0 ≤ K ≤ n, entonces
P(xo ) > 0
Por tanto, no hay ninguna raíz mayor que L, y L es una cota superior de las raíces positivas. 4.3. Separación de las Raíces Reales. Este es el segundo paso en la determinación de raíces reales de una ecuación algebraica P(x) = 0. Una vez que sabemos que todas las raíces negativas están en el intervalo (l´, L´) y las positivas en el (l, L), vamos a tratar de separarlas. Es decir, vamos a dar intervalos en los que podamos afirmar que hay una raíz y solo una.
13/21
4.3.1. Separación de las raíces de un polinomio por medio de su derivada. Para poder desarrollar este apartado vamos a enunciar dos teoremas. La demostraciones se pueden encontrar en el tema 25 y 26. TEOREMA. Teorema de Bolzano. Sea f: 3 → 3 una función continua en [a, b] con f(a) · f(b) < 0, entonces existe xo ∈(a, b) tal que f(xo ) = 0. TEOREMA. Teorema de Rolle. Sea f: 3 → 3 continua en [a, b] y derivable en (a, b) y f(a) = f(b), entonces existe xo ∈(a, b) tal que f´(xo ) = 0. Como toda función polinómica es continua, podemos aplicar los dos teoremas anteriores a P(x). El teorema de Bolzano nos indica que si un polinomio tiene signo contrario en los extremos de un intervalo, posee una raíz dentro de dicho intervalo, pero no afirma que sea única. PROP Dada la ecuación algebraica P(x) = 0 de grad n, si P(a) · P(b) < 0 entonces existe un número impar de raíces en (a, b). Dem. Sabemos que hay una raíz, al menos, en (a, b) puesto que es lo que afirma el teorema de Bolzano. Supongamos que x1 , x2 ,….., xK son todas las raíces de P(x) en (a, b), pudiendo existir repetidas (raíces múltiples). Entonces P(x) = (x – x1 )…….(x – xK) Q(x). Sustituyendo P(x) en a y en b tenemos P(a ) = (a − x1 )·.......·(a − x K )Q(a ) = (− 1)K ( x1 − a )·......·( x K − a )Q(a ) P(b) = (b − x1 )·......·(b − x K )·Q(b ) Sabemos que Q(a) y Q(b) tienen el mismo signo, ya que en caso contrario existiría una raíz de Q(x) (otra de P(x)) en (a, b) y no es posible. También P(b) y positivos.
Q(b) tienen el mismo signo, ya que todos los
b – xi son
Entonces P(b) y Q(b) tienen el mismo signo. Como xi – a son positivos, para que P(a) y P(b) (o también P(a) y Q(a)) tengan signos contrarios, debe suceder que 14/21
(- 1)K
sea negativo, lo cual solo ocurre si K es impar.
Recíprocamente, si K es impar, P(a) y P(b) tendrán signos contrarios. Al ser K impar, existen un número impar de raíces en (a, b). PROP 1) Entre cada dos raíces consecutivas de P(x) hay al menos una raíz de P´(x). 2) Entre cada dos raíces consecutivas de P´(x) existe a lo sumo una raíz de P(x). Dem. 1) Sean x1 , x2 ∈3/ P(x1 ) = 0 y P(x2 ) = 0 Aplicando el teorema de Rolle a P(x) en [x1 , x2 ] ∃⊂∈(x1 , x2 ) /P´(c) = 0 2) Sean c1 , c2 ∈3 dos raíces consecutivas de P´(x). Supongamos que existen x1 , x2 ∈(c1 , c2 ) raíces de P(x). Entonces, aplicando el apartado anterior ∃⊂∈(x1 , x2 ) ⊂ (c1 , c2 ) / P´(c) = 0 lo cual es una contradicción con el hecho de ser c1 y c2 consecutivas. Entonces existe a lo sumo una raíz de P(x). Esta última proposición nos permite situar las raíces de P(x) entre cada dos raíces de P´(x), estando la primera raíz entre la cota inferior y la menor raíz de P´(x) y la última entre la mayor raíz de P´(x) y la cota superior. El problema que tenemos con este método es que para poder separar las raíces de P(x) = 0 hemos de resolver la ecuación P´(x) = 0, y a veces tienen ambas ecuaciones una dificultad similar. Podemos ver métodos que esquivan este problema. 4.3.2. Método de Budan-Fourier. DEF Diremos que el par a, b∈3 con a < b presentan una variación si signo (a) ≠ signo (b). Se denotará por V(a, b) = 1. n −1
Generalizando, V(a1 , a2 ,……, an ) =
∑ V (a , a ) i
i =1
15/21
i +1
TEOREMA. Teorema de Budan-Fourier. Sea P(x) = 0 una ecuación algebraica de grado n, a, b∈3 con a < b, PK(a) ≠ 0 y P (b) ≠ 0 0 ≤ K ≤ n. Entonces K)
m
•
V (P(a ), P´(a ),....., P n ) (a )) − V (P(b), P´(b),....., P n ) (b )) = ∑ αi + 2 i =1
m
siendo
•
∑ αi el nº de raíces de P(x) en (a, b) contadas con sus multiplicidades y 2 un i =1
múltiplo de 2. 4.3.3. Método de Sturns. TEOREMA. Teorema de Sturns . Sea P(x) = 0 una ecuación algebraica de grado n, y P(x) un polinomio sin raíces múltiples. Entonces
(
) (
)
V P(a ), P´(a ),....., P n ) (a ) − V P(b ), P´(b ),...., P n ) (b ) = Nº de raíces de P(x) en (a, b) OBS Si P(x) = 0 tuviese raíces múltiples, podemos analizar el polinomio que se P( x ) obtiene de . mcd (P( x ), P´( x )) 4.3.4. Método de Harriot-Descartes. TEOREMA. Regla de los Signos de Harriot-Descartes. n
Sea P(x) = 0 una ecuación algebraica con P( x ) = ∑ ai x i entonces: i =0
Nº de raíces positivas de P(x) ≤ V(ao ,….., an ). 4.4. Aproximación de las Raíces Reales. Este es el último paso en la determinación de raíces reales de una ecuación algebraica P(x) = 0. Una vez que tengamos las raíces separadas en intervalos, hemos de aproximarlas con un grado de aproximación predeterminado. Veremos para ello varios métodos. 4.4.1. Método de Newton. También se conoce como método de la tangente.
16/21
Sea α la única raíz de P(x) en (a, b) con P(a) · P(b) < 0. Vamos a supones también que P´(x) y P´´(x) conservan el signo en el intervalo considerado. Bajo estas condiciones, la gráfica de P(x) en (a, b) tiene cuatro posibilidades.
a
b
a
b
a
b
a
b
El método consiste en trazar la recta tangente al punto (a, P(a)) o (b, P(b)). Elegiremos aquella recta que corte al eje x en el interior de (a, b). Tomaremos como aproximación de la raíz α el punto de corte de al recta con el eje, x1 . La recta tangente elegida verifica la condición P(x) P´´(x) > 0. Si el error que se comete es superior al fijado de antemano, repetimos el proceso pero ahora trazando la tangente al punto (x1 , P(x1 )), obteniendo así una nueva aproximación, x2 . Iterando el proceso, construimos una sucesión de aproximaciones verificando Lim P(xn ) = 0.
aα, (xn )n∈–
Tenemos que P(a) < 0 y P´´(a) < 0, luego P(a) · P´´(a) > 0, por esa razón trazamos la tangente por (a, P(a)). La ecuación de la tangente es y − P(a ) = P´(a )( x − a ) Entonces, el punto x1 donde la tangente corta al eje x es x1 = a −
P (a ) P´(a )
(1)
17/21
Si iteramos el proceso, la tangente por (x1 , P(x1 )) es y − p( x1 ) = P´( x1 )( x − x1 ) siendo (x2 , 0) el punto de corte de la recta tangente y el eje horizontal x2 = x1 −
P( x1 ) P´( x1 )
Y en general xn = x n −1 −
P( x n −1 ) P´( xn −1 )
Comprobemos que cada una de las aproximaciones mejora la anterior. Escribiendo el polinomio de Taylor de P(x) en x = a, de grado 1 P ( x ) = P (a ) +
P´(a ) ( x − a ) + P´´(ξ ) ( x − a )2 1! 2!
Sustituyendo x por la raíz de P(x), x = α 0 = P (a ) +
P (a ) P´´(ξ ) +α− a + (α − a )2 P´(a ) aP´(a )
Entonces α= a −
P(a ) P´´(ξ) − (α − a )2 P´(a ) 2 P´(a )
Teniendo en cuenta (1) α − x1 = −
P´´(ξ ) (α − a )2 2 P´(a )
(2)
Tomando P´´(x ) < K ∀x∈(a, b) queda K (b − a ) α − x1 < a P´(a )
2
Veamos ahora que x1 mejora la aproximación dada por a. P (a ) signo ( x1 − a ) = signo − por (1) P´(a ) 18/21
P (a ) P´´(ξ ) signo − = signo − (α − a )2 P´(a ) 2 P´(a ) conserva el signo en el intervalo.
ya que P(a) · P´´(a) > 0 y P´´(x)
P´´(ξ ) signo − (α − a )2 = signo (α - x1) por (2) 2 P´(a ) Entonces signo (x1 – a) = signo (α - x1 ) y eso significa que a < x1 < α Reiterando el proceso a < xi < xj < α con i < j lo que significa que (xn )n∈– es una sucesión creciente y acotada por α, por tanto ∃lim xn y es lim xn = α. Como xn = x n −1 −
P( x n −1 ) P´( xn −1 )
P(limxn −1 ) ⇒ P(limxn ) = 0 ⇒ por ser P(x) un polinomio p´(limxn −1 ) p(lim xn ) = lim P(xn ) ⇒ lim (xn ) = 0 Tomando límites α = α −
4.4.2. Método de la Regula Falsi. El método de la Regula Falsi es muy similar al método de Newton visto antes, pero en lugar de trabajar con tangentes, lo haremos con la cuerda que une los extremos del intervalo que consideremos en cada instante. Sea α la única raíz de P(x) en (a, b) con P(a) P(b) < 0. Y supongamos que P´´(x) no se anula en (a, b). La ecuación de la cuerda que une (a, P(a)) y (b, P(b)) es y − P (a ) =
P(b ) − P(a ) (x − a) b−a
Y corta al eje x en (x1 , 0) siendo 0 − P (a ) =
P (b ) − P (a ) ( x1 − a ) ⇒ x1 = a − P(a )(b − a ) ⇒ x1 = aP(b) − bP(a ) b−a P(b ) − P(a ) P(b ) − P(a )
a
b
19/21
Si queremos obtener una nueva aproximación a α, repetiremos el proceso tomando ahora uno de los intervalos (a, x1 ) ó (x1 , b). Elegiremos aquel que verifique las condiciones de partida (en nuestro caso (a, x1 ) ya que P(a) · P(x1 ) < 0). Entonces x2 =
aP( x1 ) − x1 P(a ) P( x1 ) − P (a )
Podemos iterar el proceso de sucesión monótona (creciente o decreciente) y acotada por b ó a respectivamente. Entonces la sucesión tiene limite y la recurrencia nos dice que dicho límite es α. Si queremos hallar un término de la sucesión (xn )n∈– cuya distancia a α sea menor que un error dado de antemano, hemos de conocer una cota de error que se produce al sustituir α por xm. Sea xm un valor aproximado de α, raíz de P(x). Al ser P(x) un polinomio, es una función continua en [a, b] y derivable en (a, b). Aplicando el teorema de Lagrange en [α, xn ]. ∃ξ ∈ (α, x n ) / P (x n ) − P (α) = P´(ξ)·( xn − α) Entonces P( xn ) = P´(ξ)( xn − α) ⇒ xn − α = siendo C < P´( x )
P( xn ) P (x n ) < P´(ξ) C
∀x ∈ (a , b )
Luego si queremos calcular, por este método, una aproximación de la raíz α con un P xm error menor que e, debemos iterar el proceso m veces hasta que se verifique < e. C
( )
4.4.3. Método general de Iteración. El método de Newton y el método de la Regula Falsi son casos particulares del llamado método de Iteración. Si somos capaces de encontrar una función Ψ(x) definida [a, b], que tiene una única raíz en (a, b) y tal que la ecuación P(x) = 0 con x la única raíz de P(x) en (a, b) sea equivalente a x = Ψ(x), entonces la recurrencia xn = Ψ(xn – 1) nos proporciona una sucesión (xn )n∈–, de la que podemos afirmar: PROP Si Ψ es continua [a, b], derivable en (a, b) y Ψ´( x ) < K< 1 ∀x∈(a, b), entonces la sucesión definida por la recurrencia xn = Ψ(xn-1) es convergente a α, siendo α la única raíz de P(x) en (a, b). Dem. 20/21
Consideremos el intervalo [xn-1, α] (o [α, xn-1 ] según sea el caso] y apliquemos a Ψ en ese intervalo el teorema de Lagrange: ∃ξ ∈ ( xn −1 , α) / Ψ (α) − Ψ( xn −1 ) = Ψ´(ξ )(α − xn −1 ) Y como Ψ(α) = α y Ψ(xn-1) = xn Entonces α - xn = Ψ´(ξ) (α - xn-1 ) Teniendo en cuenta que Ψ´(ξ) < K < 1 ∀ξ∈(a, b) α − x n = Ψ´(ξ) ·α − xn −1 < K α − xn −1 < K 2 · α − xn − 2 <…..< K n · b − a Y como b – a > 0 y lim Kn = 0 por ser K< 1 α − xn < K n ·(b − a ) ⇒ limxn = α
Bibliografía Recomendada. The Beauty of Fractals. Aut. H.O. Peitgen. P.H.Richter. Ed. Springer-Verlag. Dynamical System and Fractals. Ed. Cambridge University Press. Introducción al Cálculo Numérico. Aut. Aubanell. Ed. Universidad Autónoma de Barcelona. Dynamics of Simple Maps. Aut. Robert L. Devaney.
21/21
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 15 ECUACIONES DIOFANTICAS 1. Introducción. 2. Ecuaciones Diofánticas Lineales. 2.1. Ecuaciones con una Incógnita. 2.2. Ecuaciones con dos Incógnitas. 2.2.1. La ecuación ax – by = c 2.2.2. La ecuación ax – by = c 2.2.3. Formas de Hallar la solución Particular. 2.3. Ecuaciones con más de dos Incógnitas. 3. Sistemas de Ecuaciones Diofanticas Lineales. 4. Ecuaciones Diofánticas no Lineales. 4.1. Ecuaciones con dos incógnitas. 4.1.1. La ecuación x2 – y2 = a 4.1.2. La ecuación de Pell. 4.1.3. La ecuación P(x) – by = c con P(x) polinomio. 4.2. Ecuaciones con más de dos incógnitas. 4.2.1. La Ecuación Pitagórica x2 + y2 = z 4.2.2. La Ecuación de Fermat xn + yn = zn 5. Ecuaciones con Congruencias. Bibliografía Recomendada.
1/18
TEMA 15 ECUACIONES DIOFANTICAS 1. INTRODUCCIÓN. PROP Sea V un K-espacio vectorial de dimensión n. Sea B = {u1 ,…..,un } base de V. r r Dados a1 , a2 ,…., an ∈K, definimos f: V → K donde v ∈ V con v = ( x1 , x2 ,...., xn ) n r coordenadas respecto de B, f (v ) = ∑ ai xi . Entonces f es una aplicación lineal. i =1
Dem. r r f (λv + µw) = f (λ·( x1u1 + ....... + xn u n ) + µ( y1u1 + ..... + yn un )) = = f ((λx1 + µy1 )u1 + ...... + (λxn + µy n )u n ) = = a1 (λx1 + µy1 ) + ..... + an (λxn + µyn ) = = λa1 x1 + µa1 y1 + ..... + λa n xn + µan y n = r r = λ(a1 x1 + ...... + a n xn ) + µ(a1 y1 + ...... + a n yn ) = λf (v ) + µf (w) Dada una aplicación lineal f: V → K con V K-espacio vectorial, nos planteamos la r r necesidad de conocer que vectores de V, x ∈ V verifican f (x ) = c siendo c∈K un elemento fijo. r DEF Bajo las condiciones anteriores, la expresión f (x ) = c recibe el nombre de r ecuación lineal. Cada x ∈ V que verifique la ecuación anterior es una solución de al r ecuación. Los elementos ( x1 , x2 ,......, xn ), coordenadas de x respecto una base B de V, se llaman incógnitas y los a1 , a2 ,….., an ∈K coeficientes. OBS Aunque sean vectores, es usual representarlos sin la flecha superior, por lo que escribiremos f(x) = c, para simplificar la notación. DEF Una ecuación diofántica es una ecuación algebraica con coeficientes enteros y de la que interesan únicamente las soluciones enteras. Veremos como resolver las ecuaciones diofánticas, dividiéndolas en diferentes tipos. Nos centraremos más en ecuaciones lineales, aunque también veremos ecuaciones diofánticas no lineales. 2. ECUACIONES DIOFÁNTICAS LINEALES. 2.1. Ecuaciones con una Incógnita. Este caso no presenta ninguna dificultad en su resolución, pues una ecuación 2/18
ax = c con a, c∈9 tiene solución entera a/c (c es un múltiplo de a). 2.2. Ecuaciones con dos Incognitas. 2.2.1. La ecuación ax – by = c PROP Sea la ecuación Ax – By = C, siendo A ≠ 0, B ≠ 0 y D = mcd (A, B). Si Ax – By = C admite solución entonces D/C. Dem. Como D = mcd (A, B) ⇒ A = a · D y B = b · D La ecuación se puede escribir como aDx – bDy = C y D(ax – by) = C. Como Ax – By = C tiene solución, la igualdad D(ax – by) = C es cierta y por tanto D/C. OBS Teniendo en cuenta la proposición anterior, basta con resolver la ecuación ax – by = c con mcd (a, b) = 1. DEF Se llama sistema completo de números incongrue ntes modulo a, a todo conjunto de a números cuyos restos al dividir por a son todos distintos. Dado a∈–, el conjunto {0, 1,….., a – 1} forma un sistema completo de números incongruentes módulo a. PROP Sea ax – by = c una ecuación diofantica con mcd(a, b) = 1. Sea S = {0, 1,., a – 1} un sistema completo de números incongruentes módulo a. Entonces el conjunto T = {b ⋅ x + c / x ∈ S } es un sistema completo de números incongruentes módulo a. Dem. Realicemos la demostración por reducción al absurdo. Sean bi + c y bj + c con i, j∈S (es lo mismo que 0 ≤ i, j ≤ a – 1), i ≠ j, dos elementos de T tales que al dividirlos por a dan el mismo resto. Realizando la división euclidea: ∃q, r∈9/
bi + c = aq + r
∃q´, r∈9/
bj + c = aq´ + r
Restando ambas ecuaciones b(i – j) = a(q – q´)
3/18
Y como mcd (a, b) = 1
i – j/a
Entonces i y j son congruentes módulo a, lo cual es una contradicción. PROP La ecuación diofantica ax – by = c con mcd (a, b) = 1 tiene solución. Dem. Como {0, 1, 2,…., a – 1} es un sistema completo de números incongruentes módulo a, por la proposición anterior tenemos que {c, b + c, 2b + c,…., (a – 1)b + c} es también un sistema completo de números incongruentes módulo a. Entonces existe un único bβ + c con 0 ≤ β ≤ a – 1 tal que al dividir por a obtengamos de resto 0. bβ + c = a · q con q∈9 Llamemos al cociente q por la letra α quedando bβ + c = aα Y aα - bβ = c Siendo (α, β) una solución particular de ax – by = c. PROP Sea la ecuación diofántica ax – by = c con mcd (a, b) = 1 y sea (α, β) una solución particular de la misma. Entonces la ecuación tiene infinitas soluciones enteras. Dem. Dada la ecuación diofántica ax – by = c con (x, y) solución. Como (α, β) es una solución particular aα - bβ = c. Restando ambas expresiones a(x - α) – b(y - β) = 0 a(x - α) = b(y -β) Al ser mcd (a, b) = 1 ⇒ a/y - β ⇒ y - β = at con t∈9. Sustituyendo a(x - α) = b · at ⇒ x - α = bt. Por tanto, la solución completa de la ecuación diofántica es x = α + bt t ∈ 9 y = β + at 2.2.2. La ecuación ax + by = c. PROP Sea la ecuación Ax + By = C, con A ≠ 0, B ≠ 0 y D = mcd (A, B). 4/18
Si Ax + By = C admite solución entonces D/C. Dem. Es igual a la primera proposición del punto 2.2.1. OBS De nuevo consideraremos la ecuación ax + by = c con mcd (a, b) = 1. PROP Sea ax + by = c una ecuación diofántica con mcd (a, b) = 1. Sea S={0, 1,..,a – 1} un sistema completo de números incongruentes módulo a. Entonces el conjunto T = {c − bx / x ∈ S } es un sistema completo de números incongruentes módulo a. Dem. Realicemos la demostración por reducción al absurdo. Sean c – ib, c - jb∈T con i, j∈S i ≠ j, tales que al dividirlos por a se obtiene el mismo resto ∃q, r∈9/
c – ib = aq + r
∃q´, e∈9/ c – jb = aq´ + r Restando ambas ecuaciones b(j – i) = a(q – q´) Y como mcd (a, b) = 1
j – i/a
Entonces i y j son congruentes módulo a, lo cual es una contradicción. PROP La ecuación diofántica ax + by = c con mcd (a, b) = 1 tiene solución. Dem. Sabemos que {c, c – b, c – 2b,…., c – (a – 1)b} es un sistema completo de números incongruentes módulo a. Entonces existe un único c - bβ con 0 ≤ β ≤ a – 1 tal que al dividir por a obtengamos de resto 0. ∃α∈9/
c - bβ = a · α
Entonces aα + bβ = c y (α, β) es solución de la ecuación. PROP Sea la ecuación diofántica ax + by = c con mcd (a, b) = 1 y sea (α, β) una solución particular de la misma. Entonces la ecuación tiene infinitas soluciones enteras. Dem.
5/18
Sea (x, y) una solución general de la ecuación y (α, β) la solución particular. ax + by = c ⇒ a ( x − α) + b( y − β ) = 0 ⇒ a (x − α) = b(β − y ) aα + bβ = c Como mcd (a, b) = 1 ⇒ a/β - y ⇒ β - y = at t∈9 Sustituyendo a(x - α) = bat ⇒ x - α = bt La solución gene ral tiene la forma x = α + bt y = β − at
con t ∈ 9
2.2.3. Formas de hallar la solución particular. Hemos visto en los dos puntos anteriores que una ecuación de la forma ax ± by = c con mcd (a, b) = 1 tiene solución particular. Y a partir de ella hemos encontrado todas las soluciones. La proposición que nos afirma que existe solución particular nos describe una forma de encontrarla. 1ª Forma: Consiste en despejar la incógnita de menor coeficiente (supongamos que es a). Eso nos proporciona un conjunto S = {0, 1,…., a – 1} más pequeño. Y probamos secuencialmente los valores de S, siendo solución aquel que al realizar la operación indicada nos da un número entero. Ejemplo. Sea la ecuación
39x – 5y = 13
Si despejamos
x=
13 + 5 y hemos de ver cual de los números {0, 1,…,38} es 39
solución. En cambio si despejamos
y=
39 x − 13 el conjunto se reduce a {0, 1,…, 4} sólo 5 5
elementos. Para x = 2
y=
65 = 13 5
La solución particular sería (2, 13).
6/18
Siendo la solución general
x = 2 + 5t y = 13 + 39t
Este método que hemos descrito no se puede utilizar en el caso de que ambos coeficientes de la ecuación tengan un valor elevado. En caso de que suceda esta situación, primero hemos de reducir la ecuación a otra con menores coeficientes. 2ª Forma: Al encontrarnos con una ecuación con coeficientes altos, ax – by = c despejamos aquella incógnita acompañada de menor coeficiente x=
by + c a
Hacemos la división euclidea entre b y a y entre c y a ∃q, b´∈9/
b = aq + b´
∃q´, c´∈9/ c = aq´ + c´ Y sustituimos x=
(aq + b´) y + (aq´+c´) = qy + q´+ b´ y + c´ a
a
Obtenemos la ecuación diofántica ax´ - b´y = c´ donde el coeficiente de la incógnita no despejada ha sido reducido. En caso de que esta nueva ecuación todavía tenga coeficientes altos, se repite el proceso tantas veces como sea necesario. Ejemplo. Sea la ecuación 5184x – 625y = 2001 que claramente tiene solución ya que mcd (5184, 625) = mcd (34 · 26 , 54 ) = 1 Despejamos la incógnita afectada de menor coeficiente: y=
5184 x − 2001 184 x − 126 = 8x − 3 + 625 625 7/18
(1)
ya que 5184 = 625 · 8 + 184 2001 = 625 · 3 + 126 Sea y´=
184 x − 126 ⇒ 184x − 625 y´= 126 625
Repetimos el proceso despejando ahora x=
126 + 625 y´ 73 y´126 = 3 y´+ 184 184
Sea x´=
(2)
73 y´+126 ⇒ 184 x´−73 y´= 126 184
Repetimos, despejando y´=
184 x´−126 38 x´−53 = 2 x´−1 + 73 73
Sea y´´=
(3)
38 x´−53 ⇒ 38 x´−73 y´´= 53 73
Aplicamos ahora la 1ª forma de resolución para resolver esta ecuación x´=
53 + 73 y´´ 38
Y es cierta para x´ = 11 y
y´´ = 5
Sustituyendo en (3) y´ = 2 · 11 – 1 + 5 = 26 Sustituyendo en (1) Y = 8 · 89 – 3 + 26 = 735 Siendo una solución particular X = 89
y = 735
Y la solución general es:
8/18
x = 89 + 625t con t ∈ 9 y = 735 + 5184t 3ª Forma. Dada la ecuación ax ± by = c, como mcd (a, b) = 1, tenemos que por el Algoritmo de Euclides ∃λ, µ∈9/ λa + µb = 1 Y al multiplicar esa expresión por c cλa + cµb = c a (λc) + b(µc) = c que también se puede escribir como a(λc) ± b(± µc) = c siendo x = λc e y = ± µc solución particular de la ecuación. OBS Elegiremos el signo de y según sea el de la ecuación. 2.3. Ecuaciones con más de dos incógnitas. PROP Sea la ecuación A1 x1 + A2 x2 +…..+An xn = C con Ai ≠ 0 ∀i: 1,…, n. Sea D = mcd (A1 , A2 ,…, An ). La ecuación tiene solución ⇔ D/C. Dem. Vamos a demostrar el teorema por inducción en el número de incógnitas. Para n = 1 y n = 2 ya hemos visto que es cierto. Para n – 1, por hipótesis de inducción, lo suponemos cierto. Veamos para n. Sea la ecuación A1 x1 +…..+An xn = C La ecuación A1 x1 +…..+ An-1xn-1 = Dy con D = mcd (a1 , a2 ,…, an-1) tiene solución, por hipótesis de inducción. Consideremos la ecuación 9/18
Ay + An xn = C El mcd (D, An ) = mcd (A1 ,…., An-1, An ) que divide a C. Entonces, esa ecuación con dos incógnitas tiene solución. Hemos encontrado solución para la ecuación inicial con n incógnitas. Esta proposición que acabamos de demostrar nos proporciona un método práctico para hallar la solución de una ecuación con n incógnitas, reduciéndola a otra con una menos hasta llegar a une ecuación con sólo dos incógnitas. Ejemplo. Sea 18x1 + 45x2 – 20x3 + 49x4 = 11 Sabemos que tiene solución porque mcd (18, 45, 20, 49) = 1 y 1/11. Sea 18x1 + 45x2 – 20x3 = 1 · y1 ya que mcd (18, 45, 20) = 1 Entonces y1 + 49x4 = 11 con solución particular (60, -1) Siendo la solución general y1 = 60 + 49t t ∈ 9 x4 = −1 − t Volvamos a reducir la ecuación con tres incógnitas: Sea 18x1 + 45x2 = 9y2 ya que mcd (18, 45) = 9 Entonces 9y2 – 20x3 = y1 con solución particular (9y1 , 4y1 ) y2 = 9 y1 + 20t´ y 2 = 540 + 441t + 20t´ ⇒ t´∈ 9 x3 = 4 y1 + 9t´ x3 = 240 + 196t + 0t ´ Y nos queda 18x1 + 45x2 = 9y2 que es 2x1 + 5x2 = y2 Con solución particular (3y1 , - y1 ) y la general x1 = 3 y2 + 5t´´ x1 = 1620 + 1323t + 60t´+5t´´ ⇒ t´´∈ 9 x2 = − y 2 − 2t´´ x 2 = −540 − 441t − 20t´−2t ´´ Siendo la solución final
10/18
x1 = 1620 + 1323 + 60t´+5t´´ x2 = −540 − 441t − 20t´−2t ´´ t , t´, t ´´∈ 9 x3 = 240 + 196t + 9t´ x4 = −1 − t 3. SISTEMAS DE ECUACIONES DIOFANTICAS LINEALES. De nuevo, cada ecuación diofántica del sistema de ecuaciones debe verificar que el máximo común divisor de los coeficientes ha de dividir al término independiente. No lo vamos a demostrar, por no reiterarnos en exceso. En los casos anteriores, esta condición era necesaria y suficiente para garantizar la existencia de solución. Pero en el caso que ahora nos compete, vamos a ver mediante un ejemplo que ya no es suficiente. Sea el sistema 2x + y + 3z = 7 8x − 5 y − 3z = 11 Aplicando el método de resolución de Gauss, es equivalente a 2 x + y + 3 z = 7 2 x + y + 3z = 7 ⇒ 10 x − 4 y = 18 5x − 2 y = 9 La segunda ecuación es resoluble ya que mcd (5, 2)/9 x = 1 + 2t con t ∈ 9 y = −2 + 5t Sustituyendo en la 1ª ecuación 2(1 + 2t ) + (− 2 + 5t ) + 3z = 7 2 + 4t − 2 + 5t + 3 z = 7 9t + 3z = 7 Y resulta que mcd (9, 3) = 3 y 3 no divide a 7, por lo que la ecuación no tiene solución, y el sistema tampoco.
11/18
4. ECUACIONES DIOFÁNTICAS NO LINEALES. 4.1. Ecuaciones con dos Incógnitas. 4.1.1. La ecuación x2 – y2 = a. Dada la ecuación
x2 – y2 = a
con a∈9, puede escribirse como (x + y) (x – y) = a Si tomamos
m=x+y n=x–y
Entonces m · n = a Y a cada solución posible le corresponde una descomposición factorial de a. Al resolver la ecuación m · n = a en 9 podemos deducir que simultáneamente m y n son pares o son impares. Para ello basta tener en cuenta la definición de m y n. Eso implica que si a∈9 tiene un factor 2 con multiplicidad 1, no puede haber una descomposición como la indicada en el párrafo anterior. Por tanto la ecuación no tiene solución. Ejemplos. 1) x2 – y2 = 98 Como 98 = 2 3 272 ⇒ m · n = 2 · 72 Posibilidades: a) m = 2
x+ y =2 n = 49 ⇒ ⇒ 2 x = 51 x − y = 49
x ∉9
No sirve
b) m = 14
x + y = 14 n=7 ⇒ ⇒ 2 x = 21 x− y =7
x∈9
No sirve
Como vemos, no hay solución. 2) x2 – y2 = 36 Como 36 = 22 · 32 ⇒ m · n = 22 · 32 Posibilidades
12/18
x+ y =2 ⇒ x = 10 x − y = 18
a) m = 2
n = 18 ⇒
b) m = 4
n = 9 ⇒ No puede ser
c) m = 6
n=6 ⇒
d) m = 9
n = 4 ⇒ No puede ser
e) m = 18
n=2 ⇒
x + y = 6 ⇒ x= 6 x − y = 6
x + y = 18 x = 10 x− y =2
Las soluciones a la ecuación (10, -8)
(6, 0)
y = −8
y =0
y=8
x2 – y2 = 36 son
(10, 8) y también
(-10, 8)
(-10, -8)
4.1.2. La ecuación de Pell. La ecuación de Pell es X2 – dy2 = N Esta ecuación tiene gran importancia ya que cualquier ecuación cuadrática de dos variables se puede reducir a ella. Veámoslo: ax2 + bxy + cy2 + dx + ey + f = 0
con a, b, c, d, e, f ∈ 9
Si la escribimos como un polinomio en x tenemos ax2 + (by + d)x + (cy2 + ey + f) = 0 y es una ecuación de segundo grado en x. Tendrá solución si el discriminante es un cuadrado perfecto (by + d)2 – 4a(cy2 + ey + f) = w2
con
w∈9
(b2 – 4ac)y2 + (2bd – 4ae)y + (d2 – 4af – w2 ) = 0 Sea
p = b2 – 4ac q = 2bd – 4ae r = d2 – 4af
Y entonces podemos escribir 13/18
py2 + qy + r – w2 = 0 e igualmente es una ecuación de 2º grado en y, que tendrá solución si su discriminante es un cuadrado perfecto q2 – 4p(r – w2 ) = z2
con z∈9
y la ecuación anterior, escrita como z2 – 4pw2 = q2 – 4pr es una ecuación de Pell con d = 4p y N = q2 – 4pr En 1768, Lagrange demostró que si N =1 y d no es un cuadrado perfecto con d > 0, la ecuación tiene solución no trivial (distinta de x = 1 e y = 0). La solución no trivial la calculó mediante fracciones continuas de mediante un ejemplo.
d . Veamoslo
Ejemplo. X2 – 17y2 = 1 17 = 4 +
z =8+
1 1 17 + 4 ⇒z= = = 4 + 17 z 1 17 − 4
1 1 ⇒ 17 = 4 + 1 z 8+ z
A partir de aquí, es fácil comprobar que es periódica. La fracción reducida de segundo orden es 17 ≅ 4 +
1 33 = 8 8
Una solución es x = 33
y=8
Para hallar todas: Se verifica que
(19 + 6
17
)
n
= x + 17 y
Basta desarrollar la potencia y tomar como x los sumandos sin factores que acompañan a 17 . Como
(19 + 6
17
)
n
= x + 17 y 14/18
17 y como y los
(19 − 6
17
)
n
= x − 17 y
Multiplicando ambas expresiones 192 – 17 · 62 = x2 – 17y2 Y como 192 – 17 · 62 = 1 tenemos que (x, y) es también solución de la ecuación. 4.1.3. la ecuación P(x) – by = c con P(x) polinomio. n
P( x ) = ∑ ai x n polinomio, no siempre tiene
La ecuación P(x) – by = c con
i= 0
solución. El método para resolverlas es muy similar al visto para dos variable, siempre que tengan solución. Despejando en la ecuación la variable y y=
c − P( x ) b
Si llamamos Q(x) = c – P(x) nos queda y=
Q( x ) b
Sean m y n dos números enteros tales que dan el mismo resto al dividirlos por b (son congruentes). Entonces m = n + b·s
con s∈9
n
Si Q( x ) = ∑ bi n i entonces i= 0
n
Q(n) = ∑ bi ni i =0
n
n
n
i =0
i =0
i =0
Q(m) = ∑ bi mi = ∑ bi (n + bs )i = ∑ bi ni + s ⋅ K = Q(n) + s·K Vemos que Q(n) y Q(m) también son congruentes módulo b. La implicación contraria no es cierta. Para hallar la solución para y, basta probar {Q(0), Q(1),….., Q(b-1)} y ver cual de ellos, al dividirlo por b, da como resultado un entero. 15/18
Supongamos que Q(a) con 0 ≤ a ≤ b – 1 es el múltiplo de b. Entonces la solución general sería: x = a + bt Q(a + bt ) con t∈9 y= b Ejemplo. Sea la ecuación 4x3 – 3x2 + x – 3y = 3 4x3 − 3x2 + x − 3 3
y= Q(0) = -3,
Q(1) = -1
Q(2) = 19
Entonces x = 3t 4(3t )3 − 3(3t )2 + 3t − 3 108t 3 − 27t 2 + 3t − 3 t∈9 y= = 3 3 x = 3t t∈9 3 2 y = 36t − 9t + t − 1 4.2. Ecuaciones con más de dos incógnitas. 4.2.1. La ecuación Pitagórica x2 + y2 = z2 La definición completa de la ecuación pitagórica es x2 + y2 = z2
con x, y, z∈– - {0}
Esta ecuación surgió al estudiar el triángulo rectángulo de catetos 3 y 4 e hipotenusa 5. Al ser un triángulo rectángulo verificaba el teorema de Pitágoras 32 + 42 = 52 Entonces se planteó la posibilidad de hallar más conjuntos de 3 números que correspondiesen a medidas de un triángulo rectángulo, para lo cual había que resolver la ecuación x2 + y2 = z2
con x, y, z∈–
Es claro que si xo , yo , zo es una solución de la ecuación, entonces λxo , λyo , λzo con λ∈– también es solución. El recíproco también es cierto.
16/18
Entonces, para su resolución, podemos suponer que los tres números x, y, z son coprimos tomados de dos en dos. Las soluciones que verifiquen esta condición reciben el nombre de soluciones primitivas, ya que no son múltiplos de ninguna otra solución. Teniendo en cuenta lo anterior, los números representados por x e y no pueden ser ambos pares, ya que entonces también lo sería z, y hemos excluido esa situación. Supongamos entonces que x es impar, y vamos a tratar de resolver la ecuación. x2 + y2 = z 2 x2 = z 2 − y2 x 2 = ( z + y )( z − y ) Sea u 2 = z + y
v2 = z − y ⇒
y
x = u·v
u2 + v2 z+ y=u 2 ⇒ 2 2 u −v2 z− y =v y= 2 z=
2
Los factores u y v deben ser impares. Si u y v tuviesen un factor común, entonces z e y también lo tendrían y no serían coprimos, luego u y v además de impares, deben ser coprimos. x y z
3=3·1
5=5·1
7=7·1
9=9·1
11=11·1
13=13·1
15=15·1
15=15·3
17=17·1
19=19·1
21=7·3
4 5
12 13
24 25
40 41
60 61
84 85
112 113
8 17
144 145
180 181
20 29
4.2.2. La Ecuación de Fermat xn + yn = zn . La ecuación pitagórica dio lugar a intentar resolver x3 + y3 = z3
con
x, y, z∈–
x4 + y4 = z4
con
x, y, z∈–
Y posteriormente a
Y en general a Xn + yn = zn
con
x, y, z, n∈–
llamada ecuación de Fermat por ser este quien la resolvió.
17/18
Desde el siglo XVII se ha ido demostrando que para n = 3 la ecuación era irresoluble y luego se no para n = 4. Un día dijo Fermat que había demostrado que la ecuación era irresoluble para n ≥ 3, pero nunca dio la demostración. En 1993, el matemático A. Wiles, publicó la demostración de la irresolubilidad de la ecuación para n ≥ 3, pero pronto se vio que había cometido un fallo. Hoy en día es uno de los problemas clásicos de la matemática que sigue sin ser demostrado. 5. ECUACIONES DE CONGRUENCIAS. Recordemos que dos números a y b son congruentes módulo n si al dividirlos por n (mediante la división euclidea) obtenemos el mismo resto. Se representa por a ≡ b (mod n) y es equivalente a que a – b = n · t con t∈9. Podemos plantearnos la resolución de este tipo de expresiones cuando uno de los miembros lo sustituimos por una expresión, que bien puede ser lineal (con una o varias incógnitas) o polinómica. Entonces recibe el nombre de ecuación de congruencias. Ejemplos. 1) 2x ≡ 5 (mod 7) 2) 2x2 + x + 1 ≡ 3 3) 2x – 3y ≡ 7
(mod 11) (mod 5)
Toda ecuación de congruencias puede reducirse a una ecuación diofantica con una incógnita más, y tratar así de resolverla. Ejemplos. 1) 2x ≡ 5 (mod 7) ⇒ 2x – 5 = 7y ⇒ 2x – 7y = 5 2) 2x2 + x + 1 ≡ 3 (mod 11) ⇒ 2x2 + x + 1 – 3 = 11y ⇒ 2x2 + x + 1 – 11y = 3 3) 2x – 3y ≡ 7 (mod 5) ⇒ 2x – 3y – 7 = 5z ⇒ 2x – 3y – 5z = 7 Bibliografía Recomendada. • • • •
Álgebra. Aut: Hungerford. Edit: Springer-Verlag. Algèbre. Aut: S. MacLane. Edit: Gauthier-Villars Álgebra. Aut: S. Lang. Edit: Aguilar. Curso de Álgebra Moderna. Aut. P. Hilton. Edit: Reverté. 18/18
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 16 DISCUSIÓN Y RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES. TEOREMA DE ROUCHE. REGLA DE CRAMER. MÉTODO DE GAUSSJORDAN. 1. Introducción. 2. Sistemas de Ecuaciones Lineales. 2.1. Definición. 2.2. Sistemas Equivalentes. 2.3. Tipos de Sistemas. 2.4. Interpretación de un Sistema en Términos de una Aplicación Lineal. 3. Teorema de Rouché-Fröbemus. 4. Regla de Cramer. 5. Método de Gauss-Jordan. 5.1. Métodos de Gauss. 5.2. Método de Gauss con Pivote Parcial. 5.3. Método de Gauss con Pivote Total. 5.4. Método de Gauss-Jorda. Bibliografía Recomendada.
1/19
TEMA 16 DISCUSIÓN Y RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES. TEOREMA DE ROUCHE. REGLA DE CRAMER. MÉTODO DE GAUSSJORDAN. 1. INTRODUCCIÓN. Por todos es conocida la importancia que tienen los sistemas de ecuaciones lineales en la resolución de problemas, tanto en la matemática pura como en la aplicada. En este caso vamos a tratar de la resolución de sistemas de m ecuaciones lineales con n incógnitas cada uno y con coeficientes en un cuerpo K (que habitualmente será 3, pero puede ser Q o "). El teorema de Rouché-Fröbenius (también conocido bajo el nombre de Kronecker) nos da las condiciones necesarias y suficientes para la existencia de solución. La Regla de Cramer nos permite obtener dicha solución de forma explícita, aunque a costa de realizar un gran número de operaciones. Describiremos por tanto, diferentes métodos numéricos que nos permitirán de forma directa obtener la solución exacta. La teoría de espacios vectoriales y de aplicaciones lineales nos va a permitir deducir resultados sobre el conjunto de las soluciones. 2. SISTEMAS DE ECUACIONES LINEALES. 2.1. Definición. Un sistema de m ecuaciones lineales con n incógnitas y con coeficientes en un cuerpo K es un sistema de m ecuaciones de la forma. a11 x1 + ........ + a1n xn = b1 ..................... a m1 x1 + ....... + a mn xn = bm
(1)
donde (aij)∈K, bi∈K 1 ≤ i ≤ m, 1 ≤ j ≤ n. Los aij reciben el nombre de coeficientes, los bi de términos independientes y las xj son las incógnitas. DEF Dado el sistema de ecuaciones lineales (1), diremos que es homogéneo si bi = 0 1 ≤ i ≤ m. El sistema (1) se puede escribir de forma matricial como a11 ...........a1n x1 b1 .................. M = M a .........a x b m1 mn n m o de forma más sencilla como 2/19
A·X = B DEF
Diremos que
(α1 ,α2 ,.....,αn ) ∈ K n es una solución del sistema (1) si al sustituir cada incógnita xi por α i las ecuaciones se transforman en identidades. Al conjunto formado por todas las soluciones lo llamaremos solución del sistema. 2.2. Sistemas Equivalentes. DEF Diremos que dos sistemas de ecuaciones lineales con el mismo número de incógnitas son Equivalentes si toda solución del primero lo es del segundo, y al revés. También serán equivalentes si ambos carecen de soluciones. OBS En la definición de sistemas equivalentes, en ningún momento se alude a que deban mantener el mismo número de ecuaciones. NOTACIÓN A partir de ahora escribiremos la ecuación de lugar i ai 1 x1 + ai 2 x2 + ...... + ain x n = bi como ei(x) = bi o, más sencillamente, por Ei DEF
Dado el sistema e1 (x) = b1 e2 (x) = b2 (2) ………… em(x) = bm
diremos que una ecuación ex = b es combinación lineal de las ecuaciones del sistema si existen números λ1 , λ2 ,…., λm en el cuerpo K tales que se verifica e( x ) = λ1e1 ( x ) + ....... + λm em (x )
y
b = λ1 b1 + ..... + λm bm
PROP Dado un sistema con m ecuaciones lineales E1 , E2 ,…., Em y n incógnitas, se pueden obtener sistemas equivalentes efectuando las siguientes operaciones elementales.
3/19
a) Permutar el orden de dos ecuaciones. b) Sustituir una ecuación Ei por el resultado de multiplicar todos los elementos de la ecuación por un escalar λ∈K no nulo. c) Sustituir una ecuación Ei por el resultado de sumar a la ecuación el producto de un escalar arbitrario λ∈K por otra ecuación. Ej (con j ≠ i). Más generalmente, sustituir la ecuación Ei por Ei + ∑ λj E j . Ej para cualesquiera escalares λj∈K. j ≠i
d) Añadir al (suprimir del) sistema de una ecuación que sea combinación lineal del resto. Dem. a) Al permutar el orden de dos ecuaciones obtenemos un nuevo sistema que tiene las mismas ecuaciones que el anterior, por tanto una solución para uno de ellos, también lo es para el otro. b) Sea el sistema E1 E2 M Em con Ei ≡ ai 1 x1 + ai 2 x 2 + ...... + ain xn = b Sea (α 1 ,…..,αn )∈Kn solución del primer sistema. Entonces, por ser iguales, también es solución todas las ecuaciones del segundo sistema menos la del lugar i. Comprobemos que para ésta también es solución: λai1α1 + λai 2α2 + ..... + λainαn = xbi λ(ai 1α1 + ...... + ainαn ) = λbi Como λ ≠ 0,
∃λ-1∈K ai 1α1 + ....... + ainαn = bi
siendo la expresión cierta al ser (α 1 ,….., α n ) solución de Ei. c) Dado el sistema
4/19
E1 E2 M Em
(3)
m −1
sustituimos en el Em por Em + ∑ λj E j (elegimos la última por comodidad) j =1
E1 M Em −1
m −1 E m + ∑ λj E j j =1
(4)
Ambos sistemas tienen las m – 1 primeras ecuaciones iguales, sólo la última es diferente, siendo m −1
Em + ∑ λj E j ≡ λ1 e1 (x ) + λ2 e2 ( x ) + ..... + λm −1 em −1 ( x ) + em (x ) = λ1b1 + λ2 b2 + ... + λm −1 bm −1 + bm j =1
Veamos que ambos sistemas son equivalentes. • Si α = (α 1 ,…., αn )∈Kn es solución de (3), también lo es de (4). Por ser α solución del primer sistema se verifica Ei(α) = bi y también es cierto que λiei (α) = λibi
∀i:1,…., m ∀i:1,….., m con λi∈K.
Sumando las m identidades obtenemos que λ1 e1 (α) + λ2 e2 (α) + ..... + λm em (α) = λ1b1 + ..... + λm bm es cierto, y basta tomar λm = 1 (neutro de producto en K) para que esa expresión sea m −1
Em + ∑ λj E j , la cual es cierta para x = α. Como las m – 1 primeras de (4) coincidían j =1
con las de (3), también son ciertas y α es solución de (4). • Si α = ( α 1 , α2 ,……, α n )∈Kn es solución de (4), también lo es de (3). Por ser α solución de (4) se verifica que ei (α) = bi
∀i : 1,....., m − 1
5/19
m −1
m −1
i =1
i =1
∑ λi ei (α) + em (α) = ∑ λibi + bm Sólo hemos de comprobar que α es solución de la última ecuación de (3). m −1 m −1 m −1 em (α) = ∑ λi ei (α) + em (α) = ∑ λi bi + bm = ∑ λi bi + bm − b1 − ....... − bm −1 = bm i =1 i =1 i =1
Luego em(α) = bm y la ecuación es cierta. d) Dado el sistema (2), si añadimos una ecuación que sea combinación lineal del resto, obtenemos e1 ( x ) = b1 e2 ( x ) = b2 ........... em ( x ) = bm
m m λi ei ( x ) = ∑ λi bi ∑ i =1 i =1
(5)
Es claro que toda solución (5) es solución de (2) pues las ecuaciones del primer sistema son también ecuaciones del segundo. Análogamente, una solución de (2) verifica las m primeras ecuaciones de (5), y también la última, como es fácil de comprobar, luego es solución de (5). 2.3. Tipos de sistemas. Según el número de soluciones de un sistema de ecuaciones lineales, los podemos clasificar en: DEF Diremos que un sistema es Compatible si tiene solución. Si es única será Compatible determinado y si es múltiple Compatible indeterminado. En el caso de no tener solución diremos que es incompatible. Determinados Compatible ( Solución Unica) Sistemas erminados In(det Solución Múltiple) Incompatibles ( Sin solución ) 2.4. Interpretación de un Sistema en Términos de una Aplicación Lineal. A partir de ahora consideraremos que el cuerpo K es 3. Dado un sistema de m ecuaciones con n incógnitas, expresado de forma matricial se escribe como
6/19
A·X=B Consideremos la única aplicación F: 3n → 3m que tiene como matriz asociada a A (por ejemplo, respecto de las bases canónicas). r La matriz columna X es un vector cualquiera x ∈3n y la matriz columna B es un r vector fijo b ∈3m. Entonces el sistema se puede expresar como r r f (x ) = b r siendo la solución al sistema el conjunto f −1 b .
()
r r r r La expresión f (x ) = o corresponde al sistema homogéneo asociado a f (x ) = b . Las soluciones de un sistema homogéneo son los elementos de definición es, Kerf, el núcleo de la aplicación.
r f − 1 (o ) que por
PROP El conjunto de soluciones de un sistema homogéneo forman un subespacio vectorial de 3n . Dem. Es debido a que Kerf tiene estructura de subespacio vectorial. PROP El conjunto de soluciones de un sistema de ecuaciones lineales puede obtenerse sumando a una solución particular del sistema todas las soluciones del sistema homogéneo asociado. Dem. La suma de una solución particular α∈3n con una solución del sistema homogéneo asociado α K∈3n es solución: r r r f (α + αK ) = f (α) + f (αK ) = b + o = b Luego α + α K es solución del sistema. • Toda solución del sistema puede descomponerse como suma de una solución particular α∈3n y una solución del sistema homogéneo asociado α K∈3n . r Sea β∈3n solución del sistema ⇒ f(β) = b
7/19
Entonces r r r f (β − α) = f (β ) − f (α) = b − b = o Luego β - α∈Kerf
y β - α = α K∈Kerf
Y β = α + αK como queríamos probar. Podemos ahora caracterizar los diferentes tipos de sistemas en términos de la aplicación lineal asociada. r r • Si b ∉ Im ( f ) ⇒ f −1 b = Ø y el sistema es Incompatible.
()
r r • Si b ∈ Im ( f ) ⇒ ∃α 3n / f (α) = b , dándose dos situaciones r - Si Kerf = {o} , la aplicación es inyectiva y la solución es única. Sistema Compatible determinado. r - Si Kerf ≠ {o} , la solución no es única y el sistema es Compatible Indeterminado. La matriz A asociada a la aplicación lineal f verifica Dim (Im (f)) = Rang (A) lo cual nos permite decir dim Ker (f) = dim 3n – dim Im (f) = n – Rang (A) y podemos caracterizar un sistema de ecuaciones compatible sólo con el número de incógnitas y el rango de la matriz de coeficientes. OBS Un sistema homogéneo siempre es compatible ya que r O ∈ Im ( f ) 3. TEOREMA DE ROUCHÉ-FRÖBENIUS DEF Dado un sistema de ecuaciones lineales A · X = B, llamaremos matriz ampliada a la matriz que se obtiene de añadir la matriz columna B a la matriz A como (n + 1)- ésima columna. Se representa por (A/B). a11 a ( A / B ) = 21 .... am 1
a12 a22 .... am 2
8/19
.... a1 n .... a 2 n .... ... .... amn
b1 b2 .... bm
TEOREMA. Teorema de Rouché-Fröbenius. Sea A · X = B la representación matricial de un sistema de m ecuaciones lineales con n incógnitas. AX = B es compatible ⇔ rang (A) = rang (A/B). Además, será compatible determinado si rang (A) = n e indeterminado en caso contrario. Dem. “⇒” Supongamos que el sistema es compatible y sea α = (α 1 ,…, α n )∈3n una solución del mismo. Se tiene las siguientes identidades: a11α1 + a12α2 + ....... + a1n αn = b1 a 21α1 + a22α2 + ........ + a2 nαn = b2 ........................................... a m1α1 + am 2α2 + ......... + a mnαn = bm Si llamamos como
r ai = (a1i , a2 i ,....., a mi ) con 1 ≤ i ≤ m el sistema lo podemos escribir r r r r α1 a1 + α2 a2 + ...... + αn a n = b
r r r r lo cual nos indica que b es combinación lineal de {a1 , a2 ,....., an } que son las columnas de A. Entonces Rang (A) = rang (A/B) Si el sistema es compatible determinado, la combinación lineal anterior es única y se r r r deduce que {a1 , a2 ,....., an } es un conjunto linealmente Independiente. Y de aquí podemos afirmar que Rang (A) = n “⇐” Como por hipótesis rang (A) = rang (A/B) r se da que b es combinación lineal de
{ar1 , ar2 ,...., arn } .
n r r ∃α1 , α2 ,....., αn ∈ 3 / ∑ αi ai = b i =1
Entonces α = (α 1 , α2 ,…., αn )∈3n es solución del sistema 9/19
n r f (α) = ∑ αi ai = b i =1
y el sistema es Compatible. r r r Si Rang (A) = n ⇒ {a1 , a2 ,....., an } es un conjunto Linealmente Independiente lo cual significa que la combinación lineal es única, siendo también la solución al sistema. COROLARIO verifica
Sea AX = B un sistema de m ecuaciones lineales con n incógnitas. Se
a) AX = B es Compatible Determinado ⇔ rang (A) = rang (A/B) = n b) AX = B es Compatible Indeterminado ⇔ rang (A) = rang (A/B) < n c) AX = B es Incompatible ⇔ rang (A) ≠ rang (A/B) Dem. Inmediata sin más que tener en cuenta el teorema anterior. OBS Si rang (A) = rang (A/B) = K con K < n
tenemos que
dim Kerf = dim 3n – dim Imf = n – Rang (A) = n y entonces las soluciones del sistema, al formar un subespacio de dimensión n – K, se expresa en función de n – K parámetros. 4. REGLA DE CRAMER. DEF Diremos que un sistema con el mismo número de ecuaciones que de incógnitas es de Cramer si tiene solución única (si es compatible determinado). PROP Un sistema con igual número de ecuaciones que de incógnitas es de Cramer si y solo si A ≠ 0 . Dem. Sea el sistema AX = B con A una matriz cuadrada de tamaño n. Entonces la matriz (A/B) es de orden n x (n + 1) siendo por tanto rang (A/B) ≤ n. Sabemos que rang (A) = n A ≠ 0 y aplicando el teorema de Rouche-Fröbenius obtenemos que el sistema es compatible determinado si y solo si A ≠ 0 .
10/19
Los sistemas de Cramer tienen una forma especial de resolverse, que es aplicando la llamada Regla de Cramer. Veamos en que consiste: La condición A ≠ 0 nos permite garantizar la existencia de A-1. Por tanto, dado el sistema AX = B podemos despejar X como: AX = B ⇒ A-1 · AX = A-1 B ⇒ X = A-1 · B Siendo la solución única. Veamos ahora como desarrollar esa expresión para obtener el valor de cada incógnita. Sabemos que A−1 =
1 ( Adj ( A))t A
y podemos escribir la igualdad X = A-1 · B como: x1 x2 M = xn
A11 A A12 A L A1 n A
A21 A A22 A L A2 n A
L L L L
An 1 A b1 An 2 b 2 A L L Ann bn A
siendo cada Aij el adjunto del elemento aij de la matriz A a11 a12 a 21 a 22 L L i+ j Aij = (− 1) · a(i −1)1 a (i −1 )2 a(i +1 )1 a (i +2 )2 L L a n1 an 2
L a1( j −1 ) L a2 ( j −1 ) L L L a( i −1 )( j −1) L a(i +1 )( j −1) L L L an ( j −1 )
a1( j +1 ) a 2 ( j +1 ) L a(i −1)( j +1 ) a(i +1 )( j +1) L an ( j +1 )
L a1 n L a2 n L L L a(i +1 )n L a(i +1 )n L L L ann
y detallando las operaciones necesarias para calcular cada incógnita r r r r r r b1 A1 j + b2 A2 j + ... + bn Anj det a1 , a2 ,....., a j −1 , b , a j +1 ,...., an xj = = A A
(
)
OBS Si un sistema homogéneo es de Cramer, la única solución es la trivial.
11/19
La regla de Cramer también es aplicable a sistemas compatibles indeterminados, aunque para ello es necesario aplicarla a un sistema equivalente que verifique ser de Cramer. Sea a11 x1 + a12 x2 + ......... + a1 n x n = b1 a21 x1 + a 22 x 2 + ........ + a2 n xn = b2 ....................................... a m1 x1 + am 2 x2 + ........ + a mn xn = bm un sistema compatible donde rang ( A) = rang ( A / B) = K ≤ {m, n} Supongamos, sin pérdida de generalidad, que
{ar1, ar2 ,...., arK } r es linealmente independiente (donde ai ∈ 3n ). Es lo mismo que afirmar a11 a rang 21 L a K1
a12 a22 L aK 2
L a1 K L a2 K L L L a KK
=K
Teniendo en cuenta que si en un sistema de ecuaciones se elimina una de ella que sea combinación lineal de las demás, el sistema que se obtiene es equivalente, podemos indicar que el sistema inicial es equivalente a a11 x1 + a12 x 2 + .... + a1 n xn = b1 a 21 x1 + a 22 x2 + ...... + a2 n x n = b2 ....................................... a K 1 x1 + aK 2 x2 + ..... + a Kn x n = bK que se puede escribir como n
xj j = K +1 n a21 x1 + a 22 x2 + ..... + a2 K xK = b2 − ∑ a2 j x j j =K +1 ................................................. n a K 1 x1 + aK 2 x2 + ...... + aKK xK = bK − ∑ aKj x j j = K +1 a11 x1 + a12 x2 + ..... + a1 K x K = b1 −
12/19
∑a
1j
n
y llamando ci = bi −
∑a x ij
j
nos queda
j = K +1
a11 x1 + a12 x2 + .... + a1 K xK = c1 a 21 x2 + a22 x 2 + .... + a2 K x K = c 2 ....................................... a K 1 x1 + aK 2 x2 + ..... + aKK xK = cK que es un sistema de Cramer, siendo los términos independientes funciones respecto de las incógnitas xK+1 , xK+2 ,….., xn . Aplicando la regla de Cramer tenemos xi = f i ( x K +1 , x K + 2 ,...., xn )
1≤ i ≤ K
y las soluciones del sistema inicial vienen dadas por x1 = f 1 (λK +1 , λK +2 ,...., λn ) ............................. x K = f K (λK +1 , λK + 2 ,...., λn ) x K +1 = λK +1 ............................ xn = λn siendo λk ,…., λn ∈3 parámetros. 5. MÉTODO DE GAUSS-JORDAN. La regla de Cramer nos permite obtener la solución de cualquier sistema compatible, a cambio de realizar una gran cantidad de operaciones. Es por ello que su uso queda limitado a sistemas con pocas ecuaciones. Afinando un poco más, para obtener la solución de un sistema de n ecuaciones con n incógnitas, la regla de Cramer implica realizar (n + 1) · n! · n productos, (n + 1) · (n! – 1) sumas y n divisiones, lo cual es un total de (n + 1)2 ·! – 1 operaciones. Debido a la ineficacia del método de Cramer con sistemas de 5 o más ecuaciones, vamos a estudiar otras formas de resolver un sistema de ecuaciones lineales. Veremos el método de Gauss, y alguna de sus variantes, que nos dan la solución exacta gracias a una serie de operaciones elementales. El método de Gauss transforma el sistema a resolver en otro equivalente, tal que su matriz de coeficientes sea triangular superior, siendo así fácilmente resoluble. El número de operaciones que hemos de realizar para resolver un sistema de n ecuaciones 2 3 3 2 7 con n incógnitas es n + n − n que es muy inferior al Método de Cramer. 3 2 6 13/19
5.1. Método de Gauss. El método de Gauss transforma un sistema a11 x1 + a12 x2 + a13 x3 + ....... + a1 n xn = b1 a21 x1 + a22 x2 + a23 x3 + .... + a2 n xn = b2 a31 x1 + a32 x 2 + a33 x3 + ..... + a3 n xn = b3 ................................................ a m1 x1 + am 2 x 2 + a m 3 x3 + ...... + amn x n = bm en otro equivalente con matriz de coeficiente triangular superior. Partiendo del sistema de ecuaciones lineales anterior, veamos los pasos a seguir: • Paso 1. Se consiguen ceros en la primera columna por debajo de la diagonal principal (suponemos a11 ≠ 0 reordenando el sistema si fuese necesario). Aplicando al sistema inicial las ecuaciones: a´1 j = a1 j
1≤ j ≤ n
a´ij = aij − aij − a1 j ·
ai 1 a11
2 ≤ i ≤ m 1≤ j ≤ n
b´= b1 bi = bi − b1 ·
ai1 a11
2≤i ≤m
obtenemos a11 x1 + a12 x2 + a13 x3 + .... + a1n xn = b1 a´22 x2 + a´23 x3 + ...... + a´2 n xn = b´2 a´32 x2 + a´33 x3 + ..... + a´3 n xn = b´3 ............................................. a´m 2 x2 + a´m 3 x3 + ....... + a´mn x n = b´ m Resumiendo, las operaciones realizadas son E´1 = E1
y
E´i = Ei −
14/19
ai 1 E1 a11
2≤ i≤ m
• Paso 2. Se consiguen ceros en la segunda columna por debajo de la diagonal principal (suponemos a 22 ≠ 0 , reordenando el sistema si fuese necesario). Aplicamos al sistema obtenido en el paso 1 las ecuaciones: a´´ij = a´ij
1≤ i ≤ 2 1≤ j ≤ n a´i 2 a´22
a´´ij = a´ij −a´2 j · b´´i = b´i
1≤i≤ m 2 ≤ j≤ n
1≤i≤ 2
b´´i = b´i −b´2 ·
a´i 2 a´22
3≤i ≤ m
y obtenemos a11 x1 + a12 x 2 + a13 x3 + .... + a1 n xn = b1 a´22 x2 + a´ 23 x3 + ..... + a´ 2 n xn = b´ 2 a´´33 x3 + .... + a´´3 n xn = b´´3 ...................................... a´´m 3 x3 + ...... + a´´mn xn = b´´m Este sistema se ha obtenido aplicando al anterior las transformaciones E´´i = E´i E´´i = E´i −
a´i 2 E´ a´22 2
1≤ i ≤ 2 3≤i≤ m
• Paso K. Se consiguen ceros en la columna K por debajo de la diagonal principal (podemos suponer que a KK ≠ 0 , reordenando si fuese necesario, salvo que todos los a jK = 0 con K ≤ j ≤ m ,siendo innecesario entonces realizar este paso). Aplicamos al sistema obtenido el paso K – 1 las ecuaciones: aijK ) = aijK −1)
1≤ i ≤ K
aijK ) = aijK −1) − a KjK ·1) · biK ) = biK −1
K −1 ) aiK K −1 ) aKK
1≤ j ≤ n K +1≤ i ≤ m
1≤i≤ K 15/19
K ≤ j ≤n
biK ) = biK −1) − bKK −1 ·
aiKK −1 K −1 a KK
K +1 ≤ i ≤ m
obteniendo un nuevo sistema equivalente al del paso K – 1, y por tanto, a todos los anteriores. Las operaciones elementales aplicadas han sido: EiK ) = EiK −1 ) EiK ) = EiK −1 −
aiKK −1) K −1 ·E K K −1 a KK
1≤ i ≤ K K +1 ≤ i ≤ m
Después de m – 1 pasos como mucho, se obtiene un sistema equivalente al inicial con matriz de coeficientes triangular superior. El sistema AX = B será equivalente a TX = C con T triangular superior. Se verifica rang (A) = rang (T) rang (A/B) = rang (T/C) que resuelve fácilmente sin mas que tener en cuenta: 1) El Sistema es Incompatible si y solo si rang (T) ≠ rang (T/C). Y eso es equivalente a encontrar en TX = C una ecuación del tipo 0 = C siendo C ≠ 0. 2) El sistema es Compatible determinado si y solo si rang (T) = rang (T/C) = n, que es equivalente a que el sistema TX = C sea de la forma: t11 x1 + t12 x2 + t13 x3 + ...... + t1n xn = c1 t 22 x2 + t 23 x3 + ...... + t 2 n x n = c2 t33 x3 + ........ + t3 n xn = c3 ....................... t nn xn = c n siendo los elementos de la diagonal principal todos no nulos. El sistema se resuelve partiendo de la última ecuación y ascendiendo hasta la primera. 3) El sistema es Compatible Indeterminado si y solo si rang (T) =rang(T/C) = K < n. Supongamos , sin pérdida de generalidad, que
16/19
t11 t12 0 t 22 K = rang L L 0 0
L t1 K L t2 K L L L t KK
lo que obliga a que todos los elementos de la diagonal principal sean no nulos hasta la fila K. Entonces el sistema inicial, AX = B, es Compatible Indeterminado si y solo si el sistema equivalente TX = C puede escribirse como: t11 x1 + t12 x2 + ..... + t1 K xK = f1 (c1 , x K +1 ,....., x n ) t 22 x 2 + ...... + t 2 K xK = f 2 (c2 , x K +1 ,...., xn ) .................................................... t KK x K = f K (c K , x K +1 ,....., x n ) siendo las soluciones al sistema: xi = g i (λK +1 ,...., λn ) x j = λj
1≤ i ≤ K
K +1 ≤ j ≤ n
donde los parámetros λK +1 ,...., λn son números reales. K −1 ) OBS En el paso K, siendo 1 ≤ K ≤ m − 1 , el coeficiente a KK debe ser no nulo para que las correspondientes ecuaciones tengan sentido. Basta realizar una reordenación de las ecuaciones para poder obtener dicha hipótesis, variación que no afecta a las K −1 ) incógnitas. Lo que si que es un inconveniente importante es el hecho de que a KK sea K −1) K −1) muy pequeño y, por tanto, aiK / a KK muy grande, pudiendo presentar dificultades el trabajar con estos números. Los errores de redondeo podrían ir reduciéndose y aumentar paso a paso, desvirtuando la solución. A fin de resolver esta dificultad, veremos a continuación variantes del método de Gauss.
5.2. Método de Gauss con Pivote Parcial. K −1 ) K −1 ) Consiste en tomar, en el paso K, en lugar del elemento a KK el elemento a rK tal
que
{
}
K −1) a rK = max aiKK −1) / K ≤ i ≤ m
Se trata, en definitiva, de intercambiar la fila K por la r y seguir aplicando en método de Gauss.
17/19
5.3. Método de Gauss con Pivote Total. K −1 ) Al igual que el anterior, en el paso K, tomaremos en lugar del elemento a KK el elemento
{
}
max aijk −1 ) / K ≤ i ≤ m K ≤ j ≤ n
Ahora no sólo intercambiamos filas (ecuaciones) si no también columnas (incógnitas). Una vez realizado el intercambio y colocado el elemento elegido en el K −1 ) lugar de a KK , se sigue aplicando el método de Gauss. 5.4. Método de Gauss-Jordan. Dado el sistema AX = B, si A es una matriz cuadrada con A ≠ 0 , el método de Gauss puede ser completado triangulando también la parte superior, convirtiendo así a la matriz A en una matriz diagonal. Esta variante se conoce con el nombre de Método de Gauss-Jordan, y consiste en convertir a cero todos los elementos de matriz A menos los de diagonal principal. Dado el sistema AX = B se transforma la matriz a11 a ( A / B ) = 21 L an 1
L a1n b1 L a 2 n b2 L L L L ann bn
a12 a22 L an 2
por el método de Gauss en t11 t12 0 t 22 (T / C ) = L L 0 0
L L L L
t1n c1 t2n c L L t nn cn
obteniéndose el sistema TX = C. Para obtener ceros por encima de la diagonal principal en T, se procede de forma similar, siguiendo el siguiente algoritmo. • Primer paso. Se consiguen ceros en la columna de al matriz (T/C) por encima de la diagonal principal, transformando cada ecuación Ei en E´i mediante E´ n = En
18/19
E´i = Ei −
t in E t nn n
1 ≤ i ≤ n −1
• Paso K. Se consiguen ceros en la columna n – K + 1 por encima de la diagonal principal, partiendo del sistema en el paso K – 1, transformando cada ecuación EiK −1 ) en EiK ) mediante EiK ) = EiK −1) E
K) i
k −1) i
=E
−
n − K +1 ≤ i ≤ n
t iK( n−−1K) +1) t
K −1 ) (n − K +1 )(n − K +1 )
EnK−−K1)+1
1≤ i ≤ n − K
En a lo sumo n – 1 pasos obtenemos el sistema a11 0 L 0
0 d 22 L 0
L 0 L 0 L L L d nn
p1 p2 L pn
obteniéndose de forma trivial la solución como xj =
Pj d jj
1≤ j ≤ n
Bibliografía Recomendada. • • • •
Álgebra Lineal. Aut: Alberto Luzárraga. Álgebra y Geometría. Aut: Braulio de Diego. Edit: Deimos. Curso de Álgebra y Geometría. Aut: Juan de Burgos. Edit: Alhambra. Curso de Matemáticas Serie A. Aut: A. Negro, V. Zorio. Edit: Alhambra.
19/19
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 17 PROGRAMACIÓN LINEAL. APLICACIONES. 1. Introducción. 1.1. Historia de la Programación lineal. 2. Terminología Básica. 3. Formulación de un Problema de Programación Lineal. 4. Método de Resolución Gráfica. 5. Conjuntos Convexos. 6. Método de Resolución Analítico. 6.1. Teoremas de Resolución Analítico. 6.2. El método de Simplex. 6.2.1. Generación de Puntos Extremos. 6.2.2. Criterio de Optimalidad. 7. Soluciones Degeneradas. 8. Dualidad. 9. Aplicaciones. Bibliografía Recomendada.
1/24
TEMA 17 PROGRAMACIÓN LINEAL. APLICACIONES. 1. INTRODUCCIÓN. La programación lineal consiste en un conjunto de técnicas matemáticas que permiten obtener el mayor provecho posible de sistemas económicos, sociales, tecnológicos, etc, cuyo funcionamiento es posible describirlo adecuadamente mediante un modelo matemático. El problema fundamental consiste en optimizar (maximizar o minimizar) una cierta expresión lineal, sabiendo que sus variables están sometidas a un conjunto de restricciones que vienen expresadas por inecuaciones lineales. 1.1. Historia de la Programación Lineal. En los siglos XVI y XVII, matemáticos como Newton, Leibnitz, Bernovilli o Lagrauge trabajaron en la obtención de máximos y mínimos condicionados de funciones. Un siglo después, Fourier fue el primero en intuir, aunque de manera un tanto imprecisa, los métodos actuales de al programación lineal. Exceptuando a G. Monge, que en 1776 se interesó por problemas de ésta índole, hemos de esperar hasta bien entrado el siglo XX para encontrar nuevos estudios relacionados con lo que hoy en día entendemos por programación lineal. En 1939, el matemático ruso Kantorovitch publicó “Métodos matemáticos de organización y planificación de la producción”, una extensa monografía en la que por primera vez se desarrolla una teoría matemática aplicable a una gran cantidad de problemas. Dicha teoría recibe el nombre de Programación Lineal. En 1941 y 1942 estudian de forma independiente Koopmans y Lantorovitch el llamado “Problema de transporte”. El matemático Stingler plantea, tres años después, el “problema de régimen alimenticio óptimo”. En EE.UU. se planteó, a la finalización de la 2ª Guerra Mundial, que la coordinación de manera eficaz de todas las energías y recursos nacionales era un problema de tal envergadura, que para poder reducirlo y resolverlo había que aplicar los métodos de optimización de la programación lineal. Es en esta época cuando aparecen los primeros computadores, utilizándose para resolver los problemas descritos. G. B. Danzing formula, en 1947, el enunciado común al que se puede reducir cualquier problema de programación lineal. Para ello emplea notación matemática muy precisa. Y él mismo, en 1951, desarrolla el “método del Simplex” apoyándose para ello en los ordenadores. Los fundamentos matemáticos de la programación lineal fueron establecidos por John Von Neumann, que en 1928 publico “Teorías de juegos”, su trabajo más importante. Y en 1947 plantea la posible equivalencia de los problemas de
2/24
programación lineal con la teoría de matrices. Es a partir de este momento cuando otros matemáticos se interesan por esta disciplina, produciéndose un espectacular desarrollo. 2. TERMINOLOGÍA BÁSICA. DEF Llamaremos variables de elección a aquellas variables que aparecen en el problema de forma independiente y cuyo valor queremos calcular, siendo éste siempre positivo. DEF Llamaremos función objetivo a la función matemática lineal que relaciona las variables de elección y cuyo valor queremos optimizar (maximizar o minimizar). DEF Llamaremos restricción a cada una de las condiciones que deben verificar las variables de elección, siendo estas condiciones expresadas mediante ecuaciones o inecuaciones lineales. Un problema de optimización se puede clasificar en uno de los siguientes tipos: Tipo 1: Optimización libre o in restricciones. Los elementos que constituyen el problema son las variables de elección y la función objetivo. No posee restricciones. También se conoce por el nombre de “optimización clásica sin restricciones”. Tipo 2: Optimización con restricciones. El problema está constituido por variables de elección, función objetivo y restricciones. Estas últimas pueden ser: a) Restricciones de igualdad. Estos problemas reciben el nombre de “optimización clásica con restricciones” y pueden ser resueltos por medio de técnicas como los multiplicadores de Lagrange. b) Restricciones de Desigualdad. La Programación matemática es la rama que se encarga del estudio de estos problemas. Podemos clasificarlos a su vez en: b.1.) Problemas de programación lineal. Todas las expresiones que aparecen en el enunciado del problema son lineales (tanto la función objetivo como las restricciones). b.2.) Problemas de Programación no Lineal. Alguno (o todas) de las expresiones no son lineales.
3/24
3. FORMULACIÓN DE UN PROBLEMA DE PROGRAMACIÓN LINEAL. Un problema de programación lineal se puede formular fundamentalmente de tres formas distintas. a) Forma Completa. Supongamos que el problema consiste en maximizar la función objetivo, que hay n variables y m restricciones. Maximizar z = c1 x1 + c 2 x2 + ..... + cn xn Restricciones a11 x1 + a12 x 2 + .... + a1 n xn ≤ r1 .......................................................... a p1 x1 + a p 2 x 2 + .... + a pn xn ≤ r p a( p +1 )1 x1 + a( p +1 )2 x 2 + ..... + a( p +1 )n xn ≥ rp .......................................................... a q1 x1 + aq 2 x 2 + ..... + aqn xn ≥ rq a( q +1)1 x1 + a( q +1)2 x2 + ..... + a( q +1 ) x n = rq +1 ......................................................... a m1 x1 + am 2 x2 + ..... + a mn xn = rm xi ≥ 0 ∀i : 1,...., n b) Forma Reducida. n
z = ∑ Ci xi
Maximizar
i =1
Restricciones n
∑a
j : 1,...., m i : 1,...., n
x ≤ rj
ji i
i =1
xi ≥ 0 c) Forma matricial. Si definimos c1 c C= 2 ... c n
x1 x x= 2 ... x n
a11 a A = 21 ... a m1
a12 a 22 ... am 2
podemos formular el problema como Maximizar
z = cz ⋅ x
4/24
...
a1 n ... a 2 n ... ... ... amn
y
r1 r R = 2 ... r n
Restricciones AX ≤ R X ≥0 OBS Por no complicar la notación, en los dos últimos casos solo hemos escrito en las restricciones el símbolo de desigualdad ≤. Pero hemos de dejar constancia de que ambas formulaciones equivalen a la primera, siendo lo correcto el haber denotado con ≤ las p primeras restricciones, con ≥ las q – p siguientes, y con = las m – q últimas. DEF Llamaremos forma canónica de un problema de programación lineal cuando todas las restricciones del enunciado (excluyendo las que indican que las variables son no negativas) tienen la misma desigualdad (≤ ó ≥). Para el caso de maximizar Maximizar
Z = Ct ⋅ X
Restricciones AX ≤ R X ≥0 y para el caso de Minimizar Minimizar
Z = Ct ⋅ X
Restricciones AX ≥ R X ≥0 Tengamos en cuenta que una restricción del tipo a j 1 x1 + a j 2 x2 + ..... + a jn x n = r j es equivalente a las dos restricciones a j 1 x1 + a j 2 x2 + ...... + a jn xn ≤ r j a j 1 x1 + a j 2 x2 + ........ + a jn xn ≥ r j Todo problema de programación lineal expresado en forma canónica se puede escribir en forma estándar sin mas que tener en cuenta: 1) La expresión AX ≤ R se puede escribir como AX + Y = R siendo Y = ( y1 , y 2 ,...., y m ) . En las yj se recoge todo lo que falta para que se produzca la igualdad. Por definición Y ≥ 0. t
5/24
2) La expresión AX ≥ R se puede escribir como AX – Y´ = R siendo (Y ´)t = ( y´1, y´2 ,....., y m ) . En las yj´ se recoge todo lo que falta para que se produzca la igualdad. También Y´ ≥ 0. DEF Los elementos y1 , y2 ,…., ym de la matriz Y reciben el nombre de variables de holgura. DEF Los elementos y1 ´, y2 ´,…..,ym´ de la matriz Y´ reciben el nombre de variables de excedente. 4. MÉTODO DE RESOLUCIÓN GRÁFICA. Dentro de los diferentes métodos de resolución, vamos a describir ahora el funcionamiento del método de resolución gráfica, aplicable a los problemas con dos variables. Para problemas con más variables, en un punto posterior trataremos el método analítico del Simplex. Supongamos que tenemos el siguiente problema: Optimizar
Z = c1 x1 + c 2 x2
Restricciones AX ≥ B ( ó AX ≤ B) X ≥0 Los pasos a seguir en su resolución son: 1) Al ser todas las variables de elección no negativas, consideraremos el plano x1 x2 limitado al primer cuadrante. 2) Determinamos la región factible, o conjunto de los puntos del plano que verifican todas las restricciones. Se obtiene como intersección de los subespacios dados por cada una de las restricciones. 3) Representamos la función objetivo. Lo que dibujamos es el vector director de la recta definida por la función objetivo, que es (- c2 , c1 ). 4) Desplazamos la recta definida por el vector (- c2 , c1 ) en la dirección (c1 , c2 ) obteniendo rectas paralelas a la inicial en el interior de la región factible hasta alcanzar el punto o puntos óptimos. Las soluciones que nos podemos encontrar en la resolución gráfica de un problema de programación lineal pueden ser. a) Solución finita y única. Corresponde con un vértice de la región factible, pudiendo ser ésta acotada o no. b) Solución finita y no única. 6/24
Se obtiene cuando la pendiente de la recta definida por la función objetivo coincida con la pendiente de uno de los lados donde se presentan todos los puntos óptimos. En esta situación, si (a, b) y (c, d) son dos vértices consecutivos de la región factible cuyo segmento que limitan es paralelo a la función objetivo, todos los puntos de dicho segmento son solución, que llamaremos (x, y). x = λa + (1 − λ)c con 0 ≤ λ ≤ 1 y = λb + (1 − λ)d Esta situación se puede dar tanto si la región factible es acotada como si no lo es. c) Solución no finita (no acotada). Se produce cuando la región factible es no acotada y la recta definida por la función objetivo se puede desplazar indefinidamente de forma paralela encontrando siempre puntos de la región factible. d) Sin solución. Un problema de programación lineal no tiene solución cuando la región factible es vacía. 5. CONJUNTOS CONVEXOS. DEF Llamaremos Conjunto Convexo al conjunto de puntos que tiene la propiedad de que para cualquier par de puntos del mismo, el segmento que los une también está incluido en dicho conjunto. Ejemplos. Un círculo o una recta son conjuntos convexos. En cambio, una circunferencia o una elipse no los son. DEF Llamaremos punto límite a todo punto que se encuentra en la frontera del conjunto. DEF Llamaremos punto interior a todo punto del conjunto convexo que no es punto límite. DEF Llamaremos punto extremo a todo punto límite que no se encuentra en el segmento limitado por otros dos puntos límite. Desde el punto de vista geométrico equivalen a los vértices del conjunto. DEF Dados n, v ∈ V con V K-espacio vectorial de dimensión n, llamaremos combinación lineal convexa de n y v a toda expresión de la forma λu + (1 − λ)v con 0 ≤ λ ≤ 1
7/24
Teniendo en cuenta esta última definición, podemos decir que una combinación lineal convexa está formada por todos los puntos del segmento que delimitan u y v (lo demostraremos a continuación). Podemos afirmar, por tanto, que un conjunto es convexo si y solo si para todo par de puntos del conjunto, su combinación lineal convexa pertenece a dicho conjunto. TEOREMA Dados u , v ∈ 3n , toda combinación lineal convexa que se dé entre ellos es un punto del segmento que los une. Dem. Vamos a realizar la demostración en 32 para que se pueda visualizar gráficamente. La demostración sería análoga para el caso de 3n . Tomemos u = (u1 ,u 2 ) y v = (v1 , v2 ) elementos de 32 . Hemos de probar que w = λu + (1 − λ)v
(0 ≤ λ ≤ 1)
es un punto perteneciente al
segmento PQ con u = OP y v = OQ . Sea R el punto del plano tal que OR = OP − OQ = u − v . Los puntos OPQR definen un paralelogramo, siendo OP = u la diagonal del paralelogramo. Por tanto se verifica OP = OR + OQ . Sea w = λu + (1 − λ)v ó también OS = λOP + (1 − λ)OQ .
(
)
OS = λ ⋅ OP + OQ − λOQ = λOP − λOQ + OQ = λ OP − OQ + OQ = λOR + OQ Si λ = 0 ⇒ OS = OQ Si λ =1 ⇒ OS = OP
ó ó
w=v w =u
Si 0 < λ < 1 ⇒ λOR es un punto intermedio entre O y R y al sumarle OQ da lugar a un punto intermedio entre P y Q. PROP La función objetivo de un problema de programación lineal al igual que las m restricciones y n condiciones de no negatividad definen conjuntos convexos. Dem. 1) Función objetivo.
8/24
n
n
i =1
i =1
Sea z = ∑ ci xi y sea H = {(x1 , x2 , ...., xn ) ∈ 3n / ∑ c1 xi = z} Vamos a demostrar que el conjunto H es convexo. u, v ∈ H ⇒ u = (u1 ,...., un ) con c1 u1 + .... + cn un = z v = (v1 ,...., vn ) con c1 v1 + .... + cn v n = z W = λu + (1 − λ)v = λ(u1 ,..., u n ) + (1 − λ)(v1 ,..., v n )
con 0 ≤ λ ≤ 1
Entonces W = (λu1 + (1 − λ)v1 ,...., λun + (1 − λ)vn ) n
n
n
n
i =1
i =1
i =1
i =1
y C ∑ Ci (λui + (1 − λ)vi ) = ∑ [λCi ui + (1 − λ)Ci Vi ] = λ∑ CiU i + (1 − λ)∑ Ci vi = = λz + (1 − λ)z = z ⇒ W ∈ H
y
H es convexo.
2) Restricciones de Desigualdad. Las restricciones de desigualdad dividen a 3n en dos semiespacios cerrados (ya que las desigualdades no son estrictas). Veamos entonces que un semiespacio cerrado de 3n es convexo. Sea la desigualdad a1 x1 + ..... + an xn ≥ r con
( x1 ,...., xn ) ∈ 3n
Consideremos H = {(x1 ,...., xn ) ∈ 3n / a1 x1 + .... + an x n ≥ r} es semiespacio de 3n definido por la desigualdad anterior. Si u, v ∈ H ⇒ a1u1 + ..... + an un ≥ r y a1 v1 + .... + a n vn ≥ r . Sea w = λu + (1 − λ)v = (λu1 + (1 − λ)v1 ,...., λun + (1 − λ)vn ) n n a1 w1 + .... + a n wn = ∑ ai (λui + (1 − λ)vi ) = ∑ [λai ui + (1 − λ)ai vi ] = i =1 i =1 n
n
i =1
i =1
= λ∑ ai ui + (1 − λ) ⋅ ∑ ai vi ≥ λr + (1 − λ)r = r Entonces w ∈ H y H es convexo. 3) Las condiciones de no negatividad son un tipo particular de no restricciones y por tanto le es aplicable la demostración anterior. PROP La intersección de un número finito de conjuntos convexos de 3n es un conjunto convexo. 9/24
Dem. Vamos a realizar la demostración por inducción de el número de conjuntos. Para dos conjuntos: Sea C1 y C2 dos conjuntos convexos de 3n y sean u,v∈C1 ∩C2 . Como u, v ∈ C1 convexo⇒ λu + (1 − λ)v ∈ C1 Como u, v ∈ C2 convexo ⇒ λu + (1 − λ)v ∈ C2
(0 ≤ λ ≤ 1) (o ≤ λ ≤ 1) y C1 ∩C 2
es convexo.
Para n – 1 conjuntos. n −1
Hipótesis de inducción: ∩ Ci es un conjunto convexo. i =1
Para
n conjuntos.
Sean C1 , C2 ,….., Cn n conjuntos convexos. n
n −1 C = Ι i Ι Ci Ι Cn i =1 i =1 n −1
Ι
Ci es un conjunto convexo por hipótesis de inducción.
i =1
Cn es un conjunto convexo por hipótesis inicial. Aplicando el caso ya visto para 2 conjuntos, su intersección es un conjunto convexo. Por tanto, la intersección de n conjuntos convexos es un nuevo conj unto convexo. COROLARIO La Región Factible de un problema de programación lineal es un conjunto convexo. Podemos generalizar la definición de combinación lineal convexa a m vectores como sigue. DEF Llamaremos combinación lineal convexa de los vectores u1 , u2 ,...., um ∈ 3n a u = λ1u1 + λ2 u 2 +..... + λm u m con 0 ≤ λi ≤ 1 ∀i : 1,...., m . DEF Llamaremos envoltura convexa de cualquier conjunto de puntos T de 3n , y lo denotaremos por C(T), al conjunto de todas las combinaciones convexas de puntos T. PROP C (T) es el conjunto convexo más pequeño que contiene a T.
10/24
Dem. Trivial. DEF Un conjunto convexo C es ilimitado si ∀u ∈ C existe v ∈ 3n -{0} tal que los puntos u + λv ∈ C con λ > 0. En caso contrario diremos que C es limitado. DEF Sea T ⊂ 3n un conjunto con un número finito de puntos. La envoltura convexa de T la llamaremos poliedro convexa. Si C es un conjunto cerrado y poliedro convexo, entonces cualquier punto de C se puede expresar como una combinación convexa de los puntos extremos. Entonces C será la envoltura convexa de sus vértices. DEF
Llamaremos como a T ⊂ 3n que verifica que ∀u ∈ T ⇒ λu ∈ T
con λ ≥ 0
Un cono convexo es un cono que es convexo. DEF Llamaremos Simplex a un poliedro de n dimensiones que tiene exactamente n+1 vértices. Las fronteras del Simplex contienen otros simplex de menor dimensión que reciben el nombre de Caras Simpliciales. 6. MÉTODO DE RESOLUCIÓN ANALÍTICO. Sea el problema a optimizar. z = Ct ⋅ x Restricciones Ax = B x≥0 donde las restricciones las hemos convertido en igualdades introduciendo variables de holgura o de excedente. DEF Llamaremos solución factible (SF) a x o = (x10 , x2o ,..., xn0 ) que verifica las restricciones del problema. Es por tanto un punto de la región factible (RF). DEF Llamaremos Solución Factible Básica (SFB) a x o = (x1o , x 2o ,...., xno ) que verifica que es SF y que tiene n – m componentes nulas como mínimo. DEF Llamaremos Solución Factible Básica No Degenerada (SFBND) a o o o o x = (x1 , x2 ,..., xn ) que es una Solución Factible Básica que tiene exactamente n – m componentes nulas. En caso contrario diremos que es una SFB degenerada. DEF Llamaremos Solución Factible Optima (SFO) a x o = (x1o , x2o ,..., xno ) que es una SFB que optimiza la función objetivo. 11/24
6.1. Teoremas Básicos de la Programación Lineal. Vamos a ver ahora una serie de problemas que nos van a permitir llegar a la solución del problema. TEOREMA 1 El conjunto de Soluciones Factibles de un problema de programación lineal, caso de no ser vacío, es convexo. Dem. Sea S = {x ∈ 3n / Ax = B, x ≥ 0} y supongamos S ≠ Ø Sea x1 , x2 ∈ S y α, β ∈ 3+ con α + β = 1 Como x1 ∈ S ⇒ x1 ≥ 0 y Ax1 = B ⇒ αx1 ≥ 0 Como x2 ∈ S ⇒ x 2 ≥ 0 y Ax2 = B ⇒ βx2 ≥ 0 Luego αx1 + βx 2 ≥ 0 y A(αx1 + βx2 ) = αAx1 + βAx2 = αB + βB = (α + β )B = B Entonces αx1 + βx 2 ∈ S y como αx1 + βx2 es una combinación lineal convexa de x1 y x2 , dos puntos cualesquiera de S, deducimos que S es un conjunto convexo. TEOREMA Teorema Fundamental de la Programación Lineal. a) La función objetivo alcanza su óptimo en un punto extremo del conjunto convexo S de soluciones factibles. b) Si el óptimo se alcanza en más de un vértice entonces cualquier combinación convexa de estos vértices también optimiza la función objetivo. Dem. a) Vamos a realizar la demostración por reducción al absurdo. Sean x1 , x2 ,….,xn los vértices del conjunto convexo S y xo una solución factible optima que no es extremo. Al ser xo solución factible verifica Ax0 = B x0 ≥ 0 y por ser óptima c t ⋅ x0 ≤ c t ⋅ x ∀ x ∈ S
12/24
Como hemos supuesto que xo no es un vértice de S (Región factible) entonces lo podemos expresar como una combinación lineal convexa de los vértices de S: n
n
xo = ∑ αi xi con
∑α
= 1 y 0 ≤ αi ≤ 1 ∀i : 1,..., n
i
i =1
i =1
La función objetivo en el punto xo es n n n z ( xo ) = C t ⋅ xo = C t ⋅ ∑ αi xi = ∑ αi C t xi = ∑ αi ⋅ z( xi ) i =1 i =1 i =1
Entre los z(xi) con 1 ≤ i ≤ n hay uno que será el más pequeño de todos (elegimos el más pequeño si el problema es minimizar la función objetivo y el más grande si hay que maximizar). Sea λ = min{z ( xi ) / 1 ≤ i ≤ n} Entonces λ ≤ C t xi 1 ≤ i ≤ n pudiéndolo expresar como C t xi = λ + µi con µi ≥ 0 1 ≤ i ≤ n Por tanto n
n
n
n
i =1
i =1
i =1
i =1
C t xo = ∑ αi C t xi = ∑αi (λ + µi ) = ∑ αi ⋅ λ + ∑ αi µi = n
n
n
= λ ⋅ ∑ αi + ∑ αi µi = λ + ∑ αi µi i =1
i =1
i =1
Y como n t
∑α µ ≥ 0 ⇒ C x i
i
o
≥λ
i =1
Lo que contradice que Xo sea una SFO (para el caso de minimizar). b) Supongamos que el óptimo alcanza en x1 , x2 ,…..,xp , p vértices de la región factible S. Vamos a realizar la demostración para obtener el mínimo (en el caso de maximizar sería igual). Sea Ct xi = m Entonces
1 ≤ i ≤ p con m mínimo de la función objetivo.
C t xi ≤ C t x ∀x ∈ S
13/24
Axi = B xi ≥ 0 p
xo = ∑ αi xi una combinación lineal convexa de los vértices x1 ,….,xp , con
Sea
i =1
p
∑α
i
= 1 y 0 ≤ αi ≤ 1
i =1
Veamos que xo es también óptimo. p
p
p
p
i =1
i =1
i =1
i =1
C t xo = ∑ C t αi xi = ∑ αi C t xi = ∑ αi ⋅ m = m ⋅ ∑ αi = m ⋅1 = m p
p
p
p
Axo = ∑ Aαi xi = ∑ αi Axi = ∑ αi B = B ⋅ ∑ αi = B ⋅1 = B i =1
i =1
i =1
i =1
p
xo = ∑ αi xi ≥ 0 i =1
Luego xo también optimiza la función. TEOREMA 2 Dada una solución factible, xo ∈S, ésta es un punto extremo del conjunto de soluciones factibles S si tiene K componentes positivas, K ≤ n , y las restantes, n – K, nulas, de forma que se satisface K
∑x
ρ
v =B
oi i
i =1
ρ
ρ
siendo {v1 ,...., vK } K vectores linealmente independientes del conjunto de vectores que se obtienen a partir de las columnas de la matriz A (matriz de coeficientes del conjunto de restricciones). Dem. Sea xo = ( xo 1 , xo 2 ,...., xon ) es una solución factible que verifica las condiciones del enunciado. Supongamos que xo no es un punto extremo. Entonces xo se puede expresar como combinación lineal convexa de dos puntos cualesquiera, x1 y x2 , de la región factible (observemos que no decimos que esos puntos sean extremos) xo = λx1 + (1 − λ)x 2 14/24
0 ≤ λ ≤1
Podemos suponer, sin pérdida de generalidad, que las K componentes de xo no nulas son las primeras. xo = ( xo 1 , xo 2 ,...., xoK ,0,....,0) ) Entonces, los puntos x1 y x2 han de ser del mismo tipo: x1 = ( x11 ,...., x1K ,0,...,0)
y
x2 = (x 21 ,..., x2 K ,0,...,0 )
y como Ax1 = B y Ax2 = B tenemos K ρ Ax1 = ∑ x1i vi = B K i =1 ⇒ ( x1i − x2i )vρi = 0 ∑ K ρ i =1 Ax2 = ∑ x2 i vi = B i =1
Los vectores
{vρ1 ,..., vρK } son linealmente independientes x1 i − x2 i = 0 1 ≤ i ≤ K ⇒ x1i = x2 i
1 ≤ i ≤ K ⇒ x1 = x2
Al no poder expresar xo como combinación lineal convexa de dos puntos S ⇒ xo es un punto extremo o vértice de S. TEOREMA 3 (Recíproco del anterior). Sea xo ∈S un punto extremo del conjunto de soluciones factibles S. Entonces hay a lo sumo K componentes positivas en xo , siendo el resto nulas, y los K vectores columna de la matriz A que verifican K
∑x
oi
ρ
⋅ vi = B
i =1
son linealmente independientes. Dem. Sin pérdida de generalidad, vamos a suponer que son no nulas las K primeras componentes de xo . K
ρ
xo ∈ S ⇒ Axo = B ⇒ ∑ xoi ⋅ vi = B i =1
ρ
ρ
Supongamos que {v1 ,...., vK } es un conjunto Linealmente Dependiente. Podemos encontrar una combinación lineal de ellos con algún escalar no nulo.
15/24
K
Sean
ρ
ρ
λ1 ,..., λK ∈ 3 / ∑ λi vi = o con i =1 K
elegido otro). Se verifica
ρ
∑ λ ⋅ λv 1
i i
λ1 ≠ 0 (elegimos λ1 como podíamos haber
ρ
=o
i =1
Generamos los puntos x´ y x´´ como x´= (xo 1 − λ1 λ1 , x o 2 − λ1 λ2 ,...., xoK − λ1λK ,0,...,0 ) x´´= ( xo1 + λ1 λ1 , xo 2 + λ1 λ2 ,..., xoK + λ1λK ,0,...,0 ) Es claro que ambos puntos verifican Ax´ = B y
Ax´´= B
Todo lo dicho es igualmente válido si en lugar de λ1 tomamos un nº cualquiera positivo tan pequeño como sea necesario para que todas las componentes no nulas de x´ y x´´ sean positivas. Entonces x´ y x´´ son soluciones factibles y se verifica: xo =
1 1 x´+ x´´ 2 2
xo sería combinación lineal convexa de x´ y x´´ y por hipótesis era un punto extremo. Llegamos a una contradicción siendo por tanto nuestra suposición falsa y son linealmente independientes.
{vρ1 ,..., vρK }
COROLARIO El punto xo ∈S (solución factible) es un punto extremo si y sólo si los vectores columna de la matriz A asociados a las componentes positivas de xo son K
Linealmente Independientes verificando
∑x
ρ
v = B.
oi i
i =1
6.2. El método del Simplex. Si queremos calcular el punto óptimo (máximo o mínimo) de un problema de programación lineal, sólo hemos de obtener todos los vértices de la región factible y saber el valor de la función objetivo en cada uno de ellos. El problema surge cuando el nº de vértices puede ser elevado, lo que hace este proceso impracticable. El método del simplex nos facilitará la obtención de la solución óptima mediante la elaboración de un criterio que nos va a permitir si una solución básica es o no una solución óptima. En caso negativo nos daría un procedimiento de aproximación a dicha solución óptima. El método consiste en:
16/24
a) Partimos del conocimiento de una solución básica inicial. Si es óptima (mediante el criterio de optimalidad) hemos terminado. b) Pasamos a otra solución básica (vértice contiguo) tal que el valor de la función objetivo es menor (o mayor) que en la anterior. Si el nuevo vértice no es todavía la solución óptima, repetiremos el paso. c) Al ser el nº de vértices finito, en un nº finito de repeticiones encontraremos la solución (si la hay). 6.2.1. Generación de Puntos Extremos. Vamos a suponer que partimos de una solución factible básica inicial que tiene K componentes positivas como máximo. xo = ( xo1 , xo 2 ,....., xoK ,0,....,0 )
y
xoi > 0 1 ≤ i ≤ K
En la matriz A tenemos los vectores columna independientes. K
∑x
{vρ1 ,...., vρK }
que son linealmente
ρ
v =B
oi i
i =1
Cualquier otro vector de A primeros, ya que rang (A) = K. K
ρ
{vρK +1,..., vρn }
ρ
ρ
es combinación lineal de los K vectores
K
ρ
Llamaremos v o = ∑ xoi vi y sea v K +1 = ∑ x( K +1 )i vi i =1
i =1
Elegimos λ∈3 con λ ≥ 0. Entonces K
ρ
ρ
λvK +1 = ∑ λx( K +1 )i vi i =1
ρ
ρ
K
ρ
vo − λv K +1 = ∑ (xoi − λx( K +1)i )vi i =1
ρ
Hemos expresado vo como combinación lineal de los K + 1 primeros vectores columna de A. La solución factible asociada es X = (x o1 − λx( K +1 )1 , x o 2 − λx( K +1 )2 ) ,....., xoK − λx( K +1) K , λ,0,...,0 ) Se verifica que Ax = B K
∑ (x i =1
ρ
ρ
K
K
i =1
i =1
ρ
ρ
ρ
oi − λx(K +1 )i )vi + λv K +1 = ∑ xoi vi − λ∑ x( K +1 )i vi + λvK +1 = B − λvK +1 + λvK +1 = B
17/24
Como x ha de ser solución factible, todas sus componentes han de ser nulas o positivas: λ≥0
xoi − λx( K +1 )i ≥ 0
1≤ i ≤ K
Excluimos el caso λ = 0 ya que entonces x = xo que sabemos que es solución factible básica. xoi − λx( K +1 )i ≥ 0
1 ≤ i ≤ K ⇒ xoi ≥ λx( K +1 )i ⇒ λ ≤
xoi x(K +1 )i
• Si x( K +1 )i = 0 ⇒ xoi > 0 • Si x( K +1 )i < 0 ⇒ xoi - λx(K+1)i > 0 • Si x( K +1 )i > 0 ⇒ xoi − λx( K +1 )i ≥ 0 ⇒ λ ≤
xoi x( K +1 )i
Por tanto hemos de tomar λ menor o igual que todos los cocientes
xoi x(K +1 )i
cuando los
x(K+1)i sean positivos. Además, si queremos que x sea una solución factible básica, no ha de tener más de K componentes no nulas. Pero si tomamos los coeficientes x( K +1 )i = 0 1 ≤ i ≤ K . x = ( xo1 , xo 2 ,...., xoK , λ,0,....,0 ) tendría K + 1 componentes no nulas y por tanto no sería solución factible óptima. Si todos los x(K+1)i < 0 componentes no nulas.
1≤ i ≤ K sucede lo mismo, x volvería a tener K + 1
Por lo tanto, algún x(K+1)i ha de ser positivo. x Si tomamos λ = min oi siempre que x(K+1)i > 0 podemos asegurar que x x( K +1 )i 1≤i ≤K tendrá a lo más K componentes no nulas. Si suponemos que el mínimo se alcanza para x i = 1 tendremos λ = oi y entonces la primera coordenada de x, xo1 - λx(K+1)1, será x( K +1 )1 nula. Si el mínimo se alcanza en más de un valor de i, habrá más componentes nulas. Para afirmar que x es una solución factible básica, una vez visto que tiene como mucho K componentes no nulas, hemos de comprobar que los vectores asociados a dichas componentes no nulas son linealmente independientes.
18/24
Como hemos supuesto que la primera componente es nula (ya que λ =
x oi
x( K +1 )1 tenemos que una combinación lineal de los vectores asociados quede el vector cero es K +1
ρ
ρ
O = ∑ µi vi i =2
ρ
ρ
ρ
Podemos expresar v K +1 como combinación lineal de {v1 ,...., vK } K
ρ
ρ
v K +1 = ∑ x( K +1) j v j j =1
Entonces ρ
K +1
ρ
K
K
i =2
j =1
ρ
ρ
K
ρ
o = ∑ µi v i = ∑ µi vi + µK +1 ⋅ ∑ x( K +1 ) j v j = x( K +1 )1 ⋅ µK +1 v1 + ∑ (µi + µK +i x( K +1)i )vi i= 2
ρ
i =2
ρ
Como {v1 ,..., vK } son linealmente independientes, los escalares deben ser nulos. µK +1 ⋅ x(K +1 )1 = 0 y µi + µK +i ⋅ x( K +1 )i = 0 Si µK +1 = 0 ⇒ µi = 0
2≤i ≤ K
ρ
ρ
2 ≤ i ≤ K ⇒ {v2 ,...., v K +1 } son linealmente independientes
Si µK +1 ≠ 0 ⇒ x( K +1 )1 = 0 ⇒ Como λ = Así pues µK +1 = 0 y los vectores
x oi x( K +1 )1
{vρ2 ,...., vρK +1}
llegamos a una contradicción.
son L. I.
6.2.2. Criterio de Optimalidad. Vamos a ver ahora como, a partir de la solución factible básica, ir obteniendo otras soluciones factibles básicas tales que cada una de ellas mejore el valor de la función objetivo en cada paso. Sea xo = ( xo1 , xo 2 ,....., xoK , o,....., o ) la solución factible básica inicial con
{vρ1 , vρ2 ,....., vρK } los vectores columna de la matriz A asociados a las componentes no nulas que verifican ser linealmente independientes. La función objetivo es z = Ct · x
19/24
que aplicada en x = xo K
z o = ∑ Ci x oi i =1
y sea K
ρ
K
ρ
z j = ∑ Ci x ji con v j = ∑ x ji vi i =1
K +1≤ j ≤ n
i =1
TEOREMA Si en un problema de minimización se verifica z j −cj ≤ 0 1≤ j ≤ n entonces xo es un punto óptimo. Si el problema fuese de maximización el óptimo se daría cuando z j −cj ≥ 0 1≤ j ≤ n Dem. Vamos a demostrar el teorema para el caso de un problema de minimización. Sea y = ( y1 , y2 ,...., y n ) una solución factible básica y z * = c t ⋅ y Se verifica yi ≥ 0 n
ρ
∑yv
i i
1≤ i ≤ n =B
i =1
ρ
ρ
ρ
Como {v1 ,...., vK } son L. I. y los v j con combinación lineal de los K primeros tenemos. ρ
K
ρ
v j = ∑ x ji vi
K + 1 ≤ j ≤ n pueden expresar como
K +1≤ j ≤ n
i =1
n
K n ρ K ρ ∑ y j ⋅ x ji vi =B con y ⋅ x v = B ⇒ ∑ ∑ ∑ j ji i j =1 i =1 i =1 j =1
Así pues, si
20/24
n
∑y x j
j =1
ji
=xoi
z j −cj ≤ o
1≤ j ≤ n ⇒ z j ≤ cj
1≤ j ≤ n
Por tanto: n n n K K n K z * = ∑ c j y j ≥ ∑ z j y j = ∑ ∑ ci x ji y j = ∑ ∑ x ji y j ci = ∑ xoi ci =z o j =1 j =1 j =1 i =1 i =1 j =1 i =1
⇒ z * ≥ z o luego zo es mínima. ¿Qué sucede si la desigualdad zj – cj ≤ 0 en el caso de un problema de minimización no fuese cierta para 1 ≤ j ≤ n ? Existen dos posibilidades: • No hay solución. • Podemos obtener otra solución factible básica más pequeña que la inicial, al no ser óptima ésta. Veamos como obtenerla. Sea xo = ( xo 1 , xo 2 ,...., xoK ,0,....,0 ) una solución factible básica tal que existe un m ∈ {1,...., n} con zm – cm > 0. K
ρ
ρ
Sea v j = ∑ x ji vi
K +i≤ j≤ n
i =1
K
ρ
B = ∑ xoi vi
ya
que
xo
es
solución
i =1
K
ρ
ρ
ρ
K
ρ
ρ
⇒ B = ∑ xoi vi − λvm + λvm = ∑ ( xoi − λxmi )vi + λvm i =1
i =1
Si x mi ≥ 0 ∀ m el valor de la función objetivo no puede estar acotado inferiormente ya que el nuevo punto extremo sería x = ( xoi − λx m1 ,....., xoK − λxmK ,0,..., λ,...,0 ) y entonces K
K
K
i =1
i =1
i =1
z * = c t x = ∑ ci ( xoi − λxmi ) + λcm = ∑ ci xoi − λ∑ ci xmi + λcm = = z o − λz m + λcm = z o + λ(c m − z m ) < z o ya que cm – zm < 0
21/24
Por tanto, dándole a λ valores cada vez mayores el valor de z* es tan próximo a - ∞ como queramos. Luego la función objetivo no está acotada inferiormente. x x Si algún xmi > 0 (por ejemplo i = 1) λ = min oi = o1 para xmi > 0 podemos xmi x m1 obtener otra solución factible básica que satisface x = 0, x02 − λxm 2 ,...., xoK − λxmK ,0,...., λ,...,0 K
z * = c t x = ∑ ci ( xoi − λxmi ) + λcm = z o − λz m + λcm = z o + λ(cm − z m ) < zo i= 2
De forma análoga podemos verlo en el caso de un problema de maximización. 7. SOLUCIONES DEGENERADAS. DEF Una solución factible básica es degenerada cuando al menos una de las componentes es nula. Es decir, si tenemos el conjunto linealmente independiente
{vρ1 ,..., vρK }
K
∑x
tal que
oi
ρ
⋅ vi = B ,
diremos
que
la
solución
factible
básica
i =1
xo = ( xo 1 , xo 2 ,..., xoK ,0,...,0 ) es degenerada si al menos xoi = 0 para algún i ∈ {1,..., K }. Si se da esta situación no podemos hacer uso del método simplex, ya que la nueva solución no mejoraría la solución degenerada inicial. Para poder resolver este problema, hemos de tener en cuenta que la solución ρ ρ degenerada xo lleva asociada la base P = {v1 ,..., v K } de 3K tal que xo = P −1 ⋅ B . Sea ε > 0 suficientemente pequeño y hacemos que las restricciones sean función de ε:
ρ
ρ
ρ
ρ
ρ
ρ
x1 v1 + x2 v2 + ..... + xn v n = B + εv1 + ε 2 v 2 + .... + ε n vn = B(ε ) La solución vendrá dada por xo (ε ) = p −1 ⋅ B(ε)
(
)
t
Si L j = p −1 ⋅ v j = λ1 j λ2 j ....λKj ⇒ xo (ε) = xo + εL1 + ε2 L2 + .... + ε n Ln Así los Lj de los vectores de la base se compondrán de ceros excepto el elemento j-ésimo, que será la unidad. Los Lj de los vectores que no pertenecen a la base tendrán la forma general ( K + 1 ≤ j ≤ n ) . ρ
Para saber el vi que eliminaremos de la base, bastaría tomar
22/24
x (ε) min oi > 0 / 1 ≤ i ≤ K} λij 8. DUALIDAD. DEF
Dado un problema de programación lineal min
z = ct · x Ax > B x≥ 0
definimos el problema dual del anterior como max t = y · B y·A≤C y≥ 0 Análogamente, si el problema es de maximizar, siendo su dual de minimizar. TEOREMA. Teorema de dualidad. Dado un problema de programación lineal, si posee solución óptima finita, entonces el dual también posee solución óptima finita y además min z = max t. La solución del dual es yo = Co ⋅ p −1 , siendo también la solución óptima del problema inicial. Con este teorema podemos resolver un problema de programación lineal a partir de su dual, y recíprocamente. La dualidad es involuntaria, es decir, el dual del dual es el problema inicial. 9. APLICACIONES. Actualmente la programación lineal aborda cuestiones ajenas a la geometría. Un ejemplo es el problema del transporte, que surge al tener varios puntos de producción y varios de distribución, y se plantea el modo de distribuir los productos para que el coste sea mínimo. El problema del transporte se formula por primera vez en 1941 – 42, por Koopmans y Kantorovith de forma independiente. En 1958 se aplicaron métodos de programación lineal para obtener el plan óptimo de transporte de arena para la construcción del edificios en la ciudad de Moscú. Existían 10 puntos de partida y 230 de llegada. Se consiguió rebajar en un 11% los gastos respecto a los costes previstos. Otro de los problemas más comunes es el de la dieta. Se trata de determinar las cantidades diferentes de alimentos que hay que proporcionar a una persona o animal para poder asegurarle una alimentación suficiente con un coste mínimo. 23/24
Bibliografía Recomendada. Programcion lineal. S.J. Gross. Ed: Comp. edit. continental Programación matematica. A. Balbás.J.A. Gil. Ed: AC Programación Lineal. Simonard
24/24
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 18 MATRICES. ALGEBRA DE MATRICES. APLICACIONES AL CAMPO DE LAS CIENCIAS SOCIALES Y DE LA NATURALEZA. 1. Introducción. 2. Concepto básicos. 2.1. Tipos de matrices. 3. Mmxn (K) es isomorfo a L(K m, Kn ). 4. El Espacio Vectorial Mmxn (K). 4.1. Suma de Matrices. 4.2. Producto de Una Matriz por un escalar. 4.3. El espacio Vectorial Mmxn (K). 5. El Anillo Mn (K). 5.1. Producto de Matrices. 5.2. El Anillo Mn (K). 6. Producto de Matrices generalizado. 7. Matrices Regulares. 8. Transposición de Matrices. 9. Matrices Simétricas y Hemisimétricas. 10. Rango de una Matriz. 11. Aplicaciones de las Matrices. 11.1. Uso de las Matrices en las Ciencias Psico-sociales. 11.2. Aplicaciones de las matrices al campo de las Ciencias. 11.3. Aplicaciones de las matrices al campo de las Ciencias Sociales y de la Naturaleza. Bibliografía Recomendada.
1/19
TEMA 18 MATRICES. ALGEBRA DE MATRICES. APLICACIONES AL CAMPO DE LAS CIENCIAS SOCIALES Y DE LA NATURALEZA. 1. INTRODUCCIÓN. En este tema vamos a definir el concepto de matriz y operaciones básicas entre ellas. Los coeficientes de las matrices consideraremos que pertenecen a un cuerpo que denotaremos por K. Muchas de las propiedades y definiciones que aparecerán en el tema son válidas si en lugar de trabajar con un cuerpo, lo hacemos con un anillo. Definiremos la noció n de una matriz en relación con la existencia de matrices inversas. También estableceremos una correspondencia entre las matrices y los homomorfismos entre espacios vectoriales. 2. CONCEPTOS BÁSICOS. DEF Una matriz con coeficientes en K es una familia de elementos de K, (aij )(i , j )∈ IxJ , siendo I y J conjuntos finitos. El elemento aij de K corresponde con el elemento (i, j)∈IxJ. Si I = {1,...., m} y J = (1,...., n) se suele denotar una matriz por
(a )
ij 1≤i ≤m 1≤ j ≤n
Si m = n
(a )
ij 1≤i , j ≤n
También se usa la notación a11 a21 Λ a m1 La familia
(a )
ij 1≤i ≤m
(a )
ij 1≤ j ≤n
a12
Λ
a22
Λ
Λ
Λ
am 2
Λ
a1 n a 2n Λ amn
con i fijo se llama fila i-ésima de la matriz, y la familia
con j fijo se llama columna j-ésima de la matriz.
Los elementos de cualquier fila i-ésima se corresponden con un vector de Kn . Análogamente, los elementos de cualquier columna j-ésima se corresponden con un vector de Km. Los primeros se conocen como vectores fila y los segundos como vectores columna.
2/19
DEF
Llamaremos matriz de orden m x n a toda matriz de forma
(a )
.
ij 1≤i ≤m 1≤ j ≤n
DEF Llamaremos Mmxn (K) al conjunto de todas las matrices de orden mxn con coeficientes en K. Se suelen denotar por letras mayúsculas, A = (aij )1≤i ≤ m . 1≤ j ≤ n
2.1. Tipos de Matrices. DEF
Llamaremos matriz columna a toda matriz de orden mx1.
DEF
Llamaremos matriz Fila a toda matriz de orden 1xn.
DEF
Llamaremos matriz Nula a aquella que tiene todos sus elementos nulos.
DEF Llamaremos matriz Cuadrada a la matriz con igual número de filas que de columnas (Card(I) = Card(J). DEF Llamaremos matriz aij = a ji ∀(i, j ) ∈ IxJ. DEF
Simétrica
a
toda
matriz
Llamaremos diagonal principal a los elementos aij
cuadrada
que
verifica
1 ≤ i ≤ n de una matriz
cuadrada. La diagonal secundaria está formada por los a ij con i + j = n + 1. DEF Llamaremos traza de una matriz cuadrada a la suma de los elementos situados a lo largo de la diagonal principal. n
Traza ( A) = ∑ aii i =1
DEF Llamaremos matriz diagonal a toda matriz simétrica cuyos elementos situados fuera de la diagonal principal son todos nulos. DEF Llamaremos matriz escalar a toda matriz diagonal cuyos elementos diagonales son todos iguales entre si. DEF Llamaremos matriz identidad a toda matriz escalar cuyos elementos diagonales son todos iguales a la unidad. DEF Llamaremos matriz triangular a toda matriz cuadrada que tiene nulos todos los elementos situados por debajo (o por encima) de la diagonal principal. 3. Mmxn (K) ES ISOMORFO A L(Km , Kn ). L(Km, Kn ) es el conjunto formado por todas las aplicaciones lineales f: Km → Kn . Podemos definir ϕ: Mmxn (K) → L(Km, Kn ) 3/19
donde ∀A∈Mmxn (K), con A = (aij), ϕ(A)∈L(K m, Kn ) y ϕ(A): Km → Kn viene dada por n
ϕ( A)(ei ) = ∑ aij e´ j j =1
con
B = {e1 ,...., em } base de Km, B´= {e´1 ,....., e´n } base de Kn y los
(a )
ij 1≤ j ≤n
los
elementos de la fila i-ésima de la matriz A. PROP La aplicación ϕ definida anteriormente es biyectiva. Dem. • ϕ es homomorfismo. Trivial • ϕ es inyectiva. n
Sea ϕ(A)(ei )=ϕ(A)(ek )
⇒
n
j =1
n
⇒
∑ (a
ij
− akj )·e' j = 0
n
∑ aij ·e ' j = ∑ akj ·e' j ⇒ j =1
n
∑ aij ·e' j − ∑ a kj ·e' j = 0 j =1
y como B’ es una base de Kn
j =1
⇒
j =1
a ij − a kj = 0 ∀j ∈ {1,.., n}
⇒ a ij = a kj
∀j ∈ {1,.., n}
Entonces ei=ek porque sino B no sería base de Km • ϕ es suprayectiva. Sea f∈L(Km, Kn ) ⇒ f(ei)∈Kn y
n
f (ei ) = ∑ aij e´ j
∀i ∈ {1,...., m} ya que
j =1
{e´1 ,...., e´n } es base de Kn. Podemos entonces considerar la matriz A = (aij )1≤i ≤ m y es inmediato comprobar 1≤ j ≤ n
que ϕ( A) = f pues ϕ( A)(ei ) = f (ei ) COROLARIO
1≤ i ≤ m.
M mxn ( K ) ≅ L (K m , K n )
Dem. 4/19
Es una consecuencia inmediata de la proposición anterior. Debido a que la aplicación ϕ sea un isomorfismo, toda aplicación lineal f∈K(K m, Kn ) se puede escribir como la matriz asociada, fijadas las bases. Igualmente, todo lo visto es válido si en lugar de tener Km y Kn tenemos dos espacios vectoriales cualesquiera V y W de dimensiones m y n respectivamente. DEF Diremos que las matrices A y B son iguales si las aplicaciones lineales f y g asociadas a dichas matrices (ϕ(A) = f y ϕ(B) = g) respecto de las mismas bases son iguales. Veamos ahora que la estructura de espacio vectorial de L(K m, Kn ) y de anillo si n = m las podemos trasladar de forma natural al conjunto Mmxn (K). 4. EL ESPACIO VECTORIAL M mxn (K). OBS Todo el desarrollo para L(K m, Kn ) sería igual si tomamos L(V, W) con V, W K-espacios vectoriales con dim V = m y dim W = n. 4.1. Suma de Matrices. DEF Sean A y B dos matrices de Mmxn (K) y f y g aplicaciones lineales asociadas respectivamente. Definimos la matriz suma, A + B, como aquella que tiene por aplicación asociada la suma de las aplicaciones asociadas, f + g. Es decir: A + B = ϕ-1 (ϕ(A) + ϕ(B) Si A = (aij )1≤i ≤ m y B = (bij )1≤i ≤ m con 1≤ j ≤ n
1≤ j ≤ n
(recordemos que ϕ(A) = f y ϕ(B) = g) B = {e1 ,...., em } base de Km y B´= {e´1 ,...., e´n }
en base de Kn . n
n
ϕ( A + B )(ei ) = ϕ( A)(ei ) + ϕ( B )(ei ) = f (ei ) + g (ei ) = ∑ aij e´ j +∑ bij e´ j = j =1
j =1
n
= ∑ (aij + bij )e´ j
∀i / 1≤i ≤ m
j =1
Entonces
A + B = (aij + bij )1≤i ≤m
1≤ j ≤n
PROP La operación de suma así definida verifica las propiedades: 1) 2) 3) 4)
Asociativa. Conmutativa. Elemento Neutro. Elemento Opuesto.
5/19
Dem. Las propiedades 1 y 2 son inmediatas sin más que tener en cuenta que K es un cuerpo. 3) Definimos la matriz neutra para la suma como O∈Mmxn (K) siendo aquella que todos sus elementos son nulos. Es claro que su aplicación asociada es aplicación nula. A + O = (aij ) + (O ) = (aij + O) = (aij ) = A 4) Definimos la matriz opuesta de otra dada como aquella que tiene los mismos elementos en los mismos sitios pero cambiados de signo. Es claro que si A tiene por aplicación asociada a f, entonces - A tendrá a - f. A + (− A) = (aij ) + (− aij ) = (aij − aij ) = (O) = O Conclusión (Mmxn , +) es un grupo abeliano. 4.2. Producto de una matriz por un escalar. DEF Sea A una matriz que tiene por aplicación asociada f. Sea λ∈K un escalar. Definimos el producto de una matriz por un escalar, λA, como la matriz que tiene por aplicación asociada λf. Es decir λA = ϕ−1 (λ ⋅ ϕ( A)) Si A = (aij )1≤i ≤ m y λ∈K 1≤ j ≤ n
n
n
j =1
j =1
ϕ(λA)(ei ) = λϕ(a )(ei ) = λ·∑ aij e´ j = ∑ (λaij )e´ j Entonces λA = (λaij )1≤i ≤ m
1≤ j ≤ n
PROP La operación de producto por un escalar definida en Mmxn (K) verifica las propiedades: 1) Conmutativa. 2) PseudoAsociativa. 3) Elemento Unidad. Dem. Las propiedades son inmediatas. Conclusión (Mmxn (K), • K) es un ………
6/19
4.3. El espacio vectorial M mxn (K). PROP En Mmxn (K) se verifica la propiedad distributiva del producto con respecto a la suma. Dem. La comprobación de λ(A + B) = λA + λB es inmediata. Conclusión (Mmxn (K), +, • K) es un K-espacio vectorial. Por tanto ϕ: Mmxn (K) → L(Km, Kn ) es un isomorfismo de espacios vectoriales. 5. EL ANILLO M n (K). Ya sabemos que (Mn (K), +) es un grupo abeliano. Definamos una segunda operación interna. 5.1. Producto de Matrices. DEF Sean A y B dos matrices de Mn (K) con f y g como aplicaciones asociadas. Definimos la matriz producto A · B como aquella que tiene por aplicación asociada a g ο f . Es decir A ⋅ B = ϕ−1 (ϕ( A) ⋅ ϕ(B )) = ϕ−1 (ϕ(B ) ο ϕ( A)) Si A = (aij )1≤ i , j ≤ n y B = (bij )1≤i , j ≤ n con B = {e1 ,....., en } base de Kn , tenemos que ϕ( AB)(ei ) = (ϕ( A) ⋅ ϕ( B ))(ei ) = (ϕ(B ) ο ϕ( A))(ei ) = ϕ( B )(ϕ( A)(ei )) = n n n n n n = ϕ( B) ∑ aij e j = ∑ aijϕ( B )(e j ) = ∑ aij ⋅ ∑ b jK e K = ∑∑ aij b jK eK j =1 K =1 j =1 K =1 j =1 j =1
Luego
n AB = ∑ aij b jK j =1 1≤i , K ≤ n
Tengamos en cuenta que el elemento de AB que ocupa la fila i columna K se obtiene realizando la suma de productos de los elementos de la fila i de A por la columna K de B. PROP La operación producto de Matrices definida en Mn (K) verifica las propiedades 1) Asociativa 2) Elemento Neutro. Dem.
7/19
1) Inmediata. 2) Definimos como neutro a la matriz identidad I∈Mn (K). Es fácil comprobar que I · A = A · I = A
∀A∈Mn (K).
Conclusión (Mn (K), •) es un semigrupo con unidad. 5.2. El Anillo M m (K). PROP El producto de matrices verifica la propiedad distributiva respecto de la suma. Dem. ∀A, B, C∈Mn (K) con f, g, h aplicaciones lineales asociadas, hemos de comprobar que A · (B + C) = AB + AC y (A + B)C = AC + BC. Y es cierto ya que sabemos que se verifica
(g + h) ο f
= gο f +hο f
y
h ο( f + g) = hο f + h ο g M n (K ) ≅ End (K n )
Conclusión (Mn (K), +, ·) es un anillo y
6. PRODUCTO DE MATRICES GENERALIZADO. En el punto anterior hemos definido el producto de matrices cuadradas del mismo orden. Podemos obtener una generalización de dicho producto como sigue. Sea A∈Mmxn (K) y B∈Mmxn (K) y consideremos Km, Kn y Kp K-espacios vectoriales. Sean f∈K(K m, Kn ) y respectivamente. B = {e1 ,...., em } K , K n y Kp .
g∈L(Kn , Kp ) las aplicaciones lineales asociadas a A y B
B´= {e´1 ,...., e´n }
B´´= {e´´1 ,....., e´´ p } las bases respectivas de
y
m
Si A = (aij )1≤i ≤ m
1≤ j ≤ n
y
B = (b jK )1≤ j ≤ n
entonces
1≤ K ≤ p
ϕ( AB) = ϕ(B ) ο ϕ( A) n ϕ( AB)(ei ) = (ϕ( B ) ο ϕ( A))(ei ) = ϕ( B)(ϕ( A)(ei )) = ϕ(B ) ∑ aij e´ j = j =1 n
n
p
j =1
j =1
K =1
n
p
= ∑ aij ϕ(B )(e´ j ) = ∑ aij ·∑ b jK e´´K = ∑ ∑ aij b jK e´´K = j =1 K =1
8/19
p n = ∑ ∑ aij b jK e´´K K =1 j =1
Luego
n A·B = ∑ aij b jK ⇒ A·B ∈ M mxp ( K ) j =1 11≤≤iK≤m≤ p
(
)
Y su aplicación asociada g ο f ∈ L K m , K p . PROP La operación producto de matrices generalizado verifica las propiedades 1) Asociativa. 2) Elemento Neutro. Dem. 1) Fácil. 2) Hay que tener en cuenta que hemos de elegir la matriz identidad convenientemente para poder realizar el producto. Si A∈Mmxn (K) ⇒ Im · A = A · In = A OBS Dadas dos matrices A y B, para poder realizar el producto A · B debe ocurrir que el número de columnas de A coincida con el de filas de B. La matriz resultante tendrá las mismas filas que A y columnas que B. A∈Mmxn (K), B∈(Mpxq(K) ⇒ {A · B∈Mmxq(K) ⇔ n = p} 7. MATRICES REGULARES. DEF Diremos que A∈Mn (K) es una matriz regular, invertible o no singular si existe B∈Mn (K) tal que A · B = In = B · A PROP Si A∈Mn (K) es una matriz regular entonces existe una única matriz B∈Mn (K) tal que A · B = In = B · A Dem. Sean B y B´ dos matrices que verifican A · B = In = B · A A · B´ = In = B´· A 9/19
Entonces B = B · In = B · (A · B´) = (B · A) · B´ = In · B´ = B´ Esta única matriz se denomina inversa de A, y la representaremos por A-1. Sea B = {e1 ,....., en } en la base canónica de Kn . Sabemos que M n (K ) ≅ L (K n , K n ). n
Veamos ahora que las matrices regulares se corresponden con los automorfismos de
K . PROP A∈Mn (K n ) es regular ⇔ su aplicación asociada es un automorfismo en Kn . Dem. “⇒” Dada A∈Mn (K n ) matriz regular ϕ(A) es la aplicación asociada de A. Como A es regular, existe A-1∈Mn (K n ) siendo ϕ(A-1) su aplicación asociada. Para simplificar la escritura, llamaremos f = ϕ(A) y
g = ϕ(A-1)
ϕ−1 ( g ο f ) = ϕ−1 ( f )·ϕ−1 ( g ) = A− 1 · A = I n ϕ−1 ( f ο g ) = ϕ−1 ( g )·ϕ−1 ( f ) = A· A− 1 = I n Y como i K n es la única aplicación lineal de L(K n , Kn ) tal que ϕ( I n ) = i K n , resulta que g ο f = iK n = f ο g Entonces f es biyectiva y al ser lineal es un automorfismo en Kn . “⇐” Sea f∈l(K n , Kn ) un automorfismo ⇒ ∃g∈L(K n , Kn ) tal que f ο g = iK n = g ο f Sea A, B∈Mn (K n ) tal que ϕ(A) = f y ϕ(B) = g
( )
A·B = ϕ−1 ( f )·ϕ−1 (g ) = ϕ−1 (g ο f ) = ϕ−1 i K n = I n
( )
B· A = ϕ−1 (g ) ⋅ ϕ−1 ( f ) = ϕ−1 ( f ο g ) = ϕ−1 i K n = I n Entonces B = A-1 y A es regular.
10/19
OBS La elección de la base canónica no influye en el desarrollo. Si se hubiese tomado otra base cualquiera, el resultado seria el mismo. DEF
Sea GLn el conjunto formado por GLn = {A ∈ M n (K n ) / A es regular }
Es fácil ver que el producto de matrices es una operación interna en GLn . PROP Dadas A, B∈GLn . (A · B) –1 = B-1 · A-1 Dem.
( A ⋅ B ) ⋅ (B − 1 ⋅ A − 1 ) = A ⋅ (B ⋅ B − 1 ) ⋅ A − 1 = A I n
(B
−1
A −1 = A ⋅ A −1 = I n
⋅ A−1 ) ⋅ ( A ⋅ B ) = B −1 ·( A−1 A)·B = B −1 ·I n ·B = B −1 ·B = I n
Luego
( AB )−1 = B −1 ⋅ A −1
PROP (GLn , •) es un grupo. Dem. Por la proposición anterior, la operación es interna. • Existencia de Elemento Neutro. In ∈GLn
ya que
In -1 = In
• Existencia de Elemento Inverso. ∃A-1 / A · A-1 = In
∀A∈GLn Entonces
(A )
−1 −1
⋅ A − 1 = I n = A − 1 (A − 1 )
−1
luego
(A )
−1 −1
= A ∈ GLn
Por tanto a-1∈GLn OBS Sabemos
que
(GLn ,•) ≅ ( Ant (K ),ο).
GLn ≅ Ant (K n ) ,
por
tanto
podemos
afirmar
que
n
8. TRASPOSICIÓN DE MATRICES. DEF Sea A∈Mmxn (K). Llamamos matriz traspuesta de A, y se denota por At , a una matriz que pertenece a Mmxn (K) tal que si A = (aij) y At = (bij), entonces bij = aij.
11/19
OBS La matriz traspuesta de una dada se obtiene escribiendo por columnas las filas de la matriz inicial. La trasposición de matrices no es una operación interna, pero verifica las siguientes propiedades; de inmediata comprobación: 1) ( A + B)t = At + Bt 2) (α· A)t = α ⋅ At
∀ α∈ K *
( )
t
3) At = A 4) ( A· B)t = B t · At Si definimos Ø: Mmxn (K) → Mmxn(K) como Ø(A) = At podemos afirmar que 1) Ø es Lineal. • Ø ( A + B) = ( A + B )t = At + B t = Ø ( A) + Ø ( B) • Ø (αA) = (αA)t = α Ø ( A) 2) Ø es una involución (Ø2 = Id) si está definida en matrices cuadradas. Si Ø: Mn (K) → Mn (K) Ø2 (A) = Ø (Ø(A)) = Ø(At ) = (At )t = A = 1id(A) ⇒ Ø2 = 1id 9. MATRICES SIMÉTRICAS Y HEMISIMÉTRICAS. DEF
Diremos que una matriz A es simétrica si A = At .
OBS Una matriz simétrica necesariamente debe ser cuadrada. DEF
Diremos que una matriz A es hemisimétrica o antisimétrica si At = - A.
OBS Una matriz antisimétrica debe ser cuadrada y
aij = − a ji
∀i , j
luego
aii = 0 ∀i . PROP Toda matriz a∈Mn (K) se puede descomponer de forma única como suma de una matriz simétrica y otro hemisimétrica. Dem. Sean las matrices S =
1 1 ( A + A t ) y H = (A − A t ) 2 2
12/19
Calculemos St y Ht t
(
)
t t 1 1 1 1 S = ( A + At ) = (A + At ) = At + (At ) = ( At + A) = S 2 2 2 2 t
Entonces H es antisimétrica. S+H =
1 1 ( A + A t ) + (A − A t ) = A 2 2
S−H =
1 1 ( A + At ) − ( A − At ) = At 2 2
Sumando y restando A + At A + A = 2S 2 ⇒ t t A − A = 2H H = A − A 2 t
S=
Y S y H son únicas, ya que la descomposición es única. 10. RANGO DE UNA MATRIZ. DEF Dada una matriz A∈Mmxn (K), si consideramos las n columnas como n vectores de Km, definimos el rango por columnas de la matriz A como el rango del conjunto formado por los n vectores columna. rangc (A) = rang(C 1 , C2 ,…..,Cn ) Siendo Cj = (aij, a2j,….., anj) 1 ≤ i ≤ n DEF Dada una matriz A∈Mmxn (K), si consideramos las m filas como m vectores de Kn , definimos el rango por filas de la matriz A como el rango del conjunto formado por los m vectores fila. rangF (A) = rang(F1 , F2 ,…, Fn ) Siendo Fi = (ai1 , ai2 ,….., ain ) PROP Para cualquier A∈Mmxn (K) se verifica rangc (A) = rangF(A) Dem. Cualquier relación de dependencia entre las columnas de la matriz A equivale a resolver el sistema. 13/19
n
ρ
∑x c j
j =1
j
ρ
=o ⇔
a11 x1 + ....... + a1n xn = 0 am 1 x1 + ....... + a mn xn = 0
Si realizamos alguna modificación en el orden de las filas seguimos obteniendo el mismo sistema, y no alteramos el rango por columnas, ni por filas. Supongamos que rangF (A) = r. Entonces m – r ecuaciones dependen de r de ellas (supondremos que son las r primeras). El sistema a11 x1 + ..... + a1 n xn = 0 ................................. a r 1 x1 + ..... + arn xn = 0 tiene las mismas soluciones que el sistema inicial. a11 ........a1 n Entonces rangc(A) = r´ = rangc .............. a .......a r1 rn Podemos considerar las columnas de esta última matriz vectores de Kr y como dimK r = r se deduce que: Rangc(A) = rangF(A) ⇒ c ≤ r Realizando el mismo razonamiento con la matriz traspuesta como rangc (A) = rangF(At ) rangF (A) = rangc(At ) obtenemos rangc (At ) ≤ c = rangF(At ) ⇒ r ≤ c Por tanto r = c ⇒ rangc(A) = rangF (A) Al hablar de rango de una matriz no se distingue entre rango por columnas, al ser el mismo. OBS Si f: Km → Kn es la aplicación asociada a la matriz A∈Mmxn (K) se verifica rangF (A) = dim Imf.
14/19
PROP Sea f: Km → Kn una aplicación lineal entre espacios vectoriales, y sea A∈Mmxn (K) la matriz asociada a f respecto de bases B y B´ de Km y Kn respectivamente. Entonces rang(A) = rang (f) Dem. Sea A la matriz asociada a f respecto de las bases B´= {e´1 ,...., e´n } de Kn .
B = {e1 ,....., em } de Km y
Como las filas F1 , F2 ,…., Fm de A son las coordenadas de los vectores f(e1 ), f(e2 ),….., f(em) en la base B´, y el rango de un sistema de vectores coincide con el rango del sistema de sus vectores coordenadas, tenemos que rang(f) = rang(f(e1 ), f(e2 ),….., f(em)) = rang (F1 , F2 ,…., Fm) = rang (A) PROP Sea f: Km → Kn una aplicación lineal entre espacios vectoriales de dimensión finita y A su matriz asociada. Entonces: 1) f es inyectiva ⇔ rang (A) = dim (K m) 2) f es suprayectiva ⇔ rang (A) = dim (K n ) Dem. Inmediata COROLARIO
Una matriz A∈Mn (K) es invertible si y solo si rang (A) = n.
Dem. Basta recordar que A es invertible si f es biyectiva. 11. APLICACIONES DE LAS MATRICES. Las matrices son en la actualidad una herramienta imprescindible en múltiples ramas de la matemática pura y aplicada (álgebra lineal, geometría, estadística, etc) y en otras muchas ciencias (mecánica, economía, física, etc). Veamos ahora diferentes aplicaciones de las matrices. 11.1.
Uso de las matrices en las ciencias Psico-Sociales.
Una posible utilización de las matrices en Psicología y otras Ciencias Sociales es la presentación de las puntuaciones obtenidas por m personas, animales, etc, en n características. La fila i estaría constituida por las n puntuaciones
15/19
(ai1, ai 2 ,...., ain ) en las n características. La columna j estará constituida por las m puntuaciones
(a
1j
, a2 j ,...., amj )
en la característica j. La puntuación a ij es la obtenida por la persona, animal, etc, i en la característica j. 11.2.
Aplicaciones de las Matrices al campo de las Ciencias.
Actualmente podemos encontrarnos con matrices en diversidad de campos tales como la física, informática, economía y, en general, siempre que trabajamos con un gran número de datos. Estos datos se organizan y disponen en matrices para su posterior manipulación. a) La principal utilidad del álgebra matricial está en al posibilidad de poder representar, estudiar y resolver sistemas de ecuaciones con ayuda de nociones como rango de una matriz, matriz inversa y determinante. Un sistema de ecuaciones se puede escribir en forma matricial como AX = B Si la matriz A es inversible, la solución al sistema es X = A-1 · B b) Dentro del análisis, y por tanto, en una amplia gama de problemas físicos, de ingeniería, etc aparecen las matrices para estudiar las funciones de varias variables y determinar sus máximo y mínimos. Si tenemos una función f: 3n → 3m, se define su derivada por medio de una matriz ∂f de Mmxn (3) llamada Jacobiana y cuyos elementos son aij = i (derivada de la ∂x j componente i-ésima respecto de la variable j-ésima). La matriz de las segundas derivadas se llama Hessiana. También se trabaja con matrices a la hora de aplicar la regla de la cadena en funciones de varias variables. Veamos un ejemplo: Sean las funciones g: 32 → 32 y f 32 → 33 definidas como: G(x, y) = (xy, y2 – 2)
f(u, v) = (u, u2 , u – v)
16/19
Calculemos
(f
οg
)´
(1, -2) con la regla de la cadena
y x − 2 1 g´(x , y ) = ⇒ g´(1,−2) = 0 2y 0 − 4 0 f ´(u , v ) = 2u 1
1 0 ⇒ como − 1
g (1, −2 ) = (− 2,2 )
1 0 f ´(− 2, 2) = − 4 0 1 − 1
1 0 0 − 4 − 2 1 0 8 − 4 y ( f ο g )´(1,−2) = f ´(− 2,2 ) ⋅ g´(1,−2) = − 4 0 1 − 1 0 − 4 − 2 5 con lo que hemos calculado la derivada de la composición utilizando el producto de matrices. La herramienta principal para el estudio de ecuaciones diferenciales lineales es el análisis matricial, donde adquiere especial relevancia la llamada matriz de Jordan. c) En la geometría, las matrices sirven para representar los movimientos y semejanzas en el espacio, que son de vital importancia en la dinámica, cristalografía e incluso en la teoría de la relatividad. Veamos algunos ejemplos: • Ecuación de traslación de vector t = (a, b, c) x´ 1 0 0 x a y´ = 0 1 0 y + b z´ 0 0 1 z c • Ecuación del giro de ángulo α y eje z: x´ cos α − sen α 0 x y´ = sen α cos α 0 y z´ 0 0 1 z También podemos estudiar mediante matrices las simetrías axiales, centrales, con deslizamientos, etc. d) En la Estadística también empleamos las matrices: matriz de datos para presentar información, matriz de desviaciones, matriz de varianza-covarianza, matriz de correlaciones,…… e) En el campo de la economía, gran cantidad de situaciones competitivas que se presentan muchas veces, pueden estudiarse con ayuda de las matrices de pago, que informan de las ganancias o pérdidas que pueden darse en determinadas situaciones. 17/19
11.3. Aplicaciones de las matrices al campo de las Ciencias Sociales y de la Naturaleza. a) Cadenas de Markov. Las cadenas de Markov se pueden ver como una aplicación de las matrices tanto a las ciencias sociales como de la naturaleza. Se puede aplicar al estudio de la genética Mendeliana, por ejemplo, cuando intentamos cruzar individuos de la misma especia pero con diferentes caracteres. Los resultados posibles a obtener los podemos representar mediante una cadena de Markov. DEF Definimos el espacio de estados, S, como el conjunto donde toman valores las variables de una familia. DEF Una sucesión de variables aleatorias {xn } se denomina Cadena de Markov (en tiempo discreto con espacio de estados discretos) si ∀n
P[ xn +1 = i n +1 / xo = io ,...., x n = i n ] == P[xn +1 = in +1 / xn = i n ]
iK ∈S n = presente, n + 1 = futuro, {0,…., n – 1} = pasado es decir, el futuro es independiente del pasado conociendo el futuro. • Cadenas de Markov con Probabilidad de Transición Estacionaria. Matriz de Transición. A cada i∈S se le asocia un conjunto Ei ⇒ Hablamos de estado i ⇒ S = Conjunto de estados. DEF Se denomina probabilidad de Transición en n pasos a la probabilidad de pasar al estado Ej en un tiempo n + m sabiendo que en n estaba en el estado Ei. P[xn + m = j / xn = i ] Esta probabilidad de transición se denomina estacionaria si no dependen del instante del que parte, n, si no sólo del número de pasos, m. En particular si n = 0 P[xm = j / xo = i ] en este caso se denominan a las probabilidades de transición. pij( m ) = probabilidad de pasar del estado i al j en m pasos. Las cadenas de Markov son las probabilidades de transición en un paso.
(
La matriz de transición en m pasos es P (m ) = pij(m ) 18/19
)
i, j ∈ S
Por conve nio P(0) = I 11.4.
Aplicaciones a la Teoría de Grafos.
Dado un grafo es posible asociar a él matrices. a) Matriz de Adyacencia. Es la matriz A = (aij ) definida por K si vi es adyacente a v j aij = 0 en caso contrario siendo K el número de aristas que unen el vértice vi con el vj. A∈Mm(3). La matriz de adyacencia es muy útil para decidir cuestiones de conexión, pues si A es matriz de Adyacencia de un grafo con m vértices don de m > 1, entonces el término aij de la matriz An nos da el número de caminos de longitud n que van del vértice vi al vj. b) Matriz de Incidencia. Es la matriz M = (mij ) con M∈Mm(3) tal que 1 si el vértice vi es incidente con la arista e j mij = 0 en caso contrario
Bibliografía Recomendada. Curso de algebra y geometría. Juan de Burgos. Ed: Alhambra Algebra lineal y geometria. Ed: Univ. de Barcelona Algebra linea. Juan de Burgos. Ed: McGraw-Hill Algebra lineal. F. Puerta. Ed: Univ. de Barcelona.1975 Linear Algebra. W. Greub. Ed: Springer-Verlag
19/19
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 19 DETERMINANTES. PROPIEDADES. APLICACIÓN AL CALCULO DEL RANGO DE UNA MATRIZ. 1. Introducción. 1.1. Resultados previos. 2. Formas multilineales alternadas. 3. Determinantes. 3.1. Determinantes de N vectores. 3.2. Determinantes de un Endomorfismo. 3.2.1. Aplicación Adjunta de un Endomorfismo. 3.3. Determinante de una matriz. 3.3.1. Matriz Asociada a Ad(ϕ). 3.3.2. Desarrollo de un determinante por los adjuntos de una línea. 4. Aplicación al cálculo del rango de una matriz. Bibliografía Recomendada.
1/26
TEMA 19 DETERMINANTES. PROPIEDADES. APLICACIÓN AL CALCULO DEL RANGO DE UNA MATRIZ. 1. INTRODUCCIÓN. El concepto de determinante es posible introducirlo de diferentes formas: Por medio de aplicaciones multilineales alternadas, por inducción o mediante sumas de n! sumandos para un determinante de orden n. El tema se va a desarrollar utilizando la primera forma, ya que es la más rigurosa de las tres. Tiene como ventaja sobre las otras que nos permite relacionar diversos conceptos y presentar de forma sencilla pero rigurosa las propiedades de los determinantes. Hemos de destacar que a lo largo del tema la letra K denotará un cuerpo conmutativo con característica de dos. 1.2. Resultados Previos. En este apartado vamos a refrescar una serie de resultados sobre permutaciones que necesitaremos para desarrollar el tema. Para encontrar las demostraciones y evitar reiteración, remitimos al lector al tema 3 del temario. DEF Llamaremos Sn al conjunto formado por todas las permutaciones posibles de los elementos del conjunto {a 1 , a2 ,…., an }. 1→3 Sea {1, 2, 3} un conjunto. Una permutación de dicho conjunto puede ser 2 → 1 3→ 2 que se puede expresar como 1 2 3 3 1 2 El conjunto Sn podemos definir como una operación como sigue (la representaremos en S3 ) 1 2 3 1 2 3 1 2 3 · = 3 1 2 1 3 2 2 1 3 PROP El conjunto Sn junto con la operación de producto de permutaciones tiene estructura de grupo. DEF Una transposición es una permutación en la que todos los elementos quedan fijos menos dos que intercambian su posición.
2/26
Las trasposiciones se pueden representar mediante una matriz de orden 1x2, indicando los dos únicos elementos que intercambian su posición 1 2 3 Si (2,3)∈S3 se puede escribir como 1 3 2 PROP Toda permutación se puede escribir como producto de trasposiciones. PROP Si una permutación se descompone de dos formas distintas como producto de trasposición, ambas descomposiciones verifican que tienen un número par (o impar) de trasposiciones. DEF Diremos que una permutación es par si se descomponen como un número par de trasposiciones (e impar en caso contrario). E (σ ) = 1 si σ es par Si σ ∈ S n ⇒ E (σ ) = −1 si σ es impar DEF El número E(σ) con permutación.
σ∈Sn recibe el nombre de signatura o signo de la
PROP ∀σ∈Sn con σ una trasposición se verifica que E(σ) = -1. Dada una aplicación grupo, podemos definir ∀σ ∈ S n
n
f : Cx ... (. ..x C → G siendo C un conjunto cualquiera y G un
(σ ⋅ f )( x1 ,......, xn ) = f (xσ (1),......., xσ (n ) )
DEF
Diremos que f es simétrica si ∀σ∈Sn se verifica σf = f
DEF
Diremos que f es antisimétrica si ∀σ∈Sn se verifica σf = E(σ) · f
PROP ∀σ, σ´∈Sn
(σ · σ´) · f = σ · (σ´f)
OBS Para saber si una aplicación es simétrica o antisimétrica, teniendo en cuenta la proposición anterior y que toda permutación se descompone como producto de trasposiciones, sólo es necesario conocer su actuación ante las trasposiciones. PROP Dada
n
f : Cx .Λ( x C → G y ∀τ ∈ S n trasposición:
1) f es simétrica ⇔ τf = f 2) f es antisimétrica ⇔ τf = − f DEF
Diremos que f es no degenerada si es una aplicación antisimétrica no nula.
3/26
2. FORMAS MULTILINEALES ALTERNADAS. n
Sea V un K-espacio vectorial de dimensión n y Vn = Vx .Λ( x V. Sea W otro K-espacio vectorial. Diremos que f: Vn → W n-lineal si es lineal en cada una de sus componentes.
DEF
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
f (v1 ,....., αvi + βvi ´,....., vn ) = αf (v1 ,....., vi ,...., v n ) + βf (v1 ,...., vi ´,...., vn ) Si W = K entonces f es una forma n-lineal sobre V. PROP Sean V y W K-espacios vectoriales. Si f: Vn → W es n-lineal, se verifica i) Si λ1 ,...., λn ∈ K ⇒ f (λ1v1 , λ2 v 2 ,...., λn v n ) = λ1 ·....·λn f (v1 ,...., v n ) n
ii) Si ∀i ∈ {1,..., n} vi = ∑ xij u j (vi es combinación lineal de {u1 ,…,un }) ⇒ j =1
n
n
n
(
⇒ f (v1 ,...., v n ) = ∑ ·∑ ·.....·∑ λ1 j1 ·λ2 j 2 ·....·λnjn · f u j1 ,...., u j n j1 =1 j 2 =1
)
j n =1
Dem. i) f (λ1 v1 , λ2 v2 ,....., λn vn ) = λ1 f (v1 , λ2 v 2 ,...., λn v n ) = λ1 λ2 f (v1 , v2 ,...., λn vn ) = ....... = = λ1 ·λ2 ·......·λn f (v1 , v2 ,...., v n ) Por ser lineal respecto de cada una de las variables. n
ii) Como vi = ∑ λij u j
∀i ∈ {1,...., n}
j =1
n n n f (v1v2 ,...., vn ) = f ∑ λ1 j1 u j1 , ∑ λ2 j 2 u j2 ,...., ∑ λnjn u jn = j2 =1 j n =1 j1 =1 n
n
n
(
)
= ∑ λ1 j1 ·∑ λ2 j2 ·.......·∑ λnjn · f u j1 , u j 2 ,...., u j n = j1 =1
n
n
j 2 =1
j n =1
n
(
∑ ·∑ ·......·∑ λ1 j1 ·λ2 j2 ·......·λnjn · f u j1 , u j2 ,...., u jn j1 =1 j2 =1
)
j n =1
DEF Sea f: Vn → W n-lineal. Diremos que f es alternada (antisimétrica) si f(v1 ,…, vn ) = 0 cuando vi = vj para algún i, j con i ≠ j. A estas aplicaciones se las llama n-lineal alternada.
4/26
PROP Sea f: Vn → W n-lineal alternada y τ ∈Sn una trasposición ( τ = (ij ) ). Entonces f (vτ (1) , vτ (2 ) ,...., vτ (n ) ) = − f (v1 , v2 ,...., vn ) ∀(v1 ,...., vn ) ∈ V n Dem. Supongamos que i < j. f (vτ (1) ,...., vτ ( n ) ) = f (v1 ,...., vi −1 , v j , vi +1 ,...., v j −1 , vi , v j +1 ,...., vn ) Por haber dos vectores repetidos (vi + vj en los lugares i y j) y ser f alternada se verifica 0 = f (v1 ,...., vi −1 , vi + v j , vi +1 ,...., v j −1 , v j , v j +1 ,....., v n ) = = f (v1 ,...., vi −1 , vi , vi +1 ,....., v j −1 , vi , v j +1 ,...., vn ) + + f (v1 ,...., vi −1 , vi , vi +1 ,...., v j −1 , v j , v j +1 ,...., vn ) + + f (v1 ,...., vi −1 , v j , vi +1 ,...., v j −1 , vi , v j +1 ,...., vn ) + + f (v1 ,..., vi −1 , v j , vi +1 ,...., v j −1 , v j , v j +1 ,...., vn ) = = 0 + f (v1 ,...., vi ,....., v j ,...., v n ) + f (v1 ,...., v j ,...., vi ,...., vn ) + 0 Entonces f (v1 ,...., v j ,...., vi ,...., vn ) = − f (v1 ,...., vi ,..., v j ,....., vn ) PROP Sea f: Vn → W n-lineal anternada y σ∈Sn . Entonces ∀(v1 ,…, vn =∈Vn f (vσ (1 ) ,...., vσ ( n ) = ε(σ ) f (v1 ,..., vn )) siendo ε(σ) la signatura de la permutación. Dem. f (vσ (1 ) ,...., vσ ( n ) ) = f (vτ1 ·τ 2 ·....· τ K (1 ) ,......., vτ 1τ 2 .... τ K (n ) ) = σ = τ1 ·τ2 ·....·τK ε(σ ) = (− 1)K
5/26
(
)
2
(
)
= − f vτ 2 ..... τ K (1 ) ,......., vτ 2 ..... τ K ( n ) = (− 1) f vτ3 .... τ K (1 ) ,....., vτ3 ..... τ K ( n ) = ....... = K
(
)
= (− 1) f v1 ,...., vn = ε(σ) f (v1 ,...., v n ) PROP Sea f: Vn → W
σ∈Sn , ∀(v1 ,…., vn )∈Vn
n-lineal y
se verifica que
f (vσ (1 ) ,......, vσ ( n ) ) = ε(σ ) f (v1 ,...., vn ) ⇒ f es alternada. Dem. Sea (v1 ,…, vn )∈Vn
con vi = vj i ≠ j (i < j) y sea τ ∈ S n con τ = (ij )
τ· f (v1 ,...., vn ) = f vτ (1 ) ,...., vτ ( n ) = f (v1 ,...., v j ,...., vi ,...., vn ) = f (v1 ,..., vi ,..., v j ,..., vn )
(
)
ya que vi = vj Por hipótesis f (vτ (1) ,....., vτ ( n ) ) = − f (v1 ,...., vi ,...., v j ,...., vn ) Luego f (v1 ,..., vn ) = − f (v1 ,..., vn ) ⇒ 2 f (v1 ,...., vn ) = 0 ⇒ f (v1 ,...., v n ) = 0 PROP Sea f: Vn → W n-lineal alternada. Si {v1 ,…, vn ) es un conjunto linealmente independiente de V, entonces f(v1 ,…, vn ) = 0 Dem. Si {v1 ,…, vn } es L. D ⇒ ∃i∈{1,…, n}/vi es combinación lineal del resto. n
vi = ∑ λj v j j =1 j≠ i
n f (v1 ,...., vi ,...., vn ) = f v1 ,...., vi −1 , ∑ λj v j , vi +1 ,...., vn = j =1 j ≠1 n
= ∑ λj · f (v1 ,...., vi −1 , v j , vi +1 ,...., vn ) = j =1 j ≠i
En todos los sumandos aparecen repetidos los vj sumandos son cero. n
= ∑ λj ·0 = 0 j =1 j ≠i
6/26
y como
f
es alternada, los
COROLARIO Si V es un K-espacio vectorial con dimV = p < n, entonces cualquiera que sea el espacio vectorial W se verifica que toda aplicación n-lineal alternada f: Vn → W es nula. Sea f: Vn → W n-lineal alternada, (v1 ,…, vn )∈Vn y supongamos que
LEMA
n
∀i∈{1,…., n} vi es combinación lineal de {u1 ,…., un }, vi = ∑ λij v j . Entonces j =1
f (v1 ,...., vn ) = ∑ ε(σ )λ1σ (1) ·.....·λnσ ( n ) · f (u1 ,...., un ) σ ∈S n Dem. n
n
n
(
)
Sabemos que f (v1 ,....., vn ) = ∑ ·∑ ·.......·∑ λ1 j1 ·λ2 j 2 ·......·λnj n f u j1 , u j 2 ,...., u jn = j1 =1 j 2 =1
j n =1
Si en el conjunto de índices {j1 ,….., jn } tenemos jS = jK con S ≠ K entonces f u j1 ,....., u jS ,....., u jK ,....., u j n = 0 por ser f alternada.
(
)
Luego los sumandos en donde se repita algún uji son cero y los podemos eliminar de la suma. Al final nos queda j1 = σ(1), j 2 = σ(2),...., j n = σ(n ) con σ∈Sn =
∑λ
1σ (1 )
·.....·λn σ (n ) f (uσ (1 ) ,....., uσ (n ) ) =
∑λ
1σ (1 )
σ ∈S n
·.....·λn σ (n ) ·ε(σ ) f (u1 ,...., un )
σ ∈S n
TEOREMA Sea V un K-espacio vectorial de dimensión n. Sea B = {u1 ,….,un } base de V y de w∈W (con W K-espacio vectorial). Existe una única aplicación n-lineal alternada f: Vn → W tal que f(u1 ,…., un ) = w. Dem. • Unicidad. Sean f, f´: Vn → W n-lineales alternadas / f(u1 ,…., un ) = w = f´(u1 ,…., un ). n
n
Sea (v1 ,…., vn )∈V con vi = ∑ λij u j j =1
f (v1 ,...., vn ) =
∑ ε(σ )λ
1σ (1)
·......·λnσ ( n ) · f (u1 ,...., u n ) =
σ ∈S n
=
∑ ε(σ)λ
1σ (1 )
·....·λn σ (n ) · f ´(u1 ,...., un ) = f ´(v1 ,...., vn )
σ ∈S n
Como tienen igual dominio y rango y actúan igual sobre todos los elementos, son iguales: f = f´
7/26
Por tanto, de existir la aplicación, ésta es única. • Definición de f. n
Sea w∈W, f: Vn → W ∀(v1 ,….., vn )∈Vn y ∀i∈{1,….., n}, vi = ∑ λij u j j =1
f (v1 ,...., vn ) := ∑ ε(σ)λ1σ (1 ) ·.....·λnσ (n ) ·w σ ∈S n La imagen de la base es f (u1 ,....., un ) = ∑ ε(σ )δ1σ (1 ) ·.....·δn σ ( n ) ·w σ∈Sn Si σ ≠ 1Id
∃i / σ(i) ≠ i ⇒ δ iσ(i) = 0
Entonces f (u1 ,...., un ) = (δ11 ·δ22 ·.....·δnn )·w = w ya que δii = 1∀i • f es n-lineal (elegimos la 1ª variable para comprobarlo y es análogo para el resto). n
n
n
j =1
j =1
j =1
Sea v1 = ∑ λ1 j u j y v1 ´= ∑ µ j u j ⇒ v1 + v1´= ∑ (λ1 j + µ1 j )u j f (v1 + v1´, v 2 ,...., vn ) = ∑ ε(σ )·(λ1σ (1 ) + µ1σ (2 ) ·......·λn σ ( n ) )·w = σ ∈S n Como K es un cuerpo (se verifica la propiedad distributiva) = ∑ ε(σ )λ1σ (1) ·......·λn σ ( n ) + ∑ ε(σ )µ1σ (1) ·λ1σ ( 2 ) ·.....·λnσ (n ) ·w = σ ∈S n σ∈Sn = ∑ ε(σ )λ1σ (1 )·.....·λn σ ( n ) w + ∑ ε(σ )µ1σ (1 ) ·λ1σ (2 ) ·.....·λn σ ( n ) w = σ ∈S n σ ∈S n = f (v1 , v2 ,...., v n ) + f (v1 ´, v2 ,...., vn ) De forma análoga se demuestra para el producto por un escalar. Por tanto f es lineal. • f es alternada. Sea (v1 ,....., vn ) ∈ V n con vi = vj
i ≠ j. Sea τ = (ij )
8/26
∀σ ∈ S n
ε(σ ⋅ τ) = ε(σ )·ε(τ ) = −ε(σ )
Como vi = vj ⇒ λiK = λjK ∀K ∈ {1,..., n} . Tenemos λi στ (i ) = λi σ ( j ) = λj σ ( j ) λj στ ( j ) = λj σ (i ) = λi σ (i ) − ε(σ )λ1στ (1 ) ·......·λiσ (i ) ·....·λj στ ( j ) ·......·λn στ (n ) = = −ε(σ )λ1σ (1 ) ·.....·λi σ ( j ) ·......·λj σ (i )·.....·λn σ ( n ) = Como el producto en el cuerpo es conmutativo se puede escribir = −ε(σ )λ1σ (1 ) ·.....·λi σ (i ) ·.....·λj σ ( j ) ·......·λnσ (n ) Luego este sumando es igual pero opuesto a ε(σ )λ1σ (1 ) ·.....·λnσ ( n ) Pero como f (v1 ,...., vn ) = (∑ ε(σ )λ1σ (1 ) ·.....·λn σ (n ) )w existen varios sumandos. ¿Cómo podemos demostrar que para cada sumando existe su opuesto? Pues definiendo la siguiente biyección T: An → In
t(σ) = στ
siendo An el conjunto de las permutaciones pares e In las impares. Luego f (v1 ,...., vn ) = ∑ ε(σ )λ1σ (1 ) ·.....·λn σ ( n ) + ∑ ε(σ )λ1σ (1) ·.....·λnσ (n ) w = 0 σ ∈I n σ ∈ An ya que ε(σ ) = 0 si σ ∈ An y ε(σ ) = −1 si σ ∈ I n Por tanto f es alternada. 3. DETERMINANTES. 3.1. Determinante de N vectores. DEF Sea B = {u1 ,...., un } una base del K-espacio vectorial V. Se define el determinante respecto de la base B como la única forma n-lineal alternada
9/26
detB : Vn → K tal que detB(u1 , u2 ,…., un ) = 1 DEF
Si (v1 , v2 ,…., vn )∈Vn , el determinante de los n vectores respecto de la base B es det B (v1 , v2 ,...., vn ) =
∑ ε(σ)λ
1ω (1)
·λ2σ (2 ) ·......·λn σ (n )
σ ∈S n
Podemos definir el conjunto de todas las aplicaciones n-lineales como Ln (V ,W ) = {f / f : V n → W n − lineal } Este conjunto lo podemos dotar de estructura de K-espacio vectorial de la siguiente manera: Si f1 , f2 ∈Ln (V, W) Suma:
( f1 + f2 )(v1 , v2 ,....., vn ) = f1 (v1, v2 ,...., v n ) + f 2 (v1 , v2 ,...., vn )
Producto escalar: (λf1 )(v1 , v2 ,...., v n ) = λ ⋅ f1 (v1 , v 2 ,.....,v n ) PROP Sea B = {u1 , u2 ,...., u n } una base de V. Se verifica: i) Si f: Vn → K es una forma n-lineal alternada, existe a∈K tal que f = a·detB ii) Si f = 0.
f: Vn → K es una forma n-lineal alternada y f(u1 , u2 ,…., un ) = 0 entonces
Dem. i) Sea (v1 , v2 ,…., vn )∈Vn f (v1 , v2 ,...., vn ) =
∑ ε(σ )λ
1σ (1 )
·....·λn σ ( n )· f (u1 ,...., un ) = det B (v1 ,...., vn )· f (u1 ,...., u n ) =
σ∈Sn
Si llamamos a = f(u1 ,…., un ) = a ⋅ det B (u1 , u 2 ,...., un ) = (a ⋅ det B )(u1 ,...., un ) Luego f = a·detB ii) Si f(u1 ,…., un ) = 0 ⇒ f(u1 ,…., un ) = a = 0 y como f = a·detB ⇒ f = 0 PROP Sea B = {u1 ,...., un } base de V y sea {v1 ,...., vn } ∈ V . Los vectores {v1 ,...., vn } son linealmente independientes si y solo si detB (v1 ,…., vn ) = 0 10/26
Dem. “⇒” Si {v1 ,..., vn } es un conjunto linealmente dependiente entonces existe una aplicación n-lineal alternada tal que f (v1 ,...., vn ) = 0 . Luego si f = a ⋅ det B ⇒ a ⋅ det B = 0 siendo a un escalar no nulo. Entonces detB (v1 ,…., vn ) = 0 “⇐” Sea det B (v1 ,...., vn ) = 0 y supongamos que independientes.
{v1 ,...., vn }
fuese linealmente
Entonces {v1 ,...., vn } serían base de V ⇒ ∃a ∈ K / det B = a ⋅ det B ´ y como det B ´ = 1 tenemos que a = det B (v1 ,...., vn ) = 0 Pero esto es una contradicción con el hecho de que el determinante de una base es 1, det B (u1 ,...., un ) = 1. Luego nuestra hipótesis de que los vectores independientes es falsa y por tanto son dependientes.
{v1 ,..., vn }
son linealmente
3.2. Determinantes de un endomorfismo. DEF Sea V un K-espacio vectorial de dimensión n, sea B = {u1 ,....,u n } una base de V y ϕ : V → V un endomorfismo. Llamaremos determinante de un endomorfismo a det ϕB : V n → K n-lineal alternada definida por det ϕB (v1 , v2 ,...., vn ) = det B (ϕ(v1 ), ϕ(v 2 ),.....,ϕ(v n )) Puesto que ϕ es lineal, la función det ϕB es n-lineal. Y como detB es alternada también lo es det ϕB (recordemos que si vi = vj ⇒ ϕ(vi) = ϕ(vj )) Por un resultado anterior, al ser la función n-lineal y alternada, sabemos que ∃λ ∈ K / det ϕB = λ ⋅ det B siendo λ el determinante de ϕ con respecto a la base B. Como λ n va a depender de la base del espacio que tomemos la llamaremos determinante de un endomorfismo que tomemos.
11/26
PROP Si B y B´ son bases de V y ϕ ∈ L(V ) ⇒ det B (ϕ) = det B ´ (ϕ) Dem. Sean B = {u1 ,...., un } y B´= {u1 ´,..., un ´} dos bases de V. Como detB y detB´ ∃µ ∈ K / det B´ = µ ⋅ det B det ϕB ´ = det B ´(ϕ ) ·det B ´
son
n-lineales alternadas, son proporcionales
(λ = det B´ (ϕ))
det ϕB ´ (u1´,...., u n ´) = det B´ (ϕ) ⋅ det B ´ (u1 ´,..., u n ´) = det B´ (ϕ)
(det B´ (u1´,......, un ´) = 1)
Entonces det B ´ (ϕ) = det ϕB´ (u1 ´,....., un ´) = det B ´ (ϕ(u1 ´),....., ϕ(un ´)) = µ ⋅ det B (ϕ(u1 ´),...., ϕ(u n ´)) = = µ ⋅ det ϕB (u1 ´,....., u n ´) = µ ⋅ det B (ϕ)·det B (u1´,....., un ´) = det B (ϕ)·µ·det B (u1 ´,....., un ´) = = det B (ϕ)·det B ´ (u1´,....., u n ´) = det B (ϕ) DEF Si ϕ∈L(V) con dimV = n, llamamos determinante de ϕ, det(ϕ), a detB (ϕ) para alguna base B se V. PROP Si ϕ, Ψ ∈ L(V ) ⇒ det (ϕ ο Ψ ) = det (ϕ) ⋅ det (Ψ ) Dem. Sea B = {u1 ,....., un } base de V det (ϕ ο Ψ ) = det B (ϕ ο Ψ ) = det ϕB οΨ (u1 ,....., un ) = det B (ϕ ο Ψ(u1 ),....., ϕ ο ϕ(un )) = = det ϕB (Ψ(u1 ),...., Ψ(un )) = det B (ϕ) ⋅ det B (Ψ(u1 ),...., Ψ(un )) = det B (ϕ) ⋅ det ΨB (u1 ,...., u n ) = = det B (ϕ) ⋅ det B (Ψ ) ⋅ det B (u1 ,...., un ) = det b (ϕ) ⋅ det B (Ψ ) = det (ϕ) ⋅ det (Ψ ) PROP Si ϕ ∈ L(V ) ϕ es automorfismo ⇔ det(ϕ) ≠ 0 Dem. “⇒” Sea ϕ automorfismo y B = {u1 ,...., un } base de V-
12/26
det (ϕ) = det B (ϕ) = det ϕB (u1 , , , , ,.u n ) = det B (ϕ(u1 ),...., ϕ(un )) ≠ 0 Es distinto de cero ya que al ser B base de V y ϕ automorfismo ⇒ {ϕ(u1 ),....,ϕ(u n )} es base de V ⇒ {ϕ(u1 ),....,ϕ(u n )} es linealmente independiente. “⇐” Sea det (ϕ) ≠ 0 y B = {u1 ,...., un } base de V. 0 ≠ det (ϕ) = det B (ϕ(u1 ),....., ϕ(un )) ⇒ {ϕ(u1 ),...., ϕ(u n )} es linealmente independiente y como dimV = n ⇒ {ϕ(u1 ),...., ϕ(u n )} es base de V ⇒ ϕ es automorfismo, ya que transforma una base en otra.
( )
PROP Si ϕ ∈ GL(V ) ⇒ ∃det ϕ−1 =
1 det (ϕ)
Dem. det (1v ) = det (ϕ ο ϕ−1 ) = det (ϕ) ⋅ det (ϕ−1 ) ⇒ det (1v ) = det 1Bv (u1 ,...., un ) = det B (1v (u1 ),....,1v (un )) = det B (u1 ,...., un ) = 1
( )
( )
⇒ det (ϕ) ⋅ det ϕ−1 = 1 ⇒ det ϕ−1 =
1 det (ϕ)
3.2.1. Aplicación Adjunta de un Endomorfismo. NOTACIÓN La expresión det b (v;1 , v2 ,...., vˆ j ,....., vn ) Equivale a det B (v; v1 , v 2 ,....., v j −1 , v j +1 ,...., v n ) Sea V un K-espacio vectorial de dimensión n, B = {u1 ,...., un } base de V y
LEMA
{v ,......., v , v} vectores de V. 1
n
n
∑ (− 1)
j −1
Se verifica.
⋅ det B (v , v1 ,...., vˆ j ,....., vn ) ⋅ v j = det B (v1 ,...., vn ) ⋅ v
j =1
Dem. Vamos a distinguir dos casos, según sea el conjunto independiente o dependiente. a) Si {v1 ,....., vn } es L. I. ⇒
{v1 ,...., vn } es base
{v1 ,...., vn }
linealmente
n
⇒ ∃λ1 ,...., λn ∈ K / v = ∑ λK vK K =1
13/26
n
n
n
j =1
j =1
∑ (− 1) j −1 ⋅ det B (v, v1 ,....,vˆ j ,...., vn ) ⋅ v j = ∑ (− 1) j−1 ⋅ det B ∑ λK vK , v1 ,..., vˆ j ,...., v n ·v j = K =1
n n = ∑ (− 1) j −1 · ∑ λK ·det B v K , v1 ,...., vˆ j ,..., vn ·v j = j =1 K =1
(
)
Si K = j nos encontramos con dos vectores iguales y el determinante es cero por ser una aplicación alternada. n
= ∑ (− 1) ·λj ·det B (v j ,v1 ,....., vˆ j ,...., vn )·v j = j −1
j =1
Realizamos j – 1 trasposiciones y situamos el vector vj en su lugar n
n
(
= ∑ (− 1) ·λj ·(− 1) ·det B (v1 ,..., v j ,...., vn )·v j = ∑ (− 1) j −1
j −1
j =1
j =1
n
) ·λ ·det
j −1 2
j
B
(v1 ,...., vn )·v j
n
= ∑ λj det B (v1 ,...., v n )·v j = det B (v1 ,...., vn )·∑ λj v j = det B (v1 ,...., vn )·v j =1
j =1
b) Si {v1 ,...., vn } es L. D. ⇒ det B (v1 ,...., vn ) = 0 ⇒ ⇒ det B (v1 ,...., vn )·v = 0 Comprobemos pues, que el primer miembro es nulo n
∑ (− 1)
j −1
·det B (v, v1 ,...., vˆ j ,...., vn )·v j = 0 (Comprobar)
j =1
Como {v1 ,...., vn } L. D. ⇒ ∃vi que es combinación lineal del resto. n
Supongamos que es el primero ⇒ v1 = ∑ λK vK K =2
n
∑ (− 1)
j −1
·det B (v, v1 ,...., vˆ j ,...., vn )·v j =
j =1
n
j −1 = det B (v, vˆ1 , v2 ,...., vn )·v1 + ∑ (− 1) ·det (v , v1 ,..., vˆ j ,...., vn )·v j = j =2
n n n = det B (v, vˆ1 , v2 ,....., vn )·∑ λK v K +∑ (− 1) j −1 ·det B v, ∑ λK v K ,...., vˆ j ,..., vn ·v j = K =2 j= 2 K=2
14/26
=
n
=
n n j −1 ˆ λ ·det ( v , v , v ,...., v ) · v + ( − 1 ) · λK det B (v, vK ,...., vˆ j ,...., vn )·v j = ∑ K B 1 2 n K ∑ ∑ K=2 j= 2 K=2
Si K = j nos encontramos con dos vectores iguales y el determinante es cero por ser una aplicación alternada. =
n
n
K =2
j= 2
∑ λK ·det B (v , vˆ1,.v2 ,....., vn )·vK + ∑ (− 1) ·λj det B (v, v j , v2 ,...., vˆ j ,..., v n )·v j = j −1
Para colocar vj en su sitio hemos de realizar j – 2 trasposiciones n
=
=
n
j −1
∑ λK det B (v, vˆ1 , v2 ,...., v n )·vK + ∑ (− 1) ·λj ·(− 1) K=2
j =2
n
n
(
∑ λK det B (v, vˆ1 , v2 ,...., v n )·vK + ∑ (− 1)· (− 1) K=2
j =2
n
n
j− 2
·det B (v, v2 ,...., v j ,...., vn )·v j =
) ·λ ·det (v, v ,..., v ,..., v )·v
j −2 2
j
B
2
j
n
j
=
= ∑ λK det B (v, vˆ1 , v2 ,...., vn )·vK − ∑ λj det B (v, v2 ,...., vn )·v j = 0 K =2
j= 2
Vamos a construir ahora la aplicació n adjunta. Sea V un K-espacio vectorial con dimV = n y B = {u1 ,...., un } base de V. Tomemos ϕ∈L(V) y definamos la aplicación Ø: Vn → L(V) como ∀(v1 ,..., v n ) ∈ V n
Ø (v1 ,..., vn ) ∈ L(V ) ⇒ Ø (v1 ,..., vn ) : V → V n
Ø (v1 ,...., vn )(v ) = ∑ (− 1) ·det B (v; ϕ(v1 ),...., ϕ(vˆ j ),....,ϕ(v n ))·v j
∀v ∈ V
j −1
j =1
PROP Ø es la única aplicación n-lineal alternada que lleva la base a un endomorfismo. Dem. • Comprobemos que Ø está bien definida (Ø (v1 ,..., v n ) es un endomorfismo) ∀(v1 ,...., vn ) ∈ V n
∀λ, µ ∈ K n
∀v, v´∈ V
Ø (v1 ,..., vn )(λv + µv´) = ∑ (− 1) ·det B (λv + µv´,ϕ(v1 ),...., ϕ(vˆ j ),...., ϕ(vn ))·v j = j −1
j =1
n
[
(
( ))
]
= ∑ (− 1) · λ·det B v, ϕ(v1 ),...., ϕ(vˆ j ),...., ϕ vn + µ det B (v´,ϕ(v1´),..., ϕ(vˆ j ),...., ϕ(vn )) ·v j = j −1
j =1
15/26
n
= λ∑ (− 1)
j −1
j =1
n
j −1 det B (v, ϕ(v1 ),.,ϕ(vˆ j ),.., ϕ(v n ))v j + µ∑ (− 1) det B (v´, ϕ(v1 ),.., ϕ(vˆ j ),.., ϕ(vn ))·v j = j =1
= λ Ø (v1 ,..., vn )(v ) + µ Ø (v1 ,..., v n )(v´) • Ø es n-lineal. (Veámoslo para la 1ª variable, ya que el resto es análogo). ∀λ, µ ∈ K
∀ v1 , v1´∈ V
∀v ∈ V n
j −1 Ø (λv1 + µv1´, v2 ,..., vn )(v )0 ∑ (− 1) ·det B (v, ϕ(λv1 + µv1´), ϕ(v2 ),..., ϕ(vˆ j ),..., ϕ(vn ))·v j = j =1
n
= det B (v, ϕ(v2 ),..., ϕ(vn ))·(λv1 + µv1´) + ∑ (− 1)
j −1
det B (v, ϕ(λv1 + µv1 ´),..., ϕ(vˆ j ),...,ϕ(v n ))·v j =
j= 2
= λ·det B (v, ϕ(v 2 ),...,ϕ(v n ))v1 + µ·det B (v, ϕ(v2 ),..., ϕ(v n ))·v2 + n
[
]
+ ∑ (− 1) · λdet B (v, ϕ(v1 ),..., ϕ(vˆ j ),..., ϕ(v n )) + µ det B (v, ϕ(v1 ´),..., ϕ(vˆ j ),..., ϕ(v n )) ·v j = j −1
j =2
n
= λ∑ (− 1) j =1
j −1
n
det B (v, ϕ(v1 ),., ϕ(vˆ j ),..,ϕ(v n ))v j + µ∑ (− 1)
j −1
det B (v, ϕ(v1 ´),.., ϕ(vˆ j ),.., ϕ(vn ))v j =
j =1
= λ Ø (v1 ,..., vn )(v ) + µ Ø (v1 ´, v2 ,.., vn )(v ) = [λ Ø (v1 ,..., vn ) + µ Ø (v1 ´,..., vn ) ](v ) • Ø es Alternada. Sea vi = vK con i ≠ K y i < K Hemos de comprobar que Ø(v1 ,…, vn ) = 0 (matriz nula) n
∀v ∈ V
Ø (v1 ,..., vn )(v ) = ∑ (− 1) ·det B (v, ϕ(v1 ),..., ϕ(vˆ j ),..., ϕ(vn ))·v j = j −1
j =1
Si j ≠ i, K ⇒ hay dos vectores iguales.
i −1
( ( )
)
= (− 1) ·det B v, ϕ v1 ,..., ϕ(vˆi ),..., ϕ(v n ) ·vi + (− 1)
K −1
·det B (v, ϕ(v1 ),..., ϕ(vˆK ),..., ϕ(vn ))·vK =
Ahora desplazamos ϕ(vi) al lugar ϕ(vK). El número de trasposiciones es K-(i – 1) y ambos determinantes son iguales. 16/26
Veamos el signo
[ = [(− 1)
= (− 1) + (− 1)
i −1
K −1
i −1
K −1
+ (− 1)
·(− 1)
K −i +1
·(− 1)
K +1
]·det
B
−i
(v, ϕ(vˆi ),..., ϕ(v n ))·vi =
]
·(− 1) det B (v, ϕ(v1 ),...., ϕ(vˆi ),...,ϕ(v n ))·vi = 0
Ya que: (− 1)i −1 + (− 1)K −1 ·(− 1)K +1 ·(− 1)−i = (− 1)i −1 + (− 1)−i = 0 DEF
Llamaremos adjunta de ϕ respecto de B a la imagen de Ø de la base de V adB(ϕ) = Ø(u1 ,…., un )
Y adB(ϕ)∈L(V) PROP adB(ϕ) no depende de la base tomada Dem. Dadas B = {u1 ,..., un } y B´= {u1 ´,..., un ´} bases de V, hemos de comprobar que adB(ϕ) = adB´ (ϕ). Sea Ø: Vn → L(V) respecto de B y Ø´: Vn → L(V) respecto de B´. n
ad B´ (ϕ)(v ) = Ø´ (u1 ´,..., un ´)(v ) = ∑ (− 1) ·det B ´ (v, ϕ(u1 ´),...,ϕ(uˆ j ´),..., ϕ(u n ´))·u j ´= j −1
j =1
Dadas B y B´ bases de V ∃! λ ∈ K / det B ´ = λ det B n
= ∑ (− 1) ·λ·det B (v, ϕ(u1 ´),..., ϕ(uˆ j ´),..., ϕ(u n ´))·u j ´= j −1
j =1
n
= λ∑ (− 1) ·det B (v, ϕ(u1´),.., ϕ(uˆ j ´),..., ϕ(u n ´))·u j ´= λ ⋅ Ø (u1 ´,..., u n ´)·(v ) = j −1
j =1
= λ·det B (u1 ´,...., u n ´)·ad B (ϕ)(v ) = det B ´ (u1 ´,..., un ´)·ad B (ϕ)(v ) = ad B (ϕ)(v ) ya que det B ´ (u1´,...., u n ´) = 1 Por tanto adB´ (ϕ) = ad B(ϕ) y no depende de la base elegida. DEF Sea ϕ∈L(V). Se define la aplicación adjunta de ϕ, ad(ϕ), como adB(ϕ) para alguna base de B de V. PROP Sea ϕ∈L(V), con dimV = n. Se verifica: 1) ϕ ο ad (ϕ) = det (ϕ) ο 1v
17/26
2) ad (ϕ) ο ϕ = det (ϕ) ο 1v Dem. 1) ∀v ∈ V
(ϕ ο ad (ϕ))(v ) = ϕ(ad (ϕ)(v )) = Sea B = {u1 ,..., un } una base de V. n j −1 = ϕ (Ø (u1 ,...,u n )(v ) ) = ϕ ∑ (− 1) ·det B (v, ϕ(u1 ),....,ϕ(uˆ j ),....,ϕ(u n ))·u j = j =1 n
= ∑ (− 1) ·det B (v, ϕ(u1 ),..., ϕ(uˆ j ),..., ϕ(un ))·ϕ(u j ) = j −1
j =1
Aplicando el último Lema = det B (ϕ(u1 ),..., ϕ(un ))·v = det B (ϕ)·det B (u1 ,..., u n )·v = det (ϕ)·v = = (det (ϕ)·1v )(v ) Entonces ϕ ο ad (ϕ) = det (ϕ) ο 1v 2) (ad (ϕ) ο ϕ)(v ) = ad (ϕ)(ϕ(v )) = ϕ (u1 ,...., un )(ϕ(v )) = n
= ∑ (− 1) ·det B (ϕ(v ), ϕ(u1 ),..., ϕ(uˆ j ),...., ϕ(u n ))u j = j −1
j =1
n
n
= ∑ (− 1) ·det ϕB (v , u1 ,...., uˆ j ,..., un )·u j = ∑ (− 1) ·det (ϕ)·det B (v, u1 ,..., uˆ j ,..., u n )·u j = j −1
j =1
j −1
j =1
= det (ϕ)·det B (u1 ,..., un )(v ) = det (ϕ)·v = (det (ϕ) ο 1v )(v ) Entonces ad (ϕ) ο ϕ = det (ϕ) ο 1v COROLARIO
Si ϕ es un automorfismo entonces ϕ−1 =
ad (ϕ) = det (ϕ)−1 ·ad (ϕ) det (ϕ)
18/26
3.3. Determinante de una matriz. DEF Sea A∈Mn (K). Se define el determinante de la matriz A, A , como el determinante de las filas de A consideradas como elementos de Kn y respecto de al base canónica de Kn . Si A = (aij ) la fila i-ésima es ai • = (ai1 , ai 2 ,...., ain ) A = det B (a1• , a2• ,...., a n• ) =
∑ ε(σ )·a
1σ (1 )
·a2 σ ( 2 ) ·....·an σ ( n )
σ∈Sn
siendo B = {e1 , e2 ,...., en } En el caso de una matriz cuadrada de orden 2 a12 a S 2 = 1S 2 , (1,2 ) ⇒ 11 = a11 a12 − a12 a 21 a21 a 22
{
}
y en el caso de una matriz de orden 3
{
}
S3 = 1S 3 , (1,2 ), (1,3), (2,3), (1,2,3), (1,3,2 ) ⇒ a11 ⇒ a21 a 31
a12 a22 a32
a13 a 23 = a11a 22 a33 − a12 a21 a33 − a13 a22 a31 − a11a 23 a32 + a12 a 23 a31 + a13a32 a21 a33
PROP Si A∈Mn (K) ⇒ A = At Dem. Sea A = (aij ) y At = (bij ) con bij = a ji A=
∑ ε(σ )a
1σ (1)
∀1 ≤ i , j ≤ n
·a2 σ ( 2 ) ·....·an σ ( n ) =
σ∈Sn
Sabemos que ∃σ −1 ∈ S n / σ −1 ο σ = 1Id =
∑ ε(σ)·a(
σ ∈S n
σ
−1
)
·σ (1 )σ (1)
·a(σ −1 ·σ )( 2 )σ ( 2 ) ·.....·a(σ −1 ·σ )(n )σ (n ) =
Podemos establecer una aplicación biyectiva
19/26
S n → Sn σ → σ −1
( )
y se verifica ε(σ ) = ε σ −1 =
∑ ε (σ )a −1
σ
−1
−1
σ ∈S n
aσ −1 (2 )2 ·......·aσ −1 ( n )n =
(1)1
Sea β = σ −1 =
∑ ε(β )a
a
β (1 )1 β ( 2 )2
.........a β (n )n =
β∈S n
∑ ε( β)·b
1 β (1 )
·b2 β ( 2 ) ·......·bnβ ( n ) = At
β∈S n
PROP Sea A∈Mn (K). Se verifica 1) Si un determinante tiene dos filas o dos columnas iguales el determinante es cero. 2) Si se multiplica una fila o columna por un escalar, queda el determinante multiplicado por ese escalar. 3) Si a una fila o columna se le suma una combinación lineal del resto, el determinante no varía. Dem. Inmediatas, sin más que tener en cuenta que las filas (o columnas) de A se consideran vectores de Kn y que el determinante es una función n-lineal alternada. PROP Sea ϕ∈L(V), B = {u1 ,...., un } base de V y A la matriz asociada a ϕ respecto de B. Entonces det (ϕ) = A Dem. det (ϕ) = det B (ϕ(u1 ),...., ϕ(un )) =
∑ ε(σ )b
1σ (1 )
·.....·bnσ (n ) =
σ ∈S n
Siendo (bj1 , bj2 ,….., bjn ) las coordenadas de ϕ(uj) respecto de B y la fila j-ésima de A. = A OBS Si en lugar de escribir ϕ(uj ) por filas lo hiciésemos por columnas tendríamos que es igual, det (ϕ) = At = A
20/26
COROLARIO
Si A, B∈Mn (K) ⇒ A ⋅ B = A · B
Dem. Sean ϕ, Ψ ∈ L(V ) con A matriz asociada a ϕ y B a Ψ A · B = det (ϕ)·det (Ψ ) = det (ϕ ο ϕ) = A·B COROLARIO
A ≠ 0 ⇔ A es inversible
Dem. Sea ϕ∈L(V) con A matriz asociada. A es inversible ⇔ ϕ es automorfismo ⇔ det (ϕ) ≠ 0 ⇔ A ≠ 0 COROLARIO
Si A es inversible, entonces A−1 =
1 A
Dem. Sea ϕ∈L(V) con A matriz asociada 1 1 −1 det (ϕ) ⇒ A = A A−1 es la matriz asociada a ϕ−1
( )
det ϕ−1 =
3.3.1. Matriz Asociada a Ad( ϕ ). Sea ϕ∈L(V), A la matriz asociada a ϕ y denotemos por A(ad(ϕ)) a la matriz asociada a Ad(ϕ). Vamos a obtener A(ad(ϕ)) Sabemos que ϕ ο ad (ϕ) = det (ϕ)·1v Luego A· A(ad (ϕ)) = A ·I n Sea V un K-espacio vectorial de dimensión n y B = {u1 ,..., un } base de V. Sabemos que ad (ϕ) = Ø (u1 ,...., u n ) y sea A(ad (ϕ)) = (bij )
21/26
n
Por una lado tenemos ad (ϕ)(u j ) = ∑ bij ui (escribiendo por columnas) y por otro i =1
n
ad (ϕ)(u j ) = Ø (u1 ,..., u n )(u j ) = ∑ (− 1)i −1 ·det B (u j ,ϕ(u1 ),..., ϕ(uˆ j ),..., ϕ(u n ))·ui = i =1
n
= ∑ (− 1)i −1 ·(− 1)i −1 ·det (ϕ(u1 ),..., ϕ(ui −1 ), u j , ϕ(u i +1 ),...,ϕ(u n ))·ui i =1
Hemos obtenido dos expresiones del mismo vector, y como B es base, han de ser iguales. Entonces bij = det B (ϕ(u1 ),..., ϕ(u i −1 ), u j , ϕ(ui −1 ),..., ϕ(u n ))
∀1 ≤ i , j ≤ n
Ahora vamos a desarrollar el miembro de la derecha para obtener una expresión más operativa par bij. Definimos un endomorfismo auxiliar ϕij∈L(V) ∀1 ≤ i , j ≤ n como ϕ(u K ) si K ≠ i ϕij (u K ) = u j si K = i det B (ϕ(u1 ),.., ϕ(u i −1 ), u j , ϕ(u i +1 ),..., ϕ(u n )) = det B (ϕij (u1 ),..., ϕij (u i −1 ), ϕij (ui ), ϕij (ui +1 )...,ϕij (u n )) = = det (ϕij ) = A(ϕij ) donde por A(ϕij) representamos la matriz asociada a la aplicación ϕij . Sea A = (aij ) la matriz asociada de ϕ. La matriz A(ϕij) es: A(ϕ11 ) A(ϕ12 ) A(ϕ21 ) A(ϕ22 ) A(ϕij ) = ..... ..... A(ϕ ) A(ϕ ) n1 n2
..... ..... ..... .....
A(ϕ1 n ) A(ϕ2 n ) ..... A(ϕnn )
y teniendo en cuenta (ϕij)(uK) corresponden a la columna K, tenemos que a11 ..... A(ϕij ) = a j 1 ..... a 11
..... a1 ,i −1 0 a1,i +1 ..... ..... ..... ..... ..... a j ,i −1 1 a j ,i +1 ..... ..... ..... ..... ..... an ,i −1 0 a n ,i +1
..... ..... ..... ..... .....
22/26
a1n ..... a jn ..... ann
El determinante es 1 0 i −1 j −1 A(ϕij ) = (− 1) ·(− 1) · ..... ..... 0
a j1 a11 ..... ..... a n1
..... a j , i −1 ..... a1, i −1 ..... ..... ..... ..... ..... an , i −1
a j , i +1 a1 ,i +1 ..... ..... an , i +1
..... ..... ..... ..... .....
a jn a1 n ..... = ..... a nn
Renombremos los elementos de la matriz A(ϕij ) = (Cij )1≤i , j ≤ n = (− 1)i + j ·(− 1)−2 · ∑ ε(σ )·C1σ (1) ·.....·Cnσ (n ) = σ ∈S n Como el determinante de una matriz y su traspuesta coinciden = (− 1)i + j · ∑ ε(σ)·Cσ (1)1 ·.....·Cσ (n )n = σ ∈S n y al ser la primera columna toda nula menos su primer elemento resulta que 0 σ (1) ≠ 1 Cσ (1 )1 = 1 σ(1) = 1
= (− 1)
i+ j
i+ j ∑ ε(σ)Cσ ( n )n = (− 1) · ∑ ε(σ )Cσ ( 2 ) 2 ·....·Cσ (n )n = σσ ∈(1S)n=1 σ ∈S n −1
i+ j
= (− 1) · Dji siendo Dji la matriz que se obtiene de A eliminando la fila j y columna i Por tanto bij = (− 1)i + j · Dij DEF Sea A∈Mn (K) con determinante de Dij.
A = (aij). Llamamos
menor complementario de aij al
DEF
Sea A∈Mn (K) con A = (aij). Llamamos adjunto de aij a bij = (− 1)i + j · Dij
DEF
Llamaremos matriz adjunta de A∈Mn (K) a A = (bij )
Con esta nueva terminologí a tenemos que
23/26
A(ad (ϕ)) = A t OBS Si ϕ es un automorfismo y A es su matriz asociada, sabemos que A es inversible y
( )
A−1 = A ϕ−1 =
1 t ad (ϕ) · A ya que ϕ−1 = A det (ϕ)
3.3.2. Desarrollo de un determinante por los adjuntos de una línea. PROP Sea A∈Mn (K) con A = (aij). Si (bij) es la matriz de adjuntos se verifica: n
1) A = ∑ aij ·bij (desarrollo por los adjuntos de la fila i) j =1
n
2) A = ∑ aij bij (desarrollo por los adjuntos de la columna j). i =1
Dem. Vamos a realizar la demostración para 2) pues son análogas ya que A = At 2) A =
∑ ε(σ )a
1σ (1)
·a2 σ ( 2 ) ·....·an (σ )n =
σ∈Sn
Llevando el elemento que queremos sacar factor común a la fila 1 y columna 1 tenemos que j −1
= a1 j ·(− 1) ·
j
∑ ε(σ )a
2σ (2)
·...·an σ ( n ) + a2 j ·(− 1) ·
σ ∈S n σ (1 )= j
+ anj ·(− 1)
n + j −2
·
∑ ε(σ)a
1σ (1 )
·a3 σ (3 )·....·a nσ (n ) + .... +
σ ∈S n σ ( 2 )= j
∑ ε(σ )a
a
1σ (1) 2 σ ( 2 )
·.....·an −1 ,σ ( n −1 ) =
σ ∈S n σ (n )= j
σ( K ) K ≠ i Definimos σi ∈ S n −1 como σi ( K ) = K =i i 1+ j
= a1 j ·(− 1) ·
∑ ε (v )a 1
2 σ 1 (2 )
·a3σ 1 (3 ) ·.....·an σ 1 ( n ) + a2 j ·(− 1)
σ ∈ S n−1
+ .... + anj ·(− 1)
n+ j
2+ j
·
∑ ε(σ )a
σ 2∈S n −1
· ∑ ε(σn )a1σ n (1 )·a2 σ n (2 )·....·an −1,σ n (n −2 ) = σ n∈ S n
n
= a1 j b1 j + a2 j b2 j + ... + anj bnj = ∑ aij bij i =1
24/26
2
·a3σ 2 (3 ) ·...·an σ 2 ( n ) +
1σ 2 (1 )
COROLARIO vale cero.
La suma de los productos de una fila por los adjuntos de una paralela
4. APLICACIÓN AL CALCULO DEL RANGO DE UNA MATRIZ. Sabemos que las columnas de una matriz (o filas) de Mn (K) son linealmente independientes (consideradas como vectores de Kn ) si y solo si su determinante es no nulo. DEF
Dada una matriz A∈Mmxn (K) con A = (aij ) y m ≥ n se verifica:
rang A = n ⇔ A tiene al menos un menor de orden n no nulo. Dem. “⇒” Si rang(A) = n ⇒ En A existen n filas linealmente independientes y por tanto su determinante es no nulo. “⇐” Supongamos que A tiene un menor de orden n cuyo determinante es no nulo. Como el intercambio de filas no altera el rango, podemos suponer sin pérdida de generalidad que a11 ..... a1 n ..... ..... ..... ≠ 0 a n1 ..... a nn Por tanto las n primeras filas son linealmente independientes y rang (A) ≥ n Pero como A tiene n columnas ⇒ rang(A) ≤ n Entonces rang(A) = n DEF Sea A una matriz de orden m x n y D un menor de orden p obtenido de dicha matriz. Llamamos orlados del menor D a todos los menores de orden p + 1 que contienen a D. PROP Sea A∈Mmx(n+1)(K) con A = (aij). A tiene un menor D de orden n no nulo Rang(A) = n ⇔ Todos los orlados de D son nulos Dem. “⇒” Si rang(A) = n, por la proposición anterior A tiene un menor D de orden n no nulo. 25/26
Como A tiene n + 1 columnas, la única columna que no está en el menor D es combinación lineal de las otras. Y como esa columna estará en todos los orlados de D, éstos serán nulos. “⇐” Por hipótesis, al ser D un menor no nulo de orden n, A tiene n filas linealmente independientes. Como todos los orlados son nulos, las demás filas serán combinación lineal de esas n. Luego rang(A) = n.
Bibliografía recomendada. Curso de algebra y geometría. Juan de Burgos. Ed: Alhambra Algebra lineal y geometria. Ed: Univ. de Barcelona Algebra linea. Juan de Burgos. Ed: McGraw-Hill Algebra lineal. F. Puerta. Ed: Univ. de Barcelona.1975 Linear Algebra. W. Greub. Ed: Springer-Verlag
26/26
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 20 EL LENGUAJE ALGEBRAICO. SÍMBOLOS Y NÚMEROS. IMPORTANCIA DE SU DESARROLLO Y PROBLEMAS QUE RESUELVE. EVOLUCIÓN HISTÓRICA DEL ÁLGEBRA. 1. El Lenguaje Algebraico. 2. Símbolos y Números. 3. Problemas que resuelve. 3.1. Álgebra Lineal. 3.2. Álgebra Elemental. 3.3. Resolución de Ecuaciones. 3.4. Programación Lineal. 3.5. Aplicación a otras ramas de la Matemática. 4. Evolución Histórica del Álgebra. 4.1. Álgebra Egipcia. 4.2. Álgebra Babilónica. 4.3. Álgebra Griega. 4.4. Álgebra China. 4.5. Álgebra India. 4.6. Álgebra Árabe. 4.7. Álgebra Europea medieval y renacentista. 4.8. Álgebra europea. 4.9. Álgebra Moderna. Bibliografía Recomendada.
1/10
TEMA 20 EL LENGUAJE ALGEBRAICO. SÍMBOLOS Y NÚMEROS. IMPORTANCIA DE SU DESARROLLO Y PROBLEMAS QUE RESUELVE. EVOLUCIÓN HISTÓRICA DEL ÁLGEBRA. 1. EL LENGUAJE ALGEBRAICO. La notación algebraica se ha desarrollado a lo largo de la historia, pasando por tres etapas sucesivas. La primera etapa recibe el nombre de álgebra terminológica. Se caracteriza por una ausencia total de símbolos. Se utilizan palabras siguiendo su sentido algebraico. Así, cuando se dice que “la suma de dos números es independiente del orden de los mismos” se está refiriendo a que a+b=b+a (siguiendo la notación actual). En la etapa siguiente aparece el álgebra sincopada. Aquellas palabras de utilización más habitual se abrevian, apareciendo auténticos ideogramas algebraicos. Dicha abreviación fue cada vez a más, llegando a aparecer símbolos que ya no tenían ninguna relación con las palabras que representaban. Así fue como la palabra sincopada acabó adquiriendo el valor de un auténtico símbolo algebraico. Por ejemplo, en Europa, la palabra latina minus representaba la sustracción entre dos cantidades. En un primer paso se abrevió por m y al final, se prescindió de la m quedando “-“. Los matemáticos indios se quedaron en esta etapa, ya que nunca tuvieron intención de utilizar otros símbolos que no fuesen las primeras sílabas de sus palabras para indicar las operaciones consideradas. Fueron los árabes los que realizaron los avances más espectaculares hacia el álgebra actual. Gracias a su sentido práctico y capacidad de síntesis, fueron capaces de dirigir la aritmética hacia una técnica de operaciones algebraicas, para convertirla en una ciencia constructiva y positiva. La última etapa recibe el nombre de álgebra simbólica actual. Esta etapa comienza a partir de los esfuerzos y contribuciones de los matemáticos europeos del Renacimiento y de la época clásica. Fibonacci, Gerolamo Cardano, François Viète, René Descartes, etc., son algunos de los principales matemáticos que proporcionaron, gracias a sus contribuciones, el paso del raciocinio específico al raciocinio global. Afirmaba Condillac que “el álgebra es a los números árabes lo que éstos son a los romanos”, lo cual es debido a que el álgebra es la única lengua bien hecha y a que las matemáticas actuales son una ciencia bien tratada. Podemos encontrar una analogía impresionante entre la historia del álgebra y la de la aritmética. La humanidad ha chocado durante muchos siglos con numeraciones que no utilizaban la regla de posición ni el cero para representar cantidades nulas. En el álgebra, la falta de una notación general, ha reducido esta ciencia a una colección de 2/10
reglas establecidas al azar para resolver las ecuaciones numéricas. Al igual que el descubrimiento del cero es el inicio de la aritmética moderna, la notación literal fue el comienzo de una nueva era en la historia del álgebra. Las proposiciones matemáticas habían estado, bien encerradas en un lenguaje terminológico puro sometido al azar de las interpretaciones, bien bloqueadas en un pensamiento semiconcreto que sigue una regla general pero que opera sobre casos concretos. Antes de la notación general solo se había trabajado con expresiones específicas, que no podían ser tratadas más que por sus propiedades individuales. Por el contrario, la propia idea de emplear sistemáticamente letras para designar variables, incógnitas o constantes indeterminadas ha liberado al álgebra del yugo ejercido desde siempre por el verbo. En oposición con los vocablos y las abreviaturas heterogéneas empleados hasta entonces para expresar ideas preconcebidas como los números, nuestra x actual es totalmente independiente de la naturaleza de los elementos particulares que representa. Todo esto es equivalente a decir que la notación literal a permitido pasar de lo individual a lo general. Dicho de otra manera, al realizar la equivalencia entre las proposiciones matemáticas expresadas de manera verbal y literaria y las expresiones correspondientes formadas exclusivamente por letras y símbolos que representan números cualesquiera, se ha podido, a partir de entonces, pasar de un razonamiento individual, referido a propiedades específicas, a un razonamiento global sobre las propiedades comunes a todos los casos de una misma especie, elevando desde entonces la ciencia algebraica a un nivel muy superior al de una simple estenografía circunstanciada. Y todo esto es lo que ha hecho posible elaborar la teoría general de funciones, la algebraización del análisis y el desarrollo de la geometría analítica. 2. SÍMBOLOS Y NÚMEROS. Ya hemos visto que el álgebra utiliza letras y otros símbolos apropiados para representar expresiones y resultados generales. Muchos de esos símbolos han evolucionado a lo largo de la historia hasta alcanzar la forma con que los conocemos hoy en día. Al utilizar los símbolos hemos de tener en cuenta de forma clara qué representa cada uno de ellos. En la representación de cantidades hacemos uso de letras. Para las letras utilizamos cualquiera de las que nos encontramos en el alfabeto. Si no tenemos suficiente podemos añadirles subíndices y superíndices u otros elementos del lenguaje como ‘ para denotar, por ejemplo, a’ y se lee a prima. También es común la utilización de las letras del alfabeto griego, tanto en minúsculas como en mayúsculas. Para poder relacionar las cantidades anteriores utilizamos operadores como =, <, >, ≠, ≥, ≤, de los que no es preciso indicar su significado, por todos conocido.
3/10
Las operaciones que podemos realizar con las cantidades expresadas mediante letras son las mismas que si fuesen números. Tenemos la suma, +, la resta, -, producto, división, potencia, raíz, etc. 3. PROBLEMAS QUE RESUELVE. 3.1. Álgebra Lineal. Estudio de los espacios vectoriales, que permite definir los espacios afines abstractos y en general toda la geometría. Estudio y desarrollo de determinantes y matrices, que nos va a permitir realizar el estudio de sistemas de ecuaciones lineales, y también como medio para describir aplicaciones entre espacios vectoriales de dimensión finita y de aplicaciones afines entre espacios afines. Estudio de formas bilineales y cuadráticas en espacios normados, que permiten sistematizar la geometría métrica. Al trabajar con subespacios invariantes nos encontramos con el cálculo de los valores propios de una matriz así como el estudio de sus formas normales. También el estudio de valores propios aparece, por ejemplo, a la hora de clasificar las hipercuádricas. 3.2. Álgebra Elemental. El uso de fórmulas sigue siendo uno de los métodos más empleados en aquellos problemas en los que haya dependencia de variables de cualquier tipo. El método algebraico, aparece en otras áreas del conocimiento, no sólo en Matemáticas. Nos encontramos aplicaciones en Física, Ingeniería, etc. Aquellas partes del álgebra más desarrolladas también han encontrado aplicación en la Mecánica Cuántica. 3.3. Resolución de Ecuaciones. La determinación de soluciones de una ecuación algebraica de grado n provocó la aparición de numerosas técnicas, muchas de las cuales se utilizan en campos impensados por los matemáticos que las idearon. Entre ellas tenemos la teoría de Galois, extensiones transcendentes de cuerpos, teoría de grupos, métodos de iteración, etc. Muchos problemas de matemáticas, física, química, ingeniería, etc. necesitan para su resolución de un cálculo algebraico más o menos complicado. En algunos de esos problemas, los símbolos no denotan números, sino otro tipo de entidades como pueden ser vectores.
4/10
3.4. Programación Lineal. Es una de las aplicaciones más modernas del álgebra. Resuelve gran cantidad de problemas de optimización. Se trata de encontrar el mínimo de una determinada función dentro de un subconjunto. En caso de que exista, hay que calcular tanto el mínimo como en el lugar donde se alcanza. Se dice que el problema es de programación lineal cuando la aplicación es una forma lineal y el subconjunto viene dado por un conjunto de desigualdades lineales. 3.5. Aplicaciones a otras ramas de la matemática. Como consecuencia del proceso de sistematización de la matemática llevado a cabo a lo largo del siglo pasado, la interrelación entre las diferentes ramas de la matemática es total. Así, el álgebra se usa a menudo en campos tan dispares como el Análisis Numérico, Teoría de Ecuaciones Diferenciales, Análisis Funcional, Investigación Operativa, Topología Algebraica, etc. 4. EVOLUCIÓN HISTÓRICA DEL ÁLGEBRA. 4.1. Álgebra Egipcia. En el papiro de Ahmes nos podemos encontrar con problemas que podemos clasificarlos como algebraicos. Estos problemas no se refieren a objetos concretos ni piden el resultado de operaciones con números conocidos. Se trata de resolver ecuaciones lineales de la forma x+ax=b o x+ax+bx=c siendo a, b, c números conocidos y x desconocido, que recibe el nombre de aha o montón. 4.2. Álgebra Babilónica. Conocemos una tabla de la que hacían gran uso los babilonios. Se trata de una tabulación para valores n naturales de n3 +n2 , y que jugó un papel esencial en el álgebra babilónica. La resolución de la ecuación de segundo grado no ofrecía ninguna dificultad importante, dada la flexibilidad que habían desarrollado en las operaciones algebraicas. Podían transponer términos de una ecuación sumando igualdades, eliminar factores multiplicando ambos miembros por cantidades iguales, sumando 4ab a (a-b)2 lo podían transformar en (a+b)2 , etc. No usaban letras para denotar cantidades desconocidas puesto que todavía no tenían alfabeto, pero utilizaban palabras como longitud, área, y otras para dicho fin. El álgebra egipcia se había centrado en la resolución de ecuaciones lineales, algo que los babilonios consideraron elemental. En problemas de la época nos encontramos con que resolvían sistemas de dos ecuaciones lineales con dos incógnitas. La resolución de ecuaciones cuadráticas completas superó en mucho la capacidad algebraica de los egipcios, pero no así de los babilonios. Éstos las clasificaron en tres tipos que reducidas a sus formas canónicas son: a) x2 +px=q b) x2 =px+q 5/10
c) x2 +q=px Los babilonios sólo supieron resolver aquellas con soluciones reales, ya que desconocían los complejos. El álgebra mesopotámica alcanzó un alto grado de flexibilidad, que queda demostrado al ser capaces de reducir una ecuación cuadrática de la forma ax 2 +bx=c a su forma normal y2 +by=ac por medio del cambio de variable y=ax. 4.3. Álgebra Griega. En época de Platón, la dicotomía existente entre número y magnitud continua exigía un nuevo planteamiento del álgebra babilónica que habían heredado los pitagóricos. Había que construir un álgebra geométrica que generalizase y ocupase el lugar de la vieja álgebra aritmética. En esta nueva álgebra ya no se podrían sumar segmentos con áreas o áreas con volúmenes, como hacían los babilonios, sino que tenía que haber una homogeneidad estricta de los términos de las ecuaciones. Las formas canónicas mesopotámicas, x·y=A, x±y=b, deberían ser interpretadas geométricamente. Así, los griegos consiguieron resolver las ecuaciones cuadráticas por medio de procedimientos que formaban parte del álgebra geométrica, que aparece tratada de manera muy completa en los Elementos de Euclides. El álgebra geométrica griega era excesivamente artificial y difícil, pero era considerada cómoda por aquellos que la manejaron con asiduidad. El Libro II es uno de los más cortos de los que componen la obra de los Elementos de Euclides. Consistía en un álgebra geométrica que les servía más o menos para los mismos fines que nuestra álgebra simbólica. Los Elementos fueron la primera obra matemática griega de importancia que ha llegado hasta nosotros. Fue escrito hacia el 300 a.C. La matemática griega no se mantuvo uniformemente a un nivel alto, sino que el glorioso periodo del siglo III a.C. fue seguido de una época de decadencia que no se recuperó hasta la “Edad de Plata” de la matemática griega, que abarca desde el año 250 al 350 aproximadamente. La Arithmetica de Diofanto constituía un tratado que se caracterizaba por el alto grado de habilidad matemática y de ingenio. Este libro no tenía nada que ver con la matemática griega tradicional, ya que no seguía los métodos geométricos y recordaba mucho al álgebra babilónica tradicional. Este tratado está dedicado casi completamente a la resolución exacta de ecuaciones determinadas e indeterminadas. A lo largo de los seis libros que nos han llegado de la Arithmetica, podemos ver que se hace uso de ciertas abreviaturas par potencias de números y para relaciones y operaciones entre ellos. Un número desconocido o incógnita se representa por un símbolo que se parece a la letra griega s. Diofanto conocía las reglas de combinación equivalentes a nuestras leyes para operar con los exponentes, y tenía además nombres especiales para los inversos de las seis primeras potencias de la incógnita, lo que equivale a nuestras potencias negativas. Podemos afirmar que Diofanto ha tenido una influencia mucho mayor sobre la teoría de números moderna que cualquier otro algebrista no-geométrico griego. 6/10
4.4. Álgebra China. En el documento Chou Pei (se cree que es del 300 a.C.) nos encontramos con algunas indicaciones relativas al teorema de Pitágoras, que es tratado algebraicamente por los chinos. Casi tan antiguo como el Chou Pei es el Chui-chang suan-shu, o los Nueve Capítulos sobre el Arte Matemático. El capítulo ocho de los Nueve Capítulos tiene una gran importancia por contener problemas que conducen a sistemas de ecuaciones lineales, utilizando números positivos y negativos. El matemático chino Chu Shih-Chieh, escribió dos tratados siendo el segundo, Ssuyüan yü-Chien o Espejo Precioso de los Cuatro Elementos (1303), el que mayor interés matemático tiene. Los cuatro elementos a que se refiere el título (el cielo, la tierra, el hombre y la materia) representan cuatro incógnitas de una ecuación. Este libro marca la cota más alta que alcanzó el desarrollo del álgebra china, y en él se estudian tanto sistemas de ecuaciones simultáneas como ecuaciones individuales de grados tan altos como el 14. El autor explica en el libro un método de transformación para ecuaciones que en occidente se conoce como Método Horner, matemático que vivió 500 años después. 4.5. Álgebra India. Fue el matemático hindú Brahmagupta quien realizó las contribuciones más importantes al álgebra. Dio soluciones generales de ecuaciones cuadráticas, incluyendo las dos raíces aun en casos en que una de ellas es negativa. Aparece sistematizada la aritmética de números negativos y el cero surge por primera vez. A los hindúes les corresponde el mérito de considerar como números las raíces irracionales de otros números, algo que no hicieron los griegos. El álgebra hindú es notable por su desarrollo del análisis indeterminado, al que Brahmagupta hizo varias contribuciones. Podemos indicar que fue este autor el que dio una solución general de la ecuación diofántica lineal ax+by=c con a, b y c enteros. Otro matemático hindú digno de mencionar fue Bhaskara (1114-1185). Completó algunos huecos de la obra de Brahmagupta. Dio una solución de la ecuación de Pell y se enfrentó al problema de la división por cero. El tratado más conocido de Bhaskara es el Lilavati. Contiene numerosos problemas sobre ecuaciones lineales y cuadráticas. 4.6. Álgebra Árabe. El matemático Al-Khowarizmi es al que podemos considerar como Padre del álgebra. A partir del título de su obra más importante, Al-jabr wa’l muqabalah, se ha derivado el término “álgebra”, cosa natural si se tiene en cuenta que fue de este libro del que aprendió más tarde Europa la rama matemática que lleva ese nombre. Ni AlKhowarizmi ni otros matemáticos árabes hicieron uso de la sincopación ni de los números negativos. No obstante, Al-jabr viene a estar más próxima al álgebra elemental moderna que las obras de Diofanto o Brahmagupta, ya que este libro trata de la exposición directa y elemental de la resolución de ecuaciones, especialmente de las de segundo grado. 7/10
A los árabes les gustaba mucho poder seguir una argumentación lógica correcta y clara de las premisas a la conclusión, así como una organización sistemática. La traducción latina del Algebra de Al-Khowarizmi comienza con una breve introducción acerca del principio de notación posicional para los números, y a continuación se expone, en seis breves capítulos, la solución de los seis tipos de ecuaciones que resultan al considerar simultáneamente en presencia los tres posibles tipos de cantidades: cuadrados, raíces, números (es decir, x2 , x y números). Los seis tipos de ecuaciones anteriores agotan todas las posibilidades de ecuaciones lineales y cuadráticas que tengan una raíz positiva. El Algebra de Al-Khowarizmi contiene más cosas además de la resolución de ecuaciones. Nos encontramos con reglas para operar con expresiones binómicas, incluyendo productos. Aunque los árabes rechazaban las raíces negativas y, en general, todo tipo de magnitudes absolutas negativas, estaban familiarizados con las reglas que rigen las operaciones con números enteros positivos y negativos, considerados éstos como restas indicadas. Abu’l-Wefa tradujo la Arithmetica de Diofanto y su sucesor, Al-Karkhi, utilizó esta traducción para convertirse en un discípulo árabe de Diofanto. A él se le atribuye la primera resolución numérica de ecuaciones de la forma ax2n +bxn =c, considerando únicamente raíces positivas. 4.7. Álgebra Medieval y Renacentista. Fibonacci escribió en el año 1202 su obra Liber abaci. Es un tratado muy completo sobre métodos y problemas algebraicos, en el que se recomienda el uso de los numerales hindú-arábigos. Leonardo da Pisa fue sin duda el matemático más original y más importante del mundo medieval cristiano, pero la mayor parte de su obra era demasiado avanzada para ser entendida por sus contemporáneos. En su obra Liber Cuadratorum encontramos una gran variedad de problemas, uno de los cuales recuerda los de Diofanto. El primer libro de álgebra del renacimiento fue el Triparty de Chuquet. Pero fue el libro Summa de arithmetica, geometrica, proportioni et proportionalita del fraile italiano Luca Pacioli (1445-1514) el que tuvo mayor importacia, hasta eclipsar al primero. Las historias del álgebra solían pasar del Liber Abaci de 1202 a la Summa de 1494 sin mencionar ninguna obra intermedia. En Alemania también surgieron algebristas de relevancia. A ellos les debemos los símbolos + y – para denotar la suma y la resta, en lugar de los símbolos italianos p y m. Las obras más importantes de esta época son Coss (1525) de Christoph Rudolff, el Rechnung (1527) de Peter Apian y la Arithmetica integra (1544) de Michael Stifel. En la primera de estas tres obras encontramos el uso de fracciones decimales, así como del símbolo moderno de las raices, en la segunda obra nos encontramos impreso el Triángulo de Pascal (un siglo antes de su nacimiento). La tercera obra fue la más importante, ya que trata de los números negativos, las raíces y las potencias, pero ninguno de los problemas que contenía conducía a una ecuación cúbica.
8/10
Fue al año siguiente, 1545, cuando se divulgó la solución de la ecuación cúbica y también de la cuártica, gracias a la publicación del Ars Magna de Jerónimo Cardano. Este avance tan sorprendente e inesperado supuso un impacto tan fuerte que el año 1545 se suele considerar a menudo el comienzo de la matemática moderna. Hemos de especificar que el propio Cardano explica en su obra que la solución de la ecuación cúbica la obtuvo de Niccolo Tartaglia, y la cuártica de Luigi Ferrari. Una consecuencia de la solución de la cúbica fue la aparición de un nuevo tipo de número, los complejos. 4.8. Álgebra Europea. La introducción de la notación simbólica se asocia con el nombre de Vieta, que comenzó a escribir con letras, no sólo las incógnitas, sino también los coeficientes. Descartes también contribuyó al desarrollo de la notación simbólica. A partir de ese momento podemos afirmar que el álgebra es la ciencia de los cálculos simbólicos, de las transformaciones, de las fórmulas literales, de las ecuaciones algebraicas, etc. Esta forma de concebir el álgebra quedo aclarada en el libro “Introducción al álgebra” de Euler, escrito en el año 1760. El libro de descompone en varias partes. En la primera parte del libro aparece la teoría de los cálculos con números enteros, las fracciones ordinarias, las raíces cuadradas y cúbicas, la teoría de los logaritmos, las progresiones, los cálculos con polinomios, el binomio de Newton y sus aplicaciones. En la segunda parte nos podemos encontrar con la teoría de las ecuaciones de primer grado y de los sistemas de tales ecuaciones, la teoría de las ecuaciones cuadráticas, las soluciones de las ecuaciones de tercer y cuarto grado por radicales, así como diversos métodos de resolución de ecuaciones diofánticas. A finales del siglo XVIII, un problema comenzó a destacar sobre el resto: la teoría de la resolución de las ecuaciones algebraicas. Solucionadas las de grado tres y cuatro, aparecieron una gran cantidad de teoremas y resultados para intentar resolver este problema. 4.9. Álgebra Moderna. Abarca desde el siglo XVIII en adelante. Siendo esta etapa la de menor duración, es también en la que más a variado la concepción original del álgebra. A principios del siglo XVIII la pujanza del Análisis era total, hasta el punto de que la composición de fuerzas y velocidades (conocidas desde el siglo anterior) no repercutieron en el álgebra, a pesar de ser la semilla del cálculo vectorial. A principios del XIX la noción de ley de composición se extiende a conjuntos que tienen parecido solo remoto con los números. Así destacaríamos la “teoría de las sustituciones” desarrollada a partir de las ideas de Gauss, Vandermonde y Lagrange, y que dieron lugar a la teoría de grupos. Pero es Galois el verdadero iniciador de esta teoría. Es el primero que profundiza en los grupos de permutaciones y el primero que define subgrupo invariante. Igualmente
9/10
acaba con la controversia sobre las ecuaciones algebraicas al demostrar que las ecuaciones de grado superior al cuarto no son resolubles por radicales. Pero fueron los algebristas ingleses los que dieron el empujón claro hacia la abstracción, llegaron a la noción abstracta de ley de composición y ampliaron así el campo algebraico: el álgebra de Boole, vectores, cuaterniones y sistemas hipercomplejos con Hamilton, matrices y leyes no conmutativas con Cayley. Paralelamente en el continente se inicia la evolución del cálculo vectorial (Moebius) y álgebra lineal (Grassmann). La escuela alemana del siglo XIX (Dirichlet, Kronecker, Hilbert) construyó la teoría de números algebraicos, iniciada por Gauss. A partir de Gauss se introducen cuerpo, anillos, ideales,... A lo largo del siglo XX el desarrollo del álgebra ha continuado gracias a Jordan, Sylvester, Lie, Klein, Poincaré, Sylow, etc.
Bibliografía Recomendada. Historia de la Matemática. Carl B. Boyer (Alianza Editorial). Historia Universal de las Cifras. Georges Ifrah (Espasa) Elementos de historia de las Matemáticas. N. Bourbaki (Alianza Universidad)
10/10
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 21 FUNCIONES REALES DE VARIABLE REAL. FUNCIONES ELEMENTALES. SITUACIONES EN QUE APARECE. FUNCION COMPUESTA. 1. Introducción. 1.1. Subconjuntos de 3. 1.2. Cotas de subconjuntos. 2. Concepto de función. 3. Operaciones con funciones. 3.1. Suma de funciones. 3.2. Producto de funciones. 3.3. Producto de una función por un número real. 3.4. Composición de funciones. 4. Función Recíproca. 5. Relación de Orden en F (A). 6. Tipos de Funciones. 6.1. Funciones Acotadas. 6.2. Funciones Monótonas. 6.3. Funciones Pares e Impares. 6.4. Funciones Periódicas. 7. Funciones Elementales, situaciones reales donde aparecen. 7.1. Funciones Polinómicas de 1er grado. 7.2. Funciones Polinómicas de 2º grado. 7.3. Funciones Potenciales. 7.4. Funciones Polinómicas. 7.5. Funciones de Proporcionalidad Inversa. 7.6. Funciones Escalonadas. 7.7. Funciones Exponenciales. 7.8. Funciones Logarítmicas. 7.9. Funciones Definidas a trozos. Bibliografía Recomendada.
1/20
TEMA 21 FUNCIONES REALES DE VARIABLE REAL. FUNCIONES ELEMENTALES. SITUACIONES EN QUE APARECE. FUNCION COMPUESTA. 1. INTRODUCCIÓN. 1.1. Subconjuntos de 3 . Los conjuntos de números que conocemos son – = Naturales. 9 = Enteros. Q = Racionales. 3 = Reales. " = Complejos. En este tema vamos a trabajar sobre el conjunto de números reales. Los subconjuntos de números reales más simples que no podemos encontrar son los intervalos. Intervalos Abierto
(a, b ) = {x ∈ 3 / a < x < b}
Intervalo Cerrado
[a, b] = {x ∈3 / a ≤ x ≤ b}
Como podemos comprobar fácilmente, un intervalo abierto comprende todos los números reales situados entre los extremos, pero sin incluir a éstos. En cambio, un intervalo cerrado si los incluye. También podemos encontrar intervalos que son mezcla de ambos. Intervalos Semiabiertos y Semicerrados. (a, b] = {x∈3/ a < x ≤ b} [a, b) = {x∈3/ a ≤ x < b} Otro tipo de intervalo son las semirrectas. Estas, a su vez, pueden ser abiertas o cerradas según no incluyan o si el extremo, respectivamente. Semirrectas Abiertas a la derecha (a, →) = {x∈3/ a < x} Semirrectas Abiertas a la izquierda (←, a) = {x∈3/ x < b}
2/20
Semirrectas Cerradas a la derecha [a, →) ={x∈3/ a ≤ x} Semirrectas Cerradas a la izquierda (←, b] = {x∈3/ x ≤ b} Podemos observar que las semirrectas cerradas no van entre corchetes. Eso se explica porque la flecha representa a + ∞ ó a - ∞ y estos elementos no son números reales (forman parte de la recta real ampliada). El ultimo tipo de intervalos que nos podemos encontrar son los entornos reales. Estos son intervalos con unas características que los diferencian del resto. Son siempre intervalos abiertos y están centrados en un punto. E(a, r) = {x∈3/ a – r < x < a + r} Se dice que E(a, r) E(a, r) = (a – r, a + r).
es un entorno de centro a y radio r. Equivale a
También nos podemos encontrar con los subconjuntos de 3. Estos son entidades menos simples que los intervalos vistos antes. Por ejemplo: A = (- 2, -1) ∪ {0} ∪ [2, 4] 1.2. Cotas de Subconjuntos. DEF
a∈3 es cota superior de A⊂3 si ∀x∈A se verifica x ≤ a.
DEF
a∈3 es cota inferior de A⊂3 si ∀x∈3 se verifica x ≥ a.
DEF Si a∈3 es cota superior del subconjunto A⊂3, entonces, cualquier b∈3 con b>a es también cota superior. De forma análoga, si a´ es cota inferior de A⊂3 entonces dado b´∈3 con b´ < a´ también es cota inferior. DEF Diremos que un subconjunto A⊂ r está acotado superiormente si tiene cota superior. DEF Diremos que un subconjunto A⊂3 está acotado inferiormente si tiene cota inferior. DEF Diremos que un subconjunto A⊂3 está acotado si lo está superior e inferiormente. DEF Diremos que a∈3 es el Supremo del Subconjunto A⊂3 si es la más pequeña de las cotas superiores. Se representa por a = Sup A. DEF Diremos que a∈3 es el Infimo del Subconjunto A⊂3 si es la más grande de las cotas Inferiores. Se representa por a = Inf A.
3/20
DEF Diremos que a∈3 es el Máximo del subconjunto A⊂3 si a = Sup A y a∈A. Se representa por a = Max A. DEF Diremos que a∈3 es el Mínimo del subconjunto A⊂3 si a = Inf A y a∈A. Se representa por a = Min A. 2. CONCEPTO DE FUNCIÓN. Sean A y B dos conjuntos cualesquiera. DEF Una correspondencia entre dos conjuntos A y B cualesquiera es una relación entre los elementos de ambos conjuntos. Ejemplo. Sea A = {Alumnos} y B = {Asignaturas} y definimos la relación “Matriculado en”. Es fácil ver que un alumno puede estar matriculado en varias asignaturas y que de una asignatura pueden estar matriculados varios alumnos. Por tanto un elemento de A puede estar relacionado con varios del B y uno del B con varios del A. DEF Una aplicación entre dos conjuntos es una correspondencia entre ambos donde cada elemento del primer conjunto está relacionado con un único elemento del segundo. Ejemplo. Sea A = {alumnos} y B = {sillas} y definimos la relación “sentado en”. Es inmediato comprobar que la relación es una aplicación ya que un alumno solo puede estar relacionado con una silla (no puede estar sentado en dos a la vez). DEF Una función es una aplicación entre conjuntos numéricos. Se puede denotar por f :A→ B donde x → f (x) f es la función A es el conjunto inicial B es el conjunto final X es la variable independiente f(x) es al relación entre ambos conjuntos. DEF El Dominio de una funció n f es el subconjunto del conjunto inicial formado por todos los valores que puede tomar la variable independiente. Se representa por Dom f, es decir, Dom (f) = {x∈A/ ∃f(x)}. 4/20
DEF
Diremos que yo ∈B es imagen por f si ∃xo ∈A tal que f(xo ) = yo .
DEF El Recorrido de una función f es el subconjunto del conjunto final formado por todas las imágenes. Se representa por Rec f. También se conoce por Rango de la función, es decir, Rec (f) = {y∈B/ ∃x∈A con f(x) = y}. OBS Las funciones cuyo conjunto inicial es el conjunto de los números naturales reciben el nombre de sucesiones. A partir de ahora vamos a tratar las funciones reales de variable real, f: 3 → 3. DEF
Dada f: 3 → 3, llamaremos grafo de f al conjunto G = {(x, y)∈3x3/ y = f(x)}
OBS Conociendo G, tenemos completamente determinada la función f. Si dado x∈3 disponemos de una fórmula que permita calcular f(x), podemos definir f como y = f(x). Si lo que tenemos es y = f(x), entenderemos que el dominio de f será el subconjunto A⊂3 para el que es posible efectuar las operaciones indicadas en la fórmula f(x). A recibiría el nombre de Campo de Existencia o Dominio de Definición de f(x). Al fórmula que expresa f(x) puede no tener una expresión analítica. Por ejemplo f(x)= “Mayor número primo menor que x”. Resumiendo, el conocimiento de G define la función, y como G puede representarse en un diagrama cartesiano, la función puede venir dada por una gráfica o por una tabla de valores, además de por una fórmula. 5. OPERACIONES CON FUNCIONES. DEF Dadas f: A → 3 y g: B → 3 con A, B ⊂ 3, diremos que f = g si se verifica que A = B y que f(x) = g(x) ∀x∈A. 3.1. Suma de funciones. DEF Dadas dos funciones f + g, como la función
f: A → 3 y
g: B → 3 con A, B ⊂ 3 se define la suma,
f + g: Dom (f) ∩ Dom (g) → 3 x → (f + g) (x) siendo (f + g) (x) = f(x) + g(x) ∀x∈A∩B
5/20
PROP La operación suma definida anteriormente verifica las siguientes propiedades: 1) Conmutativa. 2) Asociativa. 3) Elemento Neutro. 4) Elemento Opuesto. Dem. Sean f: A → 3 y g: B → 3 con A, B ⊂ 3 y sea D = Dom (f) ∩ Dom (g) 1) Dada f + g: D → 3 definida por (f + g) (x) = f(x) + g(x) ∀x∈ Podemos construir g + f: D → 3 tal que (g + g) (x) = g(x) + f(x) ∀x∈D Es fácil ver que f + g y g + f tienen el mismo dominio, pues Dom (f + g) = Dom (g + f) = D Y ∀x∈D
(f + g) (x) = f(x) + g(x) =
Como f(x) ∈3 y g(x)∈3 = g(x) + f(x) = (g + f) (x) Luego f + g = g +f. 2) Sean f: A → 3, g: B → 3 y h: C → 3 con A, B, C ⊂ 3. Sean A´ = Dom (f), B´ = Dom (g) y C´ = Dom (h). Si (f + g) + h: (A´∩B´)∩C´ → 3 con [(f + g) + h] (x) = (f(x) + g(x)) + h(x) ∀x∈(A´∩B´)∩C´ podemos construir. f + (g + h): A´∩(B´∩C´) → 3 con [f + (g + h)](x) = f(x) + (g(x) + h(x)) ∀x∈A´∩(B´∩C´). Veamos que son iguales. • Trivialmente (A´∩B´)∩C´ = A´∩(B´∩C´) • ∀x∈(A´∩B´)∩C´ se verifica [(f + g) + h] = (f(x) + g(x)) + h(x) = como f(x)∈3, g(x)∈3 y h(x)∈3 6/20
= f(x) + (g(x) + h(x)) = [f + (g + h)] (x) Por tanto (f + g) + h = f + (g + h) 3) Definimos O: 3 → 3 con ∀x∈3
O(x) = 0
Se verifica por tanto que f + O = f = O + f ∀x∈A (f+O)(x) = f(x) + O(x) = f(x) + O = f(x) = O + f(x) = O(x) + f(x) = (O + f)(x) 4) Dada f: A → 3, podemos encontrar (- f): A → 3 con (- f)(x) = - f(x) ∀x∈A Así pues, f + (- f) = 0 CONCLUSIÓN Si definimos F (A) = {f: A → 3/ f función real con Dom f = A⊂3} podemos afirmar que ( F (A), +) es un grupo abeliano.
3.2. Producto de funciones. DEF Dadas dos funcio nes f: A → 3 y g: B → 3 con A, B∈3 se define el producto, f · g, como la función: f · g: D → 3 x → (f · g) (x) siendo (f · g) (x) = f(x) · g(x)
∀x∈D donde D = Dom (f) ∩ Dom (g)
PROP Las operaciones producto definida anteriormente verifica las siguientes propiedades: 1) Conmutativa. 2) Asociativa. 3) Elemento Neutro. 4) Elemento Inverso. Dem. Sean f: A → 3 y g: B → 3 con A, B ⊂ 3. 1) Análogamente a la proposición anterior. 2) Análogamente a la proposición anterior. 3) Definimos 1: 3 → 3 con 1(x) = 1 ∀x∈3 7/20
Se verifica que
(f · 1) (x) = f(x) · 1(x) = f(x) · 1 = f(x) (1 · f) (x) = 1(x) f(x) = 1 · f(x) = f(x)
Luego f · 1 = f = f · 1 4) Podemos definir
1 1 = A´→ 3 con ( x ) = 1 f ( x ) f f
Siendo A´ el subconjunto de A/ ∀x∈A´ Se verifica que
1 1 f ⋅ ( x ) = f (x ) ⋅ f f
∀x ∈ A
f(x) ≠ 0. 1 ( x ) = f (x ) ⋅ =1 f (x )
1 1 1 ⋅ f ( x ) = ( x ) f ( x ) = f (x) = 1 f (x) f f Luego
1 1 ⋅ f =1 = f ⋅ f f
La función 1 tendría dominio A´. CONCLUSIÓN ( F (A), •) es un semigrupo abeliano multiplicativo.
PROP Se verifica la propiedad distributiva del producto respecto de la suma. Dem. Hemos de demostrar que (f + g) · h = f – h + g · h siendo f: A → 3, g: B → 3 y h: C → 3 y A´= Dom (f), B´= Dom (g) y C´= Dom (h) Definimos (f + g) · h: A´∩B´∩C´ → 3 como definimos ( fh + gh ) : A´∩ B´∩C´→ 3 como verificándose:
[( f + g )·h ]( x ) = ( f (x ) + g ( x ))·h( x ) y ( fh + gh)( x ) = f ( x )h( x ) + g ( x )h (x )
1) El dominio de ambas es el mismo 2) El verificarse en 3 la propiedad distributiva
[( f + g )·h ]( x ) = ( f ( x ) + g ( x ))h( x ) = f ( x )h( x ) + g ( x )h (x ) = ( fh + gh )( x ) Luego (f + g)h = fh + gh
8/20
CONCLUSIÓN ( F (A), +, ·) es un anillo conmutativo con unidad. 3.3. Producto de una función por un número Real. DEF Dada la función f: A → 3 y α∈3, se define el producto de α por f, αf, como la función α·f: A → 3 x → (α f)(x) siendo (α f)(x) = α · f(x) PROP La operación anterior verifica las siguientes propiedades: 1) Distributiva respecto de la suma de funciones. 2) Distributiva respecto de la suma de números reales. 3) Pseudo asociativa. 4) Elemento Unidad. Dem. Sea f: A → 3 y g: B → 3 dos funciones con A, B ⊂ 3 y sean α, β∈3 dos números cualesquiera. 1) Hemos de comprobar que α(f + g) = α f + αg
[α( f
+ g )]( x ) = α ⋅ ( f + g )( x ) = α( f ( x ) + g ( x )) =
En 3 se verifica la propiedad distributiva = α ⋅ f ( x ) + α ⋅ g ( x ) = (αf )( x ) + (αg )( x ) = (αf + αg )( x )
∀x ∈ A ∩ B
y como ambas funciones tienen por dominio A∩B, se verifica que α(f + g) = α f + αg 2) Hemos de comprobar que (α + β) ⋅ f = αf + βf
[(α + β) ⋅ f ]( x ) = (α + β) ⋅ f ( x ) = En 3 se verifica la propiedad distributiva = αf ( x ) + βf ( x ) = (αf )(x ) + ( βf )( x ) = (αf + βf )( x ) Por tanto (α + β ) f = αf + βf 9/20
∀x ∈ A
3) α ⋅ (β ⋅ f ) = (αβ) f
[α( βf )]( x ) = α(βf )(x ) = α( βf (x )) =
∀x ∈ A
En 3 se verifica la propiedad pseudoasociativa = (αβ )· f ( x ) = [(αβ)· f ](x ) Luego α(βf ) = (αβ)· f 4) 1 · f = f ∀x ∈ A
(1· f )( x ) = 1· f ( x ) = f ( x ) ⇒ 1· f
= f
CONCLUSIÓN ( F (A), +, · 3) es un 3-espacio vectorial. 3.4. Composición de funciones. DEF Dadas las funciones f: A → 3 y g: B → 3 con A, B ⊂ 3, llamamos función compuesta de f y g, y se escribe g o f , a la función go f :C→3 x → ( g o f )(x ) siendo
( g o f )( x ) = g ( f ( x )) y C = {x ∈ A / f ( x ) ∈ B}
PROP La operación de composición definida anteriormente verifica las propiedades 1) Asociativa. 2) Elemento Neutro. Dem. Sean f: C → 3, g: B → 3 y h: A → 3 1) Comprobemos que
(f
o g ) o h = f o (g o h)
El dominio de ambas funciones
(f
o g ) o h y f o ( g o h ) es
D = {x ∈ A / h( x ) ∈ B y g (h (x )) ∈ C } y ∀x ∈ D
[( f o g ) o h]( x ) = ( f o g )(h( x )) = f (g (h(x ))) [ f o ( g o h )]( x ) = f ((g o f )( x )) = f (g (h(x )))
2) Definimos I: 3 → 3 como I(x) = x ∀x ∈ 3 10/20
∀f ∈ F (A)
Se verifica que I o f = f = f o I
OBS De esta operación podemos afirmar que, en general, no es conmutativa. Por ejemplo, sea f: 3 → 3 definida por f(x) = 2x y g: 3 → 3 como g(x) = x + 1
(f
o g )( x ) = f ( g ( x )) = f (x + 1) = 2 x +1
( g o f )( x ) = g ( f ( x )) = g (2 x ) = 2 x + 1 4. FUNCIÓN RECÍPROCA. DEF Dada la función f: A → 3, llamaremos función recíproca de f, f-1, a una función g: B → 3 que verifica f og = go f =I OBS De la condición anterior se puede deducir que 1) Rec g = Dom f 2) Rec f = Dom g La función recíproca de f, que llamaremos f-1, si existe ha de ser inyectiva ya que si f(x) = f(y) con x ≠ y tendremos que f −1 ( f ( x )) = f −1 ( f ( y )) ⇒ x = y lo que sería una contradicción. La existencia de la función recíproca no significa que su cálculo sea fácil o posible. Veamos una forma de calcular la recíproca de una función: f (x ) =
4x −1 3
1) f es inyectiva ya que si x1 ≠ x2 ⇒ f (x1 ) ≠ f ( x2 ) 2) Imf = 3 = Dom f-1 3) y =
4x −1 3y +1 3x + 1 ⇒ 3y = 4x −1 ⇒ x = ⇒ f −1 ( x ) = 3 4 4
5. RELACIÓN DE ORDEN EN F (A). DEF Dadas dos funciones f: A → 3 y g: A → 3 definimos una relación en F (A) como f ≤ g ⇔ f (x ) ≤ g (x ) ∀x ∈ A
11/20
PROP La relación binaria anterior definida en F (A) verifica las propiedades 1) Reflexiva. 2) Antisimétrica. 3) Transitiva. Dem. Inmediata. CONCLUSIÓN La relación binaria anterior es una relación de orden. Por tanto ( F (A), ≤) es un conjunto ordenado. OBS La relación de orden no es de orden total ya que dadas cualquier par de funciones f, g∈ F (A) no podemos garantizar que f ≤ g ó g ≤ f DEF Diremos que una función f es positiva si f ≥ 0 ∀x∈Dom f, y estrictamente positiva si f > 0. DEF Diremos que una función g es negativa si g ≤ 0 ∀x∈Dom g y estrictamente negativa si g < 0. A partir de estas definiciones podemos dar otras como 1) f
+
f ( x ) si f ( x ) ≥ 0 0 si f ( x ) < 0
(x) =
0 si f ( x ) > 0 2) f − ( x ) = f ( x ) si f ( x ) ≤ 0 DEF
Definimos el Valor Absoluto de f, y se representa por f , como f ( x ) si f ( x ) ≥ 0 f (x ) = − f ( x ) si f ( x ) < 0
PROP f = f + − f − Dem. Inmediata. PROP Se verifican las siguientes propiedades 1) f + g ≤ f + g
12/20
2) f ⋅ g = f ⋅ g
3) f − g ≤ f − g Dem. 1) Como: − f (x ) ≤ f ( x ) ≤ f ( x ) y − g ( x ) ≤ g (x ) ≤ g ( x )
∀x ∈ Dom( f ) ∀x ∈ Dom( g )
Entonces sumando obtenemos que: − f (x ) − g (x ) ≤ f ( x ) + g ( x ) ≤ f ( x ) + g (x )
∀x ∈ C
siendo C = Dom( f ) ∩ Dom (g ) ⇒ − ( f ( x ) + g (x ) ) ≤ f ( x ) + g ( x ) ≤ f ( x ) + g ( x ) ⇒ f (x) + g(x) ≤ f (x) + g(x)
∀x ∈ C
2) Trivial. 3) Sea C = Dom( f ) ∩ Dom (g ) f (x ) − g ( x ) ≤ f ( x ) − g (x ) ⇔
∀x ∈ C
2
2
⇔ f (x ) − g ( x ) ≤ f ( x ) − g ( x ) ⇔ 2
2
⇔ f (x ) + g ( x ) − 2 f (x ) g ( x ) ≤ ( f ( x ))2 + (g ( x ))2 − 2 f (x ) g ( x ) ⇔ ⇔ − 2 f (x ) g ( x ) ≤ − 2 f ( x )g ( x ) ⇔ f ( x )g (x ) ≤ f ( x ) g ( x ) que es cierto trivialmente ∀x ∈ C 6. TIPOS DE FUNCIONES. 6.1. Funciones Acotadas. Dada una función f: A → 3, sabemos que Imf es un conjunto de números reales (Im f = f(A))
13/20
DEF está.
Diremos que f: A → 3 está acotada inferiormente si el conjunto Imf también lo
DEF
Diremos que f: A → 3 está acotada si lo está superiormente e inferiormente.
Recordemos que todo subconjunto 3 que está acotado superiormente tiene supremo (la más pequeña de las cotas superiores). DEF Si f está acotada superiormente, con f: A → 3, llamaremos extremo superior de f en A al supremo de f(A), y se denota por sup f ( x ) . x∈ A
DEF Si f: A → 3 está acotada inferiormente, llamaremos extremo inferior de f en A al Infimo de f(A), y se denota por Inf f ( x ) . x∈ A
DEF
Si el Sup f ( x ) es un elemento de Imf, recibe el nombre de Máximo de f y se x∈ A
representa por Max f (x ) x∈A
DEF
si el
Inf f ( x ) es un elemento Imf, recibe el nombre de Mínimo de f y se x∈ A
representa por Min f ( x ) x∈ A
6.2. Funciones Monótonas. DEF Diremos que f: A → 3 es una función monótona creciente si ∀x1 , x2 ∈ A con x1
Dada f: A → 3 diremos que es una función par si ∀x∈A
1) - x∈A 2) f(x) = f(- x) OBS Las funciones pares tienen una representación gráfica simétrica con respecto al eje y. Si doblamos el plano respecto al eje OY entonces las gráficas de ambos lados coinciden. DEF
Dada f: A → 3 diremos que es una función impar si ∀x∈A
1) - x∈A 2) f(x) = - f(- x) 14/20
OBS Las funciones impares tienen una representación gráfica donde el origen (0, 0) es su centro de simetría. Si doblamos el plano respecto de un eje y después respecto del otro entonces las gráficas coinciden. 6.4. Funciones periódicas. DEF Dada f: A → 3 diremos que una función periódica de período P si P es menor número positivo que verifica ∀x∈A. 1) x + T∈A 2) f(x + T) = f(x) Ejemplo. F(x) = sen x o f(x) = cos x que tienen período T = 2π 7. FUNCIONES APARECEN.
ELEMENTALES.
SITUACIONES
REALES
DONDE
7.1. Funciones Polinómicas de 1e r grado. Las funciones polinómicas de primer grado son f: (3, +) → (3, +) con f(x) = ax + b siendo a, b∈3. El dominio de estas funciones es 3 y su recorrido también. Su representación gráfica es una recta de pendiente a y ordenada en el origen b. Según los valores de a y b podemos distinguir varios casos: 1) b = 0 Son isomorfismos continuos entre el grupo (3, +) y (3, +). Por tanto son aplicaciones biyectivas, continuas y verifican que f(x1 + x2 ) = f(x1 ) + f(x2 ) ∀x1 , x2 ∈3. Es fácil comprobar que si f(1) = a entonces f(x) = ax. Al ser homomorfismo
m ( + 1 = mf (1) = am f (m) = f 1 + 1 + L
m f = f (1) = a 1 m ⇒ f 1 =a m m m f = mf 1 m m
( )
15/20
( )
f (0 ) = f (x + (− x )) = f ( x ) + f (− x ) ⇒ f ( x ) = − f (− x ) m m Podemos concluir que f = a n n
∀
m ∈Q n
Y como Q es denso y f es continua podemos extender la definición de Q a 3. Estas aplicaciones reciben el nombre de Lineales. 2) b ≠ 0 Estas aplicaciones reciben el nombre de Afines, y su gráfica no pasa por el origen de coordenadas. 3) a > 0 Son funciones estrictamente crecientes en 3. 4) a < 0 Son funciones estrictamente decrecientes en 3. Como aplicaciones en la vida real nos podemos encontrar: 1) La distancia recorrida por un móvil en un movimiento rectilíneo uniforme viene dada por e(t ) = eo + v o ·t 2) El coste de una determinada cantidad de un producto vendido al peso c(p) = a · p 3) La longitud de una circunferencia es función lineal del diámetro de la misma L( d ) = π ⋅ d 4) Cambio de escala lineal, por ejemplo para pasar de grados Fahrenheit a grados centígrados. 7.2. Funciones Polinómicas de 2º grado. Una función polinómica de segundo grado o cuadrática tiene como expresión general f(x) = ax2 + bx + c con a, b, c∈3 y a ≠ 0. Estas funciones tienen como dominio todo 3, y su representación gráfica es una parábola.
16/20
Los puntos más característicos de estas funciones son: 1) Los puntos de corte con el eje horizontal. Si existen son − b − b 2 − 4ac P1 ,0 2 a
y
− b + b 2 − 4ac P2 ,0 2 a
2) El punto de corte con el eje vertical P3 (0, b) 3) El vértice de la parábola
(
− b − b 2 − 4ac V , 4a 2a
)
Si a > 0 tenemos que el vértice es el mínimo de la función y si a < 0 el vértice es el máximo de la función. Aplicaciones: 1) La distancia recorrida por un móvil es un movimiento uniformemente acelerado es e(t ) = eo + vo t +
1 ao t 2 2
2) El área de un círculo a (r ) = πr 2 7.3. Funciones Potenciales. Son isomorfismos continuos entre (3+, ·) y (3+, ·). Sus características son 1) Son funciones biyectivas de 3+ en 3+. 2) f(x1 · x2 ) = f(x1 ) · f(x2 )
∀x1 , x2 ∈3+
3) Son continuas. Su expresión es f(x) = xα con α∈3 - {0} 7.4. Funciones Polinómicas. Las funciones polinómicas son aplicaciones continuas de 3 en 3 donde f: 3 → 3
17/20
n
y
f (x ) = ∑ ai x i i =0
Como aplicaciones nos encontramos con 1) El volumen de un cubo es V(l) = l3 2) Y el de una esfera 4 V (r ) = πr 3 3 7.5. Funciones de Proporcionalidad Inversa. Las funciones homográficas tienen como expresión f (x ) =
ax + b cx + d
verificando que c ≠ 0 y ad ≠ bc. El dominio de estas funciones es
{ }
3- − d c y su representación gráfica es una
hipérbola. También las podemos expresar como f (x ) = p +
K x−q
donde y = p y x = q son las ecuaciones de los ejes de la hipérbola. Si p = 0 y q = 0 obtenemos
f (x ) =
K que son las llamadas funciones de x
proporcionalidad inversa. Aplicaciones: 1) Relación entre la base y la altura de un rectángulo de área constante. 2) Ley de Ohm con V constante. 3) Atracción entre dos cuerpos de masas m1 y m2 , siguiendo la ley de Newton: F =G
m1 ·m2 r2
18/20
4) Atracción o repulsión entre dos cuerpos con cargas Q1 y Q2 siguiendo la ley de Coulomb F=K
Q1 ·Q2 r2
7.6. Funciones Escalonadas. Las más conocida es f(x) = E(x) donde f(x) es la función parte entera x, y f tiene como dominio 3 y recorrido 9. También nos encontramos en informática con 1) f(x) = x ⇒ Entero más próximo pero mas pequeño que x. 2) F(X) = X ⇒ Entero más próximo pero más pequeño grande que x. 7.7. Funciones Exponenciales. Son funciones que verifican f: (3, +) → (3+, ·) y f(x) = ax con a∈3+. 1) Son aplicaciones biyectivas. 2) f(x1 + x2 ) = f(x1 ) · f(x2 ) ∀x1 , x2 ∈3 3) Son Continuas. Nos encontramos aplicaciones en 1) Cálculo del interés compuesto y del interés continuo. 2) Crecimiento de Poblaciones. 3) Desintegración de Sustancias Radiactivas. 7.8. Funciones Logarítmicas. Son funciones recíprocas de las exponenciales, f: (3+, ·) → (3, +) con
f (x ) = log a x y a∈3+. Verifican 1) Son aplicaciones biyectivas
19/20
2) f(x1 · x2 ) = f(x1 ) + f(x2 )
∀x1 , x2 ∈3
3) Son Continuas. Como aplicaciones tenemos las mismas que para las exponenciales, al ser unas recíprocas de otras. Además tenemos: 1) La escala de Richter que mide la intensidad de los terremotos es logarítmica. 2) Los logaritmos son la base de la construcción de la regla de Cálculo. 7.9. Funciones Definidas a Trozos. Por ejemplo 2 x + 1 x < 0 f (x ) = x −e x≥ 0 Como aplicación a la vida real nos podemos encontrar con la función que nos da la escala de gravemen del Impuesto sobre la Renta de las Personas Físicas (IRPF).
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté Introducción al Análisis Matemático. Aut. J.M. Ortega. Ed. Labor
20/20
TEMAS DE MATEMATICAS (Oposiciones de Secundaria) TEMA 22 LA FUNCIÓN EXPONENCIAL Y LOGARITMICA DE VARIABLE REAL. SITUACIONES REALES EN LAS QUE APARECEN. 1. La función Exponencial de base a. 1.1. Potencias de exponente natural. 1.2. Potencias de exponente entero. 1.3. Potencias de exponente racional. 1.4. Potencias de exponente real. 2. La función logaritmo de base a. 3. Función Potencial. 4. Situaciones Reales en las que aparecen. 4.1. Función Exponencial. 4.2. Función Logarítmica. Bibliografía Recomendada.
1/16
TEMA 22 LA FUNCIÓN EXPONENCIAL Y LOGARITMICA DE VARIABLE REAL. SITUACIONES REALES EN LAS QUE APARECEN. 1. LA FUNCIÓN EXPONENCIAL DE BASE a. 1.1. Potencias de Exponente Natural. Dado un número real positivo, a, podemos definir una función fa : – → 3+ n → an siendo an el producto de a por si mismo n veces. Es fácil comprobar que fa : (–, +) → 3+, ·) es un homomorfismo: ∀n1 , n2 ∈ – tenemos que f a (n1 + n2 ) = a n1 + n2 = a n1 ·a n 2 = f a (n1 )· f a (n2 ) En los siguientes apartados iremos extendiendo el dominio de la fa a 9 y a Q hasta llegar a definirla sobre 3, y siempre verificando que sigue siendo un homomorfismo. 1.2. Potencias de Exponente Entero. Sea fa : (9, +) → (3+, ·) con fa homomorfismo de grupos. fa verifica que ∀z1 , z2 ∈9 fa (z1 + z2 ) = fa(z1 ) · fa(z2 ). Sabiendo que fa es un homomorfismo, se cumple: 1) fa(z) = fa (z + 0) = fa (z) · fa(0)
∀z∈9 ⇒ fa(0) = 1
2) 1 = fa(0) = fa (z – z) = fa (z) · fa(- z) ⇒ fa(- z) = Si escribimos 1 f a (− z ) = z = a − z a
fa(z) = a-z
∀z∈9+,
1 fa ( z )
por convenio podemos decir que
∀z ∈ 9+.
Así conseguimos extender el dominio de fa de – a 9. 1.3. Potencias de Exponente Racional. Sea
r∈Q un número racional. Entonces
cualquiera de r, con p∈9 y q∈9-{0}.
2/16
r=
p siendo q
p un representante q
Sabemos que fa(1) = a por ser 1∈–, y que fa debe ser un homomorfismo. 1 1 a = f a (1) = f a q· = f a q q
q
Entonces f 1 q debe ser un número real tal que su potencia de grado q sea a. Comprobemos que ese número existe. PROP Sea g: 3+ → 3+ con g(x) = xn . Esta función verifica: 1) Es continua. 2) Es estrictamente creciente en 3. 3) lim g ( x) = +∞ x→ +∞
4) Es un homomorfismo de grupos. Dem. 1) La función g(x) es continua por ser un polinomio. 2) Sean x1 , x2 ∈3+ con x1 < x2 .
(
)
g ( x2 ) − g (x1 ) = x 2n − x1n = ( x2 − x1 ) x2n −1 + x2n −2 · x1 + ..... + x 2 x1n −2 + x1n −1 > 0 3) Como n∈– ⇒ 1 ≤ n ∀n∈– ⇒ x ≤ g(x) ∀n∈– con x > 1 y como lim x = +∞ ≤ lim g ( x ) ⇒ lim g ( x ) = +∞ x→ +∞
x →+∞
x→ +∞
4) Hemos de comprobar que (x1 · x2 )n = x1n · x2n La demostración la hacemos por inducción. n=1
(x1 · x2 )1 = x1 · x2
n=2
(x1 · x2 )2 = (x1 · x2 ) (x1 · x2 ) = x12 ·x22
Suponemos cierto (x1 x2 )n-1 = x1n −1 · x2n −1 Para n
( x1 x2 )n = ( x1x 2 )n−1 ( x1 x2 ) = (x1n−1 x2n−1 )( x1· x2 ) = x1n · x2n
Luego la igualdad es cierta y g(x1 · x2 ) = g(x1 ) · g(x2 ) 3/16
De todo esto obtenemos como conclusión que g(x) es un isomorfismo, existiendo por tanto su inversa H: 3+ → 3+
con
( g o h )( x ) = x = (h o g )( x )
Denotaremos como h(x) = x1/n Luego ∀a∈3+ h(a) = a1/n siendo a1/n el número que verifica que su potencia de grado n es a. Podemos escribir que f 1 q = a Si r∈Q con r =
1
q
q
1 y a = f 1 q = a q
q
p tenemos que q
p p 1 p 1 f a (r ) = f a = f a p· = f a 1 q = a q q q
y ahora sólo nos queda comprobar que el resultado obtenido no depende del representante elegido para r. Sea r =
p P´ = dos representantes de r. Verifican que pq´ = p´·q q q´
p 1q p f a (r ) = f a = a q p´ 1 q´ p ´ f a (r ) = f a = a q´ Veamos que ambas expresiones son iguales: p f a q
qq´
p´ f a q´
qq´
1 = f a q
pqq ´
1 = f a q´
1 q = f a q
p´ qq´
pq ´
1 q´ = f a q´
= a pq ´
p´ q
= a p ´q
y como pq´ = p´q, ambas expresiones coinciden. p p Por convenio, denotaremos f a = a q con p∈9 y q∈9* . q
4/16
PROP Si a > 1, entonces lim a n = +∞ n→ +∞
Dem. Si a > 1 ⇒ a = 1 + x con x > 0. n n Por tanto a n = (1 + x )n = 1 + nx + x 2 + x3 + ...... > 1 + nx 2 3 Y como lim (1 + nx ) = +∞ ⇒ lim a n = +∞ n→ ∞
n →+∞
PROP La función fa : Q → 3 con fa (r) = ar verifica las siguientes propiedades: 1) a r1 ·a r2 = a r1 +r2
( )
2) a r1
r2
∀r1 , r2 ∈ Q
(Es homomorfismo de grupos).
∀r1 , r2 ∈ Q
= a r1 ·r2
3) fa es estrictamente creciente si a > 1 y estrictamente decreciente si 0 < a < 1. 4) fa es continua ∀r∈Q. Dem. 1) Sean r1 =
p1 q1
(a
( ) ·(a )
y
r2 =
p2 con p1 , p2 ∈9 y q1 , q2 ∈9* q2 q1 q2
r1
·a r2
)
q1 · q 2
= a
r1 q1q 2
r2
q 1q 2
qp1 = a 1
pq 2 · a 2
q1q 2
= a p1q 2 ·a p 2 q1 =
Como p1 q2 ∈ y p2 q1 ∈9 tenemos
=a
p1 q2 + p2 q1
p1qq2 +q p2 q1 = a 1 2
Por tanto a r1 +r2 = a r1 ·a r2
q1q 2
(
= a r1 + r2
)
q1 ·q 2
∀r1 , r2 ∈ Q
2) Análogamente a la anterior. 3) Ya hemos comprobado en este mismo apartado que la función g(x) = xn es creciente ∀n∈– y g: 3+ → 3+, e igualmente h (x ) = n x es también creciente ∀n∈– y h: 3+ → 3+.
5/16
Como g(x) y h(x) son crecientes, si a > 1 ⇒ a n > 1n = 1 y m a > 1 ⇒ m a n > 1
(
)
Entonces si r1 < r2 ⇒ r2 − r1 > 0 ⇒ a r2 −r1 > 1 ⇒ a r2 − r1 ·a r1 > 1·a r1 ⇒ a r2 − r1 ·a r1 > a r1 ⇒ ⇒ a r2 > a r1
∀r1 , r2 ∈ Q con r1 < r2 ⇒ fa es creciente para asi a > 1 .
De forma análoga, si r
a <1⇒ d =
1 > 1 y si r1 < r2 con r1 , r2 ∈ Q tenemos que a
r
1 2 1 < 1 ⇒ a r1 > a r2 a a
∀r1 , r2 ∈ Q ⇒ fa es decreciente para a < 1.
(
)
4) Como a y − a x = a x a y − x − 1 tenemos que cuando y → x, si se verifica que a y− x − 1 → 0 podemos asegurar que a y → a x . Por tanto, para demostrar la continuidad de fa en Q, basta demostrarlo en el origen (r = 0). Sea ε > 0 y a > 1 ⇒ ∃∩∈– / 1 + nε > a (1 + ε)n > 1 + nε > a ⇒ 1 + ε > a1/n Y por tanto ε > a1/n – 1 > 0 Luego ∀e∈Q con 0 ≤ r <
1 sabiendo que fa es creciente tenemos n
a r −1 < ε Además, como 0 < a Y dividiendo por a
1
1
n
n
Entonces ∀r ∈ Q con −
−1 < ε ⇒ 0 < a 0 < 1− a
− 1n
1
1
− 1 < ε·a n .
n
<ε
1 < r ≤ 0 se verifica 0 ≤ 1 − a r < ε n
Uniendo ambas partes: ∀ε > 0
∃δ > 0 / ∀r ∈ Q con r < δ ⇒ a r − 1 < ε
Luego fa es continua en r = 0 y por lo visto el inicio también lo es ∀r∈Q. 1 Para demostrarlo con a < 1, basta tomar d = > 1 y como fd es creciente ∀r∈Q a queda que fa es continua para todo valor a positivo.
6/16
1.4. Potencias de Exponente Real. El homomorfismo fa : Q → 3 definido en el punto anterior vamos a extenderlo de forma única de tal manera que su dominio sea 3. Tengamos en cuenta que ∀x∈3 ∃(qi)∈Q con (qi)i∈– un representante de x.
( ) i∈–⊂3 es una
PROP Si (qi)i∈–⊂Q es una sucesión racional de Cauchy entonces a qi sucesión de Cauchy. Dem. Sea a > 1 (si a = 1 trivial) Como qi es de Cauchy ∀ε > 0 ⇒ a qi − a
qj
= a qi 1 − a
q j −q i
∃no ∈ –/ qi − q j < ε si n ≥ no
≤ K 1− a
q j −q i
≤ (*)
porque como qi es de Cauchy ⇒ está acotado ⇒ a qi ≤ K
(*) ≤ K 1 − a ε y como ε es tan pequeño como queramos, entonces aε es tan cercano a 1 como nos de la gana ⇒ K 1 − aε < ε´(1) ⇒ ∀ε´> 0 ∃ε > 0 ∃no ∈ –/ a qi − a
qj
(que
verifique
la
propiedad
(1)
y
por
tanto
< ε´ si n ≥ no
⇒ a qi es de Cauchy en 3. (Análogamente si a < 1).
( )
Como conclusión tenemos que a qi número real que denotaremos por ax .
es de Cauchy y por tanto define un único
Esta definición no depende del representante elegido, pues si (qi´)⊂Q es otra sucesión de Cauchy que representa a x, se verificará que qi − qi ´→ 0 ⇒ a q i −q i ´ → 1
(
)
ya que a qi ´ · a qi − qi ´ = a q i y por tanto real.
(a ) i∈– qi
y
(a )i∈– qi ´
tienen el mismo límite, definiendo el mismo número
PROP La función fa : 3 → 3+ definida por propiedades:
7/16
fa(x) = ax verifica las siguientes
1) fa es estrictamente creciente si a > 1 y estrictamente decreciente si a < 1. 2) fa : (3, +) → (3+, ·) es un homomorfismo de grupos. 3) fa es continua.
( )
4) a x1
x2
= a x1 ·x2 y (ab )x = a x ·b x
lim a x = +∞ 5) Si a > 1 x→ +∞ x y si a < 1 a =0 xlim →−∞
lim a x = 0 x →+∞ x a = +∞ xlim → −∞
Dem. 1) Sea a > 1. Si x1 < x 2 ⇒ ∃r , s ∈ Q / x1 < r < s < x2 Sean (qi )i∈–⊂Q y (qi ´)i∈– ⊂ Q representantes de x1 y x2 respectivamente. Como x1 = lim qi e x2 = lim qi ⇒ ∃no ∈– / ∀i ≥ no
qi < r < s < qi´
Por tanto a qi < a r < a s < a q i ´
∀ i ≥ no
Y entonces a x1 < a r < a s < a x2 Siendo fa creciente estrictamente. El caso a < 1 se demuestra de forma análoga, basta tomar d=
1 >1 a
2) Sea fa : 3 → 3+ Si x1 , x2 ∈3 sean (qi)i∈–⊂Q y (qi´)i∈ –⊂Q dos representantes de x1 y x2 . Entonces (qi + qi´)i∈– es un representante de x1 + x2
( )
( )i∈–
Luego a qi i∈–, a q i ´ respectivamente.
y
(a
qi +q i ´
)i∈– son
8/16
representantes de x1 , x2 y x1 + x2
Como fa : Q → 3+ es un homomorfismo de grupos, se verifica a qi + qi ´ = a q i ·a qi ´ entonces a x1 + x 2 = a x1 ·a x2
∀x1 , x2 ∈ 3
Y como f a (x1 + x 2 ) = a x1 + x2 = a x1 ·a x2 = f a ( x1 )· f a ( x 2 ) Entonces fa : 3 → 3+ es homomorfismo. 3) Análogamente al caso de la función exponencial racional, basta que demostremos que fa es continua x = 0. Sabemos que ∀ε > 0 ∀x ∈ 3 con x < δ
∃δ > 0 / ∀ q ∈ Q
q < δ ⇒ aq −1 < ε
∃r , s ∈ Q / − δ < r < x < s < δ
• Si a > 1 ar < ax < as Entonces 1 − ε < a r < a x < a s < 1 + ε ∃δ > 0 / ∀x ∈ 3 con x < δ ⇒ a x − 1 < ε
Y ∀ε > 0 • Si a < 1
a r > a x > as Entonces 1 − ε < a s < a x < a r < 1 + ε ∃δ > 0 / ∀x ∈ 3 con x < δ ⇒ a x − 1 < ε
Y ∀ε > 0
( )
4) a x1
x2
= a x1 ·x2
Sea (qi)i∈–⊂Q un representante de x1 y (qi´)i∈–⊂Q de x2 . Entonces lim qi = x1 y lim qi´ = x2
( )
Como a qi
qi ´
= a q i · qi ´ (ya visto en el punto anterior) y si tenemos en cuenta que:
1) lim a qi = a x
9/16
2) g ( x ) = x qi ´ es continua ∀qi ´∈ Q tenemos que
(a )
x1 qi ´
= a x1q i ´
y como fa es continua
(a )
x1 x2
= a x1 ·x2
• (ab )x = a x ·b x Inmediata. 5) Para a > 1. Que lim a x = +∞ es consecuencia de lim a n = +∞ y que fa es creciente. x→ +∞
n →+∞
lim a x = lim a − y = lim
x→ −∞
x→ +∞
y →+∞
1 =0 ay
De forma análoga se demuestra para a < 1. PROP La función exponencial de base a (a ≠ 1), fa : (3, +) → (3+, ·) es un isomorfismo de grupos. Dem. 1) Como a x1 + x 2 = a x1 ·a x2 ⇒ fa es homomorfismo. 2) fa(x) = ax es estrictamente creciente ⇒ Inyectiva fa es continua y Rec fa = 3+ ⇒ suprayectiva. Si fa es homomorfismo y biyectiva ⇒ fa es Isomorfismo. 2. LA FUNCIÓN LOGARITMO DE BASE a. En el punto anterior hemos demostrado que la función fa : (3, +) → (3+, ·) x → fa(x) = ax es un isomorfismo de grupos. Por tanto existe la función recíproca de fa, llamaremos función Logaritmo en base a, y se denota por f a− 1 ≡ log a . f a−1 : (3+, ·) → (3, +)
10/16
f −a 1 , que
x → f a−1 ( x ) = log a x verificándose a log a ( x ) = x = log a a x ya que
(f
a
o f a−1 )(x ) = x = ( f a−1 o f a )( x )
PROP La función loga : 3+ → 3 verifica las siguientes propiedades: 1) loga es estrictamente creciente si a > 1 y estrictamente decreciente si a < 1. 2) loga : (3+, ·) → (3, +) es un homomorfismo de grupos. 3) loga es continua. lim log a x = +∞ 4) Si a > 1 x→ +∞ log a x = −∞ xlim → −∞
lim log a x = −∞ y si a < 1 x→ +∞ log a x = +∞ xlim → −∞
Dem. 1) Sea a > 1 y x1 < x2 Sabemos que a x1 < a x2 ya que la función ax es creciente estrictamente. x1 = a loga x1 = log a a x1 x2 = a loga x2 = log a a x2 Supongamos que loga x1 ≥ loga x2 Entonces a log a x1 ≥ a loga x1 ⇒ x1 ≥ x 2 lo que es una contradicción. Luego loga x1 ≤ loga x2 y la función loga x es una función estrictamente creciente. De forma análoga se demuestra a < 1. 2) Como a0 = 1 ⇒ loga 1 = 0 ( f a−1 (e ) = e transforma el neutro en el neutro). ∀x1 , x2 ∈3+ x1 · x2 = a log a x1x 2 ⇒ a log a x1 · x2 = a loga x1 + loga x2 ⇒ loga x1 loga x2 loga x1 +loga x2 x1 ·x 2 = a ·a =a
11/16
Al ser ax una función inyectiva se verifica log a x1 ·x 2 = log a x1 + log a x2 que es lo mismo que: f a−1 ( x1 ·x2 ) = f a−1 ( x1 ) + f a− 1 ( x2 ) 3) Inmediata. 4) Los límites son inmediatamente deducibles sin más que tener en cuenta que loga x y ax son funciones recíprocas. PROP Se verifica: 1) log a y x = x·log a y ∀x ∈ 3
∀y > 0
2) log a y = log b y ·log a b ∀a, b, y > 0 Dem.
(
1) y x = a loga y
)
x
= a x ·loga y
Entonces log a y x = log a a x·loga y = x·log a y Luego log a y x = x log a y 2) Sabemos que Entonces
y = b logb y
log a y = log a b logb y
Y aplicando el apartado anterior log a b logb y = log b y·log a b Luego log a y = log b y ·log a b
12/16
Hay un caso especial de funciones exponenciales, que son aquellas en las que la base es el número e. Estos son muy útiles a la hora de hacer estudios físicos ya que aparecen con gran frecuencia en los problemas de crecimiento de poblaciones. La función recíproca de la exponencial f(x) = ex , es el logaritmo en base e de x, o también llamado logaritmo neperiano de x (en honor a Juan Neper), Lnx. En concreto, para los matemáticos, el logaritmo en base e es el mas importante debido en gran parte a 1 que es la integral de la función f (x ) = , aunque esto se salga del tema, pero su x utilización es muy grande y la tendencia natural es a manejarlos con mayor frecuencia que ninguno, pudiendo transformar cualquier otro logaritmo en neperiano mediante la expresión: log a x =
ln x ln a
3. FUNCIÓN POTENCIAL. DEF
Llamamos función potencial a f: 3+ → 3+ con f(x) = xr siendo r∈3+.
La definición tiene sentido ya que r∈3+ y como x∈3+ el símbolo xr podría ser considerado de forma puntual como la función exponencial de base x. PROP La función potencial f(x) = xr verifica las siguientes propiedades: 1) Es estrictamente creciente si r > 0 y estrictamente decreciente. 2) Si r < 0 f: (3+, ·) → (3+, ·) f(x) = xr es un homomorfismo de grupos. 3) Es continua en todo su dominio. lim+ x r = 0 lim+ x r = +∞ 0 x → 4) Si r > 0 y si r < 0 x→ 0 r r lim x = +∞ x =0 x→+∞ xlim →+∞ Dem. Esta proposición casi en su totalidad la tene mos demostrada antes en el caso de que r sea un natural. Demostrémosla ahora con r∈3. Si tenemos en cuenta que x r = a r ·loga x Podemos definir g ( x ) = a x y h (x ) = r ·log a x Verificándose que f (x ) = (g o h)( x )
13/16
1) Si elegimos a < 1, g(x) es estrictamente creciente y h(x) también en caso de que r > 0. Si r < 0 entonces h(x) es estrictamente decreciente. Al componer ambas funciones, se demuestra lo que queríamos. 2) f(x) = xr homomorfismos.
es un homomorfismo de grupos por ser composición de dos
Por tanto f (x1 ·x 2 ) = f ( x1 )· f ( x2 ) Y es
( x1· x2 )r
= x1r · x2r
3) f(x) = xr es continua por ser composición de funciones continuas en todo su dominio. 4) Inmediato. 4. SITUACIONES REALES EN LAS QUE APARECEN. 4.1. Función Exponencial. a) La desintegración atómica. N (t ) = No ·e − Kt siendo No = número de átomos inicial (t = 0) K = constante de desintegración del elemento. b) Enfriamiento de un cuerpo. t
f (t ) = be − Kt + e − kt ∫ K ·M (n )·e Kn dn a
K = constante. b = temperatura en t = a. M(t) = temperatura ambiental. c) Caída de un cuerpo en un medio resistente. f (t ) =
Kt mg gm 2 − m + 2 e − 1 K K
d) Crecimiento de Poblaciones. La función exponencial aparece al calcular el crecimiento de una población donde la tasa de crecimiento se mantiene constante, pudiendo ser positiva o negativa.
14/16
P = Po ·e Kt Po = tamaño inicial de la población. K = tasa de crecimiento. t = tiempo transcurrido. Con el paso del tiempo, diversos factores influyen en el crecimiento de la población haciendo que la función exponencial de adapte a la función logística, moderando su crecimiento (o decrecimiento). Las funciones logísticas tienen como expresión c (t ) =
B 1 + A·e −Kt
e) Problemas de Interés Compuesto y Continuo. En los problemas de interés compuesto, disponemos de un capital inicial que va incrementándose al añadirle los intereses producidos. Si el capital inicial es Co y el interés es I, el capital C que tendremos al cabo de t años será t
C = Co (1 + I ) llamado capital compuesto.
Si los intereses se devengan cada instante (cada infinitésimo de tiempo) la expresión para el capital C es nt
I C = lim Co 1 + = Co ·e rt n →∞ n llamado capital continuo. 4.2. Función Logarítmica. a) La Escala de Richter. La escala de Richter es una escala logarítmica de base 10 que mide la fuerza o intensidad de los terremotos. Al ser su base 10, un terremoto de intensidad 5 es 10 veces mayor que otro de intensidad 4, 100 veces mayor que otro de intensidad 3 y así sucesivamente. Teniendo en cuenta esto, un terremoto de escala 8´4 es 5´01 veces más intenso que otro de escala 7´7, ya que
15/16
10 8´4 = 10 0´7 ≈ 5´01 7´7 10 b) pH. El pH de una solución es la medida de su acidez, y mide la concentración de iones [H ], que son los átomos de hidrógeno por litro. +
pH = log 10
1 H 3O +
[
]
c) Regla de Cálculo. La regla de Cálculo sirvió, hasta la aparición de las calculadoras, para simplificar operaciones complicadas. Se apoya en las propiedades de los logaritmos que permiten traducir productos en sumas, cocientes en restas, potencias y raíces en productos y cocientes, etc.
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté Introducción al Análisis Matemático. Aut. J.M. Ortega. Ed. Labor
16/16
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 23 FUNCIONES CIRCULARES E HIPERBÓLICAS Y SUS RECÍPROCAS. SITUACIONES REALES EN LAS QUE APARECEN. 1. Introducción. 2. Funciones circulares. 2.1. Funciones de Seno y Coseno. 2.1.1. Sen x y Cos x para x∈[0, π]. 2.1.2. Extensión de Sen x y Cos x a todo 3. 2.2. Función Tangente. 2.3. Funciones Circulares Inversas. 2.4. Funciones Circulares Recíprocas. 2.4.1. La Recíproca de la función Sen x. 2.4.2. La Recíproca de la función Cos x. 2.4.3. La Recíproca de la función tg x. 3. Funciones Hiperbólicas. 3.1. Función Sh x y Ch x 3.1.1. Estudio de la Función Sh x. 3.1.2. Estudio de la Función Ch x. 3.2. Función Th x. 3.2.1. Estudio de la función Th x. 3.3. Funciones Hiperbólicas Inversas. 3.1.1. Estudio de la función Cth x. 3.4. Funciones Hiperbólicas Recíprocas. 3.4.1. La recíproca de la función Sh x. 3.4.2. La recíproca de la función Ch x. 3.4.3. La recíproca de la función th x. 4. Situaciones Reales en las que aparecen. Bibliografía Recomendada.
1/28
TEMA 23 FUNCIONES CIRCULARES E HIPERBÓLICAS Y SUS RECÍPROCAS. SITUACIONES REALES EN LAS QUE APARECEN. Funciones Circulares e Hiperbólicas y sus Recíprocas. Situaciones reales en las que Aparecen. 1. INTRODUCCIÓN. La trigonometría estudia la relación entre ángulos y lados en un triángulo. A partir de este problema aparentemente tan simple, surgen las funciones circulares. Antes de proceder a su definición, veremos algunos conceptos previos. DEF Dos semirectas r y s con origen común determinan un ángulo. Las dos semirrectas son los lados y el origen es el vértice del ángulo. DEF Un par de semirrectas (r, s) con origen común determinan un ángulo dirigido, determinado por el giro de centro del origen, que lleva coincidir la primera con la segunda, según el sentido contrario al de las agujas del reloj. Partiendo de la definición anterior y suponiendo que tenemos dos ejes de coordenadas perpendiculares OX y OY, podemos situar todos los ángulos de manera que la primera de las semirrectas coincida con el semieje OX positivo. A dicho semieje se le llama origen de ángulos. El ángulo queda determinado dando sólo una semirrecta.
fig. 1 DEF Llamaremos Circunferencia trigonométrica a la que tiene su centro en el origen de coordenadas y radio unidad. La única semirrecta que determina un ángulo en un sistema de ejes coordenados (la otra es el origen de ángulos) corta a la circunferencia trigonométrica en un solo punto. Por tanto, podemos simplificar la determinación de un ángulo dando simplemente un punto de la circunferencia. Los puntos (x, y) pertenecientes a la circunferencia verifican la condición: x2 + y2 = 1 DEF Sea α el ángulo dirigido definido por el punto (xo , yo ) perteneciente a la circunferencia trigonométrica. Llamaremos seno del ángulo dirigido al valor yo y coseno del ángulo dirigido a xo . 2/28
Sen α = yo Cos α = xo
fig. 2 A partir de la definición anterior podemos obtener el senos y el coseno de un ángulo cualquiera que podamos representar en la circunferencia trigonométrica. Pero ¿cómo se miden los ángulos?. La forma más antigua de medir los ángulos es en grados. En un sistema de base 60 que fue heredado por los griegos de los babilonios. Una circunferencia completa tiene 360º. Un grado se subdivide en 60 minutos y cada uno de estos en 60 segundos. La definición que hemos dado para el senos y el coseno nos permite conocer estos valores de cualquier ángulo comprendido en una circunferencia. α∈[0º, 360º ] Si medimos los ángulos en grados, minutos y segundos, ¿cuánto mediría un ángulo de 2 º ?. Como en época de los babilonios o griegos no conocían los números irracionales, no se encontraron con la dificultad anterior. Para poder resolverla, surgió otra forma de medir los ángulos: en radianes. DEF Un radian es el ángulo que tiene el arco de la misma longitud que el radio, donde arco y radio corresponden a la misma circunferencia. Sabiendo que la longitud de la circunferencia es 2πr, siendo r el radio de la misma, tenemos que el ángulo que abarca toda la circunferencia, 360º, equivale a 2π radianes. Podemos pasar de un ángulo α medido en radianes, R, a medido en grados, G, mediante la expresión R=
π G 180
Con esta nueva fórmula de medir ángulos, y teniendo en cuenta que es 1 radian, concluimos que, al ser 1 el radio de la circunferencia trigonométrica, medir ángulos es lo mismo que medir la longitud del arco que abarca.
3/28
Ahora vamos a extender la definición del seno y coseno a un ángulo α cualquiera cuyo valor es un número real y está medido en radianes. Pero en lugar de realizar la definición en términos de longitud, resulta más fácil en términos de áreas, las cuales podemos expresarlas mediante integrales. Supongamos que α es el ángulo determinado por un punto P de la circunferencia trigonométrica
fig. 3 Si P = (x, y) se verifica que x2 + y2 = 1. Si el ángulo α está medido en radianes, su valor coincide con la longitud del área que determina. Llamaremos l a la longitud del l arco determinado por α (l = α). Este arco contiene de la longitud total de la 2π circunferencia, que es 2π. Si llamamos S al sector determinado por las semirrectas OX positiva, OP y el arco de la circunferencia de longitud l, el área de S es: A(S ) =
l 2
que se obtiene fácilmente teniendo en cuenta que el área del círculo es π. Podemos, pues, definir sen α y cos α como las coordenadas de un punto P de la α circunferencia trigonométrica tal que el sector que determina tiene área (con α 2 medido en radianes). 2. FUNCIONES CIRCULARES. 2.1. Funciones Seno y Coseno. 2.1.1. Sen x y Cos x para x∈ ∈ [ 0, π ] . Vamos a iniciar el estudio de las funciones circulares con las funciones Seno y Coseno. En principio vamos a definirlas cuando el ángulo α pertenece semicircunferencia positiva (α∈[0, π]), para luego ir extendiendo la definición.
a
la
Como acabamos de ver que un punto P(x, y) de la circunferencia determina un α ángulo x, siendo x = cos x e y = sen x y que el área del sector que determina α es , 2 4/28
vamos a tratar de obtener una expresión analítica para el área de un sector situando en la semicircunferencia positiva. Sea f (x ) = 1 − x 2 con x∈[-1, 1] la semicircunferencia positiva. Un punto cualquiera de dicha semicircunferencia será
(
)
P x, 1 − x 2
con x∈[-1, 1]
• Si x∈[0, 1]
fig. 4 El área del sector puede descomponerse como suma del área del triángulo XOP más el área encerrada bajo la semicircunferencia. 1
A( x ) =
x 1 − x 2 + ∫ 1 − t 2 dt x
2
• Si x∈[-1, 0]
fig. 5 En este caso el área del sector es al área encerrada por al semicircunferencia menos el área del triángulo XOP. 1
A( x ) = ∫
x
2
− x 1 − (− x ) 1 − t dt − = 2 2
recordemos que escribimos - x ya que x∈[-1, 0] =
1 x· 1 − x 2 + ∫ 1 − t 2 dt x 2
(
)
El área del sector de la circunferencia determinado por P x, 1 − x 2 con x∈[-1, 1] es 5/28
A( x ) =
1 x· 1 − x 2 + ∫ 1 − t 2 dt x 2
PROP La función A: [-1, 1] → 3 definida por A( x ) =
1 x 1− x2 + ∫ 1 − t 2 dt x 2
verifica: 1) Es continua en todo su dominio. 2) Es derivable en (-1, 1) y A´(x) ≠ 0. 3) A(− 1) =
π 2
y
A(1) = 0
Dem. 1) Trivial 2) Si x∈[-1,1] ⇒ A(x) es derivable y se tiene que:
(
)
1 − 2x 1 − x2 + 1 − x 2 2 2 2 A' ( x ) = x· + 1− x − 1− x = − 1− x = 2 2 2 2 1− x 2 2 1− x 2 2 2 1 − 2x 1 − 2x − 2 1 − x −1 = − 1− x2 = = ⇒ A' ( x ) ≠ 0 2 1 − x2 2 1− x2 2 1− x2
(
1
3) A( −1) = 0 + ∫ 1 − t 2 dt = −1
)
π 2
A(1)=0 Trivialmente De la proposición anterior deducimos que A(x) es una función estrictamente decreciente y, por tanto, inyectiva. Podemos decir aun más; la función A: [-1, 1] → [0, π 2 ] Es biyectiva. Retomando nuestro problema inicial, para α∈[0, π] queremos definir Sen α y Cos α como las coordenadas de un punto P(cos α, sen α) de la circunferencia α trigonométrica que determina un sector cuya área es . 2
6/28
Como α ∈ [0, π] ⇒
[
]
α α ∈ 0, π 2 ⇒ ∈ Rang ( A( x )). 2 2
Al ser la función A(x) biyectiva, podemos garantizar la existencia de un único α xo ∈[-1, 1] tal que A(xo ) = para un α concreto. 2 DEF
Si α∈[0, π], definimos cos α como el único número xo ∈[-1, 1] tal que α A( xo ) = . Se define sen α como 1 − xo2 . 2 A(cos α) =
Luego dado α∈[0, π] se verifica
α y por el teorema de Pitágoras 2
sen α = 1 − cos α2 Si construimos una nueva función D(x) como D: [-1, 1] → [0, π] X → D(x) = 2A(x) Podemos afirmar que D(x) es una función biyectiva. Y se verifica que D(cos α) = α
∀α∈[0, π]
Por tanto, la función coseno es la recíproca de la función D Cos x = D-1(x) Y deducimos que
(
sen x = 1 − D −1 ( x )
)
2
verificándose en ambas definiciones que x∈[0, π]. Tenemos pues que Cos: [0, π] → [-1, 1] X → cos x = D-1(x) Y teniendo en cuenta que sen x = 1 − cos 2 x Sen: [0, π] → [0, 1] x → sen x = 1 − cos 2 x
7/28
Podemos observar que la función sen x, donde la tenemos definida, es positiva. Veamos algunas propiedades de ambas funciones. PROP Si x∈[0, π] se verifica 1) La derivada de Cos x es - Sen x: (Cos x)´ = - Sen x 2) La derivada de Sen x es Cos x: (Sen x)´ = Cos x Dem. La derivada de la función A(x) es A´( x ) =
−1 2 1 − x2
siendo entonces D´( x ) =
−1 1− x2
y como Cos x = D-1(x)
(Cosx )´= (D−1( x ))´= −
(Senx )´= (
)
1 − Cos 2 x ´=
1 1
(
1 − D −1 ( x )
= − 1 − Cos 2 x = − Senx
)
2
1 − 2Cosx(Cosx )´ Cosx·Senx = = Cosx 2 Senx 1 − Cos 2 x
OBS La función Cos x, donde la tenemos definida, es una función decreciente estrictamente, ya que su derivada es positiva. Calculemos algunos valores de la función cos x: • x = 0 A(Cos0 ) =
0 = 0 ⇒ A(Cos 0) = 0 ⇒ Cos 0 = 1 ya que A(1) = 0. 2
• x = π A(Cosπ) =
π π ⇒ Cosπ = −1 ya que A(− 1) = 2 2
• x=
π 2
π π π π A Cos = ⇒ Cos = 0 ya que A(0 ) = 4 2 4 2
Justifiquemos este último resultado: 8/28
A(0) =
1 1 0· 1 − 02 + ∫ 1 − t 2 dt ⇒ A(0) = ∫ 1 − t 2 dt 0 0 2 1
∫
0
−1
y como
2
1
1 − t dt = ∫0 1
∫
−1
1
1 − t 2 dt ⇒ ∫−1 1 − t 2 dt = 2 ∫0 1 − t 2 dt
1 − t 2 dt = π 2 (área del semicírculo)
queda que A(o ) =
π 4
Sabiendo que la función Cos x es decreciente y los tres valores calculados antes podemos representarla, siendo
fig. 6 Para representar la función sen x tengamos en cuenta que:
(
)
> 0 si x ∈ 0,π 2 (Senx )´= Cosx π < si x ∈ 2 , π
(
)
Estrictamente Creciente ∀ x ∈ 0, π 2 Entonces Sen x π Estrictamente Decrecient e ∀x ∈ 2 , π Y presenta un máximo en x =
π 2
• Sen0 = 1 − Cos 2 0 = 1 − 1 = 0 2
• Senπ = 1 − Cos 2π = 1 − (− 1) = 0 • Sen
π π = 1 − Cos 2 = 1 − 0 = 1 2 2 9/28
(
)
luego su representación gráfica es
fig. 7 2.1.2. Extensión de Sen x y Cos x a todo 3 . Los valores de las funciones sen x y cos x con x∈[π, 2π] los podemos calcular de la siguiente forma: Senx = −Sen(2π − x ) Cosx = Cos (2π − x ) Estas definiciones provienen de observar la circunferencia trigonométrica y recordar las definiciones para sen x y cos x con x∈[0, π] P(cos x, sen x) era un punto de la circunferencia. Es fácil extender las gráficas de sen x y cos x al intervalo [0, 2π], ya que los valores para x∈[π, 2π] se basan en los que obtiene el cos x y sen x en [0, π] respectivamente, los cuales nos son conocidos. Por tanto tenemos que Sen x con x∈[0, 2π]
fig. 8 Cos x con x∈[0, 2π]
fig. 9
10/28
Al tener en x∈[0, π] Rang (sen x) = [0, 1] Rang (cos x) = [-1, 1] Entonces en x∈[π, 2π] Rang (sen x) = [-1, 0] Rang (cos x) = [-1, 1] Y deducimos que ambas funciones tienen de rango [-1, 1] cuando x∈[0, 2π]. Antes de extender la definición a todo número real hemos de tener en cuenta que los ángulos son medidos modulo 360º o módulo 2π. Eso es debido a que si representamos un ángulo de 400º en la circunferencia, el punto de la misma que lo determina al ángulo de 40º, y a cualquier otro ángulo que provenga de sumar 40º a un número entero de vueltas de circunferencia. Por tanto, tenemos que Si x∈3 ⇒ x = 2Kπ + xo con K∈9 y xo ∈[0, 2π] Sen x = Sen xo Cos x = Cos xo Las construimos de forma que son periódicas de periodo 2π. Y por tanto, el rango de ambas funciones sigue siendo [-1, 1]. Sen: 3 → [-1, 1] x → Sen xo
siendo x = 2πK + xo con xo ∈[0, 2π]
Cos: 3 → [-1, 1] x → Cos xo
siendo x = 2πK + xo con xo ∈[0, 2π]
Y sen xo = 1 − cos 2 xo
y Cosxo = D −1 ( x )
PROP Las funciones sen x y cos x con x∈3 verifican 1) Sen2 x + Cos2 x = 1
∀x∈3
2) (Sen x)´ = Cos x
∀x ≠ Kπ
3) (Cos x)´ = - Sen x
∀x ≠ Kπ 11/28
Dem. 1) ∀x∈3 ∃K∈9 / x = 2πK + xo
con
xo ∈[0, 2π]
Sen 2 x + Cos 2 x = Sen 2 ( xo + 2πK ) + Cos 2 ( xo + 2πK ) = Sen2 xo + Cos 2 xo = 1 Vale 1 porque P(Cos xo , Sen xo ) es un punto de la circunferencia trigonométrica. 2) Si x∈(0, π) sabemos que es cierto. Si x∈(π, 2π) ⇒ sen x = - sen(2π - x) ⇒ ⇒ (sen x)´ = (- sen(2π - x)´ y como 2π - x∈(0, π) ⇒ (- sen(2π - x)´ = (- cos(2π - x) (- 1) ⇒ (sen x)´ = cos (2π - x) = cos x Si x toma cualquier otro valor (no múltiplo de π) se reduce 3) Análogo al 2). OBS Las derivadas de las funciones Sen x y Cos x no están definidas en los valores múltiplo entero de π. Ello es debido a que la función A(x) no tenía derivada para x = ± 1. Aún así vamos a extender la definición para que ambas derivadas sean continuas. Nos basaremos en el siguiente teorema. TEOREMA Sea f(x) una función continua en x = a, existe f´(x) ∀x∈E*(a, ε) y existe lim f ´( x ) . Entonces existe f´(a) y es f´(a) = lim f´(x). x →a
x →a
COROLARIO 1) (Sen x)´ = Cos x
∀x∈3
2) (Cos x)´ = - Sen x ∀x∈3 PROP Se verifican las siguientes expresiones: Sen( x + π ) = −Senx Cos( x + π ) = −Cosx 1) Sen( − x) = − Senx Cos(− x ) = Cosx π 2) Sen − x = cos x 2
12/28
π 3) Cos − x = sen x 2 Dem. Inmediatas 2.2. Función Tangente. DEF
Definimos la función tangente como tg: 3 → 3 x → tg x =
sen x cos x
siempre que cos x ≠ 0. Veamos ahora donde la función tg x no está definida, que será cuando cos x = 0. cos x = 0 cos x = 0 cos x = 0 ⇒ ⇒ ⇒ 2 2 sen x + cos x = 1 sen x = 1 sen x = ±1 2
⇒ Se corresponde con los puntos (0, 1) y (0, -1) de la circunferencia, y esos puntos π 3π definen los ángulos de y radianes. Al ser la función cos x periódica de periodo 2 2 π 3π 2π, resulta que se anula en x = + 2πK y x = + 2πK ∀K ∈ 9, siendo esos puntos 2 2 π también expresables como x = + πK ∀K ∈ 9. 2 π Por tanto, Dom( tg x ) = 3- x / x = + Kπ 2
∀K ∈ Z
Para saber el periodo de la función tangente tenemos que tg (x + 2π ) =
Sen( x + 2π ) Senx = = tg x Cos (x + 2π ) Cosx
pero 2π no es el periodo, ya que también se verifica tg (x + π ) =
Sen(x + π ) − Senx = = tg x Cos( x + π) − Cosx
y como π es el número más pequeño, estrictamente positivo, tal que tg (x + P) = tg x 13/28
podemos afirmar que P = π es el periodo de la función tangente. PROP Se verifica 1 + tg 2 x =
1 cos 2 x
Dem. Sabiendo que
Sen2 x + Cos2 x = 1
y
que
tg x =
sen x tenemos que cos x
Sen 2 x 1 1 +1 = ⇒ tg 2 x + 1 = 2 2 Cos x Cos x Cos 2 x PROP La función tg x es derivable en todo su dominio siendo
(tg x )´=
1 cos 2 x
Dem.
(tg x )´= Senx ´= (Senx )´·Cosx −2Senx (Cosx )´ = Cos Cosx
Cos x
PROP La función tg x verifica 1) tg(- x) = - tg x π 1 2) tg − x = 2 tg x Dem. sen( − x ) = cos( − x ) π sen π 2 2) Tg − x = 2 cos π 2 1) Tg (− x ) =
− sen x = − tg x cos x − x = cos x = 1 sen x tg x − x
La representación de la función tg x es
14/28
2
x + Sen2 x 1 = 2 Cos x Cos 2 x
fig. 10 2.3. Funciones Circulares Inversas. DEF
Las funciones circulares inversas son:
1) Secante
Secx =
1 Cosx
2) Cosecante Coscx =
3) Cotangente Co tg =
∀x ≠
π + Kπ 2
K∈9
1 Senx
∀x ≠ Kπ
K∈9
Cosx Senx
∀x ≠ Kπ
K∈9
PROP Las derivadas de las funciones circulares inversas son 1) (Secx )´= Secx·tg x 2) (Co sec x )´= −Coscx·Co tg x 3) (Co tg x )´=
−1 Sen 2 x
Dem. Inmediata. La representación gráfica de las funciones circulares es 1) Sec x
15/28
fig. 11 2) Cosec x
fig. 12 3) Cotg x
fig. 13 2.4. Funciones Circulares Recíprocas. Las funciones circulares las tenemos definidas de 3 en 3 y no son biyectivas. Para poder obtener sus recíprocas, primero hay que restringirlas a un intervalo adecuado. Hablando con propiedad, las funciones circulares no tienen recíproca, pero si unas restricciones suyas adecuadas. 2.4.1. La Recíproca de al función Sen x. Definíamos f(x) como 16/28
π π f : − , → 3 2 2 x → Sen x π π La función f(x) definida como la función sen x restringida al intervalo − , 2 2 es biyectiva.
fig. 14 La recíproca de la función f(x) recibe el nombre de arco seno y se denota como: π π arcse : [− 1,1] → − , 2 2 x → arcsen x y su representación gráfica es
fig. 15 PROP Si x∈(-1, 1) se verifica
(ar cos enx )´= Dem.
17/28
1 1 − x2
(ar cos enx )´= ( f −1 ( x ))´=
1 f ´(( f
−1
(x )))
=
1 1 1 = = −1 (sen ( f ( x )))´ cos(arcsen x ) 1 − x 2
ya que sen 2 (arcsen x ) + Cos 2 (arcsen x ) = 1 ⇒ x 2 + Cos 2 (arcsen x ) = 1 ⇒ ⇒ Cos (arcsen x ) = 1 − x 2 Tomamos la raíz cuadrada positiva porque
π π arcsen x ∈ − , y por tanto su 2 2
coseno es positivo. 2.4.2. La Recíproca de la función Cos x. Definimos f(x) como f: [0, π] → [-1, 1] x → Cos x Así definida, f(x) es una función biyectiva y por tanto existe su recíproca. Su representación gráfica es:
fig. 16 La recíproca de la función f(x) recibe el nombre de arcoseno y se denota como: arccos: [-1, 1] → [0, π] x → arccos x y su gráfica es
18/28
fig 17 PROP Si x∈(-1, 1) se verifica
(arccos x )´=
−1 1 − x2
Dem.
(arcsen x )´= ( f −1 (x ))´=
1 −1 −1 = = (Cos (arccos x ))´ Sen (arccos x ) 1 − x 2
ya que Sen 2 (arccos x ) + Cos 2 (arccos x ) = 1 ⇒ Sen(arccos x ) = 1 − x 2 e igualmente tomamos la raíz positiva porque arccos x∈(0, π) y por tanto su seno es positivo. 2.4.3. La Recíproca de la función tg x. Definimos f(x) como −π π f : , →3 2 2 x → tg x Así definida, f(x) es una función biyectiva y por tanto existe su recíproca. La recíproca de la función f(x) recibe el nombre de arcotangente y se denota como π π arctg : 3 → − , 2 2 x → arctg x siendo su gráfica
19/28
fig. 18 PROP ∀x∈3 se verifica
(arctg x )´=
1 1 + x2
Dem.
(arctg x )´=
1 1 1 1 = = = 2 ( tg (arctg x ))´ ( tg y )´ 1 + tg y 1 + x 2
siendo y = arctg x ⇔ x = tg y ⇔ x 2 = tg 2 y OBS De forma análoga obtendríamos, en el mayor intervalo posible, las recíprocas de las funciones inversas. 1) La recíproca de la sec x es arcosec x. 2) La recíproca de la cose x es arcosec x. 3) La recíproca de la cotg x es arccotg x. 3. FUNCIONES HIPERBÓLICAS. La circunferencia trigonométrica tiene como ecuación x2 + y2 = 1 y sus ecuaciones paramétricas son x = cos t y = sen t Por eso las funciones Sen x y Cos x reciben el nombre de funciones circulares. De forma análoga, dada la ecuación de una hipérbola x2 y2 − =1 a2 b2 20/28
vemos que sus ecuaciones paramétricas son x = a·Cht y = b·Sht siendo Sht el seno hiperbólico de t y Cht el coseno hiperbólico de t. Estas funciones, que ahora definiremos, son las llamadas funciones hiperbólicas. Aunque no lo vamos a hacer, podriamos definir estas funciones geométricamente de forma muy similar a como lo hemos hecho para el sen x y cos x. 3.1. Funciones Shx y Chx. DEF
Definimos la función Seno hiperbólico como Shx =
ex − e−x 2
y la función Coseno hiperbólico como Chx =
ex + e−x 2
PROP Las funciones Shx y Chx verifican 1) Ch2 x − Sh 2 x = 1 2) Ch( x + y ) = Chx·Chy + Shx·Shy 3) Ch( x − y ) = chx·chy − shx ·shy 4) Sh( x + y ) = Shx·Chy + Chx·Shy 5) Sh( x − y ) = Shx·Chy − Chx·Shy 6) Sh2 x = 2 ShxChx 7) Ch2 x = Ch2 x + Sh 2 x 8) 1 + Ch2 x = 2Ch2 x 9) 1 − Ch2 x = −2Sh 2 x Dem. 1) Ch 2 x − Sh 2 x = (Chx + Shx )(Chx − Shx ) =
21/28
ex + e− x e x − e−x = + 2 2 2) Ch( x + y ) =
e x + e − x e x − e − x − 2 2
x −x = e ·e = 1
e x + y + e − x− y e x e y + e − x e − y = = 2 2
Sabemos que e x = (Chx + Shx ) y e − x = (Chx − Shx ) =
=
(Chx + Shx )(Chy + Shy ) + (Chx − Shx )(Chy − Shy ) = 2
ChxChy + ChxShy + ShxChy + ShxShy + Chx − Chy − ChxShy − ShxChy + ShxShy = 2 =
2ChxChy + 2ShxShy = Chx·Chy + ShxShy 2
3) 4) 5) Análogas a la anterior. 6) Sh2 x = Sh (x + x ) = ShxChx + Chx·Shx = 2 ShxChx 7) 8) 9) Análogas a la anterior. 3.1.1. Estudio de la función Shx. Ahora hemos de tener en cuenta las propiedades de la función exponencial, ex , la cual estudiamos en el tema anterior. Como Shx =
ex − e−x , podemos decir: 2
1) Dom(Sh x) = 3 2) Corta a los ejes en el origen (0, 0), pues Sh0 = 0 3) Tiene simetría Impar. Sh(− x ) =
e−x − e x ex − e−x =− = − Shx 2 2
4) Es estrictamente Creciente ya que
(Shx )´= e
x
− e− x 2
ex + e−x ´= 2
= Chx > 0 22/28
su derivada es positiva. Por tanto no presenta máximos ni mínimos. Convexa en (0,+∞) 5) (Shx )´´= Shx ⇒ Concava en (− ∞ ,0) Presenta un punto de inflexión en (0, 0) 6) No tiene asíntotas horizontales, ni verticales, ni oblicuas. 3.1.2. Estudio de la función Chx. Realizaremos un estudio análogo al anterior par la función Chx. 1) Dom(Chx ) = 3 2) Corta a los ejes en (0, 1) pues Ch0 = 1. 3) Tiene simetría par Ch(− x ) =
e−x + ex ex + e− x = = Chx 2 2
4) (Chx)´= Shx ⇒ Decreciente en (- ∞ ,0 ), ya que Shx < 0 ∀x∈3Creciente en (0, + ∞ ), ya que Shx > 0
∀x∈3+
5) (Chx)´´ = Chx > 0 ∀3 ⇒ Es siempre convexa. 6) No tiene asíntotas de ningún tipo. 3.2. Función Thx. DEF
La función Tangente hiperbólica, que se representa por Thx es Thx =
Shx Chx
ó Thx =
PROP La función Thx verifica 1) Th 2 x =
2)
2Thx 1 + Th 2 x
1 − Ch2 x = −th2 x 1 + Ch 2 x 23/28
ex − e−x ex + e−x
3) Ch2 x =
1 + Th 2 x 1 − Th 2 x
4) Sh2 x =
2Thx 1 − Th 2 x
3.2.1. Estudio de la función Thx. 1) Dom(Thx) = 3 ya que su denominador, Chx, no se anula nunca. 2) Corta a los ejes en (0, 0) ya que th0 = 0. 3) Es simétrica impar: th(− x ) =
Sh(− x ) − Shx = = −thx Ch(− x ) Chx
4) Es estrictamente creciente:
(thx)´= Chx·Chx −2 Shx·Shx = Ch x
5) (thx)´´= −
1 > 0 ∀x ∈ 3. Ch 2 x
2Shx ⇒ Cóncava en 33 Ch x Convexa en 3+
6) Tiene asíntotas horizontales en y = ± 1 ya que lim thx = 1 x→ +∞
y
lim thx = −1 .
x →−∞
3.3. Funciones Hiperbólicas Inversas. DEF
La función inversa del Shx es la cosecante hiperbólica, coschx, y se define como Co sec hx =
DEF
La función inversa del Chx es la Secante hiperbólica, Sechx, y se define como Sechx =
DEF
1 Shx
1 Chx
La función inversa de la thx es la cotangente hiperbólica. Cthx =
1 thx
24/28
Ahora vamos a realizar el estudio de esta última función. Para no reiterarnos, omitiremos el estudio de las otras dos. 3.3.1. Estudio de la función Cthx. 1) Dom(Cthx) = 3 - {0}. 2) No corta a los ejes. 3) Simétrica impar Cth(− x ) = −Cthx 4) (Cthx)´=
−1 < 0 ∀x = 0 ⇒ Es estrictamente decreciente. Sh 2 x
5) (Cthx)´´=
Concava 2 Shx·Chx ⇒ 2 Sh x Convexa
(− ∞,0 ) (0,+∞)
No hay punto de inflexión en x = 0 ya que 0 ∉ Dom(Cthx) 6) lim Cthx = 1 ⇒ Asíntota Horizontal positiva en y = 1. x→ +∞
lim Cthx = −1 ⇒ Asíntota Horizontal negativa en y = -1.
x→ −∞
lim Cthx = −∞ ⇒ Asíntota Vertical por la izquierda en x = 0.
x→ o −
lim Cthx = +∞ ⇒ Asíntota Vertical por la derecha en x = 0.
x→ 0 +
3.4. Funciones Hiperbólicas Recíprocas. 3.4.1. La recíproca de la función Shx. La función Shx sabemos que es una biyectiva de 3 en 3, luego admite función recíproca, que también será una biyección de 3 en 3. Se representa por Argshx. La gráfica de Argshx es simétrica de Shx con respecto de la recta y = x. Como podemos comprobar, se trata de una función estrictamente creciente, que pasa por el origen, es simétrica impar, no presenta extremos relativos y tiene un punto de inflexión en (0, 0), siendo convexa en 3- y cóncava en 3+. Veamos como podemos expresar esta función: y = arg shx ⇒ x = Shy =
e y − e− y e2 y − 1 ⇒ 2x = ⇒ 2 ey 25/28
⇒ e 2 y − 2 xe y − 1 = 0 ⇒ ey es solución de la ecuación z 2 − 2 x· z − 1 = 0 ⇒ z = ey =
zx ± 4 x 2 + 4 = x ± x2 + 1 2
y tomamos la raíz cuadrada positiva ya que ey > 0.
(
⇒ e y = x + x 2 + 1 ⇒ y = lu x + x 2 + 1
)
(
)
arg shx = lu x + x 2 + 1 3.4.2. La recíproca de la función Chx.
La función Chx no es biyectiva. Si nos quedamos con la rama correspondiente a valores de x positivos, tenemos que la función Chx define una biyección entre 3+ y [1, + ∞ ). Podemos hablar entonces de su función inversa, que recibe el nombre de y = argchx. Su gráfica es simétrica de la rama correspondiente a x ≥ 0 de Chx respecto de al bisectriz y = x. Para encontrar otra expresión que nos de argchx realizamos un proceso análogo al descrito para argshx, dando
(
)
arg chx = lu x + x 2 − 1 3.4.3. La recíproca de la función thx.
La función y = thx es una biyección de 3 en (-1, 1). Su función recíproca recibe el nombre de argthx y esta definida de (-1, 1) en 3. Como thx =
Shx , vamos a encontrar otra expresión para y = argthx. Chx
Y = arg thx ⇒ x = thy =
(e )
y 2
( )
−1 = x e y
2
e y − e−y e2 y − 1 = ⇒ e y + e − y e2 y + 1
( )
+ x ⇒ (1 − x ) e y
2
= 1 + x ⇒ ey = ±
1+ x 1− x
Nos quedamos con la raíz cuadrada positiva ya que ey > 0. 1+ x x ∈ (− 1,1) y = lu 1 − x
26/28
4. SITUACIONES REALES EN LAS QUE APARECEN. Las funciones circulares son básicas para el estudio de las funciones periódicas, ya que cualquiera de éstas se puede expresar en función de Sen mx y Cos mx. Veamos un conjunto de fenómenos naturales periódicos que los podemos expresar mediante funciones circulares. a) Movimiento Pendular. b) La posición de las agujas de un reloj con relación a un punto origen. c) El Movimiento de subida y bajada del émbolo en un motor de explosión. d) Movimiento de una noria de feria, donde la altura de una persona montada varía a lo largo de una vuelta, y se repite en todas las demás. e) Cálculos de navegación o astronomía. f) Las leyes que rigen el movimiento armónico simple. g) La actividad eléctrica del cerebro. h) La Intensidad de Corriente alterna de un circuito. Las funciones hiperbólicas tienen aplicación en situaciones de tipo técnico. a) La Catenaria es la curva que forma un cable suspendido en el aire y solo sujeto por sus extremos (es Chx). b) Al calcular la longitud de un arco de Catenaria aparece Shx. c) Las recíprocas de las funciones hiperbólicas también nos las encontramos al realizar la integración de funciones donde aparecen expresiones de la forma
27/28
x2 − 1 .
Bibliografía recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté Introducción al Análisis Matemático. Aut. J.M. Ortega. Ed. Labor
28/28
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 24 FUNCIONES DADAS EN FORMA DE TABLA. INTERPOLACIÓN POLINOMICA. INTERPOLACIÓN Y EXTRAPOLACIÓN DE DATOS.
1. Introducción. 1.1. Formas diversas de expresión de Funciones. 2. Interpolación Polinomica. 2.1. Descripción del Problema de Interpolación. 2.2. Interpolación Lineal. 2.3. Interpolación Cuadrática. 2.4. Interpolación General. 2.4.1. Fórmula de Lagrange. 2.4.2. Fórmula de Newton. 2.4.3. Interpolación Basada en Diferencias. 2.4.4. Error del polinomio de Interpolación Newton. 2.4.5. Polinomios de Bernstein. 2.5. Interpolación Inversa. 3. Extrapolación de datos. Bibliografía Recomendada.
1/17
TEMA 24 FUNCIONES DADAS EN FORMA DE TABLA. INTERPOLACIÓN POLINOMICA. INTERPOLACIÓN Y EXTRAPOLACIÓN DE DATOS. 1. INTRODUCCIÓN. Al observar los fenómenos que se producen en la naturaleza podemos darnos cuenta que se pueden elegir dos magnitudes x e y entre las cuales existe una dependencia funcional que expresa el aspecto cuantitativo del fenómeno estudiado. Conocidos algunos pares de valores de la relación, el problema que vamos a tratar de resolver es hallar una curva que contenga dichos puntos y exprese de forma matemática la ley que rige dicha función. La función viene a expresar en términos cuantitativos la dependencia de una de las magnitudes respecto de la otra. Por ejemplo, la temperatura de una localidad es función del tiempo, el precio de un crédito hipotecario es función de los tipos de interés, etc. Lo cierto es que unos cuantos valores de la función no la determinan, a no ser que impongamos alguna condición extra, como podría ser la de pertenecer a una determinada clase. Sin ninguna restricción extra, podemos encontrar multitud de curvas que pasen por unos puntos determinados. Por tanto, para poder resolver el problema de forma completa, debemos fijar de antemano el tipo de función que ha de pasar por los puntos dados, viendo si son suficientes o no para su determinación. La interpolación consiste en la determinación de valores dentro del rango de al variable, a partir de la función calculadora. La extrapolación consiste en evaluar la función de interpolación obtenida en puntos que no estén dentro del rango de los datos. Podemos así comprobar si los resultados obtenidos se aproximan a los esperados. 1.1. Formas diversas de expresión de Funciones. a) Funciones dadas en forma de tabla. En esta forma de expresar una función se disponen los valores del argumento en cierto orden x1 , x2 ,…., xn y de la misma manera se escriben los valores correspondientes de la función y1 , y2 ,…., yn . De este tipo son las tablas de las funciones trigonométricas, las de logaritmos, etc. Tablas que expresan la dependencia funcional que existe entre magnitudes medidas pueden aparecer también como resultado del estudio experimental de ciertos fenómenos. b) Representación gráfica.
2/17
Dado en el plano del sistema de coordenadas rectangulares o cartesianas un conjunto de puntos P, tal que ningún par de puntos caiga sobre una recta paralela al eje y, podemos decir que el conjunto mencionado determina una función y = f(x). Las abscisas de los puntos son los valores del argumento e variable independiente, y los de la función, las ordenadas correspondientes. Se llama gráfica de una función al conjunto de puntos del plano cuyas abscisas son los valores de la variable independiente y las ordenadas, los correspondientes de la función. c) Representación Analítica de las funciones. Se llama expresión analítica a la notación simbólica del conjunto de las operaciones matemáticas conocidas que se han de realizar en cierto orden con los números y letras que designan magnitudes constantes o variables. Si la dependencia funcional y = f(x) es tal que f es una expresión analítica, se dice que la función y de x está dada analíticamente. 2. INTERPOLACIÓN POLINÓMICA. 2.1. Descripción del problema de Interpolación. Gran cantidad de operaciones con funciones exigen un paso al límite, como derivación e integración. Por tanto, sería conveniente conseguir lo que podríamos llamar “aproximación polinomial”, que es sustituir la función por un polinomio. Las operaciones anteriores sobre polinomios son operaciones algebraicas. Además, dada una función continua en un intervalo, es posible encontrar aproximaciones polinomiales tan buenas como se quiera. El problema consiste en, dados n puntos de una función de la cual desconocemos su expresión matemática, hallar otra función real de variable real que tome esos valores. La función obtenida debe permitir calcular el valor correspondiente en un punto intermedio de los que tenemos, de forma que el resultado obtenido se ajuste con el menor error posible al esperado. Y también hemos de poder comprobar si la función se ajusta a los resultados esperados para valores de x fuera del intervalo. Si representamos los puntos (x1 , y1 ),…., (xn , yn ) en un sistema de coordenadas cartesianas, la curva que los une resuelve el problema de la interpolación. Si llamamos y = g(x) a la función que une dichos puntos, tendremos que el valor de g(x) con x∈[x1 , xn ] dependerá de la curva elegida. A veces podemos demostrar que la elección de la curva es la adecuada, pero otras veces sólo contaremos con el conocimiento del fenómeno estudiado que tenga la persona que trata de resolver el problema. Consideremos una cierta función f(x), que puede ser conocida o no, pero de la que tenemos los puntos (x1 , y1 ),….., (xn , yn ). Cualquier función g(x) que pase por esos puntos recibe el nombre de función interpolación. Como lo que tratamos es de sustituir f(x) por g(x), ésta última ha de ser más sencilla que f(x). Es por ello que se suelen elegir las funciones polinómicas, que presentan como ventajas la facilidad de realizar
3/17
operaciones con ellas, son expresiones sencillas, es fácil calcular el error que se comete al sustituir una por otra, etc. El error de interpolación es la diferencia, en valor absoluto, entre el valor de la función dada, f(x), y el que toma la función de interpolación, g(x): E = f (x) − g(x) A partir de ahora vamos a tratar de calcular funciones de interpolación que verifiquen dos condiciones: 1) Que sean lo más sencillas posibles. 2) Que el error cometido sea mínimo. 2.2. Interpolación Lineal. La expresión de una función lineal es f(x) = ax + b Debido a que tenemos dos parámetros, a y b, es necesario dar dos condiciones para determinar completamente la función. Las dos condiciones son dos puntos, A(x1 , y1 ) y B(x2 , y2 ), que pertenecen a la gráfica de la función. Si sustituimos A y B en f(x) tenemos que y1 = ax1 + b y2 = ax 2 + b Para resolver el sistema aplicamos la regla de Cramer: y1 y a= 2 x1 x2
1 1 y1 − y2 = 1 x1 − x2 1
x1 x b= 2 x1 x2
y1 y2 x y − x2 y1 = 1 2 1 x1 − x 2 1
y la solución existe siempre que x1 ≠ x2 , siendo única. Si f(x) es una función cualquiera y [a, b] es un intervalo del dominio de definición de f(x), podemos aproximar la función de manera lineal con p(x) =
f (b ) − f (a ) bf (a ) − af (b ) ·x + b−a b−a
donde ambas funciones coinciden en los extremos del intervalo
4/17
A(a, f(a))
y
B(b, f(b))
Sustituyendo en p(x) la variable x por un valor intermedio entre a y b se obtiene el valor aproximado. 2.3. Interpolación Cuadrática. Una función cuadrática es de la forma p(x) = ax2 + bx + c Dada una función f(x), si queremos aproximarla mediante una función cuadrática, necesitamos conocer tres puntos, ya que hemos de calcular los tres parámetros. Igualmente, si de la función f(x) sólo conocemos tres puntos por los que pasa, podremos aproximarla por un polinomio de grado dos. Sean A(x1 , y1 ), B(x2 , y2 ) y C(x3 , y3 ) los puntos por los que pasa f(x). Vamos a suponer que los tres puntos no estén alineados, ya que en caso contrario, el polinomio más simple sería de primer grado (una recta) y no el de segundo grado. Sustituyendo los puntos en p(x) y aplicando la regla de Cramer para resolver el sistema que se obtiene: ax12 + bx1 + c = y1 ax 22 + bx2 + c = y 2 ax32 + bx3 + c = y 3
a=
y1 y2 y3
x1 1 x2 1 x3 1
x12 x 22 x32
x1 1 x2 1 x3 1
b=
x12 x22 x32
y1 1 y2 1 y3 1
x12 x22 x32
x1 1 x2 1 x3 1
c=
x12 x 22 x32 x12 x22 x32
x1 x2 x3
y1 y2 y3
x1 1 x2 1 x3 1
Y como el denominador es el determinante de Vandermonde, tenemos que x12 x 22 x32
x1 1 x2 1 = ( x3 − x1 )( x3 x2 )(x 2 − x1 ) x3 1
el cual es no nulo ya que los tres puntos son distintos. Por tanto la solución del sistema existe y es única. Si x1 < x2 < x3 tenemos que podemos sustituir la función f(x) en [x1 , x3 ] por p(x), coincidiendo ambas en los tres puntos. 5/17
2.4. Interpolación General. Si la tabla de valores de la función a interpolar tiene n + 1 puntos, (xo , yo ) (x1 y1 )…… (xn yn ), el polinomio resultante de la interpoblación será, como máximo, de grado n. n
p ( x ) = ∑ ai x i el polinomio interpolador. Los coeficientes (ai)0≤i≤n son los
Sea
i= 0
valores que queremos encontrar. Para ello obligamos al polinomio a pasar por los (n + 1) puntos, obteniendo un sistema de n + 1 ecuaciones con n + 1 incógnitas. a o + a1 xo + a 2 xo2 + ....... + a n xon = yo ao + a1 x1 + a 2 x12 + ....... + a n x1n = y1 ............................................... ao + a1 x1 + a 2 xn2 + ...... + a n xnn = y n El determinante de la matriz de coeficientes es el determinante de Vandermonde. 1
xo
xo2 L xon
1 x1 x12 L x1n = ( x1 − xo )( x2 − xo )( x2 − x1 )( x3 − x o )........( xn − xn −1 ) L L L L L 1 xn x n2 L x nn y sabemos que es no nulo si xi ≠ xj para i ≠ j. Aplicando la regla de Cramer, calculamos el valor de los obteniendo así la expresión del polinomio interpolar.
n + 1 coeficientes,
Veamos ahora otros métodos que nos van a permitir calcular el polinomio de interpolación del grado n de una forma más rápida y sencilla. 2.4.1. Fórmula de Lagrange. Se trata de conseguir un polinomio de grado n que se anule en los (n + 1) puntos (xo , yo ), (x1 , y1 ),….., (xn , yn ). Para ello vamos a construir n + 1 polinomios, donde el polinomio PK(x) tome el valor PK(xK ) = yK y se anule en los restantes n puntos, recorriendo K los valores {0,…., n}. n
Definiremos P( x ) = ∑ PK (x ) donde K=0
n
Po ( x ) = λo (x − x1 )( x − x 2 )·.......·( x − xn ) = λo Π
j =0 j ≠0
6/17
n
P1 ( x ) = λ1 ( x − xo )(x − x2 )·........·( x − xn ) = λ1 · Π (x − x j ) j= 0 j≠ 0
y en general n
PK ( x ) = λK Π (x − x j ) j =0 j ≠0
Para calcular los coeficientes de los polinomios PK (x) K∈{0,…., n} apliquemos las condiciones que conocemos n
∀K ∈ {0,..., n} PK ( xK ) = y K ⇒ λK Π (xK − x j ) = y K j= 0 j≠ K
Luego λK =
yK
∀K ∈ {0,...., n}
n
Π (x K − x j ) j =0 j ≠o
Si sustituimos en P(x) tenemos n n n n n (x − x j ) P( x ) = ∑ PK ( x ) = ∑ λK Π (x − x j ) = ∑ y K Π = j = 0 (x − x ) jj =≠0K K =0 K=0 K=0 K j j≠ 0
= yo
( x − x1 )(x − x2 )......(x − x n ) + y ( x − xo )(x − x2 )......(x − x n ) + ( xo − x1 )(x o − x2 ).......( x − xn ) 1 ( x1 − xo )(x1 − x2 )......( x − xn )
+ ....... + y n
(x − x o )( x − x1 ).......( x − xn−1 ) ( xn − xo )(x n − x1 )........( xn − x n−1 )
Es fácil ver que P(xK) = 0 ∀K∈{0,…., n}, siendo P(x) el único polinomio de grado n que pasa por los (n + 1) puntos dados. n
DEF
Los cocientes Π
j =0 j ≠0
(x − x ) j
(x
K
− xj )
reciben el nombre de coeficientes de Lagrange.
OBS Si utilizamos la fórmula de Lagrange para hallar el polinomio de interpolación de grado 1 que pasa por dos puntos, obtenemos el mismo resultado que en 22. Análogamente, al aplicar la fórmula de Lagrange para hallar el polinomio de interpolación de grado 2 que pasa por tres puntos, se obtiene el resultado de 2.3. Ellos es debido a que el polinomio es único.
7/17
Este procedimiento de obtención del polinomio de grado n que pasa por (n + 1) puntos presenta dos inconvenientes: 1) El polinomio no se presenta ordenado según potencias de x. 2) Si después de obtener P(x), añadimos un nuevo punto, para calcular el nuevo polinomio no nos sirve nada del trabajo anterior, siendo necesario rehacer todas las cuentas. DEF
Se define el resto de la interpolación como la función Rn ( x ) = f (x ) − P( x )
siendo P(x) el polinomio de interpolación de f(x) de grado n. Si sustituimos P(x) por su expresión mediante la fórmula de Lagrange tenemos: n n (x − x j ) Rn ( x ) = f (x ) − ∑ y K · Π j = 0 (x − x ) K=0 j j ≠0 K
DEF La magnitud del error cometido viene definido por Rn ( x ) y que sabemos que es cero cuando x = xK ∀K∈{0,…., n}. Podemos fácilmente comprobar, que tal y como esta definido el resto, depende de las propiedades de al función f(x) (la cual generalmente desconoceremos) así como de los nodos de interpolación xK con K∈{1,….., n}. Es por ello que se han construido diferentes formas de representar el error. Veamos ahora la que podemos considerar mas importante. Si f∈C(n+1) ([a, b]) entonces ∃ξ∈(a, b) tal que Rn ( x ) =
w(x ) n +1 ) f (ξ) (n + 1)!
siendo w(x) = (x – xo )(x – x1 ) ·……· (x – xn ) Dem. Si x = xK con K∈{0,…., n} el teorema es cierto, ya que Rn (xK) = 0 y f(xK) = P(xK) Supongamos pues que x ≠ xK Definimos las funciones
8/17
g(x) =
Rn ( x ) w( x )
n
∀x ∈ [a , b ] − ∪ {x K } K =0
h ( y ) = Rn ( y ) − g ( x )·w( y )
∀y ∈ [a , b ]
Entonces tenemos: Si y = xK ⇒ h x · = Rn x · − g ( x )·w x · = 0 ∀K ∈ {0,...., n} K K K Si y = x ≠ xK ⇒ h (x ) = Rn ( x ) − g (x )·w(x ) = 0 ∀K ∈ {0,..., n} Por tanto, la función h(y) posee (n + 2) ceros en [a, b] (x, xo ,…., xn ), y aplicando el teorema de Rolle, h´(y) posee, al menos, (n + 1) ceros en (a, b), h´´ posee al menos n ceros en (a, b) y al final llegamos a que hn+1) posee al menos un cero en (a, b). Llamemos a ese cero ξ. Se verifica h n +1) (ξ ) = 0 h n +1) (ξ ) = f n +1) (ξ ) − g (x )·(n + 1)! Y entonces g(x) =
1 f n +1 ) (ξ) (n + 1)!
Y como g ( x ) =
Rn ( x ) nos queda w( x )
Rn ( x ) = g (x )w( x ) =
w(x ) n +1 ) f (ξ) (n + 1)!
c.qd.
La expresión que hemos obtenido para el error de interpolación es poco práctica, ya que , si habitualmente de f(x) sólo vamos a conocer un conjunto de puntos, no podemos estar en condiciones de saber si es de clase (n + 1), y menos todavía saber el valor de ξ. En caso de conocer, al menos, si la derivada del orden (n + 1) está acotada, podríamos dar una cota superior para el error, Rn (x). 2.4.2. Fórmula de Newton. El objetivo que tenemos sigue siendo el mismo: conseguir un polinomio de grado n que pase por (n + 1) puntos de la función f(x), la cual puede ser desconocida. Sean los (n + 1) puntos de f(x) (xo , yo ), (x1 , y1 ),….., (xn , yn )
9/17
El polinomio de interpolación de Newton es P( x ) = Ao + A1 ( x − xo ) + A2 ( x − xo )( x − x1 ) + ..... + An ( x − xo )(x − x1 )......(x − xn −1 ) y a partir de las condiciones P(xK) = yK
∀K∈{0,…, n}
Hemos de hallar los coeficientes AK. Para ello, sustituimos en el polinomio las condiciones: P(xo ) = yo ⇒ P(xo ) = Ao
Luego Ao = yo
P(x1 ) = y1 ⇒ P(x1 ) = Ao + A1 (x1 + xo ) ⇒ yo + A(x1 – xo ) = y1 ⇒ A1 =
y1 − yo x1 − xo
P(x2 ) = y2 ⇒ P(x2 ) = Ao + A1 (x1 – xo ) + A2 (x2 – xo )(x2 – x1 ) = = yo +
y1 − y o (x − xo ) + A2 ( x2 − xo )(x 2 − x1 ) x1 − xo 2
y2 − y o =
A2 =
y1 − yo ( x − xo ) + A2 ( x2 − xo )( x2 − x1 ) x1 − xo 2
( y 2 − yo )( x1 − xo ) − ( y1 − y o )( x2 − xo ) ( x1 − xo )(x 2 − xo )( x 2 − x1 )
y así sucesivamente obtendríamos el valor de todos los coeficientes AK. Otra forma de hallar los coeficientes sería la siguiente: Escribimos el polinomio de interpolación como:
P( x ) = A o + (x − x o )[ A1 + A 2 ( x − x 1 ) + ..... + A n ( x − x 1 ).....( x − x n − 1 )] = A o + ( x − x o )P1 ( x ) Entonces P( xo ) = Ao ⇒ yo = Ao Y P1 ( x ) =
P (x ) − P( xo ) x − xo
El polinomio P1 (x) no sabemos cual es, ya que los coeficientes A1 ,….., An no los conocemos, pero si sabemos su valor en los puntos x1 ,…., xn 10/17
P1 ( x K ) =
P( xK ) − P( xo ) yK − yo = x K − xo xK − xo
∀k = 1,...., n
De la expresión P( x ) = Ao + ( x − xo )P1 ( x ) resulta P1 ( x ) = A1 + ( x − x1 )[A2 + A3 ( x − x2 ) + .... + An ( x − x2 )....(x − xn −1 )] = A1 + ( x − x1 )P2 ( x ) y P1 ( x1 ) = A1 quedando
P2 ( x ) =
P1 ( x ) − P1 ( x1 ) x − x1
Reiterando el proceso obtenemos que Ao = P( x ) A1 = P1 ( x1 ) A2 = P2 ( x2 ) M An = Pn ( xn ) que determina la expresión denominada Fórmula de Newton. 2.4.3. Interpolación Basada en diferencias. Recordemos el problema que presentaba la fórmula de Lagrange: Al construir el polinomio de grado n que pasa por (n + 1) puntos de y = f(x) si su aproximación no es buena y añadimos un nuevo punto, hemos de rehacer todos los cálculos para obtener el polinomio de grado (n + 1), no sirviendo para nada el trabajo anterior. Por ello es aconsejable conseguir una forma de obtención de P(x) tal que los cálculos previos no tengan que repetirse si añadimos nuevos puntos, si no que únicamente hayan de añadirse unos sumandos más. Después de ver la obtención de los coeficientes en la fórmula de Newton, podemos afirmar que dicho polinomio verifica la condición anterior. Vamos ahora a construir dicho polinomio por pasos, donde cada uno de ellos añadiremos un nuevo punto a los que tengamos. • Construcción de P(x), que pasa por (xo , f(xo )) y (x1 , f(x1 ))
11/17
P1 ( x ) = f (x o ) + A1 ⋅ r1 ( x ) siendo A1 una constante y r1 (x) lineal, ya que P1 (x) es lineal. P1 ( xo ) = f ( xo ) + A1r1 ( xo ) ⇒ r1 ( xo ) = 0 ⇒ r1 ( xo ) = x1 − x o P1 ( xo ) = f (x o ) Es claro que A1 ≠ 0 ya que en caso contrario P1 (x) sería constante, lo que no es cierto. P1 ( x1 ) = f ( xo ) + A1 r1 ( x1 ) f ( x1 ) − f (xo ) ⇒ f ( x1 ) = f ( xo ) + Ai ( x1 − xo ) ⇒ A1 = P1 ( x1 ) = f ( x1 ) x1 − xo Llamaremos a A1 =
f ( x1 ) − f (x o ) = D( f ( xo )) diferencia de f(xo ) x1 − xo
Nada queda P1 ( x ) = f ( xo ) + Df ( x o ) ⋅ ( x − xo ) • Añadimos el punto (x2 , f(x2 )) Ahora, al tener tres puntos, el polinomio ha de ser de 2º grado. Entonces P2 ( xo ) = P1 (x o ) + A2 r2 ( xo ) ⇒ P2 ( xo ) = f ( xo ) f (x o ) = f (x o )À2 r2 ( xo ) ⇒ r2 ( xo ) = 0 ⇒ f (x1 ) = f ( x1 ) + A2 r2 (x1 ) ⇒ r2 ( x1 ) = 0 P2 ( x1 ) = P1 (x1 ) + A2 r2 ( x1 ) ⇒ P2 ( x1 ) = f ( x1 ) ⇒ r2 ( x ) = ( x − x o )( x − x1 ) P2 ( x2 ) = P1 (x 2 ) + A2 r2 ( x2 ) f (x 2 ) − P1 (x 2 ) = ⇒ A2 = P2 ( x2 ) = f ( x2 ) ( x2 − xo )( x2 − x1 ) Llamaremos a la expresión obtenida para A2 como D2 f(xo ). • En general, al añadir el punto (xK, f(xK) el nuevo polinomio PK(x) coincidirá con PK-1 (x) para x = xj j∈{0,….., K – 1} Dicho polinomio ha de satisfacer la relación de recurrencia
12/17
PK ( x ) = PK −1 ( x ) + AK ⋅ rK ( x ) donde AK ≠ 0 y rK (x) es de grado K. Se debe verificar que PK (x j ) = f (x j ) = PK −1 (x j )
∀j ∈ {0,..., K − 1}
K −1
Por tanto rK (x ) = Π (x − x j ) j =0
K −1 P ( x ) = P ( x ) + A ⋅ K −1 K K Π (x K − x j ) ⇒ Y K K j= 0 PK ( xK ) = f (x K )
⇒AK =
f (x K ) − PK −1 (x K ) K −1
Π (x K − x j ) j =0
La expresión para AK recibe el nombre de DK f(xo ). Después de todo el proceso, obtenemos que la expresión para el polinomio de interpolación P(x) de grado n es:
P( x ) = f (x o ) + ( x − xo )Df (x o ) + ( x − xo )D 2 f ( xo ) + ..... + ( x − xo ) ⋅ ...... ⋅ (x − xn −1 )Dn f ( xo ) El cálculo teórico realizado par la obtención de P(x) es bastante farragoso. Se puede simplificar considerablemente si elegimos los puntos equidistantes entre si, llamando h a esa distancia. Entonces x j − x j −1 = h ∀ j : 1,...., n Y x j − xo = j ⋅ h ∀j : 0,..., n Definimos una nueva notación como sigue: Af (xo ) = f ( x1 ) − f ( xo ); Af (x K ) = f ( x K +1 ) − f ( x K )
Af ( x1 ) = f ( x2 ) − f (x1 );
y
en
general
A2 f (xo ) = f ( x2 ) − 2 f ( x1 ) + f ( xo ) = f (x 2 ) − f ( x1 ) − ( f ( x1 ) − f (x o )) = Af ( x1 ) − Af (x o ) A3 f ( xo ) = f ( x3 ) − 3 f ( x2 ) + 3 f ( x1 ) − f ( xo ) = A 2 f ( x1 ) − A2 f ( xo ) Y en general AK f ( xo ) = A K −1 f (x1 ) − A K −1 f (xo )
13/17
Esta notación recibe el nombre de diferencias de primer, segundo, tercer y K-ésimo orden, respectivamente. Con esta nueva notación podemos expresar D K f ( xo ) =
A K f ( xo ) K !h K
La comprobación se haría por inducción. Así, el polinomio de interpolación, obtenido mediante la fórmula de Newton usando esta notación, se escribe como Af ( xo ) A2 f ( xo ) A n f ( xo ) P( x ) = f (x o ) + ( x − xo ) + ( x − xo )(x − x1 ) + ... + ( x − xn −1 ) ⋅ ... ⋅ ( x − x n −1 ) h 2! h 2 n! h n Podemos simplificar la expresión de P(x) mediante el siguiente cambio de variable: x – xo = hz Entonces x − x K = ( x − xo ) − ( xK − xo ) = hz − hz K = h( z − z K ) Y sustituyendo Pn ( z ) = f ( xo ) + ( z − zo )Af ( xo ) +
(z − z o )( z − z1 ) A 2 f ( x ) + ... + ( z − zo )(z − z1 ).....(z − z n−1 ) An f (x ) o o z!
n!
Que se suele escribir como: z z z Pn ( z ) = f ( xo ) + Af (xo ) + A2 f ( xo ) + .... + A n f ( xo ) 1 z n z ( z − z o )( z − z1 ).......(z − z K −1 ) siendo = K! K 2.4.4. Error del polinomio de Interpolación de Newton. El polinomio de interpolación es único, se calcule de la forma que se calcule, por tanto, el error cometido es R( x ) = f ( x ) − P( x ) =
W ( x ) n +1 ) ( x − xo )( x − x1 )......( x − x n ) f n+1) (ξ ) f (ξ) = (n + 1)! (n + 1)!
Si lo expresamos en términos de la variable z =
14/17
x − xo h
R ( x ) = f (x ) − P ( z ) =
z n +1 n +1 ) h n +1 ( z − z o )( z − z1 ).......(z − z n ) n +1 ) f (ξ ) = h · f (ξ) (n + 1)! n + 1
Luego el error puede expresarse como el primer término despreciado del polinomio. 2.4.5. Polinomios de Bernstein. Dada una función continua f(x) en el intervalo [a, b]. ¿Puede ser aproximada mediante un polinomio P(x) con un grado de precisión previa fijado?. O lo que es lo mismo ¿sería posible encontrar un polinomio P(x) tal que la diferencia en valor absoluto entre f(x) y P(x) sea inferior, en todo lo puntos del intervalo [a, b], a cualquier número positivo ε previamente dado?. El teorema que vamos a enunciar nos da una respuesta afirmativa a la pregunta. OBS El polinomio de interpolación de Lagrange no permite responder a la pregunta. En los puntos xo , x1 , x2 ,…, xn los valores del polinomio coinciden con los de la función, pero en el resto de puntos, los valores pueden diferir notablemente. TEOREMA. Teorema de Weierstrass. Si la función f(x) es continua en el intervalo [a, b], entonces para todo ε > 0 existe un polinomio P(x) tal que en cada punto de este intervalo se verifica: f (x ) − P (x ) < ε El matemático soviético S. N. Bernstein a proporcionado el siguiente método para la formulación directa de polinomios aproximadamente iguales a la función continua f(x) en el intervalo dado. Supongamos que f(x) es continua en [0, 1]. Sea la expresión n m Bn ( x ) = ∑ f ⋅ C m ⋅ x m ⋅ (1 − x )n −m n m =0
m m donde f es el valor de la función dada en x = n n n Y Cm son los coeficientes del binomio de Newton C m = m Llamamos a Bn (x) polinomio de Bernstein de grado n.
15/17
Para todo número arbitrariamente pequeño ε > 0, se puede buscar un polinomio de Bernstein (elegir su grado) de manera que para todos los valores x∈[0, 1] se cumple: Bn ( x ) − f ( x ) < ε Si en lugar de tener el intervalo [0, 1] basta realizar el cambio de variable x = a + t ⋅ (b − a ) 2.5. Interpolación Inversa. El problema de interpolación inversa consiste en obtener, a partir del polinomio de interpolación, obtener el valor de la variable independiente a partir de un valor dado de la variable dependiente. Aplicando el teorema de la función inversa, sabemos que x = f −1 ( y ) existe y es dy única si existe y no se anula en un entorno del punto en el que deseamos obtener la dx interpolación inversa. Bajo estas hipótesis, existe un mecanismo de interpolación llamado método de Aitken que se puede aplicar para obtener la solución, simplemente intercambiando x e y. 3. EXTRAPOLACIÓN DE DATOS. Supongamos conocida la función f(x) para un conjunto finito y ordenado de puntos xo , x1 , x2 ,….., xn . Si queremos estimar la función en un punto x tal que se verifica que x ∉ [xo , x n ] estamos ante un problema de extrapolación de datos. La diferencia con la interpolación es que en esta última el valor x para el cual se quiere determinar el valor de la función f está incluido en el intervalo [xo , xn ] mientras que en la extrapolación el valor está fuera. La problemática en cuanto al riesgo en la aproximación del valor y, por tanto, en su validez, es idéntico a la interpolación. Incluso en algunos casos se puede ver acentuado dicho riesgo. Igualmente, todos los métodos vistos para obtener el polinomio de interpolación tienen su aplicación en la extrapolación de datos.
16/17
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté Introducción al Análisis Matemático. Aut. J.M. Ortega. Ed. Labor
17/17
TEMA 25 (Oposiciones de Matemáticas) LÍMITES DE FUNCIONES. CONTINUIDAD Y DISCONTINUIDAD. TEOREMA DE BOLZANO.
1. Introducción. 2. Límites de funciones. 2.1. Límite de una función en un punto. 2.2. Límites laterales. 2.3. Límites Infinitos y Límites en el Infinito. 2.4. Definición de Límite mediante Entornos. 2.5. Propiedades de los Límites. 2.5.1. Acotación. 2.6. Definición de límite mediante sucesiones. 2.7. Criterio de Cauchy. 2.8. Operaciones Aritméticas con Límites. 2.8.1. Límites de una suma. 2.8.2. Límites de un producto. 2.8.3. Límites de un cociente. 2.9. Infinitésimos. 3. Continuidad y Discontinuidad. 3.1. Continuidad de una función en un punto. 3.2. Continuidad Lateral. 3.3. Continuidad en un intervalo. 3.4. Algebra de funciones continuas. 3.5. Composición de funciones Continuas. 3.6. Propiedades y Teoremas fundamentales. 3.7. Discontinuidades. 3.8. Continuidad de la Función Inversa. 3.9. Continuidad Uniforme. 3.10. Asíntotas. Ramas Infinitas. Bibliografía Recomendada.
1/21
TEMA 25 LÍMITES DE FUNCIONES. CONTINUIDAD Y DISCONTINUIDAD. TEOREMA DE BOLZANO. 1. INTRODUCCIÓN. Entre todos los conceptos con los que nos podemos encontrar en el cálculo infinitesimal, el más importante es el de límite. A partir de él podemos definir otros conceptos como son el de continuidad, derivabilidad, integrabilidad, etc. Informalmente, podemos decir que la función f tiende hacia el límite l cerca de a, si se puede conseguir que f(x) esté tan cerca como queramos de l tomando x suficientemente cerca de a, pero siendo distinto en a. Esta primera aproximación al concepto de límite nonos resulta útil debido a su falta de precisión. Por eso, daremos más adelante otra que nos permita utilizarla en las demostraciones de los teoremas. Otro concepto importante es el de continuidad, si bien, tardó en aparecer debido a que cuando comenzó a desarrollarse el cálculo, casi todas las funciones eran continuas. Por tanto, no era necesario definir la continuidad. Poco a poco comenzaron a surgir en Física, Química y otras ramas del saber funciones discontinuas. Una definición de continuidad, expresada solamente a partir de las propiedades de los números reales, fue formulada por primera vez en 1821 por Cauchy. 2. LÍMITES DE FUNCIONES. 2.1. Límite de una función en un punto. Para formalizar la definición de límite vista en la introducción, tenemos que concretar las expresiones “tan cerca como queramos” o “suficientemente cerca”. El concepto de distancia entre números reales nos lo da el valor absoluto. El valor absoluto de la diferencia entre dos números reales nos indica el grado de aproximación entre los mismos. Así pues, podemos definir el límite de una función en un punto como sigue. DEF Sea A⊂3 un intervalo, a∈A y f: A → 3. Diremos que el límite de f(x) cuando x tiende a a es L, y se representa por Lim f ( x) = L , si x→ a
∀ε > 0
∃δ > 0 / 0 < x − a < δ ⇒ f ( x ) − L < ε
OBS Que x tiende a a se traduce en que x se puede hacer tan próximo al nº a como queramos, pero nunca igual.
2/21
OBS Que f ( x ) − L < ε es lo mismo que f (x ) ∈ ( L − ε, L + ε ) y que 0 < x − a < δ es equivalente a que x ∈ (a − δ, a + δ ) y x ≠ a. Ejemplos. 1) Dada la función f(x) = 3x + 5, comprobemos que lim f ( x ) = 8 x →1
∀ε > 0
∃δ > 0/ |3x+5-8|<ε
|3x+5-8|=|3x-3|=3|x-1|<3δ = ε
si |x-1|<δ ⇒
δ=
ε 3
⇒
lim f ( x ) = 8 x →1
2) Dada la función f(x) = E(x) (parte entera de x) comprobemos que en x=2 no tiene límite. Demostración análoga En la definición de límite hemos supuesto que A era un intervalo y que x podía llegar a tomar el valor de a. Podemos dar una definición más general suponiendo que A es un subconjunto, no necesariamente un intervalo, y que a es un punto de acumulación de dicho subconjunto. DEF Sea A⊂3 un subconjunto, a un punto de acumulación de A y f: A → 3 una función. Diremos que el límite de f(x) cuando x tiende a a es L, y se representa por lim f ( x) = L , si x →a
∀ε > 0
∃δ > 0 / 0 < x − a < δ ⇒ f ( x ) − L < ε
OBS Si f(x) está definida en todos los puntos del subconjunto A⊂3 menos en un número finito de ellos, y a es uno de esos puntos, significa que f(a) no existe. Pero eso no implica que lim f ( x) no vaya a existir. x →a
2.2. Límites Laterales. Vamos a suponer que f: A → 3 es una función, con A⊂3 un subconjunto y a∈3 un punto de acumulación de A. DEF Diremos que el límite de f(x) cuando x tiende a a por al izquierda es L, y se representa por lim− f ( x) = L , si x→ a
∀ε > 0
∃δ > 0 / a < x < a + δ ⇒ f ( x ) − L < ε
3/21
PROP Lim f ( x) = L ⇔ Lim− f ( x ) = Lim− f ( x ) = L x→ a
x→ a
x →a
Dem. ⇒
∀ε > 0
⇒
∀ε > 0 ∀ε > 0
∃δ > 0/ |3x-a|<δ
⇒
|f(x)−L|<ε
∃δ > 0 / a < x < a + ä ⇒
f(x)-L < ε ⇒ lim+ f ( x) = L
∃δ > 0 / a − ä < x < a ⇒
f(x)-L < ε ⇒ lim - f ( x) = L
x →a
x →a
lim f ( x) = lim− f ( x) = L
⇒
x →a +
x →a
⇐ Si lim+ f ( x) = L ⇒ ∀ε > 0
∃δ ' > 0 / a < x < a + ä' ⇒
f(x)-L < ε
Si lim− f ( x) = L ⇒ ∀ε > 0
∃ δ" > 0 / a − δ" < x < a ⇒
f(x)-L < ε
x→ a
x→ a
⇒ Si tomamos δ = min{δ ' , δ"} ⇒ ⇒ ∀ε > 0 ∃δ > 0 / x - a < ä ⇒ f(x)-L < ε
⇒
lim f ( x) = L x →a
Ejemplo. Dada la función f(x) = E(x) calcular los límites laterales para z = z. Demostración análoga 2.3. Límites Infinitos y Límites en el Infinito. De nuevo, sea A⊂3 un subconjunto y a∈3 un punto de acumulación de A. Veamos lo límites infinitos. DEF Diremos que el límite de f(x) cuando x tiende a a es + ∞ , y se representa por lim f ( x) = +∞ , si x →a
∀K > 0 ∃δ > 0 / 0 < x − a < δ ⇒ f ( x ) > K A partir de estas dos definiciones y teniendo en cuenta las vistas para límites laterales, podemos mezclarlas obteniendo cuatro nuevas, que serían desglosar cada una de las dos anteriores en sus laterales. Por ejemplo. DEF Diremos que el límite de f(x) cuando x tiende a a por al izquierda es + ∞ , y se representa por lim− f ( x ) = +∞ , si x→ a
4/21
∀K > 0 ∃δ > 0 / a − δ < x < a ⇒ f (x ) > K Análogamente para lim+ f ( x ) = +∞,
lim f ( x ) = −∞
y
x→ a −
x→ a
lim f (x ) = −∞.
x →a +
Ejemplo. 1 = +∞ ( x − 1)2
1) Comprobar que lim
x →1
∀K > 0 ∃δ > 0 / 0 < x − 1 < δ 1 >K (x - 1) 2
⇒
0 < x −1 < +
⇒
2) Comprobar que lim
x→ 0
1 = −∞ x→ 0 x 1 lim+ = +∞ x→ 0 x
1 >K (x - 1) 2
⇒
( x − 1) 2 <
1 K
1 K
δ=+
⇒
⇒ 1 K
( x − 1) < +
⇒
1 K
⇒
1 = +∞ 2 x →1 ( x − 1)
lim
1 no existe x
lim−
⇒
1 x →0 x
∃/ lim
Para definir los límites en el infinito, es necesario que el subconjunto A⊂3 cumpla alguna condición, como es el no estar acotado superiormente o inferiormente, según corresponda. DEF Sea f: A → 3 una función con A⊂3 subconjunto no acotado superiormente. Diremos que el límite de f(x) cuando x tiende a + ∞ es L, si se representa por lim f ( x ) = L x→ +∞
∀ε > 0
∃H > 0 / ∀x > H ⇒ f ( x ) − L < ε
OBS En los límites en el infinito no tiene sentido hablar de límites laterales. Ejemplo. 1) Comprobar que lim
x→ +∞
x +1 =1 x
5/21
∀ε > 0
⇒
∃H > 0 / ∀x > H
⇒
x +1 −1 < ε x
⇒
1 x +1 x + 1− x 1 −1 = = <ε ⇒ x> ⇒ ε x x x
H =
1 ε
⇒
lim
x→ +∞
x +1 =1 x
Una vez vistos los límites infinitos y los límites en el infinito, podemos juntarlos obteniendo límites infinitos en el infinito. Su representación sería: 1) lim f ( x ) = +∞ x→ +∞
2) lim f ( x ) = +∞ x→ −∞
3) lim f ( x ) = −∞ x→ +∞
4) lim f ( x ) = −∞ x→ −∞
Sus definiciones se obtienen a partir de las definiciones de cada uno de ellos. 2.4. Definición de Límite mediante entornos. Vamos a caracterizar los límites mediante entornos. Recordemos las definiciones de entornos 1) E (a,δ ) = {x ∈ 3/ a − δ < x < a + δ} 2) E * (a, δ ) = E (a, δ ) − {a} El primero es el entorno de centro a y radio δ y es equivalente al intervalo (a − δ, a + δ ) , que también se escribe como x − a < δ El segundo es el mismo, pero sin incluir el punto central a. Recibe el nombre de entorno reducido de centro a y radio r. Con estas consideraciones, podemos dar la siguiente definición. DEF Sea A⊂3 un subconjunto, a∈3 un punto de acumulación de A y f: A → 3 una función. Diremos que el límite de f(x) cuando x tiende a a es L, y se representa por lim f ( x ) = L , si x →a
∀ε > 0
∃δ > 0 / ∀x ∈ E * (a , δ ) ∩ A ⇒ f ( x ) ∈ E (L, ε)
Si además, denotamos como E (+ ∞ , r ) = {x ∈ 3 / x > r} 6/21
E (− ∞ , r ) = {x ∈ 3 / x < −r} a las semirectas (r ,+∞ ) y (− ∞ ,−r ) respectivamente, la definición nos sirve también para los límites infinitos, límites en el infinito o ambos. 2.5. Propiedades de los límites. 2.5.1. Acotación. PROP Si lim f ( x ) = L , con L finito, la función f(x) está acotada cuando x tiende a a . x →a
Dem. ∀ε > 0
∃δ > 0 / x − a < δ
⇒ si x ∈ (a − δ, a + δ ) ⇒
⇒
f ( x) − L < ε
⇒
f ( x ) ∈ ( L − ε, L + ε ) ⇒ f(x) está acotada.
La siguiente proposición se conoce comúnmente como Regla del Sándwich. PROP Si tres funciones f(x), g(x) y h(x) están relacionadas entre si por la desigualdad doble f(x) ≤ g(x) ≤ h(x) y si lim f ( x ) = lim h( x ) = L , entonces lim g ( x ) = L. x →a
x →a
x →a
Dem. lim f ( x) = L ⇒ ∀ε > 0 ∃δ ' > 0 / x ∈ (a − δ ' , a + δ ') ⇒ x →a
f ( x ) ∈ ( L − ε, L + ε )
como lim h( x) = L ⇒ ∀ε > 0 ∃δ" > 0 / x ∈ (a − δ", a + δ") ⇒ h ( x ) ∈ ( L − ε, L + ε ) x →a
si tomamos δ = min{δ' , δ"} y como
f ( x ) ≤ g ( x) ≤ h ( x )
⇒
⇒ si x ∈ (a − δ , a + δ ) ⇒ g ( x) ∈ (L − ε, L + ε) ⇒ ⇒ ∀ε > 0 ∃δ > 0 / x − a < δ
⇒
g ( x) − L < ε
⇒
lim g ( x ) = L x →a
PROP Si f(x) no toma valores negativos cuando x tiende a a y existe lim f ( x ) = L x →a
entonces L ≥ 0. Dem. Supongamos que L<0 ⇒ Si tomamos ε =
7/21
L se tiene que: 2
∀ε > 0 ∃δ > 0 / x − a < δ si f (x ) < 0
⇒
f ( x ) ∈ ( L − ε, L + ε ) ⇒
∀x ∈ (a − δ , a + δ ) ⇒ Contradicción ⇒ L ≥ 0
PROP Si dos funciones f y g verifican la desigualdad f(x) ≤ g(x) para valores de x que tienden a a y existen lim f ( x ) y lim g ( x ) entonces lim f ( x ) ≤ lim g ( x ) . x →a
x →a
x →a
x →a
Dem. Análoga 2.6. Definición de límite mediante sucesiones. PROP Sea A⊂3 un subconjunto, a∈3 un punto de acumulación de A y f: A → 3 una función.
{
( )
lim f ( x ) = L ⇔ ∀( xn )n∈ N ⊂ A con lim x n = a ⇒ lim f xn = L x →a
n
n
}
Dem. ⇒
Dada x n con x n ∈ A y lim xn = a , se trata de probar que lim f ( xn ) = L , es x→ +∞
x→ +∞
decir, que dado ε > 0 ∃n0 ∈ – / f ( xn ) − L < ε si n ≥ n0 Para ese ε > 0
∃δ > 0 / f (B( a, δ ) ) ⊂ B( L, ε) pero ⇒ ∃n0 ∈ – / xn ∈ B( a, δ )
si n ≥ n0 en cuyo caso f ( xn ) ∈ B( L, ε) si n ≥ n0 ⇐
Dado ε > 0 se trata de demostrar que ∃δ > 0 tal que f (B( a, δ ) ) ⊂ B( L, ε) Supongamos que ∃/ δ que buscamos que buscamos Para cada δ =
1 no vale, luego ∃x n / x n ∈ (a,1 n ) pero f ( x n ) ∉ B( L, ε) . n
Pero entonces
lim f ( xn ) = a
n→ +∞
⇒
y
lim f ( x n ) ≠ L
n →+∞
f ( xn ) ∉ B( L, ε) ⇒ contradicción
(ya que estamos admitiendo que si x n → a ⇒ f ( x n ) → L ) ⇒ ∃δ > 0 buscado. 2.7. Criterio de Cauchy. PROP Sea A⊂3 un subconjunto a∈3 un punto de acumulación de A y f: A → 3 una función.
8/21
Existe lim f ( x ) ⇔ ∀ε > 0 ∃δ > 0 / x1 , x 2 ∈ E * (a, δ ) ⇒ f ( x1 ) − f ( x2 ) < ε x →a
Dem. Realizar como ejercicio 2.8. Operaciones Aritméticas con Límites. En este punto, y salvo que se diga lo contrario A⊂3 es un subconjunto y a∈3 es un punto de acumulación de A. 2.8.1. Límite de una suma. PROP Sean f: A → 3 y g: A → 3 dos funciones. Si existen lim f ( x ) = L1 y lim g (x ) = L2 y son finitos entonces existe: x →a
x →a
lim ( f ( x ) + g ( x )) = L1 + L2 x →a
Dem. Como ∀ε' > 0 ∃δ ' > 0 / x − a < δ'
⇒
f ( x ) − L1 < ε'
y ∀ε' > 0 ∃δ" > 0 / x − a < δ"
⇒
g ( x ) − L2 < ε'
⇒ si tomamos δ = min{δ' , δ"} entonces: f ( x ) + g ( x ) − L1 − L2 = f ( x) − L1 + g ( x ) − L2 ≤ f ( x) − L1 + g ( x ) − L2 < ε'+ε' = 2ε' = ε ⇒ ∀ε > 0 ∃δ > 0 / ( f ( x) + g ( x) ) − ( L1 + L2 ) < ε si x − a < δ
⇒
⇒ lim ( f ( x ) + g ( x ) ) = L1 + L2 x →a
PROP Sean f, g: A → 3 dos funciones. Si existen lim f ( x ) = L1 y lim g (x ) = L2 . Y x →a
son finitos, entonces existe lim ( f ( x ) − g ( x )) = L1 − L2 . x →a
Dem. Análoga a la anterior. Si alguno de los dos límites fuese infinito tenemos
9/21
x →a
PROP Sean f, g: A → 3 dos funciones. Si existen lim f ( x ) = L1 y lim g ( x ) = +∞ con x →a
x →a
L1 finito, entonces existe lim ( f ( x ) + g ( x )) = +∞ . x →a
Dem. Realizar como ejercicio De forma análoga se podría demostrar que: 1) L1 = + ∞ y L2 finito ⇒ L1 + L2 = + ∞ 2) L1 finito y L2 = - ∞ ⇒ L1 + L2 = - ∞ 3) L1 = - ∞ y L2 finito ⇒ L1 + L2 = + ∞ 4) L1 = + ∞ y L2 = + ∞ ⇒ L1 + L2 = + ∞ 5) L1 = - ∞ y L2 = - ∞ ⇒ L1 + L2 = - ∞ En el caso de que ambos límites sean infinitos y de signo contrario no podemos garantizar la existencia de la suma. Igualmente se haría para la resta. 2.8.2. Límite de un producto. PROP Sean f, g: A → 3 dos funciones. Si existen lim f ( x ) = L1 y lim g (x ) = L2 y son x →a
x →a
finitos. Entonces existe lim ( f ( x ) ⋅ g ( x )) = L1 ·L2 x →a
Dem. Como ∀ε' > 0 ∃δ ' > 0 / x − a < δ'
⇒
f ( x ) ∈ ( L1 − ε' , L1 + ε')
y ∀ε' > 0 ∃δ" > 0 / x − a < δ"
⇒
g ( x) ∈ (L2 − ε' , L2 + ε')
f ( x ) g ( x) − L1 L2 = f ( x ) g ( x) − L1 g ( x) + L1 g ( x ) − L1 L2 = … … = ( f ( x) − L1 ) g ( x) + L1 ( g ( x) − L2 ) ≤ f ( x) − L1 g ( x) + L1 g ( x) − L2 ≤ … … ≤ ε'⋅( L1 + ε') + L1 ε' = ε
si tomamos δ = min{δ' , δ"}
⇒ ∀ε > 0 ∃δ > 0 / f ( x). g ( x ) − L1 L2 < ε si
10/21
x−a <δ.
PROP Sean f, g: A → 3 dos funciones. Si existen lim f ( x ) = L1 ≠ 0 y lim g ( x ) = +∞ y x →a
x →a
L1 finito, entonces existe lim ( f ( x )· g ( x )) = +∞ si L1 > 0 ó lim ( f ( x )· g ( x )) = −∞ si L1 > 0 x →a
x →a
Dem. Análoga. Análogamente se podría demostrar el resto de combinaciones para L1 y L2 menos las siguientes; que son indeterminadas: 1) L1 = 0 y L2 = + ∞ 2) L1 = 0 y L1 = - ∞ 3) L1 = + ∞ y L2 = 0 4) L1 = - ∞ y L2 = 0 OBS Si a = 0 hay que usar límites laterales. 2.8.3. Límite de un cociente. PROP Sea g: A → 3 una función. Si existe lim g (x ) = L y es no nulo, entonces existe x →a
lim
x →a
1 1 = g(x) L Dem. Realizar como ejercicio.
PROP Sean f, g: A → 3 dos funciones. Si existe lim f ( x ) = L1 y lim g (x ) = L2 con x →a
L2 ≠ 0 entonces existe lim
x →a
x →a
f ( x ) L1 = g (x ) L2
Dem. Realizar como ejercicio. Las únicas indeterminaciones que nos encontramos es que ambos límites sean nulos o ambos sean infinitos (independientemente del signo). OBS Si a = 0 hay que usar límites laterales. 2.9. Infinitésimos. DEF
Llamaremos a la función f(x) infinitésimo cuando x tiende a a si lim f ( x ) = 0 . x →a
11/21
PROP la suma algebraica de un número de infinitésimos es un infinitésimo. Cuando x tiende a a . Dem. Utilizando las propiedades anteriores PROP El producto de un infinitésimo por una función acotada es un infinitésimo cuando x tiende a a . Dem. Utilizando las propiedades anteriores COROLARIO a a.
El producto de dos infinitésimos es otro infinitésimo cuando x tiende
PROP Si I(x) es un infinitésimo cuando x tiende a a , entonces lim
x →a
1 =∞ I (x )
Dem. Inmediata. PROP Si I(x) es un infinitésimo cuando x tiende a a y f: A → 3 es otra función con I ( x) lim f ( x ) = L con L finito y no nulo, entonces es un infinitésimo cuando x tiende x →a f ( x) a a. Dem. Inmediata 3. CONTINUIDAD Y DISCONTINUIDAD. 3.1. Continuidad de una función en un punto. De forma intuitiva, podemos definir el concepto de continuidad de una función en un punto si al representarse la gráfica, en un entorno del punto no se levanta el bolígrafo de la hoja. Es decir, diremos que f(x) es continua en x 0 a si para todo punto próximo a x = a, el valor de la función es próximo a f(a). Veamos ahora una definición más forma. DEF Sea A⊂3 un subconjunto y a∈3 un punto de acumulación de A. Sea f: A → 3 una función. Diremos que f(x) es continua en x = a si 1) ∃f (a )
12/21
2) ∃ lim f ( x ) x →a
3) lim f ( x ) = f (a ) x →a
También es posible dar la definición basándose en la de límite. DEF Sea A⊂3 un subconjunto y a∈3 un punto de acumulación de A. Sea f: A → 3 una función. Diremos que f(x) es continua en x = a si ∀ε > 0
∃ δ > 0 / x − a < δ ⇒ f ( x ) − f (a ) < ε
Y al igual que hicimos con la definición de límite, podemos dar la definición continuidad en términos de entornos. Esta definición sirve cuando la función no solo es real de variable real. DEF Sea A⊂3 un subconjunto y a∈3 un punto de acumulación de A. Sea f: A → 3 una función. Diremos que f(x) es continua si x = a si ∀ε > 0 ∃δ > 0 / ∀x ∈ A ∩ E (a, δ ) ⇒ f ( x ) ∈ E ( f (a ), ε ) 3.2. Continuidad Lateral. Supondremos A⊂3 un subconjunto, a∈3 un punto de acumulación de A y f: A →3 una función. DEF
Diremos que f(x) es continua por la derecha en x = a si
∀ε > 0 DEF
∃ δ > 0 / a ≤ x < a + δ ⇒ f ( x ) − f (a ) < ε
Diremos que f(x) es continua por la izquierda en x = a si
∀ε > 0
∃ δ > 0 / a − δ < x ≤ a ⇒ f ( x ) − f (a ) < ε
OBS Podemos observar que la definición de continuidad lateral se basa en la de límite lateral. 3.3. Continuidad en un Intervalo. DEF Diremos que f: (a, b) → 3 es continua en (a, b) ⊂3 si es continua en todo punto del intervalo. DEF Diremos que f: [a, b] → 3 es continua en [a, b] ⊂ 3 si es continua en todo punto x∈(a, b) y además es continua por la derecha en x = a y continua por la izquierda en x = b.
13/21
3.4. Algebra de funciones Continuas. PROP Sean f y g dos funciones continuas en x = a∈3. Entonces: 1) ( f ± g ) es continua en x = a. 2) f · g es continua en x = a. 3) Si g(a) ≠ 0 ⇒
f es continua en x = a. g
Dem. La demostración es inmediata teniendo en cuenta que el límite de una suma, diferencia, producto o cociente es la suma, diferencia, producto o cociente de los límites. Sólo hay que especificar que el cociente de dos funciones continuas será otra función continua, exceptuando los puntos en los que el denominador sea nulo. OBS Sabiendo que las funciones constantes son continuas y que f(x) = x también es continua, podemos demostrar que todo polinomio es una función continua. Es más, si llamamos función racional a r(x) obtenida como cociente de dos polinomios p(x) y q(x), estará definida en todo x∈3 tal que q(x) ≠ 0. Entonces r(x) será continua en todo su dominio de definición. Sea A⊂3 un subconjunto. Sabemos que f sería continua en A si lo es en todos sus puntos. Llamamos C (A) al conjunto formado por todas las funciones continuas en A. (C (A), +, ·) tiene estructura de Anillo conmutativo con unidad, con la suma y producto de funciones visto. Su demostración es inmediata. También podemos indicar que (C (A), +, ·3) es un 3-espacio vectorial, siendo ·3 el producto de un número real por una función. Como conclusión C (A) es un álgebra. 3.5. Composición de funciones continuas. PROP Sean A, B, C⊂3 subconjuntos, f: A → B y g: B → C funciones a∈A un punto que verifica que f es continua en x = a y que g es continua en x = f(a)∈B. Entonces la función f o g : A → C es continua en x = a. Dem. Inmediata.
14/21
3.6. Propiedades y Teoremas Fundamentales. Sea f(x) una función continua en x = a y f(a) ≠ 0. Entonces existe δ >0 tal que x − a < δ ⇒ f ( x )· f (a ) > 0 . Dem. Supongamos f (a ) > 0 (análogo si f (a ) < 0 ) ⇒ sea ε = ⇒ Como f(x) es continua en x=a para ε =
f ( a) >0 2
⇒ f ( x ) ∈ ( f ( a ) − ε, f ( a ) + ε) ⇒ f ( x ) > f ( a ) − ε =
f (a ) ⇒ 2
∃δ > 0 / x − a < δ f (a ) ⇒ f ( x ) f (a ) > 0 2
COROLARIO Si f es continua en x = a y toma valores de signo contrario en todo entorno de a, entonces f(a) = 0. Dem. Análoga TEOREMA. Teorema de Acotación. 1) Sea f(x) una función continua en x = a. Entonces f(x) está acotada en un entorno de a. 2) Toda función f(x) continua en un intervalo cerrado [a, b] es acotada. Dem. 1) Como f es continua en x=a ⇒ ∀ε > 0 ∃δ > 0 / x − a < δ ⇒ ⇒
f ( x ) − f ( a) < ε ⇒
⇒
f (x ) está acotado
f ( x ) ∈ ( f ( a ) − ε, f ( a ) + ε) ⇒ ∀x ∈ (a − δ, a + δ )
2) Análoga. TEOREMA. Teorema de Bolzano. Si f(x) es continua en [a, b] y f(a) · f(b) < 0 entonces existe al menos un punto α∈(a, b) tal que f(α) = 0. Dem. Denotemos el intervalo [a,b] por I0 y lo dividimos en dos intervalos de igual longitud. Si en el punto medio de I0 (a+b)/2=α 0 la función vale cero ⇒ FIN
15/21
Si f(α0 )≠0 ⇒ designamos por I1 al intervalo en el que la función toma en sus extremos valores de signos opuestos. Hacemos lo mismo que con I0 ; si en el punto medio de I1 (3ª+b)/4=α 1 la función vale cero ⇒ FIN Si f(α1 )≠0
⇒
construimos I2 …….
Repitiendo el procedimiento en el supuesto de que f no se anule en el punto central tenemos dos posibilidades: a) O bien en un número finito de pasos habremos encontrado un punto donde f se anula y entonces hemos acabado. b) O bien, tendremos una sucesión de intervalos cerradosde la forma I0 >I1 >I2 >…… y f toma valores de signo opuesto en los extremos de cada In . Si tomamos un punto x n de cada In obtendremos una sucesión de Cauchy que tendrá un límite: llamémosle L tal que L ∈ I n ∀ n ∈ – ( L = ∩ I n por el teorema de encaje n∈N
de Cantor) Veamos si f(L)=0 - Supongamos f(L)>0 ⇒ en todo entorno ( L − ε, L + ε ) la función tomaría valores positivos, contradicción (porque para n suficientemente grande I n ⊂ (L − ε, L + ε ) y f toma valores de signo opuesto en los extremos de In ). - Supongamos f(L)<0 ⇒ en todo entorno ( L − ε, L + ε ) la función tomaría valores negativos, contradicción (porque para n’ suficientemente grande I n ' ⊂ (L − ε, L + ε ) y f toma valores de signo opuesto en los extremos de In’). ⇒
f(L)=0
TEOREMA. Teorema de Weierstrass. Si f(x) es continua en [a, b], entonces existe α 1 , α2 ∈[a, b] tales que f(α 1 ) = Sup f(x) y f(α 2 ) = Inf f(x). Es decir, el conjunto {f(x) / x∈[a, b]} tiene máximo y mínimo. Dem. i) La función f es acotada, lo que significa que f([a,b])=Im f es un conjunto de 3. Supongamos que f([a,b]) no fuera acotado ⇒
16/21
∃x1 con f ( x1 ) > 1 ∃x2 con f ( x2 ) > 2 .......... .......... ∃xn con f ( x n ) > n
∃( xn ) n ⊂ [a, b ] con
f ( x n ) > n para cada n ∈ –
Como (xn )n es acotada posee una subsucesión convergente
⇒ (xnk )k →α
f continua ⇒ f(x nk)k → f(α) pero entonces f(x nk)k es acotada. Tenemos que
∃M / f ( xnk ) ≤ M
ii) f ([a , b ]) ⊆ 3 acotada
pero nk < f ( x nk ) ≤ M
Contradicción
⇒ ∃ sup{ f ( x); x ∈ [a, b]} =: β
∃xn ∈ [a, b] con β − 1 n < f ( xn ) ≤ β
⇒
lim f ( xn ) = β
n→ +∞
( xn ) n es acotada ⇒ existe una subsucesión convergente a un punto α1 ∈ [a, b ] ( xnk ) → α1 ∈ [a, b ] como f es continua ⇒ como el límite es único
f ( x nk ) → f (α1 )
f (α1 ) = β
α1 f ( x ) ≤ β = f (α1 ) ⇒ f alcanza un máximo absoluto en α1 . Razonando análogamente con el ínfimo de f[a,b], se prueba que: ∃α1 ∈ [a, b]
tal que
f (α1 ) = inf { f ( x) / x ∈ [a, b]}
TEOREMA. Teorema de los valores Intermedios. Si f(x) es una función continua en [a, b] y K∈3 un número comprendido entre f(a) y f(b). Entonces existe al menos un número z∈[a, b] tal que f(z) = K. Dem. Definimos g ( x) = f ( x) − K
que es continua.
g ( a ) = f (a ) − K < 0 ⇒ la función se anula en algún punto (Bolzano) g ( b) = f (b) − K > 0 ∃z ∈ [a , b ] / g ( z ) = 0 g ( z) = f (z) − K = 0
17/21
⇒
f (z) = K
3.7. Discontinuidades. Sea f: A → 3 una función y a∈A. DEF
Diremos que f presenta una discontinuidad evitable en x = a si existe lim f ( x ) y x →a
no existe f(a). OBS Recibe el nombre de discontinuidad evitable ya que se podría evitar si definimos f (a ) = lim f ( x ) . x →a
DEF Diremos que f presenta una discontinuidad de salto finito en x = a si existen lim− f ( x ) y lim+ f ( x ) y son finitos pero distintos. x→ a
x→ a
DEF Diremos que f presenta una discontinuidad evitable en x = a si existen f(a) y lim f ( x ) y son distintos. x →a
DEF Diremos que f presenta una discontinuidad inevitable de salto finito si lim− f ( x) ≠ lim+ f ( x ) y su diferencia es finita. x→ a
x →a
DEF Diremos que f presenta una discontinuidad inevitable de salto infinito en x = a si alguno de los límites laterales no existe o es infinito. 3.8. Continuidad de la Función Inversa. Recordatorio Sea f(x) una función continua y estrictamente creciente en el intervalo [a,b]. Sabemos que si x∈[a,b] entonces f(x) toma cada valor “y” del intervalo [f(a),f(b)] por lo menos una vez (teorema de los valores intermedios] y solo una vez (por ser estrictamente creciente). Si f es biyectiva entre [a,b] y [f(a),f(b)], entonces f-1 también lo es. A f-1 se le llama función inversa. PROP Si f: [a, b] →3 es continua y estrictamente creciente, entonces f es biyectiva entre [a, b] y [f(a), f(b)]. Dem. f es continua en [a, b], aplicando el teorema de Weierstrass, f alcanza un máximo M, un mínimo m y todos los valores comprendidos entre ambos ⇒ f([a, b]) = [m, M]. Por ser f estrictamente creciente tenemos que f(a) = m
y
f(b) = M
Entonces ∀ x∈[a, b] ∃ • y ∈[f(a), f(b)] / f(x) = y PROP Si una función y = f(x) es estrictamente creciente (decreciente) y continua en [a, b], entonces f-1(y) también es estrictamente creciente y continua en [f(a), f(b)].
18/21
Dem. • f-1 es estrictamente creciente. Supongamos que f es estrictamente creciente. Entonces y´ < y´´ con y´, y´´∈Dom f-1. Entonces ∃ x´, x´´∈Dom f tal que f(x´) = y´ y f(x´´) = y´´ Como y´< y´´ y f es estrictamente creciente tenemos que x´ < x´´, ya que lo contrario sería una contradicción. Entonces f-1 es estrictamente creciente. • f-1 es continua. Sea yo ∈(f(a), f(b) y ε > 0. Sea f-1 (yo ) = xo f(xo - ε) = y´ f(xo + ε) = y´´ Entonces f-1 (y´) < xo < f-1 (y´´) ⇒ xo - ε < f-1 (y) < xo + ε ⇒ ⇒ f-1 (yo ) - ε < f-1 (y) < f-1 (yo ) + ε Sea δ = min {yo – y´, y´´ - yo } Entonces, siempre que y − yo < δ ⇒ f −1 ( y ) − f −1 ( y o ) < ε 3.9. Continuidad Uniforme. DEF
Sea f:3→ 3 una función real de variable real.
Se dice que f(x) es uniformemente continua si: ∀ε > 0 ∃δ > 0 / x − y < δ
⇒
f ( x ) − f ( y) < ε
NOTA Toda función uniformemente continua es continua. Pero el recíproco no es cierto. Teorema. Sea f:[a,b]→ 3 una función continua en el compacto [a,b] ⇒ f(x) es uniformemente continua en [a,b].
19/21
3.10.
Asíntotas. Ramas Infinitas.
El conjunto {(x, f(x) / x∈Dom f} recibe el nombre de gráfica de f y se denota por Graf (f). DEF Diremos que un punto se aleja infinitamente sobre una curva cuando su abscisa o su ordenada o ambas coordenadas crecen infinitamente. Podemos afirmar que el punto recorre una rama infinita. DEF Si al recorrer un punto P una rama infinita, la recta OP tiende a una posición límite, entonces esa recta límite y sus paralelas definen una dirección asíntota. DEF Llamaremos a la recta r asíntota de la curva Graf (f) si su dirección es una dirección asíntota de la curva y la distancia de un punto P a r tiende a Cero cuando P se aleja infinitamente. DEF Llamaremos asíntota horizontal de f(x) a la recta y=K que verifica una de las dos condiciones siguientes: 1) lim f ( x ) = K x→ +∞
2) lim f ( x ) = K x→ −∞
DEF Llamamos asíntota vertical de f(x) a la recta x=a si se verifica alguna de las condiciones siguientes: 1) lim− f ( x ) = −∞
2) lim+ f ( x ) = −∞
3) lim− f ( x ) = +∞
4) lim+ f ( x ) = +∞
x→ a
x→ a
x→ a
x→ a
DEF Dada una función f(x) tal que en el infinito tiene límite infinito, diremos que presenta una asíntota de ecuación y=mx+n si verifica una de las dos condiciones siguientes. 1) lim
f (x) =m≠0 x
y
2) lim
f (x) =m≠0 x
y
x→ +∞
x→ −∞
lim ( f ( x ) − mx) = n
x→ +∞
lim ( f ( x ) − mx) = n
x→ −∞
20/21
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté
21/21
TEMA 26 (Oposiciones de Matemáticas) DERIVADA DE UNA FUNCIÓN EN UN PUNTO. FUNCIÓN DERIVADA. DERIVADAS SUCESIVAS. APLICACIONES.
1. Introducción. 2. Derivada de una función en un punto. 2.1 El problema de la tangente a una curva. 2.2 Definición de derivada de una función en un punto. 2.3 Derivadas laterales de una función en un punto. 2.4 Álgebra de las funciones derivables en un punto. 2.5 Regla de la cadena. 2.6 Derivada en un punto de la función inversa. 2.7 Propiedades locales de una función derivable en un punto. 3. Función derivada. 3.1 Definición de función derivada y derivadas sucesivas. 3.2 Álgebra de las funciones derivables. 3.3 Regla de la cadena. 3.4 Derivada de la función inversa. 3.5 Propiedades de las funciones derivables en un intervalo cerrado. 4. Aplicaciones. 4.1 Crecimiento y decrecimiento de funciones. 4.2 Concavidad y convexidad de funciones. 4.3 Cálculo de límites: regla de L´Hôpital. Bibliografía Básica.
1/20
TEMA 26 DERIVADA DE UNA FUNCIÓN EN UN PUNTO. FUNCIÓN DERIVADA. DERIVADAS SUCESIVAS. APLICACIONES. 1. INTRODUCCIÓN. El cálculo diferencial trata de la noción de derivada. Veamos de qué se trata. Toda función y=f(x) puede ser representada gráficamente mediante una curva. El problema de obtener la recta tangente a dicha curva en un punto originó el cálculo diferencial. El concepto de derivada no se llegó a formular hasta comienzos del siglo XVII. Fue Fermat, cuando trataba de determinar los máximos y mínimos de algunas funciones. Observó que en los puntos donde se localiza un máximo o un mínimo la tangente a la curva tiene pendiente nula, es decir, es una recta horizontal. Así pues, surgió el problema de determinar la pendiente de la recta tangente a cualquier punto de la curva. El concepto de derivada superó el problema que había dado origen ya que también sirve para estudiar la variación de una función. Por derivación entenderemos el proceso a seguir para hallar la derivada de una función. Dicho proceso no siempre partirá de la definición de derivada en un punto, aunque a veces sería la única forma. 2. DERIVADA DE UNA FUNCIÓN EN UN PUNTO. 2.1. El problema de la tangente a una curva. Para poder obtener la recta tangente a una curva en un punto primero hemos de definir que se entiende por recta tangente. En época de los griegos se entendía por "tangente a un círculo" como "la recta que tiene un punto en común con el círculo y el resto fuera de él". Pero esta definición, aunque aproxima, no es del todo válida, ya que una recta perpendicular a y=x verifica la definición y no es tangente. Por tanto, necesitamos definir la recta tangente de forma precisa. Lo haremos utilizando rectas secantes y la noción de límite. Sea y=f(x) con f:A→R continua una curva y a∈Domf(x) un punto de la misma. Sea x∈Domf(x) otro punto cualquiera. Para no confundirnos, llamaremos X e Y a las variables. La ecuación de la recta entre (a,f(a)) y (x,f(x)) es X −a Y − f (a ) f ( x ) − f (a ) = ⇒ Y − f (a ) = ( X − a) x−a f ( x ) − f (a ) x−a
2/20
La última ecuación es la ecuación de la recta en forma punto-pendiente. La recta obtenida es secante a la curva, ya que la corta en dos puntos. f ( x) − f ( a) =m x−a tenemos que m es la pendiente de la recta tangente a f(x) en x=a siendo su expresión DEF Si existe lim x →a
Y − f ( a) = m( X − a)
2.2. Definición de derivada de una función en un punto. Consideremo s que f:A→R es una función continua siendo A⊂R un intervalo abierto. DEF Llamaremos derivada de f(x) en el punto x=a y se denotará por f´(a), al límite, si existe y es finito f ( a + h) − f ( a) f´(a) = lim x → a h Según la interpretación geométrica que se ha visto en el punto anterior, podemos afirmar que el número al cual hemos llamado derivada de f(x) en x=a no es más que la pendiente de la recta tangente a f(x) en x=a. ∆f siendo ∆x ∆f = f ( x ) − f ( a) y ∆x = x − a
DEF Llamamos cociente incremental a
Con esta última definición podemos escribir: f´(a)=lim∆x→0 ∆f/∆x PROP Si f(x) es derivable en x=a ⇒f(x) es continua en x=a. Dem Sabemos que ∃f´(a)= lim x →a = ⇒
f ( x) − f ( a) f (x ) − f (a ) ⇒ f ´(a) ≅ ⇒ x−a x−a
f ( x) − f ( a) = f ´(a ) + O( x) , siendo O(x) una función que verifica x−a Entonces f(x) = f(a)+(x-a)(f´(a)+O(x)). Si tomamos límites cuando x tiene a x=a, lim x →a f ( x ) = lim x → a ( f ( a) + ( x − a)( f ´(a ) + O( x) ) = f (a ) Por tanto f(x) es continua en x=a.
3/20
limx→aO(x)=0.
2.3. Derivadas laterales de una función en un punto. Como la definición de derivada está expresada a partir de un límite, si utilizamos límites laterales obtendremos las derivadas laterales. DEF Llamamos derivada de f por la derecha en x=a, y se denota por f´(a+), a f ( x) − f ( a) f ( a + h) − f ( a) f ´( a + ) = lim x → a + = lim h →0 + x−a h DEF Llamamos derivada de f por la izquierda en x=a y se denota por f´(a-), a f ´( a − ) = lim x →a
f ( x) − f ( a) f ( a + h) − f ( a) = lim h →0 − x−a h
PROP f es derivable en x=a ⇔existen las derivadas laterales y son iguales. Veamos ahora cuando una función no presenta derivada en un punto. Tenemos dos situaciones: 1) Por la suposición vista en el apartado anterior, si una función es derivable en un punto entonces es continua en ese punto. Si negamos esta proposición tenemos que una función que no sea continua es un punto no es derivable en él. 2) Sea f(x) una función que, siendo continua en x=a presenta un pico. Por ejemplo f(x)=|x| en x=0. Podemos comprobar que hay infinitas posibilidades para la recta tangente. Al no ser única, se conviene en decir que no existe. A nivel analítico, tenemos que las derivadas laterales existen pero son diferentes, por lo que no existe la derivada de f(x) en x=a. 2.4. Álgebra de las funciones derivables en un punto. PROP Sean f,g:A→R dos funciones derivables en a∈A. Entonces también son derivables en x=a: 1) fg siendo (f+g)´(a) = f´(a)+f´(a) 2) f-g siendo (f-g)´(a) = f´(a)-f´(a) 3) f·g siendo (f·g)´(a) = f´(a)·g(a)+f(a)g´(a) 4) Si g(a)≠0, f/g siendo (f/g)´(a) =
f ´(a)· g ( a ) − f ( a )·g´(a ) g (a ) 2
5) ∀λ∈R λf siendo (λf)´(a) = λ·f´(a) Dem 1)(f+g)´=
4/20
=limh→0 ( f + g )( a + h ) − ( f + g )( a ) = lim h → 0 f ( a + h) + g (a + h) − f ( a) − g ( a) = h h f (a + h) − f ( a) g (a + h) − g ( a) = lim h → 0 = + = f ´( a) + g´(a) h h 2) Análogo. 3) (f·g)(a) = = lim h →0
( f ·g )( a + h ) − ( f · g )( a ) f ( a + h )·g (a + h) − f ( a)· g ( a ) = lim h →0 = h h
= lim h →0
f ( a + h ) g ( a + h) − f ( a) g ( a + h) + f ( a) g ( a + h ) − f ( a ) g ( a ) = h
= lim h →0
[ f ( a + h) − f ( a) g ( a + h) [ g ( a + h ) − g ( a) ] f ( a ) = + lim h → 0 h h
=f´(a)·g(a) + f(a)·g´(a). 4) f:(a,b)→R no se anula, es derivable.
lim h →0
1 1 1 1 ( a + h) − ( a) − f f f ( a + h ) f ( a) f ( a) − f ( a + h ) = lim h →0 = lim h →0 = h h hf ( a)· f (a + h)
= lim h →0
= f ´( a)·
f (a + h ) − f (a ) 1 · = { f es continua} = h hf ( a )· f ( a + h ) 1 −1 = 2 f (a )· f ·lim h → 0 (a + h) f ( a)
′ ′ f ( x) 1 1 − g (x ) f ´( x ) g ( x) − f ( x) g´( x) = f ( x )· = f ( x)· + f ( x )· = 2 g (x ) g (x ) ( g ( x )) ( g ( x )) 2 g (x ) 5) Análogo. Conclusión: El conjunto formado por las funciones derivables en x=a con las operaciones de suma y producto de funciones y producto por un escalar tiene estructura de álgebra.
5/20
2.5. Regla de la cadena. PROP Sea f:A→R una función derivable en a∈R y f:B→R con Imf⊂B una función derivable en f(x0 )∈Y. Entonces g°f:A→R es una función derivable en x0 ∈A, siendo (g° f)´(x0 ) = g´(f(x0 ))·f´(x0 ). TEOREMA DE LA FUNCIÓN COMPUESTA. Sea f:(a,b)→R derivable en x0 ∈(a,b) y sea g:(c,d)→R tal que Imf⊂(c,d) y g derivable en f(x0 ). Entonces: - (g°f): (a,b)→R derivable en x0 . - (g°f)´=f°g = g´(f(x0 ))·f´( x0 ) f (a,b) → (c,d) x0 → y0 = f(x0 ) g°f R Dem *Como f es derivable en x0 . f(x0 +h) = f(x0 )+h · f(x0 ) +hα(h) con limh→0 α(h) = 0. *Como g es derivable en y0 g(y0 +h) = g(y0 )+k · g(y0 ) +kα(k) con limk→0β(k) = 0. Para ver que g°f es derivable en x0 tenemos que ver que se puede expresar como: (g°f)(x0 +h) = (g°f)(x0 ) + h(g°f)´(x0 )+hσ(h) (g°f)(x0 +h) = g(f(x0 +h)) = g(y0 +h·f(x0 )+hα(h)) = como g es derivable en a = = g(y0 )+ g´(y0 )·[hf´(x0 )+hα(h)] + [hf´(x0 )+hα(h)]·β(hf´(x0 )+hα(h)) = = g(y0 )+h·g´(y0 )·f (x0 ) +h [g´(y0 )α(h)+f´(x0 )+α(h) β (h f´(x0 )+hα(h))]. [g´(y0 )α(h)+f´(x0 )+α(h) β (h f´(x0 )+hα(h))]=M, y tenemos entonces que si M tiene como límite: limh→0 [g´(y0 )α(h)+f´(x0 )+α(h) β (h f´(x0 )+hα(h))]=g(y0 )·0+ (f´(x0 )+0)·0=0
6/20
Luego M tiende a =, y entonces (g°f) es derivable en x0 y (g°f)´(x0 ) = g´(f(x0 ))·f´(x0 ). Ejemplo: f(x) = xsen1/x para x distinto de cero. f´(x) = (xsen 1/x)´= sen 1/x + x(sen 1/x)´ = sen 1/x +xcos 1/x (-1/x2 ) = = sen 1/x +xcos 1/x (-1/x2 ) = sen 1/xs -1/xcos 1/x. x → 1/x sen
derivada de la función compuesta
sen 1/x 2.6. Derivada en un punto de la función inversa. PROP Sea f:A→B una función biyectiva, con A,B⊂R intervalos abiertos, y0 ∈B un punto y f derivable en f-1(y0 ) con f´(f-1(y0 ))≠0. Entonces f-1 es derivable en b siendo: ( f −1 )( y 0 ) =
1 −1
f ´( f ( y 0 ))
Dem f(x)·f(y) = f´(c)(x·y) si f´(z)>0, ∀z∈I y si x
( f )( y0 ) = lim y → y 0
= lim
y→ y0
f −1 ( y ) − f − 1 ( y 0 ) = lim y − y0
y → y0
1 = y − y0 f −1 ( y ) − f −1 ( y 0 )
1 1 1 = lim x → x0 = = f (x ) − f (x 0 ) f (x ) − f (x 0 ) f ( x) − f ( x0 ) lim y → y0 x − x0 x − x0 x − x0
7/20
=
1 1 = −1 −1 f ´( x0 ) f ( f ( z ))
Si f´(z)<0 ∀z∈I f sería estrictamente decreciente y continua: f-1 : J→I
J = f(I) todo igual
No existen puntos en los que f´(x1 )>0 y f´(x2 )<0, pues en caso contrario aplicando la proposición de los valores intermedios de la derivada debería existir un punto en que f´(c) = 0, lo que no ocurre. 2.7. Propiedades locales de una función derivable en un punto DEF Una función f(x) es creciente en A⊆R si ∀x1 ,x2 ∈A con x1
f (c + h) − f ( c) f (c + h) − f ( c) > 0 ⇒ ∃ε > 0 / si | h |< 0 ,que h h
corresponde con la definición de estrictamente creciente en c. PROP Si f(x) es derivable en x=c y f´(c)<0 entonces f(x) es decreciente en un entorno de c. Dem Análoga a la anterior. OBS El recíproco de ambas posiciones es falso. Una función que sea creciente en un entorno de un punto no tiene porque tener derivada positiva, ya que ni siquiera podría ser derivable. Por ejemplo:
a
8/20
DEF La función f:A→R presenta en a∈A un máximo relativo si existe δ>0 tal que f(x)≤f(a) ∀x∈E(a,δ)∩A. DEF La función f:A→R presenta en a∈A un máximo relativo si existe δ>0 tal que f(x)≥f(a) ∀x∈E(a,δ)∩A. DEF Diremos que f:A→R presenta en a∈A un extremo si es un máximo o un mínimo relativo. PROP Si f(x) es derivable en x=a y tiene un extremo relativo en él, entonces f´(a) = 0. Dem Si en c hay, por ejemplo, un máximo relativo ha de existir un ε>0 tal que f (c + h) − f (c ) f (c + h) ≤ f (c ), h > 0 f (c + h) − f ( c) ≥ 0, h > 0 ⇒ lim = f ´(c) ≤ + h → 0 h h f (c + h) ≤ f (c ), h < 0 ⇒ f (c + h) − f ( c) ≤ 0, h < 0 ⇒ lim − f ( c + h ) − f ( c) = f ´(c ) ≤ | h |< ε h →0 h h
f ´(c ) ≥ 0 ⇒ ⇒ f ´(c ) = 0 f ´(c ) ≤ 0 Si hay en c un mínimo relativo se prueba de forma análoga que f´(c)=0. 3. FUNCIÓN DERIVADA. 3.1. Definición de función derivada y derivadas sucesivas. DEF Si f:[a,b]→R es continua en todo el intervalo, diremos que f(x) es derivable en (a,b) si lo es en todos sus puntos. OBS Si nos fijamos en la definición anterior, vemos que hemos dicho que f(x) es derivable en el abierto y no en el cerrado. Eso es porque en los puntos a y b no se puede hablar de derivada ya que a la izquierda de a y a la derecha de b no está definida la función. DEF Sea f:A→R una función continua y tal que ∀x∈A ∃f´(x). Entonces llamamos función derivada de f y se denota por f´, a f´:A→R x→f´(x) por tanto una función es derivable si lo es en todos los puntos de su dominio.
9/20
La función derivada es una función como cualquier otra, por tanto podemos calcular su dominio, asíntotas, continuidad e incluso su derivada. DEF La función derivada de f´(x) recibe el nombre de derivada segunda de f(x) y se denota por f´´(x). Repitiendo el proceso n veces, siempre que sea posible, obtenemos la derivada n-ésima (o de orden n) de f(x), fn)(x). DEF Si la derivada n-ésima de f(x) existe para todo número natural, diremos que f(x) es infinitamente derivable. 3.2 Álgebra de las funciones derivables. PROP Sean f,g:A→R dos funciones derivables en A. Entonces, las siguientes funciones también son derivables: 1) f±g siendo (f±g)´= f´±g´. 2) f·g siendo (f·g)´=f´·g+f·g´. 3) Si g(x)≠0 ∀x∈A, f/g siendo (f/g)´=
f ´g − fg´ . g2
4) ∀λ∈R λf siendo (λf)´=λf´. Dem 1)(f+g)´= =limh→0 ( f + g )( a + h ) − ( f + g )( a ) = lim h → 0 f ( a + h) + g (a + h) − f ( a) − g ( a) = h h = lim h → 0 =
f (a + h) − f ( a) g (a + h) − g ( a) + = f ´( a) + g´(a) h h
2) Análogo. 3) (f·g)(a) = = lim h →0
( f ·g )( a + h ) − ( f · g )( a ) f ( a + h )·g (a + h) − f ( a)· g ( a ) = lim h →0 = h h
= lim h →0
f ( a + h ) g ( a + h) − f ( a) g ( a + h) + f ( a) g ( a + h ) − f ( a ) g ( a ) = h
= lim h →0
[ f ( a + h) − f ( a) g ( a + h) [ g ( a + h ) − g ( a) ] f ( a ) = + lim h → 0 h h
=f´(a)·g(a) + f(a)·g´(a).
10/ 20
4) f:(a,b)→R no se anula, es derivable.
lim h →0
1 1 1 1 ( a + h) − ( a) − f f f ( a + h ) f ( a) f ( a) − f ( a + h ) = lim h →0 = lim h →0 = h h hf ( a)· f (a + h)
= lim h →0
= f ´( a)·
f (a + h ) − f (a ) 1 · = { f es continua} = h hf ( a )· f ( a + h ) 1 −1 = 2 f (a )· f ·lim h → 0 (a + h) f ( a)
′ ′ f ( x) 1 1 − g (x ) f ´( x ) g ( x) − f ( x) g´( x) = f ( x )· = f ( x)· + f ( x )· = 2 g (x ) g (x ) ( g ( x )) ( g ( x )) 2 g (x ) 5) Análogo. ∀a∈A. Conclusión: El conjunto de las funciones derivables en A⊂R con las operaciones de suma y producto de funciones y producto de un escalar por una funciones tiene estructura de Álgebra. 3.3. Regla de la cadena. PROP Sean f:A→R y g:B→R dos funciones derivables, con A,B⊂R abiertos y f(a)⊂B. Entonces g°f es derivable siendo (g°f)´(x) = g´(f(x))·f´(x) ∀x∈A. Dem *Como f es derivable en x0 . f(x0 +h) = f(x0 )+h · f(x0 ) +hα(h) con limh→0 α(h) = 0. *Como g es derivable en y0 g(y0 +h) = g(y0 )+k · g(y0 ) +kα(k) con limk→0β(k) = 0. Para ver que g°f es derivable en x0 tenemos que ver que se puede expresar como: (g°f)(x0 +h) = (g°f)(x0 ) + h(g°f)´(x0 )+hσ(h)
11/ 20
(g°f)(x0 +h) = g(f(x0 +h)) = g(y0 +h·f(x0 )+hα(h)) = como g es derivable en a = = g(y0 )+ g´(y0 )·[hf´(x0 )+hα(h)] + [hf´(x0 )+hα(h)]·β(hf´(x0 )+hα(h)) = = g(y0 )+h·g´(y0 )·f (x0 ) +h [g´(y0 )α(h)+f´(x0 )+α(h) β (h f´(x0 )+hα(h))]. [g´(y0 )α(h)+f´(x0 )+α(h) β (h f´(x0 )+hα(h))]=M, y tenemos entonces que si M tiene como límite: limh→0 [g´(y0 )α(h)+f´(x0 )+α(h) β (h f´(x0 )+hα(h))]=g(y0 )·0+ (f´(x0 )+0)·0=0 Luego M tiende a =, y entonces (g°f) es derivable en x0 y (g°f)´(x0 ) = g´(f(x0 ))·f´(x0 ). ∀a∈A. 3.4. Derivada de la función inversa. PROP Sea f:A→B una función biyectiva y derivable siendo su derivada no nula en todos sus puntos. Entonces f-1 es derivable con ( f −1 )´( y ) =
1 f ´( f −1 ( y ))
∀y ∈ B
Dem Si en c hay, por ejemplo, un máximo relativo ha de existir un ε>0 tal que f (c + h) − f (c ) f (c + h) ≤ f (c ), h > 0 f (c + h) − f ( c) ≥ 0, h > 0 ⇒ lim = f ´(c) ≤ h→ 0+ h h f (c + h) ≤ f (c ), h < 0 ⇒ f (c + h) − f ( c) ≤ 0, h < 0 ⇒ lim − f ( c + h ) − f ( c) = f ´(c ) ≤ | h |< ε h →0 h h f ´(c ) ≥ 0 ⇒ ⇒ f ´(c ) = 0 f ´(c ) ≤ 0 Si hay en c un mínimo relativo se prueba de forma análoga que f´(c)=0. 3.5. Propiedades de las funciones derivables en un intervalo cerrado. TEOREMA. TEOREMA DE ROLLE. Sea f:[a,b]→R una función continua en [a,b] derivable en (a,b) y f(a)=f(b). Entonces existe al menos un punto c∈(a,b) tal que f´(c)=0. 12/ 20
Dem Sabemos por el teorema de Weierstrass que toda función continua definida en un cerrado alcanza un valor máximo y mínimo en el intervalo. Según donde podamos localizar ese máximo y ese mínimo vamos a distinguir dos casos: 1) Tanto el máximo como el mínimo está en los extremos. Como f(a)=f(b) ⇒maxf=minf ⇒f es cte. Si el máximo y el mínimo de f son iguales, necesariamente f tiene que ser constante. Si f es constante su derivada es cero y entonces c es cualquier punto de (a,b). Recordemos que a y b no pueden ser ya que f no es derivable en ellos. 2) Al menos uno de ellos se alcanza en el interior. En un teorema anterior vimos que "si f alcanza un extremo relativo en a y existe f´(a) entonces f´(a)=0". Al localizarse el extremo absoluto en el interior también es relativo y como en ese punto (al ser interior) es derivable, su derivada es cero. Llamaremos a ese punto x=c y se verifica que: c∈(a,b) y f´(c)=0. OBS La interpretación geométrica del teorema de Rolle es que una función continua es derivable e igual en sus extremos debe tener un punto cuya recta tangente sea horizontal. El siguiente teorema a ver es el del Valor medio o Lagrange. Su pone una generalización del anterior, pues en éste eliminamos la hipótesis de que f(x) coincida en los extremos del intervalo. Lo que vamos a conseguir ahora es un punto x=c que va a tener tangente paralela a la recta que une los puntos (a,f(a)) y (b,f(b)). TEOREMA. TEOREMA DE LAGRANGE. Sea f:[a,b]→R continua en [a,b] y derivable en (a,b). Entonces c∈(a,b) tal que f´(c) = (f(b)-f(a)) / (b-a). Dem Definimos ϕ:[a,b]→R x→ϕ(x)=f(x)+mx, donde m=-
f (b ) − f ( a ) ∈ b−a
para que ϕ(a) = ϕ(b) ϕ es continua en [a, b] ϕ es derivable en ( a, b) ⇒ ∃c ∈ ( a, b) / ϕ´(c ) = 0 ϕ( a ) = ϕ(b )
13/ 20
ϕ´(x) = f´(x)+m ⇒ ϕ´(c) = f´(c)+m = 0 ⇒ f´(c) =
f (b )· f ( a) ⇒ b−a
⇒f´(c)(b-a) = f(b)-f(a).
Geométricamente existe al menos un punto de la gráfica de f, distinto de sus extremos Ay B en el que la tangente de la gráfica es paralela a la cuerda AB.
TEOREMA. TEOREMA DELVALOR MEDIO GENERALIZADO (CAUCHY). Sean f,g: [a,b]→R continua en [a,b] y derivables en (a,b). Entonces existe c∈(a,b) tal que: f´(c)·(g(b)-g(a)) = g´(c) ( f(b)-f(a)) Dem Definimos h(x) = f(x)[g(b)-g(a)]-g(x)[f(b)-f(a)] = f(x)h - g(x)k (*) h: [a,b]→R continua h(a) = f(a)[g(b)-g(a)]-g(a)[f(b)-f(a)] = f(a)·g(b)-f(a)·g(a)-g(a)f(b)+g(a)f(a) h(b) = f(b)[g(b)-g(a)]-g(b)[f(b)-f(a)]=f(b)·g(b)-f(b)·g(a)-g(b)f(b)+g(b)f(a) (*) ⇒ h(a) = h(b) (*) h derivable en (a,b) (*)+(*)+(*) ⇒ ROLLE ⇒∃c∈(a,b) / h´(c) = 0 ⇒ si h´(c) = 0 h´(c) = (f(c)h-g(c)k)´ = f´(c)h-g´(c)k = 0 ⇒ f´(c)h = g´(c)k ⇒ f´(c)[g(b)-g(a)] = g´(c)[f(b)-f(a)] OBS Si en el teorema anterior tomamos g(x)=x se obtiene el teorema del valor medio. OBS En algún libro de texto nos podemos encontrar como tesis del teorema: ∃c ∈ ( a, b) /
f ´(c) f (b) − f ( a) = g´(c ) g (b) − g (a )
14/ 20
Esta tesis no es correcta. Con las hipótesis de continuidad y derivabilidad para f(x) y g(x) no podemos asegurar que algunos valores puedan anular los denominadores. Habría que añadir al teorema la hipótesis g´(x)≠0 ∀x∈(a,b) y g(a) ≠ g(b) y eso no sería el teorema de Cauchy. Veamos dos consecuencias obtenidas de forma inmediata a partir de estos teoremas. PROP Si f´(x) = 0 ∀x∈(a,b) ⇒ f=cte. Dem ∀x1 ,x2 ∈(a,b) con x1 ,x2 consideremos [x1 ,x2 ]⊂(a,b). Como f´(x) = 0 ⇒ f es derivable en (a,b) ⇒ es continua en (a,b) ⇒ f es continua en [x1 ,x2 ] y derivable en (x1 ,x2 ). Aplicando el teorema del valor medio:
∃c∈(x1 ,x2 ) / f´(c)
f ( x2 ) − f ( x1 ) f ( x 2 ) − f ( x1 ) x 2 − x1 = 0 ⇒ f ( x2 ) − f ( x1 ) = 0 ⇒ x 2 − x1 f ´(c ) = 0
Entonces f(x1 )=f(x2 ) ∀x1 , x2 ∈(a,b) Por tanto f es una función constante. PROP Si f y g son dos funciones que tienen la misma derivada entonces se diferencian en una constante. Dem Sean las funciones f,g:A→R con f´(x)=g´(x) ∀x∈A siendo A un intervalo abierto. Consideremos la función f-g. Su derivada: (f-g)´=f´-g´= 0 ⇒ (f-g)=cte. 4. APLICACIONES. 4.1. Crecimiento y decrecimiento de funciones. Ahora vamos a ver como, a partir de la primera derivada podemos saber si la función es creciente o decreciente.
15/ 20
TEOREMA. Si f(x)>0 ∀x∈I ⇒ f(x) es estrictamente creciente en I. Dem Tomemos un punto cualquiera x0 ∈I. Sabemos que la función es derivable y que la derivada es positiva, luego f´(x0 )>0. Como f´(x0 )= limx→xo
f ( x) − f ( x 0 ) si x > x 0 ⇒ f ( x ) > f ( x0 ) >0 ⇒ x − x0 si x < x 0 ⇒ f ( x) < f ( x 0 )
Por tanto f(x) es creciente cerca de x0 , tanto antes como después. Y como eso ocurre para cualquier punto x0 ∈I, entonces la función es creciente en I. TEOREMA. Si f´(x)<0 ∀x∈I ⇒ f(x) es estrictamente decreciente en I. Dem La demostración es igual que la anterior. Sea x0 ∈I un punto cualquiera. Sabemos que f´(x0 )>0. Como f´(x0 )= limx→xo
si x > x 0 ⇒ f ( x ) < f ( x0 ) f ( x) − f ( x 0 ) <0⇒ x − x0 si x < x 0 ⇒ f ( x) > f ( x0 )
Vemos que la función es decreciente en x0 ⇒lo es en todo I. OBS Con estos teoremas obtenemos un método alternativo para saber si un punto es máximo o mínimo relativo. Lo que habíamos visto era que igualábamos a cero la primera derivada, y luego esos puntos los sustituíamos en la segunda derivada. Si daba positiva era mínimo y si daba negativa era máximo. Ahora lo podemos saber sin necesidad de tener que ir a la segunda derivada. Basta solamente saber el signo de la primera derivada. Para que haya un máximo la primera derivada tiene que tener antes del punto signo positivo (f(x) será creciente) y después signo negativo (f(x) decreciente); y para que sea mínimo, al revés. OBS Ya habíamos visto antes que si una función es estrictamente creciente, entonces la derivada es positiva (si no lo hemos visto, se haría estudiando el signo del cociente incremental). Estos dos teoremas anteriores es lo que llamamos el recíproco, ya que son al revés (si la derivada es positiva ⇒ la función es estrictamente creciente). 4.2. Concavidad y convexidad de funciones. Ahora vamos a manejar la segunda derivada, para ver que información podemos extraer de ella (de la primera veíamos el crecimiento y decrecimiento de la función).
16/ 20
Aquí estudiaremos la concavidad y convexidad. Para ello, pasamos a definir estos conceptos. DEF Se dice que f es convexa en I si ∀a,b ∈I se verifica que la recta que une (a,f(a)) con (b,f(b)) queda por encima de la gráfica de f(x).
f(b)
f(a) a
b
OBS La recta sabíamos que era r(x) =
f (b ) − f ( a ) ( x − a ) + f ( a) y se tiene que b−a
cumplir que r(x)>f(x). f (b ) − f ( a ) ( x − a ) + f ( a) >f(x) b−a f (b ) − f ( a ) f (b ) − f ( a ) f ( x ) − f (a ) ⇒ ( x − a ) > f (x ) − f (a ) ⇒ > b−a b−a x−a r(x)>f(x)
⇒
⇒
Esto nos lleva a una nueva definición de función convexa, totalmente análoga a la anterior. DEF Se dice que f es convexa en I si ∀a,b∈I se verifica que: f (b ) − f ( a ) f ( x) − f ( a) > , ∀x∈(a,b) b−a x−a Análogamente podemos definir: DEF Se dice que f es cóncava en I si ∀a,b∈I se verifica que la recta que une (a,f(a)) con (b,f(b)) queda por debajo de la gráfica de f(x).
f(x) E igualmente podemos decir: DEF Se dice que f es cóncava en I si ∀a,b∈I se verifica que:
17/ 20
f (b) − f ( a) f ( x ) − f ( a) < ∀x ∈ ( a, b) b−a x−a Ahora vamos a ver lo que se llama un teorema auxiliar pues sólo sirve para aplicar su resultado en el siguiente, y así, en vez de dar uno grande, se ven dos pequeños. TEOREMA. Sea f:[a,b]→R continua en [a,b], derivable en (a,b), f´(x) creciente y f(a)=f(b). Entonces f(x)
2) Supongamos ahora que hay un valor x0 ∈(a,b) tal que f(x0 )=f(a). Puede ocurrir que:
- f=cte ⇒ f´=0 y no sería creciente. NO - En x0 hay un máximo ⇒ f´(x0 ) = 0 y por ser máximo, antes de x0 la derivada es positiva y después negativa ⇒ f´ es decreciente. Pero por hipótesis f´ es creciente ⇒ CONTRADICCIÓN.
Por tanto, lo único posible es que f(x)
18/ 20
TEOREMA. Si f es derivable y f´ creciente ⇒ f es convexa. Dem Como f:[a,b]→R es continua en [a,b] y derivable en (a,b) la función g(x) = f(x) -
f (b ) − f ( a ) ( x − a ) − f (a ) también lo es. También tenemos que f´ es b−a
f (b ) − f ( a ) también lo es. Si f´ crece, podemos comprobar b−a fácilmente que g´(x) también lo hace, y g(a)=g(b)=0. creciente ⇒ g´(x) = f´(x) -
Entonces la función g(x) verifica las hipótesis del teorema anterior. Por tanto, f (b ) − f ( a ) aplicándolo tenemos g(x)
19/ 20
4.3. Cálculo de límites: Regla de L´Hôpital. TEOREMA. Sean f y g derivables en un entorno (a-r, a+r) del pnto a. Si limx→a f(x)=0, limx→ag(x)=0 y existe limx→af´(x)/g´(x), entonces también existe el límite de f(x)/g(x) y es limx→a f(x)/g(x) = limx→a f´(x)/g´(x). Dem Podemos suponer que f(a)=0 y que g(a)=0, pues para el cálculo de límites cuando x→a, no es relevante el valor de la función en el punto a. Ahora f y g cumplen las hipótesis del teorema de Cauchy en [a,b] siendo x∈(a,a+r). Por tanto existe c∈(a,x) tal que: f(x)/g(x) = f´(a)/g´(a). Cuando x→a también c→a. Por tanto: limx→a f(x)/g(x) = limc→a f´(c)/g´(c) = limx→a f´(x)/g´(x). Como x∈(a,a+r) los límites son por la derecha. Análogamente por la izquierda.
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Análisis Matemático 2ª Edición. Aut. T. M. Apostol. Ed. Reverté Introducción al Análisis Matemático. Aut. J.M. Ortega. Ed. Labor
20/ 20
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 27 DESARROLLO DE UNA FUNCIÓN EN SERIE DE POTENCIAS. TEOREMA DE TAYLOR APLICACIONES AL ESTUDIO LOCAL DE FUNCIONES.
1. Introducción. 2. Polinomio de Taylor de grado n. 2.1. Polinomios de Taylor de algunas funciones elementales. 2.2. Propiedades del polinomio de Taylor. 2.3. Teorema de Taylor. 3. Desarrollo de una función en serie de Potencias. 4. Aplicaciones al estudio Local de funciones. 4.1. Extremos relativos. Curvatura. 4.2. Cálculo de límites. 4.3. Aproximaciones numéricas. 5. Bibliografía Básica.
1/26
TEMA 27 DESARROLLO DE UNA FUNCIÓN EN SERIE DE POTENCIAS. TEOREMA DE TAYLOR APLICACIONES AL ESTUDIO LOCAL DE FUNCIONES. 1. INTRODUCCIÓN. Los matemáticos consideran como funciones elementales, entre otras, los polinomios, ex , log x, sen x y cos x, las cuales hemos descrito en temas anteriores. Pero de todas ellas, solo los polinomios pueden calcularse de forma sencilla para cualquier valor de la variable independiente x. Eso es debido a que si p(x) es un polinomio, entonces n
p ( x ) = ∑ ai x i i =0
Recordemos que la función ex se calcula como inversa de log x. Y esta última viene definida por x log x = ∫ 1t dt 1
También tenemos que la función cos x se define como un número y tal que Y = cos x
⇒ A( y ) =
x 2
∀x ∈ [0, π]
Y como la función A(y) es A( y ) =
1 y 1− y2 + ∫ 1 − t 2 dt y 2
tendremos que 1 y 1− y2 x + ∫ 1 − t 2 dt = y 2 2
OBS Omitimos como extiende la función cos x de [0, π] a 3. Y recordemos que la definición de la función sen x es sen x = 1 − cos 2 x En este tema vamos a tratar de aproximar estas funciones “elementales”, y en general todas aquellas que cumplan unas determinadas condiciones, por funciones polinómicas en las proximidades de un punto.
2/26
2. POLINOMIO DE TAYLOR DE GRADO N. Sea f(x) una función derivable en x = a hasta el orden n inclusive. Vamos a encontrar un polinomio de grado no superior a n, Pn (x), cuyo valor x = a coincida con el valor de f(x) en x = a y los valores de sus derivadas también coincidan, en x = a, con las derivadas de f(x) hasta el orden n-ésimo. Entonces tenemos que Pn (a) = f(a)
Pn ´´(a) = f´´(a) ……. Pnn ) ( a) = f n ) (a )
Pn ´(a) = f´(a)
(1)
Escribamos el polinomio en forma de potencias de (x – a): Pn (x) = ao + a1 (x – a) + a2 (x – a)2 + a3 (x – a)3 + ….. + an (x – a)n Los coeficientes de Pn (x) los calculamos teniendo en cuenta las condiciones (1). Primero veamos el valor de Pn (x) y sus derivadas en x = a Pn (a) = ao Pn ´(a) = a1 Pn ´´(a) = 2 · a2 Pn ´´´(a) = 3! · a3 . . . P nn ) (a) = n! an Y aplicando las condiciones (1) obtenemos a o = f (a ), a1 = f ´(a ), a 2 =
1 1 1 f ´´(a), a3 = f ´´´(a ), L, a n = f n ) (a ) 2! 3! n!
El polinomio Pn (x) queda como Pn ( x ) = f (a ) + f ´(a )(x − a ) +
n) f ´´(a ) ( x − a )2 + f ´´´(a ) ( x − a )3 + L + f ( a) ( x − a )n 2! 3! n!
DEF
Llamamos Polinomio de Taylor de grado n para f en x = a al polinomio n f i ) (a ) Pn ( x) = ∑ ( x − a )i i! i =0
OBS Siendo riguroso, tendríamos que haber denotado al polinomio como Pn,a,f(x), aunque nos conformaremos con Pn,a(a).
3/26
2.1. Polinomios de Taylor de algunas funciones elementales. En general, las funciones elementales tienen polinomios de Taylor bastante sencillos, aunque los coeficientes parezcan depender de la función f de forma complicada. Sea, en primer lugar, f(x) = sen x. f(0) = sen 0 = 0 f´(0) = cos 0 = 1 f´´´(0) = - sen 0 = 0 f´´´(0) = - cos 0 = -1 A partir de fI V(0) las derivadas se repiten con un ciclo de 4. Los coeficientes aK toman valores 1 1 1 1 0, 1, 0, − ,0, ,0,− ,0, ,..... 3 5! 7! 9! Y el polinomio de Taylor de grado 2n + 1 para sen x en x = 0 es P2 n +1 , 0 ( x) = x −
x3 x5 x7 x 2 n +1 + − + ......... + ( −1) n 3! 5! 7! (2 n + 1)!
Para no reiterarnos, repitiendo los cálculos de manera análoga para f(x) = cos x en x = 0, obtenemos que el polinomio de Taylor de grado 2n de f(x) = cos x es x = 0 es 2n x2 x4 x6 n x P2 n , 0 ( x) = 1 − + − + ....... + (− 1) 2! 4! 6! (2n )!
El polinomio de Taylor de la función f(x) = log x no puede calcularse en x = 0 ya que es un punto que no pertenece al dominio. Tomaremos x = 1. f (1) = log 1 = 0 1 f ´(1) = = 1 1 f ´´(1) =
−1 = −1 12
f ´´´(1) =
2 =2 13
4/26
( −1) i −1 ·(i − 1)! Y en general, como f ( x ) = tenemos que f i (1) = (− 1)i −1 ·(i − 1)! i x i)
Siendo el polinomio de Taylor Pn ,1 ( x) = ( x − 1) −
( x − 1)2 + ( x − 1)3 + ...... + (− 1)n−1 ·( x − 1)n 2
3
n
Si tomamos la función f(x) = log(x + 1) si se puede calcular su polinomio en x = 0 y es Pn , 0 ( x) = x −
x 2 x3 xn + + ..... + (− 1)n −1 · 2 3 n
La inversa de la función logaritmo, ex , tiene una expresión para el polinomio de Taylor en x = 0 muy sencilla, debido a que (ex )K) = ex y entonces Pn ,0 ( x ) = 1 + x +
x2 x3 xn + + ..... + 2! 3! n!
Pero no todas las funciones elementales tienen polinomios de Taylor tan sencillos. Nos podemos encontrar con otras funciones cuyas derivadas sean complicadas o se vayan complicando conforme aumentamos el orden. Por ejemplo, la función arctgx, que tiene por derivadas arctg´ x =
1 1 + x2
arctg´´ x =
⇒ arctg´( 0) = 1
− 2x
(1 + x )
2 2
⇒
arctg´´(0 ) = 0
2 2
arctg´´´ x =
(1 + x ) ·(− 2) + 2 x·2(1 + x )·2 x ⇒ arctg´´´(0) = −2 (1 + x ) 2
2 4
Y conforme aumentamos el orden, mas complicada es la derivada. 2.2. Propiedades del polinomio de Taylor. De momento tenemos definido el polinomio de Taylor de f(x) en x = a de grado n como aquel que tiene las n primera derivadas coincidentes en x = a con f(x), además de P(a) = f(a). Esta relación entre el polinomio y f(x), veremos que es mucho mas profunda de lo que parece.
5/26
Para empezar, sea P1,a(x) el polinomio de Taylor de f(x) en x = a de grado 1. Entonces P1 ,a ( x) = f (a ) + f ´(a )( x − a ) A partir de esta expresión, cambiándola de signo y sumando f(x) y después dividiendo por x – a llegamos a f ( x ) − P1, a ( x ) f ( x ) − f (a ) = − f ´(a ) x−a x−a Y como sabemos que la definición de derivada en un punto es f ´( a) = lim
x →a
f ( x ) − f (a ) x−a
obtenemos como conclusión que lim
x →a
f ( x ) − P1 ,a ( x) =0 x−a
De esta expresión deducimos que la distancia entre f(x) y P1,a(x) no solo se hace pequeña cuando x → a sino que incluso es más pequeña comparándola con la distancia entre x y a. Generalicemos este resultado que hemos obtenido para n = 1 a cualquier valor del grado del polinomio. TEOREMA Sea f(x) una función n veces derivable en x = a y sea Pn,a(x) el polinomio definido como n
Pn ,a ( x) = ∑ ai ( x − a )i
con
ai =
i =0
f i ) (a ) i!
Entonces lim
f ( x ) − Pn ,a ( x )
x →a
( x − a )n
=0
Dem. Si desarrollamos el cociente tenemos n
f ( x ) − Pn ,a ( x ) = ( x − a )n
f ( x ) − ∑ ai ( x − a )i i= 0
( x − a )n
f i ) (a ) (x − a )i f n ) (a ) i ! i =0 − n! (x − a )n n −1
=
Definamos las funciones
6/26
f (x) − ∑
n −1
Q( x ) = ∑ i =0
f i ) (a ) (x − a )i i!
g(x) = (x – a)n
y
Con estas funciones, tenemos que demostrar f ( x ) − Q( x ) f n ) ( a) = g ( x) n!
lim
x →a
Si nos fijamos en la definición de Q(x), vemos que Qi ) (a ) = f i ) ( a)
∀i ≤ n − 1
Y la función g(x) verifica n!( x − a )n −k g ( x) = (n − K )! i)
Por tanto, tenemos que se verifica lim ( f ( x ) − Q( x ) ) = f ( a ) − Q( a ) = 0 x →a
lim ( f ´( x) − Q´( x) ) = f ´(a ) − Q´( a) = 0 x →a
M
(
)
lim f n −2 ) ( x ) − Q n − 2 ) ( x ) = f n −2 ) ( a ) − Qn − 2 ) ( a) = 0 x →a
y también lim g ( x ) = lim g´( x ) = ......... = lim g n −2 ) ( x) = 0 x →a
x →a
x→ a
Entonces, el límite a calcular es una indeterminación de la forma resolveremos aplicando la regla de L´Hôpital, hasta un total de n – 1 veces. lim
x →a
f ( x ) − Q (x ) f ´(x ) − Q´( x ) f n −1) ( x ) − Qn −1) ( x ) = lim = ..... = lim = x →a x→ a g(x) g´(x ) g n −1 ) (x )
Sabemos que Qn-1) (x) = fn-1)(a) y que gn-1)(x) = n! (x – a). Sustituyendo = lim
x→ a
f n −1 ) ( x ) − f n −1) (a ) 1 f n −1 ) (x ) − f n −1) (a ) 1 n ) = ·lim = · f (a ) n! ( x − a ) n! x→ a x −a n! c.q.d.
7/26
0 , que 0
La tesis del teorema anterior nos permite dar la siguiente definición: DEF
Dos funciones f y g se dice que son iguales hasta el orden n en x = a si lim
x →a
f (x) − g(x) =0 (x − a )n
Según esta definición, el teorema 1 dice que el polinomio de Taylor de f(x) de grado n en x = a, Pn,a(x), y f(x) son iguales hasta el orden n en x = a. Podríamos dar una definición alternativa para el polinomio de Taylor, como aquel polinomio de grado ≤ n que cumpla las propiedad anterior, que sabemos que es único. La proposición siguiente nos demuestra la unicidad. PROP Sean P y Q dos polinomios en x – a, de grado ≤ n, y supongamos que P y Q son iguales hasta el orden n en x = a. Entonces P = Q. Dem. Definamos el polinomio R(x) = P(x) – Q(x). R(x) es un polinomio de grado ≤ n: n
R( x) = ∑ ri ( x − a )n K =0
Si demostramos que R(x) verifica lim
x →a
R( x ) =0 ( x − a )n
entonces R = 0. La hipótesis para R(x) nos garantiza que se verifica R( x ) =0 i x →a ( x − a )
lim
0≤i ≤ n
Para i = 0 la condición es lim R( x) = 0 x →a
y como n
lim R ( x ) = lim ∑ ri ( x − a )i = ro x →a
x →a
i =0
8/26
entonces ro = 0 y n
r ( x ) = ∑ ri ( x − a )i i =1
Para i = 1 lim
x →a
R( x) =0 x−a
y el cociente n R( x) = ∑ ri ( x − a )i −1 = r1 + r2 ( x − a ) + ...... + rn ( x − a )n −1 x − a i =1
siendo lim
x →a
R (x ) =r x−a 1
Por tanto r1 = 0 Reiterando el proceso obtendremos ro = r1 = r2 =………= rn = 0 y por tanto R = 0. COROLARIO Sea f(x) una función derivable n veces en x = a y sea P(x) un polinomio en x – a de grado ≤ n, tan que f(x) y P(x) son iguales hasta el orden n en x = a. Entonces P(x) = Pn,a(x). Dem. Inmediata. Si f(x) tiene n derivadas en x = a, el corolario anterior nos muestra un método para hallar el polinomio de Taylor. Utilicémoslo ahora para hallar el polinomio de Taylor de la función arctg x que dejamos pendiente. Sabemos que la función arctg x se puede expresar por medio de la ecuación 1 dt 0 1+ t2
arctg x = ∫
x
Si realizamos la división que indica el cociente:
9/26
1 ( − 1)n +1 ·t 2 n + 2 n 2n 2 4 6 8 = 1 − t + t − t + t + ..... + (− 1) ·t + 1+ t2 1+ t2 y entonces x
(
)
x
t 2 n +2 dt = 1+ t2
arctg x = ∫ 1 − t 2 + t 4 − t 6 + t 8 + ...... + (− 1)n t 2 n dt + ∫ (− 1)n +1 · 0
= x−
0
2 n +2 x t x3 x5 x7 x 2 n +1 + − + ...... + (− 1)n + (− 1)n +1 ·∫ dt 0 1+t2 3 5 7 2n + 1
Aplicando el corolario anterior, el polinomio que acabamos de obtener es el polinomio de Taylor de grado n en x = 0 para arctg x siempre que se verifique.
lim
∫
x
0
x →0
t 2n+ 2 dt 1+ t2 = 0 x 2 n +1
Y la expresión anterior es cierta si tenemos en cuenta que:
∫
x
0
t 2 n +2 dt ≤ 1+ t 2
∫
x
0
2n+ 3
t
2 n +2
x dt = 2n + 3
2.3. Teorema de Taylor. Volviendo a la expresión obtenida para la función arctg x arctg x = x −
2n+ 2 x t x3 x5 x7 x 2 n +1 + − + ........ + (− 1)n · + (− 1)n +1 ·∫ dt 0 1+ t2 3 5 7 2n + 1
y recordando la acotación obtenida para el último sumando
∫
x
0
2 n +3
x t 2n+ 2 dr ≤ 2 1+ t 2n + 3
podemos afirmar que si x ≤ 1 entonces el último sumando tiene un valor máximo de 1 , pudiéndose hacer tan pequeño como se quiera tan sólo aumentando n. 2n + 3 Es decir, podemos usar el polinomio de Taylor para calcular el valor de la función arctg x con x ≤ 1 con tanta aproximación como queramos. Los teoremas de Taylor permiten extender el resultado obtenido a otras funciones.
10/26
Los resultados obtenidos en el punto anterior han examinado el comportamiento del polinomio de Taylor Pn,a(x) para n fijo, cuando x tiende hacia x = a. A partir de ahora dejaremos x fijo y variaremos el valor de n. DEF Llamaremos resto del polinomio de Taylor Pn,a(x) de la función f(x) a la función Rn,a(x) que verifica f (x ) = Pn , a ( x ) + Rn ,a ( x ) En el caso de la función arctg x hemos visto que t 2n+ 2 dt 0 1+t2
R2 n +1 , 0 ( x ) = (− 1)n +1 ·∫
x
Sería deseable obtener una expresión para Rn,a(x) que nos permitiera estimar fácilmente su magnitud. Vamos a ver que dicha expresión existe y que encierra una integral, como en el caso de al arctg x. Vamos a obtener dicha expresión den dos formas diferentes. La segunda de ellas recibirá el nombre de Teorema de Taylor, y la primera que vamos a ver es la constructiva. Para n = 0 tenemos que f ( x ) = f ( a) + Ro , a ( x ) y por el teorema fundamental del cálculo infinitesimal podemos decir x
f ( x ) = f ( a) + ∫ f ´(t )dt a
con lo que x
R0 , a ( x ) = ∫ f ´(t )dt a
Para obtener R1,a(x) partiremos de la fórmula anterior aplicando integración por partes: x
R0 , a ( x ) = ∫ f ´(t )dt = a
u´= f ´(t ) dv = dt
u´= f ´´(t )dt v =t− x
Escribimos v(t) = t – x ya que - x es una constante al ser x fijo. x
x
x
a
a
= [ f ´(t )( t − x) ]a − ∫ f ´´(t )( t − x) dt = − f ´(a )( a − x ) − ∫ f ´´(t )( t − x )dt
11/26
Sustituyendo x
f ( x ) = f ( a) + R0 ,a ( x) = f ( a ) + f ´(a )( x − a ) + ∫ f ´´(t )( x − t )dt a
por lo tanto x
R1 ,a ( x) = ∫ f ´´(t )( x − t ) dt a
Si repetimos el proceso para R1,a(x) tomando u (t ) = f ´´(t )
u´(t ) = f ´´´(t ) dt
v´(t ) = ( x − t ) dt
v( t ) =
− (x − t )2 2
obtenemos R1 ,a ( x) =
x f ´´´(t ) f ´´(a )( x − a) 2 +∫ ( x − t ) 2 dt a 2 2
siendo R2 ,a ( x ) = ∫
x
a
f ´´´(t ) ·( x − t ) 2 dt 2
Reiterando el proceso n veces llegamos a que si fn+1)(x) es continua [a, x] entonces Rn ,a ( x) = ∫
x
a
f n +1 ) (t ) ( x − t ) n dt n!
El teorema de Taylor es la segunda forma de obtener una expresión para el resto que vamos a ver. Tiene como ventaja que no exige como hipótesis que fn+1)(x) sea continua. TEOREMA Teorema de Taylor. Sea f(x) una función con derivadas hasta el orden n + 1 en [a, x] y Rn,a(x) definido como f ( x ) = f ( a) + f ´(a)( x − a) + ........ +
f n ) ( a) ( x − a) n + Rn ,a ( x ) n!
Entonces 1) Rn ,a ( x) =
f n +1 ) (t ) ( x − t ) n ( x − a) para algún t∈(a, x) n!
12/26
2) Rn ,a ( x) =
f n +1 ) (t ) ( x − a ) n +1 para algún t∈(a, x) (n + 1)!
3) Si fn+1)(x) es integrable sobre [a, x] entonces R n , a ( x ) = ∫
x
0
f n +1 ) (t ) ( x − t ) n dt n!
Dem. 1) Sea x un nº fijo. Entonces ∀t ∈ [a , x] f ( x ) = f (t ) + f ´(t )( x − t ) + ........ +
f n ) (t ) ( x − t ) n + S (t ) ∀t ∈ [a , x] n!
Derivemos la expresión anterior como función de t. El primer miembro: df ( x ) =0 dt y cada sumando
f K ) (t ) ( x − t ) K tiene por derivada K!
f K ) (t ) d ·( x − t ) K K) K −1 ) (t ) K! = f (t ) ·K ·(x − t )K −1 ·(−1) + f ( x − t)K = dt K! K! =−
f K ) (t ) f K +1 (t ) ( x − t ) K −1 + ( x − t) K ( K − 1)! K!
Sustituyendo tendremos f ´´(t ) f ´´(t ) f ´´´(t ) 0 = f ´( x) + ´ f ´(t ) + ( x − t ) + − (x − t) + ( x − t ) 2 + ......... + 1! 1! 2! f n ) (t ) f n +1) ( t ) + − ( x − t ) n −1 + ( x − t ) n + S´(t ) n! ( n − 1)! Teniendo en cuenta que se cancela casi todos los sumando, nos queda S´(t ) = −
f n +1 ) (t ) ( x − t) n n!
Aplicando el teorema de Valor Medio de la función t∈(a, x) tal que
13/26
S(t) sobre [a, x] existe un
S ( x) − S (a ) x−a
S´(t ) = por lo que
S ( x ) − S ( a) f n +1 ) (t ) =− (x − t )n x−a n! Si recordamos que S (t ) = Rn ,t ( x) tenemos que S ( x) = Rn , x ( x ) = 0 S ( a) = Rn ,a ( x) Por tanto, sustituyendo 0 − Rn ,a ( x) f n +1) (t ) =− (x − t )n x−a n! y despejando Rn ,a ( x) =
f n +1 ) (t ) ( x − t ) n ( x − a) n!
que llamaremos forma de Cauchy del resto. 2) Aplicando el teorema del valor medio de Cauchy a S y g(t) = (x – t)n+1 existe algún t∈(a, x) tal que
(S ( x ) − S ( a) ) g´(t ) = (g ( x ) − g ( a) )S´(t ) Sustituyendo g(x) = 0 g(a) = (x – a)n+1 g´(t) = - (n + 1) (x – t)n obtenemos Rn ,a ( x) =
f n +1 ) (t ) ( x − a ) n +1 (n + 1)!
que es la forma de Lagrange del Resto. 3) Si fn+1) es integrable sobre [a, x] aplicando el teorema fundamental del cálculo integral
14/26
x
S ( x) − S ( a ) = ∫ S´(t ) a
y sustituyendo S´(t) por su valor S ( x) − S ( a) = − ∫
x
a
f n +1) (t ) ·( x − t ) n dt n!
que nos da Rn ,a ( x) = ∫
f n +1) (t ) ·( x − t ) n dt n!
x
a
Como aplicación del teorema anterior, vamos a escribir de nuevo el polinomio de Taylor con el resto integral para las siguientes funciones: 2n+ 2) x sen x3 x5 x 2 n +1 (t) + − ...... + (−1) 4 +∫ ( x − t ) 2 n +1 dt 0 3! 5! (2n + 1)! ( 2n + 1)!
sen x = x −
cos x = 1 −
2 n +2 ) x cos x2 x4 x2 n (t ) + − ....... + ( −1) n +∫ ( x − t ) 2 n dt 0 2! 4! (2 n)! ( 2n)!
e x = 1+ x +
t x e x2 x3 xn + + ........ + +∫ ( x − t )n dt 2! 3! n! 0 n!
Las integrales que hemos obtenido son demasiado complicadas como para resolverlas. Y más cuando sabemos que su valor será el de la función menos el del polinomio. Lo que sí es fácil de hacer, y lo dejamos como ejercicio, es acotarlas superiormente. 3. DESARROLLO DE UNA FUNCIÓN EN SERIE DE POTENCIAS. DEF
Llamaremos serie de potencia a una serie de funciones de la forma ∞
∑a
K
xK
K=0
donde {ao , a1 ,........, an ,.....} son números constantes llamados coeficientes de al serie. El dominio de convergencia de una serie de potencias es un cierto intervalo que en algunos casos podría reducirse a un punto. TEOREMA. Teorema de Abel. 1) Si una serie de potencias converge para un cierto valor xo no nulo, entonces converge absolutamente ∀x, x < xo .
15/26
2) Si la serie diverge para cierto valor de xo ´, entonces diverge ∀x
x > xo ´ .
Dem. 1) Por hipótesis, la serie numérica a 0 + a1 x 0 + a 2 x02 + K + a n x0n + K converge, su término general a n x 0n → 0, cuando n → ∞ pero esto significa que existe un número M positivo tal que todos los términos de la serie son menores en valor absoluto que M. Sea la serie x a 0 + a1 x 0 x0
x + a 2 x 02 x0
2
n
x + K + a n x0n x0
+ K
(1)
y consideremos la serie de valores absolutos de sus términos x x a0 + a1 x 0 + a2 x 02 x0 x0
2
+ K + an x
n 0
x x0
n
+K
(2)
Los términos de esta serie son menores que los términos correspondientes a la serie x x M +M +M x0 x0
2
n
x +K + M x0
+K
(3)
x < 1 , siendo x0 por tanto convergente. Entonces la serie (2) también es convergente, por ser menor que (3). Y de aquí se deduce que la serie (1) también es convergente absolutamente. Cuando x < x0 , la serie (3) es una progresión geométrica de razón
2) Supongamos que la serie a 0 + a1 x + a2 x + K + a n x + K diverge en un cierto punto x’ 0 . Entonces esta serie también será divergente para cualquier x que verifique x > x' 0 , ya que si la serie fuese convergente para ese valor de x, aplicando el apartado 1 también sería convergente en x’ 0 , lo cual sería una contradicción. c.q.d.
16/26
El Teorema de Abel nos permite determinar los puntos tanto de convergencia de la serie, como de divergencia. Si la serie converge en xo , entonces todos los puntos x ∈ (− x , xo ) son puntos de convergencia absoluta. Y análogamente, si xo ´ es un punto de divergencia, también lo serán todos x ∈ − ∞, − xo ´ ∪ ( xo ´ ,+∞) .
(
)
Por tanto, tenemos COROLARIO El dominio de convergencia de una serie de potencias es un intervalo con centro el origen de coordenadas. DEF Llamaremos radio de convergencia de una serie de potencias a R, que verifica que ∀ x∈E(0, R) la serie es convergente y ∀x ∉ [-R, R] la serie es divergente. El caso de que x = R ó x = - R se resuelve de forma particular para cada función. Sea f(x) una función derivable hasta el orden n + 1 en un entorno de x = a. Entonces podemos escribir que f (x ) = f (a ) + f ´(a)( x − a ) + ....... +
f n ( a) 1 x ( x − a ) n + ∫ f n +1 ) (t )( x − t ) n dt n! n! a
∞
Si la función f(x) es de clase C en un entorno de x = a (tiene infinitas derivadas), podemos tomar n arbitrariamente grande en la fórmula de Taylor. DEF Dada una función f(x) de clase C ∞ en un entorno del punto x = a, llamaremos desarrollo de f(x) en serie de Taylor a la expresión ∞
f (x ) = ∑
K =0
f K ) ( a) ( x − a )K K!
Si en la fórmula de Taylor dejamos x fijo y tomamos límites cuando n tiende a infinito, la serie convergerá solo en el caso de que se verifique que lim Rn , a ( x ) = 0. n→ ∞
PROP Si lim Rn , a ( x) = 0 ⇔ la serie de Taylor de f(x) es convergente para ese x. n→ ∞
Dem. Sea f ( x ) = Pn ,a ( x) + Rn , a ( x) Donde Pn,a(a) es el polinomio de Taylor de f(x) en x = a de grado n y Rn,a(x) es el resto. Tomando límites en ambos miembros cuando n tiende a infinito tenemos f ( x ) = lim Pn , a ( x) x→ ∞
17/26
ya que por hipótesis lim Rn , a ( x) = 0 n→ ∞
Pero Pn,a(x) es la n-ésima suma parcial de al serie de Taylor, por tanto su límite es igual a al suma de al serie y se verifica que ∞
f (x ) = ∑
K =0
f K (a ) ( x − a )K K!
OBS Deducimos que la serie de Taylor representa a la función f(x) solo cuando lim Rn , a ( x) = 0 . Si el límite no fuese nulo, la serie no es la función dada, n→ ∞
independientemente de que converja o no. 1 x n +1) f ( t )( x − t ) n dt en cualquier intervalo en torno al punto a en ∫ a n! n +1 ) el que f ( x ) es continua, la condición suficiente de la proposición anterior podría ser expresada como: Como Rn ,a ( x) =
PROP f ( x ) ∈ C ∞ ( E (a , r )). Sea A∈3 una constante que f n ) ( x ) ≤ An
∀n ∀x ∈ E ( a, r )
Entonces la serie de Taylor de f(x) en x = a converge hacia f ( x ) ∀x ∈ E ( a, r ) Dem. Como Rn ,a ( x) =
1 x n +1) f ( t )·( x − t ) n dt ∫ a n!
realizamos el cambio de variable t = x + ( a − x )·u
dt = −( x − a) du
quedando Rn ,a ( x) =
( x − a ) n +1 1 n n +1) ∫0u f ( x + (a − x)u )du n!
y ahora x−a 0 ≤ Rn ,a ( x) ≤ n!
n +1
n +1
x − a · A n +1 B n +1 · A ·∫ u du = = 0 (n + 1)! (n + 1)! n +1
1
n
siendo B = A· x − a
18/26
Bn La expresión sabemos que verifica n! Bn lim =0 n→ ∞ n! por lo que lim Rn , a ( x ) = 0
∀x ∈ E( a, r )
n→ ∞
Por el teorema anterior, las funciones sen x y cos x son desarrollables en cualquier punto en serie de potencias (la serie siempre es convergente) ya que todas sus derivadas están acotadas por 1. Por lo que sen x = x −
x3 x5 x 2 n +1 + − ......... + ( −1) n · + ....... 3! 5! (2n + 1)!
2n x 2 x4 n x cos x = 1 − + − ....... + ( −1) + ....... 2! 4! (2n )!
En el caso de ex , su derivada es ella misma y es una función no acotada, pero en el intervalo [-R, R] está acotada por e R ∀ R∈3+, por lo que también podemos decir que x2 x3 xn e = 1+ x + + + ...... + + ....... 2! 3! n! x
4. APLICACIONES AL ESTUDIO LOCAL DE FUNCIONES. 4.1. Extremos relativos. Curvatura. Recordemos algunas aplicaciones de las derivadas, vistas en el tema anterior. Si a es un punto del dominio de f tal que f´(a) = 0 entonces f tenía un mínimo relativo en a si f´´(a) > 0 o un máximo relativo si f´´(a) < 0. En caso de que f´´(a) = 0 no podríamos deducir nada. Se puede plantear si en ese caso, el signo de f´´´(a) nos aporta algún dato. O si fuese cero, si el dato lo aporta el signo de fIV) (a). Veamos un teorema que nos resuelve este problema. TEOREMA Sea f una función que verifica, para un cierto a∈Dom f. f´(a) = f´´(a) = …………. = fn-1)(a) = 0 fn)(a) ≠ 0 Se verifica: 1) Si n es par y fn)(a) > 0 entonces f tiene un mínimo relativo en a. 2) Si n es par y fn (a) < 0 entonces f tiene un máximo relativo en a.
19/26
3) Si n es impar, entonces f no tiene extremo relativo en a. Dem. Mediante Taylor podemos expresar f(x) como: f' (a) f" (a) f (n −1) (a) f (n) (θ) 2 n −1 f(x) = f(x 0 ) + (x − a) + (x − a) + ...... + (x − a) + (x − a) n 1! 2! (n − 1)! n! pero por las hipótesis iniciales se tiene que f (n) (θ ) f(x) = f(a) + (x − a) n n! 1) Si n es par, se tiene que las expresiones (x-a)n >0 y n!>0 (que lo es simplemente por ser producto de números naturales). Como además f(n)(a)>0 y f(n)(x) es continua ⇒ ∃δ > 0 tal que si: x−a <δ Así, si
x ∈ (a − ä, a + ä) ⇒
f(x) = f(a) +
⇒
⇒
f(n)(x)>0
f(n)(x)>0 y
f (n) (θ ) (x − a) n > f(a) n!
f(n)(θ)>0
⇒
si x ∈ (a − ä, a + ä)
por lo tanto, en “a” hay un mínimo relativo estricto. 2) Si n es par, se tiene que (x-a)n >0 y n!>0. Como además f(n)(a)<0 y f(n)(x) es continua ⇒ ∃δ > 0 tal que si: x−a <δ Así, si
x ∈ (a − ä, a + ä) ⇒
f(x) = f(a) +
⇒
⇒
f(n)(x)<0
f(n)(x)<0 y
f (n) (θ ) (x − a) n < f(a) n!
f(n)(θ)<0
⇒
si x ∈ (a − ä, a + ä)
por lo tanto, en “a” hay un máximo relativo estricto. 3) Si n es impar, se tiene que (x-a)n >0 si x>a y (x-a)n <0 si x
⇒
f (n) (θ ) (x − a) n tiene un signo si xa, n! por lo tanto no hay ningún extremo relativo en x=a. Podemos decir que en este caso tenemos un punto de inflexión. ⇒
Como f(x) = f(a) +
20/26
Veamos ahora un teorema similar, pero en lugar de hablar de extremos relativos, lo haremos con concavidad. TEOREMA Sea f una función que verifica, para un cierto a∈Dom f. f´´(a) = …… = fn-1)(a) = 0 fn)(a) ≠ 0 Se verifica: 1) Si n es impar entonces f tiene un punto de inflexión en a. 2) Si n es par y fn)(a) > 0 ⇒ f es convexa. 3) Si n es par y fn)(a) < 0 ⇒ f es cóncava. Dem. Análoga a la anterior. 4.2. Cálculo de límites. Una de las aplicaciones más importantes del polinomio de Taylor es su utilización a la hora del cálculo de límites mediante equivalencias i infinitésimos equivalentes. Notación de Landau Si
Rn +1 ( x) = 0 entonces se expresa diciendo que: x → x0 ( x − x ) n 0 lim
f ( x ) = Pn ( x , x 0 ) + Rn +1 ( x; x0 )
y
Rn +1 ( x; x0 ) =0 x → x0 ( x − x ) n 0 lim
pero también lo podemos expresar como: f ( x ) = Pn ( x , x 0 ) + o (( x − x0 ) n ) donde o (( x − x 0 ) n ) es la llamada “o pequeña de la notación de Landau” y representa a los términos del polinomio que están por detrás del último que hemos puesto, indicando que tienen en común grado n+1 y que si x tiende a x 0 entonces todos irían a 0 siendo así un infinitésimo representante del resto. Ejemplo de Equivalencia. Dado el desarrollo de McLaurin de la función f(x)=senx, tenemos que:
21/26
x3 x 5 x7 sen x = x − + − + o( x 7 ) 3! 5! 7! x 2 x4 x6 sen x = x 1 − + − + o( x 6 ) 3! 5! 7! sen x x2 x4 x6 =1− + − + o( x 6 ) x 3! 5! 7! Haciendo el límite cuando x→ 0, tenemos que: x2 x4 x6 sen x = lim 1 − + − + o( x 6 ) = 1 x →0 x→ 0 x 3! 5! 7!
lim
sen x = 1 con lo que, cuando x→ 0 la función f(x)=sen x y la función x →0 x g(x)=x son equivalentes y lo expresamos como: por lo tanto: lim
sen x ~ox Esto quiere decir que si un límite, cuando x→ 0 aparece la función senx podemos sustituirla por x. Pero tenemos una salvedad para esto y es cuando aparezca (senx-x), en cuyo caso, la equivalencia sen x ~ox no es suficiente ya que no es lo suficiente fina, es decir, senx es equivalente a x en cero, pero no es igual, por eso cuando tenemos (senx-x) debemos añadirle un término más a la equivalencia de manera que ésta sea más fina, es decir: x3 x 5 x7 sen x = x − + − + o( x 7 ) 3! 5! 7! sen x − x = −
sen x − x = −
x 3 x5 x7 + − + o (x 7 ) 3! 5! 7!
x3 x2 x4 1 − + + o( x 4 ) 3! 20 840
sen x − x x2 x4 = 1 − + + o( x 4 ) x3 20 840 − 3! Haciendo el límite cuando x→0: sen x − x x2 x4 = lim 1 − + + o( x 4 ) = 1 3 x →0 x →0 x 20 840 − 3!
lim
por lo tanto son equivalentes cuando x→0, es decir: 22/26
sen x − x ~ o −
x3 3!
Ejemplo de Límites: Tomando
o lo que es lo mismo
A)
sen x ~ o x −
x3 3!
sen x − x x →0 x3
lim
f ( x ) = sen x
f(x) = f(0) +
sen x = x −
f' (0) f" (0) 2 f' ' ' (0) 3 f IV (0) 4 f V (0) 5 x+ x + x + x + x + o( x 5 ) 1! 2! 3! 4! 5!
x3 x 5 + + o( x 5 ) 3! 5!
sen x − x = −
x3 x 5 + + o( x 5 ) 3! 5!
sen x − x = −
x3 x2 1 − + o( x 2 ) 3! 20
⇒
sen x − x x2 = 1 − + o( x 2 ) x3 20 − 3!
x2 sen x − x = lim 1 − + o( x 2 ) = 1 3 x →0 x →0 x 20 − 3!
lim
por lo tanto,
sen x − x ~ o −
x3 3!
y se tiene que:
x3 − sen x − x 3! = − 1 = − 1 lim = lim 3 x →0 x →0 x 3 3! 6 x 1 − cos x − B)
lim
x4
x →0
Tomando f(x) = f(0) +
x2 2
f ( x ) = cos x f' (0) f" (0) 2 f' ' ' (0) 3 f IV (0) 4 f V (0) 5 f VI (0) 6 x+ x + x + x + x + x + o (x 6 ) 1! 2! 3! 4! 5! 6!
cos x = 1 −
x2 x4 x6 + − + o (x 6 ) 2! 4! 6!
23/26
x2 x4 x6 cos x − 1 = − + − + o (x 6 ) 2! 4! 6! 1 − cos x =
x2 x4 x6 − + + o (x 6 ) 2! 4! 6!
1 − cos x −
x2 x4 x6 =− + + o (x 6 ) 2! 4! 6!
x2 x4 x2 1 − cos x − = − 1 − + o ( x 2 ) 2! 4! 30 1 − cos x − −
x4 4!
x2 2 2! = 1 − x + o( x 2 ) 30
1 − cos x − lim
x →0
−
x4 4!
Por lo tanto:
x2 2 2! = lim 1 − x + o( x 2 ) = 1 x→ 0 30
x2 x4 1 − cos x − ~o − 2 4! 1 − cos x − lim
x →0
x4
y se tiene que:
x2 x4 − 2! = lim 4! = − 1 = − 1 x→ 0 x 4 4! 24
4.3. Aproximaciones numéricas. Otra aplicación importante del polinomio de Taylor es la de poder calcular valores aproximados de funciones con un error menor que un valor predeterminado. Por ejemplo: Calcular el valor de log( 1'02) con un error menor de 10-4. Tomaremos para ello la función f ( x ) = log( 1 + x) que la evaluaremos en x=0’02 y utilizaremos como punto de referencia a=0. f ( x ) = log( 1 + x) f I (x ) =
1 1+ x
24/26
f II ( x ) =
−1 (1 + x) 2
f
III
(x ) =
2 (1 + x) 3
f
IV
( x) =
−3×2 (1 + x) 4
f
(n )
( x) =
( −1) n +1 ( n − 1)! (1 + x) n
. . .
Acotaremos el resto de Lagrange para localizar el menor valor de n, para el cual, el error cometido en la aproximación será menor que 10-4.
Rn ( x) =
f ( n +1 ) ( c) ( x − a) n +1 (n + 1)!
( −1) n + 2 ( n)! (1 + c ) n +1 1 = 0'02 n +1 = ⋅ ( 0'02) n +1 < … n +1 ( n + 1)! ( n + 1)(1 + c )
a
0
1 ⋅ ( 0'02) n +1 = E < 10 -4 n +1
Si n=3 → E= 4.10-8<10-4 Si n=2 → E=2’6.10-6<10-4 Si n=1 → E=2.10-6 <10-4 Entonces haremos la aproximación construyendo el polinomio de Taylor hasta n=2. f(x) = f( 0 ) +
f'( 0 ) f"(0 ) (x-0 ) + (x-0 ) 2 + R2 (x) 1! 2!
log( 1 + x ) = x −
1 2 x + R2 ( x) 2 1 (0'02) 2 + R2 ( x) 2
log( 1'02) = 0'02 − log( 1'02) ≈ 0'0198
25/26
NOTA Si nos piden un error menor que 10 − r es porque el error lo cometemos en la (r+1)-ésima cifra decimal, pero a veces este error afecta a la cifra r-ésima, por eso cuando nos piden que calculemos un valor con r cifras decimales exactas, debemos calcularlo con un error menor que 10 − (r +1) para que el error esté en la cifra decimal (r+2)-ésima, y como mucho afecte a la cifra decimal (r+1)-ésima, quedando así las r cifras primeras exactas.
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté
26/26
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 28 ESTUDIO GLOBAL DE FUNCIONES. APLICACIONES REPRESENTACIÓN GRÁFICA DE FUNCIONES. 1. 2. 3. 4. 5. 6. 7.
Introducción. Dominio. Continuidad. Puntos de Corte con los Ejes. Simetrías. Periodicidad. Asíntotas. 7.1. Asíntotas Horizontales. 7.2. Asíntotas Verticales. 7.3. Asíntotas Oblicuas. 8. Regionamiento. 9. Crecimiento y Decrecimiento. Extremos. 9.1. Teorema del Valor Medio. 9.2. Crecimiento y Decrecimiento de una función. 9.3. Caracterización de los Máximos y Mínimos Locales. 10. Curvatura. Puntos de Inflexión. 11. Representación Gráfica. Bibliografía Recomendada.
1/18
A
LA
TEMA 28 ESTUDIO GLOBAL DE FUNCIONES. APLICACIONES REPRESENTACIÓN GRÁFICA DE FUNCIONES.
A
LA
1. INTRODUCCIÓN. En los dos temas anteriores hemos estudiado propiedades de las funciones como la continuidad, derivabilidad, crecimiento, decrecimiento, curvatura, etc, todas ellas a nivel local. En este tema tratamos esas mismas propiedades pero a nivel global de la función. El desarrollo que vamos a realizar del tema será similar al que sigue cuando queremos realizar el estudio y representación de una función. 2. DOMINIO DEF Sea f: A 3 una función real de variable real. Llamemos grafo de f, y se denota por G(f), al conjunto de pares de la forma (x, f(x)). Es decir: G(f) = { (x, f(x)) } La definición anterior nos obliga a tener en cuenta para que valores x∈A existe su imagen mediante f. Ello es debido a que no se verifica que para todo elemento x de A existe f(x). Por tanto nos vemos obligados a definir un conjunto formado por aquellos elementos de A para los cuales exista f(x). DEF Sea f: A 3 una función real de variable real y A⊂3. Llamamos dominio de f, y lo representamos por Dom(f) al conjunto formado por los elementos de A para los cuales existe f(x).Es decir: Dom(f) = { x∈A / ∃ f(x)} Teniendo en cuenta esta definición podemos redefinir el conjunto grafo de f como: G(f) = { (x, f(x)) / x∈Dom(f)} PROP Sean f,g: A 3 dos funciones reales de variables real y A⊂3. Se verifican las siguientes propiedades: 1) Dom( f ± g ) = Dom( f ) I Dom( g ) 2) Dom( f ⋅ g ) = Dom( f ) I Dom( g ) 3) Dom( f / g ) = Dom( f ) I ( Dom( g ) − {x ∈ Dom ( g ) / g ( x) = 0}) 4) Dom( g o f ) = {x ∈ Dom( f ) / f ( x) ∈ Dom ( g )} Dem. Inmediata.
2/18
3. CONTINUIDAD DEF
Una función f: A
3 real de variable real es continua en x 0 ∈A si se verifica:
1) x 0 ∈ Dom( f ) 2) ∃ lim f ( x ) ( ⇔ los limites laterales existen y son iguales) x→ x 0
3) lim f ( x ) = f ( x 0 ) x → x0
DEF Diremos que la función f: A 3 real de variable real es continua en todo su dominio si es continua en x, ∀x ∈ Dom( f ) . A la vista de las dos definiciones anteriores nos podemos plantear la siguiente pregunta: ¿Cuándo una función no es continua en un punto? La respuesta sería cuando no se verifique alguna de las tres condiciones de la primera definición. Sea f: A 3 una función real de variable real y x 0 ∈ A . DEF
Diremos que f presenta una discontinuidad evitable en x=x 0 si existe lim f ( x ) x → x0
pero no existe f(x 0 ). OBS Recibe el nombre de discontinuidad evitable ya que se podría evitar si definimos f(x 0 ) como f(x 0 ) = lim f ( x ) x → x0
DEF Diremos que f presenta una discontinuidad inevitable de salto finito en x=x 0 si existen lim − f ( x) y lim + f ( x) y son finitos pero distintos. x → x0
x → x0
DEF Diremos que f presenta una discontinuidad inevitable de salto infinito en x=x 0 si alguno de los limites laterales no existe o es infinito. 4. PUNTOS DE CORTE CON LOS EJES. Sea f: A 3 una función real de variable real. Sabemos que el eje de abcisas tiene por ecuación y=0, por tanto, los puntos de la función que cortan al dicho eje son aquellos que verifican la ecuación: f(x)=0. Si 0∈Dom(f) entonces la función f también intersectará con el eje de ordenadas, siendo (0, f(0)) el punto de corte.
3/18
5. SIMETRIAS DEF Sea f: A 3 una función real de variable real. Diremos que f es una función simétrica respecto de un cierto eje vertical x=a si se verifica: f(a+x) = f(a-x) ∀x ∈ dom( f ) . Si a=0 entonces f es simétrica respecto del eje de ordenadas y recibe el nombre de función simétrica par, verificándose: f(x) = f(-x) ∀x ∈ dom( f ) . Ser simétrica respecto de un eje vertical x=a, geométricamente significa que si doblamos el plano respecto de dicho eje ambos trozos de la gráfica se superponen (coinciden). DEF Sea f: A 3 una función real de variable real. Diremos que f tiene simetría impar si se verifica: f(-x) = -f(x)
∀x ∈ dom( f ) .
Geométricamente, que la función tenga simetría impar significa que si doblamos el plano respecto del eje de ordenadas y a continuación respecto del eje de abcisas, las gráficas se superponen. También se conoce como ser simétrica respecto del origen de coordenadas. En general, para que una función f: A IR sea simétrica, par o impar, debe cumplirse como condición necesaria que el conjunto Dom(f) sea simétrico respecto del punto x=0. OBS Nunca vamos a encontrar una función que tenga una gráfica que sea simétrica respecto de un eje horizontal, ya que en ese caso existirían valores de x pertenecientes al dominio de f que tendrían mas de una imagen, lo que entra en conflicto con la propia definición de función. Este es el caso que nos encontramos con las gráficas de la circunferencia, la elipse, la hipérbole, etc, que no se pueden expresar como funciones. 6. PERIOCIDAD DEF Sea f: A 3 una función real de variable real. Diremos que f es una función periódica si existe una constante T>0 tal que f(x + T) = f(x) ∀x ∈ dom( f ) . Llamaremos periodo de la función f a la menor de dichas constantes. Si una función es periódica de periodo T, para representarla gráficamente sólo es necesario hacerlo en un intervalo de la forma [x, x + T], ya que el resto de la gráfica consiste en repetir la representación anterior a lo largo del dominio.
4/18
Ejemplo Las funciones f(x)=Sen x, f(x)=Cos x y f(x)=Tg x son periódicas de periodo 2ð, 2ð, ð respectivamente. La función f(x)=Sen 2x es periódica de periodo ð ya que: f(x + ð) = Sen (2(x + ð)) = Sen (2x + 2ð) = Sen 2ð = f(x) 7. ASÍNTOTAS DEF Diremos que un punto se aleja infinitamente sobre una curva cuando su abcisa o su ordenada o ambas coordenadas crecen infinitamente. Podemos afirmar que el punto recorre una rama infinita. DEF Si al recorrer un punto P una rama infinita la recta OP tiende a una posición límite, entonces esa recta límite y sus paralelas definen una dirección asíntota. DEF Llamaremos a la recta r asíntota de la curva y = f(x) si su dirección es una dirección asíntota de la curva y la distancia de un punto P a la recta r tiende a cero cuando P se aleja infinitamente. 7.1.
Asíntotas Horizontales.
DEF Llamaremos Asíntota Horizontal de f(x) a la recta y = K = cte. que verifica una de las dos condiciones siguientes: 1) lim f ( x ) = K x →+∞
2) lim f ( x ) = K x →−∞
El estudio de las asíntotas horizontales cuando x → +∞ es independiente de cuando x → −∞ , por tanto no tiene porque existir asíntota por ambos lados simultáneamente ni tiene porque ser la misma en los dos lados. PROP Sea f: 3 3 una función real de variable real. Cuando x tiende a + ∞ la asíntota horizontal, en caso de existir, es única. Dem. Supongamos que f(x) presenta dos asíntotas horizontales en y = K e y = K’, con K ≠ K’, cuando x tiende a + ∞ . Entonces, por definición lim f ( x ) = K y
x →+∞
lim f ( x ) = K ’
x →+∞
Pero obtenemos una contradicción ya que el límite, al existir, es único. Por tanto, K = K’ y la asíntota horizontal es única.
5/18
PROP Sea f: 3 3 una función real de variable real. Cuando x tiende a - ∞ la asíntota horizontal, en caso de existir, es única. Dem. Análoga a la anterior. Ejemplos 1) f(x) = arctg x π π ⇒ Presenta A.H. en y= 2 2 −π π lim arctgx = ⇒ Presenta A.H. en y= − x →−∞ 2 2 lim arctgx =
x →+∞
2) f(x) =
ln x x
ln x 1/ x = lim = 0 ⇒ Presenta A.H. en y = 0 x → +∞ x 1 ln x ¬∃ lim ⇒ No tiene A.H. x →−∞ x lim
x →+∞
3) f(x) = e − x
3
3
lim e − x = 0 ⇒ Presenta A.H. en y=0
x →+∞
3
lim e − x = +∞ ⇒ No presenta A.H.
x →−∞
7.2.
Asíntotas Verticales.
DEF Sea f: 3 3 una función real de variable real. Llamamos Asíntota Vertical de f(x) a la recta x=a si se verifica alguna de las condiciones siguientes: 1) lim − f ( x) = −∞
2) lim − f ( x) = +∞
3) lim + f ( x ) = −∞
4) lim + f ( x ) = +∞
x →a
x →a
x →a
x →a
También podríamos haber dado como definición de asíntota vertical la siguiente: “Una función f(x) tiene como asíntota vertical la recta x=a si presenta en el punto x=a una discontinuidad inevitable de salto infinito.” Es probable, aunque no obligatorio, encontrar asíntotas verticales en los puntos de adherencia del conjunto dom(f) que no pertenecen al interior de dom(f). 6/18
Igualmente, si la función está definida a trozos, también hemos de buscar posibles asíntotas verticales en los puntos de cambio de trozo. Ejemplos x si x ≤ 0 1) f ( x ) = ln x si x > 0 lim f ( x ) = lim− x = 0 ⇒ No presenta A.V.
x →0 −
x→ 0
lim f ( x ) = lim+ ln x = −∞ ⇒ Presenta A.V. en x=0
x →0 +
x →0
2) f(x) =
ln x x
Dom(f) = (0, + ∞ ) Sólo podemos estudiar la existencia de asíntota vertical a la derecha de x= 0 ln x lim+ f ( x ) = lim+ = −∞ ⇒ Presenta A.V. a la derecha de x=0 x →0 x→ 0 x −
3) f(x) = e
1 ( x −1) 2
Dom(f) = 3 –{1} −
lim− f ( x) = lim− e x →1
x →1
−
lim+ f ( x) = lim+ e x →1
1 ( x−1) 2
= e −∞ = 0
1 ( x −1 )2
x →1
= e −∞ = 0
Por tanto no existe asíntota vertical por ninguno de los lados. 7.3 Asíntotas Oblicuas. DEF Sea f: 3 3 una función real de variable real. Diremos que f presenta una Asíntota de ecuación y = mx+n con m,n∈3 m≠ 0, llamada asíntota oblicua, si verifica una de las dos condiciones siguientes: 1) lim
f ( x) =m y x
2) lim
f ( x) =m y x
x →+∞
x →−∞
lim ( f ( x) − mx) = n
x →+∞
lim ( f ( x) − mx) = n
x →−∞
7/18
El estudio de la existencia de asíntota oblicua cuando x tiende a + ∞ es independiente del que se realiza cuando x tiende a -∞ , y no tienen por qué existir asíntotas por ambos lados ni ser iguales. PROP Sea f: 3 3 una función real de variable real. La asíntota oblicua de f(x) cuando x tiende a + ∞ , en caso de existir, es única. Dem. La demostración se realiza de forma análoga a la que vimos con asíntotas horizontales, basándonos en la unicidad del límite. PROP Sea f: 3 3 una función real de variable real. La asíntota oblicua de f(x) cuando x tiende a - ∞ , en caso de existir, es única. Dem. Igual que la anterior. Otra consecuencia que podemos deducir de la unicidad del límite es que las asíntotas horizontales y oblicuas de f(x) por el mismo lado ( x → +∞ ó x → −∞ ) son mutuamente excluyentes. La existencia de una de ellas impide la existencia de la otra. Ejemplo. f(x) =
x3 + 1 x2
x3 +1 2 f ( x) x3 + 1 lim = lim x = lim =1 ⇒ m =1 x →+∞ x→ +∞ x →+∞ x x x3 x3 + 1 x3 + 1− x3 1 lim ( f ( x) − x) = lim ( 2 − x) = lim = lim 2 = 0 ⇒ n = 0 2 x →+∞ x → +∞ x → +∞ x → +∞ x x x Existe asíntota oblicua cuando x → −∞ en y = x 8. REGIONAMIENTO Utilizando todos los datos obtenidos hasta este momento, en este paso se trata de localizar las regiones del plano en las que se va a situar la gráfica de la función, de manera que podamos aclarar aún más su forma. Por tanto, estudiando el regionamiento podemos saber, por ejemplo si nos ajustamos por arriba o por abajo a una asíntota horizontal. Para aclarar más el estudio del regionamiento, utilizaremos la información que nos puede ofrecer la primera derivada de f(x).
8/18
9. CRECIMIENTO Y DECRECIMIENTO. EXTREMOS El estudio de máximos y mínimos de una función f(x) consiste en encontrar puntos que verifiquen alguna de las siguientes propiedades: 1) Algún punto x = a∈Dom f tal que existe un entorno centrado en dicho punto, E(a,r), de manera que f(a) ≥ f(x) ∀ x∈E(a,r). El punto x = a recibe el nombre de máximo relativo de f(x). 2) Algún punto x = a∈Dom f tal que existe un entorno centrado en dicho punto, E(a,r), de manera que f(a) ≤ f(x) ∀ x∈E(a,r). El punto x = a recibe el nombre de mínimo relativo de f(x). 3) Un punto x = a tal que f(a) ≥ f(x) ∀ x∈Dom f. Este punto recibe el nombre de máximo absoluto de f(x) y no tiene por que ser único. 4) Un punto x = a tal que f(a) ≤ f(x) ∀ x∈Dom f. Este punto recibe el nombre de mínimo absoluto de f(x) y no tiene por que ser único. Los puntos del dominio de f(x) que hay que considerar a la hora de buscar máximos y mínimos, ya sean relativos o absolutos, deben cumplir alguna de las siguientes condiciones: 1) Sean puntos críticos de f, es decir, sean solución de la ecuación f’(x) = 0. 2) Si Dom f = [a,b], entonces los puntos x = a y x = b. 3) Los puntos del Dom f en los que l función f(x) no sea derivable. 9.1.
Teorema Del Valor Medio.
TEOREMA. TEOREMA DE ROLLE. Sea f:[a,b]→ 3 una función continua en [a,b] derivable en (a,b) y f(a)=f(b). Entonces existe al menos un punto c∈(a,b) tal que f´(c)=0. Dem Sabemos por el teorema de Weierstrass que toda función continua definida en un cerrado alcanza un valor máximo y mínimo en el intervalo. Según donde podamos localizar ese máximo y ese mínimo vamos a distinguir dos casos: 1) Tanto el máximo como el mínimo está en los extremos. Como f(a)=f(b) ⇒maxf=minf ⇒f es cte. Si el máximo y el mínimo de f son iguales, necesariamente f tiene que ser constante. Si f es constante su derivada es cero y entonces c es cualquier punto de (a,b). Recordemos que a y b no pueden ser ya que f no es derivable en ellos. 2) Al menos uno de ellos se alcanza en el interior. En un teorema anterior vimos que "si f alcanza un extremo relativo en a y existe f´(a) entonces f´(a)=0". Al localizarse el extremo absoluto en el interior también es relativo y como en ese punto (al ser interior) es derivable, su derivada es cero. Llamaremos a ese punto x=c y se verifica que: c∈(a,b) y f´(c)=0.
9/18
OBS La interpretación geométrica del teorema de Rolle es que una función continua es derivable e igual en sus extremos debe tener un punto cuya recta tangente sea horizontal. El siguiente teorema a ver es el del Valor medio o Lagrange. Supone una generalización del anterior, pues en éste eliminamos la hipótesis de que f(x) coincida en los extremos del intervalo. Lo que vamos a conseguir ahora es un punto x=c que va a tener tangente paralela a la recta que une los puntos (a,f(a)) y (b,f(b)). TEOREMA. TEOREMA DE LAGRANGE. Sea f:[a,b]→ 3 continua en [a,b] y derivable en (a,b). Entonces c∈(a,b) tal que f ' (c ) =
f (b ) − f (a ) b−a
Dem. Definimos ϕ:[a,b]→ 3 x→ϕ(x)=f(x)+mx, donde m=-
f (b ) − f ( a ) ∈ b−a
para que ϕ(a) = ϕ(b) ϕ es continua en [a, b] ϕ es derivable en ( a, b) ⇒ ∃c ∈ ( a, b) / ϕ´(c ) = 0 ϕ( a ) = ϕ(b ) ϕ´(x) = f´(x)+m ⇒ ϕ´(c) = f´(c)+m = 0 ⇒ f´(c) =
f (b )· f ( a) ⇒ b−a
⇒f´(c)(b-a) = f(b)-f(a).
Geométricamente existe al menos un punto de la gráfica de f, distinto de sus extremos Ay B en el que la tangente de la gráfica es paralela a la cuerda AB. PROP Si f´(x) = 0 ∀x∈(a,b) ⇒ f=cte. Dem ∀x1 ,x2 ∈(a,b) con x1 ,x2 consideremos [x1 ,x2 ]⊂(a,b). Como f´(x) = 0 ⇒ f es
10/18
derivable en (a,b) ⇒ es continua en (a,b) ⇒ f es continua en [x1 ,x2 ] y derivable en (x1 ,x2 ). Aplicando el teorema del valor medio:
∃c∈(x1 ,x2 ) / f´(c)
f ( x2 ) − f ( x1 ) f ( x 2 ) − f ( x1 ) x 2 − x1 = 0 ⇒ f ( x2 ) − f ( x1 ) = 0 ⇒ x 2 − x1 f ´(c ) = 0
Entonces f(x1 )=f(x2 ) ∀x1 , x2 ∈(a,b) Por tanto f es una función constante. PROP Si f y g son dos funciones que tienen la misma derivada entonces se diferencian en una constante. Dem Sean las funciones f,g:A→R con f´(x)=g´(x) ∀x∈A siendo A un intervalo abierto. Consideremos la función f-g. Su derivada: (f-g)´=f´-g´= 0 ⇒ (f-g)=cte. 9.2.
Crecimiento y Decrecimiento de una función.
DEF
Diremos que una función f: 3 → 3 real de variable real creciente en un
intervalo [a,b] ⊂ Dom f. Si ∀ x1 ,x2 ∈[a,b] con x1
Diremos que una función f: R → R real de variable real decreciente en un
intervalo [a,b] ⊂ Dom f. Si ∀ x1 ,x2 ∈[a,b] con x1
f ( x) − f ( x 0 ) si x > x 0 ⇒ f ( x ) > f ( x0 ) >0 ⇒ x − x0 si x < x 0 ⇒ f ( x) < f ( x 0 )
Por tanto f(x) es creciente cerca de x0 , tanto antes como después. Y como eso ocurre para cualquier punto x0 ∈I, entonces la función es creciente en I.
11/18
TEOREMA. Si f´(x)<0 ∀x∈I ⇒ f(x) es estrictamente decreciente en I. Dem La demostración es igual que la anterior. Sea x0 ∈I un punto cualquiera. Sabemos que f´(x0 )>0. Como f´(x0 )= limx→xo
f ( x) − f ( x 0 ) si x > x 0 ⇒ f ( x ) < f ( x0 ) <0⇒ x − x0 si x < x 0 ⇒ f ( x) > f ( x0 )
Vemos que la función es decreciente en x0 ⇒lo es en todo I. El recíproco de las dos proposiciones anteriores es falso. Por ejemplo, si f es creciente es fácil comprobar que f’(x)= 0 (por ejemplo para f(x)= x3 + 1). Vamos ahora a dar un método general para poder afirmar si un punto singular es un máximo o mínimo local, o ninguna de ambas cosas. Para ello tengamos en cuenta las siguientes gráficas:
x1
f’>0 f’<0
x1
x1
f’<0 f’>0
f’<0 f’<0
x1
f’>0 f’>0
Si f’> 0 en algún intervalo a la izquierda de x0 y f’< 0 en algún intervalo a la derecha de x0 entonces x0 es un máximo relativo. Si f’< 0 en algún intervalo a la izquierda de x0 y f’> 0 en algún intervalo a la derecha de x0 entonces x0 es un mínimo relativo. Si f’ tiene el mismo signo en algún intervalo tanto a la derecha como a la izquierda de x0 entonces x0 no es un extremo relativo. 9.3.
Caracterización de los Máximos y Mínimos locales.
PROP Sea una función f: 3 → 3 real de variable real, y a ∈ Dom( f ) , un punto en el que existe f’(a) y f’’(a). Sea f’(a)= 0, se verifica 1) Si f’’(a) > 0 entonces f tiene un mínimo relativo en x = a. 2) Si f’’(a) < 0 entonces f tiene un máximo relativo en x = a Dem. 1) Por definición tenemos que 12/18
f ' ' (a ) = lim
h→ 0
f ' (a + h) − f ' ( a ) h
y como f’(a)= 0 f ' ' (a ) = lim
h→ 0
f ' ( a + h) h
f ' ( a + h) > 0 para h suficientemente pequeño. h Si h → 0 + ⇒ f ' ( a + h ) > 0 ⇒ f crece a la derecha de a. Si h → 0 − ⇒ f ' (a + h ) < 0 ⇒ f crece a la izquierda de a. Luego f(x) presenta en x= a un mínimo relativo 2) Análoga. Por hipótesis f ' ' ( a) > 0 ⇒
PROP Sea una función f: 3 → 3 real de variable real. Sea a ∈ Dom( f ) tal que existe f’(a) y f’’(a). 1) Si f tiene un mínimo relativo en x = a entonces f’’(a) ≥ 0 . 2) Si f tiene un máximo relativo en x = a entonces f’’(a) ≤ 0 . Dem. 1) Supongamos que f tiene un mínimo relativo en x = a si f’’(a) < 0 entonces, aplicando el teorema anterior, f tendría un máximo local en x = a. Pero si f presenta en x = a un máximo y un mínimo entonces sería constante y, por tanto, f’’(a) = 0 lo cual es una contradicción. Por tanto f’’(a) ≥ 0 . 2) Análoga a la anterior. 10.CURVATURA. PUNTOS DE INFLEXIÓN. DEF Diremos que una función f es convexa en un intervalo si para todo par de puntos x1 , x2 de ese intervalo, el segmento rectilíneo que une (x1 , f(x1 )) con (x2 , f(x2 )) queda por encima de la gráfica de f.
x1
x2
La condición geométrica en la que basamos la definición podemos expresarla analíticamente. La recta que une (x1 , f(x1 )) con (x2 , f(x2 )) es
13/18
f ( x 2 ) − f ( x1 ) ( x − x1 ) + f ( x1 ) x2 − x1 La recta g(x) quedará por encima de f(x) siempre que se verifique g(x)>f(x), y g ( x) =
es: f ( x 2 ) − f ( x1 ) f ( x ) − f ( x1 ) > ∀x ∈ ( x1 − x 2 ) x 2 − x1 x − x1 obteniendo una definición equivalente. Por tanto: DEF
Una función f: 3 → 3 real de variable real es convexa en un intervalo si para
x1 , x2 y x con x1 < x < x2 se verifica f ( x2 ) − f ( x1 ) f ( x ) − f ( x1 ) > x 2 − x1 x − x1 Análogamente vamos a definir función cóncava. DEF Diremos que una función f es cóncava en un intervalo si para todo par de puntos x1 , x2 de ese intervalo, el segmento rectilíneo que une (x1 , f(x1 )) con (x2 , f(x2 )) queda por debajo de la gráfica de f.
x1
DEF
x2
Una función f: 3 → 3 real de variable real es cóncava en un intervalo si para
x1 , x2 y x con x1 < x < x2 se verifica f ( x2 ) − f ( x1 ) f ( x ) − f ( x1 ) < x 2 − x1 x − x1 PROP Sea f: 3 → 3 una función real de variable real y convexa. Sea a ∈ dom( f ). 1) Si f es derivable en x = a entonces la gráfica de f queda por encima de la tangente a f en (a, f(a)) excepto en (a, f(a)) 2) Si a < b y f es derivable en a y en b, entonces f’(a) < f’(b) Dem. Sea 0 < h1 < h2 y consideremos los puntos a < a + h1 < a + h2 . Como f es convexa se verifica f ( a + h1 ) − f ( a ) f ( a + h2 ) − f ( a) < h1 h2
14/18
Si tomamos límites cuando h1 → 0 + f ( a + h1 ) − f ( a ) f ( a + h2 ) − f ( a) lim + < lim + h1 →0 h1 → 0 h1 h2 f ( a + h2 ) − f ( a) f ' ( a) < h2 llegamos a que la pendiente de la recta tangente es menor que la pendiente de la secante que pasa por (a, f(a)) y (a + h2 , f(a + h2 )) lo cual implica que el punto (a + h2 , f(a + h2 )) queda por encima de la recta tangente. De forma análoga, si h2 < h1 < 0 y consideramos a + h2 < a + h1 < a como f es convexa se verifica: f ( a + h1 ) − f ( a ) f ( a + h2 ) − f ( a) < h1 h2 Si tomamos límites cuando h1 → 0 − f ( a + h1 ) − f ( a ) f ( a + h2 ) − f ( a) lim − > lim − h1 →0 h1 → 0 h1 h2 f ( a + h2 ) − f ( a ) f ' ( a) > h2 y esto nos indica que la pendiente de la recta tangente es mayor que la pendiente de la secante que pasa por (a, f(a)) y (a + h2 , f(a + h2 )) lo cual implica que el punto (a + h2 , f(a + h2 )) queda por encima de la recta tangente en x = a. 3) Sea a < b. Entonces b = a + (b-a) f ( a + ( b − a) − f ( a) f (b) − f ( a) f ' ( a) < por ser b − a > 0 ⇒ f ' ( a ) < b−a b−a f (b + ( a − b) − f (b ) f ( a) − f (b ) f ' (b) > por ser a − b < 0 ⇒ f ' ( b) > a−b a −b f (b ) − f ( a ) luego, f ' ( a) < < f ' (b) b−a LEMA Supongamos que f: 3 → 3 una función real de variable real es derivable y f’ creciente. Si a < b y f(a) = f(b) entonces f(x) < f(a) = f(b) para a < x < b. Dem. Supongamos que f(x) > f(a) = f(b) para algún x ∈ ( a, b ) Entonces el máximo de f sobre [a,b] se presenta en algún punto x 0 ∈ (a, b) con f(x0 ) > f(a) y por supuesto f’(x0 ) = 0. Por otra parte, aplicando el teorema del valor medio al intervalo [a,x0 ] encontramos que existe un punto x1 cib a < x1 < x0 y f ( x0 ) − f ( a) f ' ( x1 ) = >0 x0 − a y eso está en contradicción con que f’ sea creciente ya que f ' ( x1 ) > f ' ( x0 ) = 0 y x1 > x0 .
15/18
Luego hemos demostrado que f(x) ≤ f(a) = f(b) para a < x < b y solo nos queda por ver que f(x) = f(a) para algún x ∈ ( a, b ) . Sabemos que f no es constante sobre [a,x] ya que si lo fuese f’ no sería creciente, de modo que existe algún x1 con a < x1 < x y f(x1 ) < f(a). Aplicando el teorema del valor medio a [x1 ,x] deducimos que existe un punto x2 con x1 < x2 < x y f ( x) − f ( x1 ) f ' (x 2 ) = >0 x − x1 Por otra parte, f’(x) = 0, puesto que hay un máximo relativo en x. De nuevo llegamos a una contradicción por ser f’ creciente.
TEOREMA Sea f: 3 → 3 una función real de variable real. Si f es derivable y f’ creciente, entonces f es convexa. Dem. Sea a
f (b ) − f ( a) ( x − a) b−a
Es fácil ver que g’(x) es una función creciente, y como g(a)=g(b)=f(a), aplicamos el Lema anterior a g(x) y g(x)
f (b) − f ( a) ( x − a ) < f ( a) b−a
f ( x) − f ( a) f (b ) − f ( a ) < x−a b−a Por lo tanto f es convexa. DEF Llamaremos punto de inflexión de f a x = a si la tangente a la grafica de f en (a, f(a)) cruza la gráfica. PROP Sea f: 3 → 3 una función real de variable real. Si f es derivable de orden dos en x0 y f’’(x0 ) > 0, entonces f es convexa en x0 . Dem. 16/18
Inmadiata PROP Sea f: 3 → 3 una función real de variable real. Si f es derivable de orden dos en x0 y f’’(x0 ) < 0, entonces f es cóncava en x0 . Dem. Inmediata PROP Sea f: 3 → 3 una función real de variable real. Si f es derivable de orden dos en x0 y x0 es un punto de inflexión entonces f’’(x0 ) = 0. Dem. Inmediata 11. REPRESENTACIÓN GRÁFICA. ln x x 1. Dominio: Dom( f ) = (0,+ ) 2. Puntos de corte con los ejes: OY: x = 0; no existe
1) f ( x ) =
OX:
y = 0 → f ( x) = 0 ⇒
ln x = 0 → ln x = 0 → x = 1 → P(1,0) x
3. Simetrías: No hay 4. Periodicidad: No hay 5. Asíntotas a) Horizontal: 1 ln x ∞ lim = = {L ' Hopital } = lim x = 0 → y = 0 x →+∞ x x→ +∞ x ∞ b) Vertical: ln x − ∞ lim = + = −∞ → x = 0 x →0 + x 0 c) Oblicua: No hay porque hay horizontal 6. Crecimiento y decrecimiento. Extremos. 1 − ln x f ' (x ) = x2 f ' ( x ) = 0 → 1 − ln x = 0 ⇒ ln x = 1 → x = e ⇒ P (e,1 e) Máximo f ' ( x ) > 0∀x ∈ ( 0, e ) Se cumple que f ' ( x ) < 0∀x ∈ ( e,+∞) 7. Curvatura. Puntos de inflexión.
17/18
f ' ' ( x) =
− 3 + 2 ln x x3
3 f ' ' ( x) = 0 → −3 + 2 ln x = 0 → x = e 3 / 2 ⇒ P e 3 / 2 , 3 / 2 2e f ' ' ( x) < 0 ⇔ x ∈ (0, e 3 / 2 ) Se cumple que f ' ' ( x) > 0 ⇔ x ∈ (e 3 / 2 ,+∞) 8. Gráfica:
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Análisis Matemático 2ª Edición. Aut. T. M. Apostol. Ed. Reverté Introducción al Análisis Matemático. Aut. J.M. Ortega. Ed. Labor
18/18
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 29 EL PROBLEMA DEL CÁLCULO DEL ÁREA. INTEGRAL DEFINIDA. 1. Introducción. 2. Definición de integral de Riemann. 2.1. Particiones. 2.2. Suma superior y suma inferior. 2.3. Integral de Riemann. 3. Propiedades de la integral. 4. Teorema fundamental del cálculo y regla de Barrow. 5. Derivación de una función definida mediante una integral. 6. Sumas de Riemann. 7. Integrales impropias. Bibliografía Recomendada.
1/21
TEMA 29 EL PROBLEMA DEL CÁLCULO DEL ÁREA. INTEGRAL DEFINIDA. 1. INTRODUCCIÓN. El cálculo trata, principalmente, dos problemas geométricos: 1) Encontrar la recta tangente a una curva. 2) Hallar el área limitada por una curva. El primero lo hemos resuelto mediante un paso al límite, conocido con el nombre de diferenciación. El segundo vamos a ver que también lo resolveremos mediante un paso al límite, y lo llamaremos integración. Hasta ahora sólo se podían calcular áreas encerradas por polígonos que se ueden formar como composición de las anteriores. Si queremos hallar el área encerrada entre una curva y=f(x), el eje OX y las rectas verticales x=a y x=b:
lo que haremos será utilizar la idea anteriormente expuesta, es decir, vamos a usar la fórmula del área de un rectángulo para aproximar y calcular el área A.
Si sumamos el área encerrada en los rectángulos R1 , R2 y R3 obtendremos una aproximación del área A que en este caso será por defecto. La pregunta es: ¿Podemos conseguir calcular el área A usando el área de rectángulos? La respuesta es afirmativa, pero para ello debemos encontrar rectángulos de base infinitesimal, es decir, rectángulos de base puntual. Así, al sumar las áreas de todos los rectángulos estamos sumando las longitudes de todas las líneas verticales que hay entre x=a y x=b (limitadas por el eje OX y la propia curva) y esto formará el área A.
2/21
Esta idea o concepto lo llamaremos integral de Riemann. Esto nos proporciona una idea fundamental: la integración consiste en realizar una suma. 2. DEFINICIÓN DE INTEGRAL DE RIEMANN. 2.1. PARTICIONES. DEF Sea [a,b]⊂R un intervalo cerrado. El conjunto π={ x0 ,x1 ,...,xn } que satisface todas las desigualdades a = x0
s(f, π 1 ) =
∑ m (x i
i
− xi −1 )
i =1
2) Suma superior de f(x) en la partición π 1 a: 3/21
n
S(f,π 1 ) =
∑ M (x − x i
i
i −1
)
i =1
y se verifica que: s(f, π 1 ) ≤ A≤S(f, π 1 )
DEF Llamaremos integral inferior de f(x) en [a,b] y se representa por
∫
b
a
∫
a
b
a
f al número:
f =Sup {s(f,π) / π∈[a,b] }
DEF Llamaremos integral superior de f(x) en [a,b] y se representa por b
∫
∫
b
a
f al número:
f = Inf {S(f, π) / π∈∏ [a,b]}
PROP Sean π 1 , π2 ∈∏ [a,b]. Se verifica: s(f, π 1 )≤S(f, π 2 ) Dem s(f, π 1 ) ≤ (f, π 1 ∪π2 )≤S(f, π 1 ∪π 2 )≤S(f,π2 ) 2.3. INTEGRAL DE RIEMANN. DEF Sea f:[a,b]→R función acotada. Diremos que es integrable en sentido Riemann si:
∫
b
a
b
f =∫ f a
y el número que resulta se expresa como:
∫
b
a
f
PROP Sea f:[a,b]→R acotada. Son equivalentes: 1) f es integrable Riemann.
4/21
2) ∀ε>0 ∃π∈∏ [a,b] / S(f,π) - s(f, π) < ε Dem 1)⇒2). Llamaremos A=
∫
b
a
b
b
a
a
f = ∫ f = ∫ f y sea ε>0.
Como A=Sup{s(f,π) / π∈∏ [a,b]} ⇒ dado ε/2>0 ∃π2 ∈∏ [a,b] / A+ε/2 >S(f, π 2 ). Teniendo en cuenta que π 1 ∪π2 es más fina que π 1 y π2 : A-ε/2 < s(f, π 1 ) ≤s(f, π 1 ∪π2 )≤S(f, π 1 ∪π2 ) < A+ε/2 y entonces A-ε/2 < s(f, π 1 ∪π 2 )≤S(,fπ 1 ∪π2 )
s(f, π) ≤ ∫ f . Entonces a
∫
b
a
∫
b
a
f ≤S(f, π) y
b
f - ∫ f <ε. a
Y como por hipótesis la desigualdad es cierta para todo ε mayor que cero, deducimos:
∫
b
a
b
f =∫ f a
PROP Sea f:[a,b]→R una función acotada. 1) Si f es contínua ⇒ f es integrable Riemann. 2) Si f es monótonoa ⇒ f es integrable Riemann. Dem 1) Para ver que f es integrable Riemann basta ver que para cada ε>0 ∃π∈π[a,b] de modo que S(f, π)-s(f, π) <ε. Como f es contínua en un cerrado entonces f es uniformemente contínua, luego dado ε>0 tomamos: ε´ =
ε ⇒ ∃δ > 0 / x − x´ < δ ⇒ f ( x) − f ´( x) < ε´ b−a
5/21
Sea π∈[a,b] una partición para la que dos pntos consecutivos disten menos que δ: π={x0 ,x1 ,....,xn } / |xi-xi-1|<δ ∀i:1...n Entonces: n
S(f,
π)-s(f,
π)
i =1
n
n
∑ M i (xi − xi−1 ) - ∑ mi (x i − xi−1 )
=
=
i =1
n
= ∑ ( M i − mi )( xi − x i −1 ) = ∑ ( f (αi ) − f ( βi ))( xi − xi −1 ) i =1
i =1
donde f(α i) es el valor máximo de la función en [xi-1,xi] y x=αi donde se alcanza. f(β i) es el valor mínimo de la funcion en [xi-1,xi ] y x=βi donde se alcanza. Como |α i-βi| < δ ⇒ |f(α i)-f(β i)| < ε´
n
≤ ∑ ε´( x i − xi −1 ) = ε´(b − a) = ε i =1
Luego f es integrable en sentido Reimann. 2) Veamos el caso de ser f creciente ( si f es decreciente la demostración es análoga). Sea π∈∏ [a,b] una partición, π={x0 ,...,xn } y |xi- xi-1|<δ ∀i: 1...n. n
S(f, π)-s(f, π) =
∑ (M
i
− mi )( xi − x i −1 ) =
i =1
como f es monótona creciente Mi=f(xi) y mi=f(xi-1) n
=
n
∑ ( f ( xi ) − f ( xi−1 )) · (xi − x i−1 ) < ∑ ( f ( xi ) − f ( xi−1 ))·δ = i =1
i =1
n
=δ· ∑ ( f ( xi ) − f ( xi −1 )) = δ·(f(b)-f(a)) = ε i =1
Tomando δ =
ε f (b ) − f ( a )
DEF Dada una partición π∈π[a,b], llamamos suma de Riemann a cualquier suma S(f, n
π,τ) =
∑ f (τ )( x i
i
− x i −1 ) , donde π={x0 ,...,xn } y τi ∈[xi-1,xi].
i =1
PROP Sea f:[a,b]→R una función acotada. Son equivalentes: 6/21
1) f es integrable Riemann en [a,b]. 2) ∃Α⊂R / ∀ε>0 ∃π 0 ∈[a,b], si π>π0 y consideramos una suma de Riemann de π, se verifica que: b
|A-S(f, π,τ)| < ε y además A= ∫ f a
Dem b
1)⇒2). Sea A= ∫ f . Veamos que A cumple 2). a
s(f, π)≤
∫
b
a
b
f =∫ f = a
∫
b
a
f ≤ S ( f , π)
∀π ∈ [a, b ]
Se verifica que s(f,π)≤S(f, π,τ)≤S(f, π) Entonces: |A-S(f, π,τ)| ≤ S(f, π)-s(f, π) Como f es integrable Riemann: Dado ε>0 ∃π 0 ∈π[a,b] / S(f, π)-s(f, π)<ε Si π>π0 ⇒ S(f, π)-s(f,π) ≤ S(f, π 0 )-s(f, π 0 ) < ε ⇒ |A-S(f, π,τ)| ≤ S(f, π)-s(f, π) < ε ⇒|A-S(f, π,τ)| < ε 2)⇒1) Veamos que A=
∫
b
a
b
b
a
a
f y A= ∫ f . Para ver que A= ∫ f basta comprobar que dado
ε>0 ∃π∈π[a,b] / |A-S(f, π)|<ε n
Por 2) dado ε>0 ∃π 0 ∈∏ [a,b] / |A- ∑ f (τi )( xi − x i −1 ) | < ε/2 y ∀π>π 0 i =1
Mi-f(τi )<
ε (b − a) = ε / 2 2(b − a )
Entonces: |A-S(f, π)| ≤ |A-S(f, π,τ)|+|S(f, π,τ)-S(f, π)| < ε/2 + ε/2 = ε. b
Luego A= ∫ f . a
7/21
De forma análoga se demuestra que A=
∫
b
a
b
f y por tanto A= ∫ f siendo f integrable a
Riemann. 3. PROPIEDADES DE LA INTEGRAL. PROP Sea R[a,b] el conjunto de todas las funciones integrables Riemann en [a,b]. 1) Si f,g∈R[a,b] ⇒ f+g∈R[a,b] y
b
∫ ( f + g) = ∫ a
a
2) Si λ∈R y f∈R[a,b] ⇒λf∈R[a,b] y 3)Si f≥0 ⇒
∫
b
a
b
b
f +∫ g a
b
b
a
a
∫ (λf ) = λ∫
f ≥0, y por tanto si f≤g ⇒
∫
b
a
f .
b
f ≤∫ g. a
Dem 1) f∈R[a,b] ⇒∀ε>0 S(f, π 1 )-s(f, π 2 ) < ε/2 con π 1 ∈ π[a,b]. g∈R[a,b] ⇒ ∀ε>0 S (f, π 2 )-s(g, π 2 ) < ε/2 con π2 ∈ π[a,b]. Se verifica S(f, π 1 ∪ π2 )-s(f, π 1 ∪ π2 ) < ε/2. S(g, π 1 ∪ π 2 )-s(g, π 1 ∪ π 2 )<ε/2, con π 1 ∪ π 2 = {x0 ,...,xn }. Llamemos mi = Inf{f(x) / x∈[xi-1,xi]}, Mi = Sup{f(x) / x∈[xi-1,xi ]}, mi ´ = Inf{g(x) / x∈[xi-1,xi]}, Mi´ = Sup{g(x) / x∈[xi-1,xi]}, mi ´´ = Inf{f(x)+g(x) / x∈[xi-1,xi ]}, Mi´´ = Sup{f(x)+g(x) / x∈[xi-1,xi]} n
S(f+g,π 1 ∪π2 )-s(f+g,π 1 ∪π2 ) =
∑ (M ´´−m ´´)(x i
i
i
− xi −1 ) ≤
i =1
teniendo en cuenta que: Mi´´≤Mi+Mi´ mi ´´≤mi+mi´ ⇒ Mi´´-mi ´´≤ (Mi- mi)+(Mi´-mi´) n
≤
n
∑ (M i − mi )( xi − xi −1 ) + ∑ (M i ´− mi ´)( xi − xi −1 ) = S(g,π 1∪π 2)-s(g,π 1∪π2) < i =1
i =1
<ε/2+ε/2 = ε. Entonces f+g∈R[a,b].
8/21
Veamos ahora que
∫
b
a
b
b
a
a
( f + g) = ∫ f + ∫ g .
Dado ε>0 como f,g,f+g∈R[a,b] ∃π0 ∈∏ [a,b] / Si π>π0 ⇒ |A-S(f, π,τ)|<ε/3 ∃π0 ´∈∏ [a,b] / Si π>π0 ´⇒ |B-S(g, π,τ)|<ε/3 ∃π0 ´´∈∏ [a,b] / Si π>π 0 ´´ ⇒ |C-S(f+g, π,τ)|<ε/3 Consideremos π={x0 ,...,xn }: n
S(f+g,
∑ ( f + g )(τ )( x
=
π,τ)
i
i
− x i −1 )
=
i =1
n
∑ i =1
n
f (τi )( xi − x i −1 ) + ∑ g (τi )( xi − x i −1 ) = S(f,π,τ)+ S(g,π,τ). i =1
Entonces: |C-(A+B)| = |C-S(f+g, π,τ)+ S(f+g, π,τ)-A+ S(f, π,τ)- S(f, π,τ)-B+ S(g, π,τ)- S(g, π,τ)| = aplicando lo anterior = |C- S(f+g, π,τ)|+|-A S(f, π,τ)|+|-B+ S(g, π,τ)| < ε/3+ε/3+ε/3 = ε. Luego C=A+B ⇒
b
∫ ( f + g) = ∫ a
b
a
b
f +∫ g. a
2) Sean: mi = Inf{f(x) / x∈[xi-1,xi]}, Mi = Sup{f(x) / x∈[xi-1,xi]}, mi ´ = Inf{λf(x) / x∈[xi-1,xi]}, Mi´ = Sup{λf(x) / x∈[xi-1,xi]}, Sea λ∈R-{0}. n
S(λf,π)-s(λf,π) =
∑ (M
´ i
− m´i )( xi − xi −1 ) = como Mi ´-mi´ = λ(Mi- mi) si λ>0 ó
i =1
n
Mi´-mi ´ = λ(mi-Mi) =
∑ λ(M
´ i
− m´i )( x i − xi −1 ) = |λ|(S(f,π)-s(f,π))
i =1
Dado ε>0 tomamos ε´=ε/|λ| y ∃π∈π[a,b] / S(f,π)-s(f, π) < ε´ S(λf, π)-s(λf, π) ⇒ N(S(f, π)-s(f, π)) ≤ |λ|·ε´ = |λ|·ε/|λ| = ε. Luego λf es integrable Riemann. Si λ=0 ⇒λf = 0 y 0 es integrable Riemann. 9/21
b
b
a
a
Llamemos A= ∫ f y B= ∫ λf . Sea |A-S(f, π,τ)| < ε |B-S(λf, π,τ)|<ε ⇒ 0≤|λA-B|<2ε ∀ε≥0 λA = B
y por tanto
3) Sea f≥0. como f es integrable Riemann
∫
b
a
∫
b
a
b
λf = λ∫ f .
b
f =∫ f y a
a
b
= Sup{∑ M i ( x i − x i −1 )}
∫f a
Cada sumando es mayor o igual a cero (suma de Reimann), luego el supremo también lo es. Y como la función es integrable Riemann, su integral es mayor o igual que cero. Si f≥g ⇒ f-g ≥0 ⇒
∫
b
a
b
b
b
b
a
a
a
a
( f − g) ≥ 0 ⇒ ∫ f − ∫ g ≥ 0 ⇒ ∫ f ≥ ∫ g
PROP Sea f:[a,b]→R una función integrable Riemann y c∈[a,b]. Entonces: 1) f|[a,c]: [a,c] →R es integral Reimann. 2) f|[c,b]: [c,b] →R es integrable Reimann. 3)
∫
b
a
c
b
a
c
f = ∫ f +∫ f
Dem 1) f|[a,c]:[a,c]→R. Como f es integrable Reimann en [a,b], dado ε>0 ∃π∈∏ [a,b] / S(f,π)-s(f,π)<ε Sea π´ = π∪{c} ⇒ S(f, π´)-s(f, π´) < ε. Por otro lado: S(f| [a,c], π´∩[a,c])-s(f| [a,c],π´∩[a,c]) ≤ S(f, π´)-s(f, π´). Uniendo ambas desigualdades obtenemos que f|[a,c] es integrable. 2) Análoga. 3) Inmediata b
COROLARIO Si m≤f(x)≤M ∀x∈[a,b] entonces m(b-a)≤ ∫ f ≤ M (b − a) a
Dem Si m≤f(x)≤M ⇒
∫
b
a
b
m≤∫ f ≤ a
∫
b
a
M. 10/21
∫
b
a
b
m = m∫ 1 = m·Inf ( S (1, π) / π ∈ π[a , b ]) = m( b − a ) . a
Análogamente
∫
b
a
M = M (b − a )
Sustituyendo, obtenemos lo que se quería demostrar. PROP Si f es integrable Riemann ⇒ |f| es integrable Riemann y se verifica:
∫
b
a
b
f ≤∫ | f | a
Dem Sabemos que si f es integrable Riemann dado ε>0 ∃π0 ∈π[a,b] / S(f,π 0 )-s(f,π 0 )<ε n
siendo S(f,π 0 )-s(f,π 0 )=
∑ (M
− mi )( xi − xi −1 ) = con
i
i =1
mi = Inf{f(x) / x∈[xi-1,xi]} Mi = Sup{f(x) / x∈[xi-1,xi]}, Sean t,s∈[xi-1,xi], y mi´= Inf{|f(x)| / x∈[xi-1,xi ]}Mi´ = Sup{|f(x)| / x∈[xi-1,xi]} ||f(t)|-|f(s)||
≤
|f(t)-f(s)|
n
n
i =1
i =1
Mi- mi
≤
y
por
∑ (M ´i − m´i )( xi − xi−1 ) = ∑ (M i − mi )( xi − x i−1 ) de lo que deducimos que |f| es integrable Reimann. Sabemos que -|f|≤f≤|f|. Entonces b
b
a
a
- − ∫ | f |≤∫ f ≤
∫
b
a
∫
b
a
−| f |≤
| f | y obtenemos
∫
b
a
∫
b
b
f ≤∫ | f | y
a
a
b
f ≤ ∫ | f |. a
PROP Sea f integrable riemann y sea c∈[a,b]. Si dado un escalar α, definimos: f (x ) x ≠ c ~ f ( x) = x=c α entonces
~ f es integrable Riemann y
∫
b
a
b ~ f =∫ f . a
11/21
tanto
Dem Como f∈R[a,b] ⇒ ∃π 0 ∈∏ [a,b] / S(f, π 0 )-s(f, π 0 ) < ε/2. ~ ~ S( f ,π)-s( f ,π)
n
n
i =1
i =1 i≠ j
∑ (M ´i − m´i )( xi − xi−1 ) = ∑ (M i − mi )( xi − x i−1 ) +
=
+ ( M j − m j )( x j − x j −1 ) ≤ siendo c∈[xj-1,xj] para algún j∈{1,...,n}. ≤ε/2 + ε/2 = ε. ya que ( M j ´−m j ´)( x j − x j −1 ) < ε / 2 eligiendo xj-1 y xj suficientemente cerca. Veamos ahora que ambas integrales son iguales:
∫
b
a
∫
c
a
c
b
a
c
f = ∫ f +∫ f
y
∫
b
a
c ~ b ~ ~ f =∫ f +∫ f a
c
~ c f − ∫ f es igual al último rectángulo, y se podrá hacer tan pequeño como se a
quiera, por tanto ambas integrales son iguales. Análogamente se demuestra que:
∫
b
c
b ~ f =∫ f c
llegando así a comprobar que:
∫
b
a
b ~ f =∫ f a
Este resultado nos viene a demostrar que dos funciones que se diferencien en un punto y una de ellas sea integrable, la otra también lo es y la integral coincide. El resultado puede extenderse a que si f es integrable Riemann y se modifica en un número finito de puntos, la nueva función también es integrable y ambas integrales son la misma. PROP Sean f,g∈R[a,b]⇒fg∈R[a,b] Dem La demostración la vamos a realizar en varios pasos. 1) Caso f=g≥0
12/21
S(f2 ,π)-s(f2 ,π) < s(f2 ,π)<ε Sea f: [a,b]→R acotada
(por ser integrable Riemann)
entonces |f(x)|≤k. Como f es integrable Riemann dado ε>0 ∃π∈∏[a,b] / S(f, π) - s(f, π) <ε/2k S(f2 ,
siendo n
∑ (M ´− m ´)( x i
i
i
i =1
s(f2 ,
-
π) n
n
i =1
i =1
π)
=
− xi −1 ) = ∑ ( M i 2 − mi 2 )( xi − xi −1 ) = ∑ ( M i − mi )( M i + mi )( x i − xi −1 ) ≤
Como f≥0 Mi+mi ≤ 2k n
≤ 2k ∑ ( M i − mi )( x i − xi −1 ) = 2k ( S ( f , π) − s( f , π)) < 2k i =1
ε =ε 2k
Luego f2 es integrable Riemann siempre que f≥0. O expresado para cualquier f: |f2 | es integrable Riemann (ya que |f(x)|≥0). 2) Caso f=g. f2 es integrable Riemann ya que f2 =|f|·|f| = |f|2
y
|f|2 ∈R[a,b]
3) Caso (f+g)2 Como f,g∈R[a,b] ⇒ f+g∈R[a,b] y por el caso anterior (f+g)2 ∈R[a,b]. Pero si (f+g) 2 ∈R[a,b] ⇒ podemos expresar f·g =
1 ((f+g)2 -f2 -g2 ), y como f2 ∈R[a,b], 2
g2 ∈R[a,b] y (f+g)2 ∈R[a,b] obtenemos que f·g∈R[a,b].
TEOREMA. Teorema de Lebesgue. Sea f: [a,b]→R acotada y D el conjunto de las discontinuidades de f en [a,b]. Entonces son equivalentes: 1) f∈R[a,b]. 2) D tiene medida cero. Dem
13/21
1) ⇒ 2) Supongamos que D no tiene medida cero. Vamos a demostrar que f no es integrable legando a una contradicción. n
Podemos escribir D como una reunión numerable de conjuntos D=
UD
r
donde
C =1
Dr={x∈[a,b] / wf(x)≥1/r} y wf(x) = limh→0+f(x+h)- limh→0-f(x+h) llamada oscilación de f en x. Si x∈D ⇒ wf(x)>0 luego D es la unión de los conjuntos Dr con r=1,2,... Si D no tiene medida cero ⇒∃r0 / Dro no tiene mediad cero. Por tanto existe un cierto ε>0 para el que cualquier colección numerable de intervalos abiertos que recubra Dro tendrá una suma de longitudes ≥ε. Dada π∈∏[a,b] tenemos que: n
S(f,π) - s(f, π) =
∑ (M
i
− mi )( xi − x i −1 ) = S1 + S 2 ≥ S1
i =1
con S1 que contine los términos que provienen de subintervalos que en su interior contienen puntos D y S2 contiene los términos restantes. Los intervalos abiertos de S1 recubren Dro, excepto un subconjunto finito en Dr, de medida cero, luego la suma de sus longitudes es por lo menos ε. Pero en estos intervalos tenemos: Mk (f) - mk (f) ≥ 1/r ⇒ S1 ≥ ε/r y eso significa que S(f, π)-s(f, π) ≥ε/r para cada π∈∏[a,b]. Por tanto f no es integrable Riemann. Como llegamos a una contradicción, nuestra suposición es falsa y D tiene medida cero. 2) ⇒ 1)
Supongamos que D tiene medida cero. n
Sea D =
UD
r
, siendo Dr los mismos que antes. Como Dr⊂D ∀r:1,...,n ⇒ Dr tiene
r =1
medida 0 ∀r: 1,...,n ⇒ ∀r: 1,...,n Dr se puede recubrir por medio de intervalos
14/21
abiertos cuyas longitudes sean <1/r. Como Dr es compacto, se puede recubrir mediante una cantidad finita de dichos abiertos. La unión de esos abiertos la llamaremos Ar. Sea Br = [a,b] - Ar su complementario ⇒ Br es la unión de un número finito de subintervalos cerrados de [a,b]. Sea I un subintervalo típico de Br. Si x∈I ⇒ se verifica wf(x) < 1/r entonces ∃δr>0 tal que I puede ser subdivido en un número finito de subintervalos T de longitud menor que δ r que verifican Ω f(T) < 1/r siendo Ω f(T) sup{wf(x) / x∈T} Los extremos de todos esos subintervalos definen π r∈∏[a,b]. n
∑ (M
Sea π>πr ⇒ S(f, π) - s(f, π) =
i
− mi )( xi − x i −1 ) = S1 + S 2 donde S1 contine
i =1
los términos que provienen de los subintervalos que contien puntos de Dr y S2 contiene los términos restantes. En el k-ésimo término de S2 tenemos: Mk -mk < 1/r
⇒ S2 < (b-a)/r
Como Ar recubre todos los intervalos que intervienen en S1 tenemos: S1 ≤
M −m r
donde m= Inf {f(x) / x∈[a,b]} y M=Sup {f(x) / x∈[a,b]} por consiguiente S(f, π)-s(f, π) <
M − m +b −a r
Como esto es cierto ∀r≥1 ⇒ La condición de Riemann se verifica y f∈R[a,b] c.q.d. DEF Diremos que una propiedad se verifica "casi en todo" A⊂R si se verifica en todo A salvo en un conjunto de medida cero. El teorema de Lebesgue establece que dada f acotada en [a,b]. f∈R[a,b] ⇔ f es contínua casi en todo [a,b] Ejemplos: 0 si x ∈ Q 1) f1 (x)= 1 si x ∉ Q
f1 :[0,1] → R.
15/21
Sabemos que f1 (x) no es continua en ningún punto. Entonces, el conjunto de discontinuidades D=[0,1]. Como D no tiene medida cero ⇒ f1 es integrable. 0 si x ∉ Q 2) f2 (x)= 1 / q si x ∈ Q con x = p / q irreducibl e f2 (x): [0,1] → R. Sabemos que f2 (x) es contínua en Qc∩[0,1]. Entonces, el conjunto de discontinuidades D=Q∩[0,1] es numerable, y por tanto, es de medida cero. f2 es integrable. TEOREMA. Teorema del valor medio. Sea f continua en [a,b] entonces ∃ξ∈[a,b] /
∫
b
a
f ( x) dx = f (ξ)( b − a) .
Dem Como f es continua en [a,b] ⇒ f∈R[a,b]. Sean M=max {f(x) / x∈[a,b]} y m=Min{f(x)/x[a,b]}. Entonces: m≤f(x)≤M ⇒ m(b-a) =
∫
b
a
m≤
b
∫
a
b
f ≤ ∫ M = M ( b − a) a
1 b f ≤ M y como f es continua en [a,b], alcanza todos los b − a ∫a valores entre M y m. y tenemos m≤
Por tanto ∃ξ∈[a,b] / f(ξ) =
1 b f b − a ∫a
4. TEOREMA FUNDAMENTAL DEL CÁLCULO Y REGLA DE BARROW. TEOREMA. Primer teorema fundamental del cálculo. Sea f∈R[a,b]. Para cada x∈[a,b] definimos: F(x) =
∫
x
a
f
entonces se verifica: 1) F es continua en [a,b].
16/21
2) Si f es continua en c∈[a,b] ⇒ F es derivable en c y F´(c)=f(c). Dem 1) Para demostrar que F es contínua en [a,b] lo haremos comprobando que es continua en un punto cualquiera c∈[a,b]. |F(x)-F(c)| =
∫
x
a
c
f −∫ f =
∫
a
x
c
x
x
f ≤ ∫ | f | ≤ ∫ M = M ( x − c) c
c
Tomando δ= ε/M tenemos ∀ε>0 ∃δ>0 / |x-c|<δ ⇒ |F(x)-F(c)|<ε Luego F es continua en [a,b]. 2) Si f es continua en c: f(c) = limh→0 F (c + h) − F (c ) ⇔ lim h → 0 F ( c + h) − F ( c) − f ( c) = 0 h h
∫
c+h
a
c
f −∫ f a
h
∫
c+h
c
=
c+h
c
− f ( c) =
( f − f ( c)) h
∫
h
∫
c+h
c
f
∫
c
− f (c ) =
f − f ( c) |h |
≤
c+h
f − h· f ( c) h
∫
c+h
c
f − f (c ) |h |
≤
∫
c
=
∫
c+h
f −∫
c
g c+ h
c
c+h
M
|h|
≤
f ( c)
=
M ·| h | =M |h |
Siendo M=Sup{|f(x)-f(c)| / x∈[c,c+h]}. Como f(x) es continua en x=c ∀ε>0 ∃δ>0 ⁄ |x-c| < δ ⇒ |f(x)-f(c)| < ε o lo que es lo mismo M≤ε. Luego ∀ε>0 ∃δ>0 / |h|<δ ⇒
F ( c + h) − F (c ) < ε y por tanto F´(c)=f(c). h
DEF Una función g se dice que es una primitiva de f si g es derivable y su derivada g´=f. TEOREMA. Segundo teorema fundamental del cálculo. Si f es integrable en [a,b] y F es una primitiva de f, entonces
17/21
∫
x
a
∀ x ∈ [a, b]
f ( t ) dt = F ( x) − F ( a)
Dem Sea x∈[a,b] ⇒ f es integrable en [a,x] y sea π∈∏[a,x] con π={a=x0 ,...,xn =x} Aplicando el teorema del valor medio a F en [xi-1,xi]. F(xi )-F(xi-1) = F´(ξ i)(xi- xi-1)
con ξ i∈(xi-1,xi)
o lo que es lo mismo F(xi )-F(xi-1) = f(ξ i)(xi-xi-1),
con ξ i∈(xi-1 -xi)
Entonces: mi (xi-xi-1) ≤ F(xi )-F(xi-1) ≤ Mi(xi-xi-1)
∀i: 1,...,n
por tanto sumando todas las desigualdades para i: 1,...,n s(f,π)≤F(x)-F(a) ≤ S(f, π)
∀π∈∏[a,b]
y como f∈R[a,b] se deduce que
∫
x
a
f = F ( x) − F (a )
COROLARIO. Regla de Barrow. Sea f integrable en [a,b] y F una primitiva de f. Se cumple: b
∫
a
f = F ( b) − F ( a)
Dem Inmediata. 5. DERIVACIÓN INTEGRAL.
DE
UNA
FUNCIÓN
DEFINIDA
MEDIANTE
UNA
Puede ocurrir que nos definan una función mediante una integral: F(x) =
∫
g ( x)
h( x )
f ( t ) dt
y que nos pidan que estudiemos las propiedades de esa función, extremos, crecimiento, decrecimiento, puntos de inflexión, etc. En este caso nos veríamos en la obligación de tener que derivar F(x) y por lo tanto necesitamos saber como hacerlo. 18/21
TEOREMA. Sea f: R→R una función real de variable real, tal que su primitiva viene definida por T(x), es decir, T´(x)=f(x). Entonces si definimos: F(x) =
∫
g ( x)
h( x )
f ( t ) dt
se verifica que: F´(x) = f(g(x))·g´(x)-f(h(x))h´(x). Dem F(x) =
∫
g ( x)
f (t ) dt = [T (t ) ]hg ((xx)) = T ( g ( x)) − T ( h( x ))
h( x )
entonces si queremos derivar
F(x) se tiene que: F´(x) = (T(g(x))-T(h(x)))´ = (T(g(x)))´ - (T(h(x)))´ = {aplicando la regla de la cadena}= T´(g(x))·g´(x) - T´(h(x))h´(x) = {aplicando que T´(x)=f(x)} = = f(g(x)) g´(x) - f(h(x))h´(x). Por lo tanto: F´(x) = f(g(x))g´(x) - f(h(x))h´(x). Como hemos visto en el teorema anterior, podemos derivar una función definida mediante una integral, sin necesidad de tener que hacer la integral, si no que lo único que debemos hacer es evaluar la función en los límites de integración y estos a su vez derivarlos. Ejemplo: º F(x) =
∫
x2
0
sentdt entonces tenemos que:
F´(x) = senx2 ·2x - sen 0 ·0 ⇒ F´(x) = 2xsenx2 º Calcular los extremos relativos de la función definida por: F(x) =
∫
x4
0
2
e −t dt , derivando tenemos que:
F´(x) = e-x84x3 -0 = 4x3 e-x8 ⇒ F´(x)=0 ⇒ 4x3 e-x8=0 ⇒ x3 =0 ⇒ x=0 Punto crítico F´(x) = 4x3 e-x8 como 4e-x8 >0 ∀x ⇒ el signo viene dado por x3 ⇒ F´(x)>0 ∀x>0 y F´(x)<0 ∀x<0 ⇒ tenmos un mínimo en x=0. 6. SUMAS DE RIEMANN. 19/21
Como ya hemos visto anteriormente la integral definida se define como la suma de áreas de rectángulos cuando las bases de los rectángulos tienden a cero, es decir, cuando la partición tiende a ser la más fina posible. Entonces si tenemos un límite cuando n tiende a infinito de un sumatorio en el que la sucesión se puede expresar como el producto de una sucesión que tiende a cero (bn ) y que representa a la base de los rectángulos, por otra que representa a las alturas de los rectángulos (f(jn )) entonces podemos transformar esa expresión en una integral de la función f(x), es decir: n
b
limn→+∞ ∑ bn f ( j n ) = ∫ f ( x) dx donde a ≤ j n ≤ b a
j =1
Ejemplo: calcular: n
n 2 j =1 n + j
limn→+∞ ∑
2
n n n 1 n2 1 1 limn→+∞ ∑ 2 = lim = lim = n→+∞ n→+∞ ∑ ∑ 2 2 2 2 j2 j =1 n + j j =1 n n + j j =1 n n + n2 n2 n
n
1 j =1 n
1
= limn→+∞ ∑
entonces tomando como bn =1/n la base de los 2 j 1+ n 1 j rectángulos y como f = la altura de los rectángulos, tenemos que como 2 n j 1+ n j/n está entre 0 y 1: n
1 n 1 1 =∫ dx = [arctg ]0 = arctg1 − arctg0 = π / 4. 2 2 0 1+ x j =1 n + j
limn→+∞ ∑
2
Por lo tanto: n
n π = 2 4 j =1 n + j
limn→+∞ ∑
2
7. INTEGRALES IMPROPIAS. No podemos terminar el problema del cálculo del área sin antes plantearnos la siguiente pregunta: ¿qué pasaría si el conjunto que encierra el área que queremos calcular no es acotado? La respuesta a esta pregunta viene dada por la definición de un tipo especial de integrales que son las integrales impropias, y de las cuales hay dos tipos que ahora veremos. Con estas integrales lo que pretendemos ver es si el área encerrada es finita o 20/21
infinita y en caso de que sea finita la calcularemos. Si el área es finita se diría que la integral es convergente y si es infinita que la integral es divergente. Tipos de integrales impropias: 1) Integral impropia de primera especie: se produce una integral impropia de primera especie cuando queremos calcular la integral a lo largo de un rayo,es decir, cuando alguno de los límites de integración es +∞ ó -∞. Ejemplo:
∫
+∞
1
1 dx = lim t →+∞ x2
∫
t
1
t
1 1 −1 dt = lim t → +∞ − = lim t →+∞ + 1 = 1 2 x x 1 t
2) Integral impropia de segunda especie: se produce cuando la función presenta una asíntota vertical en alguno de los puntos del intervalo de integración. Ejemplo: 1
∫
0
1 1 dx = lim t → 0 + 2 x t = lim t →o + ( 2 − 2 t ) = 2. x
[ ]
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté
21/21
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 30 PRIMITIVA DE UNA FUNCIÓN. CÁLCULO DE ALGUNAS PRIMITIVAS. APLICACIONES DE LA INTEGRAL AL CÁLCULO DE MAGNITUDES GEOMÉTRICAS. 1. Introducción. 2. Concepto de Primitiva. 3. Integrales Inmediatas. 3.1. Lista de Integrales Inmediatas. 3.2. Desarrollo de las Integrales Inmediatas. 4. Integración de Funciones Racionales. 4.1. Caso 1: Grado(P(x))>Grado(Q(x)) 4.2. Caso 2: Grado(P(x))=Grado(Q(x)) 4.3. Caso 3: Grado(P(x))
1/27
de
1. INTRODUCCIÓN. A lo largo del siglo XVIII se consideró a la integración como el proceso contrario a la diferenciación. El significado geométrico de la integral indefinida es una familia de curvas, todas ellas obtenidas por desplazamiento vertical de una cualquiera. En este tema vamos a tratar de obtener primitivas de funciones. Para ello estudiaremos diferentes métodos. Hemos de tener en cuenta que la derivada de una función elemental es siempre una función elemental, en cambio la primitiva de una función elemental puede no expresarse mediante un número finito de funciones elementales. 2. CONCEPTO DE PRIMITIVA. DEF Dada f:[a,b]→R, una primitiva de f es una función F:[a,b]→R, derivable ∀xe[a,b] y tal que F´(x)= f(x) ∀x∈ (a,b) Como toda función derivable en un intervalo es continua en dicho intervalo, entonces toda función F primitiva de f es continua en el mismo intervalo. NOTACION: Representaremos como primitiva (una cualquiera) de f
∫ f ( x)dx y se lee “integral indefinida de f”. PROP Sea f:[a,b] → R y F1 , F2 dos primitivas de f. Entonces F1 -F2 = cte dem Definimos la función F0 (x)= F1 (x)-F2 (x) ∀x∈[a,b]. Es claro que F0 es una función continua y derivable, siendo F´0 (x)=F´1 (x)-F´2 (x)= f(x)- f(x)= 0 Sea x0 ∈(a,b) Dado cualquier otro punto x interior a [a,b] se verifican las hipótesis del teorema del valor medio del cálculo diferencial para F0 en [x0 ,x] (ó [x,x0 ]) siendo ∃ ξ ∈(x0 ,x) / F0 (x)-F(x0 )= F´0 (ξ) (x-x0 ) Como F´0 (ξ) = 0 → F0 (x)=F0 (x0 ) Por tanto F0 =cte y F1 -F2 =cte
2/27
Dadas dos primitivas de f, como se diferencian en una constante, para poder indicarlas todas, escribiremos ∫ f ( x)dx = F ( x) + C PROP Sea f:[a,b] → R una función continua. Entonces tiene primitiva en [a,b]. dem La demostración es inmediata sin más que tener en cuenta que x
F ( x) = ∫ f (t )dt a
es una primitiva de f. 3. INTEGRALES INMEDIATAS. 3.1. Lista de Integrales Inmediatas. Expresamos a continuación una lista de integrales inmediatas. Esta lista la obtenemos sin más que recordar las derivadas de las funciones de uso más generalizado. Si leemos las igualdades de derecha a izquierda, la lista nos puede servir como una lista de derivadas, teniendo en cuenta el concepto de integral indefinida. a) Tipo Potencial. 1 x n +1 + C n ≠ − 1 n +1 dx 1 − p +1 ∫ ( x − a) p = − p + 1 (x − a ) + C dx 2 ∫ bx + c = b bx + c + C n
∫x
dx =
p ≠1
b) Tipo Exponencial.
∫ f ' (x )e
f (x)
dx = e f ( x ) + C
c) Tipo Logarítmico. 1
∫ x dx = Lnx + C dx
∫ x − a = Ln( x − a ) + C dx
1
∫ ax + b = a Ln (ax + b) + C d) Tipo Trigonométricas circulares e hiperbólicas.
3/27
∫ Cosdx = Senx + C ∫ Sendx = −Cosx + C dx
∫ Cos x = Tgx + C 2
dx
∫ Sen x = −Co tg x + C ∫ tg xdx = − ln cos x + C ∫ cot gxdx = ln sen x + C cos x ∫ sen x dx = −Co sec x + C 2
2
sen x
∫ cos x dx = sec x + C ∫ cosh xdx = senh x + C ∫ senh xdx = cosh xdx + C 1 ∫ cosh x dx = tgh x + C 2
2
1
∫ senh x dx = − cot ghx + C ∫ tgh xdx = ln cosh x + C ∫ cot ghxdx = ln senh x + C 2
e) Tipo inversas de Trigonométricas circulares e hiperbólicas.
∫ ∫ ∫
dx 1 − x2 dx
( = arg cosh x + C = ln (x ± −1
1+ x dx 2
= arcsen x + C
2
) − 1) + C
= arg senh x + C = ln x ± x 2 + 1 + C x2
x 1 ∫ 1 + x 2 dx = arctg x + C 1 1 1+ x ∫ 1 − x 2 dx = arg tgh x + C = 2 ln 1 − x + C dx ∫ x x 2 − 1 = arcsen x + C
3.2. Desarrollo de las integrales inmediatas. a) Integrales inmediatas de tipo potencial.
4/27
Siempre que bajo el signo integral aparezca una función elevada a una constante, si lo que la multiplica es al menos en su parte variable la derivada de la función, podremos ajustar con constantes y será una integral inmediata de tipo potencial. b) Integrales inmediatas de tipo Exponencial. Siempre que bajo el signo integral aparezca una constante elevada a una función, si lo que la multiplica es, al menos en su parte variable, la derivada de la función, podremos ajustar con constantes, y será una integral inmediata de tipo exponencial. c) Integrales Inmediatas de tipo Logarítmico. Siempre que bajo el signo integral aparezca un cociente, si el numerador es al menos en su parte variable la derivada del denominador, se podrá ajustar con constantes, y será una integral inmediata de tipo Logarítmico. d) Integrales Inmediatas de tipo Arco o Argumento. Siempre que bajo el signo integral aparezca una expresión de alguno de estos tres tipos
∫
dx ax 2 + bx + c
∫
dx ax 2 + bx
∫
dx ax 2 + c
podremos resolver la integral aplicando un método que desarrollaremos en cuatro pasos. PASO 1: Multiplicamos numerador y denominador por la raiz cuadrada de cuatro veces el valor absoluto del coeficiente numérico del término en x2 ( 4 a ) PASO 2: Se expresa el término interior a la raiz obtenido en el paso anterior en la forma ± (mx ± n)2 ± p identificando coeficientes con esta expresión. PASO 3: Se divide numerador y denominador por la raiz cuadrada de p. PASO 4: Se ajusta mediante constantes el resultado obtenido a alguna de las integrales inmediatas del apartado e) del punto 3.1. OBS Estas integrales no las podremos resolver dentro del cuerpo de los números reales cuando los tres (o los dos) coeficientes numéricos del polinomio sean negativos. O también porque después de aplicar el paso 2 obtengamos negativos los dos términos bajo el signo integral. De forma muy similar a la anterior, si tenemos una integral que se asemeja a uno de estos tres tipos
5/27
∫ ax
2
dx + bx + c
∫ ax
dx + bx
dx 2 +c
∫ ax
2
su resolución es siguendo otro método de cuatro pasos, muy parecido al anterior. PASO 1: Se multiplican numerador y denominador por cuatro veces el valor absoluto del coeficiente numérico del término en x2 (4a). PASO 2: Se expresa el término del denominador en la forma ± (mx ± n)2 ± p identificando coeficientes con esta expresión. PASO 3: Se divide numerador y denominador por p. PASO 4: Se ajusta por constantes el resultado obtenido a alguna de las integrales inmediatas del tipo e) del punto 3.1. 4. INTEGRACIÓN DE FUNCIONES RACIONALES. Es la integración de la forma
P( x)
∫ Q(x ) dx ,
siendo P(x) y Q(x) polinomios de
coeficientes reales y exponentes naturales. OBS Cuando nos encontremos con este tipo de integrales, antes de nada conviene realizar la comprobación de que no se trata de una integral inmediata de tipo Logarítmico. 4.1. CASO 1: grado ( P(x)) > grado ( Q(x)). En esta situación, lo primero que hemos de realizar es la división de P(x) por Q(x) quedando P(x)= Q(x)·C(x)+R(x) siendo C(x) el cociente de la división y R(x) el resto ( grado (R(x)< grado (Q(x)). Entonces la integral nos queda como P( x)
R( x)
∫ Q(x ) dx = ∫ C (x )dx + ∫ Q(x ) dx La integral La integral
∫ C ( x)dx es de tipo potencial, y por tanto inmediata. R( x) ∫ Q(x ) dx puede no existir si R(x) =0, siendo la división exacta. Si
no es así, obtenemos una integral donde grado (R(x)< grado(Q(x)) que estudiaremos más adelante. 6/27
4.2. CASO 2: grado (P(x)) = grado(Q(x)). El proceso para resolver este caso es el mismo que el anterior. La única diferencia es que C(x)=K constante. Entonces la primera integral es también es inmediata, siendo
∫ Kdx = Kx + C Todo lo demás es análogo. 4.3. CASO 3: grado (P(x)) > grado (Q(x)). En este caso ya no podemos realizar la divisilón de P(x) por Q(x). El proceso que debemos seguir sería, en primer lugar, obtener las raices de Q(x), ya sean del tipo que sean. Hemos de recordar que cualquier polinomio con coeficientes reales y exponentes naturales puede tener 1) 2) 3) 4)
Raíces Reales Simples Raíces Reales Múltiples Raíces Complejas Simples Raíces Complejas Múltiples Estudiaremos cada uno de estas cuatro situaciones de forma independiente.
4.3.1. Raices Reales Simples. En este apartado vamos a suponer que al igualar Q(x) a cero obtenemos sólo raices reales simples. Vamos a suponer que Q(x)= a0 (x-α 1 )(x-α2 )(x-α 3 ), siendo a0 el coefiente numérico del término de mayor grado de Q(x). El motivo de elegir Q(x) de grado 3 y no de grado n es para no complicar la escritura con sumatorios y productos. El método de resolución para el caso de un polinomio de grado superior a 3 es el mismo, pero más tedioso. Para explicar este método vamos a suponer que a0 =1, ya que si no lo fuera, la constante 1/a0 se podría sacar fuera de la integral: P( x)
P( x)
1
P( x )
∫ Q(x ) dx = ∫ a ( x − α )( x − α )( x − α ) dx = a ∫ ( x − α )( x − α )(x − α ) dx 0
1
2
3
0
1
2
3
Los pasos a seguir son los siguientes: Paso1:
P( x) en fracciones simples. La descomposición es única, Q( x) siendo las fracciones de la descomposición el numerador un coeficiente indeterminado y el denominador uno de los factores de Q(x). Descomponer
7/27
P( x ) P( x) A B C = = + + Q( x) ( x − α1 )( x − α2 )( x − α3 ) ( x − α1 ) ( x − α2 ) ( x − α3 ) con A,B y C constantes. Paso2:
Se expresan ambos términos con un común denominador, que siempre será Q(x).
A( x − α2 )( x − α3 ) B( x − α1 )( x − α3 ) C ( x − α1 )( x − α2 ) P( x ) = + + Q( x) ( x − α1 )( x − α2 )( x − α3 ) ( x − α1 )( x − α2 )( x − α3 ) ( x − α1 )( x − α2 )( x − α3 ) Paso3:
Al tener ambos miembros el mismo denominador, igualamos los numeradores. P(x)=A(x- α 2 )(x-α 3 ) + B(x-α 1 )(x-α3 ) + C(x-α1 )(x-α 2 )
Paso4:
Se calculan los coeficientes A, B y C • hacemos x = α 1 , verificádose P(α 1 ) = A(α1 -α2 )(α1 -α3 ) → A =
P(α1 ) (α1 − α2 )(α1 − α3 )
• hacemos x = α 2 P(α 2 ) = B(α2 -α1 )(α2 -α3 ) → B =
P(α2 ) (α2 − α1 )(α2 − α3 )
• hacemos x = α 3 P(α 3 ) = C(α3 -α1 )(α3 -α2 ) → C = Paso 5: P( x )
P(α3 ) (α3 − α1 )(α3 − α2 )
Una vez obtenidos los coeficientes, procedemos a la integración. Adx
Bdx
∫ Q( x )dx = ∫ ( x − α ) + ∫ ( x − α 1
2
)
+∫
Cdx = A ln( x − α1 ) + B ln( x − α 2 ) + C ln( x − α 3 ) + K (x −α3 )
4.3.2. Raíces Reales Complejas. Vamos a suponer que al igualar Q(x) a cero obtenemos raices reales múltiples. Para simplificar la descripción del método, pero considerándolo en toda su generalidad, tomaremos Q(x)=a0 (x-α 1 )(x-α2 )3 siendo α 1 una raíz simple, α 2 una raíz múltiple con índice de multiplicidad 3 y a0 el coeficiente numérico del término de mayor grado de Q(x).
8/27
Análogamente al caso anterior, vamos a suponer que a0 =1 Los pasos a seguir son los mismos que en el caso anterior: P( x) en fracciones simples. Las raíces reales simples se Q( x) descomponen de la misma forma. Para las raíces reales múltiples, el numerador siempre es un coeficiente indeterminado y el denominador es el factor múltiple con exponente variando de 1 a su multiplicidad en cada fracción.
Paso1:
Descomponer
P( x ) P (x ) A B C D = = + + + 3 2 Q( x) ( x − α1 )( x − α2 ) ( x − α1 ) ( x − α2 ) ( x − α2 ) ( x − α2 ) 3 con A, B,C y D constantes. Paso2:
Se expresan ambos términos con un común denominador, que siempre será Q(x).
P( x ) A( x − α2 ) 3 B( x − α1 )( x − α2 ) 2 C( x − α1 )( x − α2 ) D( x − α1 ) = + + + 3 3 3 Q( x) ( x − α1 )( x − α2 ) ( x − α1 )( x − α2 ) ( x − α1 )( x − α2 ) ( x − α1 )( x − α2 ) 3 Paso3:
Igualamos los numeradores: P( x) = A( x − α2 ) 3 + B( x − α1 )( x − α2 ) 2 + C ( x − α1 )( x − α2 ) + D( x − α1 )
Paso4:
La identificación de coeficientes se puede realizar en este caso de las siguientes formas:
a) Sustituyendo x por los valores de las raíces obtendremos tantos coeficientes indeterminados como raíces distintas haya. • x=α 1 ⇒
A=
P(α1 ) (α1 − α2 )3
P(α2 ) = D(α2 − α1 ) ⇒
D=
P (α2 ) (α2 − α1 )
P(α1 ) = A(α1 − α2 ) 3 • x=α 2
El resto de coeficientes los podemos obtener dando a x valores pequeños distintos de las raíces α 1 y α 2 . Tantos valores como coeficientes queden por calcular. En nuestro caso, dos. • x=x0 P( x0 ) = A( x0 − α2 )3 + B ( x0 − α1 )( x0 − α2 ) 2 + C( x0 − α1 )( x0 − α2 ) + D( x 0 − α1 ) • x=x1 9/27
P( x1 ) = A( x1 − α2 ) 3 + B( x1 − α1 )( x1 − α2 ) 2 + C ( x1 − α1 )( x1 − α2 ) + D( x1 − α1 ) Como A y D son conocidos, llegamos a un sistema de dos ecuaciones con dos incógnitas, que una vez resuelto nos dará B y C. b) Si realizamos las operaciones que indica el segundo miembro e igualamos los coeficientes de ambos miembros del mismo grado, obtenemos un sistema de tantas ecuaciones como incógnitas. Paso5:
Una vez obtenidos los coeficientes procedemos a la integración: P( x)
Adx
Bdx
Cdx
Ddx
∫ Q(x ) dx = ∫ ( x − α ) + ∫ (x − α ) + ∫ ( x − α ) + ∫ (x − α ) 2
1
2
= A ln( x − α1 ) + B ln( x − α2 ) −
2
3
=
2
C D − +K ( x − α2 ) 2( x − α2 ) 2
Las dos primeras integrales son inmediatas de tipo logarítmico y las dos últimas son inmediatas de tipo potencial: 4.3.3. Raíces Complejas Simples. Describiremos el método de resolución suponiendo que el polinomio Q(x) es de grado 5, con raíces x=α 1 (real simple), x=α 2 (real múltiple de orden 2) y x= a+bi, x=a-bi ( raíces complejas simples). Escogemos así Q(x) por ser el supuesto más completo de los que constituyen este caso. Q(x)=a0 (x-α 1 )(x-α2 )2 (x-(a+bi))(x-(a-bi)) Los dos últimos factores se pueden escribir como (x-(a+bi))(x-(a-bi))=(x-a)2 +b2 quedando entonces Q(x)=a0 (x-α 1 )(x-α2 )2 ((x-a)2 +b2 ) De forma análoga a los dos casos anteriores, supondremos que a0 =1. Los pasos a seguir en este método son los mismos que hemos visto en los dos apartados anteriores. P( x) en fracciones simples, las fracciones que Q( x ) corresponden a las raíces reales simples son de la misma forma que en punto 4.3.1.; las fracciones correspondientes a las raíces reales múltiples son de la forma que en el punto 4.3.2.; y las fracciones correspondientes a las raíces imaginarias simples son: el numerador un polinomio en x de primer grado completo de coeficientes indeterminados, y el denominador la expresión (x-a)2 +b2 . En la descomposición de
10/27
Antes de proseguir con la explicación de este método, vanos a realizar un inciso, para explicar como se integran estas fracciones nuevas que hemos obtenido. Mx + N x 1 dx = M ∫ dx + N ∫ dx = (1) + ( 2) 2 2 2 2 +b ( x − a) + b ( x − a) 2 + b2
∫ ( x − a)
2 x − 2a + 2a dx = 2 +b + b2 M 2x − 2a M 2a = dx + dx = (1' ) + (1' ' ) 2 2 ∫ ∫ 2 ( x − a) + b 2 ( x − a) 2 + b 2 (1) =
(1' ) =
M 2
M 2
2x
∫ (x − a )
2
2
dx =
M 2
∫ (x − a)
2 x − 2a M dx = ln ( x − a ) 2 + b 2 2 2 +b 2
∫ (x − a)
(1' ' ) + ( 2) = ( Ma + N ) ∫
1 dx = ( x − a) 2 + b 2
Es una integral del tipo arcotangente que se resuelve como sigue: 1
= ( Ma + N ) ∫
Ma + N x−a b2 dx = arctg 2 ( x − a) b b +1 2 b
con lo cual la integral a calcular queda como Mx + N Ma + N x−a M dx = arctg + ln ( x − a ) 2 + b 2 + K 2 2 +b b b 2
∫ ( x − a)
Con esto terminamos el inciso y proseguimos con el método. Paso1:
P(x) P( x) A B C Mx+ N = = + + + 2 2 2 2 Q( x) ( x −α1 )(x −α2 ) ((x − a) + b ) ( x −α1 ) ( x −α2 ) ( x −α2 ) ( x − a) 2 + b2
con A, B, C, M y N constantes. Paso2:
Reducimos a común denominador. Omitimos la fórmula por no ser de interés.
Paso3:
Igualamos los numeradores.
P(x) = A(x−α2 )2 ((x−a)2 +b2 ) +B(x −α1)(x −α2 )((x −a)2 +b2 ) +C(x −α1)((x−a)2 +b2 ) +(Mx+ N)(x −α1 )(x −α2 )2 Paso4:
En este caso podemos realizar la identificación de coeficientes de la misma forma que en 4.3.2.
11/27
Paso5: P( x)
C
∫ Q(x) dx = Aln( x − α ) + B ln( x −α ) − (x − α ) + 1
2
2
M Ma + N x−a ln((x − a)2 + b2 ) + arctg +K 2 b b
4.3.4. Raíces Complejas Múltiples. Veremos este caso en el supuesto particular de que le polinomio Q(x) sea de noveno grado, siendo sus raíces x=α 1 raíz real simple x=α 2 raíz real múltiple de orden 2. x=a+bi y x=a-bi raíces complejas simples x=c+di y x=c-di raíces complejas múltiples de orden 2. Entonces Q(x)=a0 (x-α 1 )(x-α2 )2 ((x-a)2 +b2 ) ((x-c)2 +d2 )2 siendo a0 el coeficiente principal de Q(x), que supondremos, sin pérdida de generalidad que es a0 =1. P(x) A B C Mx+ N Sx +T Ux+V = + + + + + 2 2 2 2 2 Q( x) (x −α1 ) (x −α2 ) ( x −α2 ) ( x − a) + b (x − c) + d ((x −c)2 + d 2 )2 Hasta el paso 4 se realiza de la misma forma que en 4.3.2 y 4.3.3. Al llegar al paso 5, una vez obtenidos los coeficientes indeterminados, procedemos a la integración de cada una de las fracciones, siendo ya conocido el resultado menos de la última.(Remitimos al lector a la hoja de problemas para conocer su resolución). No resolveremos en el tema la integral de la última fracción por no extendernos innecesariamente, ya que vamos a ver un método alternativo para resolver las integrales de cocientes de polinomios con denominador con raíces complejas múltiples, llamado Método de Hermite. 5. MÉTODO DE HERMITE. P( x) donde las Q( x ) raíces de Q(x) pueden ser tanto reales como complejas y simples o múltiples. Por tanto, estamos en la misma situación que en el punto 4.3.4 Para explicar este método, partimos de un cociente de polinomios
De nuevo supondremos que Q(x) es un polinomio de noveno grado cuya descomposición es 12/27
Q(x)=a0 (x-α 1 )(x-α2 )2 ((x-a)2 +b2 ) ((x-c)2 +d2 )2 siendo a0 el coeficiente principal de Q(x), que supondremos, sin pérdida de generalidad que es a0 =1. Paso1: -
Las raíces reales simples se descomponen como hemos visto en el punto 4, con un coeficiente indeterminado como numerador y el factor que contiene a la raíz como denominador.
-
Las raíces reales múltiples se descomponen como si fueran simples, sin tener en cuenta su índice de multiplicidad.
-
Las raíces complejas simples se descomponen como hemos visto en el punto 4.3.3.
-
Las raíces complejas múltiples se descomponen como si fueran simples, sin tener en cuenta su índice de multiplicidad.
-
Además, hay un término más que pasamos a describir:
La derivada de un cociente donde el denominador es el producto de los factores múltiples con exponentes igual a sus índices de multiplicidad respectivos menos uno. El numerador será un polinomio completo de grado inferior en una unidad del grado del polinomio del denominador. OBS Se suelen utilizar letras minúsculas para indeterminados del término característico de Hermite.
expresar
los
coeficientes
P(x) A B Mx+ N Sx +T d mx2 + nx + p = + + + + Q( x) (x −α1 ) (x −α2 ) (x − a)2 + b2 (x − c) 2 + d 2 dx ( x −α2 )((x − c) 2 + d 2 ) siendo A, B, M, N, S, T, m, n y p constantes a determinar. Paso2:
Se deriva le último término con respecto a x.
P(x) A B Mx+ N Sx +T = + + + + 2 2 Q( x) ( x −α1 ) ( x −α2 ) ( x − a) + b ( x −c)2 + d 2 ( zmx+ n)(x −α2 )((x − c) 2 + d 2 ) −(mx2 + nx + p)((x − c)2 + d 2 + ( x −α2 )2( x − c)) + ( x −α2 ) 2 ((x − c)2 + d 2 )2 Paso3:
Se expresan ambos miembros con un común denominador que será siempre Q(x).
Paso4:
Se igualan los numeradores
13/27
P( x) = A( x −α2 ) 2 ((x − a) 2 + b2 )((x − c) 2 + d 2 ) 2 + B( x −α1 )(x −α2 ) 2 ((x − a) 2 + b2 )((x − c) 2 + d 2 ) 2 + + (Mx+ N)(x −α1 )(x −α2 )2 ((x − c) 2 + d 2 ) 2 + (Sx +T )(x −α1 )(x −α2 ) 2 ((x − a) 2 + b2 )((x − c) 2 + d 2 ) + + (2mx+ n)(x −α1 )(x −α2 )2 ((x − a) 2 + b2 )((x − c)2 + d 2 ) − − (mx2 + nx + p)( x −α1 )((x − a) 2 + b2 )((x − c) 2 + d 2 ) − − (mx2 + nx + p)( x −α1 )( x −α2 ) 2 2( x − c)((x − a) 2 + b2 ) Paso5: Cálculo de los coeficientes indeterminados, que se hará de la misma forma que en 4.3.2, 4.3.3 ó 4.3.4. Paso6: Integración de cada una de las fracciones obtenidas. En nuestro ejemplo, las integrales primera y segunda son inmediatas de tipo Logarítmico. La tercera y cuarta las hemos resuelto en el punto 4.3.3. y la última es inmediata teniendo en cuenta las propiedades de la integral. P( x)
∫ Q(x ) dx = A ln( x − α ) + B ln( x − α ) + 1
+
2
M Ma + N x−a ln ( x − a ) 2 + b 2 + arctg + 2 b b
(
)
S Sc + T x −c mx 2 + nx + p ln ( x − c )2 + d 2 + arctg + +K 2 d d ( x − α2 )(( x − c) 2 + d 2 )
(
)
OBS En el método de Hermite, si se realizó correctamente, no aparecen nunca integrales inmediatas de tipo potencial. 6. INTEGRACIÓN POR PARTES. Si u ý v son funciones de x, por ejemplo u=f(x) y v=g(x), aplicando la fórmula de la diferencial de un producto de funciones d(uv) = udv + vdu y si de esta expresión despejamos udv udv = d(uv) - vdu Integrando ambos miembros de la igualdad
∫ udv = ∫ d (uv) − ∫ vdu que se puede escribir como
∫ udv = uv − ∫ vdu que es la llamada fórmula de integración por partes. Si ahora tenemos en cuenta que
14/27
u = f(x) ⇒ du = f’(x)dx v = g(x) ⇒ dv = g’(x)dx y los sustituimos en la fórmula de integración por partes, obtenemos
∫ vdu ∫ f ( x) g ' ( x)dx = f ( x) g (x ) − ∫ g (x ) f ' ( x)dx Esta nueva forma de expresar la fórmula de integración por partes nos expresa mejor éste método de integración, el cual consiste en convertir una integral en una parte ya integrada más una nueva integral. Se trata de descomponer la integral original como producto de dos funciones, escogiendo éstas de tal manera que al aplicar la fórmula la nueva integral resulte más sencilla que la inicial. Vamos a ver a continuación unas recomendaciones que nos pueden servir para descomponer la integral en dos partes. Partimos del supuesto de que cualquier función se puede expresar como producto de otras dos, aunque una de ellas sea una constante. Adjuntamos una tabla, en la que llamaremos P(x) y Q(x) a los dos factores en los que dividimos la función a integrar. P(x) Función inversa de Trigonometrica circular o hiperbólica o función logarítmica Función inversa de Trigonometrica circular o hiperbólica o función logarítmica Polinomio en x o función racional en x
Q(x) La unidad o cualquier constante
u
dv
P(x)
Q(x)dx
Polinimio en x o función racional en x
P(x)
Q(x)dx
P(x)
Q(x)dx
P(x) o Q(x)
Q(x)dx o P(x)dx
Función Trigonométrica circular o hiperbólica directa, o función exponencial (normalmente de integración inmediata) Función Exponencial (normal- Función Trigonométrica mente de integración inmedia- circular o hiperbólica directa) ta. 6.1. Integración por Reducción.
La integración por reducción la aplicaremos a integrales con funciones de exponentes habitualmente enteros pero elevados. Se trata de obtener una parte integrada y otra sin integrar tal que, al aplicar la fórmula de integración por partes, se obtenga una nueva integral con la función con el exponente disminuido. El método es muy similar en todos los casos. Primero aplicamos la integración por partes, obteniendo una parte ya integrada y una integral en la que se debe, u obtener la integral inicial reducida de exponente, o descomponerla en suma de integrales, siendo 15/27
una de ellas la integral inicial reducida de exponente y la otra la propia integral inicial. En este segundo caso llegamos a una integral recurrente y trataremos como tal. Un ejemplo de fórmula de reducción:
∫ sen
m
xdx =
1 m−1 sen m −1 x cos x + sen m −2 xdx m m ∫
7. CAMBIO DE VARIABLE. Este método también se conoce como integración por sustitución. Ante integrales cuya resolución no podemos realizar como inmediata, ni racional, ni por partes (o de cualquier otra forma que veremos después) se recurre a este método. Consiste en encontrar una función x=g(t) la cual, al sustituirla bajo el signo integral, convierte a la integral en otra más sencilla con la nueva variable t. La sustitución x=g(t) debe cumplir a) Ser derivable y con derivada no nula. dx = g’(t)dt b) Admitir función inversa. x = g(t) ⇒ t = h(x) Entonces
∫ f ( x)dx = ∫ f (g (t)) g ' (t)dt = F (t ) + C = F (h(x )) + C Sólo nos queda por comprobar, para ver que es correcto, que la derivada de F(h(x)) es f(x): dF ( h( x)) dF (t ) dF ( t ) dt 1 1 = = · = F ' ( t )· = f ( g (t ))· g ' ( t )· = f ( g (t )) = f ( x) dx dx dt dx g ' (t ) g ' (t ) El método de sustitución es uno de los más amplios por la gran variedad de sustituciones que se pueden dar. Pero hemos de aplicar a cada caso el cambio adecuado, ya que si no, el cambio nos puede llevar a integrales de mayor dificultad. El los subapartados siguientes indicaremos las sustituciones para tipos concretos. La expresión R indicará función racional de los elementos entre paréntesis (elementos relacionados entre sí por las operaciones racionales de suma, resta, producto y cociente). 7.1. Sustitución en funciones exponenciales, logarítmicas e inversas de trigonométricas circulares e hiperbólicas.
16/27
Tipo de Integral x ∫ R (a )dx
Sustitución
Cálculo de elementos para la sustitución. ln t ln a
t=ax
t=ax
x=
t=ex
t=ex
x=ln t
t=ln x
t=lnx
x=et
t=arctg x
x=tg t
∫ R(x , arcsen x )dx ∫ R(x, arccos x)dx ∫ R(x, arg tgh x)dx
t=arcsen x
x=sen t
1 dt cos 2 t dx=-sen t dt
t=arccos x
x=cos t
dx=-sen t dt
t=argtgh x
x=tgh x
∫ R(x, arg senh x)dx ∫ R(x, arg cosh x)dx
t=argsenh x
x=senh x
dt cosh 2 t dx = cosh tdt
t=argcosh x
x=cosh x
dx = senh tdt
x
∫ R(x , a )dx ∫ R(e )dx ∫ R(x , e )dx ∫ R (x, ln x )dx ∫ R(x, arctg x )dx
dx =
dt t ln a
dx =
dt t
x
x
dx=et dt
dx =
dx =
7.2. Sustitución en integrales de funciones trigonométricas circulares. Sustitución Si R(sen x, cos x) es impar en sen x, haremos: t=cos x Si R(sen x, cos x) es impar en cos x, haremos: t=sen x Si R(sen x, cos x) es par en sen x y cos x, haremos: t=tg x Si R(sen x, cos x) no cumple con ninguna de las características anteriores, haremos: x t = tg 2
Cálculo de elementos para la sustitoción t=cos x
dx =
t=sen x
dx =
t=tg x
dx =
dx =
2dt 1+ t2
− dt 1− t
sen x = 1 − t 2
2
dt 1− t
dt 1+ t2
sen x =
cos x = 1 − t 2
2
sen x =
2t 1 + t2
t 1+ t
cos x =
2
cos x =
1− t2 1+ t2
7.3 Sustitucion en integrales de funciones hiperbolicas. Sustitución Cálculo de elementos para la sustitoción Si R(senh x, cosh x) es dt senh x = t 2 − 1 impar en senh x, haremos: dx = 2 t −1 t=cosh x
17/27
t 1+ t2
Si R(senh x, cosh x) es dt cosh x = t 2 + 1 impar en cosh x, haremos: dx = 2 t +1 t=senh x Si R(senh x, cosh x) es par t t en senh x y cosh x, hare- dx = dt senh x = cosh x = 2 mos: 1− t 1− t2 1−t2 t=tgh x Si R(senh x, cosh x) no cumple con ninguna de las características anteriores, 2dt 2t 1+ t2 dx = senh x = cosh x = haremos: 1− t2 1 −t2 1− t2 x t = tgh 2 8. FÓRMULAS RECURRENTES. Dada una integral a la cual no podemos aplicar el método de sustitución, y el método de integración por partes nos dé una integral similar integral partida, podemos aplicar la resolución por recurrencia. 1)
n αx
∫x e
dx
Llamaremos a la integral a calcular I n = ∫ x n eαx dx = u = xn
du = nx n −1 eαx dv = e αx dx v = α xn ⋅
1 1 1 n + ∫ eαx ·nx n −1 = x n eαx − I n −1 α α α α
La ecuación recurrente es: In =
1 n αx n x e − I n −1 α α
2) Sea I m , n = ∫ sen m −1 ( x )·cos n ( x) dx = u = sen m −1 ( x )dx
du = (m − 1)·sen m − 2 ( x)·cos( x )dx
dv = sen( x)·cos n ( x ) dx
v=−
cos n +1 ( x) n +1
18/27
−
sen m− 1 ( x)·cosn + 1 (x ) m − 1 sen m −1 ( x ) cos n + 1( x ) m − 1 + sen m − 2 ( x)·cosn + 2 ( x )dx = − + · I m − 2 ,n + 2 ∫ n+1 n +1 n +1 n +1
Luego la ecuación es: I m, n = −
1 m −1 ·sen m −1 ( x ) cos n +1 ( x) + · I m− 2, n+ 2 n +1 n +1
9. INTEGRACIÓN DE FUNCIONES IRRACIONALES. 9.1. Integración por sustitución en funciones irracionales. En la tabla siguiente aparecen las sustituciones más importantes para la resolución de este tipo de integrales. Daremos el tipo de integral al que se aplica, la sustitución que se realiza y el cálculo de aquellos elementos necesarios para completar la sustitución. Tipo de Integral
Sustitución ax + b ax + b ax + b ax + b tM = x, R , , K , dx ∫ cx + d cx + d cx + d cx + d siendo M el m.c.m. de los denominadores Cálculo de los elementos para la sustitución tM d −b x= = f (t ) función racional en t dx = f ' (t ) dt a −tMc mn
∫ R(x, (ax + b)
mn
p q
t s
Tipo de Integral , (ax + b) p q , K, (ax + b )t s dx
)
Sustitución t = ax + b siendo M el m.c.m. de los denominadores M
(es similar al caso anterior, con c=0 y d=1 Cálculo de los elementos para la sustitución 1 x = (t M − b ) = f (t ) función racional en t dx = f ' (t ) dt a
∫ R(x, x
mn
,x
pq
Tipo de Integral ,K , x t s )dx
Sustitución M
t =x siendo M el m.c.m. de los denominadores
(es similar al caso anterior, con b=0 y a=1 Cálculo de los elementos para la sustitución dx = M ·t M −1 dt
9.2. Métodos especiales de integración de funciones irracionales. a) Integrales de la forma
∫
P( x ) 2
ax + bx + c
dx con grado (P(x)) ≥ 1
19/27
Vemos los pasos a seguir en la resolución: Paso 1:
Descomponemos la fracción como sigue: Un primer término que es la derivada indicada con respecto a x del producto de un polinomio que llamaremos Q(x), completo en x con coeficientes indeterminados y de grado menor en una unidad al grado de P(x), multiplicado por la raíz cuadrada del denominador. A esto sumaremos un segundo término que será una fracción formada por un coeficiente indeterminado, λ, como numerador, y la raíz como denominador. No demostraremos que la descomposición es única. P( x) ax 2 + bx + c
Paso 2:
Paso 3:
d λ (Q( x)· ax 2 + bx + c ) + dx ax 2 + bx + c
Se deriva la expresión que hay indicada. b Q( x) ax + P( x) λ 2 = Q' ( x )· ax 2 + bx + c + + 2 2 2 ax + bx + c ax + bx + c ax + bx + c Reducimos ambos miembros a común denominador.
P( x) ax 2 + bx + c Paso 4:
=
=
Q' ( x)·( ax 2 + bx + c ) ax 2 + bx + c
b Q( x)( ax + ) 2 + + 2 ax + bx + c
λ ax 2 + bx + c
Igualamos los numeradores de ambos miembros y procedemos a la identificación de coeficientes. b P( x) = Q' ( x)·( ax 2 + bx + c) + Q( x )( ax + ) + λ 2
Paso 5:
Integramos en ambos miembros de la expresión obtenida en el Paso 1º. El primer término queda integrado con sólo eliminar la indicación de derivada, y el segundo término es una integral que ya resolvimos en un apartado anterior.
∫
P( x) ax 2 + bx + c
dx = Q( x)· ax 2 + bx + c + λ∫
20/27
1 ax 2 + bx + c
dx
b) Integrales de la forma
∫ ( x − a)
dx p
ax 2 + bx + c
Este tipo de integral es muy específico, y mediante la siguiente sustitución que recomendamos se reduce a integrales ya vistas. 1 x−a Elementos necesarios para completar la sustitución: Sustitución:
t=
1 = x−a t
x=a+
1 t
dx = −
1 dt t2
c) Caso General. Sustitución en funciones irracionales. A continuación exponemos una tabla con sustituciones estándar para resolver integrales del tipo
∫ R( x ,
ax 2 + bx + c )dx
Estas sustituciones se pueden aplicar a los dos casos anteriores, pero no es aconsejable. Tipo de Integral 2 ∫ R x , ax + bx + c dx
(
)
Sustitución ax 2 + bx + c = ± a ·x + t
Si a>0
Cálculo de los elementos para la sustitución t2 − c x= = f (t ) función racional en t b m 2 a ·t dx = f ' (t ) dt Tipo de Integral 2 ∫ R x , ax + bx + c dx
(
)
ax 2 + bx + c = ± a f (t ) + t Sustitución ax 2 + bx + c = ± c + x·t
Si c>0
Cálculo de los elementos para la sustitución ± 2· c ·t − b x= = f (t ) función racional en t a − t2 dx = f ' (t ) dt ax 2 + bx + c = ± c + f ( t )·t
∫ R(x ,
Tipo de Integral
Sustitución
ax 2 + bx + c dx
ax 2 + bx + c = ( x − α)·t Siendo α una de las dos raíces que se obtienen al resolver la ecuación y la otra β.
)
21/27
Cálculo de los elementos para la sustitución a·β − α·t 2 x= = f (t) función racional en t a −t2 dx = f ' (t ) dt ax 2 + bx + c = ( f (t ) − α)·t
Si en la integral anterior tenemos que b = 0 podemos aplicar otras sustituciones más fáciles que las estándar, usando funciones trigonométricas circulares. Tipo de Integral
∫ R( x ,
− ax 2 + c )dx
Sustitución
x=
c sen t a
Cálculo de elementos para la sustitución. c − ax 2 = c cos t c dx = cos tdi a a t = arcsen x c ax 2 − c = c tg t
∫ R(x,
∫ R(x,
2
ax − c )dx
ax 2 + c )dx
c x= sec t a
x=
c tg t a
c sen t di a cos 2 t a t = arcsen x c dx =
ax 2 + c = c sec t c dx = di a cos 2 t a t = arctg x c
10. INTEGRALES BINÓMIAS. Las integrales que llamaremos Binomias son de la forma:
∫x
m
·( a + bx n ) p dx
y las sustituciones que hay que realizar son las que aparecen en la tabla siguiente:
22/27
Tipo de Integral
Sustitución 1
∫ x ·(a + bx ) m
n
p
dx
Si p es un número entero x =tn m +1 Si es un número entero t s = a + b·x n siendo s el n denominador de la fracción p m +1 Si + p es un número entero t s = a·x − n + b siendo s n el denominador de la fracción p
11. APLICACIONES. 11.1.
Áreas de Figuras Planas.
a) Área de la figura limitada por la curva y = f(x) entre x = a, x = b y el eje OX (b > a). Podemos distinguir dos casos según la gráfica y = f(x) corte al eje OX en algún punto del intervalo [a, b] o no. Si no corta al eje en [a,b]
b
S = ∫ f ( x ) dx a
Supongamos ahora que f(x) corta a OX en x1 , x2 ∈ [a,b]
x1
S=
b) Área de la figura limitada por la curva y = f(x) y el eje OX.
Supongamos que sean x = a y x = b
23/27
xb
∫ f ( x)dx + ∫ f ( x)dx + ∫ f ( x)dx a
b.i) Existen dos puntos de corte.
x2
x1
x2
b
S = ∫ f ( x ) dx a
b.ii) Existen más de dos puntos de corte. Supongamos que sean tres: x1 , x2 y x3 x3
x2
S=
∫ f ( x)dx + ∫ f ( x)dx x1
x2
c) Área de la figura limitada entre las curvas y = f(x), y = g(x), x = a y x = b (con f(x) y g(x) positivas o negativas en [a,b]).
b
S = ∫ ( f ( x ) − g ( x)) dx a
d) Área de la figura limitada entre las curvas y = f(x), y = g(x), x = a y x = b (f(x) > 0 y g(x) < 0 en [a,b]).
b
S = ∫ ( f ( x) − g ( x ))dx a
24/27
e) Área de la figura limitada entre las curvas y = f(x), y = g(x), x = a y x = b (f(x) y g(x) positivas o negativas ambas) con un punto de corte.3 Sea x1 solución a f(x) = g(x) x1
S=
b
∫ ( f (x ) − g ( x))dx + ∫ ( f ( x) − g ( x))dx a
x1
f) Área limitada entre las curvas y = f(x) e y = g(x) Se resuelve la ecuación para f(x) = g(x) para hallar los puntos de corte. Supongamos que sólo salen dos, a y b que f(x) > g(x) ∀ x ∈ [a,b]. b
S = ∫ ( f ( x) − g ( x ))dx a
Si existiesen más de dos puntos de corte, aplicaremos la fórmula para cada dos puntos consecutivos. 11.2. Volúmenes de cuerpos de Revolución. a) Volumen del cuerpo engendrado por la revolución de la curva y = f(x) alrededor del eje OX entre x = a y x = b.
b
V = π ∫ f 2 ( x )dx a
b) Volumen del cuerpo engendrado por la revolución de la curva y = f(x) alrededor del eje OY entre x = a y x = b.
25/27
b
V = 2π ∫ xf ( x )dx a
c) Volumen del cuerpo engendrado por la revolución de una figura limitada por las curvas y = f(x) e y = g(x) (f(x) > g(x)) entre x = a y x = b al girar alrededor del eje OX b
V = π ∫ ( f 2 ( x ) − g 2 ( x)) dx a
d) Volumen del cuerpo engendrado por la revolución de una figura limitada por las curvas y = f(x) e y = g(x) (f(x) > g(x)) entre x = a y x = b al girar alrededor del eje OY. b
V = 2π ∫ ( f ( x ) − g ( x)) dx a
11.3. Area de una superficie de revolución. a) Area de la superficie generada por el giro alrededor del eje OX de l arco de la curva y = f(x) entre x = a y x = b. b
2
V = 2π ∫ f ( x ) 1 + ( f ' ( x)) dx a
26/27
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Lecciones de Cálculo Infinitesimal I. Aut. R. Molina Legaz, M. Franco. Ed. Universidad de Murcia. Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Calculus. Aut. Apostol. Ed. Reverté
27/27
TEMAS DE MATEMÁTICAS (Oposiciones de Enseñanza Secundaria) TEMA 31 INTEGRACIÓN NUMÉRICA. METODOS Y APLICACIONES. 1. Introducción. 2. Integración con abcisas dadas. 2.1. Fórmulas de integración interpolatoria 2.2. Error de las fórmulas de integración interpolatoria. 2.3. Fórmula de Simpson 2.4. Error de la Fórmula de Simpson 2.5. Fórmula del Rectángulo o del punto medio. 2.6. Fórmula del Trapecio. 2.7. Regla del Trapecio Corregida. 2.8. Fórmula de Newton-Cotes. 3. Reglas Compuestas de Integración Numérica. 3.1. Regla de los Trapecios. 3.2. Regla de Simpson. 3.3. Regla del Punto Medio. 3.4. Regla del Trapecio Compuesta. 3.5. Regla del Trapecio Corregida. 4. Integración Gaussiana. 4.1. Ejemplo que motiva las fórmulas. 4.2. Fórmulas Gaussianas. 4.3. Error de las Fórmulas Gaussianas. 5. Método de Romberg. Bibliografía Recomendada.
1/15
TEMA 31 INTEGRACIÓN NUMÉRICA. METODOS Y APLICACIONES. 1. INTRODUCCIÓN. Dada una función de forma analítica, sabemos por temas anteriores calcular su integral definida entre a y b siempre que conozcamos una primitiva de ella. El problema surge cuando no sabemos una primitiva de ella. Esa situación es muy normal en problemas prácticos de Física, Química y otras ciencias. El problema de la integración numérica de una función consiste en calcular el valor de una integral definida sobre la base de una serie de valores del integrando. 2. INTEGRACIÓN CON ABCISAS DADAS. 2.1. Fórmulas de Integración Interpolatoria. Sean a ≤ x 0 < x1 <…< x m ≤ b una partición en m+1 abcisas del segmento [a, b] y consideramos el polinomio Pm (x) de grado menor o igual que m verificando: Pm ( x K ) = f( x K ) con k ∈A = { 0, 1, …, m } entonces, aproximaremos la integral buscada por: b
b
∫ f ( x) = ∫ P
m
a
( x )dx
a
Así, integrando la fórmula de interpolación de Lagrange, que viene dada por : m
Pm (x) =
∑f
l ( x ) , donde l K = ∏
K K
K =0
i≠ K
x − xi x K − xi
obtenemos la fórmula de integración numérica b
b
m
∫ f (x )dx ≅ ∑ W
K
a
K=0
f K donde W K = ∫ l K ( x) dx con k ∈ A . a
Debido a que esta fórmula se halla por integración de un polinomio interpolador, recibe el nombre de fórmula de integración interpolatoria de m+1 abcisas. Los elementos WK los llamaremos pesos, y hay que tener en cuenta que no dependen de f, aunque si del intervalo [a, b] y de las abcisas x 0 ,…, x m . Para cualquier polinomio de grado menor o igual que m, la fórmula es exacta por la unicidad del polinomio interpolador. Esto nos permite calcular los pesos WK sin tener 2/15
que integrar l K ( x) , es decir, para los monomios 1, x, x 2 , …, x m la fórmula es exacta resolviendo el sistema resultante. 2.2. Error de las Fórmulas de Integración Interpolatoria. El error de la aproximación viene dado por la integral del error de interpolación, utilizando como error de interpolación la expresión: f(x) - p m ( x) =
f ( m +1) (ξ( x)) ( x − x0 )( x − x1 ) K ( x − x m ) ( m + 1)!
Por lo tanto si f ∈ C m +1 ( [a, b] ), se tiene que el error de la fórmula de integración interpolatoria de m+1 abcisas es:
b
Em =
b
m
∫
f ( x ) dx =
∑WK f K =
K =0
a
∫ a
f ( m +1) (ξ( x)) ( x − x0 )( x − x1 ) K ( x − x m ) dx ( m + 1)! conξ (x) ∈(a, b)
Si tomamos la constante k ∈R, como la cota superior de la derivada (m+1)-ésima de f, f ( m +1) ( x ) ≤ k ∀k ∈ [a, b], tenemos que:
Em
k ≤ ( m + 1)!
b
∫
( x − x0 )( x − x1 ) K ( x − x m ) dx
a
2.3. Fórmula de Simpson. Si tomamos polinomios de grado menor o igual que 2, usamos g k = g(k) (k = -1, 0, 1) y la fórmula de integración interpolatoria de m+1 abcisas, podemos calcular los pesos de integración W−1 , W0 y W1 para que la fórmula: 1
∫ g (t)dt ≅ W
−1
g −1 + W0 g 0 + W1 g1
−1
sea exacta. Interponiendo la exactitud de la fórmula para g(t) = 1, t, t 2 obtenemos que
3/15
1 W = 1 3 W−1 + W0 + W1 = 2 4 ⇒ W0 = − W−1 + W1 = 0 3 2 1 W−1 + W1 = 3 W−1 = 3 Por lo tanto tenemos que la fórmula buscada la podemos expresar como: 1
1
∫ g (t)dt ≅ 3 ( g
−1
+ 4g 0 + g 1 ).
−1
Aunque esta fórmula podemos expresarla para cualquier intervalo [a, b] solamente con el cambio: t=2
x−a b−a a+b - 1 o lo que es lo mismo x = t+ b−a 2 2
resultando así una fórmula nueva de integración numérica para una función f(x) sobre un intervalo [a, b] que recibirá el nombre de fórmula de Simpson: b
∫ f (x )dx ≅ a
b−a a+b [ f(a) + 4 f ( ) + f(b)] 6 2
aunque haciendo el ajuste c = b
∫ f (x )dx ≅ a
a+b b−a yh= tenemos que: 2 2
h [ f(c-h) + 4 f(c)+ f(c + h)]. 3
que también es válida y recibe el mismo nombre. Nota: Estas fórmulas resultan también exactas sobre polinomios de grado menor o igual que 3. 2.4. Error de la Fórmula de Simpson. Para poder calcular el error que cometemos en la integración numérica mediante la fórmula de Simpson vamos a definir: c+h
Es (h ) =
∫ f ( x)dx -
c−h
h [ f(c-h) + 4 f(c)+ f(c + h)]. 3
donde se verifica que Es (0) = Es ' (0) = E s( 2 ) ( 0) = 0 y
4/15
E0(3 ) ( h) = -
h [ f ( 3 ) (c+h) - f ( 3 ) (c-h)]. 3
Si la función f(x) verifica que f ∈ C 4 ( [c - h, c + h] ) definimos una función F(x) que viene dada por: f ( 3) ( c + h ) − f ( 3 ) ( c − h ) si h ≠ 0 F(x) = 2h f ( 4 ) ( c) si h = 0
y donde se verifica que F(h) es continua, ya que lim F ( x ) = F(0) y además por el h→ 0
teorema del valor medio ∀ξ ∈ [0, h], F (ξ) = f ( 4 ) (τ ) para algún τ ∈ (c –h, c + h). Si utilizamos la fórmula del error de interpolación de Taylor: x
1 Rn ( x) = (x − s)n f ∫ n! a obtenemos que:
( n +1)
h
( s) ds
h
1 1 Es (h ) = ∫ ( h − t ) 2 Es(3 ) ( t ) dt = ( h − t ) 2 t 2 F (t ) dt 2 0 3 ∫0 pero como H(t) = ( h − t ) 2 t 2 es una función estrictamente positiva y continua en (0, h), el teorema del valor medio para integrales nos asegura que: h
Es (h ) = -
1 f ( 4 ) (τ ) 5 F (ξ) ∫ ( h − t ) 2 t 2 dt = − h con τ ∈ (c –h,c + h) 3 90 0
2.5. Fórmula del Rectángulo o del punto medio. Haciendo el mismo proceso que hemos hecho para la fórmula de Simpson y con h = b –a, obtenemos la fórmula del rectángulo, que se basa en la interpolación en la abcisa media únicamente, y que viene dada por:
b
∫ a
f ( x ) dx = h f(
b−a f ( 2 ) (ξ) 3 )+ h con ξ ∈ (a , b) 2 24
2.6. Fórmula del Trapecio. Igualmente que antes con b = b – a, pero interpolando en las abcisas extremas obtenemos la fórmula del trapecio:
5/15
b
∫
f ( x ) dx =
a
h f ( 2 ) (ξ) 3 [ f(a) – f(b) ] h con ξ ∈ (a , b) 2 12
2.7. Regla del Trapecio Corregida. Si tomamos la fórmula de integración interpolatoria de 4 abcisas con x 0 = x1 = a y x 2 = x3 = b, entonces: b
∫ a
1 f ( x ) dx ≅ f 4!
b IV
(ξ)
2 2 ∫ (x − a) (x − b) dx = a
f IV (ξ)(b − a) 5 720
Como m + 1 = 4 entonces tenemos un polinomio cúbico, P3 ( x) , es decir, P IV ( x ) = 0 . Por lo tanto, usando la regla de Simpson: b
∫ f (x )dx ≅ a
b−a a+b [ P3 ( a ) + 4 P3 ( ) + P3 (b)], 6 2
pero como P3 (x) está interpolado a f(x) en x 0 = a, x1 = a, x 2 = b y x3 = b entonces a+b 1 ( b − a) P3 ( a ) = f(a), P3 (b) = f(b) y P3 ( ) = [ f(a) + f(b) ] + [ f ’(a) – f ’(b) ] 2 2 8 entonces: b ( b − a) ( b − a) 2 f ( x ) dx ≅ [ f(a) + f(b) ] + [ f ’(a) – f ’(b) ] ∫a 2 12 siendo su error: f IV (ξ)(b − a) 5 E= 720 2.8. Fórmulas de Newton-Cotes Si tomamos ahora m +1 abcisas equidistantes sobre el intervalo [a, b], es decir: x k = a + kh con k ∈A, h =
b−a m
obtenemos la fórmula de Newton-Cotes de m+1 abcisas b
m
m
∫ f (x )dx ≅ h ∑ α
k
a
k=0
f k , con αk = ∫ ∏ 0 i≠ k
t −i dt con k ∈A y donde f k = f ( a + kh) k −i
Los coeficientes αk solo dependen del grado m, es decir, ni del intervalo [a, b] ni de la función f(x). El error de la fórmula de Newton-Cotes de m +1 abcisas está dado por 6/15
b
f ( p +1) (ξ) p + 2 h con ξ ∈ (a , b) ( p + 1)!
m
E m = ∫ f ( x ) dx - h ∑ αk f k = k=0
a
y donde: m ∫ Π m (t ) dt K m = m0 t Π ( t ) dt ∫ m 0
si m es impar
p=m
p = m + 1 si m es par
siendo Π m ( t ) = t (t − 1)·...·( t − m)
3. REGLAS COMPUESTAS. Las formulas de integración numérica anteriormente expuestas no se aplican normalmente al intervalo I = [a, b] sobre el cual queramos calcular la integral, sino que se aplican sobre subintervalos de I, obteniendo así las reglas compuestas de integración numérica. 3.1. Regla de los Trapecios. Si partimos el intervalo I = [a, b] en M partes iguales, y sobre cada una de ellas, aplicamos la fórmula del trapecio, obtendremos la regla compuesta que llamaremos “Regla de los Trapecios” h [ f(a) + 2 f(a + h) + 2 f(a + 2h) + … + 2 f(b – h) + f(b), 2 que se forma como suma de la integración numérica sobre cada uno de los M intervalos en los que hemos descompuesto el intervalo I = [a, b], siendo cada una de esas M partes b−a de longitud h = : M T(h) =
b
M −1
b
xK +1
∫ f (x )dx = ∑ ∫ f (x )dx ∫ f (x )dx con K =0
a
a
x k =a+kh con k ∈A∈{0,…,M}
xK
y puesto que: xK +1
∫
xK
f ( 2 ) (ξk ) 3 h f ( x ) dx = [ f( x k ) – f( x k +1 ) ] h 2 12
donde ξk ∈ ( xk , x k +1 ) , entonces tenemos que: b
∫ a
f ( x ) dx - T(h) = −
1 M −1 ∑f 12 k = 0
( 2)
(ξk )h 3 = -
7/15
( b − a) 2M
M −1
∑f k=0
( 2)
(ξk )h 2 ,
donde si tenemos que f ∈ C 2 ( [a, b] ), utilizando el teorema del valor medio para sumas, existe ξ ∈ (a , b) tal que: b
∫ f (x )dx - T(h) = a
b − a ( 2) f (ξk )h 2 , 12
que es la fórmula del error de la regla de los trapecios. 3.2. Regla de Simpson. Si ahora lo que hacemos es dividir el intervalo I = [a, b] en 2M partes y aplicando la b−a fórmula de Simpson en cada uno de ellos, que de longitud , y sumándolos 2M obtenemos la “Regla de Simpson”. S(h) =
h [f(a)+ 4f(a + h)+2f(a + 2h)+ 4f(a + 3h)+…+2f(b – 2h)+ 4f(b –h)+ f(b)] 3
y además tenemos que si f∈ C 4 ( [a, b] ) obtenemos la siguiente expresión para el error de la regla Simpson: b
∫ f (x )dx - S(h) = a
b−a f 180
( 4)
(ξ) h 4 con ξ ∈ (a , b)
3.3. Regla del punto medio. Siguiendo un proceso análogo a los vistos hasta ahora, se obiene: b
∫ a
N 1 f ( x ) dx ≅ h ∑ f ( a + (i − ) h) 2 i =1
donde el error obtenido viene dado por: E=
f '' (ξ) h 2 ( b − a) 24
3.4. Regla del Trapecio Compuesta. Utilizando la regla simple del trapecio y dividiendo el intervalo I = [a, b] en N partes iguales obtenemos la siguiente expresión: b
∫ a
N −1 h f ( x ) dx ≈ h ∑ f ( a + ih) + ( f ( a) + f (b )) 2 i =1
8/15
siendo h =
b−a N
La expresión del error para la regla del trapecio compuesta viene dada por: E=-
f '' (ξ) h 2 ( b − a) 12
3.5. Regla del trapecio corregida. Utilizando la regla del trapecio corregida simple y dividiendo el intervalo I= b−a [a, b], en N partes de manera que definamos h = se tiene que la expresión de la N regla del trapecio corregida viene dada por: b
N −1
∫
f ( x ) dx ≈ h ∑ f ( a + ih) +
a
i =1
h h2 f (a ) + f (b ) + [ f ' ( a) − f ' ( b)] 2 12
siendo el error que se comete en la aproximación el siguiente: f IV (ξ)h 4 (b − a ) 72 Debemos darnos cuenta que todas las derivadas interiores f( x i ) se anulan entre si una con otra al sumar las fórmulas de todos los intervalos (como si fuese una suma parcial de una serie telescópica). Por lo tanto la regla del trapecio corregida anteriormente expuesta, es una regla compuesta del trapecio corregida, que al igual que la simple, obliga, para poder utilizarla, a que conozcamos la derivada de f(x) o la calculemos. E=
4. INTEGRACIÓN GAUSSIANA. Las fórmulas de integración interpolatoria de m + 1 abcisas anteriormente expuestas son exactas para los polinomios de grado menor o igual que m, independiente de la elección que hagamos de abcisas dentro del intervalo de integración. Veamos que una buena elección de estas m + 1 abcisas nos proporcionará fórmulas de integración numérica de m + 1 abcisas, exacta para polinomios de grado menor o igual que 2m + 1, y estas fórmulas recibirán el nombre de fórmulas Gaussianas. 4.1. Ejemplo que motiva las fórmulas. Si aplicamos de forma conveniente la regla de los trapecios sobre polinomios trigonométricos nos da el siguiente ejemplo, es decir:
9/15
Sea t n (θ) =
a0 n + a j Cos jθ + 2 ∑ j =1
n
n
∑ b j Sen jθ = j =1
∑c e
ijθ
j
j =− n
un polinomio de grado menor o igual que n, y calculamos 2π
J (tn ) =
∫t
n
(θ ) dθ = π a 0 =2π c 0
0
2π con M>n. M Por culpa de la periodicidad de t n (θ) , t n (θ + 2π) = t n (θ) ∀θ ∈ R por lo tanto para cualquier φ ∈ R se verifica que: mediante la regla de los trapecios con paso h =
2π +φ
J (tn ) =
∫t
2π n
(ϕ) dϕ =
∫t
n
(φ + θ )dθ = π a 0
0
φ
pero aplicando la regla de los trapecios a esta última integral tenemos el siguiente resultado exacto: T(
2π M
)=
2π M
donde tenemos que : M −1 i 2 πkj M e M = ∑ k=0 0
M −1
∑ t n (φ + k=0
2πk 2π )= M M
n
∑ c j e ijφ
j =− n
M −1 i 2 πkj M
∑e
= 2π c 0 = J (t n )
k=0
( j = 0) (0 < j ≤ n ≤ M
n
sabiendo que
∑c e j
ijφ
≠ 1 (0 < j ≤ n ≤ M )
j =− n
Si tomamos ahora un polinomio trigonométrico en cosenos de grado menor o igual que n n a t n (θ ) = 0 + ∑ a j Cos jθ 2 j =1 Si tenemos en cuenta la periodicidad t n (θ + 2π) = t n (θ) y la simetría respecto a θ = π , es decir, t n (θ) = t n (2π − θ) , por lo tanto, si M>n 2π
1 2π π 1 2π π J ( t n ) = ∫ t n (θ ) dθ = ∫ t n (θ )dθ = a 0 = T( )= 2 0 2 2 M M 0
M −1
∑t k=0
n
(φ +
2πk ) M
π para que el conjunto de abcisas sea M 2πk 2k + 1 π simétrico respecto a π . Entonces φ + = con k ∈{0, …, 2m+1} y los M m +1 2 Si tomamos M = 2(m + 1) > n y φ =
10/15
(2 k + 1)π ) aparecen dos veces: si l = 2m + 1 – k, con k ∈{0, …, m} tenemos 2( m + 1) que l∈{m + 1, …, 2m+1}, y valores t n (
tn (
(2 k + 1)π (2 k + 1)π (2l + 1)π ) = t n (2π ) = tn ( ) 2( m + 1) 2( m + 1) 2(m + 1)
Por lo tanto obtenemos así la siguiente fórmula de integración numérica de m +1 abcisas: 2π
∫ F (θ)dθ ≅ 0
π m +1
m
(2 k + 1)π
∑ F ( 2(m + 1)
)
k =0
que es exacta para los polinomios trigonométricos en cosenos de grados menor o igual que 2m +1. Si hacemos ahora el cambio t = Cos θ, que es usual en la aproximación mediante polinomios de Chebichev, resulta que f(t) = F(arccos t) será un polinomio de grado menor o igual que n si F es un polinomio trigonométrico en cosenos de grado menor o igual que n y así obtendremos la siguiente fórmula de integración numérica de m +1 abcisas: 1
∫
−1
f (t ) 1−t2
dt ≅
π m +1
m
∑ f ( Cos k=0
(2 k + 1)π ) 2( m + 1)
que es exacta para los polinomios de grado menor o igual que 2m +1, y la llamaremos Fórmula de Gauss-Chebichev. Podemos escribir también las fórmulas anteriores como: 2π
∫ F (θ)dθ ≅ 0
1
∫
−1
f (t ) 1−t2
π m +1
dt ≅
m
∑ F (θ ) k
k =0
π m +1
m
∑ f (t
k
)
k =0
donde θk con k ∈{0, …, m} son las raíces de ψm +1 (θ) = Cos((m +1)θ) y t k con k∈{0, …, m} las raíces de la función Tm +1 (t ) = Cos((m +1) arccos t) = ψm +1 ( arccos t). Debemos saber que ψm +1 ( θ) y Tm +1 (t ) forman parte de las familias ψ j (θ) y T j (t ) que son ortogonales respecto de los productos escalares: 1
π
F , G = ∫ F (θ) G(θ )dθ , 0
f,g =
∫
−1
f (t ) g (t ) 1− t2
11/15
dt
De la exactitud de la fórmula de Gauss-Chebichev resultará que ψ j ( θ) =Cos jθ y T j (t ) = ψ j (arccos t) son ortogonales respeto a los productos escalares: m
F ,G
m
=
∑ F (θ)G(θ) K=0 m
f,g
m
=
∑ f (t
k
) g (t k )
K=0
4.2. Fórmulas Gaussianas. La elección de las abcisas x k , con k∈{0, …, m}, como raíces de un polinomio ψm +1 (x), de una fórmula de polinomios ortogonales llevará siempre a fórmulas de cuadratura exacta para los polinomios de grado menor o igual que 2m +1. Sea w:[a, b] → R una función peso positiva y continua sobre el intervalo [a, b] y sea ψm +1 (x) = Am +1 x m +1 +… el polinomio ortogonal de grado m +1 asociado al producto escalar: b
f , g = ∫ w( x) f ( x) g ( x) dx a
ψm +1 (x) tiene m +1 raíces simples x k con k∈{0, …, m} que se encuentran en el intervalo (a, b). Si ψm +1 (x) sólo cambiase de signo en i abcisas x1 ,…, x i de [a, b] con 1≤ i ≤ m entonces el polinomio: q i ( x) ψm +1 (x) ≡ (x- α1 ),…, (x- αi ) ψm +1 (x) de grado m + i +1, no cambiaría de signo sobre (a, b) y por lo tanto: b
∫ cos(x)q
i
( x )ψm +1 ( x ) dx = qi ,ψm +1
a
la integral sería no nula, en contradicción con el hecho de que ψm +1 (x) es ortogonal a cualquier polinomio de grado menor o igual que m. Consideramos ahora la fórmula de integración numérica de m +1 abcisas evaluada sobre las raíces de ψm +1 (x): b
∫ w(x ) f (x )dx ≅ a
m
∑W
k
(x k )
K =0
12/15
Por la exactitud de las fórmulas de grado menor o igual que m, obtenemos que los pesos W k provienen de: b
W k = ∫ l k ( x ) w( x) dx , a
l k ( x) = ∏ k≠i
x − xi con k ∈{0, …, m} x k − xi
Comprobaremos ahora que esta elección hace exacta la fórmula también para los polinomios de grado menor o igual que 2m +1. A estas fórmulas obtenidas las llamaremos fórmulas Gaussianas de m +1 abcisas. Sea P2 m +1 (x) un polinomio de grado menor o igual que 2m +1 y sean q m (x) y rm (x) los polinomios de grado menor o igual que m que son el cociente y el resto obtenidos al dividir P2 m +1 (x) por el polinomio P2 m +1 (x) por el polinomio ψm +1 (x) de grado m +1. P2 m +1 = q m (x)+ ψm +1 (x)+ rm (x) Por lo tanto el polinomio q m (x) será ortogonal a ψm +1 (x), es decir, qm ,ψm +1 =0, es decir: b
b
b
∫ w(x )P2m+1 ( x)dx = ∫ w(x) + q m (x) +ψm +1 (x) + ∫ w(x )rm ( x)dx = a
a
b
a
m
= ∫ w( x )rm ( x) dx = ∑ Wk rm ( xk ) K =0
a
puesto que la fórmula gaussiana es exacta para el polinomio rm (x). Como ψm +1 ( x k ) = 0 con k ∈{0, …, m} obtenemos la exactitud de la fórmula gaussiana para P2 m +1 (x): m
m
∑W P k
2m +1
(x k ) =
k =0
m
∑W q k
K=0
m
b
( xk )ψm +1 ( xk ) + ∑ Wk rm ( xk ) = ∫W ( x) P2 m +1 ( x ) dx K =0
a
4.3. Error de las fórmulas Gaussianas. Para las funciones f ∈ C 2 m + 2 ( [a, b] ) podemos dar una expresión para el error de las fórmulas gaussianas. Para ello tengamos en cuenta el polinomio interpolador de Hermite P2 m +1 (x) a f en las abcisas x k con k∈{0, …, m}, por un lado la fórmula gaussiana es exacta para este polinomio y por otra parte: f(x) - P2 m +1 (x) =
f ( 2 m + 2 ) (ξ( x )) 2 wm ( x ) ( 2m + 2)!
13/15
donde con ξ ∈ {x0 , x1 ,..., x m, x} ⊂ [a, b] y wm (x ) = ( x − x 0 ) ·…· ( x − xm ) =
ψm +1 ( x) Am +1
Multiplicando por w(x) e integrando sobre el intervalo [a, b], obtenemos la fórmula del error de la fórmula gaussiana de m +1 abcisas: b
m
∫W ( x) f ( x)dx - ∑ Wk f (x k ) = K=0
a
f ( 2 m + 2 ) (ξ) 1 · ( 2m + 2)! Am2 +1
b
∫ W (x )ψ
2 m +1
( x) dx
a
donde ξ ∈ (a , b) y Am +1 es el coeficiente del término de mayor grado de ψm +1 (x).
5. MÉTODO DE ROMBERG. El método de Romberg se basa en el error de la fórmula trapezoidal compuesta. En esta, N −1 h f " (n ) 2 I(t) ≈ ∑ f i + [ f 0 + f n ] y E(t) = − h (b − a ) 2 2 i =1 b−a b − a N −1 f + fn . Por tanto si llamamos T(N) = [ ∑ fi + 0 ] a la N N 2 i =1 aproximación con (N +1) puntos, dando a N los valores 2 j (j =0, 1, 2, …) podemos 4 i Ti −1 ,i − j − Ti −1 , j definir Tij = recurrentemente. 4i −1 Desde luego h =
Se demuestra que cualquiera que sea la función f continua en [a, b]: b
∀i ,
Tij tiende a
∫ f (x )dx
cuando j → ∞
a
b
∀j ,
Tij tiende a
∫ f (x )dx
cuando i → ∞
a
Por otro lado el error de la aproximación Tij es: ETij (t ) = - (b - a) 2 i +3
B2 i + 2 2 (i +1 )(i +2 j )
f ( 2 i + 2 ) (ξ) con ξ ∈ [ a, b ] ( 2i + 2)!
siendo B 2 i + 2 el polinomio de Bernstein de f de orden 2i +2. b
Esta expresión indica que la convergencia de Tij hacia
∫ f (x )dx a
más rápida que la de cualquier serie geométrica.
14/15
cuando i→ ∞ es
La sucesión T00 , T10 , T20 ,…, Ti 0 … proporciona sucesivas fórmulas de integración Romberg. Tienen la forma: 2i
Ti 0 (f) =
∑w
j
f (xj )
j= 0
b−a y los pesos w j , calculables por recurrencia están todos en 2i ∞ ch 1 el intervalo [ , ch] con c = ∏ k 3 K =1 1 − 4 donde x j = a +jh y h =
Ejemplo.3
Para calcular aproximadamente
dx
∫ (1 + x
10 2
) −1 T00 = 0,5 T10 = 0,83 T20 = 1,63 T30 = 1,806
el método de Romberg no daria: T80 = 1,80926152
T90 =1,80926152 …
Bibliografía Recomendada Elementos de Análisis Numérico. Meter Henrici. Edit: Trillas. Mexico. 1977 Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Análisis Matemático. Aut. M. de Guzmán, B. Rubio. Ed. Pirámide. Análisis Matemático 2ª Edición. Aut. T. M. Apostol. Ed. Reverté
15/15
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 32 APLICACIÓN DEL ESTUDIO DE FUNCIONES A LA INTERPRETACIÓN Y RESOLUCIÓN DE PROBLEMAS DE LA ECONOMÍA, LAS CIENCIAS SOCIALES Y LA NATURALEZA. 1. Introducción. 2. Las Funciones en las Ciencias Naturales. 2.1. Aplicaciones a la Física. 2.1.1. Sistemas de Referencia. 2.1.2. Vector de Posición de un móvil 2.1.3. Vector Velocidad. 2.1.4. Vector Aceleración. 2.1.5. 2ª Ley de Newton. 2.1.6. Momento Angular. 2.1.7. Trabajo. 2.1.8. Energía. 2.1.9. Potencia. 2.1.10. Momento de una Fuerza y Momento de un Par. 2.1.11. Campos Eléctricos y Magnéticos. 2.1.12. Flujo Electrostático y Magnético. 2.1.13. La Ecuación de Ondas. 2.1.14. Ecuaciones de Maxwell. 2.1.15. Ondas Electromagnéticas. 2.2. Aplicaciones a la Química. 2.2.1. Cinética de Reacciones. 2.2.2. Termoquímica. Cálculos de Calores de Reacción. 2.3. Aplicaciones a la Biología. 2.3.1. Leyes de la Desintegración Radiactiva. 3. Las Funciones en las Ciencias Sociales. 4. Las Funciones en la Economía. 4.1. Funciones en Economía. 4.2. Derivadas en Economía. 4.3. Integrales en Economía. Bibliografía Recomendada.
1/32
TEMA 32 APLICACIÓN DEL ESTUDIO DE FUNCIONES A LA INTERPRETACIÓN Y RESOLUCIÓN DE PROBLEMAS DE LA ECONOMÍA, LAS CIENCIAS SOCIALES Y LA NATURALEZA. 1. INTRODUCCIÓN. Las materias que vamos a ver en este tema podríamos situarlas en lo que llamamos matemáticas aplicadas. Aparecen en otras ciencias y han sido las verdaderas impulsoras, a lo largo de la historia, de las matemáticas. Si recordamos, la matemática ha evolucionado a velocidad de vértigo en estos últimos 500 años. Y entre los que más han contribuido nos encontramos con físicos, astrónomos, economistas, etc. Estudiando comportamientos que se producían en la naturaleza se daban cuenta que era necesario inventar o desarrollar herramientas matemáticas que, o no existían o estaban poco evolucionadas. Durante la segunda mitad del siglo XX, nuevas técnicas han sido introducidas a fin de tratar problemas sociales, industriales, científicos y militares. No se ha desarrollado una nueva teoría, simplemente se han combinado diferentes técnicas particulares. El concepto de función es una de las ideas básicas de las matemáticas. Casi cualquier estudio que se refiera a la aplicación de las matemáticas a problemas de la vida real emplea las funciones. Podemos decir que el análisis matemático es la parte de las matemáticas que se dedica al estudio de las funciones. Proporciona métodos para la investigación cuantitativa de los distintos procesos de cambio, movimiento y dependencia, de una magnitud (variable) respecto de otra u otras. Por tanto, el análisis proporciona a materias tan dispares como la Física, la Tecnología, la Economía, la Biología, la Sociología y muchas más, métodos para la resolución de problemas e incluso la posibilidad de formular sus leyes. En este tema vamos a ver la aplicación de las funciones matemáticas a tres campos del saber: las Ciencias Naturales, las Ciencias Sociales y la Economía. 2. LAS FUNCIONES EN LAS CIENCIAS NATURALES. La historia del análisis ha estado muy ligada con los avances y necesidades de las ciencias naturales. Grandes personajes como Newton, Leibniz, Kepler, y otros hicieron avanzar la matemática para resolver problemas físicos. Por tanto, vamos ha realizar un recorrido por las principales aplicaciones a la Física y luego veremos aplicaciones a la Química y a la Biología. Debido a la gran cantidad de aplicaciones que hay, recomendamos al opositor que seleccione aquellas que prefiera de entre todas.
2/32
2.1. Aplicaciones a la Física. 2.1.1. Sistemas de Referencia. Para un estudio correcto del movimiento hemos de elegir en primer lugar un sistema de referencia (generalmente establecido por un sistema de coordenadas) al cual referir la posición de un punto material mediante unas coordenadas numéricas. El punto estará en reposo cuando las coordenadas respecto al sistema de referencia, no varían con el tiempo y estará en movimiento cuando al menos una coordenada varía con el tiempo. 2.1.2. Vector de posición de un Móvil. La r Posición de un punto móvil en el espacio queda fijada por el vector de posición, r trazado desde elr origen O de coordenadas hasta la posición del móvil P. Las componentes del vector r (x, y, z) serán las coordenadas del punto móvil en ese instante. El móvil, en su movimiento describe una curva C llamada trayectoria del punto P, El movimiento de P queda totalmente especificado y determinado si se conocen las tres coordenadas del vector como funciones del tiempo: x = x (t ) y = y (t ) z = z (t ) llamadas ecuaciones paramétricas del movi-miento. En cada instante t, los valores de x, y, z corresponden a las coordenadas del punto ocupado por el móvil en dicho instante. Físi-camente equivale a decir que todo movimien-to puede considerarse descompuesto en tres movimientos rectilíneos sobre los tres ejes coordenados.
De las ecuaciones paramétricas x = x(t), y = y(t), z = z(t) se deduce la ecuación de la trayectoria del punto móvil con sólo eliminar entre ellas la variable independiente t. El vector de posición vendrá dado por la expresión vectorial: r r r r r r = r (t ) = x( t )·i + y (t )· j + z (t )·k r expresión que determina r para cualquier instante t y se puede escribir de modo r r genérico como: r = r (t ) que es la ecuación vectorial del movimiento. La distancia recorrida por el móvil es la suma de todas las longitudes recorridas en los sucesivos intervalos de tiempo desde el instante inicial (t o ) al instante final (t). Esta distancia constituye la trayectoria definida anteriormente y sobre ella, el problema cinemático consiste en determinar el camino recorrido en función del tiempo, es decir: s = s(t)
3/32
2.1.3. Vector velocidad. Para el estudio del movimiento es necesario conocer la posición del móvil en cada instante, que vendrá dada por el vector de posición y la variación de esta posición con el tiempo, que vendrá dada por el vector velocidad. Si un móvil se encuentra en un instante dado, en la posición P (dada por el vector r de posición r ) y un intervalo ∆t después se encuentra en Q (dada por el vector de r r r posición r + ∆r ) el móvil ha sufrido un desplazamiento vectorial ∆r y ha recorrido un intervalo de trayectoria ∆s son, por definición, diferentes y no coincidentes. Sólo en el caso límite de que el intervalo de tiempo sea infinitesimal, ambos conceptos serán coinr cidentes en el gráfico y el módulo de ∆r coincidirá con ∆s . r r r ∆r Se define el Vector Velocidad Media v m como el cociente: vm = ∆t r que es un vector de dirección y sentido idéntico al vector desplazamiento ∆r , pues el escalar ∆t será siempre positivo. La dirección del vector desplaza-miento y por ello la del vector velocidad media es la dirección de la cuerda del arco PQ.
Análogamente se define la Velocidad Media en la Trayectoria v m (magnitud esca-lar) al cociente de la trayectoria recorrida en el tiempo empleado: ∆s vm = ∆t Ambas velocidades medias, una vectorial y otra escalar, no son generalmente, de r igual módulo pues ∆r ≠ ∆s como puede apreciarse en la Fig.2. Si reducimos el intervalo de tiempo ∆t hasta valores muy pequeños que tiendan a cero, el vector velocidad quedará referido a un intervalo infinitamente pequeño, y se llamará Vector velocidad instantánea o simplemente Vector Velocidad: r r r ∆r dr v = lim = ∆ t → 0 ∆t dt Análogamente se definirá la Velocidad Instantánea sobre la Trayectoria como: ∆s ds v = lim = ∆t → 0 ∆t dt Teniendo en cuenta la expresión de: r r r r r = x (t )·i + y (t )· j + z ( t )·k el vector velocidad también puede expresarse en un sistema cartesiano mediante la derivada del vector de posición:
4/32
r r dr dx( t ) r dy (t ) r dz (t ) r v= = i + j+ k dt dt dt dt y la celeridad, o módulo de la velocidad, será: dx 2 dy 2 dz 2 v = v = + + dt dt dt
1/ 2
que será una función del tiempo, como lo son las componentes dx/dt, dy/dt y dz/dt. 2.1.4. Vector Aceleración. El movimiento de un punto material, en su forma más general, tiene en cada punto de la trayectoria un vector de posición y un vector velocidad diferentes, lo que significa una variación de la velocidad tanto en módulo como en dirección y sentido. En el instante t la velocidad del r punto móvil situado en P es v y después de transcurrido un intervalo de tiempo ∆t, es decir en el instante t+∆t, la velocidad del móvil, situado en Q es r r v +∆ v . Definimos el Vector Aceleración Media al cociente entre la variación del vector velocidad y el intervalo de tiempo transcurrido. Es un vector que tiene la misma dirección y r sentido que ∆ v : r r ∆v am = ∆t Considerando un intervalo de tiempo infinitamente pequeño, que tienda a cero, podemos definir el Vector Aceleración Instantánea o simplemente el Vector Aceleración como el valor en el límite, de la relación ∆V/∆t cuando ∆t tiende a cero, es decir: r r r r r ∆v dv d dr d 2 r a = lim = = = ∆ t →0 ∆ t dt dt dt dt 2 El vector aceleración tendrá por componentes: r dv x r dv y r dv z r d 2 x r d 2 y r d 2 z r a= i + j+ k= 2 i + 2 j+ 2 k dt dt dt dt dt dt y su módulo será: 2
2
d2x d2y d2z r a = a = 2 + 2 + 2 dt dt dt
5/32
2
2.1.5. 2ª Ley de Newton. La segunda ley de Newton se puede enunciar así: "Una fuerza externa actuando sobre una partícula le produce una variación de su cantidad de movimiento o Momento Lineal” y matemáticamente será: r drp d r F= = ( m.v ) dt dt Si realizamos la derivada de la expresión anterior, tendremos: r r r dm r dv dv r F= .v + m. = 0 + m. = m.a dt dt dt El primer término dm/dt es nulo pues la masa de la partícula es constante, lo que es válido en el campo de la Mecánica Clásica. Por tanto, la Segunda Ley de Newton, r r F = m.a se puede expresar matemáticamente como: r drp F= dt que viene a expresar que cuanto mayor sea la fuerza aplicada, mayor será la variación del estado dinámico del sistema caracterizado por el momento lineal. El Momento Lineal (o Cantidad de Movimiento) de un sistema de partículas es la suma vectorial de los momentos lineales de cada una de las partículas que constituyen el sistema: r r r r r siendo: p i = mi vi resultará p = ∑ p i = ∑ mi v i r r y si consideramos que vi = dri / dt sustituyendo y desarrollando: r dr1 d r p = ∑ mi ⋅ = dt dt
r drCM r d r r ∑ mi ri = dt M .rCM = M . dt = M .v CM
lo que se expresa diciendo que: El Momento Lineal de un sistema de partículas es igual al producto de la masa total del sistema por la velocidad de su centro de masa, lo que llamaremos Momento Lineal del Centro de Masa. 2.1.6. Momento Angular El Momento Angular (o Momento Cinético) para una partícula se define como el Momento de su Momento Lineal, o sea: r r r r r L = r ∧ p = r ∧ mv Para un sistema de partículas, el Momento Angular será la suma vectorial de los momentos angulares de sus partículas componentes:
6/32
r r r r r r L = ∑ Li = ∑ ri ∧ p i = ∑ ri ∧ mi v i
(15)
La variación del Momento Angular del sistema se obtiene derivando la expresión anterior: r r r dL d r r dr r r d (mi vi ) = (∑ ri ∧ mi vi ) = ∑ i ∧ mi vi + ∑ ri ∧ = ... dt dt dt dt r r r r dv i r r r r r r ... = ∑ [vi ∧ mi v i ] + ∑ ri ∧ mi = 0 + ∑ (ri ∧ mi ai ) = ∑ ri ∧ Fi = ∑ M i = M dt
(
)
r dL r =M dt
Resultando finalmente que:
El primer término de la derivada es cero porque se trata de dos vectores paralelos, con producto vectorial nulo. El segundo término es la suma de los momentos que actúan sobre cada partícula, es decir, el Momento de Fuerza resultante. En este Momento de Fuerza, se incluyen las fuerzas internas y externas, es decir: r r r r r r r r r r r M = ∑ M i = ∑ ri ∧ Fi = ∑ ri ∧ FEi + FIi = ∑ ri ∧ FEi + ∑ ri ∧ FIi
(
)
( (
))
(
)
(
)
pero el término correspondiente a las fuerzas internas es nulo, de forma que podemos decir que son las fuerzas externas las únicas que producen variación del Momento Angular del sistema. 2.1.7. Trabajo. Considerando el caso en que una fuerza no constante actúa durante un determinado trayecto sobre un cuerpo produciéndole un desplazamiento se define el trabajo realizado por dicha fuerza sobre el cuerpo como la circulación de la fuerza a lo largo del desplazamiento. La circulación es la integral lineal del producto escalar del vector Fuerza por el vector desplazamiento diferencial entre el punto inicial y el punto final, siguiendo una determinada trayectoria: r2 → r W =∫ F •r r1
2.1.8. Energía. Podemos definir la energía como la capacidad de un sistema para realizar un trabajo. Entonces: ∆E=E2 -E1 =W es decir, el trabajo exterior realizado por el sistema es igual a la variación de la energía de dicho sistema. La energía cinética de un sistema de partículas es la suma de las energías cinéticas de las partículas que componen el sistema:
7/32
1 1 EC = ∑ EC i = ∑ mi vi2 = ∑ mi vi2 2 2 En el caso de un cuerpo extenso que se mueve en una trayectoria lineal (movimiento de traslación) en la que todo el cuerpo posee la misma velocidad, la energía cinética puede definirse: EC =
1 2 1 1 v dm = v 2 ∫ dm = M CM v 2 ∫ 2 2 2
En un campo de fuerzas conservativas, se define la Energía Potencial como una función del punto del campo tal que el trabajo realizado para trasladar el cuerpo desde un punto a otro del campo es igual a la variación de la energía potencial entre esos dos puntos, o sea: r2 r r W = ∫ F • r = EPA − EPB r1
de tal forma que la Energía potencial absoluta de un punto del campo conservativo, ee: r r r r EP( r ) = −∫ F • r ∞
O sea, es el trabajo realizado sobre un cuerpo para desplazarlo desde el infinito (donde la fuerza del campo es nula) hasta el punto determinado. Dicho trabajo se acumula en el cuerpo como energía potencial. 2.1.9. Potencia. Para medir la eficacia de un sistema introducimos el concepto de potencia, que se define como el trabajo que un sistema puede hacer en la unidad de tiempo. r r ∆W dW F • dr r r P = lim = = = F •v ∆ t →0 ∆ t dt dt La potencia es una magnitud física de carácter técnico pues mide la eficacia de una máquina ya que el trabajo es una función que no depende del tiempo 2.1.10. Momento de una fuerza y Momento de un Par. Cuando una fuerza actuando sobre un cuerpo produce un efecto de rotación definimos Momento de una fuerza con respecto a un punto, como el producto vectorial del vector distancia del punto a la fuerza por el propio vector fuerza: r r r M =r ∧F Si se trata de un par de fuerza, definido como dos fuerzas iguales, paralelas y contrarias que actúan sobre un cuerpo produciéndole un giro, se caracteriza por su
8/32
Momento, dediniendo el Momento del Par de fuerza como el producto vectorial de una de una de las fuerzas por el vector que une el origen de ambas: 2.1.11. Campos Eléctricos y Magnéticos. La fuerza eléctrica que mueve a un carga de prueba dentro del campo eléctrico se determina aplicando la Ley de Coulomb. Así, consideremos una carga Q1 creadora de un campo y situada en el origen de coordenadas. Otra carga Q2 positiva,r de prueba, situada en un punto dado por el vector r sufrirá una r fuerza F , por la acción del campo, dada por: r 1 Q1Q2 r 1 Q1 Q2 r F= ⋅ 2 u= ⋅ r 4πε r 4πε r 3 donde F>0 (positiva), la fuerza F es de repulsión si las cargas son del mismo signo y F
9/32
Físicamente se interpreta el potencial en un punto r como "el trabajo realizado por una fuerza exterior opuesta a la del campo, para trasladar la unidad de carga positiva desde el infinito hasta el punto". r Se debe cumplir la condición E = −∇V (el vector campo es igual al gradiente de potencial cambiado de signo), donde el signo negativo significa que el Campo Eléctrico tiene el mismo sentido que el de la disminución del potencial. El Campo Magnético se manifiesta por las fuerzas magnéticas que se ejercen dos conductores arbitrarios, por los que circulan corrientes eléctricas estacionarias Ia e Ib , a semejanza de las fuerzas que se ejercen entre cargas eléctricas. Las fuerzas magnéticas entre conductores es un hecho experimental que estu-dió Ampère en el que la fuerza entre dos hilos rectos paralelos con corrientes Ia e Ib es proporcional a Ia .Ib /r siendo r la distancia entre ambos hilos. En el caso más general que se describe en la Fig.1, la fuerza elemental que un elemento de corriente Ia dla ejerce sobre otro elemento de corriente Ib dlb viene dado por: r r r µ0 I a dla ∧ ( I b dlb ∧ ur ) d F= . 4π r2 2
e integrando doblemente a lo largo de ambos circuitos, para determinar la fuerza total de interacción magnética entre los dos circuitos, resulta: r r r r µ0 dI a ∧ ( dI b ∧ u ) Fab = .I a I b ∫ ∫ a b 4π r2 r r r r siendo u un vector unitario u = r r y el vector trazado desde el elemento I a dl a al eler r mento I b dl b y Fab la fuerza ejercida por A sobre B. La constante µ0 es la "permeabilidad magnética" del vacío, depende de las unidades empleadas. Esta fuerza magnética puede expresarse como la interacción entre la corriente Ia en el campo magnético creado por la corriente Ib en el punto de a. Este campo magnér tico se mide mediante la magnitud vectorial B llamada "Vector Inducción Magnética" o "Densidad de Flujo Magnético". La ecuación anterior puede escribirse así: r r r µ0 r r r dl b ∧ r Fab = I a ∫ dl a ∧ .I b ∫ = I d l a∫ a ∧ B 3 a b a r 4π siendo:
r r r µ0 dl b ∧ r B= .I b 4π ∫b r 3
10/32
(*)
r el vector Inducción Magnética B debido al circuito b en la posición ocupada por el r r elemento de corriente I a dl a del circuito a, posición determinada por el vector r . Dicho vector se dirige siempre desde la fuente al punto. La ecuación (*) se conoce como "Ley de Biot y Savart" y su integración sólo puede realizarse analíticamente en aquellos circuitos que tengan formas geométricas sencillas. 2.1.12. Flujo Electrostático y Magnético. Se define el flujo de un campo eléctrico en un punto, como el conjunto de líneas r de campo que atraviesan la unidadr de superficie colocada en el punto. El flujo de E a través de la superficie elemental d A viene dado por: r r dΦ = E • dA
luego
r r Φ = ∫ E • dA = ∫ E.dA. cos ϕ A
A
En algunos casos, esta magnitud ayuda a calcular la expresión del campo electrostático (en todos los puntos del espacio) creado por algunas distribuciones de carga. Al igual que en Electrostática, donde se utilizan las líneas de fuerza para describir el Campo Eléctrico, para un Campo Magnético, se definirán las líneas de fuerza magnética, líneas de flujo magnético o líneas de inducción, como líneas tangentes en cada s punto a la dirección de vector B en dicho punto. El "Flujo Magnético" Φ está relacionado con el Vector Inducción Magnética mediante la expresión integral: r r Φ= ∫ B • dA s
r r es decir: B = dΦ / dA el vector Inducción Magnética en un punto del campo magnético tiene la dirección y el sentido de la línea de fuerza que pasa por dicho punto y tiene por módulo, el flujo magnético que atraviesa la unidad de superficie colocada en el punto. 2.1.13. La Ecuación de las Ondas. Para establecer la ecuación del movimiento ondulatorio, consideraremos un foco O origen de una perturbación armónica dada por la expresión: ψ0 = A. cos ωt donde la elongación ψ0 representa el desplazamiento de la partícula origen desde la posición de equilibrio. A una distancia x del punto origen, la onda llegará un cierto tiempo después, tiempo que vendrá dado por: t'=x/v y la partícula P allí situada sufrirá una oscilación armónica idéntica a la de la partícula origen, si no hay pérdidas de energía, con un retraso de t’=x/v respecto de la partícula origen. La perturbación ψ de dicha partícula vendrá dada por una ecuación de M.A.S. idéntica a la anterior, o sea:
11/32
ψ = A. cos ω(t − t ') siendo t el tiempo contado desde el inicio de la perturbación en el origen y t' el tiempo transcurrido hasta iniciarse la perturbación de la partícula P. x 2π x x t ψ = A cos ω t − = A. cos t − = A cos 2π − T v v T Tv resultando:
t x ψ = A cos 2π − T λ
que es la ecuación del Movimiento Ondulatorio que expresa la magnitud ψ de la perturbación de la partícula P, de coordenada x, en el instante t.. La ecuación de onda puede escribirse también así: ψ = A cos 2π(νt − κx ) donde ν=l/T es la frecuencia y κ=1/λ es el número de ondas u ondas contenidas en una distancia unidad. Algunos textos llaman Numero de ondas a la expresión 2π/λ o número de ondas contenidas en la distancia 2π, siendo entonces la ecuación: ψ = A cos(ωt − κx ) Ambas ecuaciones se refieren a la perturbación ondulatoria a lo largo del eje X, sin embargo en cualquier otra dirección arbitraria r del espacio será: ψ = A cos 2π(νt − κr ) Si consideramos las derivadas parciales primera y segunda respecto a x y a t resultará: ∂ 2ψ ∂ψ = −4π 2κ 2 A. cos 2π(νt − κx ) = 2πκA. sen 2π(νt − κx ) 2 ∂x ∂x ∂ψ ∂ 2ψ = −2πνA. sen 2π(νt − κx ) = −4π 2ν 2 A. cos 2π(νt − κx ) 2 ∂t ∂t y dividiendo miembro a miembro las segundas derivadas parciales: ∂ 2ψ ∂t 2 − 4π 2ν 2 A cos 2π(νt − κx ) ν 2 λ2 = = 2 = 2 = v2 2 2 2 2 ∂ ψ ∂x − 4π κ A cos 2π(νt − κx ) κ T o bien:
2 ∂ 2ψ 2 ∂ ψ = v ∂t 2 ∂x 2
12/32
ecuación diferencial del Movimiento Ondulatorio o ecuación de d'Alembert que expresa que toda variación de la magnitud ψ (elongación, presión, campo eléctrico o magnético, etc.) que la cumpla resulta ser una perturbación ondulatoria. 2.1.14. Ecuaciones de Maxwell. 1ª Ley de Maxwell. Expresa la ley de Gauss que nos dice que el flujo del campo eléctrico a través de una superficie cerrada es igual a las cargas encerradas dentro de la superficie dividida por la constante dieléctrica. Matemáticamente es: r 1 r 1 Φ = ∫ E • dS = ∫ dq = S v ε0 ε0
∫ ρ.dV
Forma integral
τ
donde τ representa el volumen del recinto encerrado por la superficie gausiana S. La ley de Gauss puede expresarse en forma diferencial empleando el teorema de r r r la divergencia, que es: ∫ E • dS = ∫ ∇ • E.dV y aplicándolo a la expresión anterior S
τ
resulta: r 1 ∫τ∇ • E.dV = ε0 ∫τ ρdV
luego se verificará:
r ρ ∇• E = ε0
2ª Ley de Maxwell r El campo magnético, dado por el vector B , es un campo solenoidal, es decir, que viene dado por líneas de campo cerradas sobre sí mismas. Esta condición se expresa por la ecuación: r ∇• B =0 es decir, la divergencia del vector Inducción Magnética es nula y por tanto la densidad de flujo magnético por unidad de volumen es nula, lo que se interpreta diciendo que para cualquier volumen cerrado del Campo Magnético, el flujo entrante es igual al flujo saliente, y por lo tanto, el flujo neto es nulo. Por esta expresión, en el Campo Magnético no pueden existir ni fuentes ni sumideros de líneas de inducción magnética, porque estas líneas de campo son líneas cerradas que no empieza ni acaban. El flujo de Inducción Magnética a través de cualquier superficie cerrada es nulo, pues todo flujo que entra también sale, por ello: r r B ∫ • dA = 0 S
3ª Ley de Maxwell
13/32
Forma integral
Expresa la Ley de Faraday-Lenz, que indica que se produce en un circuito eléctrico una corriente inducida cuando en dicho circuito se origina una variación del flujo magnético que lo atraviesa. Matemáticamente se expresa: ε= −
dΦ dt
que se interpreta diciendo que "se genera una FEM inducida en el circuito cerrado siempre que se produzca una variación del flujo magnético y esta FEM es igual a la rapidez con que varía el flujo, con signo opuesto". r r Ya que por definición, la FEM es: ε = ∫ E • dr , la circulación en trayectoria r r cerrada del campo eléctrico inducido E en el conductor móvil, siendo dr un elemento de dicho y como este circuito es atravesado por un flujo dado por: r circuito r Φ = ∫ B • dA , la ecuación de Faraday se escribe: S
r r r d r ε = ∫ E • dr = − ∫ B • dA C dt S siendo C cualquier curva cerrada (circuito o no-circuito) y S la superficie limitada por ella. Si no existen fuentes en el circuito que consideramos, la corriente que se genera es igual a la F.E.M. inducida dividida por la resistencia óhmica del circuito., igual que si existiera una batería del mismo voltaje y polaridad que la F.E.M. inducida. Para poner la Ley de Faraday en forma diferencial, aplicaremos el Teorema de Stokes, para trasformar una integral curvilínea en una integral de superficie, así el primer miembro se transformará en: r
r
r
r
∫ E • dr = ∫ (∇ ∧ E ) • dA C
Forma integral
S
resultando para la ley de Faraday:
r r r r ∂B ∇ ∧ E • dA = − ∫ • dA S ∂t
∫( S
)
suponiendo que la trayectoria cerrada de integración C es estacionaria los integrandos de ambos miembros serán idénticos y resultará: r r ∂B ∇∧E =− ∂t 4ª Ecuación de Maxwell. La cuarta ecuación de Maxwell corresponde a la Ley de Ampère de la circulación r o Teorema Circuital y establece que la circulación del vector Inducción Magnética B , creado por un conjunto de corrientes, a lo largo de una trayectoria cerrada C, es igual al producto de la permeabilidad magnética µ0 por la suma algebraica de las intensidades de
14/32
corriente que atraviesan la superficie S arbitraria, limitada por la curva cerrada. Se expresa matemáticamente mediante la ecuación: r r r r B • d l = µ J • dS = µ0 ∑ I i = µ0 I 0∫ ∫ S
En consecuencia el Campo Magnético no es conservativo y no podemos definir en cada punto un potencial escalar que nos permita completar el estudio del campo. Si el circuito incluye algún condensador, la variación del flujo eléctrico por unidad de tiempo que se produce en el condensador, es generada por una “corriente” (variación de carga por unidad de tiempo) a través del condensador que es la que Maxwell llamó corriente de desplazamiento. En el condensador se produce una variación del flujo magnético ε0 .dΦE/dt, producida por la corriente de desplazamiento Id =ε0 .dΦE/dt que se incluye, por ello en la Ley Circuital de Ampère, tal como: r r dΦ B ∫C • dl = µ0 (I + I d ) = µ0 I + ε0 dt E
(*)
con lo cual la ley se generaliza a todas las posibles situaciones. Esta ecuación representa una forma de la Cuarta Ecuación de Maxwell del Campo Electromagnético. Consecuencia de esta generalización: se llega a la conclusión de que un campo magnético no sólo es creado por una corriente eléctrica I sino que también puede ser creado por un campo eléctrico que varíe con el tiempo. Como la corriente real puede ponerse en función de la Densidad de Corriente: r r I = ∫ J • dS S
y considerando igualmente el flujo eléctrico se puede expresar: r r Φ E = ∫ E • dS S
su variación con el tiempo se expresará: r r dΦ E ∂E =∫ • dS S ∂t dt por ello la corriente de desplazamiento, ideada por Maxwell, dada por la anterior expresión puede escribirse: r r dΦ E ∂E I d = ε0 = ε0 ∫ • dS S ∂t dt y la ecuación (*) finalmente quedará de la forma siguiente: 15/32
r r r r r r r r E E r ∂ ∂ ∫C B • dl = µ0 ∫S J • dS + ε0 ∫S ∂t • dS = µ0 ∫S J + ε0 ∂t • dS que es la forma integral de la Cuarta Ecuación de Maxwell. Si aplicamos el Teorema de Stokes:
∫
C
r r r r B • dl = ∫ ∇ ∧ B • dS S
(
)
se obtiene la expresión integral siguiente: r r r r r ∂ E • dS ∇ ∧ B • dS = µ0 ∫S J + ε0 ∂t
∫( S
)
e igualando los integrandos: r r r ∂ E ∇ ∧ B = µ0 J + ε0 ∂t forma diferencial de la Cuarta Ecuación de Maxwell del Campo Electroma gnético. 2.1.15. Ondas electromagnéticas. Se pueden deducir las propiedades de las ondas electromagnéticas, a partir de las ecuaciones de Maxwell, que recordaremos a continuación: r Q r E • d A = ∫ ε0 r r dΦ ∫ E • ds = − dt m
(1)
r r B ∫ • dA = 0
(2)
(3)
r r dΦ B ∫ • ds = µ0 I + ε0 µ0 dt e
(4)
Supongamos que la onda electromagnética es una onda plana, es decir, que sólo viaja en una dirección. Supongamos que viaja en la dirección del eje X, el campo eléctrico E está en la dirección Y y el campo magnético B en la dirección Z. Además los campos E y B son funciones de x y t y no dependen de las otras coordenadas y, z. Utilizando la tercera y cuarta ecuación de Maxwell, considerando que en el espacio vacío, Q=0 e I=0, resultará: r r dΦ m E ∫ • ds = − dt
y
r r dΦ e B ∫ • ds = ε0 µ0 dt
y aplicando el teorema de Stokes y desarrollando las expresiones resultantes, como se demuestra a continuación, llegamos a:
16/32
A partir de la 3ª y 4ª ecuaciones de Maxwell: r r dΦ m E ∫ • ds = − dt que se escribirán así:
r r dΦ e B ∫ • ds = ε0 µ0 dt
y
r r ∂ r r E • d s = − B • dA ∫ ∂t ∫s
r r r r ∂E B • d s = ε µ • d A 0 0 ∫ ∫s ∂t
y
r aplicamos el teorema de Stokes, que para el vector genérico T se escribe: r
r
r
r
∫ T • dl =∫ (∇ ∧ T ) • dA s
las ecuaciones anteriores quedarán escritas así: r
r
r
r
∂ ∫ (∇ ∧ E ) • dA = − ∂t ∫ B • dA s
s
r r r r ∂E ∇ ∧ B • d A = ε µ • d A 0 0 ∫s ∫s ∂t
(
)
e igualando los integrandos, por ser integrales de superficie extendidas a la misma superficie, resultará: r r r r ∂B ∂E ∇∧E =− y ∇ ∧ B = ε0 µ0 ∂t ∂t r r r r y desarrollando los rotacionales para E = E y j y B = Bz k resulta: r i ∂ ∂x 0 r i ∂ ∂x 0
r j ∂ ∂y 0
r j ∂ ∂y Ey
r k r ∂E y ∂ = i − ∂z ∂z 0
r k r ∂B ∂ = i z − ∂z ∂y Bz
r ∂E y + k ∂x
∂B r = − z k ∂t
r ∂B z ∂E y j = ε0 µ0 ∂x ∂t
r j
⇒
⇒
∂E y ∂x
=−
∂E y ∂B z = −ε0 µ0 ∂x ∂t
r r ya que E y B sólo son funciones de x y t. Prescindiendo de los subíndices de E y B resultará finalmente: ∂E ∂B =− ∂x ∂t
y
∂B ∂E = −ε0 µ0 ∂x ∂t
si derivamos la primera con respecto a x y sustituimos la segunda resultará: 17/32
∂B z ∂t
∂2E ∂ ∂B ∂ ∂B ∂ ∂E = − = − = − − ε0 µ0 2 ∂x ∂x ∂t ∂t ∂x ∂t ∂t ∂2 E ∂2 E = ε µ 0 0 ∂x 2 ∂t 2
o sea:
Análogamente, derivando la segunda ecuación de las (5) con respecto a x y sustituyendo la primera, resultará: ∂ 2B ∂ ∂E ∂ ∂E ∂ ∂B = −ε0 µ0 = −ε0 µ0 = −ε0 µ0 − 2 ∂x ∂x ∂t ∂t ∂x ∂t ∂t ∂ 2B ∂2 B = ε µ 0 0 ∂x 2 ∂t 2
o sea:
Las ecuaciones anteriores pueden escribirse así: ∂ 2E 1 ∂2 E = ∂t 2 ε0 µ0 ∂x 2
y
∂2 B 1 ∂2 B = ∂t 2 ε0 µ0 ∂x 2
Estas ecuaciones son análogas a la llamada "ecuación general de la onda", que tiene la forma: 2 ∂2 f 2 ∂ f = v ∂t 2 ∂x 2 donde v es la velocidad de la onda y f es la amplitud de la perturbación de la onda. 2.2. Aplicaciones a la Química. 2.2.1. Cinética de reacciones. La rapidez o velocidad de una reacción química se expresa en términos de la concentración de uno de los reactivos o de los productos involucrados en la reacción general. La rapidez se define como el índice de cambio con el tiempo, de la concentración de un reactivo o de un producto. Si tomamos la reacción general: 2 A + B → A2 B la rapidez o velocidad de desaparición del reactivo A con respecto al tiempo, puede expresarse por la derivada siguiente: d [ A] − dt donde el signo negativo (−), indica que la concentración de A, [A], disminuye conforme transcurre el tiempo de la reacción. De manera alternativa, la rapidez de la reacción puede expresarse en términos de desaparición del reactivo B, por la derivada siguiente:
18/32
−
d [B] dt
En términos de rapidez de formación del producto de la reacción A2 B, la rapidez la podemos expresar por la derivada siguiente: +
d [ A2 B] dt
donde, en este caso el signo positivo (+) indica que la concentración de A2 B aumenta al transcurrir el tiempo de la reacción. Resulta evidente que las velocidades expresadas por las ecuaciones (1), (2) y (3) no son iguales, ya que A desaparecerá con el doble de rapidez con que disminuye B se forma A2 B, por consiguiente, podemos expresar la rapidez de esta reacción por medio de cualquiera de las derivadas siguientes: V =−
d [A] d [B] d [ A2 B ] = −2 =2 dt dt dt
La rapidez o velocidad de la reacción tiene, pues, unidades de concentración por unidad de tiempo. La expresión matemática que relaciona la velocidad de una reacción con las concentraciones de los reactivos, recibe el nombre de ecuación de velocidad o Ley diferencial de la Velocidad que tiene casi siempre la forma general: Velocidad=K(T).Función de concentración de reactivos y para una reacción de carácter general será: V = K .[A]α [B]β [C ]γ ... La constante K que interviene en ella, se denomina coeficiente de velocidad, constante de velocidad o factor de las concentraciones de los reactivos y depende considerablemente de la temperatura, siendo constante únicamente para cada valor concreto de la temperatura y para cada reacción determinada. Si suponemos que la velocidad es proporcional a la primera potencia de la concentración de A e independiente de las concentraciones de otras sustancias, entonces la ley de velocidades puede escribirse de la siguiente manera: d [ A] − = K.[ A] dt Puesto que la concentración de A se eleva a la primera potencia en la ley de velocidades, se dice que la reacción es de primer orden en A. Alternativamente, puede descubrirse que la velocidad de reacción depende de la primera potencia de [A] y del cuadrado de la [B], en este caso la ley de velocidades se escribirá así:
19/32
−
d [ A] = K '.[ A][ . B]2 dt
en donde K’≠K y se dice que esta reacción es de primer orden en A y de segundo orden en B. También sería posible que se descubriera experimentalmente que la rapidez depende de la tercera potencia de la concentración de A y de la segunda potencia de la concentración de B y la ley de velocidades se escribirá así: −
d [ A] = K".[ A]3 .[B ]2 dt
donde K" es la constante de velocidad específica y se dice que la reacción es de tercer orden en A y de segundo orden en B. Si se encuentra que la velocidad de la reacción es independiente tanto de A como de B, la reacción se dice que es de orden cero en A y en B y la ley de velocidades es: d [ A] − = K".[ A]0 .[B]0 dt Si la reacción
A + B → productos
es de segundo orden la velocidad de desaparición de A viene dada por: −
d [ A] = K .[ A]2 dt
[A] = [B]
V = K .[A][ . B]
→
e integrando entre condiciones iniciales de [A] 0 para t=0 y las condiciones finales de [A] para el tiempo t, resulta: [ A]
−
t d [A] = K 2 ∫[ A] [ A] ∫0dt 0
−1 [ A ] [ A ]0
[− [ A] ]
[ A]
t
−2 ∫ [ A] d [ A] = − K ∫0dt
→
[ A ]0 [ A]
−1 1 1 = = − = −K .t [A] [ A ]0 [ A]0 [ A] 1 1 = + K .t [ A] [A]0
Si tomamos a como concentración inicial de A y x como concentración que ha reaccionado durante el tiempo t, la expresión anterior se escribirá así: d (a − x ) dx − = K (a − x )2 = dt dt E integrando entre una situación inicial para t=0 donde x=0 y una situación final para tiempo t y concentración x, resulta:
∫
x
0
t dx = K .dt ( a − x) 2 ∫0
x
⇒
1 a − x = K.t 0 20/32
⇒
1 1 = + K .t a− x a
y despejando la constante K resulta: 1 x K= t a( a − x ) 2.2.2. Termoquímica. Cálculos de calores de reacción. Las capacidades térmicas de reactivos y productos se pueden usar para calcular el cambio de entalpía para una reacción dada, a cierta temperatura T2 , a partir del conocimiento del cambio de entalpía para la reacción a otra temperatura T1 . Un cálculo de este tipo es muy útil, puesto que elimina la necesidad de determinar experimentalmente ∆H para la reacción a cada temperatura. Veamos como se lleva a cabo este cálculo. Para ello, utilicemos la reacción: A(g) → B(g) A T1 , el cambio de entalpía medio es ∆H1 . A continuación desearíamos conocer el cambio de entalpía a la temperatura T2 , cuando T2 >T1 . Este resultado se puede obtener tomando en consideración el proceso cíclico que se muestra en la fig.2.: Las etapas de este proceso, recorrido en sentido contrario al de las agujas del reloj de A(g) a T1 en torno a la trayectoria cerrada y de regreso a este punto, son: 1) La reacción A(g) → B(g) a T1 se lleva a cabo y cambio de entalpía es ∆H1 . 2) A continuación, el compuesto B(g) se eleva de T1 a T2 y el cambio de entalpía para este proceso está dado por la ecuación: T2
∆H 3 = ∫ C P ( B ) dT T1
en donde CP(B) es la capacidad térmica a P=cte del compuesto B.
3) A continuación, se lleva a cabo la inversa de la reacción A(g) → B(g) a T2 . Entonces el cambio de entalpía para esta etapa es el valor negativo de la reacción directa, ∆H2 . 4) Finalmente, el compuesto A disminuye su temperatura de T2 a T1 , volviendo a nuestro punto de partida. El cambio de entalpía es: T1
∆H 4 = ∫ C P ( A ) dT T2
21/32
A partir de la Primera Ley, Σ∆Hi=0 para una trayectoria cerrada y, para el ejemplo anterior, se tiene: 4
∑ ∆H
= ∆H1 + (− ∆H 2 ) + ∆H 3 + ∆H 4 = 0
i
i =1
y al utilizar los valores de ∆H3 y ∆H4 de las etapas (2) y (3), se obtiene: T2
T1
∆H 2 = ∆H1 + ∫ CP ( B ) dT + ∫ CP ( A ) dT T1
T2
T2
T2
T1
T1
∆H 2 = ∆H1 + ∫ CP ( B ) dT − ∫ CP ( A ) dT T2
∆H 2 = ∆H1 + ∫ (CP ( B ) − CP ( A ) )dT T1
o bien:
T2
∆H 2 = ∆H1 + ∫ ∆C P dT T1
donde ∆CP=CP(B)-CP(A), o sea, que ∆CP es la diferencia en las capacidades térmicas del producto y el reactivo. En el caso de la reacción general: aA(g) + bB(g) → gG(g) + hH(g) se calcula ∆H2 a T2 a partir del valor conocido de ∆H1 a T1 y las capacidades térmicas CP(A) , CP(B) , CP(G) , CP(H) de las sustancias A, B, G, y H, respectivamente, a partir de la ecuación: T2
∆H 2 = ∆H 1 + ∫
T1
[(gC
P (G )
]
+ hC P ( H ) ) − (aC P ( A ) + bC P ( B ) ) .dt
2.3. Aplicaciones a la Biología. 2.3.1. Leyes de la Desintegración Radiactiva. La radiactividad es un fenómeno espontáneo y aleatorio. El núclido que emite radiación en un instante determinado, puede ser cualquiera de los contenidos en la muestra. Ningún núclido presenta características especiales sobre otros, que determinen su desintegración anterior o posterior a otros núclidos. Todos los núclidos tienen la misma probabilidad de desintegrarse en un determinado instante, el proceso obedece leyes estadísticas. A partir de las observaciones experimentales, Rutherford y Soddy sugirieron que los átomos de los elementos radiactivos sufren una desintegración espontánea con emisión de partículas α o β y formación de átomos de un nuevo elemento. La intensidad de la radiactividad que, en su momento, se llamó actividad, es proporcional al número de átomos que se desintegran por unidad de tiempo.
22/32
El número de desintegraciones, dN, que se producen en un intervalo infinitamente pequeño de tiempo, dt, para poder considerar el proceso como uniforme, depende de dicho intervalo de tiempo, dt, y del número de núclidos existente en la muestra sin desintegrar, N, en dicho instante, es decir: dN ∝ N .dt e introduciendo una constante de proporcionalidad λ, resulta: dN = −λ. N.dt
(#)
donde el signo negativo de la constante nos indica que ambas diferenciales son opuestas, o sea, que N decrece a medida que transcurre t. La constante λ se llama constante de desintegración o simplemente constante radiactiva y representa las desintegraciones que se producen por núcleo y por segundo, o velocidad de desintegración por núcleo de sustancia: λ= −
dN 1 ⋅ dt N
aunque, por tratarse de un proceso aleatorio, debe interpretarse como la probabilidad de que se desintegre un núclido en la unidad de tiempo. La ecuación (#) expresa la ley fundamental de la desintegración radiactiva. Si integramos esta ecuación puesta en la forma: dN = −λ.dt N entre los límites t=0, origen de tiempos, en el cual la muestra no se ha desintegrado nada y por tanto N=N0 , hasta t en el cual el número de núclidos sin desintegrar es N, resulta: N dN t N t = − λ ∫N 0 N ∫0 dt → [ln N ]N 0 = −λ[t ]0 y desarrollando resulta:
o sea:
ln N − ln N 0 = −λt
→
ln
N = −λt N0
N = N 0 e − λy
Cuando la variable t aumenta en progresión aritmética, el número de átomos del elemento original N disminuye en progresión geométrica. El periodo de semidesintegración o semivida se define como el tiempo que ha de transcurrir para que el número inicial de núclidos de la muestra radiactiva se reduzca a la mitad, por desintegración de la otra mitad, convirtiéndose en otros núclidos que, estables o inestables, permanecerán presentes en la muestra.
23/32
Si aplicamos la ecuación anterior a esta definición, y llamamos T al periodo de semidesintegración, resulta: N0 = N 0 e −λT 2
→
1 = e −λT 2
y tomando logaritmos neperianos, tendremos: − ln 2 = −λ.T
T=
→
ln 2 0'693 = λ λ
Por ser un fenómeno nuclear, ninguna acción física o química conocida puede alterar el periodo de semidesintegración y por tanto, puede utilizarse, mediante análisis cuantitativo de los productos de la reacción de desintegración, como reloj para determinar las edades de las muestras. Tal es el caso de la datación de fósiles por el método del Carbono-14. La vida media de un elemento radiactivo se define como el valor medio de los tiempos de vida de todos los núclidos. Cualquier núclido puede desintegrarse en cualquier momento, por ser un proceso al azar. Igual probabilidad tiene un determinado núclido de desintegrarse pronto o tarde, al principio o al final, y ningún núclido tiene prioridad alguna de desintegrarse sobre la que tenga otro. Un núclido puede tener una vida de t=0 (el primero que se desintegra una vez preparada la muestra) y otro núclido puede tener una vida media de t=∞ (el último en desintegrarse), y en este intervalo están comprendidas las vidas de todos los demás núclidos. Para hallar la media de los tiempos de vida de todos los núclidos sumaremos las vidas de todos ellos y la dividiremos por el número total de núclidos: τ=
1 N0
∫
N0
0
t .dN
donde dN representa el número de núclidos que tienen una vida de t y se desintegran en el intervalo comprendido entre t y t+dt. Para resolver la ecuación anterior, diferenciamos la ecuación N = N 0 e − λy resultando: dN = N 0 e − λt (− λ)dt = −λN 0 e − λt dt y sustituyendo en τ tendremos: τ=
1 N0
∫
N0
0
t .dN =
1 N0
∫
N0
0
0
− λtN0 e −λt dt = −λ∫ t .e− λt dt
24/32
∞
los límites de integración de la integral, lógicamente cambian al cambiar la variable en el integrando, pues: t=0 para N=No (momento inicial) y t=∞ para N=0 (momento final). Si resolvemos la integral por partes: ∫ u .dv = u.v − ∫ v.du u=t
haciendo:
dv = e −λt dt
→
du = dt 1 v = − e −λt λ
0
resulta 0
1 1 1 1 τ = −λ∫ t.e dt = −λ − te− λt + ∫ e −λt dt = −λ− te −λt + ∫ e − λt dt ∞ λ λ λ ∞ λ ∞ 0
−λt
(*)
La integral ∫e-λtdt se resuelve mediante el siguiente cambio de variable: -λt=u diferenciando, resulta -λdt=du y dt=du/-λ y sustituyendo: 1 u 1 u 1 −λt −λt u du ∫ e dt = ∫ e − λ = − λ ∫ e du = − λ e = − λ e y sustituyendo la integral ya resuelta en la expresión anterior (*) 0
0
1 1 1 1 1 τ = −λ − te−λt + − e −λt = −λ − te−λ t − 2 e −λt = … λ λ λ ∞ λ ∞ λ 1 1 1 1 1 1 = −λ− 0.e − λ .0 − 2 e −λ .0 − − ∞.e −λ .∞ − 2 e − λ .∞ = − λ0 − 2 − (0 − 0 ) = λ λ λ λ λ λ τ=
resultando finalmente:
1 λ
Es decir, la vida media de un núclido es la inversa de la constante radiactiva, y puede expresarse de la siguiente forma: τ= o bien:
1 1 T = = = 1'443.T λ 0'693 T 0'693 T = 0'693.τ
3. LAS FUNCIONES EN LAS CIENCIAS SOCIALES. Las aplicaciones más habituales del Análisis a las ciencias sociales vienen del estudio de funciones de densidad de distribuciones, ya que es la Estadística y Cálculo de Probabilidades la parte de la Matemática que más aplicaciones tiene en las Ciencias Sociales. El estudio de dichas funciones supone continuidad, derivabilidad, integración, etc. Veamos cuales son las funciones de densidad más comunes:
25/32
1 ( x −µ ) 2
Normal:
− 1 f (x ) = e 2 σ 2π
Exponencial: f ( x ) = λe − λx
σ2
∀x ∈ℜ
∀x > 0
Gamma:
f (x ) =
a p − ax p −1 e x Γ( p)
Beta:
f (x ) =
1 x p −1 (1 − x ) q −1 B( p, q )
χ2
1 2 n x −1 − 2 2 f (x ) = x e 2 n Γ 2
∀x > 0
0 < x <1
n
t de Student:
∀x ∈ℜ
1 x2 1 + f (x ) = n 1 n n B , 2 2
−
n +1 2
∀x ∈ ℜ
m
m 2 m+ n − m −1 mx 2 n F de Snedecor f ( x ) = x2 + 1 m n n B , 2 2
∀x > 0
Otras aplicaciones que nos podemos encontrar, aparte de las que se derivan de la Estadistica y Probabilidad, es el estudio de gráficas de funciones. Dichas gráficas nos las podemos encontrar en Demografía, Geografía, Sociología, etc. Algunas de esas funciones reciben el nombre de Curvas de Crecimiento, siendo las más conocidas: • • • •
Función de Crecimiento Ilimitado f ( x ) = a·e bx a , b > 0 x > 0 Función de Decrecimiento Limitado f ( x ) = a·e −bx a, b > 0 x > 0 Función de Crecimiento Limitado f ( x ) = a 1 − e −bx a, b, c > 0 x > 0 C Función de Crecimiento Logístico f (x ) = a , b, c > 0 x > 0 1 + a·e −bx
(
)
La función exponencial de crecimiento ilimitado se emplearía en el caso de crecimiento de poblaciones donde no hay límite para el crecimiento y tampoco hay restricciones del medio ambiente. Pero esa es una situación un tanto utópica. Cuando el hábitat impone limitaciones al crecimiento, esta claro que la población no tendrá un crecimiento ilimitado, por tanto, llegará un momento en el que el tamaño se estabilizará. La función más habitual para describir este proceso es la función logística. 26/32
La ecuación logística también tiene otras aplicaciones, aparte del crecimiento de poblaciones. Las características de la función logística son que para valores pequeños de la variable, la función se parece a la exponencial. En cambio, para valores muy grandes de la variable, la función se acerca a un cierto límite. Un ejemplo de aplicación sería la difusión de información a través de una población. La información puede ser un rumor, trozo de noticia o cualquier otro. Si inicialmente la noticia la conoce un cierto porcentaje de la población, al principio el crecimiento será exponencial para luego irse aproximando al valor 1 sin superarlo. 4. LAS FUNCIONES EN LA ECONOMÍA. 4.1. Funciones en Economía. Vamos a describir un modelo de equilibrio estático. El problema más sencillo es considerar un mercado con un único producto. El modelo tendrá tres variables: Qd = Cantidad demandada del Producto. Qs = Cantidad Ofertada del Producto. P = Precio del Producto. La condición de equilibrio será: Qd – Qs = 0 que significa que se alcanzará el equilibrio cuando la oferta y la demanda sean la misma. Teniendo en cuenta que tanto la oferta como la demanda dependen del precio del producto, podemos suponer que Qd es una función lineal de P y decreciente (evidentemente, a mayor precio menor demanda) y que Qs es también lineal de P y creciente. Así pues, tenemos: Qd = Qs
Qd = a – bP
Qs = – c + dP
con a, b, c y d positivos.
OBS Hemos supuesto que el término independiente de Qs es negativo, – c, ya que habitualmente no habrá oferta a menos que el precio inicial sea adecuado. Si representamos estas funciones tenemos:
27/32
El punto (p,q) nos da la solución que buscábamos, que es la solución a las tres ecuaciones planteadas, y lo llamaremos punto de equilibrio. Resolviendo tenemos que p =
a+b ad − bc y que q = c+d b+ d
Si al modelo que hemos descrito le añadimos un segundo producto, las ecuaciones a plantear cambian, siendo ahora: Qd 1 = Qs1 Qd 1 = a0 + a1 P1 + a2 P2 Qs 1 = b0 + b1 P1 + b 2 P2
Qd 2 = Qs 2 Qd 2 = a' 0 + a'1 P1 + a ' 2 P2 Qs 2 = b' 0 +b'1 P1 + b' 2 P2
Y su resolución nos da: P1 =
(a 2 − b 2 )(a '0 −b '0 ) − ( a 0 − b 0 )(a ' 2 −b' 2 ) (a1 − b1 )(a '2 −b '2 ) − ( a 2 − b 2 )(a '1 −b '1 )
P2 =
( a 0 − b 0 )( a'1 −b '1 ) − (a1 − b1 )(a '0 −b '0 ) (a 1 − b1 )(a ' 2 −b' 2 ) − (a 2 − b2 )(a '1 −b'1 )
que sólo tendrá sentido si el denominador es no nulo. Una vez visto el caso para un solo producto y para dos productos, podemos generalizar el proceso para n productos. Qdi = Qsi Qd i = ai 0 + ai1 P1 + a i 2 P2 + K + a in Pn i = 1, K , n Qs i = bi 0 + bi1 P1 + bi 2 P2 + K + ain Pn 4.2. Derivadas en Economía. Sea q la cantidad de un bien, y llamemos función de demanda a aquella función que relaciona la cantidad que se demanda de un bien con respecto al precio, π(q). a) Elasticidad. La noción de elasticidad de la demanda con respecto al precio, que recibe el nombre de elasticidad-precio, mide la variación relativa de la cantidad demandada con respecto al precio. Si suponemos que la función de demanda, π, es continua y derivable, representamos la elasticidad como: ∆q q E = Lim ∆P →0 ∆π π Si tenemos en cuenta que la cantidad demandada se mueve en sentido inverso al precio, el límite anterior se ve afectado con el signo negativo para que la elasticidad resulte positiva. Entonces:
28/32
∆q q ∆q π dq π E = − Lim = − Lim · =− · ∆P →0 ∆π ∆ P → 0 ∆π q dπ q π A partir de esta definición podemos clasificar los bienes según diferentes criterios: • •
Son Bienes de Demanda Normal los que tienen Elasticidad positiva, E>0. Son Bienes de Demanda Anormal si la elasticidad es negativa, E<0. Eso significaría que la función de demanda es creciente y por tanto, el precio y la demanda varían de la misma forma.
Si en la primera definición de elasticidad comparamos el numerador y el denominador, en valor absoluto, entre si, tenemos las siguientes situaciones: •
∆q ∆π > q π
⇒ E > 1 . Diremos que el bien es de demanda Elástica.
•
∆q ∆π = q π
⇒ E = 1 . Diremos que el bien es de demanda Unitaria.
•
∆q ∆π < q π
⇒ E < 1 . Diremos que el bien es de demanda Inelástica.
b) Formación de Precios Denotemos por q la cantidad de producto, y llamemos I(q) a la función de ingresos y C(q) a la función de costes. Podemos definir la función Beneficio como: B(q) = I(q) – C(q) Suponiendo que la función beneficio es continua y derivable, para hallar su máximo tenemos una condición sobre la primera derivada y otra sobre la segunda derivada. •
•
B’(q) = 0. Lo que traduce en I’(q) = C’(q), donde llamamos ingreso marginal a I’(q) y coste marginal a C’(q). Sea q0 el punto donde se anula la primera derivada. B’’(q0 ) < 0. Entonces I’’(q0 ) < C’’(q0 ), y significa que el crecimiento del ingreso marginal en el punto considerado es menor que el crecimiento del coste marginal en el mismo punto.
b.1) Mercados de Competencia Perfecta. Tienen como característica que el precio del bien es constante, independientemente de la cantidad demandada del mismo: π(q) = π Entonces, la función de ingresos queda como I(q) = π·q, siendo I’(q) = π.
29/32
Si la condición era B’(q)=0 entonces se deduce que C’(q)=π. Por tanto, el punto q0 lo obtenemos de resolver esta última ecuación. Aplicando la segunda condición, como I’’(q)=0, deducimos que C’’(q)>0, lo que significa que en el punto q0 los costes marginales son crecientes. b.2) Mercados Monopolísticos. En esta situación, la función de ingresos es I(q) = π(q)·q. y como I’(q) = C’(q) tenemos que C ' (q ) − π( q) C’(q) = π(q) + q·π’(q) ⇒ q = π' (q ) ecuación que nos permite obtener el valor de q0 que verifica la primera condición. La segunda condición sería: I’’(q) = π’(q) + q·π’’(q) + π’(q) = 2π’(q) + q·π’’(q) Como se tiene que verificar queI’’(q)
CT ( q) q
y el coste marginal se obtendrá a partir de su derivada: CT ' ( q) =
Por tanto
dCT(q) = CT’(q)dq
dCT ( q) dq
⇒ CT (q ) = ∫ CT ' ( q) dq
b) Ingresos. Dada la función de demanda π=π(q), el ingreso total es I(q) = π(q)·q 30/32
El ingreso marginal sabemos que es I ' (q ) =
dI ( q) , por lo tanto I ( q) = ∫ I ' (q ) dq dq
c) Excedente del Consumidor. Sabemos que la función de demanda nos da la cantidad que se vende de un determinado artículo en función del precio. Si el precio de equilibrio es π0 para la cantidad demandada q0 , entonces los consumidores que estuviesen dispuestos a pagar un precio mayor que el de mercado se beneficiarán por el hecho de que el precio es π0 . Según ciertas hipótesis económicas, la ganancia total del consumidor está representada por el área bajo la curva de demanda y sobre la recta π=π0 y se conoce como Excedente del consumidor. Se obtendría como: q0
E = ∫ π( q) dq − π0 q 0 0
o bien: m0
E = ∫ q(π) dπ π0
siendo q(π) la función inversa de π(q). d) Excedente del Productor. Una función de oferta representa la cantidad de un producto que se ofrece en el mercado en función del precio. Si el precio de mercado es π0 y la cantidad ofertada a ese precio es q0 , entonces aquellos fabricantes que estuviesen dispuestos a vender dicho bien a un precio inferior al de mercado se beneficiarían de que el precio es π0 . Al igual que en el caso anterior, según ciertas hipótesis económicas, la ganancia total del producto está representada por el área sobre la curva de oferta y bajo la recta π=π0 , recibiendo el nombre de Excedente del productor, y siendo su valor: q0
E = q 0 π0 − ∫ S ( q) dq 0
expresable también como: π0
E = ∫ S −1 (π) dπ m0
31/32
Bibliografía Recomendada. Temas de Oposiciones de Física y Química. Aut. Antonio Abrisqueta García, 1999 Cualquier Manual básico sobre Economía.
32/32
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 33 EVOLUCIÓN HISTÓRICA DEL CÁLCULO DIFERENCIAL. 1. Introducción. 2. Orígenes del Análisis. Época Griega. 3. Siglo XVII. 3.1. Galileo, Kepler y Cavalieri. 3.2. Fermat y Descartes. 3.3. Wallis y Barrow. 3.4. Newton y Leibniz 4. Siglo XVIII. 4.1. La familia Bernoulli y L´Hospital. 4.2. Cotes, Stirling, Maclaurin, Taylor y Rolle. 4.3. Euler. 4.4. Legendre y Lagrange. 5. Siglo XIX. 5.1. Gauss. 5.2. Cauchy. 5.3. Bolzano. 5.4. Fourier y Dirichlet. 5.5. Riemann 5.6. La Aritmetización del Análisis. 6. Siglo XX. 6.1. Poincarè. 6.2. Hilbert. Bibliografía Recomendada.
1/12
TEMA 33 EVOLUCIÓN HISTÓRICA DEL CÁLCULO DIFERENCIAL. 1. INTRODUCCIÓN. El análisis matemático va a ser la rama de la matemática que nos proporcione métodos para la investigación cuantitativa de los procesos de cambio, movimiento y dependencia de una magnitud con respecto a otras. Inicialmente apareció con un ropaje geométrico que le impidió progresar, quizá debido a la influencia de las obras de Descartes “Discurso del Método” y “Geometría”. Cuando pudo desprenderse de dicho ropaje, avanzó rápidamente. 2. ORÍGENES DEL ANÁLISIS. ÉPOCA GRIEGA. A finales del siglo V a. C. quedaban en la matemática griega algunos problemas sin resolver. Entre ellos podemos destacar el de la comparación de figuras curvilíneas y rectilíneas. Fue Eudoxo quien encontró la solución. Matemáticos anteriores a él habían propuesto que lo mejor era intentar inscribir y circunscribir figuras rectilíneas a la figura curvilínea, aumentando el número de lados convenientemente para una mayor aproximación. Pero no sabían como terminar el razonamiento, ya que desconocían la idea de límite (y sería desconocida durante dos milenios más). Según Arquímedes, fue Eudoxo quien dio el Lema que lleva el nombre de Arquímedes y que sirve como base al método de exhausción, el equivalente griego del cálculo integral. Los griegos hicieron uso de esta propiedad para la demostración de teoremas sobre áreas y volúmenes de figuras curvilíneas. El propio Eudoxo demostró que el volumen de un cono es la tercera parte del cilindro de la misma base y altura. La método de exhausción se puede considerar como el primer teorema relativo a la medida de figuras curvilíneas conocido, lo cual apunta a que Eudoxo se puede considerar como el verdadero padre del cálculo integral, la máxima contribución de los miembros de la Academia platónica hecha a la matemática. Arquímedes (siglo III a. C) escribió Sobre las espirales, un libro de difícil comprensión. En él nos podemos encontrar varios tratados sobre el método de exhausción, siendo el más popular el de La cuadratura de la parábola. Cuando lo escribió, las secciones cónicas se conocían casi un siglo antes, pero se necesitó de su genio para progresar en el cálculo de áreas relacionadas con ellas. Concretamente, en la proposición 17 de dicho tratado consigue cuadrar un segmento de parábola. La demostración que realiza por el método de exhausción es larga y compleja, pero llega a demostrar que el área de un segmento parabólico APBQC es cuatro tercios de un triángulo que tenga la misma base y la misma altura. Parece ser que Arquímedes no pudo hallar el área de un segmento de elipse o de hipérbola. En realidad, el cálculo del área de un arco de parábola actualmente no involucra nada peor que sencillos polinomios de segundo grado. En cambio, las
2/12
integrales que aparecen en los segmentos de elipses o hipérbolas implican funciones transcendentes. También podemos decir que Arquímedes, en su trabajo Sobre conoides y esferoides, calcula el área de la elipse de semiejes a y b. Y en el mismo tratado muestra cómo calcular los volúmenes de los segmentos que se obtienen al cortar un elipsoide, paraboloide o hiperboloide de revolución por un plano perpendicular al eje principal. El método que utiliza Arquímedes es muy similar al actual. Y por último, podemos decir que en el tratado Sobre la esfera y el cilindro encontramos una proposición equivalente a π
∫
0
sen xdx = 1 − cos π = 2
y en la siguiente demuestra otra que es equivalente a la integración de la función seno. 3. SIGLO XVII. 3.1. Galileo, Kepler y Cavalieri. Fueron Galileo, Kepler y Stevin matemáticos que necesitaban de los métodos de Arquímedes para resolver sus problemas. Pero querían evitar las sutilezas lógicas del método de Exhauscion. Las modificaciones que realizaron de los antiguos métodos infinitesimales llevaron finalmente al cálculo infinitesimal propiamente dicho, siendo Stevin uno de los primeros en sugerir algunas modificaciones. Stevin estaba interesado en las aplicaciones físicas de la idea de infinitos elementos infinitamente pequeños, mientras que Kepler los necesitaba para aplicarlos a la astronomía. En su segunda ley astronómica (el radio vector que va del Sol a un planeta barre áreas iguales en tiempos iguales) el problema relativo al área lo resuelve suponiendo que estaba constituida por triángulos infinitamente pequeños con un vértice en el Sol y los otros dos en puntos infinitamente próximos sobre la órbita del planeta. Así, Kepler aplicó un tipo de cálculo integral muy rudimentario. Fue en 1612 cuando Kepler, debido a que fue un año de vino excepcionalmente bueno, comenzó a calcular volúmenes de sólidos de revolución, comenzando por los toneles de vino. Reunió sus investigaciones sobre volúmenes de revolución en un libro que publicó en 1615 llamado “Medida de los volúmenes de toneles” (Stereometria doliorum). Una de las aportaciones de Galileo fue en el cálculo de áreas. Estudió la Cicloide, e intentó hallar el área bajo uno de sus arcos. Lo más que pudo hacer fue trazar la curva sobre una chapa metálica, recortarla y pesarla, obteniendo como conclusión que su área era aproximadamente tres veces el área del círculo generador (como luego se demostró). Cavalieri fue discípulo de Galileo. Se concentró principalmente en un teorema geométrico que expresado en notación moderna sería a a n +1 n x dx = ∫0 n +1 Tanto el enunciado como la demostración del teorema son muy diferentes de los actuales, ya que Cavalieri comparaba potencias de segmentos que son paralelos a la
3/12
base de un paralelogramo, con las correspondientes potencias de los segmentos en uno cualquiera de los dos triángulos en que una diagonal divide al paralelogramo. 3.2. Fermat y Descartes. Descartes observó que todas las propiedades de una curva, tales como la medida del área encerrada por ella o la dirección de su tangente, estaban completamente determinadas cuando se daba su ecuación en dos incógnitas. Tenía mucha razón al afirmar que el problema de hallar la tangente a una curva era de gran importancia, pero el método que desarrolla en La géomètrie no era tan directo ni fácil de aplicar como el que desarrollo Fermat aproximadamente al mismo tiempo. Fermat descubrió un método muy ingenioso para la obtención de los puntos en los que una función polinómica de la forma y=f(x) toma valores máximo y mínimo. Fermat comparaba el valor de f(x) en un cierto punto con el valor de f(x+E) en un punto próximo. Vio que en general los valores serían claramente diferentes, pero en un máximo o un mínimo, la diferencia sería casi imperceptible. Por lo tanto, para hallar dichos puntos, Fermat iguala f(x) a f(x+E), teniendo en cuenta que serán casi iguales. Cuanto más pequeño sea E más se aproximará a ser una verdadera igualdad. Así pues, después de dividir todo por E hace E=0. El resultado le permite calcular las abcisas de los puntos máximos y mínimos de la función. Esa es la esencia de lo que ahora conocemos por diferenciación pues lo que hizo Fermat es equivalente a f ( x + E ) − f (x ) E
Lim E →0
e igualar ese límite a cero. También descubrió como aplicar su procedimiento de los valores próximos de la variable para hallar la tangente a una curva algebraica de la forma y=f(x). Por tanto tendríamos que darle la razón a Laplace cuando aclamaba a Fermat como el verdadero descubridor del Cálculo Diferencial. Así mismo, Fermat obtuvo un teorema relativo al área encerrada bajo curvas de la forma y=xn . Amplió los resultados de Cavalieri ya que lo demostró para todo n distinto de –1, incluyendo valores fraccionarios. La demostración consistía esencialmente, en aproximar el área mediante sumas de infinitos rectángulos circunscritos (lo que consideraríamos como suma superior). 3.3. Wallis y Barrow. Wallis publicó en 1655 su obra Arithmetica infinitorum. Llegó al resultado 1
∫x 0
m
dx =
1 m +1
por inducción incompleta, eliminando el marco geométrico que había necesitado Cavalieri en su demostración. Barrow escribió en 1670 el tratado Lectiones geometricae, en el que ocupaban un lugar importante los problemas de tangentes. En él explicó un método de determinación de tangentes que es prácticamente idéntico al que se usa actualmente en el cálculo 4/12
diferencial. El método se parece mucho al de Fermat, pero en él aparecen dos cantidades, en vez de la única que usa Fermat representada por la letra E. Dichas cantidades equivalen a los términos modernos ∆x e ∆y. De todos los matemáticos que anticiparon fragmentos del cálculo diferencial e integral, Barrow fue el que más se aproximó al nuevo análisis que se avecinaba. Ocupaba la cátedra lucasiana en Cambrigde y, cuando fue nombrado capellán del rey Carlos II de Inglaterra, a propuesta de él mismo le sucedió Newton. 3.4. Newton y Leibniz. En la obra de Newton De Analysi encontramos la primera exposición sistemática del principal descubrimiento de Newton, el cálculo. El más importante maestro de Newton fue Barrow, y formuló un método sistemático de diferenciación similar al que su maestro publicó unos años después. También demuestra en esa obra que el área bajo la curva y = ax
m
n
viene dada por A=
n ax m+n
m+ n n
Dicha área la calculó al revés. Supuso que el área era esa y obtuvo que tenía que ser de la función y. Parece ser que fue la primera vez en la historia de la matemática que se calculaba un área mediante el proceso inverso de lo que llamamos diferenciación, aunque dicho proceso podía ser ya conocido por otros matemáticos. Es por ello por lo que Newton puede ser considerado como el verdadero inventor del cálculo, porque fue capaz de explotar la relación inversa existente entre pendiente y área mediante su nuevo análisis infinito. En la exposición que hace Newton de sus métodos infinitesimales, consideraba a las variables x e y como cantidades que fluyen o “fluentes” y a sus derivadas “fluxiones” o ·
·
velocidades de variación, denotándolas por x e y . Duplicando los puntos representaba fluxiones de fluxiones (derivadas segundas). Newton no fue el primero en efectuar diferenciaciones e integraciones, ni tampoco el primero en ver las relaciones que existían entre estas dos operaciones, expresado en el teorema fundamental del cálculo. Su descubrimiento consistió en la consolidación de estos elementos en un algoritmo general aplicable a todas las funciones, tanto algebraicas como trascendentes. Con el método de las fluxiones Newton resolvió los siguientes problemas: a) b) c) d)
Determinación del centro y del radio de curvatura de una función. Trazado de tangentes. Obtención de máximos y mínimos, anulando la fluxión. Determinación de los puntos de inflexión, determinando el máximo o el mínimo del coeficiente angular de la tangente.
Leibniz llegó a la conclusión de que estaba en posesión de un método de gran importancia (el método de las fluxiones según Newton) por su generalidad varios años
5/12
después que su colega Newton. Pero sostuvo que era necesario desarrollar un lenguaje y una notación adecuados para tratar estos nuevos problemas. La notación que eligió fue muy acertada. Se decidió a representar por dx y dy las diferencias más pequeñas posibles (diferenciales) de la x y de la y. Igualmente, al principio escribía omn.y para representar la suma de ordenadas bajo una curva, pero más tarde lo cambió por el símbolo ∫ ydx , siendo el símbolo una S esbelta, inicial de la palabra suma. Tanto Newton como Leibniz obtuvieron propiedades de las derivadas, cada uno con su notación. Newton llegó a saber que Z = xy ⇒
Z& = x&y + xy&
Leibniz se preguntó si d(xy)=dx·dy, siendo su respuesta negativa, pero obteniendo a cambio la expresión correcta a la expresión general dn (xy) Newton y Leibniz desarrollaron rápidamente los dos su nuevo análisis hasta incluir las diferenciales o fluxiones de orden superior. Pero esas no fueron sus únicas contribuciones a la matemática. En las publicaciones de Newton Method of Fluxions y De Analysi nos encontramos con un método de resolución aproximada de ecuaciones, conocido actualmente como método de Newton. Y en la primera de las dos publicaciones anteriores también nos encontramos con lo que más tarde se llamaría “el paralelogramos de Newton” y que resultaba útil para los desarrollos en series infinitas y para el trazado de curvas. 4. SIGLO XVIII. 4.1. La Familia Bernoulli y L´Hospital Nunca, a lo largo de la historia de la matemática, ha producido una familia tantos matemáticos famosos como la familia Bernoulli. Más o menos una docena de miembros de esa familia consiguieron destacar en matemáticas y física. Fue Jean Bernoulli quien, en 1692, instruyó en la nueva disciplina leibziana a un joven marqués francés llamado L´Hospital, firmando con él un pacto por el cual se comprometía a enviarle a L´Hospital sus descubrimientos en matemáticas a cambio de un salario. Entre las cosas que publicó L´Hospital fruto del acuerdo anterior es una regla que hoy en día lleva su nombre. Jean Bernoulli había descubierto que si f(x) y g(x) son funciones diferenciables en x=a tales que f(a)=g(a)=0 y existe el límite Lim x→ a
f ' (x ) ⇒ g ' (x )
Lim x→ a
f (x ) f ' (x ) = Lim g ( x) x→ a g ' ( x )
Esta conocida regla la incorporó L’Hospital en el primer texto sobre calculo diferencial que apareció escrito, Analyse des infiniment petits, publicado en París en 1696. Este libro, cuya influencia se extiende a lo largo de la mayor parte del siglo XVIII, se basa en dos postulados: 6/12
a) Se pueden tomar como iguales dos cantidades que difieren sólo en una cantidad infinitamente pequeña. b) Una curva puede ser considerada como formada por segmentos de línea recta infinitamente pequeños de determinan, por medio de los ángulos que forman unos con otros, la curvatura de la curva. Las fórmulas diferenciales básicas para las funciones algebraicas las obtiene L’Hospital a la manera de Leibniz, y las aplica al cálculo de tangentes, máximos y mínimos, puntos de inflexión, curvaturas y límites en forma indeterminada. Jean Bernoulli era consciente de las relaciones que existían entre las funciones trigonométricas inversas y los logaritmos de números imaginarios, descubriendo en 1702 la relación siguiente, al estudiar ciertas ecuaciones diferenciales: 1 1 + iz arctg z = ln i 1 − iz 4.2. Cotes, Stirling, Maclaurin, Taylor y Rolle. Roger Cotes fue un matemático que murió joven dejando gran cantidad de trabajos incompletos. Uno de ellos versaba sobre integración de funciones racionales mediante descomposición en fracciones parciales. Stirling completó la clasificación que realizó Newton sobre las curvas cónicas, añadiendo algunas más que se le pasaron a Newton. También obtuvo asíntotas verticales de funciones racionales, igualando el denominador a cero. Maclaurin obtuvo sorprendentes resultados en geometría y por tanto resulta sorprendente que se le recuerde en relación a una parte del análisis en la que se le anticiparon varios matemáticos. La llamada serie de Maclaurin es sólo un caso especial de la serie más general de Taylor. La serie que lleva su nombre la publicó Taylor en su obra Methodus incrementorum. En esta obra tambión nos encontramos con otros temas del cálculo, como soluciones singulares de ecuaciones diferenciales, o fórmulas que relacionan las derivadas de una función con las derivadas de la función inversa, por ejemplo: d2y d x dx 2 = − 3 dy 2 dy dx 2
Michel Rolle fue uno de los matemáticos que cuestionó la validez de los nuevos métodos propuestos por L’Hospital. Pero se le recuerda más por el teorema que lleva su nombre, que publicó en 1691.
7/12
4.3. Euler. La obra de Euler marcó toda una época. Podemos afirmar que Euler hizo por el análisis infinitesimal de Newton y Leibniz lo que Euclides había hecho por la geometría de Eudoxo o lo que Viète había hecho por el álgebra de Al-Khowarizmi. Euler cogió el cálculo diferencial y el método de fluxiones y los integró en una rama más general de la matemática llamada “Análisis” o estudio de los procesos infinitos. La obra de Euler Introductio in analysin infinitorum se puede considerar como la piedra angular del nuevo análisis. Este importante tratado en dos volúmenes fue la fuente de la que se nutrieron los matemáticos de la segunda mitad del siglo. Desde ese momento, la idea de función pasó a ser la idea fundamental del análisis. El primer volumen de la obra de Euler trata de procesos infinitos: productos infinitos, fracciones continuas infinitas y gran cantidad de series infinitas. Esta obra es una generalización de los puntos de vista de Newton, Leibniz y los Bernoulli, los cuales mostraron un gran interés por las series infinitas. Al contrario que los anteriores, Euler obtuvo resultados que los anteriores persiguieron sin éxito, como por ejemplo obtener la suma de los inversos de los cuadrados perfectos. La gran imaginación que puso Euler en el tratamiento de las series le llevó a descubrir algunas relaciones sorprendentes entre el análisis y la teoría de números. Demostró que la divergencia de la serie armónica implica el teorema euclídeo de la existencia de infinitos números primos. Una de las más interesantes ecuaciones diferenciales que se estudiaron en el siglo XVIII es la que D’Alembert llamó ecuación de Riccati: y ' = p( x) y 2 + q( x) y + r ( x) Esta ecuación fue estudiada por muchos matemáticos entre los que se encontraban algunos Bernoulli, así como Jacopo Riccati y su hijo Vincenzo. Pero fue Euler el que se dio cuenta que si se conoce una solución particular v=f(x), entonces la sustitución 1 y = v + convierte a la ecuación de Ricatti en una ecuación diferencial lineal en z, de z forma que se puede hallar una solución general. 4.4. Legendre y Lagrange. Los campos en los que Legendre hizo contribuciones importantes fueron numerosos, entre los que encontramos el cálculo, la teoría de las ecuaciones diferenciales, la teoría de funciones, etc. Escribió un tratado en tres volúmenes, Exercises du calcul intégral, que rivalizó con los de Euler por su amplitud y autoridad. Creó algunas herramientas muy útiles para los físicos matemáticos, como las funciones que llevan su nombre, que son soluciones de la ecuación diferencial de Legendre
(1 − x ) y' '−2 xy'+n (n + 1) y = 0 2
8/12
Las soluciones polinómicas de esta ecuación para valores naturales de n se conocen con el nombre de polinomios de Legendre. También centro parte de sus esfuerzos en reducir las integrales elípticas a tres formas canónicas que por eso llevan su nombre. Lagrange escribió dos cursos para sus alumnos. El primero era de álgebra y el segundo, llamado Théorie des fonctions analytiques, de análisis. En ese curso nos encontramos con el nombre de derivada que utilizamos actualmente. La primera contribución de Lagrange y quizá la más importante, fue el cálculo de variaciones. Se trata de una nueva rama de la matemática y, en su forma más simple, de lo que trata es de determinar una cierta relación funcional y=f(x) tal que una integral
∫
b
a
g ( x, y) dx
tome un valor máximo o mínimo. También introdujo Lagrange el método de variación de las constantes en la resolución de ecuaciones diferenciales no homogéneas. 5. SIGLO XIX. 5.1. Gauss Una de las aportaciones más importantes de Gauss a la Matemática fue demostrar que toda función polinómica igualada a cero posee al menos una raíz, ya sea real o compleja. Su aportación más brillante al análisis fue el siguiente teorema: Si en el plano complejo o de Gauss dibujamos una curva cerrada simple, y si una función f(z) de la variable compleja z=x+iy es analítica (es decir, tiene derivada) en todo punto de la curva y en todo punto interior, entonces la integral de línea de f(z) tomada a lo largo de la curva es cero. También aportó resultados sobre las funciones elípticas, y consecuentemente, sobre integrales elípticas. 5.2. Cauchy. Cauchy escribió, como profesor de la Escuela Politécnica, escribio varios libros entre los que destacamos tres, que dieron al cálculo infinitesimal elemental la forma actual. Prescindiendo de la geometría y de los infinitésimos que se habían usado hasta entonces, formuló una definición de límite casi tan precisa como la definición moderna: Cuando los sucesivos valores que toma una variable se aproximan indefinidamente a un valor fijo, de manera que terminan por diferir de él en tan poco como queramos, este último valor se llama límite de todos los demás. En el cálculo de Cauchy, los conceptos de función y de límite de una función son los conceptos fundamentales. Para definir la derivada de la función y=f(x) con respecto a x, le da a la variable x un incremento ∆x=i y forma el cociente:
9/12
∆y f ( x + i ) − f ( x) = ∆x i y al límite de este cociente de diferencias cuando i tiende a cero, lo define como la derivada f’(x) de y con respecto a x. La diferencial, que había desempeñado un papel muy importante, la relega a una posición secundaria. También dio una definición de función continua: la función f(x) es continua entre límites dados de la variable x, si entre estos límites un incremento infinitamente pequeño i de la variable x siempre da lugar a un incremento infinitamente pequeño f(x+i) – f(x) de la función misma. 5.3. Bolzano. Ideas muy parecidas a la obra de Cauchy también las desarrollaba de forma casi paralela un cura checoslovaco llamado Bolzano. Las analogías en su aritmetización del cálculo, en sus definiciones de límite, derivada, continuidad y convergencia fueron sólo una coincidencia. Bolzano publicó en 1817 un libro dedicado a dar una demostración puramente aritmética o analítica del teorema del valor intermedio para funciones continuas, lo que exigía un planteamiento no geométrico de la idea de continuidad de una función o una curva. También descubrió que existen funciones patológicas que no se comportan como habían supuesto los matemáticos que lo harían. Así, dio el primer ejemplo de función continua en un intervalo que no poseía derivada en ningún punto de dicho intervalo. Dicho ejemplo pasó inadvertido, pasando dicho mérito a Weierstrass 30 años más tarde. 5.4. Fourier y Dirichlet. La contribución más importante de Fourier fue la idea de que cualquier función se puede expresar por una serie de la forma y=
∞ ∞ 1 a 0 + ∑ a i cos ix + ∑ bi sen ix 2 i =1 i =1
serie que hoy se conoce por el nombre de serie de Fourier. Los coeficientes del desarrollo se pueden obtener como a0 =
1 π f ( x) dx π ∫−π
an =
1 π f ( x) cos nxdx π ∫−π
bn =
1 π f ( x) sen nxdx π ∫−π
Dirichlet dio la primera demostración rigurosa de la convergencia de una serie de Fourier para una función que cumpla ciertas restricciones, conocidas como condiciones de Dirichlet.
10/12
5.5. Riemann Riemann fue el sucesor de Dirichlet en la universidad de Gotinga. Obtuvo varios teoremas que relacionaban la teoría de números con el análisis clásico. En análisis contribuyó a los refinamientos en la definición de integral, al énfasis que puso en las ecuaciones de Cauchy-Riemann y a las superficies de Riemann. 5.6. La Aritmetización del Análisis. La palabra clave del análisis es la de “función”, y fue en la clarificación de este término como fue surgiendo la tendencia de la aritmetización. En 1872 se publicaron importantes trabajos que contribuyeron a la aritmetización del análisis, siendo sus autores Mèray, Weierstrass, Heine, Cantor y Dedekind. Terminaron con medio siglo de investigaciones entorno a la idea de función y de número. Durante esos cincuenta años hubo dos causas que impidieron un avance efectivo. La primera era la falta de confianza al realizar operaciones con series infinitas, y la otra era la ausencia de una definición precisa del concepto de número real. De hecho, la aritmetización plena y correcta del análisis se hizo posible cuando los matemáticos entendieron los números reales como “estructuras intelectuales” y no como magnitudes heredadas de la geometría. Mèray fue el primero en comenzar a publicar sus resultados. Hasta ese momento se definía el límite de una sucesión como un número real y luego se definían los números reales como límite de sucesiones de racionales. Este matemático renunció a usar la condición externa de convergencia, y utilizando solamente el criterio de Cauchy describió la convergencia sin hacer referencia a los irracionales. Weierstrass también trató de separar el análisis de la geometría y basarlo únicamente en el concepto de número. Pero para ello resultaba necesario dar una definición de número irracional independiente del concepto de límite. Solucionó el problema de la existencia del límite de una sucesión convergente identificando la solución misma con el número límite. La teoría de Heine se parece mucho a la de Mèray afirmando que las sucesiones que no convergen a números racionales se las considera que definen números irracionales. Dedekind introdujo sus cortaduras para definir los números reales. Y Cantor se dio cuenta de que no todos los conjuntos infinitos son del mismo tamaño (por ejemplo los naturales y los reales), definiendo el concepto de potencia del conjunto. 6. SIGLO XX. 6.1. Poincaré. La tesis doctoral de Poincaré versó sobre los teoremas de existencia de soluciones de ecuaciones diferenciales. Esto le llevó al estudio de las propiedades de las funciones automorfas. Una función automorfa f(z), con z variable compleja, es una función analítica en un dominio D, excepto en los polos correspondientes, y que es invariante bajo un grupo infinito numerable de transformaciones de Möbius.
11/12
6.2. Hilbert. Hilbert presentó, en el congreso de París de 1900, 23 problemas que según su criterio debían de estar entre los que ocupasen la atención de los matemáticos a lo largo del nuevo siglo que comenzaba. Como ejemplo diremos que el primero de esos 23 problemas se refería a la estructura del continuo de los números reales, que algo ya habían estudiado anteriormente Cauchy, Bolzano y Cantor, entre otros.
Bibliografía Recomendada. Análisis Matemático I. Aut. J.A. Fernández Viña. Ed. Tecnos Principios de Análisis Matemático. Aut. W. Rudin. Ed. McGraw-Hill Curso de Análisis Matemático I. Aut. E.L. Luna. Ed. Edunsa, 1991. Calculus. Aut. M. Spivak. Ed. Reverté. Calculus. Aut. Apostol. Ed. Reverté Historia de la Matemática. Aut.: Carl B. Boyer. Ed.: Alianza Editorial.
12/12
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 34 ANÁLISIS Y FORMALIZACIÓN DE LOS CONCEPTOS GEOMÉTRICOS INTUITIVOS: INCIDENCIA, PARALELISMO, PERPENDICULARIDAD, ÁNGULO, ETC. 1. 2. 3. 4. 5.
Introducción. Puntos, Rectas y Plano. Propiedades de la división de conjuntos de puntos. Axiomas y teoremas. Intersecciones de conjuntos de puntos en el espacio. 5.1. Intersección entre dos rectas. 5.2. Intersección entre dos planos. 5.3. Intersección entre una recta y plano. 5.4. Intersección entre tres planos. 6. Ángulos. 7. Medida y congruencia. 7.1. Medida y congruencia de segmentos de recta. 7.2. Medida y congruencia de ángulos. 8. Perpendicularidad. 9. Pruebas de paralelismo Bibliografía Recomendada
1/12
TEMA 34 ANÁLISIS Y FORMALIZACIÓN DE LOS CONCEPTOS GEOMÉTRICOS INTUITIVOS: INCIDENCIA, PARALELISMO, PERPENDICULARIDAD, ÁNGULO, ETC. 1. INTRODUCCIÓN. En geometría nos podemos permitir no definir determinados términos y poder usarlos como primarios, es decir, tomarlos como si fuesen una base para definir otros. Estos términos por ejemplo son los conceptos de punto, recta y plano. Pero este concepto es totalmente moderno, pues Euclides si que intento definir estos conceptos utilizando nomenclatura no geométrica. En el libro I de los Elementos de Euclides, la definición 1 dice que: “Un punto es aquello que no tiene parte”, aunque esta definición no deja totalmente claro lo que es un punto, pues salvo que tengamos una idea intuitiva de lo que es un punto esta definición no nos lo aclararía. La definición 2 dice que: “Una recta es longitud sin anchura”. Pero Euclides en ningún momento definió lo que era longitud ni anchura. 2. PUNTOS, RECTAS Y PLANO. Aunque los conceptos de punto, recta y plano son términos que quedarán indefinidos, podemos intentar definir un punto de una manera intuitiva como una localización en el espacio. A los puntos normalmente los denotaremos por las letras P, Q, R, etc. Igualmente podemos definir una recta, como una línea recta, es decir, aquella que se prolonga infinitamente en cada dirección, o mejor dicho, en ambos sentidos. Representaremos a la recta como una línea trazada en el papel con flechas en sus extremos. Denotaremos a las rectas por L1 , L2 , etc. Todos los conjuntos que hemos definido, al igual que cualquier conjunto en geometría, son conjuntos de puntos. Esto nos permite identificar una recta mediante dos puntos que pertenezcan a ellas, por eso si tenemos una recta L, y dos puntos P y Q que pertenezcan a ella, podemos representar a L, como PQ. Podemos definir un Plano, de manera intuitiva, como una superficie plana que se extiende hacia el infinito y en todas las direcciones. Para representar al plano utilizaremos letras griegas como Π, Σ , etc. Por último definiremos el espacio como el conjunto de todos los puntos, siendo el plano y la recta subconjuntos del espacio, y el punto son los elementos del espacio.
2/12
3. PROPIEDADES DE LA DIVISIÓN DE CONJUNTOS DE PUNTOS. Dada una recta L y un punto P que pertenece a dicha recta se dice que P divide a L en tres partes, una de ellas es el propio punto P y los otros dos subconjuntos los llamaremos semirrectas y contienen cada uno a todos los puntos que están a cada lado del punto P. Si formamos un subconjunto en el que incluimos una semirrecta y el punto P tenemos lo que llamaremos un rayo, siendo P el llamado punto extremo del rayo. Si tenemos dos rayos que verifican que su unión es una recta y que tiene en común un punto (el punto extremo de cada rayo) entonces tenemos lo que llamaremos rayos opuestos. Dada una recta L y dados dos puntos P y Q de la recta L, definiremos un segmento como el subconjunto de la recta L formado por todos los puntos que se encuentran entre P y Q. Denotaremos el segmento formado por todos los puntos que hay entre P y Q por PQ , y este segmento lo podemos considerar como la intersección de los dos rayos. Análogamente a la idea de que un punto divide a una recta en tres partes iguales, podemos decir que una recta divide en tres partes iguales a un plano, que son: a) La propia recta b) Los puntos que hay a cada lado de la recta y que los llamaremos semiplanos. Si denotamos por Π 1 , y Π 2 a los dos semiplanos que hay a cada lado de una recta L, tenemos que si tomamos dos puntos cualesquiera P y Q tales que P está en Π 1 y Q esta en Π 2 entonces el segmento PQ tiene un solo punto en común con L, mientras que si tomamos dos puntos P y R que pertenecen ambos al mismo semiplano entonces el segmento PR no tiene ningún punto en común con la recta L. En consonancia con todo lo anterior tenemos que un plano divide al espacio en dos partes. Estas divisiones están relacionadas con la idea de dimensión. Por ejemplo si tomamos el espacio tridimensional, se tendrá que un plano tendrá dimensión dos, una recta tendrá dimensión uno, y cada punto tiene dimensión cero. 4. AXIOMAS Y TEOREMAS. Vamos a ofrecer ahora un enfoque formal de la geometría enunciando las siguientes axiomas, definiciones, teoremas, etc. Axioma1: Dos puntos diferentes determinan una única recta. Esto justifica nuestra idea de que una recta L se puede representar mediante dos puntos P y Q que pertenecen a la recta. Y además debemos tener en cuenta que si tenemos una recta L y tres puntos P, Q, y R que pertenecen a la recta L, se tiene que PQ=PR, es decir, la recta representada por PQ es la misma que la representada por PR. DEF Dada un recta L y dos puntos P y Q que están sobre L, se dice que P y Q son colineales.
3/12
DEF Dado un plano Π y tres puntos P, Q y R que están sobre el plano Π, entonces se dice que estos puntos son coplanares. Axioma 2: tres puntos no colineales determinan un plano único. Axioma 3: si dos puntos pertenecen a un plano, entonces la recta que los contiene está en el plano. Axioma 4: si dos planos diferentes se intersectan, entonces su intersección es una recta. Axioma 5: una recta contiene por lo menos dos puntos. DEF Dadas dos rectas L1 , L2 , se dice que L1 y L2 son paralelas si están en un mismo plano y su intersección es el conjunto vacío, es decir, si no tienen ningún punto en común. Teorema 1: Dos rectas diferentes se intersectan a lo más, en un punto. Dem. Sean L1 y L2 dos rectas diferentes y supongamos que su intersección no es a lo más un punto. Entonces su intersección contiene dos puntos (o más), llamémosle P y Q. Esto significa que tenemos dos rectas diferentes L1 , L2 , ambas conteniendo a P y Q. Pero por el axioma 1 esto es imposible ya que hay solamente una recta que contiene a los puntos P y Q. Teorema 2: Si una recta L intersecta al plano Π y no está contenida en él, entonces la intersección es un punto. L
P
ð
Dem. Hay que probar que L∩Π es un solo punto, ya que L∩Π es distinto del vacío por hipótesis. Supongamos que L∩Π contiene más de un punto, digamos P y Q. Entonces P y Q están ambos en L y por el axioma 1 PQ=L. Como P y Q están ambos en Π, por el axioma 3, L debe estar en el plano Π, lo cual contradice nuestra hipótesis, por lo tanto L∩Π contiene exactamente un punto. Teorema 3: Dada una recta L y un punto P que no pertenece a ella, hay exactamente un plano que contiene a ambos. Dem.
4/12
Sean Q y R dos puntos diferentes sobre L que existen por el axioma 5. Entonces Q y R son puntos diferentes de P, ya que P no está sobre L. Por el axioma 2, los puntos P, Q y R determinan un plano único Π. Como Q y R están en Π, que contiene a P y a L, si hubiera dos planos, ambos contendrían a los tres puntos P, Q y R y esto es imposible por el axioma 2. Teorema 4: Si dos rectas se intersectan, entonces su unión está contenida exactamente en un plano. Dem. Sean L1 y L2 dos rectas que se intersectan, entonces por el teorema 1, L1 ∩L2 es un punto P. Por lo tanto P es un punto de L1 y L2 . Sea Q un punto de L2 , Q≠P, que existe por el axioma 5. Por el axioma 1 PQ=L2 , además Q∉L1 ya que sino L1 = L2 . Consideremos el punto Q y la recta L1 , utilizando el teorema 3 hay exactamente un plano Π que contiene a L1 y Q. Como P es un punto de L1 , P está contenido en Π y por el axioma 3 PQ=L2 está contenido en Π. Luego L1 ∪L2 están contenidos en Π. Veamos que dicho plano Π es único. Por el teorema 3 el plano es único. Sean P y R contenidos en L1 y P y Q contenidos en L2 con P, Q y R distintos (esto ocurre por el axioma 5). Si existe un plano Π’ que contiene a L1 ∪L2 , entonces Π’ contiene a P, Q y R, pero esto contradice el axioma 2 ya que hay un único plano que contiene a P, Q y R que es Π. Luego no hay ningún otro plano que contenga a L1 ∪L2 y el teorema queda demostrado. 5. INTERSECCIONES DE CONJUNTOS DE PUNTOS EN EL ESPACIO. 5.1. Intersección entre dos rectas. Dadas dos rectas L1 y L2 en el espacio puede ocurrir que: a) Si su intersección es un punto, entonces ambas rectas están contenidas en un mismo plano y se cortan en un punto, este caso se dice que son secantes. b) Si su intersección son dos o más puntos entonces tienen en común todos sus puntos y se dice que son coincidentes. c) Si su intersección es el vacío y pertenecen a un mismo plano entonces se dice que ambas rectas son paralelas. d) Si su intersección es el vacío y no pertenecen al mismo plano entonces se dice que ambas rectas son oblicuas, o lo que es igual, las rectas se cruzan. 5.2.-
Intersección entre dos planos.
Dados dos planos Π 1 y Π 2 en el espacio puede ocurrir que: a) Ambos planos no tengan en común ningún punto, y en este caso se dice que ambos planos son paralelos. 5/12
b) Ambos planos tienen una recta en común, entonces se dice que los planos se cortan en una recta. c) Ambos planos se cortan en una recta y en un punto que no pertenece a la recta, entonces se dice que ambos planos son coincidentes. 5.3.-
Intersección entre una recta y un plano.
Dados un plano Π y una recta L del espacio, se tiene que: a) Si el plano Π y la recta L tienen un punto en común se dice que son secantes. b) Si el plano Π y la recta L tienen dos o más puntos en común entonces se dice que la recta está contenida en el plano y la intersección entre ambos es la propia L. c) Si el plano Π y la recta L no tienen ningún punto en común entonces se dice que la recta y el plano son paralelos. 5.4.-
Intersección entre tres planos.
Dados tres planos Π 1 , Π2 , Π 3 en el espacio se tiene que: a) b) c) d) e) f)
Los tres planos son paralelos entre si, no tienen ningún punto en común. Dos planos son coincidentes y el tercero es paralelo a ellos. Dos planos paralelos y el tercero los corta. Los tres planos se cortan dos a dos. Los tres planos se cortan en una recta, siendo todas distintas. Dos planos coincidentes y uno que los corta, de manera que los tres planos tienen una recta en común. g) Los tres planos son coincidentes entre si. h) Los tres planos se cortan en un punto. 6. ÁNGULOS. Sean dos rayos PQ y PR tales que tienen el punto P en común, y además se verifica que el punto P es extremo en ambos casos, entonces puede ocurrir que su unión sea una recta, en cuyo caso diríamos que los rayos son opuestos, pero si no son opuestos, definen lo que llamaremos ángulo. DEF Sean dos rayos con el punto extremo en común y tales que no forman una recta, se define ángulo como el conjunto de puntos en el plano que verifican esta propiedad y lo denotaremos por ∠QPR. Como claramente podemos observar un ángulo divide al plano en tres partes: a) Una es el propio ángulo, es decir, el conjunto de puntos que pertenecen a los rayos que lo forman. b) Otra es el interior, que el conjunto de puntos que hay en común entre los semiplanos siguientes: - El semiplano de la recta PQ que contiene al punto R. 6/12
-
El semiplano de la recta PR que contiene al punto Q.
c) Y por último el exterior que es el resto de puntos del plano que no son el interior ni el ángulo. DEF Dados dos ángulos ∠QPR y ∠SPT se dice que son opuestos por el vértice p si su unión forma dos rectas. DEF Dos ángulos ∠QPR y ∠RPS se dice que son adyacentes si tienen el vértice en común y su intersección es un rayo. 7. MEDIDA Y CONGRUENCIA. 7.1. Medida y congruencia de segmentos de recta. Sea una recta L, si tomamos en ella un punto cualquiera y lo designamos con el valor “0”, al tomar otro punto cualquiera y denotarlos con el valor “1” (siempre y cuando sea distinto del anterior) podemos construir una recta numérica de manera que podamos asignar a cada punto de la recta un número real y a cada número real un punto de L, siendo la unidad de medida que tomamos la distancia entre los dos puntos arbitrarios que hemos denotado por “0” y “1”. Al poder identificar cada punto de L con un número real establecemos lo que se llama un sistema coordenado, y a partir de ahora a cada punto de la recta le asignaremos un número real, dentro de la escala elegida, y a este número real lo llamaremos coordenada del punto, e identificaremos cada punto de la recta mediante su coordenada. Esto nos permitirá medir la longitud de cada segmento PQ , simplemente tendremos que comparar este segmento con la unidad de la escala elegida siendo su longitud el número de veces que hay que repetir la unidad de la escala para ir desde P hasta Q o viceversa. Por lo tanto podemos suponer que toda recta tiene asociado un sistema coordenado, y a esto lo llamaremos axioma de la regla. DEF Dada una recta L, que tiene asociado un sistema coordenado tal que asigna al punto P el número real x y al punto Q el número real y, tenemos que se define la distancia o longitud del segmento PQ como: PQ = x-y Nota: Evidentemente la longitud de un segmento es un número real positivo. PROP Si el segmento AB ⊂ PQ ⇒ AB ≤ PQ PROP Si R es un punto que pertenece al segmento PQ entonces PQ = PR + RQ .
7/12
DEF Dado un segmento PQ se define el punto medio de dicho segmento como el punto Pm que pertenece al segmento y tal que: PPm=PmQ DEF Dados dos segmentos PQ y AB de una recta, no necesariamente iguales, se dice que son congruentes, “≅”, si tienen la misma longitud, es decir: PQ ≅ AB ⇔ PQ = AB 7.2. Medida y congruencia de ángulos. Para medir ángulos usamos una semicircunferencia. Consideremos la semicircunferencia con centro en C. Supondremos que el arco de circunferencia, desde A hasta B, puede ser dividido en n partes iguales, por cualquier número positivo. Podemos llamar a esta suposición “Axioma del Transportador”. Cogemos n =180. Tenemos entonces una correspondencia de uno a uno entre los puntos sobre una circunferencia y los números reales entre 0 y 180. Este es un sistema coordenado para la semicircunferencia. Podemos usar este sistema coordenado para medir cualquier ángulo. Por ejemplo ∠PQR. Para ello colocamos nuestra escala de tal forma que el centro C de la semicircunferencia quede sobre el vértice Q del ángulo y el rayo QR sobre el rayo CB. El rayo QP intersectará al arco en algún punto de coordenada t y decimos que la medida del ∠PQR es t y se escribe m∠PQR = t. Si dividimos la semicircunferencia en 180 partes iguales la unidad de medida se denomina grado. Otra medida de medir ángulos consiste en usar la unidad llamada radian. PROPIEDADES DE LAS MEDIDAS DE ÁNGULOS 1.- La medida de un ángulo en grados es un número real positivo entre 0 y 180. Esto es consecuencia de nuestra definición de ángulo como unión de rayos. 2.- Si P es un punto interior del ∠ABC entonces. m ∠ABP < m ∠ABC 3.- Si P es un punto en el interior del ∠ABC, entonces: m ∠ABP + m ∠PBC = m ∠ABC Clasificación de ángulos Podemos clasificar los ángulos de acuerdo con su medida. Si un ángulo mide 90 se llama recto. Si un ángulo mide menos de 90 se llama agudo. Si un ángulo mide más de 90 se llama obtuso.
8/12
Dos ángulos son complementarios si suma 90º y suplementarios si suman 180º. Congruencia de ángulos. Dos ángulos son congruentes si tienen la misma medida. Por lo tanto, todos los ángulos rectos son congruentes. Decir que dos ángulos son congruentes no implica que sean iguales ya que los ángulos son conjuntos de puntos. TEOREMA Si dos ángulos son congruentes entonces sus suplementos son congruentes. Dem. (Vamos a representar los ángulos únicamente por su vértice) Supongamos ∠A ≅ ∠B. Entonces m ∠A = m ∠B y esta medida es algún número n, entre 0 y 180. Por lo tanto el suplemento de ∠a debe medir 180 – n. Y como tienen la misma medida son congruentes. TEOREMA Los ángulos opuestos por el vértice con congruentes. Dem. Consideremos los ángulos opuestos por el vértice ∠ABC y ∠PBR. Como AR es una recta, ∠ABP es suplemento de ∠ABC y como también CP es una recta ∠ABP es suplemento de ∠PBR. Por tanto, ∠ABC y ∠PBR tienen el mismo ángulo suplementario, el ∠ABP; y como ∠ABP es congruente con él mismo, concluimos por el teorema anterior que ∠ABC es congruente con ∠PBR. 8. PERPENDICULARIDAD DEF Decimos que dos rectas que se intersectan son perpendiculares si su unión contiene un ángulo recto. Podemos también definir la relación “es perpendicular a” entre dos rayos, o entre dos segmentos de recta. Se dice que dos rayos son perpendiculares si las rectas que los contienen son perpendiculares; y en la misma forma, dos segmentos de recta son perpendiculares si las rectas que los contienen son perpendiculares. Consecuentemente, dos rayos o dos segmentos de recta pueden ser perpendiculares aún cuando su intersección sea vacía. Utilizando ángulos adyacentes podemos definir las rectas perpendiculares de otra manera. DEF Dos rectas que se intersectan son perpendiculares si su unión contiene dos ángulos adyacentes congruentes. El axioma de perpendicularidad, establece que, dado un punto y una recta, existe una y sólo una perpendicular a la recta que pase por el punto.
9/12
9. PRUEBAS DE PARALELISMO. Al definir la relación de paralelismo entre dos rectas, hemos dicho que dos rectas son paralelas, si están en el mismo plano y no se intersectan. Si L1 y L2 son rectas paralelas, lo denotamos por L1 // L2 . Tal como hemos definido perpendicularidad entre rayos o segmentos de recta, podemos decir que dos rayos o dos segmentos de recta son paralelos, si las rectas que lo contienen lo son. Pero esta definición no es muy útil ya que dos segmentos en el plano pueden parecer paralelos, pero, puesto que las rectas determinada por ellos son infinitas en extensión, podemos no ser capaces de afirmar si estas rectas se intersectan o no. Por lo tanto, necesitamos desarrollar algunas pruebas, además de la definición de paralelismo. TEOREMA Si dos rectas están en el mismo plano y son perpendiculares a la misma recta, entonces son paralelas. Dem. Para demostrar este teorema hacemos uso del axioma de perpendicularidad que dice que dada una recta L y un punto P, no contenido en L, una y sólo una recta puede ser trazada pasando por P, y que sea perpendicular a L. Sean L1 , L2 y T tres rectas pertenecientes al mismo plano, tales que L1 ⊥T y L2 ⊥T. Queremos probar que L1 // L2 . Supongamos que L1 no es paralela a L2 . Entonces L1 ∩L2 contiene exactamente un punto P: es decir, hay dos rectas L1 y L2 que pasan por P y son perpendiculares a T. Pero esto contradice el axioma de perpendicularidad. Luego L1 // L2 . DEF
Dadas tres rectas,
10/12
los ángulos ∠1 y ∠3 son opuestos por el vértice y ∠1 y ∠7 son ángulos alternos internos, entonces llamaremos ∠3 y ∠7 ángulos correspondientes. LEMA La medida de un ángulo exterior a un triángulo, es mayor que la medida de cualquiera de los dos ángulos interiores opuestos. Dem.
Sea el triángulo de vértices ∆ABC Calculamos el punto medio m de CB y trazamos AE , tal que AM ≅ ME . Trazamos EB . Ahora CM ≅ MB por construcción, AM ≅ ME por la misma razón y ∠1 y ∠2 son congruentes ya que son ángulos opuestos por el vértice. Como ∆AMC ≅ ∆EMB ya que podemos establecer una correspondencia de igualdad de ángulos y lados entonces ∠CBE ≅∠C Pero E está contenido en el ángulo exterior, ∠CBD, entonces por las propiedades de la medida de ángulos m∠CBE < m∠CBD Luego concluimos m∠C < m∠CBD y análogamente m∠A < m∠CBD. TEOREMA Si dos rectas en el plano son cortadas por una transversal de forma que un par de ángulos correspondientes sean congruentes, entonces estas dos rectas son paralelas. Dem. 4 p 1
3
L1
2
r 8 q 5
7
L2
6
T
11/12
Sea L1 y L2 dos rectas en el plano, cortadas por una transversal T en los puntos P y Q respectivamente. Y supongamos que L3 ≅L7 . Queremos probar que L1 // L2 . Supongamos que L1 y L2 no lo son. Entonces se cortan en algún punto R que podemos suponer a la derecha de T. Por lo tanto PQR es un triángulo y ∠8 es un ángulo exterior a él. Pero ∠8 ≅ ∠2 (por ser ángulos alternos internos y ser ∠3 ≅ ∠7 y ∠2 es un ángulo interior, opuesto al ∠8. Esto contradice al lema, ya que la medida de un ángulo exterior debe ser mayor que la media de un ángulo interior opuesto. Luego L1 es paralelo a L2 .
Bibliografía Recomendada. Margaret Wiscamb Hutchinson “Geometría, un enfoque intuitivo”. Ed: trilles Edwin E. Morse “Geometría elemental desde un punto de vista avanzado”. Ed: C.E.C.S.A.
12/12
TEMAS DE MATEMÁTICAS (Oposiciones de Enseñanza Secundaria) TEMA 35 LAS MAGNITUDES Y SU MEDIDA. FUNDAMENTACIÓN CONCEPTOS RELACIONADOS CON ELLAS. 1. Introducción. 2. Magnitudes y Medidas. 3. Tipos de Magnitudes. 3.1. Magnitudes Fundamentales. 3.2. Magnitudes Derivadas. 4. Ecuaciones Dimensionales. 4.1. Análisis Dimensional. 5. Matematización del Concepto de Magnitud. 5.1. Magnitudes Escalares. 5.2. Medida de Magnitud. 5.3. Ejemplo de Magnitud. 6. Incertidumbre en la realización de Medidas. 6.1. Conceptos en la Teoría de Errores. 6.2. Error Absoluto. Error Relativo. Bibliografía Recomendada.
1/17
DE
LOS
TEMA 35 LAS MAGNITUDES Y SU MEDIDA. FUNDAMENTACIÓN CONCEPTOS RELACIONADOS CON ELLAS.
DE
LOS
1. INTRODUCCIÓN. El hombre siempre ha sentido curiosidad por el mundo que le rodea. Como demuestran los primeros documentos gráficos, el hombre siempre ha buscado el modo de imponer orden en la enmarañada diversidad de los sucesos observados en la naturaleza. Esta búsqueda del orden ha adquirido una diversidad de formas: una de ellas es la religión, otra es el arte y una tercera es la ciencia. La palabra ciencia tiene su origen en un verbo latino que significa "saber" pero ha dejado de significar meramente un conocimiento para referirse más bien a un conocimiento específico del mundo natural y lo que resulta más importante a un conocimiento organizado de un modo especifico y racional. Aunque las raíces de la ciencia son tan profundas como las de la religión o las del arte, sus tradiciones son mucho más modernas. Solamente en los últimos siglos se han desarrollado métodos para estudiar sistemáticamente la naturaleza. En este estudio se deben incluir las técnicas de observación, reglas para el razonamiento y la predicción, las ideas para la experimentación planificada y los modos de comunicar los resultados experimentales y teóricos, todo ello englobado en lo que se denomina método científico. La observación de un fenómeno es, en general, incompleta a menos que dé lugar a una información cuantitativa. Para obtener dicha información se requiere la medición de una propiedad o atributo de un objeto. Lord Kelvin señaló: “Nuestro conocimiento es satisfactorio solamente cuando lo podemos expresar mediante números". La expresión de una propiedad en términos de números, requiere no sólo que utilicemos las matemáticas para mostrar las relaciones entre las diferentes cantidades, sino también tener el conocimiento para operar con estas relaciones. 2. MAGNITUDES Y MEDIDAS. Se define la Magnitud como toda aquella entidad que se puede medir entendiendo por medir como comparar la entidad-magnitud con otra de la misma naturaleza que se toma arbitrariamente como unidad. Como entidad podemos entender cualquier cualidad o propiedad de los cuerpos. Llamaremos Cantidad de Magnitud a la manifestación concreta de una magnitud. Para determinar las relaciones matemáticas que surgen entre algunas magnitudes, previamente hemos de cuantificarlas o medirlas, es decir, convertirlas en números. La medición es una técnica por medio de la cual asignamos un valor numérico a una propiedad, como resultado de una comparación de dicha propiedad con otra de igual naturaleza que tomamos como patrón, la cual se ha adoptado como unidad. Las unidades de las magnitudes se eligen arbitrariamente procurando que éstas obedezcan los siguientes criterios:
2/17
1) Invariabilidad: El patrón es inalterable. Es siempre el mismo en cualquier lugar o condición. 2) Fácil Contrastabilidad: Debe ser fácil la fabricación de copias del patrón y su comparación con cualquier cantidad de la magnitud a medir. 3) Carácter Internacional: El patrón se debe usar a nivel internacional, para facilitar la transmisión de datos. Establecido el patrón, comparamos éste con la cantidad a medir, diciendo que tiene medida n si contiene n veces al patrón o unidad. Diremos entonces que n es la medida de dicha magnitud. A partir del patrón o unidad establecido para la medición de magnitudes, podemos obtener fracciones del mismo para realizar medidas que no sean igual a un número exacto de dicho patrón. Está aceptado internacionalmente que el fraccionamiento siga el sistema decimal, con lo que cada unidad de un orden es diez veces más grande que la de orden inmediatamente inferior. Hemos definido una magnitud como cualquier cualidad o propiedad de los cuerpos que es susceptible de ser medida. Por tanto, no todos los atributos de un objeto son magnitudes. Utilizaremos el criterio de igualdad y suma para distinguir aquellas entidades que son magnitudes (longitud, tiempo, masa, carga, energía,...) de aquellas entidades que no son magnitudes (dolor, alegría, inteligencia, voluntad, odio,...). Las magnitudes pueden igualarse entre sí y pueden sumarse para dar magnitudes de igual naturaleza, por consiguiente se pueden considerar como cantidades algebraicas y se pueden someter a los cálculos y procesos matemáticos. 3. TIPOS DE MAGNITUDES. Las magnitudes se clasifican a menudo en magnitudes fundamentales y magnitudes derivadas. Tal división es arbitraria, puesto que una magnitud determinada puede considerarse como fundamental en una serie de relaciones (un sistema de unidades) y como derivada en otra serie de relaciones (otro sistema de unidades). Las magnitudes derivadas son aquellas cuyas operaciones de definición se basan en otras magnitudes (fundamentales o derivadas) y las operaciones de definición de una magnitud derivada son conjuntos de operaciones que conducen a un número y una unidad y que pueden incluir cálculos matemáticos. Ejemplos de magnitudes que ordinariamente se consideran como derivadas son: velocidad, definida como el espacio recorrido en un tiempo unidad, aceleración definida como la variación de velocidad en un tiempo unidad, densidad definida como la masa de un cuerpo por unidad de volumen, etc. Las magnitudes fundamentales son primarias y no se definen en función de otras magnitudes. En Mecánica, las tres magnitudes fundamentales son: longitud (L), tiempo (T) y masa (M) y todas las demás magnitudes se deducen a partir de éstas, por ejemplo velocidad (V=L/T=LT-1), aceleración (A=V/T=LT-2), fuerza (F=M·A=MLT-2), trabajo (W=F·L=ML2 T-2), etc. Entre paréntesis se han escrito los símbolos que representan las dimensiones de las magnitudes y como puede verse las dimensiones de las magnitudes fundamentales se representan por una sola letra L, T y M, mientras que las dimensiones
3/17
de las magnitudes derivadas se representan por combinaciones u operaciones algebraicas de las dimensiones fundamentales. Junto a estas magnitudes fundamentales y derivadas, el sistema de unidades se completa con otras unidades suplementarias o auxiliares como son el ángulo plano y el ángulo sólido. - Angulo plano, porción de plano comprendida entre dos semirrectas que tienen un origen común, medida según la apertura de las semirrectas. - Angulo sólido, porción de espacio limitada por una superficie cónica de origen en un punto cuyas generatrices se apoyan en una curva cerrada que no pasa por el origen, medida según la apertura de la superficie cónica. Constituye una generalización a tres dimensiones de la noción de ángulo plano
Fig. 1
3.1. Magnitudes Fundamentales. Es natural que si los resultados de la medición de un fenómeno físico deben proporcionarse a otras personas o deben publicarse, para que puedan ser reproducidos por otros equipos investigadores, es necesario definir un sistema estándar aceptado internacionalmente. En 1960, la XI Conferencia General de Pesas y Medidas (C.G.P.M.), estableció reglas para decidir un conjunto de patrones correspondientes a las magnitudes fundamentales y se estableció un sistema de unidades que recibió el nombre de SISTEMA INTERNACIONAL (SI) de unidades o Sistema MKS. En este sistema, las unidades de masa, longitud y tiempo son: el Kilogramo (Kg), el metro (m) y el segundo (s) respectivamente. Otras unidades fundamentales del SI que estableció la Conferencia son: la temperatura (K) -el grado Kelvin-, la intensidad de corriente eléctrica (A) -el amperio- y la intensidad luminosa (C) -la Candela-. Estas seis unidades fundamentales son las unidades básicas del Sistema Internacional (SI). Posteriormente la XIV C.G.P.M. de 1971 amplió a siete las magnitudes fundamentales con la adopción de la magnitud cantidad de materia y cuya unidad es el mol. 3.1.1. Longitud. La magnitud Longitud es la extensión del espacio que ocupan los cuerpos. Las medidas de dicha magnitud sirven para apreciar la longitud de los objetos en una sola dimensión. Desde 1905 en que se celebró en París la III C.G.P M. en la que se instituyeron las unidades patrón, el metro se definía como: El metro (m) es la longitud que hay a 0o C entre dos trazos marcados en una regla de platino iridiado que se conserva en la
4/17
Oficina Museo Internacional de Pesas y Medidas de Sèvres (París) y se denomina metro patrón. En 1960 la XI C.G.P.M. sin cambiar el modelo de metro patrón lo definió a partir de un fenómeno atómico: El metro (m) es igual a 1.650.763’73 veces la longitud de onda de la radiación electromagnética (raya roja) emitida por el isótopo 86 Kr en su transición entre los estados 2p10 y 5d5 en el vacío cuando se calienta a la temperatura del punto triple del nitrógeno. La XVII C.G.P.M. de 1984 ha abolido la definición dada por la XI Conferencia, que ha permanecido en vigor desde 1960 y la ha sustituido por la siguiente: El metro es la longitud del trayecto recorrido por la luz en el vacío durante el tiempo de la fracción 1/299792456 de segundo. Esta definición ha permitido una realización del metro más precisa y exacta mediante la utilización del láser y además tiene la ventaja de ser indestructible. 3.1.2. Masa. La Masa, o cantidad de materia que integra los cuerpos, es una magnitud cuya medida vendrá dada a través de mediciones de volumen o capacidades de líquidos. Igualmente la III C.G.P.M. estableció como unidad de masa, el kilogramo patrón, como la masa de un bloque de platino iridiado conservado en el pabellón de Breteuil, de Sèvres (París). El cilindro de Sèvres mide 3'9 centímetros de diámetro y 3'9 centímetros de altura y para todos los propósitos prácticos es igual a la masa de 10-3 m3 de agua destilada a 4ºC (1 litro). La XI C.G.P.M. de 1960 ratificó como unidad de masa del SI el kilogramo internacional ya definido. Por analogía con el metro, podemos asociar el kilogramo a una propiedad atómica diciendo que un kilogramo es igual a la masa de 5'0188·1025 átomos del isótopo 12 C. En realidad, éste es el criterio adoptado al definir la escala internacional de masas atómicas. 3.1.3. Tiempo. El tiempo es la magnitud sobre la duración de los fenómenos. La unidad de tiempo, el segundo, se definió inicialmente como: la 86400 ava parte (1/86400) del día solar medio. El día solar es el intervalo entre dos pasos consecutivos del Sol por el meridiano de un mismo lugar de la Tierra. Como la velocidad de la Tierra en su traslación anual alrededor del Sol no es constante, el día va variando algo en el transcurso del año, por eso se toma el promedio de todo el año como día solar medio. También se ha comprobado que por la acción de las mareas la velocidad de rotación de la Tierra alrededor de su eje tampoco es constante y disminuye de forma que el día aumenta un 0'001 segundos cada siglo. Por ello, la XI C.G.P.M. de 1960 definió el segundo como la fracción igual a 1/31.556.925'9747 del año tropical 1900. El año tropical se define como el intervalo de tiempo entre dos pasajes sucesivos de la Tierra a través del Equinoccio Vernal, el que tiene lugar aproximadamente el 21 de marzo de cada año.
5/17
Si bien este patrón de segundo astronómico es más exacto que el patrón segundo solar medio, se necesitaba un patrón material de segundo comparable a los estándares de metro patrón y kilogramo patrón, lo que se ha logrado plenamente con el patrón atómico de frecuencia, reloj atómico regulado por el comportamiento magnético de los átomos de cesio. La XIII C.G.P.M. de 1967-68 adoptó para el segundo el patrón atómico de frecuencia con la definición actual, provisional: El segundo es la duración de 9.192.631.770 períodos de la radiación que corresponde a la transición de dos niveles hiperfinos del estado fundamental del átomo de cesio-133. Los relojes atómicos estaban en esa fecha en etapa de rápido desarrollo y esta es la razón por la que se adoptó el segundo de cesio solo de forma temporal. Por ejemplo, el Máser de Hidrógeno promete producir un reloj que tenga un error de sólo un segundo en 33 millones de años. Como complemento de las unidades fundamentales exponemos los prefijos que la Conferencia de Pesas y Medidas autoriza para designar múltiplos y submúltiplos de las unidades de todas las magnitudes: MÚLTIPLO/SUBMÚLTIPLO 1018 1015 1012 109 106 103 102 101 100 =1 10-1 10-2 10-3 10-6 10-9 10-12 10-15 10-18
PREFIJO Exa Peta Tera Giga Mega Kilo Hecto Deca Unidad deci centi mili micro nano pico femto atto
6/17
ABREVIATURA E P T G M k h da d c m µ n p f a
3.2. Magnitudes Derivadas. Vamos a ver a continuación algunas de las magnitudes derivadas más usuales. La relación completa de las mismas no corresponde a este tema. 3.2.1. Superficie. Es la magnitud que determina la extensión de un objeto en dos dimensiones (largo y ancho). Su unidad o patrón es el metro cuadrado m2 , que es la representación de un cuadrado que tiene de longitud un metro por cada lado. A partir de algunos de sus múltiplos se han determinado una serie de medidas agrarias de uso común, como son: El Área, que equivale a un decámetro cuadrado. La Hectárea, que equivale a un hectómetro cuadrado. La Centiárea, que equivale a un metro cuadrado. 3.2.2. Volúmen. Es la magnitud que determina la extensión de un objeto en sus tres dimensiones (longitud, anchura y profundidad). La unidad o patrón es el metro cúbico, m3 , que es el volumen de un cubo de longitud un metro para cada arista. 3.2.3. Capacidad. Magnitud que permite medir áridos y líquidos. La unidad o patrón es el Litro, que es la cantidad de líquido que cabe en un decímetro cúbico. 4. ECUACIONES DIMENSIONALES. La ecuación que relaciona la magnitud derivada con las fundamentales recibe el nombre de Ecuación Dimensional. Para la obtención de estas ecuaciones, partimos de la expresión de la magnitud derivada en función de otras magnitudes, que no tienen porque ser fundamentales. Esta primera expresión se llama Ecuación de Definición. A partir de ella, realizamos sucesivas sustituciones hasta conseguir que las únicas magnitudes intervinientes sean todas fundamentales. Los símbolos que se utilizan para especificar las dimensiones de las magnitudes fundamentales longitud, masa y tiempo son L, M y T, respectivamente. A menudo se utilizarán corchetes [] para representar las dimensiones de una magnitud. Por ejemplo, con esta notación, las dimensiones de la velocidad, v se escriben [v]=L/T y las dimensiones de un área, A serán [A]=L2 . Ejemplos de magnitudes y sus ecuaciones de dimensiones son: Velocidad v [v] = L/T = LT-1 Aceleración a [a] = [v]/T = LT-2 Fuerza F [F] = M·[a] = MLT-2 7/17
Trabajo W [W]= [F]·L = ML2 T-2 Energía Cinética EC [EC] = M·[v]2 = ML2 T-2 Potencia P [P] = [W]/T = ML2 T-3 4.1. Análisis Dimensional. En muchos casos es posible que se plantee el problema de deducir o verificar una fórmula específica, a partir de las magnitudes que intervienen. Aunque se hayan olvidado los detalles de la deducción, existe un procedimiento útil y poderoso, conocido como análisis dimensional, que puede utilizarse con el fin de ayudar en la deducción o comprobación de la expresión final. También se usa para comprobar la homogeneidad de una ecuación y para minimizar su memorización. El análisis dimensional hace uso del hecho de que “las dimensiones se pueden tratar como cantidades algebraicas”. 5. MATEMATIZACIÓN DEL CONCEPTO DE MAGNITUD. 5.1. Magnitudes. DEF Sea C un conjunto y E una relación de equivalencia sobre C. Si definimos en el conjunto cociente C E una operación suma que verifique las propiedades
[a ] + [b] = [b] + [a ] ∀[a], [b ]∈ C E Asociativa: ([a ] + [b]) + [c] = [a] + ([b] + [c ]) ∀[a ], [b], [c] ∈C E Elemento Neutro: ∃[0]∈ C E tal que [a] + [0] = [a] ∀[a ]∈ C E
1) Conmutativa: 2) 3)
siendo (C E ,+) un semigrupo conmutativo, entonces hemos definido sobre C una Magnitud. DEF
Llamaremos Cantidad a los elementos de C E .
Sobre un mismo conjunto C se pueden definir diferentes magnitudes. Por ejemplo, si C={polígonos convexos del plano} entonces podríamos definir como magnitudes el número de lados, perímetro o Área. Por tanto, podemos decir que una magnitud es cualquier cualidad o propiedad de los objetos que puede ser medida. Y llamamos cantidad a la manifestación concreta de una magnitud. Nos podemos plantear como definir la operación suma en el conjunto cociente C E , siendo C un conjunto sobre el que se ha definido una magnitud. Para definir la suma se suele recurrir a dar algunas reglas que nos sirvan para obtener un elemento de C a partir
8/17
de la suma de otros dos. La clase de equivalencia del elemento suma será el elemento de C obtenido como suma de los otros dos. Es decir: E
[a], [b]∈C E
⇒ a, b ∈ C ⇒ a + b ∈ C ⇒
[a + b]∈C E
y se define [a] + [b] = [a + b]
Pero para que la suma en el conjunto C E se pueda definir de esta manera se deben verificar las siguientes condiciones: 1) Dados dos elementos cualesquiera de C E , siempre hay sendos representantes de ellos en C cuya suma sea posible. 2) La clase de equivalencia a la que pertenece el elemento suma obtenido no depende de los representantes elegidos en C para las clases que se suman en C . E Estas dos propiedades reciben el nombre de Propiedad Uniforme de la Adición. Partiendo de la definición de suma que hemos definido en C E , podemos definir el producto de un número n por una cantidad al resultado de sumar n veces la misma cantidad. El resultado de multiplicar el número cero por una cantidad es el neutro de la adición. El inverso del producto no es posible para cualquier magnitud. Si dada una cantidad [a ]∈ C E y un número natural n, existe otro [b]∈ C E tal que n·[b ] = [a] , entonces
[b] = 1 [a ] siendo [b] el cociente de dividir [a ] por n. n
1 [a] , podemos definir el producto de una cantidad por una n m m 1 fracción ∈ Q como [a ] = m· [a ] n n n Si existe el cociente
Las magnitudes cuyas cantidades son siempre divisibles por cualquier número natural reciben el nombre de magnitudes divisibles. 5.1. Magnitudes Escalares. DEF Dada una magnitud definida sobre los eleme nto de un conjunto C mediante una relación de equivalencia E y una adición en C E , diremos que es Escalar si satisface las siguientes condiciones: 1) Es divisible. 2) Es ordenada. 3) Es arquimediana. 9/17
OBS Recordemos que ser ordenada significa: ∀[a ], [b]∈ C E
con
[a ] ≠ [b ]
⇒
[a ] < [b ]
ó
[a] > [b]
y tiene las propiedades siguientes: 1) Transitiva. [a ] < [b ] y 2)
[a ] < [b ]
⇒
[b ] < [c ] ⇒ [a ] < [c ] [a ] + [c ] < [b] + [c] ∀[c] ∈ C E
Ser Arquimediana significa que
[0] < [a] < [b]
⇒ ∃n ∈ N
tal
que n·[a ] > [b]
El criterio que nos permite decidir si [a ] < [b ] ó [a ] > [b] suele definirse mediante un proceso de comparación de representantes en C de ambas clases elegidos de forma adecuada. Para que sea válida la definición, el resultado no debe depender de los representantes elegidos. DEF Diremos que una magnitud escalar es absoluta si satisface la siguiente condición: 4) El elemento neutro o cantidad nula es la menor de todas las cantidades. Es fácilmente deducible de las propiedades de ser ordenada que en una magnitud absoluta no existen cantidades distintas de la nula que sumen la cantidad nula. DEF
Diremos que una magnitud escalar es relativa si satisface la siguiente condición:
4’) Existencia de Opuesto. ∀[a ]∈ C E ∃[b] ∈ C E
[a ] + [b] = [0]
tal que
⇒
[b] = −[a]
OBS Las magnitudes escalares, tal cual las hemos definido satisfacen los requisitos necesarios para establecer en ellas una teoría de la medida con las propiedades habituales de ésta. DEF
Diremos que una magnitud escalar es continua o real si satisface:
5) El Axioma de Continuidad. Recordemos que el axioma de continuidad aplicado a esta situación dice: Si las cantidades o elementos de C E se clasifican en dos clases, de modo que toda cantidad de la primera sea menor que cualquiera de la segunda, entonces existe una única cantidad de separación de ambas clases. Dicha cantidad verifica que es mayor que todas las cantidades del primer conjunto y menor que todas las del segundo conjunto.
10/17
Podemos demostrar que el conjunto de cantidades C E de una magnitud escalar continua es isomorfo al semigrupo aditivo de los números reales positivos o al grupo aditivo de los números reales, según sea la magnitud absoluta o relativa, respectivamente. 5.2. Medida de Magnitud. DEF Dada una magnitud con la propiedad de ser divisible, llamaremos unidad a una cantidad [u] no nula elegida de forma arbitraria. Si existe, su opuesta será – [u] . DEF
Dada una cantidad [a ] , si existen m,n∈– tal que [a ] =
m [u ] o n
[a] = m (− [u ])
entonces diremos que la medida de la cantidad [a ] es el número racional
n
m m o − n n
respectivamente. Si tenemos una magnitud divisible y una unidad [u] , existirán cantidades cuyas medidas sean racionales, pero no todas las cantidades han de tener medida racional. Si la magnitud, además es ordenada y la unidad es mayor que la cantidad nula, la m p desigualdad entre dos cantidades [u ] y [u ] será cierta siempre y cuando lo sea la n q m p desigualdad numérica entre y . n q DEF
Si [a ] es una cantidad que satisface
una medida por defecto y que que
m [u ] < [a ] < m + 1 [u ] , diremos que m es n n n
m +1 es una medida por exceso, ambas con error menor n
1 . n
Si podemos obtener dos sucesiones monótonas convergentes de medidas racionales por defecto y por exceso, respectivamente, de la cantidad [a ] , podríamos definir la medida de [a ] como el número real límite de ambas sucesiones. El problema que surge es que la igualdad de medidas no tiene porqué implicar la igualdad de cantidades. Y tampoco podemos asegurar la existencia de cantidades con medida irracional. Esta dificultad la vamos a evitar trabajando sólo con magnitudes escalares continuas. En este tipo de magnitudes, elegida una unidad [u] >0, toda cantidad [a ] o bien posee una medida racional o existen dos sucesiones monótonas convergentes por defecto y por exceso que definen un número real, siendo ese número real la medida de la cantidad. Por tanto, dada una cantidad en el conjunto C E existe un único número real que sea la medida de dicha cantidad, y recíprocamente, dado un número real, existe una única cantidad en C E , que tenga por medida el número real. 11/17
DEF Llamaremos medición a la operación consistente en determinar las medidas de las cantidades. 5.3. Ejemplo de Magnitud. Una vez que hemos establecido el concepto de medida y hemos determinado una unidad, las normas que rigen el proceso de medición las debemos de desarrollar de forma particular para cada magnitud a estudiar. A modo de ejemplo, vamos a realizar el estudio de la magnitud longitud absoluta en los segmentos rectilíneos, analizando su fundamento matemático. Un segmento rectilíneo viene determinado por un par no ordenado de puntos, que llamaremos extremos. Por tanto, el conjunto C de los segmentos rectilíneos se puede identificar con el conjunto de los pares de puntos. El conjunto C también contiene a los segmentos nulos, que son aquellos en los que coinciden ambos extremos. La relación que definimos en C viene dada por la congruencia de segmentos. Dos segmentos son congruentes si existe un movimiento que lleva los extremos de uno a coincidir con los del otro. La relación definida la llamaremos E y es fácil comprobar que es de equivalencia. Tenemos ya definido el conjunto C E , formado por todas las clases de segmentos congruentes. El siguiente paso es definir la operación de suma de segmentos congruentes. Para ello tendremos en cuenta que fijada una semirrecta de origen O, cualquiera que sea el segmento AB, se puede determinar un punto X de la semirrecta de tal forma que los segmentos OX y AB sean congruentes. Así pues, una vez que tenemos determinada una semirrecta queda establecida una correspondencia biunívoca entre las clases de segmentos congruentes, C E , y los puntos de la semirrecta (o los segmentos OX siendo X un punto cualquiera de la semirrecta). Ahora vamos a definir la suma en C apoyándonos en la biyección anterior. E
C
Tomemos dos segmentos AB y CD, siendo AB y CD sus clases de equivalencia en E . Fijemos una semirrecta con origen en el punto O, siendo OX un elemento de C
congruente con AB (OX∈ AB ). Tomemos otra semirrecta con origen en X, determinando en ella un punto Y tal que XY es congruente con CD (XY∈ CD ). El segmento OY define la clase OY , que por definición es la suma de las cantidades AB y CD . Tal y como hemos definido la suma, es fácil demostrar la propiedad uniforme de la adición, o lo que es lo mismo, que la clase OY no depende de la semirrecta elegida. Si elegimos otra semirrecta con origen en O’ obtenemos otro punto Y’ que verifica: O' Y ' = AB + CD = OY siendo entonces OY congruente con O'Y ' . Luego no depende de la semirrecta elegida. 12/17
A partir de esta definición de suma en C E es inmediato comprobar que verifica las propiedades dadas para que sea ( C E ,+) un semigrupo conmutativo. Tomamos como elemento neutro de la operación la clase de los segmentos nulos. Acabamos de determinar una magnitud sobre C que llamaremos Longitud. También verifica la propiedad de Divisibilidad. Para comprobarlo, sea AB un elemento de C E . Tomemos una semirrecta con origen en O y tal que OX es congruente con AB . Si el segmento AB lo dividimos en n partes iguales y proyectamos de forma paralela sobre la semirrecta, obtenemos X1 , X2 ,..., Xn-1 tales que OX1 , X1 X2 ,..., Xn-1X son congruentes entre sí. Tenemos entonces que: OX 1 + X 1 X 2 + K + X n −1 X = AB ⇒ OX 1 + OX 1 + K + OX 1 = AB ⇒ 1 ⇒ nOX 1 = AB ⇒ OX 1 = AB n Para comprobar que la magnitud satisface la propiedad de Ordenación, hemos de representar las cantidades en una recta determinada. Se deduce fácilmente que, dadas dos cantidades [a] y [b], sólo pueden darse dos situaciones: o bien [a] es suma de [b] más otra cantidad, o bien [b] es suma de [a] más otra cantidad. De la relación [a]+[0]=[a] deducimos que cualquier elemento no nulo de C E es mayor que [0]. Por tanto la Longitud es una magnitud Absoluta. A través de la representación de Longitudes sobre una semirrecta, el axioma geométrico de la continuidad nos permite obtener la continuidad de la magnitud Longitud. Una vez visto que hemos definido sobre C una magnitud con las propiedades demostradas anteriormente, nos falta por dar una forma de obtener la medida de un segmento. Para ello necesitamos tomar un segmento como unidad o patrón y establecer su medida como la unidad. Sea u ese segmento y [u] su cantidad. La medida de una cantidad de longitud [a] puede obtenerse aplicando el proceso siguiente: Sea n1 un número natural tal que verifica: n1 [u] ≤ [a] < (n1 +1)[u] Si se verifica la igualdad n1 [u] = [a] la medida de [a] será el número natural n1 y hemos terminado. Si no se verifica, entonces n1 es una medida por defecto y [a] = n1 [u] + [r1 ] siendo [r1 ]<[u] Sea entonces n2 otro número natural tal que: n2 [r1 ] ≤ [u] < (n2 +1)[r1 ]
13/17
De nuevo, si se verifica la igualdad n2 [r1 ] = [u] entonces:
[a ] = n1 +
1 [u ] n 2
1 la medida de [a]. En cambio, si no es cierta la igualdad, la medida es siendo n1 + n 2 una aproximación por exceso y [u] = n2 [r1 ]+[r2 ] con [r2 ]<[r1 ] de forma análoga existe un natural n3 tal que: n3 [r2 ] ≤ [r1 ] < (n3 +1)[r2 ] y en el caso de ser cierta la igualdad tenemos que
[u ] = n 2 +
1 [r ] n 3 1
y por tanto 1 [u ] [a ] = n1 + 1 n2 + n3 siendo la expresión encerrada entre paréntesis la medida de [a]. En cambio si la igualdad no se verifica repetiremos el proceso obteniendo, en el paso i: ni[ri-1] ≤ [ri-2] < (ni+1)[ri-1] y si la igualdad fuese cierta se tendría que: 1 [u ] [a ] = n1 + 1 n2 + n3 + K 1 + n 1 Si por el contrario no se verifica la desigualdad seguiríamos el proceso indefinidamente.
14/17
Si la medida de [a] con respecto a la unidad [u] es racional, al cabo de un número finito de pasos se obtiene su expresión, pudiendo decir entonces que [a] y [u] son conmensurables. Si la medida de [a] con respecto a [u] es irracional, este proceso nos da una sucesió n de medidas aproximadas, por defecto y por exceso alternativamente, que son las sucesivas reducidas de una fracción continua indefinida, que representa un número irracional que es la medida buscada. Diremos que [a] y [u] son inconmensurables. 6. INCERTIDUMBRE EN LA REALIZACIÓN DE MEDIDAS. 6.1. Conceptos en la teoría de errores. En todas las ciencias aplicadas se opera con datos numéricos obtenidos mediante medidas y observaciones que nunca pueden ser absolutamente exactas. Medir una magnitud con una precisión infinita carece de significado, pues por mucho cuidado que se ponga en la realización y por muy perfecto que sea el aparato, siempre existirá la posibilidad de efectuarla con mayor precisión. Por otro lado, al realizar una medida es porque desconocemos su valor exacto, por tanto al valor obtenido en la medida experimental nunca podremos saber en qué grado se acerca al valor exacto o si coincide con él. En muchos casos, en las fórmulas empleadas en las medidas intervienen números irracionales, como π, e, logaritmos, funciones trigonométricas, etc., que no pueden tomarse con todas las cifras decimales, lo que influye que los resultados adolezcan de un cierto error. El efecto de los errores en las medidas se hace aún más acentuado por el hecho de que siempre que se realiza una medida, se perturba el sistema que se desea medir y cambian sus condiciones iniciales. Todas estas circunstancias nos demuestran que los resultados de las medidas experimentales vienen afectados de una cierta incertidumbre que es preciso determinar en cada caso, pues es la que nos indica la calidad de la medida realizada y debe acompañar siempre al resultado. Así, por ejemplo, no es lo mismo dar el resultado de una pesada en la siguiente forma: 3’235 ±0’001 g que en esta otra: 3’2350 ±0’0001 g pues la primera indica que la pesada tiene dos cifras decimales seguras, mientras que la segunda tiene tres. En ambos casos 0’001 y 0’0001 g representan el error o incertidumbre de nuestra medida. La aproximación con que ha de efectuarse una medida, esto es, la incertidumbre del resultado, depende del objetivo que se persiga y de la naturaleza misma de la medida, pero, en último termino, lo importante es conocerla de antemano, como error máximo (cota máxima de error) de que puede venir afectado el resultado. El conocimiento del error cometido en una medida experimental tiene gran importancia para saber: 1) La exactitud de los resultados obtenidos. 2) El mínimo de cifras decimales que hay que tomar para resolver problemas, evitando cálculos penosos e inútiles. 15/17
6.2. Error Absoluto. Error Relativo. Un error de 1 gramo cometido en la pesada de unos pocos gramos de un metal precioso, resulta inadmisible, mientras que el mismo error al pesar una tonelada carece de importancia. De ahí la necesidad de definir el error absoluto y el relativo de una medida. Se llama error absoluto de una medida o de un número aproximado a la diferencia, con su signo, entre el valor aproximado a e el calor exacto x : ∆x = a − x pero, en general, el valor exacto, x es desconocido y en la práctica se adopta para x el valor medio de un gran número de observaciones, o simplemente se asigna a ∆x un cierto valor límite o cota superior de error. Así, por ejemplo, cuando realizamos una pesada hasta el centigramo, admitimos que: ∆x ≤ 0'01 g o bien, cuando tomamos el número π = 3’141 con tres cifras decimales, sabemos que: ∆π ≤ 0'001 El error absoluto no sirve para juzgar el grado de aproximación o la calidad de una medida. Para esto es preciso definir el error relativo, que se define como el cociente entre el error absoluto ∆x y el valor exacto de la magnitud x, o sea: ε=
∆x x
Como x es, en general, desconocido, se determina el límite superior de error relativo ε dividiendo la cota máxima de error absoluto entre el número que resulta sustituyendo por ceros todas las cifras que siguen a la primera significativa del número aproximado de la medida. Así, por ejemplo, la cota máxima de error relativo del número π cuando se toma con tres cifras decimales π = 3’141, será: ε=
0'001 1 = = 0'00033 3 3000
Con frecuencia, los errores relativos se expresan en tanto por ciento, El resultado anterior sería de un 0’033%. La inversa del error relativo da el grado de precisión de la medida.
16/17
Bibliografía Recomendada. Gerald HOLTON y Duane H. ROLLER. Fundamentos de Física Moderna. Editorial. Reverté. BARCELONA. Marcelo ALONSO y Edward J. FINN. Física. Vol. 1. Mecánica. Addison-Wesley Iberoamericana. MÉJICO. Joaquín CATALA DE ALEMANY. Física General. SABER, Entidad Española de Librería. VALENCIA.. José Luis GALÁN GARCÍA. Sistemas de Unidades Físicas. Editorial. Reverté. BARCELONA.
17/17
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 36 PROPORCIONES NOTABLES. EL NÚMERO ÁUREO. 1. 2. 3. 4. 5. 6.
Introducción. Magnitudes Longitud de segmentos rectilíneos. Proporcionalidad de segmentos. Segmentos proporcionales. Proporciones notables. 6.1. Cuarto proporcional. 6.2. Tercero proporcional 6.3. Cuaterna armónica. 6.4. Media proporcional. 7. Sección áurea de un segmento 8. Historia y aplicaciones del número áureo.
1/10
TEMA 36 PROPORCIONES NOTABLES. EL NÚMERO ÁUREO. 1. INTRODUCCIÓN. En este tema pretendemos definir el concepto de longitud de un segmento, así como establecer las relaciones o proporciones más importantes que existen entre ellos y que son básicas para el estudio de la geometría de figuras y en ramas tan importantes como la geometría proyectiva. También abordaremos la existencia de una proporción entre segmentos tan importante como la proyección áurea, tanto desde el punto de vista histórico, ya que para los griegos era la relación perfecta, como desde el punto de vista científico (biología, matemáticas, etc.). 2. MAGNITUDES. Definición Sea A un conjunto. Diremos que en dicho conjunto A definimos una magnitud si podemos establecer una relación de equivalencia, que denominaremos R, en A, de manera que se defina un conjunto cociente A/R sobre el cual definimos la operación suma con las siguientes propiedades. a) Conmutativa:
x+ y= y+x
∀x , y ∈ A/ R
b) Asociativa:
x + ( y + z ) = (x + y ) + z
∀x , y , z ∈ A/ R
c) Existencia de elemento neutro: existe el eleme nto 0 ∈ A/ R tal que: a + 0= 0+a = a
∀a ∈ A/R
Nota: A las clases de equivalencia de A/R, [a] se les llama cantidades y todos los elementos que pertenecen a una misma clase de equivalencia diremos que tienen la misma cantidad. Con esta definición podemos definir, sobre un mismo conjunto, distintas magnitudes, por ejemplo: sobre el conjunto de polígonos regulares, podemos definir las magnitudes: área, número de lados, número de vértices, etc. 3. LONGITUD DE SEGMENTOS RECTILÍNEOS. Definición: Sea R una recta cualquiera. Se define un segmento de dicha recta como los puntos que unen dos puntos P, Q cualesquiera de dicha recta. Por lo tanto, se define un segmento cualquiera de extremos P y Q como los puntos de la recta que pasa por P y Q, que además están entre ellos. Lo denotaremos por PQ . 2/10
Diremos que dos segmentos PQ y AB son congruentes si podemos establecer un movimiento que haga corresponder los puntos inicial y final de uno con los del otro. Esta congruencia es una relación de equivalencia y a cada clase de equivalencia la llamaremos longitud, por eso diremos que dos segmentos son congruentes si tienen la misma longitud. Fijada una semirrecta de origen O, si tomamos un segmento cualquiera AB , podemos encontrar un punto X sobre la semirrecta de manera que OX y AB sean congruentes. Además si OX y OY son segmentos congruentes, se tiene que X=Y. Utilizando la propiedad que acabamos de exponer podemos definir una suma en el conjunto cociente A/R de manera que dados dos segmentos cualesquiera AB y CD , si tomamos una semirrecta con origen O, tenemos que: AB ~ OX y además XY ~CD y por lo tanto:
OY = AB ~ CD
Nota: Lo anterior es cierto siempre y cuando Y no esté entre O y X. La operación suma verifica las propiedades: • Conmutativa • Asociativa • Existencia de elemento neutro. • La longitud es divisible, es ordenada y es continua. • Si tomamos una unidad de longitud u , tomada una longitud a se tiene que existe α ∈ 3+ tal que α es la medida de a sobre u . Si α es un número irracional entonces se dice que a es inconmensurable con u . 4. PROPORCIONALIDAD DE SEGMENTOS. Definición: Se llama proporcionalidad de segmentos a toda aplicación biyectiva del conjunto de cantidades de longitud en sí mismo de modo que conserve el orden, la igualdad y exista correspondencia en la suma. Teorema fundamental de la proporcionalidad: Dados dos longitudes a y b , si tomamos dos rectas r y s con un punto común O y sobre ellas OA = a , OB = b y se hace corresponder al segmento OX el segmento OX ' tal que la recta XX’ sea paralela a la recta AB y además se obtiene una proporcionalidad, esta proporcionalidad no depende de las rectas.
O
A
X' X Z' Z r
3/10
B
s
Demostración: O Sean Y, Z puntos de r e Y’ y Z’ puntos de s de modo que YY’ y ZZ’ sean paralelas a AB. Entonces el segmento YZ le corresponde el segmento Y ' Z ' en la correspondencia anterior. Haremos OR = YZ y tenemos R’ sobre s de modo que RR’ sea paralela a AB.
R'
R
B
A
Y'
Y
Z'
Trazamos por Y’ la recta Y’M paralela a r. Los triángulos ORR’ e Y’MZ’ son congruentes luego OR ' = Y ' Z '
M
Z
s
r
Veamos ahora que a la suma de segmentos le corresponde un segmento que es suma de los correspondientes a los sumandos. Consideremos: OY = OX + XY
se verifica
⇒
OY ' = OX ' + X ' Y '
La correspondencia en la igualdad es trivial, luego la correspondencia establecida es una proporcionalidad. Esta proporcionalidad es independiente de las rectas r y s elegidas. Si tomamos otro par de rectas r’, s’ que se cortan en O’ y O' A' = a , O' B' = b O' X 1 = OX veremos que O' X 1 ' = OX ' con lo que quedará probado. O
O O'
O' B'
A
B
X
⇒
A
A' X r
X1
B'
B
X1' s'
Llevemos a coincidir, mediante un movimiento, la recta r’ de modo que O’ coincida con O y A’ coincida con A. Se tiene que X coincide con X1 Tenemos que:
AB’ es paralelo a XX1 ’ AB es paralelo a XX’
Entonces por el teorema reducido de Desargues se tiene que BB’ es paralela a X1 ’X’ y como el triángulo OBB’ es isósceles, también lo es el OX’X1 ’ ⇒ OX ' = OX 1 ' . Nota. Para demostrar este teorema hemos utilizado el teorema reducido de Desargues, el cual vamos a demostrar a continuación.
4/10
Teorema reducido de Desargues. Si en un plano tenemos dos triángulos ABC y A’B’C’ tales que las rectas AA’, BB’ y CC’ se cortan en O y además AB A’B’, AC A’C’ entonces también se cumple que BC B’C’. B'
B O
A C
Demostración
A'
Tracemos por O una recta que cumpla que no está contenida en el plano de los triángulos dados y en ella marcamos los puntos A1 y A1 ’ tales que AA1 es paralela a A’A1 ’.
C' Como se cumple que el plano A1 AB es paralelo al plano A1 ’A’B’ ⇒ A1 B A1 ’B’ y como el plano A1 AC es paralelo al plano A1 ’A’C’ ⇒ A1 C A1 ’C’. Como las rectas A1 B y A1 C son paralelas respectivamente a A1 ’B’ y A1 ’C’ ⇒ el plano ABC es paralelo a A’B’C’ por lo tanto tenemos que: BC B’C’ 5. SEGMENTOS PROPORCIONALES. Definición. Dados los segmentos a1 , a 2 ,..., a r se dice que son proporcionales a a1 ' , a 2 ' ,..., a r ' si hay una proporcionalidad que transforma a i en a i ' donde i ∈ {1,...r} Para comprobarlo basta tomar dos rectas cualesquiera r y s tales que ambas incidan en un mismo punto O. Tomaremos sobre la recta r, r segmentos de longitudes a1 , a 2 ,..., a r consecutivamente y en la recta s, r segmentos de longitudes a1 ' , a 2 ' ,..., a r ' y comprobamos que las rectas que unen los puntos a i con a i ' son paralelas. Teorema Si a y b son proporcionales a a ' y b ' entonces a y a ' son proporcionales a b y b'. Demostración Tomaremos sobre r los segmentos OA = a y OB = b y sobre s los segmentos OA' = a ' y OB ' = b ' . Utilizando la hipótesis AA’ BB’ tomaremos OA" = OA' sobre r y OB" = OB sobre s. Por ser las rectas A’A” y BB” perpendiculares a la bisectriz del ángulo AOA’ tenemos que A’A” BB”. Entonces AB” A”B’ por la configuración de Pappus, por lo tanto OA y OB son proporcionales a OB" y OB' si, y sólo si a y a ' son proporcionales a b y b ' .
5/10
Configuración de Pappus: Si AB CD y FB CE entonces:
A
AE FD
B
F C
E D
6. PROPORCIONES NOTABLES. 6.1. Cuarto proporcional. Si tomamos 3 segmentos a , b y c , se define el cuarto proporcional de los segmentos a , b y c como el segmento x , que es único, que verifica la condición siguiente: a c = b x Nota. Se expresa geométricamente como OA = a en r OB = b
s
X C
OC = c en s O
A
B
r
Como se ve, trazando la paralela a la recta AC que pasa por B obtenemos un punto X de corte con la recta s, tal que OX = x es el segmento buscado. 6.2.Tercero proporcional. Sean a y b dos segmentos cualesquiera., Se llama tercero proporcional de a y b al segmento x , que es único, tal que: a b = b x Nota: Su construcción es igual a la del cuarto proporcional, pero siendo c = b . 6.3.Cuaterna armónica. Definición Sean A, B y X tres puntos alineados. El segmento XA con la unidad XB , que se escribe: XA XB 6/10
es positivo cuando X no está entre A y B y negativo en caso contrario. Este concepto definido así, lo llamaremos razón simple de 3 puntos. Definición Sean A, B, X, X’ cuatro puntos alineados. Se dice que estos puntos forman una cuaterna armónica si: XA X 'A =− XB X 'B En este caso se dirá que X y X’ están armónicamente separados por A y B. Construcción del cuarto armónico: Sean A, B, X y X’ los cuatro puntos alineados (con X entre A y B) M N' n A
X
B
n
X'
N Tracemos 2 rectas paralelas por A y B y fijemos un punto M en la primera recta. La recta MX corta a la segunda en N. Determinamos N’ tal que BN’=BN. La recta MN’ corta a AB en X’ que es el cuarto armónico. En efecto, las rectas MX y AB determinan su proporcionalidad: XA m = XB n pero la recta MN’ y AB también, luego X 'A m = X 'B n
⇒
XA X' A =− XB X'B
6.4.Media proporcional. Dados dos segmentos a y b , se llama media proporcional de a y b al segmento x tal que a x = x b La construcción puede hacerse del modo siguiente: se trazan segmentos de longitud a y b sobre una recta tal que OA = a y OB = b y O separe A y B.
7/10
Se traza la circunferencia de diámetro AB. X
La recta perpendicular a AB por O corta a la circunferencia en X y OX = x pues la semejanza de los triángulos OBX y OAX garantiza a x = x b
B
O a A
b
7. SECCIÓN ÁUREA DE UN SEGMENTO. Definición. Se dice que un punto X que se encuentra en un segmento AB divide a dicho segmento en media y extrema razón cuando la parte mayor AX es media proporcional de la parte menor XB y del segmento total AB . Definición La parte mayor x del segmento que está dividido recibe el nombre de segmento o sección áurea, es decir: A
X
x
B
y
donde x + y = a , entonces tendremos a x = x y
a
La parte menor y también es segmento áureo de la parte mayor, es decir: a x = x y
⇒
a−x x = x−y y
⇒
y x = x−y y
Proporción áurea La razón de esa proporción φ = a x es conocida por el nombre de “sección” desde la época de Grecia. En el Renacimiento, el monje Lucca Pacioli la llamó “durna proporción” y fue finalmente Leonardo da Vinci el que la llamó “sección áurea”. Su valor es: a x = x a−x ⇒
a=
⇒
a 2 − a.x = x 2
x ± x 2 + 4x 2 1 + 5 x = 2 2
8/10
⇒
⇒
a 2 − a .x − x 2 = 0 a 1+ 5 = x 2
⇒
⇒
φ=
1+ 5 2
8. HISTORIA Y APLICACIONES DEL NÚMERO ÁUREO. Desde la antigüedad, los filósofos y geómetras creyeron en la existencia de una proporción privilegiada, que posteriormente los artistas del Renacimiento denominaron el número de oro. Existe una armonía, que algunos estiman perfecta, entre dos magnitudes, particularmente dos dimensiones, cuando ambas están entre sí, en la misma proporción que la mayor de ellas y la suma de las dos. Si x e y son estas magnitudes, siendo x la menor, se tiene: x y = y x+y Para encontrar la proporción que relacione x con y basta resolver la ecuación anterior para x=1 resultando, como anteriormente se ha demostrado que: φ= Como
1+ 5 2
5 es irracional, el número de oro lo es también y vale aproximadamente: 1’618033989…
El rectángulo cuyos lados guardan esta proporción tiene propiedades dignas de mencionar. Se presta prácticamente a una separación ilimitada de rectángulos semejantes cada vez menores, es decir, contiene en germen un desarrollo en fracciones continuas. Si en un rectángulo ABCD, trazado siguiendo la proporción del número de oro, se construye sobre el D lado AB, lado menor, un cuadrado ABEF, queda delimitado un rectángulo FECD semejante al primero; continuando con el mismo procedimiento, J que puede seguirse indefinidamente, se obtienen siempre rectángulos IECJ, luego GHCJ,… de proporciones ideales. A la inversa, construyendo un C cuadrado BKLC sobre el lado mayor BC de un rectángulo perfecto ABCD, se obtiene otro rectángulo perfecto AKLD, y así sucesivamente.
1'618 F G
H
I E
A
1
B
El número de oro parece ser una de las claves estructurales del universo visible, aunque la ciencia moderna no comparte esta creencia. Se le encuentra en la espiral logarítmica que a su vez es la forma que L K adoptan algunas nebulosas o el perfil de algunas con chas animales, en la disposición periódica de las hojas sobre el tallo de los vegetales; en el cuerpo humano, en el que el ombligo divide a su eje longitudinal en dos partes según la proporción áurea., etc. En la antigüedad el número de oro fue a la vez símbolo cosmológico, fórmula mágica y clave de diversas construcciones geométricas utilizadas sobre todo en arquitectura. En geometría aparece en varios lugares de la teoría de los pentágonos 9/10
regulares convexos o estrellados. Se encuentra su trazo también en ciertos elementos de la pirámide de Keops, en el Erecteion, y sobre todo en el Partenón, tanto por las proporciones del conjunto como por los detalles estructurales, en especial los concernientes a los capiteles. El número de oro ha sido la clave de la armonía numérica de obras maestras de la escultura y de la pintura. Algunos artistas han extendido estas experiencias a la música y a la poesía.
10/ 10
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 37 LA SEMEJANZA EN EL PLANO. CONSECUENCIAS. TEOREMA DE THALES. RAZONES TRIGONOMÉTRICAS. 1. Introducción. 2. Homotecias: Definición y propiedades. 3. La semejanza en el plano. 3.1. Definición y propiedades. 3.2. Triángulos semejantes. 3.3. Descomposición de una semejanza. 3.4. Semejanzas directas e inversas. 3.5. Obtención del centro de semejanza directa. 4. Teorema de Thales. 5. Razones trigonométricas. 5.1. Definición y relaciones. 5.2. Resolución de triángulos. Bibliografía Recomendada.
1/19
TEMA 37 LA SEMEJANZA EN EL PLANO. CONSECUENCIAS. TEOREMA DE THALES. RAZONES TRIGONOMÉTRICAS. 1.- INTRODUCCION. La fundamentación de la geometría no se consiguió hasta el año 1899, en el que Hilbert publicó un libro llamado Grundlagen der Geometrie (Fundamentos de Geometría). Los elementos de Euclides tenían ya una estructura deductiva muy perfecta, pero en ellos se utilizaban a menudo implícitamente axiomas no formulados, definiciones sin sentido e incluso razonamientos lógicamente incorrectos. Hilbert era perfectamente consciente de que no todos los términos que se usan en una teoría matemática se pueden definir y por lo tanto, comenzó su tratamiento de la geometría considerando de entrada tres tipos de objetos indefinidos: puntos, rectas y planos, y sus relaciones indefinidas: estar sobre, estar en, estar entre, se congruente, ser paralelo y ser continuo. En lugar de los cinco axiomas (o nociones comunes) y los cinco postulados de Euclides, Hilbert formula para su geometría un conjunto de 21 axiomas, que se conocen desde entonces como los “Axiomas de Hilbert” para la geometría euclídea. Los 21 axiomas se dividen en cinco grupos, que son: 1) 2) 3) 4) 5)
Grupo I: 8 axiomas sobre Incidencia Grupo II: 4 axiomas sobre Ordenación. Grupo III: 5 axiomas sobre Congruencia o Movimiento. Grupo IV: 1 axioma sobre Paralelismo. Grupo V: 3 axiomas sobre Continuidad.
En este tema nos interesan los axiomas de congruencia o movimiento. Esos cinco axiomas son: Axioma 1: Los movimientos del plano son aplicaciones biyectivas del plano. OBS. Por esta biyección, a cada punto le corresponde un punto homólogo en la transformación. Axioma 2: Todo movimiento conserva las relaciones de incidencia y ordenación. OBS. Si varios puntos están en una recta y ordenados, también lo están sus homólogos. Axioma 3: Ningún movimiento puede transformar un segmento (o ángulo) en una parte del mismo. OBS. Si C es un punto entre A y B, ningún movimiento puede transformar AB en BC y, análogamente, si la recta r es interior al ángulo ab, ningún movimiento puede transformar al ángulo ab en bc. Axioma 4: Los movimientos forman un grupo.
2/19
OBS. Es decir, la composición de dos movimientos es un movimiento y la transformación inversa de un movimiento es otro movimiento. Axioma 5: Existe un único movimiento que transforma una semirrecta en otra, y cualquier semiplano limitado por la primera semirrecta es un semiplano limitado por la segunda. DEF Llamaremos movimiento directo del plano a todo movimiento que conserva el sentido del plano orientado. En caso contrario, el movimiento se dice que es inverso. OBS. Los movimientos directos forman un subgrupo de los movimientos del plano. 2.- HOMOTECIAS. DEF. Sea en el plano un punto fijo O y un nº real k≠ 0. Llamaremos Homotecia de centro O y razón k a toda transformación del plano en si mismo que verifica: 1) Un punto A y su imagen A’ están alineadas con O. __
2)
OA' __
=k
OA PROP. Las rectas que pasan por el centro de la homotecia (el punto O) se transforman en si mismas. Dem. Se obtiene la demostración teniendo en cuenta la condición 1) de la definición. PROP. La imagen de una recta que no pasa por el centro de homotecia es otra recta paralela a la primera. Dem. Sean A y B dos puntos y A’ y B’ sus imágenes en una homotecia de centro O y razón k. Queremos ver que la recta r definida por A y B y la recta r’ definida por A’ y B’ son paralelas.
A
A'
__
__
OA'
OB '
__
=k
y
OA __
B
OA'
B'
__
OA
__
=k
⇒
OB __
=
OB ' __
⇒
AB // A’B’
OB
PROP. La homotecia transforma puntos alineados en puntos alineados y puntos no alineados en puntos no alineados. Dem.
3/19
Sean A, B y C tres puntos y A’, B’, y C’ sus imágenes por una homotecia de centro O y razón k. 1) Si A, B y C están alineados.
A'
A C
Se verifica: k=
C'
__
__
OA'
OB '
__
=
OA
__
⇒ AB || A’B’
OB
Por proporcionalidad:
B
B'
__
__
__
OA'
OB '
A' B'
__
OA
=
__
=
__
OB
=k
AB
y se obtiene que __
__
__
A' B' = k AB
__
__
OB' = k OB
__
OA' = k OA
Como A, B y C están alineados, uno de los tres puntos será interior al segmento __
determinado por los otros dos. Supongamos que B es interior a AC . Entonces: __
__
__
AC = AB + BC Si multiplicamos la ecuación por k __
__
__
__
__
__
k AC = k AB + k BC ⇒ A'C ' = A' B' + B'C ' Luego A’, B’ y C’ están alineados 2) Si A, B y C no están alineados A'
se verifica que:
A
__ C
__
__
AC < AB + BC y multiplicando por k
C'
__
__
__
k AC < k AB + k BC ⇒
B
__
__
__
⇒ A'C ' < A' B' + B'C '
B'
y por tanto A’, B’ y C’ no están alineados. PROP. Las homotecias transforman segmentos en segmentos. Dem. Es una consecuencia de la proposición anterior.
4/19
PROP. El producto de dos homotecias de centro O es una homotecia del mismo centro. Dem. Sea O el centro de ambas homotecias, siendo A’ imagen de A respecto de la primera homotecia y A” imagen d A’ respecto de la segunda tenemos: Tenemos:
O, A y A’ están alineados y O, A’ y A” están alineados ⇒ O, A y A” están alineados. __
Sea k1 la razón de la primera homotecia ⇒
OA ' __
= k1
OA __
Sea k2 la razón de la segunda homotecia ⇒
OA" __
= k2
OA' Y multiplicando ambas expresiones: __
__
OA ' OA" · __ = k1 k2 __ OA OA'
⇒
OA' ' = k1 k 2 OA
Entonces k1 ·k2 es la razón de la homotecia producto. PROP. La inversa de una homotecia de centro O y razón k es una homotecia del mismo 1 centro y razón . k Dem. Si A’ es la imagen de A por la homotecia de razón k, entonces __
OA' __
=k
OA y por tanto __
OA __
OA '
=
1 k
La consecuencia de estas dos últimas proposiciones es que el conjunto de las homotecias de centro O es un grupo conmutativo, denotándose por (HO, o) 3. LA SEMEJANZA EN EL PLANO. 3.1. Definición y propiedades. DEF. Llamamos semejanza en el plano a toda correspondencia biunívoca tal que si A’ y B’ son las imágenes de dos puntos cualquiera A y B se verifica que:
5/19
__
A' B' __
=k
AB siendo k un segmento absoluto dado, llamado razón de semejanza. Al igual que las homotecias, las semejanzas verifican propiedades similares. PROP. Las semejanzas verifican las siguientes propiedades: 1) Transforman puntos alineados en puntos alineados y puntos no alineados en puntos alineados 2) Transforman segmentos en segmentos. 3) Transforman ángulos en ángulos iguales (conservan los ángulos) 4) Transforman triángulos semejantes. Dem. Trivial. A la vista de lo anterior, también podríamos haber definido una semejanza en el plano como sigue: Si realizamos el producto de una homotecia por un movimiento, o lo que es lo mismo, movemos una de las dos figuras homotéticas, como el movimiento conserva la alineación, el orden y el sentido (en movimientos directos) y transforma segmentos y ángulos en otros iguales, la transformación resultante verifica: 1) A puntos alineados le corresponden puntos alineados y en el mismo orden. 2) Los segmentos homólogos son proporcionales. 3) Los ángulos homólogos son iguales. La transformación anterior recibe el nombre de semejanza en el plano. Dos figuras entre cuyos puntos se pueda establecer una correspondencia biunívoca que cumpla las tres condiciones anteriores diremos que son semejantes. PROP. El producto de dos semejanzas es otra semejanza. Dem. Sean f y g dos semejanzas y A un punto del plano. ∃ A’ del plano tal que f(A) = A’ ∃ A” del plano tal que g(A’) = A” por tanto, A” es la imagen de A por f o g Si existiese otro punto B tal que ( g o f )(B) = A” entonces
6/19
f(A) = A’ y f(B) = B’ ⇒ g(A’) = A” y g(B’) = A” luego A’= B’ ⇒ A = B Por tanto, para razones k1 y k2 de f y g respectivamente se verifica: __
__
A' B' __
A" B"
= k1 y
__
AB
= k2
A' B'
y multiplicando miembro a miembro __
__
__
A' B' A" B" A" B" · __ =k1 k2 ⇒ __ = k1 k2 __ AB A' B' AB Luego la razón de la semejanza producto es igual al producto de las razones de las semejanzas. PROP Se Verifica: 1) El producto de las semejanzas es asociativo 2) El elemento neutro, o semejanza unidad, es aquella en la que todos los puntos son dobles. (la identidad) 3) Toda semejanza admite una inversa. Dem. 1) y 2) son inmediatas 3) esta propiedad la justificaremos más adelante, cuando demostremos que toda semejanza en el plano se puede escribir como producto de un movimiento por una homotecia. 3.2. Triángulos Semejantes. DEF. Dados dos triángulos ABC y A’B’C’, diremos que son semejantes si: 1) Existe una biyección entre sus lados 2) Las razones de los lados homólogos son iguales. Llamaremos razón de semejanza de los dos triángulos al nº k que verifica: __
__
__
AB
BC
AC
__
A' B'
=
__
B 'C'
=
__
=k
A' C '
TEOREMA Existe una única semejanza que transforma un triángulo en otro semejante a él. Dem. Sean ABC y A’B’C’ dos triángulos semejantes.
7/19
· Existencia ___
La traslación de vector AA' transforma el triángulo ABC en el triángulo A’B1 C1 . El giro de centro A’ y ángulo orientado ∠B1 A’B2 con semirrecta origen A’B1 , y semirrecta extremo A’B’ transforma el punto B1 en B2 y C1 en C2 . Por tanto el giro transforma el triángulo A’B1 C1 en el triángulo A’B2 C2 . Si componemos ambas aplicaciones, la imagen del triángulo ABC es A’B2 C2 . Ahora pueden suceder dos casos: Caso 1. La semirrecta A’C 2 coincida con A’C’ Caso 2. Las semirrectas A’C 2 y A’C’ son simétricas respecto de la A’B’ En este segundo caso, hemos de aplicar una simetría axial de eje A’B’, transformando el triángulo A’B2 C2 en A’B2 C3 . En el caso 1 los ángulos ∠ A’B’C’ y ∠ A’B2 C2 son iguales. En el caso 2 los ángulos ∠ A’B’C’ y ∠ A’B2 C3 son iguales. Entonces obtenemos las proporcionalidades Caso 1.
__
__
A' B2
A' C 2
__
=
A' B' Caso 2.
__
A' C '
__
__
A' B2
A' C 3
__
A' B'
=k
=
__
=k
A' C '
Y por lo tanto, en ambos casos, existe una homotecia de centro A’ y razón k que transforma el triángulo Caso 1. Caso 2.
A’ B2 C2 → A’B’C’ A’ B2 C3 → A’B’C’
Como los movimientos utilizados, (traslaciones, giros y simetrías axiales) y las homotecias son semejanzas, la transformación del triángulo ABC en el triángulo A’B’C’ es una semejanza. · Unicidad. Realicemos la demostración por reducción al absurdo. Suponga mos que f y g son dos semejanzas que transforman el triángulo ABC en el A’B’C’. Dado un punto cualquiera P del plano, hemos de demostrar que si f(P) = P’ y g(P) = P” entonces P’= P” Si consideramos la recta BP, cortará a la recta AC en un punto Q. Sean f(Q) = Q’ y g(Q) = Q” se verifica que
8/19
__
__
QB
Q ' B'
=
__
QC
__
Q' C '
ya que la semejanza conserva la relación entre tres puntos. De forma análoga: __
__
QB
Q" B'
=
__
QC
__
Q"C '
y por lo tanto __
__
Q ' B'
Q" B'
__
=
__
Q' C '
Q"C '
de lo que deducimos que Q’ = Q” De forma similar __
__`
__
__`
PA
P' A'
PA
P" A'
__
=
PQ
__
y
P' Q '
__
PQ
=
__
P" Q '
entonces __`
__`
P' A'
P" A'
__
P' Q '
=
__
P" Q '
y deducimos que P’ = P” siendo la semejanza única. 3.3. Descomposición de una semejanza. TEOREMA Toda semejanza en el plano es el producto de un movimiento por una homotecia. Dem. Dada una semejanza del plano, sabemos que queda determinada por tres puntos. Esos tres puntos determinan un triángulo. La semejanza que transforma un triángulo en otro, por el teorema anterior existe y es única y se descompone como producto de un movimiento por una homotecia. Luego toda semejanza se puede descomponer como hemos indicado. 3.4. Semejanzas directas e inversas. DEF. Diremos que una semejanza es directa cuando al descomponerse en un movimiento por una homotecia, el movimiento es inverso.
9/19
TEOREMA Sea S una semejanza que transforma el triángulo ABC en A’B’C’. S es una semejanza directa si y solo si los triángulos tienen la misma orientación. Dem. “⇒” Por ser la semejanza directa, se descompone como producto de una homotecia por un movimiento directo. Sea S = H o M d ⇒ S ( ABC ) = ( H o M d )( ABC ) = H ( M d ( ABC ) = H ( A1 B1 C1 ) = A' B' C ' Por ser el Movimiento directo A1 B1 C1 tiene la misma orientación que ABC y como las homotecias también la conservan, tenemos que A1 B1 C1 tiene la misma orientación que A’B’C’. Luego ABC y A’B’C’ tienen la misma orientación. “⇐” Si ABC y A’B’C’ tienen la misma orientación, para transformar el primero en el segundo necesitamos realizar una traslación de vector AA' y un giro, pero no es necesario hacer una simetría axial, y luego una homotecia. Por tanto, la composic ión de la traslación y el giro nos da un movimiento directo. 3.5. Obtención del centro de Semejanza Directa. Sea S una semejanza que transforma el segmento AB en A' B' . Se pueden dar dos situaciones: Caso 1: Los segmentos AB y A' B' están situados en rectas paralelas. El punto O, centro de homotecia, se obtiene como intersección de las rectas que pasan, una por A y A’ y la otra por B y B’.
Si tomamos un punto C no alineado con A y B obtenemos un triángulo ABC con imagen, A’B’C’, siendo C’ la imagen de C por la homotecia. La transformación del triángulo ABC en el A’B’C’ nos determina una semejanza de centro O.
10/19
Caso 2: Los segmentos AB y A' B' están situados en rectas no paralelas. Podemos hallar un giro y una homotecia con el mismo centro O, cuyo producto sea la semejanza S definida por AB y A' B' . Dicho centro O será el centro de semejanza directa. Supongamos que el punto O existe y tratemos de determinarlo. Al ser S una semejanza directa se verifica ∠OBA = ∠OB ' A' Si P es el punto de intersección de la recta AB con A’B’, y a continuación dibujamos las circunferencias que pasan por PAA’ y por PBB’ respectivamente, ambas circunferencias ser cortaran, además de en el punto P en otro punto , que será O. Los triángulos OAB y OA’B’ son semejantes, pues ∠OBP = ∠OB ' P ya que ambos son ángulos inscritos de la misma circunferencia, y subtender el arco OP en la circunferencia C2 , y lo mismo para ∠OAP = ∠ OA' P .
B P
B'
Al tener dos ángulos iguales, los triángulos son semejantes y O es el centro de la semejanza.
A
A'
11/19
4. TEOREMA DE THALES. TEOREMA Los segmentos limitados por los puntos de intersección de varias paralelas en dos rectas son proporcionales. Dem. Sean r y s las dos rectas que son cortadas por varias paralelas. Las tres posibilidades que nos podemos encontrar son:
El teorema quedará demostrado si comprobamos que existe correspondencia en la igualdad, el orden y en la suma de dichos segmentos. a) Correspondencia en la Igualdad. Veamos que: AB = CD en r ⇒ A' B' = C' D' en s. Caso 1: trivial, por ser r y s paralelas. Caso 2 y caso 3: Al ser r y s no paralelas, realizamos la traslación del trapecio ABA’B (o triángulo en el caso de que A=A’) de forma que AB coincida con CD . Entonces A' B' se transforma en A' ' B' ' siendo entonces A' B' = A' ' B' ' por traslación A' ' B ' ' = C' D' por segmentos paralelos situados en rectas paralelas, luego A' B' = C ' D' . b) Correspondencia en el Orden. Sea M un punto interior del segmento AB . La paralela que pasa por M está limitada por las paralelas AA' y BB ' luego M’ es interior a A' B' . c) Correspondencia en la Suma. Si AB = AM + MB , aplicando b) A' B' = A' M ' + M ' B' . Luego la correspondencia establecida es una proporcionalidad.
12/19
5. RAZONES TRIGONOMÉTRICAS. 5.1. Definición y Relaciones. Dado un triángulo rectángulo ABC podemos afirmar que las razones entre sus lados se conservan por una semejanza. Eso es debido a que si A’B’C’ es un triángulo rectángulo homólogo al anterior sabemos que es cierto que AB BC AC = = A' B ' B ' C' A' C ' y los ángulos son iguales, por tanto, es lógico afirmar que AB A' B = ,... BC B' C ' Así pues, podemos definir las relaciones trigonométricas independientemente del triángulo rectángulo considerado. DEF Dado un triángulo rectángulo ABC, con ∠A = 90° llamaremos razones trigonométricas del ángulo agudo x a: B x 1) 2) 3) 4)
C AB Seno: sen x = BC AC Coseno: cos x = BC AB Tangente: tan x = AC AC Cotangente: cot x = AB
A BC AB BC 6) Cosecante: csc x = AB 5) Secante: sec x =
Aunque hemos definido seis razones trigonométricas en función de los lados de un triángulo rectángulo, vamos a ver a continuación que algunas de ellas dependen de las otras, y que existen relaciones entre ellas. TEOREMA Teorema de Pitágoras Dado un triángulo rectángulo, se verifica h 2 = c1 2 + c2 2 siendo h la hipotenusa y c1 y c2 los dos catetos.
13/19
Dem. Sea ABC los vértices del triángulo rectángulo, con ∠A = 90° si trazamos la perpendicular al lado BC que pasa por el punto A, obtenemos el punto M y los dos nuevos triángulos MAB y MCA son rectángulos.
Los triángulos MAB y ABC son semejantes, entonces c a = ⇒ c 2 = a·c' c' c De igual forma MCA y ABC también son semejantes b a = ⇒ b 2 = a·b' b' b Sumando ambas relaciones b 2 + c 2 = ac '+ ab' ⇒ b 2 + c 2 = a (c '+b ' ) ⇒ b2 + c 2 = a 2 cqd El teorema de Pitágoras nos permite obtener una relación entre algunas de las razones trigonométricas. Aplicando dicho teorema al triángulo ABC anterior 2
2
AB AC + =1 AB + AC = BC ⇒ BC BC 2
2
2
y entonces sen 2 x + cos 2 x = 1 siendo x el ángulo ∠C . A partir del resto de las razones trigonométricas, deducimos que
14/19
AB AB BC sin x sin x = = ⇒ tan x = tan x = cos x AC AC cos x BC y de forma análoga obtendríamos 1 cos x cot x = = tan x sin x 1 csc x = sin x 1 sec x = cos x 5.2. Resolución de Triángulos. Entendemos por resolver un triángulo el obtener el valor de los tres lados y los tres ángulos, partiendo de algunos datos conocidos. Comenzaremos resolviendo triángulos rectángulos. Nos encontramos con cuatro casos, en función de los datos de partida. Consideraremos que el ángulo recto es A. Caso 1: Los datos de partida son la hipotenusa a y un ángulo agudo B. a B Sabemos que, como A = 90º ⇒ B + C = 90º luego C = 90º - B. También sabemos que sin B =
b ⇒ b = a sin B y por el teorema de Pitágoras a
c = a 2 + b2 . Caso 2: Los datos de partida son un ángulo B agudo y un cateto b. b B sin B =
b b ⇒a= a sin B
C = 90º - B
c = a2 −b2
Caso 3: Los datos iniciales son la hipotenusa a y un cateto b. a B
15/19
sen B =
b ⇒ Podemos determinar B. a
A partir de B obtenemos C = 90º - B c = a2 −b2 Caso 4: Los datos iniciales son los dos catetos b y c. b c Para determinar el ángulo B, lo hacemos a partir de la expresión b tan B = c C = 90º − B a = b2 + c 2 Para poder resolver cualquier triángulo, no sólo los rectángulos, necesitamos previamente generalizar las razones trigonométricas para ángulos mayores de 90º, que reciben el nombre de ángulos obtusos. Partiendo de un sistema ortonormal de ejes y de un punto P(x,y) cualquiera del segundo cuadrante, tracemos la semirrecta que parte del origen de coordenadas y pasa por el punto P. El semieje positivo OX y la semirrecta OP nos determinan un ángulo obtuso. P(x,y) á
Sea r la longitud del segmento OP. Podemos definir las razones trigonométricas como: y r y tan α = x
sin α =
x r x cot α = y cos α =
Las definiciones que hemos dado son independientes del punto p considerado y, en el caso de estar P en el primer cuadrante, coinciden con las que ya teníamos.
16/19
Las relaciones entre las razones trigonométricas se siguen verificando, ya que P pertenece a una circunferencia de radio r, siendo entonces x 2 + y2 = r 2 ( r cos α) 2 + ( r sin α) 2 = r 2 sin 2 α + cos 2 α = 1 y a partir de aquí tendríamos el resto. Una vez realizada la generalización de las razones trigonométricas para un ángulo obtuso, veamos dos teoremas que nos van a permitir generalizar a un triángulo cualquiera la resolución. TEOREMA Teorema de Los Senos Dado un triángulo ABC cualquiera se verifica
a b c = = sin A sin B sin C
Dem Dado un triángulo ABC, trazamos la altura relativa al vértice A, ha. Entonces sen B =
ha h y sen C = a c b
Las dos igualdades anteriores no dependen del triángulo elegido. Si la altura que pasa por A no está entre B y C, basta por aplicar lo visto para ángulos obtusos para comprobarlo. Si repetimos el proceso para el punto B, llamando hb a su altura obtenemos h h sen A = b y sen C = b c a Entonces ha = c sen B = b sen C a b c = = ⇒ hb = c sen A = a sen C sen A sen B sen C TEOREMA Teorema del coseno Dado un triángulo ABC cualquiera se verifica
a 2 = b 2 + c 2 − 2bc cos A
Dem. Si A = 90º tenemos un triángulo rectángulo, y podemos aplicar el teorema de Pitágoras. Y como cos90º = 0, la tesis se verifica.
17/19
Si A
90º nos encontramos con dos situaciones, A<90º o A>90º B
A
Si trazamos la altura por el punto B tenemos a 2 = hb 2 + a ' 2 ⇔ A < 90º C
a 2 = hb 2 + (b + c' ) 2 ⇔ A > 90 º
B
A
C
Del primer caso a 2 = hb 2 + ( b − c ' ) 2 = hb 2 + b 2 + c '2 −2bc' = c 2 + b 2 − 2bc ' c' y como cos A = ⇒ c ' = c cos A c 2 sustituyendo a = b 2 + c 2 − 2bc cos A Del segundo caso a 2 = hb 2 + ( b + c' ) 2 = hb 2 + b 2 + c' 2 +2bc' = c 2 + b 2 + 2bc ' − c' cos A = ⇒ c' = −c cos A c luego a 2 = b 2 + c 2 − 2bc cos A Ahora ya estamos en condiciones de resolver cualquier triángulo. De nuevo, nos encontramos con cuatro casos, en función de los datos iniciales. Caso 1: Los datos de partida son los ángulos A y B y un lado a. Entonces C = 180º - (A+B) sin A b=a sin B sin C c=a sin A Caso 2: Los datos de partida son los lados a y b y el ángulo opuesto a uno de ellos, por ejemplo A. Del teorema de los senos a b = sin A sin B 18/19
obtenemos b sin A a y de esta expresión podemos calcular B. sin B =
A partir de aquí C = 180º - (A+B) y C =
a sin C sin A
Aclaremos que para que el triángulo exista es necesario que
b sin A ≤1 a
Caso 3: Los datos iniciales son los lados b y c y el ángulo que determinan, A. a 2 = b 2 + c 2 − 2bc cos A b sin A sin B = ⇒ Obtenemos → B a c sin A sin C = a ⇒ Obtenemos → C Caso 4: Los datos iniciales son los tres lados a, b y c Por el teorema del coseno b 2 + c2 − a 2 ⇒ Obtenemos → A 2bc b sin A sin B = ⇒ Obtenemos → B a c sin A sin C = ⇒ Obtenemos → C a cos A =
BIBLIOGRAFÍA RECOMENDADA Curso de Geometría Simétrica. Aut.: Puig. Adam. Cualquier texto de Cou o 2º de Bachillerato para la parte de Razones Trigonométricas.
19/19
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 38 TRIGONOMETRÍA PLANA. RESOLUCIÓN DE TRIÁNGULOS 1. .Conceptos sobre trigonometría. 1.1. Definición. 1.2. Razones de ángulos complementarios. 1.3. Otra definición de razón trigonométrica. 1.4. Razones de ángulos obtusos. 1.5. Angulos suplementarios 1.6. Ángulos que difieren en 90º. 1.7. Ángulos opuestos. 1.8. Razones trigonométricas de ángulos fundamentales. 2. Resolución de triángulos. 2.1. Resolución de triángulos rectángulos. 2.1.1. Conocido un lado y un ángulo del rectángulo. 2.1.2. Conocidos dos lados. 2.2. Resolución de triángulos oblicuángulos. 2.2.1. Expresión trigonométrica de la altura. 2.2.2. Teorema de los senos. 2.2.3. Teorema del coseno. 2.2.4. Resolución por teorema del seno 2.3. Radio de la circunferencia circunscrita. 2.4. Resolución de triángulos con el teorema del coseno. 2.4.1. Conocidos dos lados a y b y el ángulo C. 2.4.2. Conocidos los tres lados. 3. Teorema de las tangentes. Fórmulas de Briggs. 3.1. Analogías de Mollweide y de Neper. 3.2. Teorema de las tangentes. 3.3. Resolución de triángulos. 3.4. Fórmulas de Briggs. 4. Área de un triángulo. 5. Fórmulas de adición. 5.1. Coseno de la suma y diferencia. 5.2. Seno de la suma y diferencia. 5.3. Tangente de la suma y diferencia. 5.4. Fórmulas del ángulo doble. 5.5. Fórmulas del ángulo mitad. 5.6. Transformaciones en productos de sumas y diferencias. 5.7. Expresiones trigonométricas en función de la tangente del ángulo mitad. 6. Aplicaciones. 6.1. Aplicaciones a la topografía. 6.2. Determinación de la altura de un punto de pie accesible. 6.3. Resolución de planos inclinados en física. 6.4. Resolución de problemas en estática y en dinámica.
1/20
TEMA 38 TRIGONOMETRÍA PLANA. RESOLUCIÓN DE TRIÁNGULOS 1. CONCEPTOS SOBRE TRIGONOMETRÍA. 1.1. Definición Dados dos triángulos rectángulos PQR y P’QR’, se dice que son semejantes si tienen un mismo ángulo α en el vértice Q R'
Por ser semejantes se cumple que las relaciones que hay entre dos lados cualesquiera de uno de los triángulos son las mismas que las que hay entre los lados equivalentes del otro triángulo. Tales relaciones dependen del ángulo α, y si éste varía, también varían las relaciones que se establecen. Las relaciones los podemos definir de la siguiente forma: sen α =
RP R' P' = RQ R' Q
cosecα =
1 RQ = senα RP
R
Q
α
P
cos α =
PQ P' Q = RQ R' Q
tg α =
secα =
1 RQ = cosα PQ
cotg α =
P'
RP R' P' = PQ P' Q 1 PQ = tg α RP
Una vez definidas estas relaciones trigonométricas básicas podemos intentar establecer, a su vez, otras relaciones entre ellas. Utilizando el teorema de Pitágoras tenemos que: 2
2
RP + PQ = RQ 2
2
2
y dividiendo toda la ecuación por RQ resulta 2
RP PQ RQ + RQ = 1
⇒
sen 2 α + cos 2 α = 1
Por otro lado: RP sen α RP RQ sen α tg α = tg α = = = ⇒ cos α PQ PQ cos α RQ Por último, utilizando la ecuación sen 2 α + cos 2 α = 1 y dividiéndola por cos2 α, obtenemos: 2/20
sen 2 α cos 2 α 1 `+ = 2 2 cos α cos α cos 2 α
tg 2 α + 1 = sec 2 α
⇒
1.2. Razones de ángulos complementarios. Si tomamos un triángulo rectángulo igual que el anterior y le calculamos las razones trigonométricas al otro ángulo distinto del ángulo α y distinto del ángulo recto (o sea, del ángulo en R), podemos relacionarlas con las de α, Además, como el otro ángulo es de 90−α grados, lo llamaremos ángulo complementario al α, porque la suma de ambos da 90º. sen (90 − α) =
PQ = cos α QR
tg (90 − α) =
cos (90 − α) =
R
RP = sen α QR
90-α
PQ cos α = = cotg α RP sen α
α
Q
P
1.3. Otra definición de razón trigonométrica. Si trazamos una circunferencia de radio r y sobre ella tomamos un punto P y creamos con ese punto, con el centro de la circunferencia y con el punto del eje OX que es caída perpendicular de P sobre el eje (punto A) un triángulo, se cumple que: sen α =
AP r
P
AC cos α = r tg α =
r
AP AC
α C
A
Definición Definiendo un triángulo de la misma forma que antes, pero sobre una circunferencia de radio unidad r=1, se tiene que se define el seno de α como la longitud del cateto vertival de dicho triángulo y el coseno de α como la longitud del cateto horizontal de dicho triángulo. 1.4. Razones de ángulos obtusos. Si creamos triángulos igual que antes pero tomando puntos de la circunferencia que no están en el primer cuadrante, las razones del ángulo que forma la hipotenusa con respecto a la parte positiva del eje OX, vienen dadas por:
3/20
r
y
α
x
sen α =
y r
cos α =
x r
tg α =
2
x 2 + y2 = r 2
Pero como (x,y) está en el 2º cuadrante, se tiene que, por definición, el seno es positivo, el coseno es negativo y la tangente es negativa.
y x
Análogamente podemos comprobar que: 2
x + y =1 r r
⇒
⇒
sen 2 α + cos 2 α = 1
A todos los ángulos α definidos de esta forma, es decir, que son superiores a 90º , se les llama obtusos 1.5. Ángulos suplementarios. Definición. Dados dos ángulos x e y, se dice que x e y son suplementarios si su suma es 180º, o sea x+y=180º. Bajo estas condiciones tenemos: sen y = sen (180 − x ) = sen x y
x
cos y = cos(180 − x ) = − cos x tg y = tg (180 − x ) = − tg x
1.6. Ángulos que difieren en 90º. Definición. Dados dos ángulos x e y se dice que son ángulos que difieren 90º si verifican que y=90+x: sen y = sen(90 + x ) = cos x y x
cos y = cos(90 + x ) = − sen x tg y = tg (90 + x ) = −cotg x
4/20
1.7. Ángulos opuestos Definición. Dados dos ángulos x e y se dice que son ángulos opuestos si se verifican que y=−x : sen y = sen(− x ) = − sen x cos y = cos(− x ) = cos x
x y
tg y = tg (− x ) = − tg x
1.8. Razones trigonométricas de ángulos fundamentales. • cos 0º = 1 ; sen 0º = 0 ; tg 0º = 0 • Tomando un triángulo equilátero, tenemos que
2
l h + = l 2 ⇒ 2 2
Como
30 l
l h
h2 = l2 −
60
l 2 3l 2 = 4 4
h=
⇒
entonces: l/2
l
l 2 1 = l 2
sen 30 o =
3l 2 3 = l 2
cos 30 0 =
sen 30 o =
cos 30 0 =
h = l
sen 30 o 12 1 tg 30 = = = 0 cos 30 3 2 3
tg 30 0 =
0
1 2 3 2 1 3
Como sen 60 o = sen (90 − 30 ) = cos 30 = cos 60 0 = cos(90 − 30 ) = sen 30 =
5/20
3 2 1 2
sen 60 o =
cos 60 0 =
3 2 1 2
3 l 2
tg 60 0 =
sen 60 o 3 2 = = 3 0 cos 60 12
tg 60 0 = 3
• Tomando ahora un cuadrado de lado l resulta: d 2 = l 2 + l 2 = 2l 2
45
d
l
45
d = 2l
⇒
sen 45 o =
l l 1 2 = = = d 2 2l 2
⇒ sen 45 o =
2 2
cos 45o =
l l 1 2 = = = d 2 2l 2
⇒ sen 45 o =
2 2
l tg 450 =
sen 45 = cos 45
2 2 2 2
=1
tg 450 = 1
⇒
2. RESOLUCIÓN DE TRIÁNGULOS. 2.1. Resolución de triángulos rectángulos. 2.1.1. Conocido un lado y un ángulo del rectángulo. a) Si conocemos la hipotenusa a y un ángulo agudo, por ejemplos B tenemos que: C
a
B
C=90º − B
pues A=90º
sen B =
b a
⇒
b = a sen B
cos B =
c a
⇒
c = a cos B
b
A
c
resultando entonces:
b) Si conocemos un cateto, el b, y un ángulo agudo, el B, por ejemplo, tendremos: C= 90º − B y A=90º luego sen B =
b a
⇒ a=
b sen B
y
tg B =
b c
⇒
c=
b tg B
2.1.2. Conocidos dos lados. a) Conocida la hipotenusa a y un cateto b por ejemplo, tendremos: sen B =
b a
⇒ B = arc sen
b a
y como C= 90º − B. pues A=90º y C = a 2 − b 2
6/20
b) Conocidos los dos catetos b y c, tenemos que: A = b2 + c 2 tg B =
b c
y como A=90º
⇒ B = arc tg
b c
tenemos que:
y
C = 90º − B
2.2. Resolución de triángulos oblicuángulos. 2.2.1. Expresión trigonométrica de la altura h. Dados los triángulos C
En este caso tenemos que: a
h
sen B =
b c H
h a
⇒
h = a sen B
B
A C
En este caso tenemos que: b h
a
sen A = A
c H
h b
⇒
h = b sen A
B
2.2.2. Teorema de los senos. Utilizando las expresiones que hemos obtenido, tenemos que, como h = a sen B y h = b sen A resultará igualando ambas: a sen B = b sen A
⇒
sen A sen B = a b
y haciendo lo mismo con la altura que parte del vértice A, obtendríamos que esta igualdad se puede ampliar a: sen A sen B sen C = = a b c
⇒
que es el llamado Teorema de los senos.
7/20
a b c = = sen A sen B sen C
2.2.3. Teorema del coseno. Si tomamos el teorema de Pitágoras generalizado, tenemos que: con signo menos si A < 90 o a 2 = b 2 + c 2 ± 2bn con signo más si A > 90 o tomaremo s n = 0 si A = 90 o B
B c
c
n b
a
h
a
h A
siendo
n
C
H
b
H
A
C
Si tomamos la proyección n, de AB sobre la recta AC, tenemos: cos A =
n (1ª figura) o c
Si n = c cos A pero si n = −c cos A
cos A = − cos(180 − A) = −
⇒
a 2 = b 2 + c 2 − 2bc cos A
⇒
a 2 = b 2 + c 2 + 2b (−c cos A) = b 2 + c 2 − 2bc cos A a 2 = b 2 + c 2 − 2bc cos A
resultando en ambos casos: y análogamente:
n (2ª figura) c
b 2 = a 2 + c 2 − 2 ac cos B
c 2 = a 2 + b 2 − 2ab cos C
y
2.2.4. Resolución por teorema del seno. a) Conocidos dos ángulos A y B y el lado a, tenemos que: resulta:
a c = sen A sen C
⇒
c=a
sen C sen A
y
a b = sen A sen B
⇒
b=a
sen B sen A
C=180-A-B
b) Conocidos los lados a y b y el ángulo A opuesto a a: haciendo:
a b = sen A sen B
⇒
sen B =
b sen A a
Ante esta situación tenemos dos posibilidades: 8/20
⇒
b B = arc sen sen A a
• 0 < B ≤ 90 o • 90 o < B < 180 o b sen A ≤1 a
Pero siempre debe ocurrir que
o sea
b sen A ≤ a
B = 90 o
1) Si
b sen A = a
⇒
sen B = 1
⇒
2) Si
b sen A < a
⇒
sen B < 1
entonces:
i) Si A < 90 o puede haber dos soluciones o una, dependiendo de que a < b o no. ii) Si A > 90 o sólo hay una solución. Utilizando lo anterior tenemos que:
C = 180º − A − B.
2.3. Radio de la circunferencia circunscrita. El ángulo D y el ángulo A de los triá ngulos DCB y ACB respectivamente, son iguales por tener el mismo arco, pero por otra parte, el ángulo M en el punto C es un ángulo recto por ser DB el diámetro de la circunferencia. Entonces tenemos que: a 2r = sen D sen 90 luego:
⇒
sen D =
C D b
a 2r
a r
A c
a sen A = 2r 2r =
por tanto:
M
B
a b c = = sen A sen B sen C
2.4. Resolución de triángulos con el teorema del coseno. 2.4.1. Conocidos dos lados a y b y el ángulo C. Como c 2 = a 2 + b 2 − 2ab cos C
tenemos que
c = a 2 + b 2 − 2ab cos C
Utilizando el teorema del seno calcularemos los ángulos A y B. 2.4.2. Conocidos los tres lados. Hacemo s:
cos A =
b 2 + c2 − a 2 2bc
cos B =
a2 + c 2 − b 2 2ac
Obtenemos así los ángulos A, B y C del triángulo. 9/20
cos C =
a2 +b2 −c2 2ab
3. TEOREMA DE LAS TANGENTES. FÓRMULAS DE BRIGGS. 3.1. Analogías de Mollweide y de Neper. Sea un triángulo ABC tal que a>b y llevemos b sobre a y a su vez sobre su prolongación a partir de C. Obtenemos así los puntos N y M y por lo tanto, el triángulo AMN cuyos ángulos queremos calcular.
A c
b A+B
B
a-b N
a
C
b
M
Tenemos que el ángulo ACM es igual a A+B puesto que es exterior al triángulo ABC. También el ángulo ANM es (A+B)/2 y además AMC=C/2. Finalmente ANB=90º+(C/2) por ser exterior al triángulo ANM. Entonces si aplicamos a los triángulos ABM y ABN el teorema de los senos resulta:
a+b c = A − B sen C sen 90o + 2 2
a −b c = A− B C sen sen 90 o + 2 2
⇒
⇒
A− B sen 90 o + cos A − B a+b 2 = 2 = C C c sen sen 2 2
a−b = c
A−B A−B sen 2 2 = C o C cos sen 90 + 2 2 sen
y estas igualdades son las llamadas analogías de Mollweide. 3.2. Teorema de las tangentes. Teorema de las tangentes: La diferencia de los lados es a su suma como la tangente de la semidiferencia de los ángulos opuestos es a la tangente de la semisuma de los mismos ángulos. Demostración. Por las analogías de Mollweide, tenemos que: A−B 2 a −b C A− B C cos sen sen a−b 2 = 2 × 2 = tg A − B × tg C = c = a + b a + b cos A − B cos A − B cos C 2 2 c 2 2 2 C sen 2 sen
10/ 20
C A+B = 90 o − 2 2
y puesto que:
resulta:
A− B tg a−b 2 = a + b tg A + B 2 Nota: a esta igualdad la llamamos analogía de Neper. 3.3. Resolución de triángulos. Conocidos los lados a y b y el ángulo C de un triángulo, tenemos: tg
A − B a −b A + B = tg 2 a+b 2 cotg
C A + B A+B = cotg 90 = tg 2 2 2 tg
A−B 2
de donde obtenemos
C A+B = 90 o − 2 2
con
por lo tanto
entonces
A − B a −b C = cotg 2 a +b 2
que junto con
A+ B C = 90 o − 2 2
resolvemos y calcula-
mos así A y B. Para calcular c hacemos: a+b = c
A− B 2 C sen 2
cos
C 2 c= A−B cos 2 (a + b) sen
⇒
3.4. Fórmulas de Briggs. Si tenemos un triángulo ABC entonces el radio de la circunferencia inscrita en él, tiene por radio: C
p-c
ρ=
p-c
b
a
p-a
p-b
O
donde
r A
p-a
( p − a )( p − b)( p − c ) p
c
p-b
B
entonces: 11/ 20
p=
a +b +c 2
tg
A ρ = = 2 p−a
tg
B ρ = = 2 p−b
tg
C ρ = = 2 p −c
( p − b)( p − c ) p( p − a) ( p − a )( p − c ) Fórmulas de Briggs p ( p − b) ( p − a )( p − b) p( p − c )
4. ÁREA DE UN TRIÁNGULO. Si tomamos la expresión del área de un triángulo, tenemos: S=
1 a.h 2
pero sustituyendo en la expresión h = b.sen C = c. sen B resulta: S=
1 1 1 a.b sen C = a.c sen B = b.c sen A 2 2 2
pero si resulta que conocemos A, B y a, podemos hacer C=180º −(A+B) y por lo tanto tomaremos: sen B b=a sen A que sustituyendo en la expresión anterior tenemos finalmente: S=
1 sen B a.a sen C 2 sen A
⇒
S=
1 2 sen B × sen C a 2 sen A
Si conocemos a, b y A calcularemos los ángulos B y C mediante el teorema del seno y aplicaremos: 1 S = a.b sen C 2 y por último, si conocemos los tres lados a, b y c del triángulo calcularemos el área mediante la fórmula de Herón: S=
p ( p − a)( p − b )( p − c)
5. FÓRMULAS DE ADICIÓN. 5.1. Coseno de la suma y diferencia. Si sobre una circunferencia de radio unidad, construimos dos ángulos que llamaremos α=XOA y β=AOB de manera que α+β=XOB
12/ 20
Se cumple que la proyección perpendicular de B sobre el radio OA es el punto C y la proyección so- Y bre el eje OX es el punto B’, de manera que:
B a
cos(α + β) = OB ' cos β = OC sen β = BC
y
A
E
Por otro lado, el punto C se proyecta sobre el eje OX en el punto D y sobre la recta BB’ en el punto E. Esto implica que el ángulo EBC sea α, por lo tanto:
O
b a
sen α =
EC BC
⇒
EC = BC sen α
cos α =
OD OC
⇒
OD = OC cos α
y como OB’= OD − B’D = OD − EC
C
B'
D
X
resulta
cos(α + β) = OC . cos α − BC . sen α
y sustituyendo las expresiones anteriores:
cos(α + β) = cos α. cos β − sen α. sen β siendo ésta la expresión de la suma de los ángulos. El coseno de la diferencia vendrá expresado por: cos(α − β) = cos (α + ( −β) ) = cos α. cos( − β) − sen α. sen( − β)
resultando:
cos(α − β) = cos α. cos β + sen α. sen β
5.2. Seno de la suma y diferencia. De la misma figura se deduce que sen(α + β) =BB’=BE+EB’ y como resulta que:
siendo:
cos α =
sen β =
BE BC
⇒
BC BC = = BC BO 1 BE = sen β. cos α
también en la figura se deduce que
EB' = CD
13/ 20
BE = BC cos α
y sustituyendo en la anterior:
y como resulta que: siendo:
CD ⇒ OC OC OC cos β = = = OC OB 1 sen α =
CD = OC. sen α sustituyendo en la anterior:
CD = cos β. sen α sen(α + β) = sen α. cos β + cos α. sen β
luego:
Análogamente al caso anterior: sen(α − β) = sen (α + ( −β) ) = sen α. cos( −β) + cos α. sen( −β)
resultando:
sen(α − β) = sen α. cos β − cos α. sen β
5.3. Tangente de la suma y diferencia. Las fórmulas análogas de tangentes de la suma y diferencia de ángulos son: sen α. cos β + cos α. sen β sen( α + β) sen α. cos β + cos α.sen β cos α. cos β tg(α + β) = = = cos(α + β) cos α. cos β − sen α.sen β cos α. cos β − sen α. sen β cos α. cos β resultando:
tg(α + β) =
tg α + tg β 1 − tg α. tg β
sen α. cos β − cos α.sen β sen( α − β) sen α. cos β − cos α. sen β cos α. cos β tg(α − β) = = = cos(α − β) cos α. cos β + sen α. sen β cos α. cos β + sen α.sen β cos α. cos β resultando:
tg(α − β) =
tg α − tg β 1 + tg α. tg β
5.4. Fórmulas del ángulo doble. sen 2α = sen(α + α) = sen α. cos α + cos α. sen α
⇒
sen 2α = 2 sen α. cos α
cos 2α = cos(α + α) = cos α. cos α − sen α. sen α
⇒
cos 2α = cos 2 α − sen 2 α
tg 2α = tg( α + α) =
tg α + tg α 1 − tg α. tg α
⇒
14/ 20
tg 2α =
2 tg α 1 − tg 2 α
5.5. Fórmulas del ángulo mitad. Tomando las expresiones: sen 2 α + cos 2 α = 1
cos 2 α − sen 2 α = cos 2α
sumándolas miembro a miembro tenemos:
2 cos 2 α = 1 + cos 2α por lo tanto, haciendo que α =
cos 2 α =
⇒
1 + cos 2α 2
A se tiene finalmente: 2 cos
A 1 + cos A =± 2 2
pero si las expresiones anteriores: sen 2 α + cos 2 α = 1
cos 2 α − sen 2 α = cos 2α
las restamos miembro a miembro tenemos:
2 sen 2 α = 1 − cos 2α y haciendo que α =
sen 2 α =
⇒
1 − cos 2α 2
A se tiene finalmente: 2 sen
A 1 − cos A =± 2 2
La tangente del ángulo mitad será: 1 − cos A A ± A 2 2 = tg = 2 cos A 1 + cos A ± 2 2 sen
⇒
tg
A 1 − cos A =± 2 1 + cos A
5.6. Transformaciones en productos de sumas y diferencias. Si consideramos las expresiones
sen(α + β) = sen α. cos β + cos α.sen β sen(α − β) = sen α. cos β − cos α. sen β
y sumamos y restamos ambas expresiones, resulta sen(α + β) + sen(α − β) = 2 sen α. cos β sen(α + β) − sen(α − β) = 2 cos α.sen β 15/ 20
α + β = p α − β = q
Haciendo ahora el siguiente cambio:
de donde se deduce:
p+q 2
α=
y
β=
p−q 2
p+q cos 2 p+ q sen p − sen q = 2 cos sen 2 sen p + sen q = 2 sen
2α = p + q 2 β = p − q
⇒
y sustituyendo:
p−q 2 p−q 2
Haciendo lo mismo con el coseno, tenemos: cos(α + β) = cos α. cos β − sen α. sen β sen(α − β) = cos α. cos β + sen α. sen β que nos proporciona, sumando y restando las expresiones: cos(α + β) + cos(α − β) = 2 cos α. cos β cos(α + β) − cos(α − β) = −2 sen α.sen β y haciendo el mismo cambio anterior, tal que: α=
p+q 2
y
β=
p−q 2
y sustituyendo
p+q p−q cos 2 2 p+q p−q cos p − cos q = −2 sen sen 2 2 cos p + cos q = 2 cos
5.7. Expresiones trigonométricas en función de la tangente del ángulo mitad. α α cos 2 2 α α α 2 sen cos cos 2 2 2 = 2 sen α = = ... α α α 2 2 2 2α cos + sen cos + sen 2 2 2 2 α cos 2 2 2 sen
y 16/ 20
α 2 luego sen α = α 1 + tg 2 2 2 tg
α α − sen 2 2 2 α α α cos 2 − sen 2 cos 2 2 2 = 2 cos α = = ... α α α 2 2 2 2 α cos + sen cos + sen 2 2 2 2 α cos 2 2 cos 2
α 2 luego cos α = 2 α 1 + tg 2 1 − tg 2
y α 2 α 1 + tg 2 sen α 2 = ... tg α = = α cos α 1 − tg 2 2 α 1 + tg 2 2 2 tg
α 2 tg α = α 1 − tg 2 2 2 tg
luego
6. APLICACIONES. 6.1. Aplicaciones a la Topografía. Los problemas de trigonometría tienen especial aplicación en todo lo que afecta a mediciones sobre el terreno. La medición de grandes distancias es, en efecto, más penosa que las mediciones de ángulos, por ello vamos a medir indirectamente las distancias resolviendo triángulos. Supongamos que nos interesa conocer la distancia de un punto A que está a un lado del río, con otro punto P que está al otro lado del río. Elegimos otro punto B de modo que la distancia AB sea cómoda de medir y basándonos en A y en B medimos con un teodolito, los ángulos α y β formados entre la recta AB y las visuales trazadas desde P.
Π Θ
Ρ ο
α Α
β
γ Β
Con estos elementos podemos calcular AP y BP resolviendo el triángulo ABP. 6.2. Determinación de la altura de un punto de pie accesible. B
Consiste en medir la altur a de una torre vertical cuyo pié, A, es accesible. Se elige una base AC=b.
h
Si A=A’ el cálculo es inmediato. Si AC no es horizontal, se puede medir el ángulo BCA, el ángulo BCA’ y se tiene que: 17/ 20
b C
β α
A A'
B = 90 o − (α + β)
⇒
h=
b sen β cos(α + β)
6.3. Resolución de planos inclinados en física. Dado un cuerpo de masa m que se desliza sobre un plano inclinado un ángulo α sobre la horizontal, podemos calcular la aceleración que tiene en su deslizamiento hacia abajo a lo largo del plano inclinado.
Ν ΦΡ
α µ γσενα
α µ γχοσα
∑F ∑F
X
Y
= ma
⇒
=0
⇒
mg sen α − FR = ma N = mg cos α
Π=µ γ
α
y considerando que FR = µN se resuelve el sistema de ecuaciones planteado y obtenemos el valor de la aceleración de caída del cuerpo. 6.4. Resolución de problemas en estática y en dinámica Aplicaciones importantes tiene la trigonometría en la resolución de estructuras en estática, como el que se expone a continuación. Un cilindro macizo de peso P se encuentra apoyado sin fricción en el interior de un ángulo diedro formado por dos planos contiguos inclinados α y β con la horizontal. Para calcular las reacciones sobre los apoyos consideraremos las condiciones de equilibrio.
∑F
x
=0
R1 sen α − R2 sen β = 0
∑F
y
=0
R1 cos α + R2 cos β − P = 0
sen α de la 1ª R2 = R1 y sustituyendo en la 2ª sen β R1 cos α + R1
R1cosα
R2
α
R2senβ
R1senα P=mg
sen α cos β − P = 0 sen β
α
β
R1 (sen β. cos α + sen α. cos β ) = P sen β R1 sen (α + β) = P sen β
R2 = R1
⇒
R1 =
sen β P sen (α + β)
sen α sen α sen β sen α P = R2 = P = sen β sen (α + β ) sen β sen (α + β )
18/ 20
R2cosβ β
Otra aplicación importante de la trigonometría la tenemos en la resolución del siguiente problema de dinámica. Un cuerpo de masa m desliza sin rozamiento por un carril que finaliza en un rizo vertical, partiendo del reposo a altura h. Desciende por el carril y prosigue por el interior del rizo de radio R. Deseamos ajustar la posición de P de manera que el cuerpo abandone el rizo en un punto y en el subsiguiente movimiento pase por el centro de la circunferencia O. Hallar el ángulo α correspondiente a la posición en que el cuerpo abandona el rizo. Tomemos como sistema de referencia, el sistema cartesiano XY centrado en el punto M, donde el cuerpo se despega del rizo vertical. El vector de posición de la bolita cuando está en O (centro del rizo) vendrá dado por la expresión: r r r 1 R = v0 t cos α.i + v0 t sen α − gt 2 j 2 r r r R = R. sen α.i + ( − R. cos α) j e identificando ambas:
siendo, en la figura:
v 0 t . cos α = R. sen α v 0 t . sen α −
despejando t de la primera:
t=
1 2 gt = − R. cos α 2
R. sen α v0 cos α
y sustituyendo en la segunda, resulta
R. sen α 1 R 2 sen 2 α = − R cos α sen α − g 2 v 0 2 v 0 cos 2 α v 0 cos α Condición que ha de cumplir la bolita en M para separarse del carril: que la componente radial del peso sea la fuerza centrípeta para mantener la trayectoria circular: mg. cos α = m
v 02 R R
R
→
v 02 = Rg . cos α
sustituyendo en la anterior:
sen 2 α 1 R 2 sen 2 α = − R cos α − g cos α 2 Rg . cos α. cos 2 α
sen 2 α R. sen 2 α − = − R cos α cos α 2 cos 3 α →
→
sen 2 α sen 2 α − = − cos α cos α 2 cos 3 α
sen 2 α sen 2 α + cos α = cos α 2 cos 3 α
19/ 20
→
→
→
1=
sen 2 α + cos 2 α sen 2 α = cos α 2 cos 3 α
1 2 tg α 2
→
→
tg α = 2 = 1'4142 →
1 sen 2 α = cos α 2 cos 3 α
→
1=
sen 2 α 2 cos 2 α
α = arctg 1'4141 = 54'7356 o = 54º44’8”
-------------------------------------------
20/ 20
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 39 GEOMETRÍA DEL TRIÁNGULO 1. Generalidades. 1.1. Conceptos Elementales. 1.2. Clases de Triángulos. 1.3. Rectas Notables del Triángulo. 1.4. Resultados Inmediatos. 1.5. Criterios de Igualdad de Triángulos. 1.6. Relaciones entre ángulos y lados. 2. Puntos y Rectas Notables de Triángulo. 2.1. Circunferencia Circunscrita. Circuncentro. 2.2. Ortocentro. 2.3. Circunferencia Inscrita. Incentro. 2.4. Circunferencias Exinscritas. Exincentros. 2.5. Triángulo Órtico. 2.6. Seis Puntos Notables de la Circunferencia Circunscrita. 2.7. Circunferencia de Fenerbach. 2.8. Baricentro de un triángulo. 2.9. Recta de Euler. 3. Relaciones Métricas en un triángulo. 3.1. Rectas Antiparalelas. 3.2. Triángulos Rectángulos. 3.3. Teorema de Pitágoras. 3.4. Generalización del Teorema de Pitágoras. 3.5. Suma y Diferencia de los cuadrados de dos lados de un triángulo. 3.6. Teorema de Stewart. 3.7. Propiedad Métrica de las Bisectrices. 3.8. Radio de la Circunferencia Circunscrita. 4. Área del Triángulo. Bibliografía Recomendada.
1/25
TEMA 39 GEOMETRÍA DEL TRIÁNGULO 1. GENERALIDADES. 1.1. Conceptos Elementales. DEF Triángulo es la figura del plano formada por tres segmentos rectilíneos que tienen, dos a dos, un extremo común. Como definiciones equivalentes de triángulo tenemos las dos siguientes: DEF2 Triángulo es la figura del plano formada por una poligonal cerrada de tres lados. DEF3 Triángulo es un polígono convexo de tres lados y tres ángulos. Los ángulos convexos formados por cada dos lados se llaman ángulos del triángulo, o ángulos internos, y los adyacentes a éstos son los ángulos externos. Los segmentos que forman el triángulo son los lados del mismo. Todos los triángulos, por definición, están compuestos por tres lados y tres ángulos. Notación. Los lados de un triángulo se denotarán con letras minúsculas y los ángulos con mayúsculas, teniendo un ángulo y su lado opuesto la misma letra.
C
b A
a c
Fig. 1.
DEF
B
Llamamos Perímetro del triángulo a la suma de las longitudes de sus tres lados.
1.2. Clases de Triángulos. Podemos realizar dos clasificaciones diferentes de los triángulos, según nos basemos en sus lados o en sus ángulos. 1) Clasificación de los triángulos en función de sus lados. • • •
Equilátero. Tienen los tres lados iguales. Isósceles. Tienes dos lados iguales. Escaleno. Tienen todos los lados de diferente longitud.
2) Clasificación de los Triángulos en función de sus ángulos. • Rectángulos. Tienen un ángulo recto.
2/25
• •
Obtusángulos. Tienen un ángulo obtuso. Acutángulos. Tienen los tres ángulos agudos.
1.3. Rectas Notables del Triángulo. DEF
Llamaremos Base del triángulo a uno cualquiera de sus lados.
DEF Llamaremos Altura de un triángulo al segmento perpendicular trazado desde el vértice opuesto a la base o a su prolongación. DEF Llamaremos Mediana al segmento que une un vértice con el punto medio del lado opuesto. DEF Llamaremos Bisectriz Interior a la recta que divide un ángulo cualquiera del triángulo en dos ángulos iguales y queda limitada por el lado opuesto. DEF
Llamaremos Bisectriz Exterior a la bisectriz de un ángulo exterior.
Dado que un vértice del triángulo tiene dos ángulos externos, opuestos entre si, sus bisectrices son parte de una misma recta, la cual es perpendicular a la bisectriz interior de dicho ángulo. DEF Llamaremos Mediatriz de un triángulo a toda recta perpendicular a un lado cualquiera que pasa por su punto medio. 1.4. Resultados inmediatos. TEOREMA Un triángulo es isósceles si y sólo si tiene dos ángulos iguales. Dem. “⇒” Sabemos que un triángulo isósceles tiene dos lados iguales. Demostraremos que los dos ángulos opuestos a los dos lados iguales son iguales. Sea ABC un triángulo isósceles, siendo b=c. Consideremos el triángulo A’B’C’ simétrico de ABC respecto de la bisectriz del ángulo A. A'
A
Este triángulo verifica que b’=c’ Si realizamos un movimiento de forma que A’ coincida con A y A’C’ con su igual AB, dado que A’=A, el lado A’B’ también coincidirá con su igual AC.
B
C
C'
B'
3/25
Por tanto, los dos triángulos isósceles coincidirán y ∠C’=∠B. Y como ∠C=∠C’, tenemos que ∠B=∠C. “⇐” Supongamos ahora que el triángulo ABC dibujado verifica que ∠B=∠C. Sea A’B’C’ igual que antes y mediante un movimiento situamos A’ sobre A y C’B’ sobre BC. La recta C’A’ tendrá la misma dirección que BA ya que ∠B=∠C’ y la recta B’A’ tendrá la dirección de CA por ser ∠C=∠B’. Entonces AB=A’C’ y A’C’=AC luego AB=AC y por tanto ABC es isósceles. TEOREMA La bisectriz del ángulo determinado por los dos lados iguales de un triángulo isósceles es a la vez la altura, la mediana y la mediatriz del vértice que determina al lado opuesto. Dem. Consideremos el triángulo isósceles ABC, donde AB=AC. La bisectriz de ∠A forma con los lados AB y AC los ángulos α 1 y α 2 y corta a BC en el punto D. Por construcción α 1 =α2 .
A α1
La simetría con respecto a la recta que contiene al segmento AD transforma el triángulo en sí mismo. De este resultado podemos deducir:
α2
1) BD=CD, luego D es el punto medio de BC. 2) ∠BDA=∠CDA, luego AD⊥BC. Por tanto AD es la mediatriz.
B
D
C
1.5. Criterios de Igualdad de Triángulos. DEF Dados dos triángulos ABC y A’B’C’, diremos que son congruentes si existe un movimiento que transforma uno en otro. Obtenemos así que los lados y ángulos homólogos serán congruentes, pudiendo escribir AB=A’B’
AC=A’C’
BC=B’C’
∠A=∠A’
∠B=∠B’
∠C=∠C’
A partir de esta definición podemos determinar la congruencia de dos triángulos con sólo realizar un movimiento. El problema está en que en gran cantidad de situaciones no podremos realizar dicho movimiento. Es por ello que la congruencia se deducirá comprobando la igualdad entre los lados y los ángulos de ambos triángulos.
4/25
Para simplificar algo más el problema de determinar si dos triángulos son congruentes, vamos a ver cuatro criterios (llamados criterios de igualdad) en los cuales partiremos de menos igualdades y comprobaremos que se verifican el resto. Dos triángulos ABC y A’B’C’ son congruentes si verifican alguno de los criterios siguientes: a) Criterio 1. Tienen iguales dos lados y el ángulo que lo forman. Supongamos que AB=A’B’, AC=A’C’ y ∠A=∠A’ El movimiento que lleva AB sobre A’B’ y el semiplano que contiene a C sobre el semiplano que contiene a C’, transforma ∠A en ∠A’ y la recta AC en A’C’. Así pues, los tres vértices se transforman en sus homólogos y por lo tanto los triángulos son congruentes. b) Criterio2. Tienen iguales un lado y los dos ángulos contiguos. Sea AB=A’B’, ∠A=∠A’ y ∠B=∠B’ El movimiento que lleva AB sobre A’B’ de forma que coincidan los semiplanos que contienen a C y C’, transforma el primer triángulo en el segundo, por tanto son congruentes. c) Criterio 3. Tienen iguales, respectivamente, los tres lados. Sea AB=A’B’, AC=A’C’ y BC=B’C’ Vamos a probar que uno de los triángulos es congruente con el simétrico del otro, y de aquí deduciremos la congruencia entre ambos. Apliquemos al triángulo A’B’C’ un movimiento tal que el lado A’B’ coincida con AB y el semiplano que contiene a C’ sea distinto del semiplano que contiene a C. El triángulo obtenido del movimiento es ABC’’, verificándose que AC=A’C’=AC’’ y BC=B’C’=BC’’ Así pues, A equidista de C y C’’, al igual que B. Por tanto AB es la mediatriz del segmento CC’’ y la simetría respecto de dicha mediatriz hace coincidir el triángulo ABC con ABC’’. Por tanto ABC es congruente con ABC’’ y este con A’B’C’, Luego ABC es congruente con A’B’C’. d) Criterio 4. Tienen iguales dos lados de diferente longitud y el ángulo opuesto al mayor de ellos. Sea AB=A’B’, AC=A’C’ con AC>AB y ∠B=∠B’
5/25
C
C' C''
A
B
A'
B'
Apliquemos al triángulo A’B’C’ un movimiento que transforme A’B’ en AB y el semiplano que contiene a C’ en el semiplano que contiene a C. Como ∠B=∠B’, las rectas que contienen a BC y a B’C’ coinciden. Sólo nos queda por demostrar que el punto C’ se transforma en C. Supongamos que C’ se transforma en C’’. Entonces AC’’=A’C’=AC El triángulo ACC’’ es isósceles, verificándose que ∠C=∠C’’ y ∠C’’>∠B por ser ∠C’’ exterior al triángulo ABC’’. Entonces AB>AC’’ y como AC’’=AC obtenemos que AB>AC lo cual es una contradicción. En la demostración hemos aplicado un teorema, que demostraremos más adelante, que dice que a ángulos mayores se oponen lados mayores. Si el punto C’’, obtenido como transformación de C’, fuese exterior a BC, llegaríamos a deducir que ∠C’>∠B’, entonces A’B’>A’C’, lo cual también contradice la hipótesis. Por tanto C’’=C y ambos triángulos son congruentes. Una vez vistos los cuatro criterios de igualdad, podemos particularizarlos para triángulos rectángulos, quedando sus enunciados de la siguiente forma: a) Criterio 1. Dos triángulos rectángulos de catetos respectivamente iguales son congruentes. b) Criterio 2. Dos triángulos rectángulos que tienen, respectivamente, un cateto y un ángulo agudo (contiguo u opuesto), son congruentes. c) Criterio 3. Dos triángulos rectángulos que tienen, respectivamente, los tres lados iguales, son congruentes. d) Criterio 4. Dos triángulos rectángulos que tienen, respectivamente, iguales un cateto y la hipotenusa, son congruentes. 1.6. Relaciones entre Ángulos y Lados. TEOREMA Dado un triángulo, se verifica:
6/25
1) Un ángulo externo es mayor que cualquiera de los ángulos internos no adyacentes. 2) A mayor lado se opone mayor ángulo. 3) A mayor ángulo se opone mayor lado. Dem. 1) Consideraremos el triángulo ABC de la figura. D'
D A
F' E' B
F E
C
En primer lugar demostraremos que el ángulo externo DAC es mayor que el interno ACB. Trazamos la recta BF que corta al segmento AC en su punto medio, E, y determinamos F como EF=BE. Posteriormente dibujamos el segmento AF.
Los triángulos AEF y CEB son congruentes ya que tienen iguales los ángulos en E y los lados que los forman. Por tanto ∠ACB = ∠FAC y como ∠FAC < ∠DAC resulta ∠ACB < ∠DAC En segundo lugar demostraremos que el ángulo externo DAC es también mayor que el ángulo interno ABC Realizando un proceso similar obtenemos F’ como CE’=E’F’ siendo E’ el punto medio de AB. Y llegamos a que ∠F’AB < ∠D’AB y como ∠F’AB = ∠ABC obtenemos ∠ABC < ∠D’AB y siendo ∠D’AB = ∠D’AC resulta ∠ABC < ∠DAC 2) Consideremos el triángulo ABC de la figura. C
α
Supongamos que el lado BC es mayor que AC, BC > AC. Probemos que el ángulo A es mayor que el ángulo B, ∠A > ∠B.
D
β
Como el segmento BC es mayor que AC, elijamos en él un punto D que verifique 7/25
CD=AC El triángulo ACD es isósceles por construcción, siendo los ángulos α y β iguales. Por el apartado anterior, el ángulo β es mayor que B ya que β es externo al triángulo ABD. Y como el ángulo α es menor que el ángulo A tenemos ∠A > α = β > ∠B Luego ∠A > ∠B 3) La demostración de este apartado la realizaremos por reducción al absurdo. Consideraremos el triángulo del apartado anterior con ∠A > ∠B. Supongamos que BC ≤ AC Tenemos dos situaciones: a) BC=AC. Entonces el triángulo sería isósceles y por tanto ∠A = ∠B, lo cual es falso. b) BC < AC. Aplicando el apartado anterior obtenemos ∠A < ∠B, lo cual también es falso. Por tanto BC > AC TEOREMA Todo lado de un triángulo es menor que la suma de los otros dos. Dem. Vamos a realizar la demostración para el lado mayor.
A
C
Supongamos que AB es el lado mayor. Sobre la prolongación del segmento AC situamos un punto B’ que verifique CB=CB’.
B'
B Entonces el triángulo BCB’ es isósceles, y se verifica ∠AB’B = ∠CBB’ y como ∠CBB’ < ∠ABB’ ya que C es interior al segmento AB’, llegamos a que ∠AB’B < ∠ABB’
8/25
Por tanto, en el triángulo AB’B, sabiendo que a menor ángulo se opone menor lado, se tiene AB < AB’ ⇒ AB < AC+BC TEOREMA Todo lado de un triángulo es mayor que la diferencia de los otros dos. Dem. La demostración es inmediata sin más que tener en cuenta el teorema anterior. Si AB < AC+BC ⇒ AC > AB-BC 2. PUNTOS Y RECTAS NOTABLES DEL TRIÁNGULO. 2.1. Circunferencia Circunscrita. Circuncentro. Sabemos que tres puntos no alineados, A, B y C, determinan una circunferencia que los contiene. El centro de la circunferencia es el punto de intersección de las mediatrices de los segmentos AB, BC y AC. TEOREMA Las mediatrices de un triángulo se cortan en un punto equidistante de los tres vértices, llamado circuncentro. Dem. Sea el triángulo ABC, y los puntos D, E y F son los puntos medios de cada uno de los lados. Como AB y BC no son paralelos, sus mediatrices se cortan en un punto, que llamaremos O.
C F O A
D
E
El punto O equidista de A y B, pues se encuentra en la mediatriz del lado AB.
B
Igualmente equidista de B y C por estar en la mediatriz del lado BC. Por tanto, equidista de A y C y eso significa que se encuentra en la mediatriz del lado AC. Por tanto, O es la intersección de las tres medianas, y está a la misma distancia de los tres vértices DEF Llamamos Circuncentro de un triángulo al punto intersección de sus tres mediatrices.
9/25
DEF Llamamos Circunferencia Circunscrita de un triángulo a la circunferencia con centro en el Circuncentro y que pasa por los tres vértices. 2.2. Ortocentro. TEOREMA Las paralelas a los lados de un triángulo ABC que pasan por los vértices opuestos forman otro triángulo A’B’C’ de lados dobles de los del primero y cuyos puntos medios son A, B y C. Dem. A
C'
B
Sea B’C’ la paralela a BC que pasa por A, A’C’ la paralela a AC que pasa por B y A’B’ la paralela a AB que pasa por C. Las tres rectas se cortan dos a dos en los puntos A’, B’ y C’ determinando un triángulo.
B'
C A'
Los vértices ABCB’ determinan un polígono de cuatro lados y como los lados son paralelos dos a dos tenemos que AB=B’C y AB’=BC. De forma análoga ABA’C es otro paralelogramo y AB=CA’. Entonces AB=B’C=CA’, luego 2AB=A’B’ y A es el punto medio de A’B’. Igualmente, podemos demostrar para el resto de lados que el triángulo A’B’C’ tiene los lados de longitud doble que los del triángulo ABC, siendo A, B y C sus puntos medios. La consecuencia qie obtenemos del teorema anterior es que las alturas del triángulo ABC se corresponden con las mediatrices de A’B’C’ Debido a que las mediatrices se cortan en un punto, podemos afirmar que las alturas del triángulo ABC se cortan en un punto. DEF
Llamamos Ortocentro al punto donde se cortan las tres alturas de un triángulo.
2.3. Circunferencia Inscrita. Incentro. TEOREMA Sea ABC un triángulo. Las bisectrices de sus ángulos internos se cortan en un punto interior del mismo y equidistante de sus lados. Dem.
10/25
A
I B
C
Sean D, E y F los puntos de los lados del triángulo que se obtienen como intersección de las bisectrices de un ángulo en el lado opuesto. Se verifica que: ∠BAD + ∠ABE = 0’5·∠A + 0’5·∠B < ∠A+∠B < 180º Entonces, las bisectrices de los ángulos A y B se cortan, ya que forman con la secante común AB ángulos cuya suma es menor de 180º. Sea I el punto de corte. Como el punto I pertenece a la bisectriz AD, equidista de AB y AC, y por estar en la bisectriz BE también equidista de AB y BC, luego está en la bisectriz CF. DEF Llamaremos Incentro al punto donde se cortan las tres bisectrices de un triángulo. DEF Llamaremos Circunferencia Inscrita de un triángulo a la única circunferencia interior con centro en el Incentro y tangente a los tres lados. 2.4. Circunferencias Exinscritas. Exincentros. DEF Llamaremos Exincentros a los puntos exteriores de un triángulo que equidistan de las rectas que contienen a cada uno de los tres lados. Para obtener los exincentros, que son tres, realizaremos el siguiente proceso: Tomemos las bisectrices de los ángulos exteriores A y C. Dado que son ángulos concexos, sus mitades suman menos de 180º y por tanto las bisectrices se cortan en un punto IB que equidista de las rectas de los tres lados, por tanto pertenece a la bisectriz del ángulo interior B. El proceso lo podemos repetir, obteniendo IA e IC. Cada dos vértices exteriores de un triángulo se cortan en un punto con la bisectriz interior del tercer vértice. Si, por ejemplo, trazamos por IB perpendiculares a los lados o sus prolongaciones, cortarán al lado AC y a las prolongaciones de AB y BC. DEF Llamaremos Circunferencia Exinscrita a aquella con centro en un exincentro y tangente a los lados del triángulo o sus prolongaciones.
11/25
C I
B
I
A
O A
B
I
C
2.5. Triángulo Órtico. TEOREMA Las alturas de todo triángulo ABC acutángulo son bisectrices interiores del triángulo HA, HB y HC, cuyos vértices son los pies de sus alturas. Dem. Comprobemos que ∠HC HAA = ∠AHA HB, lo cual es lo mismo que β=β’. Con eso demostraremos que la recta AHA es la bisectriz del vértice HA.
A
HB HC
α' B
β
β'
El triángulo BHCC es rectángulo, al igual que BHBC, luego los cuatro puntos están en una misma circunferencia, siendo iguales los ángulos inscritos en ella: α=α’.
α C
HA
De forma análoga, el triángulo CHB H es rectángulo, al igual que HHAC, luego los cuatro puntos están en una misma circunferencia, siendo iguales los ángulos inscritos en ella: α=β. El punto H es la intersección de las tres alturas.
12/25
Y repitiendo de nuevo el proceso demostraríamos que α’=β’. Por tanto llegamos a probar que β=β’. DEF Llamaremos Triángulo Órtico al triángulo HAHB HC, siendo sus vértices los puntos de corte de las alturas de un triángulo ABC acutángulo con sus lados. La consecuencia de todo del teorema anterior es: “Los lados de un triángulo acutángulo son las bisectrices exteriores de su triángulo órtico. Los vértices de un triángulo son los exincentros de su triángulo órtico.” De forma similar a la anterior demostraríamos que, si el triángulo es obtusángulo, las alturas son una bisectriz interior y dos exteriores y los lados son las bisectrices restantes del triángulo órtico. En el caso de que el triángulo fuese rectángulo, no existe su triángulo órtico 2.6. Seis Puntos Notables de la Circunferencia Circunscrita. La circunferencia cincunscrita a un triángulo ABC contiene los puntos de intersección de la mediatriz de cada lado con las bisectrices que pasan por el vértice opuesto.
G' C
B
A
Sean GC y GC ’ los puntos medios de los arcos de la circunferencia con extremos en A y B. Por dichos puntos pasan a la vez el diámetro perpendicular al lado AB (la mediatriz de AB) y las bisectrices interior y exterior del ángulo C (aplicando las propiedades de un ángulo inscrito en una circunferencia).
C
GC
Consideremos el triángulo de vértices IA, IB e IC, siendo dichos puntos los exincentros del triángulo de vértices ABC. El triángulo IBCI C es rectángulo en C y el triángulo IB BIC es rectángulo en B. Ambos triángulos están formados por bisectrices cuyos lados pasan por IB e IC. Por tanto, los cuatro puntos están en una circunferencia de diámetro IB IC, y cuyo centro está en la mediatriz de BC, que llamamos GA. Análogamente IAI es el diámetro de una circunferencia que pasa por B y C por ser rectos los ángulos ∠ICIA y ∠IBIA. El punto de intersección de la mediatriz de BC con IAI es el centro o punto medio de IAI. Por tanto: La circunferencia circunscrita a un triángulo contiene los puntos medios de los lados del triángulo de los exincentros, así como los puntos medios de los segmentos que unen éstos con el Incentro.
13/25
G C C
I
G'
B
B
A
I
G'
C
I
A
B
O
G
A
G'
G
B
C
I
C
2.7. Circunferencia de Fenerbach. Sea ABC un triángulo no rectángulo (ya que éstos no tienen triángulo órtico). Si aplicamos las propiedades que hemos visto a su triángulo órtico obtenemos que la circunferencia que pasa por los pies de las alturas de un triángulo contiene los puntos medios de sus lados así como los puntos medios de los segmentos de altura comprendidos entre cada vértice y el ortocentro. DEF La circunferencia anterior recibe el nombre de Circunferencia de los nueve puntos, o Circunferencia de Fenerbach o Circunferencia de Euler. 2.8. Baricentro de un triángulo. TEOREMA Las medianas de un triángulo se cortan en un punto que dista de cada vértice el doble que del punto medio del lado opuesto. Dem. Consideremos las medianas del triángulo que pasan por los vértices A y B. La mediana que pasa por A determina un punto MA en el lado opuesto, y la mediana que pasa por B determina MB en su lado opuesto. Ambas medianas se cortan en G.
C
MB
MA G
Q
P A
MC
B
14/25
Si tenemos en cuenta los segmentos AG y BG, sean P y Q, respectivamente, sus puntos medios. Demostremos que PG=GMA y que QG=GMB. En el triángulo ABC, el segmento de extremos MAMB es la paralela media a AB, lo cual significa que es paralelo a AB y de longitud mitad que AB. Si consideramos el triángulo ABG, deducimos algo similar. El segmento PQ es la paralela media a AB. Por tanto, el cuadrilátero determinado por los puntos PQMAMB es un paralelogramo, ya que tiene dos lados iguales y paralelos. El punto G es el punto donde se cruzan las diagonales de dicho paralelogramo. Por tanto se verifica que PG=QMA y que QG=GMB, por tanto PG=2GMA y QG=GMB. Aplicando el mismo razonamiento para una de estas medianas y la tercera no considerada, obtenemos que se cortan en el mismo punto G y verifica la misma relación, demostrando así la tesis del teorema. DEF Llamaremos Baricentro al punto donde se cortan las tres medianas de un triángulo. 2.9. La Recta de Euler. TEOREMA Dado un triángulo ABC cualquiera, se verifica que el Baricentro está alineado con el ortocentro y el circuncentro y a doble distancia del primero que del segundo. Dem. C
Vamos a trazar la recta que pasa por dos de ellos y comprobaremos que también pasa por el tercero, verificando entre ellos las distancias que se indican.
HB HA H MB
MA G
M P A
MC
M'
Q B
Tracemos por A y B las alturas correspondientes, que sabemos que se cortan en el ortocentro H, e igualmente tracemos las medianas, que se cortan en baricentro G. Sean P y Q los puntos medios respectivamente de AG y BG. Si trazamos por P una paralela a la altura de A y por Q una paralela a la altura de B, se cortan en un punto M’ de GH,siendo además su punto medio, ya que son las paralelas medias de AGH y GBH. Si ahora, de forma simétrica, trazamos por MA otra paralela a la altura de A y por MB otra paralela a la altura de B, se cortan en M, coincidiendo esas rectas con las mediatrices del triángulo, y por tanto M es el circuncentro del triángulo.
15/25
Por simetría se obtiene que M y M’ están a la misma distancia de G GM=GM’ y como M’ era el punto medio de GH tenemos GM’= ½GH, luego obtenemos que 1 GM = GH 2 estando los tres puntos alineados. 3. RELACIONES MÉTRICAS EN UN TRIÁNGULO. 3.1. Rectas Antiparalelas. A
Sean a y b dos rectas secantes, cortándose en un punto O. Sean r y r’ otras dos rectas que cortan a las dos anteriores, respectivamente en A y B y en A’ y B’, verificándose que los dos pares AA’ y BB’ están a un mismo lado o a distinto lado de O y que los ángulos ∠OAB y ∠OB’A’ son iguales.
a r'
r A' O B'
B
b
Verificándose todas las condiciones anteriores, diremos que las rectas r y r’ son antiparalelas de a y b. Además se verifica que los ángulos ∠OBA y ∠OA’B’ son iguales, por ser suplementarios de los anteriores respecto de ∠AOB. Por todo lo anterior podemos ver que la recta r forma con las rectas a y b ángulos iguales a los que forma la recta r’ con b y a. Por tanto la relación de antipàralelismo es recíproca: las rectas a y b son también antiparalelas de r y r’. Si consideramos los triángulos AOB y B’OA’, vemos que son semejantes por tener iguales los ángulos homólogos, y entonces: OA OB ' = o también OA·OA' = OB ·OB ' OB OA ' Visto lo anterior, podemos enunciar la siguiente proposición, la cual ya estaría demostrada. PROP Dos rectas concurrentes en O, a y b, son cortadas por dos antiparalelas respecto de ellas, r y r’, en puntos, A y B y también A’ y B’, cuyo producto de distancias a O es el mismo en ambas rectas, OA·OA' = OB ·OB ' .
16/25
3.2. Triángulos Rectángulos. A
B
C
H
En el triángulo rectángulo ABC, rectángulo en A, las dos rectas determinadas, una de ellas por los puntos de la altura AH sobre la hipotenusa BC y la otra por el cateto AC, son antiparalelas respecto de las rectas determinadas por la propia hipotenusa y el otro cateto, ya que ∠AHB=∠CAB=90º Por tanto, si lo anterior también lo aplicamos a los triángulos ABH y ACH, los 2 2 cuales son rectángulos, se verifica que BA = BC ·BH y CA = CH ·CB Así pues, a partir de lo anterior podemos enunciar el siguiente teorema: TEOREMA. Teorema del Cateto. Cada cateto de un triángulo rectángulo es medio proporcional entre la hipotenusa y su proyección sobre ella. TEOREMA. Teorema de la Altura. La altura sobre la hipotenusa de un triángulo rectángulo es media proporcional entre los segmentos en que divide a ésta. Dem. De la semejanza entre los triángulos ABH y CAH , que tienen iguales los ángulos homólogos ∠ABH y ∠CAH se deduce: HB HA = y por tanto HA HC
2
HA = HB·HC
TEOREMA 2
Si se verifica que HA = HB·HC siendo ABH y CAH dos triángulos rectángulos, entonces el triángulo ABC es rectángulo. Dem. De la igualdad se deduce que los triángulos ABH y CAH son semejantes y por tanto
17/25
∠BAH = ∠ACH = 90º - ∠CAH ⇒ ∠BAC = 90º 3.3. Teorema de Pitágoras. TEOREMA. Teorema de Pitágoras. El cuadrado de la longitud de la hipotenusa es igual a la suma de los cuadrados de las longitudes de los catetos. Dem. Si el triángulo ABC es rectángulo en A se verifica que: 2
BA = BC ·BH 2 2 2 ⇒ BA + CA = BC ·(BH + HC ) = BC ·BC = BC 2 CA = CB·CH 3.4. Generalización del Teorema de Pitágoras. Vamos a tratar ahora de generalizar el teorema de Pitágoras que acabamos de ver para cualquier tipo de triángulo, no necesariamente rectángulo. TEOREMA El cuadrado de un lado opuesto a un ángulo (agudo u obtuso) de un triángulo oblicuángulo es igual a la suma de los cuadrados de los otros dos mas o menos el doble producto de uno de ellos por la proyección del otro sobre él. El signo dependerá del ángulo elegido. Dem. Sean los triángulos 1-2-3 de la figura, numerados de izquierda a derecha.
B
B
B hB
m C
m
n H
A
H
n A C
C n
A H m
Llamemos a cada lado por la letra de su vértice opuesto, en minúscula. Sean m y n las medidas de los segmentos CH y AH, con H el pie de la altura sobre la base del triángulo y h la longitud de dicha altura. Entonces tenemos que: Figuras 1 y 2: a 2 = m 2 + h 2 = (b − n) 2 + c 2 − n 2 = b 2 + c 2 − 2bn Figura 3:
a 2 = m 2 + h 2 = (b + n )2 + c 2 − n 2 = b 2 + c 2 + 2bn
18/25
2
2
2
Es decir a = b + c ± 2bn
+ si ∠A > 90º − si ∠A < 90º n = 0 si ∠A = 90º
siendo
COROLARIO Dadas las medidas de los tres lados de un triángulo, se verifica: 1) Será acutángulo si el cuadrado del lado mayor es menor que la suma de los cuadrados de los otros dos. 2) Será recto si el cuadrado del lado mayor es igual que la suma de los cuadrados de los otros dos. 3) Será obtusángulo si el cuadrado del lado mayor es mayor que la suma de los cuadrados de los otros dos 3.5. Suma y Diferencia de los cuadrados de dos lados de un triángulo. PROP Se verifica: 1) La suma de los cuadrados de dos lados es igual al doble de la suma de lo s cuadrados de la mitad del tercer lado y de la mediana correspondiente. 2) La diferencia de los cuadrados de dos lados es igual al doble del producto del tercer lado por la distancia de su punto medio al pie de la altura correspondiente. Dem. C
Aplicando el teorema anterior para expresar los cuadrados de los dos lados a y b, con a mayor que b, de un triángulo ABC, en función de la mitad del tercer lado c y de la mediana correspondiente, mc, tenemos: B
M
A
H
2
c c En el triángulo BMC ⇒ a 2 = + mc2 + 2· ·MH 2 2 2 c c En el triángulo MCA ⇒ b 2 = + mc2 − 2· ·MH 2 2 De ambas expresiones deducimos que 2
c a + b = 2 + 2 mc2 2 2 2 a − b = 2·c·MH 2
2
19/25
3.6. Teorema de Stewart. Podemos obtener una fácil generalización del resultado del punto anterior aplicando cálculos análogos a una oblicua cualquiera al lado c, CN=c interior al triángulo y distinta de la mediana.
C
b
a n
c1
c2
B
N
H
A
Si llamamos c1 =BN y c2 =NA, tenemos que: a 2 = c12 + n 2 + 2c1 NH c 2 a 2 = c 2 c12 + c 2 n 2 + 2c1c 2 NH ⇒ ⇒ b 2 = c 22 + n 2 − 2c 2 NH c1b 2 = c1 c22 + c1 n 2 − 2c1c 2 NH c1b 2 + c2 a 2 = c2 c12 + c22 c1 + c1 n 2 + c 2 n 2 = c1 c2 ( c1 + c2 ) + n 2 (c1 + c2 ) ⇒ c1b 2 + c2 a 2 = (c1c 2 + n 2 )·c Si asignamos signos a los segmentos sobre la recta AB y designamos por AB la longitud de AB con signo, la igualdad se convierte en: 2
2
2
BN ·CA + NA·CB + AB·CN + BN ·NA· AB = 0 la cual se conoce como Teorema de Stewart. 3.7. Propiedad Métrica de las Bisectrices. TEOREMA 1) Toda bisectriz interior divide al lado opuesto en dos segmentos proporcionales a los lados que concurren con ella. 2) Si una bisectriz exterior de un triángulo corta al lado opuesto, las distancias de su pie a los extremos de dicho lado son proporcionales a los lados concurrentes con la bisectriz y que pasan por ellos. Dem.
A
a
B
v' v
N
Sea el triángulo ABC. Llevemos sobre la prolongación del lado a, y a continuación de C, el segmento CM=b. El triángulo ACM es isósceles. La bisectriz v’ es perpendicular a AM y a la bisectriz v de ACB, que es paralela a AM.
b
C
M
20/25
Por el teorema de Thales BV VA c = = a b a +b Por tanto, toda bisectriz interior divide al lado opuesto en dos segmentos proporcionales a los lados que concurren con ella, cuya expresión en función de los lados es: ac bc BV = y VA = a +b a +b Llevando sobre el lado a, y a partir de C, el segmento CN=b, ahora AN es paralela a la bisectriz exterior v’ y tendremos: BV ' AV ' c = = a b a −b por tanto, si una bisectriz exterior de un triángulo corta al lado opuesto, las distancias de su pie a los extremos de dicho lado son proporcionales a los lados concurrentes con la bisectriz y que pasan por ellos y una expresión en función de los lados es: BV ' =
ac a −b
y
AV ' =
bc a −b
3.8. Radio de la Circunferencia Circunscrita. El ángulo ∠BAC es mitad del ángulo central ∠BOC, y por tanto, igual al ∠MOC, limitado por OC y el diámetro perpendicular a BC. De aquí resulta la semejanza de triángulos rectángulos MOC y HAC. Por tanto:
A
H
B O
h
b
M
r b = a2 h C
Sabiendo que la altura: h=
2 c
p( p − a )( p − b)( p − c)
siendo: p=
a +b +c 2
resulta: r=
abc 4 p( p − a)( p − b)( p − c)
21/25
⇒
r=
ab 2h
Demostremos ahora la expresión que hemos utilizado para la altura h. Llevando los lados c y b a la prolongación del lado a, respectivamente, a partir de los vértices B y C, obtenemos NM=a+b+c. Sea P el punto de corte de la altura del triángulo ABC con la base BC.
A
b
c I N
c
B
b
C
M
Por ser AM y AN paralelas a las bisectrices interiores de C y B, el triángulo ANM es semejante al IBC. Por tanto, sus alturas H=AP y h=IP son proporcionales a sus respectivas bases MN=2p y BC=a. Luego: H 2p = h a
⇒
H=
2p h a
y como: ( p − a )( p − b)( p − c ) p
h= tenemos: H=
2 a
p( p − a)( p − b)( p − c )
Además se verifica que h es el radio de la circunferencia circunscrita. Comprobemoslo: Los tres puntos de contacto A’, B’ y C’ de la circunferencia inscrita en un triángulo ABC divide a sus lados en seis segmentos cuya suma es el perímetro 2p=a+b+c. Como AC’=AB’, CB’=CA’ y BA’=BC’, tenemos que:
A
p-a C' B' I
p=BC’+AC’+CA’=c+CA B
p-b
A'
p-c
C
luego
CA’=p-c AC’=p-a y BA’= p-b
Considerando la circunferencia exinscrita tangente al lado AC en B’’, siendo A’’ y C’’ los puntos de tangencia con las rectas AB y BC, se tiene, análogamente BC’’ = BA’’ ⇒ BA + AB’’ = BC + CB’’ y como la suma de ambos miembros es el perímetro, cada uno de ellos vale p. Por tanto BA’’ = BC’’ = p de donde CB’’ = CA’’ = p-a
22/25
y análogamente: C''
C’C’’ = A’A’’ = p-(p-b) = b A
B’B’’ = CB’-CB’’ = (p-c)-(p-a) = a-c
IB
C' B'=B'' I
B
p-b
A'
p-c
C
p-a
A''
Por otra parte, los triángulos IBA’ e IB BA’’ son semejantes. Llamando r al radio de la circunferencia inscrita y ρ al de la exinscrita, tenemos: r p −b = ρ p Los triángulos IA’C y CA’’IB también son semejantes por tener iguales los ángulos ∠ICA’ y ∠CIBA’’. Entonces: r p −a = ⇒ r ·ρ = ( p − a)( p − c) p −c ρ sustituyendo en la expresión anterior tenemos que r 2 · p = ( p − a)( p − b )( p − c ) luego ( p − a )( p − b)( p − c ) p
r= 4. ÁREA DEL TRIÁNGULO. TEOREMA
Toda área de un triángulo es equivalente a un paralelogramo de igual base y mitad de altura. Dem. A
N
M
B
H
M'
C
Sea ABC un triá ngulo cualquiera. Sean M y N los puntos medios de los lados AB y AC respectivamente. El triángulo MAN es congruente con M’CN, y por suma de áreas, el triángulo ABC será equivalente al paralelogramo BMM’C de igual base y mitad de altura. 23/25
Como el área de un paralelogramo es igual al producto de su base y se altura, obtenemos que el área del triángulo es: BC ·AH AT = 2 COROLARIO El área de un triángulo es equivalente a la de un paralelogramo de igual altura y mitad de base. COROLARIO El área de un triángulo es equivalente a la mitad del área de un paralelogramo de igual altura e igual base. FÓRMULA DE HERÓN
A
p-a C' B' I
B
p-b
A'
p-c
C
El área del triángulo ABC puede expresarse como suma de las áreas de los triángulo IBC, IAC e IAB. AIBC =
[( p − b ) + ( p − c )]·r = r ·[2 p − (b + c) ] 2
2
2
2
2
2
AIAC
[( p − a ) + ( p − c )]·r = r ·[2 p − ( a + c ) ] =
AIAB
[( p − a ) + ( p − b )]·r = r ·[2 p − (a + b) ] =
Por tanto AABC =
r [6 p − (2a + 2b + 2c )] = r [6 p − 4 p] = r · p 2 2
y como: r=
( p − a )( p − b)( p − c ) p
resulta: AABC =
p ( p − a)( p − b)( p − c)
24/25
Bibliografía Recomendada. Elementos de Geometría Racional. Tomo 1. Rey Pastor, Puig Adam. Curso de Geometría Métrica. Volumen 1. Puig Adam.
25/25
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 40 GEOMETRÍA DE LA CIRCUNFERENCIA.
1. Generalidades. 1.1. Teorema fundamental. 2. Posiciones relativas de una recta y una circunferencia. 2.1. Rectas secantes 2.2. Rectas tangentes. 2.3. Rectas exteriores. 3. Distancia de un punto a una circunferencia 4. Posiciones relativas de dos circunferencias. 4.1. Circunferencias exteriores. 4.2. Circunferencias tangentes exteriormente. 4.3. Circunferencias secantes. 4.4. Circunferencias exteriores tangentes interiormente. 4.5. Circunferencias interiores. 5. Ángulos en la circunferencia. 5.1. Ángulo central. Arcos. Cuerdas. 5.2. Diámetro perpendicular a una cuerda. 5.3. Ángulos inscritos, semiinscritos y no inscritos. 5.4. Arco capaz de un ángulo. 6. Relaciones métricas en la circunferencia. 6.1. Potencia de un punto respecto a una circunferencia. 6.2. Eje radial de dos circunferencias. Determinación. 6.3. Centro radical de tres circunferencias. 7. Circunferencias ortogonales. Bibliografía Recomendada.
1/14
TEMA 40 GEOMETRÍA DE LA CIRCUNFERENCIA.
1. GENERALIDADES. El conjunto de los puntos del plano cuya distancia a un punto O de éste es igual a un segmento r, se llama circunferencia de centro O y radio r. Si A es un punto de la circunferencia, el segmento OA es un radio. Cada segmento AA´, cuyos extremos pertenecen a la circunferencia, y que contiene O, es un diámetro. El conjunto de los puntos cuya distancia a O es menor de r se llama círculo, y los puntos de éste, puntos interiores. Aquellos puntos cuya distancia a O es mayor de r se llaman puntos exteriores. 1.1. Teorema fundamental. Todo segmento cuyos extremos son uno interior y otro exterior a una circunferencia, tiene con ella un punto común y uno solo. M
A A'
B' P
O
C
N
En efecto, clasifiquemos los puntos del segmento MN donde M es interior y N exterior en dos clases C1 y C2 . C1 formada por los puntos interiores a C. C2 formada por los puntos no interiores a C.
a) Existen en el segmento MN puntos de ambas clases. b) Todo punto del segmento MN es interior o no interior. c) Todo punto de C1 precede a todo punto de C2 (propiedad de los oblicuos). Por el axioma de continuidad (o de las cortaduras de Dedekiud), existe en MN un punto P y uno solo tal que todo punto que le precede es de C1 y todo punto que se le sigue es de C2 , pero P pertenece a la circunferencia, pues en caso contrario si fuera interior, podríamos encontrar otro interior A´ que le sigue, y si fuera exterior podríamos encontrar otro exterior B’ que le precede. Así pues: La circunferencia divide al plano en dos regiones (al igual que una recta divide al plano en dos semiplanos). La única diferencia es que en este caso una región es convexa, y la otra no.
2/14
2. POSICIONES RELATIVAS DE UNA RECTA Y UNA CIRCUNFERENCIA. 2.1. Rectas secantes. I - Proposición: Si una recta tiene un punto interior a una circunferencia, tiene dos puntos comunes y solo dos, con ella. N'
A
Q M
Demostración: P
O
N
Si la recta pasa por el centro, en cada semirrecta de origen O hay un punto y sólo uno cuya distancia de O es r, luego pertenece a la circunferencia.
Si la recta no pasa por O (origen), llevamos sobre cada semirrecta de origen M un segmento igual a 2r, determinando N y N´, ambos exteriores, pues se tiene: NO>MN-OM>2r−OM>r
y
N´O>r
análogamente.
Entonces por el teorema fundamental podemos determinar P y Q únicos sobre la circunferencia. Definición: Llamamos recta secante con una circunferencia a toda recta que tiene dos puntos comunes con ella. Si además pasa por el centro, la recta se llama diametral. 2.2. Rectas tangentes. II- Proposición: Si la distancia del centro de una circunferencia a una recta es igual al radio, la recta tiene un único punto común con la circunferencia, y los demás son exteriores. Demostración: Si H es el pie de la perpendicular a la recta se tiene OH= r luego H pertenece a la circunferencia. Cualquier otro punto P verifica OP>OH=r, y es exterior. Definición: Dicha recta se llama tangente a la circunferencia.
3/14
2.3. Rectas exteriores. III- Proposición: Si la distancia del centro de una circunferencia a una recta es mayor de r, la recta tiene todos sus puntos exteriores a la circunferencia. Demostración: Trivial. Definición: Toda recta que no tiene punto alguno común con la circunferencia se llama ext erior. 3. DISTANCIA DE UN PUNTO A UNA CIRCUNFERENCIA. Dado un punto P, la recta OP, donde O es el centro de una circunferencia, corta a ésta en dos puntos A y B. Caso 1
B
Caso 2
M
O
A
P
O
B
Caso 3
M
P
A
B
M
O
P=A
Caso1. Llamamos OP = d
entonces
PA = OP − OA = d − r PB = OP + OA = d + r
y cualquier otro punto M verifica
PM > OP − OM = d − r PM < OP + OM = d + r Caso 2. PA = r − d PB = r + d
y cualquier otro punto M de C verifica PM > OM − OP = r − d PM < OM + OP = r + d
Caso 3. PA = 0 cualquier otro punto M verifica PB = 2r
4/14
PM > 0 PM < 2r
(trivial)
Así pues, tiene sentido definir: d(P,C) = min {d(P,M)} donde M recorre la circunferencia = min { PA, PB } donde PA es una recta diámetro(A,B puntos de la circunferencia) Definición: Llamamos cuerda a todo segmento que une dos puntos de una circunferencia. La mayor de las cuerdas es el diámetro. 4. POSICIONES RELATIVAS DE DOS CIRCUNFERENCIA. Supongamos dos circunferencias C y C´ de centros O, O´ y radios r, r´ supongamos, de momento que r>r´ y sea OO´=d. Se presentan los siguientes casos posibles: 4.1. Circunferencias exteriores. d > r + r' > r − r' En este primer caso, todos los puntos de C serán exteriores a C´ y recíprocamente. Las circunferencias son exteriores entre sí 4.2. Circunferencias tangentes exteriormente. d = r + r' > r − r' En este caso, las circunferencias no tendrán mas que un punto común en la recta de centros, siendo los demás puntos exteriores. Las circunferencias son tangentes exterio rmente. 4.3. Circunferencias secantes. r + r' > d > r − r' En éste caso se tiene d < r + r´ d > r − r´
⇒
d − r´< r d + r´> r
luego el punto de C´ más cercano a O es interior a C, y el punto de C´ mas alejado de O es exterior. Las circunferencias son secantes, se cortan en dos puntos.
5/14
4.4. Circunferencias tangentes interiormente. r + r ' > r − r' = d En este caso
d = r − r´ ,
⇒
d + r´= r
luego el punto de C´ mas alejado de O esta en C, y todos los demás son interiores. Las circunferencias son tangentes interiormente. 4.5. Circunferencias interiores. r + r ' > r − r' > d En este caso:
r − r´> d
⇒
r´+ d < r
luego todos los puntos de C´ son interiores a C. La circunferencia C´ es interior a C. En el caso que r=r´, el caso 4 se reduce a que la circunferencias coinciden y el caso 5 no tiene sentido. 5. ANGULOS EN LA CIRCUNFERENCIA. 5.1. Ángulo central. Arcos. Cuerdas. Angulo central Se llama ángulo central en una circunferencia al que tiene su vértice en el centro, es decir a cada uno de los ángulos determinados por dos semirrectas de origen O. El conjunto de los puntos de la circunferencia situados en un ángulo central se llama arco abarcado por dicho ángulo, y el conjunto de puntos del circulo situados en un ángulo central se llama sector circular correspondiente a dicho ángulo. Definición: Dos ángulos (o dos sectores) de una misma circunferencia son equivalentes si sus ángulos centrales son iguales. Puede establecerse una “suma” de arcos y un orden en los arcos pues para ello basta hacerlo con los ángulos centrales correspondientes. Cada cuerda determina 2 arcos y se dice que la cuerda subtiende cada uno de estos arcos. Es claro que dado un arco solo hay una cuerda que lo subtiende. Proposición. En una misma circunferencia, entre dos arcos menores que una semicircunferencia, a menor arco corresponde menor cuerda y recíprocamente.
6/14
Demostración. A' A
B"
Supongamos:
D
A'
Arco AB < Arco A´B´.
B'
entonces:
O B'
(∠AOB ) < (∠A'OB ') . O
Hagamos coincidir mediante un movimiento OA con OA’ obteniendo un nuevo triángulo. OA’B” congruente con OAB. La bisectriz del ángulo ∠ B”OB’ corta a A’B’ en un punto D. Se tiene B”D=DB’ pues B”OD=B’OD (al tener iguales 2 lados y el ángulo comprend ido). Entonces. A’B’ = A’B” < A’D + DB” = A’D + DB’ = A’B’. 5.2. Diámetro perpendicular a una cuerda. El diámetro perpendicular a una cuerda la corta en su punto medio e igualmente a los arcos que subtiende en dos arcos iguales (trivial). En una circunferencia, las cuerdas iguales equidistan del centro y recíprocamente (trivial). Si una cuerda es menor que otra, su distancia al centro es mayor pues los triángulos AOM y CON son rectángulos y tienen igual hipotenusa, luego si un cateto es menor que su correspondiente, el otro es mayor.
B A
M
O C N
D
5.3. Angulos inscritos, semiinscritos y no inscritos. Definición: Se llama ángulo inscrito en una circunferencia a un ángulo cuyo vértice esta en ella y cuyos lados son secantes con la circunferencia. Proposición: La medida de un ángulo inscrito es igual a la mitad del ángulo central que abarca el mismo arco. Demostración:
Pueden presentarse 3 casos.
7/14
A
1 El centro de la circunferencia está sobre un lado del ángulo. El ángulo AOB es exterior al triángulo POA, que es isósceles pues OP=OA, y vale la suma de los dos ángulos iguales de dicho triángulo.
B O P
2 El centro de la circunferencia es interior al ángulo APB. Basta trazar el diámetro PM, y el ángulo APB se descompone en otros dos que son mitad respectivamente de los ángulos centrales que abarcan los arcos AM y MB.
A M O B
P
3
Se traza el diámetro PM y el ángulo APB es diferencia de APM y BPM luego ∠APB =
∠AOM ∠BOM ∠AOB − = 2 2 2
A B M O P
Definición: Se llama ángulo semiinscrito en una circunferencia a aquel que tiene su vértice sobre ella, y que tiene un lado secante. Proposición: Un ángulo semiinscrito tiene el mismo valor que cualquier inscrito que abarca el mismo arco. Demostración Si el lado secante pasa por el centro, el ángulo abarca media circunferencia y es recta, como cualquiera de los inscritos que abarcan, dividen semicircunferencia.
P O B
Si el centro O es interior al ángulo, el ángulo APB es suma de un recto y un ángulo inscrito de donde APB =
1 (MOP + MOB ) . 2
8/14
A
B P O M
A
Si el centro O es exterior al ángulo, el ángulo APB es diferencia de un recto y un ángulo inscrito, de donde 1 APB = (MOP − MOB ) 2
P O M
A B
Definición: Si el vértice del ángulo es interior o exterior a la circunferencia y sus lados cortan a la circunferencia, el ángulo se llama no inscrito. A
A' P
B'
B
Si el punto P es exterior y A´, B´ son los puntos de la circunferencia más cercanos a P situados en sus lados resulta. ∠AA' B = ∠A' PB + ∠A' BP AA´B= Angulo inscrito que subtiende AB A´BP= Angulo inscrito que subtiende A´B´ de donde
APB= diferencia de los ángulos inscritos correspondientes a los dos arcos que abarcan sus lados.
Si el punto P es interior, entonces
A
∠APB = ∠ A' PB' = ∠AA' B + ∠A' AB' = … A'
…= suma de los ángulos inscritos correspondientes a los dos arcos que abarcan sus lados.
B
P B'
5.4. Arco capaz de un ángulo. Definición: Dado un segmento AB y un ángulo α se llama arco capaz del ángulo α sobre el segmento AB al conjunto de puntos P del plano tal que APB=α (incluyendo A y B).
B
P
Todos los puntos P del lugar geométrico estarán sobre dos circunferencias de las que AB es una cuerda y APB es una ángulo inscrito o semiinscrito.
9/14
α A
Construcción de una ángulo capaz: Es fácil determinar los centros de las circunferencias sobre las que están los arcos capaces. Basta construir el ángulo BAC=α, y trazar la perpend icular a la recta AC por A, que contendrá el centro. El punto de corte de dicha recta con la mediatriz de AB determina unívocamente O.
O
A
B
α
(En efecto la recta AC será tangente a una de las circunferencias buscada, y el ángulo semiinscrito BAC vale α)
C
Repitiendo la construcción desde B se determina el otro centro que será simétrico respecto AB. Aplicaciones. El arco capaz de un ángulo tiene muchas aplicaciones en problemas de construcciones geométricas e incluso en ramas tan dispares como navegación. Problema de la carta o de Pothenot: Desde un cierto punto P se determinan los ángulos APB=α y BPC=β. Podemos determinar el punto P mediante la intersección de los dos arcos capaces correspondie ntes. 6. RELACIONES METRICAS EN LA CIRCUNFERENCIA. Proposición: Si por un punto P del plano se trazan secantes a una circunferencia, el producto de los segmentos determinantes por dicho punto y los de intersección de cada secante con la circunferencia, es constante. Demostración: Caso1. Los triángulos PAD y PBC tienen 2angulos iguales, luego son semejantes. Se tiene:
D C P B
A
PA PD = ⇒ PA ⋅ PB = PC ⋅ PD = cte PC PB
10/ 14
Caso2. B
D
Los triángulos PDB y PAC son semejantes porque tienen 2 ángulos iguales. Luego:
P
PB PC = ⇒ PA ⋅ PB = PC ⋅ PD PD PA
C
A
Caso3. A P
Trivial porque uno de los dos segmentos es nulo en todos los casos.
B
6.1. Potencia de un punto respecto a una circunferencia. Definición: Dada una circunferencia C y un punto P del plano, se llama potencia de P respecto C al valor constante PA⋅ PB donde A y B son los puntos de intersección de una secante que pasa por P con la circunferencia, y con signo positivo si P no separa A y B, y negativo en caso contrario. Calculo de la potencia. Caso1. P exterior. Tracemos la recta PO, que corte a la circunferencia en A y B. Entonces P = PA ⋅ PB = ( PO − OA)( PO + OA) = d 2 − r 2 llamando PO=d como siempre la potencia será positiva. Caso2. P interior.
P = −( PA ⋅ PB) = −( OA − OP )(OB + OP) = −( r 2 − d 2 ) = d
en este caso la potencia será negativa. Caso3. P en la circunferencia
⇒
la potencia será 0.
11/ 14
Propiedad de la tangente. Si P es exterior el segmento PM de tangente a la circunferencia trazado desde P es la raíz cuadrada de la potencia, y trivialmente también, dicho segmento es media proporcional de cualquier par de segmentos PA, PB donde A y B son intersección de una recta secante que pasa por P con la circunferencia. 6.2. Eje radical de dos circunferencias. Definición: Se llama eje radical de dos circunferencias al lugar geométrico de los puntos que tienen igual potencia respecto a dichas circunferencias. Si P es un punto del lugar geométrico y O,O´ son centros de las circunferencias de radios r y r´ se verifica d = OP d 2 − r 2 = d ´ 2 − r ´ 2 . ⇒ d 2 − d´ 2 = r´ 2 −r 2 = cte d ´= O´P Luego los puntos del lugar geométrico verifican d 2 − d ´ 2 = cte . Proposición: El eje radical de dos circunferencias es una recta perpendicular a la línea de centros. Demostración: P
d
O
Llamamos M a la proyección de P sobre OO´ y H al punto medio del segmento OO´. Se verifica en OPH y O´HP el teorema del coseno.
d'
M
d 2 = OH 2 + PH 2 − 2OH ⋅ MH d ´ 2 = O´H 2 + PH 2 − 2O´H ⋅ MH
O'
H
d 2 − d´ 2 = −4 ⋅ OH ⋅ HM y siendo OH fijo, si d 2 − d ´ 2 = cte debe ser el punto M fijo, luego P esta sobre una recta cuyos puntos se proyectan todos en M. Determinación del eje radical. Si las circunferencias son secantes, los puntos de intersección de ambas tienen potencia O respecto a ambas, luego son del eje radical, que será la recta que pasa por dichos puntos.
12/ 14
O
O'
Si las circunferencia son tangentes interior o exteriormente, el eje radical será el tangente común.
Si las circunferencias son exteriores, los puntos medios de los segmentos de tangente AB y CD tienen igual potencia respecto a ambas circunferencias (propiedad de la tangente), luego el eje radical será la recta que los une.
A B
D C
En el caso que una sea interior a la otra basta trazar una circunferencia auxiliar secante con ambas (O,O´,O´´ no alineados) y determinar los ejes radicales de cada una de ellas, que se cortaran en un punto P. El eje radical es la recta perpendicular por P a la línea de centros.
P
O O'
6.3. Centro radical de tres circunferencias. Dadas 3 circunferencias C, C´, C´´ se llama centro radical de las 3 circunferencias (si existe) al punto que tiene igual potencia respecto a las 3 circunferencias. Obviamente, el centro radical no siempre existe, pero en caso de que exista, la construcción gráfica es trivial (mirar caso anterior). Para que exista basta que los centros de las circunferencias no estén alineados. 7. CIRCUNFERENCIAS ORTOGONALES. Las circunferencias secantes se llaman ortogonales si las tangentes en los puntos de intersección son perpendiculares entre si. Obviamente se cumple: a) Los radios de una y otra circunferencia correspondientes a cada punto de intersección son perpendiculares entre sí. b) Si d es la distancia entre los centros y r, r´ los radios.
d 2 = r 2 + r´ 2 .
c) La potencia del centro de cada circunferencia, respecto otra es el cuadrado de su propio radio pues d 2 − r 2 = r´ 2 , d 2 − r´ 2 = r 2 . (El concepto de circunferencia ortogonal se utiliza para la definición de polaridad, que por su extensión no es adecuado tratarla aquí). 13/ 14
Bibliografía Recomendada. Elementos de Geometría Racional. Tomo 1. Rey Pastor, Puig Adam. Curso de Geometría Métrica. Volumen 1. Puig Adam.
14/ 14
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 41 MOVIMIENTOS EN EL PLANO. COMPOSICIÓN DE MOVIMIENTOS. APLICACIÓN AL ESTUDIO DE LAS TESELACIONES DEL PLANO. FRISOS Y MOSAICOS. 1. Introducción. 2. Conceptos Básicos. 3. Movimientos en el Plano. 3.1. Traslaciones. 3.2. Giros. 3.3. Simetrías. 3.3.1. Simetría Central. 3.3.2. Simetría Axial 4. Composición de Movimientos. 4.1. Producto de Simetría Axial por Traslación. 4.2. Producto de Simetrías Axiales. 4.2.1. Ejes Paralelos. 4.2.2. Ejes no Paralelos. 4.3. Producto de Giros. 4.4. Producto de Simetrías Centrales. 4.5. Producto de una Traslación por un Giro. 4.6. Producto de un Giro por una Traslación. 5. Movimientos. 6. Teselaciones del Plano. 6.1. Frisos. 6.1.1. Tipos de Movimientos en los Frisos. 6.1.2. Clasificación de Frisos. 6.2. Mosaicos. 6.2.1. Tipos de Mosaicos. Bibliografía Recomendada.
1/24
TEMA 41 MOVIMIENTOS EN EL PLANO. COMPOSICIÓN DE MOVIMIENTOS. APLICACIÓN AL ESTUDIO DE LAS TESELACIONES DEL PLANO. FRISOS Y MOSAICOS. 1. INTRODUCCIÓN. En este tema vamos a tratar un tipo particular de transformaciones en el plano: aquellas que hacen corresponder a cada figura otra de igual forma y tamaño. Estas transformaciones reciben el nombre de movimientos, y son aplicaciones biyectivas del plano en sí mismo. De los axiomas de movimiento también podemos deducir que son transformaciones biyectivas del plano que conservan la alineación y el orden, y que transforman segmentos y ángulos en otros iguales. Para definir un movimiento es suficiente determinar las imágenes de dos puntos del plano e indicar la clase del movimiento (directo o inverso). De esta manera, cualquier otro punto del plano tiene determinada de forma unívoca su imagen. Recordemos que una transformación es directa si conserva la orientación e inversa en caso contrario. Los movimientos del plano que vamos a estudiar son las traslaciones, los giros y las simetrías, y sus correspondientes composiciones. 2. CONCEPTOS BÁSICOS. DEF Llamaremos Vector Fijo a u par ordenado de puntos A y B. El punto A recibe el nombre de Origen y el punto B de Extremo. Un vector fijo es equivalente a un segmento dotado de orden. Como características de los vectores vamos a definir la dirección, el sentido y el módulo. DEF Diremos que dos vectores fijos (A,B) y (C,D) tienen la misma dirección si están situados sobre la misma recta o sobre rectas paralelas. DEF Diremos que dos vectores (A,B) y (C,D) con la misma dirección tienen el mismo sentido si se verifica una de las dos condiciones siguientes: a) Si los vectores están situados en rectas paralelas y trazamos la recta que pasa por A y C (el origen de ambos vectores), los puntos extremos, B y D, están en el mismo semiplano. b) Si los vectores están situados en la misma recta, ambos tienen el mismo sentido que un tercer vector con la misma dirección y situado en otra recta paralela. DEF Dos vectores fijos (A,B) y (C,D) tienen el mismo módulo si los segmentos que definen son iguales.
2/24
Si definimos el conjunto de los vectores fijos del plano, podemos definir sobre dicho conjunto una relación de equivalencia de la siguiente manera: DEF Sean (A,B) y (C,D) dos vectores cualesquiera del conjunto de los vectores fijos del plano. Diremos que dichos vectores están relacionados si y sólo si tienen la misma dirección, sentido y módulo. (A,B) ∼ (C,D) ⇔ (A,B) y (C,D) tienen igual dirección, sentido y módulo. PROP La relación anterior es de equivalencia (también llamada de Equipolencia). Dem. Inmediata. La relación de equivalencia, o equipolencia, que hemos definido sobre el conjunto de los vectores fijos del plano nos define un conjunto de clases de equivalencia. Cada clase de equivalencia recibe el nombre de vector libre, y se representa mediante una letra en minúscula con una flecha sobre ella, en contraposición con los vectores fijos, que se representan por sus dos letras (origen y extremo por ese orden) con una flecha sobre ambas letras. vr = AB = XY / XY ~ AB
[ ] {
}
Los conjunto de los vectores libres del plano se representa por V2 . Veamos algunas propiedades de los vectores libres. PROP Si vr es un vector libre y P un punto cualquiera del plano, existe un único representante de vr con origen en P. Dem. Sea AB un representante cualquiera de vr . Vamos a distinguir dos situaciones: 1) El punto P no pertenece a la recta que define el vector AB . B Q
A P
Trazamos por el punto P una paralela a la recta AB y por B una paralela a la recta AP. El punto de intersección, que llamaremos Q, es único. Es trivial comprobar que por construcción obtenemos PQ ~ AB .
El vector fijo que definen los puntos P y Q es el único representante de vr que tiene origen en P 2) El punto P pertenece a la recta que define el vector AB .
3/24
En este caso, elegimos un punto O no perteneciente a la recta AB. A continuación obtenemos el único representante de vr que tiene origen en O aplicando el caso 1. Por último, obtenemos el representante de vr que tiene origen en P aplicando el caso 1 al vector fijo conseguido en el paso anterior. Veamos ahora diferentes operaciones que podemos definir sobre el conjunto de vectores libres del plano. DEF
Sean ur y vr vectores libres. Definimos la suma de ambos vectores como ur + vr = OB
[ ]
siendo O un punto cualquiera del plano, OA un representante de ur y AB un representante de vr . PROP La definición dada de suma de vectores no depende del punto O elegido. Dem.
A
v
u O
B
u+v
u'
A' u'+v'
O'
Sea O’ otro punto cualquiera del plano. Los puntos OAA’O’ forman un paralelogramo, al igual que los puntos ABB’A’. Entonces los puntos OBB’O’ también forman un paralelogramo, deduciéndose que OB ~ O' B ' . Por tanto, la suma no depende del punto O elegido.
v' B'
PROP La operación suma de vectores libres verifica las siguientes propiedades: 1) 2) 3) 4)
Conmutativa. Asociativa. Elemento Neutro. Elemento Opuesto.
Dem. 1) y 2) son inmediatas. r r 3) Llamaremos 0 al neutro de la suma siendo 0 = AA . Es fácil comprobar con esa definición que es el neutro.
[ ]
4/24
4) Dado un vector ur = AB definimos su opuesto como − ur = BA . También es inmediato comprobar que esa definición verifica la propiedad de ser elemento opuesto.
[ ]
[ ]
Conclusión. El conjunto V2 con la operación de suma definida tiene estructura de grupo abeliano. (V2 , +) Grupo Abeliano. DEF Dado un vector ur = AB definimos su producto por un escalar α∈3, y se representa por αur , como aquel vector libre que verifica:
[ ]
1) La dirección de los vectores fijos que componen la clase αur es la misma que la de los vectores ur . 2) El sentido de los vectores fijos que componen la clase αur es el mismo si α>0 y contrario si α<0. 3) El módulo de cualquier vector fijo que representa la clase αur es α multiplicado por el módulo del vector ur , AB . PROP La operación de producto de un vector por un escalar verifica las siguientes propiedades: 1) 2) 3) 4)
Distributiva respecto de los vectores: Distributiva respecto de los escalares: Pseudoasociativa: Elemento Unidad:
α(ur + vr ) = αur + αvr (α + β)ur = αur + βur α(βur ) = (αβ)ur 1·ur = ur
Dem. Las demostraciones son inmediatas y no corresponden al objetivo del tema. Conclusión: El conjunto de los vectores del plano, V2 , con las operaciones interna y externa definidas tiene estructura de espacio vectorial. (V2 ,+,·) es un espacio vectorial. 3. MOVIMIENTOS EN EL PLANO. 3.1. Traslaciones. DEF Sea ur un vector cualquiera de V2 . Llamaremos traslación de vector ur a la aplicación Tur : E 2 → E 2 A a A' del conjunto de los puntos del plano en sí mismo que transforma cualquier punto A en otro A’ verificándose que AA' = ur En general, el vector ur ≠0 y por tanto A y A’ serán puntos diferentes. En el caso de que el vector fuese nulo, A=A’ para todo punto del plano, y la aplicación sería la identidad. 5/24
Podemos definir el conjunto de las traslaciones de vectores del plano como: T = {Tur / ur ∈V2 } PROP Las traslaciones son transformaciones biunívocas del plano en sí mismo. Dem. Trivial PROP Las traslaciones conservan las distancias y transforman rectas paralelas en rectas paralelas. Dem. • Conservan las distancias. Sean A y B dos puntos cualesquiera del plano y A’ y B’ sus imágenes por la aplicación Tur . Entonces se verifica que AA' = ur y BB ' = ur .
B'
A partir de la figura podemos deducir que:
B
AB = AB' − BB ' = AB' − ur A' B ' = AB' − AA' = AB' − ur Por tanto AB ~ A' B'
A' A Y obtenemos que el módulo de ambos es el mismo. O lo que es lo mismo, la distancia de A a B se mantiene por la aplicación. • Transforma rectas paralelas en rectas paralelas. Partiendo de lo obtenido anteriormente, los puntos ABB’A’ determinan un paralelogramo pues AB ~ A' B' y AA' = BB ' . Por tanto también transforma rectas paralelas en rectas paralelas (y conserva los ángulos). PROP Una traslación de vector no nulo no tiene puntos invariantes. Dem. Inmediata.
6/24
En el conjunto T de las traslaciones de vectores del plano, podemos definir una operación interna, llamada composición o producto, de la siguiente forma: DEF Sean Tur , Trv ∈ T . Llamaremos composición o producto de Tur y Tvr a la traslación definida por (Tvr o Tur )( A) = Tvr (Tur ( A) ) . Comprobemos que la definición es consistente y que la aplicación obtenida como composición de traslaciones es una traslación. Si tenemos en cuenta que: (Tvr o Tur )( A) = Tvr (Tur ( A) ) = Tvr ( A' ) = A' ' y que: AA' ' = ur + vr obtenemos que la composición de las traslaciones Tur y Tvr nos da como resultado otra traslación de vector suma de los anteriores Tur +vr PROP La operación de composición de traslaciones verifica las siguientes propiedades: 1) 2) 3) 4)
Asociativa Conmutativa. Elemento Neutro. Elemento Opuesto. Dem.
La demostración es inmediata ya que esas propiedades las verifica la suma de vectores en V2 y sólo hemos de tener en cuenta que la composición de traslaciones se reduce a la traslación de la suma de los vectores asociados. El elemento opuesto es Tr0 y el elemento inverso es Tur−1 = T− ur Conclusión: El conjunto T con la operación de composición definida tiene estructura de grupo conmutativo. (T ,o ) Grupo Conmutativo. PROP Los grupos (V2 ,+) y (T ,o ) son isomorfos. Dem. Basta comprobar que la aplicación f: V2 → T r definida como f (u ) = Tur es un isomorfismo, lo cual es inmediato. 3.2. Giros. DEF Llamaremos giro de centro el punto O y ángulo α a una aplicación delplano en sí mismo que transforma cada punto A en otro A’ verificando las condiciones:
7/24
1) Los vectores OA y OA’ tienen el mismo módulo. 2) ∠AOA’ = α La aplicación se denota por GO,α PROP Los giros verifican las siguientes propiedades: 1) Conservan las distancias, es decir, son Isometrías 2) Transforman puntos alineados en puntos alineados. Dem. 1) Sean A y B dos puntos del plano y A’ y B’ sus imágenes por GO,α Se trata de comprobar que el módulo de los vectores AB y A’B’ es el mismo, manteniéndose así la distancia entre dos puntos por medio del giro. Para ello necesitamos demostrar que los triángulos AOB y A’OB’ son semejantes.
B A
α
β α
A'
B'
O Los triángulos AOB y A’OB’ tienen dos lados iguales y un ángulo, que son OA=OA’
OB=OB’
∠AOB = α-β = ∠A’OB’
Por tanto, el tercer lado también coincide y AB=A’B’, luego el módulo de ambos vectores es el mismo y la aplicación GO,α conserva las distancias. 2) C B
Sean A, B y C tres puntos alineados del plano y sean A’, B’ y C’ sus imágenes respecto del giro GO,α.
A
A'
B'
C'
Por el apartado anterior tenemos que se conservan las distancias entre los puntos, por tanto AC = AB + BC = A' B ' + B' C ' = A' C '
O De aquí obtenemos que si el punto B está en el segmento que forman A y C, entonces el punto B’ también está en el segmento determinado por los puntos A’ y C’. Así pues transforma puntos alineados en puntos alineados.
8/24
PROP Los giros transforman circunferencias en circunferencias del mismo radio. Dem. Sea GO,α un giro de centro O y ángulo α. Sea también una circunferencia de centro el punto C y radio r. La imagen de C será un punto GO,α(C)=C’ y teniendo en cuenta que conserva las distancias, transforma una circunferencia en otra. Como consecuencia de estas propiedades podemos deducir que los giros son transformaciones directas, ya que mantienen el sentido de los ángulos. Podemos definir el conjunto de todos los giros de centro O como: GO={ GO,α / α∈3} DEF En el conjunto GO definimos la operación interna llamada composición o producto como: GO , β o GO ,α = GO ,α + β La operación es interna, ya que dado un punto A cualquiera del plano tenemos que al aplicarle la composición, la primera aplicación lo gira un ángulo α y la segunda lo gira un ángulo β. Por tanto el resultado final ha sido un giro suma de ángulos, que es otra aplicación que está en el conjunto GO. PROP El conjunto GO con la operación de composición o producto verifica las siguientes propiedades: 1) 2) 3) 4)
Conmutativa. Asociativa. Elemento Neutro, GO,0º. Elemento Opuesto, dado GO,α su opuesto es GO,-α. Dem. Inmediata.
Conclusión: El conjunto de todos los giros con el mismo centro con la operación de composición o producto tiene estructura de grupo conmutativo. (GO ,o ) Grupo Conmutativo. 3.3. Simetrías. 3.3.1. Simetría Central. DEF Dada una recta r, consideremos una semirrecta suya con origen en el punto O. Llamaremos Simetría Central de centro O al movimiento que transforma la semirrecta
9/24
de origen en O en su semirrecta opuesta, y cada semiplano determinado por la semirrecta en el semiplano opuesto. Podemos dar como definición equivalente de simetría central la siguiente: DEF2 Llamamos simetría central de centro O a una aplicación del plano en sí mismo que transforma cada punto A en otro A’ verificando que el segmento AA’ tiene como punto medio a O CARACTERÍSTICAS. 1) Las simetrías centrales son movimientos directos, ya que los semiplanos quedan ambos a la derecha o a la izquierda de las semirrectas consideradas. 2) El punto O es el único punto invariante de la aplicación, también llamado punto doble. 3) Si A es un punto cualquiera del plano y A’ su imagen, se verifica que OA' = −OA . Si B es otro punto del plano, también se verifica que OB ' = −OB y de aquí deducimos que
A B
O
R'
R
A' B ' = OB ' − OA' = −OB + OA = − AB
B' A'
PROP Las Simetrías Centrales verifican las siguientes propiedades: 1) Las rectas que pasan por el centro de simetría se transforman en ellas mismas, es decir, son invariantes. 2) Las rectas que no pasan por el centro de simetría se transforman en rectas paralelas. 3) Conservan las distancias y los ángulos. 4) Son aplicaciones involutivas, lo cual significa que aplicadas dos veces se convierten en la aplicación unidad o identidad. Dem. La demostración es inmediata sin más que tener en cuenta que una simetría central de centro O es equivalente a un giro de centro O y ángulo 180º. En general, las simetrías centrales verifican las mismas propiedades que los giros, ya que son un caso especial de éstos. 3.3.2. Simetría Axial. DEF Llamaremos Simetría Axial de eje r al movimiento del plano que deja invariante una semirrecta OR situada en la recta r, cambiando los semiplanos que determina.
10/24
Otra definición alternativa de simetría axial podría ser la siguiente: DEF2 Dada una recta r, llamaremos Simetría Axial de eje r a la aplicación del plano en sí mismo que asocia a cada punto A del plano otro punto A’ tal que el segmento AA’ tiene como mediatriz a la recta r. PROP Las simetrías axiales son transformaciones involutivas, es decir, aplicadas dos veces se convierten en la aplicación identidad. PROP Los puntos que forman el eje de una simetría axial son invariantes por la simetría. Dem. Supongamos que no es cierto. Sea P un punto del eje r y P’ su imagen por la simetría. Por la primera definición, el segmento OP se transforma en OP’, siendo uno parte del otro. Y eso es una contradicción con los axiomas de movimiento. PROP Toda recta perpendicular al eje r de una simetría, se transforma en sí misma. Dem. Dado un punto A no perteneciente al eje r de la simetría se transforma en A’ verificando que el eje r es la mediatriz del segmento que determinan. Por tanto, la recta que contiene al segmento AA’ es perpendicular al eje (por definición de mediatriz). Luego todo punto de una recta perpendicular se transforma en otro punto de la propia recta. Como conclusión obtenemos que las rectas perpendiculares al eje son invariantes. PROP Toda simetría axial es una isometría, es decir, conserva las distancias. Dem. Tenemos que demostrar que el módulo del vector AB coincide con el del vector A’B’. Para ello demostraremos que los triángulos rectángulos APB y A’QB’ son semejantes. Obtenemos los puntos P y Q trazando paralelas a r por B y B’ respectivamente, y están situados en la recta que contiene a los puntos A y A’.
A P
B
M Q
N B'
r
A' Por definición de simetría tenemos que AM=MA’, BN=NB’ y PM=MQ Por la manera de obtener P tenemos que PM=BN y MQ=NB’. Entonces AM = AP + PM = AP + BN MA’ = MQ + QA’ = NB’ + QA’ = BN + QA’
11/24
Y deducimos que AP = QA’ Como B y B’ están en la misma recta perpendicular a r y P y Q también están en otra recta perpendicular a r, tenemos que los cuatro puntos BB’QP determinan un paralelogramo, por lo que PB=QB’. Así pues tenemos que ambos triángulos tienen dos lados iguales y el ángulo rectángulo también, por tanto, aplicando un criterio de semejanza de triángulos tenemos que ambos triángulos son semejantes. De lo cual se deduce que el tercer lado de ambos triángulos también coincide, verificándose que AB = A’B’ PROP Las Simetrías Axiales transforman puntos alineados en puntos alineados. Dem. Sea r el eje de simetría y sean A, B y C tres puntos alineados, situados en el mismo semiplano. Sus imágenes por la simetría son, respectivamente, A’, B’ y C’. Por la proposición anterior se conservan las distancias, luego: AB = A’B’
BC = B’C’
AC = A’C’
Y como
AC = AB + BC = A’B’ + B’C’
Entonces
A’C’ = A’B’ + B’C’
siendo B’ un punto interior del segmento A’C’. Por tanto A’, B’ y C’ están alineados. COROLARIO
Las simetrías axiales transforman rectas en rectas.
COROLARIO Las simetrías axiales transforman circunferencias en circunferencias del mismo radio. PROP Las simetrías axiales transforman ángulos en ángulos iguales pero de sentido contrario. Dem. Una semirrecta s con origen en un punto O del eje de simetría r se transforma en otra semirrecta s’ con el mismo origen, pues O es un punto invariante. El ángulo que forma s con el eje r se transforma en el que forma s’ con el propio eje, que son iguales pero de sentido contrario, pues están en distinto semiplano. Conclusión: Las simetrías axiales son movimientos inversos.
12/24
4. COMPOSICIÓN DE MOVIMIENTOS. 4.1. Producto de Simetría axial por Traslación. DEF Llamaremos Antitraslación o Deslizamiento a todo movimiento que sea igual a la composición o producto de una simetría axial de eje r por una traslación paralela al eje r. El eje r recibe el nombre de eje de la antitraslación o eje del deslizamiento. El eje de una antitraslación o deslizamiento es la única recta invariante. B
Dado un vector AB, su imagen por la simetría axial es el vector A’B’ y aplicando la traslación de vector u nos da el vector A’’B’’
A
A''
A' u
B'' B'
Cuando la traslación no es paralela al eje r de la simetría se obtiene también una antitraslación, pero de eje r’ paralelo al eje r. A partir de un vector AB se obtiene por la simetría un vector A’B’ y aplicando la traslación de vector u obtenemos A’’B’’. B Para hallar el eje de simetría de la antitraslación r’, éste viene dado como A mediatriz del segmento que une el punto A’’ con el punto que se obtiene como r intersección de una paralela a r que pasa r' por Acon la perpendicular a r que pasa A' por A’’. A'' B'
B''
4.2. Producto de Simetrías Axiales. 4.2.1. Ejes paralelos. Sean dos simetrías axiales de ejes r y r’ respectivamente. Dado un punto cualquiera A, por la primera simetría obtenemos A’, y este punto tiene como imagen A’’ por la segunda simetría. Por tanto, la imagen de A por la composición de las dos simetrías es A’’, que está en la recta perpendicular a ambos ejes. Se verifica que AA' ' = 2ur , donde ur es el vector determinado por dos puntos, uno de cada eje, contenidos en una perpendicular a los mismos. Como esto sucede para todos los puntos, el producto de dos simetrías axiales de ejes paralelos es una traslación de vector 2· ur .
13/24
4.2.2. Ejes no Paralelos. Sean dos simetrías axiales de ejes r y r’ respectivamente y A un punto cualquiera del plano. Como los dos ejes no son paralelos, se cortan en un punto que llamaremos O y determinan un ángulo α.
A r
A'
α O r' A''
La imagen de A por la simetría de eje r es A’, y la imagen de este punto por la otra simetría es A’’. El ángulo ∠AOA’’=2α, ya que el eje r es la bisectriz de ∠AOA’ y el eje r’ es la bisectriz de ∠A’OA’’. Luego la composición de dos simetrías axiales de ejes no paralelos equivale a un giro de centro O y ángulo 2α. 4.3. Producto de Giros. Vamos a considerar la composición o producto de giros de distinto centro, ya que si tienen el mismo centro ya lo hemos visto (como una operación interna en el conjunto de los giros de centro O).
s' (α+ β )/2
r
C
α/2 β /2
Sean los giros GO,α y GO’,β . Supongamos que ambos ángulos son positivos.
O
s
O'
Trazamos la recta que pasa por los puntos OO’ y la llamamos r. Como el primer giro tiene amplitud α, trazamos una recta s que forma con la recta r un ángulo α/2. Entonces el giro GO,α se puede descomponer como producto de dos simetrías de ejes r y s respectivamente; GO ,α = S r o S s De forma análoga trazamos un eje s’ que forma con el eje r un ángulo β/2. Luego GO, β = S s' o S r Entonces GO , β o GO ,α = (S s ' o S r ) o ( S r o S s ) = S s ' o (S r o S r ) o S s = S s ' o S s Y como la composición de las simetrías de ejes s y s’ es un giro de centro C y ángulo α+β, tenemos que la composición de dos giros de diferente centro es otro giro con otro centro y ángulo suma de los otros dos.
14/24
4.4. Producto de Simetrías Centrales. Sea la primera simetría central la semirrecta con origen en O y la segunda simetría central con origen en O’.
A'
O
O'
A
A''
Se verifica: OA' = −OA O' A' ' = −O' A'
AA' ' = AA' + A' A' ' = 2OA' + 2 A' O' = 2OO '
Como la imagen de un punto por ambas simetrías no depende del punto elegido, tenemos que el producto de dos simetrías centrales de centros O y O’ es una traslación de vector 2OO ' 4.5. Producto de una Traslación por un Giro. u
Sea Tur una traslación de vector ur y GO,α un giro de centro O y ángulo α.
α/2
Sea r una recta perpendicular al vector ur que pasa por el centro de Giro O. Sea s una recta paralela a r, que verifica que mediante una traslación de vector ur /2 se transforma en r. Sea s’ la recta obtenida a partir de r al aplicarle el giro de centro O y ángulo α/2.. Entonces podemos descomponer:
O' O α/2
s'
Tur = S r o S s GO, ∂ = S s' o S r Entonces:
GO ,α o Tur = (S s ' o S r ) o ( S r o S s ) = S s ' o S s = GO ',α
Por tanto, la composición de una traslación con un giro es otro giro con el mismo ángulo que el anterior y distinto centro. 4.6. Producto de un Giro por una Traslación. Sea GO,α un giro de centro O y ángulo α y Tur una traslación de vector ur . Descomponemos el giro en producto de las simetrías Sr y Sr’, siendo r’ una recta
15/24
perpendicular al vector ur por el punto O. Descomponemos la traslación como producto de las simetrías Sr’ y Sr’’, cuya distancia es la mitad del vector ur . GO ,α = S r ' o S r
u O'
Tur = S r '' o S r '
α/2
O
Sustituyendo:
r Tur o GO ,α = S r '' o S r = GO ',α
α/2
r'
r''
El producto de ambas aplicaciones es un giro de centro O’ y ángulo α. Podemos observar que el producto de giros y traslaciones no es una operación conmutativa, ya que varía el centro de Giro. 5. MOVIMIENTOS. DEF Llamaremos Movimiento a toda transformación geométrica que se puede descomponer en un número finito de simetrías. Si el número de simetrías es par el movimiento es directo y si es impar diremos que es inverso. La definición tiene sentido pues acabamos de ver que las traslaciones y los giros se pueden expresar como producto de dos simetrías axiales. Por tanto, las traslaciones y los giros son movimientos directos. Igualmente, una simetría central es también un movimiento directo, pues se puede interpretar como un giro de ángulo π. PROP Todo movimiento directo puede reducirse a un producto de una traslación por un giro. Dem. Sean dos triángulos ABC y A’B’C’ dos triángulos homólogos en el movimiento. Una traslación de vector AA’ transforma el triángulo ABC en el triángulo A’B’’C’’. Si ahora aplicamos un giro de centro el punto A’ y ángulo α (siendo α el ángulo formado por los lados A’B’’ y A’B’) transformamos el triángulo A’B’’C’’ en A’B’C’. Si el movimiento fuese inverso, tendríamos que añadir a la traslación y al giro una simetría axial de eje A’B’. OBS La descomposición anterior no es única ya que podemos encontrar otras con una reducción mayor. TEOREMA. Teorema de Chasles. Sean A y B dos puntos del plano y A’ y B’ sus imágenes por un movimiento. 1) Si los vectores AB y A’B’ no son equipolentes y tienen distinta dirección pero igual módulo, el movimiento puede reducirse a un giro.
16/24
2) Si tienen la misma dirección y módulo, pero no son equipolentes, se reduce a una simetría central. 3) Si son equipolentes, se reduce a una traslación. Dem. 1) Las mediatrices de los segmentos AB y A’B’ se cortan en un cierto punto O, que será invariante por la aplicación y centro de un giro de amplitud ∠AOA’.
B
O A
α A'
B'
2) En este caso los dos segmentos determinan univocamente una simetría central que tendrá de centro el punto medio de AA’ o de BB’.
B
O
A'
A B'
3) B
En este caso, la aplicación que transforma uno en otro es una traslación de vector AA’. B'
A A'
Como conclusión a todo lo que hemos visto, podemos resumir que: • • • •
• •
Todo movimiento directo se puede reducir a una composición de un número par de simetrías axiales, que podemos limitar a dos. Todo movimiento inverso se puede reducir a una composición de un número impar de simetrías axiales, que podemos limitar a tres. Las simetrías axiales son las transformaciones elementales del grupo de los movimientos. Un movimiento sin puntos dobles es una traslación o una composición de traslación y simetría axial (dependiendo que que existan dos o más rectas invariantes o sólo una). Un movimiento con tres puntos invariantes no alineados es la identidad. Un movimiento (excluyendo la identidad) con al menos dos puntos invariantes es una simetría axial.
17/24
•
Un movimiento con un único punto invariante es un giro o rotación.
6. TESELACIONES DEL PLANO. DEF Llamamos Teselación del plano a una o varias figuras planas que al repetirse con regularidad pueden llenar el plano. Los movimientos que se pueden aplicar a la figura o figuras del plano son: 1) 2) 3) 4)
Simetrías axiales. Traslaciones. Giros. Antitraslaciones o Deslizamientos.
Las aplicaciones de las teselaciones nos las podemos encontrar en los frisos y mosaicos. 6.1. Frisos. Los frisos son también conocidos con el nombre de cenefas y son figuras donde el autor utiliza su ingenio geométrico para crear belleza por medio de la repetición. Podemos afirmar que los primeros frisos fueron las hileras de dólmenes prehistóricos, luego los podemos encontrar en las decoraciones de los templos egipcios y griegos, en las decoraciones textiles romanas, etc. En España los podemos encontrar en su máximo esplendor en la edificación musulmana de la Alhambra (Granada). DEF Sea una cierta figura F y sea S(F) el grupo de simetría de F (S(F)=conjunto de isometrías que dejan invariante F). Diremos que F es un Friso si verifica las dos condiciones siguientes: 1) Existe una recta r (que puede estar o no dibujada) que indica la acción y desarrollo del friso y que permanece invariante por todas las isometrías de S(F). 2) Existe una traslación Tur de vector no nulo y paralelo a r que verifica que dada cualquier otra traslación Tvr que deja invariante el friso, el vector vr es un múltiplo entero de ur . 6.1.1. Tipos de Movimientos en los Frisos. a) Simetrías Axiales en Frisos. Nos podemos encontrar una simetría axial respecto de la recta r, Sr, y otra simetrías Sr’, siendo r’ una recta perpendicular a r. También es posible tener más simetrías Sr’’, siendo r’’ rectas paralela a r’ y situadas a una distancia mitad del vector ur o múltiplos enteros de ur . b) Giros en Frisos.
18/24
Son posibles todos los giros de centro un punto O situado en la recta r y ángulo 180º.. Puede existir más de un giro, pero todos debes de verificar que sus centros se obtienen como traslación de vector múltiplo entero de ur de uno cualquiera de ellos. c) Antitraslaciones en Frisos. Las únicas antitraslaciones posibles son las que se obtienen de multiplicar la 1 simetría axial de eje r, Sr, con traslaciones de vector n ur , T1 r . nu 2 1 6.1.2. Clasificación de Frisos. La clasificación la vamos a realizar en función de los movimientos que se efectúen para la obtención del Friso. a) Traslación. Disponemos de una figura que desplazamos a la derecha por medio de una traslación de vector ur .
b) Traslación y simetría axial de eje paralelo al vector de la traslación. A partir de una figura obtenemos el friso por medio de una traslación de vector ur y sus múltiplos enteros y luego aplicamos una simetría axial. respecto de un determinado eje paralelo a ur .
c) Simetría axial y traslación de vector perpendicular al eje de la simetría. Dada una figura, realizamos una simetría de eje r y luego sucesivas traslaciones de vector ur perpendicular al eje de simetría. Aparecen así infinitas simetrías obtenidas por traslación del eje r según múltiplos enteros de ur .
d) Traslación y antitraslación.
19/24
Dada una determinada figura, se realiza una traslación Tur y una antitraslación de 1 vector + n ur y eje r, T 1 r o S r . + n u 2 2
e) Giro de 180º y traslación. Dada una figura, realizamos un giro de centro C situado en una recta r y 180º. A continuación aplicamos traslaciones de vector múltiplos de ur , siendo éste paralelo a la recta r.
f) Simetría Axial, Giro de 180º y Traslación. Se basa en el friso anterior, al que le añadimos una simetría axial de eje r.
g) Giro, Antitraslación y Traslación. Aplicando estos movimientos surgen simetrías axiales respecto de ejes verticales, pero no aparece la simetría axial de eje paralelo al vector ur de la traslación.
6.2. Mosaicos. Los Mosaicos aparecen al intentar recubrir el plano de forma que no queden agujeros ni se produzcan solapamientos. A lo largo de la historia se han utilizado unos pocos diseños geométricos básicos. Se piensa que en el viejo Egipto ya conocían de la existencia de 17 formas de recubrir el plano mediante mosaicos periódicos, y en la Alhambra de Granada existe una representación de 17 modelos. Fue el cristalógrafo ruso Fedorov quien demostró en 1981 que sólo hay 17 estructuras básicas en mosaicos periódicos.
20/24
6.2.1. Tipos de Mosaicos. a) Mosaicos Regulares. DEF Son aquellos formados por baldosas iguales con forma de polígono regular. Los casos que nos podemos encontrar son baldosas con forma de: • • •
Triángulos equiláteros. Cuadrados. Hexágonos regulares.
Para que estas baldosas recubran completamente el plano, basta con que verifiquen la siguiente propiedad: Si giramos el polígono regular con centro en uno de sus vértices y ángulo igual al ángulo interior del polígono, al cabo de un número finito de giros, n, alcanzamos la posición inicial, siendo el producto de n por el ángulo de giro igual a 360º.
Otra forma de obtener mosaicos es desplazando unas filas con respecto a otras, siempre que se pueda.
También podemos obtener otros mosaicos sin que verifiquen la propiedad anterior. Basta con que estén formados por paralelogramos y triángulos isósceles con una cierta equiangularidad o equilateralidad. Son, por ejemplo:
21/24
b) Polígonos Cuasirregulares. DEF Diremos que un polígono es Cuasirregular si está formado con baldosas iguales y los polígonos que se forman al unir los puntos medios de sus lados o unir sus centros determinan nuevos polígonos regulares. Como ejemplo de obtención uniendo sus puntos medios tenemos:
c) Mosaicos Semirregulares. DEF Diremos que un mosaico es semirregular si está compuesto por dos o más tipos de polígonos regulares en los que existe un único tipo de polígono regular obtenido al unir sus puntos medios. 22/24
DEF Diremos que un mosaico es semirregular si está compuesto por dos o más tipos de polígonos regulares en los que su distribución alrededor de cualquier vértice del mosaico es siempre la misma. Los ocho mosaicos semirregulares que existen son:
d) Mosaicos Pararregulares. Son mosaicos formados por polígonos no regulares. e) Mosaicos de Escher. El matemático holandés Maurits Escher, conocido por sus configuraciones imposibles, también intervino en el proceso de construcción de mosaidos. A partir de una cierta loseta básica, realizaba modificaciones pero manteniendo el área de la misma. Un ejemplo es el siguiente mosaico, en el que utiliza figuras de animales:
23/24
Bibliografía Recomendada. Curso de Álgebra y Geometría. Aut. Juan de Burgos. Ed. Alhambra Universidad. Geometría Métrica y Proyectiva. Aut. Puig Adam. Matemáticas de 4º de E.S.O. Diferentes editoriales.
24/24
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 42 HOMOTECIA Y SEMEJANZA EN EL PLANO.
1. Introducción. 2. Homotecias en el plano. 2.1. Propiedades de la homotecia en el plano. 2.2. Producto de homotecias. 2.2.1. Producto de homotecias del mismo centro. 2.2.2. Producto de dos homotecias de distinto centro. 3. Semejanza en el plano 3.1. Propiedades de la semejanza. 3.2. Producto de semejanzas. 3.3. Construcción del centro de semejanza directa. 3.4. Ecuaciones de la semejanza. Bibliografía Recomendada.
1/19
TEMA 42 HOMOTECIA Y SEMEJANZA EN EL PLANO. 1. INTRODUCCIÓN. Vamos a indicar algunos teoremas y propiedades de los que haremos uso a lo largo del tema Teorema de Thales. Los segmentos limitados por los puntos de intersección de varias paralelas en dos secantes, son proporcionales. Teorema recíproco al de Thales.
s
r
Si los segmentos A´B´ y A´C´ son proporcionales a AB y AC siendo las rectas a y b paralelas, se verifica que la recta c es paralela a la b, o bien los puntos A y A´ coincidentes.
a b c
A B C
A' B' C'
Razón simple de tres puntos. Dados tres puntos A,B,C de una recta se determina el cociente, AB/AC que se representa (ABC) de las distancias del primero al segundo y al tercero. A este cociente se le llama razón simple. Ya que AC=tAB (ABC)=t Movimientos. En toda aplicación biyectiva que conserva la distancia -
Los movimientos transforman rectas en rectas Conservan los ángulos.
2. HOMOTECIAS EN EL PLANO. Definición. Sea O un punto del plano y k un número real, k≠ 0 . Llamaremos homotecia de centro O y razón k, y la designaremos por Ho,k a la aplicación del plano en sí mismo que hace corresponder a cada punto P distinto de O, otro punto P´ tal que OP´=kOP. Al punto P´ se le llama homotetico de P y se escribe 2/19
Ho,k(P)=P´ De la definición se deduce que O, P, P´ están alienados. Si k>0 P y P´ están en la misma semirrecta de origen O. P' P
O
Si k<0 P y P´ están separados por el centro O
P'
O
P
Cuando k=1 OP´=-OP es decir P y P’ coinciden. Por lo tanto la homotecia Ho,k=I identidad. Cuando k=-1 OP’=-OP la homotecia es una simetría de centro C. Proposición. a) Si k=1 todos los puntos son invariantes. b) Si k ≠ 1 el único punto invariante es el centro de la homotecia. c) Las rectas que pasan por el centro de la homotecia son invariantes globalmente. Demostración. a) Si k=1 Ho,k=I y la identidad mantiene todos los puntos invariantes. b) Si P es un punto invariante y P´ es su homotetico tal que P=P´ OP = kOP ⇒ OP − kOP = 0 ⇒ (1 − k ) OP = 0 y como k ≠ 1 ⇒ OP=0 luego P=0 c) Es inmediata por la definición de homotecia. Proposición. Sea Ho,k una homotecia. Entonces se verifica que Ho,k es una biyección. Demostración. Por la definición tenemos que Ho,k es una aplicación. Demostraremos que Ho,k es una biyección, probando la existencia de una aplicación inversa de Ho,k. Sea H o , k −1 la homotecia de centro O y razón k −1 . Sea P un punto P ≠ 0 y probemos que H o , k −1 o Ho,k =I
3/19
H o , k −1 (Ho,k (P))= H o , k −1 (P´)=P´´ Como Ho,k (P)=P´
O,P,P´ están alineados y OP´=k OP.
Como H o , k −1 (P´)=P´´ O, P´,P´´ están alineados y OP´= k −1 OP´. Como O, P, P´ están alineados y O, P´, P´´ están alineados entonces O,P,P´,P´´ están alineados entonces O,P,P´´ están alineados y OP´´= k −1 OP´= k −1 kOP=OP
⇔
P´´=P
y como P es un punto cualquiera del plano, se deduce H o , k −1 o Ho,k =I. De forma análoga se demuestra Ho,k o H o , k −1 =I. Por lo tanto ∃ Ho , k −1 tal que
H o , k o H o ,k −1 = I H o , k −1 o H o ,k = I
Ho,k es una biyección
2.1. Propiedades de la homotecia en el plano. Proposición 1. La razón de las distancias entre dos puntos homólogos y sus originales es igual a la razón de la homotecia en valor absoluto. Demostración. Sea P, Q dos puntos cualesquiera del plano P´, Q´ sus transformadas por una homotecia de centro O y razón k. Entonces se cumple OP´ OQ´ OP´=kOP OQ´=kOQ luego = =k OP OQ O
Sea C el punto en el que la paralela a OP trazada por Q´ corta a la recta PQ. Por el teorema de Thales se deduce que (QPC)=(QOQ´) P
P'
C
Q
Utilizando las propiedades de las razones simples (PCQ)=(OQ´Q)=k es decir PC OQ´ = =k PQ OQ
Q'
PC =k PQ
Pero como PCQ´P´ es un paralelogramo ya que PQ//P´Q´ (por el reciproco del teorema de Thales) y PP´//CQ´ por construcción resulta que PC=P´Q´
4/19
P´Q´ =k PQ
Luego
o
d ( P´, Q´) =k d ( P, Q )
Proposición 2. Si P, Q son dos puntos del plano y P´, Q´ son sus homólogos es una transformación H en el plano tal que P´Q´=k PQ, entonces H es una homotecia si k ≠ 1 y una traslación si k=1. Demostración. Si k=1 P´Q´=PQ y como los segmentos P´Q´ y PQ son paralelos y d ( P´, Q´) = 1 ⇒ PP´= QQ´ d ( P, Q ) lo cual indica que H es una traslación del vector PP´. Si k ≠ 1 PP´ no es paralela a QQ´ y por lo tanto se cortan en un punto que llamamos O. d ( P´, Q´) = k y como los puntos O, P, P´ y O, Q, d ( P, Q ) Q´ están alineados la transformación es una homotecia de centro O y razó n k. Como P´Q´=k PQ tenemos que
Proposición 3. Las homotecias transforman puntos alineados en puntos alineados. Demostración. En efecto. Sean P, Q, R tres puntos alineados y sean P´, Q´, y R´ sus homólogos mediante Ho,k. Se trata de demostrar que P´, Q´ y R´ están alineados. De acuerdo con la Proposición 1 se tiene: P´Q´= k PQ
P´r´= k PR
Q´R´= k QR
Si P, Q y R están alineados, uno de los tres puntos estará situado entre los dos restantes. Sea por ejemplo Q∈PR. Entonces se tiene: PR=PQ+QR Luego
k PR = k ( PQ + QR ) = k PQ + k QR
esto es
P´R´=P´Q´+Q´R´
Con esto queda demostrado no solo que P´, Q´, y R´ forman una recta, sino que además, si Q esta entre P y R, Q´ esta entre P´ y R´. Es decir las homotecias trans forman rectas en rectas y conservan la posición relativa de los puntos.
5/19
Nota. Cuando decimos que las homotecias forman rectas en rectas queremos decir que transforman puntos de una recta en puntos de una recta ya que una homotecia es una aplicación entre puntos. Proposición 4. Las homotecias transforman rectas paralelas en rectas paralelas. Demostración. Sea Ho,k una homotecia, sean P y Q los puntos que determinan la recta y P´, Q´ sus transformadas por Ho,k. Se trata de demostrar que la recta PQ es paralela a la recta P´Q´. a) Q∈OP. Como por la definición de homotecia O,P,P´ están alineado y O,Q,Q´ también. Tenemos que P´,Q´∈PQ. Entonces las rectas PQ y P´Q´, son paralelas, porque coinciden. OQ´ OP´ b) Q∉OP. Como OP´=k OP y OQ´=k OQ, tenemos que = = k y por el OQ OP reciproco del teorema de Thales se tiene que las rectas PQ y P´Q´´ son paralelas. Proposición 5. Los homotecios transforman puntos no alineados en puntos no alineados. Demostracion. Si P,Q,R no estan alineados, debera tenerse que: PR < PQ + QR
PR > PQ − QR
Sean P´,Q´ y R´ los transformados por la homotecia Ho,k entonces se tiene que: P´R´ = K PR
P´Q´ = K PQ
Q´R´ = K QR
(Prop1)
Como K >0, multiplicando las desigualdades por K K PR < K PQ + K QR
K PR > K PQ − K QR
luego P´R´ < P´Q´ + Q´R´ P´R´ > P´Q´ − Q´R´
esto es P´,R´ y Q´ no estan alineados.
Proposición 6. Las homotecias transforman segmentos en segmentos.
6/19
Demostracion. Como consecuencia de la proposición 3. Proposición 7. Las homotecias transforman triangulos en triangulos semejantes. Demostracion. (Dos triángulos son semejantes si tienen sus ángulos homólogos iguales y sus lados correspondientes proporcionales). Sea ABC un triangulo y sean A´= Ho,k (A), B´= Ho,k (B), y C´= Ho,k (C). Se trata de demostrar que A´B´C´ es un triangulo semejante al ABC. Por la proposicion 5
A,B,C no alineados ⇒ A´,B´,C´ no alineados.
luego A´B´C´ constituyen un triangulo. Por la proposicion 1 se tiene que A´B´= K AB B´C´= K BC A´C´= K AC. luego los triangulos ABC y A´B´C´ tienen sus lados proporcionales. Bastara por tanto demostrar que tienen sus angulos homologos iguales. Consideremos, por ejemplo, el angulo CAB. A
A'
B"
B' O
C" C'
B
C Trazando por C´ una recta paralela a la A´A se obtiene en su interseccion con AC, el punto C´´ tal que AC´´=A´C´. Del mismo modo, en la semirecta de origen A que contiene a B existe un punto B´´ tal que AB´´=A´B´ Por lo tanto se tiene AC´´ = AC AB´´ = AB Luego
A´C´ =K AC A´B´ =K AB
AC´´ AB´´ = = K AC AB 7/19
Esto nos indica que B´´ y C ´´ son las transformaciones respectivas de B y C, en la homotecia de cnetro A y razon K , luego por la proposicion 1 se tiene: B´´C´´ = K ⇔ B´´C´´= K BC = B´C´ BC Por tanto, los triangulos AB´´C´´ y A´B´C´ son iguales por tener sus lados iguales: AB´´=A´B´ y AC´´=A´C´
por construccion y
B´´C´´=B´C´según hemos visto en . Luego AB´´C´´ y A´B´C´ tendran sus angulos correspondientes, respectivamente iguales. En particular B´A´C´=B´´AC´´. Pero la eleccion de B´´ y C´´se tiene que B´´AC´´=BAC. Analogamente probariamos la igualdad de los otros angulos. Con lo que queda demostrado que los homotecios tranforman triangulos en triangulos semejantes. Proposición 8. Los homotecios transforman circunferencias en circunferencias. Demostracion. Sea una circunferencia de centro C y radio r. Su transformada por una homotecia de centro O y razon k es otra circunferencia de centro C´=Ho,k(C) y radio r´= K r, pues se verifica que d(C´,P´) K d(C,P) P' P
r' r
O
OP´= KOP OC´= KOC
C
C'
OP´ OC´ = =K OP OC
Por la propiedad 1
C´P´ = K CP
Proposición 9. Dadas dos circunferencias cualesquiera siempre hay dos homotecias, una de razon k>0 y otra de razon k´<0, respecto de los cuales las dos circunferencias son homoteticas.
8/19
Demostración. P
P'
r C
O'
r' C'
O P"
Sean las circunferencias de radios r y r´ y centros C y C´, tracemos sobre la primera circunferencia un radio CP y sobre la segunda, los radios opuestos C´P´ y C´P´´ paralelos a CP. Las rectas PP´ y CC´ se cortan en el punto O, que es el cnetro de una homotecia de razon k>0 que transforma la primera circunferencia en la segunda ya que: OP´ OC´ = =K OP OC
siendo K>0 la razon de la homotecia.
Las rectas que determinan CC´ y PP´´ se cortan en el punto O´, que es el centro de la homotecia de razon K´<0, K´=-K que transforma la primera circunferencia en la segunda. En efecto O´P´´ O´C´ = = K´ O´P O´C
siendo K la razon. K´=-K ya que
K´
C´P´´ − C´P´ = = −K CP CP
Proposición 10. Sean AB, CD dos segmentos paralelos distintos, no situados en la misma recta. Entonces existen dos homotecios h1 y h2 que transforman AB en CD. O
Demostración. Sean O=AC∩BD y O´=AD∩BC. Demostramos que la homotecia de centro O y OC razon k = transforma AB en CD. Para ello OA teniendo en cuenta las propiedades anteriores, bastara demostrar que Ho,k(A)=C Ho,k (B)=D.
A
B O'
C
D
Sea Ho,k (A)=A´ por definición de Ho,k, O, A, A´ estan alineados y verifican OA´ OC =k= OA OA
⇔
OA´= OC
⇒
A´= C luego Ho,k (A)=C
Sea Ho,k (B)=B´ ⇒ O, B, B´ estan alineados OB´ OC OD =k= = ⇒ OB´= OD ⇒ B´= D OB OA OB
9/19
Luego Ho,k (B)=D
Demostraremos ahora que la homotecia de centro O´ y razon k ´=
O´C transforman O´B
AB en CD, para ello probaremos que Ho´,k´ (A)=D y Ho´,k´(B)=C Sea Ho´,k´ (A)=A´ y O´, A, A´ estan alineados y cumplen que O´ A´ O´C =k = O´ A O´ A
⇒ O´ A´= O´D ⇒
A´= D luego Ho´,k´(A)=D
De forma análoga Ho´,k´ (B)=C Por tanto existen dos homotecias que transforman el segmento AB en el CD Proposición 11. Sean AB y CD dos segmentos de la misma recta y tales que AC ≠ BD. Entonces se verifica que existe una unica homotecia que transforman AB en CD. Demostración. Supongamos que exista la homotecia y sea O su centro. Entonces Ho,k(A)=C y Ho,k (B)=D
OC OD = =k OA OB
⇒
De acuerdo con las propiedades de las proporciones AO BO = CO DO
⇒
AO CO CA + AO = = BO DO DB + BO AO CA = BO DB
Por lo tanto se tiene
Como AC ≠ BD
⇒
AC ≠1 BD
Por tanto
Sea
AO =k BO
⇒
⇒
AO CO + AO CA = = BO DO + BO DB
OA AC = OB BD
AC =k BD ⇔
AO = kBO
Es decir, O es unico. La homotecia es pues una homotecia de centro O y razon
OA OC
2.2 Producto de homotecias. 2.2.1. Producto de homotecias del mismo centro. El producto de dos homotecias del mismo centro es otra homotecia del mismo centro y de razon el producto de las razones de las homotecias.
10/19
Demostración. Sean Ho,k1 y Ho,k2 dos homotecias. Si P es un punto del plano, Ho,k1 (P)=P´ y Ho ,k2 (P´)=P´´ se cumple OP´= k1 OP OP´´= k2 OP´ Luego OP´´= k2 OP´= k2 k1 OP⇒ P´´ es el transformado de P por una homotecia de centro O y razon k1 k2 . Luego Ho, k2 Ho, k1 =Ho, k1 k2. Proposición. La inversa de Ho,k es Ho,1/k . Demostración. Si P y P´ son puntos homoteticos tendremos OP´ OP 1 =k⇔ = OP OP´ k
Ho,k Ho,1/k =Ho,1
Consecuencia: el conjunto de las homtecias de centro un punto dado, con el producto definido forma un grupo abeliano. 2.2.2 Producto de dos homotecias de distinto centro. El producto de dos homotecias de distinto centro es otra homotecia cuyo centro esta alineado con los anteriores y cuya razon es el producto de las razones de las homotecias dadas. Demostración. Sean Ho1,k1 y Ho2,k2 , dos homotecias. P' P Q' O1
P"
Q
Q"
O2
O3
Consideremos los puntos P y Q del plano, que se transforman por Ho1,k1 en P´, Q´. Estos ultimos se transforman a su vez en A´´, B´´ por Ho2,k2. Se verifica que:
11/19
O1 P´ O1 Q´ P´Q´ = = = k1 O1 P O1Q PQ O2 P´´ O2 Q´´ P´´Q´´ = = = k2 O2 P´ O2 Q´ P´Q´
⇒
P´´Q´´ = k1 ⋅ k 2 PQ
que define una homotecia de razon k 1 ⋅ k 2 . Como la recta O1 O2 es homologa a las dos homotecias, tambien lo sera a su producto y por tanto estara en ella el centro O3 de la homotecia producto. Luego Ho2 ,k2 Ho1,k1= Ho3,k1k2 . Si k1 k2 =1. la homotecia es una traslación. 2.3 Ecuaciones de la homotecia. r r Sea R= O, i , j un sistema de referencia ortonormal del plano.
{
}
O'(a,b) P(x,y) P'(x',y')
j O
i
Consideramos la homotecia Ho´,k con centro O´(a,b) y razón k que transforma P(x,y) en P´(x´,y´) O´P´=k O´P OP´=OO´+O´P´=OO´+k O´P Sustituyendo sus componentes queda (x´,y´)=(a,b)+k(x-a,y-b) x ' = a + k ( x − a) x ' = kx + (1 − k )a o bien y ' = b + k ( y − b ) y ' = ky + (1 − k )b Que son las ecuaciones de la homotecia con centro O´(a,b) y razon k. Si añadimos 1=1 se puede escribir en forma matricial.
12/19
(1,x´,y´)= (1 x
1 (1 − k )b (1 − k )b y ) 0 k 0 0 0 k
3 SEMEJANZA EN EL PLANO Definición. Se llama semjanza en el plano a toda aplicación del plano en si mismo, que puede descomponer en producto de una homotecia por un movimiento o de un movimiento por una homotecia. Si el movimiento es directo, la semejanza se llama directa y si el movimiento es inverso, la semejanza se llama inversa. En particular, si consideramosn la homotecia identidad. Las semejanzas son movimientos. 3.1 Propiedades de las semejanzas. Proposición 1. La razon de las longitudes de dos segmentos homologos es una semejanza es constante. A esa constante le llamaremos razon de semejanza. Demostración. Consideremos una semejanzas S igual al producto de una homotecia Ho,k y de un movimiento M, es decir, S=mo Ho,k. Sea A y B dos puntos del plano cuyas transformadas por la homotecia son A´ y B´, y que se transforman a su vez en A´´, B´´ por el movimiento M. Se verifica entonces que: A´B´=A´´B´´ y A´B´=k AB A´´B´´= k ⋅ AB ⇒ d ( A´´, B´´) = k D( A, B ) ⇒
de donde d ( A´´, B´´) =k d ( A, B)
siendo k la razon de la homotecia, k es la razon de la semejanza. Nota: Cuando se habla de razon de semejanza se supone k>0.
Proposición 2.
13/19
Las semejanzas transforman puntos alineados en puntos alineados y como consecuencia rectas en rectas. Demostración. Sean A, B, C tres puntos alineados, para los puntos semejantes tenemos que aplicar una homotecia y un movimiento. Como la homotecia y el movimiento conservan la alineación, los puntos semejantes estan alineados. Proposición 3. Las semejanzas transforman angulos en angulos iguales, del mismo sentido si la semejanza es directa y de sentido contrario si esinversa. Demostracion. Las homotecias conservan angulos y el sentido, por lo tanto, si la semejanza es directa, el movimiento es directo y conserva angulos y sentido. Si la semejanza es inversa, el movimiento tambien y cambia el sentido de los angulos. Observación. Teniendo en cuenta las propiedades anteriores se dice que dos figuras son semejantes cuando tienen los angulos correspondientes iguales y los lados homologos proporcionales. 3.2 Producto de semejanzas Proposición. El producto de dos semejanzas de razones k1 , y k2 es otra semejanza de razón k1 ⋅ k 2 . Demostración. En efecto, sean A, B dos puntos del plano que se transforman en A´, B´ respectivamente, por una semejanza de razón k1 y sean A´´, B´´ las transformadas de A´, B´ por la semejanza de razon k2 . Se verifica que d ( A´, B´) = k1 d ( A, B)
d ( A´´, B´´) = k 2 d ( A´, B´)
⇒
d ( A´´, B´´) = k 2 k1 d ( A, B )
lo que indica que el producto de semejanzas de razon k 1 ⋅ k 2 .
Proposición. 14/19
Existe el elemento inverso de una semejanza. Demostración. Supongamos que S es igual al producto de una homotecia H por un movimiento M, es decir S=MH. Tanto H como M tienen inversos H −1 y M −1 y por tanto H −1 o M −1 existe. Veremos que H −1 o M − 1 = S −1 S o S −1 ( M o H ) o ( H −1 o M −1 ) = M o I o M −1 = M o M −1 = I S −1 o S ( H −1 o M −1 ) o ( M o H ) = H −1 o I o H = H −1 o H = I Conclusión: el conjunto de las semejanzas del plano, con el producto definido, forman un grupo no conmutativo. El grupo se llama equiforme porque las semejanzas conservan la forma de las figuras. El conjunto de las emejanzas directas es un subgrupo del anterior, no asi el de las semejanzas inversas ya que el producto de dos semejanzas inversas es un directa. Teorema fundamental de la semejanza. Existe una unica semejanza que transforma un triangulo en otro semejante a el. Demostración B
B B2
α B1
A P x
A' C2
C C1
α
C'
Existencia. Sea el triangulo ABC, semejante al A´,B´,C´, es decir, ambos triangulos tienen sus angulos respectivamente iguales y sus lados proporcionales. La traslación t AA ' de vector AA´, transforma el triangulo ABC en el triangulo A´B1 C1 , por tanto 15/19
ABC t AA ' → A´ B1 C1 El giro de centro A´ y ángulo orientado B1 A´B2 de semirrecta origen A´B1 y de semirrecta extremo A´B´, transforma B1 en B2 . Luego el triangulo
A´B1 C1 , G( A' B1 A' B2 ) → A´B2 C2 ,
En la composición G(A´)o t AA ' ABC
t AA'
A'B1C1
G(A',B1A'B2)
G(A',B1A'B2)
o
A'B2C2
t AA'
Puede ocurrir que en el G(A´,B,A´B2 ), la semirrecta A´ C2 coincida cona la A´C´ (como indica en la figura), o bien estas dos semirrectas pudieran ser simétricas respecto de la A´B´. En este ultimo caso es necesario aplicar al A´B2 C2 una simetría axial de eje A´B´ con lo que se obtendría un A´B2 C3 igual al A´B2 C2 que tendría el angulo B2 A´C 2 coincidiendo como ocurre en nuestro caso, con el B´A´C´. Situados ya los dos triangulos. 1º caso A´B´C´ y A´B2 C2 . 2º caso A´B´C´ y A´B2 C3 . con estos dos angulos coincidiendo, esto es 1º caso A´B´C´ coincidiria con A´B2 C2 . 2º caso A´B´C´ coincidiria con A´B2 C3 . se tiene que la proporcionalidad 1º caso
A´ B2 A´C2 = A´ B´ A´C´
2º caso
A´ B2 A´C3 = A´ B´ A´C´
Existe por tanto en ambos caso una homotecia de centro A´ y razon k (la obtenida anteriormente) que nos transforma el triangulo. A´B2 C2 . → A´B´C´ o bien
A´B2 C3 . H(A’ A' C 3 A' C ' )→ A´B´C´
16/19
La transformación producto H(A´,k) o G(A´,α) o t AA ' transforma el triangulo ABC en el A´B´C´ y como los movimientos y las homotecias son semejantes, el producto de dos semejanzas es una semejanza. Luego existe una semejanza que transforma el triangulo ABC en el A´B´C´. Unicidad
( por reducción al absurdo)
Supongamos que existiesen dos semejanzas f y g que nos transforman el triangulo ABC en A´B´C´. Sea x un punto cualquiera, que tendra f(x)=x´ g(x)=x´´. La recta BX corta a AC en un punto P y sean f ( P) = P' PB P´B´ se verifica que = g ( P) = P" PC P´C´ ya que la semejanza conserva las razones simples (PBC)=(P´B´C´) Análogamente PB P´´B´ = por ser (PBC)=(P´´B´C´) PC P´´C´ luego es evidente
P´B´ P´´B´ = ⇒ (P´B´C´) = (P´´B´C´) P´C´ P´´C´
Lo cual obliga por las propiedades de las razones simples Del mismo modo
por tanto
(XAP)=(X´,A´,P´) ⇒
XA X ´ A´ = XP X ´P´
(XAP)=(X´´,A´,P´) ⇒
XA X ´´ A´ = XP X ´´P´
(X´A´P´)=(X´´A´P´) ⇒ X ´≡ X ´´
luego la semejanza es única.
17/19
P´ ≡ P´´
3.3 Construccion del centro de semejanza directa. En el producto de un giro por una homotecia es interesante determinar o hallar el punto O que sea a la vez centro de giro y centro de homotecia, que transforma un segundo AB en otro A´B´ siendo estos segmentos directamente semejantes. B
P
Prolongar A´B´ hasta que corte la recta A´B´ al segmento AB en un punto P. ϕ
A B' O
Construir -La circunferencia ψ que pasa por P, A y A´ -La circunferencia ϕ que pasa por P, B y B´
ψ
El segundo punto de intersección de ψ con ϕ, el O, es el buscado.
A'
En efecto Deberan ser iguales OAB=OA´B´ siendo A´ y B´ los transformados de los A y B. Sobre la circunferencia ϕ, OAB abarca el OP en ψ y OA´B´ abarca tambien el OP, luego OAB=OA´B´ Tambien puede verificarse que En efecto
OBA=OB´A´
A' B ' O + OB ' P = 180 o y en ϕ PBO + OB' P = 180 o
⇒
A’B’O=PBO
El angulo PBO, sobre ϕ abarca el arco PO (que contiene B´) El angulo OBA, sobre ϕ abarca el arco PO Luego PBO=OBA por tanto OB´A´=PBO=OBA
OB´A´=OBA
3.4 Ecuaciones de la semejanza Como semejanza se puede descomponer en una homotecia y un movimiento o viceversa, las ecuaciones se obtienen aplicando en cada caso las ecuaciones correspondientes del movimiento y de la homotecia. Veamos el caso en que la semejanza S se puede descomponer en producto de una homotecia Ho,k de centro O(a,b) y razon k, y una traslación Tu de vector (a´,b´), es decir S=Tu o Ho,k Sea A(x,y) un punto que se trans forma en A´(x´,y´) mediante la homotecia y este en A´´(x´´,y´´) por la traslación.
18/19
Entonces se obtiene x ' = a + k ( x − a) y ' = b + k ( y − b )
aplicando Ho,k
y si aplicamos Tu
x" = x '+a ' = a + k ( x − a ) + a ' y" = y '+b' = b + k ( y − b) + b'
o bien
x" = kx + (1 − k ) a + a' y" = ky + (1 − k ) b + b' que son las ecuacio nes de la semejanza dada. Si añadimos 1=1 se puede expresar en forma matricial 1 (1 − k )a + a´ (1 − k )b + b´ (1, x", y") = (1 x y ) 0 k 0 0 0 k
Bibliografía Recomendada. Puig Adam, P. Curso de Geometría Métrica. Ed.Biblioteca Matemática. Queysannne, H y Revuz,A. Geometría. Ed.C.E.C.S.A. Tuduri, Fortuni, Jovellanos. Matemáticas COU Angel Primo Martínez. Matemáticas COU. Ed.S.M.
19/19
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 43 PROYECCIONES EN EL PLANO. MAPAS. PLANISFERIOS TERRESTRES: PRINCIPALES SISTEMAS DE REPRESENTACIÓN. 1. Introducción. 2. Conceptos Elementales. 3. Proyecciones en el Plano. 3.1. Clasificación de las Proyecciones Geométricas. 3.1.1. Proyecciones Cilíndricas. 3.1.2. Proyecciones Cónicas. 3.1.3. Proyecciones Acimutales o Cenitales. 3.2. Tipos de Proyecciones. 4. Mapas. 4.1. Indicatriz de Tissot. 4.2. Clases de Mapas. 5. Planisferios Terrestres: Sistemas de Representación. 5.1. La Proyección de Mercator. 5.2. La Proyección de Gauss. 5.3. La Proyección de Gall. 5.4. La Proyección de Lambert. 5.5. La Proyección Estereográfica Polar.
1/10
TEMA 43 PROYECCIONES EN EL PLANO. MAPAS. PLANISFERIOS TERRESTRES: PRINCIPALES SISTEMAS DE REPRESENTACIÓN. 1. INTRODUCCIÓN. Para representar la Tierra de forma exacta, al ser una superficie esférica, sólo podemos conseguirlo mediante otra esfera o un globo. Estos elementos han sido instrumentos habituales desde que se supo que la Tierra era esférica. Aun así presentan un problema y es su manejabilidad. Si son pequeños se pueden manejar con facilidad pero no son capaces de representar detalles más o menos importantes. Si son grandes ganamos en representación de detalles pero perdemos la posibilidad de manejarlos. Por lo tanto, resulta necesario representar las superficies esféricas sobre un plano. Pero esto no es posible salvo que permitamos a la superficie esférica que se deforme o se rompa. Entonces sólo conseguimos su representación de modo aproximado. A lo largo de la historia reciente se han desarrollado diferentes sistemas de representación de superficies esféricas en el plano. Todos estos sistemas se basan en el concepto de proyección, y dan lugar a distintos tipos de proyecciones cartográficas. 2. CONCEPTOS ELEMENTALES. DEF La Cartografía es la parte de la Ciencia que se dedica al trazado, estudio e interpretación de los mapas. DEF Llamaremos Mapa a la representación en el plano y a menor tamaño de la superficie terrestre, ya sea toda o una parte. DEF La Escala es la relación entre la imagen representada en el Mapa y su tamaño verdadero. DEF El Eje de la Tierra es una línea imaginaria que cruza el planeta de Norte a Sur, siendo el eje de revolución del planeta. DEF El Ecuador es la circunferencia máxima de la Tierra, equidistante de ambos polos y perpendicular al eje de la Tierra. Divide al planeta en dos mitades, llamadas Hemisferios. Su radio es de 6378 km. y su longitud de 40.076 km. DEF Los Trópicos son otras circunferencias paralelas al ecuador. En el hemisferio norte está el Trópico de Cáncer y en el hemisferio sur el Trópico de Capricornio. Tomando como referencia el centro de la Tierra, están a 23º27’ del ecuador y –23º27’ respectivamente. DEF Llamaremos Meridianos a las semicircunferencias con origen en el Polo Norte y final en el Polo Sur.
2/10
DEF Los Paralelos son circunferencias paralelas al ecuador. La separación entre ellos es constante y determinan un ángulo esférico recto con los meridianos. Para determinar un punto sobre la superficie de la Tierra, primero hemos de determinar un origen para las mediciones. Al ser una superficie, daremos dos coordenadas, una respecto de un Meridiano y otra respecto de un paralelo. El meridiano origen será el ecuador. Como paralelo origen consideraremos aquel que pasa por la población inglesa de Greenwich. Las coordenadas serán los ángulos que forman el meridiano y el paralelo que pasan por el punto respecto de las líneas de origen. DEF La Longitud de un lugar es el ángulo que forma el meridiano que pasa por ese sitio con respecto al meridiano de Greenwich. La distancia se mide de 0º a 180º. y puede ser hacia el este, E, o hacia el Oeste, W. DEF La Latitud de un lugar es el ángulo que forma el meridiano que pasa por ese sitio con respecto al Ecuador. Se mide de 0º a 90º y puede ser hacia el Norte o hacia el Sur. 3. PROYECCIONES EN EL PLANO. Ya hemos comentado en la introducción del tema que la forma de representar una superficie esférica era sobre un plano, aunque no reflejara fielmente la realidad. Las diferentes representaciones de la Tierra se basan en proyectar su superficie directamente sobre un plano o sobre otras figuras geométricas que se puedan desarrollar de forma sencilla sobre el plano. Las figuras habituales serán el cilindro, el cono o directamente un plano tangencial a la superficie esférica. Una vez realizada la proyección sobre la figura geométrica auxiliar extenderemos ésta sobre el plano, cortándola previamente a lo largo de una generatriz. Cada punto de la esfera terrestre lo tenemos determinado por medio de dos coordenadas, que son la longitud y la latitud. Al ser ángulos, las vamos a expresar en radianes. Entonces, cualquier punto de la Tierra viene determinado por un par de números reales (L,M) verificando que:
( L, M )∈ − π .π × (− π, π]) = A
2 2
DEF Sea 32 un plano euclídeo. . Llamaremos Proyección a una aplicación p:A→32 de tal forma que existe un abierto D⊂A no vacío y conexo verificando que p:D→p(D) es un homeomorfismo. El conjunto D es el dominio de valores de las coordenadas geográficas de la porción D’ de la esfera terrestre S que se desea representar. A veces, por abuso de lenguaje, se llama proyección a la aplicación p:D’→p(D), donde p(D) es el trozo del plano donde se va a representar la porción de esfera seleccionada. Este trozo del plano será una unión de grafos de restricciones de p a puntos y líneas de D, a los que se les añadirán símbolos convencionales, nombres, coloraciones, etc.
3/10
3.1. Clasificación de las Proyecciones Geométricas. Desde el punto de vista matemático son interesantes las proyecciones geométricas. Éstas las podemos clasificar en función del modo en el que se obtienen, o lo que es lo mismo, teniendo en cuenta la figura geométrica en la que se apoyan para realizar la proyección. 3.1.1. Proyecciones Cilíndricas. Son proyecciones que se realizan sobre un cilindro, cuyo eje pasa por el centro de la Esfera. Posteriormente se desarrolla la superficie del cilindro, obteniéndose un plano. Las únicas condiciones son que el centro de la proyección ha de coincidir con el de la esfera y el radio del cilindro debe ser menor o igual que el de la esfera. De ahí que el cilindro sea tangencial a la esfera o la atraviese. Como características de estas proyecciones, podemos decir que los paralelos de la esfera se convierten en líneas horizontales y los meridianos en líneas verticales.
Debido a que los paralelos cortan a los meridianos a distancias iguales, y esas distancias se conservan por la proyección, estas líneas determinan en el plano un sistema de rectángulos. Teniendo en cuenta que una esfera, en este caso la Tierra, no tiene una representación perfecta en un plano, toda proyección presenta limitaciones. En el caso de la proyección cilíndrica, tenemos que en el plano la superficie de las zonas representadas crece a medida que nos separamos de los puntos de contacto entre la esfera y el cilindro. Este tipo de proyecciones se aplica de forma habitual en la representación de zonas próximas al ecuador o de regiones a las cuales el cilindro no es normal. Como caso particular de este tipo de proyecciones tenemos las llamadas Proyecciones Planas, en las cuales el cilindro corta al mapa en el centro según los círculos paralelos. Se aplica fundamentalmente para representar trozos de superficie pequeños. Aunque sabemos que no conservan las áreas, al ser porciones pequeñas, las deformaciones están dentro de unos límites aceptables. 3.1.2. Proyecciones cónicas. Las proyecciones cónicas son las que se realizan utilizando como figura geométrica un cono. Al desarrollar el cono se obtiene el mapa. El centro de proyección es el punto medio de la esfera.
4/10
Como características fundamentales de este tipo de proyecciones tenemos que los paralelos son circunferencias paralelas a la base del cono y los meridianos son generatrices del cono. Al desarrollar el cono, estas líneas se convierten en líneas circulares y líneas radiales, respectivamente. La aplicación más importante es la confección de atlas, dado que la proyección tiene facilidad para dividirse en secciones, cada una de las cuales será una hoja del atlas. Existen diferentes variantes de esta proyección, que son: a) Proyección Cónica Simple. b) Proyección Cónica con dos paralelos Base. c) Proyección Cónica Equivalente. d) Proyección Policónica. 3.1.3. Proyecciones Acimutales o cenitales. Son aquellas en las que la proyección se realiza sobre un plano tangente en algún punto de la esfera terrestre. El centro de proyección coincide con el centro de la esfera o con el punto diametralmente opuesto al punto de contacto. El mapa que obtenemos está concebido concentricamente alrededor del punto de contacto.
Como características principales de estas proyecciones tenemos: •
• •
Los círculos máximos que pasan por el punto de contacto de la esfera con el plano se proyectan en líneas rectas, y su acimut es verdadero. Recordemos que el acimut es el ángulo que forma el meridiano con el círculo vertical que pasa por un punto de la superficie terrestre. Todas las áreas situadas a la misma distancia del punto de contacto presentan la misma deformación. Los puntos de la esfera equidistantes del punto de contacto verifican que sus proyecciones también son equidistantes de dicho punto.
5/10
En función de cómo se produzca el contacto del plano de tangencia con la esfera, tenemos distintas proyecciones acimutales. • • • •
Proyección Polar. El contacto se produce en el polo de la esfera. Proyección Ecuatorial. El punto de contacto es algún punto del ecuador. Proyección Transversal. El punto de contacto es cualquier otro. Proyección Estereográfica: El punto de mira está situado en la superficie de la Tierra, justamente en las antípodas del punto de contacto.
Un cierto tipo especial de proyecciones acimutales son las que no poseen punto de contacto o tangencia entre el plano y la esfera. Podemos destacar varios tipos: • •
Proyección Ortográfica: La proyección se realiza mediante rayos paralelos a un plano perpendicular a los mismos. El punto de mira se situaría en el infinito. Proyección Gnomónica: Proyectamos sobre un plano desde el centro de la esfera, pudiendo estar dicho plano a cierta distancia de la Tierra. Los márgenes del mapa aparecen aumentados, por lo que no es posible representar un hemisferio completo.
3.2. Tipos de Proyecciones. Sabiendo que p:D’→p(D) es una aplicación, podemos considerar los siguientes tipos de proyecciones. a) Proyecciones Conformes. Son las que conservan los ángulos, pero no las áreas. Son útiles en aquellas aplicaciones en las que la conservación de los ángulos y direcciones es primordial, como puede ser en la navegación. Las proyecciones geométricas son conformes. b) Proyecciones Equivalentes. Son las proyecciones que conservan las áreas pero no los ángulos. Las figuras proyectadas quedan deformadas, principalmente en los bordes de la zona representada. Entre sus aplicaciones nos encontramos que sirven para poner de relieve la distribución de productos en los estudios económicos o industriales. c) Proyecciones Afilácticas. Desde el punto de vista matemático, la igualdad de superficie y la igualdad de ángulos constituyen propiedades de las proyecciones muy dignas de tenerse en cuenta. Desde el punto de vista práctico, ambas propiedades no se pueden dar a la vez (salvo en la propia esfera). Por tanto, el cartógrafo prefiere proyecciones intermedias entre las equivalentes y las conformes, de tal forma que no se alteren en modo excesivo la forma ni el tamaño. Este tipo de proyecciones reciben el nombre de proyecciones afilácticas o híbridas. Podemos destacar la proyección equidistante, en la cual los paralelos son equidistantes y los meridianos son ortogonales a los paralelos.
6/10
4. MAPAS. DEF Llamaremos Mapa a la proyección de un dominio abierto y conexo de una esfera sobre un plano. Esta esfera será habitualmente la esfera terrestre. En Mapas astronómicos será la esfera celeste. DEF Llamaremos Escala de un mapa a la razón entre la distancia de dos puntos de un mapa y la distancia de sus respectivas antiimágenes sobre la esfera terrestre. Como no existe ninguna isometría de un dominio abierto y conexo de la esfera en un dominio del plano (no existen proyecciones que sean a la vez conformes y equivalentes) las escalas sólo pueden ser locales. La escala se puede indicar en un mapa de diferentes formas: a) Escala Numérica. Establece la relación entre las distancias mediante una razón o fracción. Así nos podemos encontrar con 1:100.000 lo cual significa que dos puntos separados por 1 cm en el mapa realmente se encuentran a una distancia de 100.000 cm en la esfera terrestre. b) Escala Gráfica. La relación entre las distancias se representa por medio de una escala graduada. c) Escala centímetro por kilómetro. Esta escala permite disminuir el número de ceros en la escala numérica. La razón expresa el número de kilómetros en la esfera terrestre por cada centímetro del mapa. 4.1. Indicatriz de Tissot. Para poder apreciar la deformación producida por una proyección utilizamos la Indicatriz de Tissot. Consiste en una elipse obtenida como proyección de una circunferencia de la esfera terrestre. Las deformaciones que produce la aplicación utilizada son concretadas por la longitud y la orientación de los ejes de la elipse. Si la circunferencia que proyectamos es de radio unidad, entonces los semiejes de la indicatriz designan las escalas locales máxima y mínima. Más concretamente, si a y b son los semiejes de la elipse y a≤b tenemos que a es la escala máxima y b es la mínima. Además también nos determina las diferentes alteraciones que produce la proyección. Así, tenemos que: • • •
Las alteraciones lineales correspondientes son a-1 y b-1. La alteración de superficie es π(ab-1). La alteración local de ángulos se mide por transportación de un ángulo central de la circunferencia y aumenta con la excentricidad de la indicatriz.
Aplicando la indicatriz de Tissot a algunas de las proyecciones que ya hemos estudiado, se verifica que:
7/10
• • •
Proyecciones Conformes: Son circunferencias de radios distintos. Proyecciones Equivalentes: Son elipses de superficie constante y excentricidad variable. Proyecciones Afilácticas: Son elipses de superficie variable en las proyecciones equidistantes. En este caso, los valores de las alteraciones o deformaciones se reducen a la mitad, aproximadamente, en comparación con las anteriores.
4.2. Clases de Mapas. Los mapas que nos podemos encontrar los podemos clasificar en tres tipos: a) Mapas Celestes. También llamados mapas astronomicos. Representan la esfera celeste, es decir, como es la distribución de estrellas. También pueden representar otros objetos como planetas, satélites, cometas, etc. b) Mapas Marinos. También conocidos con el nombre de Cartas Marinas. Existen de dos clases: Tenemos los que nos muestran diferentes accidentes físicos del mar, salinidad, corrientes, profundidad, etc. y aquellas que se usan para navegar, en las que aparecen todos los datos necesarios para la navegación. Entre estos datos tenemos los accidentes costeros, faros, boyas, etc. c) Mapas Terrestres. Los mapas terrestres son una representación de todo o parte de la superficie de la esfera terrestre. Según los temas o detalles que aparezcan, tenemos distintas clases: • • • • • •
Mapas Geográficos. Tratan de representar la superficie terrestre de la forma más exacta posible, incluyendo todos sus aspectos. Mapas Físicos: Representan fundamentalmente los accidentes físicos de la superficie terrestre. Los podemos subdividir en hidrográficos, sismotectónicos, geológicos , orográficos, etc. Mapas Biológicos: Se representan datos relativos a la distribución de animales o plantas. Mapas de Tráfico: Representan carreteras, líneas férreas, de navegación, de telecomunicaciones, etc. Mapas Políticos: Se representan los diferentes países, regiones, provincias, capitales o ciudades, etc. Mapas Estadísticos: Representan datos de población economía, industria, comercio y otros.
8/10
5. PLANISFERIOS TERRESTRES: SISTEMAS DE REPRESENTACIÓN. Llamamos planisferios terrestres a la representación en el plano de la esfera terrestre completa. Teniendo en cuenta las distintas proyecciones vistas al principio del tema, veamos ahora algunas de las representaciones en el plano de la esfera terrestre. 5.1. La Proyección de Mercator. Esta proyección aparece para mejorar la proyección cilíndrica, pretendiendo conservar la exactitud angular. Sobre una esfera de radio R se tiene: π L p ( L, M ) = R·M , R·Log Tg + 4 2 siendo la escala local k = Sec L Por abuso de lenguaje se llaman meridianos y paralelos a las respectivas proyecciones de estas líneas de la esfera. En esta proyección tenemos que los meridianos son rectas paralelas y equidistantes, y los paralelos son rectas perpendiculares a los meridianos. El intervalo de separación entre dos paralelos consecutivos es función de la latitud, y verifica la condición de conformidad. Las curvas que forman ángulo constante con los meridianos reciben el nombre de Loxódromas, y en esta proyección se representan mediante rectas. Debido a esta característica, esta proyección es muy utilizada para la representación de cartas de navegación. Como inconvenientes de esta proyección nos encontramos que los polos no pueden ser representados ya que al ser los meridianos paralelos entre sí no se cortan. Sabemos que en la esfera los paralelos son más cortos a medida que se aproximan a los polos siendo su longitud proporcional al coseno de la latitud. Como en la proyección Mercator los paralelos disponen todos de la misma longitud, tenemos entonces que éstos han sido aumentados proporcionalmente al seno de la latitud, expresada en grados. 5.2. Proyección de Gauss. La proyección de Gauss es otro caso particular de proyección cilíndrica. Sobre una esfera de radio R tenemos definida la proyección como: R 1 + cos L·sen M p ( L, M ) = Log , arctg (R·tg (L·sen M )) 1 − cos L·sen M 2 La escala local es
k=
1 2
1 − cos L·sen 2 M
La proyección de Gauss verifica que el ecuador y el meridiano central son rectas ortogonales. El resto de meridianos y paralelos son curvas trascendentes ortogonales entre sí.
9/10
5.3. La Proyección de Gall. Esta es una proyección cilíndrica, donde el cilindro corta a la esfera en los paralelos 45º N. y 45º S. Los meridianos son rectas verticales, verificando que la distancia no presenta ninguna deformación en los paralelos nombrados. Los paralelos son rectas horizontales, no manteniéndose invariante la distancia entre ellos. En las zonas ecuatoriales las áreas son menores que las reales y en las zonas polares son mayores (siempre teniendo en cuenta la escala). 5.4. La Proyección de Lambert. La proyección de Lambert es una proyección Cónica. Dado un paralelo L0 que tomaremos como origen, tenemos que la imagen en coordenadas polares de un punto de la esfera son: ϑ = M ·sen L0 r = r0 ·e·sen L0 ·( L0 − L ) donde r0 es el radio de las imágenes de los puntos del paralelo L=L0 y L es la función de Mercator: π L L ( L ) = ln tg + 4 2 La escala local es k = 1 +
y2 2R2
Los meridianos son rectas concurrentes que determinan ángulos proporcionales a la longitud. Los paralelos son arcos de circunferencias concéntricas, siendo su centro el punto de intersección de los meridianos. Los radios de dichos arcos verifican la condición de conformidad. 5.5. Proyección Estereográfica Polar. Para una esfera de radio R, las coordenadas polares del punto imagen vienen dados por: ϑ= M π L r = 2 R tg − 4 2 y la escala es
r2 x2 + y2 k =1+ =1 + 4R 2 4R 2
La proyección estereográfica es una proyección acimutal o cenital conforme en la que el punto del que parten los rayos proyectantes se encuentra en una posición diametralmente opuesta al punto de contacto del plano tangente con el globo; en ella, la distancia entre meridianos y paralelos contiguos aumenta desde el centro hasta los márgenes del mapa; se utiliza mucho para la confección de mapas de las zonas polares.
10/10
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 44 SEMEJANZAS Y MOVIMIENTOS EN EL ESPACIO
1. 2. 3. 4. 5. 6.
Generalidades. Movimientos de E3 . Aplicación lineal asociada a un movimiento. Caracterización del movimiento. Movimientos con algún punto doble. Movimientos sin puntos dobles. 6.1. La traslación 6.2. Composición de simetría especular y traslación. 6.3. Composición de giro y traslación. 6.4. Composición de simetrías especulares. 6.5. Composición de giros. 6.6. Composición de simetrías axiales. 6.7. Resumen 7. Homotecias. 8. Semejanzas.
1/14
TEMA 44 SEMEJANZAS Y MOVIMIENTOS EN EL ESPACIO 1. GENERALIDADES. Suponemos construido el espacio vectorial de los vectores libre del espacio V3 . DEF Llamaremos espacio afín ordinario a una terna formada por un conjunto E3 (el conjunto de puntos del espacio), el espacio vectorial V3 y una aplicación: ϕ:
E 3 × E3 → V ( A, B ) → n = AB
(el vector libre de representante de AB)
tal que se verifique: 1) ϕ( A, B) + ϕ( B, C) = ϕ( A, C ), esto es AC+AB=AC ∀ A,B,C ∈E3 2) Fijado A, la aplicación
ϕA : E 3 → V3 B → AB = n
es biyectiva.
DEF Si sobre V3 hay definido un producto escalar, entonces V3 se dice que es el espacio vectorial euclídeo de los vectores libres del espacio E3 (por abuso del lenguaje) el espacio afín euclídeo ordinario. Dicho producto escalar permite introducir la distancia: d ( A, B ) = AB = y los ángulos, a través de:
cos( AB, AC) =
AB ⋅ AB
AB ⋅ AC AB ⋅ AC
2. MOVIMIENTOS DE E3 . DEF Se llama movimiento a toda aplicación biyectiva f : E 3 → E 3 que conserve la distancia, esto es si A’=f(A), B’=f(B) se verifica: d(A,B)=d(A´,B´)=d(f(A),f(B)). Con esta definición se verifica que PROP Los movimientos transforman puntos alineados en puntos alineados y en el mismo orden. Dem
2/14
En efecto, dados A,B,C puntos alineados, uno de ellos pertenece al suplemento formado por los otros dos (p. ej. B entre A y C) luego d(A,B)+d(B,C)=d(A,C) También será:
d(A´,B´)+d(B´,C´)=d(A´,C´)
luego A´,B´,C´ alineados y B´ entre A´ y C´. COROLARIO Con ello resulta obvio que los movimientos transforman rectas en rectas y también planos en planos (puesto que un plano esta determinado por 3 puntos no alineados) PROP Los movimientos conservan los ángulos. Dem Si el ángulo α esta determinado por 2 semirrectas OA y OB los puntos O,A,B formaran un triángulo (si no es trivial) y sus transformados O, A´, B´ también. d ( A, B ) 2 = d ( OA) 2 + d (OB ) 2 → 2 d ( OA)d (OB ) cos α
En el primero se tiene: y en el segmento:
d ( A´, B´) 2 = d (O´ A´) 2 + d (O´B´) 2 → 2d (O´ A´)d (O´B´) cos α´
y por la igualdad de distancias
α = α´
3. APLICACIÓN LINEAL ASOCIADA A UN MOVIMIENTO. DEF
Dado un movimiento f, definiremos: ϕ : V3 → V3 AB → A´B´
siendo A´=f(A) B´=f(B).
PROP La aplicación ϕ esta bien definida, pues si AB ∩ CD también es A´B´ ∩ C´D´ Dem. Si A,B,C,D están alineados, sus transformados también y en el mismo orden y como se conservan la distancia AB ∩ CD⇒ A´B´ ∩ C´D´ Si AB y CD están situados en líneas paralelas, determinarán un paralelogramo, y sus transformadas verifican (al conservarse distancias y ángulos por f) d(A´,B´)=d(C´,D´),
d(A´,D´)=d(B´,C´),
3/14
d (A´,C´)d=(B´,D´),
luego
A´,B´,C´,D´
determinan también un paralelogramo A´B´ ≈ C´D´ La aplicación ϕ es lineal, pues eligiendo representantes adecuadas: ϕ( AB + BC ) = ϕ( AC ) = A´C´= A´B´+ B´C´= ϕ( AB) + ϕ( BC ) luego
ϕ( u + v ) = ϕ( u) + ϕ( v) ϕ(α ⋅ AB) = α ⋅ A´ B´= αϕ( AB)
luego
∀u , v ∈ V3 ∀A, B ∈ E 3 , ∀α ∈ R
ϕ(αu ) = αϕ(u )
∀α ∈ R, ∀u ∈ V3
la aplicación ϕ es biyectiva (por tanto un endomorfismo biyectivo =automorfismo de V3 ) Dem. Kerϕ = {o}
Pues por ser endomorfismo, basta probar que
entonces si ϕ( AB) = A´B´= O ⇒ d ( A´, B´) = 0 = d ( A, B ) ⇒ A = B
y por tanto
AB=O
4. CARACTERIZACION DEL MOVIMIENTO Si {O, u1 , u 2 , u 3 } es una referencia ortonormal de E3 se tiene que ∀x ∈ E3 , X´=f(x) ∈ E3
y OX´=OO´+O´X´=OO´+ ϕ(OX ) .
Como los componentes de OX´ en la referencia son las coordenadas de X’=f(x) f(x)=f(O)+ ϕ (OX) x1 x1 ´ a1 Si llamamos X = x 2 , X ´= x 2 ´ , f (o ) = a 2 x x ´ a 3 3 3 La matriz de ϕ en la base de la referencia: x1 ´ a1 a11 x 2 ´ = a 2 + a 21 x ´ a a 3 3 31
a12 a22 a32
y
a13 x1 a 23 x 2 a 33 x 3
Ecuación del movimiento en la referencia considerada.
4/14
a11 M = a 21 a 31
a12 a 22 a 32
a13 a 23 a 33
Hasta ahora nada distingue estas ecuaciones de las ecuaciones de una transformación afín a cualquiera, pero ϕ tiene una particularidad: conserva el producto escalar, pues:
ϕ( u) ⋅ ϕ(v ) =
ϕ(u ) + ϕ( v)
− ϕ(u ) − ϕ( v)
2
4 =
Entonces:
2
u+v
2
− u−v 4
=
ϕ( u + v )
2
− ϕ(u − v)
2
4
=
2
=u ⋅v
∀u , v ∈ V3
ϕ( u) = M ⋅ u (notación matricial) ϕ( v) = M ⋅ v (natación matricial)
y como el producto escalar de dos vectores (en base ortonormal) (u 1 , u 2 , u3 ) , ( v1 , v 2 , v 3 ) es: v1 (u 1 , u 2 , u 3 ) v 2 = u1 v1 + u 2 v 2 + u 3 v 3 v 3 se tiene:
( Mu )( Mv ) T = (u ⋅ v T ) = M ( u ⋅ v T ) M T ⇒ M ⋅ M T = I
y también M T ⋅ M = I , luego M es un matriz ortogonal. De aquí:
det M ⋅ det M T = 1 ⇒ det M = ±1
Aquellos mo vimientos en los que la aplicación lineal asociada tiene una matriz con determinante igual a 1, la llamaremos movimientos directos y los movimientos que lo tienen igual a –1, movimientos inversos o pseudomovimientos. Vamos a estudiar los movimientos, clasificándolos en primer lugar en dos grupos: los que tienen algún punto doble y los que no. 5. MOVIMIENTOS CON ALGÚN PUNTO DOBLE. Tomando una referencia ortonormal R= {O, u1 , u 2 , u 3 } las ecuaciones de movimiento quedarían, en dicha referencia (al tener al menos un punto doble, tomamos como tal al O=f(o) x1 ´ a11 x 2 ´ = a 21 x ´ a 3 31
a12 a 22 a 32
a13 x1 a 23 x 2 , a 33 x3
con lo que es totalmente análogo en este caso estudiar ϕ que el movimiento f.
5/14
Estudiaremos ahora los vectores invariantes por ϕ : r Un vector u invariante por ϕ , cumplirá:
r r r ϕ ( u )= u =I u
r r luego (ϕ -I)( u )= O , y como ϕ -I es también una aplicación lineal estudiar los vectores invariantes por ϕ equivale a hallar Ker(ϕ -I). Pueden suceder 3 casos: a) dim ker( ϕ -I)=3, y en este caso todos los vectores serian invariantes, luego todos los puntos serian dobles. El movimientos es la identidad. b) dim Ker(ϕ -I)=2. en este caso hay un subespecie V (plano vectorial) de vectores invariantes, luego el plano π determinado por A y V es todo de puntos dobles. Elijamos ahora una referencia me jor: {A, u1 , u 2 , u 3 } donde u1 , u 2 son una base ortonormal de V y u 3 un vector u 3 normal al plano, de modulo 1 y bien orientado.
u3
u1=ϕ(u1)
u2=ϕ(u2) ϕ(u3)
Entonces
ϕ( u1 ) = u 1 ϕ( u 2 ) = u 2 ϕ( u 3 ) = ±u 3
(recuerda que se conserva el producto escalar) como no puede ser ϕ( u 3 ) = u 3 entonces ϕ( u 3 ) = −u 3 . x1 ´ 1 0 0 x1 x 2 ´ = 0 1 0 x 2 , x ´ 0 0 − 1 x 3 3
La matriz de f seria
y el movimiento se llama simetría especular, o simetría respecto al plano A+V= π . Obviamente es un movimiento inverso pues detM=-1 (además invierte el sentido de la referencia) c) dim ker( ϕ -I)=1. En este caso hay un subespacio V (resta vectorial de vectores invariantes), y la recta A+V=r es toda de puntos dobles. u1=ϕ(u1) ϕ(u3) u2
α ϕ(u2)
u3
Tomemos una referencia {A, u1 , u 2 , u 3 } donde u1 es un vector director normal de la recta V, u 2 , u 3 dos vectores que sean ortogonales entre sí y ortogonales u1 de módulo A.
Cualquier combinación lineal de u 2 y u 3 es ortogonal a u1 , luego también serán ϕ(u 2 ) y ϕ( u3 ) ortogonales a u1 = ϕ(u1 ) .
6/14
ϕ( u 2 ) = au 2 + bu 3 ϕ(u 3 ) = cu 2 + du 3 de aquí tomando
ϕ(u 2 )
ϕ( u 2 ) = au 2 + bu 3 ϕ( u 3 ) = −bu 2 + au 3 0 ≤ θ < 2π
y la matriz de f es
2
2
= a 2 + b 2 = ϕ( u3 ) = c 2 + d 2 = 1 ϕ( u 2 )ϕ(u 3 ) = ac + bd = 0 a 2 + b 2 =1
tal que cosθ=a
seria
senθ=b
0 0 x1 x1 ´ 1 x 2 ´ = 0 cos θ senθ x 2 x ´ 0 − sen θ cos θ x 3 3
el movimientos es un giro de eje r y amplitud θ. Se trata de un movimiento directo. d) dim Ker(ϕ -I)=0. En este caso hay vectores invariantes. Sea X∈V3 no nulo y consideremos la simetría Sπ respecto al plano bisectriz del ángulo determinado por X y ϕ (X). El movimiento Sπ oϕ (X) (hemos identificado el movimiento con su aplicación lineal asociada). Verifica Sπ oϕ (X)=X, luego dim ker( Sπ oϕ -I) ≥ 1 si fuese la dimensión igual a 2, entonces Sπ oϕ = S π ´ y de aquí: Sπ o Sπ oϕ = Sπ o S π ´ ⇒ ϕ = Sπ o S π ´ . y ϕ seria un giro, contradicción pues ϕ no tiene puntos dobles. Luego: dim Ker(( Sπ oϕ -I)=1 Entonces Sπ oϕ es un giro que se puede escribir como comparación de dos simetrías respecto a planos π´,π´´ . De donde ϕ = Sπ o S π ´´ o S π ´ (todos estos movimientos son inversos). De todos estos movimientos el más interesante es la simetría central de centro A. En este movimientos, ϕ verifica: ϕ( u1 ) = −u1 ϕ( u 2 ) = −u 2 ϕ( u 3 ) = −u 3 0 x1 x1 ´ − 1 0 y las ecuaciones x 2 ´ = 0 − 1 0 x 2 x ´ 0 0 − 1 x3 3 Es evidentemente un movimiento inverso.
7/14
6. MOVIMIENTOS SIN PUNTOS DOBLES Estudiaremos en primer lugar un movimiento especial. 6.1 La traslación DEF Se llama traslación a todo movimiento en el que la aplicación lineal asociada es la identidad. Sus ecuaciones serian, en una referencia ortonormal {O, u1 , u 2 , u 3 } x1 ´ a1 x1 x 2 ´ = a 2 + x 2 x ´ a x 3 3 3 OBS Obviamente la traslación queda definida cuando se conoce la imagen de un punto, por ejemplo O, pues entonces OX´=OO´+O´X´=OO´+ϕ (OX)=OO´+OX ⇒ OX´-OX=XX´=OO´ r DEF Entonces también puede definirse la traslación de vector u como el movimiento r que transforma x en x´ siendo xx´= u . PROP Todo movimiento f puede considerarse como una composición de un movimiento f´ con un punto doble O seguido de una traslación de vector OO´ (O´=f(O)). Dem. Consideramos f´ como el movimiento con un punto fijo O, y aplicación lineal asociada l aplicación ϕ asociada a f. Entonces en una referencia A= {O, u1 , u 2 , u3 } las ecuaciones de f´ son: x1 ´´ a11 x2 ´´ = a 21 x ´´ a 3 31 la traslación t OO ´ tiene R= {O, u1 , u 2 , u3 } x1 ´ a1 x1 ´´ x2 ´ = a 2 + x 2 ´´ x ´ a x ´´ 3 3 3
a12 a22
a13 x1 a 23 x 2 a32 a 33 x 3 las ecuaciones
a1 a 2 = f ( O) y evidentemente f= t OO ´ o f ´ . a 3
Esto nos simplifica la tarea, pues basta estudiar las composiciones de los movimientos anteriores con traslaciones para tener estudiadas todos los movimientos.
8/14
6.2 Composición de simetría especular y traslación. Probaremos que, en este caso, el movimiento se puede reducir a la composición de una simetría respecto a un plano π y una traslación de vector u paralelo a la dirección de π. r r r r El vector de la traslación u se puede descomponer de forma única como u = u ’+ u ” r r donde u ´ es paralelo a la dirección de π y u ”´ paralelo a la dirección perpendicular a π. r Así la traslación de vector u ”/2 transforma la simetría especular Sπ en una simetría Sπ´ (π´ plano paralelo a π resultante de la traslación). Seguidamente la traslación de r vector u ´ completa el movimiento. t u o Sπ = t u ´ o Sπ´ es un movimiento inverso y además la composición es conmutativa. 6.3. Composición de giro y traslación Probaremos que, en este caso, el movimiento se reduce a un giro de cierto eje, que determinaremos, y traslación de vector paralelo a la dirección del eje de giro.
r r r r El vector u de la traslación se descompone igualmente como u1 + u ” (u ” de la r dirección de e, u1 de la dirección perpendicular.) la traslación t u1 / 2 transforma el giro de eje e, en otro giro de eje e´ (paralelo de e) y la misma amplitud y seguidamente la r traslación de vector u ” completa el movimiento t u o G( e,α) = t u ´´ o G(e´, α) . Es un movimiento directo, y recibe el nombre especial de movimiento helicoidal. Igualmente la composición es conmutativa.
6.4 Composición de simetrías especulares. A) De planos paralelos. X M
π
X' M'
Si llamamos M a la proyección de X sobre π y M´´ la proyección de X´ sobre π´´, se tiene que XX´´=2MM´, luego la comparación de S π ´ o S M es una traslación de vector 2MM´.
π'
X"
9/14
B) De planos secantes. En este caso los planos π y π´ se cortaran en una recta e, y determinaran un ángulo diedro γ . e π
M
X
π' X"
Si por x y x n trazamos perpendiculares al eje e, se cortaran en un punto M, ang(MX,MX´´)=2 γ , siendo su orientación la determinada por la composición (de π a π´).
X'
Sπ ´ o S M = G (l,2γ ) .
Reciproco. r Recíprocamente, toda traslación de vector u puede escribirse como una composición de simetrías respecto a planos paralelos (los planos serán perpendiculares a la dirección r u r u , y distaran entre si ). 2 Igualmente, todo giro de eje e y amplitud α puede escribirse como una composición de simetrías respecto a planos secantes en e. En este caso uno de los planos puede α fijarse a voluntad. El otro, formara con el anterior un diedro de ángulo , en el sentido 2 de la composición. OBS SIMETRÍAS AXIALES. Son giros de ángulo π, y por lo anterior, basta determinarlas como composición de simetrías respecto a planos perpendiculares. 6.5 Composición de giros. A) Del mismo eje. En este caso es trivial que B) De ejes paralelos.
G( l, β) o G( l,α) = G( l,α + β)
Si G( l,α) y G( l´, β) son los giros en cuestión, como podemos elegir uno de los planos que por composición determinan los giros, tomaremos el plano π que contiene a l y l ´.
10/14
e"
γ α+β/2
e
π' α/2
e' π" β/2
π
G( l´´,2γ ) si π´ y π´´ se cortan en l´´ .
Hallamos ahora planos π´ y π´´ tales que: G( l,α) = Sπ ´ o Sπ G( l´, β) = Sπ o S π ´´ G( l, α) o G (l´, β) = S π ´ o S π o S π o S π ´´ = * G( l´´,2γ ) si π' yπ" se cortan en e" = S π ´ o S π ´´ = * * Traslación si π ' y π" son paralelos
γ =π−
α+ β ⇒ 2γ = −(α + β) 2
(**) Esto ocurrirá cuando α + β = 2kπ siendo k entero. B) De ejes que se cortan. En este caso la composición es un movimiento directo trivialmente con un punto doble, el de corte, y sabemos que si esto es así debe haber una recta de puntos dobles. El movimientos resultante (de enorme complejidad) es un giro, como eje es una recta que pasa por el punto de corte. C) De ejes que se cruzan. En este caso trazando la perpendicular PP´, y aplicar una traslación de vector P´P con lo que el giro de eje l y ángulo α se transformara en otro giro de eje l ´ (paralelo a l ) y el mismo ángulo. La composición de los giros de ejes l ´´ y l es otro giro. El movimiento resultante es composición de un giro y una traslación. Es un movimiento helicoidal. Es fácil sin embargo determinar la composición de las simetrías asociadas (giros de 180º) cuando los ejes se cortan o se cruzan. 6.6 Composición de simetrías axiales. A) De ejes que se cortan. En este caso, si las simetrías axiales son de eje r y r´ y se cortan podemos determinar
11/14
S r ´ = S π o Sπ ´ S r = Sπ ´´ o S π
π'
e
S r o S r ´ = S π ´´ o S π o S π o S π ´ = … π" α
r'
π
… = S π ´´ o S π ´ = G (l,2α)
r
l es la perpendicular común a las dos rectas por el punto de corte, α ángulo de r´ y r. (en ese orden). B) De ejes que se cruzan. Basta trazar planos π y π´ que contengan respectivamente a r y r´ y paralelos. π y π´ son perpendiculares a π´´ y π´´´ que contienen respectivamente a r´ y r. Luego el movimiento es composición de una traslación y un giro. (movimiento helicoidal). En efecto S r ´ o S r = ( Sπ ´´ o S π ) o ( S π ´ o Sπ ´´´ ) = S π ´´ o ( S π o Sπ ´ ) o Sπ ´´´ =
... = Sπ ´´ o T2 l o Sπ ´´´ = T2 l o Sπ ´´ Sπ´´´ = T2 l o G (l ,2α ) 6.7. Resumen. De todo lo dicho resulta que: Las simetrías a un plano son las transformaciones fundamentales puesto que cualquier movimiento pueda reducirse a una composición de ellas. Resultaría el siguiente cuadro resumen: Movimientos directos
Movimientos inversos
No hay puntos fijos
Traslación o movimiento helicoidal (gira + traslación)
Un punto fijo
No hay
Simetría + traslación (composición de 3 simetrías especulares) Composición de tres simetrías especulares (los planos se cortan en un punto)
Una recta de Giro puntos fijos
No hay
Un plano de puntos fijos
No hay
Simetría respecto a un plano o sin especular
Todo el espacio de puntos fijos
Identidad
No hay
12/14
7. HOMOTECIAS. DEF
Se llama homotecia de centro C y razón k a la aplicación H(c,k):
E B → EB A → A´
tal que CA´= k ⋅ CA .
Si k>0 la homotecia se llama directa, y en caso contrario inversa. Obviamente no son movimientos salvo si k = 1 , pero trivialmente transforman rectas de la misma dirección y plano en plano de la misma dirección. Luego conserva los ángulos. Ecuaciones En la referencia ortonormal {O, u1 , u 2 , u3 } , sea X ( x1 , x 2 , x3 ) transformada por la homotecia.
X ( x1 ´, x2 ´, x 3 ´) su
Entonces CX ´= k ⋅ CX ⇒ OX − OC = k (OX − OC ) ⇒ OX ´= (1 − k )OC + k ⋅ OX . luego si C (c1 , c2 , c3 ) queda: x1 ´ c1 (1 − k ) kx1 x1 ´ c1 ´ k 0 0 x1 x2 ´ = c 2 (1 − k ) + kx2 ⇔ x2 ´ = c 2 ´ + 0 k 0 x 2 x ´ c (1 − k ) kx x ´ c ´ 0 0 16 x 3 3 3 3 3 3 Producto de homotecias. a) Del mismo centro. Sean H(C, k 1 ), H(C, k 2 ) dos homotecias del mismo centro: , k1 ) ,k 2 ) x H(C → x´H( C → x´´
CX ´= k1 ⋅ CX , CX ´´= k 2 ⋅ CX ´⇒ CX ´´= k1 k 2 ⋅ CX
luego H(C, k 2 ) o H(C, k 1 ) en otra homotecia de centro C y razón k 1 ⋅ k 2 . b) De distinto centro. Probaremos que el producto de dos homotecias de distinto centro es otra homotecia cuyo centro esta alineado con los centros de las homotecias dadas, y su razón el producto de las razones de ambas, o bien una traslación de vector paralelo a la línea de centros. Sea X´ el transformado de X por H(C, k 1 ) ⇔ CX ´= k1 ⋅ CX y X´´ el transformado de X´ por H(C´, k 2 ) ⇔ C´ X ´´= k 2 ⋅ C´ X ´ . Se tiene:
13/14
X'
X"
X
C1 C
C'
C1 X ´´= C1 C´+C´ X ´´= C1 C + k 2 ⋅ C´ X ´= C1 C´+k 2 ( C´C + CX ´) = C1 C´+k 2 C´C + k 2 k1 CX = C1 C´+k 2 C´C + k 2 k1 (CC1 + C1 X ) ⇒ C1 X ´´= (C1 C´+k 2 CC´+k 2 k1 CC1 ) + k 2 k1 ⋅ C1 X (*) Como C1 X ´´ y C1 X tiene la misma dirección, y la expresión entre parámetros la dirección de CC´, en el caso que sean independientes será C1 C´+ k 2 C´C + k 2 k1 CC1 = O y C1 X ´´= k 2 k1 C1 X (homotecia de centro C1 y razón k 1 k 2 ). C1 esta relacionado con C y C´ por la igualdad: C1 C´=
k 2 (1 − k1 )CC´ pues C1 C´+ k 2 C´C + k1 k 2 (CC´+C´C1 ) = O 1 − k1 k 2 C1 C´(1 − k1 k 2 ) = k 2 (1 − k1 ) CC´
k 1k 2 ≠ 1
Si k 1 k 2 = 1 , de (*) se deduce que C1 X ´´= (C1 C´+k 2 C´C + CC1 ) + C1 X . X
Traslación de vector: X"
C1
C1 C´+ k 2 C´C + CC1 = (1 − k 2 )CC´ . Todavía puede simplificarse mas pero es tedioso.
8. SEMEJANZAS. Se llama semejanza de razón k a toda comparación de homotecia de razón k y un movimiento. Igualmente puede definirse semejanza de razón k como la aplicación f : EB → E B tal que d(f(A),f(B))=kd(A,B). Las propiedades de las semejanzas se deducen trivialmente de las de las homotecias y de los movimientos
14/14
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 46 COORDENADAS DEL PLANO Y DEL ESPACIO
1. Coordenadas cartesianas en el plano 2. Cambio de sistemas de coordenadas. 2.1. Traslación de ejes 2.2. Giro de ejes 2.3. Movimiento de ejes coordenados 3. Coordenadas polares. 3.1. Paso de coordenadas cartesianas a polares. 4. Ecuaciones de curvas en el plano. 4.1. Curvas en coordenadas cartesianas explícitas. 4.2. Curvas en forma paramétrica. 4.2.1. Circunferencia. 4.2.2. Cicloides 4.2.3. Hipocicloides. 4.3. Curvas en coordenadas polares. 4.3.1. Ecuación de la recta 4.3.2. Ecuación de la circunferencia. 4.3.3. Estrofoide. 4.4. Curvas en forma cartesiana implícita. 4.4.1. Ejemplos de curvas en implícitas 4.4.1.1.Circunferencia 4.4.1.2.Estrofoide 4.4.1.3.Lemniscata. 5. Coordenadas en el espacio. 5.1. Coordenadas cartesianas. 5.2. Coordenadas polares. 5.3. Coordenadas esféricas. 5.4. Coordenadas cilíndricas. 6. Curvas en el espacio. 6.1. Representación paramétrica. 6.2. Como intersección de superficies. 7. Superficies en el espacio. 7.1. Ejemplos de superficies. 7.1.1. Esfera. 7.1.2. Cuádricas. 7.1.3. Superficies regladas. 7.1.4. Superficies de revolución. Bibliografía Recomendada.
1/22
TEMA 46 COORDENADAS DEL PLANO Y DEL ESPACIO 1. COORDENADAS CARTESIANAS EN EL PLANO. Se trata en este primer apartado de conseguir un sistema de representación para los puntos de un plano, así como para los diversos subconjuntos de puntos de dicho plano que reciben habitualmente el nombre genérico de curvas planas. Para ello, un primer método es el denominado de coordenadas cartesianas. Dado un plano determinado, consideremos en él un conjunto de dos rectas que se cortan en un punto O, que llamaremos origen y sobre cada una de las rectas un punto que denominaremos punto unidad. El punto O y el punto unidad en cada recta (definidos en la figura como u1 y u2 ), que no tienen por qué estar a la misma distancia de O, determinan sobre cada recta un sistema de abscisas. Sobre cada recta, todo punto P determina un segmento OP. El cociente entre la distancia OP y la distancia Ou1 se denomina abscisa del punto P en ese sistema (colocando el signo + a ese cociente si P está en la recta de forma que u1 esté entre 0 y P, y el signo – si 0 está entre u1 y P. El sistema formado por las dos rectas, el punto O y los puntos u1 y u2 se suele denominar sistema de ejes cartesianos. Definido este sistema, vamos a establecer una correspondencia biunívoca entre los puntos del plano y los pares de números reales. Supongamos para ello el punto P1 del plano y tracemos por dicho punto una paralela a cada eje de coordenadas. Cada paralela cortará a cada eje en un punto, denominado A1 y A2 respectivamente. Como OA1 = x1 ·Ou 1 y OA2 = x 2 ·Ou 2 los puntos A1 y A2 determinan dos números reales x1 y x2 . Decimos que el par (x1 , x2 ) son las coordenadas del punto P1 en el sistema de coordenadas dado. Por la construcción de los puntos A1 y A2 se observa fácilmente que los números x1 y x2 son únicos, dado P1 y el sistema de coordenadas (por los axiomas de la geometría). Recíprocamente, los números (x1 , x2 ) determinan, dado el sistema coordenado, de forma única los puntos A1 y A2 . Trazando por ellos rectas paralelas a los ejes de coordenadas, el punto intersección de ambas es único, y se llama afijo del par (x1 , x2 ). Establecida así la correspondencia biunívoca vemos que el origen O se corresponde con el par (0, 0). A los puntos del eje OX1 (denominado eje de abscisas), le corresponden pares de la forma (x1 , 0) y a los puntos del eje OX2 (denominado eje de coordenadas), le corresponden pares de la forma (0, x2 ). 2/22
El punto u(1, 1) se dice que es el punto unidad del sistema. Como casos particulares de los sistemas de coordenadas cartesianas tenemos: a) Los ejes de coordenadas son rectas perpendiculares y los puntos unidad de cada eje están a distancias distintas de 0. Decimos que tenemos un sistema ortogonal de coordenadas. b) Los ejes de coordenadas son perpendiculares y los puntos unidad de cada eje están a la misma distancia de 0. Estamos ante un sistema ortonormal de coordenadas. En cualquier caso, los puntos P(x1 , x2 ) tales que: x1 > 0 se dice que forman el primer cuadrante x2 > 0 x1 < 0 forman el segundo cuadrante x2 > 0 x1 < 0 forman el tercer cuadrante x 2 < 0 x1 > 0 forman el cuarto cuadrante x 2 < 0 2. CAMBIO DE SISTEMAS DE COORDENADAS. En ciertas cuestiones es conveniente utilizar dos sistemas de coordenadas cartesianas (ortonormales) OXY y O’X’Y’, que podemos distinguir llamando OXY al antiguo y O’X’Y’ al nuevo. El problema fundamental que plantea el uso de dos sistemas de coordenadas es el siguiente: cada punto P del plano tiene unas coordenadas (x, y) en el sistema OXY y otras coordenadas (x’, y’) en el sistema O’X’Y’. Es, pues, necesario conocer el modo de pasar de unas a otras de estas coordenadas, con lo cual los problemas planteados en un sistema se podrán traducir a problemas en el otro sistema. Para pasar de las coordenadas (x, y) de P en el sistema OXY a las (x’, y’) de P en el sistema O’X’Y’ debemos encontrar las fórmulas de transformación: x ' = f ( x, y) y ' = g ( x, y )
(1)
x = h( x' , y' ) y = k ( x' , y ' )
(2)
o sus inversas:
3/22
Para poder encontrar estas fórmulas de transformación de coordenadas es preciso conocer la situación de un sistema respecto del otro. Si en (1) damos a (x, y) todos los pares de valores posibles, entonces para (x’, y’) aparecen también todos los pares de valores posibles y cada uno una sola vez. Las (1) constituyen, pues, una sustitución definida en el conjunto de los pares de números (x, y). 2.1. Traslación de ejes.
Sean OXY y O’X’Y’ dos sistemas de ejes coordenados ortonormales tales que los ejes O’X’ y O’Y’ son paralelos, con el mismo sentido respectivamente, que los ejes OX y OY. En estas condiciones se dice que el sistema de ejes O’X’Y’ se obtiene del OXY por traslación.
La posición de O’X’Y’ quedará conocida dando las coordenadas del origen O’ en el sistema OXY. Sean pues: O’(a, b) P(x, y) P(x’, y’)
referido al sistema OXY referido al sistema OXY referido al sistema O’X’Y’
Proyectando O’ sobre OX se obtiene O’, y proyectando P sobre OX obtenemos P1 y sobre O’X’, obtenemos P’1 . La igualdad: OP1 = OO '1 + O'1 P1 = OO'1 + O' P'1
equivale a:
x = a + x' Del mismo modo, OP2 = OO' 2 + O'2 P 2 = OO' 2 + O' P' 2 y = b + y' Las fórmulas de traslación de ejes son, por tanto: x = a + x' y = b + y y sus inversas
4/22
equivale a:
x'= x − a y ' = y − b 2.2. Giro de ejes. Supongamos ahora que tenemos dos sistemas ortonormales OXY y OX’Y’ con el mismo origen, y por tanto con el ángulo entre OX y OX’ igual al ángulo entre OY y OY’, que llamaremos á. En estas condiciones, el sistema OX’Y’ se dice que se ha obtenido a partir del OXY por un giro (rotación) de ángulo á alrededor del origen.
Sean (x, y) y (x’, y’), como siempre, las coordenadas de un punto P en los sistemas OXY y OX’Y’, respectivamente. Proyectando P sobre OX y sobre OX’ obtenemos P1 y P’1 respectivamente, proyectando P sobre OY y sobre OY’ obtenemos P2 y P’2 respectivamente. De la figura obtenemos: OP1 + P1 P"1 = OP"1 siendo P”1 la proyección de P’1 sobre OX. Entonces: P1 P"1 = QP '1 = PP'1 sin α = y ' sinx OP1 = x OP"1 = x' cos α
⇒
⇒
x ' cos α = x + y' sin α ⇔ x = x' cos α − y' sinα
Por otro lado:
OP2 = P1 P = P1 Q + QP . P1 Q = P"1 P'1 = x' sinx QP = y ' cos α OP2 = y
Ahora bien:
⇒
y = x' sin α + y ' cos α
Así pues, las fórmulas de la transformación en el giro son:
5/22
x = x ' cos α − y ' sin α y = x ' sin α + y ' cos α que pueden escribirse matricialmente como: x cos α − sin α x ' = + y sin α cos α y' cos α − sin α Calculando la inversa de la matriz , que es, sin α cos α
cos α sin α , − sin α cos α
obtenemos las expresiones inversas: x = x cos α + y sin α y = − x sin α + y cos α 2.3. Movimiento de ejes coordenados Sean ahora OXY y O’X’Y’ dos sistemas de ejes coordenados ortonormales tales que trazando por O’ unos ejes auxiliares O’X’’ y O’Y’’ con la misma dirección y sentido que los OX y OY, demuestre que O’X’Y’ se obtenga de O’X’’Y’’ por un giro de ángulo α alrededor de O’. Es decir, que los ejes O’X’Y’ se obtienen, a partir de OXY, mediante una traslación y un giro.
Sea O’(a, b) referido al sistema OXY y P(x, y) un punto cualquiera del plano referido a dicho sistema. Sea además P(x’,y’) el punto P referido al sistema O’X’Y’ y P(x’’,y’’) referido al O’X’’Y’’. Tendremos: x = a + x'' y = b + y ' ' Además: x ' ' = x ' cos α − y ' sin α y ' ' = x ' sin α − y' cos α Juntando ambas, obtenemos:
6/22
x = x ' cos α − y' sin α + a y = x ' sin α − y ' cos α + b
Fórmulas del movimiento de ejes.
Estas expresiones se pueden escribir matricialmente como: x cos α − sin α x ' a = + y sin α cos α y' b o bien x cos α − sin α 0 x ' y = sin α cos α 0 y ' 1 0 0 1 1 Las inversas pueden obtenerse de forma sencilla. 3. COORDENADAS POLARES. En un plano queda determinado un sistema de coordenadas polares si se da un punto O, que se denomina polo, una semirrecta de origen O, que se denomina eje polar, y las unidades que se utilizan para medir longitudes y ángulos, además del sentido que se utiliza como positivo para medir ángulos orientados, o con sentido. Comúnmente se utiliza en el dibujo el eje OX paralelo al margen inferior del papel del dibujo y como sentido positivo el contrario al del movimiento de las agujas del reloj. Una vez fijado un sistema de coordenadas polares, cada punto P del plano, determina dos números ö y ñ llamados coordenadas polares de P. El primero, ö, es la medida del ángulo (OX, OP) y se llama argumento de P. Este ángulo queda indeterminado si P=0. El segundo número, ñ, es la distancia OP y se llama radio polar o módulo de OP. Recíprocamente, si damos un par de números (ö, ñ) tales que 0 ≤ ϕ ≤ 2π y ρ ≥ 0 , no hay un punto que posea como argumento ö y como radio polar ñ. El punto P con estas coordenadas polares puede representarse como P(ö, ñ). Conviene, sin embargo, establecer un convenio que permite que las coordenadas polares de un punto tomen cualquier valor. Seas ö y ñ y par de números cualesquiera. Hay una semirrecta OA que forma con OX un ángulo de medida ö. En esta recta OA hay un solo punto P cuya abscisa es ñ. Este punto estará en la semirrecta OA si ñ es positivo y en la opuesta si ñ es negativo. El punto P se dice que tiene las coordenadas polares (ñ, ö). Si el punto P tiene también las coordenadas (ñ0 , ö0 ) con:
7/22
0 ≤ ϕ0 < 2π
ϕ = ϕ0 + 2kπ ρ = ρ0
entonces: si ñ>0 se verifica:
Si ñ<0, entonces:
ρ0 > 0
ϕ = ϕ0 + ( 2k + 1)π ρ = − ρ0
Con este convenio puede representarse gráficamente cualquier función ρ = f (ϕ) como conjunto de puntos de la forma (ϕ, f (ϕ) ) . 3.1. Paso de coordenadas cartesianas a polares. Si tenemos un sistema ortonormal OXY y tomamos OX como eje polar y como sentido positivo para medir ángulos el del ángulo (OX, OY), cada punto P del plano tendrá unas coordenadas cartesianas P(x, y) y unas coordenadas polares P(ö, ñ).
ñ ö De la figura se obtiene, sin dificultad: x = ρ cos ϕ y = ρ sin ϕ
y x ϕ = arctan = arccos 2 2 x x +y ρ=
o bien,
x2 + y 2
4. ECUACIONES DE CURVAS EN EL PLANO. 4.1.
Curvas en coordenadas cartesianas explícitas.
Son aquellas curvas que vienen determinadas por la gráfica de una expresión de la forma y = f (x ) . Es decir, una curva así definida viene determinada como: G = {( x, y) y = f ( x )} Representando gráficamente los pares (x, y) se obtiene una gráfica, que suele denominarse curva de la función y = f (x ) , en el supuesto que f(x) sea la expresión de una función f : R → R . Las curvas dadas de esta forma han sido estudiadas con detalle en los temas de cálculo, sobretodo en el Tema 28. 8/22
La representación gráfica de la función y = f (x ) se dice que constituye una curva uniforme y continua si la función y = f (x ) es uniforme y continua. La igualdad y = f (x ) se llama ecuación de dicha curva. Si y = f (x ) está definida en el intervalo (a, b), la curva que resulta de limitar en y = f (x ) el campo de variabilidad de x a un subintervalo (α, β) ⊂ (a, b ) se dice que es un arco de curva (incluso puede ser (α, β ) = (a, b ) ). 4.2.
Curvas en forma paramétrica. Dadas dos funciones uniformes y continuas: x = x (t ) t ∈ (a , b) y = y (t )
al conjunto de puntos de la forma G = {(x (t ), y (t 1 ) ), ∀ t ∈ ( a, b)} se llama curva de ecuaciones paramétricas. x = x (t ) y = y (t ) Un arco de la curva anterior de extremos P1 ( x( t1 ), y (t 1 ) ) y P2 ( x(t 2 ), y( t 2 ) ) es la curva que se obtiene con los puntos {( x( t ), y (t1 ) ), ∀t ⊂ ( a, b )} . Un punto ( x( t ' ), y (t ' ) ) se dice que es un punto múltiple de la curva de ecuaciones x = x (t ) t ∈ (a , b) y = y (t ) si existe (por lo menos) otro valor t "≠ t ' tal que: x (t ") = x (t ' ) y (t ") = y (t ' ) Los demás puntos de dicha curva se llaman simples. Si los puntos extremos ( x( a), y ( a) ) y ( x( b), y( b) ) coinciden, pero no se obtiene dicho punto para ningún otro valor del parámetro t, dicho punto se considera simple. La curva se dice cerrada o un arco de curva cerrada cuando coinciden los dos puntos que resultan para t =a y t =b. Una curva de ecuaciones paramétricas x = x (t ) t ∈ (a , b) y = y (t ) 9/22
se llama de Jordan si además de ser estas funciones uniformes y continuas, la curva carece de puntos múltiples. Una curva de Jordan decimos que tiene tangente en el punto (x(c), y(c)) si existe el límite: y( t ) − y ( c) lim t →c x( t ) − x ( c) Una curva de Jordan se dice que tiene tangente en todos sus puntos si el límite anterior existe ∀c ∈ (a , b). En las curvas elementales se excluye la existencia de infinitos puntos de discontinuidad, de infinitos puntos múltiples y de infinitos puntos sin tangente. Es decir, una curva elemental o regular puede considerarse como la unión de un número finito de curvas de Jordan con tangente en todos sus puntos. Como ejemplos de curvas paramétricas tenemos: 4.2.1. Circunferencia Si el centro de la circunferencia de radio r es el origen de coordenadas, las ecuaciones paramétricas de la circunferencia, en función del ángulo que forme un punto genérico con el eje OX es: x = r cos t t ∈ [0,2π] y = r sin t
Si el centro es el punto de coordenadas (x0 , y0 ) las ecuaciones serán ahora: x = x 0 + r cos t t ∈ [0,2π] y = y 0 + r sin t 4.2.2. Cicloide Es la curva descrita por un punto M de una circunferencia c que rueda sin deslizarse sobre una recta indefinida. Tomando por eje OX la recta dada y por eje OY la perpendicular a la anterior trazada por el punto O en que se supone que el punto M coincide con la recta, las ecuaciones se obtienen así:
10/22
Las coordenadas de un punto M cualquiera de la curva verifica que: x = OP = OA − MB y = MP = AC − C Llamando r al radio de la circunferencia móvil y t al ángulo MCA, por la definición de la curva se sabe que el arco AM es igual en longitud al segmento OA. Según esto: OA= arco AM= Z De todo ello resulta: x = rt − r sin z ⇒ x = r ( t − sin t ) y = r − r cos t ⇒ y = r (1 − cos t ) Estas dos ecuaciones son las ecuaciones paramétricas de la cicloide. De ellas se deduce la forma de la curva: El valor de x crece continuamente al mismo tiempo que t mientras que la ordenada y crece desde t= 0 hasta t= ð en que adquiera el valor máximo EF= 2r, correspondiente a x= ðr, disminuyendo luego hasta t= 2ð en que y= 0 cuando x= 2ðr. Para valores de t superiores a 2ð se obtienen ramas sucesivas de curvas iguales a la primera. Los puntos O y M se llaman puntos de retroceso. 4.2.3. Hipocicloides Si al rodar una circunferencia sobre otra el contacto es interior, las curvas descritas por los distintos puntos unidos invariablemente a la curva móvil describen hipocicloides.
Las ecuaciones de las hipocicloides son: r x = ( r − a ) cos α + a cos − 1α a r y = ( r − a ) sin α − a sin − 1α a
11/22
-
Para r= 3a tenemos la hipocicloide natural de Steimer de tres retrocesos.
-
Para r= 4a tenemos la astroide o hipocicloide de cuatro retrocesos.
-
Cuando a>r tenemos las pericicloides y en ellas el círculo fijo es interior al móvil.
4.3.
Curvas en coordenadas polares.
4.3.1. Ecuación de la recta Sea la ecuación normal de la recta:
x cos α + y sin α = P Si en esta ecuación ponemos: x = ρ cos ϕ y = ρ sin ϕ
ö á ñ o sea:
obtenemos:
ρ cos ϕ cos α + ρ sin ϕ sin α = P , ρ cos(ϕ − α) = P
que es la ecuación de la recta en coordenadas polares. Si se quiere esta ecuación se puede poner de la forma: P ρ= cos(ϕ − α) 4.3.2
Ecuación de la circunferencia Sea la circunferencia de centro (a, b) y radio r en un sistema de coordenadas ortonormal. Si en su ecuación ( x − a ) 2 + ( y − b) 2 = r 2 ñ
hacemos el cambio a polares x = ρ cos ϕ y = ρ sin ϕ
á ö y sustituimos además:
a = d cos α
b = d sin α
obtenemos:
r 2 = ρ 2 + d 2 − 2 ρd cos(ϕ − α) si el punto (a, b) es el origen de coordenadas entonces d= 0 y la ecuación queda sí:
12/22
ρ= r 4.3.3. Estrofoide Dado el sistema cartesiano ortonormal OXY sea A un punto sobre el eje x. Trazando por A una recta cualquiera AD que corte a OY en D, se lleva sobre esta recta, a un lado y otro de D los segmentos DM = DN = OD. El lugar geométrico de los puntos M y N se llama estrofoide. Tomando por polo el punto O y por eje polar el eje OX, las coordenadas de M son: ρ = OM ϕ = ∠MDA Por construcción sabemos que el triángulo OMD es isósceles, de donde se deducen las siguientes relaciones: ∠DOM = ∠ DMO = 90º −ϕ ∠ODM = 2ϕ ∠OAM = 90 º−2ϕ En el triángulo OAM se verifica: OM sin ∠ OAM sin( 90º −2ϕ) cos 2ϕ = = = OA sin ∠OMA sin( 90º −ϕ) cos ϕ Como OM= ñ, resulta: (haciendo OA= a= ρ= a
cos 2ϕ cos ϕ
que es la ecuación de la estrofoide en coordenadas polares. Las coordenadas de N verifican la misma ecuación. 4.4.
Curvas en forma cartesiana implícita.
En general, cuando tratemos de representar una curva dada por una ecuación en forma implícita, de la forma f(x, y)= 0, no podemos expresarla explícitamente (en la forma y= g(x)), por lo que el estudio de una representación es muy distinto al conocido. Cuando a partir de f(x, y)= 0 es posible encontrar una o varias funciones uniformes y continuas y = f 1 ( x ), y = f 2 ( x),..., y = f n ( x )
13/22
que contienen todas las soluciones de f(x, y)= 0 decimos que las curvas y = f i (x ) (i = 1...n ) componen una curva de ecuación implícita f(x, y)= 0. Las curvas representan todas las soluciones de f(x, y)= 0 en la forma paramétrica x = x (t ) y = y (t ) de modo que f (x (t ), y (t 1 ) ) = 0 ∀t En este caso queda expresada la curva f(x, y) = 0 en forma paramétrica. 4.4.1. Ejemplo de curvas en implícitas: 4.4.1.1. Circunferencia Sabemos que la ecuación de la circunferencia de centro (a, b) y radio r puede expresarse como: ( x − a ) 2 + ( y − b )2 = r 2 que proviene de expresar la distancia de un punto cualquiera (x, y) al centro (a, b) e igualarla a r. 4.4.1.2. Estrofoide En la ecuación vista antes: ρ = a
cos 2ϕ , haciendo: cos ϕ
x = ρ cos ϕ y = ρ sin ϕ
x2 y2 a 2 − 2 ρ ρ a cos 2 ϕ − sin 2 ϕ ρ= = x cos ϕ ρ
obtenemos:
[
x ( x2 − y2 ) ρ=a =0 ρ ρ2
]
⇒
Como ρ2 = x 2 + y 2 resulta:
o sea:
ρ2 x = a( x 2 − y 2 ) .
x ( x 2 + y 2 ) 2 − 2a 2 ( x 2 − y 2 ) = 0
que es la ecuación implícita de la estrofoide. 4.4.1.3. Lemniscata La ecuación de esta curva en implícitas es: ( x 2 + y 2 )2 − 2 a 2 ( x 2 − y 2 ) = 0 El origen de coordenadas es el centro de la curva, y los ejes de coordenadas son ejes de simetría. Se compone de dos ramas cerradas que se unen en el centro , que es un punto doble. 14/22
5. 5.1.
COORDENADAS EN EL ESPACIO. Coordenadas cartesianas.
Z P3 P
O
y1
P1
Y
P’
X Sean OX, OY, OZ tres rectas del espacio concurrentes en un punto O y no coplanarias. En la recta OX tomemos un sistema de abscisas con origen en el punto Oy otro punto U1 como punto unidad. Del mismo modo, en OY y OZ tomemos sendos sistemas de abscisas con origen O y puntos unidad U2 y U3 , respectivamente. Diremos que estas tres rectas OX, OY, OZ con los sistemas de abscisas considerados forman un sistema de coordenadas OXYZ, del espacio tridimensional. En este sistema de coordenadas el punto O se llama origen de coordenadas, las rectas OX, OY y OZ, ejes de coordenadas y los planos OXY, OXZ y OYZ, planos de coordenadas. Dado ahora un punto P del espacio, trazamos por él un plano paralelo al plano OYZ, el cual corte al eje OX en un punto P1 . De modo análogo, el plano trazado por P paralelo a OXZ corta al eje OY en un punto P2 , y el paralelo a OXZ corta a OZ en P3 . Los tres puntos P1 , P2 , P3 tendrán ciertas coordenadas x, y, z en los sistemas de abscisas de los ejes OX, OY, OZ respectivamente. Estos tres números (x, y, z) así obtenidos se llaman coordenadas del punto P en el sistema de coordenadas OXYZ. Estas coordenadas dadas en este orden determinan el punto P. Por ello, este punto P lo designaremos por (x, y, z) o bien P(x, y, z).
15/22
En el caso de que las rectas sean perpendiculares (los ejes de coordenadas), decimos que el sistema de coordenadas es ortogonal. En el caso de que la distancia al origen O a cada punto unidad sobre cada eje sea igual, decimos que el sistema de coordenadas cartesiano es ortonormal.
5.2.
Coordenadas polares. X3
Consideremos un sistema cartesiano ortonormal OX1 X2 X3 . Denominando polo al punto O y plano polar al plano OX1 X3 , el punto P viene determinado por los tres números siguientes:
P ñ è
x3
ñ= OP, llamado radio vector
O
X2 ø
x1
ö r
X1
P’
è = ángulo POX 3 , denominado distancia cenital. ö= ángulo que forma el plano POX3 con el plano polar.
A todo punto del espacio corresponde una terna de números y recíprocamente, a toda terna de números corresponde un punto (excepto al origen), si hacemos variar: 0 ≤ ρ< ∞
0 ≤ ϕ ≤ 2π
0 ≤θ < π
existiendo así una correspondencia ente los puntos del espacio y las ternas de puntos con tales limitaciones, llamadas coordenadas polares. El paso a coordenadas cartesianas se hace de la siguiente forma: x1 = ρ sin θ cos ϕ x 2 = ρ sin θ sin ϕ x 3 = ρ cos θ y recíprocamente, elevando al cuadrado y sumando el paso a polares es:
16/22
ρ = x1 2 + x 2 2 + x3 2 2
x1 + x2
sinθ =
tanϕ = 5.3.
2
x1 2 + x 2 2 + x3 2
o bien
x3
cos θ =
2
2
x1 + x 2 + x3
2
x2 x1
Coordenadas esféricas.
Coinciden con las anteriores sin más que tomar, en vez del ángulo è, su complementario ø, que se denomina latitud. 5.4.
Coordenadas cilíndricas. Referido a un sistema cartesiano ortonormal, un punto P cualquiera del espacio viene determinado por: - Su altura z sobre el plano OXZ, es decir, la coordenada de la proyección P sobre el eje OZ. - Las coordenadas polares (ñ, ö) de la proyección P’ de P sobre el plano OXY. ö
ñ
Los números (ñ, ö, z) reciben el nombre de coordenadas cilíndricas de P.
Las restricciones de tales coordenadas para la existencia de una correspondencia biyectiva (salvo el origen) entre puntos del espacio y ternas de números es: 0 ≤ ρ≤ ∞
0 ≤ ϕ < 2π
−∞ < z < ∞
La relación entre coordenadas cilíndricas y rectangulares es: x = ρcos ϕ
y = ρsin ϕ
z=z
y recíprocamente: ρ=
x2 + y 2
tan ϕ =
17/22
x y
z=z
6.
CURVAS EN EL ESPACIO. Una curva en el espacio puede representarse de dos maneras distintas:
6.1. Representación paramétrica. o sea por ecuaciones de la forma: x = x (t ) y = y (t )t ∈ I ⊂ R z = z (t ) Ejemplos. 1. Una recta en el espacio viene expresada por: x = a + vt y = b + wt z = c + ut donde P(a, b, c) es un punto de la recta y (v, w, u) es un vector director. 2. Una hélice circular o cilindro: Es la curva descrita por un punto que gira alrededor de un eje con velocidad angular constante y al propio tiempo se desplaza en la dirección de este eje con velocidad lineal constante. Si tomamos como eje el OZ, llamamos R al radio de giro, ù a la velocidad angular y v a la lineal, tenemos: x = R cos ωt y = R sin ωt z = vt que son las ecuaciones paramétricas de la hélice, siendo t (el tiempo) el parámetro. 6.2. Como intersección de dos superficies Según veremos en el apartado siguiente, una superficie en R3 puede expresarse mediante una ecuación de la forma: f(x, y, z) = 0 Si las superficies S1 y S2 vienen dadas por sus ecuaciones: 18/22
f ( x, y , z ) = 0 g ( x, y, z ) = 0 la curva, en este caso, es el conjunto de puntos M cuyas coordenadas (x, y, z) satisfacen las dos ecuaciones simultáneamente. Ejemplos La hélice anterior puede expresarse como intersección de las dos superficies siguientes: x = R cos ωt y = R sin ωt = 0 z = vt
⇒
x 2 + y 2 = R2 ωz x = R cos v
Una recta puede expresarse como intersección de dos planos: Ax + By + Cz + D = 0 A' x + B' y + X ' z + D' = 0 7.
SUPERFICIES EN EL ESPACIO.
Una superficie S en el espacio tridimensional puede representarse de distintas formas. a) Expresando la condición necesaria y suficiente que deben cumplir las coordenadas (x, y, z) de un punto P para pertenecer a S. Ello da lugar a una ecuación de la forma: f ( x, y, z ) = 0 que se denomina ecuación implícita de la superficie. b) También puede representarse la superficie S paramétricamente, mediante dos variables independientes (por ejemplo u y v), denominadas parámetros y tres funciones, cada una de las cuales define cada coordenada. Así: x = f (u, v ) y = g (u, v) z = h( u, v)
ecuaciones paramétricas de S
19/22
7.1. Ejemplos de superficies 7.1.1. Esfera Los puntos P(x, y, z) pertenecen a la esfera de centro C(a, b, c) y radio R si y sólo si d(P, c) = R, o lo que es lo mismo: ( x − a ) 2 + ( y − b) 2 + ( z − c) 2 = R . Por lo tanto, la esfera se define así:
{
S = ( x, y , z ) ∈ R 3 /( x − a) 2 + ( y − b) 2 + ( z − c ) 2 = R 2
}
En coordenadas esféricas viene expresada por: x = a + R cos θ cos α y = b + R cos θ sin α z = c + R sin θ 7.1.2. Cuádricas En el Tema 49 se estudiarán con detalle. Basta aquí señalar las siguientes ecuaciones: - Elipsoide de ecuación:
x2 y 2 z 2 + + =1 a2 b2 c2
- Hiperboloide de una hoja:
x2 y 2 z 2 + − =1 a2 b2 c 2
- Hiperboloide de dos hojas:
x2 y 2 z 2 − − =1 a2 b 2 c 2
- Cono elíptico:
x2 y2 z 2 + + =0 a2 b 2 c 2
- Paraboloide elíptico:
x2 y 2 + −z=0 a2 b2
- Paraboloide hiperbólico:
x2 y 2 − − z =0 a2 b 2
7.1.3. Superficies reglada Sea Rö una recta que depende de un parámetro ö. Cuando este parámetro varía, la recta (generatriz) describe, en general, una cierta superficie que se llama superficie reglada. 20/22
Si la recta tiene una dirección fija y se apoya en una curva fija (directriz), se originan las superficies cilíndricas. Si la recta pasa por un punto fijo (vértice) y su apoyo en una curva fija (directriz), se originan las superficies cónicas. Se analizan con detalle en el Tema 49. 7.1.4. Superficie de revolución Una superficie de revolución S es la superficie engendrada por una curva c que gira alrededor de un eje E. Puede definirse también como el lugar geométrico de las circunferencias situadas en planos perpendiculares a E, con centro en E, que pasan por un punto de c. Estas circunferencias se llaman paralelos de la superficie. Las secciones de S por planos del haz de eje E se llaman meridianos de E. Estos meridianos son curvas que tienen a E por eje de simetría. S puede considerarse engendrada con el giro, alrededor de E, de cualquier meridiano. Si tomamos por eje E el eje OZ y definimos la superficie por el meridiano c situado en el plano OYZ, la curva tendrá de ecuaciones: x =0
y = f (ϕ) z = g (ϕ) luego la circunferencia engendrada por el giro de un punto c de dicha curva alrededor del eje OZ tendrá por ecuaciones: x = f (ϕ) cos t y = f (ϕ) sin t z = g (ϕ) que son las ecuaciones paramétricas de la superficie S. Se analizan con detalle en el Tema 49.
21/22
Bibliografía Recomendada. Curso de Geometría, Vol I. Aut. Puig Adam. Exercices de GEOMETRIE, Cours de Mathèmatiques Élémentaires. Autor: F.G.M. Edición de 1912 por MALSON A MAME ET FILS. PARIS Exercices de TRIGONOMETRIE. Autor: F.G.M. Edición de 1915 por MALSON A MAME ET FILS. PARIS.
22/22
TEMAS DE MATEMATICAS (Oposiciones de Secundaria) TEMA 47 GENERACIÓN DE CURVAS COMO ENVOLVENTES. 1. Introducción. 2. Envolvente. 2.1. Definición de Envolvente. 2.2. Existencia de Envolvente en el Plano. 2.3. Determinación Práctica de la envolvente en el Plano. 2.4. La Astroide. 3. Evoluta y Envolventes. 3.1. Evoluta de una curva Plana. 3.2. Ejemplos de Evolutas. 3.2.1. Evoluta de la Elipse. 3.2.2. Rectas del Plano dadas en forma Polar. 3.3. Evolventes de una curva plana. 4. Envolvente de una Familia de Curvas. 4.1. Curvas en Forma Paramétrica. 4.2. Curvas en Forma Explícita. 4.3. Curvas en Forma Implícita. 4.4. Propiedades de la envolvente. 5. Construcción de Algunas Curvas. 5.1. Trazado de la Evolvente del Círculo. 5.2. Trazado de la Curva Pericicloide. 5.3. Trazado de la Curva Epicicloide. 5.4. Trazado de la Curva Cardioide. 5.5. Trazado de la Curva Hipocicloide. Bibliografía Recomendada.
1/22
TEMA 47 GENERACIÓN DE CURVAS COMO ENVOLVENTES. 1. INTRODUCCIÓN. En este tema vamos a describir un tipo especial de curvas: las curvas generadas como envolventes. Son curvas de gran interés ya que tienen gran cantidad de aplicaciones. 2. ENVOLVENTE DE UNA FAMILIA DE RECTAS. 2.1. Definición de Envolvente. Sea D el conjunto formado por todas las rectas del plano. D = { y = ax + b / a, b ∈ 3} DEF Llamaremos Familia de Rectas dependientes de un Parámetro a la imagen de una aplicación. ϕ: I ⊂ 3 → D y designaremos a la familia como ( Dt )t ∈I Ejemplos 1. Dado el plano cartesiano, podemos definir tres funciones numéricas α(t ), β(t ) y γ (t ) con t∈I. Entonces, las rectas Dt ≡ α(t )x + β(t ) y + γ (t ) = 0 determinan una familia en función del parámetro t ∈I. 2. También podemos determinar una familia de rectas por su ecuación vectorial. r r r Dt ≡ r = α(t ) + λv (t ) r r siendo α, v : I → 3 2 dos funciones vectoriales y λ ∈ 3 una variable independiente de t. r r r α(t ) es un punto del plano y v (t ) el vector director que determina la recta Dt ≡ r en función del parámetro t ∈ I . DEF Llamaremos envolvente de una r familia de rectas dependientes r de un parámetro, ( Dt )t∈I ,a un arco parametrizado I , f tal que, en todo punto t, f (t ) , la recta Dt sea tangente al arco.
( )
(
2/22
)
r El par I , f también recibe el nombre de curve en paremétricas.
( )
DEF
r Llamaremos Punto Característico de la recta D t a t , f (t ) .
(
)
2.2. Existencias de Envolvente en el Plano. PROP Una familia de rectas del plano dependientes de un parámetro posee, en general, un envolvente. Dem Sea ( Dt )t ∈I la familia de rectas definidas como r r r r = α(t ) + λv (t ) r r siendo las funciones α(t ) y v (t ) derivables en I. r El arco I , f es la envolvente de la familia de rectas Dt t∈ I si para todo t∈I, el r r punto característico f (t ) pertenece a D t y el vector f (t ) que define la tangente al arco
( )
( )
en ese punto, tiene la dirección de D t . r Suponga mos que existe una función f : I → 3 2 tal que el arco envolvente de la familia dada. Entonces:
(I , fr )
sea la
r r 1) ∀t ∈ I el punto r = f (t ) ∈ Dt . Existe, por tanto, un número real λ(t ) tal que r r r f (t ) = α(t ) + λ(t ) ⋅ v (t )
(1)
La determinación de la función f equivale a hallar la función λ : I → 3 r 2) El vector derivada f ´(t ) (que en general será distinto de cero) debe ser vector director de D t . Ahora bien, si derivamos (1) r r r r f ´(t ) = α´(t ) + λ(t )v´(t ) + λ´(t )v (t ) r Y como v (t ) es el vector director de D t , ha de existir un µ(t ) ∈ 3 tal que: r r r r α´(t ) + λ(t )v´(t ) + µ(t )v (t ) = o
(2)
λ, µ : I → 3 funciones numéricas que satisfacen la r expresión (2), y si λ es derivable, la función vectorial f dada por (1) es derivable, y su derivada verifica la ecuación: Recíprocamente, si existe
3/22
r r f ´(t ) = [λ´(t ) − µ(t )]⋅ v (t ) r r por tanto, el vector f (t ) es nulo o colineal con v (t ) . Por tanto, la existencia de la envolvente están ligada a la existencia de dos funciones numéricas λ y µ que satisfagan (2). r r Y (2) exige que los vectores α´(t ), v´(t ) y v (t ) sean Linealmente Dependientes, condición que trivialmente se verifica en el plano relación (2) se puede obtener las funciones λ y µ como sigue: r • Multiplicando escalarmente por w(t ) r r r r r α´(t ) ⋅ w(t ) + λ(t ) ⋅ v ´(t ) ⋅ w(t ) = o r r − α´(t ) ⋅ w(t ) λ(t ) = r r v ´(t ) ⋅ w(t )
(3)
r r • Multiplicando por u (t ) , perpendicularmente a v´(t ) resulta: r r r r r α´(t )u´+µ(t ) ⋅ v (t ) ⋅ u (t ) = o r r α´(t ) ⋅ u (t ) µ(t ) = − r r v (t ) ⋅ u (t )
(4)
r r En términos generales, estos dos valores existirán siempre, salvo v (t ) y v´(t ) sean r r colineales, en cuyo caso se anulan los denominadores. Si v (t ) y v´(t ) son linealmente independientes, para todo t∈I existe un único par de funciones λ(t) y µ(t) que satisfacen (3) y (4). Este par único de funciones constituye la única solución de (2). La función r λ(t), así determinada, define la función f . En el caso general, para la mayoría de valores de t∈I, se tiene también λ´(t ) ≠ µ(t ) , r r r de donde se deduce f ´(t ) ≠ o . Tal punto t∈I es un punto ordinario del arco I , f . La tangente al arco en ese punto es la recta Dt .
( )
r r Si para cierto valor to ∈I se tiene λ´(t o ) = µ(t o ) entonces f ´(t o ) = o . r r El punto t o , f (t o ) del arco I , f es un punto singular, y no es posible afirmar que la tangente al arco en ese punto sea la recta Dt .
(
)
( )
Si la situación anterior nos la encontramos en puntos aislados, diremos también que r f (t o ) es un punto característico de Dto . Teniendo en cuenta esto, la envolvente de la
4/22
r familia (Dt )t∈I es el arco I , f , incluidos los puntos singulares. Así, es posible evitar el cálculo de la función µ.
( )
r r Si v (t ) y v´(t ) son linealmente dependientes, tenemos: r r 1) Si α´(to ) no es colineal con v (t o ) , la expresión (3) no tiene solución para λ ya que r r r w(t ) , que es perpendicular a v (t ) , también lo será a v´(t ) y por tanto
(3) ⇒ αr´(t ) ⋅ wr (t ) = or lo cual es imposible. r r r 2) Si α´(to ) es colineal con v (t o ) es colineal con v (t o ) , todo número real λ verifica (3) y todos los puntos de la recta Dto satisfacen las condiciones de punto característico. Diremos que Dto es una recta estacionaria de la familia. Como casos singulares tene mos: a) Si el par de funciones λ y µ verifican λ´(t ) = µ(t )
∀t ∈ I
Entonces, se tiene r r f ´(t ) = o
r r ∀t ∈ I ⇒ f (t ) = C
r siendo c un vector fijo. r Así pues, todas las rectas de la familia (Ft )t∈I pasan por el punto fijo c . La familia r forma una radicación de rectas concurrentes en c . r r r b) Supongamos que v (t ) satisface que {v (t ), v´(t )} son linealmente dependientes r ∀t ∈ I . Entonces v ha de tener una orientación fija. r v.
La familia (Dt )t∈I forma una radicación de rectas paralelas de la misma dirección que
Como conclusión a todo lo anterior podemos enunciar TEOREMA La familia de rectas del plano dependientes de un parámetro (Dt )t∈I r r r r r r r = α(t ) + λ ⋅ v (t ) con α, v : I → 32 admite, en general, una envolvente I , f con
( )
r r r f (t ) = α(t ) + λ(t )v (t ) donde la función λ(t) es la solución de la ecuación
5/22
r r r r α´(t ) + λ(t )v (t ) + µ(t ) ⋅ v (t ) = o 2.3. Determinación Práctica de la Envolvente en el Plano. TEOREMA La envolvente de la familia de rectas del plano,
( Dt )t∈I
α(t ) ⋅ x + β(t ) y + γ (t ) = 0
con α, β, γ: I → 3 y derivables ∀t∈I, se obtiene derivando primero esta relación respecto de la variable t: α´(t ) ⋅ x + β´(t ) ⋅´+γ´(t ) = 0 y resolviendo a continuación con el sistema formado por las dos ecuaciones. La r r solución (c, y) serán las coordenadas de f (t ) que define la envolvente I , f .
( )
Dem. r Determinaremos la envolvente I , f mediante las coordenadas
( )
r x = ϕ(t ) de f (t ) y = ϕ(t ) Lo vamos a hacer basándonos en el razonamiento desarrollado en el punto anterior. r a) El punto f (t ) = (ϕ(t ),ψ(t )) ha de pertenecer a Dt . entonces α(t )ϕ(t ) + β(t )ψ(t ) + γ (t ) = 0
∀t ∈ I
(5)
r b) El vector tangente f ´(t ) = (ϕ´(t ),ψ´(t )) ha de ser paralelo a Dt , entonces α(t )ϕ´(t ) + β(t )ψ´(t ) = 0
∀t ∈ I
(6)
Si derivamos la expresión (5) y tenemos en cuenta la expresión (6) obtendremos α´(t )ϕ(t ) + β´(t )ψ(t ) + γ ´(t ) = 0
∀t ∈ I
(7)
Recíprocamente, toda solución (ϕ,ψ) del sistema de ecuaciones formado por las expresiones (5) y (7) es también solución de la expresión (6) y representa, por tanto, la envolvente buscada. 2.4. La Astroide. Sea un sistema de referencia ortonormal del plano y l∈3+ un número dado. Consideremos la familia de rectas que cortan a los ejes en dos puntos, siendo la distancia entre estos constante de valor 2l.
6/22
Vamos a obtener ecuaciones de estas rectas, que dependerán de un parámetro. Una recta cortará a los ejes en dos puntos que llamaremos P y Q, verificándose d(P,Q) = 2l. Sea A el punto medio del segmento que une P y Q. Definimos el parámetro t como t = L (OX , OA )
con
t ∈ [0, 2π)
Si d(P,Q) = 2l entonces d(0,A) = l siendo entonces las coordenadas del punto A A(lcost, lsent) Es fácil ahora obtener las coordenadas de P y Q P(2lcost, 0)
y Q(0, 2lsent)
Y de aquí conseguimos la ecuación de la recta que pasa por P y Q x y + =1 2l cos t 2l sen t Para obtener la familia de rectas, vamos a limitarnos a tomar I = [0,2π ], siendo
( Dt )t∈I
x sen t + y cos t = 2lSentCost
(8)
Ahora ya estamos en condiciones de hallar la envolvente a esta familia de rectas. Para ello aplicamos el teorema anterior. Derivando los dos miembros de la expresión (8) con respecto al parámetro t
(
x cos t − y sen t = 2l Cos 2 t − Sen 2 t
)
(9)
Ahora hemos de resolver el sistema formado por (8) y (9) siendo x (t ) = 2lCos 3t y(t ) = 2lSen 3 t r y definimos f (t ) = ( x(t ), y (t )) . r La envolvente I , f que acabamos de obtener recibe el nombre de Astroide.
( )
Esta ecuación representar rla recta trazada por W(2lcost, 2lSent) perpendicular al segmento PQ, cuyo vector pq es linealmente dependiente con (cost – sent). El punto característico m sobre Dt es el pie de dicha perpendicular.
7/22
3. EVOLUTAS Y EVOLVENTES. 3.1. Evoluta de una curva Plana. r DEF Llamaremos Evoluta de una curve paramétrica I , f , con f: I → 32 derivable dos veces, a la envoltura de la familia de rectas normales a la curva paramétrica.
( )
Sea el sistema de referencia de Frenet correspondiente a un punto S∈I, determinado por r f ( s ) , como origen de coordenadas r r r T = f ´(s ) como vector que define un eje de coordenadas que pasa por f ( s ) . r r r r N = vector normal a f en f ( s ) , y perpendicular a f ´(s ) DEF
r Definimos el radio de curvatura ρ del arco I , f en s como
( )
r dT 1 r = N ds ρ
y
r dN 1 1 r = = T ds ρ ρ
TEOREMA La envoltura ce una curva plana es el conjunto de los centros de curvatura. Dem. r La ecuación vectorial de la normal a f en cada punto viene determinada por r r p = f `+λN Para determinar el punto característico de esta recta calculamos la función λ(s) de r r forma que p´( s ) y p (s ) sean linealmente dependientes. ∀s∈I. Entonces
8/22
r r r r dp df s N dλ r r 1 r dλ r λ r dλ r p´(s ) = = +λ + ⋅ N = T + λ − T + ⋅ N = 1 − T + N ds ds ds ds ds ds ρ ρ r r Para que p´( s ) y N sean colineales basta con 1−
λ =0 ρ
λ=ρ
Queda así determinado el punto característico de la normal, el cual es precisamente el centro de curvatura en el punto s∈I. 3.2. Ejemplos de Evolutas. 3.2.1. Evoluta de la Elipse. r La elipse I , f viene dada por
( )
I = [0,2π ]
r x = aCosθ f (θ ) = y = bSenθ
En el punto θ∈I la ecuación de la normal es − aSenθ ( x − a cos θ ) + bCosθ ( y − b sen θ ) = 0 Haciendo c2 = a2 – b2 obtenemos la familia de rectas normales a la elipse ( Dθ )θ∈ I
− a sen θ ⋅ x + bCosθ ⋅ y + c 2 SenθCosθ = 0
Para hallar la envolvente de esta familia se calcula primero ( D´θ ) θ∈I
− Cosθx − bSenθ ⋅ y + c 2 (Cos 2θ − Sen 2θ ) = 0
Resolviendo el sistema formado por las dos ecuaciones anteriores tenemos: r c (θ ) :
x=
c2 Cos 3θ a
y
y =−
c2 Sen 3θ b
r La evoluta es ( I , c ) , que es la transformación de la Astroide: c2 Cos 3θ a a al aplicarle la afinidad se eje OX y de razón − , es decir b c2 Y= Sen3θ a X=
9/22
x= X
a y = − y b
c2 c2 Los puntos de retroceso de la evoluta ,0 y 0, − se obtienen trazando, por b a el cuarto vértice d del rectángulo construido sobre los semiejes OX y Ob positivos de la elipse, la normal a la diagonal ab. La ecuación de esta recta normal es − ax + b + c 2 = 0 Por tanto, encuentra a los ejes OX y OY respectivamente, en los puntos de retroceso en cuestión. Los restantes se deducen por simetría.
3.2.2. Rectas del plano dadas en forma polar. Sea ( Dθ )θ ∈I una familia de rectas del plano, siendo el parámetro θ su ángulo polar: r r θ = L i,u
( )
r donde u es un vector unitario normal de la recta Dθ . Vamos a calcular la envolvente r ( I , vr ) de la familia ( Dθ )θ ∈I y la evoluta ( I , cr ) del arco I , f .
( )
10/22
El pie de la normal a Dθ trazada por el origen O, que denotaremos por h, describe r r r r un arco I , h , denominado Podaria del arco I , f con relación al punto O. Sea h = r u la ecuación de la Podaria en coordenadas polares, con r (θ ) una función
( )
( )
r:I →3 La ecuación cartesiana de la familia de rectas es:
( Dθ )θ ∈I
xCosθ + ySenθ = r (θ )
Aplicando lo visto ya para el cálculo de la envolvente, basta resolver el sistema formado por la ecuación y su derivada respecto del parámetro θ:
( D´θ )θ∈I
− xSenθ + yCosθ = r´(θ )
r La recta D´θ es normal al vector u´(θ ) y pasa por el punto h1 , definido como r h1 = r´(θ ) ⋅ u´ . El punto característico m de Dθ es m = Dθ ∩ D´θ La envolvente normales.
(I , rf )
( Dθ )θ ∈I
de la familia
tiene a
( D´θ )θ∈I
como familia de
r La evoluta del arco I , f coincide, por consiguiente, con al propio arco (I, f). Es la evolvente de la familia ( D´θ )θ∈I .
( )
Para hallar esta evolvente, derivamos de nuevo
( D´´θ )θ∈I
− xCosθ − ySenθ = r´´(θ )
r r r La recta D´´θ es normal al vector u y pasa por el punto h2 tal que h2 = −r´´(θ ) ⋅ u . r r El centro de curvatura del arco I , f es c = D´θ ∩ D´´θ . La evoluta ( I , c ) del arco r r I , f está definida por las coordenadas de c , solución del sistema ( D´θ , D´´θ ) .
( )
( )
3.3. Evolventes de una curva plana. r DEF Llamamos Evolvente de un arco I , f a otro arco como Evoluta.
( )
r Sea el arco I , f r tangente en m es:
( )
(I , pr )
que admite a
(I , rf )
dado en representación normal. La ecuación vectorial de la v r r p = f + λT
11/22
Vamos a obtener la función λ: I → 3 de forma que el arco anterior como normal, ∀s∈I.
(I , pr )
admite la recta
r r dp r dλ r dT dλ λ r =T + T +λ = 1 + T + N ds ds ds ds ρ con ρ el radio de curvatura en el punto s∈I. r r dp Para que sea normal a T basta con que ds 1+
dλ =0 ds
de donde se deduce dλ = −ds ⇒ λ = − s + k (con k = cte) Obtenemos una familia parametrizada de los arcos
(I , pk )
k∈3
siendo k el
parámetro, y su ecuación. r r r p k = f + (k − s )T r r ∀k, k´∈3 ∀s∈I, los arcos ( I , pk ) e ( I , pk ´ ) admiten tangentes paralelas, ya que: r dp λ r = N ds ρ
(10)
r r Aun más, sobre la normal común a los dos arcos, los puntos p k (s ) y p k´ (s ) determinan un segmento de longitud constante k − k´ ya que: r r r p k − p k ´ = (k − k´)T r Decimos que las evolventes ( I , pk )
k∈3 son
curvas paralelas.
r La expresión (10) prueba que λ = 0 implica que p´(s ) = 0 . Es decir, si una r evolvente del arco I , f encuentra a este arco, el punto de intersección es un punto singular de la evolvente (en general, un punto de retroceso).
( )
12/22
4. EVOLVENTE DE UNA FAMILIA DE CURVAS. 4.1 Curvas en Forma Paramétrica. r r Sea la ecuación x = x (t , λ) . Dando al parámetro λ todos los valores posibles obtenemos, para cada valor, un vector de posición que será función de la variable t, que representará una curva. El conjunto de Curvas obtenidas será función de la variable t, que representará una curva. El conjunto de Curvas obtenidas será una familia de curvas dependientes del parámetro λ. Sea una recta tangente a cada curva de la familia en uno de sus puntos. Diremos que esta línea es la Envolvente de la familia de curvas. Si queremos determinar la anterior envolvente, se M un punto de la curva de la familia que corresponde a un valor de λ y supongamos que a este punto le corresponde un cierto valor de t. Para que el punto M sea de contacto de la curva con la envolvente, es necesario que los valores de t y λ existan una relación que se expresa como λ = λ(t) y la ecuación de la envolvente será: r r x = x (t , λ(t )) Al ser M un punto en el que coinciden las rectas tangentes a la curva de la familia y a la envolvente, resulta que el vector tangente a la envolvente r r ∂x ∂x dλ + ⋅ ∂t ∂λ dt ha de ser igual al vector tangente a la curva. r ∂x ∂t Por tanto, las componentes de ambos vectores deben ser proporcionales r r r ∂x ∂x dλ ∂x + ⋅ =k⋅ ∂t ∂λ dt ∂t y entonces
r r dλ ∂x ∂x ⋅ = (k − 1) dt ∂λ ∂t
r r ∂x ∂x obteniendo que los vectores y son linealmente dependientes. ∂t ∂λ Si hacemos
13/22
r r ∂x ∂x det , =0 ∂t ∂λ
(11)
r r y eliminamos λ entre las ecuaciones x = x (t , λ) y (11) obtenemos la ecuación implícita de la envolvente. 4.2. Curvas en Forma Explícita. Sea la familia de curvas parametrizadas dada como x2 = f ( x1 , λ) Podemos convertirla a forma paramétrica introduciendo la ecuación x1 = x1 reduciéndose así al caso anterior. La ecuación (11) se transforma en: 1 ∂f ∂x1
0 ∂f = 0 ⇒ ∂f ( x1 , λ) = 0 ∂λ ∂λ
y eliminando λ entre las ecuaciones (12) y implícita de la envolvente.
x2 = f(x1 , λ) obtenemos la ecuación
4.3. Curvas en Forma Implícita. Si la familia de curvas viene dada por la ecuación f (x1 , x2 , λ) = 0 entonces, para ciertas condiciones x2 = ϕ( x1 , λ) luego, por la condición (12) ∂ϕ =0 ∂λ y por tanto ∂f ∂x2 ∂f ⋅ + =0 ∂x2 ∂λ ∂λ lo que implica 14/22
(12)
(13)
∂f =0 ∂λ
(14)
que es la condición de envolvente. Por tanto, basta eliminar el parámetro λ entre las ecuaciones (13) y (14) para obtener la ecuación de envolvente. 4.4. Propiedades de la Envolvente. PROP La envolvente es el lugar geométrico de las posiciones límites de la intersección de cada dos curvas de la familia cuando tienden a confundirse. Dem. Sea la familia de curvas f (x1 , x 2 , λ) = 0 y consideremos las curvas f ( x1 , x 2 , λ) = 0 f (x1 , x2 , λ + ∆λ) = 0 La curva f ( x1 , x 2 , λ + ∆λ) − f ( x1 , x2 , λ) =0 ∆λ pasa por el punto común a ambas curvas consideradas (punto característico) y cuando ∆λ → 0 el movimiento que lleva a la segunda a confundirse con la primera desplaza a éste, de forma que la posición límite del punto común será: f (x1 x 2 , λ) = 0 ∂f = 0 ∂λ que son las condiciones de envolvente de una familia de curvas. PROP La envolvente contiene al lugar geométrico de los puntos singulares de las curvas. Dem. Sea la familia de curvas f (x1 , x 2 , λ) = 0 . Los puntos singulares vienen dados por las condiciones
15/22
∂f =0 ∂x1
∂f =0 ∂x2
y
(15)
Si de estas dos ecuaciones despejamos x1 y x2 en función de λ, tendremos un punto singular para cada valor de λ, el cual debe satisfacer la ecuación de la familia. O sea: f (x1 (λ), x 2 (λ), λ) = 0 y derivando respecto a λ: ∂f dx1 ∂f dx 2 ∂f ⋅ + ⋅ + =0 ∂x1 ∂λ ∂x 2 dλ ∂λ y teniendo en cuenta (15) queda ∂f =0 ∂λ que es la condición de envolvente. Por tanto, resulta interesante al hallar la envolvente de una familia eliminar el lugar de los posibles puntos singulares de las curvas de la familia. Recíprocamente, de las relaciones f (x1 , x2 , λ)
y
∂f =0 ∂λ
deducimos las ecuaciones paramétricas de la línea x1 = x1 (λ)
x2 = x2 (λ)
cuyos puntos satisfacen la ecuación de la familia, es decir:
(
)
f x1 (λ), x2 (λ), λ = 0 y derivando respecto a λ: ∂f dx1 ∂f dx 2 ∂f ⋅ + ⋅ + =0 ∂x1 dλ ∂x 2 dλ ∂λ y como ∂f =0 ∂λ resulta
16/22
∂f dx 2 ∂x1 = dλ ∂f dx1 ∂x2 dλ que nos dice que la línea obtenida y cada una de las curvas de la familia son tangentes. 6. CONSTRUCCIÓN DE ALGUNAS CURVAS. TEOREMA El arco de evoluta es igual a la diferencia entre los radios de curvatura correspondientes a los extremos del arco de evoluta. Dem r r Sea la curva x = x ( s ) y la ecuación de su evoluta r r r x = x (t ) + p ⋅ N ( s )
(16)
Vamos a demostrar que el arco CD de la evoluta es igual a la diferencia de los radios de curvatura en A y B. Derivando (16) tenemos r r r r r dx r dN r = T + ρ´(s ) ⋅ N (s ) + ρ( s ) = T + ρ´( s ) ⋅ N (s ) − T ds ds luego r r dx = ρ´(s ) ⋅ N (s ) ds Si llamamos σ al arco de evoluta r dx dσ = ds ds luego B dσ dρ = ⇒ σCD = ∫ d ρ = ρB − ρA A ds dσ
c.q.d.
Del teorema anterior deducimos la manera de construir de forma práctica la evolvente: Bastaría suponer una línea arrollada sobre la evoluta e irla extendiendo manteniéndola tensa. El punto tomado como origen para tal desarrollo describe la
17/22
evolvente. Ahora bien, al variar ese punto obtenemos diferentes evolventes, todas ellas paralelas, de la misma curva evoluta. Por otra parte, la podaria de una curva respecto de un punto C es el lugar geométrico de los pies de las perpendiculares trazadas por C a las tangentes de la curva. Puede considerarse la podaria como envolvente de las circunferencias de diámetro CA donde A es el punto de la curva donde se traza la tangente y la normal. r r En efecto, si la curva es x = x ( s ) , la tangente en uno de sus puntos es r r r x = x (s ) + λT La perpendicular por C a esta recta es r r r x = c + µN Si entre estas ecuaciones eliminamos s, λ y µ obtenemos la ecuación de la podaria. Si la curva viene dada por como normal en C:
x2 = f ( x1 ) se procesa de forma análoga obteniendo
x2 − c2 = −
1 (x − c ) f ´(a1 ) 1 1
Si consideramos la circunferencia de diámetro AC:
( x1 − c1 )( x1 − a1 ) + ( x2 − c2 )(x 2 − a2 ) = 0 y queremos hallar la envolvente, derivamos respecto de a1
( x1 − c1 ) + ( x2 − c 2 ) ⋅ da2 da1
=0
y dividiendo ambas ecuaciones, después de transformar los términos x1 −a1 =
1 ( x2 − a2 ) a´2
que con a 2 = f (a1 ) nos dan las ecuaciones obtenidas anteriormente. 5.1. Trazado de la Evolvente de la circunferencia. La evolvente de la circunferencia es la curva engendrada por un punto de una recta que se mueve, apoyándose sin desplazamientos sobre una circunferencia. Las ecuaciones paramétricas son
18/22
x = r ⋅ cos α + (rα ± h )sen α y = r ⋅ sen α − (r α ± h ) cos α Veamos cual es el procedimiento para su trazado. Paso 1: Trazamos la circunferencia evoluta con radio r. Paso 2: Dividimos la circunferencia en n partes iguales. En el dibujo tomamos n = 12. Paso 3: Por cada punto obtenido de la división anterior, trazamos rectas tangentes a la circunferencia. Paso 4: Si el punto de tangencia C correspondiente a la partición O es punto de la evolvente, trazamos el arco de centro el punto 1 y radio la distancia del punto 1 al O. Paso 5: Repetimos el proceso haciendo centro en el resto de puntos y como radio la distancia de dichos puntos al O.
5.2. Trazado de la curva Pericicloide. Esta curva presenta características muy similares a la anterior. La diferencia está en que las tangentes a la circunferencia, que van a apoyar la construcción de la evolvente serán de circunferencias en lugar de rectas. Los lados cóncavos del dichos arcos tocarán al lado convexo de la circunferencia inicial e evoluta, siendo los radios de aquellos mayores que los de esta.
19/22
5.3. Trazado de la curva Epicicloide. Un punto P de una circunferencia que rueda sobre otra fija describe la curva epicicloide. De su construcción gráfica obtenemos sus ecuaciones paramétricas r x = (r + a ) ⋅ cos α − a ⋅ cos + 1 a ⋅ α r y = (r + a ) ⋅ sen α − a ⋅ sen + 1 ⋅ α a Su construcción gráfica es:
20/22
5.4. Trazado de la curva Cardioide. Si en el trazado de la Epicicloide, ambas circunferencias, la móvil y la fija, son de la misma dimensión, obtenemos la Cardioide.
5.5. Trazado de la curva hipocicloide. Si al rodar una circunferencia sobre otra fija el contacto es interior, las curvas descritas por los distintos puntos, unidos invariablemente a la curva móvil, describen hipocicloides. Las ecuaciones paramétricas son: r x = (r − a) cos α + a ⋅ cos − 1 ⋅ α a r y = (r − a ) sen α − a ⋅ sen − 1 ⋅ α a
21/22
Bibliografía recomendada. Curso de Matemáticas. Análisis y Geometría Diferencia. Aut: A. Donnddu. Edit: Aguilar. Algebra. Aut: L. Thomas Ara. Geometría Analítica. Aut: M. De Lanuza. Edit: Gredos. Geometría Analítica. Aut: L. Crusat. Edit: Bosch.
22/22
TEMAS DE MATEMÁTICAS (OPOSICIONES DE SECUNDARIA) TEMA 48 ESPIRALES Y HÉLICES. PRESENCIA EN LA NATUTALEZA, LA TÉCNICA Y EL ARTE.
1. 2. 3. 4.
Introducción. La espiral de Arquímedes: Descripción y ecuación. Actividades. La espiral equiangular: Descripción y ecuación. Propiedades. Otras espirales. 4.1. Hiperbólica. 4.2. De dos, tres, cuatro centros o de paso 2 4.3. De Durero. 5. Hélices. 5.1. Ecuaciones de la Hélice. 6. Helicoides. Descripción y construcción. Bibliografía Recomendada.
1/8
TEMA 48 ESPIRALES Y HÉLICES. PRESENCIA EN LA NATUTALEZA, LA TÉCNICA Y EL ARTE
1.- INTRODUCCIÓN. Existen en la Naturaleza numerosos ejemplos de formas enrolladas cuya representación gráfica es una espiral o una hélice. Se trata en casi todos los casos de un crecimiento en forma de giro ligado a una expansión, por ejemplo: las galaxias espirales, las conchas de las caracolas y otros moluscos, el crecimiento de una planta trepadora a lo largo de un soporte, las astas de los carneros, etc. Igualmente, el hombre ha necesitado también estas formas unas veces por necesidades prácticas y otras por necesidades estéticas. El diseño de una escalera de caracol, construcción de muelles y solenoides son ejemplos prácticos; las espirales en vasos, los volantes en arquitectura, etc., son manifestaciones artísticas. El estudio de ellas se dificulta siempre porque las coordenadas rectangulares no son idóneas. Se precisan coordenadas polares. No obstante puede conseguirse una aproximación a ellos válida para último curso de ESO (con muchas reservas y prescindiendo de ecuaciones), y sobre todo para las matemáticas de la forma, del futuro Bachillerato artístico. Estudiaremos en primer lugar las espirales, en especial las de Arquímedes, y la logarítmica o equiangular. Se citaran también otras espirales y “falsas” espirales. 2.- LA ESPIRAL DE ARQUÍMEDES. Es la más antigua conocida. Ya Arquímedes la citaba como ejemplo de la trayectoria que sufre un punto móvil sometido a un giro a velocidad angular constante y a un crecimiento del radio también constante. Se puede determinar su ecuación fácilmente: Si á es el ángulo de giro en radianes, Va la velocidad angular y t el tiempo, se tiene: α = Va t Si r es el radio de giro, V1 la velocidad constante de crecimiento del radio, se tiene: r = V1 t . eliminando t:
r = V1
α = kα Va
2/8
r = kα
Ecuación espiral de Arquímedes en c. polares.
Es curioso el parecido que existe entre una recta que pase por el origen en coordenadas rectangulares y = mx, y la espiral de Arquímedes en coordenadas polares r = kα . La forma de la espiral de Arquímedes la determina el valor de k pues la distancia entre dos espiras se obtiene restando los radios de dos espiras consecutivas al dar una vuelta completa. r ' = k (α + 2π) r = kα
r '−r = 2 kπ
lo que prueba que la “anchura de la espiral es constante. Es claro también que al aumentar el radio las espiras se vayan pareciendo cada vez más a circunferencias. Actividades: 1.- Puede tantearse la forma de la espiral usando “papel polar”, o marcando con ayuda de un semicírculo graduado ángulos cada 5º y determinando los radios correspondientes. 2.- Igualmente, un procedimiento en LOGO muy sencillo permite simular espirales de forma muy aproximada PARA ESPIRAL :LADO :INC :ANGULO AV :LADO GD :ANGULO ESPIRAL :LADO + :INC :INC :ANGULO FIN (Es conveniente indicar valores “pequeños”, por ejemplo ESPIRAL 1 1 20 construye una poligonal que ya se parece a una espiral). Como el incremento de lado es constante también lo es el del radio. 3.- Un procedimiento dinámico más útil, es el de los alfareros. Sobre el pivote central se coloca una regla fija, y se desplaza un lápiz a velocidad constante de dentro afuera. El lápiz describe una espiral, y la forma de la espiral depende de la velocidad del torno, y de la velocidad con que se desplaza el lápiz. Este método, que explica por qué se utiliza tanto la espiral de Arquímedes como motivo artesanal, puede simularse también con un tocadiscos y un papel colocado sobre él.
3/8
3.- LA ESPIRAL EQUIANGULAR. La Naturaleza no entiende de velocidades constantes, y así el crecimiento suele depender de lo crecido hasta entonces. Así, las espirales en la Naturaleza no suelen mantener la distancia entre espiras. Como introducción, modifiquemos el procedimiento LOGO anterior así: PARA ESPIRAL2 :LADO :RAZON’ :ANGULO AV :LADO GD :ANGULO ESPIRAL2 :LADO*:RAZON’ :RAZON :ANGULO FIN y probemos, por ejemplo con ESPIRAL2 1 1’01 5. Al describir la tortuga de LOGO un segmento forma con 0 un triángulo. El siguiente segmento dibujado forma con 0 otro triángulo semejante al anterior siendo la razón de P n-3 semejanza 1’01. Entonces rn = 1'01 rn +1
5o L
P n-2
P n-1
5o L.1'01
Pn
rn-1 rn-2
rn
O
En este tipo de “espirales” el radio no se incrementa cada vez una longitud constante, sino que aumenta un porcentaje del valor anterior. Supongamos ahora que el radio aumenta cada 10º un porcentaje del 20%, e intent emos hallar una fórmula que mida r (la línea descrita será poligonal). 0º → r0 10º → r0 + 0'2r0 = r0 (1 + 0'2) 20 º → r0 (1 + 0'2) + r0 (1 + 0'2)0'2 = r0 (1 + 0'2) 2 Para un ángulo x (múltiplo de 10º) será: x
r = r0 (1 + 0'2) 10 Intentemos hallar una expresión para cualquier valor de x, aunque no sea múltiplo de 10º. Si dividimos el intervalo [x, x + 10] anterior en n partes, y así mismo que aproxi10 0'2 mamos cada el porcentaje de crecimiento sea , se tendría n n' nx
0'2 10 r = r0 1 + n
4/8
La expresión “real” del radio debería ser 0 '2 x nx
0'2 10 r = lim r0 1 + n →∞ n
n 0 '2 1 = lim r0 1 + n →∞ n 0'2
10 0' 2x
= r0 e
10
La ecuación en polares de la espiral equiangular es: r = r0 e kθ siendo k constante. Expliquemos lo que significa k. Entre dos vueltas consecutivas: r = r0 e kθ
k (θ + 2 π ) r ' = r0 e
⇒
r ' r0 e k (θ + 2 π ) = = e 2 kπ = cte. r r0 e kθ
Además, si fijamos un ángulo è’, se tiene r ' = r0 e kθ ' , y cualquier ángulo è >è’ (è = è’ + h) verifica: r = r0 e kθ = r0 e k (θ '+ h ) = r0 e kθ ' ·e kh
⇒
r = r ' e kh .
Luego a partir del punto (è’, r’) la espiral es una copia ampliada (razón de semejanza r’) de la espiral inicial. Por eso se dice que la espiral equiangular es una curva de crecimiento armonioso. 4.- OTRAS ESPIRALES. 4.1. Hiperbólicas. Cualquier ecuación en polares donde r no sea periódica (es decir, que dependa dik rectamente de è) puede proporcionar una espiral. Por ejemplo r = representa una θ espiral hiperbólica, cuya forma depende mucho de los intervalos de ángulo considerado. 4.2. De dos, tres o cuatro centros o de paso
2.
Pueden considerarse otras falsas espirales: espirales de dos centros, de tres centros , de cuatro centros, etc., o construidas mediante arcos de circunferencias cuyas longitudes y radios están en una proporción dada, por ejemplo 2 , el número áureo (espiral de Durero, etc.).
5/8
A
B
B A
C
4.3. Espiral de Durero Espiral áurea o de Durero. Variantes de ella son, por ejemplo, la de paso gnómico 2 , donde dos radios consecutivos están en esa proporción.
5.- HÉLICES. La hélice es una forma muy abundante en la Naturaleza: la forma de crecimiento de las plantas trepadoras, la disposición de las brácteas de una piña, los cuernos de muchos rumiantes. En otros casos es menos accesible pero quizás más importante: la doble hélice de la cadena de ADN. También en la técnica se utiliza la hélice y sus propiedades: muelles, sacacorchos, tornillos, escalera de caracol, etc. Puede considerarse la hélice como generada por un punto del espacio que gira alr ededor de un eje, y se desplaza paralelamente al mismo. Actividades: 1.- Puede construirse una hélice con una experiencia. Se coloca un cilindro de cartón hueco sujeto sobre un plato giradiscos y bien centrado. Fijamos una regla a lo largo de una de las generatrices y desplazamos el lápiz sobre el cilindro apoyado en la regla que ha de quedar fija. 2.- Como puede que el exponente anterior resulte muy pequeño, se sugiere esto otro: sobre un vaso cilíndrico gotea un poco de miel. Hay una mosca situada en otra generatriz. ¿Cuál es el camino más corto para la mosca para llegar a la miel?.
6/8
Si hacemos un desarrollo plano, vemos que dicho camino es la línea recta. Trazando de nuevo obtenemos un arco de hélice. 3.- Es posible construir una hélice trazando sobre un folio líneas paralelas a longitud constante (solo es preciso que al fabricar el cilindro casen las líneas). 5.1. Ecuaciones de la Hélice. x = r cos α y = r sin α z = kα α ∈ IR los puntos de la hélice están contenidos en el cilindro de ecuación x 2 + y 2 = r 2 . Al describir un giro completo, si P(x, y, z) es un punto de hélice para un valor á, P’(x, y, z’) es un punto de la hélice situado sobre la generatriz para el valor α + 2π siendo z ' = (α + 2π) k , luego el paso de la hélice es, entonces, 2ðk. Es fácil medir la longitud de una espiral (recorrida por la hélice entre dos pasos consecutivos por la misma generatriz si recurrimos nuevamente a los desarrollos planos. Ejemplo: x = 3 cos α y = 3 sin α z = 2α
La longitud de una espira es L = 36π 2 + 16π 2 = 52π
7.- HELICOIDES. La misma idea de hélice sugiere otra posibilidad, ¿qué ocurre cuando r no es constante y depende de á Ejemplo: x = a cos a y = a sin a a ∈ IR z=a Representa una línea, pero los puntos de L línea verifican x 2 + y 2 − z 2 = 0 . Está por tanto contenida en un cono y recibe el nombre de helicoide. En la Naturaleza existen numerosas muestras de helicoides, por ejemplo, en ciertos caracoles.
7/8
Estos movimientos son generados por 3 elementos: un giro alrededor del eje, una traslación vertical paralela al eje y un alejamiento del eje. Sin embargo, son muy complejas por lo que se recurre a otras técnicas. Puede ocurrir que la distancia entre espiras se mantenga a lo largo de una generatriz o que no (al igual que ocurría con las espirales). Actividad: Si desarrollamos el cono en el plano y dibujamos “espirales” con una plantilla polar (espirales incompletas por supuesto) al construir el cono se reproduce la helicoide (téngase en cuenta que las dos generatrices deben unir). Bibliografía Recomendada. No existe bibliografía matemática adecuada para un tema tan novedoso. Casi todas las actividades son repescadas de aquí y allá. Podríamos citar: Mathemática vielle realitá de Inma Castelnuovo de 12 a 16: un proyecto de curriculo de matemáticas, grupo Cero. Publicaciones de los centros de profesores y grupos de trabajo de matemáticas. Dibujo Técnico con varias editoriales, en especial Bruño.
8/8
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 49 SUPERFICIES DE REVOLUCIÓN. CUADRICAS. SUPERFICIES REGLADAS. PRESENCIA EN LA NATURALEZA, EL ARTE Y EN LA TÉCNICA. 1. Definición de superficies. Conceptos básicos. 2. Clasificación de superficies. 3. Superficies de revolución. 3.1. Generalidades. 3.2. Revolución de Curvas. 3.2.1. Esfera. 3.2.2. Toro circular. 3.2.3. Elipsoide y Paraboloide de Revolución. 3.3. Revolución de Rectas. 3.3.1. Cilindro. 3.3.2. Cono. 3.3.3. Hiperboloide de Revolución. 4. Cuádricas. 4.1. Cuádricas con Centro. 4.1.1. Elipsoide. 4.1.2. Hiperboloide de una hoja. 4.1.3. Hiperboloide de dos hojas. 4.1.4. Cono. 4.1.5. Cilindro Elíptico. 4.1.6. Cilindro hiperbólico. 4.2. Cuádricas sin Centro. 4.2.1. Cilindro Parabólico. 4.2.2. Paraboloide Elíptico. 4.2.3. Paraboloide hiperbólico. 5. Superficies Regladas. 5.1. Superficies Regladas Desarrolladas. 5.1.1. Superficies Cónicas. 5.1.2. Superficies Cilíndricas. 5.2. Otras superficies Regladas. 6. Aplicaciones. 6.1. Superficies de Revolución. 6.2. Cuádricas. 6.3. Superficies Regladas. Bibliografía Recomendada.
1/18
TEMA 49 SUPERFICIES DE REVOLUCIÓN. CUADRICAS. SUPERFICIES REGLADAS. PRESENCIA EN LA NATURALEZA, EL ARTE Y EN LA TÉCNICA. 1. DEFINICIÓN DE SUPERFICIE. De manera geométrica, podemos definir una superficie como el lugar geométrico de las posiciones sucesivas de una línea, indeformable o no, que se mueve en el espacio siguiendo una ley determinada y continua. La línea anterior recibe el nombre de generatriz. r r r Supongamos que R = {O, u1 , u 2 , u3 } es una referencia ortonormal del espacio euclídeo. Un tipo especial de superficie son los planos, que expresados en ecuaciones paramétricas son: x = xo + a1λ + b1 µ y = yo + a2 λ + b2 µ λ,µ∈3 z = z o + a3 λ + b3 µ De forma analítica, una superficie se puede definir como sigue: DEF Llamaremos superficie al conjunto de puntos del espacio E3 que tiene por ecuaciones paramétricas, según la referencia ortonormal R: x = f 1 (λ, µ) y = f 2 (λ, µ) z = f 3 (λ, µ) donde f1 , f2 y f3 son funciones continuas en los parámetros λ y µ. Si fuese posible eliminar los parámetros λ y µ, se obtendría una ecuación de la forma F ( x, y, z ) = 0 llamada ecuación implícita de la superficie. Si de la ecuación implícita podemos despejar z z = f (x , y ) la ecuación obtenida recibe el nombre de ecuación explícita de la superficie. Teniendo en cuenta la forma geométrica de definir la superficie, la línea móvil o generatriz puede ser recta o curva y al moverse, suele apoyarse sobre una o más líneas
2/18
que llamaremos directrices. En general, la directriz puede ser un punto, una línea u otra superficie. Así pues, podemos clasificar las superficies engendradas de la siguiente manera: 1) Como el lugar geométrico de las posiciones sucesivas de una línea que se mueve en el espacio cambiando de posición, pero no de forma, según una determinada ley. 2) Como el lugar geométrico de las posiciones sucesivas de una línea que cambia tanto de posición como de forma. 3) Como la envolvente de las distintas posiciones de otra superficie que puede mantener su forma o no, y sigue en su movimiento una determinada ley. Como elementos característicos de una superficie tenemos: DEF Llamaremos Tangente de una superficie en un punto a la tangente en ese punto a una curva cualquiera que pase por el punto y esté contenida en la superficie. DEF Si el lugar geométrico de las tangentes a todas las curvas contenidas en la superficie que pasan punto es un plano, éste recibe el nombre de Plano Tangente a la superficie en el punto considerado, y el punto lo llamaremos Punto Ordinario. En caso contrario habrá más de un plano tangente y el punto lo llamaremos Punto Singular. DEF Diremos que una recta es Normal a la superficie en un punto si es perpendicular al plano tangente a la superficie en el punto considerado. DEF Llamaremos Plano Normal a la superficie en un punto cualquiera del plano que contenga una recta normal a la superficie en dicho plano. DEF Llamaremos Sección Normal a la intersección entre el plano normal a la superficie en un punto y al propia superficie. La curvatura de las sección Normal la llamaremos Curvatura Normal. 2. CLASIFICACIÓN DE SUPERFICIES. Según el criterio que tengamos en cuenta, podemos clasificar de distintas formas las superficies. a) Según el movimiento de la generatriz. Si la generatriz describe un giro alrededor de una recta obtenemos las superficies de revolución. b) Según la forma de la generatriz. Si la generatriz es una recta las llamaremos Superficies Regladas y si es una curva Superficies No Regladas.
3/18
Además, si son desarrollables en un plano diremos que son superficies desarrollables. En caso contrario son no desarrollables o alabeadas. Todas las superficies no regladas son no desarrollables. c) Según el Orden de la superficie. DEF Llamamos Orden de una Superficie al número máximo de puntos que una recta corta a la superficie. Si el Orden es 2 las superficies se llaman Cuádricas, si es 3 son Cúbicas, si es 4 Cuárticas, etc. Vamos a desarrollar el tema destacando las superficies más importantes de cada clasificación. 3. SUPERFICIES DE REVOLUCIÓN. 3.1. Superficies de Revolución. DEF Una superficie de revolución es la engendrada por una cura C generatriz, al girar alrededor de una recta llamada eje de revolución. Los planos perpendiculares al eje de revolución cortan a la superficie en circunferencias. Los planos que contienen al eje de revolución cortan a la superficie en curvas y pueden considerarse a su vez generatrices de la superficie. Por convenio, tomaremos un sistema de referencia en el que coincidan uno de los ejes, por ejemplo en OZ, con el eje de revolución de la superficie. Así, si P( x, y, z ) es un punto de la superficie, un giro de eje OZ y ángulo α lo transforma en P´( x´, y´, z´) siendo x´= xCosα − ySenα y´= xSenα + yCosα z´= z y si la curva generatriz C tiene por ecuaciones paramétricas x = f 1 (t ) y = f 2 (t ) z = f 3 (t ) tenemos entonces que la ecuación en forma paramétrica de la superficie es
4/18
x = f 1 (t )Cosα − f 2 (t )Senα y = f 1 (t )Senα + f 2 (t )Cosα z = f 3 (t )
t, α∈3
Como caso particular tenemos la situación en la que la curva esté contenida en un plano. Entonces elegiremos un sistema de referencia que, además de la condición anterior, verifique que el plano OYZ contiene a C. Entonces, la ecuación de la curva sería x=0 f ( y, z ) = 0 Como cada punto de C describe al girar una circunferencia de ecuación x 2 + y 2 = λ z=µ eliminando x, y, z de ambas ecuaciones, llegamos a la ecuación de la superficie F (λ, µ) = 0 o también
(
)
F x2 + y2 , z = 0 3.2. Revolución de Curvas. 3.2.1. Esfera. Es la superficie de revolución obtenida al girar una circunferencia alrededor de uno de sus diámetros. La circunferencia podemos suponer que es x=0
y +z =R 2
De la expresión x 2 + y 2 = λ z=µ y la anterior obtenemos
5/18
2
2
generatriz
y 2 = λ 2 2 2 2 2 2 ⇒ λ+ µ = R ⇒ x + y + z = R z=µ
(1)
Luego F (λ, µ) = λ + µ2 − R 2 o también
(
)
F x 2 + y2 , z = x2 + y 2 + z 2 − R 2 La ecuación (1) expresa la definición clásica de esfera como:
{P ∈ E3 / d (O, P ) = R} siendo O el centro de la esfera y R su radio. DEF Llamamos diámetro de la esfera a cualquier segmento que une dos puntos de la misma pasando por el centro. El plano tangente en un punto es la perpendicular al radio que pasa por ese punto. Cualquier plano normal a la esfera pasa por su centro. Si cortamos la superficie esférica por un plano secante a la misma, obtenemos dos cuerpos llamados segmentos esféricos de una base y las dos partes de la superficie esférica reciben el nombre de casquetes esféricos. 3.2.2. Toro Circular. El toro circular es la superficie de revolución obtenida al girar una circunferencia alrededor de una recta exterior a la misma y situada en su mismo plano.
Z
La ecuación de la circunferencia generatriz es x=0
Y
con r < R ( y − R )2 + z 2 = r 2
X Si tenemos en cuenta que x 2 + y 2 = λ x=µ
podemos obtener la ecuación de la superficie como sigue: x2 + y2 = λ ⇒ y = λ ⇒
(
)
2
λ − R + µ2 = R 2 ⇒
⇒ λ − 2 R λ + R 2 + µ2 = R 2 ⇒ 2 R λ = λ + µ 2 ⇒
6/18
⇒ 4R 2 λ = λ2 + µ 4 + 2λµ2 ⇒
(
) (
4R 2 x2 + y2 = x2 + y2
)
2
(
+ z4 + 2z 2 x 2 + y2
)
que es una ecuación algebraica de cuatro grados. Generalizando, si en lugar de girar una circunferencia, gira otra curva, nos podemos encontrar otros tipos de revolución. Por ejemplo, Toros elípticos, parabólicos o hiperbólicos. Es más, si la recta generatriz no está en el plano de la curva, la superficie generada recibe el nombre de Toroide. 3.2.3. Elipsoide y Paraboloide de Revolución. Una elipse o una parabólica engendran al girar alrededor de uno de sus ejes (la elipse) o de su único eje (la parábola) superficies que llamaremos, respectivamente, elipsoide de revolución. La elipse de ecuación x2 y 2 + =1 a2 b2 engendra, al girar alrededor del eje z, el elipsoide de ecuación x2 y 2 z 2 + + =1 a2 b2 b2
La parábola de ecuación y 2 = 2 px engendra al paraboloide de revolución de ecuación y 2 + z 2 = 2 px
7/18
3.3. Revolución de Rectas. 3.3.1. Cilindro. El Cilindro es la superficie de revolución obtenida al girar una recta alrededor de un eje paralelo a la misma. Es decir, ambas rectas, la generatriz y el eje de revolución, estarán contenidas en el mismo plano.
Sea el eje revolución el eje OZ y la recta generatriz C tiene por ecuaciones x = 0 y = a Teniendo en cuenta x 2 + y 2 = λ z=µ entonces y= λ⇒ λ = a y la ecuación del cilindro es x2 + y2 = a 2 La forma de la ecuación nos dice que estos cilindros también se pueden obtener realizando traslaciones de la circunferencia x2 + y2 = a 2 contenida en el plano z = 0 (OXY) paralelamente al eje z. 3.3.2. Cono. Elegimos una referencia r r r R = {O, u1 , u 2 , u3 } en la que el eje de r rotación sea el eje OZ (u3 ) y la recta generatriz C es x=0 y = mz la cual corta al eje de revolución en el punto O que llamaremos Vértice.
8/18
De x 2 + y 2 = λ z=µ obtenemos y = λ ⇒ λ = mµ ⇒ λ = m 2 µ2 Y la ecuación del Cono es x2 + y2 − m 2 z 2 = 0 Al ser la generatriz indefinida, como cualquier recta, generará un cono formado por dos ramas unidas por el vértice. El cono que se obtiene es recto ya que su base es circular. 3.3.3. Hiperboloide de Revolución. Elegimos un Sistema de Referencia r r r R = {O, u1 , u 2 , u3 } en la que el eje de revolución sea el eje OZ y la recta generatriz se cruce con el eje OZ, siendo la perpendicular común al eje X. Así, la recta generatriz tiene por ecuación x=a y = mz Como x 2 + y 2 = λ z=µ entonces y2 = λ − a2 2 2 2 ⇒ λ− a = m z z=µ y la ecuación del hiperboloide de revolución es x 2 + y 2 − m2 z 2 = a 2 Si cortamos la superficie por planos perpendiculares al eje obtenemos circunferencias, siendo la de menor radio la que obtenemos con el plano z = 0. Si cortamos la superficie por planos que contengan al eje Z, que tienen por ecuaciones x = Ky, las intersecciones verifican
9/18
x 2 + y 2 + m2 z 2 = a 2 2 2 2 2 2 ⇒ K +1 y − m z = a x = Ky
(
)
que es una hipérbole contenida en el plano x = Ky. En particular, cua lquiera de estas hipérbolas puede servirnos para generar la superficie. 4. CUÁDRICAS. Al clasificar las superficies según su orden, las cuadricas corresponderían a aquellas que eran de 2º grado. Cualquier cambio de sistema de referencia cambiaría la ecuación, r r r pero no su grado. Así pues, elijamos un sistema de referencia R = {O, u1 , u 2 , u3 } ortonormal, DEF
Llamaremos Cuádrica a toda superficie cuya ecuación es de la forma a11 x 2 + a22 y 2 + a33 z 2 + 2a12 xy + za13 xz + 2a23 yz + 2ax + 2by + 2cz + d = 0
Todas las superficies de revolución en el apartado anterior son cuádrigas, menos el toro circular, que es de cuarto grado. 4.1. Cuádricas con Centro. Elegido convenientemente un sistema de referencia, diremos que una cuádrica tiene como centro de simetría el origen si al sustituir (x, y, z) por (-x, -y, -z) en la ecuación, se obtiene la misma. 4.1.1. Elipsoide. La ecuación de la superficie (en un sistema elegido convenientemente) es x2 y2 z 2 + + =1 a2 b2 c2
La superficie corta a los ejes coordenados en los puntos
(a,0,0 ) (0, b,0 ) (0,0, c )
(− a,0,0) (0, −b,0 ) (0,0,−c )
y verifica que el origen es su centro de simetría.
10/18
La intersección con un plano paralelo al plano OXY, por ejemplo x = λ, nos da • Intersección vacía si λ > c ó λ < - c • Un solo punto si λ = c ó λ = - c • Una elipse de ecuación
x2 y2 λ2 + = 1 − a2 b2 c2
si - c < λ < c.
Por simetría, el resultado es el mismo si el elipsoide es intersectado por planos de ecuaciones x = λ o y = λ. En el caso de que a = b, a = c o b = c, las intersecciones con planos de ecuaciones z = λ, y = λ ó x = λ respectivamente dan, si existen, circunferencias, siendo el elipsoide de revolución. Si a = b = c el elipsoide degenera en una circunferencia de radio O. 4.1.2. Hiperboloide de una hoja. La ecuación de esta superficie en un sistema de referencia convenientemente elegido es x2 y2 z 2 + − =1 a2 b2 c 2 Corta a los ejes en
(a,0,0 ) (o, b, o )
(− a,0,0) (0,−b,0)
y no corta al eje Z. También verifica que el origen es su centro de simetría. La intersección con planos paralelos al plano OXY, de ecuación z = λ, da elipses. En cambio, si los planos son paralelos al OXZ o al OYZ, por ejemplo y = λ ó x = λ respectivamente, obtenemos hipérbolas. Si escribimos x2 z 2 y2 x − = 1 − ⇒ + 2 2 2 a c b a x z y + 1− b =µ ⇒a c = y x z 1+ − b a c
z x − c a
y
Así tenemos que 11/18
z y y = 1 + 1 − c b b x z y + 1+ a c = b = µ´ y x z 1− − b a c
y x z + − µ 1 + = 0 a c b y x z 1 − − µ − = 0 b a c 4.1.3. Hiperboloide de dos hojas. Su ecuación es −
x2 y 2 z 2 − + =1 a 2 b2 c2
Solo corta al eje Z en los puntos
(0,0, c )
y
(0,0, −c )
Los planos de ecuación x = λ y y = λ cortan a la superficie en hipérbolas. En cambio, los planos de ecuación z = λ cortan a la superficie si λ ∉(-a, a). • Si λ = a ó λ = -a, la corta en un punto. • Si λ > a ó λ < -a, la corta en elipses de ecuación
x 2 y 2 λ2 + = −1 a2 b2 c2
Igual que las anteriores, el origen es centro de simetría. 4.1.4. Cono. La ecuación del cono, es un sistema de referencia elegido convenientemente, es x2 y2 z 2 + − =0 a2 b2 c2 Corta a los ejes en el punto (0, 0, 0), siendo además su centro de simetría. Cualquier plano de la forma z = λ (paralelo al plano OXY) corta a la superficie en elipses.
12/18
Los planos de la forma x = λ e y = λ, paralelos a OYZ y a OXZ respectivamente, cortan al cono determinando hipérbolas. Excepto si pasan por el origen, en el que obtenemos un par de rectas. Dadas las generatrices x=0 b y= c
x=0
z
ó
b y = − z c
los planos paralelos a ellas, que son de la forma cy ± bz + h = 0
con
h≠0
cortan al cono en parábolas. 4.1.5. Cilindro Elíptico. Su ecuación es y2 z2 + =1 a2 b2 y lo vimos con más detalle en el caso a = b, que es el cilindro de revolución. Los planos de la forma x = λ cortan al cilindro en elipses, pudiéndose obtener éste por traslación de la elipse a lo lardo del eje X. 4.1.6. Cilindro hiperbólico. Al igual que el anterior, elegido convenientemente un sistema de referencia, podemos escribir su ecuación como x2 y2 − =1 a2 b2 Los planos z = λ cortan a esta superficie en hipérbolas.
13/18
4.2. Cuádricas sin Centro. 4.2.1. Cilindro Parabólico. Tiene por ecuación y 2 = 2 px y como es fácil comprobar, no tiene centro de simetría. Los planos z = λ cortan a este cilindro en parábolas Concretamente, el plano z = 0 (o también, el OXY) determinan una parábola de ecuación y 2 = 2 px 4.2.2. Paraboloide Elíptico. Su ecuación se puede escribir como x2 y2 + = 2cz a2 b2 y corta a los tres ejes en el origen (0, 0, 0). Cualquier plano z = λ corta a la superficie en elipses siempre que λ·c>0 En cambio, dado un plano paralelo a parábolas.
OXZ o a
OYZ cortará a la superficie en
Si a = b, el paraboloide es de revolución. 4.2.3. Paraboloide hiperbólico. Su ecuación es de la forma x2 y2 − = 2cz a2 b2 y corta a los ejes en el origen de coordenadas.
14/18
Cualquier plano de ecuación z = λ cortará a la superficie en hipérbolas, y los planos x = λ e y = λ la cortan en parábolas. Corrientemente, es conocida como Silla de Montar. 5. SUPERFICIES REGLADAS. Si clasificamos las superficies según la forma de la generatriz, obteníamos las superficies regladas cuando la generatriz era una recta, y las no regladas cuando era una curva. Dentro de las superficies regladas podemos distinguir: 5.1. Superficies Regladas Desarrollables. Son superficies cuya característica más importante es que el plano tangente a cualquier recta contenida en la superficie no varía, pudiendo ser desarrollables en el plano. El caso más sencillo de superficie reglada desarrollable es el plano. Otras superficies son poliedros, que ya los estudiamos en el tema 45. Veamos pues otras: 5.1.1. Superficies Cónicas. DEF Sea V un punto y C una curva. Una superficie cónica es el conjunto P de todas las rectas que pasan por V y se apoyan en C.
Si V ( xo , y o , z o )
x = f1 (t ) C y = f 2 (t ) y z = f 3 (t )
entonces, las rectas que
pasan por V y se
apoyan en C tienen por ecuaciones paramétricas x = xo + ( f1 (t ) − xo )·λ y = yo + ( f 2 (t ) − yo )·λ z = z o + ( f 3 (t ) − z o )·λ
t,λ∈3
Si se puede eliminar t y λ obtenemos una ecuación de la forma F ( x, y, z ) = 0 llamada ecuación implícita de la superficie. 5.1.2. Superficies Cilíndricas. DEF Una superficie Cilíndrica es el conjunto P de rectas que se apoyan en una curva r C y son paralelas a una recta de dirección u .
15/18
x = f1 (t ) C = y = f 2 (t ) entonces se verifica que para todo punto P de la z = f (t ) 3 superficie existe un punto Q de la curva tal que r Si u = ( a, b , c ) y
r QP = λu Entonces, las ecuaciones paramétricas de la superficie son x = f 1 (t ) + λa y = f 2 (t ) + λb z = f 3 (t ) + λc
con t, λ∈3
y de nuevo, si es posible eliminar λ y t llegamos a la forma implícita. 5.2. Otras Superficies Regladas. Una superficie puede generarse también mediante una recta que se apoye en dos curvas, de modo que sea paralela a un plano director. El caso más destacable es aquel que una de las curvas es una recta. Estas superficies reciben el nombre de Conoides. Entre estos podemos destacar: • Conoide de Wallis, que tiene la forma de sombrero de un legionario. • La superficie helicoidal, que está generada por una recta que se apoya en una hélice y su eje, siendo la recta perpendicular al eje. 6. APLICACIONES. Son múltiples las aplicaciones que nos podemos encontrar de los distintos tipos de superficies. 6.1. Superficies de Revolución. a) Paraboloides de Revolución. Quizá sea una de las aplicaciones más interesantes. Nos los podemos encontrar en las antenas parabólicas, aunque también en los hornos solares o los reflectores. Todos siguen el mismo principio. La antena recibe las ondas, las cuales se proyectan en el foco o polarizador, lo que amplifica la señal. El fundamento técnico consiste en que los planos que contienen al eje del paraboloide intersecan formando parábolas iguales, y todas ellas con el mismo foco.
16/18
b) Esfera. La esfera está omnipresente en nuestra vida. Los planetas, satélites, estrellas, tienen formas más o menos esféricas. También a nivel microscópico nos la encontramos. Las células huevo adoptan la forma esférica para guardar el máximo de reserva en el mismo espacio. La tensión superficial de los líquidos también propicia la forma esférica, por ejemplo, las gotas de rocío. c) Toro. El toro nos lo podemos encontrar en el arte para formar anillos, en la técnica en las ruedas, ciclotrones o aceleradores de partículas. Incluso en la alimentación lo vemos en los donuts. d) Otras superficies. En arquitectura nos encontramos muchas aplicaciones, como por ejemplo para cubrir o cerrar un espacio (bóvedas o cúpulas) o para dar luz a éstas (lunetas). Existen bóvedas cilíndricas o de cañón y de revolución de eje vertical o cúpulas. El luneto es una bóveda pequeña, abierta en otra mayor, para dar luz a ésta. Según la forma de la bóveda tenemos lunetos cilíndricos, cónicos o esféricos. 6.2. Cuádricas. Una conocida propiedad de la elipse nos proporciona aplicaciones para el elipsoide. PROP Si M es un punto de la elipse de focos F y F´, la bisectriz exterior del ángulo LFMF´ es tangente a la elipse. Dem S
M'
M
Si T es la bisectriz de dicho ángulo y S es un punto Simétrico de F´ respecto de T, se tiene que FS =2a.
T
Además, si M´ es otro punto de T, se tiene que
a F
F' b
M ´ F´ + M ´ F = M ´S + M ´F > FS = 2 a luego M´ no es de la elipse. Entonces el único punto común a la elipse y a T es M, lo que significa que T es tangente. De esta proposición deducimos que cualquier rayo, ya sea luminoso o sonoro, que proceda de un foco se proyecta en el otro.
17/18
Esta propiedad ha sido utilizada desde antiguo en la construcción de bóvedas y teatros. Por ejemplo, la concha del apuntador suele construirse teniendo esto en cuenta. La forma elipsoidal es una variación de los planetas. Los dirigibles se construyeron con esta forma para ganar penetración, partiendo de la utilidad de la forma esférica. 6.3. Superficies Regladas. Las aplicaciones más importantes nos las encontramos en ingeniería y arquitectura, dada su sencillez. Por ejemplo, la cubierta piramidal de torre, formada por al intersección de dos pirámides hexagonales. También nos encontramos estas superficies en las Pirámides de Egipto
Bibliografía Recomendada. Geometría y Cónicas. Grupo Cero. Universidad de Valencia. Geometría Descriptiva. Aut. Izquierdo Asensi, F. Ed. Dossat. S.A. Matemáticas COU. Aut. Varios. Ed. Ecir. Matemáticas COU. Aut. Marqués. Ed. Bello. Curso de Geometría Métrica, Tomo II. Aut. Fernández González, F. Editado por al cátedra de Dibujo Técnico.
18/18
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 50 GEOMETRÍA ESFÉRICA. 1. Geometrías no euclídeas. 1.1. Geometría hiperbólica de Lobatchevsky. 1.2. Geometría elíptica de Riemann. 1.3. Comparaciones entre la geometría euclídea y no euclídea. 2. Geometría sobre la superficie esférica. 2.1. Superficie esférica y esfera. 2.2. Círculos máximos y menores. 2.3. Simetrías en la superficie esférica. 2.4. Plano tangente: ángulos en la superficie esférica. 2.5. Triángulos esféricos. 2.5.1. Propiedades. 2.6. Triedro suplementario Bibliografía recomendada.
1/10
TEMA 50 GEOMETRÍA ESFÉRICA. 1. GEOMETRÍAS NO EUCLÍDEAS. Durante dos mil años la geometría de Euclides fue considerada como una verdad absoluta. Basada en diez axiomas, tan evidentes que nadie los negaría. Desde hace siglos los Elementos de Euclides permanecieron inviolables. No obstante, todo no era correcto. Algunos pensadores, Euclides mismo fueron perturbados por el axioma 5: el axioma de las paralelas de Euclides. Axioma de las Paralelas: Dada una recta L y un punto P no contenido en L, una y solo una recta puede ser trazada, pasando por P y paralela a L. Este axioma no puede ser verificado experimentalmente. Podemos trazar dos o más rectas que pasen por P y no intersecten a L, sobre una pagina, sin importarnos lo grande que sea la hoja que usemos. Debemos suponer que todas, excepto una de estas rectas, interesan a L en alguna parte indefinidamente lejana. Por lo tanto como los otros axiomas son simples, claros e intuitivamente razonables, surgió el afán de deducir el axioma de las paralelas a partir de los otros nueve axiomas. Tres hombres: Gauss, Lobatchevsky y Bolyac, independientes y con pocos años entre si, descubrieron el sistema geométrico que llamamos geometría no euclidiana y probaron que el axioma de los paralelos no puede deducirse de los otros nueve. Al intentar probar el axioma de las paralelas, el argumento que dieron fue: supongamos que los otros nueve axiomas son válidos, pero el axioma de los paralelos no; entonces si por una deducción lógica podemos llegar a una contradicción, el axioma de los paralelos esta probado. La negación del axioma de las paralelas puede tomar dos fo rmas: a) Dadas una recta L y un punto P no perteneciente a L, no existen rectas que pasen por P y sean paralelas a L. b) Dadas una recta L y un punto P no perteneciente a L, al menos dos rectas pueden trazarse, pasando por el punto P y paralelas a L. Con cada una de estas formas surgen dos tipos de geometrías no euclídeas. 1. La geometría hiperbólica de Lobatchevsky y Bolya. 2. La geometría elíptica de Riemann.
2/10
1.1. Geometría hiperbólica de Lobatchevsky. Gauss, Lobatchevsky y Bolayac eligen la forma (b) de negación del axioma de las paralelas, que es frecuentemente llamado, axioma de las paralelas de Lobatchevsky. Ellos supusieron (b), junto con los nueve axiomas de Euclides. A partir de ellos dedujeron muchos teoremas totalmente diferentes de los de la geometría euclidiana, pero no encontraron ninguna contradicción a los axiomas, con lo que afirmaron que había geometrías distintas a la Euclídea. Algunos de los teoremas, los que están basados en los nueve axiomas, son los mismos que en la geometría euclidiana. Por ejemplo el teorema: “Los ángulos opuestos por el vértice son congruentes”, es común a ambas geometrías. Sin embargo los teoremas basados en el axioma de las paralelas toman una forma totalmente diferente. En la geometría de Lobatchevsky se establece que la suma de los ángulos de un triángulo es siempre menor que 180º. Además no todos los triángulos tienen la misma suma angular. Cuanto mayor sea el área del triángulo menor será la suma de sus ángulos. Puesto que los triángulos más grandes tienen sumas de ángulos diferentes no hay triángulos semejantes, triángulos que tienen la misma forma, pero diferente medida. En la nueva geometría, si dos triángulos tienen sus ángulos congruentes, entonces los triá ngulos también los son. En esta geometría no hay rectángulos, ya que si tres ángulos de un cuadrilátero miden 90º , el cuarto debe tener una medida menor. Ya que al dividirlo en dos triángulos deben ser <180º. Un modelo para la geometría euclídea es el plano con las nociones de puntos y recta. La siguiente superficie
es llamada pseudoesfera y es un modelo para esta nueva geometría. Las “rectas” sobre esta superficie son las líneas mas cortas entre puntos de ella, estas distancias se denominan geodésicas. El comportamiento de puntos y rectas sobre esta superficie da origen a los axiomas de la geometría de Lobatchevsky. Dados una recta L y un punto P no perteneciente a L, un numero infinito de rectas pueden ser trazadas por P, paralelas a L. Sobre esta superficie las rectas paralelas no son equidistantes en todos sus partes, como lo exige el teorema de la geometría euclidiana. La suma de las medidas de los ángulos de abc es menor de 180.
3/10
1.2. Geometría elíptica de Riemann. Poco después de la construcción de la geometría de Lobatchevsky un matemático Bernhurd Riemann construyó otra geometría no euclidiana, empleando el axioma (a) y algunas veces (no todas) los otros axiomas de Euclides. Su geometría fue diferente de las de Lobatchevsky y Euclides. En la geometría de Riemann no hay rectas paralelas y la suma de las medidas de los ángulos de un triángulo es mayor de 180º. Un modelo para la geometría de Riemann, es la superficie de una esfera. Las “rectas” en este modelo, son circunferencias mayores, las geodésicas de la esfera. Todas las rectas se intersectan y el triángulo abc contiene dos ángulos rectos, de tal forma que la suma de sus ángulos es mayor que 180º. En esta geometría, cuanto mayor es el área de un triángulo, mayor es su suma angular y solamente son semejantes aquéllos que son congruentes.
1.3 Comparaciones entre la geometría euclídea y no euclídea. Vamos a comparar algunos resultados en la geometría de Euclides, Lobatchevsky y Riemann. En la geometría euclídea, dos rectas distintas se intersectan en un punto, a lo más, de igual forma ocurre en la de Lobatchevsky, mientras que en la de Riemann, lo puede hacer en un punto o en dos. Dada la recta L y un punto P no perteneciente a L, según Euclides existe una única recta paralela a L que pase por P, según Lobatchevsky existen al menos dos y según Riemann no existe ninguno. Según Euclides las rectas paralelas son equidistantes mientras que Lobatchevsky asegura que no lo son. La suma de los ángulos de un triángulo, para Euclides es 180º, para Lobatchevsky es menor de 180º y para Riemann es mayor de 180º. Si en una recta consideramos un punto de ella, esta queda dividida en dos partes para Euclides y Lobatchevsky mientras que no queda dividida en dos partes para Riemann. Dos triángulos con ángulos homólogos iguales para Euclides son semejantes, mientras que para Lobatchevsky y Riemann son congruentes.
4/10
2. GEOMETRIA SOBRE LA SUPERFICIE ESFERICA. 2.1 Superficie esférica y esfera. El conjunto de todos los puntos del espacio que equidista de un punto fijo O llamado centro, recibe el nombre de superficie esférica. La distancia del centro a uno cualquiera de sus puntos se llama radio. La superficie esférica descompone al espacio en dos partes. El conjunto de puntos, A, cuya distancia al centro es menor o igual que el radio se denomina esfera. El conjunto de puntos, B, cuya distancia al centro es mayor que el radio constituye la parte de espacio exterior a la esfera. Una parametrización de la superficie esférica es la siguiente. x = r cos θ cos ϕ f (θ, ϕ) = y = r cos θsenϕ z = rsen θ siendo r el radio de la esfera y: 0 <ϕ≤π y
0 ≤ θ ≤ 2π
2.2 Círculos máximos y menores. Un plano que pase por el centro determina sobre la superficie esférica una circunferencia, pues la sección será el conjunto de puntos de dicho plano que equidisten del centro. Esta circunferencia se llama circunferencia máxima. Se deduce de aquí, que en una circunferencia máxima queda determinada por dos puntos que no sean diametralmente opuestos P, Q, y junto con el punto O determinan el plano del cual obtenemos la circunferencia (como intersección de ese plano con la esfera) Si un plano π no pasa por el centro, pero tiene mas de un punto común A con la superficie esférica, determina sobre esta una circunferencia que se llama circunferencia menor. En efecto: la perpendicular por el centro O al plano π , corta a este punto C si A es un punto cualquiera de la sección. Como el triángulo AOC es rectángulo en C, se verificara CA = r 2 − OC 2 = r 2 − d 2 = cte y como r 2 − d 2 es un numero fijo, será AC un segmento de longitud constante independiente del punto A elegido. Los puntos de esta sección equidistan por tanto, de C. 2
5/10
Además los puntos del plano π que equidistan de C están en la superficie esférica que su distancia a O es r. Luego la sección de la superficie esférica por el plano π es una circunferencia. Esta circunferencia queda determinada por tres puntos y no por dos como las circunferencias máximas. Por lo tanto podemos hacer una distinción entre ella. Mientras unas se comportan en una geometría sobre la superficie esférica como las rectas en el plano las otras se comportan como verdaderas circunferencias. Podemos por tanto considerar a las primeras como las rectas de la superficie esférica y a las segundas como las circunferencias de la misma. Veamos que, tomando como modelo esta geometría, fue como Riemann hizo su geometría elíptica. Teorema. Dos circunferencias máximas se cortan en dos puntos diametralmente opuestos. Dem. Es inmediata ya que los planos α, β que pasan por un punto común O, se cortan en una recta d que pasa por O. Sean C1 y C2 las circunferencias que se forman al intersectar los planos α, β sobre la superficie esférica E, es decir: C1 = α ∧ E
C2 = β ∧ E
pero d corta a ambas circunferencias en dos puntos A y B diametralmente opuesto. Se deduce de aquí que dos rectas de esta geometría sobre la esfera tienen dos puntos comunes. La geometría sobre la superficie esférica carece de rectas paralelas. 2.3. Simetrías en la superficie esférica. Un plano diametral, es decir, que pase por el centro de una superficie esférica, descompone a la esfera en dos partes llamadas semiesferas. Consideremos una de estas partes y la porción de superficie esférica que la limita. Su simetría respecto al plano estará constituida por puntos equidistantes del centro, luego coinciden con la otra parte de la superficie esférica. Todo plano diametral es por tanto, plano de simetría de la superficie esférica. Las rectas que pasan por el centro de la superficie esférica se llaman diámetros.
6/10
Todos los planos π que pasan por un diámetro AB son planos diametrales de la superficie esférica y determinan sobre éstas, circunferencias π ∧ E . AB es eje de simetría de estas circunferencias y por tanto de la superficie esférica. Luego todo diámetro es eje de simetría de la superficie esférica.
2.4. Plano tangente: ángulos en la superficie esférica. Sea E una superficie esférica y A uno de sus puntos. El plano π perpendicular a OA en A tiene el punto A común con la superficie esférica y todos los demás son exteriores puesto que OB>OA=r
DEF Se dice que este punto es tangente a la superficie esférica. Luego en cada punto de la superficie esférica podemos, por consigna determinar un plano tangente y solamente uno. Sean C y C´ dos circunferencias de una superficie esférica E, que se cortan en T. En sus planos podemos trazar las tangentes t y t´, respectivamente. TEOREMA
t y t´ ∈ π
Dem. OC es perpendicular al plano de C que contiene a t, y CT perpendicular a t por lo que t será perpendicular al plano OCT y por tanto perpendicular a OT, luego t pertenece al plano π tangente a E en T. De la misma forma se demuestra que t´ ∈ π . Luego las tangentes t y t´ pertenecen por tanto, al plano tangente π en T. DEF Definimos el ángulo de dos circunferencias de una superficie esférica como el formado por dos tangentes a ellas en sus puntos comunes. Cuando el ángulo de dos circunferencias de una superficie esférica es recto, ambas circunferencias se dice que son ortogonales y si en particular son circunferencias máximas se dice que ambas son perpendiculares. Sea E una esfera y e y e´ dos rectas sobre la superficie esférica perpendicular, es decir dos circunferencias máximas ortogonales. Los planos de cada una son planos de simetría de E y por tanto de la otra. Sea P un punto de e´. Si A y A´ son puntos de e simétricas superficie esférica respecto del plano de e´, los arcos de circulo máximo sobre la PA y PA´ son simé-
7/10
tricas y por tanto iguales. Esto nos va a permitir resolver el problema de perpendicularidad sobre la superficie esférica.
Sea E una superficie esférica y c una recta sobre ella o sea una circunferencia máxima. Si A y B son dos puntos de c y trazamos con arcos iguales dos circunferencias de centros A y B y radios cualesquiera pero iguales que se corten en P y Q, la recta PQ sobre la superficie esférica es perpendicular a c y mediatriz de AB. 2.5. Triángulos esféricos. DEF Un triángulo esférico es una porción de superficie esférica limitado por tres rectas sobre ella, o sea por tres circunferencias máximas. Estas tres circunferencias se cortan en tres puntos llamados vértices y los ángulos que forman cada dos de dichas circunferencias se denominan ángulos de triángulo esférico. Los arcos limitado por cada dos vértices son los lados del triángulo esférico. Ahora bien tres rectas sobre una superficie esférica determinan 8 triángulos esféricos: ABC, BDC, BDF, FAE, DEF, AEC, EDC, BAF Es preciso por tanto determinar de qué triángulo se trata. Si unimos el centro de la superficie esférica con los vértices ABC de un triángulo esférico, obtenemos un ángulo triedro cuyas caras tienen la misma medida que los lados del triángulo esférico, por ser ángulos centrales y los diedros tienen la misma medida que los ángulos del triangular por ser sus caras los planos de los círculos máximos que define el triángulo. Existe, por consiguiente una correspondencia biunívoca entre los triángulos esféricos de una superficie esférica y los triedros que resultan de proyectarlas desde el centro de la esfera. Esta correspondencia conserva los ángulos, lo que permite trabajar indistintamente con triángulos esféricos o triedros, trasladando a la otra las propiedades deducidas de una de estas figuras. 2.5.1. Propiedades. PROP En todo ángulo triedro, una cara es menor que la suma de los otros dos. Dem. Sea la cara AVC la mayor del ángulo triedro, vamos a demostrar que la suma de AVB y BVC es mayor que dicha cara.
8/10
Para ello llevamos sobre AVC la cara AVB de modo que VB tomara la posición VB´ y sobre estas rectas llevemos VA=VB=VB´. Unimos luego A con B y con B´ de modo que AB´ corta a VC en C. Se forma así el triángulo ABC en el cual se verifica AC
Pero BVC y B´VC tienen VC común y VB=VB´ y como B´C
AC
PROP La suma de las caras de un triángulo esférico es menor que cuatro rectas. Dem. Sea el triángulo esférico ABC y prolonguemos sus lados hasta su encuentro en A´. Se verifica
BC
Sumando: AB+AC+BC
El ángulo B´V´C´=a´ es suplementario del diedro A por ser rectos los ángulos V´B´A y V´C´A. De donde las caras del triedro V´ son suplementarias de los diedros del triedro V. Pero siendo VA perpendicular al plano V´B´C´ y VC perpendicular al plano V´B´A´ será la cara b=AVC suplemento del diedro V´B´. El triedro V´ se dice que es suplementario del triedro V y recíprocamente y las caras de uno son suplementos de los diedros del otro. Si superponemos ambos triedros por la traslación V´V y cortamos por una superficie esférica de centro V, la sección serán dos triángulos esféricos que se llaman polares o suplementarios y entre los cuales se verifica la relación anterior. Si ambos triángulos esféricos son ABC y A´B´C´ y sus lados son a, b, c y a´, b´, c´ se verificara: a´=π -A b´=π -B c´=π -C y sumando resulta 0
π
Por lo tanto la suma de los ángulos de un triedro es mayor que dos rectos y el exceso sobre 180 se llama exceso esférico.
BIBLIOGRAFÍA RECOMENDADA. Matemáticas. Curso preuniversitario. F Marcos de Lanuza. Geometría, un enfoque intuitivo. MargaretWiscamb.
10/10
TEMAS DE MATEMATICAS (Oposiciones de Secundaria) TEMA 51 SISTEMAS DE REFERENCIA EN EL PLANO Y EN EL ESPACIO. ECUACIONES DE LA RECTA Y DEL PLANO. RELACIONES AFINES. 1. Espacio Afín. 1.1. Plano Afín. 1.2. Espacio Afín. 1.3. Subespacios Afines. 2. Sistemas de Referencia en el Plano y en el Espacio. 2.1. Sistemas de Referencia en el Plano. 2.1.1. Coordenadas de un Punto en el Plano Afín. 2.1.2. Cambio de Sistema de Referencia Afín. 2.2. Sistemas de Referencia en el Espacio. 2.2.1. Coordenadas de un Punto en el Espacio. 2.2.2. Cambio de Sistema de Referencia en el Espacio. 3. Ecuaciones de la Recta en el Plano. 3.1. Ecuación Vectorial de la Recta. 3.2. Ecuaciones Paramétricas de la Recta. 3.3. Ecuación de la Recta en Forma Continua. 3.4. Ecuación de la Recta en Forma General. 3.5. Ecuación Explícita de la Recta. 3.6. Ecuación de la Recta que pasa por dos Puntos distintos. 4. Ecuaciones de la Recta y del Plano en el Espacio. 4.1. Ecuaciones de la Recta en el Espacio. 4.2. Ecuaciones del Plano. 5. Relaciones Afines. 5.1. Incidencias de Puntos, Rectas y Planos. 5.1.1. Incidencia entre Punto y Recta. 5.1.2. Incidencia entre Punto y Plano. 5.1.3. Incidencia entre Recta y Plano. 5.2. Paralelismo entre Rectas y Planos. 5.2.1. Paralelismo entre Rectas. 5.2.2. Paralelismo entre Planos. 5.3. Intersección entre Rectas y Planos. 5.3.1. Intersección entre Rectas. 5.3.2. Intersección entre Planos. 5.3.3. Intersección entre Recta y Plano. 5.4. Posiciones Relativas de dos Rectas en el Plano. 5.5. Estudio Analítico de las Posiciones Relativas entre Rectas y Planos. 5.5.1. Posiciones Relativas de dos Planos. 5.5.2. Posiciones Relativas de Recta y Plano. 5.5.3. Posiciones Relativas de dos Rectas. Bibliografía Recomendada.
1/27
TEMA 51 SISTEMAS DE REFERENCIA EN EL PLANO Y EN EL ESPACIO. ECUACIONES DE LA RECTA Y DEL PLANO. RELACIONES AFINES. 1. ESPACIO AFIN. DEF Sea V un K-espacio vectorial. Llamaremos K-espacio vectorial afín sobre V a una terna (E, V, ϕ) donde E es un conjunto arbitrario, V un espacio vectorial y ϕ es una aplicación ϕ : E x V → E que cumple las siguientes condiciones i) ∀ P ∈ E
r r ∀ x, y ∈ V
r r r r ϕ(ϕ( P, x ), y ) = ϕ(P, x + y )
ii) ∀ P ∈ E
r ϕ P,θ = P
r θ es el neutro de V.
( )
iii) ∀ P, Q ∈ E
r ∃x ∈ V
r ϕ(P, x ) = Q r r ϕ( P, x ) = P + x los
A la terna (E, V, ϕ) la vamos a denotar por A. Si definimos axiomas anteriores quedan como: r r ∀ x, y ∈ V
i) ∀ P ∈ E
( P + xr) + yr = P + ( xr + ry )
r ii) P + 0 = P iii) ∀ P, Q ∈ E
r ∃x ∈ V
/
r P+ x =Q
DEF Se llama dimensión del espacio afín (E, V, ϕ) a la dimensión del espacio vectorial asociado. TEOREMA. TEOREMA DE CHASLES Si tenemos
P1 , P2 ,........, Pn ∈ E
P1 P2 + P2 P3 + P3 P4 + ...... + Pn −1 Pn = P1 Pn
⇒
Dem. Vamos a realizar la demostración en n. Si n = 3.
(
) (
)
P1 + P1 P2 + P2 P3 = P1 + P1 P2 + P2 P3 = P2 + P2 P3 = P3 ⇒ P1 P2 + P2 P3 = P1 P3 Supongamos que es cierto para n – 1 y vamos a demostrarlo para P1 P2 + P2 P3 + ..... + Pn −2 Pn −1 = P1 Pn −1 es la hipótesis de inducción
(
)
[(
)
]
P1 + P1 P2 + P2 P3 + ...... + Pn −1 Pn = P1 + P1 P2 + ..... + Pn −2 Pn −1 + Pn −1 Pn =
2/27
n
luego
[ (
)]
= P1 + P1 P2 + ..... + Pn −2 Pn − 1 + Pn −1 = [P1 + P1 Pn −1 ] + Pn −1 Pn ? Pn −1 + Pn −1 Pn = = Pn ⇒ Luego
COROLARIO
P1 P2 + P2 P3 + ..... + Pn −1 Pn = P1 Pn
c.q.d.
Un caso particular del teorema de Charles es r P1 P2 + P2 P3 + ..... + Pn P1 = P1 P1 = 0
1.1. Plano afín. Supongamos ahora que el espacio vectorial V es el conjunto de todos los vectores libres del plano definido sobre el cuerpo K = 3 y sea E = P2 conjunto de los puntos del plano. En P2 tenemos definida la ley de composición externa que asocia a un punto A y a r r un vector v un solo punto P tal que AP es el representante del vector v . ϕ P2 xV → P2 ( A, vr ) → P siendo vr = AP
[ ]
PROP A2 = ( P2 ,V2 , ϕ) es un espacio afín de dimensión 2 llamado Plano Afín. Dem. r r i) Sea A∈P2 y u = AB y v = BC dos vectores libres. Se verifica
[ ]
[ ]
r B = A+ u
r r r y C = B + v = (A + u ) + v
r r Como AB + BC = AC tenemos que C = A + (u + v ) luego
[ ][ ] [ ]
( A + ur) + vr = A + (ur + vr ) r ii) A + O = A r r r Si A + x = A ⇒ x = AA = O r iii) Dos puntos cualesquiera A y B de P2 definen un único vector libre v de r representante AB y por tanto B = A + v . Por lo tanto A2 = ( P2 ,V2 , ϕ) es un espacio afín de dimensión 2 llamado Plano Afín.
3/27
1.2. Espacio afín. De forma análoga al plano afín, tomamos V como el conjunto de los vectores libres del espacio definido sobre 3 y E el conjunto de puntos del espacio ordinario y se define: ϕ ExV → E r ( A, vr ) → P t ·q v = AP
[ ]
Así definido, cumple los axiomas del espacio afín. (Demostración análoga). Como la dimensión de V es 3 ⇒ la dimensión de A3 = (E ,V , ϕ) es 3 y A3 recibe el nombre de espacio afín tridimensional. 1.3. Subespacios afines. DEF Sea E1 un subconjunto no vacío de E y U un subespacio vectorial de V. Se dice que ( E, U , ϕ1 ) es un subespacio afín de dirección U cuando es un espacio afín asociado al espacio vectorial U y ϕ1 = ϕ E xU 1
ϕ1 E1 xU → E1 r r ( A, u ) → P = A + u
Los subespacios afines reciben también el nombre de variedades lineales. TEOREMA Un subconjunto E1 del espacio afín
{
}
(E,V , ϕ)
es un subespacio afín si y sólo si el
conjunto U = AX / X ∈ E1 , donde A es un punto fijo pero arbitrario de E1 , es un subespacio de V. Dem. “⇒” Sea
{
( E1, U , ϕ1 )
un subespacio afín de dirección U. Demostraremos que
}
U = AX , x ∈ E1 es subespacio vectorial.
{
}
a) AX , X ∈ E1 ⊂ U ya que para todo par de puntos A, X ∈ E por ser ( E1 , U , ϕ1 ) un espacio afín (ax, iii) se tiene que AX ∈ U . r b) Sea u un vector arbitrario de U, existe un vector fijo con origen en r A / u ∈ {AX , x ∈ E1 }. “⇐”
4/27
Demostraremos que vectorial. Se cumple:
( E1, U , ϕ1 )
es un espacio Afín asociado a U subespacio
r r i) Sea B un punto arbitrario de E1 y u , v ∈U. Se verifica r ur = BC C = B + u r r D = (B + u ) + v ⇔ r ⇔ r v = CD D = C + v
[ ] [ ]
r r r r Como u + v = BC + CD = BD ∈ U ⇒ D = B + (u + v ) .
[ ] [ ]
r r r r Luego ( B + u ) + v = B + (u + v ) . r ii) B + O = B iii) B y C dos puntos arbitrarios de E1 , como AB, AC ∈U ⇒ BC = AC − AB ∈ U ya que U es un subespacio vectorial, luego BC = AD y por tanto C = B + AD . OBS La recta es un subespacio afín de dimensión 1 y el plano es un subespacio afín de dimensión 2. 2. SISTEMAS DE REFERENCIA EN EL PLANO Y EN EL ESPACIO. 2.1. Sistemas de referencia en el plano. Vamos a establecer una biyección ϕo : A2 → V2 y otra b :V2 → 32 , de la siguiente manera: PROP Sea O un punto fijo de A2 . Definimos una correspondencia ϕo : A2 → V2
[ ]
P → OP
con OP el vector posición del punto P. Entonces ϕo es una biyección. Dem. - ϕo es una aplicación ya que cada punto P del plano le corresponde un único vector
[OP ] por ser A afín. 2
- ϕo es inyectiva, ya que ϕo (P ) = ϕo (Q) ⇒ P = Q .
[ ]
[ ]
Como ϕo ( P ) = OP y ϕo (Q ) = OQ . 5/27
Si
[ ] [ ]
ϕo (P ) = ϕo (Q ) ⇒ OP = OQ ⇒ OP = OQ por lo tanto por ser A2 afín
O + OP = O + OQ ⇒ P = Q . - ϕo es suprayectiva ya que por el axioma iii) de espacio afín, dado un punto O y r un vector u , existe un único punto P ∈ A2 / r r O + v = P ⇒ v = OP
[ ]
r r r r r r PROP Sea B = {u1 , u 2 } una base de V2 , entonces ∀x ∈ V2 ⇒ x = x1u1 + x2 u 2 con x1 , x2 ∈3. Definimos la correspondencia b: V2 → 32 del siguiente modo Entonces b es una biyección.
r b( x ) = ( x1 , x2 ) .
Dem. r r r - b es una aplicación ya que B = {u1 , u 2 } es una base por lo tanto x = x1u1 + x 2 u2 se puede expresar de forma única. r r r r - b es inyectiva ya que si b( x ) = b( y ) ⇒ x = y . r r r r r r Si b( x ) = b( y ) = ( x1 , x 2 ) ⇒ x = x1 u1 + x2 u 2 = y - b es sobreyectiva ya que ∀( x1 , x2 ) ∈32 podemos considerar el vector r r r r x = x1u1 + x 2 u2 y entonces b( x ) = ( x1 , x2 ) . Luego b es una biyección. DEF Sea A2 un plano afín y R = (O, U1 , U2 ) una terna de puntos. Se dice que esta terna es una sistema de referencia afín cuando los vectores OU1 y OU 2 asociados forma una base de V2 . El punto O se llama “origen del sistema de referencia”, el punto U1 primer punto unidad y el punto U2 segundo punto de unidad. Si llamamos r r R = (O, u1 , u 2 ) .
r OU1 = u1
y
r OU 2 = u2 , el sistema de referencia se escribe
r r PROP Sea A2 un plano afín, O∈A2 y B = {u1 , u 2 } sea una base de V2 . Entonces existe un único conjunto de puntos {O,U1 , U 2 } tal que R = {O,U 1 , U 2 } es un sistema de r r referencia del plano afín y OU1 = u1 y OU 2 = u2 . Dem. 6/27
r r Dada la base B = {u1 , u 2 } y el punto O, por el axioma i)
∃ U1 y U 2
/ O + ur1 = U1 ⇒ ur1 = OU 1 O + ur = U ⇒ ur = OU 2
2
2
2
Entonces la terna R = {O,U 1 , U 2 } cumple el enunciado. 2.1.1. Coordenadas de un punto en el plano afín. r r Dado R = {O, u1 , u 2 } un sistema de referencia afín y X un punto del plano afín. Se verifica: 1. Por la biyección r ϕo (x ) = OX = x .
ϕo : A2 → V2 vista en una proposición anterior se tiene que
[ ]
2. Por la biyección b: V2 → 32 vista en otra proposición r r r b( x ) = b( x1u1 + x 2 u2 ) = (x1 , x2 ) Entonces la composición de ϕo y b, f= bo o ϕo queda V2 b
ϕ
R2
A2 f
Si x∈A2 r f (x ) = (b o ϕo )( x ) = b(ϕo (x )) = b( x ) = ( x1 , x2 ) DEF Llamaremos coordenadas cartesianas del punto X respecto del sistema de r r referencia R = {O, u1 , u 2 } al vector numérico ( x1 , x2 ) ∈ 32 . Es decir, a las coordenadas r del vector posición x . Como consecuencia de ser f una biyección, las coordenadas del punto son únicas, pero dependen del sistema de referencia elegido. 2.1.2. Cambio de sistema de referencia afín. r r r r Sea R = {0, u1 , u 2 } y R´= {0´, v1 , v2 } dos sistemas de referencia afín en el plano A2 y X un punto cualquier de dicho plano.
7/27
Sean (x1 , x2 ) las coordenadas de X respecto de R Sean (y1 , y2 ) las coordenadas de X respecto de R´ El cambio del sistema de referencia consiste en hallar las coordenadas (x1 , x2 ) en función de las (y1 , y2 ) y recíprocamente. Vamos a hallar las coordenadas del punto X en R´ conocidas sus coordenadas en la referencia R. Para ello tenemos que conocer las coordenadas de los elementos de la referencia R en función de R´. Sean r r O´O = a1 v1 + a2 v2 r r r u1 = a11v1 + a12 v 2 r r u2 = a 21v1 + a22 v2
r r r x = OX = x1u1 + x 2 u2 r r r y = O´ X = y1 v1 + y2 v2
X y
v2
O' v1
x
u2 O u1 r r Por la figura anterior se tiene que y = O´O + x r r r r r r r r r r r r y = O´O + x = (a1 v1 + a2 v2 ) + ( x1u1 + x2 u2 ) = (a1 v1 + a2 v 2 ) + [ x1 (a11v1 + a12 v2 ) + x2 (a21 v1 + a22 v2 )] = r r r r r r = a1 v1 + a2 v2 + x1 a11v1 + x1 a11 v2 + x 2 a21 v1 + x2 a 22 v2 = r r = (a1 + a11 x1 + a21 x 2 )v1 + (a2 + a12 x1 + a22 x 2 )v2 r r r como y = y1 v1 + y 2 v2 y {v1 , v2 } es una base, tenemos y1 = a1 + a11 x1 + a 21 x2 que son las ecuaciones del cambio de sistema de referencia de y2 = a 2 + a12 x1 + a22 x2 R a R´. Vamos a expresar estas relaciones en forma matricial, para ello añadimos las igualdades 1 = 1. 8/27
1 a1 (1, y1 , y 2 ) = (1, x1 , x 2 ) • 0 a11 0 a 21
a2 a12 y tenemos y = X · A a 22
1 a1 a 2 a Además A ≠ 0 ya que 0 a11 a12 = 11 a21 0 a 21 a22
a12 r r ≠ 0 ya que u1 y u2 son L. I. a22
Por lo tanto ∃ A−1 . Multiplicando la ecuación Y = X · A por A-1 Y · A-1 = X que son las ecuaciones inversas de cambio de base. 2.2. Sistemas de Referencia en el Espacio. Todas las propiedades demostradas en el plano son validas para el espacio, cambiando A2 por A3 , V2 por V3 y 32 por 33 . Por lo tanto la definición de sistema de referencia será: DEF Sea A3 el espacio afín y R = {0, U 1 , U 2 , U 3 } una cuaterna de puntos. Se dice que es un sistema de referencia afín tridimensional, cuando los vectores asociados OU , OU 2 y OU 3 forman una base de V3 . r r r r r r Si llamamos u1 = OU 1 ; u 2 = OU 2 y u3 = OU 3 podemos escribir R = {O, u1 , u 2 , u3 }. 2.2.1 Coordenadas de un punto en el espacio. De igual forma que en el plano tenemos el siguiente diagrama r ϕo (x ) = OX = x Donde r r r r b( x ) = b( x1u1 + x 2 u2 + x3 u3 ) = ( x1 , x2 , x3 )
[ ]
V3 b
ϕ0
R3
A3 f
9/27
Luego r f (x ) = b o ϕo ( x ) = b[ϕo ( x )] = b( x ) = (x1 , x2 , x3 ) Donde por ser f aplicación, las coordenadas son únicas, pero dependen del sistema de referencia elegido. 2.2.2. Cambio de Sistema de Referencia en el Espacio. r r r r r r Sean R = {0, u1 , u 2 , u3 } y R´= {0´, v1 , v2 , v3 } dos sistemas de referencia en el espacio afín A3 y X un punto cualquiera de dicho espacio cuyas coordenadas respecto a R son ( x1 , x2 , x3 ) y con respecto a R´ sean ( y1 , y 2 , y3 ) . Para obtener las ecuaciones del cambio de sistema de referencia es necesario r r r conocer las coordenadas del punto O respecto a R´ y los de u1 , u2 , u3 respecto de r r r v1 , v2 , v3 . Sean Ó´O = (a1 , a 2 , a3 ) r r r r u1 = a11v1 + a12 v2 + a13 v3 r r r r u2 = a21v1 + a 22 v2 + a23 v3 r r r r u3 = a31v1 + a 32v 2 + a33v3 r r r r r r Se tiene O´ X = O´O + OX = (a1 v1 + a2 v2 + a3 v3 ) + ( x1 u1 + x2 u 2 + x3 u3 ) = r r r r r r r r r r r r = (a1v1 + a2 v2 + a3 v3 ) + [x1 (a11v1 + a12v2 + a13v3 ) + x2 (a21v1 + a22v2 + a23v3 ) + x3 (a31v1 + a32v2 + a33v3 )] = = a1 vr1 + a 2 vr2 + a3 vr3 + a11 x1 vr1 + a12 x1 vr2 + a13 x1 vr3 + a21 x 2 vr1 + a 22 x2 vr2 + a 23 x 2 vr3 + a 31 x3 vr1 + + a 32 x 3 vr2 + a 33 x 3 vr3 = r r r = (a1 + a11 x1 + a21 x 2 + a31 x3 )v1 + (a2 + a12 x1 + a22 x 2 + a32 x3 )v2 + (a3 + a13 x1 + a 23 x 2 + a33 x3 )v3 r r r Y como O´ X = y1v1 + y 2 v2 + y 3 v3 y
{vr1 , vr2 , vr3 } es base tenemos
y1 = a1 + a11 x1 + a 21 x2 + a31 x3 y2 = a 2 + a12 x1 + a22 x2 + a32 x3 Ecuaciones de cambio de sistema de referencia de R a y3 = a3 + a13 x1 + a 23 x2 + a33 x3 R´. En forma matricial se escriben
10/27
1 a1 0 a11 (1 y1 y2 y3 ) = (1x1x2 x3 ) 0 a21 0 a 31
a2 a12 a22 a32
a3 a13 o sea Y = X · A a 23 a33
Y como A es regular por ser A ≠ 0 ya que las filas, después de eliminar la 1ª columna y r r r 1ª fila son las coordenadas de u1 , u2 , u3 que forman base. Tenemos que X = Y A-1 que son las ecuaciones de R´ a R. 3. ECUACIONES DE LA RECTA EN EL PLANO. r r Sea R = {O, u1 , u 2 } un sistema de referencia en A2 . Una recta r es un subespacio afín de A2 de dimensión 1 por lo tanto r ⊂ A2 . Si consideramos un punto A∈A2 y un subespacio vectorial de V2 engendrado por un r vector v, que denotaremos por v r r = X ∈ A2 / AX ∈ v
{
}
3.1. Ecuación Vectorial de la Recta.
r
x
a u2
v
O u1 r r Si x ∈ r ⇒ AX ∈ v ⇒ AX = t ·v con t∈3. r r Si a y x son vectores posición de los puntos A y X respectivamente, se tiene que OX = OA + AX r r r x = a + tv con
t∈3
Esta igualdad se llama ecuación vectorial de la recta r.
11/27
Se observa que dando valores al parámetro t, en la ecuación vectorial de la recta se obtienerun conjunto de vectores de posición de puntos que pertenecen a la recta r. Al vector v se le llama vector director de la recta. 3.2. Ecuaciones paramétricas de la recta. r r r Si ( x, y ), ( x1 , y1 ) y (v1 , v2 ) son las coordenadas de los vectores de posición x , a , v respectivamente en R y si tenemos en cuenta el isomorfismo existente entre V2 y 32 (b: V2 →32 ), entonces la ecuación vectorial de r r x → ( x1 , x2 ) r r r x = a + tv se traduce por
( x, y ) = ( x1 , y1 ) + t (v1, v 2 ) = ( x1 , y1 ) + (tv1 , tv2 ) = ( x1+tv1, x 2 + tv2 ) de donde x = x 1 +tv1 con t∈3 y = x2 + tv2 que reciben el nombre de ecuaciones paramétricas de la recta. Dichas ecuaciones están r caracterizadas por el punto A = ( x1 , x2 ) y el vector director v (v1 , v 2 ) . Para cada valor del parámetro t se obtiene un punto de la recta. 3.3. Ecuación de la Recta en Forma Continua. • Si v1 ≠ 0 y v 2 ≠ 0 , si despejamos en las ecuaciones paramétricas resulta x − x1 =t v1 y − y1 = t v2
x − x1 y − y 1 = v1 v2
v1 ≠ 0 y v 2 ≠ 0
Dicha igualdad recibe el nombre de ecuación de la recta en forma continua que esta r determinada por A( x1 , x1 ) y v (v1 , v 2 ) . • Si v1 = 0 las ecuaciones paramétricas son x = x1
que se reduce a x = x1 que es una recta // al eje OY y = y1 + tv2
• Si v2 = 0 las ecuaciones paramétricas son
12/27
x = x1 + tv1 que se reduce a y = y1 que es una recta // al eje OX y = y1 3.4. Ecuación de la Recta en Forma General. • Si v1 ≠ 0 y v 2 ≠ 0 a partir de la ecuación continua x − x1 y − y1 = v1 v2 se obtiene v2 ( x − x1 ) = v1 ( y − y1 ) v2 x − v2 x1 = v1 y − v1 y1 v2 x − v1 y + v1 y1 − v 2 x1 = 0 Si hacemos A = v2 ; B = -v1 y C = v1 y1 – v2 x2 resulta Ax + By + C = 0 Que recibe el nombre de ecuación general o implícita de la recta. • Si v1 = 0 teníamos que x = x1 , es decir, x – x1 = 0. • Si v2 = 0 teníamos que y = y1 , es decir, y – y1 = 0. Luego, en los tres casos te obtiene una ecuación de la forma Ax + By + C = 0. Análisis de la ecuación. Recíprocamente si Ax + By + C = 0 es la ecuación de una recta en el espacio afín. r • El vector director de la recta será v = (− B, A) ya que A = v2 y B = -v1 . • Un punto base de la recta será cualquier punto perteneciente a la recta, por tanto sus coordenadas (x1 , y1 ) verificarán la ecuación de la misma. 3.5. Ecuación Explícita de la Recta. Si despejamos y en la ecuación general (siendo B ≠ 0) By = -Ax – C y=−
Ax C − B B
haciendo m = −
tenemos y = mx + n ecuación explícita
13/27
A C y n =− B B
donde m es la pendiente de la recta y n es la ordenada en el origen. m=−
A v2 = = tg α siendo α el ángulo que forma r con OX. B v1
3.6. Ecuación de la Recta que pasa por dos Puntos distintos. Uno de los axiomas de la geometría elemental dice que una recta queda determinada por dos puntos A y B. r Sean A( x1 , y1 ) y B( x2 , y2 ) dos puntos distintos. Sean a posición de los puntos A y B respectivamente.
y
r b los vectores
r r Por lo tanto AB = b − a es un vector direccional de la recta r cuyas componentes serán ( x2 − x1 , y2 − y1 ) = (v1 , v2 ) y considerando A( x1 , y1 ) podemos utilizar cualquier tipo de ecuación anterior por ejemplo utilizando la continua tendremos x − x1 y − y1 = x 2 − x1 y 2 − y1 4. ECUACIONES DE LA RECTA Y DEL PLANO EN EL ESPACIO. 4.1. Ecuaciones de la Recta en el Espacio. DEF Llamamos recta en el espacio a cualquier variedad lineal asociada a un subespacio vectorial de dimensión uno r r = X ∈ A3 / AX ∈< v >
{
}
r donde A es un punto de A3 y v es un subespacio de dimensión 1 engendrado por el r vector v . r r r Sea R = {O, u1 , u 2 , u3 } un sistema de referencia afín. r r Para que un punto X pertenezca a la recta r debe satisfacer AX ∈ v ⇒ AX = tv . O sea OX = OA + AX r r Es decir, OX = OA + t v r r Si denominamos x al vector posición de X y a al de A tenemos r r r x = a + tv que es la ecuación vectorial de la recta. 14/27
Expresando la relación anterior, utilizando las componentes de los vectores (debido al isomorfismo existente entre V3 y 33 ). Sea ( x, y , z ) y ( x1 , x 2 , x3 ) las coordenadas con respecto a R de X y A y r los del vector v . Entonces tenemos
( x, y, z ) = ( x1 , x2 , x3 ) + t(v1 , v2 , v3 ) o sea x = x1 + tv1 y = x2 + tv2 que son las ecuaciones paramétricas de la recta. z = x 3 + tv3 Para eliminar el parámetro t en el sistema anterior tenemos v1 v1 rang v 2 = rang v 2 v v 3 3
x − x1 y − x2 z − x3
(1)
r r pero como v ≠ O por ser el vector director de una recta v1 rang v2 = 1 v 3 por lo tanto, para que se cumpla (1) debe ser, suponiendo v1 ≠ 0 v1 v2 v1 v3
x − x1 = 0 y − x2 v1 ( y − x2 ) = v2 (x − x1 ) x − x1 v1 ( z − x 3 ) = v3 ( x − x1 ) = 0 z − x3
(2)
Igualdades que es costumbre escribir en la forma x − x1 y − x2 z − x3 = = v1 v2 v3
Si
v1 ≠ 0, v2 ≠ 0 y v3 ≠ 0
que recibe el nombre de ecuación continua de la recta. Las ecuaciones de la expresión (2) también pueden escribirse como v2 x − v1 y + v1 x2 − v2 x1 = 0 v3 x − v1 z + v1 x3 − v3 x1 = 0
15/27
(v1 , v2 , v3 )
En general, lo podemos escribir de la forma: Ax + By + Cz + D = 0 A´x + B´ y + C´z + D´= 0 que reciben el nombre de ecuaciones cartesianas o implícitas de la recta. Recíprocamente, dado un sistema de dos ecuaciones lineales con 3 incógnitas a1 x + a2 y + a3 z + a4 = 0 b1 x + b2 y + b3 z + b4 = 0 la condición necesaria y suficiente para que sean ecuaciones cartesianas de una recta es que a a2 a3 = 2 rang 1 b1 b2 b3 ya que entonces el sistema tiene por solución una variedad lineal de dimensión 1. 4.2. Ecuaciones del plano. DEF
Un plano en A3 es cualquier variedad asociada a un subespacio de dimensión 2.
r r r r Sean v , w el subespacio de dimensión 2 engendrado por v , w y A un punto arbitrario de A3 . r r Π = X ∈ A3 / AX ∈ v , w
{
}
r r v , w se llaman vectores directores del plano y A es el punto base. r r r Sea R = {O, u1 , u 2 , u3 } un sistema de referencia afín. Sea ( x1 , x2 , x3 ) las coordenadas de A respecto a R y (v1 , v2 , v3 ), ( w1 , w2 , w3 ) los r r componentes de v , w . r r r r Si X ∈ Π ⇒ AX ∈ v , w ⇒ AX = αv + βw es decir OX = OA + AX . O sea
r r OX = OA + αv + βw Ecuación vectorial del plano.
Expresando esta resolución en función de las componentes vectores que en ella intervienen, tenemos
16/27
( x, y, z ) = ( x1, x 2 , x3 ) + α(v1 , v2 , v3 ) + β(w1 , w2 , w3 ) Luego x = x1 + αv1 + βw1 y = x2 + αv 2 + βw2 z = x3 + αv3 + βw3 que son las ecuaciones paramétricas del plano α,β∈3 Para eliminar los parámetros α, β planteamos v1 rang v 2 v 3
w1 v1 w2 = rang v 2 v w3 3
w1 w2 w3
x − x1 y − x2 z − x3
(3)
y como v, w son base de un subespacio de dimensión 2, entonces v1 rang v 2 v 3
w1 w2 = 2 w3
y para que se cumpla la expresión (3) debe ser v1
w1
x − x1
v2 v3
w2 w3
y − x2 = 0 z − x3
Desarrollando este determinante y simplificando obtenemos la ecuación que recibe el nombre de ecuación cartesiana o implícita del plano. Ax + By + Cz + D = 0 En el caso de que el plano venga determinado por tres puntos no alineados A = (a1 , a 2 , a3 ) B(b1 , b2 , b3 ) C (c1 , c2 , c3 ) , podemos formar los vectores AB y AC r r que pueden tomarse como v , w y pueden escribirse
[ ] [ ]
b1 − a1
c1 − a1
x − a1
b2 − a2 b3 − a3
c 2 − a2 c3 − a3
y − a2 = 0 z − a3
determinante que equivale al
17/27
1 a1 a2 a3
1 b1 b2 b3
1 c1 c2 c3
1 x1 =0 x2 x3
igualdad cuyo desarrollo da lugar a una ecuación de la forma Ax + By + Cz + D = 0 5. RELACIONES AFINES. 5.1. Incidencias de Puntos, Rectas y Planos. 5.1.1. Incidencia entre Punto y Recta. DEF Se dice que un punto P es incidente con la recta r, o bien que la recta r pasa por P, cuando el punto P pertenece a dicha recta. TEOREMA El punto P es incidente con la recta r si y sólo si las coordenadas de P satisfacen las ecuaciones de la recta. Dem. Es inmediata por la definición de incidencia. 5.1.2. Incidencia entre Punto y Plano. DEF Se dice que un punto P es incidente en un plano Π, o bien que el plano Π pasa por el punto P, cuando el punto P pertenece a dicho plano. TEOREMA El punto P es incidente al plano Π si y solo si las coordenadas de P satisfacen las ecuaciones del plano Π. Dem. Es inmediata por la definición. 5.1.3. Incidencia entre Recta y Plano. DEF Se dice que una recta r es incidente con el plano Π, cuando todos los puntos de la recta r son incidentes con dicho plano, es decir, cuando la recta está contenida en el plano.
18/27
TEOREMA r Sea r la recta determinada por el punto A y el vector director u y sea Π el plano r r determinado por el punto B y los vectores directores v , w . La recta r es incidente con el r plano Π si y sólo si existe un punto P de r incidente con Π y que el vector u se exprese r r como combinación lineal de los vectores v , w . Dem. La condición es necesaria, ya que si r es incidente con Π todos los puntos de r son r incidentes con Π y por tanto el vector u tiene un representante con origen en B y r r r extremo un punto C∈Π, luego u = BC = α, v + α2 w .
[ ]
Recíprocamente, sea P un punto de r incidente con Π y sea r r r u = α, v + a2 w Para todo punto X ∈ r se verifica: r ) = OP + (t α)vr + (tα )wr OX = OP + t ur = OP + t (α, vr + α2 w 2 Luego el punto X también es incidente en el plano Π. Y como esto sucede para todo punto X de r entonces r es incidente en el plano Π. COROLARIO r r r La recta es incidente con el plano Π si y sólo si rango (u , v , w) = 2 y A∈Π. Dem. r r r Inmediata por el teorema anterior ya que los vectores u , u y w tienen que ser linealmente dependientes. 5.2. Paralelismo entre Rectas y Planos. 5.2.1. Paralelismo entre rectas. DEF Sean r ≡ A + V y r ' ≡ B + V ' dos rectas afines y V y V’ los subespacios vectoriales asociados. Se dice que las rectas r y r’ son paralelos si V = V’ y son coincidentes si además A∈r’ ó B∈r. TEOREMA r r Dada la recta r determinada por A y por u y la recta r’ determinada por B y por v . r r Las rectas r y r’ son paralelas si y sólo si los vectores u y v son linealmente dependientes.
19/27
Dem. La condición es necesaria ya que si las dos rectas son paralelas, los espacios r r vectoriales V y V’ coinciden y por lo tanto, el sistema {u , v} es linealmente dependiente ya que la dimensión de los subespacios asociados es uno. r r Recíprocamente si u y v son linealmente dependientes se tendrá que r r u = αv r r v = βu luego
r = t ur = (tα)vr ⇒ w r ∈V ' ⇒ V ⊂ V ' ∀wr ∈ V ⇒ w ⇒ V =V ' r r r r r ∀w ∈ V ' ⇒ w = s v = (sβ )u ⇒ w ∈ V ⇒ V ' ⊂ V
COROLARIO r r Dos rectas r y r’ son paralelas si y sólo si rang (u , v ) = 1 . Además, serán coincidentes r r si rango AB, u , v = 1 .
(
)
Dem. r r Es consecuencia inmediata del teorema anterior ya que los vectores u y v son linealmente dependientes. 5.2.2. Paralelismo entre Planos. DEF Sean Π = A + V y Π ' = B + V ' , dos planos afines y V y V’ los subespacios vectoriales asociados. Se dice que los planos Π y Π ' son paralelos si V = V’ y son coincidentes si además A∈Π’ ó B∈Π. TEOREMA Sean
(A, ur , vr )
y
(B, ar, br )
los determinantes lineales de los planos Π y Π’ r r r r respectivamente. Los planos Π y Π’ son paralelos si y sólo si rango u , v , a , b = 2.
(
)
Dem. r r r r En efecto, si los planos son paralelos el sistema {u , v} depende linealmente de a , b y recíprocamente, ya que V = V’ y tienen dimensión 2.
{ }
Recíprocamente si el rango de los cuatro vectores es dos, quiere decir que hay dos r r r r vectores que dependen linealmente de los otros dos. Como {u , v} y a , b son sistemas linealmente independientes por ser bases de espacios vectoriales de dimensión dos, el primero depende linealmente del segundo y recíprocamente, luego engendran el mismo espacio vectorial.
{ }
20/27
COROLARIO Los planos Π y Π’ definidos por sus ecuaciones cartesianas Π = Ax + By + Cz + D = 0
Π1 = A´x + B´ y + C´z + D´= 0
son paralelos si y sólo si A B C rango = 1 A´ B´ C´ Dem. En efecto, las ecuaciones cartesianas de los planos Π y Π’ se obtienen desarrollando los determinantes: u1
v1
x − xo
Π = u2 u3
v2 v3
y − yo = 0 z − zo
a1
b1
x − x1
Π' = a 2 a3
b2 b3
y − y1 = 0 z − z1
y los coeficientes A, B y C, A´, B´ y C´ son los adjuntos de los elementos de la tercera columna respectivamente. r r Si los planosr sonr paralelos, por el teorema anterior, los vectores a y b dependen linealmente de u y v , luego r r r a = αu + βv r r r b = tu + s v con los que teniendo en cuenta las propiedades de los determinantes, se tendrá a1
b1
x − x1
αu1 + βv1
tu1 + sv1
x − x1
αu1
sv1
x − x1
βv1
tu1
x − x1
a2 a3
b2 b3
y − y1 = αu2 + βv 2 z − z1 αu 3 + βv3
tu2 + sv2 tu3 + sv3
y − y1 = αu2 z − z1 αu3
sv 2 sv 3
y − y1 + βv 2 z − z1 βv3
tu2 tu3
y − y1 = z − z1
u1
v1
x − x1
= (αs − βt ) u 2 u3
v2 v3
y − y1 z − z1
Igualando los coeficientes de las incógnitas, tendremos A´= A(αs − βt ) B´= B(αs − βt ) C´= C (αs − βt ) 21/27
esto es, los coeficientes A, B y C son proporcionales a los coeficientes A´, B´ y C´. Por tanto A B C rango = 1 A´ B´ C´ 5.2.3. Paralelismo entre recta y plano. DEF Sean r = A + V y Π = B + V’ una recta y un plano afín, donde V y V’ son los subespacios vectoriales asociados. Diremos que la recta y el plano son paralelos si V⊂V1 y son incidentes si además A∈Π. TEOREMA r r r Sean ( A, u ) y ( B, u , w) los determinantes lineales de la recta r y del plano Π respectivamente. La recta r y el plano Π son paralelos si y sólo si rang (u , v, w) = 2 . Dem. “⇒” Si la recta y el plano son paralelos r r r rang (u , v , w) = 2.
r V ⊂ V1 ⇒ u depende de
{vr, wr }
luego
“⇐” r r r r r r r r Si rango (u , v , w) = 2 por ser v y w L. I. el vector u depende linealmente de v y w , luego V⊂V1 y la recta y el plano son paralelos. 5.3. Intersección entre Rectas y Planos. 5.3.1. Intersección de Rectas. DEF Sean r = A + V y r’ = B + V’ dos rectas afines y V y V’ los subespacios vectoriales asociados. Diremos que las rectas r y r’ son secantes o que se cortan en un punto, cuando las dos rectas son coincidentes con un mismo plano y no son paralelas. TEOREMA r Sean ( A, u ) y
(B, vr ) los determinantes lineales de las rectas r y r’, respectivamente. r r r r Las rectas r y r’ son secantes si y sólo si rang (AB, u , v ) = 2 y rango (u , v ) = 2 . Dem.
22/27
“⇒” Si dos rectas r y r’ son secantes, no son paralelas, luego por el corolario 2 r r r r rang (u , v ) = 2 , pero además por ser incidentes con el mismo plano rango AB, u , v = 2 ya que tres vectores en el plano son linealmente dependientes.
(
)
“⇐” r r rang AB, u , v = 2 Si ⇒ las rectas están en el mismo plano y no son paralelas, luego r r rang (u , v ) = 2 son secantes.
(
)
DEF Se dice que las rectas r y r’ se cruzan cuando no son incidentes con un mismo plano. TEOREMA r r Dos rectas r y r’ se cruzan si y sólo si rang AB, u , v = 3 .
(
)
Dem. Inmediata a partir del teorema anterior. 5.3.2. Intersección entre Planos. DEF Sean Π = A +V y Π’ = B + V’ dos planos afines y V y V’ los subespacios vectoriales asociados. Diremos que los planos Π y Π’ son secantes o que se cortan según una recta, cuando no son paralelos. TEOREMA Sean
(A, ur , vr )
y
(B, ar, br )
los determinantes lineales de los plano Π y Π’ r r r r respectivamente. Los planos Π y Π’ son secantes si y sólo si rango u , v , a , b = 3 .
(
)
Dem. r r r r r r r r Inmediata ya que por no ser paralelos rang u , v , a , b > 2 ⇒ rang u , v , a , b = 3 .
(
)
(
)
5.3.3. Intersección entre Recta y Plano. DEF Sean r = A + V y Π = B + V’ una recta y un plano afín, donde V y V’ son los subespacios vectoriales asociados. Diremos que la recta r y el plano Π son secantes o que se cortan en un punto cuando no son paralelos. TEOREMA
23/27
r r r Sean ( A, u ) y ( B, v , w) los determinantes lineales de la recta r y del plano Π r r r respectivamente. La recta r y el plano Π son secantes si y sólo si rango (u , v , w) = 3. Dem. Consecuencia de un teorema anterior. 5.4. Posiciones Relativas de dos Rectas en el Plano. Sean r ≡ Ax + By + C = 0 Consideremos el sistema
y
r´≡ A´ x + B´ y + C´= 0 dos rectas en el plano.
Ax + By + C = 0 A´x + B´ y + C´= 0 Llamamos M a la matriz de coeficientes y M* a la matriz que resulta de añadir los términos independientes. Entonces 1) Sistema compatible Rang ( M ) = Rang ( M * ) = 1 ⇒ ⇒ rectas coincident es in det erminado Además de cumple A B =0 A´ B´
A C A B C = 0⇒ = = A´ C´ A´ B´ C´
2) Sistema Las rectas se Rang ( M ) = Rang ( M * ) = 2 ⇒ compatible ⇒ cortan en un det ermiando punto Además si son secantes se obtiene la siguiente relación A B A B ≠ 0⇒ ≠ A´ B´ A´ B´ 3) Sistema Las rectas son Rang ( M ) ≠ Rang ( M * ) ⇒ ⇒ incompatible paralelas
24/27
RANG M = 1 RANG M ∗ = 2
Luego
A B =0 A´ B´ A C ≠0 A´ C´
Entonces obtendríamos la siguiente relación para rectas paralelas A B C = ≠ A´ B´ C´ 5.5. Estudio Analítico de las Posiciones Relativas entre Rectas y Planos. Las distintas posiciones que pueden adoptar rectas y planos en el espacio se reducen analíticamente al estudio de las soluciones del sistema S formado por las ecuaciones que definen a las rectas y a los planos. Si M es la matriz de coeficientes, M* la matriz ampliada y g el grado de indeterminación del sistema S, con ayuda del teorema de Rouché-Fröbenious, se obtienen los siguientes resultados. 5.5.1. Posiciones Relativas de dos Planos. 1) Sistema compatible Planos Rang ( M ) = Rang ( M ) = 1 ⇔ in det erminado ⇔ coincident es g =2 *
2) Sistema compatible Los planos se cortan Rang ( M ) = Rang ( M ) = 2 ⇔ in det erminado ⇔ según una recta g =1 *
3) Rang ( M ) ≠ Rang ( M * ) ⇔
Sistema ⇔ Planos paralelos } incompatible
5.5.2. Posiciones Relativas de Recta y Plano. 1) Sistema compatible Re cta coincident e Rang ( M ) = Rang ( M ) = 2 ⇔ in det erminado ⇔ con plano g =1 *
25/27
2) Rang ( M ) = Rang ( M * ) = 3 ⇔
Sistema compatible La recta corta al ⇔ y det erminado plano en un punto
3) Rang ( M ) ≠ Rang ( M * ) ⇔ Sistema incompatible} ⇔
La recta es paralela al plano
5.5.3. Posiciones Relativas de dos Rectas. 1) Sistema compatible Rang ( M ) = Rang ( M * ) = 2 ⇔ in det erminado ⇔ Re cta coincident e} g =1 2) Re ctas paralelas b * Rang ( M ) = 2 ≠ Rang ( M ) ⇔ Sistema incompatible} ⇔ Se encuentran en el mismo plano 3) Rang ( M ) = Rang ( M * ) = 3 ⇔
Sistema compatible ⇔ Las rectas se cortan en un punto det erminado
4) Rang ( M ) = 3 ≠ Rang ( M * ) ⇔ Sistema incompatible} ⇔
26/27
Las rectas se cruzan
Bibliografía Recomendada. Matemáticas COU. Aut. Angel Primo. Ed. SM Matemáticas 2º BUP. Aut. Vizmanos, Primo, Anzola. Ed. SM Matemáticas COU. Fortuny – Cienfuegos. Geometría. Aut. Queysanne- Revuz.
27/27
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 52 PRODUCTO ESCALAR DE VECTORES. PRODUCTO VECTORIAL Y PRODUCTO MIXTO. APLICACIONES A LA RESOLUCION DE PROBLEMAS FISICOS Y GEOMETRICOS. 1. Producto escalar. Propiedades. 1.1.Norma de un vector. Espacio normado. 1.2.Ortogonalidad. Ángulos. 1.3.Producto escalar en V2 . 1.4.Producto escalar en V3 . 2. Producto vectorial de dos vectores de V3 . 2.1.Expresión analítica en una base ortonormal. 3. Producto mixto de tres vectores de V3 . 3.1.Expresión Analítica en una Base Ortonormal. 3.2.Interpretación Geométrica. 4. Aplicaciones. 4.1.Ecuación normal de una recta del plano 4.2.Ecuación normal del plano 4.3.Teorema del coseno y de Pitágoras. 4.4.Las tres alturas de un triángulo son concurrentes en un punto. 4.5.Las diagonales de un rombo son perpendiculares. 4.6.Obtención de Fórmulas Trigonométricas. 4.7.Trabajo de una fuerza. 4.8.Fórmula de Herón Bibliografía Recomendada.
1/14
TEMA 52 PRODUCTO ESCALAR DE VECTORES. PRODUCTO VECTORIAL Y PRODUCTO MIXTO. APLICACIONES A LA RESOLUCION DE PROBLEMAS FISICOS Y GEOMETRICOS. 1. PRODUCTO ESCALAR. DEF Sea V un espacio vectorial real. Se llama producto escalar en V a toda aplicación f : V × V → R que verifique los siguientes axiomas: Ax1
r r r r f( u , u ) > 0 si u ≠ 0
Ax2
f( u , v ) = f( v , u )
Ax3
r v r r v r r f( u , v + w ) = f( u , v ) + f( u , w )
r v r ∀ u ,v , w ∈ V
Ax4
r v r v f( α u , v ) = α f( u , v )
∀α ∈R
r v
v r
r v r v El número real f( u , v ) se escribe simplemente u · v , y por abuso del lenguaje, r v se dice que es el producto escalar de u y v . En lo que sigue adoptaremos esta notación. r v r r r v r PROP ( u + v ) w = u w + v w Dem. r v r r r v r r r v r r r v r v r (u +v ) w = w ( u + v ) = w u + w v = u w + v w = (u +v ) w r r v v PROP u (α v ) = α ( u v ) Dem. r r v v v r v r u (α v ) = ( α v ) u = α ( v u ) = α ( u v ) r r PROP u 0 = 0
r ∀ u ∈V
Dem. r r r r r r r r r u 0 = u (0 +0 ) = u 0 + u 0 ⇒ r r PROP u u = 0
⇔
r r u 0 =0
r r u =0
Dem. r r Si u = 0 se reduce al caso anterior
2/14
r r r r Si u ≠ 0 ,entonces u u > 0, contradicción 1.1. Norma De Un Vector. Espacio Normado. Supongamos definido un producto escalar en V. r r r DEF Dado u ∈V, llamamos norma de u (o módulo) y se designa por || u || , al nº real rr r r r r || u || = u·u (La definición tiene sentido pues u u ≥ 0 ∀ u ∈V ) TEOREMA r v r v r ∀ u , v ∈V se verifica | u v | ≤ u
r v
(Desigualdad de Cauchy-Schwartz)
Dem. r r v r r v Si u = 0 o v = 0 , el teorema es evidente. Supongamos ahora u , v no nulos y sea r v u +α v , α ∈3 un cierto vector. r r r r v r r r2 v r v v v Se verifica u + αv = ( u +α v )( u +α v ) = u u + 2α u v + α 2 v v = u r r v 2α ( u v ) + α 2 v 2 ≥ 0 ∀ α ∈R
2
+
Entonces el discriminante de la ecuación de segundo grado en α debe ser ≤ 0 r r v ⇒ (u v ) - u
2
r v
2
≤0
r r r v |u v |≤ u v
⇒
r v (La ecuación anterior ocurrirá cuando u y v sean L.D) PROP Se verifican las siguientes expresiones: r a) u ≥ 0 r b) u = 0 ⇔ r r r c) u + v ≤ u r d) αu = | α |
r u=0 r +v r u
Dem. 1, 2 y 4 son evidentes. r r 3) u + v
2
r = u
2
r r v + 2(u v ) + v
2
r ≤ u
2
r r r r r r + 2 u v ⇒ u + v 2 ≤ ( u + v )2
DEF Un espacio vectorial real V sobre el que se define una aplicación que verifique las 4 propiedades anteriores es un espacio normado. DEF Los vectores de norma 1 se llaman unitarios.
3/14
c.q.d. :V → R
DEF Se dice que una base de V es normada si todos los vectores que la componen son unitarios. 1.2. Ortogonalidad. Ángulos. r v r v DEF Dos vectores u , v ∈V se dice que son ortogonales si y solo si u v = 0. PROP Se verifica: r r 1) El vector 0 es ortogonal a todo vector u ∈V r 2) El único vector ortogonal a si mismo es el vector 0 r v 3) Si u y v son ortogonales y no nulos, son linealmente independientes. r v r r r r 4) Si u y v son ortogonales entonces u + v 2 = u 2 + v 2 DEF Se dice que una base de V es ortogonal si los vectores que la componen son ortogonales dos a dos. DEF Una base ortogonal y normada de V es una base ortonormada. r r v r v Sabemos que si u , v son no nulos se tiene ( u v )2 ≤ u rr u ·v − 1 ≤ Cauchy-Schwartz) de donde r r ≤ 1 podemos entonces u·v
2
r v
2
(desigualdad de
r v DEF Definimos el coseno del ángulo que forman dos vectores u , v mediante la expresión rr u·v r v cos( u , v ) = r r u·v que puede escribirse también de esta otra forma : r v r r r v u · v = u · v cos( u , v ) Hasta ahora los conceptos de norma e incluso de ángulo están desprovistos de sentido geométrico, al tratarse de elementos definidos en un espacio vectorial real de V. Vamos a particularizar a los espacios vectoriales V2 y V3 DEF Al par formado por el plano afín E2 y un producto escalar definido en V2 lo llamaremos plano afín euclídeo. DEF Al par formado por el espacio afín E3 y un producto escalar definido en V3 lo llamaremos espacio afín euclídeo. 1.3. Producto Escalar en V2 . r r r v Sea B = { u1 , u 2 } una base de V2 y u , v vectores de V2 se tendrá
4/14
r r u = x1 u1 + y1 u2 r r v v = x 2 u1 + y 2 u 2 entonces r v r r r r r r r r u · v = ( x1 u1 + y1 u 2 )( x 2 u1 + y 2 u 2 ) = ( x1 x 2 )( u1 u 2 ) + ( x1 y 2 )( u1 u 2 ) + r r r r + ( y1 x 2 )( u 2 u1 )+ ( y1 y 2 )( u 2 u 2 ) (por los axiomas del producto escalar) En forma matricial puede escribirse así: r r r v u1 u 2 u · v = ( x1 y1 ) r r u 2 u1 OBS Por tanto, r r u1 u 2 (simétrica) r r u 2 u1
r r u1 u 2 r r u 2 u 2
x2 y2
el producto escalar queda determinado cuando se conoce la matriz r r u1 u 2 r r que se llama matriz del producto escalar. u 2 u 2
r r r r r r r r OBS Cuando la base B es ortonormal se tiene u1 u1 = u 2 u 2 = 1 u1 u 2 = u 2 u1 = 0, y entonces la matriz del producto escalar es la matriz identidad. En una base ortonormal tenemos que: El producto escalar es
r v u v = x1 x 2 + y1 y 2
r El módulo de u = ( x1 , x 2 ) es
r u =
r v El coseno del ángulo que forman u , v es
x12 + y12
r v cos( u , v ) =
x1 x 2 + y1 y 2 x12 + y12 x 22 + y 22
r v r r r v OBS La relación u v = u v cos( u , v ) obtenida de la simple definición de producto escalar, es la expresión clásica del producto escalar ordinario. En ocasiones suele introducirse el producto escalar directamente, suponiendo conocidos los conceptos de módulo, norma o longitud de un vector, y el concepto de ángulo. En ese caso, las propiedades que definen el producto escalar deben demostrarse. r NOTA: El módulo o longitud de un vector u de V2 es la longitud del segmento de un r r representante de u . Se denota por u . r v r r r v r r r r Si se define u v = u v cos( u , v ), entonces u u = u u pero también es r r r r r r u u = u u , luego u = u
5/14
1.4. Producto Escalar En V3 . r r Sea B = { u1 , u2 , u3 } una base de V3 , expresamos ambos vectores en la base B
r v u , v ∈V3 dos vectores. Entonces, si
r r r u = x1 u1 + y1 u2 + z1 u3 r r v v = x 2 u1 + y 2 u2 + z 2 u3 tenemos que su producto escalar es: r v r r r r r r r u v = ( x1 u1 + y1 u2 + z1 u3 )( x 2 u1 + y 2 u2 + z 2 u3 ) = ( x1 x 2 )( u1 u1 ) + ( x1 y 2 )( u1 u2 ) + r r r r r r ( x1 z 2 )( u1 u3 ) + ( y1 x 2 )( u2 u1 ) + ( y1 y 2 )( u2 u2 ) + ( y1 z 2 )( u2 u3 ) + ( z1 x 2 )( u3 u1 )+ r r r ( z1 y 2 )( u3 u2 ) + ( z1 z 2 )( u3 u3 ) por los axiomas del producto escalar. Nuevamente en forma matricial r r u1 u1 r r r v u v = ( x1 y1 z1 ) u 2 u1 ur ur 3 1 r r u1 u1 r r donde u 2 u1 ur ur 3 1
r r u1 u 2 r r u 2u 2 r r u 3u 2
r r u1 u 2 r r u 2u 2 r r u 3u 2
rr u1u 3 r r u 2u 3 r r u3 u3
x y z
rr u1u 3 r r u 2 u 3 es la matriz del producto escalar en la base B. r r u3 u3
Si la base es ortonormal entonces dicha matriz es la identidad y el producto escalar se escribe de forma más simple como: r v u v = x1 x 2 + y1 y 2 + z1 z 2 Igualmente, la norma de un vector y el coseno del ángulo de dos vectores se pueden escribir, respectivamente, como: r u =
x12 + y12 + z12
r v cos( u , v ) =
x1 x2 + y1 y 2 + z1 z 2 x12 + y12 + z12 x22 + y 22 + z 22
El producto escalar ordinario de dos vectores puede definirse partiendo de: r u r u
r r r v v v = u v cos( u v ) v v =0
r v si u , v son no nulos r r v r si u = 0 ó v = 0
6/14
r r El símbolo u expresa el módulo de u , la longitud de uno de sus representantes y coincide con el concepto de norma, al igual que vimos para V2 . 2. PRODUCTO VECTORIAL DE DOS VECTORES DE V3 . r r r r r r DEF Sean a b ∈V3 , llamamos Producto Vectorial de a y b y se escribe a x b a otro vector que verifica: r r r r r r 1) axb = a b sen (a , b ) r r r r r r 2) ( a x b ) a = 0 , ( a x b ) b = 0 r r 3) En caso que a y b sean linealmente independientes, la orientación r r determinada por la base ortonormal {u1 , u2 , u3 } de V3 es la misma que la determinada r r r r por ( a , b , a x b ), o lo que es lo mismo, r r r r r r signo [det( u1 , u2 , u3 )] = signo [det( a , b , a x b )] 2.1. Expresion Analítica en una Base Ortonormal. r r Sea B = { u1 , u2 , u3 } una base ortonormal de V3 r a = ( a1 , a 2 , a 3 ) r b = ( b1 , b2 , b3 ) r r r w = a x b = ( w1 , w2 , w3 ) por 2) se tiene
r r r (a xb ) a = 0 ⇒ r r r (a xb ) b = 0 ⇒
a1 w1 + a 2 w2 + a 3 w3 = 0 b1 w1 + b2 w2 + b3 w3 = 0
r r r r Si a y b fuesen linealmente dependientes sería a = λ b , y por 1) r r r r r ⇒ a x b = 0 , luego podemos suponer a y b linealmente independientes.
r r axb = 0
Entonces a1 a 2 a 3 = 2, y tomando un menor de orden 2 no nulo, por ejemplo rang b b b 1 2 3 a1 a 2 = ∆≠0 b1 b2
a1 w1 + a 2 w2 = − a 3 w3 ⇒ b1 w1 + b2 w2 = − b3 w3
w1 =
a2 a3 b2 b3 ∆
w3
7/14
Llamemos w3 = t ∆
w2 =
⇒ w1 = t
a2 a3 b2 b3
,
w2 = t
a3 a1
,
b3 b1
a3 a1 b3 b1
w3
∆
w3 = t
a1 a 2 b1 b2
Si la base está orientada positivamente, entonces por 3), a1 a 2 a 3 a2 a3 a3 a1 a1 a 2 b1 b2 b3 > 0 ⇒ w1 + w2 + w3 >0 b2 b3 b3 b1 b1 b2 w1 w2 w3 ⇒ w1
w1 w w 1 + w2 2 + w3 3 >0 ⇒ ( w1 2 + w2 2 + w3 2 ) > 0 t t t t
a2 a3 r r Además w w = t2 ( b2 b3 r r w w= a
2
2
+
a3 a1 b3 b1
r r r b 2 sen2 ( a , b ) = a
2
r b
2
+
2
a1 a 2 b1 b2
2
) y también
r r - (a b )2 ⇒
r r w w = ( a1 2 + a 2 2 + a 3 2 )( b1 2 + b2 2 + b3 2 ) – ( a1 b1 + a 2 b2 + a 3 b3 )2 = … = = a1 2 b1 2 + a 2 2 b1 2 + a 3 2 b1 2 + a1 2 b2 2 + a 2 2 b2 2 + a 3 2 b2 2 + a1 2 b3 2 + a 2 2 b3 2 + a 3 2 b3 2 - a1 2 b1 2 - a 2 2 b2 - a 3 2 b3 2 - 2 a1 a 2 b1 b2 - 2 a1 a 3 b1 b3 - 2 a 2 a 3 b2 b3 = … = = ( b1 a 2 - a1 b2 )2 + ( a 3 b1 - a1 b3 )2 + ( a 3 b2 - a 2 b3 )2 =
a1 a 2 b1 b2
2
+
a3 a1 b3 b1
2
+
a2 a3
2
b2 b3
⇒ t2 = 1 ⇒ t = 1 por tanto r a = ( a1 , a 2 , a 3 ) r b = ( b1 , b2 , b3 ) a 2 a 3 a3 a1 a1 a 2 r r a xb = ( , , ) b2 b3 b3 b1 b1 b2
(cuando la base es ortonormal)
OBS A veces se suele adoptar como definición, demostrando en este caso 1), 2) y 3). Lo hemos hecho de esta forma pues la interpretación geométrica del producto vectorial es
8/14
r r más inmediata. Así el producto vectorial de dos vectores a , b es otro vector ortogonal a r r r r ambos, cuyo módulo es a b sen( a , b ), siendo el área del paralelogramo determinado r r por representantes de origen común de a y b y cuyo sentido viene dado por la regla del sacacorchos (orientación positiva de la base ortonormal de V3 elegida). r r r PROP ∀ a , b , c ∈V3 y ∀ α ∈R, se verifica: r r r r 1) a x b = - b x a r r r r r r 2) a x( α b ) = α ( a x b ) = ( α a )x b r r r r r r r 3) a x( b + c ) = a x b + a x c r r r r r r r 4) ( a + b )x c = a x c + b x c r r r 5) a x 0 = 0 r r r r r 6) a x b = 0 ⇒ a , b son linealmente independientes. Dem. Estas propiedades se demuestran fácilmente si pensamos en la forma usual de calcular el producto vectorial cuando nos dan 2 vectores expresados en una base ortonormal: r u1 r r a x b = a1 b1
r r u2 u3 a2 a3 b2 b3
Evidentemente la expresión no es un determinante pero ayuda mucho a recordar la expresión del producto vectorial. 3. PRODUCTO MIXTO DE TRES VECTORES DE V3 . r r r DEF Dados x , y , z ∈V3 se define el producto mixto de los tres vectores como el nº real: r r r r r r [ x , y , z ] = x · (y x z ) 3.1. Expresión Analítica en una Base Ortonormal. r x = ( x1 , x 2 , x3 ) r y = ( y1 , y 2 , y 3 ) r z = ( z1 , z 2 , z 3 )
⇒
x1 x 2 x 3 y2 y3 y 3 y1 y1 y 2 r r r r r r ⇒ x ( y x z ) = x1 + x2 + x3 = y1 y 2 y 3 = det ( x , y , z ) z 2 z3 z 3 z1 z1 z 2 z1 z 2 z 3
9/14
PROP Se verifica: r r r r r r r r r r r r r r r r r r 1) [ x , y , z ] = [ z , x , y ] = [ y , z , x ] = - [ x , z , y ] = - [ z , y , x ] = - [ y , x , z ] r 2) Si alguno de ellos es 0 r r r r r ,rentonces el producto mixto es 0 3) λ [ x , y , z ] = [ λ x , y , z ] r r r r r r r r r r 4) [ x + x ’, y , z ] = [ x , y , z ] + [ x ’, y z ] Dem. Son propiedades de determinantes. 3.2. Interpretación geométrica. −→ r r Sea R = { 0, u1 , u2 , u3 } una referencia ortonormal del espacio E3 y AB , → −→ r r r AC , AD representantes respectivos de los vectores x , y , z . −→
→
−→
Dichos vectores determinan un paralelepípedo del que AB , AC , AD son 3 aristas concurrentes en un vértice. El volumen del paralelepípedo es: A x Base x h →
−→
A x Base = || AC x AD || →
−→
La altura h es la distancia de B al plano ACD y como AC x AD es un vector → −→
normal al plano se tiene que h = || AB
→
AC x AD →
→
|| ⇒
AC x AD →
−→
−→
→
−→
−→
→
−→
V = || AC x AD ||· h = | AB ( AC x AD )| = [ AB , AC , AD ] 4. APLICACIONES. El producto escalar definido en V2 y V3 de la forma ordinaria permite introducir las nociones métricas de distancia y ángulo en el plano y espacio de forma clara y sencilla. Igua lmente el producto vectorial nos facilita el cálculo de áreas, y el producto mixto, el cálculo de volúmenes. Todas estas cuestiones, que perfectamente pueden introducirse aquí, son propias del tema 53, y ahí se verán con detalle. Pero igualmente, nos facilitan la resolución de numerosos problemas geométricos y físicos. Veamos ejemplos de algunos de los más destacados.
10/ 14
4.1. Ecuación Normal de una Recta del Plano. r Supongamos R = { 0, u1 , u2 } referencia ortonormal. Una recta r puede venir r dada por un punto A( x 0 , y 0 ) y un vector u = (A, B) en la dirección perpendicular a r. Cualquier punto P(x, y) de r verifica r −→ u · AP = 0 ⇒ (A, B)(x - x 0 , y - y 0 ) = 0 ⇒ A(x- x 0 ) + B(y - y 0 ) = 0 ó bien Ax + By + (-A x 0 - B y 0 ) = 0 ⇒ Ax + By + C = 0 4.2. Ecuación Normal del Plano. Igualmente , un plano π viene dado por un punto A( x 0 , y 0 , z 0 ) de π y un r vector n = (A, B, C) normal al plano. Si P∈π se tiene que −→ r AP n = 0 ⇒ A(x - x 0 ) + B(y - y 0 ) + C(z - z 0 ) = 0
⇒ Ax + By + Cz + D = 0 siendo
D = -A x 0 -B y 0 -C z 0
4.3. Teorema del coseno y de Pitágoras. TEOREMA En todo triangulo ABC se verifica a2 = b2 + c2 – 2bc cosA Dem.
se tiene
r → r → r → Si llamamos b = AC , a = CB , c = AB r r r r r r c = a +b ⇒ a =c -b
r r r r r r r r r r r ( a )2 = a a = ( c - b )( c - b )= ( c )2 + ( b )2 - 2b c ⇔ a2 = b2 + c2 – 2bc cosA OBS Si el triángulo es rectángulo en A entonces se obtiene el teorema de Pitágoras. 4.4. Las Tres Alturas de un Triángulo son concurrentes en un Punto. TEOREMA Dados 4 puntos A, B, C, D cua lesquiera del plano, se verifica que →
→
→
→
−→
→
AB CD + AC DB + AD BC = 0
11/ 14
Dem. → r → r −→ v → v r → r v → r r Llamamos AB = u , AC = v , AD = w , CD = w - v , DB = u - w , BC = v - u
Luego, basándonos en las propiedades del producto escalar r v r r r v v r r u ( w - v ) + v (u - w ) + w (v - u ) = 0 Ello nos permite probar, por ejemplo que : PROP Las tres alturas de un triángulo son concurrentes. Dem. Tracemos las alturas correspondientes a C y B que se cortan en O. Debemos →
→
probar que AO es ortogonal a BC . Aplicando la igualdad anterior a los puntos A, B, C, O obtenemos →
→
→
→
→
→
AB CO + AC OB + AO BC = 0 pero →
→
→
→
AB CO = 0 y AC OB = 0 por hipótesis, luego →
→
AO BC = 0 como queríamos demostrar. 4.5. Las diagonales de un rombo son perpendiculares. → r → r r r En efecto AB = u , AC = v || u || = || v ||,
Pero → −→ → −→ r r r r r r r r BC = v - u y AD = v + u ⇒ BC AD = ( v + u )( v - u ) = 0.
4.6. Obtención de Fórmulas Trigonométricas. Complicadas fórmulas de trigonometría se obtienen fácilmente con el producto escalar. r r r Sea B ={ u1 , u2 } una base de V2 ortonormal y a , b vectores unitarios tal que r r r ( u1 , a ) = α , ( u2 , b ) = β r r r r Entonces a = λ1 u1 + λ2 u2 ⇒ u1 a = λ1 =cosα y Así
r u2 a = λ2 = cos( π /2 - α ) = senα r r a = cosα u1 +senα u2
12/ 14
y análogamente
r r b = cos β u1 + sen β u2
r r r r a b = cosα cos β + sen α sen β = || a || || b || cos ( β -α ) ⇒ cos ( β -α )=cos α cos β + sen α sen β r r r r r Otro ejemplo si a , b son unitarios y determinan un ángulo entonces (a , a + b ) r r α = ( al ser unitarios a + b es la diagonal del cuadrado que forman) 2 r r r r r r α a ( a + b ) = 1 + cos α = || a || || a + b || cos 2 r r || a + b || =
r r r r ( a + b )( a + b ) = 2 + 2 cos α ⇒ 1+ cosα =
cos
α = 2
2 + 2 cos α cos
α ⇒ 2
1 + cos α 2
4.7. Trabajo de una Fuerza. El producto escalar está asociado en física con un concepto muy importante, el de TRABAJO. r r Así, la aplicación de una fuerza F a un móvil que sigue una trayectoria d , nos r r proporciona un trabajo que puede definirse como T = F d . 4.8. Fórmula de Herón para el cálculo del Área de un Triángulo. A=
b·hB 2
h B2 = c 2 - c12
Por el teorema del coseno (demostrado con el p. escalar) a2 = b2 + c2 – 2bc cosα ⇒ a2 = b2 + c2 – 2bc1 ⇒ c1 = 2
b2 + c 2 − a 2 2b
b2 + c 2 − a 2 b 2 + c2 − a 2 h =c - = c + 2b 2b 2 B
2
a 2 − (b − c ) 2 2b
b 2 + c 2 − a 2 (b + c ) 2 − a 2 c − = 2 b 2b
(b + c − a)( b + c + a)( a − b + c )( a + b − c ) = 4b 2
Llamando p =
a+b+c 2 13/ 14
h B2 =
2( p − a) 2 p 2( p − b) 2( p − c) 2 ⇒ hB = 2 4b b luego A =
p( p − a)( p − b)( p − c )
p ( p − a)( p − b )( p − c)
Bibliografía Recomendada. Curso de Álgebra y Geometría. Aut. Juan de Burgos. Ed. Alambra Universidad. Álgebra Lineal. Aut. F. Puerta. Ed. Univ. Politécnica de Barcelona. Matemáticas COU, Tomo I. Aut. Vizmanos-Anzola.
14/ 14
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 53 RELACIONES MÉTRICAS: PERPENDICULARIDAD, DISTANCIAS, ÁNGULOS, ÁREAS, VOLÚMENES, ETC... 1. Introducción. 1.1. Producto Escalar. 1.2. Norma de un Vector. 1.3. Ángulos. 1.4. Ortogonalidad. 1.5. Particularización del Producto Escalar a V3 . 1.6. Producto Vectorial de dos Vectores de V3 . 1.7. Producto Mixto. 2. Ángulos. 2.1. Ángulo de dos Rectas. 2.2. Ángulo de dos Planos. 2.3. Ángulo de Recta y Plano. 3. Paralelismo. 3.1. Paralelismo de Rectas. 3.2. Paralelismo de Recta y Plano. 4. Perpendicularidad. 4.1. Perpendicularidad de Rectas. 4.2. Perpendicularidad de Recta y Plano. 4.3. Perpendicularidad de Planos. 5. Distancias. 5.1. Distancia de un Punto a un Plano. 5.2. Distancia entre Planos. 5.3. Distancia de un Punto a una Recta. 5.4. Distancia entre Rectas. 6. Áreas. 6.1. Área del Paralelogramo. 6.2. Área del Triángulo. 7. Volúmenes. 7.1. Volumen del Paralelepípedo. 7.2. Volumen del Tetraedro. Bibliografía Recomendada.
1/14
TEMA 53 RELACIONES MÉTRICAS: PERPENDICULARIDAD, DISTANCIAS, ÁNGULOS, ÁREAS, VOLÚMENES, ETC... 1. INTRODUCCIÓN. Para poder desarrollar este tema, vamos a exponer inicialmente la teoría necesaria. Recordaremos el Producto Escalar, Vectorial y Mixto. 1.1. Producto Escalar. DEF
Sea V un espacio vectorial real.
VxV → R Se llama producto escalar V toda aplicación: r r que verifica: (u , v ) → ur·vr r 1. ur·ur > 0 si ur ≠ 0 rr r r 2. u ·v = v ·u r r r rr r r 3. u ·(v + w) = u ·v + u ·w r r rr 4. u ·(αv ) = α(u ·v )
r r r ∀u , v , w ∈ V ∀α ∈ R
rr r r DEF Llamaremos producto escalar de u y v al número real u ·v (la imagen del par (ur, vr) por la aplicación). Como consecuencia directa de las axiones se tiene: PROP Se verifican las siguientes igualdades: r r r r r r r r r r 1) (u + v )·w = u ·w + v ·w ∀u , v , w ∈ V r r rr 2) (αu )v = α(u v )
∀α ∈ R
r r 3) u ·O = 0 rr r r 4) u ·u = 0 ⇒ u = O Dem. Inmediatas a partir de los axiomas. Abreviadamente, un producto escalar es una forma bilineal, simétrica y definida positiva en V.
2/14
1.2. Norma de un Vector. r DEF Definido un producto escalar en V, se llama norma de un vector u al número r rr real u = u ·u . rr (Tiene sentido pues u ·u ≥ 0
∀u ∈ V ) .
TEOREMA rr r r r r ∀u , v ∈ V se verifica u ·v ≤ u · v Dem. r r u + αv
2
r r r r r2 rr r2 = (u + αv )(u + αv ) = u + 2α(u ·v ) + α2 v ≥ 0
rr r2 r2 rr r r ⇒ (u ·v )2 − u · v ≤ 0 ⇒ (u ·v ) ≤ u · v 1.3. Ángulos. r r Si u y v son no nulos se tiene rr u ·v r ≤1 u ·v
⇔
rr u ·v −1 ≤ r r ≤ 1 u·v
DEF
Definimos entonces el coseno del ángulo formado por dos vectores como rr r r u ·v cos (u , v ) = r r u·v y de aquí rr r r r r u ·v = u · v ·cos(u , v ) 1.4. Ortogonalidad. En virtud de la definición anterior parece lógico definir la ortogonalidad de en función del valor de la expresión anterior DEF
r r r r Diremos que los vectores u y v son Ortogonales si cos (u , v ) = 0 .
rr r r PROP u , v ortogonales ⇔ u ·v = 0 Dem. Inmediata.
3/14
1.5. Particularización del Producto Escalar a V3 . r r r Si B = {u , u2 , u 3 } es una base V3 , entonces r r r r u = x1u1 + x 2 u2 + x3u 3 r r r r v = x1 ´u1 + x 2 ´u 2 + x3 ´u 3 y por las propiedades de linealidad r r r r r r r r u ⋅ v = ( x1 u1 + x2 u 2 + x3 u3 )·( x1 ´u1 + x 2 ´u 2 + x3 ´u 3 ) =
3
∑ (x x ´)(u ·u ) i
j
i
j
i , j =1
El producto escalar queda conocido cuando se conoce los valores de los 9 productos r r escalares ui ·u j (en realidad sólo 6 por simetría). r r El producto escalar de u y v es sumamente sencillo si la base {ur1 , ur2 , ur3 } está formada por vectores ortogonales dos a dos y unitarios (de norma 1) pues entonces rr r r r r r u1 u1 = u 2 u2 = u3 u3 = u1
2
r = u2
2
r = u3 = 1
rr rr r r u1 u2 = u1u 3 = u2 u 3 = 0 y
rr u ·v = x1 x1 ´+ x2 x 2 ´+ x3 x3 ´
Una base con las características anteriores se dice que es ortogonal, y en dicha base se tiene r u =
x12 + x22 + x32
r r cos (u , v ) =
x1 x1´+ x 2 x2 ´+ x3 x3 ´ 2 1
x + x22 + x32 · x1´ 2 + x1´ 2 + x3 ´2
OBS La particularización a V2 es análoga 1.6. Producto Vectorial de dos Vectores de V3 . DEF
r r r Sea B = {u1 , u2 , u 3 } una base ortogonal de V3 . Llamaremos Producto Vectorial
x3 x3 x1 x1 x2 r r r x . de ur = (x1 , x 2 , x 3 ) y v = ( x1 ´, x2 ´, x3 ´) al vector u x v = 2 , , x ´ x ´ x ´ x ´ x ´ x ´ 2 3 3 1 1 2 PROP Se verifica: r r r r r r 1) u x v = u · v (sen (u , v )) r r r 2) (u x v )·u = 0
(ur x vr )·vr = 0 4/14
r r r r r r 3) Si u , v son linealmente independientes, entonces u , v , u x v determinan una base r r r r r r r de V3 , y si det (u , u2 , u3 ) > 0 , también es det (u , v , u x v ) > 0 . Dem. 2
2
2
x3 x x1 x x2 r r2 x 1) u x v = 2 + 3 + 1 = x2 ´ x3 ´ x3 ´ x1 ´ x1´ x2 ´ 2
2
2
= ( x2 x3 ´− x3 x2 ´) + ( x3 x1´− x1 x3 ´) + ( x1 x2 ´− x 2 x1 ´) = = x22 x3 ´+ x32 x2 ´2 + x32 x´2 + x12 x3 ´ 2 + x12 x2 ´2 + x22 x1´ 2 −2 x2 x3 x2 ´ x3 − 2 x3 x1 x3 ´x1´−2 x1 x 2 Sumando y restando x12 x1 ´2 + x22 x 2 ´2 + x32 x3 ´2 se tiene
(x
2 1
+ x22 + x32 )(x1´2 + x 2 ´2 + x3 ´2 ) − (x12 x1 ´2 + x 22 x2 ´ 2 + x32 x3 ´2 −2 x2 x3 x 2 ´x3 ´−2 x3 x1 x3 ´x1 2 x1 x 2 x2 )
(
)(
)
2
= x12 + x22 + x32 x1 ´2 + x2 ´2 + x3 ´2 − ( x1 x1 ´+ x2 x2 ´+ x3 x3 ´) = rr r 2 r 2 r r 2 r 2 r 2 u ·v = u · v − (u·v ) = u · v · 1 − r r u·v r r ⇒ u xv
2
2
r2 r2 = u · v ·sen 2 (u, v )
x1 x 2 x3 x2 x3 x3 x1 x1 x2 r r r 2) (u x v )·u = x1 + x2 + x3 = x1 x 2 x3 = 0 x2 ´ x3 ´ x3 ´ x1´ x1 ´ x2 ´ x1´ x2 ´ x3 ´ x1´ x2 ´ x3 ´ x 2 x3 x3 x1 x1 x2 r r r (u x v )·v = x1´ + x2 ´ + x3 ´ = x1 x 2 x3 = 0 x2 ´ x3 ´ x3 ´ x1´ x1 ´ x2 ´ x1´ x2 ´ x3 ´ al ser determinantes con dos filas iguales.
r r r r 3) det (u , v , u x v ) =
x1 x1 ´
x2 x 2´
x2 x3 x2 ´ x3 ´
x3 x1 x3 ´ x1´
x3 r r r x3 ´ ·det (u , u2 , u 3 ) = x1 x 2 x1 ´ x2 ´
5/14
x2 x3 2 x3 x1 2 x1 x2 2 ·det (ur , ur , ur ) ⇒ = + + 1 2 3 x 2 ´ x3 ´ x3 ´ x1´ x1 ´ x2 ´ r r r r r r r signo det (u , v , u x v ) = signo det (u , u2 , u3 ) Las dos primeras propiedades probadas tienen el siguiente significado: r r r r 1) u x v = u · v · sen α , que es el área del paralelogramo determinando por 2 r r representaciones con origen común de u , v . r r r r 2) El producto vectorial de u y v es un vector ortogonal a la vez a u y v . 1.7. Producto Mixto. r r r DEF Dados los vectores x , y, z , definimos su producto mixto como el número real [xr, yr, rz ] = xr·( yr x zr ) Si expresamos los tres vectores mediante sus coordenadas en una determinada base, podemos escribir su producto mixto como: r x = ( x1 , x2 , x3 ) y r r r r y = ( y , y 2 , y3 ) ⇒ x ·( y x z ) = x1 2 z2 r z = ( z , z2 , z3 ) x1
x2
= y1 z1
y2 z2
y3 y + x2 3 z3 z3
y1 y + x3 1 z1 z1
y2 = z2
x3
r r r y3 = det ( x, y , z ) z3
Interpretación geométrica. El producto mixto es r r r r r r r r r r r r r r r x ·( y x z ) = x · y x z ·cos ( x, y x z ) = y x z · x ·cos( x , y x z ) donde
r r y x z Es el área del paralelogramo definido por ambos vectores
y r r r r x ·cos ( x, y x z ) Es la proyección de x sobre la dirección normal al plano determinado por los otros dos vectores. r r r Luego [x , y , z ] = Volumen del paralelepípedo de aristas concurrentes xr, ry, zr
6/14
2. ÁNGULOS. 2.1. Ángulo de dos Rectas. El producto escalar definido en V3 (o V2 ) permite el estudio del ángulo que forman dos rectas en el espacio afín (o el plano afín). r r DEF Sean r y s dos rectas de vectores directores u y v respectivamente. Llamamos r r ángulo de r y s al menor de los ángulos que determinan los vectores u y v . La medida del ángulo de r y s es el número real que verifica: rr u·v cos ϕ = r r u·v 0 ≤ϕ ≤ π
2
OBS Definimos así el ángulo de dos rectas aún en el caso de que éstas se crucen. Si el sistema de referencia es ortogonal y las dos rectas las expresamos como r≡
x − x1 y − y1 z − z1 = = a b c
s≡
x − x2 y − y2 z − z 2 = = a´ b´ c´
entonces cos (r, s ) =
aa´+bb´+cc´ a 2 + b 2 + c 2 · a´2 +b´2 +c´ 2
2.2. Ángulos de dos Planos. r r Sean π y π’ dos planos, y n , n´ sus vectores normales. Sabemos que el ángulo que forman r r los dos planos es igual al ángulo que forman dos rectas normales de direcciones n y n´. r r DEF Sean π y π’ planos de vectores normales n y n´ respectivamente. Llamamos r r ángulo de π y π’ al menor ángulo que forman n y n´ . Su medida será el número real ϕ que verifica las dos condiciones siguientes: rr n·n´ 1. cos ϕ = r r n · n´ 2. 0 ≤ ϕ ≤ π 2
7/14
Si los planos vienen dados por sus ecuaciones generales, con vectores normales: nr = ( A, B, C )
π ≡ Ax + By + Cz + D = 0 π' ≡ A´ x + B´ y + C´ z + D = 0 luego cos (π, π ') =
nr´= ( A´, B´, C´)
AA´+ BB´+CC´ A 2 + B 2 + C 2 · A´ 2 + B´ 2 +C´ 2
2.3. Ángulo de Recta y Plano. Sea π un plano y r una recta (no perpendicular). Sabemos que el ángulo de π y r es el formado por r y su proyección ortogonal, r´, sobre π. Pero dicho ángulo es el r r complementario del formado por u , vector director de la recta, y n , vector normal al plano. r n.
r Así pues, definiremos α = ∠(r,π) como el menor de los ángulos que forman u y Su medida será el número real que verifica: rr u ·n π 1. cos 2 − α = sen α = r r u·n
(
)
2. 0 ≤ α ≤ π 2 Si r ≡
x − x1 y − y 1 z − z 1 = = a b c
entre sen (r , π) = sen α =
y π ≡ Ax + By + Cz + D = 0 Aa + Bb + Cc
A2 + B 2 + C 2 · a 2 + b 2 + c 2
3. PARALELISMO. 3.1. Paralelismo de Rectas. DEF Diremos que las rectas r y s son paralelas si el ángulo que determinan verifica que Cos(r,s)=1. r PROP Las rectas r y s son paralelas ⇒ u y vr son L. D. siendo ambos vectores los vectores directores de las rectas. Dem. r , s paralelas ⇔ cos(r , s ) = 1 ⇔ (aa´+bb´+cc´)2 = (a 2 + b 2 + c 2 )(a´2 +b´2 +c´2 )
8/14
2 aa´bb´+2aa´cc´+2bb´cc´= a 2 b´ 2 + a 2 c´2 +b 2 a´ 2 +b 2 c´2 +b 2 c´2 + c 2 a´ 2 + c 2 b´2
2
2
⇒ (ab´−ba´) + (ac´a´c ) + (bc´−b´c )
2
ab´−ba´= 0 = 0 ⇒ ac´−a´c = 0 bc´−b´c = 0
a b = a´ b´ a c = a´ c´ b c = b´ c´
cqd
3.2. Paralelismo de Recta y Plano. DEF Diremos que la recta r y el plano π son paralelos si el ángulo que determinan verifica que Senα=0. 4. PERPENDICULARIDAD. 4.1. Perpendicularidad de Rectas. DEF
Las rectas r y s son perpendiculares si ur ⋅ vr = 0
PROP Las rectas r y s son perpendiculares si aa´+bb´+cc´= 0 , siendo (a,b,c) las coordenadas que determinan el vector director de la recta r y (a’,b’,c’) las del vector director de la recta s. Dem. r y s son perpendiculares ⇔ cos ϕ = 0 ⇔ aa '+bb´+ cc´= 0 4.2. Perpendicularidad de Recta y Plano. r r PROP r y π son perpendiculares si u y n son Linealmente Dependientes. a b c a b c OBS La Proposición anterior significa que rang = 1 ⇔ = = A B C A B C 4.3. Perpendicularidad de Planos. DEF
Los planos π y π’ son perpendiculares si verifican Cosϕ=0.
PROP Los planos π y π’ son perpendiculares si se verifica que AA’+BB’+CC’=0, siendo (A,B,C) y (A’,B’,C’) las coordenadas de los vectores normales a cada plano. 5. DISTANCIAS. DEF Sea A y B dos puntos del espacio afín euclideo E3 . Se llama distancia de A a B a la norma del vector AB .
9/14
d ( A, B ) = AB
z a
r Si a es el vector de posición A (que nos da las coordenadas de A en la r referencia) y b el vector de posición de B, se tiene:
B
A b
y
r r d ( A, B ) = b − a
x Así, si A(x1 , y1 , z1 ) y B(x2 · y2 · z2 ) se tendrá como expresión de la distancia entre dos puntos (si el sistema de referencia es ortonormal) d ( A, B ) =
(x 2
− x1 )2 + ( y 2 − y1 )2 + ( z 2 − z1 )2
PROP La aplicación d: E3 x E3 → R verifica: 1) d ( A, B ) ≥ 0 y si d ( A, B ) = 0 ⇔ A = B 2) d ( A, B ) = d (B, A ) 3) d ( A, B ) ≤ d ( A, C ) + d (C, B )
∀a, B, C ∈ E3
Dem. Las dos primeras son inmediatas y la tercera es una consecuencia de la desigualdad de Cauchy-Swartz. d ( A, B ) = AB = AC + CB ≤ AC + CB Conclusión
Así pues, (E3 , d) es un espacio métrico.
5.1. Distancia de un Punto a un Plano.
P(x0 ,y0 ,z0 )
Sea M un plano y P un punto. Se define la distancia de P a Π como min{d ( P, P´)} donde P´ ∈ Π.
P''
Dicho mínimo se alcanza cuando P´ = P’’, pie de L perpendicular trazado por P a Π, pues entonces:
α
P'
PP´ ≥ PP´ · cos α = PP' '
10/14
∀ P´∈ Π
r Si u es un vector normal al plano, se tiene que: PP´·nr = PP´ · nr · cos α = PP' ' · nr r PP´·n de donde d ( P, Π ) = PP' ' = r n Así, si P(xo , y o , z o ) , Π ≡ Ax + By + Cz + D = 0 se tendrá que d ( P, Π ) =
A(x − x o ) + B( y − y o ) + C( z − zo ) A2 + B 2 + C 2
=
Axo + By o + Czo + D A2 + B 2 + C 2
5.2. Distancia entre Planos. DEF
Sean π y π’ dos planos. Definimos la distancia entre ellos como d ( A, B ), A ∈ π d (π, π') = min B ∈ π'
Sólo tendrá sentido cuando π y π’ sean paralelos, en cuyo caso basta calcular la distancia de un punto cualquiera de π al plano π’. Si no fuesen paralelos la intersección no sería vacía y la distancia es cero. 5.3. Distancia de un Punto a una Recta. DEF Sea r una recta y P un punto. Se llama distancia de P a r a d ( P, r ) = min{d ( P, P´)} {donde P´∈ r } . Esta claro que si P´ es un punto cualquiera de r y α el ángulo que determina PP´ y r u (vector director de r) se tendrá que PP´ ≥ PP´ · sen α = PPo , luego dicho mínimo se alcanza cuando Po es el pie de la perpendicular desde P a r. Teniendo en cuenta lo anterior, podemos expresar la distancia de un punto a una recta como sigue: r r PP´xu PP´ · u sen α d ( P, r ) = PPo = = (recordar def. de prod. vectorial) r r u u Así si
P( xo , yo , zo ) x − x1 y − y1 z − z1 y r≡ = = P´( x1 , y1 , z1 ) a b c
11/14
2
b y1 − yo
d ( P, r ) =
2
c c + z1 − zo z1 − zo
a a + x1 − x o x1 − xo
b y1 − y o
2
a2 + b2 + c 2
5.4. Distancia entre Rectas. d ( A, B), A ∈ r Dadas dos rectas r, s definimos d (r , s ) = min B∈s
DEF
Sólo tendrá interés cuando r y s sean paralelas y cuando se crucen. En el caso de que sean paralelas se reduce a calcular la distancia de un punto cualquiera de una de ellas a la otra recta. Y esa situación ya la hemos visto. En el caso de que se crucen, la distancia entre las rectas es también la distancia entre el plano paralelo a s que contiene r y el plano paralelo a r que contiene s. r AB·n d (r , s ) = d (α, β) = r n
u s
v
B
r donde n es un vector normalr a ambos r planos y por tantor normal r r a u y a v. Podemos tomar n = u x v .
u A
v r
Así
cuando r ≡
r r r r r r AB·(u x v ) det AB, u , v AB, u , v d (r , s ) = = r r = r r r r u xv u xv u xv
[
x − xo y − yo z − z o = = a b c
d (r , s ) =
x1 − x o a a´ 2
(
]
s≡
y1 − y 0 b b´
)
x − x1 y − y1 z − z1 = = a´ b´ c´
z1 − z o c c´ 2
b c c a a b + + b´ c´ c´ a´ a´ b´
12/14
2
(referencia ortogonal)
6. ÁREAS. Aun cuando el producto vectorial no nos resuelve el problema general del área, si puede ayudarnos a calcular determinadas áreas como las del paralelogramo y triángulo y cualquier otra figura geométrica que se pueda reducir a éstas. 6.1. Área del Paralelogramo. D
C
Sea ABDC un paralelogramo. Sabemos que su área es el producto de su base por su altura y
h
tomemos como base = AB
α
A
y
como
(
h = AC · sen α donde α = ang AB, AC
B
altura
)
Por la definición de producto vectorial A = AB x AC 6.2. Área del Triángulo. Dado un triángulo Luego A =
ABC, su área es la mitad de la del paralelogramo ABCD.
1 AB x AC 2
7. VOLUMENES. 7.1. Volumen del paralelepipedo.
n
Consideremos el paralelepípedo determinado por 3 aristas concurrentes en un vértice AB, AC, AD .
D h
h
Admitimos que su volumen es el área de la base por la altura.
C A
B
A. base = AB x AC
r La altura h es la distancia de D al plano ABC y dado que n = AB x AC es un vector normal a dicho plano. h = d (D, plano ABC ) =
(
AD· AB x AC AB x AC
)
de donde
13/14
V=
(
AD· AB x AC AB x AC
)
[
]
(
· AB x AC = AD, AB, AC = det AB, AC , AD
)
7.2. Volumen de un Tetraedro. El tetraedro ABCD es una pirámide
D
V=
h
Abase x h 3
C A
Abase =
B h = d (D, plano ABC ) =
de donde, trivialmente V =
1 det AB, AC, AD 6
(
(
AD· AB x AC
AB x AC 2
)
AB x AC
)
Bibliografía Recomendada. Curso de Álgebra y Geometría. Aut. Juan de Burgos. Ed. Alambra Universidad. Álgebra Lineal. Aut. F. Puerta. Ed. Univ. Politécnica de Barcelona. Matemáticas COU teoría, tomo 1. Aut.: Vizmanos-Anzola. Matemáticas COU. Aut.: J. García - S. Rellicer. Ed. Marfil. En general cualquier texto del antiguo COU
14/14
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 54
LAS CÓNICAS COMO SECCIÓNES PLANAS DE UNA SUPERFICIE CÓNICA. ESTUDIO ANALÍTICO. PRESENCIA EN LA NATURALEZA, EN EL ARTE Y EN LA TÉCNICA. 1. Las cónicas como secciones planas de una superficie cónica. 1.1. Focos, directrices y eje focal. 1.2. Razón de distancias de un punto de la cónica a un foco y a una directriz. 1.3. Nueva definición métrica de las cónicas. 1.4. Teorema de Dandelin. Tercera definición de elipse o hipérbola. 1.5. Secciones del cilindro de resolución. Eje menor de la elipse. 1.6. La excentricidad en función del eje focal y la distancia focal 1.7. Cónicas degeneradas. 2. Estudio analítico. 2.1. Ecuación focal de las cónicas. 2.2. Ecuación cartesiana de la elipse y de la hipérbola. 2.2.1. Circunferencia 2.2.2. Hipérbola equilátera. 2.3. Ecuación cartesiana de la parábola. 2.4. Ecuación general de las cónicas. 2.5. Clasificación de las cónicas. Asíntotas. 2.6. Ecuación reducida de las cónicas (elipse e hipérbola). 2.7. Determinación de los ejes. 2.7.1. Ejes de una cónica. 2.8. Ecuación reducida de la parábola. 3. Presencia en la Naturaleza, la Técnica y el Arte. 3.1. Presencia en la Naturaleza. 3.2. Presencia en la Técnica. 3.3. Presencia en el Arte. Bibliografía Recomendada.
1/20
TEMA 54
LAS CÓNICAS COMO SECCIÓNES PLANAS DE UNA SUPERFICIE CÓNICA. ESTUDIO ANALÍTICO. PRESENCIA EN LA NATURALEZA, EN EL ARTE Y EN LA TÉCNICA. 1. LAS CÓNICAS COMO SECCIONES PLANAS DE UNA SUPERFICIE CÓNICA. Siguiendo la tradición dórica antigua, definiremos las cónicas como secciones producidas en una superficie cónica de resolución por un plano que no pase por el vértice. De ahí su nombre. Si el plano secante corta a todas las generatrices de la superficie llamaremos a la sección elipse. Si es paralelo a una sola generatriz, la curva tendrá un punto impropio y la llamaremos parábola. Si es paralelo a dos generatrices, tendrá dos puntos impropios y se llama hipérbola. Como el plano paralelo por el vértice solo puede contener, a lo sumo dos generatrices del cono, esto son todos los casos posibles.
Si α es el ángulo de las generatrices con el eje y β el ángulo de este con el plano de la sección, podemos caracterizar la naturaleza de la sección según sea α < β (elipse) α = β (parábola) o α > β (hipérbola). Si el plano de la sección es perpendicular al eje ( β =90º) la sección es una circunferencia. Por tanto la circunferencia es un caso perpendicular de la elipse. En nuestro estudio no trataremos este caso, visto en temas anteriores. Llamaremos puntos interiores (exteriores) los que se proyectan desde el vértice según rayos interiores (exteriores) al espacio cónico encerrado por la superficie. De aquí se deduce que toda recta que pase por un punto interior a una cónica tiene con ésta dos puntos comunes (propios o impropios), por tener el plano que le proyecta dos generatrices comunes con la superficie cónica.
2/20
1.1. Focos, directrices y eje focal. En cualquiera de los tres casos, tracemos por el eje del cono el plano σ perpend icular al plano π que contiene la cónica. El plano σ será el plano de simetría del cono y de π , y por tanto, de la cónica. Sean g y g´ las dos generatrices contenidas en dicho plano y e la recta de intersección de σ con π . Tracemos en el plano σ las dos circunferencias inferiores al ángulo gg´ (o a un opuesto por el vértice) tangentes a sus lados y a la recta e.
Sean F y F´ los puntos de contacto con e. Estas circunferencias se reducen a una sola recta e que es paralela a g o g´ (parábola) y por tanto, en tal caso no hay mas que un punto F. Los puntos F y F´ se llaman focos de la cónica. Si hacemos girar las circunferencias obtenidas alrededor del eje del cono se enge ndran esferas que son tangentes a la superficie cónica ( a lo largo de sendas circunferencias c y c´, situadas en planos perpendiculares al eje) y también tangentes al plano π en F o F´ respectivamente, puesto que la distancia del centro O(O´) al plano π es la perpendicular OF(OF´) igual al radio. Se llaman focos de una sección cónica a los puntos de contacto de un plano con las esferas inscritas en el cono y tangentes al plano de la sección. La intersección d (d´) del plano de la circunferencia de contacto con el plano de la cónica se llama directriz de éste correspondiente al foco F(F´). La parábola no tiene mas que un foco y una directriz. Se llama eje focal a la recta FF´ que contiene a los focos. Esta recta e es eje de simetría de la cónica (por ser intersección de un plano con el plano σ de simetría). Es, por tanto, perpendicular a las directrices. Los puntos A (A´) de la cónica situadas en el eje se llaman vértices de la cónica. La parábola solo tiene uno. Los segmentos PF(PF´) que unen un punto P cualquiera de la cónica con los focos, se llaman radios vectores del punto P.
3/20
1.2. Razón de distancias de un punto de la cónica a un foco y a una directriz. En virtud de las definiciones anteriores resulta que el radio vector que une un punto cualquiera P de la sección con un foco F, es igual al segmento PM de generatriz que pase por P y la circunferencia c. PF=PM, puesto que ambos son segmentos de rectas tangentes por P a una esfera. Ahora bien, PM forma constantemente el mismo ángulo α con el eje del cono, y el segmento de perpendicular PR de P a la directriz es paralelo al eje focal e, y forma con el eje del cono el ángulo constante β . Pero las proyecciones de PM y PR sobre el eje del cono son iguales por estar R y M en un mismo plano normal al eje, es decir, PM ⋅ cos α = PR ⋅ cos β . Por tanto: PF PM cos β = = = ε (constante) PR PR cos α y podemos enunciar: La razón de distancias de un punto de una cónica a un foco y a una directriz es la misma para todos los puntos. Esta es una constante ε que se llama excentricidad y es igual a la que existe entre los cosenos de los ángulos que forman con el eje el plano de la sección y las generatrices rectilíneas de la superficie. Según α < β , α = β o α > β , es decir según se trata de una elipse, parábola o hipérbola, se tendrá ε <1, ε =1 o ε >1.
1.3. Nueva definición métrica de las cónicas. Recíprocamente, todo lugar geométrico de puntos de un plano cuya razón de distancias a un punto fijo F y a una recta fija d es constante, ε , es cónica. Sea FD el segmento de perpendicular de F a d y sea A el punto del que cumple la condición: FA = ε. FD Tracemos una esfera arbitraria tangente en F al plano π del lugar, y en el plano diametral por A tracemos la tangente AM. El cono circunscrito a dicha esfera a lo largo de su sección por el plano MD (impuesta esta sección no diametral, en cuyo caso variaremos la esfera), será cortado por el plano π según una cónica cuyos puntos, entre los que esta A, verifican la condición del enunciado.
4/20
Y son los únicos puntos que le verifican, pues si P´, por ejemplo, es un punto int erior y trazamos por P´ la paralela a d, la distancia de F a uno de los puntos P de intersección verificare FP´
Elipse:
PF+PF´=PM+PN=MN=HJ
Hipérbola:
PF´-PF=PN-PM=MN=HJ
5/20
Pero en el caso de la elipse, HJ es la distancia entre los puntos de contacto de dos circunferencias inscrita y exinscrita al triángulo AVA´, cuya longitud es igual al lado AA´. En la hipérbola, el triángulo VAA´ permite obtener: (p=semiperímetro): A´H=p-AA´ A´J=p HJ=A´J-A´H=AA´ Luego los radios vectores de una elipse tienen, suma constante, los de una hipérbola, tienen diferencia constante, en valor absoluto. En ambos casos esta longitud constante es la longitud del eje focal, entendiendo por tal la distancia entre los vértices A y A´ de la cónica situada en él. Se le suele designar por 2a, mientras que la distancia FF´ se designa por 2c. Recíprocamente: el lugar geométrico de puntos P de un plano π cuya suma (diferencia) de distancias a dos puntos fijos F y F´ es una longitud 2a constante, es una elipse (hipérbola) cuyos focos son F y F´. En efecto: colocadas A y A´ simétricamente respecto el punto medio de FF´, tales que AA´=2a, A y A´ pertenecen al lugar, puesto que AF+AF´=A´F´+A´F=2a Tracemos ahora una esfera arbitraria, tangente al plano π en F y en el plano diametral que contiene A y A´, dos tangentes AV y A´V. El cono circunscrito a dicha esfera por el punto V de intersección (se suponen secantes, pues en caso contrario variaremos la dimensión de la esfera), corta al plano π según una cónica cuyos puntos, entre los que se hallan A y A´, cumplen la condición del enunciado. Y son los únicos puntos que la cumplen, pues todos los puntos P´(P´´) situados en el interior (prolongación) de un radio vector cualquiera PF verifican: P´ F´< PF´+ P´ P´´F´> PF´− PP´´
P´F P´F´+ P´F < PF´+ PF = 2a y sumando tenemos P´´F P´´F´+ P´´F > PF´+ PF = 2a
Es decir, la suma de distancias de todo punto interior (exterior) a la elipse a sus focos es menor (mayor) que el eje focal. Análogamente se prueba que la diferencia de distancias de todo punto interior (exterior) a la hipérbola a sus focos es mayor (menor) que la longitud del eje focal. En resumen, podemos dar una tercera definición de elipse e hipérbola, equivalente a las anteriores: Elipse (hipérbola) es el lugar geométrico de puntos cuya suma (diferencia) de distancias a dos puntos fijos (focos) es constante. Esta definición junto a la anterior de parábola son las definiciones de donde se suele partir en las exposiciones elementales. 6/20
1.5. Secciones del cilindro de resolución. Eje menor de la elipse. La sección producida en una superficie cilíndrica por una plano π oblicuo al eje es una elipse. En efecto, definiendo las esferas tangentes al cilindro y al plano de la sección, si F´ y F´ son los puntos de contacto de las mismas, P es un punto cualquiera de la sección y MN el segmento de generatriz que pasa por P y limitado por las circunferencias de tangencia respectivas, se tiene: PF+PF´=PM+PN=MN
(constante)
lo que demuestra que la sección es elíptica. También se puede probar, por la constancia de la razón: PM PR siendo PR la distancia de P a la recta intersección de π con el pleno de la circunferencia de contacto, de donde resulta que esta recta es directriz. El plano diametral del cilindro, perpendicular a π , es plano de simetría de la elipse y una intersección con π será el eje de simetría AA´. El diámetro perpendicular a dicho eje por el punto medio O de AA´. Será asimismo eje de simetría del cilindro y de π , y por tanto, de la elipse. El segmento BB´ limitado por sus intersecciones con la elipse se llama eje menor y es igual al diámetro del cilindro. Se le designa por 2b y sus extremos B y B´ se llaman también vértices de la elipse. 1.6. La excentricidad en función del eje focal y la distancia focal. En la elipse y en la hipérbola la excentricidad es igual a la razón: FF´ c = AA´ a entre la distancia focal, 2c, y la distancia AA´=2a entre los vértices del eje focal. En efecto, trazando por V la perpend icular VL al eje del cono en el plano de simetría σ (normal al de la sección) tendremos: ε=
cos β sen β´ VA = = cos α senα´ LA
7/20
y por una propiedad de las bisectrices interiores y exteriores de un triángulo, se verifica (restando o sumando términos en proporción según ser elipse o hipérbola): ε=
VA VA´ VA´±VA = = LA LA´ AA´
pero VA´-VA=FF´ (elipse) y VA´+VA=FF´ (hipérbola). Luego
ε=
FF´ AA´
en cualquier caso.
1.7. Cónica degeneradas. Si en la definición de cónica como sección de un cono omitimos la restricción de que el plano sección no pase por el vértice y consideremos el cilindro como un cono (de vértice impropio), obtenemos, además de la elipse, hipérbola y parábola, las diferentes clases de cónicas, llamadas degeneradas: Dos rectas concurrentes (I) Dos rectas paralelas (II) Dos rectas confundidas en una (III y IV) Dos rectas imaginarias con un punto propio común (V) Dos rectas imaginarias con un punto impropio común (VI) 2. ESTUDIO ANALÍTICO Consideremos unos ejes cartesianos rectángulos Ox, Oy coincidentes con los ejes AA´ y BB´ de la elipse o de la hipérbola.
Los dos radios vectores r1 , r2 de cada punto P son lados de un triángulo PFF´ cuya diferencia de cuadrados se expresa fácilmente mediante el tercer lado FF´=2c y la proyección x de la mediana OP sobre el. Así tendremos:
8/20
Elipse
Hipérbola
r2 2 − r1 2 = 4cx
r2 2 − r1 2 = 4cx
r2 + r1 = 2a
r2 − r1 = 2a
de donde: r2 − r1 =
2c x a
r2 + r1 =
2c x a
Conocidas r2 + r1 y r2 − r1 se deduce por suma y resta respectivamente: c x = a + ε. x a c r1 = a − x = a − ε.x a
c x = a + ε. x a c r1 = −a + x = −a + ε.x a
r2 = a +
r2 = a +
En la parábola, tomando como eje x el de la parábola y como eje y la tangente en el vértice y llamando p a la distancia del foco a la directriz resulta r=DP´, luego: r = x+
P 2
2.1. Ecuación focal de las cónicas. Llamando θ al ángulo que forma el radio r1 con FA se tiene: Elipse
Hipérbola
r1 cosθ = x − c
r1 cosθ = c − x
y eliminando x entre estas ecuaciones y las respectivas expresiones del radio vector, para lo cual basta multiplicarlas por ε y sumarlas a las anteriores, y teniendo en cuenta que: Elipse
Hipérbola
a 2 = b2 + c 2
c2 = b2 + a2
tenemos: r1 = a − ε.x r1ε cos θ = ε. x − ε.c
r1 = −a + ε.x r1ε cos θ = ε.c − ε.x
luego:
9/20
a 2 − c2 b2 r1 (1 + ε cos θ ) = a − ε.c = = a a y llamando p =
c 2 − a2 b2 r1 (1 + ε cos θ ) = ε.c − a = = a a
b2 queda la ecuación valida para ambas cónicas: a P r= 1 + ε cos θ
que liga las dos coordenadas polares ( r ,θ ) del punto P respecto a un origen situado en el foco y un eje polar coincidente con la dirección del radio-vector mínimo. Esta ecuación vale también para la parábola pues: r cosθ =
P −x 2
y como en
r cosθ =
r (1 + ε cosθ ) = P
luego
P +x 2 r=
resulta: P 1 + cos θ
2.2. Ecuación cartesiana de la elipse y la hipérbola. Volviendo a los ejes cartesianos coincidentes con los de la cónica, tenemos: r1 2 = ( x − c) 2 + y 2 y sustituyendo r1 por a − ε. x ó − a + ε.x (respectivamente) tenemos: a2 +
c2 2 x − 2cx = x 2 + c 2 − 2cx + y 2 a2 2
Pero en la elipse, el coeficiente de x es:
y en una hipérbola, el coeficiente de x 2 es:
luego
x2 +
c2 2 x + y 2 = a 2 − c2 a2
a2 − c 2 b 2 = 2 a2 a a2 − c 2 b2 = − a2 a2
luego dividiendo por b 2 resulta: Elipse x2 y2 + =1 a2 b 2
Hipérbola x2 y 2 − =1 a2 b2
(1)
que se llaman ecuaciones reducidas de dichas cónicas referidas a sus ejes.
10/20
(2)
Recíprocamente, toda curva de ecuación (1) (supuesto a>b), pues en caso contrario bastaría con cambiar los ejes, puede escribirse, poniendo c 2 = a 2 − b 2 en la forma: x2 +
a2 +
o equivalentes, es decir:
c2 a
2
x2 + y2 = a2 − c2
c2 2 x ± 2cx = x 2 + c 2 ± 2cx + y 2 2 a
o sea:
2
a ± c x = ( x ± c) 2 + y 2 a Pero con el signo + el segundo miembro es el cuadrado de la distancia r2 del punto P(x,y) al punto F´(-c,0) y con el signo – es el cuadrado de la distancia r1 del punto P(x,y) al punto F(c,0), de donde: c x = r2 a c a − x = r1 a
a+
2a = r1 + r2
⇒
que expresa que todo punto del lugar cumple la definición de elipse. Análogamente ocurre para la hipérbola. 2.2.1. Circunferencia. Si en una elipse es a=b entonces c=0, los focos se confunden (excentricidad nula) y la elipse se convierte en una circunferencia de ecuación: x2 + y2 = a2 2.2.2. Hipérbola equilátera. Si a=b en la hipérbola resulta c=a 2 . Las asíntotas, que son las rectas y = ±
b x, a
son ahora y = ± x y por tanto, perpendiculares. x 2 − y 2 = a2
La ecuación queda
2.3. Ecuación cartesiana de la parábola. Respecto a unos ejes cartesianos coincidentes con el eje de la parábola y la tangente en el vértice, se tiene:
11/20
2
x − P + y2 = r2 2 y como r = x +
P tenemos: 2 x2 +
P2 P2 − Px + y 2 = x 2 + + Px 4 4
o sea: y 2 = 2Px
(3)
llamada ecuación reducida de la parábola. Recíprocamente, toda ecuación de la forma (3) puede ponerse en la forma 2
x − P + y2 = x + P 2 2
2
P que traduce la condición de equidistancia del punto P(x,y) del lugar al punto F ,0 y 2 P a la recta x = − . 2 2.4. Ecuación general de las cónicas. Una cónica, en un sistema cartesiano ortonormal cualquiera, esta representado por una ecuación de 2º grado con dos variables: a11 x 2 + 2a12 xy + a22 y 2 + 2a13 x + 2 a23 y + a33 = 0 Usando la notación matricial dicha ecuación puede escribirse como:
(x
a11 y 1) a21 a 31
a12 a 22 a32
a13 x a 23 y = 0 a33 1
o sea
x ( x, y,1) ⋅ A ⋅ y = 0 1
siendo la matriz simétrica ( aij = a ji ) Para el estudio de la cónica es muy importante tener en cuenta el valor del determinante de dicha matriz, que se llama discriminante de la cónica. Si el discriminante es cero la ecuación de la cónica puede descomponerse en producto de dos factores de primer grado y la ecuación representara dos rectas. Estas rectas serán distintas cuando el rango de la matriz valga 2. Si el rango vale 1 la ecuación de la cónica es el cuadrado de la ecuación de una recta (recta doble).
12/20
Por tanto para que la ecuación general de 2º grado con dos variables represente una cónica no degenerada ha de ser A ≠ 0 . Si A = 0 decimos que la cónica es degenerada.
2.5. Clasificación de las cónicas. Asíntotas. Sabemos que la elipse no tiene puntos en el infinito, mientras que la parábola y la hipérbola si los tienen. Las tangentes a la hipérbola en los puntos infinitos se llaman asíntotas. Las ecuaciones de las asíntotas, por ser rectas, serán de la forma y=mx+n. Para hallarlas procederemos así: La intersección de la recta y =mx+n con la cónica se obtiene resolviendo el sistema: a11 x 2 + 2a12 xy + a22 y 2 + 2a13 x + 2 a23 y + a33 = 0 y = mx + n que proporciona: a11 x 2 + 2a12 ( mx + n) + a 22 ( mx + n ) 2 + 2a13 x + 2 a23 (mx + n) + a33 = 0
(4)
o sea: ( a11 + 2a12 m + a 22 m 2 ) x 2 + 2( a12 n + a 22 mn + a13 + a 23 m) x + (a 22 n 2 + 2 a23 n + a 33 ) = 0 dividiendo por x 2 : ( a11 + 2a12 m + a 22 m 2 ) + 2( a12 n + a22 mn + a13 + a 23 m)
1 1 + (a 22 n 2 + 2a 23 n + a33 ) 2 = 0 x x
cuando x → ∞ nos queda: a11 + 2 a12 m + a 22 m 2 = 0 ecuación de 2º grado en m que presenta 3 casos: 1)
a12 2 − a11 a 22 > 0 o sea
a11 a21
a12 >0 a 22
en este caso la ecuación tiene dos raíces reales. Hay dos valores reales de m, por lo que la cónica tiene dos asíntotas y es una hipérbola.
13/20
a12 2 − a11 a 22 < 0
2)
o sea
a11 a21
a12 <0 a 22
la ecuación no tiene raíces reales. No hay asíntotas y la cónica es una elipse. a12 2 − a11 a 22 = 0
3)
o sea
a11 a21
a12 =0 a 22
hay una raíz doble. Solo hay un punto en el infinito y la cónica es una parábola. En el caso de la hipérbola la ecuación a12 2 − a11 a 22 > 0 y por tanto: a11 + 2a12 m1 + a 22 m1 2 = 0 tiene dos raíces reales distintas m1 y m2 . Para hallar n sustituimos estos valores en la ecuación: a11 + 2a12 m1 + a 22 m12 = 0 luego en la ecuación (4) queda: 2( a12 n + a 22 m1 n + a13 + a 23 m1 ) + (a 22 n 2 + 2 a23 n + a 33 ) y haciendo x → ∞ queda:
1 =0 x
( a12 n + a22 m1 n + a13 + a 23 m1 ) = 0
ecuación que proporciona: n1 = −
a13 + a 23 m1 a12 + a 22 m1
y análogamente
n2 = −
a13 + a23 m2 a12 + a22 m2
En el caso de la parábola, resolviendo la ecuación: a11 + 2a12 m + a22 m 2 = 0 m=
− a12 a 22
o sea
tenemos: a12 + a 22 m = 0
Este valor de m nos da la dirección del punto del infinito de la parábola. Para hallar n1 hacemos: n1 = −
a13 + a 23 m1 a12 + a 22 m1
no finito al ser el denominador 0.
14/20
2.6. Ecuación reducida de las cónicas. La ecuación general de una cónica puede simplificarse trasladando el origen de coordenadas al centro de la cónica. Si las coordenadas del centro son (h,k), las fórmulas de transformación son: x=X+h y=Y+k y la ecuación general se convierte ahora en: a11 ( X + h) 2 + 2a12 ( X + h)(Y + k ) + a 22 (Y + k ) 2 + 2a13 ( X + h) + 2a 23 (Y + k ) 2 + a 33 = 0 ordenando y desarrollando: a11 X 2 + 2a12 XY + a22 Y 2 + 2( a11 h + a12 k + a13 ) X + 2( a12 h + a 22 k + a23 )Y + ... 2
(5)
2
... + (a11 h + 2 a12 hk + a22 k + 2a13 h + 2a23 k + a33 ) = 0 si pretendemos que no queden términos lineales ha de ocurrir: a11h + a12 k + a13 = 0 a12 h + a 22 k + a 23 = 0 sistema que permite encontrar las coordenadas del centro: − a13 h=
a12
a11
− a 23 a 22 A = 31 a11 a12 A33 a12 a22
h=
− a13
a12 − a 23 A = 32 a11 a12 A33 a12 a 22
Los términos encerrados en el último paréntesis de (5) representan el valor numérico que toma la ecuación general de la cónica al sustituir x por h e y por k. Representando tal cosa por f(h,k) la ecuación (5) se convierte en: a11 X 2 + a12 XY + a 22 Y 2 + f ( h, k ) = 0
(6)
Puede comprobarse que: f (h , k ) =
A A33
con lo cual la formula (6) quede así: a11 X 2 + a12 XY + a 22 Y 2 +
A A33
=0
(7)
Hay que señalar que en la expresión de las coordenadas del centro ha de ser A33 ≠ 0 luego la parábola no tiene centro.
15/20
2.7. Determinación de los ejes de la cónica. La ecuación (9) puede escribirse así:
(x
a11 y 1) a21 0
a12 a 22 0
0 x 0 y = 0 A 1 A33
Si queremos que la cónica tenga por ejes de simetría los de coordenadas, su ecuación no cambiará al cambiar x por –x ni y por –y, luego ha de ser nulo el término XY. Por tanto en este caso la ecuación de la cónica seria de la forma: c1 x 2 + c 2 y 2 + c 3 = 0 o matricialmente: (x
c1 y 1) 0 0
0 c2 0
0 x 0 y = 0 c3 1
Para que los ejes de la cónica coincidan con los de simetría ha de producirse un giro de amplitud α mediante: x cos α − senα 0 x y = senα cos α 0 y 1 0 0 1 1
X = x cos α − ysen α o bien: Y = xsenα + y cos α y llamando T a esa matriz resulta T t = T −1
Entonces:
(x
(x
a11 a 21 0
a11 y 1) a21 0
a12 a 22 0
c1 y 1)T 0 0 t
a12 a22 0
0 c2 0
0 x 0 y = 0 A 1 A33
se convierte en
0 x 0 T y = 0 c 3 1
y por tanto:
0 c1 0 ⋅T = T 0 0 A A33 16/20
0 c2 0
0 0 c 3
o bien:
a11 cos α + a12 sen α = c1 cos α a 21 cos α + a 22 senα = c1 senα − a11 sen α + a12 cos α = −c2 sen α − a 21 sen α + a22 cos α = c 2 cos α A
= c3
A33
Este ultimo nos da el valor de c3 y las anteriores conducen a: a11 − c1 + a12 sen α = 0 a 21 cos α + (a 22 − c2 ) sen α = 0 y para que este sistema de ecuaciones homogéneas sea compatible y con soluciones no nulas, ha de ser: a11 − c1 a 21
a12 =0 a22 − c2
( a12 = a 21 )
y desarrollando c1 2 − ( a11 + a22 )c1 + ( a11 a 22 − a12 2 ) = 0 queda
y como A33 = a11 a22 − a12
2
2
c1 − ( a11 + a22 ) c1 + A33 = 0
Las otras dos ecuaciones conducen a una expresión idéntica, sustituyendo c1 por c 2 : 2
c 2 − (a11 + a 22 ) c 2 + A33 = 0 Una vez calculadas los valores de c1 , c2 , c3 se sustituyen en la ecuación c1 x 2 + c 2 y 2 + c 3 = 0 quedando:
c1 x 2 + c 2 y 2 +
−
x2 A c1 A33
+ −
A A33
y2 A
=0
o bien:
=1
c 2 A33
y comparando esta ecuación con la de una cónica referida a sus ejes observamos que:
17/20
x2 y2 ± =1 a2 b 2 luego:
a= −
y obtendremos una elipse si:
A c1 A33 −
b= −
A c1 A33
>0
y
A c 2 A33 −
A c2 A33
>0
Si ambos valores son negativos, a y b serian imaginarios y tendríamos una elipse imaginaria. Si uno es negativo obviamente tenemos una hipérbola. Si alguno de los c1 y c2 es nulo, no sirve este proceso y lo haremos mas adelante. 2.7.1. Ejes de una cónica. Una vez calculados c1 y c 2 , podemos obtener el ángulo que forman los ejes de la cónica con los ejes cartesianos: tgα =
c1 − a11 a12
A A y puesto que 31 , 32 son las coordenadas del centro, como la ecuación de la recta A33 A33 que pasa por (x 0 , y0 ) con pendiente tgα es y − y 0 = tgα( x − x 0 ) , las ecuaciones de los ejes son: A c − a11 A y − 32 = 1 ( x − 31 ) A33 a12 A33 A a12 A y − 32 = ( x − 31 ) A33 a11 − c1 A33 en el caso de cónica con centro (elipse o hipérbola) 2.8. Ecuación reducida de la parábola. El camino seguido anteriormente no sirve para la parábola, al no tener centro. Sin embargo, se puede seguir un camino análogo haciendo girar primero los ejes cartesianos hasta situar el eje de abscisas paralelo al de la parábola. Después se traslada el centro de coordenadas al vértice y su ecuación es, entonces, de la forma:
18/20
y 2 = 2 px como se vio anteriormente. El valor de P, siguiendo este proceso nos da: P=±
− A (a11 + a 22 ) 2
El signo de P depende del sentido que se tome como positivo en el eje OX. 3. PRESENCIA EN LA NATURALEZA, EL ARTE Y LA TÉCNICA. 3.1. Presencia en la Naturaleza. Son innumerables los puntos de encuentro de las cónicas y la Naturaleza. Las trayectorias de los planetas alrededor del sol, de los satélites alrededor de los planetas, muestran órbitas elípticas. Se encuentran trayectorias de tipo parabólico e hiperbólico en las trayectorias de ciertos cometas y en los movimientos de cuerpos en los campos de fuerzas, como el campo gravitatorio. Por otra parte, la teoría atómica explica, en algunos modelos, hoy superados, que las órbitas electrónicas pueden presentar excentricidades por ser elípticas. 3.2. Presencia en la Técnica. Como se sabe, una de las aplicaciones militares mas importantes de las cónicas se produce al descubrir el lanzamiento de cañones y misiles, que es de tipo parabólico. Es importante también la utilización de espejos de tipo parabólico, así como antenas de tipo parabólico, que utilizan la propiedad de que todos los rayos paralelos al eje del espejo o de las antenas, pasen, al reflejarse, por el foco. Esta misma propiedad se utiliza en los faros de los coches. 3.3. Presencia en el Arte. La utilización de las cónicas en el arte está muy generalizadas. Desde la construcción de edificios con planta elíptica, que utilizan la propiedad de que si se emite un sonido en uno de los focos, es oído por otra persona situada en el otro foco, hasta la construcción de puertas con aspecto de segmento de parábola, o de pue ntes con ojos parabólicos.
19/20
BIBLIOGRAFÍA RECOMENDADA. Algebra. L.Thomas y M.E.Ríos. Santander. Geometría Analítica. L.Crusat. Editorial Bosch Curso de Geometría Métrica. P.Puig Adam. Ed.Biblioteca Matemática. Geometría y Cónicas. Grupo Cero. ICE. Universidad de Valencia. Geometría Analítica, J.Rey Pastor, L.A.Santaló y M.Balanzat. Ed.Kapelusz.. Buenos Aires. (Argentina) Geometría Analítica. Marcos de Lanuza. Editorial Gredos.
20/20
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 55 LA GEOMETRÍA FRACTAL. NOCIONES BÁSICAS. 1. Introducción a la Geometría Fractal. 1.1. Una Geometría para las Formas Irregulares. 1.2. Geometría Fractal Versus Geometría Diferenciable. 1.3. Geometría Fractal y Teoría Geométrica de la Medida. 2. Elementos Geométricos Especiales. 2.1. El Conjunto de Cantor. 2.2. Curvas de Peano y de Hilbert. 2.3. Curva de Koch. 2.4. Funciones de Weierstrass. 3. La Dimensión en la Geometría Fractal. 3.1. Dimensiones Fraccionarias. Dimensión de Homotecia. 3.2. Dimensión por Recuento de Cajas. 4. Geometría Fractal en la Naturaleza y las Ciencias. 4.1. Fronteras. 4.2. Árboles. 4.3. Movimiento Browniano. Bibliografía Recomendada.
1/18
TEMA 55 LA GEOMETRÍA FRACTAL. NOCIONES BÁSICAS. 1. INTRODUCCIÓN A LA GEOMETRÍA FRACTAL. 1.1. Una Geometría para las Formas Irregulares. Hasta ahora la matemática y, más concretamente, la geometría ha explorado el mundo físico casi siempre simplificando la realidad compleja que él mismo encierra en sus leyes y en sus formas. Las dos simplificaciones más habituales se refieren por una parte a la linealización de las leyes (aproximación lineal de una ley que no lo es) y por otra, la regularización de las formas geométricas (se suponen suaves o lisas tanto líneas como superficies que en rigor no lo son). Muy recientemente se ha descubierto cómo procesos regidos por leyes estrictamente deterministas (p.e., la temperatura en un punto de la Tierra) dan lugar a futuros inciertos e impredecibles de los que lo único que podemos saber es que “vagan” casi aleatoriamente por regiones geométricas de estructura muy irregular. Son los llamados Procesos Caóticos de tipo determinista. Si a esto unimos los caprichos del azar, es decir, la existencia de procesos puramente aleatorios, el resultado es una naturaleza con formas muy irregulares y caprichosas. Pero la Matemática, una vez más, no se ha dejado vencer y asustar por este nuevo reto y, aunque en primera instancia utiliza para éstos nombres catastrofistas (irracional, caos, etc.), del mismo modo que racionalizó por medio de Dedekind el concepto de número irracional, ahora pretende explorar y encontrar orden y regularidades en formas geométricas aparentemente caóticas. Podemos afirmar pues que acaba de nacer la Geometría Fractal. El término fractal fue acuñado recientemente por Mandelbrot para designar ciertos objetos geométricos de estructura irregular que él constató por primera vez, y que estaban presentes en muchos comportamientos y formas de la naturaleza, aunque ya habían sido tratados desde finales del s. XIX desde el punto de vista matemático dentro de lo que se conoce como Teoría Geométrica de la Medida. Ha sido, por una parte, el descubrimiento de Mandelbrot y, por otra, el descubrimiento del caos determinista, lo que ha provocado el enorme desarrollo y la importancia que en poco tiempo ha adquirido esta geometría. Hay muchos procesos en la naturaleza que conducen a formas irregulares. Pero podemos destacar tres sumamente importantes, en los que habitualmente está el origen de la irregularidad. Pasamos a describirlos.
2/18
a) La Separación de Fronteras. La frontera de separación de dos medios suele venir caracterizada por el hecho de que miradas a cualquier escala, se observan incursiones de un medio en el otro. Y cuando aumentamos el grado de resolución de la medida de la longitud o del área, éstas aumentan indefinidamente. Así pues, la modelización de estas fronteras, cuando esto se tiene en cuenta, ha de hacerse con un tipo especial de curvas (o superficies) con la curiosa propiedad de que la longitud (o el área) de las mismas es infinita, hechos que nunca ocurren con curvas o superficies suaves (diferenciables en todos los puntos). Como ejemplos de uso de este tipo de modelización tenemos que es utilizada para el estudio de costas, accidentes geográficos, accidentes geológicos, superficies de fractura, superficies de separación de fluidos, etc. b) Los Procesos de Ramificación. Un proceso de ramificación se puede explicar esquemáticamente a partir de la figura siguiente: Podemos ver que el segmento inicial se ve reemplazado, por ejemplo, por otros tres tales que la suma de sus longitudes resulta mayor que la del original. Es conocido que la naturaleza utiliza procesos similares en muchas ocasiones y a todas las escalas, resultando estructuras ramificadas de las que anteriormente la geometría clásica no se había ocupado. Como ejemplos de este tipo de estructuras tenemos los polímeros ramificados, estructuras coralinas, etc. c) La Formación de la Porosidad. Si queremos modelizar fielmente la presencia de “islas” (poros) de todos los tamaños, de un medio en el seno de otro, esto ha de hacerse con objetos geométricos nuevos que, a todas las escalas, tengan “islas” que no pertenezcan a dicho objeto. Puede resultar así un sólido sin volumen, con otras propiedades que, en principio, choquen con la intuición. Por ejemplo, puede pensarse en la geometría de una nube, una esponja ,etc. El estudio de este nuevo tipo de objetos geométricos tiene aspectos y enfoques totalmente nuevos y diferenciados respecto a la geometría tradicional, que hacen de la geometría fractal una nueva geometría.
3/18
1.2. Geometría Fractal versus Geometría Diferenciable. La característica más peculiar de la geometría fractal consiste en abordar el estudio de formas geométricas no diferenciables o quebradas, a cualquier escala que se miren. Este hecho, tal vez, queda oculto por la forma en que usualmente se contrapone geometría fractal a geometría euclídea, cuando sería mucho más preciso establecer la división entre geometría fractal y geometría diferenciable. La geometría diferenciable estudia las formas geométricas que miradas en “pequeño” son lisas. En el caso de una curva, por ejemplo, no diferenciabilidad significa que, localmente, se comporta como una recta y, aunque las formas que estudia la geometría euclídea pueden ser diferenciables, la clasificación geometría euclídea/no euclídea no coincide con la clasificación geometría diferenciable/no diferenciable. Cuando se estudia un fenómeno real, el mismo contexto establece habitualmente el alcance del término “en pequeño”. El objeto estudiado tendrá medidas de determinada magnitud, y los intrumentos de medición o nuestro propio interés limitarán los mínimos relevantes de dichas medidas. El modelo diferenciable es válido siempre que al estudiar muestro objeto con cierto grado de aproximación mayor que ese mínimo, su comportamiento local a una escala de tal orden sea liso. Debido a que observador dotado de una visión normal no puede apreciar las rugosidades en la superficie lunar, también estará dispuesto a admitir que una esfera es un modelo geométrico adecuado para ella. Sin embargo, un selenita que habitase en un cráter de la Luna podría oponer serias objeciones a tal comparación. Por tanto, la utilidad de cualquier modelo está en relación directa con la oscilación entre los valores mínimo y máximo considerados en las magnitudes que se estudian. La evidencia experimental indica que la regularidad aceptada por la geometría diferenciable es excesivamente fuerte para poderse adaptar satisfactoriamente a la mayoría de las formas reales. La geometría fractal ofrece un modelo alternativo que busca una regularidad en las relaciones entre un objeto y sus partes a diferentes escalas. Esta forma de regularidad no precisa el encorsetamiento del objeto en otras formas geométricas que, aunque elementales, no dejan de ser externas al mismo. Busca la lógica interna del propio objeto mediante relaciones intrínsecas entre sus elementos constitutivos cuando éstos se examinan a diferentes escalas. De esta forma no se pierden la perspectiva ni del objeto global ni del aspecto del mismo en cada escala de observación. La geometría fractal busca y estudia los aspectos geométricos que son invariantes con el cambio de escala. Cuando se explora la lógica interna a que nos referíamos antes, puede construirse un modelo matemático del objeto expresable como el límite de un proceso geométrico iterativo que, con mayor o menor facilidad, se repite indefinidamente. Dicho proceso iterativo, que resume la organización del objeto a sus diferentes escalas y lo caracteriza, puede provocar en cada iteración una ruptura (fractura) de la “suavidad” que conlleva la ausencia de diferenciabilidad del objeto límite. De esta forma, la geometría fractal, además de no perder la perspectiva del objeto en cada escala
4/18
de observación, realiza el análisis local del objeto sin la necesidad de suavidad del mismo, hecho que requería la geometría diferencial para aplicar sus técnicas. 1.3. Geometría Fractal y Teoría Geométrica de la Medida. Actualmente, lo que se entiende por geometría fractal es una parcela de las matemáticas cuyos límites reales no están todavía del todo claros. Históricamente, sus orígenes se remontan a finales del siglo XIX y principios del siglo XX, con la aparición en el campo de las matemáticas de conjuntos geométricos de propiedades aparentemente paradójicas. En dichos conjuntos (curvas de Peano y Koch, conjunto de Cantor, etc.) parecía existir una discordancia entre su tamaño real y su configuración especial como conjunto de puntos (curvas con área o con longitud infinita entre dos de sus puntos, etc.) Los ejemplos plantearon la necesidad de establecer una medida adecuada de su tamaño, por una parte, y por otra el estudio de su forma o propiedades geométricas. De esta forma, se inició una nueva parcela del análisis matemático denominada Teoría Geométrica de la Medida, que tuvo como punto de partida la definición del concepto de Dimensión de Hausdorff. Este concepto establecía da distinción del tamaño de los conjuntos paradójicos y sentó sus bases con los trabajos de Besicovitch, aproximadamente sobre 1920 a 1930. En ellos, con singular ingenio, estudió las propiedades geométricas de los conjuntos planos que él llamó Irregulares: eran el arquetipo de lo que hoy llamamos fractales, y sus trabajos fueron los cimientos de la geometría fractal. A partir de entonces, matemáticos como Federer, Marstrand, Davies Falconer, etc, continúan el estudio de este tipo de conjuntos. En 1981, Hutchinson publica un trabajo donde desarrolla un concepto básico de la geometría fractal: el de conjunto autosemejante. En 1977, Mandelbrot, en su obra “La Geometría Fractal de la Naturaleza”, además de acuñar el término fractal, definede una idea que se convertiría con el tiempo en la razón del crecimiento exponencial de las aplicaciones de ésta y de la actual popularización del término: las formas de la naturaleza son fractales y múltiples procesos de la misma se rigen por comportamientos fractales. El último punto clave en el desarrollo de la geometría fractal ha sido el descubrimiento del Caos Determinista y el impacto del ordenador. En sistemas dinámicos, el valor x0 de un estado presente se va transformando con el tiempo, sometido a una ley fija F (función) y va tomando los valores sucesivos x0
x1 =F(x0 )
x2 =F(x1 )
........
xn =F(xn-1)
.........
que, bajo ciertas condiciones, se van acercando a un conjunto ha llamado Atractor del sistema. A veces, puede suceder que dicho atractor tenga una estructura fractal (atractor extraño), hecho que suele ir unido a la circunstancia de que dos presentes próximos, x0 y x’0 , pueden dar lugar a futuros que se acercan y se alejan con el tiempo de forma casi aleatoria, de los cuales, lo único que se sabe es que están, o se acercan con el tiempo, al atractor extraño. Se tiene así una situación que aun siendo determinista es, de hecho, impredecible: es el llamado caos determinista.
5/18
Por otra parte, la exploración de los futuros x1 , x2 , ..., xn , ... mediante iteraciones de la función F, hoy en día es una tarea realizada por el ordenador, que ha supuesto una ayuda indispensable para aproximarse (sólo) a la geometría de esos atractores extraños. 2. ELEMENTOS GEOMÉTRICOS ESPECIALES. A principios del siglo pasado, a la teoría de la medida le surgieron una serie de problemas derivados de la aparición de conjuntos con propiedades no concordantes con su estructura geométrica (topológica). Con dichos conjuntos aparecían los primeros ejemplos de lo que llamamos fractales. Sus paradójicas y sorprendentes propiedades fueron uno de los sustos que la matemática, en toda su historia, ha padecido. Se llegaban a resultados capaces de violentar el sentido común y que obligaban a los matemáticos a prestar atención a los fundamentos de la misma. En lo que se refiere al problema de evaluación del tamaño de los conjuntos geométricos, tales ejemplos ponen de manifiesto la insuficiencia de la medida de Lebesgue y levantan de nuevo, con más fuerza, los problemas de la teoría de la medida. 2.1. El Conjunto de Cantor. Es un ejemplo clásico de conjunto no numerable con el mismo cardinal del continuo pero, a pesar de ello, con medida de Lebesgue unidimensional nula (longitud). Se construye de la siguiente forma: Partiendo del intervalo unidad E0 =[0,1], se divide dicho intervalo en tres partes iguales. Consideramos los dos intervalos cerrados de los extremos: 1 E11 = 0, 3
2 E12 = ,1 3
ambos de longitud 13 . Cada uno de estos intervalos se divide a su vez en tres intervalos iguales, prescindiendo de los intervalos centrales. Tenemos, por tanto, cuatro nuevos intervalos: 1 E 21 = 0, 9
2 1 E 22 = , 9 3
2 7 E 23 = , 3 9
8 E 24 = ,1 9
siendo cada uno de longitud 19 . Si continuamos indefinidamente este proceso, en el paso K-ésimo obtenemos 2k intervalos cerrados: Ekj
j:1, 2, ..., 2k 6/18
donde cada uno de ellos es de longitud 3-k. Para cada valor de k definimos: 2k
E = U Ekj j =1
Observemos que con los conjuntos Ek para k:1, 2, ... decreciente, es decir Ek+1 ⊂Ek ∀k
tenemos una sucesión
DEF El conjunto límite de este proceso ∞
C = I Ek k =1
recibe el nombre de Conjunto Ternario de Cantor. PROP El conjunto C de Cantor es no vacío y cerrado. Dem. En primer lugar, destaquemos que el conjunto de Cantor es No Vacío, pues en cada Ek están, por lo menos, los extremos de los 2k intervalos cuya intersección buscamos. Además, es Cerrado, por ser intersección de cerrados. PROP El conjunto C de Cantor es No Numerable. Dem. Cada punto de C se representa de forma única mediante a=
a1 a2 a 3 a + 2 + 3 + ... + nn + ... 3 3 3 3
donde ai toma los valores 0 ó 2 ∀i. Podemos, por tanto, escribirlo en base 3 de la forma: a = 0' a1 a 2 a 3 ...an ... Recíprocamente, cada expresión de este tipo corresponde a un punto de C. Supongamos que están todos en el siguiente cuadro (es decir, supongamos que es numerable): a 1 = 0' a11 a12 a13 ...a1n ... a 2 = 0' a12 a 22 a 32 ...an2 ... a 3 = 0' a13 a 32 a 33 ...a n3 ...
7/18
Entonces, formemos otro, de la forma b = 0' b1 b2 b3 ..bn ... con el criterio siguiente: Si a nn = 0 ⇒ bn = 2 Si a nn = 2 ⇒ b n = 0 El número b construido de esta manera no está en el cuadro anterior, y sin embargo, es de C. Luego C no es numerable. PROP El conjunto C tiene medida de Lebesgue unidimensional nula. Dem. Para cualquier etapa k, la familia de intervalos {Ekj} con j:1, 2, ..., 2k es un recubrimiento de C formado por intervalos disjuntos. Así tenemos: k 2k 2k 2 L' (C ) ≤ L' U E kj = ∑ L' (E kj ) = 2 k ·3 − k = 3 1 j =1 k
2 Puesto que la desigualdad es cierta ∀k y → 0 cuando k → ∞ , se obtiene 3 L’(C)=0 El conjunto de Cantor, además de las propiedades ya demostradas que le hacen contradictorio, tiene otras propiedades interesantes que dan idea de su estructura. PROP El conjunto C no contiene intervalos, es Infinitamente Poroso. Dem. En primer lugar, cada punto viene determinado por la sucesión de intervalos {Ekj} con j:1, 2, ..., 2k , formado en cada etapa k por el intervalo Ekj (1≤j≤2k ) que contiene al punto. El diámetro de dichos intervalos tiende a cero. De esta forma, cualquier intervalo de la forma (a,b) que contenga al punto x, es tal que existe un intervalo Ekj de la sucesión {Ekj} asociada al punto x tal que Ekj⊂(a,b). Ahora bien, los puntos del intervalo abierto central resultante de dividir Ekj en tres partes no son del conjunto C. Por tanto, el conjunto C no contiene intervalos, lo cual significa que es Infinitamente Poroso. 8/18
PROP Todo punto de C es límite de una sucesión de puntos de C. Dem. Cada punto x∈C es límite de la sucesión formada por los extremos de los intervalos Ekj de la sucesión {Ekj} asociada a dicho punto. 2.2. Curvas de Peano y Hilbert. En 1890, Peano construye una curva continua que pasa por todos los puntos del cuadrado unidad [0,1] x[0,1]. Era el primer ejemplo de una “curva que llena un espacio”. Años más tarde Hilbert, interesado también por este tipo de problemas, construye otra del mismo tipo, con una construcción geométrica más simple de descubrir. La curva de Hilbert se construye como sigue:
Dividimos el cuadrado unidad en cuatro cuadrados y unimos los centros de dichos cuadrados por segmentos, tal como se ve en la figura. Cada uno de los nuevos cuadrados se divide nuevamente en otros cuatro cuadrados, y conectamos sus centros comenzando siempre por el cuadrado inferior izquierdo y terminando en el cuadrado inferior derecho. Se continúa así indefinidamente, uniendo los centros de los cuadrados que resultan en cada etapa. La curva límite de tales poligonales “llena” el cuadrado unidad. En la figura siguiente tenemos las seis primeras iteraciones de este proceso infinito.
9/18
2.3. Curva de Koch. En 1904, el matemático sueco Koch construye la curva que hoy lleva su nombre, de la forma siguiente: se parte del segmento unidad [0,1] y se divide en tres partes, sustituyendo la parte central por los dos segmentos que junto con dicha parte formarían un triángulo equilátero. Se obtiene así una poligonal P1 de longitud 4 3 .
P0 P1
10/18
Cada uno de los cuatro segmentos que así quedan determinados vuelven a generar, mediante la misma operación, otra poligonal P2 , de longitud 169 . Se procede indefinidamente de esta manera, obteniendo en cada etapa k una k
4 poligonal Pk de longitud . En la 3 figura siguiente aparecen 5 iteraciones de este proceso.
La curva de Koch se define como la curva límite a que converge la sucesión Pk k 4 cuando k→∞. Se trata, por tanto, de una curva de longitud infinita, ya que → ∞. 3 Pero podemos decir más, la longitud de la parte de la curva comprendida entre dos puntos cualesquiera de la misma, también es infinita. 2.4. Funciones de Weierstrass. Weierstrass dio otro ejemplo de una curva con comportamiento análogo a las anteriores, pero definida de forma analítica, es decir, como grafo de una cierta función. La función de Weierstrass se define como: ∞
f ( x ) = ∑ λ( s − 2 ) i ·sen (λi x )
con 1 < s < 2
y λ<1
i =1
Dicha función es continua pero no diferenciable en ningún punto. 3. LA DIMENSIÓN EN LA GEOMETRÍA FRACTAL. 3.1. Dimensiones Fraccionarias. Dimensión de Homotecía. Vamos a construir un conjunto semejante al conjunto de Cantor, pero en este caso partiremos de un cuadrado cerrado (borde incluido) de lado 1, que llamaremos Q.
11/18
1 Tomemos en cada una de sus cuatro esquinas un cuadrado de lado r 0 < r < , de 2 forma que los cuadrados no se solapen entre sí. Llamemos Qi (1≤i≤4) a los cuatro 4
cuadrados y sea Ei = U Qi el conjunto formado por la unión de ellos. Se repite ahora la i =1
construcción a escala sobre cada uno de los cuadrados Qi, tomando en cada una de sus cuatro esquinas un cuadrado de lado r2 , a los que llamaremos Qij (1≤i,j≤4). Obtenemos así una colección de 16 cuadrados de lado r2 , a cuya unión llamaremos E2 . Repitiendo este proceso, llegamos a la etapa n donde nos encontramos con 4n cuadrados Qi1 i ... i 1 ≤ i1 , i 2 ,..., i n ≤ 4 2
n
cuya unión es el conjunto En . Definimos entonces el conjunto E como intersección de todos los En . ∞
E = I En n =1
Una vez definido el conjunto E, lo que nos interesa saber es cuál será su dimensión. Puesto que en cada una de las etapas, el conjunto En es unión de cuadrados, resulta tentador suponer que la dimensión de E es 2. Sin embargo, como En es unión de $n cuadrados disjuntos de lados rn , la superficie de En es 4n rn y como se verifica que 1 r n < , la superficie de En es tan pequeña como deseemos, con tal de tomar n 4 suficientemente grande. Como E está incluido en En (∀n) la superficie de E es nula, lo cual nos sugiere que descartemos el valor 2 para la dimensión de E. Otra forma de ver la construcción de E es pensar en el primer paso, en el que quitamos al cuadrado Q el conjunto en forma de cruz complementario E1 y nos quedamos con el resto, que es E1 . así continuamos en los sucesivos pasos del proceso. Razonando de esta manera, cabe pensar que para obtener E hemos vaciado el cuadrado inicial Q de forma tan exhaustiva que lo que resta no es una superficie. Pero entonces, ¿qué es lo que queda en E? Para poder responder a la pregunta formulada, numeramos las cuatro esquinas de cada uno de los cuadrados de cada En con números del 1 al 4 según una regla fija (por ejemplo comenzando en la esquina inferior izquierda y siguiendo el movimiento contrario a las agujas del reloj). Esta numeración permite asignar de forma biunívoca a cada sucesión finita de k números naturales 1i , i2 , ..., ik comprendidos entre 1 y 4 uno de los cuadrados que componen Ek , el cual será el que se obtiene eligiendo primero el cuadrado que ocupe la 12/18
esquina del cuadrado inicial Q, indicado por el número de la sucesión i1 , eligiendo después dentro de éste el cuadrado que ocupa la esquina indicada por i2 y así sucesivamente. Las sucesiones de números naturales comprendidos entre 1 y 4 son, de esta forma, una especie de escalera que permite “descender” a los interiores del conjunto cantoriano E. De hecho, si consideramos sucesiones infinitas, en lugar de sucesiones finitas, con ayuda de ellas podremos llegar hasta los mismos puntos de E. Cada sucesión infinita va definiendo una sucesión de cuadrados, cada uno de ellos encerrado en el anterior y conteniendo al siguiente, y cuyos lados tienden a cero, de forma que la intersección de todos ellos define un único punto, según el principio de los intervalos encajados. Es evidente que cada uno de los puntos así obtenidos está en el conjunto E pues lo está en cada En . Es fácil ver que cualquier punto de E se puede obtener de la misma forma, debido a que dicho punto debe pertenecer a algún cuadrado En en cada paso n, y el proceso de selección de cuadrados es precisamente el que nos lleva a la construcción de las escaleras infinitas. Por otro lado, es claro que en el momento en que dos sucesiones difieren en un símbolo, los correspondientes puntos de E son diferentes, Es por ello que podemos afirmar que el conjunto E tendrá tantos puntos diferentes como sucesiones distintas se pueden formar con números comprendidos entre el 1 y el 4, siendo el número de éstas infinito y con potencia del continuo. Por tanto en E hay tantos puntos como en todo el cuadrado inicial Q. Es por ello que parece demasiado grande como para asignarle la dimensión 0. Veamos ahora, por último, si la dimensión de E es 1. Ello sería posible si nos fijamos que la construcción de E se hace vaciando cada uno de los cuadrados que componen los conjuntos en toda su superficie, y nos fijamos en el perímetro de esos conjuntos y no en su superficie. Podríamos concebir E como conjunto límite de las curvas formadas por los bordes de los cuadrados de los En . Sumando los perímetros de los 4n cuadrados de lado rn que componen En , obtenemos una longitud total para dichas curvas de: Pn = 4 n +1 r n •
Si r >
1 entonces Pn →∞ y E parece demasiado grande para considerarlo una 4
curva. • •
1 entonces Pn →0 y la dimensión de E parece intermedia entre 0 y 1. 4 1 Si r = entonces Pn =4 y sólo en este caso parece adecuado que la dimensión de 4 E sea 1. Si r <
13/18
Así pues, si queremos que el proceso de medida dé como resultado un número finito, nos vemos abocados a prescindir del prejuicio de que las únicas dimensiones posibles son las enteras, lo que nos conduce a ensayar Dimensiones Fraccionarias. Un procedimiento para asignar una dimensión fraccionaria a E consiste en considerar tal conjunto como límite de los conjuntos de En y asignarle, en consecuencia, una medida d-dimensional límite de las medidas d-dimensionales de los conjuntos En . Si d=2 sabemos que la medida bidimensional que corresponde a En es 4n r2n , o lo que es lo mismo, 4n ln 2 donde ln =rn es el lado de cada uno de los cuadrados que forman En . Si d=1 habíamos estimado la medida unidimensional de E, que es 4 x4n ln . Es la longitud del perímetro de los cuadrados que lo determinan. Por tanto, resultaría natural considerar la expresión 4n xln 3 como estimación de la medida tridimensional de En . Siguiendo el mismo razonamiento, podemos estimar la medida d-dimensional de En como k·4n ln d donde k es una constante que depende de la dimensión, pero que no varía, afectando sólo como factor de proporcionalidad en el límite, sin alterar el hecho de que éste pueda tomar los valores cero, finito o infinito, para una dimensión determinada. Por el contrario, el parámetro que determina cual de estos resultados finales será el 1 correcto es la dimensión d. Sabemos que salvo para r = , las dimensiones enteras 4 conducen siempre a límite 0 o infinito. Vamos a tratar de ampliar las dimensiones fraccionarias para poder ajustar el valor de el parámetro d de tal forma que el límite de la expresión , la cual será nuestra estimación de la medida d-dimensional de E, no tome los valores 0 o infinito. Si podemos encontrar dicho valor de d, será la dimensión que asignaremos a E. Basta tomar d de manera que: 1 l = 4
n
d n
ya que entonces k ·4 n ·l nd = k
∀n
y éste será el valor que la expresión toma en el límite, y equivale a: r
nd
1 = 4
n
pues ln =rn
y por tanto
14/18
log
1
4 = − log 4 = log 4 = log 4 log r log r − log r 1 log r Obtenemos que la dimensión es: log 4 dim E = 1 log r d =
Podemos comprobar ahora mediante la expresión obtenida que: • • •
1 1
Este procedimiento nos lleva a uno de los posibles conceptos de dimensión fraccionaria, y es la llamada dimensión de homotecia. Su aplicación exige que el conjunto en cuestión pueda ser descompuesto en copias de sí mismo a escala, propiedad muy específica de dichos conjuntos. Cuando las figuras no verifican la propiedad anterior no podemos aplicar la dimensión de homotecia, teniendo entonces que recurrir a la dimensión de Hausdorff. 3.2. Dimensión por Recuento de Cajas. Aunque el concepto de dimensión con el que generalmente se trabaja en geometría fractal es el de dimensión de Hausdorff, existen otras definiciones de dimensión más fáciles de computar y coinciden con ella en los casos más interesantes. Quizá el más extendido sea el de Dimensión por Recuento de Cajas. La idea central es encontrar un proceso de medida a cierta escala δ que ignore las irregularidades de tamaño menor y estudiar como varía dicha medida cuando δ→0. Supongamos una curva C no necesariamente rectificable (de la que no podemos calcular su longitud). Si reticulamos el plano con cuadrados de lado δ, podemos definir “δ-longitud de C” como la suma de las longitudes de los lados de los cuadrados del retículado que cortan a la curva C, y así, el número de éstos es Nδ(C) y la δ-longitud sería: Lδ(C)=Nδ (C)·δ Si la curva fuese rectificable, podríamos esperar que, cuando δ→0, Lδ(C) tendiese a la longitud de dicha curva, pero si al ser mirada a cualquier escala siguiese mostrando irregularidades (es decir, una curva de “dimensión” mayor que 1) cuando hiciéramos tender δ→0, el valor Lδ (C) tendería a infinito.
15/18
Definimos la dimensión de recuento por cajas de un determinado conjunto E como dim B E = Lim δ →0
log Nδ ( E ) − log δ
donde Nδ(E) es el número de cubos de la δ-malla (en 3n ) que corta a E, siempre y cuando dicho límite exista. Puede demostrarse que Nδ(E) se puede sustituir, entre otros, por los siguientes números: • •
El menor número de cubos de lado δ que cubre E (no necesariamente pertenecientes a la δ-malla). El menor número de conjuntos de diámetro a lo sumo δ que cubre E.
Además, en los casos más importantes, el límite anterior suele existir, lo que permite simplificar su cálculo tomando: k 1 δ = 2 Se tiene entonces log N k ( E ) dim B E = Lim k →0 log 2 k donde Nk (E) es el número de cubos de la etapa k-ésima que cortan a E. Como ejemplo de aplicación, si E fuese el conjunto de Cantor tenemos que: dim B E =
log 2 log 3
4. GEOMETRÍA FRACTAL EN LA NATURALEZA Y LAS CIENCIAS. ¿Qué significado preciso tiene decir que un objeto real, tal como una costa o la red capilar del sistema venoso, es un fractal? Lo que queremos decir con ello es que podemos definir un modelo matemático fractal que aproxime satisfactoriamente al objeto real en toda una franja de escalas limitada por ciertos valores máximo y mínimo que llamamos corte superior e inferior, según Mandelbrot. Según lo expuesto en el párrafo anterior, en el mundo real no existen fractales, al igual que tampoco existen rectas ni esferas. Hablar de dimensión fractal de una costa no es más absurdo que hablar del radio de la Tierra. 4.1. Fronteras. Las fronteras de separación entre diferentes medios físicos, biológicos o sociales proporcionan a menudo excelentes ejemplos de sistemas que se pueden analizar 16/18
mediante fractales. Un ejemplo clásico es el de las costas, pero pueden ser los bordes de una nube, una superficie montañosa, la frontera entre dos paises, etc. Los célebres Conjuntos de Julia son también fronteras (matemáticas) entre regiones del plano e igual sucede con el Conjunto de Mandelbrot. La determinación histórica de una frontera es un proceso semejante a la formación de una curva fractal del tipo de la curva de Koch. Concretando, mediante simulación , la curva de Koch que simula la costa de Gran Bretaña tiene dimensión de Hausdorff igual a 1’26128, mientras que empíricamente, Richardson obtuvo el valor de 1’3. 4.2. Árboles. Desde el punto de vista matemático, un árbol es un conjunto de puntos o vértices (que serían los nudos de ramificación de los árboles botánicos), unidos entre sí por arcos (ramas) de forma que si caminamos desde un vértice por una sucesión consecutiva de arcos diferentes, nunca regresaremos al vértice de partida. Este modelo resulta aceptable de forma obvia y en primera aproximación para alguno de los objetos naturales. Una red fluvial es un modelo natural de curva característica de conjuntos fractales como la curva de Peano o de Hilbert 4.3. Movimiento Browniano. En 1827, Brown descubrió como minúsculas partículas de polen en una suspensión acuosa realizaban una complicada danza compuesta de una sucesión de longitud y dirección aleatorias. En 1905, Albert Einstein publicó un estudio del Movimiento Browniano basado en la teoría cinética de los gases, que posteriormente permitió a Prrin calcular el número de Avogadro. En 1923, Wiener construyó un modelo matemático de tipo aleatorio que describe el movimiento browniano con precisión satisfactoria. El modelo de Wiener refleja el comportamiento de variados fenómenos naturales en los que interviene el azar. Un camino Browniano es continuo, pero sus cambios permanentes y bruscos de dirección causan, como en las curvas de Koch o de Hilbert, su no diferenciabilidad. Sin embargo, las características de regularidad internas del movimiento browniano son de naturaleza esencialmente diferente a las que poseen las curvas anteriores. En este caso existe una regularidad de tipo estadístico que permite clarificar el movimiento browniano como un Fractal Aleatorio. Utilizando gráficos de movimientos fractales brownianos definidos como funciones de dos varables, Mandelbrot y otros han conseguido paisajes fractales tan realistas que, al verlos, resulta difícil de imaginar que no son fotos tomadas de paisajes reales. En la figura siguiente aparece un esquema de paisaje fractal obtenido por ese procedimiento.
17/18
Si se corta el gráfico por cualquier plano vertical se obtiene el gráfico de un movimiento browniano fraccionario unidimensional.
BIBLIOGRAFÍA RECOMENDADA. Estructuras Fractales y sus Aplicaciones. Aut. M. de Guzman y Otros. Ed. Labor. Los Objetos Fractales. Aut. B. Mandelbrot. Ed. Busquets.
18/18
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 56 EVOLUCIÓN HISTÓRICA DE LA GEOMETRÍA. 1. Introducción. 2. Las Civilizaciones más Antiguas. 2.1. Egipto. 2.2. Babilonia. 2.3. India. 2.4. China. 3. Grecia. 3.1. Los Comienzos de la Matemática Griega. 3.1.1. Thales de Mileto. 3.1.2. Pitágoras. 3.1.3. La escuela de Atenas. 3.2. La Escuela de Alejandría. 3.2.1. Euclides. 3.2.2. Arquímedes. 3.2.3. Apolonio. 3.3. Matemáticos Griegos Tardíos. 4. Roma. 5. La Edad Media. 5.1. India. 5.2. Los Árabes. 5.3. La Edad Media Latina. 6. La Edad Moderna. 6.1. Siglo XVI. 6.2. Siglo XVII. 6.2.1. La Geometría Analítica. 6.2.2. La Geometría Proyectiva. 6.3. Siglo XVIII. 6.3.1. Geometría Analítica Plana. 6.3.2. Geometría Analítica Espacial. 6.3.3. Geometría Diferencial. 7. La Edad Contemporánea. 7.1. Geometría Descriptiva. 7.2. Geometría Analítica. 7.3. Geometría Diferencial. 7.4. Geometrías no Euclídeas. 8. Siglo XX. Bibliografía Recomendada.
1/17
TEMA 56 EVOLUCIÓN HISTÓRICA DE LA GEOMETRÍA. 1. INTRODUCCIÓN. Comencemos indicando que la palabra “Geometría” significa, en griego, “medir la tierra”. Se cree que la geometría surgió a orillas del río Nilo, cuando surgió la necesidad de medir las tierras de labranza después de las crecidas para poder fijar el impuesto a pagar al faraón. La Geometría surgió a través de un lento proceso de abstracción de las formas de la Naturaleza, las cuales estaban idealizadas. Así, fueron apareciendo los conceptos de recta, curva, círculo, triángulo, superficie, volumen. Este proceso de observación se vio estimulado por la necesidad de controlar la Naturaleza, de servirse de ella. Por tanto, la geometría se desarrolló por las necesidades de dividir la tierra, de construir, etc. 2. LAS CIVILIZACIONES MÁS ANTIGUAS. 2.1. Egipto. La civilización egipcia se desarrolló considerablemente desde tiempos muy remotos. Ya hemos dicho que los egipcios disponían de un estímulo muy especial y era el Nilo. Ya desde el 5.000 a.C., el río, con sus inundaciones, borraba los mojones de separación y era necesario distribuir las tierras todos los años. Este hecho provocó que se reemplazara el calendario lunar por el solar. Uno de los primeros textos matemáticos existentes es el “Manual de Ahmes” que data del 1.700 a.C. y se titula “Orientaciones para conocer todas las cosas oscuras”. Es un manual para la formación de funcionarios reales. Está escrito en lenguaje jeroglífico y, a pesar de sus equivocaciones (quizá el que lo escribió no sabía lo que estaba escribiendo), contiene una colección de problemas de cálculo de capacidades de contenedores y almacenes, áreas de porciones de tierras, dimensiones de terraplenes, etc. Estos problemas nos ilustran sobre la evolución de la ciencia como resultado de las necesidades de la sociedad paleolítica y urbana. Un mural de hace 3.000 años nos muestra a los agrimensores llevando una cuerda con 12 nudos equidistantes. Al transformar dicha cuerda en un triángulo rectángulo se transforma en un instrumento muy útil para fijar los lindes de los terrenos. Entre sus conocimientos sobre geometría encontramos fórmulas de superficies del triángulo y del rectángulo, volúmenes de pilas de grano, y en forma aproximada, el valor de π: 2
16 π ≈ ≈ 3'16 9
2/17
También disponían de una palabra especial para la función Cotangente, ya que la usaban muy a menudo en la construcción de las pirámides. Obtenían geométricamente las raíces cuadradas y es posible que conocieran el Teorema de Pitágoras para los datos 3, 4 y 5. A su vez, trazaban ángulos rectos, eran capaces de dividir la circunferencia en seis partes, pero lo más notable era que también la dividían en 5 y 7 partes (construcción de pentágonos y heptágonos), aunque los métodos eran sólo aproximados. Se especula también con que conocieran el “segmento áureo”, por los datos de Herodoto sobre la Gran Pirámide. A pesar de las opiniones de matemáticos como Aristóteles, que afirmaba que las matemáticas se originaron en Egipto porque la clase sacerdotal disponía de tiempo para el estudio, se puede deducir de lo anterior que la matemática egipcia era eminentemente práctica. Es más, la matemática egipcia no consiguió abstraer los casos particulares a una teoría general. Cada método lo ilustran con un ejemplo y lo resuelven para cada caso particular. Y lo mismo sucederá con la matemática babilónica. Para obtener la generalización tendremos que esperar a los Griegos. 2.2. Babilonia. La civilización babilónica no es menos antigua que la egipcia y sus conocimientos matemáticos son, hasta cierto punto, paralelos. Es característico en ellos el empleo del sistema sexagesimal y los estudios astronómicos. Aun hoy utilizamos la base 60 en mediciones de ángulos y tiempos. En Geometría sus conocimientos no fueron abundantes ni profundos. Conocían el área del triángulo, del rectángulo y del trapecio, volúmenes de prismas rectos y pirámides de base cuadrada. También disponían de nociones sobre triángulos semejantes y conocían algún caso particular del teorema de Pitágoras. 2.3. India. La matemática en la antiquísima civilización hindú fue poco notable en estas primeras épocas y más bien fue de carácter fantástico. 2.4. China. La civilización china, con dinastías anteriores al 3.000 a.C. (los tres reyes sabios de Confucio), probablemente tuvo grandes conocimientos prácticos, pero nada ha podido ser comprobado. Ello se debe a que en el año 213 a.C. un emperador retrógrado, ShiHuang Ti (el gran emperador amarillo) hizo quemar todos los libros científicos. 3. GRECIA. 3.1. Los Comienzos de la Matemática Griega.
3/17
Alrededor del año 900 a.C. se efectúa el paso de la Edad del Bronce a la Edad del Hierro en el mediterráneo oriental y tienen lugar grandes cambios en la organización de estos pueblos, declinando culturas como la cretense, egipcia y mesopotámica. Aparecen nuevas formas sociales, como la polis griega, que ya no sólo vive del campo, sino sobre todo del comercio. En esta ascensión de la matemática griega, son adelantadas las ciudades del Asia Menor, recogiendo el legado (sobre todo egipcio) por parte de Thales de Mileto y Pitágoras. Los griegos se distinguieron en dos campos: los números o aritmética y la geometría. Sobre todo en esta última, que vive su primera época de oro. En Grecia, la matemática se convierte en una ciencia deductiva, partiendo de axiomas, postulados y definiciones, para llegar a teoremas. Eso fue debido gracias a su excepticismo y razón, lo que posibilitó la formulación, por primera vez, de los dos procesos mentales vitales para el progreso matemático: la abstracción y la demostración. Distinguieron entre dos clases de premisas, las generales, que llamaron axiomas, y las específicas, que llamaron postulados. La Inducción surgió como un nuevo proceso mental (el tercero) a fin de poder disponer de premisas para comenzar. También procede de los griegos el “método de reducción al absurdo” como forma de demostrar los teoremas. 3.1.1. Thales de Mileto. Fue Thales de Mileto el primer griego que estableció directrices para el estudio de la geometría, en términos abstractos, independientemente de cualquier aplicación práctica. Formó parte de los siete sabios de Grecia y el primero de la llamada escuela jónica. Vivió en la primera mitad del siglo VI a.C. y como comerciante viajó a Egipto y aprendió sus conocimientos. A él se le atribuyen conocimientos geométricos que, probablemente, eran ya conocidos. Lo más importante es que, como toda la matemática griega posterior, hace demostraciones y afirmaciones generales, no para cada ejemplo particular. A él se le asigna el concepto de lugar geométrico, y los teoremas: • • • •
Los ángulos de la base de un triángulo isósceles son iguales. Todo diámetro divide a la circunferencia en dos partes iguales. Los ángulos opuestos por el vértice son iguales. Todo ángulo inscrito en una semicircunferencia es recto
3.1.2. Pitágoras. Pitágoras, natural de la isla de Samos (Asia Menor), estudió con Thales. Fue un hombre de gran personalidad, y se pasó la primera parte de su vida viajando, tratando así de aumentar sus conocimientos matemáticos. En la segunda mitad del siglo VI a.C. fundó la escuela pitagórica en Cretona (Italia Meridional). Se dedicaba al estudio de la medicina, la filosofía y las matemáticas. Su pensamiento era idealista y los números 4/17
tenían propiedades mágicas. Su símbolo de hermandad era la estrella de cinco puntas y el secreto de sus investigaciones era riguroso. Para los pitagóricos, la geometría era, en consonancia con su concepción metafísica, una geometría de cuerpos sólidos y de figuras planas. Por número entendían el número entero y, al descubrir los irracionales, provocó tal crisis en la aritmética griega que terminaron inclinándose por la geometría. Obtuvieron 2 y 3 como hipotenusas de determinados triángulos y les apareció π al medir la longitud de la circunferencia. En Geometría, Pitágoras introdujo los conceptos de elipse, parábola e hipérbola. También conocían los cinco poliedros regulares, aunque se piensa que cuatro de ellos ya eran conocidos de antes. Dieron una forma de construir el dodecaedro y el icosaedro. Conocían la propiedad de que sólo tres polígonos regulares (triángulo, cuadrado y hexágono) recubrían el plano, lo que lleva a pensar que dedujeron que la suma de los ángulos de un triángulo equivalía a dos rectos. Claro está, a todos estos conocimientos tenemos que añadir el teorema de Pitágoras, que se piensa que fue el propio Pitágoras quien lo formuló en su forma general. 3.1.3. La Escuela de Atenas. En el siglo V a.C. Atenas adquirió la preeminencia tras la victoria sobre los persas y tiene lugar una época de florecimiento científico. Se funda la Escuela de Atenas, que vivirá los siglos V y IV a.C. y entre cuyos representantes encontramos a Anaxágoras, Hipócrates, Menecmo, Demócrito, Platón, Eudoxio. Contemporáneos a éstos tenemos al pitagórico Arquitas y a Zenón de Elea. Anaxágoras de Esmirna llegó a Atenas y fue amigo de Pericles. Se piensa que se ocupó de la cuadratura del círculo, pero no se disponen de referencias precisas. En aquella época se plantearon tres problemas que se hicieron famosos y clásicos y de los que, en el siglo XIX, se demostraría su imposibilidad por métodos de regla y compas. Los problemas eran: • • •
La duplicación del cubo. La trisección del ángulo. La cuadratura del círculo.
Hipócrates de Chios trabajó sobre la cuadratura del círculo, logrando la cuadratura de las lúnulas que llevan su nombre, ejemplo práctico de la cuadratura. En estos intentos se descubrieron multitud de curvas y superficies nuevas. Fue el autor del primer tratado de matemáticas elementales que se conoce. Planteó las siguientes razones para resolver la duplicación del cubo: a : x = x : y = y : 2ª de donde: x3 = 2a3 por lo que se estudiaron las medias geométricas 5/17
Menecmo también llevó a cabo la duplicación del cubo por el procedimiento anterior. Y estudió las secciones cónicas. Arquitas de Tarento fue contemporáneo de Menecmo. Se preocupó de la duplicación del cubo y fue uno de los primeros autores en escribir sobre mecánica. Demócrito de Abdera (Tracia) se adelantó a Arquímedes en el estudiode volúmenes de pirámides y conos, mediante el procedimiento de descomposición en capas cada vez más delgadas, antecedente del cálculo infinitesimal. Zenón de Elea se hizo famoso por ser el autor de las “aporías”. En ellas planteaba las insuficiencias del pensamiento lógico, las cuales no se resolvieron hasta la formalización del concepto de límite por Cauchy en el siglo XIX. Entre las más conocidas tenemos las paradojas de Aquiles y la tortuga y también la de la flecha. Platón fue discípulo de Sócrates y podemos decir de él que fue el fundador de la escuela ateniense. Su preocupación fueron fundamentalmente los números. Más interés para la geometría tiene Eudoxio, que resolvió la crisis planteada por los inconmensurables, estableciendo una teoría de proporciones de segmentos. Ello significó que la aritmética dejo de servir para la geometría, al no introducirse el concepto paralelo de número irracional. Los griegos desarrollaron a partir de ese instante una geometría totalmente separada del cálculo numérico. A Eudoxio se le atribuye el llamado “Axioma Arquimediano” que dice que dadas dos magnitudes A y B, siendo B la menor y no nula, se puede obtener un múltiplo de B que sea mayor que A. Su descubrimiento indica la penetración del espíritu científico de la época. 3.2. La Escuela de Alejandría. En el año 338 a.C. Grecia es unificada por Filipo de Macedonia y la península pierde su impulso científico. Alejandro Magno, hijo de Filipo, conquista todo el Oriente y funda la ciudad de Alejandría, en el delta del Nilo, pero muere en 323 a.C. Sus sucesores en Egipto, los Ptolomeos, harán de Alejandría la capital de su imperio y el centro cultural de Oriente, que pervivirá hasta que el Califa Omar toma Egipto en el año 642 d.C. En Alejandría se fundó una biblioteca y un museo, donde centenares de sabios y estudiosos enseñaron y aprendieron, gracias a que se universalizó el idioma griego. En ese ambiente científico hemos de destacar a tres grandes matemáticos: Euclides, Arquímedes y Apolonio. 3.2.1. Euclides. Euclides fue maestro en la universidad de Alejandría y pasó a la posteridad como autor de los “Elementos”. Esta obra se compone de 13 libros y 465 proposiciones, constituyendo una de las obras más perfectas del pensamiento matemático. Recoge todo el saber geométrico y aritmético, exponiéndolo en forma de riguroso tratado a partir de sus cinco axiomas en geometría.
6/17
Los libros I, II, IV y V tratan de líneas, áreas y figuras planas regulares simples, siguiendo a los pitagóricos. El libro III trata de los círculos, siguiendo a Hipócrates. El libro V elabora el trabajo de Eudoxio sobre las proporciones, que necesita otras partes del trabajo. El libro VI trata de la semejanza de figuras. Los libros VII, VIII y IX tratan de la teoría de números: máximo común divisor, mínimo común múltiplo, algoritmo de Euclides, etc. Es muy curiosa y nada fácil su teoría de los números perfectos. El libro X habla de los irracionales, en particular de los de la forma a± b con a y b naturales. En este libro aparece el método de demostración de Eudoxio y la escuela ateniense y el principio del descenso infinito. El libro XI trata de la geometría del espacio. El libro XII es importantísimo, ya que trata del método exhaustivo de nuevo y demuestra el área del círculo. El libro XIII trata de la construcción de los cinco cuerpos geométricos regulares de Pitágoras, siendo el último de ellos el dodecaedro. Otros dos libros, a veces añadidos en ediciones posteriores, son respectivamente de Hippias y de Damasceno. El primero de ellos fue un astrónomo del siglo II d.C. y el segundo fue del siglo VI d.C. Los elementos han sido la fuente de geometría que ha estudiado Europa y su profundidad no ha sido sobrepasado hasta el siglo XIX. Un detalle que merece la pena destacar es el “axioma de las paralelas”. Durante mucho tiempo pareció evidente, pero todo intento de demostración cometía errores. Finalmente, en el siglo XIX, Lobachebski y Bolyai mostraron dos geometrías no euclídeas, ya que no verificaban dicho axioma. Euclides escribió otros libros de menor importancia, como son “Datos” y “División de Figuras”. 3.2.2. Arquímedes. Arquímedes de Samos vivió en Siracusa (Sicilia), donde murió a manos de los romanos. Había vivido en Alejandría y aprendió el saber de entonces. Es considerado como el mayor matemático de la antigüedad.
7/17
Fue un gran calculista, mejorando la determinación del número π hasta alcanzar cinco cifras decimales exactas. Como mecánico descubrió la ley de la palanca y en hidráulica el principio que lleva su nombre. En geometría podemos destacar obras suyas como “De las Espirales”, “De la medida del Círculo”, “De la Esfera y el Cilindro” y “De los Conoides y los Esferoides”. Es en los dos últimos donde nos podemos encontrar con las fórmulas de superficie y volumen de la esfera, superficies de revolución de segundo grado, superficie de la elipse, etc. También podemos destacar otra obra sobre “Las Líneas Espirales” donde su tratamiento de las tangentes es propio del cálculo infinitesimal. También calculó el área limitada por una parábola. Precisamente fue el cálculo del volumen de la esfera de lo que más orgulloso se sentía. Lo obtuvo viendo que era igual a dos terceras partes del volumen del cilindro cincunscrito más pequeño. Su método era tan riguroso que perduró como modelo de demostración. Pero hemos de resaltar que a los resultados solía llegar por procedimientos más intuitivos, como el mismo reconocía. También parece ser de Arquímedes la llamada Fórmula de Herón, para el cálculo del área del triángulo en función de sus lados. 3.2.3. Apolonio. Apolonio de Perga escribió, hacia el año 200 a.C., su teoría de las secciones cónicas. Fue una obra tan completa que hasta nuestros días no se ha podido añadir algo. consta de ocho libros y se definen y estudian en ellos la elipse, la parábola y la hipérbola, asíntotas, diámetros conjungados, ejes, tangentes, polos, polares, haces de rectas, focos, etc. También nos podemos encontrar en dichos estudios sobre rectas normales e incluso sobre la evoluta. Además fue astrónomo y aritmético, y se le considera uno de los matemáticos más importantes de la antigüedad. 3.3. Matemáticos Griegos Tardíos. Con Apolonio finaliza la edad de oro de la geometría en Alejandría. En el año 146 a.C. Grecia cayó en poder de Roma y en el 45 a.C. cayó la ciudad de Alejandría. Entre los matemáticos dedicados a la geometría de esta época podemos destacar varios. Menelao de Alejandría (siglo I d.C.) demostró teoremas de Geometría, uno de los cuales lleva su nombre. Se le debe una “Esférica”, donde aparece por primera vez el triángulo esfércio. Ptolomeo vivió a lo largo del siglo II d.C. Escribió trece libros traducidos al árabe bajo el nombre de “Almagesto”. Resumen los conocimientos astronómicos de su tiempo
8/17
y tratan lo que hoy entendemos como seno de un ángulo, son fórmulas como Sen(a±b) y tablas en intervalos de 30º. Esta época de poco relieve bajo la dominación romana pareció reavivarse en Alejandría en el siglo III d.C. con matemáticos como Herón, Pappus y Diofanto. En geometría podemos destacar a Pappus, que fue notable por comentar las obras de épocas anteriores, siendo en más de un caso, lo único que sabemos de ellas. Estudiando el volumen y superficie de cuerpos de revolución, descubrió los cuerpos que hoy en día llamamos de Guldin, matemático del siglo XVII. En el siglo IV d.C. nos encontramos con Teón de Alejandría, que editó y comentó la obra de “Los Elementos” de Euclides. Y su hija, Hipatía, se ocupó de las cónicas de Apolonio. 4. ROMA. El interés por la ciencia del pueblo romano fue prácticamente nulo. Los agrimensores sabían algo de geometría, cosas rudimentarias. Valga como ejemplo que cuando César quiso reformar el calendario tuvo que llamar a Sosígenas, un sabio de Alejandría. Durante el siglo V d.C. desaparece el imperio de Occidente. Los romanos, que parece que habían empezado a interesarse por las matemáticas, al convertirse al cristianismo, volvieron la espalda de nuevo a la ciencia. Ello fue debido a que el espíritu científico helenístico era contrario al cristianismo, que lo ligaba al paganismo. 5. LA EDAD MEDIA. Desde el declinar de la matemática griega hasta el renacimiento de las ciencias en Europa en los siglos XVI y XVII, recorremos una época de más de mil años de poca fertilidad matemática. El mayor interés reside en la transmisión de los conocimientos antiguos a la edad moderna. El otro dato importante due la adopción del sistema de numeración moderno. 5.1. La India. La India tuvo un interés casi nulo por la geometría y sus preocupaciones fueron más bien algebraicas y astronómicas. A ellos se debe un progreso fundamental y es el sistema de numeración decimal con valor relativo a la posición de los números. Este sistema fue transmitido por los árabes y potenciaría el renacimiento científico europeo. Está sin decidir si los conocimientos matemáticos que aparecen hacia el siglo V d.C. en la India estuvieron influidos por los griegos mediante Alejandro Magno, o si se deben al contacto con Babilonia.
9/17
En los escritos que se han encontrado se proponen reglas para la construcción de los altares destinados a los sacrificios. Entre estos escritos nos podemos encontrar: En los Siddhauta paraceren por primera vez las funciones circulares seno y coseno. Aryabhata, en su obra Aryabhatiya, da reglas para el cálculo de áreas y volúmenes, donde algunas de ellas son exactas y otras aproximadas. Bhaskara hace una demostración tanto gráfica como empírica del teorema de Pitágoras, así como de otros resultados, entre los que podemos citar la equivalencia entre un triángulo y un rectángulo de bases iguales, y entre un círculo y el rectángulo cuyos lados son el lado y la semicircunferencia. 5.2. Los Árabes. Conquistadores en el siglo VII d.C. de los dominios de la cultura helenística y extendiéndose hasta España y la India por uno y otro lado, tuvieron inclinación por las matemáticas, que copiaron al árabe de los antiguos manuscritos. De allí pasó al latín en el siglo XII principalmente gracias a la Escuela de Traductores de Toledo, bajo el reino de Alfonso X El Sabio. Pero la geometría no les interesó mucho, aunque las obras de la antigüedad se las debemos en gran parte a ellos, como los “Elementos” o el “Almagesto”. Trabajaron el Álgebra y la astronomía y transmitieron a occidente el sistema de numeración hindú. La primera figura árabe fue Al-Khuwarizmi, que vivió durante el siglo IX. Además de su “Álgebra”, que ya comentamos en otro tema de historia, también escribió una “Geometría” y tablas astronómicas donde aparece la función seno. Los astrónomos árabes del siglo X ya usaban senos, tangentes y cotangentes en sus cálculos y trataron de problemas esféricos. Hubo comentarios a la Geometría de Euclides, una cuadratura de la parábola y del paraboloide. El poeta y matemático Omar Khayam usaba en problemas algebraicos intersecciones de cónicas. Abu-al-Wafa escribió un libro sobre construcciónes geométricas como polígonos y poliedros. El persa Nasir Eddin, en el siglo XIII estudió la trigonometría independientemente de la astronomía, usando el teorema de Menelao. 5.3. La Edad Media Latina. En la época de la caída de Roma ante los bárbaros, Boecio parece que escribió una Geometría (quizá una falsificación tardía) y estableció el Quadrivium o cuatro caminos: Aritmética, Música, Geometría y Astronomía. Su influencia en los estudios de la edad media fue notable. De todos modos, la Geometría fue prácticamente olvidada en occidente y la Aritmética se redujo casi exclusivamente a las teorías de cálculos con el ábaco, al modo romano.
10/17
En el siglo XI la cultura árabe comienza a mostrar signos de decadencia, asomando un despertar cultural en el mundo cristiano, tanto en Oriente como en Occidente. Habrá que esperar al siglo XII para que aparezcan las traducciónes del árabe y la pujanza de las Universidades vaya recobrando su saber antiguo. Es a partir de esta época, y hasta el siglo XV, podemos destacar a: • • • • • •
•
Leonardo de Pisa, conocido como Fibonacci, (1170-1240), escribe “Práctica Geometriae”. Campano de Novara, en 1482, tradujo la obra de Euclides “Los Elementos”, Más que traducir, se dedicó fundamentalmente a comentar la obra. Jordanus Nemorarius, que escribió sobre Geometría y Álgebra. Nicolás de Cusa se ocupó de la cuadratura del círculo. Johannes Muller, también conocido como Regiomontano, escribió tablas de doble entrada para la tangente de un ángulo. A él se le debe el Teorema de los senos. J. Widmann (1489) escribió una obra en tres volúmenes. La parte dedicada a la geometría es muy irregular. Podemos destacar el cálculo de forma correcta del radio del círculo circunscrito a un triángulo, conocido un lado, su altura y la proyección de uno de los otros dos lados sobre él. Luca Pacioli fue el autor de una obra de carácter enciclopédico en la que resumió todo el saber geométrico de la época.
En el imperio de Oriente, el siglo V reunió en Atenas la escuela neoplatónica y se puede citar a Proclo. Fue disuelta por Justiniano acusada de defender el paganismo. La ciencia se fue perdiendo, pero de todas formas, desde el siglo X funcionó en Constantinopla una escuela científica. Cuando los turcos ocuparon Constantinopla en 1453, los emigrados griegos a occidente aportaron muchas obras de la antigüedad y contribuyeron al despertar científico. 6. LA EDAD MODERNA. 6.1. Siglo XVI. En este siglo tiene lugar en Europa un florecimiento científico considerable, que prepara el de siglos posteriores. Se trabaja intensamente en Álgebra, donde Tartaglia, del Ferro y Cardano resuelven las ecuaciones de tercer y cuarto grado. Se trabaja en Cálculo, con el trascendental descubrimiento de los logaritmos por John Napier. También se producen avances en Astronomía, de la mano de Tycho Brahe, Galileo, Copérnico, Kepler. Pero en Geometría no se producen progresos. Se editan y estudian las obras antiguas y se trata la cuadratura del círculo y otros temas semejantes. Se obtiene la fórmula: 2 = π
1 1 1 1 1 1 · + · + 2 2 2 2 2 2
1 1 1 + L 2 2 2
debida a Vieta, llegándose a calcular π con 28 cifras decimales exactas.
11/17
6.2. Siglo XVII. 6.2.1. La Geometría Analítica. La gran novedad del siglo XVII es el empleo de coordenadas referidas a dos ejes arbitrarios del plano. de forma que todo punto puede representarse por un par de números. Esta es la obra que inician los matemáticos franceses Rene Descartes y Pierre de Fermat. Descartes publicó en 1657 su famoso “Discurso del Método” cuya última sección, “Geometría”, trata de esta innovación que recibiría con el tiempo el nombre de Geometría Analítica. Dos son las ideas fundamentales: • •
El concepto de coordenadas referidas a un par de ejes arbitrarios (no necesariamente rectangulares). La Relación entre ecuaciones con dos incógnitas y los lugares geométricos del plano, es decir, la ecuación f(x,y)=0, indeterminada como ecuación algebraica, representa una curva del plano cuyos puntos son aquellos que sus coordenadas satisfacen la ecuación.
El inconveniente principal de la época fue que tanto Descartes como sus contemporáneos rehuyeron el uso de coordenadas negativas. Por otra parte, fue corriente en este siglo no dibujar más que un solo eje: el de abcisas. . El mérito de Descartes estuvo en la introducción de la notación moderna, similar a la actual. A pesar de todo, su estilo era bastante oscuro. Fermat hizo un trabajo similar pero de exposición más clara, aunque la notación fuese la antigua de los algebristas. Su obra se publicó en 1679 y se llamo “isagoge”. Influidos por Descartes, Wallis escribió un tratado sobre las secciones cónicas y Jan de Witt sobre el trazado de curvas de segundo grado. La introducción de coordenadas en el estudio analítico de la Geometría motivó la reanudación de estudios sobre la resolución gráfica de ecuaciones, en los que trabajaron también Descartes y Fermat. Newton y Leibnitz se basaron en la Geometría Analítica para inventar el Cálculo Infinitesimal. El primero demostró analíticamente algunos teoremas de Geometría, como el de los diámetros de una curva de grado n. La aplicación al espacio tridimensional resultó lenta. El tema lo trato Juan Bernouilli a finales del siglo. Las superficies se estudiaron a través de secciones planas, que pueden tratarse con dos coordenadas. Por último, podemos destacar que el uso de coordenadas fue, en cierto sentido, introducido por Apolonio. Éste describía las cónicas por medio de las propiedades de las distancias de cada punto a los ejes (o sea, coordenadas) de forma que ecuaciones como la reducida de la parábola están ya implícitamente en sus trabajos. Pero una diferencia notable está en que nunca usó un sistema de referencia de dos ejes arbitrarios, es decir, independientes de la figura. En realidad, mucho del trabajo de este siglo
12/17
consistió en traducir al lenguaje algebraico moderno los resultados de Apolonio. Veremos que a mediados del siglo siguiente, el XVIII, la Geometría superaba claramente a Apolonio y se aplicaba a multitud de cuestiones. 6.2.2. La Geometría Proyectiva. Iniciada por el arquitecto francés Gerard Desargues, estudió la proyección central de los cuerpos geométricos y, en especial, las secciones cónicas, publicando la “perspectiva Abreviada” en 1639. Encontró poco interés y la obra fue prácticamente olvidada hasta 1845 en que se descubrió una copia de la obra. A este mismo tema se dedicó también el filósofo Blaise Pascal. 6.3. Siglo XVIII. En este siglo podemos destacar, aparte de otros temas que veremos a continuación, a Euler, que publicó el Teorema sobre poliedros que lleva su nombre, aunque el enunciado ya era conocido por Descartes. Saccheri contempla la posibilidad de que el quinto postulado de Euclides sea verdadero, por exclusión de las otras dos posibilidades. también Lambert estudió las posibilidades de geometría no euclídea. La Geometría Descriptiva fue iniciada por Monge, con la representación de figuras en planta y alzado, un estudio tan perfecto que no se superó durante 50 años. 6.3.1. Geometría Analítica Plana. El avance resultó ser lento, pues inicialmente se usaban las ecuaciones en coordenadas para representar puntos y no se usaba el hecho de que la ecuación manifiesta las propiedades de la curva. Newton estudió sistemáticamente las curvas de tercer orden y las clasificó en tipos. También clasificó las curvas algebraicas por el grado y estudio las secciones cónicas. La obra más influyente en la materia fue la “Introductio” de Leonard Euler, de 1748, de Basilea, que es una exposición completa de la Geometría Analítica de su tiempo. Estudia y clasifica las cónicas refiriéndolas a unos ejes y no al diámetro, rompiendo en este tema definitivamente con Apolonio. También habla de curvas trascendentes. Otro libro clave fue la “Introducción al Análisis de las líneas curvas” del suizo Gabriel Cramer. Su método de representación de curvas con el estudio de puntos singulares de orden superior en el origen es aún utilizado (método de Newton-Cramer). Por diversos autores se estudiaron multitud de curvas particulares.
13/17
6.3.2. Geometría Analítica Espacial. El avance es todavía más lento. Juan Bernouilli y Leibnitz usaron, a finales del siglo XVII, coordenadas en el espacio. Euler estudió los cambios de coordenadas ortogonales e introdujo los tres ángulos llamados de Euler. Después lo amplió al cambio de coordenadas n dimensionales. Gaspar Monge estudia en 1771 la ecuación del plano y trata problemas de puntos y rectas en el espacio. Problemas análogos fueron estudiados por Lagrange. 6.3.3. Geometría Diferencial. Euler, Juan Bernouilli y Clairaut trabajaron sobre las geodésicas y la curvatura de las superficies, dando las ecuaciones diferenciales de las primeras. Euler estudia el plano osculador y conjuntamente con Monge estudia las superficies desarrollables. Monge estudió el teorema de la curvatura en una superficie, llamado hoy teorema de Meusnier. Sin embargo, el concepto de curvatura media tendrá que esperar al Gauss en 1823. También trabajó Monge sobre los radios de curvatura y las líneas de curvatura. Finalmente, se trató el tema de representación de superficies para fines cartográficos. Lambert estudió la proyección estereográfica y Euler y Lagrange estudiaron la proyección Mercator. 7. EDAD CONTEMPORÁNEA. La edad de oro de la Geometría puede datarse entre la publicación de la “Geometría Descriptiva” de Monge en 1795 y del “Programa de Erlangen” de Félix Klein en 1872. Se efectúan progresos que llevan a la Geometría a cumplir en algunas ramas todos sus objetivos. 7.1. Geometría Descriptiva. Se recupera el trabajo iniciado por Desargues en el siglo XVII sobre proyecciones centrales. Monge, al desarrollar la descriptiva y la proyección ortogonal prepara el terreno. La figura más destacada es Víctor Poncelet, oficial del ejército de Napoleón. Prisionero en Rusia, usa extensamente los elementos (punto, recta, plano) del infinito, colocando a la Geometría en el marco del espacio proyectivo. Se distinguen las propiedades métricas de las proyectivas y se estudian las relaciones anharmónicas. Brianchon y Gergonne estudian las polares respecto a una forma cuadrática y la dualidad, como también Möbius y Plücker harán en la Geometría Analítica. Además, Poncelet para al espacio proyectivo complejo e introduce los puntos cíclicos, con lo que se consigue la unidad de tratamiento, independiente de los casos de figura. Se estudian las transformaciones proyectivas, homologías, involuciones. Esta geometría se orienta en sentido sintético, es decir, prescindir totalmente de las
14/17
coordenadas, y tiene figuras de relieve de Jacobo Steingr y Miguel Chasles, suiza y francés respectivamente. La obra es culminada por Cristian von Staudt, que en su “Geometría de la posición” (1847), prescinde de los escalares en su tratamiento de la Geometría. Esto abre, con el tiempo, el camino a geometrías sobre un cuerpo cualquiera. Hacia 1850 la Geometría sintética llega a su apogeo. 7.2. Geometría Analítica. El tomo IV del clásico “Curso de Matemáticas” de Lacroix expone todo el conocimiento del siglo XVIII. Al comienzo, pesada y falta de elegancia, referida a conceptos no intrínsecos (por una causa de los ejes arbitrarios), se convertirá en medio siglo en un poderoso instrumento de las más variadas disciplinas. Hacen avances Gergonne, Bibillier y Lame, pero se deba más a Möbius, que introduce las coordenadas baricéntricas en su “Cálculo baricéntrico” (1827) y a Julio Plücker que introduce las coordenadas homogéneas y con ellas el tratamiento analítico de los elementos del infinito. Este introduce por dualidad las coordenadas plückerianas y ambos estudian las colineaciones y las propiedades proyectivas. Plücker introduce también la Geometría Analítica los puntos imaginarios. Ambas tendencias geométricas realizan así un estudio a fondo y en cierto sentido definitivo de las cónicas (y cuádricas) y haces correspondientes, pasando a estudiar curvas y superficies de segundo y tercer grado con gran detalle. Pero serán Cayley y Silvester, británicos, quienes darán el impulso final a la geometría analítica con la teoría de los invariantes, poniéndola a la altura de lo sintético. Por eso, Félix Klein, en su “Programa de Erlangen” pide el fin de la querella entre la tendencia analítica y sintética, pues si el uso de la geometría referida a unos ejes arbitrarios justificaba el que fuera tachado de defectuoso, la aplicación racional del método, dice Klein, está de sobra justificada. Una vez desarrollada la teoría de los invariantes, la geometría “elemental” se convierte en un diccionario para expresar los resultados de formas bilineales, siendo el cálculo de los invariantes un procedimiento bastante mecánico. Por eso, la geometría elemental llega a su cénit y al mismo tiempo muere como campo de investigación. Las nuevas orientaciones serán el avanzar en la teoría de las formas bilineales. Todo lo referente al rango, como el famoso teorema de Silvester, será aclarado por Fröbenius, Éste y Pfaff estudian las formas alternadas. Por último, una generalización que llevará a cabo en el siglo XX será el espacio de Hilbert y el concepto de forma hermítica, introducido por Hermite. Para terminar el siglo XIX, Hilbert realiza su magnífica obra “Fundamentos de la Geometría”, que estudia a fondo la axiomática y recoge el estado de la ciencia. No podemos terminar sin comentar a Willian R. Hamilton, irlandés, inventor del álgebra de los cuaterniones.
15/17
7.3. Geometría Diferencial. a) Curvas. “Las aplicaciones del análisis a la geometría”, de Monge, influyeron hasta mediados del siglo. Se definieron y calcularon todos los elementos del triedro intrínseco en un punto de una curva, siendo muy importantes las fórmulas de Frenet (1847). b) Superficies. Los avances son fundamentales. Gauss publicó unas notables “Disquisiciones sobre superficies curvas” y estudió el primer tensor fundamental. También descubrió el “Teorema Egregium” sobre la curvatura, que el definió, estudiando a su vez el segundo tensor fundamental. Mainardi y Codazzi completaron sus fórmulas sobre estos tensores. Dupin introdujo los conceptos de tangentes principales y la indicatriz de su nombre. También Hamilton hizo estudios sobre este tema. 7.4. Geometrías no Euclídeas. Por fin, en el siglo XIX se resolvió negativamente la disputa sobre la dependencia lógica del postulado de las paralelas de Euclides. Legendre y Gauss se dedican al tema. El primero intentó probarlo. Quiso demostrar que la suma de los ángulos de un triángulo no puede ser menor que dos rectos y no pudo conseguirlo. Gauss llegó a formular las bases de la Geometría Hiperbólica pero no lo publicó “por temos al escándalo que produciría”, como se supo tras su muerte. El mérito de su publicación corresponde a Lobachevski (1829). El sistema era idéntico al de Gauss. En 1832 publicó un resultado análogo el húngaro Bolyai. Con la lectura por Riemann en 1854 de su tesis “Sobre las Hipótesis que sirven de fundamento a la Geometría”, no sólo se admiten las posibilidades anteriores, sino que se amplía el marco de la Geometría al estudio de los espacios más generales. La Geometría no Euclídea tuvo su aplicación física en la relatividad de Einstein. 8. SIGLO XX. Del siglo XX citaremos sólo los dos campos de investigación corrientes relacionados con la Geometría: • •
Geometría Algebraica. Estudia todo lo relativo a curvas, superficies y sus generalizaciones a espacios de más dimensiones, de entes definidos por polinomios en varias variables. Geometría Diferencial, donde las ideas de Elie Cartan le han devuelto la vitalidad un tanto apagada (fibrados, jets, haces, etc.).
16/17
Bibliografía Recomendada. La Matemática: Su contenido, Método y Significado. Aut.: Alexandrov, Kolmogorov, y otros. Ed. Alianza. Elementos de Historia de las Matemáticas. Aut.: N. Bourbaki. Ed. Alianza. El Mundo de las Matemáticas. J. Newman. Ed Grijalbo.
17/17
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 57 USOS DE LA ESTADÍSTICA: ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL. MÉTODOS BÁSICOS Y APLICACIONES DE CADA UNA DE ELLAS. 1. Definición de Estadística. 2. Estadística Descriptiva. 3. Estadística Inferencial. 3.1. Estimación de Parámetros. 3.2. Contrastes de Hipótesis. 4. Características de los Fenómenos Asociados a la Estadística. 4.1. Recolección de Datos. 4.2. Parámetros y Estadísticos. 4.3. Variables. 5. Aplicaciones. 5.1. La Variabilidad Biológica. 5.2. La Información en las Ciencias de la Salud. 5.3. La Investigación en el Campo de las Ciencias de la Salud. 5.4. La Calidad en Ingeniería. 5.5. La Estadística en las Ciencias Físicas. 5.6. Aplicación a los Seguros. 5.7. Otras Aplicaciones. Bibliografía Recomendada.
1/12
TEMA 57 USOS DE LA ESTADÍSTICA: ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL. MÉTODOS BÁSICOS Y APLICACIONES DE CADA UNA DE ELLAS. 1. DEFINICIÓN DE ESTADÍSTICA. Históricamente, la Estadística aparece con el único objetivo de recopilar datos demográficos, sociológicos o económicos, concepción que, siendo absolutamente incompleta, sigue prevaleciendo aún hoy en día en un gran número de personas. Aunque tal objetivo tiene un indudable interés (por ejemplo estadísticas de la O.M.S., Boletín Epidemiológico semanal, estadísticas sanitarias nacionales, censo de población,...), el desarrollo de la ciencia en general, y de la Matemática en particular, ha impulsado la ampliación de los fines de la Estadística. De un modo general. la ciencia ha progresado tanto hoy en día que resulta muy difícil definir en unas palabras cualquiera de sus ramas, y a ello no se escapa la Estadística. Aunque no existe una definición de Estadística que sea universalmente aceptada (existiendo centenares de ellas) una que, dentro de su sencillez, es bastante aceptada sería: La Estadística es el conjunto de métodos necesarios para recoger, clasificar, representar y resumir datos, así como para hacer inferencias (extraer consecuencias) científicas a partir de ellos. De acuerdo con esta definición, la Estadística puede dividirse en dos grandes subapartados: Estadística Descriptiva e Inferencia Estadística. La Estadística Descriptiva tiene por fin lo indicado en la primera parte de la definición, esto es, la recogida, clasificación, representación y resumen de los datos proporcionados por una experiencia. La Inferencia Estadística responde a la segunda parte de la definición y consiste en llegar a conclusiones válidas a partir de una información incompleta. Veamos un ejemplo: si un internista desea ensayar la eficiencia de una droga hipotensora, sólo dispondrá de un número limitado de pacientes hipertensos a los cuales podrá administrar en plan experimental. Sin embargo, él deseará obtener conclusiones válidas para todos los pacientes hipertensos del mismo medio. El paso de obtener conclusiones para todos los pacientes a partir de un número limitado de ellos es el que realiza la Inferencia Estadística. Si, de una forma general, llamamos población al conjunto de los individuos que se desea estudiar, y por muestra a una parte de esa población, entonces la Inferencia Estadística es el conjunto de métodos que permiten, a partir de los resultados de una muestra obtener conclusiones válidas para una población. Usualmente el número de elementos de una población será denotado por N, en tanto que los de la muestra lo será por n. Pero esto no es siempre así. La sencilla definición anterior, suele ser fruto de un gran número de confusiones para la persona que se inicia en Estadística.
2/12
2. ESTADÍSTICA DESCRIPTIVA. Ya hemos comentado que la Estadística Descriptiva tiene como finalidad la recogida, clasificación, representación y resumen de los datos proporcionados por una experiencia. La recopilación de datos es la primera fase de todo estudio estadístico y, quizá, la más delicada, pues va a determinar la calidad de todo el trabajo. Si los datos no reflejan correctamente la realidad que intentamos estudiar, es evidente que los resultados serán falsos, tanto más cuanto más alejados estemos de los datos correctos. En una segunda fase, se trata de sustituir toda la información recopilada por unos pocos valores que puedan caracterizarla. Para ello utilizaremos parámetros que caracterizan el centro de la distribución de frecuencias, media, mediana y moda y otras divisiones de la distribución como cuartiles y percentiles. Se estudia también la necesidad de cuantificar, de alguna manera, cómo los valores que toma la variable se separan de los valores centrales, nombrados anteriormente. Se estudia así el concepto de variabilidad y la influencia que ésta puede tener en la representatividad de los valores centrales. Aparecen los conceptos de dispersión y concentración de los datos, y las medidas de dispersión habituales: recorrido, desviación media, momentos, varianza y desviación típica, así como el coeficiente de variación para cuantificar la dispersión relativa. Una manera tradicional de establecer diferencias entre la forma de dos distribuciones es a través de las medidas de asimetría y apuntamiento o exceso. Una vez finalizado el proceso de síntesis de la información de partida, resulta conveniente saber hasta que punto la distribución de frecuencias puede ser sustituida por las medidas introducidas. 3. ESTADÍSTICA INFERENCIAL. 3.1. Estimación de Parámetros. Iniciaremos el estudio estadístico de colectivos (población) mediante la elección de unos pocos (muestra), de los que inferiremos las características de toda la población. La Estadística Inferencial tratará de obtener información acerca de los parámetros poblacionales a partir de la muestra. Diremos que una muestra es Aleatoria Simple (m.a.s.) si X1 , X2 ,..., Xn son variables aleatorias independientes e idénticamente distribuidas. Los Estimadores son variables aleatorias utilizadas `para estimar parámetros de la población. Los estimadores que proporcionan un único valor para el parámetro poblacional se denominan Estimadores Puntuales, mientras que los que especifican un intervalo de valores se denominan Estimadores por Intervalos.
3/12
Para llevar a cabo tales estimaciones es necesario que la muestra sea representativa de la población, para lo cual ha de ser aleatoria en su selección y poseer un adecuado tamaño. 3.2. Contrastes de Hipótesis. Otro apartado importante de la Estadística Inferencial son los métodos de contrates de hipótesis, de gran utilidad en las Ciencias. En muchas ocasiones, el interés está centrado en la comparación de dos estadísticos entre sí, o entre un estadístico y un determinado valor poblacional, y no tanto en la estimación de parámetros poblacionales. Los métodos de contraste de hipótesis permitirán decidirnos entre dos hipótesis formuladas previamente (Hipótesis Nula y Alternativa) con un determinado nivel de error. Podemos clasificar los errores en dos tipos, tanto para pruebas de significación direccionales como no direccionales: • •
Error Tipo I. Son los errores que tienen lugar cuando es rechazada la hipótesis nula siendo verdadera. Error Tipo II. Tienen lugar cuando se acepta una hipótesis y no es cierta.
El problema central de las pruebas de hipótesis es hacer posible una elección adecuada entre dos hipótesis referidas al valor de un parámetro poblacional. Una Hipótesis Estadística es una proposición que se establece acerca de una o más poblaciones. Estas proposiciones suelen referirse bien a la forma de distribución (binomial, normal, etc.) bien a los parámetros de la distribución conocida su forma. El contraste de la hipótesis estadística se basa en la información proporcionada por la muestra. La terminología de rechazar o aceptar una hipótesis debe quedar clara. Es decir, el término “rechazar una hipótesis” significa concluir que es falsa, mientras que “aceptar una hipótesis” solamente implica que no se dispone de suficiente información como para rechazarla. Al establecer las hipótesis referidas a los posibles valores que puede tomar un parámetro poblacional es conveniente distinguir entre Hipótesis Simples y Compuestas. En una hipótesis simple sólo se especifica un valor para el parámetro poblacional; las hipótesis compuestas, por el contrario, establecen un rango de valores que puede tomar el parámetro poblacional. Para realizar las pruebas de hipótesis se establecen dos hipótesis mutuamente excluyentes, y complementarias, denominadas Hipótesis Nula e Hipótesis Alternativa. Debe quedar claro que desde el punto de vista estadístico el establecimiento de una hipótesis como nula y la otra como alternativa no es lo mismo que elegirlas al contrario. La hipótesis nula suele utilizarse como estrategia o medio del que nos valemos para probar la alternativa. Es conveniente, a la hora de establecer las hipótesis, que la hipótesis nula sea aquella que contenga el signo de igualdad, si es que este signo aparece en alguna de ellas. La hipótesis nula, por ser más concreta, suele ser simple y la alternativa compuesta. Para distinguir ambas hipótesis se establece la siguiente nomenclatura: H0 : Hipótesis Nula.
H1 : Hipótesis Alternativa.
4/12
El planteamiento de H0 permite elaborar un modelo probabilístico a partir del cual podemos llegar a la decisión final. El procedimiento de contrastar dos hipótesis conlleva establecer dos zonas disjuntas y complementarias, denominadas: Zona de Rechazo (Región Crítica) y zona de Aceptación.
La zona de rechazo está constituida por aquellos valores del Estadístico de Contraste que por ser muy grandes o ser muy pequeños es muy poco probable que ocurran si H0 es verdadera. Es decir, la región crítica la constituye el conjunto de valores del estadístico que permiten rechazar H0 y, por tanto, aceptar H1 . La región de aceptación la conforman el conjunto de valores del estadístico de contraste que permiten aceptar H0 . Diremos que un valor es Muy Significativo si tiene poca probabilidad de ocurrir. Otro concepto que nos conviene tener definido es el que se conoce como Nivel de Significación, denotado por α y que representa a la probabilidad de que un valor concreto del estadístico de contraste caiga en la región crítica. La decisión de aceptar o rechazar H0 se basa en probabilidades y no en certezas, al tomar la decisión existen posibilidades de error. Ya hemos visto que existen dos tipos de error. Como muestra la tabla adjunta hay cuatro posibles conclusiones y en ella se encuentra recogido el problema básico del contraste de hipótesis refiriéndolo sólo a la hipótesis nula.
Aceptar H0 Decisión Rechazar H0
Situación de H0 Verdadera Falsa Decisión Decisión Incorrecta Correcta Error Tipo II (1-α) (β) Decisión Decisión Incorrecta Correcta Error Tipo I (1-β) (α)
Debe quedar claro, que tanto las probabilidades de Tipo I como las del II son probabilidades condicionales. Nivel de significación = α = P(Error Tipo I) = P(Rechazar H0 H0 es verdadera)
5/12
Lógicamente al construir una prueba desearíamos que la probabilidad de cometer un error tipo I fuese pequeña. Dentro de este nuevo contexto la probabilidad correspondiente a un intervalo de confianza γ = 1 – α se la denomina ahora Nivel de Confianza y representa el complemento de la probabilidad P(Error Tipo I), es decir: Nivel de Confianza = 1 – α = 1 – P(Error Tipo I) = P(Se acepta H0 H0 es verdadera) β = P(Error Tipo II) = P(No poder rechazar H0 H0 es falsa) Por ejemplo, supongamos que establecemos la hipótesis nula H0 :µ=5. Para un tamaño n dado de muestra supóngase que se decide rechazar H0 si se observa un valor de la media muestral X = x * superior a 6, luego el valor X = 6 constituye el valor crítico, y el conjunto de valores superiores a 6 la región crítica de la prueba. La figura nos muestra como varían α y β al variar el valor crítico (cambio de 6 a 7).
Al valor complementario de β, se le denomina Potencia de la prueba y representa la capacidad o poder que tiene la prueba de reconocer correctamente que la hipótesis nula es falsa. Potencia de la Prueba = 1 – β = P(Rechazar H0 H0 es falsa) Lógicamente, de lo que se trata es que la potencia de la prueba sea grande, lo que nos lleva a una β pequeña. Dependiendo de la situación en que nos encontremos podemos estar interesados en disminuir el error tipo I o bien el error tipo II. Normalmente el error tipo I es el más grave por lo que le prestaremos especial atención. Al intentar cubrir los objetivos de que tanto α como β sean pequeñas nos conduce a llegar a un compromiso entre ambas. Para un tamaño de muestra n fijo, vemos que, al aumentar α disminuye β y viceversa. El llevar a cabo la reducción de ambos errores (conseguir los valores de α y β que deseamos) nos supone ir aumentando el tamaño de la muestra. Este aumento de la muestra no será indefinido, sino que su límite vendrá impuesto por nuestros intereses. No tiene sentido aumentar el tamaño de la muestra cuando su repercusión sobre α o β resulta inapreciable, lo cual supone un coste adicional. En la medida que sea posible elegiremos contrastes de hipótesis con un nivel de significación α prefijado y con la propiedad de que maximice la potencia de la prueba, 1 – β. El nivel de significación α es normalmente controlado por el experimentador, mientras que β o 1 – β es controlado mediante la elección apropiada del tamaño de la muestra.
6/12
De forma resumida podemos decir que las fases de un contraste de hipótesis son las siguientes: 1) 2) 3) 4) 5) 6) 7) 8)
Enunciado de la hipótesis nula H0 y de la alternativa H1 . Elección de un nivel de significación α. Especificación del tamaño n de la muestra. Selección del estadístico de contraste, cuya distribución debe ser conocida para H0 verdadera. Determinación de la región crítica. Cálculo del estadístico de contraste para la muestra observada. Conclusiones de tipo estadístico. Conclusiones de naturaleza no estadística, propias del campo de aplicación en estudio.
4. CARACTERÍSTICAS ESTADÍSTICA.
DE
LOS
FENÓMENOS
ASOCIADOS
A
LA
4.1. Recolección de Datos. Cuando deseamos saber algo acerca de la opinión, gustos, aspiraciones o simplemente características de la gente, el procedimiento que puede seguirse es preguntando a la población. Los tipos de encuesta pueden ser: • • •
Encuestas Personales. Cuestionarios a cumplimentar. Entrevistas telefónicas.
Todas estas Encuestas requieren de un cuestionario o lista de preguntas previamente confeccionadas con el objetivo de que nos proporcione la información deseada. La diferencia más importante entre ellos estriba en la mayor o menor presencia del entrevistador. En el cuadro que adjuntamos mostramos las ventajas e inconvenientes más sobresalientes de cada tipo de encuesta. Tipo de Entrevistas Entrevistas personales
Cuestionarios a cumplimentar
Entrevistas Telefónicas
Ventajas
Inconvenientes Puede intimidar o El entrevistador puede influir en las orientar, informar, etc. respuestas • Una parte importante pueden • Más baratos. no remitir los • No hay influencia cuestionarios. del entrevistador. • No podrá ser orientado. Rápidas
7/12
Deben ser Breves
Parece evidente que en cada caso particular, nos merecerá la pena una u otra opción, dependiendo de estos factores más o menos generales, o de otros que aquí no hemos considerado. La elaboración del cuestionario deberá perseguir el objetivo de conseguir esencialmente la información que necesitamos (los datos). La lista de preguntas a realizar constituye el cuestionario. Lo que nos interesa debe estar lo suficientemente bien definido como para que al llegar a ese punto no nos quede ninguna duda de la información que necesitamos. Los tipos de preguntas pueden ser cerradas o abiertas. En el primer caso la información es fácil de tabular, cosa que no sucede con las respuestas libres del segundo caso que, aunque matizan más la situación, son más difíciles de clasificar. 4.2. Parámetros y Estadísticos. El conjunto de individuos o cosas que consideramos en un estudio estadístico se llama Universo. Así, son distintos universos: • • •
Todos los Alumnos de la Universidad de Granada. Todos los alumnos de la Facultad de Ciencias. Todos los Profesores del Departamento de Estadística.
El universo debe estar perfectamente definido, de forma que no queden dudas sobre la pertenencia o no de un individuo al mismo. A sus componentes se denominan Unidades Estadísticas o Entidades Estadísticas. Su notación es: U = {u1 , u2 , ..., un } Dentro de un mismo universo podemos distinguir varias Poblaciones, que son todos los valores que adopta una característica determinada del universo. Dentro del universo “Alumnos de la Facultad de Ciencias” se podrían distinguir las Poblaciones de Edades (E), Alturas (A), Coeficiente de Inteligencia (C), o cualquier otra población (P):
U = {u1 , u2 ,..., un }
E = {e1 , e2 ,..., en } A = {a1 , a2 ,..., an } C = {c 1 , c2 ,..., cn} ................. P = {p 1 , p2 ,..., pn}
donde u1 es el primer individuo del universo y e1 , a1 , c1 su edad, altura y coeficiente de inteligencia, respectivamente. De la misma forma un es el último de los elementos del universo que está constituido por n elementos. Cualquier subconjunto de la población constituye una Muestra de la misma, que puede ser representativa o no. Si en una población dada determinamos con todos los elementos que la componen, valores tales como media, mediana, percentiles, varianza, coeficientes de correlación, etc. estamos calculando los Parámetros de la Población. Es decir, un parámetro es una propiedad descriptiva de la población.
8/12
Si en vez de trabajar con todos los elementos de la población trabajamos con un subconjunto de ella, denominado muestra, los mismos cálculos darían lugar a los Estadísticos de la Muestra, que son los valores que se aproximan a los parámetros, tanto más, cuanto más representativa es una muestra. Así pues, un estadístico es una propiedad descriptiva de una muestra. Los parámetros se describen con letras griegas y los estadísticos con las letras latinas para distinguirlos: Parámetros
µ: Media Poblacional. σ2 : Varianza Poblacional ρ: Coeficiente de correlación de la población.
Estadísticos
X : Media de la Muestra. S2 : Varianza de la Muestra r: Coeficiente de correlación de la Muestra
4.3. Variables. Cuando estudiamos a los individuos de una población, nos interesamos por alguna de sus cualidades o propiedades. Un Carácter es una cualidad o propiedad inherente en las unidades estadísticas. Algunos son medibles, esto es, se pueden cuantificar, como por ejemplo la estatura, el peso o la edad de un individuo; pero hay otras que no, como son: la raza, el sexo, el estado civil, etc. A los primeros los denominamos Caracteres Cuantitativos y a los segundos Caracteres Cualitativos. Modalidades: Son las distintas maneras o situaciones posibles que puede presentar un carácter. Modalidades del Carácter cuantitativo “número de hijos”: 0, 1, 2, ... Modalidades del Carácter cualitativo “estado civil”: Soltero, casado, viudo, ... Variable Estadística: Valor que adopta un carácter en sus distintas modalidades. El término variable estadística esta referido a una propiedad mediante la cual podemos distinguir a los individuos de una muestra o de una población. Así, las personas difieren en cuanto al sexo, la edad, la inteligencia, etc. Estos caracteres reciben el nombre de variables estadísticas, en cuanto a que los valores atribuidos a las correspondientes permiten diferenciar a los sujetos. Una Variable Nominal es aquella propiedad de los individuos de un grupo que queda definida mediante una operación que nos permite obtener información únicamente acerca de la igualdad o desigualdad de dichos individuos en tal propiedad. Así, respecto a la variable sexo, sólo podemos informar de que el sexo de un individuo es igual o diferente al de otro. Una Variable Ordinal es aquella propiedad de los individuos de un grupo que queda definida mediante una operación que nos permite la ordenación de dichos individuos respecto a la propiedad en cuestión. Es decir, ésta nos informa no sólo respecto de la igualdad o desigualdad, sino del sentido de éstas (mayor que, menor que).
9/12
Una Variable Cuantitativa es aquella propiedad que queda definida mediante una operación que nos permite informar bien de la igualdad de diferencias entre individuos respecto de tal propiedad (variable de intervalo), bien de la igualdad de razones. Es decir, que dados dos individuos podemos informar acerca de que uno posee tal propiedad en una cantidad doble, triple, etc. que el otro. La temperatura es un ejemplo de variable de intervalo; se caracteriza por tener un origen arbitrario, pero una unidad de medida constante; el cero no indica ausencia de temperatura. Un ejemplo de variable de razón la tendríamos en el peso. Otra clasificación de las variables cuantitativas la tendríamos atendiendo al número de posibles valores que éstas puedan tomar. Así, tendríamos variables Discretas y Continuas. Discretas: Continuas:
Si toman un número finito o numerable de valores. Cuando el número de valores que pueden tomar es infinito y no numerable.
5. APLICACIONES. 5.1. La Variabilidad Biológica. Los datos que proporcionan otras ciencias experimentales como la Física, la Química, etc. son cualitativamente distintos a los que proporcionan las Ciencias de la Salud. En las primeras, la repetición de los experimentos en condiciones idénticas dan lugar a resultados idénticos, salvo error de manipulación del experimentador o el error inherente al aparato de medida utilizado. Así, el tiempo que tarda en caer un objeto desde 1 metro de altura es siempre el mismo (si se mantiene constante el objeto, la posición, la densidad del aire, etc...). Las Ciencias de la Salud son otro asunto. Aparte de la variabilidad por causa de la imprecisión del aparato de medida (cronómetro, en el ejemplo anterior), las disciplinas anteriores añaden el problema de la variabilidad biológica de los sujetos experimentales: dos seres vivos nunca son iguales, ni un mismo individuo es igual a sí mismo en diferentes etapas de su vida. Aquí los fenómenos son fundamentalmente impredecibles en sus resultados, y las afirmaciones acerca de ellos sólo pueden hacerse en términos de probabilidad o posibilidad. El modo de obtener resultados científicamente válidos a partir de datos que son fundamentalmente impredecibles es a través de técnicas estadísticas, técnicas que son las únicas capaces de tener en cuenta la variabilidad aludida, pues ella es consustancial con su metodología. 5.2. La Información en las Ciencias de la Salud. Hemos asistido a lo largo de los últimos años a una creciente cuantificación de la información disponible en las Ciencias de la Salud. Así, el tipo de información cualitativa clásicamente manejada en este campo (color de la piel, estado general de ánimo del individuo, aspecto de las heridas, etc...) ha quedado postergada a ocupar una posición menor frente a informaciones más precisas de tipo numérico (glucosa, bilirrubinemia, presión sanguínea, etc...). La Estadística efectúa el tratamiento adecuado
10/12
de tales datos cuantitativos y cuantifica la información proporcionada por los cualitativos, haciendo abandonar al profesional las clásicas posturas pragmáticas y ayudándole a profundizar y comprender el fundamento científico de su área de trabajo. 5.3. La Investigación en el campo de las Ciencias de la Salud. En toda investigación experimental podemos distinguir tres etapas: 1) Diseño. 2) Recopilación de datos. 3) Análisis de los resultados y obtención de las conclusiones. En las tres el papel de la Estadística resulta fundamental. En la fase de diseño porque éste debe hacerse de modo que las afirmaciones que se obtengan sean válidas para el conjunto de individuos de interés y no sólo sobre una parte no prevista de ellos. Además, una misma experiencia puede diseñarse en diversos modos, y siempre hay uno que, siendo menos costoso, origina una máxima eficacia. Ambos aspectos son controlados por la Estadística, pero esta es la fase que con menos frecuencia se acude a ella. La fase de recopilación de datos requiere algún conocimiento acerca de las precauciones al obtenerlos y el modo de presentarlos, pero el papel de la Estadística es menor. La fase de análisis de resultados no puede llevarse a cabo sin el método estadístico, que es el que realiza el análisis y valida las conclusiones. En la literatura científica en general suelen encontrarse expresiones tales como “según nuestra experiencia”, “a nuestro juicio”, “en nuestra opinión”, “los datos parecen mostrar que”, etc. en base a las cuales, y apoyados en datos de tipo descriptivo, se extraen conclusiones pretendidamente científicas. El daño causado por tal tipo de justificaciones ha sido apreciable. Se hubiese ahorrado mucho esfuerzo y trabajo si el investigador hubiera sometido sus observaciones e hipótesis a pruebas estadísticas antes de su publicación. El reconocimiento de este hecho en los últimos tiempos ha dad impulso a las técnicas estadísticas vinculadas estrechamente con las Ciencias de la Salud. Es clásico el estudio de Freimann (1978) sobre una muestra de artículos de una revista científica de prestigio en el que detectó un 50% de artículos con tratamiento estadístico inexistente o inadecuado, y un 72% de artículos con un diseño incorrecto. Los planteamientos o afirmaciones falsas que ocurrieron fueron patentes. 5.4. La Calidad en Ingeniería. Los métodos de control estadístico de la Calidad en Ingeniería tienen por objeto determinar, sin tener que examinar cada uno de los materiales fabricados, si éstos verifican ciertas condiciones sin las cuales la producción debe rechazarse.
11/12
5.5. La Estadística en las Ciencias Físicas. En Física nos encontramos con variedad de aplicaciones de la Estadística. • •
Experimentos relativos a desintegración por radiactividad, como el método del Carbono 14. En Telefonía, el número de enlaces que se necesitan para que no se produzca saturación de las líneas a determinadas horas.
5.6. Aplicación a los Seguros. Por lo que hemos visto, la Estadística nos puede servir para prevenir. La aplicación más antigua es la de los seguros, en la que sobre la base de las tablas de mortalidad, se puede predecir el número de accidentes de un cierto tipo de futuro, lo cual constituye la base de los cálculos actuariles. 5.7. Otras Aplicaciones. En Economía, podemos aplicarla para encontrar la demanda futura de algún bien, según las necesidades pasadas y presentes. En Lingüística puede comprobar si una Lengua proviene o no de otra. La fecha aproximada de separación de dos Lenguas determinadas. El análisis de obras de dudosa paternidad, etc.
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Teoría de la Estadística. Aut.: Mood/Graybill. Ed. Aguilar. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa. Ed. PPU
12/12
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 58 POBLACION Y MUESTRA. CONDICIONES DE REPRESENTATIVIDAD DE UNA MUESTRA. TIPOS DE MUESTREO. TAMAÑO DE UNA MUESTRA. 1. Introducción. 2. Tipos de Muestreo. 3. Estimación. 3.1. Propiedades de un Buen Estimador. 3.1.1. Estimadores Centrados. 3.1.2. Consistencia. 3.1.3. Eficiencia. 3.1.4. Suficiencia. 3.2. Métodos de Estimación Puntual. 3.2.1. Estimación por Máxima Verosimilitud. 3.2.2. Método de los Momentos. 3.2.3. Método de Mínimos Cuadrados. 3.3. Estimación por Intervalos. 4. Estadísticos. 5. Errores de Muestreo. 6. Estimación Puntual. 6.1. Nivel de Confianza. 6.2. Cálculo del Tamaño de una Muestra que corresponde a un Error. 6.3. Estimación de la Varianza. 6.4. Tamaño de la Muestra de la Varianza. 6.5. Estimación de la Proporción. 6.6. Tamaño de una muestra de la Proporción. Bibliografía Recomendada.
1/19
TEMA 58 POBLACION Y MUESTRA. CONDICIONES DE REPRESENTATIVIDAD DE UNA MUESTRA. TIPOS DE MUESTREO. TAMAÑO DE UNA MUESTRA. 1. INTRODUCCIÓN. El objetivo de la Estadística es hacer una inferencia con respecto a la población basándose en la información contenida en una muestra. Como las poblaciones se describen mediante medias numéricas denominadas parámetros, el objetivo de la mayoría de las investigaciones estadísticas es hacer una inferencia con respecto a uno o más parámetros de la población. La generalidad de los procedimientos de la inferencia estadística involucran ya sea la estimación o bien la prueba de hipótesis 2. TIPO DE MUESTREO. Llamaremos muestra a la parte de la población que utilizamos para conocer a toda la población, aunque sea de un modo aproximado. Las muestras deben cumplir las siguientes condiciones: a) Ser Representativa. Esta condición está asociada al tamaño de la muestra n, ya que cuanto más grande sea n es evidente que más información proporcionará, y por lo tanto, más representativa. A su vez, el tamaño de la muestra también depende de la dispersión ya que, si la población esta muy dispersa, tendremos que coger una muestra de gran tamaño, para no perder mucha información. b) Ser Aleatoria. Todos los análisis estadísticos se basan en que la muestra sea aleatoria, es decir, que todos los elementos de la población tienen la misma probabilidad de formar parte de la muestra. En caso contrario, corremos el peligro de coger una subpoblación, que es un subconjunto de la población que cumple una determinada condición, con lo cual perdemos el principio de representatividad. En el caso de que se pierda la aleatoriedad y, por lo tanto la muestra no sea del todo representativa, se dice que se han cometido errores de Sesgo. Otro fallo a la hora de elegir una muestra es que una variable condicione a otra, ya que las variables deben ser independientes y no condicionadas. Ejemplo. Un ejemplo de una muestra representativa y aleatoria es coger cinco números con dos decimales utilizando la función de Randomize, donde la población es de N=99 y la muestra es n=5. 0’61, 0’39, 0’30, 0’44, 0’12, 0’57
2/19
Para aumentar la representatividad sin necesidad de aumentar el tamaño de la muestra se recurre al muestreo o técnicas de muestreo. En la práctica resuelven el problema de la representatividad. Hay varios tipos de muestreo: a) Muestreo Aleatorio Simple. Se realiza en poblaciones en las que los datos son homogéneos. Es decir, no existen factores que produzcan variabilidad sistemática. en este tipo de muestreo los elementos de la población homogénea se eligen al azar. b) Muestreo Aleatorio Estratificado. Si en la población existe variabilidad, este muestre consiste en descomponer la población en partes que se llaman estratos, de manera que dentro de cada estrato los elementos sean homogéneos, siendo diferentes los elementos de estratos distintos. Posteriormente se realiza un muestreo aleatorio simple en cada estrato, obteniéndose así la muestra. Criterios de Estratificación. Se deben coger como estratos aquellos factores que producen variabilidad de los datos. Por ejemplo, en las alturas de los españoles, los criterios de estratificación son: • • •
Edad: E1 , E2 , E3 Sexo; H, M Zona: Rural, Urbana E1 Rural
E2 Urbana
Rural
E3 Urbana
Rural
Urbana
H M Los cuadros representan a los estratos. Si llamamos Ni al tamaño del estrato y ni al tamaño de la muestra del estrato, la proporción que existe entre el tamaño de la muestra del estrato y el del estrato coincide con la proporción que existe entre el tamaño total de la muestra y el de la población. ni n = Ni N c) Muestreo por conglomerados Se aplica cuando la población presenta heterogeneidad y se actúa de la siguiente manera: Paso 1: Se descompone la población en clases llamadas conglomerados, de forma que dentro de cada conglomerado haya la máxima dispersión o heterogeneidad (es decir, que haya de todo), de tal forma que los conglomerados se parezcan entre sí.
3/19
Paso 2: Para elegir la muestra se realiza un muestreo aleatorio de conglomerados. Cuando se elige un conglomerado, todos los elementos del mismo forman parte de la muestra. d) Muestreo Sistemático. Se realiza cuando los elementos se encuentran en una lista. Una vez que se elige un número, el resto ya está condicionado. Para introducir la aleatoriedad, se dice por donde se empiezan a coger los elementos. Ejemplo. Si en una lista hay 100 números y deseamos coger 25 de ellos, elegiremos uno al azar entre los cuatro primeros y, a partir de ese momento, tomamos los elementos cada cuatro. e) Muestreos Polietápicos. Los muestreos estratificados se realizan de la siguiente manera: se forman estratos y después se hace un muestreo (de los tipos anteriores), luego se hace otro, etc. Además, los tipos de muestreo pueden ser con reemplazamiento o sin reemplazamiento. • •
Muestreo sin reemplazamiento. Una vez tomado un elemento no se devuelve a la población. Muestreo con reemplazamiento. El elemento elegido sí se devuelve a la población, pudiendo ser seleccionado de nuevo.
3. ESTIMACIÓN. Iniciaremos el estudio estadístico de colectivos (población) mediante la elección de unos pocos (muestra), de los que inferiremos las características de toda la población. La Estadística Inferencial tratará de obtener información acerca de los parámetros poblacionales a partir de la muestra. Los Estimadores son variables aleatorias utilizadas `para estimar parámetros de la población. Los estimadores que proporcionan un único valor para el parámetro poblacional se denominan Estimadores Puntuales, mientras que los que especifican un intervalo de valores se denominan Estimadores por Intervalos. Para llevar a cabo tales estimaciones es necesario que la muestra sea representativa de la población, para lo cual ha de ser aleatoria en su selección y poseer un adecuado tamaño. 3.1. Propiedades de un Buen Estimador. Para que un estadístico sea considerado un buen estimador de un parámetro dado, conviene que reúna las siguientes propiedades:
4/19
• • • •
Ser Insesgado (centrado) Ser Consistente. Ser Eficiente. Ser Suficiente.
Sea un estadístico (’ del que nos vamos a servir para estimar un parámetro (. 3.1.1. Estimadores Centrados. Diremos que θ’ es un Estimador Centrado o Insesgado de θ si se verifica que E(θ’)=θ. Por el contrario, diremos que el estimador es Sesgado si E(θ’)=θ+b(θ), y se denomina Sesgo del estimador a la cantidad b(θ)=E(θ’) – θ. 3.1.2. Consistencia. Un estadístico θ’ utilizado para estimar un parámetro θ es consistente si para n tendiendo a infinito, se verifica que θ’→θ en probabilidad, para lo cual es suficiente que se cumplan las dos condiciones siguientes: i) Que sea Asintóticamente Centrado: ii) Que la Varianza tienda a Cero:
E(θ’) → θ Var(θ’) → 0
3.1.3. Eficiencia. Si para estimar un mismo parámetro θ tenemos dos estimadores asintóticamente centrados θ’ y θ’’, decimos que θ’ es más eficiente que θ’’ si la varianza del primero es menor que la del segundo. Esto es, si Var(θ’) ≤ Var(θ’’). La Eficiencia Relativa de θ’’ respecto de θ’ se define como el cociente entre ambas varianzas: Var (θ ' ) efr(θ '| θ ' ' ) = Var (θ' ' ) 3.1.4. Suficiencia. Un estimador θ’ del parámetro θ es Suficiente si contiene tanta información como la contenida en la propia muestra. Dicho de otra forma: Diremos que un estadístico T=T(X1 ,X2 ,...,Xn ) es Suficiente para θ si la distribución de X1 , X2 , ..., Xn dado T es independiente del valor del parámetro. 3.2. Métodos de Estimación Puntual. La Estimación Puntual constituye el método más elemental de asignar los valores obtenidos de la muestra (estadísticos) a toda la población (parámetros). En los métodos de estimación puntual se busca un estimador, con base en los datos muestrales, que proporcione un único valor del valor del parámetro. Estimar un parámetro θ no es más que dar una función de las observaciones que no dependa, por tanto, del parámetro desconocido: 5/19
θ’ = θ’(X1 , X2 , ..., Xn ) así pues, para cada valor de la muestra asigna un valor al parámetro θ. A esta función se la denomina Estimador y a sus valores Estimaciones del Parámetro. 3.2.1. Estimación por Máxima Verosimilitud. Este método selecciona como estimación aquel valor del parámetro que tiene la propiedad de maximizar el valor de la probabilidad de la muestra aleatoria observada. En otras palabras, el método de máxima verosimilitud consiste en encontrar el valor del parámetro que maximiza el valor de la función de verosimilitud. Si denotamos a la función de verosimilitud por L, es decir, la función de probabilidad de la muestra (caso discreto) o la de densidad de probabilidad (caso continuo), en ambos casos la función depende del parámetro desconocido (o parámetros) θ, con lo que tenemos: n
L(θ; X 1 , X 2 , K , X n ) = ∏ f ( X i ; θ ) i =1
para una muestra aleatoria simple X1 , X2 , ..., Xn de una distribución con función de probabilidad o densidad de probabilidad f(x;θ). La función L(θ; x1 , x2 , ..., xn ), considerada como función del parámetro θ, recibe el nombre de Función de Verosimilitud de la Muestra. Si t=g(x1 , x2 , ..., xn ) es el valor de θ para el cual el valor de la función de verosimilitud es máxima, entonces T=g(X1 , X2 , ..., Xn ) es el estimador de máxima verosimilitud de θ. Así pues, el estimador máximo verosímil debe satisfacer la ecuación: L(θ’; X1 , X2 , ..., Xn ) = maxº L(θ; X1 , X2 , ..., Xn ) θ∈Θ
donde Θ es el Espacio Paramétrico (conjunto de posibles valores del parámetro θ). El método de máxima verosimilitud tiene la propiedad de proporcionar estimadores que son funciones de estadísticos suficientes si y sólo si el estimador de máxima verosimilitud es único. Debido a la naturaleza de la función de verosimilitud resulta a menudo mucho más fácil de obtener el estimador máximo verosímil del logaritmo neperiano de dicha función, Ln[L(θ; X1 , X2 , ..., Xn )], que de la propia función L(θ; X1 , X2 , ..., Xn ). 3.2.2. Método de los Momentos. Este método es quizás el más antiguo para la estimación de parámetros. Consiste en igualar un determinado número de momentos teóricos de la distribución de población con los correspondientes momentos muestrales para obtener una o varias ecuaciones que, una vez resueltas, permiten estimar los parámetros desconocidos de la distribución poblacional.
6/19
3.2.3. Método de Mínimos Cuadrados. El método de Mínimos Cuadrados, introducido por Legendre y Gauss, consiste en buscar los valores de los parámetros que minimizan una cierta función cuadrática de los mismos (la suma de los cuadrados de los errores). Estos métodos son interesantes debido a sus propiedades asintóticas, pues para muestras grandes: Suelen dar estimadores asintóticamente centrados, es decir, con un sesgo despreciable. Por lo general, son asintóticamente normales, es decir, que su distribución de probabilidad es aproximadamente normal. 3.3. Estimación Por Intervalos. Aún el estimador centrado más eficiente es improbable que estime con exactitud el valor del parámetro de la población. De aquí nace la necesidad de obtener un intervalo dentro del cual se espera hallar el valor del parámetro, lo que nos lleva a la Estimación por Intervalos. Una estimación por intervalos de un parámetro θ de la población es un intervalo de la forma θL < θ < θU donde θL y θU dependen de las observaciones muestrales. Puesto que muestras diferentes generalmente proporcionarán valores diferentes de θL y θU, estos puntos extremos del intervalo son valores aleatorios y se buscan de modo que fijado γ entre 0 y 1 se verifique que P(θL < θ < θU)=γ El Intervalo θL < θ < θU obtenido a partir de la muestra seleccionada recibe el nombre de Intervalo de Confianza. El valor γ se denomina Coeficiente de Confianza. Los valores θL y θU son respectivamente Límite de confianza Inferior y Límite de Confianza Superior. 4. ESTADÍSTICOS. Definimos como Estadístico cualquier función que dependa de los valores de la muestra. Distintos tipos de Estadísticos: 1) Media Muestral.
X=
X1 + X 2 +K + Xn n
Se diferencia de la media poblacional µ en que X es una función y µ es un parámetro.
7/19
n
s2 =
2) Varianza Muestral.
∑ (x
− X)
i
2
i =1
n
Se diferencia de la varianza poblacional, ya que σ2 es un número. n
∑ (x
i
3) Cuasivarianza Muestral.
S2 =
− X)
2
i =1
n −1
4) Proporción Muestral. Se define para valores cualitativos donde x=nº de casos con x cualidad y n=tamaño de la muestra. Se define por: p = n 5) Proporción Poblacional. Se define por Π La media muestral puede tomar un conjunto de valores que dependen de las variables X1 , X2 , ..., Xn . Los valores que puede tomar un Estadístico t1 , t2 , ..., tn forman la población del estadístico. La distribución de frecuencias o de probabilidad se llamará Distribución del Estadístico. Ejemplo. Dada la población {1,3,5,7} con µ=4 y σ2 =5, calcular la distribución del estadístico de X de tamaño 2: X=
X1 + X2 2 1 2 3 4
Valores que puede tomar el Estadístico:
2 3 4 5
3 4 5 6
4 5 6 7
La media de las medias muestrales es: µX =
1 + 2·2 + 3·3 + 4·4 + 3·5 + 2·6 + 7 =4 16
que coincide con la media de la población. La varianza de las medias muestrales σ X2 = población dividida por n. Entonces: σ X2 =
σ2 n
8/19
5 , que coincide con la varianza de la 2
Por lo tanto, la distribución del Estadístico de X se ajusta a una distribución normal σ2 de media µ y varianza .Así pues: n σ2 X → N µ, n TEOREMA. Teorema Central del Límite. Cuando la población es Normal, la distribución del estadístico es Normal, con media σ2 µ y varianza . n 5. ERRORES DE MUESTREO. Calculemos la varianza de la media muestral para establecer la precisión de las estimaciones: 2
2
n n ∑ xi ∑ xi 2 i =1 i =1 σ (x ) = E − E (x ) = E −X = n n 2
n 1 n 1 n = 2 E ∑ ( xi − X ) = 2 E ∑ (x i − X ) + 2∑ (x i − X )(x j − X ) n i =1 n i≠ j i =1
Ahora bien: n n N −1 2 2 2 E ∑ (xi − X ) = ∑ E (xi − X ) = n·V = n· S N i =1 i =1 N
n n n E ∑ (xi − X )( x j − X ) = ∑ E ((x i − X )(x j − X )) = ∑ i≠ j i≠ j i≠ j
∑ E (( X
Por otra parte: 2
N N N 2 0 = ∑ (X i − X ) = ∑ ( X i − X ) + 2∑ ( X i − X )( X j − X ) i =1 i =1 i≠ j
9/19
i
− X )(X j − X ))
i≠ j
n 2
Luego: n
∑ E (x
i
n
− X )(x
N n 2 1 2 ( ) Xi − X = ∑− ·V ∑ N ( N − 1) i = 2 i≠ j N −1
− X ) = ∑ −
j
i≠ j
i≠ j
Sustituyendo tenemos: σ 2 (x ) =
=
N −1 2 n 1 N − 1 2 n −1 N − 1 2 1 n· = S − · 2 · · V n N ·S − N − 1· N S = N 2 N − 1
1 n2
1 2 N − n N − n 2 N − n V ·N N −n V S S = · = · = n N Nn Nn N − 1 N − 1 n
Así pues: N − n 2 S σ 2 ( x ) = Nn N −n V · N −1 n
en función de la cuasi var ianza poblaciona l en función de la var ianza
S
poblaciona l V
PROP La cuasivarianza muestral es un estimador insesgado de la varianza poblacional. Dem. Probaremos que E(s2 )=S2 n
∑ (x
i
s2 =
− x)
2
1 n 2 E ∑ (x i − x ) n − 1 i =1
( )
i =1
E s2 =
n −1
Ahora bien: n
n
∑ (x − x ) = ∑ [(x − X ) − (x − X )] 2
2
i
i
i =1
=
i =1
n
[(
)
2
= ∑ xi − X i =1
n = ∑ xi − X i =1
(
n
)
)(
2
(
)∑ (x − X ) + (x − X ) =
2
n
−2 x − X
2
i
i =1
(
)
((
) − n(x − X ) )
= ∑ xi − X
) (
) ]=
(
− 2 xi − X · x − X + x − X
2
(
)(
) (
−2 x − X nx −nX +n x − X
i =1 n
= ∑ xi − X i =1
2
2
10/19
)
2
=
Entonces: E (s2 ) =
[(
1 n ∑ E xi − X n − 1 i =1
) − nE(x − X ) ] = 2
2
1 N −n V 1 n −1 n·V − n· · = ·V · ·N = S 2 n −1 N −1 n n −1 N −1 A la raíz cuadrada de la varianza de la media muestral se le llama error de muestreo, y su valor es: N −n V · N −1 n
σX =
o también
σX =
N −n S · N n
Llamaremos Factor de Corrección para Poblaciones Finitas a
N −n . N
Si la población es infinita (N→∞) se obtiene que el error de muestreo es el cociente de la derivación típica poblacional y la raíz cuadrada del tamaño muestral n. En el caso de una proporción, al tratarse de una media, resulta que la proporción muestral es un estimador insesgado de la proporción poblacional y N −n S2 σ ( P) = · N n 2 ρ
pero en este caso S2 se puede simplificar más
S2 =
1 N ∑ x −X N − 1 i =1 i
(puesto que
(
)
2
=
N
N
i =1
i =1
(
N N xi − X ·∑ N − 1 i =1 N
N 2 ∑ xi 2 N i =1 N N = −X = (P − P 2 ) = PQ N −1 N −1 N N −1
)
2
∑ xi2 = ∑ xi al tomar xi los valores 0 y 1, y Q=1 – P) con lo que el error
de muestreo de la proporción es σp =
N − n N PQ · · = N N −1 n
N − n PQ · N −1 n
6. ESTIMACIÓN PUNTUAL. TAMAÑO DE UNA MUESTRA. Consiste en asignar valores a un parámetro de la población a partir de los valores de la muestra, donde la media tiene un valor determinado que es estimado, no calculado. 11/19
Para ello se usan los estimadores, que son los estadísticos que dan valores aproximados del parámetro que se quiere estimar. Estimador X S2 P
Parámetro µ σ2 Π
La media µ de la población es aproximadamente la que obtenemos como media de la muestra, y lo mismo ocurre con la varianza. Pero para saber como es de “aproximado” debe conocerse el grado de aproximación que viene dado por la llamada Cota de Error e. σ e = K· n La cota de error la utilizamos para estimar la media de la población mediante el estimador media muestral. Debemos saber que la cota de error depende de la dispersión del estadístico. Tenemos que el estadístico es: σ2 N → N µ, n
con
( X1 , X 2 ,K, X n )
Se pueden tomar los valores de X, pues todos tienen 0 o se ajustan a la misma distribución normal. En una muestra n-dimensional (X1 , X2 , …, Xn ) se tiene que: Xi µ σ2 → N , 2 n n n
donde n X1 + X 2 + K + X n X =∑ i n i =1 n por lo tanto podemos ver que la suma de variables normales es también normal y son idénticamente distribuidas e independientes. Se tiene que:
X=
µ σ2 σ2 N n· , n· 2 → N µ, n n n Para saber cuanto vale la media de una población se obtiene una muestra y se toma la media de la misma como estimador. El problema está en que la cota de error no es segura, ya que todavía no sabemos el valor que debe tomar K. Para ello debemos plantearnos que nivel de confianza queremos en nuestra estimación.
12/19
6.1. Nivel de Confianza. Se mide en términos probabilísticos, donde K se determina en función del nivel de confianza: P X − µ < e = 1−α (1)
(
)
Para que esto suceda con una probabilidad elevada, se necesita conocer el nivel de confianza, es decir, 1 – α (donde para que el nivel de confianza sea alto debe ocurrir que α sea muy pequeño). El nivel de confianza se define como “la probabilidad de que la diferencia entre el estimador y el parámetro que se quiere estimar sea menor que la cota de error”, o sea (1). El nivel de confianza suele establecerse entre 0’95 y 0’99, es decir σ P X − µ < K =1 − α n Tipificando se tiene que: X−µ P < K = 1 −α ⇒ σ n Por lo tanto tenemos que
P (Z < K ) = 1 − α
K = Zα
donde Z≡N(0,1).
2
Y de aquí deducimos que el error es
e = Zα · 2
σ n
Debemos saber que la cota de error depende de: • • •
De la dispersión de la población. Del tamaño de la muestra. Del Nivel de Confianza.
Ejemplo. Notas de Bioquímica {8, 8’33, 8, 8’1, 7, 6, 8’9, 7’2, 7’8, 8’5} Z α = 1'96
σ= 2 X = 7'78
1 − α = 0'95 ⇒
⇒ e = Zα ·
σ 2 = 1'96· = 1'24 n 10
2
y obtenemos que
Podemos tomar
µ = 7'78 ± 1'24
13/19
2
Z
1−
α 2
= 0'975
6.2. Cálculo del Tamaño de una Muestra que Corresponde a un Error. Si definimos “e” como el error máximo admisible, y partimos de la fórmula del σ error e = Zα · se tiene que: 2 n σ e = Zα · ⇒ 2 n
n e = Zα ·σ
n=
Z α ·σ
⇒
2
2
e
Esta fórmula la aplicaremos porque conocemos Zα
⇒ n=
Z α2 ·σ 2 2
e2
y porque “e” lo damos 2
nosotros. Sin embargo, esta fórmula sólo nos sirve para muestreos sobre poblaciones infinitas o finitas con reemplazamiento. Por lo tanto, para poblaciones finitas utilizaremos esta otra fórmula: eN = Zα · 2
N −n σ · N −1 n
Esta fórmula del error para poblaciones finitas aparece a partir de la de poblaciones N −n infinitas, pero añadiéndole un término llamado Factor de Corrección, que es , N −1 siendo N el tamaño de la población y n es el tamaño de la muestra. Además, podemos N −n decir que este factor de corrección disminuye el error, ya que <1, por razones N −1 obvias. En el caso, ahora, de que queramos calcular el tamaño de una muestra para poblaciones finitas, utilizaremos la fórmula: n∞ n −1 1+ ∞ N
nN =
Por lo tanto, recapitulando tenemos que: Error Población Infinita
e = Zα · 2
Población Finita
eN = Zα · 2
σ n
N −n σ · N −1 n
14/19
Tamaño de la Muestra Z α2 ·σ 2 n = 22 e n∞ nN = n −1 1+ ∞ N
6.3. Estimación de la Varianza. También se puede estimar la varianza mediante la cuasivarianza S2 = pero como Zα
1 n ∑ xi − X n −1 i =1
(
)
2
procede de una distribución normal y la cuasivarianza no, tenemos que 2
establecer una nueva fórmula del error, que es: S n Como vemos, aparece un término nuevo que es la distribución continua t-Student, que depende del nivel de confianza α que queramos para la cota del error y de los grados de libertad n-1, donde n es el tamaño de la muestra. e∞ = t α , n −1 ·
Análogamente a lo hecho antes, podemos establecer una fórmula para la cota del error pero en poblaciones finitas, que dependen de la cuasivarianza: E N = t α , n −1 ·
S N −n · n N −1
OBS Vamos a establecer una relación entre la varianza y la cuasivarianza, de manera que podamos conocer la cota de error, conocida una o conocida la otra. n
S 2=
∑ (x
i
−X
)
2 n
i =1
⇒
n −1 n
s2 =
∑ (x
i
−X
i =1
n
∑( i =1
)
2
⇒
o lo que es lo mismo
2 xi − X = S 2 ·( n −1) ⇒ n 2 2 xi − X = S ·n ∑ i =1
)
(
S2 s2 = ⇒ n n −1
S = n
s n −1
)
n − 1·S = n ·s
Por lo tanto se tiene que: Error Población Infinita Población Finita
e∞ = t α , n −1 · E N = t α , n −1 ·
S n
S N −n · n N −1
ó ó
e∞ = t α , n −1 ·
S n −1
E N = tα ,n −1 ·
S N −n · n −1 N −1
Ejemplo. Se quiere medir la efectividad de un somnífero. Para ello se aplica a 17 personas que duermen una media de 8’2 h. Con una desviación de 0’25 h. Estimar la efectividad del somnífero con una confianza del 95%.
15/19
Resolución. Como la conclusión que queremos sacar es general, supondremos una población infinita. n = 17 X = 8'2 s = 0'25 1 − α = 0'95 La efectividad del somnífero es el estimador X . Tenemos que calcular el error, ya que X =8’2 horas. e∞ = t α , n −1 ·
S n −1
como α=0’05 y n-1=16 Entonces e∞ = 2'12·
entonces t0’05,16=2’12
0'25 = 0'13 horas. 16
Luego µ= X ±e∞=8’2±0’13 horas ⇒ µ∈(8’07,8’33) 6.4. Tamaño de la Muestra de la Varianza. Existe ahora un problema, porque para conocer el tamaño de la muestra necesitamos más datos, ya que hasta ahora hemos partido de la muestra ya extraída. Para ver el tamaño de la muestra, hemos de tener en cuenta la Paradoja de Friedman que dice que cuando no conocemos la varianza y queremos saber el tamaño de la muestra, debemos usar una de estas tres opciones: 1) La varianza de un estudio similar. 2) La varianza de una muestra piloto. 3) Una muestra lo más grande posible. Ejemplo. Queremos estimar la efectividad de un fármaco con un error de 1 minuto (máximo). ¿Cuántos pacientes tendrían que recibir el fármaco? 1 60 Z 2 ·σ 2 1 − α = 0'95 ⇒ n = α 2 ∞ e2 α = 0'05 Zα = 1'96 = t α , ∞ 2 e=
16/19
La expresión anterior no podemos resolverla ya que nos falta la varianza y al no tener una muestra similar, podemos calcularla a partir de la muestra del ejemplo anterior, aunque la varianza de la muestra piloto no es la varianza que buscamos, pero se aproxima. n∞ =
1'96 2 ·(0'25) 2 1 60
2
= 864'36 ≈ 865
Para no perder precisión aproximamos por arriba. Cuando queremos reducir el error a la mitad necesitamos aumentar el tamaño de la muestra cuatro veces. e' = Zα · 2
σ σ 1 σ 1 = Zα · = Zα · = e 2 2 n 2 2 n 2 4n
Para poblaciones pequeñas, si ésta se duplica, el tamaño de la muestra también se duplica. Si ésta vuelve a duplicarse, da un resultado mayor, pero llega un momento en el que por mucho que aumente la población, su tamaño no influye en el de la muestra. n∞ n = ∞ = n∞ N →∞ n −1 1 + 0 1+ ∞ N
Lim
6.5. Estimación de la Proporción. Si definimos Π como la proporción poblacional y definimos p como la proporción p(1 − p) muestral, la cual se ajusta a una distribución N Π , donde n es el tamaño n muestral, se tiene que las cotas de error para poblaciones finitas e infinitas son: e∞ = Z α · 2
p (1 − p) n
Cota de error para poblaciones infinitas.
Y añadiéndole el factor de corrección:
E N = Zα · 2
p(1 − p) N − n · n N −1
Cuando queramos estimar el Intervalo de Confianza de la Proporción Poblacional, éste nos vendrá dado por la proporción muestral y por la cota de error. Es decir: Π ≈ p* ± e* donde p* =p*100 y e* =e*100, que se dan en tanto por ciento.
17/19
6.6. Tamaño de una Muestra de la Proporción. Para una población infinita se tiene que, despejando n de la fórmula de la cota de error: Zα2 · p·(1 − p ) n∞ = 2 2 e Pero esta fórmula no nos sirve, pues no tiene sentido que si queremos hallar el tamaño de la muestra, estemos utilizando la proporción muestral. Por tanto, para poder solucionar este problema, sustituimos en la fórmula la proporción muestral por la proporción poblacional. Zα2 ·Π ·(1 − Π ) n∞ = 2 2 e El problema se plantea cuando tampoco conocemos Π. Entonces la pregunta sería ¿Cómo estudiar Π sin conocerlo? La solución a este problema consiste en elegir una de las siguientes opciones: 1) Tomar Π de un estudio similar. 2) Tomar Π de una muestra piloto. 3) Darle a Π el valor que haga máximo a n. Es decir, nos planteamos el caso más desfavorable de modo que así no podamos errar, y dicho valor es Π=0’5. El tamaño de una muestra para poblaciones finitas se obtiene mediante la siguiente fórmula: n∞ nN = n −1 1+ ∞ N Π donde h es el índice de proporción de h error. Es decir, si h=2 es porque se quiere un error que sea la mitad de la proporción poblacional. Entonces, utilizando esta relación se tiene que: OBS. Podríamos establecer la relación e =
n∞ =
Zα2 ·Π ·(1 − Π ) 2
2
⇒
1 n∞ = Zα2 ·h 2 · − 1 2 Π
Π h2 Ejemplo. ¿Qué tamaño de muestra se necesitaría para estimar el porcentaje de fumadores de la Región de Murcia, sabiendo que en un estudio anterior se conoció que fumaban el 30%, y que podemos permitirnos un error máximo del 5%? Sabemos que: 1 − α = 0'95 ⇒
Z α = 1'96 2
e = 5% ⇒ e = 0’05 Π ≈ 30% ⇒ Π ≈ 0’3
18/19
n∞ =
Zα2 ·Π ·(1 − Π ) 2
e2
2 ( 1'96) ·0'3·0'7 = = 322'7 ≈ 323
0'05 2
Ejemplo. Si quisiéramos hacer un estudio para saber a cuántos de los 14 que estamos en este aula habría que entrevistar para calcular el porcentaje de fumadores bajo las condiciones del ejemplo anterior, se tiene que: nN =
n∞ 323 = = 13'458 ≈ 14 n∞ −1 323 − 1 1+ 1+ N 14
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Teoría de la Estadística. Aut.: Mood/Graybill. Ed. Aguilar. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa. Ed. PPU
19/19
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 59 TÉCNICAS DE OBTENCIÓN Y REPRESENTACIÓN DE DATOS. TABLAS Y GRÁFICAS ESTADÍSTICAS. TENDENCIOSIDAD Y ERRORES MÁS COMUNES. 1. Preparación y Realización de una Encuesta. 1.1. Determinación del Objeto de una Encuesta. 1.2. Clasificación, Nomenclatura y Códigos. 1.3. Definición del conjunto a estudiar y Métodos generales de encuestación. 1.4. El Cuestionario. 1.5. Distribución de los cuestionarios. 1.6. Manejo de los cuestionarios contestados. 1.6.1. Comprobación de los Cuestionarios. 1.6.2. Método de Elaboración. 1.6.3. Control de los Resultados. 1.7. Divulgación de los Resultados. 2. Tablas y Gráficas Estadísticas. Tendenciosidad y Errores más Comunes. 2.1. Variable Estadística. 2.1.1. Variable Discreta y Variable Continua. 2.2. Distribuciones de Frecuencias. 2.2.1. Frecuencia Absoluta y Relativa. 2.2.2. Frecuencias Acumuladas. 2.2.3. Distribución de Frecuencias de una sóla Variable. 2.2.4. Recorrido, Intervalos y Marcas de Clase. 2.3. Representaciones Gráficas. 2.3.1. Representación de Caracteres Cualitativos. 2.3.2. Representación de Caracteres Cuantitativos. Bibliografía Recomendada.
1/17
TEMA 59 TÉCNICAS DE OBTENCIÓN Y REPRESENTACIÓN DE DATOS. TABLAS Y GRÁFICAS ESTADÍSTICAS. TENDENCIOSIDAD Y ERRORES MÁS COMUNES. 1. PREPARACIÓN Y REALIZACIÓN DE UNA ENCUESTA. 1.1. Determinación del Objeto de la Encuesta. Para realizar un estudio estadístico, el primer paso consiste en definir el objeto de tal estudio. Para ello tendremos que hacer un inventario lo más completo posible de las necesidades que dicho estudio deberá satisfacer, precisando que resultados pretendemos alcanzar, abandonando lo superfluo y reteniendo lo esencial. Los modelos de tablas que nos van a servir para presentar los resultados del estudio estadístico deben hacerse en el momento de establecer los objetivos del estudio, ya que el modo de formular las encuestas depende de la presentación de los resultados. Por último, es conveniente revisar los modelos de tablas establecidos una vez obtenidos los resultados por si fuera conveniente eliminar o ampliar dichas tablas debido al tipo de contestaciones obtenidas. 1.2. Clasificaciones, Nomenclaturas y Códigos. Realizada la encuesta y recogidos los cuestionarios, se plantea el problema de clasificar las unidades estadísticas según los distintas modalidades establecidas. Dentro de las clasificaciones podemos distinguir dos grandes grupos: Clasificaciones Cualitativas y Clasificaciones Cuantitativas. a) Clasificaciones Cualitativas. Estas clasificaciones reparten las unidades observadas según los distintas modalidades, no siendo éstas medibles. Tenemos como ejemplos el sexo, el estado civil, la profesión, etc. En estos casos, se establece previamente una lista de las modalidades que se distinguen de cada característica, recibiendo dicha lista el nombre de Nomenclatura. Debido a los adelantos tecnológicos, se ha conseguido una gran rapidez en la clasificación y recuento de los datos estadísticos. Aun así, para poder beneficiarnos de dichos adelantos es necesario una traducción de los cuestionarios estadísticos a fichas perforadas mediante una identificación numérica de las características presentadas por una unidad estadística. Llamamos Código a una nomenclatura en la que cada rúbrica está afectada de un número de referencia. Una buena nomenclatura debe presentar las siguientes cualidades:
2/17
• • •
Ser Completa. No significa que sea complicada sino que su utilización será tanto más cómoda cuanto más sencilla sea. Precisa y Clara. Para que toda unidad estadística pueda ser clasificada sin ninguna duda. Adaptarse a las necesidades lo más generales posibles.
b) Clasificaciones Cuantitativas. Diremos que una clasificación es cuantitativa cuando las unidades observadas se pueden clasificar según las modalidades de una característica que son expresables numéricamente. Así, podemos considerar la edad, el peso, la estatura, etc. Dentro de las clasificaciones cuantitativas debemos distinguir entre las características cuantitativas que sólo toman valores enteros y las que pueden tomar cualquier valor en un intervalo dado. En este segundo caso debemos elegir los límites de estos intervalos de tal forma que no exista duda al clasificar una unidad estadística entre dos intervalos consecutivos. Por ello, es suficiente que cubran el intervalo total con continuidad y sin superposiciones, pudiendo tener todos los intervalos la misma longitud o diferente. Si el número de unidades estadísticas es pequeño, interesa tomar intervalos amplios, mientras que si en número de unidades estadísticas es muy grande, tomaremos intervalos de poca amplitud. 1.3. Delimitación del Conjunto a Estudiar y Métodos Generales de Encuestación. Cuando se plantea la realización de una encuesta, el universo que ha de someterse a observación viene definido en la gran mayoría de los casos y no ofrece problemas su determinación. Esta delimitación comprende tres fases: a) Definición de la Unidad Estadística. La unidad estadística, elemento más simple en la población o universo, toma distintas características según el tipo de encuesta. Así, por ejemplo, en un censo demográfico, la unidad estadística es una persona, otras veces podrá ser un objeto, como un coche, etc. En cualquier caso, deben darse todas las propiedades necesarias que permitan reconocerla con facilidad y evitar posibles equivocaciones, debiendo ser precisa y clara y expresada en términos de fácil comprensión por todos. b) Delimitación Geográfica. En la segunda fase debemos fijar los límites geográficos de la colectividad a la que se circunscribe la unidad estadística. c) Delimitación temporal. Las encuestas estadísticas se registran en el tiempo y en el espacio. Destaquemos dos aspectos importantes en relación al tiempo. 1) Estadísticas de Estado.
3/17
Su objeto es comparar el estado de una población en un momento determinado y se realiza mediante el censo en un día fijado previamente. 2) Estadísticas de Movimiento. Son el resultado de la observación de los movimientos que afectan a una colectividad durante un periodo de tiempo. Por ejemplo, la estadística de nacimientos por mensualidades, las de mortalidad por años, las de migraciones, etc. Una vez vistas estas tres fases, veamos las características que debe verificar una encuesta. a) Encuestas Exhaustivas y Parciales. Una encuesta es exhaustiva cuando abarca a todas las unidades estadísticas que componen el colectivo, universo, población o conjunto estudiado. El principal problema que surge es el encontrar el procedimiento adecuado para que no se omita ninguna unidad estadística, para lo cual se debe poseer una lista de todas las unidades estadísticas del colectivo. Una encuesta se denomina parcial cuando no es exhaustiva. En general, las encuestas parciales se realizan tomando una muestra representativa de la población, de tal modo que podamos hacer extensivos los resultados obtenidos a la colectividad entera. b) Encuestas Directas e Indirectas. Una encuesta es directa cuando la unidad estadística se toma y observa por el estudio estadístico propuesto, registrándose en el llamado cuestionario estadístico. En cambio, una encuesta es indirecta cuando los documentos que se estudian corresponden a otra investigación anterior y con fines diferentes de la actual. c) Encuestas sobre Hechos y Encuestas de Opinión. Las encuestas de opinión tienen como misión averiguar lo que el público piensa de una determinada materia y lo que considera que debe hacerse en una circunstancia concreta. Por ejemplo, para estudios de mercado, temas políticos. Por lo general, las encuestas de opinión utilizan el procedimiento de muestreo, ya que el realizarla exhaustiva rozaría límites de trabajo y gastos prohibitivos. Cabe hacer una serie de observaciones a las encuestas de opinión: 1) No indica necesariamente lo que el público piensa del tema, sino lo que pensaría si le planteásemos una pregunta a ese respecto, que son términos distintos. 2) A veces, las personas tienen más de una respuesta a una pregunta determinada según el marco en que se le presente la pregunta. 3) Las respuestas no tienen por qué ser sinceras.
4/17
1.4. El Cuestionario. El documento donde se anotan las características observadas para cada unidad estadística del colectivo estudiado recibe el nombre de cuestionario. El cuestionario suele presentarse de dos formas diferentes: a) Cuestionario Individual. A cada una de las unidades estadísticas se destina un cuadernillo donde se enumeran las preguntas presentadas, previendo un espacio para cada contestación. El cuestionario puede enviarse por correo o ser entregado en mano a los interesados. b) Cuestionario Lista. El cuestionario se presenta bajo la forma de una tabla reservando una columna a cada una de las preguntas formuladas y una fila a cada una de las unidades estadísticas censada. Es adecuado para encuestas realizadas por agentes entrevistadores. El resultado de una encuesta depende en gran medida de la presentación del cuestionario estadístico. Por tanto, debe verificar dos condiciones: 1) Favorecer la recogida de la información necesaria. 2) Facilitar la explotación posterior de los resultados. Previo a la reducción de las preguntas, se deberán efectuar una serie de operaciones entre las que destacamos: 1) Estudiar a fondo el problema a resolver. 2) Consultar a los usuarios de los resultados. 3) Necesidad de conocimientos tecnológicos relacionados con el tema de la encuesta. 4) Realizar una o varias preguntas para clarificar la información. 5) Sondeos previos para evitar erróneas interpretaciones. Las cualidades fundamentales de un buen cuestionario son: 1) 2) 3) 4) 5)
Comodidad para las personas encuestadas. Precisión de las preguntas formuladas. Dejar poca iniciativa a los encuestados. Claridad. Incluir sólo lo esencial.
1.5. Distribución de los cuestionarios. Otro factor que hemos de tener en cuenta en la realización de una encuesta es la fecha de su aplicación. Conviene no realizarla en periodo de vacaciones. Si se realiza
5/17
mediante agentes encuestadores, conviene hacerlo de forma tal que el plazo de tiempo sea mínimo, para no aumentar en exceso los costes de la operación. La distribución de la encuesta puede realizarse de las siguientes formas: a) Envío postal del cuestionario. Es el procedimiento más simple, cómodo y, en la mayoría de los casos, más económico. Sin embargo, presupone conocer el nombre y la dirección de todos los encuestados. Además, tiene una serie de ventajas, entre las que destacamos: 1) Eliminación de los errores sistemáticos debidos a la intervención del encuestador. 2) Permite una respuesta anónima más sincera. 3) Permite utilizar una muestra muy dispersa. Presenta, no obstante, una serie de inconvenientes: 1) No hay control en las respuestas, pudiendo responder otra persona distinta de la elegida. 2) Pueden quedar preguntas sin contestar. 3) Escaso rendimiento obtenido debido a las equivocaciones en las direcciones postales, dejadez de los encuestados para responder a todas las preguntas y olvido de la devolución del cuestionario. b) Envío de los cuestionarios mediante un repartidor. Su misión consiste en entregar el cuestionario a la persona encuestada, la cual lo cumplimentará, encargándose de recogerlo comprobando las contestaciones. c) Interrogatorio directo por un encuestador. Consiste en formular las preguntas del cuestionario personalmente al encuestado, anotando sus respuestas por escrito. Se utiliza en las encuestas por muestreo, no dejando el cuestionario en manos del encuestado, salvo que el régimen de la encuesta así lo exija. 1.6. Manejo de los Cuestionarios Contestados. 1.6.1. Comprobación de los cuestionarios. La comprobación de los cuestionarios consiste en examinarlos detenidamente para descubrir todos los errores u omisiones que puedan tener y tratar de corregirlos. Son innumerables los errores que aparecen al comprobar el resultado de una encuesta, pudiendo abarcar desde defectos del propio cuestionario hasta torpezas cometidas por el encuestador.
6/17
En la comprobación podemos distinguir dos operaciones distintas encaminadas a subsanar, en la medida de lo posible, los errores cometidos. La primera comprende todas las operaciones de control, revisado de las cifras mal escritas, la exactitud de las operaciones hechas, etc. La segunda comprende un examen de todos los cuestionarios a fondo, permitiendo contestar a alguna pregunta que hubiera quedado en blanco, y a descubrir contradicciones e incompatibilidades que puedan existir. 1.6.2. Método de Elaboración. La elaboración de los cuestionarios consiste en un conjunto de operaciones sucesivas que van desde la comprobación de los cuestionarios hasta la obtención de las tablas numéricas que presentan los resultados de la encuesta. Los distintos métodos de elaboración conducen, tras un número de operaciones variable según el procedimiento, a clasificar las unidades estadísticas por modalidades, a su recuento y a su contabilización para cada característica determinada. 1.6.3. Control de los Resultados. En último lugar, confeccionamos las tablas numéricas simples o de doble entrada, para presentar los resultados de la encuesta. Estas tablas no pueden publicarse tal y como salen de las máquinas. Conviene realizar una revisión previa de los resultados a fin de detectar errores en los que haya incurrido, bien el material humano o bien el mecánico y electrónico. Este control debe hacerse en tres aspectos: a) Control contable, comprobando las operaciones aritméticas. b) Control de concordancia, comprobando las tablas que se refieren a resultados de una misma naturaleza. c) Control de verosimilitud, sometiendo los resultados a un estudio crítico comparativo si se disponen de datos suministrados por los estudios anteriores. 1.7. Divulgación de los Resultados. Una vez obtenidos los resultados de la encuesta conviene hacerlos públicos de la forma que mejor se estime. En revistas especializadas, en periódicos, comunicación del resultado de la encuesta a los encuestados y al público interesado en ella.
7/17
2. TABLAS Y GRÁFICAS ESTADÍSTICAS. TENDENCIOSIDAD Y ERRORES MÁS COMUNES. 2.1. Variable Estadística. El investigador social intenta captar, de la amplia realidad que le rodea, una serie de fenómenos. Dichos fenómenos pueden dar lugar a observaciones de tipo cuantitativo o cualitativo. Los fenómenos de naturaleza cuantitativa son aquellos cuyas observaciones vienen expresadas en forma cuantitativa: una concreción del fenómeno estatura de un individuo es, por ejemplo, 1’74 metros. Los fenómenos de naturaleza cualitativa son, por tanto, aquellos cuyas observaciones no tienen carácter numérico. Así, la concreción de los fenómenos estado civil, sexo o profesión constituyen ejemplos puntuales de dichos fenómenos. En definitiva, en estos momentos tenemos al investigador con una información que ha obtenido de la realidad, y que intenta analizar. Para ello, o bien tendrá que crear un nuevo lenguaje, o bien necesitará utilizar un modelo con un lenguaje ya conocido. El investigador social opta por aplicar un modelo matemático. Así, en el modelo matemático existe el concepto de variable y el concepto de dato. Para emplear el modelo matemático hacemos corresponder la idea de fenómeno al concepto de variable, y la concreción del fenómeno, al concepto de dato. Cuando el fenómeno es de naturaleza cualitativa, la idea de atributo sustituye a la de variable. Al observar las diferentes variables o atributos se obtiene un conjunto, numérico o no, denominado conjunto de datos. El dato estadístico puede ser unidimensional si corresponde a una sola variable (o atributo) o multidimensional si corresponde a varias variables (o atributos). Llamaremos Valores a los resultados obtenidos al medir u observar variables y Modalidades a los resultados correspondientes a atributos. 2.1.1. Variable Discreta y Variable continua. Dentro de las variables existen dos tipos, que son las discretas y las continuas. Llamaremos Variable Discreta a aquella que entre dos valores próximos puede tomar a lo sumo un número finito de valores. Llamaremos Variable Continua a aquella que puede tomar los infinitos valores de un intervalo. La distinción realizada es más bien teórica que práctica, pues la limitación de los aparatos de medida hace que todas las variables se comporten como discretas cuando son observadas.
8/17
Por otra parte, y haciendo extensiva la noción de variable estadística continua, una magnitud que pueda tomar un gran número de valores muy próximos (aunque éstos sean aislados) la consideraremos variable continua. Así, como ejemplos tenemos el sueldo de un trabajador, los gastos de una sociedad, etc. Aun teniendo en cuenta lo anterior, no debemos olvidar la naturaleza discreta o continua de la variable, ya que en los modelos teóricos de la Estadística, dicha distinción tiene gran importancia. Dado que la variable es un símbolo matemático que representa a un conjunto de valores, estableceremos que si ese conjunto toma un número infinito de valores, la variable se representará por el símbolo X, Y, Z, ... En cambio, si toma un conjunto finito será X1 , Y1 , Z1 , ... 2.2. Distribuciones de Frecuencias. 2.2.1. Frecuencia Absoluta y Relativa. Consideremos la tabla siguiente para la descripción de las mismas, donde se recoge el recuento de 1000 alumnos en función de la carrera de ciencias que cursan. Carreras Matemáticas Físicas Geológicas Informática TOTAL
F. Absolutas 150 400 250 200 1000
F. Relativas 0.15 0.40 0.25 0.20 1
F. Abs. Acum. 150 550 800 1000
F. Rel. Acum 0.15 0.55 0.80 1
Frecuencia Absoluta. Es el número de veces que se repite cada valor o dato de la variable. En general, se representan por ni. En nuestro ejemplo, n3 =250, o lo que es lo mismo, el valor X3 se repite 250 veces. Frecuencia Relativa. Es igual a la frecuencia absoluta dividida por el número total de datos. Se representa por fi. Si N es el número total de datos, tenemos que fi =
ni N
2.2.2. Frecuencias Acumuladas. Frecuencia Absoluta Acumulada. Nos indica el número de datos que hay igual al considerado e inferiores a él. Su símbolo es Ni. Frecuencia Relativa Acumulada. Es el resultado de dividir cada frecuencia acumulada por el número total de datos. Se designa por Fi. Es evidente que se verifica: 1) La suma de todas las frecuencias relativas es igual a la unidad. 9/17
2) La última frecuencia relativa acumulada es la unidad. 2.2.3. Distribución de Frecuencias de una sola Variable. Llamaremos Distribución de Frecuencias al conjunto de valores que ha tomado una variable con sus frecuencias correspondientes. Para que quede determinada una distribución de frecuencias debemos conocer las diferentes xi y cualquiera de las columnas de frecuencias, ya que el paso de una a otra es inmediato. Como normalmente, la primera columna que obtenemos es la de las ni, representaremos una distribución de frecuencias como los diferentes valores que en cada caso toma el par (xi ; ni). Para que dos distribuciones de frecuencias sean iguales han de ser iguales los diferentes xi y sus frecuencias relativas fi. 2.2.4. Recorrido, Intervalos y Marcas de Clase. Vamos a distinguir, por otra parte, dos tipos fundamentales de distribuciones de frecuencias: las no agrupadas en intervalos y las agrupadas en intervalos. Una vez recogida y tabulada la información, ñesta se dispone asociando a cada valor su frecuencia. En este caso, tendremos una distribución No Agrupada en intervalos. Si las frecuencias son todas iguales a 1, la distribución se denomina de Frecuencias Unitarias. Pero si el número de valores distintos que ha tomado la variable es suficientemente grande, parece aconsejable, para mayor comodidad en el tratamiento de la información, agrupar estos valores en Clases o Intervalos, teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en información. En la agrupación hay tres aspectos que debemos tener en cuenta: 1) El máximo de información lo alcanzamos al recogerla, disminuyendo al realizar la operación de agrupación por intervalos. 2) Las distribuciones agrupadas en intervalos no se presentan realmente así, sino que es el investigador el que las agrupa, para manejar los datos más fácilmente. 3) Al agrupar hay que tener en cuenta las frecuencias. En general, representaremos una distribución de frecuencias agrupada en intervalos por el par (Li-1-Li; ni), donde Li es el extremo superior del intervalo y Li-1 su extremo inferior. Para agrupar los datos en intervalos o clases, debemos comenzar determinando el Recorrido o Rango de la variable, que se define como la diferencia entre el mayor y el menor valor de la variable. Es decir, Re = Max x i − Min x i i
Este recorrido se divide después en intervalos. 10/17
i
Denominamos amplitud del intervalo a la diferencia entre los extremos superior e inferior del mismo Ci = Li – Li-1 Los intervalos pueden ser de amplitud (o longitud) constante o variable. Si la amplitud es constante se verifica que: Re = Nº de Intervalos x ci Esta relación nos permite deducir el número de intervalos si fijamos la amplitud, o ésta si fijamos el número de intervalos. En la determinación del número de intervalos no existen reglas fijas (suelen oscilar entre 5 y 15), hasta el punto de que a veces se hacen varios ensayos. Un intervalo queda especificado por sus extremos. Aparece un problema cuando un valor de la variable coincide exactamente con un extremo del intervalo, con lo que hay dudas de su inclusión en el intervalo o no. Por esto se establece, como regla general, que los intervalos son abiertos por la izquierda y cerrados por la derecha, menos el primero, que será cerrado. Por último, cabe señalar que, como representante de cada intervalo o clase, elegimos su punto medio, el cual recibe el nombre de Marca de Clase, denotándose por xi xi
Li −1 + Li 2
2.3. Representaciones Gráficas. Aunque el par de columnas (xi ; ni) encierra toda la información disponible, parece útil traducirla en gráficos, de modo que la referencia visual sirva de punto de partida para el análisis estadístico. Ya habíamos comentado que las distribuciones de frecuencias pueden ser de datos sin agrupar y de datos agrupados. Éstas últimas presentan la particularidad de que los valores de la variable no aparecen individualmente, sino agrupados en intervalos. Los tipos de gráficos que nos podemos encontrar son: a) Para fenómenos cuantitativos: 1) Diagrama de Barras para distribuciones no agrupadas. 2) Histograma de frecuencias para distribuciones agrupadas en intervalos. b) Para fenómenos cualitativos. 1) Diagramas Sectoriales. 2) Cartogramas. 3) Pictogramas.
11/17
2.3.1. Representación de Caracteres Cualitativos. a) Diagramas de Sectores. Destacamos en primer lugar los diagramas de sector o de pastel, así como los diagramas de rectángulos. El principio de este tipo de representación es el de la proporcionalidad de las áreas de los gráficos a las frecuencias absolutas.
25%
20%
15%
40%
En este sistema de representación, los sectores circulares tienen un ángulo central proporcional a la frecuencia absoluta correspondiente y, por tanto, un área proporcional a la frecuencia absoluta. b) Diagramas de Rectángulos. Los Diagramas de Rectángulos tienen una base constante y una altura proporcional a la frecuencia absoluta correspondiente. Su superficie es proporcional a la frecuencia absoluta. 400 300 200
100
M
F
G
I
c) Pictograma. También como método de representación de las distribuciones de carácter cualitativo, podemos hablar del Pictograma. Si se quiere representar de forma pictórica un carácter cualitativo, se puede indicar por una silueta sugestiva el significado de cada unidad de carácter. Existen de dos tipos:
12/17
Tipo I. Cada modalidad es representada por un dibujo de tamaño proporcional a la frecuencia de la misma. Si el dibujo es representado en tres dimensiones, será el volumen el que nos represente a la frecuencia. De igual forma, si el dibujo es representado en el plano, será el área la que represente a la frecuencia.
Tipo II. Todos los dibujos son del mismo tamaño y a cada uno de ellos se le asigna una cantidad de frecuencia. A cada modalidad se le asignan tantos dibujos, o partes del mismo, según la frecuencia a representar.
d) Cartogramas. Aquí la representación de los datos se lleva a cabo sobre mapas.
Como el objetivo de toda representación gráfica es facilitar la explicación de las distribución de frecuencias que estemos estudiando, no estará de más que le echemos 13/17
imaginación y formemos representaciones combinadas que, sin alterar los principios básicos de las representaciones gráficas, contribuyan a tal objetivo. A veces, conviene hacer combinaciones de representaciones con objeto de obtener una representación más versátil. 2.3.2. Representación de Caracteres Cuantitativos. En la representación de variables cuantitativas, cabe señalar que aquí también se fija el principio general de la proporcionalidad para la obtención de gráficos, en este caso de las alturas o áreas a las frecuencias absolutas. En su representación atenderemos a si los datos están agrupados o no. a) Representación de Datos sin Agrupar. En el caso de datos sin agrupar, la representación gráfica se realiza fácilmente mediante un sistema de ejes de coordenadas cartesianas, representando en el eje de abscisas los valores de la variable y en el de ordenadas las frecuencias. En general, se puede marcar el segmento correspondiente, dando lugar a lo que llamaremos Diagrama de Barras. Las frecuencias acumuladas dan lugar a un Diagrama de Escalera o Escalonado. Se pueden hacer las representaciones utilizando frecuencias absolutas o relativas, de forma indistinta. Para construir el diagrama, se llevan los valores de la variable sobre el eje de abscisas, empleando una escala cualquiera de medida. Y sobre cada valor de la variable se levanta un segmento igual a la frecuencia absoluta (o relativa) empleando también una escala gráfica.
Si utilizáramos frecuencias absolutas acumuladas (o relativas acumuladas) utilizaríamos el Diagrama de Escalera. Se construye, al igual que el anterior, trazando sobre la variable una altura igual a la frecuencia acumulada y uniendo mediante trazos horizontales el extremo de cada ordenada con el siguiente. La última ordenada será de magnitud N (ó 1, según el caso) y la ordenada correspondiente a un valor xi de la abscisa indicará el número de observaciones para las cuales la variable ha tomado valores menores o iguales a la abscisa.
14/17
b) Representación de Datos Agrupados. En el caso de datos agrupados, le representación se efectúa mediante el Histograma o Histograma de Frecuencias. Se construye levantando sobre cada intervalo un rectángulo de área proporcional a la frecuencia absoluta correspondiente a dicho intervalo.
Si los intervalos son de amplitud constante, las alturas de los rectángulos serán iguales a las frecuencias absolutas respectivas, ya que al ser las bases iguales, las áreas dependerán de las alturas de los rectángulos. Si las amplitudes de los intervalos son desiguales, las alturas de los rectángulos deben calcularse dividiendo la frecuencia absoluta por la longitud del intervalo. Si llamamos di a la altura del intervalo i-ésimo, ci a la longitud del mismo y ni a las frecuencias correspondientes, tendremos n di = i ci valor que se conoce como Densidad de Frecuencia. Si trabajáramos con frecuencias absolutas acumuladas (o relativas acumuladas), la representación gráfica se haría mediante un Polígono de Frecuencias.
15/17
Para construirlo, se levanta en el extremo superior de cada intervalo una ordenada igual a la frecuencia acumulada correspondiente, uniendo a continuación dichas ordenadas. La primera ordenada se une al extremo inferior del primer intervalo, prolongando el polígono desde este punto hacia la izquierda sobre el eje X, y prolongando también a partir de la ordenada del extremo superior del último intervalo, con una paralela al eje de abscisas. La altura correspondiente al extremo superior del último intervalo será igual a la frecuencia total N ó 1, según hallamos utilizado frecuencias acumuladas absolutas o relativas, respectivamente. Otra práctica muy utilizada es la de sustituir el histograma por un Polígono de Frecuencias , pero no acumuladas. Es el gráfico que se forma al unir los puntos medios de cada intervalo (marca de clase) a una altura proporcional a la frecuencia (intervalos iguales). La unión de tales puntos constituye una línea quebrada rectilínea que, al prolongarla por los extremos, corta al eje X. El área que queda por debajo del polígono de frecuencias es igual al área contenida dentro del correspondiente histograma.
16/17
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Teoría de la Estadística. Aut.: Mood/Graybill. Ed. Aguilar. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa. Ed. PPU Algoritmo. Matemáticas II. Cou. Aut.: Vizmanos y Anzola. Edit. SM.
17/17
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 60 PARÁMETROS ESTADÍSTICOS. CÁLCULO, SIGNIFICADO Y PROPIEDADES. 1. Introducción. 2. Medidas de Posición. 2.1. La Media Aritmética. 2.1.1. Propiedades. 2.1.2. Cálculo Abreviado. 2.1.3. Ventajas e Inconvenientes. 2.2. La Media Geométrica. 2.2.1. Propiedades. 2.2.2. Ventajas e Inconvenientes. 2.3. La Media Armónica. 2.3.1. Ventajas e Inconvenientes. 2.4. Relación entre los tres Promedios. 2.5. La Mediana. 2.5.1. Propiedades de la Mediana. 2.5.2. Ventajas e Inconvenientes. 2.6. La Moda. 2.6.1. Distribuciones no agrupadas en Intervalos. 2.6.2. Distribuciones agrupadas en Intervalos. 2.7. Medidas de Posición no Centrales. 3. Momentos Potenciales 3.1. Momentos Respecto al Origen. 3.2. Momentos Respecto a la Media Aritmética. 4. Medidas de Dispersión. 4.1. Absolutas. 4.1.1. Recorrido. 4.1.2. Desviación Media. 4.1.2.1. Desviación Media respecto a la Media Aritmética 4.1.2.2. Desviación Media respecto a la Mediana. 4.1.2.3. La Varianza. Propiedades. 4.1.2.4. Desviación Típica o Standard. Propiedades. 4.2. Relativas. 4.2.1. Coeficiente de Variación de Pearson. 4.2.2. Índice de Dispersión Respecto a la Mediana. 5. Medidas de Forma. Asimetría y Curtosis. 5.1. Asimetría. 5.2. Medidas de Apuntamiento o Curtosis. Bibliografía Recomendada.
1/24
TEMA 60 PARÁMETROS ESTADÍSTICOS. CÁLCULO, SIGNIFICADO Y PROPIEDADES. 1. INTRODUCCIÓN. Aunque la observación visual de cualquier representación gráfica de una misma distribución de frecuencias proporcionan una primera aproximación al análisis de los datos, este tipo de observación no nos permite comparar, con rigor, dos distribuciones del mismo carácter. Por tanto, se hace necesario estudiar procedimientos numéricos que obtengan, a partir de todos los datos de la distribución, unos valores que permitan deducir una información cuantitativa. Por otra parte, si no se dispone de ninguna representación gráfica, es necesario, ante la imposibilidad del humano de retener gran cantidad de datos, el intentar resumir toda la información. La idea de resumir la información del comportamiento global del fenómeno estudiado en unos pocos datos se realiza calculando una serie de parámetros. Este tipo de medidas descriptivas utilizadas son, principalmente, medidas de centralización o posición, medidas de dispersión, medidas de deformación o simetría y el apuntamiento. 2. MEDIDAS DE POSICIÓN. La tabla estadística nos ofrece toda la información disponible, pero el investigador se encuentra incapaz, en numerosos casos, de interpretar toda esa extensa información, por lo que intenta resumirla en una serie de expresiones. Hacia la síntesis de esa información van dirigidas todas estas expresiones o medidas. Toda síntesis de una distribución se considerará como operativa si: 1) Intervienen en su determinación todos y cada uno de los valores de la distribución. 2) Es siempre calculable. 3) Es única para cada distribución de frecuencias. En este proceso de síntesis buscamos unos valores que nos fijen el comportamiento global del fenómeno estudiado a partir de los datos individuales recogidos en la información disponible. Estos valores sintéticos globales son las llamadas Medidas de Posición. 2.1. La Media Aritmética. DEF Definimos la Media Aritmética como la suma de todos los valores de la distribución dividida por el número total de datos. Si el valor xi de la variable Xi se repite ni veces, hay que considerar estas repeticiones en la suma. Si representamos la media aritmética por x , tendremos:
2/24
x=
n x1 n1 + K + x n n n xn =∑ i i N N i =1
Pero esto sólo es válido en el supuesto más sencillo en que los datos de la variable estén sin agrupar. En el caso de que tuviéramos una distribución con datos agrupados, los valores individuales de la variable serían desconocidos y, por tanto, no podríamos hacer uso de la fórmula anterior. En este supuesto se postula la hipótesis de que el punto medio del intervalo de clase (marca de clase) representa adecuadamente el valor medio de dicha clase; y aplicaríamos la fórmula original de la media simple para dichos valores. Otro tema al que tenemos que hacer referencia es el de la llamada Media Aritmética Ponderada, que se produce cuando se otorga a cada valor de la variable una ponderación o peso, distinto de la frecuencia o repetición. En este caso, en el cálculo de la media aritmética tendríamos en cuenta dichas ponderaciones. En este caso, si ωi son las ponderaciones, definimos la media como: n
∑x ω i
x=
i
i =1 n
∑ω
i
i =1
2.1.1. Propiedades. PROP La suma de las desviaciones de los valores de la variable respecto a su media es cero. Dem. n n
∑ (x i =1
n
i
n
− x )·ni = ∑ x i ·n i − x ⋅ ∑ ni = N ⋅ i =1
i =1
∑ x ·n i
i =1
N
i
− xN = N x − xN = 0
TEOREMA. Teorema de König. La media de las desviaciones al cuadrado de los valores de la variable respecto a una constante k cualquiera se hace mínima cuando esa constante es igual a la media aritmética. Dem. Consideremos la expresión: n
D ( k ) = ∑ (x i − k )2 i =1
ni N
que toma diferentes valores para una misma distribución de frecuencias, según los distintos valores de k.
3/24
Si sumamos y restamos x dentro del paréntesis, tenemos que: n
D ( k ) = ∑ ( x i − k )2 i =1
n
= ∑ (x i − x )
2
i =1
n n ni 2 n 2 n = ∑ (xi − k + x − x ) i = ∑ (( xi − x ) − (k − x )) i = N i =1 N i =1 N
n n ni n n 2 + (k − x ) ∑ i − 2(k − x )∑ (xi − x ) i = N N i =1 N i =1
y teniendo en cuenta la propiedad anterior, se transforma en n
D( k ) = ∑ (xi − x )
2
i =1
ni + ( k − x) 2 N
en donde el valor de k que hace que D(k) sea mínimo es x . PROP Si a todos los valores de una variable les sumamos una constante k, la media aritmética queda aumentada en esa constante. O lo que es lo mismo, la media aritmética se ve afectada por los cambios de origen. Dem. Inmediata. PROP Si todos los valores de una variable los multiplicamos por una constante k, su media aritmética queda multiplicada por la misma constante. Es decir, la media aritmética se ve afectada por los cambios de escala. Dem. Inmediata. 2.1.2. Cálculo Abreviado. Con objeto de facilitar el cálculo práctico de x cuando la distribución presenta numerosos valores o éstos están compuestos por bastantes dígitos, es aconsejable realizar el siguiente cambio de variable x i' =
xi − O c
donde: xi son los valores de la distribución. O un origen de trabajo arbitrario, que se procura sea un valor central de la distribución. c una constante que es igual al máximo común divisor de las diferencias que existen entre cada dos valores consecutivos de la variable.
4/24
Xi’ los nuevos valores de la variable. Despejando xi de la expresión anterior tenemos que
xi = cxi’ + O
Por tanto: n
x = ∑ xi i =1
n n n ni n n n = ∑ (cxi '+O ) i = ∑ cx i ' i + O∑ i = c x' + O N i =1 N i =1 N i =1 N
2.1.3. Ventajas e Inconvenientes. Como ventajas podemos nombrar las tres que se le exigen a una medida de síntesis: 1) Consideración de todos los valores de la distribución. 2) Ser calculable. 3) Ser única. También podemos considerar como ventaja la obtenida en la primera propiedad, que nos dice que la media aritmética es el centro de gravedad de la distribución, así como la obtenida de la segunda propiedad (Teorema de König). Como inconvenientes podemos indicar que a veces da lugar a conclusiones no muy atinadas. Esto ocurre en el caso de que la variable presente valores anormalmente extremos que pueden distorsionar la media aritmética, haciéndola poco representativa. La media aritmética, como medida de posición, es la fórmula más adecuada para el resumen estadístico en caso de distribuciones en Escala de Intervalos o de Proporción, con las cuales dicha medida alcanza su máximo sentido. 2.2. La Media Geométrica. DEF Sea una distribución de frecuencias (xi; ni ). Definimos la Media Geométrica, y la representaremos por G, como la raíz N-ésima del producto de los N valores de la distribución. Así: n
G = N x1n1 ⋅ K ⋅ x nn n = N ∏ x ini i =1
2.2.1. Propiedades. PROP El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los valores de la variable. Dem. n
log G = log N ∏ x in i = i =1
1 n 1 n 1 n ⋅ log ∏ x in i = ⋅ ∑ log x ini = ⋅ ∑ (log xi )ni N N i =1 i =1 N i =1
5/24
2.2.2. Ventajas e Inconvenientes. Como ventajas podemos señalar: 1) En su determinación intervienen todos los valores de la distribución. 2) Es menos sensible que la media aritmética a los valores extremos, por su carácter de producto. Como inconvenientes tenemos: 1) Es de significado estadístico menos intuitivo que la media aritmética. 2) Su cómputo es más difícil. 3) En ocasiones no queda determinada. Esto ocurre cuando la variable toma en algún momento el valor 0. Si la variable toma valores negativos, se pueden presentar una amplia gama de casos particulares en los que tampoco queda determinada G. No es que G no exista, sino que no la podemos determinar. El empleo más frecuente de la media geométrica es el de promediar porcentajes, tasas, números índices, etc. Es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas. 2.3. La Media Armónica. DEF Definimos la Media Armónica de una distribución de frecuencias (xi; ni ), y se representa por H, como N N H= = n n1 n n +K+ n ∑ i x1 xn i =1 x i OBS La inversa de la media armónica es la media aritmética de los inversos de los valores de la variable. 2.3.1. Ventajas e Inconvenientes. Como ventajas diremos que intervienen en su cálculo todos los valores de la distribución y que, en ciertos casos, es más representativa que la media aritmética. Por otra parte, siempre se puede pasar de una media armónica a una media aritmética transformando adecuadamente los datos. Como inconvenientes hemos de citar la influencia de los valores pequeños, y su no determinación en las distribuciones con algunos valores iguales a cero. Por ello no es aconsejable su empleo en distribuciones en las que existan valores muy pequeños. Se suele utilizar para promediar velocidades, tiempos, rendimientos, etc.
6/24
2.4. Relación entre los tres Promedios. PROP Para una misma distribución de frecuencias (xi; ni ), y siempre que existas, se verifica que: H≤G≤ x Dem. Vamos a ver la demostración para el caso de una distribución con dos valores x1 y x2 con frecuencia unitaria. Para el caso de n valores, sólo hemos de aplicar inducción. Las medias tienen como valores: x=
x1 + x 2 2
H=
G = x1 x 2
2 1 1 + x1 x 2
Comencemos demostrando que H ≤ G 2 1 1 + x1 x2
≤ x1 x 2
2 x1 x 2 = x1 x 2 x1 + x 2
⇒
⇒
4 x12 x 22 ≤ x1 x 2 ( x1 + x 2 )2
⇒
2 x1 x 2 ≤ x1 x 2 (x1 + x 2 )
⇒
⇒
4 x1 x 2 ≤ (x1 + x 2 )2
4 x1 x 2 ≤ x12 + 2 x1 x 2 + x 22
⇒
0 ≤ x12 − 2 x1 x 2 + x22
⇒ ⇒
0 ≤ ( x1 − x 2 )2
que es una desigualdad que claramente se verifica siempre, por tanto H ≤ G. Por otro lado, veamos que G ≤ x x1 x 2 ≤
x1 + x 2 2
⇒
4 x1 x 2 ≤ (x1 + x 2 )2
⇒
0 ≤ ( x1 − x 2 )2
que es el mismo resultado que en el caso anterior. Luego se verifica la desigualdad entre las tres medias. 2.5. La Mediana. Dado que la definición de Mediana puede entrañar múltiples dificultades, vamos a dar una definición operativa diciendo: DEF La Mediana es el valor de la distribución, supuesta ésta ordenada de menor a mayor, que deja a su izquierda y a su derecha el mismo número de frecuencias. Es decir, el valor que ocupa el lugar central, supuesto un número impar de datos. Si el número de
7/24
datos fuese par puede decirse que hay dos valores medianos, y se toma la media aritmética de ellos. La Mediana también se puede definir como el valor de la distribución cuya frecuencia acumulada es N/2. No obstante, hemos de tener en cuenta que para los diferentes casos particulares (número impar de datos, número par de datos, distribuciones de frecuencias unitarias) se pueden establecer diferentes criterios. En el caso de distribuciones agrupadas en intervalos, no es necesario distinguir si los intervalos se han construido de la misma o distinta amplitud. Siguiendo el método general de búsqueda del valor que ocupa el lugar N/2, en este caso, nos encontramos con un intervalo mediano, en lugar de un valor mediano. Con el objeto de fijar la mediana en un valor, seleccionaremos un representante del intervalo mediano al que llamaremos mediana. El criterio usualmente seguido es el siguiente. Suponemos, en primer lugar, que todos los valores comprendidos dentro del intervalo mediano se encuentran distribuidos uniformemente a lo largo de él. A continuación, vamos a considerar la poligonal de frecuencias acumuladas correspondiente al intervalo mediano y a sus dos contiguos, y determinamos gráficamente la mediana.
Vemos que Me = Li-1 + m. Determinaremos m en base a la hipótesis fijada que nos permite escribir AC BC = AC ' B' C ' ya que los triángulos ABC y AB’C’ son semejantes. Pero
8/24
AC = m
AC ' = ci
BC =
N − N i −1 2
Por tanto N − N i −1 m 2 = ci ni
B' C ' = N i − N i −1 = ni Es decir
N − N i −1 2 m= ci ni Con lo que tenemos Me = Li −1
N − N i −1 + 2 ci ni
2.5.1. Propiedades de la Mediana. PROP La Mediana hace mínima la suma de todas las desviaciones absolutas. Es decir, si representamos la mediana por Me, tenemos que n
n
i =1
i =1
Min ∑ x i − k ni = ∑ [x i − Me[ni k
cuando la constante respecto a la cual se toman las desviaciones, k, es igual a la mediana. Dem. Transformamos la distribución en otra de frecuencias unitarias, tal que x1 ≤ x2 ≤ ... ≤ xm-1 ≤Me ≤ xm ≤ ... ≤ xa-1 ≤ k ≤ xa ≤ ... ≤ xn siendo k > Me. Por definición de Mediana, tendremos igual número de valores iguales o inferiores que iguales o superiores, Supongamos que hay m-1 en cada lado. Tendremos que: n
m −1
∑x
i
i =1
i =1
n
∑ i =1
n
∑ i =1
a −1
n
− k = ∑ ( k − xi ) + ∑ ( k − x i ) + ∑ ( x i − k ) i= m
m −1
(1)
i= a
a −1
n
xi − Me = ∑ ( Me − x i ) + ∑ ( x i − Me) + ∑ ( x i − Me ) i =1
n
i= m
m −1
a −1
n
xi − k − ∑ x i − Me = ∑ ( k − Me) + ∑ ( k + Me − 2 x i ) + ∑ ( Me − k ) i =1
i =1
(2)
i =a
i =m
9/24
i= a
(3)
a −1
Sumando y restando
∑ (k − Me)
en (3):
i= m
n
∑ i =1
n
m −1
a −1
a −1
a −1
xi − k − ∑ x i − Me = ∑ ( k − Me ) + ∑ ( k − Me ) + ∑ ( k + Me − 2 xi ) − ∑ ( k − Me ) + i =1
i =1
i =m
i =m
i =m
n
+ ∑ ( Me − k ) i= a
n
∑ i =1
n m −1 n a −1 xi − k − ∑ xi − Me = ∑ (k − Me) − ∑ ( k − Me) + ∑ (k − Me) + i =1 i =1 i= a i= m a −1
a −1
+ ∑ (k + Me − 2 x i ) + ∑ ( k − Me ) = i= m
i =m
a −1
a −1
= (m − 1)( k − Me) − ( m − 1)(k − Me) + ∑ ( 2k − 2 x i ) = 2∑ ( k − x i ) i= m
i= m
Es decir n
n
∑x
i
i =1
a −1
− k − ∑ x i − Me = 2∑ ( k − xi ) > 0 i =1
i =m
Luego n
n
∑x
i
i =1
− k > ∑ x i − Me i =1
n
por tanto
∑x
i
− Me
es mínimo para cualquier k>Me.
i =1
La demostración para cualquier k
Llamaremos Moda al valor de la variable que más se repite. Se representa por
10/24
Por tanto, en una distribución de frecuencias, es el valor de la variable que viene afectada por la máxima frecuencia de distribución. Para calcular la Moda, distinguiremos entre distribuciones no agrupadas en intervalos y distribuciones agrupadas en intervalos. 2.6.1. Distribuciones no agrupadas en Intervalos. En este caso, la determinación de la Moda Mo es inmediata. Se observa la columna de las frecuencias absolutas y el valor de la distribución al que corresponde la mayor frecuencia será la Moda. A veces aparecen distribuciones con más de una moda (bimodales, trimodales, etc.) e incluso una distribución de frecuencias que presente una moda absoluta y una relativa. 2.6.2. Distribuciones agrupadas en Intervalos. a) Intervalos de la misma amplitud. En este caso, una vez determinada la mayor frecuencia, observamos que a ésta no le corresponde un valor sino un intervalo, luego realmente no tendremos un valor modal sino un intervalo modal. De entre todos los valores comprendidos en el intervalo modal vamos a seleccionar uno que desempeñe el papel de valor modal. Para esto, podemos utilizar diferentes criterios, entre los cuales citamos los cuatro siguientes: 1) 2) 3) 4)
Tomar como valor modal el extremo inferior del intervalo. Mo = Li-1. Considerar como moda el extremo superior. Mo = Li. Hacer la moda igual a la marca de clase. Mo = xi. O bien, suponiendo que: • Todos los valores del intervalo están distribuidos uniformemente dentro de él. • La moda estará más cerca de aquel intervalo contiguo cuya frecuencia sea mayor. Lo anterior se puede resumir diciendo que las distancias de la moda Mo a los intervalos contiguos son inversamente proporcionales a las frecuencias de dichos intervalos. La Moda será
Mo = Li-1 + m
Pero
n m = i +1 c i − m ni −1
Que teniendo en cuenta las propiedades de las proporciones queda:
11/24
n i +1 m = ci − m + m ni −1 + ni +1 de donde m=
ni +1 ·ci n i −1 + n i +1
Por tanto Mo = Li −1 +
n i +1 ·c i ni −1 + ni +1
b) Intervalos de Distinta Amplitud. Si recurrimos a la definición que hemos dado como moda (valor que más se repite), al ser ahora los intervalos diferentes la frecuencia absoluta no nos dirá nada sobre la abundancia de valores en cada intervalo, ya que podría suceder que el intervalo al que correspondiese la mayor frecuencia fuera muy amplio y entonces, fuera más denso otro intervalo con menor frecuencia pero menor amplitud. Por tanto, ahora, las frecuencias no son significativas para resolver el problema. Recordemos que las densidades de frecuencia se obtenían dividiendo las frecuencias absolutas por los recorridos o amplitudes de sus correspondientes intervalos. Las densidades de frecuencias nos dan el número de valores que hay en cada unidad de intervalo, para cada intervalo. La mayor densidad de frecuencia nos determinará el intervalo modal. Una vez determinado el intervalo modal, y siempre en la línea de operar con valores y no con intervalos, podemos aplicar cualquiera de los cuatro criterios expuestos en el caso anterior. Si seleccionamos, por parecer el más razonable, el cuarto, tendremos que: Mo = Li −1 +
d i +1 ·c i d i −1 + d i +1
La deducción de esta fórmula es análoga al caso anterior. Por último, diremos que la moda es la medida más representativa en caso de distribuciones en escala nominal. Esto es debido a que las distribuciones de este tipo presentan los datos no susceptibles de ordenación, de tal forma que para estas distribuciones no es posible realizar operaciones elementales con sus observaciones. 2.7. Medidas de Posición no Centrales. Podemos nombrar otros valores notables pero que no van a reflejar ninguna tendencia central: los Cuantiles. Son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores. Entre los Cuantiles podemos citar, por ser de uso más frecuente, los Cuartiles, los Deciles y los Percentiles.
12/24
DEF Llamaremos Cuartiles a los tres valores de la distribución que la dividen en cuatro partes iguales. Es decir, en cuatro intervalos dentro de cada cual están incluidos el 25% de los valores de la distribución. DEF Llamaremos Deciles a los nueve valores de la distribución que la dividen en diez partes iguales. Cda parte contendrá el 10% de la distribución. DEF Llamaremos Percentiles a los noventa y nueve valores que dividen a la distribución en cien partes iguales. Para calcular los valores anteriores hemos de distinguir entre: a) Distribuciones no agrupadas en intervalos. iN con i:1,2,3. 4
Cuartiles:
Ci es el valor que ocupa el lugar
Deciles:
Di es el valor que ocupa el lugar
iN 10
Percentiles:
Pi es el valor que ocupa el lugar
iN con i:1, , 99 100
con i: 1,...,9
Para determinarlos, se calculan previamente las frecuencias acumuladas, y se busca iN el valor que ocupe el lugar de la distribución. k b) Distribuciones agrupadas en intervalos. El problema que se presenta es el mismo que el que teníamos al calcular la mediana. Para elegir el representante para un determinado cuantil seguiremos el criterio:
Q r = L i −1 k
r N − N i −1 k + ⋅ ci ni
donde 1) Para k=4 y r=1,2,3 obtenemos los cuartiles. 2) Para k=10 y r=1,2,...9 obtenemos los deciles. 3) Para k=100 y r=1,2,...,99 obtenemos los percentiles. La fórmula anterior se obtiene de forma análoga a la desarrollada para la mediana. 3. MOMENTOS POTENCIALES. Al considerar las diferentes características de una distribución haremos referencia a unos valores específicos, deducidos de todos los valores de la distribución y que, como 13/24
se verá, serán la base de alguna de las características de cada distribución de frecuencia. Estos valores específicos reciben el nombre de Momentos. Los Momentos de una distribución son unos valores que la caracterizan, de tal modo que dos distribuciones son iguales si tienen todos sus momentos iguales, y son tanto más parecidas cuanto mayor sea el número de momentos iguales que tengan. Conviene advertir que existen dos tipos de momentos: los potenciales y los factoriales. Sólo vamos a tratar los momentos potenciales y a partir de ahora los designaremos simplemente por momentos. El momento de orden r respecto a un origen arbitrario O se define como n
M r = ∑ ( x i − O )r ⋅ i =1
ni N
Pero dentro de los momentos potenciales podemos distinguir, a su vez, dos tipos: los momentos respecto al origen y los momentos respecto a la media aritmética. 3.1. Momentos respecto al Origen. Los momentos respecto al origen se representan por ar y se obtienen haciendo O=0. Por tanto: n n a r = ∑ xir ⋅ i N i =1 Los primeros momentos serán a0 =1
a1 = x
etc.
3.2. Momentos respecto a la Media Aritmética. Son también llamados momentos centrales. Se representan por mr y se obtienen al hacer O= x . Por tanto: n r n m r = ∑ (x i − x ) ⋅ i N i =1 siendo x la media aritmética de la distribución, que coincide con el momento de primer orden respecto al origen. m0 =1
m1 =0
m2 =s2
etc.
Observemos que los términos del sumatorio son de la forma (xi – x )r·ni. Si llamamos ui = xi – x
14/24
el momento central de orden r de la distribución será: n
mr = ∑ uir ⋅ i =1
ni N
que es por definición el momento de orden r respecto al origen para la distribución (ui ; ni). Por tanto, conceptualmente no existe diferencia entre los momentos respecto al origen y respecto a la media. La única diferencia existente entre ambos comsiste en que mientras en los momentos respecto al origen se toma como origen de medidas el cero de la escala correspondiente a la característica en estudio, en los momentos centrales se hace una traslación del origen de medidas, para situarlo precisamente en la media aritmética. PROP Todos los momentos respecto a la media se pueden representar en función de los momentos respecto al origen. Dem. El binomio de Newton nos dice que r r ( a − b) r = ∑ ( −1) k a r −k b k k =0 k
y aplicándolo a la expresión de los momentos centrales n
mr = ∑ ( xi − x) r i =1
n r r ni k n = ∑∑ ( −1) k xir −k x i = N i =1 k = 0 N k
r n r r r k n n k n = ∑∑ ( −1) k xir − k x i =∑ (−1) k x ∑ xir −k i = N k =0 N k = 0 i =1 k k i =1 r r r k r = ∑ ( −1) k x a r − k = ∑ ( −1) k a k a r − k k=0 k =0 k k
Como casos particulares podemos expresar m2 = a2 − a 2 m3 = a3 − 3a2 ·a + 2a 3 m4 = a4 − 4a3 ·a + 6a2 a 2 − 3a 4
15/24
4. MEDIDAS DE DISPERSIÓN. En los dos apartados anteriores definíamos una serie de medidas de tendencia central cuyo objetivo era sintetizar toda la información de que se disponía. En este apartado veremos hasta que punto, para una determinada distribución de frecuencias, estas medidas de tendencia central son representativas como síntesis de toda la información. Medir la representatividad de estas medidas equivale a cuantificar la separación de los valores de la distribución respecto de dicha media. A la mayor o menor separación de los valores entre sí se le llama Dispersión o Variabilidad. Llamaremos Medidas de Dispersión a los coeficientes que nos miden el grado de dispersión de la distribución de la variable. Para una mejor clasificación, vamos a distinguir entre medidas de dispersión absolutas y relativas. 4.1. Absolutas. 4.1.1. Recorrido. Una primera aproximación para medir la dispersión en una distribución es calcular su recorrido. DEF Llamaremos Recorrido a la diferencia entre el mayor valor y el menor valor de una distribución. R = xn – x1 DEF Llamaremos Recorrido Intercuartílico a la diferencia existente entre el tercer cuartil y el primero. RI = C3 – C1 El Recorrido Intercuartílico nos indica que en el intervalo de longitud RI están comprendidos el 50% central de los valores. Si RI es pequeño, siempre en términos relativos de acuerdo con las unidades en que venga dada la distribución, podemos intuir una pequeña dispersión. 4.1.2. Desviaciones. Supongamos que tenemos un promedio P del que vamos a estudiar su representatividad. Consideremos que tenemos dos distribuciones que originan este mismo promedio P (supongámoslas de frecuencias unitarias por sencillez) y que son tales como las que se representan en el siguiente gráfico:
16/24
Si queremos saber cual de los dos promedios es más representativo, a simple vista parece que el primero, porque el error que se comete utilizando P (en lugar de los valores de la distribución) es menor en la primera que en la segunda. Luego, cuanto más agrupados estén los valores alrededor del promedio, más útil será. Para poder medir esto en una distribución genérica tenemos que considerar las desviaciones de cada valor con respecto al promedio, pero para evitar errores, se tomarán en valor absoluto o elevadas al cuadrado. 4.1.2.1.Desviación media respecto a la Media Aritmética. Tomamos ahora como promedio genérico P la media aritmética x y tomaremos las desviaciones en valor absoluto. Así pues, tendremos n
Dx = ∑ x i − x i =1
ni N
que es la desviación media respecto de la media aritmética. Un valor grande nos dirá la existencia de una gran dispersión en la distribución. La desviación media respecto la media aritmética se puede definir como la media aritmética de los valores absolutos de las diferencias entre los valores de la variable y la media aritmética. 4.1.2.2.Desviación Media respecto a la Mediana. Si el promedio cuya eficacia queremos medir es ahora la mediana tendremos: n
DMe = ∑ x i − Me i =1
ni N
que es la desviación media respecto a la Mediana. Para un valor grande, la mediana no será representativa. En la mediana demostramos que: n
∑x
i
−k
i =1
ni N
era mínima para k=Me, luego se verifica que DMe < Dx . Cuando la distribución está agrupada en intervalos, para calcular Me seguíamos el criterio:
17/24
Me = Li −1
N − N i −1 2 + ci ni
mientras que para x utilizábamos las marcas de clase. En esta doble operación utilizamos unas hipótesis de trabajo incompatibles. Para la Me la hipótesis era que los valores dentro del intervalo estaban distribuidos uniformemente, mientras que para x , al utilizar las marcas de clase, se hace implícitamente la hipótesis de que todos los valores de cada intervalo son iguales a xi. Debemos, en este caso, optar por una de las dos hipótesis para ambos cálculos. Las desviaciones medias tienen un significado preciso como promedio de las desviaciones, aunque tienen el inconveniente de no ser adecuadas al cálculo algebraico. 4.1.2.3.La Varianza. Propiedades. De todas las medidas de dispersión absolutas respecto a la media aritmética, la varianza y su raíz cuadrada, la desviación típica, son las más importantes. DEF Llamamos Varianza a la medida de dispersión que surge como media aritmética de los cuadrados de las desviaciones de los valores de la variable a la media aritmética. Es decir, el momento de segundo orden respecto a la media aritmética. Se denota por S2 y es: n 2 n S 2 = ∑ ( xi − x ) i N i =1 Evidentemente, S2 nos medirá la mayor o menor dispersión de los valores respecto a la media aritmética. Si la dispersión es muy grande, la media no será representativa. En el caso extremo de que todos los valores de la variable fuesen iguales, la media coincidiría con el valor común de las mismas y las desviaciones serían todas nulas, dando S2 =0. En general, cuanto más dispersas sean las observaciones, mayores serán las desviaciones respecto de la media, y mayor el valor numérico de la varianza. A continuación enunciamos unas propiedades que verifica la varianza. Las demostraciones son inmediatas y no las damos para no agrandar en exceso el tema. PROP La varianza no es negativa. PROP La varianza es la medida cuadrática de dispersión óptima. n
S 2 = ∑ ( xi − x ) i =1
2
n ni n < ∑ (x i − k )2 i N i =1 N
∀k ≠ x
PROP La varianza es igual al momento de segundo orden respecto al origen menos el de primer orden elevado al cuadrado. S 2 = m2 = a 2 − a 2
18/24
PROP La varianza está acotada inferior y superiormente en cada distribución de frecuencias. PROP Si en la distribución de frecuencias sumamos a todos los valores de la variable una constante, la varianza no varía. PROP Al multiplicar los valores de una distribución de frecuencias por una constante k, la varianza queda multiplicada por el cuadrado de la constante. También podemos ut ilizar como medida de dispersión respecto a la media el coeficiente n ni N 2 S * 2 = ∑ (xi − x ) = S2 N −1 N − 1 i =1 denominado Cuasivarianza. 4.1.2.4.Desviación Típica o Standard. Propiedades. Así como las desviaciones medias vienen expresadas en las mismas unidades de medida que la distribución, la varianza no, lo cual dificulta su interpretación. Es por ello que aparece la desviación típica. DEF Llamamos Desviación Típica a la raíz cuadrada, con signo positivo, de la varianza. Se representa por S, y es n
∑ (x
S = S2 =
i
− x)
2
i =1
ni N
Al ser la raíz cuadrada de la varianza, vendrá expresada en las mismas unidades de medida que la distribución, lo cual la hace más apta como medida de dispersión. Sus propiedades las podemos deducir fácilmente de las propiedades de la varianza. PROP La desviación típica no es negativa. PROP La desviación típica es una medida de dispersión óptima. PROP La desviación típica verifica
S = a2 − a2
PROP La desviación típica esta acotada superior e inferiormente. PROP A la desviación típica no le afectan los cambios de origen. PROP A la desviación típica le afectan los cambios de escala, siendo S’=k·S DEF Diremos que una variable estadística X está Tipificada, Estandarizada o Reducida si su media es cero y su varianza es 1. 19/24
Dada una variable X, su tipificada Z, se define como
Z=
X−x SX
4.2. Relativas. Supongamos que tenemos dos distribuciones de frecuencias cuyos promedios son P1 y P2 y queremos saber cuál de las dos es más representativa. Esta comparación no la podemos efectuar por sus respectivas medidas de dispersión , ya que las distribuciones, en general, no vendrán dadas en las mismas unidades de medida. Tampoco se podrá efectuar en el caso de que las unidades de medida sean las mismas, si los promedios son numéricamente diferentes. Por tanto, resulta necesario construir medidas adimensionales. Estas medidas de dispersión, llamadas relativas, siempre vendrán dadas en forma de cociente. Podemos destacar: DEF Llamamos coeficiente de Apertura a la relación por cociente entre el mayor y menor valor de una distribución. x A= n x1 Este coeficiente es el más fácil de calcular, pero presenta varios inconvenientes. Entre ellos podemos nombrar: 1) Mide la dispersión de la distribución sin hacer referencia a ningún promedio, por lo que no resuelve el problema de la comparación entre éstos. 2) Sólo tiene en cuenta dos valores de la distribución (los dos extremos), lo que nos dará una gran dispersión en el caso de que estén muy separados. DEF Llamamos Recorrido Relativo al cociente entre el recorrido y la media aritmética. R Rr = e x Nos indica el número de veces que el recorrido contiene a la media aritmética. DEF Llamamos Recorrido Semi-intercuartílico al cociente entre el recorrido intercuartílico y la suma del primer y tercer cuartil. RS =
C3 − C1 C3 + C1
20/24
4.2.1. Coeficiente de Variación de Pearson. Para poder comparar las medias aritméticas de dos distribuciones que vengan dadas en unidades diferentes tenemos el coeficiente de variación de Pearson. DEF Definimos el coeficiente de variación de Pearson como la relación por cociente entre la desviación típica y la media aritmética. V=
S x
En primer lugar, tenemos que dicha medida es adimensional. En segundo lugar, V representa el número de veces que S contiene a x . Cuanto mayor sea V, más veces contendrá S a x , luego relativamente a mayor V menor representatividad de x . Este coeficiente se suele expresar en tanto por ciento, siendo V=
S ·100 x
Como tanto en S como en x han intervenido todos los valores de la distribución, V presenta la garantía de que utiliza toda la información. La cota inferior de V es cero, al ser éste el menor valor que puede tomar S, y es el valor de V que indica la máxima representatividad de x . En caso de que la media aritmética sea nula, el valor de V no es significativo, ya que su resultado numérico nos puede hacer tomar conclusiones estadísticamente equivocadas. 4.2.2. Índice de Dispersión respecto a la Mediana. Para comparar medianas podemos definir un coeficiente similar a V. DEF
Definimos el índice de dispersión respecto a la mediana como: n
VMe
D = Me = Me
∑x
i
− Me ·n i
i =1
N ·Me
5. MEDIDAS DE FORMA. ASIMETRÍA Y CURTOSIS. En los apartados anteriores hemos realizado el análisis estadístico sintetizando la información mediante medidas de posición y visto la dispersión en la distribución. Pero analizar los datos no consiste sólo en hallar una media y una varianza. En este apartado vamos a ver una tipología de distribuciones según la forma de su representación gráfica. El motivo es que, aunque resumamos la distribución mediante medias, no debemos 21/24
proceder a una interpretación que implique un comportamiento de todos los elementos uniformemente constante e igual a la media. Las medidas de la forma de la distribución se pueden clasificar en dos grandes grupos: medidas de asimetría y medidas de curtosis. 5.1. Asimetría. Las medidas de asimetría se dirigen a elaborar un indicador que permita establecer el grado de simetría (o asimetría) que presenta la distribución, sin necesidad de llevar a cabo su representación gráfica. Si representamos gráficamente la distribución y trazamos una vertical que pase por la media aritmética, diremos que ésta es simétrica si deja a ambos lados el mismo número de valores. Será asimétrica en caso contrario. Vamos a buscar una medida que nos diga si la distribución es simétrica o no sin necesidad de representarla. Tomaremos la expresión n
m3 = ∑ ( x i − x) 3 i =1
ni N
así, si: m3 =0 la distribución es simétrica. m3 >0 la distribución es asimétrica positiva. m3 <0 la distribución es asimétrica negativa Si la distribución es asimétrica a derechas o positiva, sería lógico pensar que la suma de las desviaciones positivas será mayor que la suma de las desviaciones negativas. En caso de que la distribución sea asimétrica a la izquierda o negativa, lo anterior se repetirá, pero a la inversa. Esta medida está expresada en las mismas unidades que las de la variable, pero elevadas al cubo, por lo que no es invariante ante un cambio de escala. Para poder obtener un indicador adimensional, debemos dividir la expresión anterior por una cantidad que venga en sus mismas unidades. Tomaremos como dicha cantidad el cubo de la desviación típica, obteniéndose así DEF
Llamaremos Coeficiente de Asimetría de Ficher a
g1 =
m3 S3
Como S no es negativa, el signo de g1 coincide con el de m3 y entonces: g1 =0 g1 >0 g1 <0
la distribución es simétrica. la distribución es asimétrica positiva. la distribución es asimétrica negativa
Otras medidas de asimetría que siguen el mismo criterio de signos que las dos anteriores son las siguientes:
22/24
DEF
Llamamos Coeficiente de Asimetría de Pearson a
Ap =
x − Mo S
DEF
Llamamos Coeficiente de Asimetría de Bowley a
AB =
C 3 + C1 − 2 Me C3 − C1
DEF
Llamamos Coeficiente Absoluto de Asimetría a A=
(C 3 − C2 ) − ( C2 − C1 ) C3 + C1 − 2C 2 C3 + C 2 − 2Me = = S S S
5.2. Medidas de Apuntamiento o Curtosis. Las medidas de curtosis se aplican a distribuciones campaniformes, es decir, unimodales simétricas o con ligera asimetría. Las medidas de curtosis tratan de estudiar la distribución de frecuencias en la zona central de la distribución. La mayor o menor concentración de frecuencias alrededor de la media y en la zona central de la distribución dará lugar a una distribución más o menos apuntada. Por esta razón a las medidas de curtosis se les llama también de apuntamiento o concentración central. Para estudiar la curtosis de una distribución es necesario definir previamente una distribución “tipo”, que vamos a tomar como modelo de referencia. Esta distribución es la llamada distribución Normal, que corresponde a fenómenos muy corrientes en la naturaleza, y cuya representación gráfica es una campana de Gauss, dada por la fórmula 1 ( x −α )2
− 1 f (x ) = e 2 σ 2π
σ2
donde α y σ son la media y desviación típica, respectivamente. Se trata de ver la deformación existente entre una distribución, en sentido vertical, y la Normal. Diremos que una distribución puede ser más apuntada que la normal si es más alta y recibe el nombre de Leptocúrtica. En caso contrario recibe el nombre de Platicúrtica. La propia distribución normal recibe el nombre de Mesocúrtica. La idea del apuntamiento de una distribución surgió de la comparación de frecuencias de los valores centrales de la distribución considerada con la frecuencia de dichos valores en una distribución normal con media y varianza iguales a las de la distribución que se compara. DEF
Llamaremos Coeficiente de Apuntamiento o Curtosis a g2 =
m4 − 3. S4
23/24
Si g2 = 0 Mesocúrtica. g2 > 0 Leptocúrtica g2 > 0 Platicúrtica
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Teoría de la Estadística. Aut.: Mood/Graybill. Ed. Aguilar. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa. Ed. PPU Algoritmo. Matemáticas II. Cou. Aut.: Vizmanos y Anzola. Edit. SM. Estadística para Ingenieros. Aut.: Ramón Ardanuy y Quintín Martín. Edit.: Hespérides
24/24
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 61 DESIGUALDAD DE TCHEBYCHEV. COEFICIENTE DE VARIACION. VARIABLE NORMALIZADA. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS. 1. Variable Aleatoria. 1.1. Concepto de Variable Aleatoria. 1.2. Variable Aleatoria Discreta. 1.3. Variable Aleatoria Continua. 2. Esperanza Matemática. 2.1. Momentos. 2.2. Variable Normalizada 2.3. Coeficiente de Variación. 3. Desigualdades de Markov y Tchebychev. 4. Teoremas de Bernouilli y Moivre. 5. Aplicación al Análisis, Interpretación y Comparación de Datos Estadísticos. 5.1. Ejemplos. Bibliografía Recomendada.
1/14
TEMA 61 DESIGUALDAD DE TCHEBYSCHEV. COEFICIENTE DE VARIACION. VARIABLE NORMALIZADA. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS. 1. VARIABLES ALEATORIAS. 1.1. Concepto de Variable Aleatoria. DEF Sea un experimento E y sea Ω el espacio muestral asociado con el experimento. Llamaremos Variable Aleatoria a una función X que asigna a cada elemento s∈Ω un número real X(s). DEF Diremos que una variable aleatoria es Discreta si sólo toma un número finito de valores o un número infinito pero numerable. Si la variable aleatoria es discreta, enumeraremos los valores que toma como x1 , x2 , x3 , ... DEF Diremos que una variable aleatoria es Continua si toma un número infinito no numerable de valores 1.2. Variables Aleatorias Discretas. DEF Definimos la función de Probabilidad de la variable aleatoria discreta X como aquella función que asigna a cada número real xi la probabilidad de que la variable aleatoria tome ese valor, X=xi. f(xi) = P(X=xi) Tengamos en cuenta que la variable aleatoria X estaba definida sobre un espacio muestral Ω, el cual es discreto. En cambio, la función de probabilidad f(x) esta definida sobre 3. Así pues, si el número real xi no pertenece al conjunto de valores que toma X, se verificará f(xi) = P(X=xi) = 0 En cambio, si pertenece al conjunto de los valores asumibles por X, se verificará: f(xi) = P(X=xi) > 0 En este caso, f(xi) será la suma de las probabilidades de todos los sucesos elementales a los que X asigna el valor xi. Las propiedades fundamentales de la función de probabilidad no son más que la traducción de los axiomas de la probabilidad. PROP Si x1 , x2 , ..., xn son los valores que toma la variable aleatoria X, se verifica:
2/14
1) ∑ f ( xi ) = P( X = x1 ) + P ( X = x 2 ) + K + P( X = x n ) 2) f(xi)>0 ∀i:1, 2, ..., n 3) Si a
∫
+∞
−∞
f ( x ) dx = 1
3/14
DEF Llamaremos función de Distribución de la variable aleatoria continua X a una función que asigna a todo número real x, la probabilidad de que X sea igual o menor que x. F ( x) = P( X ≤ x) = ∫
x
−∞
f (t ) dt
PROP La función de distribución de una variable aleatoria continua X verifica: 1) F ( −∞) = Lim F ( x) = 0 x → −∞
2) F ( +∞) = Lim F ( x ) = 1 x→ +∞
3) F(x) es una función no decreciente. 4) P(a
µ = E ( X ) = ∑ xi f ( xi ) i
2) Caso Continuo:
+∞
µ = E ( X ) = ∫ xf ( x) dx −∞
La esperanza matemática, denotada por E(X), también recibe el nombre de Media o Valor Esperado. Cuando una variable aleatoria se expresa mediante una función Y=G(X), con X otra variable aleatoria, podemos expresar la esperanza matemática de Y utilizando X como sigue: 1) Caso Discreto.
µ = E (Y ) = E( G( X )) = ∑ g ( x i ) f ( x i ) = ∑ y i h( yi ) i
2) Caso Continuo.
i
+∞
+∞
−∞
−∞
µ = E (Y ) = E( G( X )) = ∫ g ( x ) f ( x ) dx = ∫ yh ( y )dy
Si tenemos que una variable aleatoria Z se expresa como producto de otras dos variables aleatorias, Z=X·Y, su esperanza matemática será: E ( Z ) = E ( XY ) = ∑ xi y j f ( x i , y j ) i,j
E ( Z ) = E ( XY ) = ∫
+∞
∫
+∞
−∞ −∞
4/14
xyf ( x, y) dxdy
PROP Sean a y b constantes y X una variable aleatoria con media µ. Si Y=aX+b entonces E(Y) = aµ+b. PROP El valor esperado de la suma o diferencia de dos o más funciones de una variable aleatoria X, es la suma o diferencia de los valores esperados de las funciones. E[g(X)±h(X)] = E[g(X)] ± E[h(X)] PROP La Esperanza Matemática es una función lineal. E(aX+bY) = aE(X) + bE(Y). 2.1. Momentos. DEF Sea X una variable aleatoria Discreta con función de probabilidad f(x). Llamaremos Momento de Orden r Respecto al Origen de la variable aleatoria X, y lo denotamos por α r, a la expresión: αr = E ( X r ) = ∑ x r f ( x) DEF Sea X una variable aleatoria Continua con función de densidad de probabilidad f(x). Llamaremos Momento de Orden r Respecto al Origen de la variable aleatoria X, y lo denotamos por α r, a la expresión: +∞
αr = E ( X r ) = ∫ x r f ( x )dx −∞
Podemos destacar a µ1 que corresponde precisamente con E(X), la media de la variable aleatoria. DEF Sea X una variable aleatoria Discreta con función de probabilidad f(x). Llamaremos Momento Central de Orden r de la variable aleatoria X, y lo denotamos por µr, a la expresión: r r µr = E ( X − E ( X ) ) = ∑ ( X − E ( X ) ) f ( x )
[
]
DEF Sea X una variable aleatoria Continua con función de densidad de probabilidad f(x). Llamaremos Momento Central de Orden r de la variable aleatoria X, y lo denotamos por µr, a la expresión:
[
r
]
+∞
r ( X − E ( X )) −∞
µr = E ( X − E ( X ) ) = ∫
f ( x ) dx
DEF Sea X una variable aleatoria con distribución de probabilidades f(x) y media µ. Definimos la Varianza de X, y se denota por Var(X), como µ2 , Momento Central de Orden 2. En el caso discreto
[
]
Var ( X ) = µ2 = E ( X − E ( X )) 2 = ∑ ( x i − µ) 2 f ( x i ) i
En el caso continuo
[
]
+∞
Var ( X ) = µ2 = E ( X − E( X )) 2 = ∫ ( x − µ) 2 f ( x ) dx
5/14
−∞
DEF Llamamos Desviación Típica o Estándar de una variable aleatoria X, y se denota por σ, a la raíz cuadrada de la Varianza. σ = Var ( X ) = µ2 PROP La varianza de una variable aleatoria X se puede expresar como la media de los cuadrados menos el cuadrado de la media.
[
]
Var ( X ) = E ( X − E ( X )) 2 = E ( X 2 ) − E ( X ) 2 PROP Si a y b son constantes y X es una variable aleatoria con media µ y varianza σ2 . Se verifica: Var(aX+b) = a2 Var(X) 2.2. Variable Normalizada. DEF
Si en la proposición anterior, tomamos como caso particular los valores a =
1 y σ
µ X −µ , la variable , que expresa la desviación de la variable aleatoria X σ σ respecto de su media y medida en unidades de la desviación típica, recibe el nombre de Variable Normalizada o Tipificada. b= −
Nótese que la media de la variable normalizada es cero y su desviación típica uno. X − µ E =0 σ
X − µ Var σ
1
2
X − µ 2 = E =1 σ
2.3. Coeficiente de Variación. DEF Llamaremos Coeficiente de Variación de la variable aleatoria X al cociente de la desviación típica por la media. σ E( X ) Para poder comparar las medias aritméticas de dos distribuciones que vengan dadas en unidades diferentes tenemos el coeficiente de variación de Pearson. DEF Definimos el coeficiente de variación de Pearson como la relación por cociente entre la desviación típica y la media aritmética. V=
σ µ
6/14
En primer lugar, tenemos que dicha medida es adimensional. En segundo lugar, V representa el número de veces que σ contiene a µ. Cuanto mayor sea V, más veces contendrá σ a µ, luego relativamente a mayor V menor representatividad de µ. Este coeficiente se suele expresar en tanto por ciento, siendo V=
σ ·100 µ
Como tanto en σ como en µ han intervenido todos los valores de la distribución, V presenta la garantía de que utiliza toda la información. La cota inferior de V es cero, al ser éste el menor valor que puede tomar σ, y es el valor de V que indica la máxima representatividad de µ. En caso de que la media aritmética sea nula, el valor de V no es significativo, ya que su resultado numérico nos puede hacer tomar conclusiones estadísticamente equivocadas. 3. DESIGUALDADES DE MARKOV Y TCHEBYCHEV. En este apartado vamos a ver las desigualdades de Markov y Tchebychev. Ambas se basan en el concepto de valor esperado para establecer acotaciones sobre la probabilidad. La desigualdad de Markov establece una acotación de la probabilidad de una función no negativa de una variable aleatoria X. Con la desigualdad de Tchebychev, si conocemos la distribución de probabilidades de una variable aleatoria X, podemos calcular su esperanza E(X) y su varianza Var(X), si existen. Sin embargo, el recíproco es falso. Es decir, conociendo la media y la varianza de la variable aleatoria X no podemos reconstruir la distribución de probabilidades de X. Debido a esto, es conveniente obtener unas cotas superior e inferior para la función de probabilidad. DESIGUALDAD DE MARKOV. Dadas una función g no negativa de la variable aleatoria X y una constante t positiva, se verifica que E[g ( X ) ] P[g ( X ) ≥ t ] ≤ t Dem. La demostración vamos a realizarla para el caso de que la variable aleatoria X sea continua. El caso discreto es análogo. Sea D el dominio en el que g(X)≥t. Entonces: +∞
E[g ( X ) ] = ∫ g ( x) f ( x) dx ≥ ∫ g ( x ) f ( x ) dx ≥ ∫ tf ( x )dx ≥ t ∫ f ( x ) dx −∞
D
D
D
Teniendo ahora en cuenta las propiedades que verifica la función de densidad:
7/14
∫
+∞
−∞
resulta que
f ( x ) dx = 1
y
∫
D
f ( x )dx = P[g ( X ) ≥ t ]
E[g ( X ) ] ≥ tP[g ( X ) ≥ t ]
y operando llegamos a P[g ( X ) ≥ t ] ≤
E[g ( X ) ] t
Un caso particular que merece la pena destacar es cuando la función g sea la identidad, g(X)=X. En este caso E [X ] P[X ≥ t ] ≤ t siempre que X≥0. Esta expresión nos va a permitir demostrar la desigualdad de Tchebychev. DESIGUALDAD DE TCHEVYCHEV. Sea X una variable aleatoria con media µ y varianza σ2 . Entonces, ∀k>0 se verifica: P(µ − kσ < X < µ + kσ ) = P( X − µ < kσ ) ≥ 1 −
1 k2
Dem. Definamos la variable aleatoria Y=[X-E(X)]2 . Como P(Y≥0) = 1 podemos aplicar la desigualdad de Markov, para obtener:
(
)
P( X − µ ≥ kσ) = P Y ≥ k 2 σ 2 ≤
E (Y ) σ2 1 = = 2 2 2 2 2 k σ k σ k
verificando su complementario la desigualdad que queremos demostrar: P( X − µ < kσ ) ≥ 1 −
1 k2
Veamos ahora otra manera de enunciar la desigualdad de Tchevybech, y vamos a realizar su demostración para el caso de una variable discreta. DESIGUALDAD DE TCHEVYBECH. Sea X una variable aleatoria. ∀k>o se verifica: P( X ≥ k ) ≤ Dem.
8/14
E( X 2 ) k2
Sea X una variable aleatoria discreta. E ( X 2 ) = ∑ xi2 pi = i
2 i
∑x
pi +
xi ≤ − k
∑x
2 i
pi +
− k < xi < k
∑x
2 i
pi
k≤xi
Entonces E( X 2 ) ≥
2 i
∑x
pi +
xi ≤ − k
2 i
∑x
k ≤ xi
pi ≥ k 2 ∑ p i + ∑ pi k ≤ xi xi≤−k
E ( X 2 ) ≥ k 2 ·P( X ≥ k ) ⇒
P( X ≥ k ) ≤
E( X 2 ) k2
Si en la desigualdad anterior sustituimos la variable aleatoria X por otra variable que X −µ esté tipificada , obtenemos la desigualdad de Tchevychev demostrada en primer σ lugar. La desigualdad de Tchevychev nos va a servir para poder justificar la introducción del concepto frecuencialista de probabilidad. Sea A un suceso aleatorio, con probabilidad p, P(A)=p. Sea f la variable aleatoria que mide el número de apariciones de A en una serie de n observaciones independientes. si se verifica A 1 f = X1 + X2 + ... + Xn donde X i = en la i-ésima experiencia 0 si no se verifica A E(Xi) = 1 – P(A) + 0·(1 – P(A)) = p Var(Xi) = E[(Xi – p)2 ] = p·(1 – p)2 + (1 – p)·(0 – p) = p·(1 – p) Como los experimentos son independientes: E(f) = E(X1 ) + E(X2 ) + ... + E(Xn ) = np Var(f) = Var(X1 ) + Var(X2 ) + ...+ Var(Xn ) = np(1 – p) 4. TEOREMAS DE BERNOUILLI Y MOIVRE. TEOREMA DE BERNOUILLI. Dado k>0, la probabilidad de que la desviación absoluta de la frecuencia relativa de A sea mayor que k en la repetición de n experiencias independientes respecto a la probabilidad de A tiende a 0 cuando n tiende a ∞. Dem.
9/14
Apliquemos la desigualdad de Tchebychev a la variable aleatoria f np E = =p n n
np(1 − p ) = n
f σ = Var = n
f p(1 − p ) 1 P − p ≥ k ≤ ≤ 2 nk 4 nk 2 n
ya que
f . n
p(1 − p) n
p (1 − p ) ≤
1 4
∀p ∈ [0,1]
Entonces: f Lim P − p ≥ k = 0 n →∞ n Un caso algo más general fue obtenido por Poisson, que hacía variar la probabilidad de A de un experimento a otro. Si la probabilidad de A en el experimento i-ésimo es pi, tenemos que n
n
E ( f ) = ∑ pi
Var ( f ) = ∑ p i (1 − p i )
i =1
i =1
y entonces n
f P − p ≥ k ≤ n
∑ p (1 − p ) i
i
i =1
2
n k
2
≤
1 4n 2 k 2
siendo p=
1 n ∑ pi n i =1
la probabilidad media. El teorema de Bernouilli se publico en el año 1713, 150 años después que la desigualdad de Tchebychev. Originalmente se demostró calculando directamente la probabilidad n i f P − p ≤ k = P( f − np ≤ nk ) = p (1 − p) n − i ∑ n n ( p − k )≤ i ≤ n ( p + k ) i Bernouilli tardó veinte años en calcular el sumatorio anterior, y probar que tiende a 1 cuando n tiende a ∞. Sin embargo, hoy en día puede deducirse un resultado mucho más general que el de Bernouilli y que fue dado por De Moivre en 1733, y que se podría enunciar como: “La Distribución Binomial es Asintóticamente normal” también conocido como Teorema Central del Límite, en forma reducida. 10/14
En la demostración de De Moivre, se utilizaba la variable tipificada λ=
f − np np(1 − p)
Entonces:
∑
P( λ1 < λ < λ2 ) =
np + λ1 np (1− p ) ≤i ≤np + λ 2
n i p (1 − p) n − i np (1− p ) i
Pues bien Lim P( λ1 < λ < λ2 ) =
1 2π
n →∞
∫
λ2
λ1
e
−
u2 2
du
siendo la expresión de la derecha la función de distribución normal. El cálculo de la probabilidad
∑
np +λ1 np (1− p ) ≤i ≤ np + λ2
n i p (1 − p ) n −i np (1 − p ) i
anterior, cuando n→∞ puede hacerse de forma ligeramente distinta, lo que proporciona otra distribución límite, llamada de Poisson, muy útil cuando n es muy grande y p es muy pequeña. Sea λ un parámetro tal que r
n λ λ P( X = r ) = 1 − n r n
λ = p·n n− r
y
q = 1 − p =1 −
λ n
n( n − 1) K ( n − r + 1) λr λ = · 1 − r! n nr
1 2 r − 1 λr λ = 1 − 1 − L 1 − · ·1 − n r! n n n
n
λ ·1 − n
n− r
=
−r
Tomando límites cuando n→∞ nos queda la distribución de Poisson λr −λ e r!
P( X = r ) ≈
λr −λ Se verifica que ∑ e = 1 , la esperanza es λ=np y la varianza es σ2 =λ r = 0 r! ∞
En la práctica, se suele utilizar cuando es suceso A es raro y np ≤ 5
11/14
5. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS. La noción de ley de probabilidad correspondiente a una variable aleatoria se introduce en Estadística como un modelo de las regularidades que se observan al considerar series estadísticas. Al igual que sucede con todas las teorías de las Matemáticas, la segunda parte es ver como se adaptan los modelos matemáticos a la realidad. Igualmente, si llegamos a establecer criterios que permitan afirmar que una serie estadística se puede considerar como una cierta aproximación de una ley de probabilidad, podemos admitir que el mecanismo que conduce a estas observaciones será análogo al de los experimentos imaginados para obtener valores del universo que tiene dicha ley de probabilidad. Concretamente, al aplicar métodos estadísticos para obtener nuevos conocimientos de los fenómenos naturales, se pueden considerar cuatro etapas: a) Descripción. Propone la recogida, clasificación y presentación resumida de datos relativos a un fenómeno. b) Modelos. Para explicar los hechos observados se formulan hipótesis, teorías o se buscan modelos, que expresen en forma matemática las relaciones que se han observado en los datos estadísticos. c) Verificación. También llamado Contraste del Modelo, Se realiza mediante la recogida de nuevos datos estadísticos relativos al fenómeno estudiado. Si la ley se confirma, podrá utilizarse en lo sucesivo. Si no, se descarta. d) Predicción. La teoría o modelo establecido permite establecer predicciones. 5.1. Ejemplos. a) Ley de Mendel. 1) Descripción. Mendel estudió el cruce de una variedad de guisantes amarillos con otros verdes. Los guisantes verdes, al reproducirse, dan siempre verdes, pero los amarillos dan unos sólo amarillos y otros amarillos y verdes. Estos amarillos dan una raza pura que da
12/14
indefinidamente amarillos. Si se cruzan verdes con amarillos de raza pura, se obtiene una primera raza de híbridos verdes. Si éstos se cruzan entre sí, se obtienen guisantes amarillos y verdes aproximadamente en una proporción 3 a 1. 2) Modelo Matemático. Este modelo fue sugerido por el propio Mendel. En los cromosomas del guisante hay un corpúsculo portador del color. En la raza híbrida, unos gametos llevan el gen V y otros el A en la misma proporción. Al formarse las células, se pueden tener los siguientes tipos: V1 V2 A1 V2 V1 A2 A1 A2 Como A es dominante, entonces la proporción de amarillos es de ¾. 3) Verificación. En este caso, la comprobación de la Ley debe hacerse con test de hipótesis, por ejemplo la χ2 de Pearson. 4) Predicción. Una vez confirmada la ley, se puede saber con cierta probabilidad cual será el resultado del cruzamiento de dos plantas de guisantes en las condiciones anteriores. b) Calidad en la Producción de Inyectables. 1) Descripción. Se ha observado que una máquina produce inyectables con un porcentaje de defectuosos del 1% en un lote de 10.000 unidades. 2) Modelo. El número de inyectables defectuosos en una caja de 200 unidades es variable, pero una teoría basada en la observación y en un modelo del cálculo de probabilidades permite considerar el número de defectuosos como una variable de Poisson 3) Verificación. Si este modelo es confirmado por la experiencia, se puede utilizar para la predicción. Si no es confirmado, se revisa la hipótesis del paso 2. 4) Predicción. La hipótesis y teoría anterior permite predecir que es prácticamente seguro que en una caja de 200 unidades de inyectables aparezcan, a lo sumo, cuatro defectuosos.
13/14
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Teoría de la Estadística. Aut.: Mood/Graybill. Ed. Aguilar. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa. Ed. PPU Algoritmo. Matemáticas II. Cou. Aut.: Vizmanos y Anzola. Edit. SM. Curso Básico de Estadística Económica. Aut.: M.P. Martín y F.J. Martín. Edit.: AC.
14/14
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 62 SERIES ESTADÍSTICAS BIDIMENSIONALES. COEFICIENTE DE VARIACIÓN. VARIABLE NORMALIZADA. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS. 1. Distribuciones Bidimensionales de Frecuencias. 1.1. Independencia y Relación Funcional de dos Variables. 1.2. Tablas de Correlación y de Contingencia. 1.3. Distribuciones Marginales. 1.4. Distribuciones Condicionadas. 1.5. Independencia Estadística. 2. Representaciones Gráficas. 3. Momentos de Distribuciones Bidimensionales. 3.1. Momentos Respecto al Origen. 3.2. Momentos Respecto a las Medias. 3.3. Cálculo de los Momentos Centrales en función de los Momentos Respecto al Origen. 3.4. Método Reducido para el Cálculo de Varianza y Covarianza. 3.5. Valor de la Covarianza en caso de Independencia Estadística. 4. Ajuste. 4.1. Método de los Mínimos Cuadrados. 4.1.1. Ajuste de una Recta. 4.1.2. Ajuste de una Parábola. 4.1.3. Ajuste Hiperbólico. 4.1.4. Ajuste Potencial. 4.1.5. Ajuste Exponencial. 4.2. Método de los Momentos. 5. Regresión. 5.1. Regresión Lineal. 5.1.1. Recta de Regresión de Y sobre X. 5.1.2. Recta de Regresión de X sobre Y. 5.2. Coeficientes de Regresión. 6. Correlación. 6.1. Campo de Variación de R y su Interpretación. 6.2. Coeficiente de Correlación Lineal. 6.3. Interpretación Analítica de r. 6.4. Interpretación Geométrica de r. 7. Varianza debida a la Regresión y Coeficiente de Determinación Lineal. 8. Aplicaciones de la Regresión y la Correlación. 8.1. Uso y Abuso de la Regresión. 8.2. Predicción. Bibliografía Recomendada.
1/25
TEMA 62 SERIES ESTADÍSTICAS BIDIMENSIONALES. COEFICIENTE DE VARIACIÓN. VARIABLE NORMALIZADA. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS. 1. DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS. Si estudiamos sobre la misma población dos caracteres cuantitativos X e Y y los medimos en las mismas unidades estadísticas, obtenemos dos series estadísticas de las variables X e Y. Considerando simultáneamente ambas series, el par de valores (xi,yi ) le corresponde una variable estadística Bidimensional. Es posible estudiar de forma separada la distribución de la población según el carácter X o Y, obteniendo x, S x , y, S y o cualquier otro parámetro. Pero puede ser interesante considerar de forma simultánea los dos caracteres, con el objetivo de determinar las posibles relaciones entre ellos y así poder responder a preguntas como ¿Existe algún tipo de relación entre los caracteres X e Y?. Vamos a ver instrumentos estadísticos que nos van a permitir obtener la existencia o no de coincidencias entre los valores de dos variables y, a partir de esas coincidencias, formular la hipótesis de una relación causal entre los dos caracteres. Si existen coincidencias estadísticas entre los valores de dos caracteres, o lo que es lo mismo, si existe relación entre las dos variables, las coincidencias pueden ser más o menos fuertes, y la intensidad de la relación puede variar entre ausencia total de relación o ligazón perfecta. 1.1. Independencia y Relación Funcional de dos Variables. DEF Diremos que dos variables son independientes cuando no existe relación entre ambas. Inversamente, cuando la relación entre dos variables es perfecta, diremos que están relacionadas funcionalmente, lo cual implica que su relación puede expresarse como y=f(x). DEF Diremos que Y depende funcionalmente de X cuando podamos establecer una aplicación que nos transforme los elementos de X en elementos de Y. Desde el punto de vista de la Estadística, lo que realmente nos interesa es que podemos determinar los elementos de Y conocidos los de X, o viceversa. Pero esa circunstancia no será muy habitual. Existen características como la estatura y el peso, consumo y renta, etc. en los que aun existiendo interrelación, es imposible definir una aplicación en el sentido estrictamente matemático. Es decir, no dependen funcionalmente una de otra. Estadísticamente hablando, es claro que el peso depende en cierta forma de la estatura, el consumo depende de la renta, etc. Este tipo de relación no expresable a través de una determinada aplicación es la conocida como Dependencia Estadística. Y 2/25
este tipo de dependencia si admite grados, ya que puede haber dependencias más o menos fuertes. Estos tipos de dependencia se pueden expresar gráficamente mediante un segmento de la recta real, donde en un extremo situamos la dependencia funcional y en el otro la independencia. Los puntos intermedios del segmento se corresponden con los diferentes grados de dependencia estadística. 1.2. Tablas de Correlación y de Contingencia. Dada una población, en la que estudiamos simultáneamente dos caracteres X e Y, podemos representar la distribución mediante ternas de la forma (xi, yj, nij), donde xi e yj son dos valores cualesquiera y nij es la frecuencia absoluta conjunta del valor i-ésimo de X y j-ésimo de Y. Los resultados se pueden representar en una tabla de doble entrada conocida como Tabla de Correlación. X \ Y x1 x2 … xm n.j
y1 n11 n21 … nm1 n·1
y2 n12 n22 … nm2 n·2
… … … … … …
yn n1n n2n … nmn n·n
ni. n1· n2· … nm· N
Si la distribución bidimensional es de atributos, la tabla de doble entrada recibe el nombre de Tabla de Contingencia. 1.3. Distribuciones Marginales. A partir de una distribución bidimensional podemos realizar el estudio de cada una de las variables de forma aislada. Tendríamos así dos distribuciones unidimensionales las cuales serían las correspondientes a X e Y respectivamente. Para poder obtenerlas, necesitamos determinar las frecuencias marginales. La distribución marginal de X se halla obteniendo cuantas veces se repite el valor xi, independientemente de que aparezca conjuntamente o no con algún valor de Y. Así, tenemos que la distribución marginal de X sería: X x1
ni· n
n1· = ∑ n1 j j =1
x2
n
n 2· = ∑ n2 j j =1
… xm
… n
n m · = ∑ nmj j =1
3/25
Análogamente obtendríamos la distribución marginal de Y. 1.4. Distribuciones Condicionadas. Se pueden formar otro tipo de distribuciones unidimensionales en las que previamente haría falta definir una condición. En general, las distribuciones de X condicionadas a que Y tome un determinado valor (por ejemplo yj) son: xi/yj x1 x2 … xm
ni/j n1j n2j … nmj n·j
De forma análoga construiríamos las distribuciones de Y condicionadas a que X tome un determinado valor. La frecuencia relativa de la distribución condicionada a algún valor de y es: fi/ j =
nij n· j
Análogamente, la frecuencia relativa de la distribución condicionada a algún valor de x es: n f j / i = ij ni · 1.5. Independencia Estadística. DEF Diremos que dos variables X e Y son independientes estadísticamente cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales. Es decir: nij ni · n· j = · ∀ i, j N N N En este caso, las frecuencias relativas condicionadas serán:
fi/ j
n· j N = ni · = = n· j n· j N nij
ni ·
f j/i
n· j nij ni · N n = = = ·j ni · ni · N
Como vemos, las frecuencias relativas condicionadas son iguales a sus correspondientes frecuencias relativas marginales, lo que nos indica que el condicionamiento no existe. Las variables son independientes, puesto que en las
4/25
distribuciones marginales se estudia el comportamiento de una variable con independencia de los valores que pueda tomar la otra. 2. REPRESENTACIONES GRÁFICAS. La representación gráfica más utilizada consiste en representar cada pareja de valores mediante un punto en un sistema de ejes coordenados. Por tanto, la distribución vendrá dada por un conjunto de puntos que recibe el nombre de Nube de Puntos o Diagrama de Dispersión. Cuando una pareja de valores está repetida, junto a la representación del punto correspondiente se indica el valor de su frecuencia. La representación gráfica de la nube de puntos puede hacerse tanto con datos agrupados (las marcas de clase son las que se representan) como con datos sin agrupar. En el diagrama de tres dimensiones y utilizando los límites de intervalos (no las marcas de clase), el “escalograma” más adecuado es el constituido por paralelepípedos cuyo volumen sea la correspondiente frecuencia, y los lados de la base cada una de las amplitudes de los respectivos intervalos de las variables, y donde nij es el volumen del paralelepípedo y hij la altura del mismo. n ij = ( Li − Li −1 )·( L j − L j −1 )·hij
3. MOMENTOS DE DISTRIBUCIONES BIDIMENSIONALES. Al igual que se definen los momentos en las distribuciones unidimensionales, podemos hacerlo en las bidimensionales. Por tanto, podemos distinguir entre momentos respecto al origen y momentos respecto a la media. 3.1. Momentos Respecto al Origen. DEF Definimos el momento de orden r,s respecto al origen para la distribución (xi,yj,nij ) como m n nij αrs = ∑ ∑ xir y sj ⋅ N i =1 j =1 Podemos calcular los momentos de primer orden: m
n
α10 = ∑∑ x1i y 0j ⋅
nij
i =1 j =1
N
m
n ij
n
α01 = ∑ ∑ xi0 y 1j ⋅ i =1 j =1
N
m
n
= ∑ ∑ xi ⋅ i =1 j =1
m
n
= ∑∑ y j ⋅ i =1 j =1
nij N n ij N
m
n
= ∑ xi ⋅ ∑
n ij
i =1
j =1
N
n
m
n ij
= ∑ yj ⋅∑ j =1
i =1
N
ni · =x N
m
= ∑ xi ⋅ i =1
n
= ∑ yj ⋅ j =1
n· j N
=y
También resulta sencillo calcular los momentos de segundo orden:
5/25
m
n
α20 = ∑ ∑ xi2 y 0j ⋅
nij
i =1 j =1
N
m
nij
n
α02 = ∑∑ xi0 y 2j ⋅ i =1 j =1
m
n
α01 = ∑ ∑ xi y j ⋅ i =1 j =1
N
m
nij
n
= ∑ ∑ x i2 ⋅ i =1 j =1
N
m
n ij
n
= ∑ ∑ y 2j ⋅
N
i =1 j =1
m
n
nij
i =1
j =1
N
n
m
nij
j =1
i =1
N
= ∑ x i2 ⋅ ∑
= ∑ y 2j ⋅ ∑
ni · N
m
= ∑ x i2 ⋅ i =1
n
n· j
j =1
N
= ∑ y 2j ⋅
nij N
3.2. Momentos Respecto a las Medias. DEF Definimos el momento de orden r,s respecto a las medias para la distribución (xi,yj,nij ) como: m n r s n ij µrs = ∑∑ (x i − x ) ⋅ ( y j − y ) ⋅ N i =1 j =1 Los momentos de primer orden son m
n
(
µ10 = ∑∑ (x i − x) y j − y 1
)
nij
0
N
i=1 j=1 m
n
(
µ01 = ∑∑(xi − x ) y j − y 0
m
1
m
n
(
nij
)
= ∑∑ y j − y
N
i=1 j =1
N
i=1 j =1
nij
)
nij
n
= ∑∑ (xi − x)
N
i=1 j=1
m
= ∑(x i − x ) i=1
n
(
=∑ yj − y j=1
n
n ij
∑N j =1
m
= ∑ (xi − x ) i=1
) ∑ nN = ∑ (y m
ij
i =1
n
j
−y
ni· =0 N n· j
)
N
j=1
=0
Los Momentos de segundo orden son: m
n
(
µ20 = ∑∑(x i − x) y j − y 2
)
i =1 j=1 m
n
(
µ02 = ∑∑ (xi − x) y j − y 0
i=1 j =1
m
n
)
2
nij
0
m
N nij
i =1 j =1
DEF
m
n
(
)
= ∑∑ y j − y
N 1
2
i=1 j =1
µ11 = ∑∑ (x i − x ) ⋅ ( y j − y ) ⋅ 1
n
= ∑∑ (xi − x )
i =1 j=1
nij N
2
nij N nij N
m
= ∑ (xi − x )
2
i =1 n
(
= ∑ yj − y j=1
n
nij
∑N j=1
m
= ∑(x i − x) i=1
) ∑ nN = ∑(y 2
m
i=1
ij
2
n
)
j − y
j=1
2
ni· = S 2X N n· j N
= SY2
= S XY
Llamamos Covarianza al momento µ11 , que también se representa por SXY.
3.3. Cálculo de los Momentos Centrales en Función de los Momentos respecto al Origen. Al igual que sucede en las distribuciones unidimensionales, los momentos centrales de una distribución bidimensional pueden expresarse en función de los momentos respecto del origen. 6/25
Veamos: m
m m m ni · m 2 n n n 2 n 2 = ∑ xi − 2x i x + x i · = ∑ xi2 i · − 2 x∑ xi i · + x ∑ i · = N i =1 N i =1 N N i =1 i =1 N
(
µ20 = ∑ ( xi − x )
2
i =1
)
2
= α20 − 2 xα10 + x = α20 − 2α102 + α102 = α20 − α102 S 2X = µ20 = α20 − α102
Por tanto tenemos que
2 S Y2 = µ02 = α02 − α01
De forma análoga comprobaríamos que Además, de la covarianza podemos decir: m
n
S XY = µ11 = ∑ ∑ (x i − x ) ⋅ ( y j − y ) ⋅ 1
1
i =1 j =1
m
n
= ∑∑ x i y j ⋅ i =1 j =1
nij N
m
n
− x ∑∑ y j ⋅ i =1 j =1
nij N
nij N m
m
n
= ∑ ∑ (x i y j − x y j − yx i + y x ) ⋅ i =1 j =1
n
− y ∑∑ x i ⋅
n ij
i =1 j =1
N
m
n
+ x y ∑∑ i =1 j =1
nij N
nij N
=
=
= α11 − xα01 − yα10 + x y = α11 − α10 α01 − α01α10 + α10α01 = α11 − α10 α01 Nos queda que la covarianza es
S XY = µ11 = α11 − α10α01
3.4. Método Reducido para el Cálculo de Varianza y Covarianza. En aquellos casos en los que nos pueda parecer conveniente, podemos realizar determinados cambios de variable para así simplificar los cálculos. Los cambios de variable siempre serán los mismos: x i' =
x i − O1 c1
y 'j =
y j − O2 c2
siendo O1 y O2 orígenes de trabajo arbitrarios que se procuran sean puntos centrales de la distribución. Así, sabemos que: x = c1 x '+O1 y = c 2 y '+O2 S 2X = c12 ( S X' ) 2 S Y2 = c 22 ( S Y' ) 2 ' S XY = c1 c 2 S XY
7/25
3.5. Valor de la Covarianza en caso de Independencia Estadística. Según hemos visto, la covarianza se podía expresar como S XY = µ11 = α11 − α10α01 La condición de independencia estadística era
nij ni · n· j = · N N N
∀ i, j
Calculemos, según esta condición, el valor de α 11 m
n
α11 = ∑ ∑ x 1i y 1j ⋅ i =1 j =1
nij N
m
n
= ∑∑ xi y j ⋅ i =1 j =1
m n· j ni · n· j n n · = ∑ x i i · ·∑ y j ⋅ = α10 ⋅ α01 N N i =1 N j =1 N
Luego, cuando las variables son independientes, la covarianza es nula. En cambio el recíproco no tiene por qué ser cierto. 4. AJUSTE. Sea (xi,yj,nij ) una distribución bidimensional en la que suponemos que existe relación entre las variables aleatorias X e Y. Si representamos en un sistema de ejes coordenados los pares de valores de ambas variables, el problema del ajuste consiste en obtener la ecuación de una curva que pase cerca de los puntos y se adapte lo mejor posible a los mismos, cumpliendo unas determinadas condiciones. Cuando pretendemos realizar un ajuste nos encontramos con dos problemas: 1) Elegir el mejor tipo de curva que se adapte a los datos disponibles, es decir, aquella que mejor represente la relación existente entre X e Y. Es importante, sólo a modo de orientación, ver la representación gráfica de los puntos. 2) Fijado el tipo de curva a través de su ecuación en forma explícita con un cierto número de parámetro, determinar éstos mediante las condiciones que se impongan según el procedimiento de ajuste planteado. 4.1. Métodos de los Mínimos Cuadrados. Dados los puntos (x1 ,y1 ), (x2 ,y2 ), ..., (xm,ym), podemos elegir una función de ajuste definida por: y = f(x,a1 ,a2 ,...,an ) en la que intervienen n parámetros (a1 ,a2 ,...,an ) con n
8/25
Para cada término xi, existe una diferencia entre el valor observado en la distribución y el obtenido en forma teórica, que llamaremos Residuo. ej = yj – yj* El método de mínimos cuadrados consiste en determinar los parámetros a1 ,a2 ,...,an de tal forma que los residuos sean mínimos. Si tomamos la suma de todos los residuos
∑ ∑ (y i
j
− y *j )n ij
j
nos encontramos con dos problemas a la hora de minimizar la expresión. El primero es que tenemos residuos de diferente signo, los cuales se compensarán en la suma, pudiendo dar una suma muy pequeña para residuos muy grandes. El segundo problema es que la determinación de los parámetros no es única, ya que obtendríamos diferentes conjuntos de parámetros que arrojarían la misma suma mínima de los residuos. Para solucionar estos problemas siguiendo con el método de mínimos cuadrados, lo que vamos a hacer es tratar de minimizar la expresión: φ = ∑∑ ( y j − y *j ) nij 2
i
j
Como los valores teóricos son los obtenidos a partir de la curva ajustada, tenemos que la expresión a minimizar se queda como: φ = ∑∑ ( y j − f ( x i , a1 , a 2 , K, an ) ) nij 2
i
j
para lo cual, la condición necesaria es que las primeras derivadas parciales respecto a cada uno de los parámetros se anulen. El sistema que se obtiene recibe el nombre de Sistema de Ecuaciones Normales.
9/25
∂φ = 2∑ ∑ y j − f ( xi ; a1 , a 2 ,K , a n ) ·nij ·(− f a'1 ) = 0 ∂a1 i j ∂φ ' = 2∑ ∑ y j − f ( x i ; a1 , a 2 , K, an ) ·nij ·( − f a 2 ) = 0 ∂a 2 i j L ∂φ = 2∑ ∑ y j − f ( x i ; a1 , a 2 , K, an ) ·nij ·( − f a'n ) = 0 ∂a n i j
[
]
[
]
[
]
Resolviendo este sistema determinamos los valores de los parámetros, así como la propia función f. A continuación vamos a utilizar el método descrito para ajustar algunas funciones que corrientemente se suelen presentar. 4.1.1. Ajuste de una Recta. Dada una nube de puntos, vamos a tratar de ajustarla mediante una recta de ecuación y *j = a + bxi Para determinar los coeficientes a y b buscaremos el mínimo de la función: φ = ∑∑ ( y j − y *j ) nij = ∑∑ ( y j − ( a + bxi ) )2 nij = ∑∑ ( y j − a − bx i )2 nij 2
i
j
i
j
i
j
para lo cual, obtendremos las derivadas parciales de la función con respecto a los parámetros. Al igualar a cero ambas expresiones, resolvemos el sistema de dos ecuaciones que aparece. ∂φ = 2∑∑ ( y j − a − bx i )( −1)n ij = 0 ∂a i j ∂φ = 2∑ ∑ ( y j − a − bx i )(− x i ) nij = 0 ∂b i j Dividiendo ambos miembros por –2, nos queda:
∑∑ (y − a − bx )n = 0 ∑ ∑ ( y − a − bx )(x )n = 0 j
i
j
i
i
ij
j
i
j
i
ij
Operando y cambiando términos de un miembro a otro:
10/25
∑∑ y n ∑∑ y x n j
i
j
i
= a ∑∑ nij + b∑ ∑ xi nij
2 = a ∑∑ x i nij + b∑ ∑ x i nij i j i j
ij
j
i
i
ij
j
j
i
j
Podemos resumir la expresión anterior en:
∑y
n· j = aN + b ∑ xi ni ·
2 x i nij + b∑ xi ni · ∑i ∑j y j xi nij = a ∑∑ i j i j
j
i
Ahora ya estamos en condiciones de resolver el sistema, llamado Sistema de Ecuaciones Normales. b=
S XY S X2
a = y − bx
4.1.2. Ajuste de una Parábola. En este caso, la curva seleccionada para ajustarse a la nube de puntos es y *j = a + bx i + cxi2 y para hallar los parámetros a, b y c debemos minimizar la función φ = ∑∑ ( y j − a − bxi − cxi2 ) n ij 2
i
j
Las primeras derivadas parciales de la función con respecto a cada uno de los parámetros nos determinan el sistema siguiente: ∂φ = 2 ∑∑ y j − a − bxi − cx i2 ( −1) nij = 0 ∂a i j ∂φ 2 = 2∑ ∑ y j − a − bx i − cxi ( − xi ) n ij = 0 ∂b i j ∂φ = 2∑ ∑ y j − a − bx i − cxi2 ( − xi2 ) n ij = 0 ∂c i j
(
)
(
)
(
)
Realizando las mismas operaciones que en el caso anterior para la recta, el sistema se transforma en ∑j y j n· j = aN + b∑i xi ni· + c ∑i x 2i ni· 2 3 x y n = a x n + b x n + c x n ∑i ∑j i j ij ∑i i i· ∑i i i· ∑i i i · 2 2 3 4 x y n = a x n + b x n + c x n ∑i ∑j i j ij ∑i i i· ∑i i i· ∑i i i·
11/25
de cuya resolución se obtiene los valores numéricos de los parámetros de la mejor parábola de segundo grado en el sentido mínimo cuadrático para la nube de puntos dada. 4.1.3. Ajuste Hiperbólico. Son funciones de la forma: yx = b ⇔
y=b
1 x
siendo b una constante cualquiera. También se puede considerar la función anterior pero desplazada una cierta cantidad a: 1 y=a+b x El ajuste por mínimos cuadrados lo podemos reducir al caso de la recta, ya visto anteriormente, sin más que efectuar la transformación z= con lo que la función se convierte en
1 x
y = a+bz
4.1.4. Ajuste Potencial. La forma general de la función potencial es y = a ⋅ xb que de forma análoga al anterior, lo podemos reducir al caso de una recta simplemente tomando logaritmos en ambos miembros. log y = log a + b log x y ' = a'+bx'
4.1.5. Ajuste Exponencial. La ecuación general es y = a ⋅bx y repitiendo el caso anterior, al tomar logaritmos se nos reduce al caso de una función lineal. log y = log a + x log b
12/25
4.2. Método de los Momentos. El Método de los Momentos se basa en el hecho conocido de que dos distribuciones son tanto más parecidas cuanto mayor cantidad de momentos iguales tengan. Dada la distribución bidimensional (xi,yi) dada por un número N de puntos, recordemos que nuestro objetivo era encontrar una cierta función y*=f(x,a0 ,...,an ) que se ajuste lo más posible a la nube de puntos obtenida. Para hallar la función, bastará basarnos en la propiedad que hemos enunciado, para lo cual, sólo tendremos que igualar los n+1 primeros momentos obtenidos de la distribución observada con sus correspondientes de la distribución teórica. Teniendo en cuenta que los momentos respecto al origen de la distribución observada vienen dados por la expresión: αrs =
1 N
N
∑x
r i
y is
i =1
que para el valor s=1 se convierte en: αr 1 =
1 N
N
∑x
r i
y i ∀r:0,1,2,...
i =1
De forma análoga, los momentos correspondientes a la distribución teórica obtenidos a partir de la función serían: αr 1 =
1 N
N
∑x
r i
y i* ∀r:0,1,2,...
i =1
donde, recordemos, yi*=f(xi,a0 ,...,an ) Igualando los n+1 primeros momentos, obtenemos el sistema de ecuaciones: N
N
i =1 i =1 N N * xi yi = ∑ xi yi ∑ i =1 i =1 L N N x in y i = ∑ x in y *i ∑ i =1 i =1
∑ y i = ∑ y i*
Tenemos así un sistema de n+1 ecuaciones que nos permite calcular el valor de los n+1 parámetros que determinan la función yi*=f(xi,a0 ,...,an ) Si esta función fuera un polinomio de grado k, el sistema que se obtiene es el Sistema de Ecuaciones Normales obtenido por el método de Mínimos Cuadrados cuando la función a ajustar es un polinomio de grado k.
13/25
5. REGRESIÓN. La Regresión tiene por objeto la determinación de una cierta estructura de dependencia que mejor exprese el tipo de relación de la variable Y con las demás. Es decir, trata de poner de manifiesto, a partir de la información disponible, la estructura de dependencia que mejor explique el comportamiento de la variable Y (variable dependiente) a través de todo el conjunto de variables X1 , X2 , ..., Xk (variables independientes) con las que se supone que está relacionada. En este tema sólo vamos a tratar el caso de disponer de una variable independiente, ya que estamos estudiando distribuciones bidimensionales. Sean pues, X e Y dos variables cuya distribución conjunta de frecuencias es (xi,yj,nij ) DEF Llamaremos Regresión de Y sobre X a la función que explica la variable Y para cada valor de X. DEF Llamaremos Regresión de X sobre Y a la función que explica la variable X para cada valor de Y. 5.1. Regresión Lineal. La regresión será lineal cuando la curva de regresión, obtenida o seleccionada, sea una recta. Desarrollaremos este caso particular por ser el más empleado. 5.1.1. Recta de Regresión de Y sobre X. Haciendo uso de la técnica de mínimos cuadrados para el ajuste de una recta, debíamos hacer mínima la función: φ = ∑∑ ( y j − a − bx i ) nij 2
i
j
llegando al sistema de ecuaciones normales
∑y
n· j = aN + b ∑ xi ni ·
2 x i nij + b∑ xi ni · ∑i ∑j y j xi nij = a ∑∑ i j i j
j
i
Dividiendo ambas ecuaciones por N, expresamos el sistema en función de los momentos respecto al origen: α01 = a + b ⋅ α10 α11 = a ⋅ α10 + b ⋅ α20
14/25
Para resolver el sistema, multiplicamos la primera ecuación por –α 10 y sumamos ambas, quedando: α − α10 ⋅ α01 µ11 S XY b = 11 = = µ20 S X2 α20 − α102 Despejando a en la primera ecuación y sustituyendo el valor de b obtenido a = α01 −
S XY S XY α = y − x 10 S 2X S X2
Por tanto, la recta de regresión de Y sobre X, en función de los momentos quedará: y= y−
S XY S XY x + x S 2X S 2X
Y reordenando los términos obtenemos: y− y=
S XY (x − x ) S X2
5.1.2. Recta de Regresión de X sobre Y. Partiendo de la función φ = ∑∑ (x i − a − by j ) nij 2
i
j
y realizando un desarrollo análogo al del apartado anterior, llegamos a que la recta de regresión de X sobre Y será: S x − x = XY2 ( y − y ) SY DEF Llamaremos Centro de Gravedad de la distribución conjunto de X e Y al punto (x, y ) , lugar donde se cortan ambas rectas de regresión. 5.2. Coeficientes de Regresión. Los coeficientes de regresión lineal son las pendientes de las rectas de regresión. Así, el coeficiente de regresión de Y sobre X será b=
S XY S X2
pero
15/25
b = tg α =
∆y ∆x
luego el coeficiente de regresión de Y sobre X nos mide la tasa de incremento de Y para variaciones de X. Es decir, b indica la variación de la variable Y para un incremento unitario de la variable X. De forma análoga, el coeficiente de regresión de X sobre Y será b=
S XY S Y2
y como b' = tg α' =
∆y ∆x
b’ nos indicará la variación de X correspondiente a un incremento unitario de Y. Tanto el signo de b como de b’ será el signo de la covarianza. Una covarianza positiva nos dará dos coeficientes de regresión positivos y sus correspondientes rectas de regresión crecientes. Si la covarianza es negativa, las dos rectas de regresión serán decrecientes al serlo sus pendientes. En caso de que la covarianza sea cero, las pendientes serán nulas y por tanto las rectas serán paralelas a los ejes coordenados y perpendiculares entre sí. 6. CORRELACIÓN. DEF Llamamos Correlación al grado de dependencia mutua entre las variables de una distribución. El problema que se nos plantea es como medir la intensidad con que dos variables de una distribución bidimensional están relacionadas. Recordemos que a través de la curva de regresión expresábamos la estructura de la relación existente entre las variables, y que para cada valor de xi obteníamos una diferencia, llamada residuo, entre el valor de Y en la nube de puntos y el correspondiente valor teórico obtenido en la función. Si todos los puntos de la nube estuvieran en la función, obtendríamos dependencia funcional, siendo el grado de dependencia entre las variables el máximo posible. Cuanto más se alejen los puntos de la función (mayor sean los residuos) menor será la relación entre ambas. Es por ello que para estudiar la dependencia entre las variables vamos a hacer uso de los residuos. DEF Llamaremos Varianza Residual a la media de todos los residuos elevados al cuadrado. nij n· j 2 2 2 S rY = ∑ ∑ y j − y *j ⋅ = ∑ y j − y *j ⋅ N N i j j
(
)
16/25
(
)
Si la varianza residual es grande, entonces los residuos, por término medio, serán grandes, lo que significa que los puntos estarán muy separados de la función, siendo pequeña la dependencia entre las variables. Razonando igual, si la varianza es pequeña, la relación será grande. Para que la relación entre la dependencia de las variables y la medida utilizada sea directa (en lugar de inversa como ocurre con la varianza residual), definimos el siguiente coeficiente. DEF
Llamamos Coeficiente de Correlación General de Pearson a 2 S rY SY2
R = 1−
DEF Llamamos Coeficiente de determinación al cuadrado del coeficiente de correlación, R2 . 6.1. Campo de Variación de R y su Interpretación. Despejando la varianza residual del coeficiente de correlación R, tenemos 2 S rY = SY2 (1 − R 2 )
Dado que la varianza marginal de Y y la varianza residual son sumas de sumandos no negativos, ambas serán no negativas, de lo cual deducimos que 1 − R2 ≥ 0 y de aquí obtenemos − 1 ≤ R ≤1 Por tanto, el rango de valores de R es el intervalo cerrado [-1,1] Analicemos ahora, en función de los valores de este coeficiente, que dependencia existe entre las variables. 1) R=1 ⇒ S rY2 = 0 . Todos los valores teóricos coinciden con los obtenidos de la observación y, por tanto, la dependencia es funcional. Diremos que existe Correlación Positiva Perfecta, indicando con “Perfecta” que ambas variables varían en el mismo sentido. 2) R = −1 ⇒ S rY2 = 0 . En este caso, la dependencia también es funcional pero ambas variables varían en sentidos opuestos. Decimos que existe Correlación Negativa Perfecta.
17/25
3) R=0 ⇒ S rY2 = S Y2 No existe ninguna relación entre la variable Y y la variable X, lo cual significa que no están asociadas. Diremos entonces que la Correlación en Nula. 4) –1
(
2 S rY = ∑ ∑ y j − y *j i
)
2
⋅
nij
j
N
y que los valores teóricos de la distribución son y *j = y +
S XY ( xi − x) S X2
Sustituyendo esta expresión en la varianza residual tenemos:
S
2 rY
= ∑ ∑ (y j − y i
j
)
* 2 j
2
nij
nij S ⋅ ⋅ = ∑ ∑ y j − y + XY ( x − x ) = i 2 N S i j X N 2
nij S XY nij nij S 2 2 = ∑ ∑ ( y j − y ) − XY ( x − x ) ⋅ = ( y − y ) ⋅ + ( x − x ) ⋅ − i ∑∑ j ∑∑ i N N N S X2 S 2X i j i j i j nij S 2XY S 2XY S S XY 2 2 2 − 2 XY ( y − y ) ⋅ ( x − x ) ⋅ = S + S − 2 · S = S − ∑∑ j i Y X XY Y 2 S X2 i j N S 2X S X2 S X2
( )
DEF Llamamos Coeficiente de Correlación Lineal, al coeficiente de correlación general aplicado al caso de una función lineal. Se denota por r y es
r = 1−
2 S rY = 1− S Y2
SY2 −
S 2XY S X2
S Y2
18/25
=
S 2XY S = XY 2 2 S X SY S X SY
Y el Coeficiente de Determinación Lineal es r2 =
S 2XY S X2 S Y2
Ya hemos visto en el apartado anterior que − 1 ≤ r ≤ 1 y la interpretación dada para R también nos sirve para r.
6.3. Interpretación Analítica de r. Teniendo en cuenta las rectas de regresión de Y sobre X y de X sobre Y y el coeficiente de correlación lineal, podemos expresar las rectas de la siguiente forma: SY ( x − x) SX SX x− x=r ( y − y) SY y− y=r
Consideremos ahora los siguientes casos: 1) Si r=1. La varianza residual es cero y los valores teóricos coinciden con los observados. Por tanto, todos los puntos de la nube están en la recta. La correlación lineal es perfecta positiva y las rectas de regresión coinciden, ya que al sustituir r por 1 en la expresión anterior, obtenemos la misma recta. En este caso, la dependencia funcional existente viene reflejada por una recta creciente , al ser la pendiente positiva. 2) Si r = –1. La correlación es perfecta negativa. En este caso las rectas también coinciden, pero la recta es decreciente al ser la pendiente negativa. 3) Si r=0 La correlación es nula y las dos rectas son y− y=0 x− x=0 las cuales son dos rectas paralelas a cada uno de los ejes y por tanto, perpendiculares entre sí.
19/25
4) Si –1
Sabemos que S XY S X2 S b' = XY2 SY b=
multiplicando miembro a miembro obtenemos b ⋅ b' =
S XY S XY S 2XY ⋅ = =r2 2 2 2 2 S X SY S X ⋅ SY
Es decir r = b ⋅ b' el coeficiente de correlación lineal es la media geométrica de los coeficientes de regresión lineales. 20/25
Por otra parte tenemos que b = tg α 1 π b' = tg α' = c tg − α' = 2 tg π − α' 2 Por lo cual, el coeficiente de correlación lineal se puede expresar como r = b ⋅ b' =
tg α π tg − α' 2
1) Si r=±1 π − α' , lo que 2 geométricamente significa que las dos rectas coinciden, como se puede ver en la gráfica anterior. Tenemos que ambas tangentes son iguales lo cual implica que
α=
2) Si r=0 Entonces tenemos que se debe verificar una de las dos expresiones siguientes: tg α = 0 α= 0 π ⇒ tg − α' → ∞ α' → 0 2 luego las dos rectas son dos paralelas a cada uno de los ejes. Como conclusión, podemos decir que r es un coeficiente tal que cuando es igual a +1 o –1, el ángulo entre rectas es de cero grados, ya que coinciden. Cuando r es cero, el ángulo formado es de 90º. De aquí deducimos que cuando más se acerque r al valor +1 o –1 mas pequeño será el ángulo entre rectas. Por tanto, r también mide la apertura existente entre las rectas de regresión. 7. VARIANZA DEBIDA A LA DETERMINACIÓN LINEAL.
REGRESIÓN
Y
COEFICIENTE
DE
El intento de explicar una variable en función de la otra viene motivado por el supuesto, el cual hemos de comprobar, de que la información que suministra una variable sobre la que se “regresa” va a mejorar el conocimiento del comportamiento de la otra variable. Es decir, se supone que en el caso de la regresión de Y sobre X, Y se explica mejor a través de X que con la distribución marginal de Y. Para ver en que medida la mejora de la descripción de una variable a través de la otra tiene lugar, vamos a definir primero el concepto de Varianza Debida a la Regresión. Para ello, hemos de considerar las tres variables que se obtienen en la regresión. 21/25
• • •
yj, que representa los valores observados de la variable Y. yj* que representa los valores teóricos asignados a xi en la regresión de Y sobre X. ej que son los residuos o errores que se generan en la regresión mínimocuadrática.
Los valores medios de estas tres variables son 1) La media de la serie observada de Y y =∑∑ yj i
j
nij N
2) La media de los valores teóricos. y* = ∑∑ y *j i
nij N
j
=L= y
3) La media de los residuos en la regresión lineal de Y sobre X e = ∑∑ e j i
j
nij N
=L = 0
Teniendo en cuenta estos resultados, podemos definir las siguientes varianzas: DEF
Llamamos Varianza Total de los valores observados a SY2 = ∑∑ (y j − y ) i
DEF
j
2
nij N
Llamamos Varianza de los Errores o Residuos a S e2 = ∑∑ (e j − e )
2
i
j
nij N
Si tenemos en cuenta que la media de los residuos tiene valor nulo, al desarrollar la expresión anterior llegamos a que S e2 = S rY2 que es la llamada varianza residual. DEF
Llamamos Varianza Debida a la Regresión, a la varianza de los valores teóricos.
(
)
S R2 = ∑ ∑ y *j − y * i
j
2
nij
(
N
= ∑∑ y *j − y
22/25
i
j
)
2
nij N
En la regresión lineal, podemos encontrar una relación entre las tres varianzas anteriores, la cual pasamos a obtener. Para ello tendremos en cuenta que la regresión es lineal.
(
2 R
* j
S =∑∑ y − y i
=
S 2XY
(S ) 2 X
)
j
2
∑ ∑ (x i
2
nij S = ∑ ∑ y + XY ( xi − x ) − y = 2 N N SX i j
− x)
2
i
j
2
nij
n ij N
=
S 2XY
(S ) 2 X
2
⋅ S 2X =
S 2XY 2
SX
= r 2 ⋅S Y2
Por otra parte, la varianza residual será 2 S rY = SY2 (1 − r 2 ) = S Y2 − r 2 S Y2
Luego tenemos que 2 S rY = S Y2 − S R2 2 SY2 = S R2 + S rY
Dividiendo ambas ecuaciones miembro a miembro 1=
2 S R2 S rY + S Y2 SY2
El primer sumando del segundo miembro nos indica la parte de la variación de Y que es explicada por la recta de regresión. El segundo sumando indica la parte no explicada por la recta, la que escapa de ésta o variación residual. De la expresión anterior tenemos 2 S R2 S rY = 1 − =r2 2 2 SY SY
El coeficiente de determinación lineal r2 nos medirá el grado de acierto de la utilización de la regresión. O lo que es lo mismo, r2 nos dará el porcentaje de variabilidad de Y que queda explicada por la regresión. La introducción de r, coeficiente de correlación lineal, se justifica con el fin de añadir a r2 el carácter de la asociación (positiva o negativa). Teniendo en cuenta la expresión anterior, si r2 = 1, es decir, si la correlación es perfecta: S2 r 2 = R2 = 1 → S R2 = S Y2 SY
23/25
2 lo que implica que la varianza residual S rY es nula, luego se ha mejorado al máximo la descripción de Y mediante la utilización de la información suministrada por X. Toda la variabilidad marginal de Y está contenida en la regresión.
Si r=0, caso de correlación nula r2 =
S R2 2 = 0 ⇒ S R2 = 0 ⇒ S rY = S Y2 2 SY
es decir, en este caso X no nos sirve para ampliar la descripción del comportamiento de la variable Y. 8. APLICACIONES DE LA REGRESIÓN Y LA CORRELACIÓN. 8.1. Uso y Abuso de la Regresión. La aplicación de los métodos expuestos de regresión y correlación exige un análisis teórico previo de las posibles relaciones entre las variables. Puede ocurrir que se seleccionen dos variables cualesquiera al azar y que dé la casualidad de que, estadísticamente, la correlación sea perfecta cuando no existe relación posible entre ellas. Por ejemplo, el hecho de que, casualmente, la correlación lineal entre la tasa de natalidad en Nueva Zelanda y la producción de cereales en España a lo largo de un determinado periodo fuera perfecta no nos debería llevar a suponer que existe algún tipo de relación lineal entre estas variables. Se deben seleccionar variables entre las que la fundamentación teórica avale algún tipo de relación, evitando, en lo posible, relaciones a través de otra variable principal.. Por ejemplo, el consumo de bebidas puede variar en la misma dirección que el consumo de gasolina, pero no porque una variable dependa directamente de la otra, sino porque ambas van en el mismo sentido que las variaciones de la renta, que será la principal variable explicativa. 8.2. Predicción. El objetivo último de la regresión es la predicción o pronóstico sobre el comportamiento de una variable para un valor determinado de la otra. Así, dada la recta de regresión de Y sobre X, para un valor X=x0 de la variable, obtenemos y0 Es claro que la fiabilidad de esta predicción será tanto mayor, en principio, cuanto mejor sea la correlación entre las variables. Por tanto, una medida aproximada de la bondad de la predicción podría venir dada por r.
24/25
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Teoría de la Estadística. Aut.: Mood/Graybill. Ed. Aguilar. Introducción a la Probabilidad y la Medida. Aut. Procopio Zoroa. Ed. PPU Algoritmo. Matemáticas II. Cou. Aut.: Vizmanos y Anzola. Edit. SM. Estadística Teórica y Aplicada. Aut.: A. Vortes. Edit.: PPU Teoría de Probabilidades y Aplicaciones. Aut.: Cramer. Edit.: Aguilar.
25/25
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 63 FRECUENCIA Y PROBABILÍSTICO.
PROBABILIDAD.
LEYES
DEL
1. Introducción. 2. Probabilidad Clásica o A Priori. 3. Probabilidad a Posteriori o Frecuencial. 4. Modelos de Probabilidad. 5. Conjuntos de Puntos. 6. Desarrollo Axiomático de Probabilidad. 7. Espacio Muestral Discreto con un Número Finito de Puntos. 8. Primeras Propiedades de la Familia de sucesos S. 9. Límites en S. 10. Propiedades de la Función de Probabilidad P. 11. Propiedades de Límite. Bibliografía Recomendada.
1/20
AZAR.
ESPACIO
TEMA 63 FRECUENCIA Y PROBABILÍSTICO.
PROBABILIDAD.
LEYES
DEL
AZAR.
ESPACIO
1. INTRODUCCIÓN. Uno de los instrumentos fundamentales de la Estadística es la Probabilidad, que tuvo sus orígenes en los juegos de azar, en el siglo XVII. Los juegos de azar, como implica su nombre, incluyen acciones tales como girar la rueda de una ruleta, lanzar dados, tirar al aire una moneda, extraer una carta, etc., en las cuales el resultado es incierto. Sin embargo, es sabido que, aun cuando el resultado de una prueba en particular sea incierto, existe un resultado que se puede predecir a largo plazo. En la ciencia experimental se presenta también un tipo similar de incertidumbre y regularidad a largo plazo. Así, por ejemplo, en genética es incierto saber si un descendiente será macho o hembra, pero en un plazo largo se conoce aproximadamente el porcentaje de descendientes que serán machos y el de aquellos que serán hembras. Examinaremos en primer lugar la teoría clásica de la probabilidad, o sea de la probabilidad a priori, luego expondremos la teoría frecuencial y, finalmente, desarrollaremos un modelo axiomático. 2. PROBABILIDAD CLÁSICA O A PRIORI. La relación entre la probabilidad y los juegos de azar sugirió la definición clásica. Así, por ejemplo, supongamos que queremos hallar la probabilidad de obtener cara en el lanzamiento de una moneda ideal. Razonamos de la siguiente forma: puesto que sólo existen dos resultados posibles, cara y cruz, y dado que la moneda está bien equilibrada, cabe esperar obtener cara y cruz con la misma frecuencia, aproximadamente; por tanto, en un gran número de pruebas, es de esperar que se obtendrá cara alrededor de la mitad de las veces, y así, la probabilidad del suceso “obtener cara” estará dada por el valor ½. Esta clase de razonamiento sugirió la definición: DEF Si un suceso puede ocurrir de n maneras mutuamente excluyentes e igualmente verosímiles y si nA de éstas poseen un atributo A, la probabilidad de A es la fracción nA . n La aplicación de esta definición no siempre resulta inmediata. Veamos que significa eso de “mutuamente excluyentes” y de “igualmente verosímiles”. Supongamos que deseamos calcular la probabilidad de obtener dos caras lanzando una moneda dos veces. Podría razonarse que los resultados posibles son: Dos caras, dos cruces o una cara y una cruz. Pero este razonamiento es falso porque los tres resultados no son igualmente verosímiles o probables. El último de los tres puede obtenerse de dos formas diferentes. La probabilidad buscada es, por tanto, ¼ y no 1/3. 2/20
Si queremos calcular la probabilidad de obtener un As o una espada al extraer una carta de una baraja española, podemos razonar que tenemos 4 ases y 10 espadas, luego 1 la probabilidad sería . Pero este razonamiento tampoco es correcto ya que los 14 sucesos no son mutuamente excluyentes, puesto que existe un As de Espadas. nA n debe ser una fracción propia, ya que el total de resultados posibles no puede ser menor que el número de resultados con un determinado atributo. Si un suceso ha de ocurrir con seguridad, su probabilidad es 1. En cambio, si es seguro que no va a ocurrir, su probabilidad es cero. Observemos que la probabilidad es un número del intervalo [0,1], La razón
Las probabilidades determinadas mediante la definición clásica se denominan probabilidades a priori. Como en cualquier otra rama de las matemáticas, trabajaremos con objetos ideales: monedas equilibradas, líneas de anchura cero, círculos perfectos, etc. Existen varios inconvenientes en esta manera clásica de abordar el problema. Es obvio que la definición dada de probabilidad tendremos que modificarla de alguna manera cuando el total de resultados posibles sea infinito. Por ejemplo, supongamos queremos calcular la probabilidad de que un número natural extraído al azar sea par. La respuesta intuitiva a esta cuestión es ½. Para justificar este resultado, tomaríamos los diez primeros naturales y calcularíamos la probabilidad, la cual sale ½. Luego lo haríamos con los 100 primeros, Después con los 1.000 primeros. Al final, lo hacemos con los 2N primeros naturales y tomamos límites en N. La razón seguiría siendo ½. El argumento anterior y su respuesta son plausibles, pero su justificación rigurosa no es algo sencillo. Podemos darnos cuenta que el razonamiento anterior se basa en la ordenación de los números naturales. Si tuviésemos una ordenación diferente, no podríamos llegar a dicha respuesta. La definición clásica de probabilidad suscita otra dificultad más grave aún que la que se presenta en el caso de un número infinito de resultados posibles. Supongamos que tenemos una moneda con una distribución de su masa tal que existe un sesgo a favor de las caras. Los dos resultados posibles al lanzar dicha moneda no son igualmente probables. ¿Cuál es entonces la probabilidad de obtener cara? La definición anterior no nos permite responder la pregunta. Nos encontramos aún con otra dificultad al tratar de responder preguntas tales como ¿Cuál es la probabilidad de que un niño nacido en Madrid sea varón? ¿Cuál es la probabilidad de que una mujer muera antes de los 55 años? ¿Cuál es la probabilidad de que una bombilla pueda encenderse al menos 200 veces? Desearíamos que todas estas preguntas tuvieran respuesta dentro del marco de al teoría de la probabilidad. Sin embargo, las cuestiones de “simetría”, “igualmente verosímiles”, etc. no pueden considerarse como lo serían en un juego de azar. Por tanto, tendremos que alterar o extender la definición de probabilidad. 3/20
3. PROBABILIDAD A POSTERIORI O FRECUENCIAL. Supongamos que lanzamos una moneda 100 veces, la cual tomamos bien equilibrada y simétrica. Los resultados son 56 veces cara y 44 veces cruz. Un hecho importante en que la frecuencia relativa de caras tiende a estabilizarse en torno al valor ½. Esto sugiere que la frecuencia relativa obtenida podría utilizarse como una aproximación de la probabilidad de obtener cara con la moneda empleada. Es razonable suponer que existe un número, que designaremos con p, que es la probabilidad de obtener cara. Si la moneda parece verdaderamente bien equilibrada y simétrica, podemos emplear la definición anterior para establecer que p es aproximadamente ½. Decir que p es igual a ½es sólo una aproximación, puesto que para esta moneda en particular no podemos estar seguros de que los dos resultados sean igualmente verosímiles. Pero comprobados el equilibrio y la simetría de la moneda, parece razonable suponer que lo son. Tomemos ahora una moneda desequilibrada, de tal forma que después de un examen estamos completamente seguros de que los dos sucesos, cara y cruz, no son igualmente verosímiles. Aun en estos casos, puede postularse la existencia de un número p como probabilidad de obtener cara, pero para hallar el valor de p no podremos aplicar la definición clásica. Tendremos que utilizar la teoría frecuencial. Concretemos un poco más. Supongamos que podemos realizar observaciones (o experimentos) bajo condiciones completamente uniformes. Es decir, hecha la observación, se repite el suceso en condiciones análogas y se hace otra observación. al repetir esto muchas veces, aunque las condiciones sean siempre similares, existe una variación incontrolable que es “casual” o “aleatoria”, de forma que no es posible predecir el resultado de las observaciones individualmente. Esto sugiere que definamos un número p, llamado probabilidad del suceso, y que lo aproximemos por la frecuencia relativa con que aparece dicho suceso en las repetidas observaciones. 4. MODELOS DE PROBABILIDAD. Uno de los objetivos de la ciencia consiste en predecir y describir sucesos del mundo en que vivimos. Una manera de hacerlo es construir modelos matemáticos que describan adecuadamente el mundo real. En la teoría de la probabilidad hacemos lo mismo. Construimos un modelo probabilístico que pueda utilizarse para describir sucesos del mundo que nos rodea. Así, por ejemplo, puede desearse hallar una ecuación adecuada para predecir el sexo de cada nacido en cierta localidad. La ecuación sería muy compleja y no se ha descubierto ninguna. Sin embargo, puede construirse un modelo de probabilidad que, aunque no sea muy útil para tratar un suceso individual, sirva perfectamente par ocuparse de grupos de sucesos. Cabe entonces indicar la existencia de un número p que represente la probabilidad de que un nacido sea varón. A partir de esta probabilidad fundamental podemos responder a preguntas tales como: ¿Cuál es la probabilidad de que de diez nacidos, al menos tres sean varones? ¿Cuál es la probabilidad de que hay tres varones consecutivos en los próximos cinco nacimientos? Para contestar a este tipo de preguntas vamos a desarrollar un modelo idealizado de probabilidad.
4/20
Consideraremos una teoría de la probabilidad adecuada sólo para aquellas situaciones que pueden ser descritas por los resultados de experimentos conceptuales. Es decir, consideraremos únicamente aquellos sucesos cuya repetición sea concebible bajo condiciones semejantes. También necesitamos que pueda enumerarse cada posible resultado de un experimento. Asociaremos probabilidades solamente con esos resultados. añadiremos, sin embargo, que aun cuando un resultado sea imposible puede ser incluido (su probabilidad es 0). Lo fundamental es recordar que ha de incluirse cada resultado que puede ocurrir. DEF Cada resultado imaginable de un experimento conceptual, que puede repetirse bajo condiciones similares, será denominado un punto muestral, y la totalidad de los resultados imaginables se llamará espacio muestral, siendo denotado por Ω. 5. CONJUNTOS DE PUNTOS. Vamos a definir ciertas operaciones sobre el conjunto de puntos que forman el espacio muestral y que son necesarias para posteriores estudios. Un conjunto de puntos, llamado a veces simplemente un conjunto, es una colección de elementos que tienen ciertas propiedades específicas. Si s es un punto o un elemento que pertenece al conjunto Ω, escribiremos s∈Ω. DEF Diremos que los conjuntos S1 y S2 son iguales si cada elemento de S1 es también un elemento de S2 , y cada elemento de S2 lo es de S1 . Es decir si S1 y S2 tienen exactamente los mismos puntos. DEF Diremos que S1 es un subconjunto de Ω, y se denota por S1 ⊂Ω, si cada elemento de S1 es también un elemento de Ω. DEF En cada aplicación de la teoría existirá un conjunto universal, el propio espacio muestral Ω, tal que todos los demás conjuntos que intervengan en el análisis son subconjuntos de Ω. Algunas veces puede que no se indique explícitamente el espacio muestral, pero generalmente estará implícito en el contexto de la discusión. DEF El complemento de un cierto conjunto S1 , respecto al espacio muestral Ω, será el conjunto de puntos que están en Ω pero no en S1 . Se indicará por Ω–S1 , o también por S1 . DEF Llamaremos Conjunto Nulo a un cierto conjunto S1 que no contiene puntos. Se denotará por ∅. DEF Un suceso A está definido en el espacio muestral Ω como un subconjunto A de puntos de Ω, y cuando decimos “probabilidad de que ocurra A” queremos decir “probabilidad de que aparezca cualquier punto de A”.
5/20
Si el espacio muestral contiene un continuo de puntos, no definiremos todo subconjunto como un suceso, sino sólo subconjuntos medibles. DEF Sean S1 y S2 dos elementos de S. Llamaremos Unión de los sucesos S1 y S2 , y se denota por S1 ∪S2 , al suceso formado por todos los puntos de S1 y todos los puntos de S2 . DEF Sean S1 y S2 dos elementos de S. Llamaremos Intersección de los sucesos S1 y S2 , y se denota por S1 ∩S2 , al suceso formado por todos los elementos comunes a S1 y S2 . De las definiciones anteriores se desprenden los resultados siguientes, donde Ω es el espacio muestral, y S1 y S2 , elementos de Ω. PROP Se verifica: 1) 2) 3) 4) 5) 6) 7)
Ω=∅ Si S1 y S2 no tienen puntos comunes entonces S1 ∩S2 =∅. S1 ∩Ω = S1 S1 ∪Ω = S Ω ∩ S1 = Ω − S 1 = S1 S1 ∪S1 = S1 S1 ∩S1 = S1
DEF Diremos que un espacio muestral Ω es discreto si verifica una de las dos condiciones siguientes: 1) Un número finito de puntos. 2) Un número infinito de puntos que pueden ponerse en correspondencia biunívoca con el conjunto de los números naturales. DEF Diremos que un espacio muestral Ω es continuo si contiene un conjunto continuo de puntos. 6. DESARROLLO AXIOMÁTICO DE LA PROBABILIDAD. En los apartados anteriores hemos visto los conceptos de probabilidad clásica y frecuencial que pueden ayudarnos a resolver importantes problemas de la ciencia experimental. Para coadyuvar a la solución de estos problemas vamos a desarrollar una teoría matemática de la probabilidad. En primer lugar, vamos a enunciar los axiomas que empleamos para desarrollar la teoría. Supondremos un espacio muestral Ω cuyos elementos quedan, de momento, indeterminados. Asimismo, se supondrá fijada una familia S de subconjuntos del espacio Ω. S∈℘(Ω)
6/20
Aquí ℘(Ω) es el conjunto de las partes de Ω, es decir, la familia formada por todos los subconjuntos de Ω. Por tanto A∈℘(Ω) equivale a A⊂Ω Finalmente supondremos dada una función P de dominio S que toma valores reales. DEF Diremos que la terna (Ω,S,P) es un Espacio de Probabilidad en Ω, o Distribución de Probabilidad en Ω, si verifica las condiciones siguientes, estando las tres primeras referidas a S y las tres últimas a P: S1) S2)
Ω∈S A∈S ⇒ A ∈S
S3)
Ak ∈S ∀k∈– ⇒
∞
UA
k
∈S
k =1
P1) P2) P3)
P(A) es un número real tal que P(A)≥0 para todo suceso A de S. P(Ω)=1 Si S1 y S2 son dos sucesos de S mutuamente excluyentes (S1 ∩S2 =∅) entonces P(S1 ∪S2 ) = P(S1 ) + P(S2 ).
Estos axiomas, que usaremos para desarrollar el modelo idealizado de probabilidad, están motivados por las definiciones de probabilidad clásica y frecuencial. Veamos ahora algunos teoremas que son resultado directo de los axiomas anteriores. TEOREMA Sea Ω un espacio muestral y P una función de probabilidad en Ω. La probabilidad de que no ocurra el suceso A es 1–P(A). Se escribe como P( A) = 1 − P ( A) Dem. Sabemos que A ∩ A = ∅ y que A ∪ A = Ω . Aplicando el axioma 2 tenemos que 1 = P(Ω ) = P ( A ∪ A) Y aplicando el axioma 3, 1 = P(Ω ) = P ( A ∪ A) = P( A) + P( A) con lo que P( A) = 1 − P ( A) , quedando así demostrado. TEOREMA Sea Ω un espacio muestral con función de probabilidad P. En tal caso 0≤P(A)≤1 para cualquier suceso A de S. Dem. Por el axioma 1, P(A)≥0 7/20
Y aplicando el teorema anterior, como P( A) = 1 − P ( A) verificando que P( A) ≥ 0 entonces necesariamente se debe dar que P(A)≤1 TEOREMA Sea Ω un espacio muestral con una función de probabilidad P. entonces P(∅)=0. Dem. La conclusión se obtiene de forma inmediata sin más que tener en cuenta que S = ∅ 7. ESPACIO MUESTRAL DISCRETO CON UN NÚMERO FINITO DE PUNTOS. En ciertos tipos de problemas, entre los cuales los juegos de azar constituyen ejemplos notables, el espacio muestral contiene un número finito, n, de puntos, y la 1 probabilidad asignada a cada punto es . Es decir, en ciertos problemas existe un n número finito de ordenaciones, y es totalmente realista suponer que la probabilidad de 1 cada ordenación es . En general, es suficiente para estos problemas la definición n clásica, y pueden utilizarse los métodos combinatorios para la enumeración de las ordenaciones. DEF Sean s1 , s2 , ..., sn los n puntos muestrales de un espacio muestral discreto Ω. Diremos que la función P es una función de probabilidad de sucesos igualmente verosímiles si satisface las condiciones siguientes: 1 . n 2) Si A es un suceso que contiene nA cualesquiera puntos muestrales, entonces n P( A) = A . n 1) P(s1 )=P(s2 )=...=P(sn )=
La primera condición afirma que cada uno de los n puntos muestrales es igualmente 1 verosímil y, por tanto, que su probabilidad en . n La segunda condición establece que la probabilidad de un suceso que contenga nA n de los n puntos muestrales es A . n
8/20
Es fácil comprobar que esta definición cumple los tres axiomas anteriores y es, por tanto, una función de probabilidad. 8. PRIMERAS PROPIEDADES DE LA FAMILIA DE SUCESOS S. En lo que sigue supondremos dado un espacio de probabilidad cualquiera (Ω, S, P) al cual se referirán todos los conceptos que desarrollemos. La propiedad S2 de la familia de sucesos S se expresa diciendo que S es una familia de conjuntos cerrada por la operación de complementario. La propiedad S3 significa que S es cerrada por uniones numerables. Las tres propiedades que contienen los axiomas S1, S2 y S3 caracterizan las familias de conjuntos que se llaman σ-álgebras en Ω. Veamos a continuación las primeras consecuencias de estos axiomas. PROP1
El conjunto vacío pertenece a la familia S, ∅∈S
Dem. Como ∅ = Ω , resulta lo que se desea de S1 y S2. PROP2
La familia S es cerrada por uniones finitas. Es decir, si Ak ∈S con 1≤k≤n n
entonces
UA
k
∈ S . En particular, si A,B∈S se verifica que A∪B∈S.
k =1
Dem. Podemos aplicar S3 donde tomamos Ak =∅ para k>n, obteniendo el resultado pedido. PROP3
La familia S es cerrada por intersecciones finitas. O sea, si Ak ∈S para 1≤k≤n n
entonces
IA
k
∈ S . en particular, si A,B∈S se verifica que A∩B∈S.
k =1
Dem. n
Como se tiene que Ak ∈ S , resulta de la proposición anterior que
UA
k
∈S
y al
k =1
tomar complementarios se obtiene el resultado deseado. PROP4
La familia S es cerrada por intersecciones numerables. Es decir, si Ak ∈S ∞
para k:1,2,... entonces
IA
k
∈S .
k =1
Dem. Similar a la anterior. 9/20
DEF Dados dos conjuntos A y B, llamamos diferencia simétrica de A y B, y se representa por A∆B, al conjunto A∆B=(A–B)∪(B–A). PROP5 sea,
La familia S es cerrada por diferencias ordinarias y diferencias simétricas. O
1) A∈S, B∈S ⇒ A–B∈S 2) A∈S, B∈S ⇒ A∆B∈S Dem. 1) Como para la diferencia de dos conjuntos se tiene que A − B = A ∩ B obtenemos la primera parte de la tesis de la Proposición 3. 2) Teniendo en cuenta 1) y la proposición 3 obtenemos el resultado. Como resumen de las propiedades vistas en este apartado, podemos decir que la σálgebra S es Cerrada por las operaciones de Complementario, Diferencia y Diferencia simétrica, así como por uniones o intersecciones de un conjunto contable de sucesos. En casos particulares, operando con conjuntos no numerables de sucesos el resultado puede ser un suceso. DEF Diremos que una sucesión (An ) de sucesos es Monótona Creciente si se cumple que An ⊂An+1 para todo n. DEF n.
Diremos que una sucesión (An ) es Monótona Decreciente si An+1 ⊂An para todo
DEF Diremos que la familia {At ⊂Ω: t∈I}, donde I es un intervalo de la recta real, es una familia Monótona Creciente si t1 ,t2 ∈I, con t1
se tiene ∞
U At = U Ax n ∈ S
a
n =1
2) (yn ) tal que 10/20
b > yn > yn+1 ∀n Lim y n = a n
vale ∞
I At = I A yn ∈ S
a
n =1
Dem. 1) Es inmediato ver que el segundo miembro de la igualdad está contenido en el primero. ∞
U At ⊃ U Axn ∈ S
a
n =1
Veamos la inclusión contraria, Dado t '∈ ( a, b) ∃n ' / x n ' > t ' por lo que ∞
At ' ⊂ Axn ' ⊂ U Axn n =1
y como t’ es arbitrario obtenemos ∞
UA ⊂UA t
a
xn
∈S
n =1
De las dos inclusiones anteriores obtenemos la igualdad a demostrar. 2) La demostración la vamos a realizar de forma análoga. En primer lugar, es inmediato ver que ∞
I At ⊂ I Ay n ∈ S
a
n =1
Para comprobar la inclusión contraria Dado t '∈ ( a, b) ∃n' / y n ' < t ' por lo que ∞
At ' ⊃ Ay n ' ⊃ I Ay n ∈ S n =1
y por ser t’ arbitrario ∞
IA ⊃IA t
a
yn
∈S
n =1
demostrando así la igualdad. PROP7 Si {At :t∈(a,b)} es una familia de sucesos monótona decreciente, para cualquier sucesión 3) (xn ) tal que a < xn < xn+1 ∀n y Lim x n = b n
se tiene
11/20
∞
I At = I Ax n ∈ S
a
n =1
4) (yn ) tal que b > yn > yn+1 ∀n Lim y n = a n
vale ∞
U At = U A yn ∈ S
a
n =1
Dem. Definiendo Bt = At , la familia {Bt :t∈(a,b)} es monótona creciente y se le puede aplicar el teorema anterior. Al tomar complementarios en las relaciones que se obtienen para los sucesos Bt , conseguimos las igualdades a demostrar. 9. LÍMITES EN S. Dada una sucesión (An ) de conjuntos de Ω, podemos definir los siguientes nuevos conjuntos. DEF
Llamamos Límite Inferior de la sucesión (An )⊂Ω al conjunto Lim An ={ω: para algún n, y ∀j≥n ω∈Aj} _____
DEF
Llamamos Límite Superior de la Sucesión (An )⊂Ω al conjunto
______
Lim An ={ω:Para alguna sucesión de enteros n1
1) Lim An = UI Ap ______ ______
n =1 p ≥ n ∞
2) Lim An = IU Ap n =1 p ≥ n
Dem. Inmediatas a partir de la definición. DEF Diremos que existe el Límite de An si los límites superior e inferior son iguales y se escribe ____
LimAn = Lim An = Lim An ____
12/20
PROP El límite inferior y superior de una sucesión de sucesos es un suceso. Por tanto, cuando existe el límite de una sucesión de sucesos, dicho límite es también un suceso. Dem. La primera parte es consecuencia de la fórmulas demostradas en la última proposición. La segunda parte es obvia. PROP Se verifican las siguientes relaciones: ____
1) Lim An ⊂ Lim An ____
____
2) Lim An = Lim An ____ ____ 3) Lim An = Lim An ____ Dem. 1) Se obtiene de forma inmediata a partir de las definiciones. 2) y 3) se obtienen a partir de los resultados de la primera proposición de este apartado, sin más que utilizar las leyes de Morgan. Las sucesiones Comprobémoslo
monótonas
son
convergentes,
es
decir,
tienen
límite.
PROP Se verifica: ∞
1) Si la sucesión (An ) es monótona creciente entonces existe Lim An = U An n
n =1
∞
2) Si la sucesión (An ) es monótona decreciente entonces existe Lim An = I An n
n =1
Dem. La demostración se obtiene fácilmente. 10. PROPIEDADES DE LA FUNCIÓN DE PROBABILIDAD P. La función de probabilidad es No Negativa por el axioma P2. Y por el axioma P3 la función P es numerablemente aditiva, o también llamada σ-aditiva. Veamos las primeras consecuencias de los tres axiomas que satisface la función P.
13/20
PROP1
El suceso vacío, ∅, es un suceso de probabilidad cero o suceso nulo.
Dem. Llamando a=P(∅) y aplicando P3 con An =∅ para todo n, obtenemos a = a + a + a + ... igualdad que solamente es cierta si a=0. PROP2 P es Finitamente Aditiva. Es decir, si los conjuntos Aj∈S para j:1,2,...,n son disjuntos, entonces: n n P U A j = ∑ P( A j ) j =1 j =1 En particular A∈S, B∈S, A∩B=∅ ⇒ P(A∪B) = P(A) + P(B) Dem. Tomando en el axioma P3 los conjuntos Aj del enunciado para j:1,2,...,n y Aj=∅ para j>n, el enunciado de P3 se convierte en la igualdad del teorema. Al ser P finitamente aditiva y numerablemente aditiva, podemos decir que P es Contablemente Aditiva. PROP3
Si A∈S, B∈S, A⊂B, entonces se tiene que
1) P es Sustractiva. Es decir, P(B–A) = P(B) – P(A) 2) P es Monótona. Es decir, P(A) ≤ P(B) Además, ∀A∈S 3) P(A) ≤1 4) P( A)1 − P( A) Dem. 1) Teniendo en cuenta la hipótesis A⊂B podemos deducir B = A∪(B–A)
y
A∩(B–A) = ∅
y de aquí obtenemos P(B) = P(A) + P(B–A) y de aquí P(B–A) = P(B) – P(A) 2) Teniendo en cuenta que P(A)≥0 para todo suceso A de S, tenemos que P(B–A)≥0, obteniendo fácilmente la expresión a demostrar.
14/20
3) y 4) se deducen de las expresiones 1) y 2) ya demostradas sin más que tomar B = Ω. PROP4 P es Finitamente Subaditiva. Es decir, para n sucesos cualesquiera Aj, con j:1,2,...,n se verifica: n n P U A j ≤ ∑ P( A j ) j =1 j =1 En particular A∈S, B∈S ⇒ P(A∪B) ≤ P(A) + P(B) Dem. Para poder realizar la demostración, definimos los conjuntos Bj como sigue j −1
B1 = A1
B j = A j − U Ak
y
con 2 ≤ j ≤ n
k =1
Los conjuntos que acabamos de definir verifican las siguientes propiedades: 1) Bj⊂Aj, por la propia definición. 2) Los Bj son todos ellos disjuntos, ya que si h
3)
n
UA =UB j
j =1
j
j =1
Comprobemos que, efectivamente, se verifica la tercera de las propiedades. Para ello, hemos de comprobar las dos inclusiones. n
La inclusión
UA j =1
n
j
⊂ U B j se verifica a partir de la primera de las propiedades. j =1
Para demostrar la inclusión contraria, lo que vamos a comprobar es n
ω∈ U A j j =1
n
⇒ ω∈ U B j j =1
Si ω∈A1 =B1 , y resulta evidente. Si ω∉A1 , existirá un cierto j tal que ω∈Aj y ω∉Ak para k
15/20
∞ ∞ P U An ≤ ∑ P( An ) n =1 n =1 Dem. Al igual que hemos hecho en la demostración de la proposición anterior, introducimos los conjuntos Bn definidos de la misma forma y, por tanto, verificando las mismas propiedades. Entonces ∞ ∞ ∞ ∞ P U An = P U Bn = ∑ P( Bn ) ≤ ∑ P( An ) n =1 n =1 n =1 n =1
PROP6
Para dos sucesos cualesquiera A y B se verifica P(A∪B) = P(A) + P(B) – P(A∩B)
Dem. Podemos establecer las cuatro relaciones siguientes A∪B = A∪(B–A)
A∩(B–A) = ∅
B = (A∩B)∪(B–A)
(A∩B)∩(B–A) = ∅
las cuales nos permiten escribir P(A∪B) = P(A) + P(B–A)
y
P(B) = P(A∩B) + P(B–A)
De ambas expresiones, eliminando P(B–A) obtenemos lo que queremos demostrar. PROP7
Sean A1 , A2 , ..., An n sucesos cualesquiera. Entonces
n n n P U A j = ∑ P ( A j ) − ∑ P( Ai ∩ A j ) + ∑ P ( Ai ∩ A j ∩ Ak ) + K + ( −1) n −1 P I A j 1≤i < j ≤n 1≤i < j
16/20
Aplicando ahora la suposición de ser cierto para n sucesos completamos la demostración por inducción. PROP8
Se verifica:
1) Si los sucesos Aj con 1≤j≤n son sucesos nulos entonces la unión de todos ellos es un suceso nulo. 2) Si los sucesos Aj con 1≤j≤n son sucesos casi seguros entonces la intersección de todos ellos es un suceso casi seguro. Dem. 1) Para la demostración, basta tener en cuenta la prop4 en la que vimos que P era subaditiva. n n P U A j ≤ ∑ P( A j ) = 0 j =1 j =1 2) Para esta parte tomamos complementarios y aplicamos el caso anterior. PROP9
Se verifica:
1) Si (An ) es una sucesión de sucesos nulos, entonces su unión es un suceso nulo. 2) Si (An ) es una sucesión de sucesos casi seguros, entonces su intersección es un suceso casi seguro. Dem. La demostración es igual que la de la proposición anterior, pero utilizando el resultado obtenido en la prop5. 11. PROPIEDADES DE LÍMITE. PROP1
Se verifica:
1) P es Continua Inferiormente. Es decir, dada una sucesión monótona creciente (An ) se verifica que ∞ Lim P( An ) = P U An n n =1 2) P es Continua Inferiormente. Es decir, dada una sucesión monótona decreciente (An ) se verifica que ∞ Lim P( An ) = P I An n n =1 Dem. 1) En el caso de ser la sucesión monótona creciente podemos escribir
17/20
∞
∞ A = A ∪ U ( An +1 − An ) U n 1 n =1 n =1 verificando los sucesos del segundo miembro que son disjuntos. Por tanto ∞ ∞ ∞ P U An = P A1 ∪ U ( An +1 − An ) = P( A1 ) + ∑ P( An +1 − An ) = n =1 n =1 n= 2
k k = Lim P( A1 ) + ∑ P( An +1 − An ) = Lim P A1 ∪ U ( An +1 − An ) = Lim P ( An ) k→∞ n n= 2 k →∞ n= 2
2) Si la sucesión (An ) es monótona decreciente, la formada por los sucesos complementarios es monótona creciente y tenemos ∞ P U An = Lim P( An ) = Lim (1 − P( An ) ) n n n =1 y de aquí obtenemos de forma inmediata la expresión que queremos demostrar. PROP2
Si (An ) es una sucesión de sucesos cualesquiera, se verifica ______ ______ P Lim An ≤ Lim P( An ) ≤ Lim P( An ) ≤ P Lim An ______ ______
Dem. De las relaciones
IA
p
p≥ n
⊂ An ⊂ U Ap p≥ n
resulta P I Ap ≤ P( An ) ≤ P U A p p≥ n p≥ n Si definimos las sucesiones (Bn ) y (Cn ) como Bn = I Ap
Cn = U Ap
p ≥n
p≥ n
podemos comprobar que son monótonas, y aplicando la prop1 obtenemos Lim P( B n ) = P U B n = P Lim An ≤ Lim P( An ) ≤ n ______ ______ n ______ ______ ≤ Lim P ( An ) ≤ P Lim An = P I Cn = Lim P( Cn ) n n
18/20
PROP3 P es Continua. Es decir, si (An ) es una sucesión de sucesos convergente, tiene límite, entonces existe Lim P(An ) = P(Lim An ) Dem. La demostración es inmediata con sólo aplicar la proposición anterior. Aclaración. En la siguiente proposición vamos a utilizar el concepto de Límite Lateral. Para cualquier función real f usaremos las notaciones Lim f (t ) = f (c +)
Para el límite lateral por la derecha en t=c.
Lim f (t ) = f (c −)
Para el límite lateral por la izquierda en t=c
t →c +
t → c−
Recordemos la siguiente propiedad que relaciona el límite aritmético y el límite funcional. PROP Para una función real f definida al menos en (a, a+h) son equivalentes las dos condiciones siguientes: 1) Lim f (t ) = c t →a +
2) Para cada sucesión (tn ) con a < tn < a+h y tn →a se verifica Lim f (t n ) = c n →∞
Análoga propiedad podemos demostrar para el límite lateral por la izquierda. PROP4
Sea {At : t∈(a,b)} una familia de sucesos monótona creciente. Entonces:
1) Lim P( At ) = P U At t →b − t
2) Lim P( At ) = P I At t →a + t >a
Si la familia de sucesos {At : t∈3} es monótona creciente, se tiene de forma análoga: 1) Lim P( At ) = P U At t → +∞ t∈ℜ
2) Lim P( At ) = P I At t → −∞ t∈ℜ
Dem. Vamos a demostrar las dos primeras, ya que la segunda parte es análoga. 1) La función f: (a,b) → 3 definida por acotada por lo que existen los límites.
f(t) = P(At ) es una función monótona
Si xn es una sucesión monótona estrictamente creciente con límite b resulta inmediatamente, por la relación entre el límite aritmético y funcional, y el resultado de la prop6 del apartado 8
19/20
∞ Lim P( At ) = Lim P( Axn ) = P U Ax n = P U At t →b − n→ ∞ n =1 t< b 3) La demostración de esta expresión se realiza de forma análoga. PROP5
Sea {At : t∈(a,b)} una familia de sucesos monótona decreciente. Entonces:
1) Lim P( At ) = P I At t →b − t
2) Lim P( At ) = P U At t →a + t >a
Dem. Se puede obtener de la proposición anterior utilizando sucesos complementarios.
BIBLIOGRAFÍA RECOMENDADA. Estadística Teórica. Aut. J.M.Doblado y M.C. Nieto. Edit. UNED Introducción a la Estadística Teórica. Aut.: G Arnáiz. Edit.: Lex Nova Estadística Teórica y Aplicada. Aut.: A. Nortes. Edit.: S. Rodríguez. Introducción a la Probabilidad y la Medida (I). Aut.: P Zoroa y N. Zoroa. Edit.: Maior DM.
20/20
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 64 PROBABILIDAD COMPUESTA. PROBABILIDAD PROBABILIDAD TOTAL. TEOREMA DE BAYES. 1. Probabilidad Marginal. 2. Probabilidad Condicionada. 3. Dos Leyes Básicas de la Probabilidad. 4. Sucesos Compuestos. 5. Sucesos Independientes. 6. Teorema de la Probabilidad Total. 7. Teorema de Bayes. 8. Espacio de Probabilidades Producto. Bibliografía Recomendada.
1/16
CONDICIONADA.
TEMA 64 PROBABILIDAD COMPUESTA. PROBABILIDAD PROBABILIDAD TOTAL. TEOREMA DE BAYES.
CONDICIONADA.
1. PROBABILIDAD MARGINAL. 1 . Sea n A1 , A2 , ..., Ar una partición de Ω formada por r subconjuntos mutuamente excluyentes (disjuntos). Sea B1 , B2 , ..., Bs otra partición de Ω en s subconjuntos disjuntos. Entonces, los n puntos del espacio muestral los podemos clasificar según la siguiente tabla de doble entrada: B1 B2 ... Bs A1 n11 n12 ... n1s A2 n21 n22 ... n2s ... ... ... ... ... Ar nr1 nr2 ... nrs Sea un espacio muestral Ω formado por n puntos con probabilidades iguales,
La tabla nos indica que de los n resultados existentes en el espacio muestral Ω, n11 tienen simultáneamente el atributo A1 y el atributo B1 ; n12 el A1 y el B2 ; y, en general, nij los atributos Ai y Bj. La suma de todos los nij es n. Como ejemplo podemos considerar como espacio muestral Ω las 52 cartas de una baraja. Una partición de Ω puede ser según el palo (espadas, bastos, oros o copas) y otra partición puede ser según el número de la carta. La probabilidad del suceso Ai y Bj se puede representar por P(Ai,Bj) en lugar de por P(Ai∩Bj), y el valor de esta probabilidad es, evidentemente P( Ai ∩ B j ) =
nij n
Puede interesarnos sólo uno de los criterios de clasificación, por ejemplo A, y sernos indiferente la clasificación B. En este caso prescindimos de B en el símbolo, y la probabilidad de un valor cualquiera Ai se designa por P(Ai ) y es s
∑n P( Ai ) =
ij
j =1
n
que recibe el nombre de Probabilidad Marginal. La calificación de marginal se emplea siempre que se prescinde de uno o más criterios de clasificación. Es evidente que
2/16
s
∑n
ij
P( Ai ) =
j =1
n
= ∑ P( Ai ∩ B j )
n
j =1
ya que nij
= P( Ai ∩ B j )
n
De forma análoga, la probabilidad marginal de Bj es r
∑n
ij
P( B j ) =
r
= ∑ P( Ai ∩ B j )
i =1
n
i =1
Con la terminología anterior, hemos particionado el espacio muestral Ω en r·s subconjuntos disjuntos, designando el subconjunto general por Ai∩Bj. Ahora bien: Ai = ( Ai ∩ B1 ) ∪ ( Ai ∩ B2 ) ∪ ( Ai ∩ B3 ) ∪ K ∪ ( Ai ∩ Bs ) Puesto que ( Ai ∩ B j ) ∩ ( Ai ∩ B j ' ) = ∅ cuando j≠j’. Teniendo en cuenta los axiomas de probabilidad, aplicando P3 obtenemos P( Ai ) = P ( Ai ∩ B1 ) + P( Ai ∩ B 2 ) + P( Ai ∩ B3 ) + K + P ( Ai ∩ B s ) y teniendo en cuenta el valor de cada uno de los sumandos, podemos escribir la expresión anterior como s
s
P( Ai ) = ∑ P( Ai ∩ B j ) = ∑ j =1
j =1
n ij n
En el ejemplo que hemos puesto antes de la baraja con 52 cartas, la probabilidad de obtener un as es la suma de probabilidades de obtener un as de espadas, un as de bastos, un as de oros y un as de copas. Considerando un caso más general, supongamos tres criterios de clasificación A, B y C. Sea A1 , A2 , ..., Ar una partición de Ω formada por r subconjuntos mutuamente excluyentes (disjuntos), sea B1 , B2 , ..., Bs otra partición de Ω en s subconjuntos disjuntos y sea C1 , C2 , ..., Ct la tercera partición de Ω. Denotemos por nijk el número de resultados, de entre los n, que presentan los caracteres Ai, Bj y Ck . La clasificación completa sería una tabla de triple entrada compuesta de t capas de tablas de doble entrada, correspondiendo cada capa a un Ck . La probabilidad marginal de, por ejemplo, Ai y Ck es: s
P( Ai ∩ C k ) = ∑ P( Ai ∩ B j ∩ Ck ) j =1
3/16
y la probabilidad marginal de Ck es r
s
r
s
P(C k ) = ∑ ∑ P( Ai ∩ B j ∩ C k ) = ∑ P ( Ai ∩ C k ) = ∑ P ( B j ∩ C k ) i =1 j =1
i =1
j =1
La generalización de lo anterior para más de tres criterios se realiza de forma inmediata. 2. PROBABILIDAD CONDICIONADA. Teniendo en cuenta la clasificación de doble entrada vista al principio del punto anterior, con la tabla de doble entrada, supongamos que deseamos examinar el resultado de un experimento aleatorio para un atributo, pero no para el otro. Queremos hallar la probabilidad de que el otro atributo tenga un valor determinado. Supongamos que hemos observado que el suceso tiene el atributo B3 . ¿Cuál será la probabilidad de que tenga así mismo el atributo A2 ? El total de resultados de A cuando ha sucedido B3 es r
∑n
i3
i =1
y el número de resultados favorables a A2 es n23 . Así, la probabilidad de A2 , cuando se sabe que ha ocurrido B3 , es r
n 23
∑n
i3
i =1
que se designa con el nombre de Probabilidad Condicionada y cuyo símbolo es P(A2 |B3 ). En general, suponiendo que los denominadores no son nulos, P( Ai | B j ) =
n ij
P( B j | Ai ) =
r
∑n
n ij s
∑n
ij
i =1
ij
j =1
Dividiendo el numerador y el denominador de la fracción del segundo miembro por n, nos queda P( Ai | B j ) =
P( Ai ∩ B j )
P( B j | Ai ) =
P( B j )
o bien P( Ai ∩ B j ) = P( Ai | B j )· P( B j ) P( Ai ∩ B j ) = P( B j | Ai )· P( Ai )
4/16
P( Ai ∩ B j ) P( Ai )
Esta última ecuación puede enunciarse de la siguiente manera: La probabilidad de que un resultado tenga los atributos Ai y Bj es igual a la probabilidad marginal de Ai multiplicada por la probabilidad condicional de Bj cuando a ocurrido Ai. La idea de probabilidad condicional admite una generalización inmediata a situaciones donde interviene más de un criterio de clasificación. Por ejemplo, en el caso de tres criterios, se ve inmediatamente que P( Ai ∩ B j | C k ) =
P ( Ai ∩ B j ∩ Ck )
P( Ai | B j ∩ C k ) =
P(C k )
P ( Ai ∩ B j ∩ Ck ) P ( B j ∩ Ck )
y también que P( Ai ∩ B j ∩ C k ) = P( Ai ∩ B j | C k )· P(C k ) = = P( Ai | B j ∩ C k )· P( B j ∩ C k ) = = P( Ai | B j ∩ C k )· P( B j | Ck )·P (Ck ) Podrían obtenerse otras relaciones análogas permutando las letras A, B y C. Así P( B j | Ai ∩ C k ) =
P ( Ai ∩ B j ∩ Ck ) P( Ai ∩ C k )
y P( Ai ∩ B j ∩ C k ) = P( B j | Ai ∩ C k )· P( Ai | C k )· P(C k ) o bien P( Ai ∩ B j ∩ Ck ) = P ( B j | Ai ∩ Ck )·P( Ck | Ai )·P ( Ai ) Podríamos seguir escribiendo todas las relaciones análogas existentes, pero no es el objetivo del tema. Debe quedar claro que las probabilidades anteriores no están definidas si el denominador es 0. Para describir la probabilidad condicional hemos utilizado un espacio muestral ciertamente especial, conteniendo un número finito de puntos, cada uno de ellos con la misma probabilidad. Sin embargo, la idea es completamente general y puede definirse para espacios muestrales discretos y continuos de la siguiente forma. DEF Sean A y B dos sucesos de un espacio muestral Ω tal que P(B)>0. La probabilidad condicional del suceso A cuando ha ocurrido el suceso B, y que se designa por P(A|B) es P( A ∩ B ) P( A | B ) = P ( B) Para la probabilidad condicionada P(A|B) podemos utilizar la notación más breve PB ( A) = P( A | B) =
5/16
P( A ∩ B) P( B)
De este modo vemos que, fijado el suceso B, PB es una función de dominio S. PROP Dado el espacio de probabilidad (Ω, S P) y definida la función PB como P(·|B) también (Ω, S, PB) es un espacio de probabilidad. Dem. La familia S es una σ-álgebra por hipótesis. Por ser P una medida de probabilidad, se deduce fácilmente que PB es también una medida de probabilidad de dominio S. 3. DOS LEYES BÁSICAS DE LA PROBABILIDAD. Si A y B son dos subconjuntos mutuamente excluyentes (disjuntos), el axioma 3, P3, de la probabilidad establece que P(A∪B) = P(A) + P(B) Vamos a obtener ahora una fórmula más general que nos sirva aun en el caso de que los sucesos no sean disjuntos. TEOREMA. Sea Ω un espacio muestral y S la σ-álgebra asociada, con función de probabilidad P. Si A y B son dos sucesos cualesquiera de S, se verifica P(A∪B) = P(A) + P(B) – P(A∩B) Dem. El álgebra de conjuntos permite establecer la igualdad A∪B = A∪( A ∩B) Pero los conjuntos A y A ∩B son disjuntos, por tanto podemos aplicarles el axioma P3, obteniendo P(A∪B) = P(A) + P( A ∩B) Ahora bien B = (A∩B) ∪ ( A ∩B) siendo, de nuevo, ambos conjuntos disjuntos, por lo que aplicando de nuevo el axioma P3. P(B) = P(A∩B) + P( A ∩B) O también como P( A ∩B) = P(B) – P(A∩B) Sustituyendo esta expresión en la primera, obtenemos el resultado deseado. Para demostrar el teorema en un espacio muestral finito Ω, donde cada punto tiene 1 de probabilidad , nos referiremos a la tabla del apartado 1, y calcularemos, por n
6/16
ejemplo, la probabilidad P(A1 ∪B2 ). La probabilidad de que ocurran los sucesos A1 o B2 se obtiene sumando todas las nij de la primera fila y de la segunda columna, y dividiendo por n. Así, tenemos s
r
s
∑ n1 j + ∑ ni 2 P( A1 ∪ B2 ) =
j =1
i= 2
n
r
∑ n1 j + ∑ n i2 − n12 =
j =1
i =1
n
= P( A1 ) + P( B2 ) − P( A1 ∩ B 2 )
Cabe generalizar esta ley para más de dos subconjuntos, siendo para tres P(A∪B∪C) = P(A) + P(B) + P(C) – P(A∩B) – P(A∩C) – P(B∩C) + P(A∩B∩C) Y para el caso de n subconjuntos, sería: TEOREMA Sean A1 , A2 , ..., An n sucesos cualesquiera. Entonces n n n P U A j = ∑ P ( A j ) − ∑ P( Ai ∩ A j ) + ∑ P ( Ai ∩ A j ∩ Ak ) + K + ( −1) n −1 P I A j 1≤i < j ≤n 1≤i < j
7/16
Vamos a demostrar esta proposición considerando que el espacio muestral Ω tiene n puntos equiprobables. Sean m1 y m2 el número de puntos contenidos en A y B respectivamente y m3 el número de puntos comunes a ambos. Si suponemos que m1 y m2 son ambos positivos, tenemos m m m P( A ∩ B) = 3 P( A) = 1 P( B) = 2 n n n P( A | B) =
m3 m2
P( B | A) =
m3 m1
De las expresiones anteriores deducimos de forma inmediata la tesis a demostrar. Generalizando la proposición anterior, tenemos el siguiente enunciado llamado Teorema de la Probabilidad Producto o Teorema de la Probabilidad Compuesta. TEOREMA Teorema de la Probabilidad Compuesta. Sean A1 , A2 , ..., An n sucesos cualesquiera y supongamos que
n −1 P I Ai > 0 . i =1
Entonces i −1 n n P I Ai = ∏ P Ai | I A j i =1 i =1 j =1
Dem. La condición n −1 P I Ai > 0 i =1 permite escribir la identidad 2 P I Ai n P I Ai = P( A1 ) ⋅ i =1 ⋅ P ( A1 ) i =1
3 n P I Ai P I Ai i =1 ⋅ L ⋅ i =1 2 n −1 P I Ai P I Ai i =1 i =1
ya que ninguno de los denominadores anteriores es nulo. La definición de probabilidad condicionada aplicada a cada fracción convierte esta identidad en la expresión que queríamos demostrar. OBS En total, iguales a la expresión anterior, tenemos n! relaciones, obtenidas permutando las letras del segundo miembro.
8/16
4. SUCESOS COMPUESTOS. La ley multiplicativa de las probabilidades resulta especialmente útil para simplificar el cálculo de las probabilidades de sucesos compuestos. Un suceso compuesto consiste en dos o más sucesos simples, como ocurre cuando se lanza un dado dos veces o se extraen sucesivamente tres cartas de una baraja. Veamos un ejemplo que sirva de ilustración. Se extraen dos bolas, una tras otra, de una urna que contiene dos bolas negras, tres blancas y cuatro rojas. ¿Cuál es la probabilidad de que la primera bola sea roja y la segunda blanca? Consideraremos al extracción sin reemplazamiento. Los resultados de este suceso compuesto pueden clasificarse según dos criterios • •
El color de la primera bola. El color de la segunda bola.
Podemos pues, construir una tabla análoga a la del primer apartado. La clasificación A se basa en el color de la primera bola, y hacemos corresponder los sucesos A1 , A2 y A3 a los colores negro, blanco y rojo, respectivamente. Análogamente, los sucesos B1 , B2 y B3 corresponden a los mismos colores para la segunda bola. El número total de resultados es n = 9·8 = 72 9 No es el número combinatorio porque estamos considerando permutaciones y 2 no combinaciones, ya que existe un determinado orden de extracción. La tabla completa de resultados es: B1 B2 Bs A1 2 6 8 A2 6 6 12 Ar 8 12 12 Y la probabilidad pedida es P( A3 ∩ B2 ) =
12 1 = 72 6
Utilizando la ley multiplicativa de las probabilidades, sólo necesitamos considerar los dos sucesos simples por separado. En este caso, se debe utilizar dicha ley en la forma P( A3 ∩ B2 ) = P ( A3 )· P( B 2 | A3 ) Ahora bien, P(A3 ) es simplemente la probabilidad de obtener bola roja en una sola 4 extracción, la cual es . P(B2 |A3 ) es la probabilidad de extraer bola blanca habiendo 9 3 extraido ya una bola roja, probabilidad que vale . El producto de estos dos números 8 nos da la probabilidad pedida.
9/16
La validez de la técnica empleada en el ejemplo no es evidente. No resulta inmediato que la probabilidad marginal P(A3 ) pueda calcularse prescindiendo por completo del segundo suceso, ni que la probabilidad condicional corresponda al suceso físico simple que antes hemos descrito. Para un suceso compuesto, que conste de dos sucesos simples, basta considerar una tabla 2 por 2. Hacemos corresponder A1 a un acierto en el primer suceso y A2 a un fallo en el mismo. Sea m1 el número de maneras con que puede presentarse con acierto el primer suceso y m2 el número de veces en que dicho suceso puede fallar. Supongamos que B1 y B2 se definen de forma análoga para el segundo suceso. Sean m11 y m12 las veces en que el segundo suceso puede ser un acierto y un fallo, suponiendo que se haya obtenido un acierto en el primero. Sean m21 y m22 los números de maneras en que el segundo puede resultar acierto o fallo cuando sabemos que el segundo ha sido un fallo. La tabla 2 por 2 que queda sería:
A1 A2
B1 m1 m11 m2 m21
B2 m1 m12 m2 m22
El número total de resultados posibles es n = m1 m11 + m1 m12 + m2 m21 + m2 m22 La probabilidad buscada es que se produzca un acierto en ambos sucesos, luego P( A1 ∩ B1 ) =
m1 m11 n
La probabilidad marginal P(A1 ) es m1 m11 m1 m12 m1 (m11 + m12 ) + = n n m1 ( m11 + m12 ) + m2 ( m21 + m22 ) Ahora bien, la probabilidad de obtener un acierto en el primer suceso sin tener en cuenta el segundo es m1 m1 + m2 P( A1 ) =
que no coincide con la expresión anterior salvo que m11 + m12 = m21 + m 22 esto es, a menos que el número total de resultados del segundo suceso sea el mismo sin tener en cuenta si el primero ha sido acierto o fallo. La probabilidad condicional es m11 m11 + m12 10/16
y da la probabilidad de un acierto para el segundo suceso, en el supuesto de que el primero haya sido un acierto. Podríamos inclinarnos a deducir que este uso de la probabilidad condicional sólo es correcto cuando el número de resultados para el segundo suceso es independiente del resultado del primero, pero precisamente sucede lo contrario. La probabilidad correcta es P( A1 ∩ B1 ) =
m1 m11 ⋅ m1 + m 2 m11 + m12
y no el valor dado anteriormente P( A1 ∩ B1 ) =
m1 m11 n
El valor calculado por este método condicional es siempre correcto, mientras que el obtenido por enumeración de resultados lo es sólo cuando el número de ellos para el segundo suceso es independiente del resultado del primero. Un ejemplo sencillo nos va a permitir aclarar todo esto. Supongamos que se lanza una moneda y que si sale cara, se introduce una bola negra en una urna, mientras que si sale cruz, se introducen en la urna una bola negra y otra blanca. A continuación, se extrae una bola de la urna. Si salió cara, la bola tendrá que ser, evidentemente, negra. Si representamos los sucesos cara y cruz por C y X, y blanca y negra por B y N, los tres resultados posibles serán CN, XN y XB. Estos tres resultados no son, por supuesto, equiprobables. Si el experimento se repitiese un cierto número de veces, cabría esperar que el resultado CN ocurriera doble número de veces que cualquiera de los otros dos. Es decir, que su probabilidad fuese ½y no 1/3. En general, los resultados posibles de un suceso compuesto no son igualmente probables si el número de resultados del segundo suceso depende del resultado del primero. Por tanto, no es aplicable la definición de probabilidad. No obstante, si la definición puede aplicarse por separado a los sucesos componentes, será posible calcular la probabilidad del suceso compuesto utilizando el método de las probabilidades condicionales. Desgraciadamente, no es posible dar una demostración formal de estas afirmaciones. Tenemos que limitarnos a confiar en nuestra intuición o, más bien, en el valor de cualquier testimonio experimental que poseamos. 5. SUCESOS INDEPENDIENTES. Si P(A|B) no depende del suceso B, diremos que los sucesos A y B son independientes. Podemos expresarlo formalmente de la siguiente forma: DEF Sean A y B dos sucesos de un espacio muestral Ω. Diremos que A y B son Sucesos Independientes si satisfacen P(A∩B) = P(A)·P(B)
11/16
Por ejemplo, supongamos que lanzamos un dado dos veces y que deseamos hallar la probabilidad de que los resultados sean dos y tres, en este orden: P(2∩3) = P(2)·P(3|2) =
1 1 ⋅ = P(2)·P(3) 6 6
de modo que los dos sucesos son independientes. La dependencia es la negación de la independencia. Por tanto, diremos que A y B son Dependientes si no son independientes. PROP Cualquier suceso nulo o casi seguro es independiente de cualquier otro suceso. Dem. La validez de la condición P(A∩B) = P(A)·P(B) en el caso de que A sea nulo o casi seguro es inmediata. PROP Si A y B son independientes y P(B)>0 entonces P(A) = P(A|B). Recíprocamente, si P(B)>0 y se verifica P(A) = P(A|B) entonces A y B son independientes. Dem.
y
Como P(A∩B) = P(A)·P(B) por el hecho de ser independientes P(A∩B) = P(B)·P(A|B)
se deduce rápidamente que P(A) = P(A|B). Recíprocamente, teniendo en cuenta las expresiones P(A) = P(A|B) P(A∩B) = P(B)·P(A|B) Obtenemos que A y B son independientes. PROP Si A y B son dos sucesos independientes, entonces A y B también lo son. Dem. Restando las dos igualdades P(A) = P(A) P(A∩B) = P(A)·P(B) se obtiene P(A–A∩B) = P(A)·(1–P(B)) de donde P(A∩ B ) = P(A)·P( B )
12/16
DEF Diremos que los sucesos A1 , A2 , ..., An son Independientes por Parejas (dos a dos) si cada par Ai y Aj son independientes entre sí. Es decir, si se verifica que P(Ai∩Aj) = P(Ai)·P(Aj) 1≤i
i∈ I
Entonces A y B son independientes. PROP Si los sucesos A1 , A2 , ..., An-1 son independientes, entonces, para que A1 , A2 , ..., An sean independientes es suficiente que An sea independiente de cada suceso A obtenido como A = I Ai con I⊂{1, 2, ..., n} i∈ I
PROP Si los sucesos A1 , A2 , ..., An son independientes, y sustituimos uno de ellos, por ejemplo el último, An , por su complementario, los sucesos del nuevo conjunto son también independientes.
13/16
DEF Los sucesos de una familia {At : t∈T} donde T es un conjunto cualquiera de índices, diremos que son independientes si los sucesos de cada conjunto finito At1 , At 2 , K, At n
con n ≥ 2 y {t1 , t2 , ..., tn }⊂T
son independientes. 6. TEOREMA DE LA PROBABILIDAD TOTAL. En cálculo de probabilidades se nos pueden presentar situaciones en que existen n sucesos incompatibles (disjuntos) cuya unión es todo el espacio muestral Ω. n
H1 , H2 , ..., Hn
Hi∩Hj=∅ ∀i≠j
UH
i
=Ω
i =1
que poseen probabilidades conocidas P(Hi) y que para cada suceso A resultan también conocidas las probabilidades condicionadas P(A|Hi). En esta situación se puede calcular la probabilidad de A a través de las probabilidades anteriores mediante una fórmula que constituye el llamado Teorema de la Probabilidad Total. En la situación descrita suele utilizarse la siguiente nomenclatura. los sucesos Hi se llaman hipótesis o causas. Las probabilidades P(Hi ) se llaman probabilidades a priori de las hipótesis. La probabilidad condicionada P(A|Hi) es la probabilidad de A en la hipótesis Hi. La probabilidad P(Hi|A) es la probabilidad a posteriori de la hipótesis Hi cuando se sabe que ha sucedido A. TEOREMA Sean H1 , H2 , ..., Hn n sucesos incompatibles de probabilidades no nulas cuya unión es Ω. entonces, para cualquier suceso A se tiene n
P( A) = ∑ P( H i ) ⋅ P ( A | H i ) i =1
Dem. Son inmediatos los cálculos siguientes n n P( A) = P ( A ∩ Ω) = P A ∩ U H i = P U ( H i ∩ A) = i =1 i =1 n
n
= ∑ P( H i ∩ A) = ∑ P ( H i )·P( A | H i ) i =1
i =1
OBS En el enunciado del Teorema anterior, la restricción de que P(Hi )>0 puede suprimirse quedando la suma extendida al conjunto J={i : P(Hi)>0} ya que
14/16
n
P( A) = ∑ P( H i ∩ A) = ∑ P( H i ∩ A) = ∑ P( H i )·P ( A | H i ) i =1
i∈J
i∈ J
OBS También puede utilizarse la tesis del teorema, sin ninguna dificultad, si el conjunto de sucesos Hi es numerable en vez de un conjunto finito. 7. TEOREMA DE BAYES. La fórmula de Bayes da la probabilidad a posteriori de una hipótesis Hr cuando se sabe que ha ocurrido un suceso A. TEOREMA. Fórmula de Bayes Sean H1 , H2 , ..., Hn n sucesos incompatibles de probabilidades no nulas cuya unión es Ω. Sea A un suceso cualquiera de probabilidad positiva. Entonces para cualquier suceso Hr se tiene P( H r )·P( A | H r ) P( H r | A) = n ∑ P( H i )· P( A | H i ) i =1
Dem. Partiendo de la definición de probabilidad condicionada P( H r | A) =
P( H r ∩ A) P ( A)
y aplicando en el denominador la igualdad demostrada en el teorema anterior, obtenemos inmediatamente la expresión a comprobar. TEOREMA. Generalización de la Fórmula de Bayes. Sean H1 , H2 , ..., Hn n sucesos incompatibles cuya unión es Ω. Sea A un suceso tal que P(A∩Hi)>0 para i : 1, 2, .., n. Entonces, para cualquier suceso C se tiene n
P(C | A) =
∑ P( H
i
)·P( A | H i )·P(C | H i ∩ A)
i =1
n
∑ P (H
i
)·P( A | H i )
i =1
Dem. Partiendo de la definición de probabilidad condicionada
15/16
n
P( A ∩ C) = P(C | A) = P ( A)
∑ P( A ∩ C ∩ H ) i
i =1
n
∑ P( A ∩ H ) i
i =1
y utilizando la expresión obtenida en el teorema de la probabilidad total llegamos a la fórmula a demostrar. OBS Las dos fórmulas de Bayes obtenidas pueden ser utilizadas en el caso de ser numerable el conjunto de sucesos {Hi : i∈I} OBS También se aprecia la ventaja de suponer que las sumas de los denominadores de ambas fórmulas se extienden al conjunto {j : P(Hj )>0} y la del numerador de la segunda fórmula al conjunto {j : P(Hj∩A)>0}.
BIBLIOGRAFÍA RECOMENDADA. Estadística Teórica. Aut. J.M.Doblado y M.C. Nieto. Edit. UNED Introducción a la Estadística Teórica. Aut.: G Arnáiz. Edit.: Lex Nova Estadística Teórica y Aplicada. Aut.: A. Nortes. Edit.: S. Rodríguez. Introducción a la Probabilidad y la Medida (I). Aut.: P Zoroa y N. Zoroa. Edit.: Maior DM.
16/16
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 65 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. CARACTERÍSTICAS Y TRATAMIENTO. LAS DISTRIBUCIONES BINOMIAL Y DE POISSON. APLICACIONES. 1. 2. 3. 4. 5. 6. 7. 8.
Introducción. Funciones de Cuantía. Distribuciones Multivariantes. Distribución de Bernouilli. Distribución Binomial. Distribución de Poisson. Ajuste de una Distribución Binomial a una Poisson. Otras Distribuciones Discretas. 8.1. Distribución Multinomial. 8.2. Distribución Hipergeométrica. 8.3. Distribución Hipergeométrica Multivariante. 8.4. Distribución Geométrica o de Pascal. 8.5. Distribución Binomial Negativa. Bibliografía Recomendada.
1/17
TEMA 65 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. CARACTERÍSTICAS Y TRATAMIENTO. LAS DISTRIBUCIONES BINOMIAL Y DE POISSON. APLICACIONES. 1. INTRODUCCIÓN. DEF Diremos que X es una variable aleatoria discreta unidimensional si es una variable aleatoria que toma sólo un número finito o infinito numerable de valores del eje x. Supongamos que X toma únicamente los valores x1 , x2 , ..., xn , ... con probabilidades f(x1 ), f(x2 ), ..., f( xn ), ... e imaginemos que A es cualquier subconjunto de los puntos x1 , x2 , ..., xn , ... La probabilidad P(A) del suceso A (probabilidad de que x esté en A) se define como P( A) = ∑ f ( x ) x∈ A
donde el sumatorio representa la suma de f(x) para aquellos valores xi que pertenecen a A. Así, por ejemplo, P(X=4) indica la probabilidad de que el valor de la variable sea 4, y P(1
x = 0,1,2,3,4
Como f(x)≥0
0≤x≤4
2/17
4
∑
f ( x) =
x= 0
1 24
4
4
∑ x = 1 x =0
Entonces, f(x) es una función de densidad. Es importante destacar que f(x) da las frecuencias relativas o frecuencias con que se presenta cada uno de los valores de X. 2. FUNCIONES DE CUANTÍA. El conjunto de resultados posibles de un suceso aleatorio se divide en un cierto número de clases mutuamente excluyentes en relación con determinado atributo. A cada clase se le asocia un valor de la variable aleatoria, o variante X. La función de cuantía es una función que da la probabilidad de que ocurra un valor determinado de x. La variante X puede describir un atributo, como era el caso anterior del lanzamiento de 4 monedas, o puede ser simplemente el resultado de una codificación. Así, al extraer bolas de una urna, pueden clasificarse según su color, y podríamos definir una variable aleatoria X estableciendo arbitrariamente una correspondencia entre los valores de X y los colores. La función de cuantía puede ser una expresión matemática, como en el apartado anterior, o bien reducirse a una tabla de valores. A menudo resulta necesario calcular la probabilidad cuando la variable aleatoria se encuentra en un determinado rango de valores, como por ejemplo, P(X<3) o P(1
PROP
P(a
Dem. Inmediata a partir de la definición. 3. DISTRIBUCIONES MULTIVARIANTES. Si el resultado de un suceso aleatorio lo podemos clasificar de más de una manera, la función de cuantía es una función de más de una variable. Así, al extraer una carta de una baraja francesa, podríamos caracterizarla según su palo y su numeración. Tendríamos la variable aleatoria X que toma los valores 1, 2, 3 y 4 (representando cada uno a un palo de la baraja) y la variable aleatoria Y que toma los valores del 1 al 13.
3/17
La variable aleatoria (X,Y) es bidimensional y la probabilidad de extraer una carta se representa por f(X,Y). Si cada carta tiene la misma probabilidad de ser extraida, la función de cuantía será 1 f ( X ,Y ) = 1 ≤ X ≤ 4 1 ≤ Y ≤ 13 52 Este tipo de funciones pueden representarse sobre un plano. Las probabilidades vienen representadas por segmentos verticales en los puntos (x,y) del plano horizontal en el cual están definidas. En el ejemplo, los segmentos serán de igual altura. En general, la variable aleatoria k-dimensional (x1 , x2 , ..., xn ) se denomina función de cuantía de la variable aleatoria k-dimensional. Sea A un subconjunto del conjunto de valores de la variable aleatoria, entonces P(( x1 , x 2 , K , x k ) ∈ A) = ∑ f ( x1 , x 2 , K , x k ) A
donde el sumatorio supone la suma que toma la función de cuantía para los valores de la variable que pertenecen al conjunto A. DEF
Sea x i1 , x i2 , K , xi t cualquier subconjunto de las variables aleatorias discretas x1 ,
x2 , ..., xn . La distribución marginal de la variable aleatoria t-dimensional ( x i1 , x i2 , K , xi t ) es f i1 ,i 2 ,..., it ( xi1 , xi t ,..., x i t ) = ∑ f ( x1 , x 2 ,..., xn ) donde la suma se extiende a todos los valores, a excepción de x i1 , x i2 , K , xi t . DEF Sean x i1 , x i2 , K , xi t y x j1 , x j 2 , K , x j s dos subconjuntos disjuntos de las variables aleatorias discretas x1 , x2 , ..., xn . La distribución condicional de la variable aleatoria t-dimensional ( x i1 , x i2 , K , xi t ) dado el valor ( x j1 , x j 2 , K , x j s ) es g ( x i1 , xi 2 , K, x it | x j1 , x j 2 , K, x j s ) =
f i1 , i2 ,..., i t , j1 , j 2 ,..., j s ( x i1 , xi 2 , K, x it , x j1 , x j 2 , K , x j s ) f j1 , j 2 ,..., j s ( x j 1 , x j 2 , K , x j s )
para todos los valores de x para los cuales no se anula el denominador. DEF
Las variables aleatorias discretas x1 , x2 , ..., xk son Independientes si f ( x1 , x 2 ,..., x k ) = f ( x1 )· f ( x 2 )·...· f ( x k )
para todos los valores en que está definida la variable aleatoria. Ejemplo Supongamos que extraemos 12 cartas sin reemplazamiento de una baraja francesa. Sea X1 el número de ases, X2 el número de doses, X3 el número de treses y X4 el número de cuatros. La distribución de estas variables viene expresada por una función de cuatro variables, que es: 4/17
36 4 4 4 4 ⋅ ⋅ ⋅ ⋅ x1 x 2 x 3 x 4 12 − x1 − x 2 − x 3 − x 4 f ( x1 , x 2 , x 3 , x 4 ) = 52 12 siendo el recorrido de cada una de las variables aleatorias de 1≤Xi≤4 y verificando la restricción de ∑ X i ≤ 12 Existe una gran cantidad de distribuciones marginales y condicionales asociadas con esta distribución. Veamos dos ejemplos de distribuciones marginales y otro de distribución condicional. 44 4 4 ⋅ ⋅ x 2 x3 12 − x 2 − x3 f 23 ( x3 , x 4 ) = 52 12 4 48 ⋅ x 4 12 − x 4 f 4 (x 4 ) = 52 12
0 ≤ xi ≤ 4
0 ≤ x4 ≤ 4
36 4 4 ⋅ ⋅ x 2 x 4 12 − x1 − x 2 − x3 − x 4 f ( x 2 , x 4 | x1 , x 3 ) = 44 12 − x1 − x 3
0 ≤ xi ≤ 4 x 2 + x 4 ≤ 12 − x1 − x3
4. DISTRIBUCIÓN DE BERNOUILLI. Llamaremos Prueba de Bernouilli a toda realización de un experimento aleatorio en el que sólo sean posibles dos resultados mutuamente exclusivos (por ejemplo, éxito y fracaso). Por tanto, podemos definir un espacio muestral como Ω = {0,1} donde 0 representa “fracaso” y 1 representa “éxito”. Definamos una variable aleatoria X que pueda tomar sólo los valores anteriores, con probabilidades asociadas P(éxito) = p
P(fracaso) = q = 1 – p
Es claro que la función de distribución de probabilidades (también llamada de cuantía) de X es:
5/17
f(x) = P(X=x) = px (1–p)1-x para x=0,1 Esta distribución de probabilidades recibe el nombre de Distribución de Bernouilli. La media y la varianza de una variable aleatoria que posee una distribución de probabilidades de Bernouilli son: E(X) = 0·f(0) + 1·f(1) =00·q + 1·p = p Var(X) = E(X2 ) – [E(X)]2 = 0·f(0) + 1·f(1) – p2 = p – p2 = p(1–p) = pq 5. DISTRIBUCIÓN BINOMIAL. Supongamos n pruebas independientes entre sí de Bernouilli tales que la probabilidad de éxito, p, se mantiene constante a lo largo de todas ellas. Definimos la variable aleatoria X como el número de veces que sucedió el suceso éxito. Bajo estas condiciones podemos definir DEF Diremos que X es una variable aleatoria Binomial de parámetros n y p si su función de probabilidad es n P( X = x ) = p x q n − x con x = 0,1,...,n x Veamos como se ha originado esta función de probabilidad. Supongamos que el resultado de la i-ésima prueba forma una variable aleatoria unidimensional que designaremos por Xi, siendo su valor Xi=0 si el resultado es un fracaso y Xi=1 si es un éxito. Sea f(x1 ,x2 ,...,xn ) la probabilidad de que la variable aleatoria Xi=xi con i:1,2,...,n. Puesto que las n variables aleatorias, todas ellas iguales, son independientes, podemos aplicar la definición de independencia para obtener x n− x f ( x1, x 2 ,..., x n ) = f ( x1 )· f ( x 2 )·K· f ( x n ) = p x1 q 1 − x1 p x 2 q1 − x2 ·K· p x n q 1− x n = p ∑ i q ∑ i
donde 0 y 1 son los valores que toman cada una de las variables xi. Evidentemente, para cualquier ordenación de k éxitos y n–k fracasos, la probabilidad es pk qn–k puesto que el sumatorio será k al haber esa cantidad de 1’s. Si ahora tenemos en cuenta el número total de formas de ordenar k 1’s en n lugares, obtenemos el número combinatorio n k siendo entonces la probabilidad de k éxitos el número
6/17
n k n− k p q k La función de distribución de variable aleatoria binomial presenta otras dos variables, p y n, de carácter distinto. Su variación corresponde a distribuciones binomiales diferentes, ya que para una distribución binomial dada, p y n tienen valores fijos. Las variables de este tipo reciben el nombre de parámetros de la distribución. La función f( x;n,p) representa una familia de distribuciones con dos parámetros, obteniéndose un miembro de esta familia al especificar los valores de p y n. DEF El parámetro n recibe el nombre de Parámetro Discreto. El parámetro p es el Parámetro Contínuo. El nombre de n es debido a que sólo puede tomar valores naturales. En cambio, p puede tomar valores dentro del intervalo cerrado [0,1] En general, la distribución binomial tendrá un valor máximo, el cual pasamos a determinar. Sea m la parte entera del número (n+1)·p y sea e la parte fraccionaria. m = [(n+1)·p]
y
e = (n+1)·p – [(n+1)·p]
PROP El mayor valor de f(x) se obtiene al tomar x = m, recibiendo m el nombre de valor modal o, simplemente, moda de la variable aleatoria X. Si e=0, también se alcanza en x = m–1. Dem. Supongamos que el número e, definido anteriormente, es distinto de cero. Tomemos la razón f ( x + 1) f (x ) Vamos a comprobar que esta razón es inferior a 1 cuando x es mayor o igual a m, y superior a 1 cuando x es inferior a m. f ( x + 1) p n − x = ⋅ f ( x) q x +1 y si x ≥ m tenemos p n− x p n−m ⋅ ≤ ⋅ q x +1 q m +1 Sustituyendo m por (n+1)p–e, el segundo miembro puede escribirse como
7/17
1 − e ( n + 1) − q p n−m ⋅ = q m +1 1 − e ( n + 1) + p que es menor que la unidad Si x < m–1 tenemos e p n − x p n − ( m − 1) p ( n + 1) q + e q ⋅ > ⋅ > ⋅ > q x +1 q m q ( n + 1) p − e n + 1 − e p que es mayor que 1. n +1 +
Ahora vamos a estudiar el caso que nos hemos dejado pendiente: x = m–1, para el cual se verifica: e ( n + 1) + f ( x + 1) p n − m + 1 q = ⋅ = e f ( x) q m ( n + 1) − p que es también superior a 1 si e≠0. Si e=0, la razón es igual a la unidad, verificándose que f(x+1) = f(x), teniendo la distribución dos valores de x en los que alcanza el máximo, x =m y x = m–1. PROP La Media y la Varianza de una variable aleatoria que posee una distribución de probabilidades Binomial es: 1) E(X) = np 2) Var(X) = npq Dem. Para la demostración, vamos a considerar que la variable aleatoria X con distribución binomial se puede dividir en n variables aleatorias independientes, cada una de ellas asociada a una distribución de Bernouilli de probabilidad p. Es decir X = X1 + X2 + ... + Xn donde las Xi son variables aleatorias independientes que siguen una distribución de Bernouilli, representando si sucede o no el suceso A en la prueba i-ésima, con i:1,2,...,n. Tomando esperanzas a ambos lados de la igualdad: E(X) = E(X1 + X2 + ... + Xn ) = E(X1 ) + E(X2 ) + ... + E(Xn ) = p + p + ... + p = np y tomando varianzas Var(X) = Var(X1 + X2 + ... + Xn ) = Var(X1 ) + Var(X2 ) + ... + Var(Xn ) =
8/17
= pq + pq + ... + pq = npq 6. DISTRIBUCIÓN DE POISSON. DEF Diremos que la variable aleatoria X se distribuye según una distribución de Poisson si la función de distribución es de la forma f (x ) =
e − λ λx con x=0,1,2,3,... x!
siendo λ cualquier número positivo. Si tenemos en cuenta que la exponencial e λ tiene un desarrollo en serie de potencias eλ =1+ λ+
λ2 λx +K + +K 2! x!
deducimos que ∞
∑ f ( x) = 1 x= 0
Esta distribución se suele aplicar en aquellas situaciones en que un gran número de objetos se encuentran distribuidos sobre un gran recinto de considerable extensión. Consideremos un ejemplo que concrete esta situación. Supongamos un volumen V de un fluido que contiene un gran número N de pequeños organismos. Podemos suponer que estos organismos carecen de instintos sociales y que la probabilidad de que aparezcan en cualquier parte del fluido es la misma para un determinado volumen. Examinemos una gota de volumen D al microscopio. ¿Cuál es la probabilidad de que se hallen x organismos en la gota?. Se supone que V es mucho mayor de D. Puesto que suponemos que los organismos están distribuidos con probabilidad uniforme por todo el fluido, se deduce que la probabilidad de encontrar uno cualquiera de ellos en D D es . Y al suponer que no tienen instintos sociales, la presencia de uno de ellos en D V no influye en la de cualquiera de los otros. Por tanto, la probabilidad de que haya x organismos en D es x N −x N D V − D ⋅ ⋅ x V V Supongamos ahora también que los organismos son tan pequeños que podemos prescindir del espacio que ocupan; los N reunidos no ocuparían parte apreciable del volumen D. La función de Poisson es una aproximación de la expresión anterior, que es D simplemente una función binomial en la que p = es un valor muy pequeño. V
9/17
La distribución de Poisson se obtiene haciendo que V y N tiendan a infinito, de tal N modo que la densidad de organismos d = permanezca constante. si escribimos de V nuevo el producto anterior de la siguiente forma x
N ( N − 1)( N − 2) L ( N − x + 1) ND ND ⋅ ⋅ 1 − x!⋅N x V NV
N −x
1 2 x − 1 Dd x 1 − 1 − L 1 − ⋅ (Dd ) ⋅ 1 − N N N N = x!
= N− x
Podemos ver que el límite de la expresión anterior cuando N tiende a infinito es e − Dd ( Dd ) x x! y si sustituimos Dd por λ obtenemos la función de distribución de Poisson.. Esto nos demuestra que λ es el valor medio de x, ya que D, volumen de la porción examinada, multiplicado por la densidad d, da el promedio esperado en el volumen D. Hemos visto este ejemplo con cierto detalle porque a menudo se aplica de forma equivocada a datos que no verifican todas las condiciones requeridas. Por ejemplo, no se puede aplicar en el estudio de distribuciones de larvas de insectos en una gran extensión de cultivo, porque los insectos depositan sus huevos en grupos, de modo que en caso de encontrar uno en una pequeña área dada, lo probable es que se encuentren también otros. PROP La Media y la Varianza de una distribución de Poisson son iguales al parámetro λ. Dem. ∞
E( X ) = ∑ x x=0
∞ ∞ λx e − λ λx e − λ λx −1 e − λ =∑x = λ∑ x! x! x =1 x =1 ( x − 1)!
Haciendo el cambio de y = x–1 y operando, obtenemos λy = λe − λ e λ = λ y =1 y! ∞
E ( X ) = λe − λ ∑
En cuanto a la varianza, nos vamos a apoyar en su obtención en el cálculo de la esperanza. ∞ ∞ λx e − λ λx e − λ λx− 2 e −λ 2 E[ X ( X − 1) ] = ∑ x( x − 1) = ∑ x ( x − 1) =λ ∑ x! x! x= 0 x=2 x= 2 ( x − 2)! ∞
10/17
© Carlos M. Abrisqueta Valcárcel, 2002
Temario Específico – Tema 65
Haciendo el cambio de variable y = x–2 y operando, obtenemos λy e − λ = λ2 y! y=0 ∞
E[ X ( X − 1) ] = λ2 ∑ con lo cual obtenemos el valor de la varianza
Var ( X ) = E ( X 2 ) − [E ( X ) ]2 = E ( X 2 ) − µ 2 = E [X ( X − 1) ] + µ − µ 2 = µ = λ 7. AJUSTE DE UNA DISTRIBUCIÓN BINOMIAL A UNA POISSON. La distribución de Poisson también se obtiene como límite de la binomial cuando el tamaño de muestra n crece, n→∞, y la probabilidad de éxito tiende a cero, p→0, de manera que el número medio de “éxitos”, np=λ, permanezca constante. Las probabilidades binomiales las podemos expresar de la forma siguiente: x
n λ λ P( X = x ) = ⋅ ⋅ 1 − n x n
n− x
Tomando límites: x
n λ λ Lim P( X = x ) = Lim ⋅ ⋅ 1 − n →∞ n →∞ n x n
n− x
n λ n (n − 1) K ( n − x + 1) λ Lim = 1 − = x n → ∞ n x! λ x 1 − n n x
n x n( n − 1) K ( n − x + 1) λ 1 − λ = λ ⋅ 1 ⋅ e − λ = Lim ⋅ Lim x n →∞ n x! n → ∞ x! λ x 1− n n x
En consecuencia P( X = x ) →
λx e − λ x!
para x = 0, 1, 2, ...
llegando así a la distribución de Poisson. La aproximación se puede considerar que es bastante buena cuando se verifican las siguientes condiciones: 1) n > 25 2) p < 0’1 3) np = λ ≤ 5 Debido a esto, se conoce a la distribución de Poisson como Ley de los Sucesos Raros ya que se presenta en aquellos fenómenos en que estudiemos la ocurrencias de sucesos con probabilidades pequeñas.
11/17
8. OTRAS DISTRIBUCIONES DISCRETAS. 8.1. Distribución Multinomial. Supongamos que un experimento aleatorio puede conducir a k resultados excluyentes y exhaustivos E1 , E2 , ..., Ek , con probabilidades respectivas p1 , p2 , ..., pk , entonces la distribución de probabilidad de las variables aleatorias X1 , X2 , ..., Xk , que representan los números de ocurrencias para E1 , E2 , ..., Ek , en n ensayos independientes es: n x1 x2 n! p1 p 2 K p kxk = f ( x1 , x 2 , K, x k ) = p1x1 p 2x2 K p kx k x1 ! x 2 !K x k ! x1 , x 2 , K, x k donde k
∑ xi = n
k
0 ≤ p1 ≤ 1
i =1
∑p
i
=1
i =1
Si la variable aleatoria X tiene distribución Multinomial, entonces sus Medias, Varianzas y Covarianzas están dadas por las siguientes expresiones: 1) E(Xi) = µi = npi 2) Var(Xi) = σi2 = npi (1–pi) 3) Cov(Xi,Xj) = σij = –npipj con i≠j 8.2. Distribución Hipergeométrica. Supongamos que tenemos una población con N unidades estadísticas, de las cuales NA son de la clase A y el resto, N–NA, de la clase contraria A . Sea un experimento consistente en tomar, sin reemplazamiento, n unidades de población. DEF
Bajo las condiciones anteriores, llamamos variable aleatoria Hipergeométrica a X = “número de elementos de la clase A que hay en la muestra”
A la variable aleatoria así definida le corresponde una función de probabilidad dada por N A N − N A x n − x P( X = x) = N n Los parámetros de la distribución son N Tamaño de la población NA Nº de unidades de la clase A n Tamaño de la muestra sin reemplazamiento PROP Si la variable aleatoria X tiene una distribución Hipergeométrica, entonces su media y su varianza están dadas por
12/17
E( X ) = µ =
donde p =
nN A = np N
Var ( X ) = σ 2 =
N−n np (1 − p ) N −1
NA . N
Dem. NA N − NA ⋅ n n x n − x ( N A − 1)! N − N A = NA E( X ) = ∑ x = ∑ N N x =1 ( x − 1)! ( N A − x )! n − x x=0 n n =
NA n (N A − 1)! N − N A N A n N A − 1 N − N A = ∑ ∑ N x =1 ( x − 1)! ( N A − x )! n − x N x=1 x − 1 n − x n n
y haciendo el cambio de variable de y = x–1 convertimos la expresión anterior en n −1 N − 1 N − N A N A ∑ A ⋅ y n − y − 1 y =0 E( X ) = N n
y teniendo en cuenta que
N N N − 1 = n n n −1
podemos dejar la expresión anterior
como N A − 1 N − N A ⋅ y n − y − 1 N A NA E( X ) = n∑ = n = np N y =0 N N − 1 n −1 n −1
ya que el sumatorio es el de todas las probabilidades en el caso de una muestra de tamaño n–1, de un lote con N–1 objetos de los que NA–1 son de la clase A. Para el cálculo de la varianza vamos a tener en cuenta lo siguiente: Var ( X ) = E ( X 2 ) − [E ( X ) ]2 = E ( X 2 ) − µ 2 = E[ X ( X − 1) ] + µ − µ 2 donde E[ X ( X − 1)] =
N A ( N A − 1) n( n − 1) N ( N − 1)
y al operar obtenemos
13/17
Var ( X ) =
N−n np (1 − p ) N −1
La diferencia más importante entre esta distribución y la binomial es que en esta última las probabilidades permanecen constantes a lo largo de las pruebas (muestreo con reemplazamiento), mientras que en la hipergeométrica varían de prueba a prueba en función de los resultados de las pruebas anteriores (muestreo sin reemplazamiento). Cuando se verifican las condiciones siguientes: 1) N→∞ NA 2) = p = cte N 3) n = cte. entonces podemos aproximar la distribución hipergeométrica por una binomial, ya que puede probarse que en esas condiciones se cumple que: NA N − NA ⋅ x n − x → n p x q n − x x N n 8.3. Distribución Hipergeométrica Multivariante. Consideremos una población con N unidades estadísticas repartidas en k clases disjuntas y exhaustivas E1 , E2 , ..., Ek con N1 , N2 , ..., Nk unidades en cada clase respectivamente, y verificándose que N1 +N2 + ...+Nk =N. Si tomamos n unidades estadísticas sin reemplazamiento y contabilizamos cuántas unidades de cada clase nos aparecen, entonces esas k variables discretas constituyen una variable hipergeométrica multivariante. Xi = Nº de elementos de la clase Ai que hay en la muestra Estas variables Xi son linealmente dependientes, ya que su suma es evidentemente el tamaño n de la muestra. Su función de probabilidad viene dada por N1 N 2 N k K x1 x 2 x k P( X 1 = x1 , X 2 = x 2 ,K , X k = x k ) = N n y sus medias y varianzas valen E ( X i ) = µi = npi
14/17
Var ( X i ) = σi2 =
N −n np (1 − pi ) N −1 i
Cov( X i , X j ) = σij = − donde p i =
N −n npi p j N −1
i≠ j
Ni . N
Vemos que las covarianzas son negativas, al igual que sucedía con la distribución multinomial. De manera totalmente análoga a la expuesta en el punto anterior, podemos aproximar esta distribución por una binomial, bajo las siguientes condiciones: 1) N→∞ Ni 2) = p i = cte. N 3) n = cte. y la aproximación de la distribución hipergeométrica multivariante por una multinomial se debe al hecho de que en esas condiciones se verifica N1 N 2 N k K x1 x 2 x k N n
→
n! p1x1 p2x2 K p kx k x1 ! x2 !K x k !
8.4. Distribución Geométrica o de Pascal. Supongamos que realizamos un experimento y estamos interesados en la ocurrencia o no de un determinado suceso A. Supongamos también, al igual que hacíamos en la distribución binomial, que realizamos repeticiones del experimento de forma que estas repeticiones son independientes, y que en cada una de las repeticiones las probabilidades de A, p, y de su complementario A , 1–p, permanecen constantes. En esta situación, repetimos el experimento hasta que ocurre A por primera vez. Podemos definir la variable aleatoria X=
número de repeticiones del experimento necesarias para que tenga lugar la primera ocurrencia de A
la cual, diremos, tiene una distribución Geométrica o de Pascal de parámetro p. Tengamos en cuenta que aquí nos separamos de las hipótesis mantenidas para la distribución binomial. Allí el número de repeticiones era predeterminado, mientras que aquí es una variable aleatoria. Tenemos que X=k siempre que en las k–1 repeticiones anteriores no haya sucedido A. Entonces, la función de probabilidad es f ( x ) = pq k −1
para k = 1,2,3, K
15/17
PROP Si la variable aleatoria X tiene una distribución geométrica, entonces su media y su varianza vienen determinadas por E( X ) =
1 p
Var ( X ) =
q p2
Dem. d∑qk d (q ) p p 1 = p d q = E ( X ) = ∑ kpqk −1 = p∑ =p k = 2 = 2 dq dq dq 1 − q (1 − q ) p p k k k
y de forma análoga, con la derivada segunda respecto de q podemos razonar para obtener la varianza a través de la esperanza de X(X–1) Var ( X ) = E[ X ( X − 1) ] + E ( X ) − E ( X ) 2 =
q p2
8.5. Distribución Binomial Negativa. Esta distribución es una generalización de la anterior. Para obtenerla, y bajo las mismas condiciones que para la distribución geométrica, supongamos que un experimento se repite hasta que un suceso particular A se repite r veces. Sea la variable aleatoria X = número de repeticiones necesarias para que A suceda exactamente r veces. Esta distribución recibe el nombre de Distribución Binomial Negativa de Parámetros r y p. Es evidente que para r=1 obtenemos la distribución geométrica de parámetro p. El suceso X=K ocurre si y sólo si el suceso A ocurre en la k-ésima repetición, verificándose que A ya sucedió r-1 veces en los k-1 experimentos anteriores. Por ello, la probabilidad de este suceso es k − 1 r k − r P( X = k ) = p q para k = r, r+1, ... r −1 PROP La media y la varianza de una distribución binomial negativa son E( X ) =
r p
Var ( X ) =
rq p2
Dem. Para comprobarlo, definamos las siguientes variables aleatorias. Z1 =
Nº de repeticiones necesarias hasta la primera ocurrencia de A
16/17
Z2 = ....... Zr =
Nº de repeticiones necesarias desde la primera ocurrencia de A hasta incluir la segunda ocurrencia de A. Nº de repeticiones necesarias desde la ocurrencia r–1 de A hasta incluir la résima ocurrencia de A.
Todas las Zi son variables aleatorias independientes, teniendo cada una de ellas una distribución geométrica de parámetro p. Además, la variable aleatoria X es suma de todas ellas. Por tanto E ( X ) = E (Z 1 + Z 2 + K + Z r ) = E ( Z1 ) + E( Z 2 ) + K + E ( Z r ) =
1 1 1 r + +K+ = p p p p
de manera análoga, tomando varianzas Var ( X ) = Var ( Z 1 + Z 2 + K + Z r ) = Var ( Z1 ) + Var ( Z 2 ) + K + Var ( Z r ) =
rq p2
BIBLIOGRAFÍA RECOMENDADA. Estadística Teórica. Aut. J.M.Doblado y M.C. Nieto. Edit. UNED Introducción a la Estadística Teórica. Aut.: G Arnáiz. Edit.: Lex Nova Estadística Teórica y Aplicada. Aut.: A. Nortes. Edit.: S. Rodríguez. Introducción a la Probabilidad y la Medida (I). Aut.: P Zoroa y N. Zoroa. Edit.: Maior DM. Introducción a la Teoría de la Estadística. Aut.: Mood, Graybill. Edit.: Aguilar.
17/17
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 66 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE CONTINUA. CARACTERÍSTICAS Y TRATAMIENTO. LA DISTRIBUCIÓN NORMAL. APLICACIONES. 1. 2. 3. 4. 5. 6. 7.
Variables Aleatorias Continuas. Distribuciones Multivariantes. Distribuciones Acumulativas. Distribuciones Marginales. Distribuciones Condicionales. Distribución Uniforme. Distribución Normal. 7.1. Aproximación de las Distribuciones Binomial y Poisson a la Normal. 8. Otras Distribuciones. 8.1. Distribución Gamma. 8.2. Distribución Exponencial. 8.3. Distribución Weibull. 8.4. Distribución χ2 de Pearson Bibliografía Recomendada.
1/17
TEMA 66 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE CONTINUA. CARACTERÍSTICAS Y TRATAMIENTO. LA DISTRIBUCIÓN NORMAL. APLICACIONES. 1. VARIABLES ALEATORIAS CONTINUAS. En el caso de variables discretas es posible asociar una probabilidad finita a cada punto (elemento) del conjunto muestral, aunque el número de puntos (elementos) que lo compongan sea infinito (numerable). La suma de todas las probabilidades será la unidad. En el caso de una variable continua esto no es posible. Las probabilidades no sumarán uno, a menos que prácticamente a todos sus puntos (todos menos un conjunto numerable) les asignemos probabilidad cero. La solución a este problema que se plantea es considerar intervalos en lugar de puntos. DEF Diremos que X es una Variable Aleatoria Continua (Unidimensional) si existe una función f(x) que verifica 1) f(x) ≥ 0 2)
∫
+∞
−∞
∀x∈3
f ( x ) dx = 1
y tal que para cualquier suceso A
P( A) = P ( X ∈ A) = ∫ f ( x ) dx A
La función f(x) recibe el nombre de función de densidad. A partir de ahora consideraremos que las variables aleatorias continuas tienen función de densidad también continua, salvo, a lo sumo, en un número finito de puntos. Definamos A como A={x : a
P( A) = P (a < X < b) = ∫ f ( x ) dx = ∫ f ( x )dx A
a
Veamos algunas propiedades que verifican las variables aleatorias continuas. 1) Debido a que la integral anterior tiene el mismo valor independientemente de si los puntos a y/o b pertenecen al intervalo, tenemos que se verifica P(a
2/17
a
P( X = a ) = ∫ f ( x) dx = 0 a
3) Si A no es un intervalo sino la unión disjunta de un número finito de intervalos A = A1 ∪A2 ∪...∪An con Ai∩Aj=∅ ∀i≠j
y Ai={x : ai
se verifica que P( A) = P ( A1 ∪ A2 ∪ K ∪ An ) = ∫ f ( x ) dx = A
b1
b2
bn
a1
a2
an
∫ f (x )dx + ∫ f (x )dx + K + ∫ f ( x)dx = A1
A2
An
= ∫ f ( x ) dx + ∫ f ( x )dx + K + ∫ f ( x )dx Esta propiedad establece que la probabilidad de que el valor de una variable aleatoria pertenezca a un conjunto A es el área comprendida entre f(x) y el eje x sobre el conjunto. Así se justifica la segunda condición de las funciones de densidad, donde en el caso de que el suceso A sea toda la recta real su probabilidad (según el axioma P2) debe ser la unidad. Cualquier función f puede servir como función de densidad de una variable aleatoria continua siempre que verifique las dos condiciones dadas en la definición anterior. Es claro que en un problema particular, se elegirá como función de densidad aquella que, para todo a y b (a
P( a < X < b ) = ∫ f ( x ) dx a
represente la probabilidad de que el valor de la variable aleatoria X se halle comprendido entre a y b. cualquier función positiva en un dominio elegido arbitrariamente puede considerarse como una función de densidad de una variable aleatoria, siempre que la función esté multiplicada por una constante que haga que su integral, en todo su dominio, sea 1. Así, por ejemplo 0 x≤ 2 2x + 3 f (x ) = 2< x<4 18 x≥ 4 0 es una función de densidad, ya que
∫
+∞
−∞
2
f ( x ) dx = ∫ 0 dx + ∫ −∞
4
2
+∞ 2x + 3 dx + ∫ 0 dx = 0 + 1 + 0 = 1 4 18
3/17
2. DISTRIBUCIONES MULTIVARIANTES. DEF Diremos que X e Y son variables aleatorias continuas distribuidas conjuntamente si existe una función f tal que f( x,y)≥0 ∀X,Y∈3 y tal que para cualquier suceso A P( A) = P (( X , Y ) ∈ A) = ∫ f ( x, y )dxdy A
Vemos que es necesario que 1) f(x,y)≥0 ∀X,Y∈3 2)
+∞ +∞
∫ ∫
−∞ −∞
f ( x, y )dydx = 1
La función f recibe el nombre de Función de Densidad de las variables aleatorias X e Y. En el caso de k variables aleatorias continuas, la definición de distribución conjunta es análoga. Ejemplo. Definamos la función de distribución siguiente 1 f ( x, y ) = 8 (6 − x − y ) 0 < x < 2 2 < y < 4 0 en otro caso Triviamente podemos comprobar que verifica las dos condiciones para ser función de densidad. Si X e Y son dos variables aleatorias que tienen esta densidad, la probabilidad de que estén en la región X<1 y Y<3 sería: 1
P( X < 1, Y < 3) = ∫
∫
3
−∞ − ∞
f ( x, y )dydx = ∫
1
∫
3
0 2
6− x− y 3 dydx = 8 8
La probabilidad de que X+Y sea inferior a 3 es P( X + Y < 3) = ∫
1 3− x
∫
0 2
6−x−y 5 dydx = 8 24
La probabilidad de que X<1 cuando se sabe que Y<3 es P( X < 1 | Y < 3) =
P( X < 1, Y < 3) P(Y < 3)
el numerador ya lo conocemos, veamos el valor del denominador. 4/17
P(Y < 3) = ∫
2
0
∫
3
2
6−x−y 5 dydx = 8 8
Y entonces 3 P( X < 1, Y < 3) 8 3 P( X < 1 | Y < 3) = = = 5 5 P(Y < 3) 8 3. DISTRIBUCIONES ACUMULATIVAS. Puesto que en el caso de variables continuas las probabilidades vienen dadas por integrales, resulta a menudo conveniente considerar las integrales de las densidades con preferencia a las densidades mismas. DEF Dada f(x) función de densidad de una variable aleatoria X, definimos la función F(x), llamada función de distribución Acumulativa, como F ( x) = P( X ≤ x) = ∫
x
−∞
f (t ) dt
PROP Si F(x) es una función de distribución acumulativa, verifica las siguientes propiedades: 1) 2) 3) 4)
F es una función no decreciente. F(–∞) = 0 F(+∞) = 1 F es continua. Dem. La demostración es inmediata.
La función de densidad, si existe, puede hallarse a partir de la función de distribución acumulativa derivando F en los puntos donde tiene derivada. Es decir, f (x ) =
dF ( x) dx
La probabilidad de que X esté en un cierto intervalo a
x
∫
y
−∞ −∞
5/17
f (t 1 , t 2 )dt 2 dt 1
siendo f(x,y) la función de densidad. Dada la función de distribución acumulativa F(x,y), podemos hallar la función de densidad derivando F respecto de cada una de sus variables, en el supuesto, claro está, de que las derivadas existan. f ( x, y ) =
∂ ∂ F (x , y ) ∂x ∂y
La probabilidad de que (X,Y) esté en un rectángulo cualquiera a1 < X < b1 a2 < Y < b2 podemos escribirla mediante la función acumulativa como P( a1 < X < b1 , a2 < Y < b2 ) = P( X < b1 , Y < b2 ) − P( X < a1 , Y < b2 ) − − P( X < b1 , Y < a 2 ) + P( X < a1 , Y < a2 ) = = F (b1 , b2 ) − F ( a1 , b2 ) − F (b1 , a 2 ) + F ( a1 , a 2 ) Estas distribuciones pueden complicarse mucho cuando se trata de más de dos variables aleatorias. De hecho, muchos problemas importantes de estadística permanecen sin resolver por la excesiva complicación de las integrales que hay que resolver. 4. DISTRIBUCIONES MARGINALES. Cada distribución de más de una variable tiene asociadas varias distribuciones marginales. Sea f(x,y) la función de densidad correspondiente a dos variables aleatorias continuas. Puede ocurrir que sólo nos interese una de las variables, por ejemplo X. Buscaremos entonces una función que al integrarla sobre un intervalo a
b
a
∫
+∞
−∞
f ( x, y) dydx
Cualquiera que sea la especificación de X, los límites de integración de Y son toda la recta real, de modo que podemos definir una función como DEF
Llamamos Función de Densidad Marginal con respecto a X a f1 (x ) = ∫
+∞
−∞
f ( x, y )dy
ya que, para cualquier par de valores a y b se verifica que b
P( a < X < b ) = ∫ f 1 ( x) dx a
6/17
De forma análoga podemos definir DEF
Llamamos Función de Densidad Marginal con respecto a Y a f 2 ( y) = ∫
+∞
−∞
f ( x, y )dx
ya que, para cualquier par de valores a y b se verifica que b
P( a < Y < b) = ∫ f 2 ( y ) dy a
La función de distribución marginal acumulativa se encuentra fácilmente a partir de la función de distribución acumulativa. Para dos variables, esta función acumulativa marginal es F1 ( x ) = ∫
x
∫
+∞
−∞ −∞
x
f ( x, y )dydx = ∫ f 1 ( x ) dx = F ( x ,+∞) −∞
Igualmente, de forma análoga obtenemos F2 ( y) = ∫
y
∫
+∞
−∞ −∞
f ( x , y ) dxdy = ∫
y
f 2 ( y ) dy = F ( +∞, y )
−∞
5. DISTRIBUCIONES CONDICIONALES. Sea una función de densidad de dos variables aleatorias X e Y, f(x,y). Buscamos una función f(x|y) que nos dé la densidad de X cuando conozcamos Y. Es decir, una función tal que b
P( a < X < b | Y ) = ∫ f ( x | y ) dx a
para valores cualesquiera a y b. DEF
Definimos la función de densidad condicional f( x|y) como f ( x | y) =
DEF
f ( x, y) f 2 ( y)
con
f 2 ( y) > 0
Definimos la función de densidad condicional f( y|x) como f ( y | x) =
f (x , y ) f 1 ( x)
con
f 1 ( x) > 0
La función de densidad f( x|y) es una función de densidad de la variable X, siendo Y un parámetro que tendrá un valor numérico determinado para cada función de densidad condicional dada. Por tanto, la función f2 (c) debe considerarse como una constante. La función de densidad conjunta f(x,y) está representada por una superficie en el plano XY. Un plano perpendicular a XY, que corte a éste según la recta y=c, cortará a la superficie según la curva f(x,c). El área limitada por esta curva es
7/17
∫
+∞
−∞
f ( x , c) dx = f 2 ( c)
Por tanto, si dividimos f(x,c) por f2 (c), obtenemos una función de densidad que es precisamente f(x|c) Las distribuciones condicionales se definen de manera análoga para las distribuciones con varias variables. Así, para cinco variables aleatorias que tengan como función de densidad f(x1 , x2 , x3 , x4 , x5 ), la función de densidad condicional de X1 , X3 , X5 para valores dados de X2 y X4 es f ( x1 , x 2 , x 3 , x 4 , x 5 ) f 24 ( x 2 , x 4 )
f ( x1 , x 3 , x 5 | x 2 , x 4 ) =
6. DISTRIBUCIÓN UNIFORME. Comenzaremos el estudio de las distribuciones continuas con la más elemental de todas ellas. DEF Diremos que una variable aleatoria X es uniforme en el intervalo (a,b) cuando su función de densidad de probabilidades es constante en él. Es decir 1 f (x ) = b − a 0
a< x
Su función de distribución vendrá dada por 0 x− a F ( x) = b − a 1
x≤a a < x
Los parámetros de la distribución son los extremos del intervalo a y b. Estos parámetros verifican las desigualdades − ∞ < a < b < +∞ La media y la varianza de la distribución uniforme son µ=
a+b 2
σ2 =
(b − a) 2 12
7. DISTRIBUCIÓN NORMAL. Pieza clave en el estudio de la Estadística la constituye la distribución normal. Muchas distribuciones de frecuencias tienen aspectos parecidos, aunque describen fenómenos muy diferentes: pesos y alturas de una gran población, errores de medida, 8/17
etc. Se apunta de esta manera el concepto de distribución normal. La dificultad de realizar un cálculo rápido de áreas bajo la curva normal, así como la imposibilidad de obtenerlas para todos los valores posibles de µ y σ, nos conduce a buscar transformaciones que obvien esta dificultad. DEF Diremos que una variable aleatoria X que toma todos los valores reales tiene una distribución normal si su función de densidad de probabilidades es de la forma − 1 f (x ) = e σ 2π
( x − µ )2 2σ 2
− ∞ < x < +∞
Sus parámetros fundamentales son su media (µ) que puede tomar cualquier valor real, y su varianza (σ2 ) que debe ser positiva. Examinando la primera y segunda derivada de la función de densidad, podemos realizar un estudio de la misma, destacando las siguientes propiedades, que no vamos a demostrar por su sencillez. PROP La moda de la distribución (máximo de la función de densidad) se alcanza en x=µ. PROP La curva es simétrica respecto de un eje vertical que pasa por x= µ. PROP La curva tiene sus puntos de inflexión en
x = µ ± σ.
PROP Los valores de la media, la moda y la mediana coinciden. PROP El eje de abscisas (y=0) es la asíntota horizontal de la curva (por ambos lados). PROP El área comprendida entre la curva y el eje horizontal es 1. Vamos a obtener ahora los valores de la media y la varianza de esta distribución. PROP La Media y la Varianza de la distribución normal son µ y σ2 , respectivamente. Dem. 1 E ( X ) = ∫ xf ( x )dx = −∞ σ 2π +∞
Haciendo el cambio de variable x−µ σ dx = σ dz z=
obtenemos
9/17
∫
+∞
−∞
x·e
−
(x−µ )2 2σ 2
dx
1 E( X ) = 2π
∫
+∞
−∞
( µ + σz ) e
−
z2 2
µ dz = 2π
∫
+∞
−∞
e
z2 2
−
σ dz + 2π
∫
+∞
−∞
ze
−
z2 2
dz = µ
Analizando las dos integrales en las que ha quedado descompuesto la original, tenemos que la primera es µ multiplicada por una integral cuyo valor es 1 y la segunda es una integral impar en un dominio simétrico, siendo su resultado 0. La varianza de la distribución normal viene dada por 1 E ( X − µ) = σ 2π
[
2
]
∫
+∞
−∞
2
( x − µ) e
−
(x−µ )2 2σ 2
dx
y haciendo de nuevo el cambio de variable x−µ σ dx = σ dz z=
obtenemos σ2 E ( X − µ) = 2π
[
2
]
∫
+∞
−∞
2
z e
−
z2 2
dz
Aplicando ahora la integración por partes con u=z v = −e
−
du = dz
z2
dv = ze
2
−
z2 2
dz
llegamos a +∞ z2 z2 − +∞ − σ2 2 2 E ( X − µ) = − ze + ∫−∞ e dz = σ 2 ( 0 + 1) = σ 2 2π −∞
[
2
]
La curva de una distribución de probabilidad continua o función de densidad de probabilidad, se traza de manera que bajo la curva limitada por las abscisas x=x1 y x=x2 , es igual a la probabilidad de que la variable aleatoria X tome valores comprendidos entre x1 y x2 . Así tenemos 1 P( x1 < X < x 2 ) = σ 2π
∫
x2
x1
e
−
( x−µ)2 2σ 2
dx
x−µ nos proporciona valores de una distribución normal σ de media 0 y varianza 1, N(0,1). Veámoslo La transformación z =
1 P( x1 < X < x 2 ) = σ 2π
∫
x2
x1
e
−
(x−µ)2 2σ 2
1 dx = 2π
10/17
∫
z2
z1
e
−
z2 2
dz = P (z 1 < Z < z 2 )
donde se observa que Z es una variable aleatoria normal de media 0 y varianza 1. A la variable aleatoria que posee estas características se la denomina variable aleatoria normal estándar o tipificada y a su función de distribución, igualmente normal estándar. Supongamos que X tiene una distribución N(0,1), entonces 1 P( a < X < b) = 2π
∫
b
a
e
−
z2 2
dz
Esta integral no puede evaluarse por métodos ordinarios. Por ello, debemos acudir a los métodos de integración numérica. La función de distribución de la normal estandarizada o tipificada es 2 1 s − z2 Φ(s) = e dz 2π ∫−∞ Esta función se encuentra recogida en tablas. Para el cálculo de la probabilidad de que la variable aleatoria X esté en el intervalo (a,b), teniendo X una distribución normal N(0,1), haremos uso de las tablas. P( a < X < b) = Φ (b) − Φ ( a) La importancia de esta tabulación radica en que si X es una variable aleatoria con distribución normal cualquiera N(µ,σ2 ), la probabilidad anterior puede calcularse realizando la transformación x−µ z= σ con lo cual tipificamos la variable aleatoria X y a continuación utilizamos la tabulación mencionada. Es decir b − µ a−µ b − µ a − µ P( a < X < b ) = P
11/17
X −µ P( µ − kσ < X < µ + kσ) = P − k < < k = Φ ( k ) − Φ ( −k ) = 2Φ ( k ) − 1 σ Expresión en la que podemos observar que la probabilidad anterior es independiente de µ y σ, y que ésta sólo depende de k. 7.1. Aproximación de las Distribuciones Binomial y Poisson a la Normal. Las probabilidades asociadas a experimentos binomiales, cuando n es pequeña, se obtienen con facilidad mediante la fórmula B(x;n,p) (ya vista en el tema anterior). Para valores grandes de n, por lo general las probabilidades binomiales se calculan con procedimientos de aproximación. Si X es una variable aleatoria binomial de parámetros n y p, entonces, si n es grande y ni p ni q son próximos a cero, podemos considerar que X sigue una distribución normal N(np, npq). Esta propiedad la conocemos como TEOREMA. Teorema de De Moivre. Si X tiene una distribución binomial de parámetros n y p, entonces la variable aleatoria tipificada X − np Z= npq tiende a una distribución normal estándar N(0,1) cuando n→∞. OBS En general, podemos considerar como buena aproximación cuando n>25 y npq>5. Debemos resaltar que estamos aproximando una distribución discreta por una continua, por tanto, resulta necesario establecer una corrección por continuidad. Se ha encontrado que la siguiente corrección para continuidad mejora la proximidad anterior. 1 1 P( X = k ) ≡ P k − ≤ X ≤ k + 2 2 1 1 P( a < X < b) ≡ P a + ≤ X ≤ b − 2 2 1 1 P( a < X ≤ b) ≡ P a + ≤ X ≤ b + 2 2 1 1 P( a ≤ X < b) ≡ P a − ≤ X ≤ b − 2 2 1 1 P( a ≤ X ≤ b) ≡ P a − ≤ X ≤ b + 2 2 donde k, a y b son números enteros. De la misma manera que se ha establecido una aproximación de la distribución binomial a la normal, podemos establecer una aproximación de la distribución de Poisson a la normal. 12/17
Sea X una variable aleatoria de Poisson P(λ) con λ grande, en la práctica λ>25. En estas condiciones, la variable tipificada X −λ Z= λ tiene aproximadamente una distribución normal estándar N(0,1) y, por tanto, podemos considerar que X sigue aproximadamente una distribución N(λ,λ). Aquí también será conveniente tener en cuenta la corrección por continuidad similar a la efectuada para la distribución binomial. 8. OTRAS DISTRIBUCIONES. Como la distribución Normal no resuelve todos los problemas, tenemos que recurrir a otras distribuciones para resolver determinados problemas en los campos de la ingeniería y de la ciencia, como son la distribución Gamma, Exponencial, Wiebull y χ2 . 8.1. Distribución Gamma. DEF
Definimos la función Gamma como ∞
Γ(α) = ∫ x α −1 e − x dx 0
α> 0
Integrando por partes con u = x α −1 dv = e − x dx se obtiene la fórmula de recurrencia Γ(α) = (α − 1)·Γ(α − 1) En particular, Γ(1)=1 y si α=n, siendo n un número positivo, la recurrencia anterior conduce a que Γ( n) = ( n − 1)! Algunas expresiones útiles para la función gamma son PROP La Función Gamma verifica 1) Fórmula de los complementos:
Γ(α) Γ(1 − α) =
1 2) Γ = π 2
13/17
π con 0<α<1 sen απ
DEF Diremos que la variable aleatoria X tiene una Distribución Gamma, con parámetros α y β, si su función de densidad viene dada por α −1 − βx x e f ( x; α, β) = α β Γ(α) 0
x > 0, α > 0, β > 0 en el
resto
donde α se conoce como parámetro de forma y β como parámetro de escala. Cuando α es entero positivo, la distribución Gamma también se conoce con el nombre de Distribución de Erlang, en honor al científico danés que la utilizó por primera vez en el año 1900. PROP La media y la varianza de la distribución gamma son Var ( X ) = αβ 2
E ( X ) = αβ Dem.
En efecto, el r-ésimo momento en torno al cero vale µ1' = β
Γ(α + 1) αΓ(α) =β = αβ = E ( X ) Γ(α) Γ(α)
Y para la varianza tenemos µ2' = β 2
Γ(α + 2) (α + 1)αΓ(α) = β2 = (α + 1)αβ Γ(α) Γ(α)
Var ( X ) = E ( X 2 ) − [E ( X ) ]2 = µ2' − µ1'2 = α(α + 1) β − αβ = αβ 2 8.2. Distribución Exponencial. Si particularizamos la distribución Gamma para α=1 obtenemos: − βx e f ( x; β) = β 0
x > 0, β > 0 en el
resto
que es la función de densidad de una variable aleatoria X con distribución exponencial. Esta función exponencial se caracteriza por el parámetro β, que representa el lapso promedio de tiempo que transcurre entre dos sucesos independientes de Poisson. Es decir, la distribución exponencial puede modelar el tiempo transcurrido entre dos sucesos consecutivos de Poisson (llegadas o prestaciones de servicios).
14/17
Su función de distribución es F ( x; b) = P( X ≤ x) = 1 − e
−
x β
PROP La media y la varianza de la función exponencial son E( X ) = β
Var ( X ) = β 2
Dem. Basta tomar α=1 en la media y varianza de Gamma para obtener los resultados. 8.3. Distribución de Weibull. La distribución de Weibull fue establecida por el físico suizo del que lleva su nombre y al igual que la distribución exponencial, su función fundamental es en el estudio de la fiabilidad. DEF Diremos que una variable aleatoria X tiene una distribución de Weibull si su función de densidad de probabilidad es de la forma α x − αx α −1 e β f ( x; α, β) = βα 0
x > 0, α > 0, β > 0 en el
resto
La distribución de Weibull es una familia de distribuciones que dependen de dos parámetros, el de forma, α, y el de escala, β. Podemos introducir un parámetro adicional reemplazando la variable aleatoria de Weibull X, por X–a, donde a es un parámetro de localización, que representa un valor umbral de tiempo de garantía. PROP La media y la varianza de la distribución Weibull son 1 E ( X ) = βΓ 1 + α
2 1 Var ( X ) = β 2 Γ1 + − Γ 2 1 + α α
Dem. El r-ésimo momento en torno al cero de una variable aleatoria que sigue una distribución de Weibull es r µr ' = β r Γ1 + α con lo cual 1 µ1 ' = βΓ1 + = E( X ) α y para la varianza tenemos
15/17
2
2 1 Var ( X ) = E ( X ) − [E ( X ) ] = µ2 '−µ' = β Γ 1 + − βΓ1 + = α α 2
2
2 1
2
2 1 = β 2 Γ1 + − Γ 2 1 + α α 8.4. Distribución χ 2 de Pearson. Sean X1 , X2 , ..., Xn n variables aleatorias N(0,1) independientes entre sí. La variable Y = X 12 + X 22 + K + X n2 recibe el nombre de χ2 de Pearson con n grados de libertad y se denota por χn2 . Por estar formada la variable aleatoria Y por suma de cuadrados resulta positiva, además su función de densidad de probabilidad es n2 −1 − 2x x e n f ( x; n) = 2 n 2 Γ 2 0
x>0 en el
resto
Una propiedad importante de la χn2 es que la suma de varias de ellas que sean independientes nos da como resultado otra cuyo número de grados de libertad es la suma de los grados de libertad de éstas. PROP La media y la varianza de una distribución χn2 es E(X) = n
Var(X) = 2n
Dem. El r-ésimo momento en torno al cero es n n Γ + 1 Γ 2 = 2n 2 = n = E ( X ) µ1 ' = β 2 n n Γ Γ 2 2 y para la varianza n n Γ + 2 Γ 2 = 4 n + 1 n 2 = n 2 + 2n µ2 ' = 4 2 n 2 Γ n Γ 2 2 Var ( X ) = E ( X 2 ) − [E ( X ) ]2 = µ2 '−µ'12 = n 2 + 2n − n 2 = 2n
16/17
Integrando por partes, desde 2λ hasta +∞, la función de densidad de una distribución χ con n=2(r+1) grados de libertad, se obtiene la siguiente relación entre las probabilidades de una χ2 con un número par de grados de libertad y las de una distribución de Poisson 2
−
x
c xce 2 λr e − λ P(χ22( c+1 ) > 2λ) = ∫ dx = = P(Ρ( λ) ≤ c ) ∑ 2 λ 2 c +1 c! r! r =0 donde se ha tenido en cuenta que para c entero es Γ(c+1)=c!. En ciertas ocasiones suele utilizarse esta relación para calcular probabilidades de Poisson +∞
BIBLIOGRAFÍA RECOMENDADA. Estadística Teórica. Aut. J.M.Doblado y M.C. Nieto. Edit. UNED Introducción a la Estadística Teórica. Aut.: G Arnáiz. Edit.: Lex Nova Estadística Teórica y Aplicada. Aut.: A. Nortes. Edit.: S. Rodríguez. Introducción a la Probabilidad y la Medida (I). Aut.: P Zoroa y N. Zoroa. Edit.: Maior DM. Introducción a la Teoría de la Estadística. Aut.: Mood, Graybill. Edit.: Aguilar.
17/17
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 67 INFERENCIA ESTADÍSTICA. TEST DE HIPÓTESIS. 1. Intervalos confidenciales. 2. Intervalos confidenciales para la media de una distribución normal. 3. Intervalos confidenciales para la varianza de una distribución normal. 4. Región confidencial para la media y la varianza de una distribución normal. 5. Intervalos confidenciales para el parámetro de una distribución binomial. 6. Intervalos confidenciales múltiples. 7. Intervalos confidenciales para muestras grandes. 8. Intervalos confidenciales múltiples. 9. Introducción al contraste de hipótesis. 10. Contraste de una hipótesis simple contra una alternativa simple. 11. Hipótesis compuestas. 12. Contraste de è è1 contra è>è1 para densidades con un parámetro único è. Bibliografía Recomendada.
1/28
TEMA 67 INFERENCIA ESTADÍSTICA. TEST DE HIPÓTESIS. 1. INTERVALOS CONFIDENCIALES. La estimación puntual de un parámetro no resulta de mucho valor si no se posee alguna medida del posible error cometido en la estimación. Toda estimación θˆ de un parámetro θ debería acompañarse de cierto intervalo que incluyera a θˆ , por ejemplo, de la forma (θˆ -d, θˆ +d), junto con alguna medida de seguridad de que el parámetro verdadero θ fuera interior a dicho intervalo. A menudo las estimaciones se dan de esta manera. Así la carga electrónica puede estimarse que vale (4,770 ± 0,005)10 −10 unidades electrostáticas, dándose a entender con ello que es muy poco probable que el primer factor sea exterior al intervalo 4,765 a 4,775. Un contable que se ocupe de los costes de una editorial, y que quiera tener en cuenta todos los factores que intervienen en le coste de producción de cierto libro (costes efectivos de producción, proporción de sostenimiento, proporción de sueldos directos, etc.), podrá estimar el coste en 83 ± 4,5 centavos por volumen, lo que significa que es muy probable que el coste correcto esté comprendido entre 78,5 y 87,5 centavos por volumen. La Oficina de Estadística del Trabajo puede estimar el número de parados en un momento dado en 2,4 ± 0,3 millones, teniendo bastante seguridad en que el número verdadero está comprendido entre 2,1 y 2,7 millones. A fin de precisar a estas ideas, consideremos un caso particular. Supongamos una muestra (1,2; 3,4; 0,6; 5,6) de cuatro observaciones, extraída de una población normal de media desconocida µ y desviación estándar conocida 3. La estimación máximoverosímil de µ es la media de las observaciones maestrales, x = 2,7 Queremos determinar los límites superior e inferior entre los cuales queda comprendido, con bastante seguridad, el valor verdadero del parámetro. En general, para muestras de tamaño cuatro, procedentes de la distribución dada, la cantidad y=
x−µ 3 2
tendrá una distribución normal con media cero y varianza unidad; x es la media muestral, y 3/2 es σ / n . Por tanto, la cantidad γ tiene por función de densidad f ( y) =
1 − 12 y 2 e 2π
(3)
que es independiente del valor verdadero del parámetro desconocido, y se podrá calcular la probabilidad de que γ esté situado entre dos números elegidos arbitrariamente. Así, por ejemplo, 2/28
1 ,96
P( −1,96 < y < 1,96) = ∫−1, 96 f ( y )dy = 0,95
(4)
En esta relación, la desigualdad -1,96< γ , o bien − 1,96 <
x−µ 3/ 2
(5)
equivale a la desigualdad µ < x + 3 / 2(1,96) = x + 2,94 y la desigualdad γ < 1,96 es equivalente a µ > x − 2,96 cabe por tanto, volver a escribir (4) en la forma P( x − 2,94 < µ < x + 2,94) = 0,95
(6)
P( −0, 24 < µ < 5,64) = 0,95
(7)
y sustituyendo x por 2,7
Podemos decir que estos límites obtenidos, -0,24 y 5,64, contendrán el valor del parámetro verdadero, con una seguridad del 95%. Debe examinarse cuidadosamente el significado de (6) y (7). La probabilidad de que el intervalo aleatorio x -2,94 a x +2,94 cubra a la media verdadera µ es 0,95. Esto es, si se extraen repetidamente de la población muestras de tamaño 4, y si se calcula para cada muestra el intervalo aleatorio x -2,94 a x +2,94, es de esperar que le 95% de estos intervalos contengan la media verdadera µ. Tenemos, pues, una gran confianza en que el intervalo -0,24 a 5,64 cubra la media verdadera. La medida de nuestra confianza es 0,95, porque antes de extraer la muestra, la probabilidad de que el intervalo que intentamos construir cubra la media verdadera es 0,95. El intervalo -0,24 a 5,64 recibe el nombre de intervalo confidencial o, más concretamente, intervalo confidencial del 95%; la probabilidad, en este caso 0,95, se denomina coeficiente confidencial o coeficiente de confianza. Es posible obtener intervalos con cualquier grado de confianza que se desee. Así, puesto que P( −2,58 < y < 2,58) = 0,99 (8)
3/28
se obtiene un intervalo confidencial del 99% para la media verdadera considerando las desigualdades como antes, y sustituyendo x =2,7, con lo que resulta P( −1,17 < µ < 6,57) = 0,99
(9)
Debe observarse que hay muchos intervalos posibles con la misma probabilidad. Así , por ejemplo, ya que P( −1,68 < y < 2,70) = 0,95 (10) tenemos otro intervalo confidencial del 95% para µ, dado por P( −1,35 < µ < 5,22) = 0,95
(11)
Este intervalo es inferior al de antes obtenido, ya que su longitud 6,57 es superior a la longitud 5,88 del intervalo dado en (7), por lo que procura una información menos precisa sobre la situación de µ. Dos números cualesquiera a y b, tales que las ordenadas que les corresponden incluyan el 95%. En general, se desea que el intervalo confidencial sea lo más pequeño posible; esto se logra haciendo que a y b estén tan próximos como sea posible, ya que la relación P(a < γ < b)=0,95 da lugar a un intervalo confidencial de longitud (σ / n ) (b-a). La distancia (b-a) se hace mínima para un área dada cuando f(a) = f(b), como se ve claramente en la figura 1. si el punto b se desplaza un poco hacia la izquierda, el a deberá moverse una distancia menor hacia la izquierda, a fin de que el área siga siendo la misma; esta operación disminuye la longitud del intervalo y continua dis minuyéndola mientras f(b) < f(a). Como en este ejemplo f(y) es simétrica respecto a y = 0, el valor mínimo de b – a, para un valor prefijado del área, corresponde a b = -a. Por tanto, (7) da el intervalo confidencial más corto del 95%, y (9) da el intervalo confidencial más corto del 99%, ambos para el parámetro µ. En muchos problemas no es posible construir los intervalos confidenciales más cortos para un coeficiente de confianza dado. En estos casos, resultará deseable hallara un intervalo confidencial que tenga las más corta longitud esperada, o que sea tal que haga mínima la probabilidad de que el intervalo confidencial cubra un valor µ*, donde µ* ≠ µ.
Fig. 1
El método general que aquí exponemos es el siguiente. Se halla, si es posible, una función de las observaciones muestrales y del parámetro a estimar (la función y anterior), cuya distribución sea independiente del parámetro y de otros parámetros 4/28
cualesquiera. Entonces, cualquier afirmación probabilística de la forma P(a < y < b) = y. en donde γ es la función, dará lugar a una afirmación probabilística relativa al parámetro. Esta técnica es aplicable en muchos problemas importantes, pero hay también otros muchos en los que no puede aplicarse, por ser imposible hallar funciones de la forma deseada y cuya distribución no dependa de parámetros. Estos últimos problemas se abordan mediante una técnica más general que describiremos en la sección 5. La idea de la estimación por intervalos puede generalizarse de modo que incluya la estimación simultánea de varios parámetros. Así, los dos parámetros de la distribución normal se estiman mediante una cierta región plana R, en el llamado espacio paramétrico, espacio de todas las combinaciones posibles de los valores de µ y σ 2 . Una región confidencial del 95% es una región que se puede construir a partir de la muestra, de tal forma que, si se extraen muestras repetidamente, construyendo una región para cada una de ellas, el 95% (por término medio) de estas regiones incluirán el punto paramétrico verdadero ( µ0 , σ02 ) . (véase figura 2) Los intervalos y regiones confidenciales ilustran adecuadamente acera ce la incertidumbre de las inferencias. En (7) se hizo la inferencia de que el intervalo -0,24 a5,64 cubre el valor verdadero del parámetro, pero no se estableció de forma categórica. La medida 0,05 de la incertidumbre de esta inferencia constituye parte esencial de la afirmación.
Fig. 2
2. INTERVALOS CONFIDENCIALES DISTRIBUCIÓN NORMAL.
PARA
LA
MEDIA
DE
UNA
El método utilizado en la sección anterior no suele ser de posible utilización para estimar la media de una población normal, pues lo corriente es que se desconozca la varianza σ 2 . La función γ toma la forma (para muestras de tamaño n) y=
x−µ σ/ n
y transformando las desigualdades:
5/28
(1)
P( −1,96 < y < 1,96) = 0,95
(2)
σ σ P x − 1,96 < µ < x + 1,96 = 0,95 n n
(3)
se tiene
Para una muestra dada se conocen x y n, pero no σ , de modo que no será posible calcular límites para µ. Claro es que puede sustituirse σ por una estimación σˆ ; pero entonces la afirmación probabilística ya no sería exacta, y para muestras pequeñas podría ser muy errónea. W. S. Gossett (que utilizó el seudónimo de Student) indicó el camino para resolver esta dificultad en una publicación clásica en que introdujo la distribución t. Se le considera como fundador de la teoría de la inferencia estadística exacta. La cantidad t=
x−µ
∑ (x
i
(4)
− x ) 2 / n( n − 1)
comprende solo el parámetro µ y tiene la distribución t con n -1 grados de libertad, sin incluir parámetros desconocidos. Por tanto, será posible hallar un número t 0 , 05 tal que P( −t 0 , 05 < t < t 0 ,05 ) =
∫
t 0, 05
−t 0 ,05
f ( t ; n − 1) dt = 0,90
(5)
convirtiendo después las desigualdades para obtener P x − t 0 , 05
∑ (x
i
− x) 2
n( n − 1)
< µ < x + t 0 ,05
− x) 2 = 0,90 (6) n( n − 1)
∑(x
i
donde los limites se calculan para cada muestra dada, obteniendo así un intervalo confidencial del 90%.
Fig. 3
El número t 0 , 05 recibe el nombre de nivel del 5% de t, y sitúa a los puntos que separa un 5% del área limitada por f(t) en cada rama de la curva. Cabe obtener otros intervalos confidenciales, empleando distintos niveles de t. Así, se puede hallar un
6/28
intervalo confidencial del 98% usando el número t 0 , 01 , que separa 0,01 del área en cada rama de la distribución. (véase fig. 3) En este ejemplo la longitud del intervalo confidencial es w = x + t 0 , 05
∑(x
i
− x) 2
n( n − 1)
− x + t 0 , 05
∑(x
i
− x )2
n (n − 1)
= 2t 0 , 05
∑ (x
i
− x )2
n( n − 1)
La longitud es una variable aleatoria, ya que es función de las variables aleatorias x i . Es también función del tamaño n de la muestra en que se basa el intervalo confidencial. Si este es muy amplio, quizá resulta poco útil aunque sea alta la probabilidad de que cubra al parámetro desconocido. Así, es preciso que el tamaño n de la muestra sea suficientemente grande para que siendo la probabilidad alta, la longitud resulte lo bastante pequeña para ser útil. 3. INTERVALOS CONFIDENCIALES PARA LA VARIAN ZA DE UNA DISTRIBUCIÓN NORMAL. Para muestras de tamaño n de una población normal la cantidad
∑ (x u=
i
− x) 2
(1)
σ2
donde x es la media muestral, tiene la distribución ji cuadrado con n – 1 grados de libertad. Por tanto, puede construirse un intervalo confidencial con coeficiente confidencial gamma, hallando dos números a y b tales que b
P( a < u < b) = ∫ f ( χ 2 ) dχ2 = γ a
(2)
Transformando las desigualdades, obtenemos ∑ ( xi − x )2 P < σ2 < b
∑ (x
2 − x) =γ a i
que proporciona un intervalo confidencial para σ 2 .
Fig. 5
Puesto que la longitud de este es 7/28
(3)
1 1 ( x x) 2 − ∑ i − a b
(4)
el intervalo confidencial más pequeño para una muestra dada se obtendría eligiendo a de modo que [(1/a)-(1/b)] resultase mínimo para el valor elegido de γ . El cálculo necesario resulta muy laborioso. Las tablas ordinarias de la distribución ji cuadrado proporcionan números χ 2 tales que ∞
P(u > χe2 ) = ∫ 2 f ( χ 2 ) dχ2 =∈ χe
(5)
para valores elegidos de ∈. Al construir, por ejemplo, un intervalo confidencial del 95%, se suele elegir a = χ02, 975 y b = χ02, 025 , esto es, se eligen a y b de modo que quede separado 0,025 del área en cada rama de la distribución. Esto da aproximadamente la longitud mínima del intervalo confidencial, a menos que el número de grados de libertad sea muy pequeño (véase fig. 5). 4. REGIÓN CONFIDENCIAL PARA LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN NORMAL. Al construir una región para la distribución conjunta de la media µ0 y la varianza 2 0
µ
de una distribución normal, cabría inclinarse a primera vista a utilizar las
estimaciones individuales dadas por las distribuciones t y χ 2 . Así, por ejemplo, podría construirse una región 0,9025 ( = 0,952 ), como en la figura 6, haciendo uso de las dos relaciones: ( xi − x )2 ( xi − x )2 ∑ ∑ = 0,95 (1) P x − t 0 , 025 < µ0 < x + t 0 , 025 n( n − 1) n( n − 1) ∑ ( xi − x ) 2 P < σ02 < 2 χ0 , 025
− x )2 = 0,95 χ02, 975
∑(x
i
(2)
y suponiendo que la probabilidad de los dos sucesos fuera el producto de las dos probabilidades de cada uno. Esto no es correcto, puesto que las distribuciones de t y χ 2
8/28
Fig. 6
no son independientes. La probabilidad conjunta de que ambos parámetros cubran los valores del parámetro verdadero no es igual al producto de las probabilidades correspondientes. Por tanto, la probabilidad de que la región rectangular de la figura 6 cubra al punto paramétrico verdadero ( µ0 ,σ 02 ) no es 0,9025. Sin embargo es posible construir una región confidencial utilizando las distribuciones de x y ∑ ( x i − x ) 2 , que son independientes. Si, por ejemplo, se desea una región confidencial del 95%, pueden hallarse números a, a’ y b’ tales que x − µ0 P − a < < a = 0,95 ≅ 0,975 σ0 / n P a ' <
− x)2
∑(x
i
2 0
σ
< b ' = 0,95
(3)
(4)
La probabilidad conjunta es x − µ0 P − a < < a, a' < σ0 / n
∑ (x
i
− x) 2
σ02
< b' = 0,95
(5)
debido a la independencia de las distribuciones. Las cuatro desigualdades de (5) determinan una región en el espacio paramétrico, fácil de determinar trazando las líneas que la limitan.
Fig. 7
9/28
Basta reemplazar los signos de desigualdad por otros de igualdad y representar cada una de las cuatro relaciones resultantes como funciones de µ y σ 2 en el espacio paramétrico. Resultará así una región como la que aparece rayada en la figura 7. Exactamente del mismo modo se obtendría una región confidencial para ( µ0 ,σ0 ); la relaciones se representarían como funciones de σ en lugar de σ 2 , y la parábola de la figura 7 se transformaría en un par de rectas µ= x ±
aσ n
que se cortarían en x sobre el eje de las µ. La región que hemos construido no es la de área mínima, pero se construye fácilmente a partir de las tablas y difiere poco de la región de área mínima, a menos que sea pequeño el tamaño de la muestra. La región mínima es, aproximadamente, de forma elíptica y difícil de construir. 5. MÉTODO GENERAL CONFIDENCIALES.
PARA
LA OBTENCIÓN
DE
INTERVALOS
El método utilizado en las secciones anteriores para la determinación de intervalos y regiones confidenciales obliga a encontrar funciones de la muestra y de los parámetros, distribuidas independientemente de estos. No obstante, es posible establecer intervalos confidenciales sin tener en cuenta la existencia previa de tales funciones. Dada una población por f(x ; θ) y un estimador ( x1 , x2 ,..., x n ) para muestras de tamaño n (generalmente, se usará el estimador de máxima verosimilitud), determinaremos la distribución del estimador, que vendrá dada por g( θˆ ;θ). Supongamos, para fijar ideas, que se desea un intervalo confidencial del 95%. Si se sustituye θ , en g( θˆ ;θ), por el número arbitrario θ’, la distribución de θˆ quedará completamente especificada, y será posible dar enunciados probabilísticos relativos a θˆ . En particular, será posible hallar dos números h1 y h2 tales que
(
)
−∞
(
)
−∞
h1 P θˆ < h1 = ∫ g (θˆ; θ' ) dθˆ = 0,025 h2 P θˆ > h2 = ∫ g (θˆ;θ ' ) dθˆ = 0,025
(1) (2)
Claro es que los números h1 y h2 dependerán del número que sustituye a θˆ en g( θˆ ;θ). En efecto, h1 y h2 son ciertas funciones de θ, esto es h1 (θ) y h2 (θ). Los valores de estas funciones para cualquier valor de θ vienen determinados por las dos ecuaciones anteriores. Evidentemente,
[
]
h 2 (θ ) P h1 (θ ) < θˆ < h2 (θ) = ∫ g (θˆ; θ )dθˆ = 0,95 h1 (θ )
10/28
(3)
Las funciones h1 ( θ) y h2 (θ) pueden representarse en función de θ, como se ha hecho en la figura 8. Trazando una vertical por cualquier valor θ’ de θ, esta cortará a ambas curvas en puntos que, proyectados sobre el eje de las θˆ , darán limites entre los cuales caerá θˆ , con probabilidad de 0,95. Construidas las dos curvas θˆ = h1 ( θ) y θˆ = h2 ( θ), cabe obtener un intervalo confidencial para θ del siguiente modo: Se extrae una muestra de tamaño n y se calcula el valor del estimador θˆ ’. La horizontal trazada por el punto θˆ ’ del eje θˆ (fig. 8) cortará a ambas curvas en puntos que pueden proyectarse sobre el eje θ y que llamaremos θ1 y θ2 , según se indica en la figura. Estos dos números definen el intervalo confidencial, pues se ve fácilmente que P(θ2 < θ < θ1 ) = 0,95
(4)
Supongamos que estuviésemos extrayendo muestras de una población en que el valor de θ fuese θ’. La probabilidad de que la estimación θˆ quede comprendida entre h1 ( θ’) y h2 (θ’) es 0,95. Si la estimación cae entre estos dos limites, dicho horizontal cortará a la vertical trazada por θ’ en cierto punto situado entre las curvas, y el intervalo correspondiente ( θ2 , θ1 ) cubrirá a θ’. Se deduce, por tanto, que la probabilidad de que un intervalo (θ2 , θ1 ), construido por este método, cubra a θ’, es exactamente 0,95. Esta afirmación es cierta cualquiera que sea el valor de θ en la población. A veces, es posible determinar los límites θ2 y θ1 para una estimación dada, si necesidad de hallar efectivamente las funciones h1 ( θ) y h2 ( θ).
Fig. 8
Con referencia a la fig 8, los limites para θ son los puntos θ2 y θ1 , tales que h1 ( θ1 ) = θˆ ’ y h2 ( θ2 )=θˆ ’. Basándonos en la definición de h1 y h2 , diremos que θ1 es el valor de θ para el cual θˆ '
∫
−∞
g (θˆ; θ )dθˆ = 0,025
y θ2 es el valor de θ para el cual
11/28
(5)
∫
∞
θˆ'
g (θˆ; θ) dθˆ = 0,025
(6)
Si es posible expresar los primeros miembros de estas dos ecuaciones explícitamente en función de θ, y si las ecuaciones pueden resolverse unívocamente respecto a θ, las raíces son los límites confidenciales del 95%, para θ. Si h1 (θ) y h2 (θ) no son funciones monótonas de θ, el intervalo confidencial puede ser, en realidad, un conjunto de intervalos. Así, por ejemplo, supongamos que las curvas de la figura 8 se inclinaran mas hacia la derecha de modo que la horizontal trazada por θ’ volviera a cortarlas, por ejemplo, en los puntos θ3 y θ4 . El intervalo confidencial consistiría en dos intervalos (θ2 , θ1 ) y (θ3 , θ4 ). La afirmación sobre θ sería de la forma P(θ2 < θ < θ1 , ó,θ3 < θ < θ4 ) = 0,95 (7) Sin embargo, en la mayoría de las situaciones que se plantean en la práctica habrá un intervalo único, o será posible elegir un intervalo único basándose en otros datos disponibles relativos al experimento que dio lugar a las observaciones maestrales. El método aquí descrito para la obtención de intervalos confidenciales se extiende al caso de varios parámetros; pero la representación geométrica ya no es posible, ni siquiera para dos parámetros. Supongamos una distribución que dependa de dos parámetros θ1 y θ2 ; podemos hallar una región plana R en el plano θˆ1 , θˆ2 tal que
(
) ∫ ∫ g (θˆ , θˆ ;θ , θ )dθˆ dθˆ
P θˆ1 , θˆ2 enR =
1
2
1
2
1
2
= 0,95
(8)
R
Considerando todos los pares posibles de valores θ1 y θ2 limitaremos una región cuatridimensional en el espacio, θ1 , θ2 , θˆ1 , θˆ2 , que es análo ga a la región bidimensional entre las curvas de la figura 8. Supongamos ahora que se extrae una muestra y se calculan las estimaciones θˆ1 ’ yθˆ2 ’. La intersección de los dos hiperplanos θˆ1 = θˆ1 ’ y θˆ2 = θˆ2 ’ con la región cuatridimensional determinará una región bidimensional que, proyectada sobre el plano θ1 , θ2 , será una región confidencial del 95% para θ1 , θ2 .
Fig. 9
12/28
Este razonamiento se generaliza para abarcar el caso de K parámetros. El método determinará una región confidencial para todos los parámetros de una distribución. Si se desea estimar algunos, pero no todos los parámetros de un conjunto de ellos, dicho método no podrá usarse en general, pero en determinadas circunstancias si puede modificarse para adaptarse al problema en cuestión. Por ahora, no hay solución general del problema de construir regiones confidenciales para una parte del conjunto de K parámetros de una función de distribución, excepto en el caso de muestras grandes. 6. INTERVALOS CONFIDENCIALES PARA EL PARÁMETRO DE UNA DISTRIBUCIÓN BINOMIAL. Aplicaremos el método general descrito en la sección precedente a un problema que exige su empleo. Si una muestra x1 , x2 ,..., x n procede de una población binomial con f ( x; p ) = p x (1 − p) 1− x
x = 0,1; 0 ≤ p ≤ 1
(1)
el estimador máximo-verosímil de p es pˆ =
y n
(2)
en donde y = ∑ xi puede tomar los valores 0, 1, 2, …, n. La distribución de pˆ viene dada por n g ( pˆ ; p ) = p npˆ (1 − p ) n (1− pˆ ) npˆ
1 2 pˆ = 0, , ,...,1 n n
(3)
y no es posible hallar una función de pˆ y p, cuya distribución sea independiente de p. Volveremos a suponer, para fijar ideas, que el intervalo confidencial a construir es del 95%. El primer paso consiste en determinar las funciones h1 ( p ) y h2 ( p) . Así, para p = 0,4, y de acuerdo con la sección anterior, buscaríamos un número h1 ( 0,4) , tal que nh1 n ˆ P[ p < h1 (0,4) ] = ∑ (0,4) y ( 0,6) n − y = 0,025 (4) y =0 y No obstante, por tratarse de una distribución discreta, nh1 deberá ser un entero, y será imposible lograr que la suma valga exactamente 0,025 para todo valor de p. Sin embargo, no nos preocuparemos por esto, ya que no necesitamos una curva h1 ( p ) definida para todo valor de p. Los únicos puntos de interés son los que corresponden a valores posibles de pˆ . En efecto, es posible utilizar la técnica indicada por las ecuaciones (5-5) y (5-6), por disponerse inmediatamente de una expresión explicita por las probabilidades que figuran en el primer miembro de dichas ecuaciones. Suponiendo que tenemos una estimación pˆ ' =
k n
(5)
13/28
puede determinarse el límite superior confidencial de p1 , del 95%, hallando el valor de p para el cual k n y p (1 − p) n − y = 0,025 (6) ∑ y =0 y siendo el límite inferior p 2 el valor de p para el cual n
n
∑ y p
y
(1 − p) n − y = 0,025
(7)
y=k
Si es k = 0, se toma cero como límite inferior, y si k = n, se toma 1 como límite superior. Para valores pequeños de n, las ecuaciones (6) y (7) pueden resolverse por tanteos, a fin de obtener las raíces p1 y p 2 ; pero este cálculo se hace más prolijo a medida que aumenta n. Un método sencillo consiste en utilizar las tablas de Pearson para la función beta incompleta. La forma acumulativa de la distribución beta es F ( x; α, β) =
(α + β + 1)! x α t (1 − t ) β dt ∫ 0 α! β!
(8)
y por integración reiterada por partes se obtiene α α + β + 1 i F ( x; α, β) = −∑ x (1 − x) α + β +1− i + 1 i i =0
(9)
Se deduce que las sumas binomiales parciales vienen dadas por la tabla de F(x; αβ ). Podemos escribir la ecuación (6) del siguiente modo: k
n
∑ y p
y
( y − p ) n − y = 1 − F ( p; k , n − k − 1) = 0,025
(10)
y =0
hallando inmediatamente en la tabla el valor de p que corresponde a F =0,975 para los valores dados de k y n – k -1. Análogamente, puesto que k −1 n n y n− y p ( 1 − p ) = 1 − ∑k y ∑0 y p y (1 − p )n − y n
se obtendrá el límite confidencial inferior escribiendo (7) en la forma k
n
∑ y p
y
(1 − p ) n − y =F ( p; k − 1, n − k ) = 0,025
(11)
n
Para valores de n que excedan de los tabulados, puede emplearse la aproximación normal a la distribución binomial, y obtener intervalos confidenciales de p, tal como se
14/28
indica en la sección siguiente, o bien utilizar las Tables of the Binomial Probability Distribution (National Boreau of Standards, Applied Mathematics Series 6, Washington DC, 1950). 7. INTERVALOS CONFIDENCIALES PARA MUESTRAS GRANDES. Para muestras grandes, el estimulador θˆ máximo-verosímil para el parámetro θ de una distribución dada por f(x; θ) tiene, bajo condiciones bastante generales, una distribución aproximadamente normal respecto de θ. Cuando se satisfacen tales condiciones, se obtienen fácilmente intervalos confidenciales aproximados. La varianza del estimulador en las muestras grandes es σ 2 (θ) =
−1 nE ∂ log f ( x; θ) / ∂θ 2
[
2
]
(1)
en donde σ 2 (θ) indica que es una función de θ, porque ordinariamente dependerá de este parámetro. Para muestras grandes, por tanto, puede determinarse un intervalo confidencial con probabilidad γ , convirtiendo las desigualdades en θˆ − θ P − d γ < < dγ σ ( θ )
≅ 2γ
(2)
en donde d γ se ha elegido de modo que
∫
dγ
−d λ
1 − 12 t 2 e dt = 2γ 2π
8. INTERVALOS CONFIDENCIALES MÚLTIPLES. En la secciones anteriores hemos indicado que la interpretación frecuencialprobabilística de los intervalos confidenciales es la siguiente: En repetidos muestreos, 100(1- α )% de los intervalos confidenciales construidos contendrán el parámetro desconocido θ, donde 1 - α es el coeficiente confidencial. Para ilustrar esta interpretación con mayor precisión, supongamos que se extrae una muestra aleatoria de tamaño k de cada una de 3 poblaciones normales de medias µ1 , µ2 y µ3 , respectivamente y varianza común σ 2 . Construiremos un intervalo confidencial del 95% para µ1 - µ2 , µ2 - µ3 y µ1 - µ3 . Para hallar un intervalo confidencial para µ1 - µ2 tenemos en cuenta que x - µ1 es normal, con media 0 y varianza σ 2 /k; y - µ2 es normal con media 0 y varianza σ 2 /k; y - µ2 y x - µ1 son independientes luego w = ( x - µ1 ) – ( y - µ2 ) = ( x - y ) – ( µ1 - µ2 )
15/28
es normal con media 0 y varianza 2 σ 2 /k y , por tanto, w 2σ 2 / k es también normal, con media 0 y varianza 1. Si hacemos s12 =
1 ( xi − x ) 2 ∑ k −1
s 22 =
1 ( yi − y ) 2 ∑ k −1
s32 =
1 ( zi − z) 2 ∑ k −1
entonces 3( k − 1) s 2 ( k − 1) s12 + ( k − 1) s 22 + ( k − 1) s32 = σ2 σ2
(2)
se distribuye según una ji cuadrado con 3k -3 grados de libertad, y s2 es independiente de w. Por tanto, w( k σ) w k t= = 2s σ s 2 se distribuye según una t de Student con 3(k -1) grados de libertad. Un intervalo confidencial del 95% para µ1 - µ2 es 2s 2 2s 2 P ( x − y ) − t 0 ,025 < µ1 − µ2 < ( x − y ) + t 0 ,025 k k
= 0,95
(3)
Por un proceso semejante se deduce que un intervalo confidencial del 95% para µ1 µ3 es 2s 2 2s 2 P ( x − z ) − t 0 ,025 < µ1 − µ3 < ( x − z ) + t 0 , 025 k k
= 0,95
(4)
y, análogamente, un intervalo confidencial del 95% para µ2 - µ3 es 2s 2 2s 2 P ( y − z ) − t 0 , 025 < µ2 − µ3 < ( y − z ) + t 0 , 025 k k
= 0,95
(5)
Si se toman repetidos conjuntos de observaciones (1), y se calcula (3) para cada conjunto de 3k observaciones, entonces, para un número grande de repeticiones, el 95% de los intervalos confidenciales cubrirán a µ1 - µ2 .
16/28
Si para cada conjunto de 3k observaciones se calcula el intervalo confidencial (4), para un número grande de repeticiones el 95% de estos intervalos cubrirán a µ1 - µ3 . Análogamente, si para cada conjunto se calcula el intervalo confidencial (5), en un número grande de repeticiones, el 95% de los intervalos contendrán a µ2 - µ3 . Deseamos calcular intervalos confidenciales para µ1 - µ2 , µ1 - µ3 y µ2 - µ3 , tales que la probabilidad de que los tres intervalos confidenciales resulten simultáneamente verdaderos sea, por ejemplo, el 95%. Si los tres intervalos dados por (3) a (5) fuesen independientes, en un número grande de repeticiones, para el (0,95)3 de los conjuntos, (3) cubriría a µ1 - µ2 , (4) cubriría a µ1 - µ3 , y (5) cubriría a µ2 - µ3 . Sin embargo, puesto que (3), (4) y (5) no son independientes, esta probabilidad no es (0,95)3 . Para resolver este problema definiremos el coeficiente confidencial experimentativo. Un conjunto de observaciones tales como (1) recibirá el nombre de experimento; puede haber t poblaciones en lugar de 3. En cada experimento, se calculan interva los confidenciales para las t(t-1) diferencias µi - µ j . Si en el 95% de los experimentos la totalidad de los t(t-1) intervalos confidenciales cubren a sus diferencias respectivas ( µi - µ j ), diremos que el coeficiente confidencial experimentativo es 0,95. Enunciaremos el siguiente teorema aunque no daremos su demostración. Teorema. Sea v1 , v2 ,..., vn una muestra aleatoria de tamaño n de una población normal de media 0 y varianza σ 2 , y designaremos por R el recorrido de estas variables aleatorias; es decir, R = máx v i -mín v i . Supongamos que vs 2 / σ 2 es independiente de las v i y esta distribuida según una ji cuadrado con v grados de libertad. La variable aleatoria q=
R s
se distribuye como el recorrido studentizado, con n y v grados de libertad en el numerador y en el denominador, respectivamente. La función frecuencial de q es bastante complicada y no se dará aquí, pero la cantidad qα , definida por P(q< qα )=1-α , puede obtenerse en para varios valores de n, v y α = 0,01, 0,05 y 0,10. Para ilustrar como puede emplearse este teorema, hallaremos un conjunto de intervalos confidenciales con un coeficiente confidencial experimentativo del 0,95. Consideremos las variables aleatorias (nos limitaremos al caso especial de 3) 3( k − 1) s 2 , u1 , u 2 , u 3 σ2 en donde s2 está dada por (2), y u1 , u 2 , u3 son los estadísticos ordinales de las tres variables aleatorias v1 , v2 , v3 con
17/28
v1 = ( x − µ1 ) k
v 2 = ( y − µ2 ) k v 3 = ( z − µ3 ) k
Puesto que las v i son variables normales independientes, de medias 0 y varianzas σ , y dado que 3(k -1)s2 / σ 2 es una variable de ji cuadrado independiente, con v = 3(k -1) g. de l., utilizaremos el teorema 1 para demostrar que q se distribuye como el recorrido studentizado, con n =3 g. de l. en el numerador y v =3(k -1) g. de l. en el denominador, siendo 2
q=
R u 3 − u1 max vi − min v i = = s s s
También u − u1 1 − α = P( q < qα ) = P 3 < qα = s max v i − min v i = P < qα = s = P(max vi − min vi < sq α )
(6)
Pero si max vi − min vi < s qα , se tienen las tres desigualdades siguientes: ( x − µ1 ) − ( y − µ2 ) <
sq α k
( x − µ1 ) − ( z − µ3 ) <
sqα k
( y − µ2 ) − ( z − µ3 ) <
sqα k
y
lo que implica −
sqα sq < ( x − y ) − ( µ1 − µ2 ) < α k k
−
sqα sq < ( x − z ) − ( µ1 − µ3 ) < α k k
−
sqα sq < ( y − z ) − ( µ2 − µ3 ) < α k k
(7)
Si utilizamos (7) con (6), la probabilidad de que las seis desigualdades (8) sean verdaderas es 1 - α :
18/28
( x − y) −
sqα sq < µ1 − µ2 < ( x − y ) + α k k
(y − x) −
sqα sq < µ2 − µ1 < ( y − x ) + α k k
( x − z) −
sq α sq < µ1 − µ3 < ( x − z ) + α k k
( z − x) −
sq α sq < µ3 − µ1 < ( z − x ) + α k k
(y − z) −
sqα sq < µ2 − µ3 < ( y − z ) + α k k
( z − y) −
sqα sq < µ3 − µ2 < ( z − y ) + α k k
En el caso de haber más de tres poblaciones, serían válidas las mismas fórmulas, salvo que variarían los grados de libertad para qα y que existirían t(t-1) intervalos confidenciales. 9. INTRODUCCIÓN AL CONTRASTE DE HIPÓTESIS. La inferencia estadística comprende dos partes principales, a saber: la estimación de parámetros y los contrastes de hipótesis. En este capítulo estudiaremos la segunda de ellas, con el objetivo de desarrollar métodos generales para los contrastes de hipótesis y su aplicación a algunos problemas corrientes. Estos métodos también se utilizarán en capítulos posteriores. En la investigación experimental se pretende a veces simplemente estimar un parámetro; por ejemplo, puede que interese estimar la producción de un nuevo híbrido de maíz. Muchas veces, el objetivo final es la utilización de dicha estimación. Así ocurre cuando se quiere comparar la producción del nuevo híbrido con la correspondiente a una variedad conocida, a fin de recomendar la sustitución de esta por aquel, en caso de que parezca superior. Esto sucede corrientemente en la investigación; puede ocurrir que interese determinar si un método nuevo para cerrar lámparas aumenta la vida de éstas; si un nuevo germicida resulta más efectivo en el tratamiento de cierta infección; si un método de conservación de alimentos es preferible a otros, en lo que se refiere a la conservación de vitaminas, etc. Utilizando como ejemplo el caso de las lámparas, supongamos que la vida media de las fabricadas por medio de un proceso conocido es de 1400 h. Se desea contrastar un nuevo procedimiento para la fabricación de lámparas. En este caso, el modelo estadístico es el siguiente: se trata de dos poblaciones de lámparas, la constituida por las correspondientes al proceso que se propone. Sabemos (en virtud de numerosas investigaciones anteriormente realizadas) que la media de la primera población es
19/28
aproximadamente 1400. Se desea averiguar si la media de la segunda población es superior o inferior a 1400. Tradicionalmente, para resolver este problema, se establece la hipótesis de que una medida es mayor que la otra. Basándose en una muestra de las poblaciones se aceptará o rechazará la hipótesis. (Naturalmente, se confía en que el nuevo proceso es mejor y que la hipótesis será rechazada). Para contrastar la hipótesis se fabrica cierto número de lámparas mediante el nuevo procedimiento, midiendo después su duració n. Supongamos que la media de esta muestra de observaciones es de 1550 h. Esto parece indicar que el nuevo proceso es mejor; pero supongamos que la estimación de la desviación estándar de la media es δ / n , igual a 125 (siendo n el tamaño de la muestra). Por tanto, el intervalo confidencial del 95% para la media de la segunda población (suponiendo la población normal) es aproximadamente de 1300 h a 1800 h. La media muestral 1550 podría proceder fácilmente de una población cuya media fuese 1400. No tenemos, pues, motivos suficientes para rechazar la hipótesis. Por otra parte, si δ / n fuese igual a 25, podríamos rechazar la hipótesis con gran confianza y afirmar la superioridad del nuevo proceso de fabricación. Se ve, pues, que los contrastes de hipótesis está relacionada íntimamente con el problema de la estimación. No obstante resulta instructivo desarrollar la teoría de los contrastes independientemente de la de la estimación al menos en principio. Los contrastes de hipótesis puede integrarse en la estructura del problema general de decisión de la siguiente forma: existen dos acciones finales posibles, a1 y a2 . La acción apropiada a tomar depende del valor del parámetro desconocido θ, llamado algunas veces estado de la naturaleza, que es un elemento del espacio paramétrico Ω . El conjunto Ω puede descomponerse en dos conjuntos, ϖ1 y ϖ2 , tales que se elige la acción a1 si θ pertenece a ϖ1 , y la acción a2 si θ pertenece a ϖ 2 . La pérdida asociada a la acción a y al estado de la naturaleza θ viene dada por l ( a; θ) , donde l ( a; θ) ≥ 0 y l ( a1 ;θ ) = 0 l(a 2 ;θ) = 0
Si θ está en ϖ1 Si θ está en ϖ2
(1)
Sea s = ( x1 , x 2 ,..., x n ) una muestra aleatoria procedente de f ( x; θ ) , y S, el espacio muestral n-dimensional. Una estrategia (función de decisión) es una función d que asigna a cada posible muestra una acción de A, donde A = {a : a = a1 o a 2 } . La acción que se toma es a = d ( x1 , x2 ,..., xn ) En este problema en el que existen sólo dos acciones, cada estrategia d (función de decisión) puede representarse por una partición del espacio muestral n-dimensional en dos conjuntos disjuntos, S1 y S2 , siendo
20/28
S 2 = S 1 = S − S1 tales que se toma la acción a1 si el punto muestral s cae en S1 , y la a2 si s cae en S2 . El riesgo (pérdida esperada) correspondiente a la estrategia d está dado por R( d ; θ) = l ( a1 ; θ) P( s ∈ S1 θ) + l ( a2 ;θ ) P( s ∈ S 2 θ)
(2)
donde P( s ∈ S 1 θ) denota la probabilidad de que el punto muestral s caiga en S1 cuando el valor del parámetro (estado de la naturaleza) es θ, y análogamente para P( s ∈ S 2 θ) . Puesto que se toma la acción a1 si s cae en S1 y la a2 si cae en S2 , las probabilidades en la ecuación anterior son las correspondientes a adoptar las acciones a1 y a2 , respectivamente, cuando θ es el estado de la naturaleza. Se denominan probabilidades de acción. DEF Sea S un espacio muestral n-dimensional, y S1 y S2 , una partición del espacio muestral, tal que si un punto muestral s = ( x1 , x 2 ,..., x n ) cae en S1 , se toma la acción a1 , y si s cae en S2 se adopta la acción a2 . Las siguientes probabilidades se denominan probabilidades de acción: P( s ∈ S 1 θ)
P( s ∈ S 2 θ)
donde P( s ∈ S i θ) es la probabilidad de que s caiga en Si (probabilidad de que se tome la acción ai ) cuando el verdadero estado de la naturaleza es θ. Si en la ecuación (2) calculamos el riesgo cuando θ pertenece a ϖ1 , el cual designaremos por R( d ; θ∈ ϖ1 ) , se obtiene: R( d ; θ ∈ ϖ1 ) = l ( a1 ;θ ∈ ϖ1 ) P( s ∈ S1 θ ∈ ϖ1 ) +l (a 2 ; θ ∈ ϖ1 ) P( s ∈ S 2 θ ∈ ϖ1 )
(3)
Utilizando la ecuación (1), resulta R( d ; θ ∈ ϖ1 ) = l ( a 2 ; θ ∈ ϖ1 ) P ( s ∈ S 2 θ ∈ ϖ1 )
(4)
Por un procedimiento análogo, calcularemos el riesgo cuando θ está en ϖ 2 , obteniendo R( d ; θ ∈ ϖ2 ) = l ( a1 ;θ ∈ ϖ2 ) P( s ∈ S1 θ ∈ ϖ 2 ) (5) Es decir, puesto que una de las dos pérdidas l ( a1 ; θ ) y l ( a 2 ; θ ) es igual a 0, escribiremos el riesgo en la ecuación (2) en la forma R( d ; θ ) = l (θ )ε( d ; θ)
(6)
donde
21/28
l (θ) = l (a1 ; θ) = 0 Si θ está en ϖ 2 l ( a 2 ; θ ) = 0 Si θ está en ϖ1
(7)
siendo l (θ) la perdida asociada con la acción incorrecta cuando el estado de la naturaleza es θ, y ε( d ;θ ) en la ecuación (6), es la probabilidad de error definida a continuación. DEF Probabilidades de error.- La probabilidad de error, designada por ε( d ;θ ) en la ecuación (6), es la probabilidad de adoptar la acción incorrecta. Es decir, es la probabilidad de tomar la acción a1 si θ está en ϖ 2 , o bien tomar la acción a2 si θ está en ϖ1 . Si θ ∈ ϖ1 , esta probabilidad se expresará así: ε1 ( d ; θ) = P[( x1 ,..., xn ) ∈ S 2 θ ∈ ϖ1 ] = P( s ∈ S 2 θ ∈ ϖ1 ) que es la correspondiente a tomar la acción a2 erróneamente; y si θ ∈ ϖ2 , la probabilidad de error puede escribirse: ε2 ( d ; θ) = P[( x1 ,..., x n ) ∈ S1 θ ∈ ϖ2 ] = P( s ∈ S1 θ ∈ ϖ2 ) que es la probabilidad de adoptar la acción a1 erróneamente. DEF Contrastes de hipótesis.- Los conjuntos ϖ 1 y ϖ 2 en la formulación anterior del problema de decisión pueden asociarse a la hipótesis o afirmación H1 : “θ está en ϖ1 ” y a la hipótesis alternativa H2 : “ θ está en ϖ 2 ”, respectivamente. La acción a1 consiste en aceptar la hipótesis (aceptar H1 ) y la acción a2 en rechazar la hipótesis (rechazar H1 ). La función de decisión d que, aplicada a los datos, conduce a la aceptación o rechazo de la hipótesis se denomina contraste de la hipótesis. El objetivo es encontrar el contraste (la función de decisión d) que hace mínimo el riesgo para cada valor de θ en Ω . Sin embargo, esto no es generalmente posible, sino que una función de decisión puede dar un riesgo mínimo para ciertos valores de θ, mientras que otra función de decisión puede hacer mínimo el riesgo para otros valores de θ, etc. Por tanto, puesto que θ es desconocido, hay que contar con la posibilidad de que no exista un método definido para determinar qué función da riesgo mínimo en un problema particular. Otra dificultad inherente a la utilización de las ecuaciones (4) y (5) se debe a que en gran parte de los problemas de aplicación, donde un experimentador desea utilizar contrastes de hipótesis, la función de pérdida es totalmente desconocida, o bien no se conoce con la función acuracidad para garantizar su empleo. Si la función de pérdida no es conocida, parece que un procedimiento razonable consistirá en utilizar una función de decisión que, en cierto sentido minimice las probabilidades de error. El procedimiento tradicional es elegir una probabilidad α , usualmente en el entorno de 0,01, 0,05, 0,10, 0,20 y hallar la clase de funciones de decisión (o sea, determinar los conjuntos S2 ) tales que se satisfaga
22/28
P( s ∈ S 2 θ ∈ ϖ1 ) ≤ α
(8)
Entonces, de la clase de contrastes que satisfacen a (8) se considera como “mejor” contraste aquel para la cual P( s ∈ S 1 θ ∈ ϖ2 )
(9)
es mínimo. En esta formulación, la cantidad P( s ∈ S 2 θ∈ ϖ1 ) de (8) se llama probabilidad de rechazar una hipótesis verdadera (rechazar la hipótesis H1 cuando de hecho es cierta), y a veces se la denomina probabilidad de un error de tipo I, y (8) se escribe en la forma P( I ) ≤ α . La cantidad P( s ∈ S 1 θ ∈ ϖ2 ) de (9) se llama probabilidad de aceptar una hipótesis falsa (aceptar H1 cuando no es cierta), pero algunas veces se denomina también probabilidad de un error de tipo II, se escribe P(II). Obsérvese que ε1 ( d ; θ) = P ( I )
y
ε2 ( d ; θ) = P( II )
La región S2 recibe el nombre de región de rechazo o de región crítica, y S1 , región de aceptación. Si la afirmación de (8) es verdadera, se dice que la extensión de el contraste es α . En lugar de la cantidad P( s ∈ S 1 θ ∈ ϖ2 ) de (9) es a menudo más conveniente utilizar P( s ∈ S 2 θ ∈ ϖ2 ) , donde, evidentemente, 1 − P( s ∈ S1 θ ∈ ϖ 2 ) = P( s ∈ S 2 θ ∈ ϖ2 )
(10)
que es la probabilidad de rechazar la hipótesis H1 cuando de hecho es falsa. La cantidad P( s ∈ S 2 θ) se denomina potencia de el contraste, designándose por β(θ) , y es función de θ. Obsérvese que β(θ) = P(I) cuando θ ∈ϖ1 . También β(θ) = 1 – P(II) si θ ∈ ϖ2 . A primera vista puede parecer que esta formulación del problema de los contrastes de hipótesis no tiene en cuenta la función de pérdida. En realidad, no prescinde de ella completamente, puesto que llegar a un valor razonable para α requiere que el experimentador sopese al s consecuencias de cometer errores de los tipos I y II. La anterior formulación del problema ha recibido una atención preferente por parte de los estadísticos matemáticos y se emplea extensamente por los experimentadores. 10. CONTRASTE DE UNA ALTERNATIVA SIMPLE.
HIPÓTESIS
SIMPLE
CONTRA
UNA
Una hipótesis H : θ∈ ϖ se llama simple si ϖ contiene un punto único. Así, si ϖ 1 consta del punto θ1 y si ϖ 2 es el punto θ2 , el problema se denomina contrastar una hipótesis simple contra una alternativa simple. Aquí la función de riesgo para una estrategia d toma dos valores R( d ; θ1 ) = l (θ1 ) P( I )
y
R (d ;θ2 ) = l (θ2 ) P( II ) ;
23/28
por tanto, para cada función de decisión d, el riesgo R( d ; θ2 ) puede representarse por un punto en un gráfico cuyas coordenadas sean R( d ; θ1 ) y R( d ; θ2 ) . Análogamente, ε( d ;θ ) podrá representarse en un gráfico cuyas coordenadas son las probabilidades de error P(I) y P(II). Este último gráfico no implica la función de pérdida y es útil en aquellas aplicaciones donde esta función no se conoce perfectamente y P(I) y P(II) pueden utilizarse como se explicó en la sección anterior. DEF Una estrategia (función de decisión o contraste) d es admisible si no existe otra estrategia d* tal que R( d *;θ ) ≤ R( d ; θ) y R( d *;θ ) < R( d ; θ)
para todo θ de Ω para algún θ de Ω
Como se indicó anteriormente, no hay en general, una función de decisión que dé riesgo mínimo para todos los valores de θ en Ω ; por tanto, se comprende que lo más razonable consiste en hallar la clase de las funciones de decisión admisibles y seleccionar una de ellas. Para ayudar a encontrar la clase de estrategias admisibles, probaremos que toda estrategia admisible es una estrategia de Bayes, y que toda estrategia de Bayes es una contraste de la razón de verosimilitud. Por tanto, toda estrategia admisible es un contraste de la razón de verosimilitud. En consecuencia, si es posible hallar la clase de contrastes de la razón de verosimilitud, está incluirá todas las estrategias admisibles; la obtención de la clase de contrastes de la razón de verosimilitud es, frecuentemente, bastante fácil dedicaremos el resto de esta sección al desarrollo de estas ideas. Recordemos que nos limitamos a considerar una hipótesis simple y una alternativa simple. DEF Estrategia de Bayes.- Una estrategia d es una estrategia de Bayes correspondiente a probabilidades “a priori h1 y h2 = 1 − h1 ( hi ≥ 0) si hace mínimo B(d), donde B( d ) = E[R( d ; θ) ] = h1 R (d ;θ1 ) + h2 R (d ;θ2 ) Esbozaremos la demostración con el siguiente teorema. TEOREMA Para contrastar una hipótesis simple contra una alternativa simple, toda estrategia admisible es una estrategia de Bayes. Dem. En primer lugar, observamos que la estrategia de Bayes correspondiente a h1 y h2 puede representarse geométricamente dibujando la recta h1 R1 + h2 R2 = c
24/28
y desplazándola mediante la variación de c, paralelamente a sí misma, hasta que toque a T. El punto (o puntos) donde toca a T corresponde a la estrategia de Bayes. Como h1 varía desde 0 hasta 1, la pendiente de la recta lo hace, desde 0 hasta − ∞ . Una propiedad de los conjuntos convexos es que, dado cualquier punto del contorno, existe una recta que pasa por ese punto en la que se apoya el conjunto. Luego para toda estrategia admisible, es decir, para cualquier punto de contorno inferior a T, existe una recta de apoyo que pasa por dicho punto. Por tanto, puede trazarse esta recta con pendiente no positiva, y expresarse en la forma h1 R1 + h2 R2 = c donde h1 y h2 son probabilidades posibles a priori (o sea, 0 ≤ hi ≤ 1 ). Por consiguiente, la estrategia admisible es una estrategia de Bayes. El caso especial de contrastar una hipótesis simple contra una alternativa simple nos lleva a un resultado interesante; es decir, toda estrategia de Bayes es un contraste de la razón de verosimilitud. DEF Contraste de la razón de verosimilitud.- Un contraste basada en una muestra aleatoria x1 ,..., x n de la densidad f ( x; θ ) para contrastar H1 : θ = θ1 contra H 2 : θ = θ2 es un contraste de la razón de verosimilitud, si existe un número k tal que el contraste permite Aceptar H1 Rechazar H1
(acción a1 ) (acción a2 )
si λ > k si λ < k
y una de las dos acciones
si λ = k
donde ë es la razón de verosimilitud dada por λ = t ( x1 ,..., x n ) =
f ( x1 ; θ1 ) f ( x2 ;θ1 )... f ( x n ; θ1 ) f ( x1 ; θ2 ) f ( x2 ; θ2 )... f ( xn ; θ2 )
(1)
TEOREMA Para contrastara la hipótesis simple H1 : θ = θ1 contra la alternativa simple H 2 : θ = θ2 , toda estrategia de Bayes es un contraste de la razón de verosimilitud. Cabe interpretar que la razón de verosimilitud ë es una medida de cómo la evidencia confirma H1 . Así, es razonable aceptar H1 cuando ë es suficientemente grande. Obsérvese que el ser “suficientemente grande” puede depender de factores tales como las pérdidas debidas al error y el grado de confianza previa, si la hay, en la hipótesis.
25/28
11. HIPÓTESIS COMPUESTAS. En la práctica, la mayor parte de los problemas de contrastes implican hipótesis compuestas. Estas hipótesis son de la forma H1 : θ∈ ϖ1 , con la alternativa H 2 : θ ∈ ϖ2 , en donde ϖ1 y/o ϖ 2 contienen más de un elemento. En los contrastes de hipótesis compuesta la situación resulta mucho más compleja que cuando las hipótesis son simples. En el caso compuesto, los contrastes admisibles son difíciles o imposibles de obtener. En este caso, nos contentaremos, en general, con un análisis de las probabilidades de error P(I) y P(II), e intentaremos hallar contrastes que de cierta manera las controlen. TEOREMA La región crítica Rk de extensión á que hace máxima la potencia de el contraste de la hipótesis H1 : θ = θ1 , contra la alternativa H 2 : θ = θ2 donde x1 , …, xn es una muestra aleatoria de tamaño n de f ( x; θ ) , se obtiene hallando la regió n Rk (si existe) que satisface a λ = t ( x1 ,..., x n ) =
f ( x1 ;θ1 ) f ( x 2 ; θ1 )... f ( x n ; θ1 )
(2)
para un número fijo k y tal que
∫ ∫ ...∫ f (x ;θ ) f (x ;θ )... f (x Rk
1
1
2
1
n
; θ1 ) dx1 dx 2 ...dxn = α
(3)
Esto, evidentemente, constituye una aplicación de la razón de verosimilitud. A primera vista no parece claro cómo (3) implica k, pero la región en que se verifica (2) cambia al variar k, y cuando esto ocurre puede haber una región (un valor de k) que satisface a (3). Es importante insistir en que este teorema proporciona una región crítica más potente (de extensión á) para contrastar solo que è es también un único punto. El teorema no da necesariamente un método para hallar una región crítica más potente de extensión á cuando ù 1 o ù2 contienen más de un punto. Veremos más adelante que algunas veces puede utilizarse en tales situaciones, que, evidentemente, son los casos más útiles. Es decir, un experimentador puede desear contrastar que la diferencia de rendimientos medios de dos variedades de trigo es cero cont ra la alternativa de que es positiva. O un fabricante deseará quizá contrastar la hipótesis H1 : µ ≤ 0 contra la alternativa H 2 : µ > 0 , donde ì es la diferencia de eficacia media de dos medicamentos. En estos casos, ù1 o ù2 (o ambos) contienen más de un punto. Existen cuatro casos distintos: 1) 2) 3) 4)
ù 1 contiene un punto y ù2 contiene un punto. ù 1 contiene un punto y ù2 contiene más de un punto. ù 1 contiene más de un punto y ù 2 contiene un punto. ù 1 y ù2 contienen más de un punto.
26/28
En general, el lema de Neyman-Pearson se aplica únicamente al caso 1, pero veremos que algunas veces es también útil en otros casos. 12. CONTRASTE DE È È 1 CONTRA È>È1 PARA DENSIDADES CON UN PARÉMETRO ÚNICO È. En estadística aplicada existen muchas densidades que contienen un parámetro único desconocido, tales como la binomial, la de Poisson, la normal de media conocida, la normal de varianza conocida, la exponencial, etc. Muchas veces un experimentador desea contrastar la hipótesis H1 : θ ≤ θ1 con la hipótesis alternativa H 2 : θ > θ1 , siendo è1 conocido donde la densidad es f ( x; θ ) . DEF Un contraste de la hipótesis H1 : θ∈ ϖ1 , contra la alternativa H 2 : θ ∈ ϖ2 , se dice que es un contraste UMP de extensión á si su región critica R es tal que P( I ) ≤ α para todo θ de ϖ1 β(θ) = 1 − P ( II ) es máximo para cada θ de ϖ2
(1)
En la formulación de los contrastes de hipótesis dada en (12-3-1), un contraste UMP es la “mejor” contraste. A continuación daremos un teorema bastante útil para determinar un contraste UMP de H1 : θ ≤ θ1 contra la hipótesis alternativa H 2 : θ > θ1 . TEOREMA Sea x=(x1 , …, xn ) una muestra aleatoria de una densidad con un único parámetro θ en un intervalo Ω , y sea f ( x; θ ) la densidad conjunta de las variables aleatorias. Supongamos que f ( x; θ ) puede escribirse así: f ( x; ) = s(θ)U ( x) e v ( x ) t (θ )
(2)
donde t(è) es una función estrictamente creciente de θ en Ω . Si existe una constante c tal que P[v( x) > c θ1 ] = α para un á dado y comprendido entre 0 y 1, R es entonces una región crítica UMP de extensión á para contrastar H1 : θ ≤ θ1 contra H 2 : θ ≤ θ1 , donde R = {x : v( x) > c} . Si t(θ) es una función estrictamente decreciente de θ en Ω y si existe una constante c tal que P[v( x) < c θ1 ] = α para un á dado y comprendido entre 0 y 1, R es una región crítica UMP de extensión á para contrastar H 2 : θ ≤ θ1 , donde R = {x : v( x) < c} .
27/28
H1 : θ ≤ θ1 contra
BIBLIOGRAFÍA RECOMENDADA. Estadística Teórica. Aut. J.M.Doblado y M.C. Nieto. Edit. UNED Introducción a la Estadística Teórica. Aut.: G Arnáiz. Edit.: Lex Nova Estadística Teórica y Aplicada. Aut.: A. Nortes. Edit.: S. Rodríguez. Introducción a la Probabilidad y la Medida (I). Aut.: P Zoroa y N. Zoroa. Edit.: Maior DM.
28/28
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 68 APLICACIONES DE LA ESTADÍSTICA Y EL CÁLCULO DE PROBABILIDADES AL ESTUDIO Y TOMA DE DECISIONES EN PROBLEMAS DE LAS CIENCIAS SOCIALES Y DE LA NATURALEZA. EVOLUCIÓN HISTÓRICA. 1. 2. 3. 4. 5.
Introducción. Evolución Histórica de la Estadística. Evolución Histórica del Cálculo de Probabilidades. Aplicaciones a las Ciencias Sociales y Naturales. Toma de Decisiones 5.1. Hipótesis Estadísticas. 5.2. Otros Procesos de Decisión. 5.3. Predicción. Bibliografía Recomendada.
1/12
TEMA 68 APLICACIONES DE LA ESTADÍSTICA Y EL CÁLCULO DE PROBABILIDADES AL ESTUDIO Y TOMA DE DECISIONES EN PROBLEMAS DE LAS CIENCIAS SOCIALES Y DE LA NATURALEZA. EVOLUCIÓN HISTÓRICA. 1. INTRODUCCIÓN. La Estadística tiene actualmente el carácter de ciencia básica, fundamentalmente por dos motivos. El primero de ellos es que resuelve problemas de carácter básico y elemental. El segundo, es la cantidad de veces que surgen sus conceptos en la vida diaria. A través de los medios de comunicación de masas, como son la prensa, radio y televisión, al que actualmente se está incorporando Internet, recibimos noticias y mensajes que nos obligan a tener una idea clara de los conceptos estadísticos. Ejemplos pueden ser la vida media de la población, el aumento del IPC, desviación sufrida en un partido por un jugador de baloncesto con respecto a sus porcentajes, etc. Algunos ejemplos del uso frecuente que nos encontramos de la Estadística en la vida real pueden ser: 1) “Juan es más alto de lo habitual”. Aquí estamos haciendo uso del concepto de promedio o media de ciertos elementos. 2) “Los padres rubios suelen tener hijos rubios”. En este caso, las ideas de semejanzas y diferencias utilizan el concepto de correlación. 3) “Han tomado muestras de sangre de varios ciclistas elegidos al azar”. Aquí usamos el concepto de muestra, al no poder abarcar todo el espacio muestral. Además de estas apariciones de la Estadística en la vida diaria, nos encontramos que tiene cada vez más aplicaciones, y más importantes, en sectores tan dispares como la agricultura, la industria, la administración, etc. Pero además, desde hace ya más de un siglo, han comenzado a utilizarse los métodos estadísticos como una técnica poderosa en la investigación científica experimental. Y desde hace unos pocos años, apareció la Investigación Operativa aplicada a la industria, a la estrategia militar e incluso a la resolución de problemas de gobierno. Todo lo anterior implica que hoy en día sea necesario conocer las ideas estadísticas mas sencillas, pasando a formar parte del bagaje cultural del hombre, al mismo tiempo que el método estadístico ha de ser un instrumento de trabajo esencial para el ingeniero, economista, sociólogo y sobre todo, para el investigador experimental (biólogo, químico, médico, etc.).
2/12
2. EVOLUCIÓN HISTÓRICA DE LA ESTADÍSTICA. Es muy difícil establecer una cronología exacta de los orígenes de la Estadística. Encontramos los primeros rastros de la Estadística en la historia en el libro de Confucio, en el cual se mencionan por primera vez los censos. Se piensa que fue el emperador Tao, en 2200 a.C. el primero en ordenar censos en China. También en la época romana aparece la Estadística. En el año 555 a.C. se realizaron censos en Roma, cuyo objetivo era conocer la población existente en aquel momento. Y según nombra Tácito, Augusto (61 a.C a 14 d.C.) mandó enumerar todos los bienes y riquezas del imperio. Así pues, se realizó un inventario de los navíos, los recursos, las rentas públicas y de todos los soldados. A lo largo de la Edad Media y hasta la mitad del siglo XVII la Estadística fue meramente descriptiva. Aunque acabamos de ver que la Estadística aparece en la antigüedad, no fue hasta 1748 cuando Achenwall, en Alemania, introdujo por primera vez la palabra Estadística. Este matemático, profesor de la universidad de Gotinga, fue considerado el padre de la Estadística por los alemanes. Achenwall era la cabeza visible de una de las dos escuelas que coexistieron en Alemania en esta segunda mitad del siglo XVII, la escuela descriptiva alemana. La otra era la escuela de matemáticos políticos, cuyo máximo representante era Graunt. Esta escuela ensayó los fundamentos de las previsiones y las leyes sobre la regularidad aproximada de ciertos fenómenos sociales. Fue en 1662 cuando John Graunt, mercader de lencería londinense, publicó un libro en el que puso de manifiesto las cifras brutas de nacimientos y defunciones en Londres durante el periodo de 1604 a 1661, así como las influencias que ejercían las causas naturales, sociales y políticas de dichos acontecimientos. Graunt entabló amistad con Sir William Petty, que también formó parte de la escuela de matemáticos políticos. Al final del siglo XVII fue creado en Francia el primer centro oficial de Estadística. Y el siglo XVIII, gracias al francés Desparcieu y al sueco Wargentin, fue el punto de partida de la floreciente industria de los seguros. Ello fue debido a que estas dos personas publicaron las primeras tablas de mortalidad, que mostraron la manera práctica de la previsión de los fenómenos colectivos. Fue en el primer año del siglo XIX cuando Chaptal, ministro del interior de Francia, ordenó el primer censo de la población. Poco tiempo después, Jacques Bernouilli y Laplace introdujeron la utilización del cálculo de probabilidades, por lo que la Estadística fue perdiendo poco a poco su significado descriptivo por un carácter más matemático. A. Quetelet Lambert (1796-1874) extendió el cálculo de aplicaciones de este método al estudio de las cualidades físicas, morales e intelectuales de los seres humanos, con el objetivo de encontrar un hombre medio ficticio sobre el cual se distribuyeran todos los demás. A él se debe el término “hombre medio” que posteiormente usaría Sir Francis Galton. Fue en 1835, mientras detentaba el cargo de astrónomo real de Bélgica, cuando realiza el primer censo de su país, en el que analiza la influencia que sobre la mortalidad tienen la edad, el sexo, la profesión, la situación económica, etc.
3/12
G. T. Fechner (1801-1887), profesor de física de la universidad de Leipzig, aplicó los conocimientos existentes de Estadística de su época a las ciencias sociales, principalmente a la psicología. Galton (1822-1911) y Pearson (1857-1936) se pueden considerar los padres de la Estadística moderna. A ellos se debe la evolución de la Estadística deductiva, estudiada hasta su época, a la Estadística inductiva, que es la que hoy en día tiene una mayor influencia en todas las ramas del saber. La teoría de la Correlación y la Regresión es muy reciente, debiéndose su descubrimiento a Sir Francis Galton. Sus trabajos más importantes estuvieron relacionados con sus dos grandes aficiones, el estudio de la herencia y la expresión matemática de los fenómenos vinculados a ella. En 1869 publicó el libro “Hereditary Genius”, y a través del estudio de los problemas de la herencia, obtuvo el concepto de correlación. Fue el primero en asignar a un conjunto de variables un número que permitía obtener una medida del grado de relación existente entre ellas. Llegó a inferir que las personas muy altas solían tener hijos más bajos que ellas, y también sucedía al revés, las personas muy bajas solían tener hijos más altos que sus progenitores. Esta observación permitió a Galton enunciar su Principio de Regresión a la Mediocridad. Este resultó ser el origen del actual análisis de la regresión. La observación que realizó Galton es cierta, pero su principio resultó ser falso. La justificación está en que los valores extremos de una distribución se producen al azar, de ahí que, en el caso de la altura, no pasen a los hijos. Los trabajos de Galton los continuaron Edgeworth, Weldon y Pearson, quienes reelaboraron y mejoraron sus ideas. Karl Pearson realizó aportaciones muy importantes a la Estadística, como fue la distribución χ2 o el test que lleva su nombre, para el estudio de la bondad del ajuste de una distribución empírica a otra teórica. 3. EVOLUCIÓN HISTÓRICA DEL CÁLCULO DE PROBABILIDADES. Hoy en día, la Teoría de la Probabilidad es una parte importante de las matemáticas, que abarca un campo de aplicaciones muy extenso, incluyendo ramas de las ciencias naturales, técnicas y sociales. Sin embargo, tuvo un comienzo muy simple. Sus raíces las encontramos en una sencilla Teoría de los Juegos de Azar, dada a conocer hace ya tres siglos. Por ello, resulta complicado establecer una cronología histórica del desarrollo del concepto de probabilidad, debido a que como tal concepto es muy reciente. En el siglo XVI, el matemático Italiano G. Cardano (1501-1576) obtiene una serie de resultados que escribe en su libro “Libro de los juegos de Azar”, hallado con posterioridad a su muerte y publicado casi un siglo después en la ciudad francesa de Lyon. Los resultados los consigue como consecuencia del estudio de la combinatoria que él mismo desarrolla junto con su compatriota N. Fontana (más conocido como
4/12
Tartaglia, por su tartamudez). También plantea en sus escritos problemas sobre juegos con dos y tres dados. En el libro anteriormente mencionado, Cardano expone conceptos como la equiprobabilidad, la esperanza matemática, elabora tablas de frecuencia para el juego de dados e incluso esboza lo que, 150 años después, sería la Ley de los Grandes Numeros. Por esa misma época, un jugador italiano se puso en contacto con Galileo Galilei (1564-1642) para mostrarle su sorpresa al comprobar que “al jugar con tres dados a la suma 10, tenía más oportunidades de ganar que cuando jugaba a la suma 9”. Galileo dio la solución al problema planteado, pero sus trabajos fueron publicados por primera vez en 1656, omitiéndose el capítulo dedicado al juego de dados. No fue hasta 1718 cuando se dio a conocer la obra casi completa de Galileo. En la sociedad francesa de 1650, el juego era un entretenimiento corriente. Debido a que cada vez se introducían más variantes y las cantidades apostadas subían desmesuradamente, se sintió la necesidad de encontrar un método racional para poder ganar. Apareció un noble llamado A. Gombaud, aunque más conocido con el nombre de Caballero de Mère, quien propuso al matemático francés Blaise Pascal (1623-1662) diversos problemas relacionados con estos juegos. En ellos le pedía explicaciones sobre algunas contradicciones aparentes entre su razonamiento teórico y las observaciones que había recogido experimentalmente a través del juego. Alguno de los problemas que Gombaud propuso a Pascal son: a) Dos personas participan en un juego de azar, ganando la apuesta la primera que logre acumular un cierto número de puntos. Si los jugadores se ven forzados a suspender el juego antes de que éste haya terminado, conocido el número de puntos que ha acumulado cada uno de ellos, ¿Cómo deberá dividirse la apuesta? b) En 24 tiradas con dos dados, gana el que obtenga al menos un seis doble ¿Qué es más fácil, ganar o perder? c) ¿Por qué en el juego de tirar tres dados es más frecuente obtener la suma 11 que la suma 12? Estos problemas permitieron establecer a Pascal correspondencia con otros matemáticos, como Pierre de Fermat. Esta correspondencia, producida sobre el año 1654, se considera el origen de la Teoría de la Probabilidad. Ambos matemáticos resolvieron los problemas propuestos de forma separada. Pascal utilizó su triángulo aritmético haciendo hipótesis sobre las apuestas de cada uno, en cambio Fermat se apoyó en el naciente cálculo combinatorio. El físico, geómetra y astrónomo holandés C. Huygens (1629-1695) estuvo muy interesado en la correspondencia que existió entre Pascal y Fermat. Publicó, en su idioma natal, una memoria titulada “De Ratiociniis in Ludo Alae”, que es considerada hoy en día el primer trabajo impreso dedicado en exclusividad a la probabilidad. En el trabajo aparecen muchas de las resoluciones realizadas tanto por Pascal como por Fermat, junto con otros problemas interesantes acerca de las probabilidades en los juegos de azar. En todos los juegos corrientes de azar con dados, monedas, ruletas, etc., cada una de las jugadas que pueden producirse debe dar como resultado uno de entre todos los
5/12
posibles. Si se da la circunstancia de que los aparatos están correctamente hechos, cabe suponer que todos los resultados posibles son equivalentes, mirado desde el punto de vista del juego. Esta forma de ver las cosas llevó a dar la definición clásica de probabilidad: “La probabilidad de que se presente determinado suceso es igual al número de casos que son favorables a este suceso dividido por el número total de casos posibles, con tal de que estos casos sean mutuamente simétricos”. La definición anterior fue admitida de forma tácita por Pascal, Fermat, Laplace y todos sus contemporáneos. Pero incluso en una primera época, la gran cantidad de observaciones experimentales realizadas con los juegos de azar había revelado una forma general de regularidad. Si en un juego en el cual cada vez se produce una jugada, hay m casos posibles simétricos, y realizamos n jugadas en total, a la larga (cuando n tiende a infinito) todos los casos posibles tienden a presentarse el mismo número de veces. Se llama frecuencia relativa al cociente entre el número de veces que se presenta un determinado caso y el número total de veces que se repite el experimento, n. A la larga, cualquier suceso tiende a presentarse con una frecuencia relativa aproximadamente igual a su probabilidad. Las principales dificultades pertenecen al dominio del análisis combinatorio. En cuanto dejamos a un lado los casos mas claros, surgen otros donde la dificultad de separar los casos favorables de los posibles es más grande. Por tanto, las controversias que aparecieron, terminaron por mostrar que la definición clásica de probabilidad no resultó completamente satisfactoria. A partir del año 1700, comienza un rápido desarrollo de la teoría de la probabilidad. El impulso vino dado por dos obras escritas por Bernouilli y De Moivre. En la primera de ellas, encontramos una proposición muy importante conocida como Teorema de Bernouilli, que proporciona la base matemática de las propiedades de regularidad de ciertas razones frecuenciales en una larga serie de repeticiones de un juego. Centrándonos en el primero de ellos, podemos decir que entre los discípulos más entusiastas de Leibniz se encontraban los hermanos Jakob y Johann Bernouilli. Pero tengamos presente que al menos doce Bernouilli de la misma familia destacaron en Física y Matemática. El primero de ellos, Jakob Bernouilli, fue el miembro más destacado en el estudio de cálculo de probabilidades. Escribió un tratado, conocido hoy como un clásico, titulado “Ars Conjectandi”, que se publicó en 1713 (ocho años después de su muerte). Podemos afirmar que es el primer tratado importante sobre la Teoría de Probabilidades. Consta de cuatro partes. En la primera de ellas aparecen los trabajos de Huygens junto con un comentario personal del propio autor. La segunda parte contiene una teoría general sobre las combinaciones y permutaciones, lo cual le permite pasar a estudiar las distribuciones binomial y multinomial. Las dos últimas partes están dedicadas por entero a la Teoría de Probabilidades. Podemos destacar que la cuarta parte trata la Ley de los Grandes Números.
6/12
En la segunda de las obras, De Moivre enunció la regla de multiplicación de la teoría de probabilidades (probabilidad de la intersección de sucesos) y las primeras indicaciones sobre la distribución normal de probabilidades. En 1711 publicó su obra “Philosophical Transactions”, un largo estudio sobre las denominadas leyes del azar. Posteriormente, en 1718, publicó una ampliación de su trabajo anterior, en el que aparecen gran cantidad de problemas sobre dados, juegos, extracciones de bolas de una bolsa, anualidades de vida, etc. De Moivre estaba particularmente interesado en desarrollar toda la Teoría de Probabilidades con métodos muy generales, como si se tratara de una nueva Álgebra. En 1733, estando exiliado en Londres, publicó un pequeño folleto donde aparece por primera vez la curva de distribución de los errores, que pasando el tiempo, y no reconociéndole dicho mérito, pasó a llamarse Distribución Normal de Gauss. A partir de ese momento aparece una idea nueva. Se encontró que la teoría de la probabilidad, que había aparecido gracias a los juegos de azar, podía aplicarse a diversos problemas de campos muy distintos con buenos resultados. Estos otros problemas caían por completo fuera del campo de acción de la definición clásica de probabilidad ya vista. Entre estos problemas tenemos las estadísticas sobre poblaciones humanas y la teoría de los seguros de vida. Pongamos un ejemplo del primero. Supongamos que observamos el sexo de una serie de niños recién nacidos. Podemos considerar estas observaciones como una serie de repeticiones de un cierto juego de azar. O también podemos anotar, dado un grupo de personas de una determinada edad, si a final de año viven o no. También podría ser considerado como un juego de azar con dos posibles resultados, vivo y fallecido. De esta forma resultó posible el cálculo de tablas de supervivencia, primas de seguros de vida, etc. Pero quedaba algo pendiente. Debía especificarse que interpretación había que dar a los casos favorables y posibles cuando la definición caía fuera del dominio de los juegos de azar. El resultado de este proceso de extensión de la definición apareció en las obras de Laplace, fundamentalmente en “Theorie Analytique des Probabilitès” de 1812. Sin embargo, se muestra poco crítico con la definición clásica, aplicándola para todo. El resultado fue que las aplicaciones se desarrollaron mucho, pero la teoría se estancó. Durante todo este tiempo, tanto Gauss como Laplace utilizaron de forma independiente las aplicaciones al análisis numérico de los errores de medida, creando una teoría de errores sistemática. Tanto esta teoría, como el método de los mínimos cuadrados que se desarrolló junto con ella, han adquirido actualmente una gran importancia tanto teórica como práctica. El gran desarrollo de los seguros de vida iniciado a principios del siglo XIX fue posible gracias al desarrollo de la matemática actuarial, que a su vez se basaba en la aplicación de la probabilidad a las estadísticas de mortalidad. Incluso, la Teoría de la Probabilidad se ha llegado a aplicar a la Física Matemática. Aquí nos encontramos como las obras de Maxwell, Boltzman y Gibs sobre Mecánica
7/12
Estadística han sido muy importantes para el desarrollo de determinadas partes de la Física Moderna. Durante el siglo XX, el desarrollo de la Probabilidad a continuado a gran ritmo. Y en el momento actual, tenemos la Teoría de la Probabilidad aplicada sobre campos tan distintos como la genética, la economía, la psicología y la ingeniería. Es precisamente el siglo XX el que se puede caracterizar por una tendencia a la axiomatización. Podemos destacar, en especial, a Kolmogorov como creador del moderno cálculo de probabilidades. También tenemos a Pearson, Fisher, Neyman, Wald y Gosset, que fundamentaron la Inferencia Estadística, y le dieron carácter científico a algunas aplicaciones. Entre estas aplicaciones tenemos la Teoría de la Correlación y Regresión que, hasta ese momento, eran propias de la Estadística Descriptiva. 4. APLICACIONES A LAS CIENCIAS SOCIALES Y NATURALES. Si buscamos aplicaciones de la Estadística en la Psicología, nos encontramos que se utiliza de forma práctica para la selección psicotécnica de los trabajadores y para la obtención de encuestas de opinión pública. En la industria, tenemos aplicaciones en el control de calidad de los productos fabricados. También podemos encontrar usos de la Estadística en la Meteorología, la Balística, la Experimentación Agrícola, etc. Incluso en el campo de la Lingüística, para la determinación de la autoría de obras anónimas, o la verificación de otras. En todos los casos se sigue el mismo método, conocido como método estadístico, el cual comprende varias etapas. 4.1. Recogida de Datos. En cualquier campo de investigación (física, biología, medicina, etc.) los datos suelen ser procurados por el investigador. Tenemos campos como el económico y el sociológico en los cuales a veces los datos pueden procurarse de fuentes de información tales como estadísticas oficiales, hechas con fines distintos a los que se persiguen. Es por ello, que en estos casos la confianza que ofrecen los datos debe ser examinada antes de basar en ellos alguna conclusión. Dichas estadísticas oficiales reciben la forma de Censos, estadísticas en el tiempo y encuestas. Los primeros, los censos, abarcan todo el espacio muestral que se quiere estudiar en un momento dado. Las Estadísticas observan de forma dinámica la evolución de un determinado fenómeno en periodos sucesivos de tiempo. Las encuestas tiene un carácter peculiar. Se realizan sobre muestras tomadas de colectivos, la cual se considera representativa. Esto da lugar a un nuevo problema y es determinar si la muestra es representativa. Aparece así la Teoría del Muestreo.
8/12
4.2. Elaboración de Datos. Una vez obtenidos los datos hay que depurarlos. Después hay que darles forma y estudiar la manera más conveniente de presentarlos, llevarlos a una escala que resulte adecuada, tabularlos y agruparlos. 4.3. Reducción de los Datos. En el proceso de reducción de los datos, nos vemos obligados a sacrificar elementos informativos a cambio de obtener mayor claridad y flexibilidad, algo necesario para el posterior tratamiento de los mismos. Esta fase dota de consistencia a los datos. Estamos ya en situación de calcular valores centrales, de dispersión, coeficientes de correlación, etc. Para visualizar mejor los datos, es conveniente incluir gráficos, diagramas y cualquier otro elemento que permita disponer de una idea más clara sobre la distribución. 4.4. Análisis de los Datos. En algunos estudios, interpretar los datos que representan la distribución es suficiente. En el resto, los cuales son mayoría, el objetivo final de la investigación estadística no es únicamente descriptivo. Los datos se consideran como valores observados de ciertas variables aleatorias, lo cual sugiere buscar un determinado modelo probabilístico que describa de forma adecuada la distribución. Una vez planteada una determinada hipótesis de que la distribución se ajusta a un determinado modelo de distribución probabilística, hemos de aplicar medidas adecuadas para comprobar el grado de concordancia o la bondad del ajuste. En otros muchos casos, deseamos estimar ciertos parámetros desconocidos de la población a partir de la muestra elegida, como son la media, varianza, cuartiles, mediana, desviación típica, etc. Siempre será posible si la muestra elegida es aleatoria o representativa del conjunto de la población. Vemos por tanto que en cualquiera de estos casos se deben tomar decisiones estadísticas. 5. TOMA DE DECISIONES. 5.1. Hipótesis Estadísticas. Llamaremos Decisiones Estadísticas a aquellas decisiones que se tienen que tomar sobre poblaciones partiendo de la información proporcionada por muestras.
9/12
Para poder tomar decisiones de forma adecuada, es conveniente hacer determinadas suposiciones sobre las poblaciones que se estudian. Llamaremos Hipótesis Estadísticas a estas conjeturas, las cuales pueden ser ciertas o no serlo. Las hipótesis pueden no ser ciertas ya que en determinadas situaciones se formulan con el único objetivo de poder rechazarlas o invalidarlas. En otras ocasiones, en el caso de que se quiera decidir si un procedimiento es mejor que otro, se puede formular una hipótesis que diga que no existe diferencia entre los procedimientos en cuestión. Tales hipótesis reciben el nombre de hipótesis nulas. Si dada una hipótesis que suponemos es cierta, encontramos que los resultados observados son muy distintos de los que cabría esperar según la hipótesis, podremos decir que las diferencias observadas son significativas, y estaremos en condiciones de rechazar la hipótesis. Diremos que se ha cometido un Error de Tipo I cuando es rechazada una hipótesis que debía ser aceptada. El Error es de Tipo II si la hipótesis es aceptada cuando tenía que haber sido rechazada. Todos los ensayos de hipótesis deben ser diseñados de forma que se minimicen los errores de decisión. Lo que sucede es que cuando se intenta disminuir el error de uno de los tipos se aumenta el otro. La única forma de disminuir los dos errores es aumentando la muestra, cosa que a veces no resulta posible. Llamaremos Nivel de Significación del Ensayo la probabilidad máxima con la que en un ensayo de hipótesis se puede cometer un error de tipo I. En la práctica se utilizan los valores 0’05 ó 0’01. Así, un nivel de significación del 5% (0’05) significa que de cada 100 ocasiones en las que se rechaza la hipótesis, en cinco de ellas debía ser aceptada. Existe por tanto un 95% de confianza de que se está tomando la decisión adecuada. Existen muchos tipos de ensayos. Comentaremos algunos referentes a la distribución normal. Supongamos que con una cierta hipótesis dada, la distribución muestral de un estadístico X es normal con media µ y desviación típica σ. entonces, la distribución de X−µ la variable tipificada Y = es una normal tipificada. σ Podemos estar con el 95% de confianza de que, si la hipótesis es cierta, el valor de Y obtenido de una muestra real para el estadístico X se halla entre –1’96 y 1’96, ya que el área bajo la normal entre estos valores es 0’95. Pero resulta que si al elegir una muestra al azar encontramos que Y está fuera del intervalo [–1’96, 1’96], entonces Y difiere significativamente de lo es era esperable, siendo la hipótesis rechazada con un 5% de Nivel de Significación.
10/12
5.2. Otros Procesos de Decisión. Veamos un ejemplo para poder introducir de forma sencilla las ideas generales de otros procesos de decisión. “Un vendedor de revistas hace semanalmente un pedido de revistas, cuyo coste por unidad es de 2’5 € y su precio de venta al público de 3 €. Cada unidad no vendida en el día supone una pérdida de 0’05 €. La demanda diaria puede ser 0, 1 ó 2 unidades, pero no es conocida la ley de probabilidad. El problema está en buscar la decisión óptima con el criterio de obtener la ganancia máxima. Para esto se tiene el esquema siguiente: a/b 1 2
0 -0’05 -0’10
1 0’5 0’45
2 0’5 1
“a” indica la variable de decisión o alternativa (unidades encargadas de forma diaria) y “b” indica las posibles demandas o estados del ambiente. Los elementos de la matriz son los resultados (las ganancias). Es posible elaborar un árbol de decisión (un grafo en árbol). La decisión mejor sería la que hiciera máxima la esperanza matemática de la ganancia. Así resulta que si los estados de ambiente son equiprobables, la esperanza valdría en un caso 0’95/3 y en el otro 1’35/3, con lo que debería encargar dos revistas diarias. Pero si no sabemos nada de dicha probabilidad, tendremos que elegir un criterio diferente. Se entiende así que el esquema de un proceso de Bayes sea también un proceso de toma de decisiones, aunque el mayor problema es calcular las probabilidades condicionadas que nos encontramos. 5.3. Predicción. La palabra predicción debemos entenderla en un sentido muy amplio, el cual está relacionado con la posibilidad de responder a preguntas del tipo ¿qué va a ocurrir en determinadas condiciones? ¿qué medida debemos tomar para obtener un determinado resultado?. La predicción es, por tanto, el fin último de la ciencia. Así, una planificación racional de un sistema educativo, o de una central telefónica, o de la necesidad de un hipermercado, requiere de la predicción. La fiabilidad de la predicción que se efectúe vendrá determinada por la información, si tenemos o no, sobre las distribuciones de probabilidad ajustadas, lo que nos dice que la toma de decisiones es en sí una predicción.
11/12
BIBLIOGRAFÍA RECOMENDADA Iniciación a la Estadística. Aut. Sixto Rios. Edit. Paraninfo. Teoría de Probabilidades y Aplicaciones. Aut. Cramer. Edit Aguilar. Estadística Teórica y Aplicada. Aut. A. Nortes. Edit. PPU
12/12
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 69 LA RESOLUCIÓN DE PROBLEMAS EN MATEMÁTICAS. ESTRATEGIAS. IMPORTANCIA HISTÓRICA. 1. Introducción. 2. La Resolución de Problemas. Estrategias. 2.1. ¿Qué es un Problema? 2.2. El Proceso de Resolución de un Problema. 2.3. La Resolución de Problemas como Propuesta Didáctica. 3. Importancia Histórica. Algunos Problemas Clásicos. 3.1. Problemas Famosos. 3.2. Problemas sin Solución. 3.3. Problemas sin Resolver. 3.4. Problemas del Milenio. Bibliografía Recomendada.
1/16
TEMA 69 LA RESOLUCIÓN DE PROBLEMAS EN MATEMÁTICAS. ESTRATEGIAS. IMPORTANCIA HISTÓRICA. 1. INTRODUCCIÓN. Una de las actividades fundamentales en Matemáticas es la resolución de problemas. Conviene que distingamos entre ejercicio y problema. Cuando se plantea un ejercicio, se identifica de inmediato la técnica que se precisa para resolverlo y, en todo caso, la dificultad estriba en aplicarla correctamente. En cambio, un problema es una tarea cuyos términos y propósitos son globalmente comprensibles por la persona, pero no se sabe de momento como abordar. Así tenemos que, para un alumno de secundaria, calcular el área de un triángulo conociendo la base y la altura es un ejercicio, pero determinar cuantos triángulos tienen 1 dm2 de superficie y representarlos todos, es un problema. Cuando un problema o una tarea incita a una persona a plantearse nuevas preguntas sobre el mismo, por ejemplo, si es posible generalizar el resultado, o que pasaría si se modifican las condiciones iniciales del problema, puede decirse que se ha embarcado en una auténtica investigación. La resolución de problemas ayuda a la construcción de conceptos y a establecer relaciones entre ellos. Pero no se aprende a resolver problemas por el hecho de haber aprendido determinados conceptos y algunos algoritmos de cálculo. Hemos de disponer de herramientas, técnicas específicas y pautas generales de resolución de problemas, que nos permitan enfrentarnos a ellos sin miedo y con una cierta garantía de éxito. La mejor manera de aprender a resolver problemas eficazmente es resolver una cantidad suficiente. Este aprendizaje, como cualquier otro, lleva mucho tiempo. Es importante la reflexión sobre la forma de resolver cada problema; de ser conscientes de qué estrategia estamos utilizando, sin que esta reflexión se convierta en un tratamiento sistemático de las diferentes estrategias. 2. LA RESOLUCIÓN DE PROBLEMAS. ESTRATEGIAS. La heurística o ars inveniendi tenía por objeto el estudio de las reglas y de los métodos de descubrimiento y de la invención. La heurística moderna, inaugurada por Polya con la publicación de su obra How to solve it (Polya, 1945), trata de comprender el método que conduce a la solución de problemas, en particular las operaciones típicamente útiles en este proceso. 2.1. ¿Qué es un problema? Polya no definió lo que entendía por problema cuando escribió su libro en 1945. Sin embargo, en su libro Mathematical Discovery (Polya, 1961), se vio obligado a
2/16
proporcionar una definición. Pero no para empezar su disertación, sino en el capítulo 5, y después de una amplia exposición práctica sobre algunos procesos que intervienen en la resolución de problemas: Tener un problema significa buscar de forma consciente una acción apropiada para lograr un objetivo claramente concebido pero no alcanzable de forma inmediata. Otra definición, parecida a la de Polya es la de Krulik y Rudnik: Un problema es una situación, cuantitativa o de otra clase, a la que se enfrenta un individuo o un grupo, que requiere solución, y para la cuál no se vislumbra un medio o camino aparente y obvio que conduzca a la misma (Krulik y Rudnik, 1980). De ambas definiciones se infiere que un problema debe satisfacer los tres requisitos siguientes: 1) Aceptación. El individuo o grupo, debe aceptar el problema, debe existir un compromiso formal, que puede ser debido a motivaciones tanto externas como internas. 2) Bloqueo. Los intentos iniciales no dan fruto, las técnicas habituales de abordar el problema no funcionan. 3) Exploración. El compromiso personal o del grupo fuerzan la exploración de nuevos métodos para atacar el problema. También ha existido cierta polémica sobre la diferencia que hay entre un ejercicio o un auténtico problema. Lo que para algunos es un problema, por falta de conocimientos específicos sobre el dominio de métodos o algoritmos de solución, para los que sí los tienen es un ejercicio. Esta cuestión aunque ha sido planteada en varias ocasiones, no parece un buen camino para profundizar sobre la resolución de problemas. R. Borasi (1986), en uno de los primeros intentos en clarificar la noción de problema originada por su interés en mejorar la enseñanza de la resolución de problemas, utiliza los siguientes elementos estructurales para una tipología de problemas: • • • •
El contexto del problema, la situación en la cuál se enmarca el problema mismo. La formulación del problema, definición explícita de la tarea a realizar. El conjunto de soluciones que pueden considerarse como aceptables para el problema. El método de aproximación que podría usarse para alcanzar la solución.
Tales elementos estructurales pueden dar origen a la siguiente clasificación: Tipo ejercicio
Problema texto
Contexto inexistente
Formulación Soluciones Única y explícita Única y exacta
con Explícito en el Única y explícita Única y exacta texto
3/16
Método Combinación de algoritmos conocidos Combinación de algoritmos conocidos
Puzzle
Explícito en el Única y explícita Única y exacta texto
Elaboración de un nuevo algoritmo Acto de ingenio. Prueba de una En el texto y Única y explícita Por lo general Exploración del conjetura sólo de forma única, pero no contexto, parcial necesariamente reformulación, elaboración de nuevos algoritmos. Problemas de la Sólo de forma Parcialmente Muchas posibles, Exploración del vida real parcial en el dada. de forma contexto, texto Algunas aproximada. reformulación, alternativas creación de un posibles. modelo Situación Sólo parcial en Implícita, se Varias. Puede Exploración del problemática el texto sugieren varias, darse una contexto, problemática explícita reformulación, plantear el problema. Situación Sólo parcial en Inexistente, ni Creación del Formulación del el texto siquiera problema problema. implícita
2.2. El proceso de resolución de un problema. Para George Polya (1945), la resolución de un problema consiste, a grandes rasgos, en cuatro fases bien definidas: Comprender el problema. ¿Cuál es la incógnita? ¿Cuáles son los datos? Concebir un plan. ¿Se ha encontrado con un problema semejante? ¿Conoce un problema relacionado con este? ¿Podría enunciar el problema de otra forma? ¿Ha empleado todos los datos? Ejecutar el plan. ¿Son correctos los pasos dados? Examinar la solución obtenida. ¿Puede verificar el resultado? ¿Puede verificar el razonamiento?
4/16
Las fases anteriores caracterizan claramente al resolutor ideal, competente. Cada fase se acompaña de una serie de preguntas, al puro estilo socrático, cuya intención clara es actuar como guía para la acción. Los trabajos de Polya, se pueden considerar por lo tanto, como un intento de describir la manera de actuar de un resolutor ideal. Una pregunta, ¿Por qué es tan difícil entonces, para la mayoría de los humanos, la resolución de problemas en matemáticas? Los trabajos de Schoenfeld (1985), son por otro lado, la búsqueda inagotable de explicaciones para la conducta de los resolutores reales de problemas. Propone un marco con cuatro componentes que sirva para el análisis de la complejidad del comportamiento en la resolución de problemas. Recursos congnitivos: conjunto de hechos y procedimientos a disposición del resolutor. Heurísticas: reglas para progresar en situaciones dificultosas. Control: Aquello que permite un uso eficiente de los recursos disponibles. Sistema de creencias: Nuestra perspectiva con respecto a la naturaleza de la matemática y como trabajar en ella. Cada uno de tales componentes explica las carencias, y por lo tanto, el poco éxito en la resolución de problemas de los resolutores reales. Así, cuando a pesar de conocer las heurísticas no se sabe cuál utilizar o cómo utilizarla se señala la ausencia de un buen control o gestor de los recursos disponibles. Pero las heurísticas y un buen control no son suficientes, pues puede que el resolutor no conozca un hecho, algoritmo o procedimiento específico del dominio matemático del problema en cuestión. En este caso se señala la carencia de recursos cognitivos como explicación al intento fallido en la resolución. Por otro lado, puede que todo lo anterior esté presente en la mente del resolutor, pero sus creencias de lo que es resolver problemas en matemáticas o de la propia concepción sobre la matemática haga que no progrese en la resolución. La explicación, para este fallo, la contempla Schoenfeld en el cuarto elemento del marco teórico, las creencias. Por último están las heurísticas. La mayor parte de las veces se carece de ellas. Se dispone de conocimientos específicos del tema o dominio matemático del problema, incluso de un buen control pero falla el conocimiento de reglas para superar las dificultades en la tarea de resolución. Las heurísticas son las operaciones mentales típicamente útiles en la resolución de problemas, son como reglas o modos de comportamiento que favorecen el éxito en el proceso de resolución, sugerencias generales que ayudan al individuo o grupo a comprender mejor el problema y a hacer progresos hacia su solución. Existe una amplia, posiblemente incompleta, lista de heurísticas. Entre las más importantes cabría citar:
5/16
• • • • • • • •
Buscar un problema relacionado. Resolver un problema similar más sencillo. Dividir el problema en partes. Considerar un caso particular. Hacer una tabla. Buscar regularidades. Empezar el problema desde atrás. Variar las condiciones del problema.
Sin embargo, como bien ha señalado Puig (1996), en la lista anterior aparecen demasiadas cosas juntas, que son, por otro lado, diferentes si las sometemos a un detenido análisis. Buscar un problema relacionado es una sugerencia heurística pues se señala una dirección de trabajo, y sobre todo se recurre a la memoria del resolutor, y no a un procedimiento concreto para buscar tal problema. Considerar un caso sí se refiere a un procedimiento en concreto que permite, a partir del problema dado, formular un problema relacionado con él. Puig (1996) denomina a este tipo de procedimientos, independientes del contenido y que permiten transformar el problema dado en otro, con el nombre de herramientas heurísticas. (Tal observación parte de una nota marginal de Polya (Polya, 1962, vol 2. p.84)) Por último, hacer una tabla se podría considerar como una destreza al no poseer el carácter de transformar el problema ni al recurso de la memoria como en el caso de las sugerencias heurísticas. La característica más importante del proceso de resolución de un problema es que, por lo general, no es un proceso paso-a-paso sino más bien un proceso titubeante. En el proceso de resolución, Schoenfeld ha señalado que tan importante como las heurísticas es el control de tal proceso, a través de decisiones ejecutivas. Tales decisiones son acerca de qué hacer en un problema. La característica más importante que define a las decisiones ejecutivas y a las acciones de control, es que tienen consecuencias globales para la evolución del proceso de resolución de un problema. Las decisiones ejecutivas determinan la eficiencia de los conocimientos y recursos de todo tipo puestos en servicio para la resolución del problema. Son decisiones ejecutivas: • • • • •
Hacer un plan. Seleccionar objetivos centrales y subobjetivos. Buscar los recursos conceptuales y heurísticos que parecen adecuados para el problema. Evaluar el proceso de resolución a medida que evoluciona. Revisar o abandonar planes cuando su evaluación indica que hay que hacerlo.
6/16
Las anteriores son decisiones ejecutivas tal y como se usa ese término en Inteligencia Artificial, son equivalentes a las decisiones de gestión en el campo de los negocios, o decisiones de táctica y estrategia en el campo militar. El término metacognición se ha usado en la literatura psicológica en la discusión de fenómenos relacionados con el que aquí tratamos. Son por tanto, decisiones acerca de qué caminos tomar, pero también acerca de qué caminos no tomar. Cuanto más precisas sean las respuestas a las preguntas: ¿ Qué estoy haciendo? ¿ Por qué lo hago? ¿ Para qué lo hago? ¿ Cómo lo usaré después? mejor será el control global que se tenga sobre el problema y sobre las decisiones que conducen a su solución. La ausencia de decisiones ejecutivas y de control suele tener efectos desastrosos en el proceso de resolución de un problema. La mayor parte de las veces en que se fracasa en la resolución de un problema es debido a que, la persona que afronta el problema, no dispone de un plan de solución. Pero hay otras actitudes que imposibilitan la toma de buenas decisiones durante la fase de resolución. Entre ellas cabe destacar: •
Inflexibilidad para considerar alternativas.
Cuando una y otra vez fallan los procedimientos empleados no hay más salida que cambiar de perspectiva para salir del bloqueo. •
Rigidez en la ejecución de procedimientos.
Más de una vez intentaremos encajar un procedimiento conocido en una situación en la que no es aplicable. Nuestra obstinación es debida al simple hecho de que nos parece apropiado a primera vista, o porque la situación, aunque distinta, se parece a aquella en que el procedimiento fue eficaz. •
Incapacidad de anticipar las consecuencias de una acción.
Al respecto cabe hacerse siempre la siguiente pregunta antes de ejecutar una acción pensada: Cuando haya ejecutado lo que pienso ¿ qué consecuencias tendrá para la resolución del problema ? •
El efecto "túnel".
Se produce cuando la ejecución de una tarea es tan absorbente que no hay energías disponibles para la evaluación de lo que se esta realizando. Suele darse más fácilmente cuanto más embebido se está en la ejecución de una acción. 7/16
Miguel de Guzmán partiendo de las ideas de Polya, Mason et al. (Mason, Burton y Stacey, 1988) y de los trabajos de Schoenfeld ha elaborado un modelo para la ocupación con problemas, donde se incluyen tanto las decisiones ejecutivas y de control como las heurísticas. La finalidad de tal modelo es que la persona examine y remodele sus propios métodos de pensamiento de forma sistemática a fin de eliminar obstáculos y de llegar a establecer hábitos mentales eficaces, en otras palabras, lo que Polya denominó como pensamiento productivo. Un modelo para la ocupación con problema (Miguel de Guzmán, 1991, p.80) Familiarízate con el problema • • •
Trata de entender a fondo la situación Con paz, con tranquilidad a tu ritmo Juega con la situación, enmárcala, trata de determinar el aire del problema, piérdele el miedo
Búsqueda de estrategias • • • • • • • •
Empieza por lo fácil Experimenta Hazte un esquema, una figura, un diagrama Escoge un lenguaje adecuado, una notación apropiada Busca un problema semejante Inducción Supongamos el problema resuelto Supongamos que no
Lleva adelante tu estrategia • • •
Selecciona y lleva adelante las mejores ideas que se te han ocurrido en la fase anterior Actúa con flexibilidad. No te arrugues fácilmente. No te emperres en una idea. Si las cosas se complican demasiado hay otra vía. ¿Salió? ¿Seguro? Mira a fondo tu solución.
Revisa el proceso y saca consecuencias de él. • • • • •
Examina a fondo el camino que has seguido. ¿Cómo has llegado a la solución? O bien, ¿por qué no llegaste? Trata de entender no sólo que la cosa funciona, sino por qué funciona. Mira si encuentras un camino más simple Mira hasta dónde llega el método Reflexiona sobre tu propio proceso de pensamiento y saca consecuencias para el futuro
8/16
2.3. La resolución de problemas como propuesta didáctica. El National Council of Teachers of Mathematics (NCTM) propuso para la década de los pasados ochenta la resolución de problemas como eslogan educativo de la matemática escolar: En la enseñanza de las matemáticas escolares se debe poner el enfoque en la resolución de problemas. ¿Qué significa poner el enfoque en la resolución de problemas? Cabe al menos tres interpretaciones: Enseñar para resolver problemas • • •
Proponer a los alumnos más problemas. Emplear aplicaciones de los problemas a la vida diaria y a las ciencias. No proponer sólo ejercicios sino también problemas genuinos que promuevan la búsqueda, la investigación por los alumnos.
Enseñar sobre la resolución de problemas Enseñanza de la heurística. El objetivo es que los alumnos lleguen a aprender y a utilizar estrategias para la resolución de problemas. Dentro de esta tendencia hay ejemplos en los mismos trabajos citados anteriormente. Sin embargo, parece ser que las destrezas heurísticas son las más apropiadas para tal fin. Enseñar vía la resolución de problemas Enseñar la matemática a través de problemas. En un seminario celebrado en La Laguna en 1982 e impartido por el profesor Gaulin (M. Fernández 1982), al ser preguntados por objetivos de la resolución de problemas, los profesores asistentes enumeran los siguientes: • • •
Desarrollo de la capacidad de razonamiento Aplicación de la teoría previamente expuesta. Resolución de cuestiones que la vida diaria plantea.
La primera propuesta, aunque durante mucho tiempo fue un argumento aceptado generalmente sobre las virtudes de la educación matemática, con el paso del tiempo se ha convertido en un mito. Las dos últimas caen dentro de la primera interpretación anterior. En el mismo artículo, el autor M. Fernández que actuó como informador del seminario, concluye con la siguiente redacción: Al final, pareciéndome que el profesor buscaba algo más, me aventuré a indicar lo que creo suele olvidarse: la propuesta de problemas con el fin de elaborar una teoría, esto es, para explorar y aprender nuevos conceptos. En efecto, comentó, pese a ser eminentemente formativa, no es frecuente que se tenga en cuenta por el profesorado.
9/16
Esta es claramente la interpretación tercera de las enumeradas más arriba. Sin embargo, el comentario del Profesor Gaulin deja las cosas de nuevo en su sitio. ¿Por qué no se tiene en cuenta por el profesorado? 3. IMPORTANCIA HISTÓRICA. ALGUNOS PROBLEMAS CLÁSICOS. La resolución de problemas ha sido, es y será, el auténtico motor de las matemáticas. Una vez que un problema era resuelto, surgían otros nuevos, los cuales constituían nuevos retos para las hornadas de matemáticos. Sin embargo, podemos encontrar en la historia de las matemáticas unos cuantos problemas, de enunciado y propósito sencillo, que se pueden considerar universales. Muchos de ellos fascinaron en su infancia a muchos grandes matemáticos, según han confesado después ellos mismos. El problema de los matemáticos no es inventar nuevas ramas de forma gratuita. Se inventan para resolver problemas a veces propuestos siglos antes. 3.1. Problemas Famosos. 3.1.1. Los puentes de Köninsberg.
En la ciudad de Köninsberg (ahora se llama Kaliningrado) (donde nació Kant y Hilbert) hay una isla, Kneihof, rodeada por dos brazos del río Pregel. Hay siete puentes que lo cruzan. ¿Puede una persona realizar un paseo de modo que cruce cada uno de los puentes una sola vez? Solución: Euler demostró que no se puede hacer. 3.1.2. Problema de Teofrasto Teofrasto fue a ver a Aristoteles, para hablar sobre la clasificación de las plantas. Llevaba a su perro, un mastín, atado con una cuerda de longitud L. Cuando llegó, ató la cuerda con un nudo corredizo, alrededor de una columna de radio R. El perro, al que no le gustaba estar atado, tensionó la cuerda, y la cuerda se rompió. Hallar a que distancia del perro estaba el nudo corredizo cuando se rompió la cuerda. Solución:
10/16
Sea y la distancia entre el perro y el nudo corredizo, x, la distancia entre el nudo corredizo y el punto en que la cuerda toca a la columna y a el ángulo que forma la cuerda con el eje de abscisas en C (el nudo). La longitud de la cuerda es L = y + AC + AB + BC La cuerda es tangente a la circunferencia en A y en B, por lo tanto el ángulo que forma la cuerda con el radio será de 90º. Como se puede ver en el dibujo el ángulo en O correspondiente al arco de circunferencia en contacto con la cuerda es p + 2a, luego la longitud de la cuerda en contacto con la columna es (p + 2a)R. Entonces L = y + 2x + (p + 2a)R y = L - 2x - (p> + 2a)R tg a = R/x a = arctg R/x y = L - 2x - p R - 2R arctg R/x Obteniendo el máximo de esta función se resolvería el problema. 3.1.3. Coloreando los mapas. Demostrar que para colorear un mapa, de forma que países con frontera común se pinten con colores distintos, sólo se necesitan cuatro colores. Este problema fue propuesto a Augustus de Morgan por un antiguo alumno suyo, Francis Guthrie. El profesor no fue capaz de resolverlo y se lo envió a Hamilton en una carta de fecha 23 de octubre de 1852. El problema ha resistido los embates de muchos matemáticos. En 1976 Kenneth Apel y Wolfgang Haken, de la Universidad de Urbana (Illinois) dieron una demostración con ordenador pero no existe ninguna demostración matemática.
11/16
3.2. Problemas sin Solución. 3.2.1. Problema Délico o Duplicación del Cubo. Dado un cubo cuya arista tiene longitud 1 se pide construir un cubo de volumen doble, utilizando regla (una regla sin marcas) y compás. El nombre del problema se debe a que en Delfos (una isla griega) había un templo que era famoso por sus oráculos. Un rey acudió al templo para que le hiciesen un oráculo (adivinar el porvenir) y después de hacérselo le dijo a la sacerdotisa que le pidiese lo que quisiera. La sacerdotisa le pidió que construyese un altar del doble de volumen que el que tenía. Se trata de calcular, con regla y compás un número que sea igual a la raíz cúbica de 2. La solución es un número irracional y con regla y compás sólo se pueden obtener números fraccionarios, por lo tanto es imposible. Tendríamos que resolver la ecuación x3 = 2. No existe ningún número fraccionario que elevado al cubo dé 2. 3.2.2. Trisección de un ángulo. Dado un ángulo alfa, se trata de dividirlo en tres partes iguales, utilizando regla y compás. La trisección de un ángulo es equivalente a la resolución de la ecuación de tercer grado cos 3x = 4 (cos x) 3 - 3 cos x. Descartes resolvió este problema utilizando un compás como el de la figura
Las barras de colores rojo y azul están fijas en su extremo más cercano al vértice en un punto situado a la misma distancia en los cuatro brazos del compás. El otro extremo de las barras de colores se puede deslizar solidariamente con la barra compañera. 3.2.3. Rectificación de una circunferencia. Dada una circunferencia de radio R, se trata de construir, con regla y compás, un segmento de longitud igual a la circunferencia.
12/16
3.2.4. Cuadratura del círculo. Dado un círculo de radio R, se trata de construir, utilizando regla y compás, un cuadrado de igual superficie. Sea L el lado del cuadrado. Tendríamos L2 = p R2 Resulta que Lindemann demostró que p no es solución de ningún polinomio. El primero que intentó resolver este problema fue Anaxágoras, mientras estaba en la cárcel como prisionero político (fue liberado gracias a la intervención de Pericles, de quien había sido profesor). Dicen que llenó las paredes de la celda con los cálculos. 3.2.5. Construcción de n-ágonos regulares. Dado un círculo de radio R, se pide construir un n-ágono (un polígono de n lados) regular inscrito en él. Este problema sólo tiene solución si n tiene la forma 2k +1. 3.3. Problemas de Números. a) ¿Existe una cantidad infinita de números perfectos? Números perfectos son números cuya suma de divisores suman el número (p.e 6) b) ¿Existe una cantidad infinita de números primos gemelos? Los primos gemelos son parejas de números primos que están separados por un solo número (p.e 5,7, 17 y 19) c) Demostrar que todos los números pares > 4 se pueden obtener como suma de dos primos. Este problema se llama la conjetura de Goldbach. Goldbach era un matemático, que fue tutor del zar Pedro II. Goldabach planteó este problema a Euler y no fue capaz de resolverlo. d) Demostrar que todos los números impares > 9 se pueden obtener como suma de tres primos. Este problema se llama la conjetura de Goldbach. Goldbach era un matemático, que fue tutor del zar Pedro II. Goldabach planteó este problema a Euler y no fue capaz de resolverlo.
13/16
3.4. Problemas del Milenio. 3.4.1. P contra NP. Stephen Cook y Leonid Levin formularon este problema independientemente en 1971. Stephen Cook lo explicó con un ejemplo semejante a éste. Usted llega a una fiesta, el salón está lleno de gente y se pregunta si conoce a alguna persona de la fiesta. Se lo pregunta al anfitrión y este le dice que usted conoce a la persona que está en la ventana. Inmediatamente usted ratifica lo dicho por el anfitrión (es fácil comprobarlo). Sin embargo, si no tuviese esta ayuda , tendría que examinar una a una a toda la gente y determinar si la conoce. Tardaría mucho tiempo en hacer esta operación. La explicación de las siglas P y NP se refieren a los tiempos "polinómico" y "polinómico no determinista". 3.4.2. La conjetura de Hodge. Durante el siglo XX, los matemáticos descubrieron formas de investigar las formas de objetos complicados. La idea básica es preguntar en qué medida podemos aproximar la forma de un objeto dado uniendo formas geométricas simples. La conjetura de Hodge dice que para un tipo particular de formas, llamadas variedades algebraicas proyectivas, las formas llamadas ciclos de Hodge son combinaciones de formas geométricas llamadas ciclos algebraicos. 3.4.3. La conjetura de Poincaré. Henri Poincaré era el rival francés del alemán Hilbert. Poincaré llegó a unas conclusiones sobre las esferas en el espacio de tres dimensiones que, posteriormente, han resultado imposible trasladar al espacio de cuatro dimensiones. Esta incógnita resultó ser extraordinariamente difícil en el momento de su planteamiento y los matemáticos siguen hoy luchando por darle una solución. 3.4.4. La hipótesis de Riemann. Los números primos han traído de cabeza a los matemáticos desde los inicios de las matemáticas. Uno de los temas que se resiste es la distribución de los números primos (no parece seguir ningún patrón regular). El matemático alemán Georg Riemann propuso en el siglo XIX, que su frecuencia está íntimamente relacionada con el comportamiento de una función matemática llamada función Zeta. La hipótesis de Riemann se ha confirmado en muchos casos, pero todavía no existe una demostración general.
14/16
Éste es el único de los siete problemas que estaba en la lista de 1900 de Hilbert. 3.4.5. La teoría de Yang-Mills. Hace casi una centuria, los físicos Yang y Mills descubrieron ciertas relaciones entre la geometría y las ecuaciones de la física de partículas que, más tarde, resultaron de gran utilidad para unificar tres interacciones fundamentales de la materia en una sola teoría. A pesar de ello, no se conocen soluciones compatibles con la mecánica cuántica de las soluciones de Yang y Mills. El progreso de este problema requerirá la introducción de nuevas ideas fundamentales en la física y en matemáticas. 3.4.6. Las ecuaciones de Navier-Stokes. Las ecuaciones de Navier-Stokes describen el comportamiento de los fluidos, cuando se mueven en movimiento turbulento. A pesar que las ecuaciones se escribieron en el siglo XIX nadie ha sabido resolverlas hasta el momento. 3.4.7. La conjetura de Birch y Swinnerton-Dyer. El décimo problema planteado por Hilbert en 1900 en París, planteaba si existía algún método para saber si las ecuaciones xn + yn = zn tienen soluciones que sean números enteros. El matemático Yu Matiyasevich demostró, en 1970, que no había ningún método general, pero Birch y Swinnerton-Dyer propusieron algunos métodos parciales que, todavía hoy, no se han demostrado.
15/16
BIBLIOGRAFÍA RECOMENDADA. Pensar Matemáticamente. Aut. Mason, Burton y Stacey. edit. MEC Labor Cómo plantear y resolver problemas. Aut.: Polya. Edit.:Trillas, Mexico Elementos de Resolución de Problemas. Aut.: L. Puig. Edit.: Comares
16/16
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 70 LÓGICA PROPOSICIONAL. EJEMPLOS RAZONAMIENTO MATEMÁTICO.
Y
APLICACIONES
1. Introducción. 2. El Lenguaje para la Lógica de Proposiciones. 2.1. Sintaxis. 2.1.1. Reglas de Formación. 2.1.2. Conectivas. 2.2. Semántica. 2.2.1. Tablas de Verdad. 2.2.2. Equivalencia. 2.2.3. Tautologías y Contradicciones. 3. Validación de Sentencias Proposicionales. 4. Leyes de la Lógica de Proposiciones. 5. Sistema Axiomático del Cálculo de Proposiciones. 6. Sistema Inferencial del Cálculo de Proposiciones. 6.1. Reglas de Inferencia. 6.2. Proceso de Inferencia. 7. La Demostración en Matemáticas. 7.1. Demostraciones Directas. 7.2. Demostraciones Indirectas. 7.3. Demostraciones por Recurrencia o Inducción Completa. 8. Álgebra de Boole de las Proposiciones. Bibliografía Recomendada.
1/19
AL
TEMA 70 LÓGICA PROPOSICIONAL. EJEMPLOS RAZONAMIENTO MATEMÁTICO.
Y
APLICACIONES
AL
1. INTRODUCCIÓN. La Lógica es una ciencia que trata de ser la teoría formal del razonamiento, por ello es una herramienta muy importante para el análisis de argumentos. Según la Academia de la Lengua, la Lógica es la disciplina que estudia la estructura, fundamento y uso de las expresiones del conocimiento humano. Otra cuestión a tener en cuenta en el estudio de la Lógica es su relación con la Teoría de Conjuntos. Conocida es la posibilidad de establecer un isomorfismo entre ésta y una gran parte de aquella, lo que nos garantiza que muchos teoremas, en cualquiera de las dos teorías, tiene su contrapartida en la otra. Este hecho hace que sea posible la explicación de las dos de manera análoga y simultánea. La Lógica pretende ser una ciencia y por ello tener capacidad de realizar operaciones o cálculos de modo preciso. Para conseguirlo se requiere la confección de un lenguaje artificial que, contando con reglas explícitas, permita usar componentes y combinarlos para formar enunciados. Una primera área del estudio de la lógica es la lógica de proposiciones, que trata de las combinaciones de variables en proposiciones arbitrarias. Estas variables se llaman variables lógicas o proposicionales. Estas variables pueden asumir los dos valores de la lógica clásica, los de verdad o falsedad. En lógica de proposiciones se pueden producir nuevas proposiciones aplicando las fórmulas lógicas a las proposiciones existentes. El interés de la lógica de proposiciones está en el estudio de estas reglas qe permiten producir nuevas variables y proposiciones en función de otras ya conocidas. 2. EL LENGUAJE PARA LA LOGICA DE PROPOSICIONES. Vamos a definir un lenguaje que nos permita representar las fórmulas sentenciales para su estudio. Esto supone definir los símbolos que utilizaremos y las reglas de cómo utilizar estos símbolos para formar fórmulas sentenciales correctas, es decir, la sintaxis de nuestro lenguaje, así como la semántica, asignación de un significado lógico a las sentencias. En la lógica de proposiciones los enunciados declarativos del tipo: Está lloviendo Antonio corre Clara aprueba pueden ser verdaderos o falsos, pero no las dos cosas a la vez.
2/19
DEF Llamaremos proposición a un enunciado declarativo que puede ser verdadero o falso pero no ambas cosas a la vez. 2.1. Sintaxis. El primer paso en el estudio de un lenguaje es definir los símbolos básicos que lo constituyen, el alfabeto, y cómo se combinan para formar sentencias, es decir, la sintaxis o estudio de los signos como puras y simples figuras, independientemente de lo que designan y significan, y las relaciones de los signos entre sí. El alfabeto con el que vamos a trabajar es el siguiente: • Los símbolos de Verdadero, V ó 1, y Falso, F ó 0. • Los símbolos que representan variables proposicionales, p, q, r, s, ... • Los símbolos que representan las conjunciones y/o los adverbios, que en lógica denominaremos conectivas, tales como ‘no’, ‘y’, ‘o’, ‘o..o...’, ‘si...entonces...’, ‘si y solo si’, y que son representadas mediante ‘¬’, ‘∧’, ‘∨’, ‘⊕’, ‘→’, ‘↔’. • Los símbolos de puntuación como ‘(‘, ‘)’, utilizados para evitar ambigüedades. La conectiva ¬ es unitaria, pues sólo actúa sobre un operando, el cual se coloca detrás de la conectiva. El resto de las conectivas son binarias, pues operan sobre dos operandos. 2.1.1. Reglas de Formación. Una secuencia finita de símbolos de variables proposicionales, conectivas y paréntesis forman una fórmula sentencial. Por ejemplo: )∨ p¬→( p ∧ ( q∨ ¬r)→ s son fórmulas sentenciales. Aunque la única que significa algo es la segunda, por lo tanto sólo esta expresión es una sentencia. Diremos que la segunda expresión es una fórmula sentencial bien formada (o símplemente fbf), mientras que la primera es una fórmula sentencial mal formada. La diferencia entre ambas es sintáctica, siendo la segunda la única que puede tener significado. Para poder obtener fórmulas bien formadas, hemos de tener en cuenta las llamadas reglas de formación. Son tres: 1) Una variable proposicional es una fbf. 2) Una fbf precedida de la negación (¬) es una fbf. 3) Dos fbf unida por una conectiva binaria constituye una fbf. Ejemplos de fbf es p ; ¬p ; ¬(p∧q) ; [¬p∨(q↔p)]
3/19
Las reglas de formación se pueden relajar para facilitar la lectura y la escritura. Así tenemos: • • •
Se pueden omitir los paréntesis que encierran una sentencia completa. El estilo tipográfico de los paréntesis se puede variar para hacerlos más evidentes. A las conjunciones y disyunciones se les puede permitir tener más de dos argumentos: p∧q∧r.
2.1.2. Conectivas. Las conectivas las dividimos en conectivas singulares y binarias, dependiendo de que se apliquen a una única sentencia o a dos. a) Negación. Es la única conectiva singular. La simbolizamos por medio de ‘¬’ precediendo a la variable proposicional o sentencia que niegue. b) Conjunción. La conectiva ‘y’ la simbolizamos con el signo ‘∧’ insertado entre dos variables proposicionales o sentencias, de la forma p∧q, leyéndose ‘p y q’. c) Disyunción. A la conectiva ‘o’ se le dan dos sentidos, los cuales quedan reflejados en el lenguaje ordinario cuando se distingue entre ‘o’ y ‘o...o...’. El primero corresponde a ‘o bien p, o bien q, o ambas’. Es la llamada disyunción inclusiva. El segundo corresponde a ‘o bien p o bien q, pero no ambas’. Es la disyunción exclusiva. La disyunción inclusiva la simbolizamos por el símbolo ‘∨’ insertado entre las dos sentencias, p∨q, leyéndose ‘p o q’. La disyunción exclusiva la simbolizamos con el signo ‘⊕’, insertado entre dos sentencias, p⊕q, y se lee ‘o p o q’ d) Condicional. La conectiva ‘si...entonces...’ la simbolizamos mediante ‘→’ insertado entre dos sentencias, p→q, y se lee ‘si p entonces q’. La primera sentencia del condicional, p, recibe el nombre de antecedente. La segunda, q, consecuente. Hemos de advertir que no debemos de confundir el condicional con la implicación.
4/19
e) Bicondicional. El bicondicional o conectiva ‘...si y sólo si...’ se simboliza mediante ‘↔’. 2.2. Semántica. Hasta ahora hemos presentado la sintaxis o forma de las sentencias de la lógica proposicional. Ahora, le vamos a asignar a cada sentencia un valor de verdad, ‘V’ si es verdadera y ‘F’ si es falsa. La asignación de unos valores concretos de verdad a cada variable proposicional y a cada sentencia corresponde a una interpretación. Hemos de tener en cuenta que a todas las ocurrencias de una variable proposicional se les asigna el mismo valor dado por la interpretación. 2.2.1. Tablas de Verdad. Dada una interpretación para una sentencia, podemos determinar su valor de verdad bajo esta interpretación aplicando ciertas reglas que dan significado a las conectivas que la constituyen. Para ello partiremos del principio de que el valor de verdad de cualquier sentencia está determinado por los valores de verdad de cada variable proposicional que la compone. Para determinar el valor de verdad de una sentencia para una interpretación determinada, nos podemos ayudar de las denominadas tablas de verdad. La Tabla de Verdad de una sentencia es una tabla en la que se presentan todas las posibles interpretaciones de las variables proposicionales que constituyen la sentencia y el valor de verdad de la sentencia para cada interpretación. Corresponden a un modo mecánico de determinar la verdad o falsedad de una sentencia dada una interpretación de las variables proposicionales que la constituyen. En la tabla siguiente resumimos las seis tablas de verdad de las seis conectivas vistas p V V F F
q V F V F
¬p F F V V
p∧ ∧q V F F F
p∨ ∨q V V V F
p⊕ ⊕q F V V F
p→ →q V F V V
p↔ ↔q V F F V
Cada una de las filas de esta tabla corresponde a una interpretación de las variables proposicionales p y q. Las tablas de verdad no se confinan sólo a la expuesta anteriormente, sino que se hacen tablas de verdad para comprobar mecánicamente los valores de verdad de cualquier sentencia. Por ejemplo, la sentencia (p→q)→((¬p)→(¬q)) 5/19
tendrá cuatro posibles interpretaciones. Para construir la tabla de verdad, en las columnas de la izquierda ponemos los valores de verdad de p y q para cada una de las cuatro posibles interpretaciones. Para cada una de dichas interpretaciones, vamos poniendo en columnas sucesivas los valores de verdad de cada una de las subsentencias que la constituyen. La última columna de la derecha tendrá los valores de verdad de la sentencia en su conjunto. p V V F F
q V F V F
p→ →q V F V V
¬p F F V V
¬q F V F V
(¬ ¬ p)→ → (¬ ¬ q) Sentencia V V V V F F V V
También se pueden construir tablas de verdad para sentencias que contengan más de dos variables proposicionales. Sólo hemos de tener en cuenta que tendremos 2n interpretaciones, siendo n el número de variables proposicionales de la sentencia. 2.2.2. Equivalencia. DEF Diremos que dos sentencias son Equivalentes si tienen los mismos valores de verdad para cualquier interpretación, es decir, si sus tablas de verdad son iguales. La equivalencia la representaremos mediante el símbolo ‘≡’ PROP La relación anterior definida entre dos sentencias verifica las propiedades Reflexiva, Simétrica y Transitiva, siendo una relación de Equivalencia. Esta relación de equivalencia permitirá catalogar todas las sentencias en clases de equivalencia. Así, para todo el conjunto infinito de sentencias con dos variables proposicionales, su tabla de verdad corresponderá a una de las dieciséis clases de equivalencia que existen para ese tipo de sentencias. 2.2.3. Tautologías y Contradicciones. Cada una de las clases de equivalencia que surgen de la relación anterior pueden contener valores verdaderos y falsos, sólo verdaderos o sólo falsos. DEF Diremos que una sentencia es indeterminada si tiene interpretaciones verdaderas para unos casos y falsas para otros. Por ejemplo, la sentencia p∨q es indeterminada, ya que su valor final depende de que interpretación le demos a p y a q. DEF Diremos que una sentencia es una tautología si todas sus interpretaciones son verdaderas. Son tautologías las sentencias p∨(¬p) cuya demostración dejamos como ejercicio. 6/19
((p→q)∧ (q→r)) →(p→r)
DEF Diremos que una sentencia es una Contradicción si todas sus interpretaciones son falsas. Ejemplos de contradicciones son p ∧ ( ¬ p )
¬[ ( p ∧ q ) → p ]
3. VALIDACIÓN DE SENTENCIAS PROPOSICIONALES. Un problema importante para cualquier sistema lógico es el problema de encontrar un procedimiento efectivo para verificar la validez o tautología de una sentencia bien formada. Procedimiento que no es posible para todos los sistemas lógicos. El problema de encontrar un procedimiento de validación de las sentencias bien formadas se denomina Problema de Decisión. Para los sistemas en que se puede encontrar un procedimiento de decisión, se dice que el problema es Resoluble y el sistema Decidible. Para los sistemas en que no se puede encontrar un procedimiento de decisión se dice que el problema de decisión es Irresoluble y el sistema es Indecidible. La lógica de proposiciones es un sistema decidible. De hecho se conocen varios procedimientos de decisión, entre los que podemos destacar • • •
Validación mediante tablas de verdad Árboles Semánticos. Refutación.
El último de los procedimientos es muy conocido en matemáticas, pues consiste en suponer falsa la sentencia a validar, y ver si ello supone una contradicción. 4. LEYES DE LA LÓGICA DE PROPOSICIONES. Existen un número infinito de Tautologías. Ahora bien, del infinito número de tautologías posibles, hay algunas que son especialmente útiles para los procesos de deducción. Éstas las agruparemos por afinidad y les damos el nombre de leyes o teoremas. 1) Ley de identidad: p→p p↔p indica que cualquier sentencia es equivalente a ella misma. 2) Ley de la doble negación: p↔¬¬p indica la equivalencia entre una sentencia y la negación de su negación.
7/19
3) Ley del tercio excluso: p∨¬p indica que siempre se verifica una sentencia o su negación. 4) Ley de contradicción: ¬(p∧¬p) es la contraposición a la anterior, nunca se puede verificar a la vez una sentencia y su negación. 5) Leyes de Morgan: ¬(p∧q)↔(¬p∨¬q) ¬(p∨q)↔(¬p∧¬q) Estas leyes fueron conocidas por Occam e indican que la negación de una conjunción se puede transformar en una disyunción de negaciones, y que la negación se puede transformar en una conjunción de negaciones. 6) Ley de reducción al absurdo: (¬p→(q∧¬q))↔p utilizada para demostrar una conclusión partiendo de la negación de la misma. 7) Leyes de conmutación: (p∨q)↔(q∨p) (p∧q)↔(q∧p) (p↔q)↔(q↔p) indican que los términos de conjunciones, disyunciones y bicondicionales se pueden conmutar. 8) Leyes de asociación: ((p∧q)∧r)↔(p∧(q∧r)) ((p∨q)∨ r)↔(p∨ (q∨r)) ((p↔q)↔ r)↔(p↔ (q↔r)) indican que los términos de conjunciones, disyunciones y bicondicionales se pueden agrupar como se quiera. 9) Leyes de transposición: (p→q)↔(¬q→¬p) (p↔q)↔(¬q↔¬p) indican que los términos de un condicional y de un bicondicional se pueden intercambiar si se les hace preceder de la negación. 10) Leyes distributivas: (p∧(q∨r))↔((p∧q)∨(p∧r))
8/19
(p∨(q∧r))↔((p∨q)∧ (p∨r)) (p→(q∧r))↔((p→q)∧ (p→r)) (p→ (q∨r))↔((p→q)∨(p→r)) indican que una conjunción se puede distribuir en una disyunción; que una disyunción se puede distribuir en una conjunción; y que un condicional se puede distribuir tanto en una conjunción como en una disyunción. 11) Ley de permutación: (p→(q→r))↔(q→ (p→r)) indica que el antecedente del consecuente de un condicional se puede intercambiar por el antecedente. 12) Ley del silogismo: (p→q)→((q→r)→(p→r)) 13) Silogismo hipotético o transitividad: ((p→q)∧(q→r))→(p→r) ((p↔q)∧(q↔r))→(p↔r) muestra la transitividad del condicional. 14) Leyes de inferencia de la alternativa o de los silogismos disyuntivos: [¬p∧(p∨q)]→q [p∧(¬p∨¬q)]→¬q 15) Ley del dilema constructivo: [(p∨q)∧(p→r)∧(q→r)]→r 16) Segunda ley del dilema constructivo: [((p→q)∧(r→s))∧(p∨r)]→(q∨s) 17) Ley del dilema destructivo: [(¬p∨¬q)∧(r→p)∧(s→q)]→(¬r∨¬s) las tres últimas leyes (15, 16 y 17), y sobre todo la ley del dilema constructivo, eran muy usadas en la antigua retórica y todavía son muy comunes en las discusiones para poner al adversario en un aprieto. 18) Ley de exportación: [(p∧q)→r]↔[p→(q→r)]
9/19
indica que una parte del antecedente de un condicional puede pasar al consecuente mediante un cambio de conectiva. 19) Ley de resolución: [(¬p∨q)∧(p∨r)]→(q∨r) esta ley nos permite eliminar las sentencias contradictorias. La usaremos para automatizar el proceso de deducción. 20) Ley del bicondicional: (p↔q)↔[(p→q)∧(q→p)] indica que un bicondicional se puede transformar en un par de condicionales. 21) Condicional-disyunción: (p→q)↔(¬p∨q) muestra la equivalencia entre un condicional y una disyunción. 22) Condicional-conjunción: (p→q)↔¬(p∧¬q) muestra la equivalencia entre un condicional y la negación de una conjunción. 23) Leyes de simplificación: (p∧q)→p p→(p∨q) indican que una conjunción implica cualquiera de sus términos competentes; y que una disyunción está implicada por cualquiera de sus términos componentes. 24) Leyes de expansión: (p→q)↔[p↔(p∧q)] (p→q)↔[q↔(p∨q)] indican que los condicionales se pueden transformar en bicondicionales. 25) Modus ponendo ponens: [(p→q)∧p]→q según el cual se puede afirmar el consecuente de un condicional si se afirma su antecedente. 26) Modus tollendo tollens: [(p→q)∧¬q]→¬p según el cual se puede negar el antecedente de un condicional si se niega su consecuente.
10/19
5. SISTEMA AXIOMÁTICO DEL CÁLCULO DE PROPOSICIONES. Podemos formalizar la lógica de proposiciones transformando el lenguaje lógico en un cálculo. Entendemos por Cálculo la estructura formal de un lenguaje, abstrayendo el significado. Al ser el cálculo un sistema de signos no interpretados, su estudio pertenece a la sintaxis. Cuando se les da un significado a los signos, el cálculo se transforma en lenguaje, y su estudio pertenece a la semántica. Cuando el cálculo se construye sobre la base de unos axiomas, se dice que es cálculo es un Sistema Axiomático. Axiomas son construcciones que se admiten como verdaderas en todos los lenguajes que se pueden formalizar a partir de ese cálculo. La idea básica de construir un sistema axiomático es elegir como axiomas unas pocas sentencias bien formadas que junto a unas reglas sirvan de puntos de arranque para deducir otras sentencias bien formadas, denominadas teoremas o leyes. Tales reglas son llamadas Reglas de Transformación. Algunas veces a los teoremas se les denominan tesis, y otras veces la palabra teorema se usa tanto para los axiomas como para los teoremas. Por tanto, para definir un sistema axiomático tenemos que especificar: • • • •
Un Alfabeto. Un conjunto de reglas de formación. Una lista de sentencias bien formadas seleccionadas como axiomas. Una o más reglas de transformación.
En un sistema axiomático la demostración de una fbf es una secuencia de fbf, de las cuales la última es la sentencia que queremos demostrar, y cada una de las fbf de la secuencia es a su vez un axioma o es derivada de algún axioma o teoremas ya existentes. Una sentencia bien formada (o fórmula bien formada, fbf) es un teorema si y sólo si hay una demostración de la misma en el sistema axiomático. Probablemente, el sistema axiomático mejor conocido en el cálculo de proposiciones es el derivado del Principio Mathematica de Alfred North Whitehead y Bertrand Russell (1910), denominado PM. El sistema PM se compone de
• Alfabeto.
ÿ Los átomos V y F. ÿ Los símbolos proposicionales p, q, r, ... ÿ Los símbolos de conectivas ¬ y ∨. ÿ Los símbolos ‘(‘ y ‘)’. • Reglas de Formación ÿ Un símbolo proposicional es una fbf. ÿ Dada una fbf, su negación también lo es. ÿ Dadas dos fbf, su disyunción también lo es.
11/19
• Axiomas.
ÿ (p∨ p)→p ÿ q→(p∨ q) ÿ ( p ∨ q ) → ( q∨ p ) ÿ (p→q)→[(r∨ p)→(r∨ q)] • Reglas de Transformación. ÿ Regla de Sustitución (Sust.). El resultado de reemplazar cualquier variable en un teorema por una sentencia bien formada es un teorema. ÿ Regla de Separación. (Sep.) Si S y S→R son teoremas, entonces R es un teorema. Tengamos en cuenta que sólo utilizamos dos conectivas porque el resto se pueden poner en función de éstas según las siguientes equivalencias, demostrables mediante tablas de verdad: p ∧ q≡ ¬(¬p ∨ ¬q) p→q≡¬p∨ q p ↔ q ≡ ( p → q ) ∧ ( q → p ) ≡ ( ¬p ∨ q ) ∧ ( ¬q ∨ p) p⊕q≡¬(p↔q) Relativo a un criterio de validación, un sistema axiomático debe cumplir las siguientes propiedades. • • • •
Debe ser lógico o razonable, en el sentido de que todo teorema es una tautología. Completo. Toda sentencia bien formada válida es un teorema y se debe poder demostrar a partir de los axiomas. Consistente. No se pueden demostrar como teoremas fbf que no sean tautologías. Así, si una fbf es un teorema, su negación no lo es. Por último, los axiomas y las reglas de transformación deben ser independientes, es decir, ningún axioma (regla de transformación) debe ser derivable a partir de los otros.
Se puede comprobar que el sistema PM, tal y como lo hemos definido, verifica las propiedades anteriores. Ejemplo. Demostrar que ( p → q ) → [( r → p ) → ( r → q )] es un teorema del sistema PM. 1 (p→q)→[(r∨ p)→(r∨ q)] 2 ( p → q ) → [ ( ¬r ∨ p ) → ( ¬r ∨ q ) ] 3 (p→q)→[(r→p)→(r→q)]
Axioma 4 Sustituimos r por ¬r Definición del Condicional
6. SISTEMA INFERENCIAL DEL CÁLCULO DE PROPOSICIONES.
12/19
La lógica se presenta, muchas veces, como una herramienta para analizar los procesos de razonamiento del lenguaje ordinario. Así, el cálculo de proposiciones se presenta como el Método de Deducción Natural. El cual consiste en un grupo de reglas que nos permiten deducir unas conclusiones a partir de unas hipótesis. Esto es lo que llamamos un sistema inferencial. En un sistema inferencial llamamos inferencias a los procesos mediante los cuales obtenemos una conclusión a partir de unas premisas de forma que el razonamiento sea válido. Una regla de inferencia es la declaración de las condiciones bajo las cuales se puede hacer una inferencia, así como el resultado de la misma. Una inferencia que siga las reglas será una inferencia correcta, mientras que si no las sigue será una inferencia incorrecta. En muchos tratados lógicos podemos encontrar que a la conclusión se la denomina consecuencia lógica de las premisas. Formalmente podemos decir que C es una conclusión o consecuencia lógica de las premisas P1 , P2 , P3 , ..., Pn si y sólo si para cualquier interpretación I para la que P1∧P2∧P3∧...∧Pn es verdadera, C también es verdadera. Se puede demostrar que C es una conclusión o consecuencia lógica de las premisas P1 , P2 , P3 , ..., Pn si y sólo si la sentencia P1∧P2∧P3∧...∧Pn → C es una tautología. O bien, si y sólo si la sentencia P1∧P2∧P3∧...∧Pn∧¬C es una contradicción. 6.1. Reglas de Inferencia. Podemos considerar tantas reglas de inferencia como leyes del cálculo de proposiciones tengamos, es decir, infinitas, ya que a cada ley le corresponde una regla de inferencia. Pero aunque sean formas diferentes de decir lo mismo, no hay que confundirlas. Una ley es una sentencia bien formada que pertenece al lenguaje del cálculo de proposiciones y corresponde al enunciado de una sentencia válida de inferencia. Una regla es el enunciado de una instrucción para realizar una inferencia válida. Aunque hay infinitas reglas de inferencia, en los tratados de lógica se presentan conjuntos seleccionados de reglas como sistemas de deducción natural. Así, hemos seleccionado las siguientes reglas de inferencia.
13/19
a) Regla de Separación. También llamada regla del Modus Ponens y conocida como regla de eliminación del condicional. (RE→). Corresponde a la ley del modus ponens y la formulamos de la siguiente forma: Si un condicional y su antecedente se toman como premisas, se puede inferir el consecuente como conclusión S→R S R b) Regla de Unión. Conocida también como Regla de la Introducción de la conjunción Si dos sentencias se toman como premisas, se puede inferir su conjunción como conclusión. S R S∧R Esta regla parece “intuitivamente” evidente, nada más “natural” que afirmar la conjunción de dos sentencias si se han afirmado ya separadamente las dos sentencias. Sin embargo, un examen más detallado de la cuestión nos mostraría que la noción de “intuición” es ajena a la de prueba y que es necesario en lógica que cada etapa de una inferencia sea justificada por una regla. c) Regla de Inserción. Cualquier ejemplo de tautología puede servir de premisa en cualquier inferencia proposicional. Por ejemplo S→R R→T S→T es un razonamiento cuya conclusión no puede ser derivada de unas premisas sino gracias a la regla de inserción. La regla de unión nos permite deducir de las dos premisas anteriores (S→T)∧(R→T) pero no nos permite deducir la conclusión. No obstante, la regla de inserción nos permite insertar como premisa suplementaria la ley de transitividad [( S→T ) ∧ ( R→T )] → ( S→T ) y con la regla de separación nos permite deducir la conclusión.
14/19
d) Regla de Intercambio. Si se da un bicondicional como premisa, se puede inferir como conclusión el resultado de intercambiar sus componentes en cualquier otra premisa. S→R R↔T S→T 6.2. Proceso de Inferencia. Con ayuda de las tautologías enumeradas en el apartado 4 y de las cuatro reglas de inferencia anteriores podemos realizar inferencias en la lógica de proposiciones. El proceso de inferencia se efectúa según las normas siguientes 1) Se simbolizan los enunciados y las conectivas, procurando uniformar el lenguaje. 2) Se indican en líneas separadas las premisas precedidas de la letra ‘P’ (P1, P2, ...). 3) Se procede a derivar la conclusión a partir de las premisas. Cada fórmula se escribe en una línea aparte, indicándose a la derecha de la misma la inferencia y/o tautología que permite deducirla. 4) Se indica la conclusión precedida de la letra ‘C’. Ejemplo. Supongamos que nos dan las dos premisas siguientes: Si Rivaldo juega, el Barcelona gana Si Rivaldo no juega, el Barcelona pierde. y nos piden concluir que El Barcelona gana o pierde. 1) Sean las proposiciones: J: Rivaldo juega. G: El Barcelona Gana P: El Barcelona Pierde 2) 3) y 4) P1 J → G P2 ¬J → P 3 J ∨ ¬J 4 [((J→G)∧(¬J→P))∧(J∨¬J)]→(G∨J) 5 (J→G)∧(¬J→P) 6 ((J→G)∧(¬J→P))∧(J∨¬J) C G∨P
15/19
Premisa 1 Premisa 2 Regla de Inserción (Tercio Excluso) Regla de Inserción (Dilema) Regla de Unión de P1 y P2 Regla de Unión de 3 y 5 Regla de Separación de 4 y 6
Este no es el único conjunto de reglas de inferencia que se puede seleccionar. Sea cual sea el conjunto de reglas de inferencia seleccionado, no es fácil su aplicación de una forma automática. Para cada problema es preciso tener una cierta habilidad o conocimiento, expresado en forma de metarreglas, para saber en qué orden aplicar las reglas y a qué premisas. En cualquier caso, el conjunto de reglas que se utilicen debe ser consistente y completo. Estos conceptos son paralelos a los definidos para un sistema axiomático. Un sistema inferencial es completo si para cualquier conjunto de premisas el sistema infiere toda conclusión que pueda deducirse de las premisas. Un sistema inferencial es Consistente si para cualquier conjunto de premisas, toda conclusión que infiera el sistema también se deduce de las premisas. 7. LA DEMOSTRACIÓN EN MATEMÁTICAS. Las Matemáticas utilizan términos del lenguaje ordinario y otros específicos. Hay de dos clases: • •
Términos Primitivos. Los que se introducen con sólo enunciarse, es decir, sin definición. Por ejemplo: elemento, propiedad, conjunto. Términos Definidos: Los que se introducen dando unas propiedades características. Por ejemplo: Grupo, triángulo, etc.
También se usan dos tipos de proposiciones: • •
Axiomas o postulados. Proposiciones cuya veracidad se establece por convenio. Por ejemplo, el postulado de Euclides. Teoremas. Proposiciones en las que una proposición llamada conclusión o tesis resulta ser consecuencia lógica de otras llamadas premisas o hipótesis. El paso de unas a la otra se llama demostración.
Una ciencia cuyos métodos de demostración pertenecen a la lógica se dice que está formalizada. La Matemática es la ciencia formalizada por excelencia. Las principales demostraciones matemáticas son: • • •
Directas. Indirectas o por reducción al absurdo. Por recurrencia o Inducción Completa.
7.1. Demostraciones Directas. Son las demostraciones más frecuentes. Consisten en razonamientos por los cuales se puede pasar de la hipótesis a la tesis mediante la consideración de definiciones, axiomas y proposiciones anteriormente establecidas y combinadas según la regla de inferencia del silogismo. Los teoremas que se demuestran así se llaman directos. 16/19
Si la demostración es válida, se dice que son ciertos y que: • •
P es condición suficiente para que se verifique C C es condición necesaria para que se verifique P
Es decir
P⇒C
Diremos que un teorema es Recíproco de otro dado si tiene por hipótesis la tesis del primero y por tesis la hipótesis del primero. Es decir C’ = P y P’ = C Si la demostración del teorema recíproco es válida diremos que el recíproco es cierto y que • •
P es condición necesaria para que se cumpla C C es condición suficiente para que se cumpla P.
Es decir
C⇒P
La certeza de un teorema no implica la de su recíproco, excepto si caben diversas hipótesis que se excluyan mutuamente y se completen. Si fueran ciertos los dos, diremos que • •
P es condición necesaria y suficiente para C C es condición necesaria y suficiente para P.
Es decir
C⇔P
Diremos que un teorema es contrario a uno dado si tiene por hipótesis (P’’) la negación del otro y por tesis (C’’) la negación del otro. Es decir
P’’ = ¬P
y
C’’ = ¬C
Diremos que un teorema es contrarrecíproco de uno dado si tiene por hipótesis (P’’’) la negación de la tesis del otro y por tesis (C’’’) la negación de la hipótesis del otro. Es decir
P’’’ = ¬ C
y
C’’’ = ¬P
Comparando entre sí los teoremas recíproco y contrario de uno dado, se observa que son mutuamente contrarrecíprocos. Ejemplo. • • •
Directo. En un triángulo rectángulo se verifica que h2 = a2 + b2 . Recíproco. Si h2 = a2 + b2 entonces el triángulo es rectángulo. Contrario (del directo). Si el triángulo no es rectángulo entonces h2 ≠ a2 + b2
17/19
•
Contrarrecíproco. Si h2 ≠ a2 + b2 entonces el triángulo no es rectángulo.
7.2. Demostraciones Indirectas. Son llamadas también demostraciones por reducción al absurdo. Se basan en la equivalencia de dos teoremas contrarrecíprocos entre sí. A veces conviene aprovechar esta equivalencia y en lugar de demostrar un teorema, demostrar su contrarrecíproco.
7.3. Demostraciones por Recurrencia o Inducción completa. En las Ciencias Experimentales, de una serie más o menos grande de observaciones se establece una ley general (se induce) que abarca a todas las observaciones análogas. También la Matemática generaliza (induce), pero de modo distinto. No se contenta con comprobar una ley en determinados casos particulares. Por muchos que sean, hay que comprobarlos para todos. Para ello se aplica el siguiente principio lógico, llamado de inducción completa, o de recurrencia, que consiste en: 1) Comprobar que la ley es cierta para un primer valor de n. 2) Suponer que es cierta para un cierto valor n’ 3) Comprobar que es cierta para el siguiente, n’+1 8. ÁLGEBRA DE BOOLE DE LAS PROPOSICIONES. Definamos el conjunto C formado por todas las fórmulas lógicas. Podemos definir en C las operaciones internas de negación ‘¬’, Conjunción ‘∧’ y Disyunción ‘∨’. Si construimos las correspondientes tablas de verdad, podemos demostrar sin problemas que se verifican las siguientes propiedades: • • • • • • • • • • •
Idempotencia de ∧: p ∧ p⇔ p Complementaria de ∧: p ∧ (¬p) ⇔ λ (λ es la proposición falsa universal) Conmutativa de ∧: p ∧ q⇔ q∧ p Asociativa de ∧: p ∧ (q ∧ r) ⇔ (p ∧ q) ∧ r Elemento absorbente de ∧: p ∧ λ ⇔ λ Elemento neutro de ∧: p ∧ τ ⇔ p (τ es la proposición verdadera universal) Simplificativa de ∧ respecto de ∨: p ∧ (p ∨ q) ⇔ p Distributiva de ∧ respecto de ∨: p ∧ (q ∨ r) ⇔ (p ∧ q) ∨ (p ∧ r) Idempotencia de ∨: p ∨ p⇔ p Complementaria de ∨: p ∨ (¬p) ⇔ τ Conmutativa de ∨: p ∨ q⇔ q∨ p
18/19
• • • • • • • •
Asociativa de ∨: p ∨ (q ∨ r) ⇔ (p ∨ q) ∨ r Elemento absorbente de ∨: p ∨ τ ⇔ τ Elemento neutro de ∨: p ∧ λ ⇔ p (τ es la proposición verdadera universal) Simplificativa de ∨ respecto de ∧: p ∨ (p ∧ q) ⇔ p Distributiva de ∨ respecto de ∧: p ∨ (q ∧ r) ⇔ (p ∨ q) ∧ (p ∨ r) 1ª Ley de Morgan: ¬( p ∧ q ) ⇔ ¬p ∨ ¬q 2ª Ley de Morgan: ¬( p ∨ q ) ⇔ ¬p ∧ ¬q Doble negación Involutiva: ¬(¬p) ⇔ p
El conjunto C con las tres operaciones internas definidas verificando las propiedades anteriores tiene estructura de Álgebra de Boole.
BIBLIOGRAFÍA RECOMENDADA. Introducción a la Lógica Matemática. Aut.: P. Suppes y S. Hill. Edit.: Reverté Elementos de Lógica Teórica. Aut.: D. Hilbert y W. Ackermann. Edit.: Tecnos Introducción a la Lógica Formal. Aut.: A. Deaño. Edit.: Alianza Fundamentos de Lógica Matemática. Aut.: j. Aranda y Varios. Edit. Sanz y Torres.
19/19
TEMAS DE MATEMÁTICAS (Oposiciones de Secundaria) TEMA 71 LA CONTROVERSIA SOBRE LOS FUNDAMENTOS DE LA MATEMÁTICA. LAS LIMITACIONES INTERNAS DE LOS SISTEMAS FORMALES. 1. Las Paradojas. 1.1. Paradojas Lógicas. 1.2. Paradojas Semánticas. 1.3. Observaciones. 2. El Logicismo. 2.1. El principio de círculo vicioso. 2.2. La reducción de los términos matemáticos en términos lógicos. 3. El formalismo. 3.1. El programa de Hilbert. 3.1.1. Elaboración del sistema formal. 3.1.2. Teoría de la demostración. 4. El intuicionismo. 4.1. La lógica intuicionista. 4.2. Comparación con el logicismo 4.3. Comparación con el formalismo. Bibliografía Recomendada
1/10
TEMA 71 LA CONTROVERSIA SOBRE LOS FUNDAMENTOS DE LA MATEMÁTICA. LAS LIMITACIONES INTERNAS DE LOS SISTEMAS FORMALES. 1. LAS PARADOJAS. El término paradoja viene del griego (para y doxos) y significa "más allá de lo creíble". En la actualidad la palabra "paradoja" tiene numerosos significados: 1) Afirmación que parece falsa, aunque en realidad es verdadera. 2) Afirmación que parece verdadera, pero en realidad es falsa. 3) Cadena de razonamientos aparentemente impecables, que conducen sin embargo a contradicciones lógicas. (Las paradojas de esta clase suelen llamarse falacias.) 4) Declaración cuya veracidad o falsedad es indecible. 5) Verdad que se vuelve patas arriba para llamar la atención. Las paradojas matemáticas, como las científicas, pueden ser mucho más que amenidades, y llevarnos hasta nociones muy profundas. A los primeros pensadores griegos les resultaba tan paradójico como insoportable que la diagonal de un cuadrado de lado unidad no pudiera ser medida exactamente por finas que se hicieran las graduaciones de la regla. Este hecho perturbador sirvió para abrir el vasto dominio de los números irracionales. Los matemáticos del siglo pasado encontraban enormemente paradójico que todos los miembros de un conjunto infinito puedan ponerse en correspondencia biunívoca con los miembros de algún subconjunto del dado, mientras por otra parte podían existir conjuntos infinitos entre los cuales es imposible establecer una correspondencia biunívoca. Tales paradojas condujeron a desarrollar la moderna teoría de conjuntos, que a su vez ha ejercido profunda influencia sobre la filosofía de la ciencia. Mucho podemos aprender de las paradojas. Al igual que los buenos trucos de ilusionismo, nos causan tanto asombro que inmediatamente queremos saber como se han hecho. Los ilusionistas no revelan jamás como hacen lo que hacen, pero los matemáticos no tienen necesidad de guardar el secreto. Después del descubrimiento de las geometrías no euclídeas, ningún hecho ha influido de forma tan importante en el desarrollo de los fundamentos de la Matemática como la aparición de las paradojas. Las paradojas estimularon los esfuerzos de los matemáticos para que las explicaran y superaran. Además, era un punto muy delicado con el que en adelante tenían que enfrentarse todas las teorías de fundamentación de la Matemática. 1.1. Paradojas Lógicas. Entre las primeras, cronológicamente hablando, tenemos la paradoja de Cantor (1899). Cantor fue el creador de la teoría de conjuntos. Sea U el conjunto universal, es decir, el conjunto formado por todos los conjuntos. Sea P(U) el conjunto de las partes de U, o lo que es lo mismo, el conjunto formado por todos los subconjuntos de U.
2/10
El teorema de Cantor dice que el cardinal de un conjunto es menor que el cardinal del conjunto formado por todos los subconjuntos de dicho conjunto. Es decir |U| < |P(U)|
(1)
Pero como P(U) es un conjunto se debe verificar que P(U) ⊂ U verificándose que |P(U)| ≤ |U|
(2)
Y aquí nos encontramos con la paradoja, ya que no puede suceder de forma simultánea (1) y (2). Probablemente la paradoja más conocida corresponde a B. Russell, publicada a comienzos del siglo XX, y que ha dado lugar a numerosas variantes. Para que se pueda entender la paradoja, tengamos en cuenta que existen clases o conjuntos que pueden pertenecer a sí mismos. Por ejemplo, el conjunto de todos los conjuntos debe ser un elemento de sí mismo, al ser otro conjunto. De forma análoga, podemos indicar que si colocamos en un armario un catálogo de tapas azules que cataloga todos los libros de tapas azules, deberá catalogarse a sí mismo. Sea W el conjunto de todos los conjuntos C que no se pertenecen a sí mismos. entonces tendremos que C∈W ⇔ C∉C Pero entonces W∉W lo cual significa que W∈W. Recíprocamente, si W∈W, ha de verificarse que W∉W. En cualquier caso, ha de verificarse de forma simultánea que W pertenece y no pertenece a W. 1.2. Paradojas Semánticas. La paradoja de Richard (1905) se refiere a la imposibilidad de una enumeración de las funciones de la teoría de números, a pesar de la aparente posibilidad de llevarlo a cabo. Se consideran las funciones f tales que a todo número natural n se le hace corresponder un número natural f(n). Supongamos que para escribir correctamente en castellano sean necesarios y suficientes 35 signos (entre letras, acento, espaciado y demás símbolos de puntuación). Entonces, una expresión con m signos no es más que una combinación con repetición de los 35 signos. Es claro que todas estas expresiones (con una cantidad finita de signos) se pueden ordenar, comenzando con los formados por un solo signo, después los de dos, y así sucesivamente, siguiendo el orden lexicográfico.
3/10
Una vez ordenadas todas las expresiones en correcto castellano hacemos una lista, es decir, numeramos (manteniendo el orden) con E1 , E2 , ... todas aquellas que definan una función en la teoría de números y suprimimos todas las demás expresiones. Llamemos fk (n) la función definida por la expresión Ek . Dado que la sucesión E1 , E2 , ... es infinita, la correspondiente a funciones f1 (n), f2 (n), ... también lo es. Consideremos ahora la siguiente expresión de Richard: “La función que para todo número natural toma, aumentando en una unidad, el valor que para ese mismo número natural toma la función que ocupa en la lista el lugar indicado por este mismo número natural” Es claro que esta expresión es equivalente a la expresión matemática: “La función que para todo número natural n toma el valor fn (n)+1” Ahora bien, la expresión de Richard define una función y, por tanto, ocupa un lugar en la lista. Sea la expresión Ep y sea fp (n) la función correspondiente. Entonces en virtud de la misma definición, resulta que para todo n, fp (n) = fn (n)+1, lo cual es imposible, pues para n=p tendría que ser fp (p)=fp (p)+1. La paradoja de Berry (1906) surge al considerar las cualidades sintáctica y semántica de la siguiente expresión: “El menor número natural que no puede ser nombrado con menos de treinta sílabas” Resulta que la expresión de Berry nombra en menos de treinta sílabas un número natural que no puede ser nombrado en menos de treinta sílabas. 1.3. Observaciones. Las paradojas lógicas pueden ser formalizadas en sistemas formales lógicos (los cuales deben ser inconsistentes) sin que en estas tengan que figurar términos primitivos ajenos a la teoría de conjuntos. Mientras que las paradojas semánticas para poder ser formalizadas requieren la introducción de algún término como “definir”, “nombrar”, “verdad”, etc que son ajenos a la teoría de números. Para la fundamentación de la matemática, las paradojas semánticas no son peligrosas. De hecho, no pueden ser formalizadas en el lenguaje de la lógica simbólica. Ninguna de las paradojas formuladas tiene una solución trivial. Veremos como las teorías de Logicismo, Formalismo e Intuicionismo evitan caer en las paradojas. 2. EL LOGICISMO. El Logicismo es una doctrina sobre los fundamentos de la matemática que considera la lógica como anterior o más fundamental que la matemática, y efectúa la reducción de
4/10
los conceptos y métodos de inferencia matemática a los correspondientes de la lógica, concluyendo que la matemática no es más que una rama de la lógica, sin duda extensa y con vida propia, pero cuyo método se identifica con el propio método de la lógica. El primero en desarrollarla con considerable extensión y con todo rigor fue G. Frege (1848-1925). Con mayor extensión aun, lo hizo J. Peano (1858-1932). Y finalmente también lo hicieron Whitehead (1861-1947) y B. Russell (1872-1970), que son considerados los introductores del Logicismo. Una de las tareas fundamentales del Logicismo es la reducción de los conceptos matemáticos a conceptos lógicos y de igual manera los teoremas de la matemática deben ser demostrados como teoremas de la lógica. 2.1. El principio de círculo vicioso. Un somero examen de las paradojas nos sugiere inmediatamente que no se ha de poder permitir utilizar, por lo menos en matemáticas y lógica, conjuntos tan grandes y con elementos tan arbitrarios como los conjuntos U y W de Cantor y Russell, que sin embargo satisfacen las precisas condiciones de conjuntos, que estableció Cantor. Sin duda alguna, el análisis del concepto de conjunto, de sus estrictas y justas limitaciones para su empleo en lógica y matemáticas parece ser un problema más difícil que el de evitar las paradojas. Poincaré y Russell vieron que en todas las paradojas hay una especie de círculo vicioso en cuanto que, en todas ellas, hay una definición que contiene lo definido. Uno de los requisitos de toda teoría de los fundamentos ha de ser evitar que puedan surgir paradojas; Russell formuló y guardó el siguiente principio de exclusión de círculo vicioso: “Ninguna totalidad puede contener miembros definibles solamente en términos de esa totalidad, o miembros que impliquen o presupongan esta totalidad. 2.2. La reducción de los términos matemáticos en términos lógicos. Los tres volúmenes de Principia Mathematica de A.N. Whitehead y B. Russell empiezan como si fuera un tratado de lógica avanzada mediante operaciones lógicas y definiciones explícitas hasta dar todos los elementos fundamentales de la matemática. Los autores pretenden que es imposible señalar una línea de separación entre la lógica y la matemática. Ello requiere dos reducciones: la primera es la definición explícita de los términos o conceptos matemáticos mediante términos lógicos y la segunda reducción es reducir los teoremas matemáticos mediante deducciones lógicas o teoremas de la lógica. Las entidades primitivas en las que termina la reducción lógica son en primer lugar los del cálculo proposicional, es decir, las cuatro conectivas lógicas de conjunción, disyunción, negación e implicación y variables proposicionales; luego los
5/10
cuantificadores y las variables del cálculo funcional, es decir, propiedades y relaciones con sus argumentos y finalmente la relación de igualdad. Los axiomas lógicos fundamentales para la reducción lógica de los teoremas son los mismos axiomas del cálculo de predicados; y las dos reglas de inferencia lógica son las de sustitución y de modus ponens o implicación. Los autores de la Principia pretenden logificar todos los teoremas matemáticas en el sentido de reducirlos a proposiciones lógicas verdaderas, formadas exclusivamente por símbolos primitivos lógicos y por otros signos definidos explícitamente, los cuales a su vez pueden ser sustituidas por otras y así sucesivamente hasta poder conseguir que las proposiciones lógicas equivalentes a los teoremas matemáticos contenga solamente los símbolos lógicos primitivos. Ahora bien, para llevar a cabo esta reducción los autores admiten como verdaderos los tres axiomas de infinitud, de selección y de reducibilidad. Este último axioma permite introducir propiedades del primer orden que tengan la misma extensión lógica que propiedades de orden superior, con lo cual se consigue poder formar definiciones predicativas, que sin este axioma serían impredicativas (definiciones que contienen lo definido). Pero este axioma es difícilmente justificable. El postulado de infinitud establece que para todo número natural existe otro mayor. Es obvio que este postulado u otro equivalente o más fuerte ha de figurar en todo sistema axiomático que incluya un tratamiento de números naturales, pero no parece que su admisión constituya una logificación. Finalmente podrían hacerse consideraciones respecto al axioma de selección. Además, el empleo de este axioma parece implicar que si se hiciera la reducción de un teorema matemático a su expresión lógica exclusivamente mediante los símbolos lógicos primitivos se obtendrían expresiones no solo con infinitos símbolos, sino incluso con infinitud no numerable. Esta conclusión tampoco parece satisfactoria y aun menos si se considera desde el punto de vista del logicismo. 3. EL FORMALISMO. D. Hilbert (1862-1943) llevó a cabo la fundamentación de la geometría, especificando claramente su axiomatización, y haciendo patente su consistencia relativa respecto de la aritmética y el análisis. Todas las dificultades en los fundamentos de la matemática nacen del hecho de que en las matemáticas a menudo se hace uso del infinito actual, es decir, que se suponen como existentes y manejables conjuntos que contienen infinitos elementos. No obstante, en la deducción de los teoremas matemáticos si bien es verdad que se maneja el infinito el número de pasos lógicos que se realizan en cualquier demostración de cualquier teorema es necesariamente finito. La idea fundamental de Hilbert al crear la teoría formalista para la fundamentación de la matemática consiste en la intuición de que ha de ser posible establecer más allá de toda duda la validez de las matemáticas clásicas, incluso de las no constructivas,
6/10
apelando al carácter finitista o finitario de las demostraciones matemáticas. Para ello se “idealizarán” las demostraciones matemáticas, algo así como la introducción de puntos en el infinito es una idealización del concepto de punto; los sistemas formales serán precisamente esta idealización simplificadora de las demostraciones matemáticas. Luego, mediante el establecimiento de un criterio, a saber, la consistencia del sistema formal, se establecerá a través de razonamientos finitos y, por tanto, fuera de toda duda, la validez del contenido de todos los teoremas matemáticos. En un sistema axiomático formal los elementos primitivos (símbolos o términos) carecen en absoluto de contenido esencial explícito y son las piezas de un puro juego sin sentido material en sí mismo, cuyo manejo o único sentido formal viene definido implícitamente por las reglas del juego constituidas por los axiomas y las reglas de inferencia. Por tanto, en un sistema formal tendremos términos, fórmulas, demostraciones, teoremas que son diversas combinaciones de los elementos primitivos de acuerdo con ciertas reglas fijas, pero carece de sentido hablar de verdad o falsedad. El juego del ajedrez nos suministra un ejemplo: se puede preguntar si una situación dada es alcanzable (demostrable), pero no parece que tenga sentido preguntar si es verdadera o falsa en sí misma. Es importante tener en cuenta que las matemáticas tratan de entidades existentes y en particular los teoremas de existencia son fundamentales. 3.1. El programa de Hilbert. 3.1.1. Elaboración del sistema formal. En la elaboración de un sistema formal en orden a demostrar la validez de los métodos matemáticos clásicos, podemos distinguir tres etapas que podemos caracterizar con estas tres palabras: símbolos, fórmulas y teoremas del sistema. Hay que determinar en primer lugar cuales son los símbolos a emplear. Podrán ser de diversas clases: símbolos que representan variables o constantes, funciones y predicados que corresponden a entidades matemáticas y luego símbolos que correspondan a las conexiones lógicas del discurso matemático y a los cuantificadores. Con estos símbolos formales se podrán formar sucesiones finitas que llamaremos expresiones formales. Las fórmulas constituyen una parte de las expresiones formales. Son aquellas en las que la sucesión de símbolos guarda ciertas reglas. Pero dichas fórmulas no siempre serán expresiones verdaderas (Ej.: = + + =). Finalmente hay que especificar los axiomas y reglas de inferencia que permiten obtener sucesiones de fórmulas de modo que cada una sea un axioma o una inferencia lógica de fórmulas precedentes. A tales sucesiones de fórmulas formales las llamaremos demostraciones (formales) de la última fórmula de la sucesión, la cual se llamará teorema (formal).
7/10
3.1.2. Teoría de la demostración. Hilbert admite que el empleo del infinito actual en las matemáticas puede, en efecto, representar un salto en lo incomprensible y carecer de evidencia y ser la razón primitiva de la aparición de paradojas. Por consiguiente hay que emplear una teoría de la demostración que, empleando exclusivamente razonamientos evidentes y, por tanto, finitarios, demuestre teóricamente que los métodos de las matemáticas conducen a teoremas verdaderos y son por tanto métodos válidos. De este modo, la pieza fundamental de la teoría de la demostración es la noción de consistencia de un sistema formal. Supongamos que, en efecto, se ha construido un sistema formal, cuyos teoremas formales se corresponden mutuamente con los teoremas matemáticos de una cierta rama de la matemática. Si los teoremas matemáticos son verdaderos y tienen un sentido objetivo innegable y el método empleado para obtenerlos es válido, entonces será necesario que el sistema formal sea consistente. Pues a cada teorema matemático deberá corresponder uno formal y a la fórmula contradictoria de la que expresa un teorema tendrá que corresponder una fórmula formalmente indemostrable, de tal manera que en el sistema formal no sea posible que una fórmula y su negación sean al mismo tiempo formalmente indemostrable (condición de consistencia). Inversamente, Hilbert estima que si se demuestra que un sistema formal es consistente y en dicho sistema formal son demostrables formalmente las fórmulas que corresponden a los teoremas de una rama de las matemáticas, ello es suficiente garantía de que los teoremas de esta rama de la demostración de consistencia del sistema formal constituye la clave de la fundamentación formalista de las matemáticas. De lo dicho se desprende el propósito de la teoría de la demostración: demostración de la absoluta veracidad de las matemáticas. Hoy día hay que admitir que la teoría de la demostración de Hilbert no ha conseguido sus fines. Ello ha contribuido a quitar importancia a la propiedad de consistencia de un sistema formal. 4. EL INTUICIONISMO. Brouwer fue el fundador del intuicionismo. El principio de construcción o de constructibilidad, que es el principio básico del intuicionismo matemático que afirma que la matemática es el estudio de un cierto tipo matemático de construcción mentales. El trabajo del intuicionista consiste en desarrollar esa construcción mental, descubrirla, suscitarla en otras, incluso estructurarla y formalizarla lo mejor posible, pero a sabiendas de que todo eso no es más que un proceso de aproximación. La construcción mental matemática no puede ser reducida o fundada en algo matemático anterior, que sea más radical o primitivo. A. Heyting afirma que un teorema matemático expresa un hecho puramente empírico. Además, el pensamiento matemático se caracteriza porque se ocupa solo de la construcción mental y no implica verdad alguna en lo relativo al mundo exterior. La matemática intuicionista procede por tanto por vía exclusiva y simultáneamente genética y existencial, en cierta manera categórica, empezando precisamente por la
8/10
construcción –matemática- de los números naturales. Llevada a cabo una construcción matemática, la entidad matemática resultante goza de aquellas propiedades, y no más, que le han sido otorgadas por la construcción matemática. Un segundo elemento fundamental del intuicionismo, es la intuición matemática misma, cuya actividad, potencia y manera de ser condiciona, evidentemente, el carácter de las entidades matemáticas construidas. Hay que señalar que la descripción y estudio de la construcción mental y de la intuición matemática no forman parte de la matemática intuicionista propiamente, sino que están en un plano prematemático o mejor de filosofía de las matemáticas. Brouwer señala cono intuicionismo el apriorismo de las formas de la sensibilidad del espacio y tiempo en Kant. 4.1. La lógica intuicionista. La formalización de la lógica intuicionista llevada a cabo por Heyting, introduce en el cálculo proposicional las cuatro conectivas de conjunción “∧”, de disyunción “∨”, de implicación “→” y de negación ”¬”. Aunque los símbolos son los mismos que en el cálculo proposicional, su significado es distinto. Salvo el significado de las conectivas, coinciden, por ejemplo, las f.b.f.s. (fórmulas bien formadas o formales, las reglas del modus ponens, las reglas de inferencia, demostración formal, el empleo del signo de demostrabilidad formal, etc.). Pero los axiomas no, ya que dependen del significado de las conectivas. La interpretación de los signos de conjunción ∧ y de disyunción ∨ es la siguiente: si Α y B son f.b.f.s., entonces A∧B es verdadero solo cuando A y B sean verdaderos; y A∨B es verdadero solo cuando A o B sean verdaderos (o ambos). La validez de esa formalización es evidente si se considera que de la construcción o demostración de A y de la de B resulta inmediata la construcción de A y B y de forma análoga para la disyunción. La interpretación del símbolo → de implicación es la siguiente. Si A y B son f.b.f.s., entonces A→B será verdadera en la interpretación intuicionista sólo cuando podamos dar una demostración constructiva de la f.b.f. B en la hipótesis de que tengamos una demostración constructiva de la f.b.f. A. Y por último la negación ¬. Hay que tener presente que ¬A, al igual que A, es también una proposición intuicionista y por lo tanto ha de connotar una construcción. Supongamos que afirmamos ¬A, de modo que tenemos ¬A. Entonces por definición, el significado de esta afirmación es que partiendo de la hipótesis de una construcción mental matemática de A podemos llevar a cabo una construcción que nos lleve a un contradicción. 4.2. Comparación con el logicismo. El logicismo presenta la lógica como fundamento exclusivo de la matemática clásica. Pero para el intuicionismo, la lógica matemática desarrollada por Frege, Peano 9/10
y Russell no es sino una continuación de la de Platón y Aristóteles. Y la reducción lógica de la matemática llevada a cabo por los logicistas conserva todavía una esencial referencia al mundo y a un realismo muy elaborado, pero conservando rasgos de ingenuidad. Russell llegó a escribir: “La lógica se ocupa del mundo real tan verdaderamente como la zoología, aunque de sus rasgos más abstractos y generales” Por el contrario, el intuicionismo, lejos de reducir la matemática a la lógica, considera esta como una elaboración posterior. Para la matemática intuicionista, el mundo exterior no es sino ocasión o aplicación. 4.3. Comparación con el Formalismo. Para los formalistas, la matemática empieza en los símbolos, en el papel. En su aspecto esencial la matemática se identifica con la ciencia de los sistemas formales: El formalista desea como definición de la actividad matemática algo claro, bien definido y bien cortado. El intuicionista aplica su intuición, elabora con cierta imprecisión y oscuridad la noción de número natural y luego finalmente empieza su actividad El intuicionista es impreciso y oscuro en sus primeras actividades todavía prematemáticas, pero nunca arbitrario. Busca lo que haya y descubre lo que encuentre en su actividad constructiva.
BIBLIOGRAFÍA RECOMENDADA Fundamentos de la Matemática. Aut.: Alberto Dou Edit.: NCL
10/10