M*riagra*ia Bianchi Anna GiUìo
Ü
Introduzione
alla matematica discreta
Copyright © 2005, 2001 2001 The McGraw-Hill Companies, Compa nies, srl Publishing Group Italia via Ripamonti, 89 - 20139 Milano
McGraw-Hi McGr aw-Hill ll
¿2
\ Division o f The McGra w-Hill Companies
I diritti di traduzione, di riproduzione, di memorizzazione elettronica e di adattamento totale e parziale con qualsiasi mezzo (compresi i microfilm e le copie fotostatiche) sono riservati per tutti i paesi. Nomi Nomi e marchi citati nel testo sono generalmen g eneralmente te depositati o registrati dalle rispet rispettiv tivee case produttrici.
Produzione: Produzione: Donatella Giuliani Realizzazione editoriale. CompoMat s.a.s., Configm (RI) Grafica di copertina: G & G Stampa: Arti Grafiche Murelh, Fizzonasco di Pieve Emanuele (MI)
ISBN 88-386-6229-0 Printed in Italy 3456789AGMERR09
Indice
Prefazione
IX
Elenco lenco dei si mb oli
XI
1
Ins iem i
1
1.1 1.2 1.3
Operaz Op erazioni ioni sugli insiemi insie mi Insieme delle parti Prodotto Prodot to cartesia car tesia no di due insiemi
3 7 8
V t
_2 _2 ____ I ntroduzione alla logica e alle tecniche dimo strative ____ Introduzione
9
3
Gli in ter i
19
3.1
Division Div isionee tra Interi 3.1.1 3.1.1 M assimo assi mo comun com un divisore (MCD) e minimo comune comune multiplo (meni) Numeri primi e teorem a fondamentaledell'aritmetica fondamentale dell'aritmetica Numer Nu merazion azionee in base n 3.3.1 3.3.1 O peraz per azion ionii in base 2 Equazioni Equa zioni lineari diofantee diofa ntee Relazioni ncors nc ors ive Alcune applicaz ioni all ’analisi ’analisi dialgoritmi dialgoritmi
20
3.2 3.3 3.4 35 3.6 3.6 4
41 4.2 4.2 4.3 4.4 4.5 4.5 46 4-7
Relazioni Relazioni bi nar ie tr a insiemi
Mat Matrici di incid nciden enza za Relazioni di equiva lenza Relazione di cong ruen za in Z Criteri di divisib div isibilità ilità Congr Co ngruen uenze ze lineari Sistemi di congruenz cong ruenz e lineari Relazioni d'o rdin rd inee 4.7.1 4.7.1 Rappr Ra pprese esenta ntazio zione ne grafica di una relazione d ’ordine ordine 4-8 Appli Ap plicaz cazion ionii 4 9 Alcune tecniche di enum erazione 4.10 4.10 Prodotto di applicaz ioni
22 26 29 31 32 34 42 45
48 49 51 53 54 57 59 61 62 64 66
VI
Indice
5
Elementi Elementi di teor ia dei gr afi
5.1 5.2 5.3 5.4
Grafi rafi semplic sem plicii orientati e non orientati Alberi e arborescenze arborescenz e Alberi sintattici Algoritmo di Huffman Huffman
6
A l g o r i t m i e d e l e m e n t i d i t e o r i a d e l l a c o m p l es es s i tà tà
7
Introd uzion e alle str utt ur e algebriche
8
69
69 73 75 76
A lgebra delle matrici
8.1 8.1
8.2 8.3 "8.4 "8.4
Operazioni nell’insieme delle matrici 8.1.1 8.1.1 Som ma di matric i 8.1.2 8.1.2 Prodotto esterno 8.1.3 8.1.3 Prodotto righe per colonne 8.1.4 Matrici quadra te di ordine n Sistemi lineari 8.2.1 8.2.1 Ma trici stoca stiche e cate ne di Marko v Sistem i lineari linear i e ma trici Me todo di elim inazio ne di Ga uss-J orda n 8.4. 8.4.1 1 Alg oritmo e calco lo della matrice inversa
94 94 95 97 100 100 101 103 107 108 112
9
Gru pp i
115
9.1 9.1 9.2 9.3 9.4
Sottog rupp i Gruppi di perm utazioni Equivalenze in un grupp o Sottogruppo generato da un sottoinsieme . Sottogrupp i ciclici 9.4.1 9.4.1 Pro prietà prie tà dei gruppi ciclici ciclic i 9.4.2 Periodo di un elem ento di un grup po
119 119 120 124 126 128 128
An elli e Campi. Campi. An ello dei po lin om i
131
10
10.1
Anello dei polinomi a una inde term inata inat a 10.1.1 10.1.1 Divisione Divis ione in Z 10.1.2 10.1.2 Massim o comun com un divisore di due polinomi polino mi 10.1.3 10.1.3 Polinomi irriducibili irriducib ili e teore ma di fattorizz fatto rizzazio azio ne 10.1.4 10.1.4 Radici di un polinomio polino mio su un cam po 10.2 10.2 Funzioni polinomiali e Schema Sche ma di Horner Ho rner 10.3 10.3 II Campo Cam po Com plesso ples so
136 138 138 140 143 144 144 146 146 147 147
11
153 153
11.1 11.1
Spazi Spazi v et to riali
Sottospazi di uno spazio vettoriale vettor iale 111 1 Sottos Sottospazi pazio o generat generato o da un sottoinsi sottoinsieme eme non vuoto 11.2 11.2 Dipendenza Dipen denza e indipend indip endenza enza lineare linea re
155 155 158 160
Basi di di uno uno spazio spazio vettoriale vettoriale 11.3 Basi 11.3.1 Prod Prodotto otto scalare scalarecanonico canonico 11.3.2 Orto gon alità
162 165 165 166 166
12
169
Deter m in ant e di una matric e
12.1 Prim e proprietà dei determinan ti 12.2 II teorem a di Lap lace sullo sviluppo del determinante 12.2.1 Ma trice inversa 12.3 Sistemi di 11 equazioni in n incognite- teorema di Cramer 12.4 Caratteristic a o rang o di una matrice 12.4.1 Procedim ento di Kronecker 12.5 Sistemi lineari di m equazioni in «in cog nite 12.5.1 Ricerca delle soluzioni di un sistema lineare
172 172 178 179 181 183 186 187
13
Ap pl ic azion i li neari
193
13.1
Rango
201
14
Au tov alori , aut ov etto ri, diagon alizzazione
205
14.1
Matrici diagonalizzabili
208
15
Reticol i, A lg ebr e di Boote e circuiti
215
15.1 Elementi di Teo ria dei Reticoli 15.2 Algebre di Boole 15.2.1 Alg ebre di Boole e circuiti
215 220 222
16
225
Elementi di cr ip to gr afia
16.1 Terminologia 16.2 Codice di Vem am 16.3 Crittografia a chiave segreta e crittografia a chiave pubblica
225 230 230
17
233
Codici co rr ett or i
17.1 Distanza di Hamming 17.2 Codici lineari e codici gruppo 17.3 Quadrati latini Appendice Indice analitico
235 236 237 239
Prefazione
Chi ben comincia, è a metà dell'opera Frisch begonnen, ist halb gewonnen Well begun, is half done Un travati bien commencé est déjà à moitiéfait Qien bien empieza, bien acaba .
Questo libro nasce con lo scopo dì colmare un’esigenza didattica degli studen ti del corso di laurea in Informatica, soprattutto in seguito alla riforma, cha ha drasticamente ridotto il numero di ore a disposizione per svolgere 1 programmi. Si presenta come una raccolta di argomenti che sono generalmente trattati nei corsi di Matematica Discreta. Riporta la dimostrazione di alcune proprietà fondamentali che fanno uso di tecnich e spesso elementari, utili però a far acquisire un metodo di ragionamento rigoroso. Inoltre, proprietà p resen tate come proposizioni, osservazioni o esempi, hanno una dimo strazion e molto dettaglia ta in modo che possa essere svolta dagli studenti come esercizio. Quando può essere utile, alla fine del paragrafo abbiamo aggiunto esercizi, senza soluzione, come stimolo all’applicazione delle nozioni introdotte e per ve rificarne la comprensione. Le soluzioni saranno presentate sul sito:
ht t p: / / www. at eneonl ì ne. i t / gi l l i o Poiché gli studenti si lamentano spesso di dover affrontare argomenti matemati ci con un taglio astratto e “avulso dalla realtà'’ sono stati introdotti alcuni brevi capitoli che p resentano con crete applicazio ni dei concetti trattati. In particolare abbiamo trattato nozioni introduttive alla teoria dei grafi, alla teoria della com plessità e degli algo ritmi, ad algebre di Boole e circuiti, alla crittografia e ai codici correttori. Rispetto all’edizione precedente abbiamo introdotto alcune nozioni riguar danti: equazioni diofantee, relazioni ricorsive, matrici stocastiche e catene di Markov, funzioni polinomiali e schema di Homer, numeri complessi, prodotto scalare e ortogonalità. Si ringraziano ancora gli studenti e 1 colleghi per le utili osservazioni e le proficue discussion i, che hann o stimolato la nascita e la nuova edizione dì questo libro. Da ultimo siamo grati anticipatamente a tutti coloro che vorranno segnalare errori grandi e piccoli.
Gli autori
'
»
Elenco dei simboli
XyA,B* ' ‘ *
(Lettera maiuscola) Indica un insieme
x,a,b , •••
(Lettere minuscole) Indicano un elemento dell’insieme
U
Insieme “Universo”
0
Insieme vuoto
V(X)
Insieme delle parti di X
\x\
Numero degli elementi dell’insieme X, cardinalità di X
c
Simbolo di inclusione
c
Simbolo di inclusione stretta
n
Intersezione
u
Unione
G
Simbolo di appartenenza
i
Simbolo di non appartenenza
V
Quantificatore universale (per ogni)
3
Quantificatore esistenziale (esiste)
V
Oppure
A
E
=>
Simbolo di implicazione (allora) Sìmbolo di equivalenza logica (se e solo se)
a
\
b
Insieme differenza
A x B
Prodotto cartesiano di A c B
N = {0 , 1, . . .
Insieme dei numeri naturali
2
Anello degli interi
Q
Campo dei razionali
IR
Campo dei reali
C
Campo dei complessi
B erc c de* sirnccii
0\ »' c
Gruppi moltiplicativi d ei campi p receden ti a è m relazione con b (nella relazione H) Relazione di cong ruenz a
a; è aj
L’elemento a divide Telemento b L'elemento a non divide l'elemento b
f
MCD ( a M)
Massimo comun divisore tra a e b
mcm(a,b)
Mimmo comune m ultiplo tra a e b
(G.*)
Gruppo in notazione moltiplicativa
(G,+)
Gruppo in notazione addi tiva
o(g)
Periodo dell’elemento g e G
H
H è sottogruppo di un gruppo G
H
H è sottogruppo normale di G
Sn
An
Gruppo di tutte le permutazioni su ri oggetti Sottogruppo di S„, formato dalle permutazioni pari
(a,b,c.*‘-)
Sottogruppo generato dagli elementi a,b,c, ••• di un gruppo
(A, + .£
Anello rispetto alle operazion i + ,•
Zw
Anello delle classi dì resto modulo n
[«In
Classe di resto modulo n, con rappresentante a
A[x]
Anello di polinomi ad una indeterminata con coefficienti in A
gr(a(x))
Grado del polinomio a(x)
A7-
Matrice trasposta della matrice A
det(A)
Determinante della matrice A
car(A) ì rg(A) j
Rango o caratteristica della matrice A
dim V'
Dimensione dello spazio vettoriale V
5 © r
Somma diretta di due spazi vettoriali S e T
1 Insiemi
“Ogni inizio contiene una magia che ci protegge e ci aiuta a vivere” H Hesse (// gioco delle perle di vetro)
Il linguaggio degli insiemi è un utile strumento per studiare collezioni, aggregati, classi di oggetti In questa sede non abbiamo intenzione di addentrarci in delicate questioni legate alla definizione di insieme, assumeremo pertanto la nozione come intuitiva. Gli insiemi sono generalmente indicati con le lettere latine maiuscole A, B.X, Y . . . , e gli elementi con lettere latine minuscole a,b,x,y __ Per indicare che un elemento x appartiene all’insieme X, si usa il simbolo e e si scrive: x e X, mentre per indicare che y non appartiene all’insieme Y si scnve y £ Y. Si considera anche l’insieme privo di oggetti o insieme vuoto, che si indica con il simbolo 0 . Ci sono diversi modi per descrivere un insieme: uno di questi consiste nell’elencare, se possibile, tutti gli elementi deH’insieme stesso.
Esempio 1.1 INSIEME è
L’insieme V delle lettere dell’alfabeto che compongono la parola V = {I,N,S,E,M}.
Osservazione 1.1 In genere gli elementi elencati sono intesi distinti e non ha importanza l’ordine in cui essi compaiono, cioè
V = {I,N,S,E,M} = {N,E,M,S,I}. Osservazione 1.2 co elemento {a}. Esempio 1.2
Si considera anche l’insieme "singoletto” formato da un uni
L’insieme W dei capoluoghi di provincia della regione Liguria è
W = {Genova, Savona, Imperia, La Spezia}.
2
Capitolo 1
Un altro modo per rappresentare un insieme X è quello di specificare X mediante una condizione definitrice, cioè una legge ch e p er m etta di stab ilire se un oggetto appartiene oppure no all’insieme X.
Esempio 1.3 L’insieme degli interi positivi o nulli m inor i di 1000, può essere indicato con la scrittura X = {0,1,2,... ,999} oppure
X = { x e Z \ 0 < x < 999} Le lettere N, IL, Q, R, C si usano esclusivamente per rappresentare, rispetti vamente, l’insieme dei numeri naturali {0 , 1, 2 ...}, l’insieme dei numeri interi relativi { . . . , - 2 , - 1,0 , 1, 2 ,...}, l’insieme dei numeri razionali, l’insieme dei numeri reali e quello dei numeri complessi. Gli insiemi possono anche essere rap presen tati g ra fic am en te utilizzando i dia grammi di Venn, che traggono il loro nome da quello del matematico londinese J. Venn, che introdusse il loro uso sul finire del sec olo dician no ve sim o. Nei dia grammi di Venn, l’insieme “universo” U, che co ntie ne tutti gli ogg etti delle nostre considerazioni, è rappresentato da un rettangolo ove cerchi o altre figure al suo in terno sono usate per rappresentare insiemi, mentre punti rappresentano elementi dell’insieme stesso.
Esempio 1.4 II diagramma di Venn dell’Esempio 1.1 è quello della Figura 1.1.
Figura 1.1
Definizione 1.1 Un insieme Y si dice sottoinsieme di un insieme X e si sciti Y C X se ogni elemento di Y è anche elemento di X, cioè se V y e Y si ho <-'* y e X, ove il simbolo V si legge “per ogni”.
_________ _ ________________________________________
Insiemi
3
Ogni insieme X è sottoinsieme di se stesso, cioè X c
X
Esempio 1.5 N c Z c Q. Osservazione 1.3
Inoltre 0 C I
Se A e B sono due insiemi, scriveremo A — B per indicare thè A C B e B C A, cioè Definizione 1.2
A = B significa che x e A
x G B (cioè x e A se e solo se x e B).
Con la scrittura A C B (A sottoinsieme proprio di B) si vuole indicare che A C B ma non è A = B\ cioè V a e A => a e B ma 3 h e B tale che b A (leggasi: “per ogni a appartenente ad A, si ha che a appartiene a B ma esiste un b in B tale che b non stia in A”). Osservazione 1.4
Esempio 1.6
Siano A = [2h | h e Z}
e
B = {6k \ k e Zj.
Allora B C A. Esempio 1.7
Siano
C = (5 k | k e Z}, D = [d e Z | d = IO* + 15;y, x,y € Z} Allora C = D. Dimostrazione. Mo striamo che C C D : V c e C 3 / i e Z tale che
c = 5h =
(-1 0 + 15)/z = 10 (-/i) + Ì5h => c e D. Viceversa sia d e D. Allora esistono r, 5 e Z tali che d = lOr + 15s = 5(2r + 3 s) => d e C. m
1.1 Oper azion i su gl i ins iemi Due insiemi possono ess ere com binati in modi diversi per ottenere nuovi insiemi. Sia assegnato un universo U e siano A,B C C U.
Si definisce intersezione di A e B, l'insieme degli elementi co muni ad A e a B e la si indica con il simbolo A i) B, cioè: Definizione 1.3
A f ) B = { x e U \ x e A,* e B) = [x e U \ x e A x e B}. a
Osservazione 1.5 Esempio 1.8
L’intersezione A fi B è un sottoinsieme sia di A sia di B
Siano A = {2h | h e Z}
e B = [3k | k e Zj.
Allora A fi B = {6/ 11 e Zj.
Definizione 1.4 Due insiemi A e B si dico no disgiunti se A fi B = 0. Proprietà 1.1 1.
Per Vintersezione insiemistica valgono le seguenti proprietà :
A fi {B fi C) = (A H B) n C (associativa);
2. A fì B = B fi A (commutativa); 3. A fi A = A (di idempotenza); 4. AO 0 = 0. Lasciamo le dimostrazioni per esercizio.
u
A Ufi
Figura 1.2
Definizione 1.5 Siano A i , A2, •. • , A n C U, scriviamo n
Pj a , = Ai n a 2 n ... n
a „
=
{x e u \ x e A, Vi = 1,2 ........ «}.
i=i Definizione 1.6 Si definisce union e di A e B l ’insiem e degli elementi che ap partengono ad A o a B (o ad entrambi) e la si indica con il sìmbolo A U B, cioè AUB = { x e U \ x e A o x e B) = {x e U \ x e A v x e B}.
Osservazione 1.6 A e B sono sottoinsiemi di A U B. Esempio 1.9 Siano A = {2h | h e Z}
e B = {6k | k e Z}.
Allora A U B = A.
Insiemi
5
Proprietà 1.2 Per l'unione insiemistica valgono le seguenti proprietà, analoghe a quelle dell'intersezione: A U (B U C) = (A U B) U C ( proprietà associativa);
1.
2.
A U S = S U A ( proprietà commutativa);
3.
A U A = A (proprietà di idempotenza);
4. A U 0 = A, Lasciamo le dim ostrazioni per esercizio.
Definizione 1.7
Siano A i , A2, . . . ,A„ C U , scriviamo
n
A, = A\ U A i U ... U An = [x e U | 3 i e {1,2,... ,«} perori* € Aj}.
»=1 Dimostrare che per ogni tema di sottoinsiemi A,B ,C c i/ valgono le seguenti proprietà (dette distributive):
Esercizio 1.1
1.
A U ( 5 n C ) = ( A U f i ) n ( A U C );
2.
A n ( 5 U C ) = ( A n 5 )U ( A n C ) .
Esercizio 1.2
Verificare che, per ogni tem a di sottoinsiemi A ,B ,C C i/, si ha:
1. A C : B t > A U B = B:
2. A f ì £ = A < s > A C £ ; 3.
A fi (A U B) = A U (A fi 5 ) = A.
Il p r o b l e m a d e l t r i f o g l i o
Tre categorie di utenti sono soci di un centro sportivo: quelli che praticano il tennis (t ) sono 44, quelli che praticano nuoto ( n ) sono 26, mentre 31 sono quelli che si dedicano al golf (g). Di questi, però, 12 si dedicano sia al tennis sia al nuoto, 5 al tennis e al golf, 6 al nuoto e al golf e 4 praticano tutti e tre gli sport. Quanti sono ì soci del centro sportivo? Ricorrendo ai diagrammi di Venn si ottiene che il numero totale degli iscritti è 82 (vedi Figura 1.3) Definizione 1.8
Per ogni A e t / si dice complemento di A in U l ’insieme A' = {x e U\ x<£ A)
Figura 1.3
Valgono le seguenti proprietà: 1. U' = 0, 0' = U\ 2. A U A' = i/, A H A' = 0; 3. (A')' = A;
e le seguenti Leggi di De Morgan :1 4. (A fi B)' = A' U B'\ 5. (AUB)' = A 'D B1. Dimostrazione. Le proprietà 1), 2) e 3) sono immediate. Per dimostrare la 4) occorre provare la seguente doppia inclusione (Afi B)' C A ' U B '
e
(A 0 B)' 2 A' U B \
Siax € (AHB)'; allora x e U, m ax £ A n B per cui x non appartiene ad almeno uno dei due insiemi A o B . Ne segue che x appartiene ad almeno uno degli insiemi A' o B' e quindi anche ad A! U B’. Viceversa se y e A'UB' si ha che y appartiene ad almeno uno dei due insiemi A' o B'. Pertanto y e U ma non appartiene ad almeno uno degli insiemi A o B per cui y e (AH B)\ Si lascia per esercizio la dimostrazione d ella 5), ch e è an al oga a que lla svolta per il punto 4). «
1AkUguslusDe Morgan U806 Madura (India), 1871 L on dr a) .
Insiemi
Definizione
Siano A,B
1.9
C JJ\
7
si dice differenza fra A e B l ’insieme
A \ B = {x e U \ x € A, x <£ B}. Osservazione 1.7
Per ogni sottoinsìeme A
c
U => A! — U
A
1.10 Siano A,B C (J; si dice differenza simmetrica fra A e B l ’insieme ( A \ B ) U ( B \ A ) (Figura 1.4). Definizione
Figura 1.4
O sse rva zio ne 1.8 Per la diffe renz a di insiemi non vale la proprietà commutativa. Infatti, considenamo x ,y ,z tre elementi distinti di un insieme U e poniamo A = {*,;y}, B — {*,z}. Si ha che A \ B — { y } ^ B \ A = {z}. Esercizio
1.3
Provare che (A \ B) U (B \ A) = (A U B) \ {A fi B).
1.2 Ins iem e d elle parti Definizione 1.11 Fissato un insieme U, l ’insieme i cui elementi sono tutti e soli i sottoinsiemi di U è detto insieme delle parti di U, e lo si indica con il simbolo V(U). In simboli V { U ) = {X | X c U}.
Esem pio 1.10
Se U = {1,2,3} allora V{U) = {0 , ( 1}, {2 }, {3 }, { 1, 2 }, {1,3}, (2 ,3}, {1, 2,3}}.
Esercizio 1.4
zioni i)
{a} C A;
Sia A = {a,b,c}. Si dica se sono vere 0 false le seguenti afferma-
3 > ; £ * * f
iii t a € A;
iv) {a} € V{A).
1.3 Prodotto cartesiano di d u e i n s i em i Definizione 1.12 Dati due insiemi A .B . si dice prodotto cartesiano di A e B
l’insieme A x B = {(a, b)\a € A.b € B } costituitodalle coppie ordinate degli elementi di A e di B. Osservazione 1.9 Se A fi B si ha che A x B fi B x A . Osservazione 1.10 Se A = B si pone A x A = A 2. Definizione 1.13 Dati n insiemi A 1.A 2, . . . ,A„ si definisce
Ai x A2 x ... x An = {(ai,tf2, • •• >an) I dì € Aiy i = 1 ,2
.........
Notazione 1.1 Se Ai = A2 = . . . = An, allora si pone
Ai x A2 x . . . x An — An. Osservazione 1.11 Se l’insieme A = E (insieme dei numeri reali) a) H2è l’ordinario piano cartesiano; fi) E3è l’ordinario spazio cartesiano.
n. }
2 In tro d u zion e alla logica e alle tecniche dimostrative *lo
“Cogito ergo suit i" (R. Descartes)
Si cerch erà ora di “ fare u n p o ' di ord ine ” nel linguag gio m atematico >m qui utilizzato, introducendo, in particolare, alcuni simboli logici di soUto usati negli enunciati e nelle dimo strazioni. Assunti alcuni enti o concetti come primitivi cioè non definibili (per esem pio: nu mero na turale, zero , succ essivo di un numero naturale, punto, re tta piano, ecc.), vengono fissate alcune propo sizioni, i postulati' enunciano proprietà che risultano di tale evide nza d a po ter essere a ccettate senza giustificazione Ogni altra costruzione dedotta logicamente da postulati o da altre proprietà precedentemente stabilite si chiama Teorema. In esso distinguiamo il soggetto, cioè l’ente e/o gli enti di cui si parla, l’ipotesi e la tesi mentre la dimostrazione è il ragionamento mediante il quale si prova che il soggetto sotto certe ipotesi dà luogo a una certa tesi. Per esempio, “Una retta e un punto fuori di essa determinano uno e un solo piano” è l’enunciato di un teorema in cui retta e punto sono i soggetti, l’i potesi è che il pun to no n ap par te nga alla retta, la tesi è 1’esistenza di un unico piano. Vi sono teoremi, come quello ricordato, di tipo esistenziale, che affermano, cioè, 1’esistenza di un ente; mentre in altri la dimostrazione può essere costruttiva, in quanto si dimostra resistenza dell’ ente in questione costruendolo. Alla base di tutti questi discorsi c’è il concetto di proposizione semplice, che rapprese nta la più elem en tare frase di sen so compiuto che può essere vera (V) oppure falsa (F). Per esempio, “Oggi il cielo è azzurro” è una proposizione semplice mentre “andiamo a spasso” non lo è.
10
Capitolo 2
Combinando proposizioni semplici tramite i connettivi logici: ->
(non)
negazione
A
(e)
congiunzione
V
(o)
disgiunzione
(segue)
im plicazione
(se e solo se)
equivalenza
sì ottengono proposizioni composte che po sson o es se re a lo ro volta ve re o false. Per stabilire ciò ci avvaliamo delle tavole di verità dei connettivi logici, che qui riportiamo. 1. Sia Auna proposizione semplice, la tavola di verità di -• A è A V F
-A F V
Esempio 2.1 A
:= La faccia della mo neta è testa;
->A := La faccia della m on eta è croce. Se vale A non vale-* A. 2. Siano ora A e fi due proposizioni semplici: 2.1 la tavola di verità di A a fi è
A V V F F
f i
V F V F
A a B
V F F F
Esem pio 2.2 A
:= La sostanza è solida;
fi
:= La sostanza è colorata;
A A fi := La sostanza è solid a e colo rata . Se la sostanza è un cristallo di ametista è A(V), fi (V ) e quin di
A
A
fi è V.
Introdu zion e alla logica e alle tecniche dimostrative
2.2
La tavola di verità di A v B è
A V V F F
B V F V F
A v B V V V F
Esempio 2.3 A v B := La sosta nza è solida o è colorata. Nel ca so di un a ta zz a di caffè, si ha che A( F) , B{ V) e quindi A v B è V 2.3
La tavola di verità di A ==> B è
A V V F F
5 V F V F
A=> B V F V V
N. 5. Ex falso sequitur quoti libet (principio della filosofia medioevale).
Esempio 2.4 A : = 1 > 3 ; B : = 4 < 8 ; A{ F) , B{ V) \ A => B
2.4
è
La tavola di verità di A <=>• B è
A V V F F
B V F V F
A o B V ^ F F V
Esempio 2.5 A : = 1 < 3 ; B := 4 < 8 ; A o
B
è
V.
V.
11
Una proposizione composta sempre vera quale che siano i valori di verità delle proposizioni semplici che la compongono è detta tautologia (dal greco tautòs = stesso, identico), mentre una proposizione co m posta sem pre fa lsa, quale che siano i valori di verità delle proposizioni sem plici ch e la com po ngo no , è detta contraddizione.
Esempio 2.6 A A (->A) è una contraddizione. Infatti A V F
-A F V
A A (—•A) F F
Esempio 2.7 A => (A v B) è una tautologia. A B V V V F F V F F
Av 5 V V V F
A =» (A v B) V V V V
Definizione 2.1 Definiamo funzione proposizionale su un dominio D una espres sione p(x) tale che per ogni a e D sia p( a) una proposizione, cioè p(a) sia vera ofalsa.
Esempio 2.8 Sia p{x) = (x | x2 - 5 > 0} : essa è fun zion e p ro po siz ion ale su R.
Notazione 2.1 Se p(x) è una funzione proposizionale su un insieme D, la frase “La proposizione p{a) è vera per ogni a e D" si scrive uti lizz an do il simbo lo V (leggi: pe r ogni) detto quantificatore universale “V a e D, p(a) è vera”.
Notazione 2.2 Con 3 a e D tale che p{a) sia vera indichiamo la frase “esiste un a appartenente a D tale che p{a) sia vera” (3: quantificatore esistenziale).
Osservazione 2.1 Negare un’affermazione del tipo “V a e D , p{a) è vera” equivale a garantire resistenza di almeno un b € D tale che p(b) sia falsa. Esempio 2.9 Data l’affermazione: “i numeri primi sono disp ari ”, la sua nega zione è: “esiste almeno un numero primo pari”.
Introdu zion e alla logica e alle tecniche dimostrative
13
Ritorniamo al concetto di teorema o proposizione ipotetica, che possiamo sche matizzare nella seguente forma (detta diretta): “Se S ha la proprietà I allora S pos sied e la pro pr ietà T”
Osservazione 2.2 inversa.
Scambiando l’ipotesi I con la tesi T si ottiene la proposizione
Osservazione 2.3 N egando l ’ip otesi e la tesi si ha la pr opo sizione contraria.
Osservazione 2.4 N egando ip otesi e tesi e sc am biandole fra loro si ha la p ro po sizione contronominale. Osserviamo che, ammessa vera la proposizione diretta, è vera la sua contro nom inale e su que sta afferm azion e si basa la tecnica dimostrativa detta dimostra zione per assurdo, ove, appunto, negando la tesi si arriva a una contraddizione con l’ipotesi. La pro po sizion e inversa e la contraria possono invece non essere vere.
Esempio 2.10 Un numero naturale divisibile per 6 termina con cifra pari (pro po sizione diretta). La sua inversa “un numero che termina con cifra pari è divisibile per 6” è chiaramente falsa (basti pensare al numero 14). La sua contro no m inale “un n um ero c he non termina con cifra pari non è divisibile per 6 ” è invece vera. La sua contraria “un num ero non d ivisibile per 6 non termina con cifra pa rr ’ è falsa (basti pensare al numero 2 ). U n’altra tecnica dim ostrativa è basata sul cosiddetto “postulato o principio di induzione’’ che afferma:
Assioma 2.1 (di induzione: I forma) Sia no un intero e sia P(n) un enunciato che ha senso per ogni n > no. Se: i)
Pino) è vero;
ii) per ogni n > no, P (n — 1) vero implica P(n) vero, allora P(n) è vero per tutti gli n > no. Diamo, ora, alcuni esempi di dimostrazioni che fanno uso del principio di indu zione.
Esempio 2.11 Dimostrare che la somma dei primi n numeri interi naturali è n(n - f i ) ----- - — - , ci ò è P (n) è
n(n 4- 1) 1 + 2 + . . . + (w — 1) "f n — ?
«
i) P( 1) è vera; infatti a primo membro abbiamo 1 (solo il prim o addendo) e al ■■■ = 1.
secondo membro ^ im*
ii) Supposto vero P(n - 1) dimostriam o ? {ri). P(n - 1) è
«-i (n — l)n 1 -f- 2 -K . . . -\~(n — 1) — ' i = ì= i
quindi n
J—... — j—( ai — 1)] — |—/i. ^ ^i — 1 ~1~2 + . . . + {¡n — 1) 4" ri — [1 —2 — i=1 Poiché la somma in parentesi quadra per ipo tesi induttiva vale ^ 14- 2 + ... + (« —1) “I-
m
e quindi:
= [1 + 2 + . .. + (w —1) ] "4* ri = {n — \)n rr —n + 2n n(n + 1) _ ------------- f- n = ------- -------- = ------ ----- .
Pertanto la proprietà è vera per tutti gli n > 1. Esempio 2.12 Dimostrare che
-:)H
•
•
•
1
1
n
In questo caso P{n) è 1
i)
1
— — con n
ì ) ( - 5) - ( - : ) - Q ( - r ) -
1 P(2) è vero: infatti il primo membro diventa 1 — -
1 - mentre il secondo 2
membro è - . 2 ii) Supposto P(n —1) vero, cioè 1
1
1 Proviamo P(n).
2 K 1
3J ‘
l 1
n —l
n > 2.
n
—1
Introduzione alla logica e alle tecniche dimostrative
1
1 2
15
1
)(
la parentesi quadra per ipotesi induttiva vale ~
da cui segue 1
n - 1
1
n —1
n
n
Quindi la proprietà è vera per tutti gli n >2. Si indica con \X\ il numero degli elementi di un insieme X .
N otazio ne 2.3
Esem pio 2.13 Sia X un insieme con ri oggetti. L’insiem e delle parti di X pos siede 2" elementi, cioè il numero di sottoinsiemi di X è 2". In questo caso P(n) può essere così riscritta:
\P( X) \ = 2" i)
P( 0) è vero: infatti in questo caso X = 0 e qundi V(X) ha come unico sottoinsieme 0, sicché \P (X) \ = 1 = 2 ° .
ii)
Supposto l’asserto vero per n —1, dimostriamolo per n; supponiamo cioè che un insieme dotato di « — 1 oggetti possieda 2n 1sottoinsiemi. Con sideriamo, ora, l’insieme X con n oggetti X = {ai,a 2,«3. . . a,,}. X può essere visto come unione dell’ insieme Y={ai,ci2 ,a 3 .. .a n-\} e del singoletto {an}. Cioè
X = {a\,ci2,ci3 .. .û/(-i} U {an}. Per contare i sottoinsiemi di X dobbiamo tener conto dei sottoinsiemi di Y che per ipotesi induttiva sono in numero di 2"~l e di quelli che si ottengono unendo a questi sottoinsiemi il singoletto {an} e che, naturalmente, sono tutti distinti e ancora in numero di 2n~l. In totale si hanno: 2"_1 + 2 "_1 = 2 • 2n~1 =2". Pertanto \P (X) \ = 2" per tutti gli n > 0. Lasciamo provare al lettore, sulla falsariga di quanto fatto sopra, che:
n E se rciz io 2.1
Esercizio 2.2
^
i2 = l 2 + 2 2 + . . . + (n — l) 2 + n2 =
n(n + 1)(2n -f 1)
6
4
n —1
Esercizio 2.3
Y l j + l = n- (la somma dei primi n
num er i positivi dispan).
7=0
n Esercizio 2.4
2 j = n( n + 1) (la somma dei primi n numeri positivi pari).
^ ì
n
Esercizio 2.5
^
3n+i _ j 31= 1 + 3 + 32 + . . . + 3n
i= 0
2
Enunciamo, ora, una seconda formulazione del pr inc ipio di induzione:
Assioma 2.2 (di induzione: Il forma) Sia no un intero e sia P(n) un enunciato che ha senso per ogni n > no. Se : i)
P (no) è vero',
ii) per ogni n > no, P{k) vero per ogni no < k < n itnplica P( n) vero; allora P(n) è vero per tutti gli n > noUsiamo questa formulazione del principio di induzione anche per definire insiemi ricorsivamente.
Esempio 2.14 I numeri di Fibonacci. A Leonardo Fibonacci, mercante e matematico italiano vissuto tra il 1170 e il 1250, fu posto il seguente qu esito relativo al l’allev am ento di conigli. Data una coppia di conigli tale che: a)
generi una nuova coppia (maschio e fem mina ) ogni mese;
b)
ogni coppia diventi fertile dopo un mese di vita, in assenza di morìe quante coppie di conigli sono presenti dopo n mesi?
Denotato con /„ il numero di coppie di conigli dopo n mesi e posto
fo = r i f i = 1 alla fine deU’n-esimo mese si ha che:
fu — fn -ì + fn —2 Infatti;
1= 1 1+ 1=2 1 + 2
= 3
2 + 3 = 5 3 + 5 = 8 5 + 8 = 13
e co*» via.
Introduzione alla logica e alle tecniche dimostrative
17
Possiamo anche visualizzare questa sequenza con un diagramma. Indichiamo con il simbolo una coppia fertile e con il simbolo una coppia non ancora fertile. Si ha la seguente situazione (Figura 2.1):
Figura 2.1
mesi
0
1
2
3
4
5
/„
1
1
2
3
5
0 0
3 Gli interi
“Il numero e l’armonia respingono Terrore” Filolao1
Fino all’inizio del xix secolo la matematica era concepita come lo studio dei nu meri e delle figure (aritmetica e geometria). Non vogliamo in questa sede adden trarci in una disputa filosofica sul concetto di numero, ma assumiamo come noto che, accanto ai numeri naturali N = { 0 ,1 ,2 ,3 ,. ..} esistano numeri “con segno” detti interi relativi Z = {. .. , - 2 , - 1, 0, 1, 2, . . . } e che esista una naturale identificazione dell’insieme dei numeri positivi o nulli {0, 4 - 1, + 2, + 3 . . . } con l’insieme N. Per ogni z € Z si definisce il valore assoluto o modulo di z, e lo si indica con il simbolo \z\
Definizione 3.1
, , _ { z se z > 0 'z ' ~ | — z se z < 0 Osservazione 3.1
Per ogni z u h € Z, si ha che |zj • zi\ — \zi I • ta l-
Osserva zione 3.2
Non vale invece, in generale, l’uguaglianza
IZ1+Z2I = t a l + t alPer esempio se Zi = - 5 1Tardo Pitagorico, morto verso il 390 a.C.
e
Z 2 = 3
allora
ki + Z 2 Ì = 2 # 8 = \z \| -f |z2|. Supponiamo familiari le principali proprietà delle operazioni sugli interi elarap presentazione di Z sulla retta orientata (Figura 3.1)
-
3
-
2
-
1
1
0
2
3
Figu ra 3.1
3.1 Divisione tra Interi Siano a e b e Z , b ^ 0; allora esistono e sono univocamente determinati due interi q ed r e Z tali che: Teorema 3.1
1.
a = bq
2.
0 < r < \b\.
4-
r;
Dimostrazione. Esistenza della coppia q, r e Z. Distinguiamo quattro casi: i)
a >
0,
b >
0;
ii) a > 0, b < 0; iii)
a <
0,
b >
0;
iv)
a <
0,
b <
0.
i) Procediamo per induzione su a, fissato b.
a — 0 possiamo scrivere a — b • 0 4- 0, co n q = 0 = r. Se 0 < a < b ancora scriviamo a = b • 0 + a, con q = 0 ed r = a. Se a > b allora a > a — b > 0 e, utilizzando l’ipotesi di induzione (fl ha che esistono q , r tali che
Se
a — b — bq
r
con 0 <
r
e quindi
a - b
+
bq +
r =
b ( \ + q) 4- r ove
q =q
+ l>r - r .
>si *°r
Gli interi
21
ii) a > 0, 6 < 0. Poniamo b' = - b > 0. Allora poiché a > 0 e V > 0, per il punto i) 3 q, r e Z tali che a = b'q + 7 con 0 <7
Allora « = ( - 6 )2/ + r = b ( - q ) + r,
ove
<7 = - q , r - 7 .
iii) a < 0, b > 0. Poniamo a! — —a > 0; quindi, essendo a! > 0, b > 0, ancora per il punto i) 3 q { , rj e 7L tali che a — bqi 4- rj,
0
< r\ < b
cioè
- a = h qx + n
da cui, moltiplicando mem bro a mem bro per (— 1), si ottiene a = b(-qx) + ( - n ) .
Se ri = 0 allora q = —q 1, r = —ri = 0; se ri > 0 allora, aggiungen do + 6 e —b al secondo membro, si ottiene a = b(-qx) + b —b —r\ = b (- q { - 1) + (b - ri)
e quindi segue la tesi, ponendo q — —q 1 — 1 ed r = b — rj (osservando che 0 < b —ri < | 6 |). iv)fl < 0, b < 0. Poniamo b' — —b > 0. Allora, per il punto iii), esistono <72»
r 2 e Z tali che a = b'qi + r 2, con 0 < rj < b' = \b\ a = b{—qì) + r 2 , ove q = -<72, r = r2. Unicità della coppia q, r , soggetta alla condizione 0 < r < |/?|. Supponiamo che, accanto a q ed r, esistano 2/, r tali che a = bq + r, a = bq + r
con le condizioni
0 < r < | 6 |, 0 < r < |/?|. Dalle relazioni precedenti, uguagliando e supponendo r > r, (senza ledere la generalità del discorso ) si ottiene bq + r = bq 4- r
da cui r - r = b(q - q)
e quindi r — r = \b\ • |g —<7 1 con
0 < r - r < \b\.
Questo implica che debba essere 0 < \ q - q \ < 1 , con
q -q
€ Z.
I
L’unica soluzione è quindi: q - q = 0 =>■ r - r = 0
da cui si ottiene q =q
r — r.
■
Definizione 3.2 G/i interi q ed r si dicono quoziente e resto della divisione di a per b.
Definizione 3.3 Dati a, b e Z diciamo che h | a (b divide a) se b c e Z tale che a - b c .
0 ed esiste
I
Osservazione 3.3 Se b £ 0, b | a & il resto della divisione di a per b è 0. Osservazione 3.4 Va e Z si ha sempre che ± 1 , ±a sono divisori di a. Proprietà 3.1 Se a eh sono interi non nulli, allora b \ a e a | b & a = ±b. Infatti, poiché per ipotesi b | a e a 1 da cui si ottiene:
3 q\,qi € Z tali che a = bq\,b = ag2,
a = bq\ - (a g 2)<7i = fl(i 2i i )
e quindi q2q\ = 1. In Z le soluzioni sono q2 = q\ = ± 1. Viceversa, poiché per ipotesi a = ±b, si ottiene b | a, a 1 b. Proposizione3.1 Se a,b,c sono numeri interi tali che c \ a, c \ b, allora c divide (ax + by), Vx,y e Z. Poiché c 1a, 3 q\ e Z tale che a = cq\ \ poiché c 1 b 3 q2 € Z tale che b = cq2. Allora, sostituendo, sì ottiene ax + by = cg j* 4- cg 2y = + ¿/2>0 da cui segue che c j (ax + by). Osservazione 3.5 Dati a,b,x,y e Z, l’espressione ax + by si dice “combina zione lineare” di a e b. 3.1.1 Massimo cornuti div iso re (MCD ) e m in im o c o m u n e multiplo (mcm )
Definizione 3.4 Siano a, b e Z (non entrambi nulli). Si dice massimo cornuti divisore di a e b e lo si indica con m c d (a,b ), ogni intero d tale che: 1.
d \a, d \ b;
Gli interi
2.
23
se 3 t e Z tale che t | a, t \ b allora t | d.
Osservazione
d =
3.6
mc d
Si verifica facilmente che, se d =
(- a , b ) =
mc d
(a , - b) =
= MCD (b,a) = MCD (b , - a) Osservazione 3.7
mc d
(0,/?) = 6 =
mc d ( - a ,
= mc d (- 6 ,a)
mc d
mc d (a,b)
allora e pure
- b) =
=
mc d
( - 6 , - a)
(b, 0 ).
Non si lede quindi la generalità del discorso se si proverà resistenza di un massi mo comun divisore per ogni coppia di interi a , b > 0 . Daremo una dim ostrazione di tipo costruttivo, cioè utizzeremo una procedura detta “Algoritmo euclideo delle divisioni successive”, che permette l’effettiva determinazione di un mc d (a ,b ). Teorema 3.2 Per ogni coppia a, b e Z, a > 0, b > 0, esiste un intero d, massimo comun divisore fra a e b. Esistono inoltre due interi x e ) tali che d = ax + by. Dimostrazione. Si supponga a > b e si eseguano le divisioni successive
( 1)
a = bq i 4- rj
con
0 < ri < b
(2 )
se
r . ^ 0
b = r{q2 + r2
con
0 < r 2 < n
(3)
se
r2 * 0
n = r2q3 4- r 3
con
0 < r 3 < r2
•
#
•
•
«
•
•
•
à)
se
n -i ^ o
fh -2 = rh-\qh + rh
(* + i)
se
n, # o
Oi-i = ^hqii+\ •
con
0 < rh < rh
Poiché la sequenza dei resti delle successive divisioni è strettamente decrescente e limitata inferiorm ente, dopo un numero finito di divisioni si ottiene un resto nullo, cioè 3 h tale che r/,+i = 0 . Se h = 0, cioè se r\ = 0, si ha che b | a e quindi mc d (a,b) = b. Se h > 0, ri 0, mostriamo che r/, = mc d (a,b), cioè sono verificate le condizioni 1), 2) della D efinizione 3.4. 1)
r/,| a e r/,| b. Infatti r/,| r*_i (dalla uguaglianza [h 4- 1)) e così risalendo e utilizzando ripetutamente la Proposizione 3.1, si ottiene dalla (2) e dalla (1) che r/, | b ed r/, | a.
2)
Se / | a e t \ b = > t \ rit.
Infatti dalla (1) si ha che t | r\ = a — bqp, se t | r\ e t \ b, dalla (2) si ha che t | r 2. Co s ì proseguendo, alla fine si ottiene che t | r^ e quindi si conclude che ri, è un mc d (a,b).
24
Capitolo 3
Quanto alla seconda parte delFenunciato del Teorema, l’eguaglianza (1) permette di esprimere ri nella forma ri = a + b { - q i). Sostituendo l’espressione di ri nella (2) si ha r2 - b - riq2 = b - {a - b q \) q2 = a ( - q 2) + b( 1 4- q\q2)
e così via.
In questo modo si esprime ciascun resto come “combinazione lineare” a coeffi cienti interi di a e di b. In particolare esisteranno *, y e IL tali che d =
mc d (a,b)
Esempio 3.1 Determinare un
mc d
= rh = xa + y b .
■
(54,45).
Effettuiamo le divisioni successive: 54 = 45 • 1 + 9 45 = 9 • 5. Poiché il resto della seconda divisione è 0, un mc d (54,45) è 9 (ultimo resto non nullo). Possiamo inoltre scrivere 9 come combinazione lineare di 54 e di 45, rica vando 9 dalla prima uguaglianza, cioè 9 = 54 • 1 + 45 • (—1). Esempio 3.2 Trovare un neare di 420 e 182.
mc d (420,182)
ed esprimerlo come combinazione li
Come poma, effettuiamo le divisioni: 420 = 182*2 + 56 182 = 56* 3 + 14 56 = 14.4. Quindi un seguente:
mc d (420,182)
è 14. Una com binazio ne linear e si otterrà nel modo
Gli interi
Proposizione 3.2 divisore di a e b.
25
Se mc d (a,b) = d, allora —cl è l ’unico altro massimo comun
Dimostrazione. Per ipotesi sia d = mc d (a,b) Allora:
1. d | a e d \ b =>• —d | a e — d | b; 2. se c | a e c | b allora c | —d: infatti, per ipotesi, si può scrivere d = ax + by, e, poiché esistono à , b e Z tali che a = cà, b = cb , sostituendo si ha che d = cax + cby = c(ax + by)
da cui —d = c{—ax — by) cioè c | (—d)
e quindi d è —
mc d (a,b).
D’altro canto, se d è un altro massimo comun divisore di a e di b si ha d d | d ==> d =
de
Definizione 3.5 Due interi a e b sì dicono relativamente primi (o primi tra loro o coprimi) se mc d (a,b) = 1, ovvero se ( e solo se) esistono due interi relativi x e y tali che valga la seguente uguaglianza, detta “identità di Bézout'
1 = ax + by. Osservazione 3.8 S e a , b e Z e d = mc d (a,b ), posto a = dà, b = db, si ha che mc d (a , b) = 1.
Infatti, detto / = mc d (à,b) si ha che / | a e t j b e quindi td \ àd = a, td | bd = b = > td \ d = y t = db1. Osservazione 3.9
Se mc d (a,b) = 1 e a | bc = > a | c.
Infatti, essendo mc d (a ,b ) = 1, esistono x, y e Z tali che 1 = ax + by ; inoltre, poiché a | bc, 3 q e Z tale che bc — aq. Allora si ha che c = c(ax) 4- c(by) = = cax + (cb)y da cui, sostituendo, si ottiene c = cax + (aq)y = a{cx + qy). Segue quindi che a | c. Definizione 3.6 Siano a, b e Z, a j=- 0, b ^ 0. Si dice minimo comune multiplo di a e b, e lo si indica con il simbolo man ( a,b ), ogni intero m tale che
1. a | m, b | m; 2. se 3t e Z tale che a \ t, b | t allora m \ t .
Esistenza e unicità a meno del segno del mem (a,b) sono garantiti dal seguente
Teorema 3.3 Siano a t b €
a ^ 0r b f=- 0 (non ^ a >0. b > 01 Allora, detto d = MCD (a,b), si ha che: L m=
a • i? ~d~
IL
/a generalità supporre
è un minimo comune multiplo fr a a e b ;
2. se m è un minimo comune multiplo fra a e b, allora —m è l ’unico altro minimo
comune multiplo fra a e b. Dimostrazione.
1. Posto
a = da
b = db
si ha
ab
dadb d
— ab = ab
quindi a | — , b | — ed è sod disfa tto il pu nto 1) de lla Defin izione 3.6. Sia d d ab ora t e Z tale che a | t,b \ t e m ostriam o ch e —- | t. Infatti, per opportuni a t\,h £ t = at\ = bto Y adt i = bdt2 =>• at\ = bt 2.
Per le Osservazioni 3.8 e 3.9 si deduce che a | ti , sicché ti — at 3 (per un opportuno f 3 e Z) e quindi t = bt2 = bat-i =
ab
ab
2. Se m = mc m(a ,b) anche - m lo è, in qua nto sod disf a le condizion ici. e 2. della definizione. Inoltre, se si considera un qualsiasi mcm ( a ,b ) = ih, si ha che m | m e in \ m da cui segue rh = ± m .
3.2 Numeri primi e teo rem a fo n d am en ta le dell’aritmetica Definizione 3.7 Un numero p e Z, p ^ 0 , p ± 1 , si dice primo se, ogni volta che divide il prodotto di due interi a e b esso divide almeno uno dei due fattori . In simboli: p | ab ==>• p \ a o p \ b. Definizione 3.8 Un numero p € Z, p £ 0, p / solo se p è divisibile solo per ±1 e Teorema 3.4 Sia p € Z, p è primo.
± 1 , si dice irriducibile se e
0, p ^ ±1. Allora p è irriducibile se e solo se p r
Gii meri
27
Dimostrazione. Assumiamo per ipotesi che p sia primo e dimostriamo e ie p e irriducibile. Sia q un divisore di p: allora p = qlp e quindi p j q~p. Essendo p primo allora p divide q oppure divide ~p. Se p | q allora, poiché anche q | p, per la Proprietà 3.1, segue p = ±q. Se p | ~p allora ~p = p p e quindi p = q(pp) cioè qp = 1, da cui si ottiene q = p = ±l. Viceversa sia p irriducibile e dimostriamo che p è primo. Supponiamo che p ( ab e che quindi 3 € Z tale che ab = pq. Sia d = m c d (p,b); allora d | p che è irriducibile e quindi d = ±p oppure d — ± 1. Se d = ±p =>• p | b. Se d = ±1 => 3 x ,y e Z tali che si abbia 1 = px-\-by => a —apx+(ab)y = apx + (p q)y = p(a x + qy) =$>p \ a. u Esercizio 3.1
Siano a e b e Z, se
(a,b) = 1 =» vtCD(a — b,a + b) e
mc d
{db1, ± 2 }. Poiché a e b non sono entrambi pari per ipotesi, i casi possibili sono due: 1. a = 2 n, b = 2m 4- 1. Allora
a — b — 2{n —m) — 1 a + b = 2(n + m) + 1
J
sono entrambi dispari.
Se 3 r e Z tale che r | (a —b) e r | (a 4- b) allora si ha che r ! 2a. r ' 2b Essendo r dispari segue r | a ed r \ b. Essendo poi
(a,b) = 1 ==> r = ±1.
mc d
2. a = 2n + 1, b — 2m + 1. Allora
1 a - b = 2(n - m) a + b = 2 (n 4 - ni + 1) j
9, , '
ov e d = m c d (a —b,a + b ). Inoltre d \ (a —b + a +b) e d | { a - b —a - b) cioè d | 2a, d | 2 b. Poiché mc d (a,b ) = 1 segue che d \ 2 e quindi d = ±2.
(fondamentale delVaritmetica): Ogni numero intero n, diverso da 0 e da ± 1, può essere scritto come prodotto di s > 1 numeri primi (non necessariamente distinti). Tale fattorizzazione è essenzialmente unica, cioè se n = PìP2 • • • Ps = q\q 2 ---qt, ove ogni p, (1 < i < s) e ogni q} (1 < j < t) è un numero primo, allora si possono ordinare i fattori in modo che sia
Teorema 3.5
1. s = t; 2.
p , = ± q u p 2 = ± q 2%. . . , Ps = ±qs.
c,w
\ j c l \ j \\ \ j ì v
o
Supponiamo n > l e p ro c ed ia m o pe r induz ione (II (II forma) osser vando che per n = 2 il il Teorem a è vero essen do 2 un num ero pr primo mo..
Dimostrazione.
Esistenza della fattorizzazione:
Suppo Supponi niamo amo che che il il Teorem a sia vero pe r og ni intero m con 2 < m < n e prov provia ia molo per n. Se n è un numero primo, il teorema è vero; se n non è primo, allora sarà n = ab con \ < a < n t l < b < n . Per ipotesi ipotesi induttiv a
a = a\fl 2 *' *Qh
£
b = b\Ò 2 • ’ ' bk
ove i fattori a,- e b} sono prim i V i = 1, • • • , h e V j = 1, • • • , k. Quindi n = ( a ^ • **ait)(b\b 2 *• • fc*) c*) è e s p ri m ib il e c o m e pro dotto do tto di un numero finito di numeri primi. Unicità della fattorizzazione:
Sia n = p\p 2 ♦• ♦• • ps = q \ q i " - q t
M
con pi e qj num eri prim i V i = 1, • • • , s e Vy = 1, • • • , t. Dimostriamo che s = t e che, a meno dell’ordine in cui compaiono e del loro segno, i fattori del primo membro sono uguali a quelli del secondo membro. Poiché Poiché pi è primo e pi 1 q\(q 2 ••• qt) => P i I q\ (e allora pi = ±^i), oppure pi | (q2 " - q t ) Se pi { q\ allora p\ p \ 1 ^ 2(^3 • • • qì) quindi o p\ p \ ) ^2 e allora pi = ±<72 oppure Pi 1ri/3 ***qt)' Procedendo in questo modo, essendo finito il numero dei fattori, esisterà qualche qi tale che p\ = ±q , . Allora dalla (o), semplificando, si ottiene
P i ’ ’ • Ps — q 1 • • *qi-\qt+\ ' ‘ • qt e, per ipotesi induttiva, segue la tesi. ■
Ogni numero intero n ha una fattorizzazione (essenzialmente unica ica) come come prodott prodottoo di potenze di prim i distinti dis tinti cioè si può scrivere a ai (*r r Pi Pi~ ove pi # pj se i ± j , a, > 0 .
Corollario 3.1
1
Osservazione 3.10 Dato un num ero intero inte ro n > 1, utilizzando il teorema prece dente, possiamo calcolare quanti sono i suoi divisori positivi (compresi 1 ed n). Infatti, sia d un divisore di n. Per il teorema di fattorizzazione e il suo co , p 2, - - - ,p rollario, se n = p f p “2. *- pj*- allora esistono fi\ fi \ ,p , p r con 0 < p, < a h Co nta nd o i possibili possib ili valori valori dei p,, i G {1,2 ,... ,r} tali che d = p f 1 p^ p ^ 2 • • • p f r . Conta abbiamo che il numero dei divisori di n è
r («i 4-
l)(oi2 +
1 ) . . . (a r -f - f 1) = n < * + * ) •
/= !
Gli interi
Esempio 3.3
29
Determinare quanti sono i divisori positivi di 30.
Poiché n = 30 = 2 • 3 • 5, detto det to d un suo divisore, sarà d = 2/?l 3^ 5' con co n 0 < Pi < 1. f i può ass Ciascun fi a ssum um ere er e due du e valori e quindi i divisori diviso ri di 30 saranno 2 • 2 • 2 = 8. Precisamente, detto D l ’insiem e dei divisori positivi di 30, si ha D = [d e N | d | 30} = {1,2,3 ,5,6,10 ,15,30 }. Esis tono infiniti numeri prim pr imii . Proposizione 3.3 Esistono
primi positivi positivi.. Procediamo per per as Dimostrazione. Sia P l ’insieme dei numeri primi surdo e supponiamo che P sia finito, cioè che P = {pi, • • • ,p,} ,p,}.. Consideriamo ora il numero m = p \ p 2 • • • pt p t + 1. Esso risulta coprimo con ogni primo dell’insieme P quindi non è divisibile per nessuno nessuno di essi. essi. Inoltre non è un numero primo perché m £ P (infatti m > p¡,V/) e quindi si si ha l’assurdo. l’assu rdo. ■
3.3 Nu m erazio n e in base r i essere scritto in uno Teorema 3.6 Sia n un intero n > 2. Ogni intero a > 0 può essere e un sol modo nella forma: a = rhn> hn >l + rhrh- {nh~l nh~l -4----- n « 1 + r0n°, con 0 < r, < n, pe r ogni ogni i = 0 , 1, • • • ,h , h , h > 0. Dimostrazione. Per dimostrare l’esistenza della scrittura, si procede per induzio ne su a .
1.
Se a = 0 si si ha 0 = 0 • n°.
2. Supposto che l’asserto sia vero per ogni 0 < k < a, mostriamo che è vero anche per a. Dividiamo a per n: si ottiene a = nq + r con
0
e
0 < q < a.
Utilizzando l’ipotesi di induzione, possiamo scrivere q = shsh- \ n ll~x -I- 5/ j j _ 2/2/' ” 2 H------- M i / i 1 +Son°
con 0 < s, < n e qui quindi ndi,, sost sostit itue uend ndo, o, a = nq + r = Sh-\nh - f s / , _ H ------- h Si« 2 + so« 1 + r n 1' = = r,,nh + rh~inh~l -I----- r\n{ + r 0n°
ove rh = sh- U rh~\ rh~\ = sh- 2, • • •
= s0, s 0, r 0 = r.
dell ’espressione segue da ll’unicità ll’unicità di q ed r. ■ L’unicità dell’
30
Capitolo 3
Osservazion Osser vazionee 3.11 3.1 1
ro, n , • • • Jh sono i resti nella sequenza di divisioni:
a = n q + ro
0 < r o < n
q = nq \ + rx
ri < n 0 < ri
0 < r 2
qi = nq2 + r 2
0 < r/, r/, < n
qh-\ = n q h + rh Osservazione Osservazione 3.12 n — 1, il numero
n
Se indichiamo n simboli (cifre) distinti con gli interi da 0 a
a = rhrh rhrh-- i • • • r 0 = ( a )„ )„ si dice rappresentato in base n .
Osservazione 3.13 dell’alfabeto. Esempio 3.4
1.
Se 10 < n < 36 si possono usare le cifre da 0 a 9 e le lettere
n — 10: abbiamo l’usuale rappresentazione in base 10.
Il numero numer o (20 (2 0 05 )10 )10 = 2 • IO3 + 0 • IO2 + 0 • IO 1 + 5 • 10°. (2005) io in 2. n = 2 : ci serviamo dei simboli 0 e 1; ra pp re se n tia m o il num ero (2005) base 2, utiliz u tilizzan zando do l ’Oss ’O ssee rv az ion io n e 3.11 3. 11 . 2005
2 1002 + 1
1002
2 501+0
501 25 0 125 62 31 15 7 3
1
2 2 2 2
250+1
2 2 2 2 2
15+1
125 125 + 0 62+1 31+0 7+1 3+ 1
1+ 1 0+1
e quin quindi di (200 (2005) 5)io io = (11 11 1010 101)2. Viceversa: (11111010101 )2 = 1 - 2 10+ l - 2 9+ l - 2 8+ l - 2 7+ l - 2 6 + 0 - 2 5+ l - 2 4 + + 0-2 0-2 3+ l ' 2 2+ 0 - 2 1+ 1 -2° = ( 1 0 2 4 + 5 1 2 + 2 5 6 + 1 2 8 + 6 4 + 1 6 + 4 + 1)10 = (2005 (20 05)) 10. 10. 3. n — 8: util utiliz izzia ziamo mo le cifre cifre 0, 1 ,2 ,3 ,4 ,5 ,6 ,7. Ancora, in base all’Osservazio ne 3.11 si ha: 2005 250 25 0
8-250 + 5 8-31+2
31
8- 3 + 7
3
8-0 + 3
Gli inten
31
e quindi (2005) j0 = (3725) (3725)g. g. Vicevers Viceversaa (3725 )8 = 3-8 3 + 7 - 8 2 + 2 - 8 14-5-8° 4-5-8° = (1536+448 + 1 6 ~ 5 )10 )10 = (20 05) 05 ) 10. 10. 4.
= 16: (b ase esad ecim ale); si utilizzano solitamente le dieci dieci cifre cifre da 0 a 9 e le prime sei lettere dell’alfabeto:
n
0,l,2,3,4,5,6,7,8,9,A,fl,C,D,£,F In questo caso abbiamo (2005) 10 = ( 7 D 5 )i 6. Viceversa, (7D5 ) , 6 = (7 • 162 162 + 13 • 161 + 5 • 16°) 16°) = (1792 (1792 + 208 208 + 5 )io = (200 (2 005) 5) 10.
3 . 3 .1
Op erazio n i in b ase 2
Le operazioni in u na qualsiv oglia base si impostano e si risolvono in modo modo analo go a quanto si fa nel caso della numerazione in base 10. Nel caso ca so dell de llaa nu m eraz er azio ione ne in base ba se 2 è mo lto agevole agev ole fare ì calcoli. calc oli. In base bas e 10 si sa che 7 + 12 = 19 e 7 • 12 = 84. In base 2 si si ha: ha: (7 )io = ( 111) 2, (12)io (12)io = (1 100 100)2 e quindi
111+ 1 1 0 0 = 10011
111 x 1 1 0 0 = 000 0 0 0 1 1 1 1 1 1 1010100
Esercizi Verificare che (1001 1)2 = (19 )io )io e che ( 1010100)2 = (84) iq . Dati Dati i seguenti n umeri ume ri in base ^ 10, 10, trasform arli in numeri in in base 10: 10:
1. ( 1111111)2 2.
( 111111)4
3. (10011011)3
4. (127)g. Dati i seguenti segu enti nume nu meri ri in base bas e 10, 10, scriverli in base 2: 2:
5.
(1365) 10
6.
(2523)». Calcolare :
7.
(1111111)2 + 000 11 )2
8. (1010100)2+ (lim )2 9.
(1111111)2-(10011)2-
3.4 Equazioni lineari diofantee U algoritmo della divisione nonché l1algoritmo euclideo delle divisioni successive per la ricerca di un mc d fra interi giocano un ruolo notevole in molte applicazioni legate alla teoria dei numeri, in particolare nella ricerca di soluzioni intere di
equazioni del tipo: ax q- by = c, ove a,b,c e Z .
(★)
Definizione 3.9 Un’equazione del tipo F ( j c i , x 2, • • • ,x n) = 0 si dice diofantea (o diofantina) quando F ( jc ì , x 2, • • • ,x n) è un polinom io a coefficienti interi rela tivi 11 termine "‘diofantee’' deriva dal nom e del m atem atico greco Diofanto che operò in Alessandria verso la metà del secolo terzo . Per la v erità ben poco si sa della vita di Diofanto, se non il fatto che gli viene spesso dato l’appellativo di pa dre dell’ algebra poiché il trattato a noi pervenuto, V A ritm etica, è de dicato quasi esclusivamente alla soluzione di equazioni. Tra l’altro si deve a Diofanto l’intro duzione di una notazione simbolica molto simile alla n ostra inde term inata x. Prendiamo, ora, in esame alcune equazioni del tipo (★ ). Se consideriamo 33x + l y = 5 possiamo osservare che la coppia (1, — 14) è soluzione dell’equazione ma anche la coppia ( 3 , - 47 ) è soluzione così come la coppia (—1,19). In generale si può verificare che è soluzione dell’equazione data ogni coppia del tipo (1 + Ih , - 14 - 33h), h e IL. Se invece consideriamo l’equazione 2x -V-4y = 5 possiamo osserv are che essa non ammette alcuna soluzione (intera): infatti se esistesse una coppia {a, fi) e Z x Z soluzione di detta equazione, avremmo che la 4- 4/3 = 2 ( a + 2 £ ) = 5 e quindi otterremmo che 2 è un divisore di 5, assurdo! Diamo, pertanto, una condizione necessaria e sufficiente affinché un’equazione diofantea ammetta soluzioni e, nel caso in cui dette soluzioni esistano, diamo una formula per scrivere la soluzione generale. Teorema 3.7 tea)
Condizione necessaria e sufficiente affinché l ’equazione (diofan ax + by = c, ove a,b,c € Z
ammetta soluzioni intere è che mc d (a,b ) clivida c.
Gli interi
33
Dimostrazione. Indichiamo, anzitutto, con d un MCD(a,b): per definizione d a t d \ b quindi esistono a\,b\ e Z tali che a — d a \ , b = db . Supponiamo, ora. che l’equa zione (★ ) amm etta soluzione, cioè esista una coppia (xo,)'o) e Z x Z tale che axo + 6 vo = c; sostituendo ad a e b le loro espressioni in funzione di d si ottiene: (dai)xo + (dbi)y0 = d(aix0 + bxy0) = c da cui si deduce che d deve dividere c. Viceversa supponiamo che d c, cioè esista cx e Z tale che c = de . Poiché d = mc d (a ,b ) esistono.ri,yi e Z tali che a x j + b y x = d Moltiplicando membro a membro per c x si ha: a{xxci) + b(yicx) = dc\ = c e quindi la coppia (^ i Ci . ^
c i ) è
soluzio ne de ll’equazione (★ ). ■
Nel caso in cui l’eq uaz io ne ax + by — c amm etta soluzione, ricerchiamo una formula che fornisca la soluzione generale. Proposizione 3.4
Si consideri l'equazione diofantea (★ )
ax + by = c , a , b x e Z.
Supponendo che la coppia (a,ß) e Z x Z sia una soluzione particolare della (*), allora tutte e sole le soluzioni sono le coppie ordinate (jc.y) = (or + b\h ,ß —axh) ove d = m c d (<2,/?), a = da i, b = d b i, d \ c (per il teorema precedente) e h e Z. Dim ostrazion e. Verifichiamo che (a + b\h ,ß —axh) è soluzione della (★ ) Infatti, sostituendo, otteniamo:
a{a -f b\h) + b(ß —axh) = aa + ab\h + bß —baxh = act + bß —c (essendo (a ,ß ) una soluzion e della (★ )). Viceversa se (xo, Vo) € Z x Z è soluzione dell ’equazio ne (★ ), da (
aa 4- bß = c axo + by 0 = c
sottraendo m embro a mem bro si ottiene: ala - xo) + b{ß - ,v0) = 0
e quindi, sostituendo, da i (or - xo) = dby{yQ- ß) da cui, dividendo membro a membro per d, si ottiene l’uguaglianza: a j (or - x 0) = bylyo - ß).
(*★ )
Poiché a x divide il prodotto b\{ß — yo) ed è primo con b\ (cioè MCD(a\,bi) = 1), necessariamente ai deve dividere lyo —ß). Sicché yo~ ß = a\h , per un opportuno h e Z. Sostitu end o nella (★ ★ ) e semplificando per ai si deduce che ar —.xo = b\h, da cui segue la tesi. ■
WjCIfJIlVJlU O
Esempio 3.5 Si dica se sono risolvibili le seguenti equazioni lineari diofante
in caso affermativo se ne determinino tutte le soluzioni:
L
a] 3 jc + 21>’ = 5
5>’ = 7 c] 9x 4-15 v = 21 d] 3x 4- 15y = 21.
b] 3x +
Soluzione al Osserviamo che m c d ( 3 ,2 1 ) = 3 e 3 { 5 quind i l ’equ azio ne non è risolvibile. b] Poiché m c d ( 3,5 ) = 1 e 1 | 5 l ’equ azio ne è risolv ibile. Una soluzione particolare è data dalla cop pia ( —1,2 ), pertanto la soluzione gene rale è (;t,)0 = (—1 + 5 h, 2 —3/z), ove h e Z. c] Poiché m c d (9,15 ) = 3 e 3 | 21, l ’equazione ammette soluzioni. Dividendo membro a membro per 3 si ottiene l’equazione 3x + 5y = 7 che è equivalente a quella data, le cui soluzioni sono quelle trovate al punto b]. d 1 Anche in questo caso l’equazione è risolvibile poiché m c d (3, 15) = 3 e 3 | 21. Una soluzione particolare dell’equazione in questione è data dalla coppia (2,1) quindi la soluzio ne generale è data da: jc = 2 + 5 h , y = 1 — h, per h e Z.
3.5
R e l az io n i r i c o r s i v e
L’intento di questo paragrafo è quello di fornire una introduzione alla risoluzio ne di problemi in cui intervengono relazioni ricorsive, cioè successioni in cui l’n —esimo elemento sia correlato ai term ini che lo p reced ono . È importante sottolineare ch e dette relazion i g iocan o u n ru olo essen ziale negli al goritmi ricorsivi, cioè in quegli alg oritm i in cui si risolve un prob lem a riducendolo ad un sottoproblema dello stesso tipo con un input più piccolo. c
Ad esempio si considerino le seguenti istruzioni per g enerare una successione: 1. si inizi con 3 2. dato un qualsiasi termine, si agg iung a 4 per ottenere il successivo. Naturalm en te il primo term in e è a\ — 3 per l’istruzione 1.; utilizzando V istruzio ne 2., otteniamo il secondo termine a 2 = <3! 4-4 = 3 + 4 = 7, poi il terzo termine ai — ai + 4 = 7 + 4 = 11; quindi il quarto aA = 15, il quinto a5 = 19 e così via. Le condizioni 1. e 2. non danno esplicitamente una formula per compu tare il termine n -esimo, ma permettono di calcolare ogni termine della sequenza proce dendo termine per termine. Ora, posto a\ — 3 si può sostituire l’istruzione 2 . ponendo an — an- 1 + 4, n > 2
(★ ★ ★)
e in questo modo è possibile determinare ogni termine della successione La relazione (* ★ ★) fornisce un esempio di relazione ricorsiva.
Gli interi
35
Il lettore può ricordare la successione di Fibonacci e rileggerla come relazione ricorsiva:
ftt = /«-1 4- fn —2t
n > 3 , pon end o/i = 1,
f 2 = 2.
Definizione 3.10 Una relazione ricorsiva è una legge che definisce una succes sione assegnando Un--esìmo termine in funzione di termini antecedenti, una volta fissato il valore iniziale . V
E immediato osservare che una relazione ricorsiva, pur permettendo il calcolo del valore del termine «-esimo a„ per ogni n, dà solo inform azioni locali, in quanto detto termine a„ si computa in funzione dei precedenti termini, Risolvere una relazione ricorsiva significa trovare una cosiddetta “ formula chiu sa”, cioè una formula che esprima direttamente an in funzione di un numero di operazioni ben note su n . Ad esempio nel caso delle progressioni aritmetiche e geometriche rispettivamente si ottiene:
an = a + (n — \) d an = aqn~l ove q e d rappresentano la ragione, a il valore iniziale ed « > 1. Risolvere relazioni ricorsive può essere molto complicato; ci sono tuttavia casi per i quali la riso lu zi on e è se mplice e altri pe r i qua li esistono tecniche che ci perm ettono di arrivare ad un a fo rm ul a chiusa. Cominciamo, pertanto, ad affrontare le cosiddette equazioni ricorsive lineari.
Definizione 3.11 Si dice equazione ricorsiva lineare di ordine k a coefficienti costanti una relazione ricorsiva del tipo
an = h\an-i 4- ^ 2^ - 2+
........
~fhkan-k 4- h
ove h,,h e E, Vi = 1, ,/c, ed h * 0. Nel caso in cui h = 0. Uequazione si dice omogenea {di grado k). ___
Esempio 3.6
La re lazion e ricorsiva che definisce la successione di Fibonacci
fn = fn —l + fn —2'
tl > 3, po ne nd o f i = 1, f 2 = 2
è lineare omo genea di grad o 2 , mentre la relazione ricorsiva
bn — 3bn—\bn—2 non è lineare o m og en ea a cefficien ti costanti, poiché i suoi termini non sono del tipo cbk. Ancora, ogni relazione ricorsiva del tipo
è lineate omogenea a coefficienti costanti, poiché il termine che sta a destra ce. segno di ugua glianza no n è n ullo. Noe è crea re om ogenea neppure u n a relaz io n e ric o rsiv a del tipo: m
dn — 5ndn-\
costante.
Ci proponiamo omogenee a co Consideriamo la seguente relazione ricorsiva lineare om ogen ea: an = h ia n-y + h 2an- 2+ .........+ h ka n- k
(★ ★ ★ ★ ★ )
e cerchiamo una soluzione del tipo an = tn, t costante. E immediato verificare che tn sarà soluzione di (★ ★ ★ ★ ★ ) se e solo se tn - h y t " - 1 - h 2t n- 2- .........- h ktn~k = 0
da cui, dividendo membro a membro per t"~k, si avrà: tk - h \tk~l - h2tk~2- ........ - h k = 0 .
Quest ultima equazione è detta equ azione c a ra tte ris tic a ass oc iata a lla relazione ricorsiva e le sue radici sono dette radici caratteristiche dell’equazione ricorsi va Prop osizione 3.5
Si consideri la relazione lineare ricorsiva di grado k : h \a n—\ + h2an—2~\~........ ~\~hkan—k + h
ove hi,h € R, Vi = 1, ........ k , h k ¿ 0 , e sia tk - h {tk~x - h2tk~2- ........ - h k = 0
/ equazione caratteristica ad essa associata. Se l ’equazione caratteristica am mette radici t\ ,t 2, . . . . ,tk tutte distinte, allora una successione {a,,} è soluzione della relazione ricorsiva se e solo se an = C\t" 4- C2?2 + ........ +cktk,
c\,c 2 , . . . ,ck costanti, Vn > 0
e i coefficienti C\ ,c2, . .. ,ck sono determinati a partire da k valori iniziali fissa ti
E sem pio 3.7
Sia data la relazione ricorsiva:
an = lan-\ - \2 an- i , con valori iniziali a0 = 5 ,a y = l i .
Si ricono sce che la relazione ricorsiva data da an — lan-\ + \ 2 a n-2 = 0
Gli interi
37
è lineare omogenea di grado 2 a coefficienti costanti. L’equazione caratteristica ad essa associata è t 2 - l t 4 12 = 0
le cui radici son o 3 e 4 (quindi distinte). A bbiam o perciò le soluzioni: an == ci(4-3)/I 4- c2(+4)n.
Imponendo le condizioni iniziali ao = 5, ai = 11 si ottengono le relazioni: f a0 = ci3° 4- c 24° = 5 | a\ = C131 + c 24 1 = 11
| c i + c2 = 5 | 3ci + 4c 2 = 11
ci = 5-c 2 3(5 —c2) 4- 4 c 2 = 1 1
( ci = 9 j c2 = - 4
e quindi a„ = 9(43 )" - 4(44 )" = 3"+2 - 4"+1,
0.
Esem pio 3.8 Ripren diam o la relazione ricorsiva che porta alla successione di Fibonacci: fn = f i - 1 + f i —li n > 3, con valori iniziali / i = 1, f 2 = 2 Essa è lineare omogenea di secondo grado sicché l’equazione caratteristica ad essa associata sarà: t2 - t - 1 = 0
le cui radici distinte sono: ha =
1 ±V 5
La soluzione ha la form a n
/n =
, / 1 ~V 5 + C2
i *
----
Le condizioni iniziali impongono che siano verificate simultaneamente le equa zioni: ,
. 1 4 a / 5 \
Jl ~ c\ I ----^---- I + ^2
/ 1 -V 5
.
.
. iW
5 \\
= 1» /2 = <4 I — i — I 4- c2
/ 1 - ^ /5 '
Risolvendo il sistema si ottiene: Ci =
V 5 ( \ 4 a/5
5 4 V5
10
c2 = -
V5/l-V5\
5 —
10
Da cui la formula chiusa: 5 + V5 /" = 1
o _
/1 + v ^ V ' \
2
, 5 - 75
10
/
= v s ( i ± v i y +1_
^
1-
2
\
( ^
-M
"
+1
Due sono le osservazioni da farsi: nonostante /„ sia un numero intero, la formula chiusa ottenuta evidenzia la presenza del num ero irrazio na le \ / 5 . Inoltre nella stessa formula è presente il numero a = , cio è il cosiddetto rapporto aureo o proporzione divina : in altre parole ciò che per i Greci era con siderato il rapporto più armonioso tra du e gran dezze x e y
x : y
=
(x
+
y) : x
al punto che la facciata del Partenone è stata inscritta in un rettangolo i cui lati soddisfano queste proporzioni. Possiamo inoltre osservare che, al cresc er e di n, f n si avvicina al numero irrazionale ^ . v5 Consideriamo, ora, il caso in cui l’equazione caratteristica associata ad una rela zione ricorsiva omogenea di grado k abbia radici multiple ed espo nia m o i risultati senza fornire la dimostrazione. Proposizione 3.6
Sia an = h\an-\ -f h2an_2+
........
+hica„-ic
una relazione ricorsiva lineare di grado k, ove h, e R , hk ^ 0 e sia tk - h ì tk- ' - h 2tk- 2 - ......... —hk —0 I equazione caratteristica associata. Se le radici distinte sono t\ t2 . . ,ts con s < k e hanno molteplicità rispettivamente m u m 2........ ,m s, ove m t > 1, per , 5} e m 1 4- m 2+ ogni i e {1,2, + m s = k, allora {a,,} è soluzione di tale relazione ricorsiva se e solo se ........
------
an = (cL0 + clAn+
.........
+ ( c 2,0 + C2 , l r t +
+ c 1>Wl_ 1nm' - 1)if +
.............
+C2.m2-lU m2_1)f'J +
...............................................................+ + (G , o + csAn+ + cs
ove n e N; cttJ e K , \ < i < s, \ < j < m, — \ e i coefficienti c, j sono determinati dai valori iniziali.
E se m pi o 3.9
Sia data la seguente relazione ncorsiva di secondo grado a„ =
- 9a „ - 2,
ao = ai = u
L’equazione c aratteristica associata è:
t2 - 6t +
9 = 0;
essa ammette radice 3 con molteplicità 2. Allora: «« = (ci.o +
c\\n)yi.
Utilizzando le condizioni iniziali, determiniamo
c\ 0 e c\ \ :
«o = 1 = ci,0 • 3° «i = l = (ci.o + ci,i ' 0 3 1
^ì.o fu
= 1 2 3
e quindi otteniamo:
an =
(1 -
j
/ i )3" = 3” - 2n3"-1
Eser cizio 3.2 Dire quali delle seguenti relazioni ricorsive sono lineari omogenee a coefficienti costanti: 1.
ciu
—
3>nciii—j
2. b„ = b,,_i
-f-
3. Cn — 5c h_2 4. 5.
n Òd n~3
dn — ?>dn—\ en = —en-\ + 5 e„_ 2.
Eserc izio 3.3
Riso lvere le seguenti relazioni lineari ricorsive a coefficienti co
stanti: 1. dn = SéZ /j — \Sdn— 2 i 2 . bn = - 24 6,,_ 2 3. c„ = 4c„_i - 4tì n_2 4. dn — 3dn—i 5. = 10e„_i — 25e„_2.
Utilizzando le rela zioni lineari ricorsive om ogenee si possono risolvere alcuni pro blemi connessi con la cres cita delle popolazioni nel tempo, modelli economici ecc. Ad esempio, data una popolazione di 1000 esemplari al tempo iniziale {n = 0), supponendo che, passando dal tempo n — 1 al tempo n essa aumenti la sua consi stenza del 10% rispetto al tempo n — 1, otteniamo la seguente relazione ricorsiva: «o = 1000 1 «/I —«n—l = — «H—1 10 11 dn = ----- -1 10 « 7 1
Da qui si deduce che
11
11
11 Y
n /u io | i o a"
Tó) a,l~2 ~
Tò
a0 =
n io
n 1000
cioè la crescita è esponenziale. Diamo, ora, alcuni cenni sulle relazioni ricorsive lin e a ri n o n om ogenee. Sia ci„ = h\an-i + h2dn-2+ ........+hkan-k + f (n)
una relazione ricorsiva lineare non omogenea, ove ht e R , * / 0 e /( « ) non è identicamente nulla e dipende da n. Le soluzioni an si trovano aggiungendo ad una soluzione particola re d e ir equazione non omogenea, a[,no), le soluzioni della relazione om oge ne a asso cia ta a®, cioè le soluzioni della relazione che si ottiene ponendo f( n ) = 0. Sicché: (0 )
an = «lro) + an
Pertanto il problema si riduce a trovare una soluzione particolare dell’equazione non omogenea, giacché quelle della omogenea sono state già studiate. Procediamo con un esempio illustrativo. Consideriamo l’equazione: an — an..\ + n , c o n a o = 0 .
I primi casi danno a\ = a0 + 1
«2 = «i + 2 a 3 = a2 + 3 ¿*4 = a 3 + 4
¿*0 + 1 + 2 £*o+ 1 + 2 + 3 00 + 1 + 2 + 3 + 4
an = «o + 1+ 2+.
n
e quindi n n(n + 1) an — a0 + y ' l =
La relazione assegnata era non omogenea del tipo:
a„
dn—\ — f (fi)
ed è stata risolta poiché si è ottenuto: n
a„ = aB + f ( ì ) + f ( 2 ) + .......... + / ( « ) =
+ V / ( i )
Gli inter i
41
Ora la relazione om ogen ea associata è: On
&n—l = 0
e quindi è di grado 1, m entre l’equazione c aratteristica associata è t - 1=0
che ammette soluzione t = 1. Pertanto an = c\ V1. Essendo a0 = 0, si ha che C\ = 0 e quindi an = 0. Sicché lo zero della (★ ★ ★ ★ ★ ) è soluzione dell’equazione omogenea associata, mentre fl^n
—- è una solu zion e partic olare di quella non omogenea.
Rientra in questa casistica il cosiddetto problema della Torre di Hanoi inventato alla fine de ll’ ottoc ento dal m atem atico Lucas, forse ispirandosi ai Brahamini, che nel tempio di B rahm a avevan o il com pito di fare in continuazione trasferimenti di 64 dischi d’oro posti su 3 aste d ’oro su basi di diamante. Nell’ istante stesso in cui il trasferimento fosse terminato il mondo sarebbe terminato! Descriviamo pe r bene il gioco d ella Torre di Hanoi: ci sono n cerchi infilati in un’asta verticale a con diam etri decresc enti dal basso verso l’alto. Finalità del gioco è trasferire tutti i dischi nello stesso ordine di prima, cioè con diametri decrescenti dal basso verso l’alto, su un’altra asta y seguendo regole precise: ( 1) i cerchi devono essere trasferiti uno per volta, passando per un’asta inter media p (2 ) mai un cerchio di diametro maggiore può trovarsi su uno di diametro minore. E possibile individ uare u na form ula ricorsiva che risolve il problema. Indichiamo con a„ il num ero di mosse nec essarie a concludere il gioco. Se n = 1 allora a i = 1. Proce diam o per induzione, supponend o di sapere che per trasferire n — 1 cerchi occorrano an-\ mosse e calcoliamo an. Trasferiamo da a a fi gli n — 1 dischi superiori con an-\ mosse; muoviamo, poi, su y, in una mossa, il cerchio rimasto di diametro più grande. Da ultimo rimuoviamo da p a y, in j mosse, gli n — 1 cerchi che avevamo prima trasferito . O tte niam o an = 2a„_i + 1
che è una relazione lineare non omogenea di grado 1. Poiché: a„ = 2an-i + 1 =
2 (2 a n- 2 +
1) + 1= 2 ~an-2 + 2 + 1 —
2 (2a „_3 + 1) -f 2 4 - 1 = 2*cin-2 + 2 “ + 2 + 1 = . . . . =
= 2n- la{ -F2,," 24-..............4-2+1
42
Capitato
3
e poiché a\ = 1 , l’espressione ottenuta è la somma di una progressione geometri ca dì ragione 2 e quindi a„ = 2
+
2" ’
2+
n -1 + 2 + 1 = V 2' = 2" - 1 0
3.6 A l c u n e a p p l i c a zi o n i a l l ’ a n a l i s i d i a l g o r i t m i La principale applicazione delle relazioni ricorsive nella teoria degli algoritmi è legata al computo del tempo di esecuzione di un algoritmo. A tal fine occorre produrre una re lazione ricorsiva e fo rnire delle condiz io ni in iz ia li che definiscano una sequenza a \,a i% a ^ .. . ,a„ . . . , ove an è il tempo richiesto da un algoritmo per es eguire un input di am piezza n . Risolvendo la relazion e ricorsiv a si è in grado di determ inare il tem po richiesto da ll’algoritmo. Procediamo con un esempio Algoritm o che computa una potenza: Input: a € R, n e N \ {0} Output cin. 1. procedure exp(a,n) 2 . if n.ss 1 then 3. return (a)
4 m = tu 5. return (exp (a,m ) • ex p(a,n - m)) 6 . end exp Come misura del tempo richiesto da questo algoritmo contiamo il numero c„ di moltiplicazioni alla riga 5 per calcolare an. Si ottiene su bito la co nd izion e iniziale C\ — 0 .
Per ottenere la relazione ricorsiva per la sequenza C|,C 2, .............. simuliamo l’e secuzione deiralgoritmo per un arbitrano input n > 1. Con tiam o il num ero di moltiplicazioni per ogni riga e poi sommiamo i numeri per ottenere il numero to tale dì m oltiplicazion i. Nelle righe 1 —4 non ce ne sono. Alla riga 5 ci son o n — 1 moltiplicazioni e poi basta, sicché cn = ri - 1
che fornisce la relazione ncorsiva richiesta. Così il tempo richiesto dalLalgoritmo in questione è 0(n). Osserviamo che la precedente applicazione è stala presentata solo per fornire un es em pio di utilizzo del procedimento ricorsivo. Ricordiamo che, in generale, non è vantaggioso utilizzare tale procedimento nel caso esistano procedure al
Gli interi
43
vengono richiamati (nel caso deiresempio n log n) e del conseguente uso di tem po nella tra sm iss ione dei parametri, sono più lenti ed occupano più memoria di altri procedimenti. Esistono però situazioni in cui l’unica via percorribile è quella della ricorsione, ad esem pio nel calcolo de lla funzione di Ackerman (cfr. M. Bonecchi, L. Zauli: “Algoritmi su Teorìa e applicazioni degli elaboratori’' Edizioni CLUP 1994).
4 Relazioni binarie tra insiemi
Il mondo è infinito, l ’universo è inesauribile e il cervello umano non sarà mai minacciato dalla disoccupazione (G. Haltshuller: ‘The Innovation Algonthm”)
Definizione 4.1
Una rela zio n e bin ari a fra due insiemi X e Y (non vuoti) è un sottoinsieme 1Z del prodotto cartesiano X x Y, cioè un insieme 7Z di co pp ie ord in ate (x,y), x e X, y e Y.
1. Se X = Y si parla di relazione su X.
2. Se 7Z è una relazione fra X e Y e la coppia (x,y) € 1Z si scrive anche xTZ y e si dice che „vè associato a v nella relazione 7Z. 3. Ogni sottoinsieme 7Z di X x Y è una relazione fra X e Y\ in particolare: 3.1 7 Z =0 è la relazione vuota (nessun elemento di X è in relazione con elementi di Y). 3.2 TZ = X x Y è la relazione totale (ogni elemento di X è in relazione con ogni elemento di K). Se X = Y, X x X = X 2 è la relazione universale su X.
4. Se X = Y, la diagonale di X 2 cioè identica su X.
I \ —
{(*,-01 * € X}, è la relazione
Definizione 4.2 Data una relazione TZfra X e Y si dice re la zione trasp os ta di 7 Z la relazione 1Z1 così definita 7 ZT = {(j,*) e Y x X| (*,0 e IZ }< Esempio 4.1
Sia X = {a,b,c} :
1Z = {(a,b),(b,b),(a,c),(b,c)}
7 Z1 - {(b,a)Ab,b)y(c,a),(c,b )}.
Osservazione 4.1
{TZ7)1 =7Z.
Sia ora 7Z una relazione definita su un insieme X. Definizione 4.3 7Z è riflessiva se e solo se Ix ^ 7Z, cioè se per ogni x e X si ha che:
Oc,*) e 7 Z
(cioè xTZx, V* e X ).
Definizione 4.4 7Z è simmetrica se t z7
=
tz
cioè se e solo se
(*,}>) € 71 =>■ (y,*) € 71 (xTZy ==> y lZ x ). Definizione 4.5 71 è antisimmetrica se e solo se
71 n 7lT c
ix
cioè se
(*,y) e 71
e
(y,x ) e TZ =>• * = y
(x7Zy A yTZx => x = y).
Definizione 4.6 7Z è transitiva se e solo se
(x,y) € 7 Z e Definizione 4.7
(y,z) e 7 Z= ì ( x ,z ) e 7Z (cioè
xTZy
a
;y7£z => xTZz).
Una relazione che sia riflessiva, simmetrica e transitiva si dice
relazione di equivalenza. Definizione 4.8 Una relazione che sia riflessiva, antisimmetrica e transitiva si dice relazione d'ordine. Esempio 4.2 SiaX = {a,b,c) ed 7Z\ = {(a,a),(a,b),(b,b),(b,c),(c,b)} c X2.
1. La relazione non è riflessiva perché la coppia (c,c) £ 7Z\ ;
2. la relazione non è simmetrica perché (a,b) e 7Z\ ma (b,a) £ 7Z\\ 3. la relazione non è transitiva perché ( a,b) e 7Z\, (b,c ) € 7Z\ ma (a,c)
7Z\\
4. la relazione non è antisimmetrica perché ( b,c ), ( c,b ) e 7Z\ con b ^ c. Esempio4.3 Sia 7Z2 = {(a,a),(b,b),(c,c),(a,b),(a,c),(b,c),(c,b)} Q X“ ove X = {a,b,c}.
1. La relazione è riflessiva perché Ix = {(<3,a),(/?, 7?),(c,c)} C 7^25
2. la relazione non è simmetrica: (a,b ) € TZ-i ma (b,a) £ 7£2; 3. la relazione è transitiva (verifica all* Esempio 4.8);
Relazioni binarie tra insiemi
4.
47
la relazione non è antisimmetrica: (b,c) e (c,b) € 7l2.
Esempio 4.4
Sia 7Z3 = {(b,b)} c X x X, ove X = {a,6 ,c}.
1.
La relazione 7Z3 non è riflessiva perché (a,a) non appartiene a 7Z3;
2.
la relazione 7£3 è simmetrica, antisimmetrica e transitiva.
Esercizio 4.1
S/a X = {1,2,3,4} e sia R\ la relazione su X così definita;
K x = {(1,1),(1,2),(2,1),(2,2),(2,4),(3,3),(4,2)}. S/ false:
1.
giustificando la risposta, se le seguenti affermazioni sono vere oppure è riflessiva;
2.
711 è simmetrica;
3.
1Z\ è antisimmetrica;
4.
7Z[ è transitiva;
5.
7Z[ è un'applicazione da X a X.
Esercizio 4.2
Sia X = {1,2,3,4,5} e sia 7£2 lo relazione su X così definita.
n 2 = {(1,1),(2,1),(2,2),(2,4),(3,3),(4,2),(4,4),(5,1),(5,5)}. Si dica, giustificando la risposta, se le seguenti affermazioni sono vere oppure false: 1.
1Z2 è riflessiva;
2 . 7Z2 è simmetrica; 3.
7Z2 è antisimmetrica;
4.
7Z2 è transitiva;
5.
7Z2 è un 'applicazione da X a X.
Esercizio 4.3
Sia X = {1,2,3,4} e sia 7£3 la relazione su X cosi definita:
K 3 = { ( U ) , (1,2), (1,3), (1,4), (2,2), (2,3), (2,4), (3,3), (4,3), (4,4)}. Si dica, giustificando la risposta, se le seguenti affermazioni sono vere oppure false: 1.
7Z3 è riflessiva;
2.
7Z3 è simmetrica;
3.
7Z3 è antisimmetrica;
4.
7Z3 è transitiva;
5.
1Z3 è un 'applicazione da X a X.
48
Capitolo 4
4.1 Matrici di in cidenza Sia X un insieme finito di ordine n. Una relazione 1Z su X si può rappresentare mediante una tabella a doppia entrata (matrice) M n con n righe ed n colonne così definita M n = (rtj) =
r,j = 1 se ( x ,,x j ) e 7 Z r,j = 0 se ( x ì , x j ) t 7Z
M- jz è detta matrice di incid enz a della relazione 7Z (su X).
Esempio 4.5 La matrice di incidenza della relazione 1Z\ dell’Esempio 4.2 è
1 10 0 1 1 0 10 La matrice di incidenza della relazione TZi de ll’Esempio 4.3 è
1 1 1 0 1 1 0 1 1 Viceversa una matrice M — (a,7) (a n righe ed n colonne), con at] e {0,1} può essere vista come la matrice di incidenza di un a relazione su un insieme di ordine n . Esempio 4.6 La matrice
1110 M =
0 10 0
1 0 11 0 0 0 1
può essere vista come la matrice di incidenza di una relazione TZ su un insieme X, con |X| = 4. Se scegliamo X = avremo 1Z = {(a,a),(a, 6),(a,c),(ò,/?),(c,a),(c,c),(c,i/),(i/,i/)}.
Osservazione 4.2 Le proprietà di una relazione si possono dedurre molto age volmente osservando la matrice di incidenza: a.l 7l = 0 s e ru = 0 ViJ = 1,2,... ,n; a.2 7?. =X 2 se rtl = 1 Vi ,j = 1,2 .........n; a.3 -R = / x se r„ = 1Vi = 1 ,2 ,. .. ,n e rh = 0 Vi ^
Relazioni binarie tra insiemi
b.l
7 Z è riflessiva se rn = 1, V7 = 1 ,2 ,. .. ,/r,
b.2
72 è simmetrica se r,y = rJt,V i,j = 1,2,... ,/*;
b.3
72 è antisimm etrica se r,j • rJt = 0, / ^ y;
b.4
72 è transitiva se r,* • r*y < r;;, V/,y,7: = 1 ,2 ,...
Esempio 4.7
49
La matrice
può essere interpretata come la matrice di incidenza di una relazione sull insieme X = {a,b}\ tale relazione è riflessiva poiché è verificata la (b.l), antisimmetrica per (b.3) ma non simmetrica perché non è verificata la (b.2) ed è transitiva perché è verificata la (b.4). Esem pio 4.8 Riprendiamo le relazioni dell’Esempio 4.5. La 72j non è transitiva perché r ì2 • r 23 = 1 ^ r 13 = 0 , mentre la relazione 722 è transitiva perché è soddisfatta la condizione [b.4]: r,krk] < rtJ per ogni i , j , k e {1,2,3}. A tal scopo osserviamo che tali disuguaglianze sono certamente verificate nei casi in cui y = k e quelle in cui / = k (cioè < r,k e rkkrkj < rkj). Verifichiamo le restanti disuguaglianze: ri 2r2i = 0 < r n , r ]2r 23 = 1 = r 13, r 13r3i = 0 < r n , r 13r 32 = 1 = r{2, r 23^*32 = 1 = r22, r 32r 23 = 1 = r33.
4.2 Relazioni di equivalenza Definizione 4.9 Ricordiamo che una relazione 72 su un insieme X si dice rela zione di equivalenza se i) alZa Va e X (proprietà riflessiva); ii) a 72 b => bTZa (proprietà simmetrica); iii) aTZb, bTZc => a72c (proprietà transitiva). Definizione 4.10 Diremo classe di equivalenza individuata dall’elemento a di X l ’insieme degli elementi di X che sono equivalenti ad a nella 72; in simboli [a]t i = {x € X | x IZa).
Teorema 4.1
Siano a, b e X e sia 72 una relazione di equivalenza su X. Allora
si ha:
1- a € [a]n : 2.
blZ a => [b]n=[o]n (quindi una classe di equivalenza è individuata da uno qualsiasi dei suoi elementi);
50
Capitolo 4
3. b i [a]n => [b]n D [a]n = 0 (cioè due classi di equivalenza distinte non hanno elementi in comune, ovvero sono disgiunte).
Dimostrazione.
1. Immediato poiché alla per la proprietà riflessiva. 2. Sia x € [b]Ti e quindi x1l b; poiché per ipotesi òlla, per la transitività di 11 segue xTl a cioè jc e [afo. Quindi [b]n ^ [a]n-
Viceversa, sia y e [a]^, allora \11 a e, ancora per la simmetria di 71, a Ry. Da bU a e all y segue b 71 y cioè y e [bfa e quindi anche [af o c [b]n< da cui segue l’uguaglianza delle classi. 3. Per assurdo sia x e [b]n n [afo allora jc 71 b e x 71 a e, per la simmetria e la transitività di 71, bTlx e x1la da cui bTla e quindi [b]n = [a]n
■
Definizione 4.11 Si dice partizione di un insieme X ^ 0 ogni collezione di sot toinsiemi non vuoti A,, dì X ì e I, tali che:
1. A, fi Aj = 0 per i ^ j 2. U Ai = Xi€/ In altre parole, ogni elemento di X appartiene a uno e un solo sottoinsìeme A, della partizione.
Teorema 4.2 Ogni relazione di equivalenza 71 su un insieme X determina una partizione di X i cui elementi sono le classi di equivalenza (rispetto ad 71). Viceversa ogni partizione di X determina una relazione di equivalenza (su X) le cui classi di equivalenza sono gli elementi della partizione considerata. Dimostrazione. 1. Mostriamo che le classi di equivalenza rispetto ad una relazione 7Z sono gli elementi di una partizione di X. Infatti ogni elemento a e X sta in una classe poiché ogni a € Inoltre a appartiene ad una sola classe; infatti se a € [c]%, c 6 X, si avrebbe a l i c e quindi [a fa = [ c ] t z (cfr. Teorema 4.1). 2. Viceversa, sia {A,j i € /} una partizione di X e si consideri la relazione 71 così definita: per x,y e X poniamo xTly <&x,y € A,. Si verifica in modo immediato che R è una relazione di equivalenza su X e quindi segue la tesi. ■
Relazioni binane tra insiemi
51
Definizione 4.12 Introdotta una relazione di equivalenza R su un insieme X, l ’insieme delle classi di equivalenza prende il nome di insieme quoziente di X rispetto a R e lo si indica con X I t i . Osservazione 4.3 Con la frase “passare al quoziente ' si intende identificare elementi di un insieme fra loro equivalenti rispetto ad una relazione R data. Esempio 4.9 Sia T l’insieme dei triangoli del piano euclideo. Le note relazioni di congruenza e di similitudine sono relazioni di equivalenza (verificarlo). Esempio 4.10 Sia X = {1,2,3,4,5,6 ,7} e sia Y = {{1,3},{2},{4},{5,6,7}}. Os serviamo che Y è una partizione dell’insieme X e individua, pertanto, la relazione di equivalenza q su X così definita:
6 = {(1,3),(3,1),(5,6),(5,7),( 6 ,7),(6,5),(7,5),(7, 6)} U Ix . Esercizio 4.4 Nell’insieme N x N, si consideri la relazione
q
così
definita.
(a,b)Q(c,d) <=>■ a + d = b + c e si mostri che è una relazione di equivalenza.
Diamo ora un esempio importante di relazione di equivalenza congruenza mod n in Z.
la relazione di
4.3 Relazione di congruenza in Z Definizione 4.13 Sia X = Z, a.h € Z ed n un intero n > 1. Si dice che a è congruo a b modulo il e lo si scrive 1
a = b(modn) se 3 h € Z tale che a —b = hn. Proposizione 4.1 La relazione di congruenza (mod/i) è una relazione di equi valenza in Z. Dimostrazione.
Proprietà riflessiva Va € Z è a = a(modn) : infatti a — a = 0 • n. Proprietà simmetrica: sia a = b(modn) => Ih € Z tale che a —b = h n: ma h) • n , con (— h) € Z e quindi b = a(mod;i). è anche b — a = (— 1Questa notazione è dovuta a Gauss (dal suo trattato Disquisitiones Anthmeticae' - 1801-1
52
Capitolo 4
Proprietà transitiva: a = b(modn) => 3/ij £ Z tale che a - b = h\ • «, b = c(mod/i) => 3/i 2 £ Z tale che b —c = I 12 • n. Sommando membro a membro si ottiene a —c = (/? 14- /12) •n
h 1 + /ì 2 £ Z
da cui segue che a = c(mod/i). ■ Fissato n > 1, l’insieme Z può essere ripartito in classi di congruenza ottenute includendo in una stessa classe tutti e soli gli z £ Z a due a due congrui tra loro modulo n. Quindi la classe di congruenza individuata da jc è [ jc]„ = (x + hn\ h £ Z} = {y £ Z| >’ = jc(mod/i)}.
Proposizione 4.2 Fissato n > 1, si hanno esattamente n classi di equivalenza distinte, che possono essere rappresentate dai numeri 0 , 1 , . . . ,n — 1. L ’insieme di queste classi di congruenza è indicato con il simbolo Z„ e viene usualmente chiamato “insieme delle classi di resti modulo n Si ha quindi = {[0]n, , [ r t
- 1]„}.
Dimostrazione. Sia jc £ Z; per Talgoritmo della divisione 3! q,r £ Z tali che .r = nq + r, con 0 < r < n. Si ha quindi che jc = r(m odn ), cioè [x]„ = [r]„. D’altro canto, due classi U]„,[y]„ con 0 < x < y < n sono sempre distinte. Infatti se [x]n= [y]n avremmo x = y(modn) cioè n sarebbe divisore di —y). Poiché x e y sono entrambi minori di n l’unica soluzione è a : — y = 0 da cui segue x = y. ■ Osserviamo ora i legami che sussistono tra le operazioni di somma e di prodotto definiti in Z e la relazione di congruenza modulo n. Proposizione 4.3 La relazione di congruenza (mod n) è compatibile con le ope razioni di somma e di prodotto di IL, cioè se a,b £ Z da a = b(modn) e c = d (mod n) segue a + c = b + d(modn) a •c = b ■ d(modn).
Dimostrazione. Poiché a = £>(modn) e c = d ( mod n) esistono h,k £ Z tali che a - b = hn, c - d = kn. Sommando membro a membro otteniamo (a —b) 4- (c — d) —hn 4- kn
cioè (a + c) - (b + d) = (h 4- k)n , da cui segue a 4- c == b 4- d(mod n). Analogamente, essendo a - b + hn, c = d 4- kn, moltiplicando membro a membro, si ottiene ac = (b + hn)(d 4- kn) —bd 4- {bk 4- hd 4- hkn)n =$• ac = bd(modn). ■ Valgono anche le seguenti proprietà
Relazioni binane tra insiemi
Proposizione 4.4
53
Sia n > 1 e siano a, b, t € Z, t > 0
1. se a = ò ( m o d n ) allora a ' = /?'(modn); 2. se a = b(m odn) allora n \ a
n\b .
Dimostrazione. 1. Per ipotesi si ha che 3h e Z tale che a — b = hn. Quindi. a1 —b' — (a —b)(af~l 4- a‘~2b 4- ... 4- b'~l) = = hn(a‘~] 4- a‘~2b 4 - .. . 4- b '_1) da cui a1 = bl (mod n).
2.
Per ipotesi sia a — b = hn ed a = «<7. Allora b = a - hn = nq — nh = n{q —/i), da cui si ha
Il viceversa segue sfruttand o la proprietà simm etrica della relazione di congruenza e scambiando b con a. ■
4.4 Criteri di div isi bil ità Le congruenze modulo n sono strumenti di grande utilità nello studio delle pro prietà aritmetiche degli interi. Per esempio giocano un ruolo primario nella dimo strazione dei cosiddetti “criteri di divisibilità” Nel Capitolo 3 ci siamo occupati della scrittura di un intero in base n , in particolare nel caso in cui n = 10. Abbiamo visto che, dato un intero a > 0, se a= 1 . . . ri ro si può scrivere: a = r/, • 1O^1-+■r/,_j • 1O^1 1 -f- . . . + ri • 10 4- ro • 10^\ r/,
0 h > 0.
Osserviamo ora che 10 = 0(m od2) = 0(mod5) = 0(mod 10). e quindi anche 10' = 0(mod 2) = 0(mod 5) = 0(mod 10) = 0(mod 100) Vt > 2 Possiamo quindi enunciare il seguente Crite rio 4.1
Dato un numero
a = rh • IO7* + r/,_i • 10/,_1 4- . . . 4- r, • 10 -h r 0 *10°, rh ^ 0, h > 0
sì ha che a è divisibile per 2 se e solo se 2|ro, cioè se e solo se ro € {0,2 4,6.8}; a è divisibile per 5 se e solo se 5|r 0 cioè se e solo se r 0 € {0,5}; a è divisibile per 10 se e solo se r 0 = 0 ; a è divisibile per 100 se e solo se r0 — r{ = 0 . Osserviamo ora che, poiché 10 = l(m od 3) = l(m od9), si ha il seguente
54
Capitolo 4
Criterio4.2 Dato¿7 = si ha che:
*1O^1+/*/,_!* 10/# ]-K..-fri*10-f-^o'10 ,
3|a <£► 31(r;, + r/,_ 1 + . . . + 9\a
9|(r/, + r/,_i -f- .. . +
r\ + r\ +
^ 0,
h
> 0,
ro) ro)
cioè 3, (rispettivamente 9), dividono un numero intero a se e solo se 3 (rispettiva mente 9) ne dividono la somma delle cifre. Criterio 4.3 Dato un numero intero a , nelle ipotesi dei precedenti criteri, allora «|11 se e solo se 11| £ o ( —l) '^ , cioè, come noto, un numero è divisibile per 11 quando, eseguita la somma delle cifre di posto pari e la somma delle cifre di posto dispari, la differenza è un multiplo di 11. Dimostrazione. Osserviamo che 10 ==-l( m o d 11)
e quindi
102 = l ( m o d ll ) ......... 10r = (—l) r (mo d 11 )
Si ha quindi che
10f = ( - 1)' =
1
se t è pari —1 se t è dispari
Allora a = n ,( - l) h + r/,_i(—l)'1 1 + . . . + r t(—1) 4- r0(mod 11) e quindi llla lUC rU-iy1+ r/l_ i( -l ) ,,_1 + ... + n ( ~ l) + r0). ■
Osservazione 4.4 Si possono enunciare molti altri criteri di d ivisibilità, m a que sti presentati sono quelli più utilizzati perché più vantaggiosi.
Problema 4.1 Enunciare un criterio di divisibilità per 22, 23, 24, . . . ,2". Problema 4.2 Enunciare un criterio di divisibilità per 25. Problema 4.3 Enunciare un criterio di divisibilità per 7.
i l
4.5 Congruenze lineari Sarà capitato talvolta al lettore di porsi un quesito analogo al seguente: “se nelVanno 2004 il Natale è caduto di sabato, in quale giorno della settimana cadrà nel 2007<>” Dopo aver osservato che tra il 25 Dicembre 2004 e il 25 Dicem bre 2007 non cade alcun 29 Febbraio (cioè tra il 2004 e il 2007 non ci sono anno bisestili) denotiamo 1 giorni della settimana con le cifre da 0 (domenica) a 6 (sabato) e rispondiamo al quesito determinando un intero x, 0 < x < 6 tale che x
=
6 + 3 • 365(mod7)
a == 1101(mod7) = 2(m od7).
Relazioni binarie tra insiemi
55
La risposta sarà quindi “ martedì”. In generale, se volessimo sapere quando si terrà la «-esima prima teatrale di una stagione iniziata di giovedì, tenendo conto che ogni rappresentazione è in cartellone per 26 giorni, numerando come prima i giorni della settimana con le cifre 0 , 1, . . . , 6 , vogliamo trovare un x, 0 < x < 6 . tale che
x = 4 + (« —l)26(mod7). Per esempio la terza prima sarà di domenica, poiché, per « = 3 si ha:
x = 4 4- 52(mod 7) = 56 = 0(mod 7). Se volessimo sapere quante prime cadono di martedì dovremo risolvere la con gruenza in cui l’incognita è « : 2 = 4-1- (« — 1) • 26(mod 7) cioè otterremmo 26« = 24(mod 7) 5 « = 3(mod7) cioè [5u ]7 s [5]7 [«]7 = [3]7 .
Poiché 5 • 2 = 10 = 3(mod7) la risposta è [n]7 = [2]7 , quindi la seconda, la nona e così via. Abbiamo così introdotto il concetto di congruenza lineare, che ora precisiamo Definizione 4.14 Dati a, b e Z, n > 1, si dice congruenza lineare l'espres sione ax = ¿>(mod n) e ogni intero xq tale che ax o = h{ m od //) si dice soluzione della congruenza. Proposizione 4.5 Posto d = ha soluzione se e solo se d\b.
m c d
(aji), la conguenza lineare ax = ¿ ( m o d « )
Dimo stra zione. Se l’intero xo è soluzione della congruenza ax = ¿(mod«) al lora:
ax o —¿ = hn, h e Z. Posto d = MCD(tf,«), 3à, h € Z tali che a = ad, n = hd sicché, sostituendo,
àdx o —¿ = hhd => ¿ = d(àxo — hh) da cui si ottiene d\b. Viceversa supponiamo che d\b cioè che esista b e Z tale che ¿ = db. Essendo d = MCD(a,n) esistono s, t € Z tali che d = as 4- ut da cui si ottiene: ¿ = db = (as -f nt)b —asb 4- ntb
56
Capitolo 4
cioè
a(sb) = b(modn) e quindi sb è soluzione. ■ Proposizione 4.6 Sia ax = b{modn) (★) una congruenza lineare: se x è una soluzione, lune e sole le soluzioni sono della fortna x — x 4 - kh (★★) con fc € Z, zi = - , e d - m c d (a,n ). d Si hanno quindi esattamente d soluzioni non congrue mod n . Dimostrazione. Sia x una soluzione della congruenza (*), cioè sia ax = b + hn, con h e Z : verifichiamo che anche x = Jc + kh è soluzione. Infatti:
ax = ax + akh = b + hn + akh = b + hn + kàn = b + (h 4 - kà)n da cui si conclude che ax = b(mod n ). Supponiamo ora che x' sia una soluzione della congruenza (★) e verifichiamo che x è della forma (★ *). Infatti:
ax = b(modn) = ax(modn) quindi esiste k € Z tale che
a(x' — x) = kn. Poiché a = dà ed n = dfi, semplificando si ottiene: à(x/ —Jc) = kh. Essendo MCD(à,n) = 1 segue che a\k e quindi 3k e IL tale che k — àk. Sostituendo si ottiene: à(x' — x) = akh =$ x' —x = kh e quindi si conclude che x' = x + kh. Contiamo ora quante sono le soluzioni distinte. Sicuramente jc, x + h, x + 2h,... , x + (d - 1)h, sono soluzioni distinte della congruenza (*). Sia ora jc = x + rii, un’altra soluzione: mostriamo che t € (0,1,... ,d — 1}. Infatti, dati t e d esistono q ed r, con 0 < r < d tali che t = dq 4 - r. Sostituendo si ottiene: x = ic + (dq + r)h - x 4- dqh + ni = x + rh +qn=> x = jc -f rn(modn) ■
Relazioni binane tra insiemi
57
Ese mp io 4.11 Risolvere la congruenza lineare 3x + 6 = 0(mod 12): Anzitutto riscriviamo la congruenza nella forma
3x = — 6 (mod 12) e quindi
3x = 6 (mod 12). Poiché m c d (3,12 ) = 3 è un divisore di 6 , la congruenza ha soluzioni. Una di esse è x = 2 e quindi tutte e sole le soluzioni sono
x = 2 4- h4. Il caso precedente ci fornisce l’occasione per porci il seguente problema
ac = bc(modn) implica oppure no che a = b(modn)l Consideriamo l’esempio (controesempio) seguente: n = 3, a = 5, b = c = 3. Si ha che 3* 5 = 3* 3(mod 3) ma 5 fé 3(mod 3). Si ha invece la seguente
Siano a , b , ce7L tali che ac = bc(modn) con m c d (c.n) = 1. Allora a = b{modn). Proposizione 4.7
Infatti, per ipotesi esiste un h e IL tale che ac — bc = hn, da cui si ottiene che (a —b)c = hn ed essendo c ed n coprimi si deduce che n\(a —b) e quindi a = ¿»(mod zi)-
dire se sono risolubili le seguenti congruenze e, in caso affermati vo, determinarne le soluzioni: Esercizio 4.5
1.
3x = 8 (mod 4).
2.
5x = l(mo dl0 ).
3. —3x = 2(mod(5). 4.
50x = 8 (mod 7).
4.6 Sistemi di con gruenze lineari Vogliamo ora affrontare i sistemi di congruenze lineari, enunciando il cosiddetto “Teorema cinese dei resti”, che probabilmente deriva il suo nome dalla più antica parte a noi pervenuta dell’opera matematica attribuita al cinese Sun-Tse.
58
Capitolo 4
Teorema 4.3 (cinese del resto) Siano n \M 2- • • nr interi positivi a due a due co primi e b\.b2 ... br numeri interi. Allora:
1. il sistema di congruenze lineari
ammette soluzioni. 2. Sec è una soluzione, ogni altra soluzione è del tipo c' = c(mod n \ti2 *• • nr).
Dimostrazione. 1. Indichiamo con N — nirt 2 -**nr econ N,- = n i «2 ***«»— nr — N / n t. Poiché m c d = 1, per f ^ j , segue che N, e n, sono coprimi e quindi ha soluzione ogni congruenza del sistema ausiliario N\y = 1 (modni) Njy = 1 (modn 2)
Siano yi,y2, ... ,» tali soluzioni. Poiché V i si ha che ponendo
= b,(m od «,),
r
2. Sia c' una soluzione del sistema (***). Allora d == bt (modM() = c(m odn ,) V i e quindi n,\(c - c) per ogni i. Poiché m c d ( n , , n j ) = 1. segue che N\(c' —c). cioè c ss c(modiV). ■ Osservazione 4.5 II teorema cinese del resto fornisce una condizione sufficiente affinché un sistema di congruenze lineari ammetta soluzione. Tale condizione non e però necessaria, come mostra l'esempio seguente. Esempio 4.12 Si consideri il sistema di congruenze lineari x = 1 (modó) jc = 1 (mod4).
Relazioni binarie tra insiemi
59
Dalle ipotesi si ha che esistono h, k e Z, tali che x = 1 + h6 e r = 1 - k 4 Uguagliando siottiene che h6 = k4, cioè h3 = k2 e quindi 2| h e 3| k. Si può scrivere h = 2/z, k = 3& e quindi abbiamo le soluzioni x = 1 + 6 - 2 h y h e Z (cioè x = l(m od 12)).
Esempio 4.13 lineari
Si determinino le soluzioni del seguente sistema di congruenze | x = 21 (mod 3) | x = —13 (mod 7)
Poiché m c d (3,7) = 1, il teorema cinese del resto garantisce che ci sono soluzioni e le determiniamo seguendo il procedimento suggerito alla dimostrazione (che è di tipo “costruttivo”). Il sistema ausiliario è i ly = 1 (mod 3) j 3>’ = 1 (mod 7) N = 3 • 7 = 21, N\ = 7, A^2 = 3. Soluzioni delle equazioni ausiliarie sono jy, = 1, 3/2 = —2. Le soluzioni del sistema dato saranno pertanto
c = 27 • 7 - 1 + (-1 3 ) • 3 • (—2)(m od21) = = 189 + 78(mod 21) = 267 (mod 21) = 15(mod 21).
Esercizio 4.6 Dire se i seguenti sistemi di congruenze lineari ammettono solu zioni e, in caso affermatico, determinarle:
| x = l(mod4) | 3x = 2(mod 5) 2x = l(mod5) 3x = 2 (mod 10) [ x = 3 (mod 4) 3. j 5x = 4(mod3) ( 6x = l(mod7)
j 2x = 5(mod 3) | x = l(mod9)
4.7 Relazioni d’ordine Una relazione V, su un insieme X si dice relazione d'ordine se gode cede pro prietà:
i) riflessiva: Va e X segue aV, a\
li)
antisimmetnca: se a 1Z b e b1Z a => a = b;
iìi) transitiva: se all b e b1l c => alle.
Notazione 4.1 Una relazione 71 viene spesso indicata con il simbolo < e quindi
se all b si scrive a
a
Definizione 4.16
Esempio 4.14 Sia N* l’insieme dei numeri naturali non nulli e si introduca in N* la relazione < così definita
a < b <$ a \b Tale relazione è una relazione d’ordine; infatti valgono le proprietà: 1. riflessiva: Va e N* si ha che a\ a;
3 h,k e N* tali che ah — b e bk = a, da 2. antisimmetnca: se al b e fr a cui, sostituendo, si ottiene bkh = b cioè kh — 1 e quindi h = k — \ da cui segue a —b\ 3. transitiva: se a) b e fr c =} 3 r,s € N* tali che ar = b c bs = c, da cui, sostituendo, si ottiene ars = c e quindi a\ c.
I
Osservazione 4.6 L’insieme (N*, <) dell’esempio precedente, non è totalmente ordinato: infatti, per esempio, 2 e 5 non sono confrontabili, in quanto 2\ 5 e 5{ 2. Definizione 4.17 Sia (X, <) un insieme parzialmente ordinato. Un elemento I m e X si dice massimo per X se V>> € X si ha y < m. Definizione 4.18 Sia (X, <) un insieme parzialmente ordinato. Un elemento r e X si dice minimo per X seVy e X si ha r < y. Osservazione 4.7 Sia (X, <) un insieme parzialmente ordinato. Se Y C X, allora Y è parzialmente ordinato rispetto alla stessa relazione d ’ordine introdotta in X. Definizione 4.19 Siano (Y, <),(X, <) con Y C X . Un elemento s e X si dice estremo superiore per Y (s = sup(Y)) se:1 1. Vy e Y si ha y < s\
Relazioni binarie tra insiemi
61
2. se c € X e Vy e Y si ha che y < c allora s < c. Definizione 4.20 Nelle ipotesi della definizione precedente un elemento j c X si dice estremo inferiore per Y (j = inf(F)) se 1.
Vy € Y si ha j < y ;
2. s e d e X e V y e Y s i ha che d < y allora d < j . Esempio 4.15 Sia A — {1,2,3,5,15} C il* con f i1*, < ) come nell’esempio 4.14. L'elemento 1 è minimo per A, A non possiede ìnassimo, mentre 30 è sup(A) (si osservi che 30 £ A).
4.7.1
Rap pr esen tazion e gr afica di una relazione d ’ordin e
Se ( X . < ) è un insieme ordinato dotato di n elementi è possibile rappresentare in forma grafica la relazione d ’ordine < nel modo seguente: ogni elem ento a € X si rappresenta con un nodo (o vertice);
se a < b il nodo corrispondente ad a sta al di sotto del nodo corrispondente a b\ se a < b e non esiste alcun elemento c e X tale che a < c < b si congiungono i nodi corrispondenti ad a e a b con uno spigolo. Si ottengono i cosiddetti "dia gra m m i di H asse” 2. Esempio 4.16 Sia X = [n e N*| az| 24} = {1 2,3.4,6,8.12,24} e sia ordinato rispetto alla relazione < definita come nell’Esempio 4.14, (cioè a < b <$ a b ) Abbiamo già verificato che la relazione è d’ordine in 11, quindi le proprietà ri flessiva, simmetrica e transitiva valgono anche se gli elementi appartengono a un sottoinsieme di N \ Il diagram ma di Hasse di (X, <) è mostrato nella Figura 4 1
Figura 4.1 ‘ H Hasse (1898-1979) matematico tedesco, studioso di teoria algebrica dei numeri.
Esempio 4.17 Sia X = {1,2,3} e V{X) l’insieme delle parti di X (cfr. Esem-
pio 1.8). Introduciamo la relazione < così definita A < B o A c B
Lasciamo al lettore verificare che (V{X), <) è un insieme parzialm ente ordinato. Il suo diagramma di Hasse è quello della Figura 4.2.
[a, b,c}
0 Figura 4.2
Esercizio 4.7 Disegnare il diagramma di Hasse dell’insieme Y = {y e N | vi 30} rispetto alla relazione < definita (come nell’Esempio 4.14) cioè a < b «=> a\b„ Esercizio 4.8 Disegnare il diagramma di Hasse di ('P(X), <), dove la relazione d’ordine è ancora Vinclusione insiemistica e X = (a, b).
4.8 Applicazioni Siano A e B due insiemi non vuoti e sia (p una relazione binaria tra A e B . Definizione 4.21 Diciamo che (p è un applicazione (o funzione o mappa) tra A e B se per ogni a € A esiste uno e un solo b e B tale che (a,b) € B
e, invece di (a,b) e si pone (p{a) = b. A è detto dominio e B codominio. Dalla definizione segue che assegnare una applicazione vuol dire specificare anzitutto il dominio e il codominio e descrivere poi “il modo di operare” di
Relazioni binarie tra insiemi
63
Date due applicazioni 0 e \J/ esse coincidono se e solo se han no lo stesso dominio A, lo stesso codominio B e se (pia) = xpia) Va e A. Definizione 4.22
Esempio 4.18
1. 0i : Z — > Z ove 0 i = {Ce,*3))* e Z}. In questo caso è 0 iU ) = jt3; 2. 02 : Z — ► Z ove 02 =
{(x,2x -f l)|x e Z}. In questo caso (p2ix) = 2x 4- 1.
Se 0 : A — ► B è un ’applicazione ed a è un elemento del dominio A , l’elemento (pia) è detto immagine di a attraverso 0 e se consideriamo A' c A , Tinsieme 0 (A') = {(pia)| a G A '}, è detta immagine di A' per 0 . Naturalmente è contem plato il caso limite in cui A' = A : in questo caso
Sia (p : A — > B un’applicazione. Diremo che:
i)
(p è iniettiva se (p{a\) = (piai) implica che a\ = ai, ovvero se ogni elemento di B ammette al più una preimmagine;
ii)
0 è suriettiva se (p{A) = B, cioè seVb e B esiste almeno un a e A tale che (pia) — b, cioè se ogni elemento di B ammette almeno una preimmagine;
iii)
0 è bijettiva {o biunivoca) se è sia iniettiva che surjettiva.
1. Consideriamo l’applicazione 0 i : Z — ► Z definita precedentemente ((p\{x) = *3 V jc € Z). Essa è iniettiva, infatti, se 0 i U i ) = x \ = x\ = 0] {x2) si ha x 3- x \ = 0 cioè x2){x \ + x\x 2 + (*i — = 0 da cui si deduce x\ = x2. Ma 0i non è suriettiva: infatti non tutti gli elementi di Z hanno retroimmagine. Basta considerare 5 € Z: $z G Z tale che 0i(z) = 5 (l’elemento \/5 £ Z). Osserviamo che, se per dominio e codominio per 0i assumessimo R, allora 0 isarebbe biunivoca, quindi la suriettività (e Tiniettività) di una funzione dipen dono dal dominio e dal codominio.
2. L’applicazione (p2 : Z — > Z definita precedentemente ( 02CO = 2.v -f 1) è ancora iniettiva ma non suriettiva.
64
Capitolo 4
3. Sia ora fa : Q — > Q l’applicazione definita ponendo 0 3(x) =
Essa è
invece sia iniettiva che suriettiva. a b Infatti se O= y.
Osserviamo inoltre che se consideriamo il sottoinsieme K = {2x \ x e Z) l'insieme delle immagini 03(X) = {x | x e Z] Z Q. Definizione 4.24 Dato un insieme X, una qualsiasi funzione 0 da N a X si dice successione di elementi di X e la si indica con il simbolo {an }„eA/ ove cin — fin). Definizione 4.25 Dato un insieme X si dice che è finito se esiste una applica zione biunivoca fra X e /’insieme { 1,2,... m ] C N. Il numero n si dice ordine o cardinalità di X e si scrive |X| = n. Esercizio 4.9 Considerate le applicazioni 0 i e 02 dell’esempio 4.18: 1) Determinare 0i(-2), 0i(3), 02( - l ) , 02(4). -1 (1), 0 2-1‘(-3), 0 2-1 2) Determinare 0j 1(27), 0 -1 t ‘( - 8), 0 21 ‘(9). 3) Per ciascuno degli elementi dell’insieme A = {0,1,2,6,7, 8 , —4, —5}, dire se ammettono preimmagine {sia attraverso la (p\ che la fa) e in caso affermativo, determinarle. Esercizio 4.10 Si consideri l’applicazione f : Z x Z - + Z x Z definita da: f{a,b) —{la - b,?>b). Si dica se le seguenti affermazioni sono vere oppure false:
1. f è iniettiva. 2. f è suriettiva. 3. /(3,4) = (2,8). 4. /-K2,0) = (l,0). 4.9 Alcune tecniche di enum erazione
■K.
Siano Ae B due insiemi finiti: A = {ai,<22........ an}e B = {b\, ¿>2, . . . ,bk). Ci proponiamo di contare quante sono le applicazioni tra A e B , quante sono le applicazioni iniettive e quante le applicazioni biunivoche. Da quanto detto inizialmente, per descnvere un’applicazione occorre preci sare oltre al dominio e al codominio anche il modo in cui agisce V applicazione su ogni elemento del dominio.
Relazioni binarie tra insiemi
a)
65
Contiamo le applicazioni. Sia f una applicazione da A a fi. Allora / (a può essere scelta in k modi diversi (perché l’immagine di a\ può essere un qualsiasi elemento di B). Analogamente f{ a 2) può essere scelta in k modi e così pure l’immagine di ogni altro elemento di A. Quindi per ogni scelta di f(a x ),f(a 2 ) , . . . ,f(a „) si ha un’applicazione diversa e si può concludere che le applicazioni tra A e B sono
k • k • . . . • k = k". V
n volte
Esempio4.19 Siano A = {ax,a2,a3} e B = {b\,b 2) • Allora l’insieme delle applicazioni tra A e fi, spesso denotato con il simbolo fi'4, ha 8 elementi, preci samente
a x — » bx a2 — * bx fa a3 — > b2
fa 1 — ► b\ fi = I «2 — >b\ f 2 [ a3 — ► b[ (t¡x — >b2 f 5 = l a 2 — >bx [a 3 — ► bx
(ax — >b2 fa
=
\
“ 2
l
C*3
—
----
( a¡ - —► b x ax —> b 1 b2 f a - j a2 — hi a2 a3 - —» bx 1 a3 —> b2
f a x - —> b2 > b f i — | ¿*2 — * b2 fa - \ a2 - —> b2 b2 I a 3 — > bx 1 a3 >b2 Í Ü X —
> b
2
,
Chiaramente, delle 8 applicazioni sopra descritte, per la natura del problema, nes suna è iniettiva, mentre la f\ e la / 8 non sono neppure sunettive Proposizione 4.8 Siano A e B due insiemi finiti con lo stesso numero n di de menti e sia f : A — * B un’applicazione. Allora f è iniettiva se e solo se f è
suriettiva.
Dimostrazione. Sia / iniettiva. Allora |/( A )| = \A\ ma 4 = B quindi | / ( A ) | = \B\. Poiché /(A ) C B segue che f ( A) = B, cioè la / è suriettiva. Sia / suriettiva. Allora f ( A) = B da cui segue che f (A) = B l Poiché per ipotesi |£ | = \A\ segue anche |/( A )| = |A cioè elementi distinti di A hanno immagini distinte e quindi / è iniettiva. ■ Contiamo ora il numero di applicazioni iniettive tra gli insiemi
A = {aha2
.........
an}
e
B = [b\,b2, ... ,bk}
supponendo che k > n. Il discorso è analogo a quello fatto per coniare le applica zioni tra A e fi : si deve solo tener conto del fatto che elementi distinti debbono avere immagini distinte, quindi f( a\) può essere scelto in k modi diversi, ma f(a 2) dovrà essere diverso da f{ax) e quindi potrà essere scelto solo in A: — 1 modi distinti, f{a f) potrà essere scelto solo in k —2 modi e cosi via, quindi si ottiene che
\BA\ = k(k - 1)(* - 2 ) . . . (* - n + 1) = Dk.„ (disposizioni di k oggetti di classe n).
66
Capitolo 4
c) Nel caso in cui |A| = \B\ = /ri allora le applicazioni iniettive tra A e R sono anche suriettive e quindi bijettive ed è
\BÀ\ —n(n - l)(/i - 2) .. . 2 • 1 = ni Esempio4.20 Sia A = {a\,a2 ,a^},B = {b\,biM)\ le 6 applicazioni bijettive tra A e B sono * fri -> bi
«1 /4 =
ai
l«3
■» b * fr? * ¿i
f 5 =
■» fri ■» ¿>3 ■> fr 2
* ¿>2 * fri * /?3
■> fr 2 ■> fri
■> ¿>3 * fri ■»
/6
=
Nel caso in cui A coincida con 5 si parla di applicazioni .sull’insiem e A e tra queste c’è sempre l’applicazione identica (o identità) IA : A — > A definita ponendo IA(a) = a, per ogni a € A. Definizione 4.26 Se X è un insieme, un’applicazione bijettiva f : X — * X sì
dice trasformazione su X e, se X è finito, si dice permutazione. L ’insieme delle trasformazioni su un insieme X si indica con Sx e, nel caso in cui \X\ = n, lo si indica con il simbolo S„. Per quanto detto precedentemente |S„ | = ni.
4.10 Prodotto di applicazioni Definizione 4.27 Date due applicazioni f e g con f : A —> B e g : B —»• C , sì definisce prodotto delle due applicazioni l’applicazione g o f : A —*■ C così
definita:
( g ° /)(<*) = g[f( a)], Va € A. Si verifica che il prodotto di applicazioni è associativo, cioè per ogni terna di applicazioni / , g, li
f : A — > B ,
g ; B
C,
h : C — > D
(à og) o / = h o (g o /). Per ogni applicazione / : A — B si ha che /B o / = / o /A = / , mentre in generale il prodotto non è commutativo, come si può vedere considerando il seguente Esempio 4.21 Siano / : M —+ R e g : R —* R cosi definite:
Relazioni binarie tra insiemi
f ( x ) = 2x,
67
g(x) = 2x + 1
si ha che
(g o / ) ( * ) = g [ / ( * ) ] = g ( 2x) = 2(2*) + 1 = 4* 4 - 1 ( / o g )( *) = / [£ (* )] = f( 2 x + 1) = 2(2* + 1) = 4* + 2. Chiaramente le due applicazioni / e g sono diverse: infatti, consideran do ad esempio il numero reale 0 , si ha ( g o / ) ( 0 ) = 1 m en tr e ( / o g)( 0 ) = 2 Proposizione 4.9
Siano f : A — *• B e g . B — > C due applicazioni.
i)
Se f e g sono iniettive allora g o f è inìettiva;
ii)
Se f e g sono suriettive allora g o f è suriettiva,
iii)
Se f e g sono bijettive allora g o f è bijettiva.
Dimostrazione. Chiaramente basterà dimostrare i) e n) perché la iii) seguirà di conseguenza. i) Siano ai,a2 € A e sia (g o / ) (a \) = (g o f)(a2) Allora g[f(a\)] = g [f (^ 2)] e l’iniettività di g implica che f ( a 1) = f ( a 2). Poiché anche / è miet tiva, segue che a\ — a2. il) Sia c € C , al lo ra la su riettivi tà di g com porta l’esistenza di almeno un b e B tale che c = g{b), d ’altro canto anche / è sunettiva, quindi esiste almeno un a e A tale che b = f ( a) . Sicché c = g(b) = g [ / ( « ) ] = (g o f )(a) e a è preimmagine di c attraverso g o f. m Corollario 4.1 Sia X un insieme. Il prodotto di trasformazioni su X è ancora una trasformazione su X, in particolare se X è fiuto, il prodotto di permutazioni è ancora una permutazione. Esempio 4.22
Sia X = {1,2,3} e siano due permutazioni.
a or
=
1 2 3
3 2 1
infatti
(o -o r) (l ) =
a
[r(2)] = er(3) = 2
(cr o r) (3 ) =
o
[r(3)] = cr(l) = 1
(cr o
Consideriamo ora r o r = z~. Abbiamo iròr)(l'i = 3,
(r o r)(2) = 1
(r o r)(3 ) = 2
Definizione 4.28 Se due applicazioni f : A — > B e g : B — > A sono tali che g o f = l\ si dice che g è invena sinistra di f e che f è inversa destra di g . Se f o g = /$ si dice che g è invena destra di f e che f è inversa sinistra di g. Se valgono entrambe le relazioni si parla di inversa (bilatera). Esercizio4.11 Sia / : A —» B un’applicazione. Provare che / ammette in versa sinistra se e solo se / è iniettiva, ammette inversa destra se e solo se / è sunettiva. Esercizio 4.12 Data l'applicazione / : Z x Z -» Z x Z definita ponendo: f{a.b) = (a + 2b,2b), dire se f è iniettiva e/o suriettiva. Esercizio 4.13 Date le applicazioni f e g : Z x Z - ^ - Z x Z definite ponendo: f{a,b) = (a + 2b, - b) e g(c,d) = (~c,3d), determinare le funzioni composte f o g e g o /. Per ciascuna di esse dire se è iniettiva e/o suriettiva. Esercizio 4.14 Si consideri Vapplicazione h : Q x Q -> Q x Q, definita ponendo h(x,y) = (x + 2>\ - x + y) :
1. verificare che h è iniettiva; 2. determinare la funzione inversa sinistra; 3. dire se l’applicazione h è anche suriettiva. Esercizio 4.15 Date le applicazioni f : Z -> Q, g : Q+ —► R, definite da: zi^ + 1 fi n) g{q) = y/q per ogni n e IL e per ogni q € Q+, sì detenninì la funzione composta f o g e si dica se è iniettiva e/o suriettiva.
5 Elementi di teoria dei grafi
5.1 Grafi sem pl ic i or ientati e non orientati “Ogni uscita è un'entrata verso qualche altro posto” (T Stopparci)
Nel linguaggio colloquiale si fa uso indiscriminato della terminologia relativa ai grafi: per esempio q uando parliamo di albero genealogico per studiare l’ongine e la discendenza di una famiglia o quando parliamo di radice linguistica “come elemento irriducibile presente in tutta una famiglia di parole” o quando descriviamo una rete elettrica o rappresentiamo una molecola o descriviamo un torneo di tennis... Tutto questo può essere formalizzato a partire dalla definizione di grafo
Un grafo G è una coppia ordinata (V(G),E(G )) ove V(G) è un insieme non vuoto di elementi detti vertici o nodi di G mentre E(G) è una famiglia di coppie non ordinate di elementi di V(G) detti lati o spigoli. Definizione 5.1
In questa trattazione considereremo sempre grafi finiti, cioè grafi in cui Tinsieme dei vertici V ( G) è finito. In modo naturale è possibile rappresentare un grafo attraverso un diagramma in cui i vertici sono individuati da punti e due vertici a e b sono collegati da un segmento se e solo se (a,b) e E(G). Osserviamo che la famiglia di spigoli E(G) è formata da coppie (a.b) non necessariamente distinte. Esempio 5.1
V(G) = {a,b,c }
E( G) = {{a,a)f (a ,a ),(a ,c )A a,b ),(c ,b ),(c M
70
Capitolo 5
Figura 5.1
Se a.b sono vertici di G e v = (a,b) e E(G ) si dice che a e b sono adiacenti e se due lati v £ w hanno un vertice in comune, diremo che v e w sono incidenti. Un lato del tipo {a,a) si dice loop. In genere un lato (a,b) si indica con la scrittura abbreviata ab.
Un digrafo D (o grafo orientato) è una coppia (V{D).A(D)) ove V{D) è un insieme finito, non vuoto, di vertici e A (D ) è una famiglia finita di coppie ordinate di elementi dì V(D), dette archi (ovviamente (v,w) = vw
Definizione 5.2
wv = (tu,u)).
Definizione 5.3 Dato un vertice v € V(G), si indica con q ( v ) il numero dei lati
incidenti av e lo si dice valenza (o grado) di v. Un loop, per convenzione, dà contnbuto 2 al grado di un vertice, un vertice di grado 0 è detto isolato mentre un vertice di grado 1 è detto terminale.
p( a)
4
p( b)
3 2
p(c) p( d) Pie)
:1 :0
Figura 5.2
Lemma 5.1 (delle strette di mano) La somma dei gradi di tutti i vertici di un
grafo è un numero pan, esattamente eguale al doppio dei lati. Dimostrazione. Infatti poiché ogni lato ha 2 estremi, il numero che rappresenta gli ‘'estremi di lati” è 2 • \E{G)\. D’altro canto ogni u € V (G) è estremo di q (v ) lati sicché 2 -\E ( G )\= ^
Y . V€V(G)
ew»
Elementi di teoria dei grafi
Corollario 5.1
71
Ogni grafo ha un numero pari di vertici dipari.
Dimostrazione. Poiché
Jf, Q(v ) è un numero pari, supposto di suddividere veV(G)
l’insieme dei vertici V(G) in 2 sottoinsiemi disgiunti, quello dei vertici con grado pari V\(G) e quello dei vertici con grado dispari Vi{G) si ha
Y Q(v) = Y G(v) - Y giv) ^eV2(G) i’€V| IG) veV,G) Essendo il secon do m em bro un num ero pan segue la tesi. ■
Definizione 5.4 Un grafo in cui ogni vertice ha la stessa valenza (o grado) r e detto grafo regolare di grado r. In par tico la re è re go lare il grafo che ha vertici e non ha lati, cioè il grato in cui |V(G)| = n e E{G) = 0 che è detto anche grafo nullo su n vertici ed è indicato con N n
Esempio 5.2
N 3 (Figura 5.3) . b •
a•
C
Figura 5.3
Esempio 5.3 Grafo regolare di grado 2 con \V(G)\ = 4 e q ( v) = 2, per ogni v € V{G) (Figura 5.4)
a «>------------ » b -
C
*d
Figura 5.4
Definizione 5.5 Un grafo G senza loop in cui 2 qualsiansi vertici distinti siano adiacenti è detto grafo completo e indicato con Kn ove n — V(G)
72
Capitolo 5
Esempio 5.4 Grafo completo K 4 e K$ (Figuia 5.5)
a
Figura 5.5
Definizione 5.6 Sia G un grafo: si dice sequenza di spigoli una successione
finita di spigoli di G della forma Vq Vi ,Vi V2........ Vr—\Vr
(*)
Il numero r degli spigoli è detto lunghezza della sequenza. o Se nella sequenza (*) tutti i nodi sono distinti si parla di catena aperta. 0 Se gli spigoli sono a 2 a 2 distinti si dice che (*) è un cammino dal vertice Vo al vertice vr. 0 Una catena chiusa, tale cioè che il vertice iniziale e finale coincidano, di lunghezza almeno 3, è detta ciclo 0 circuito. Un grafo G si dice connesso se per ogni coppia di vertici v,iv distinti esiste un cammino da v a w.
Definizione 5.7
Si conviene di considerare connessi il grafo K\ nodo.
N i e og ni gra fo con 1 solo
Un grafo può essere spezzato in sottografi disg iunti detti componenti connesse, definendo una relazione sull'insieme dei vertici di G che risulta essere di equi valenza, ritenendo due vertici i> e uu equivalenti se o co incid on o o se es iste un cammino da v a w.
Definizione 5.S Un grafo G connesso si dice euleriano se esiste in G un cam
mino chiuso che contiene ogni spigolo di G. L attributo euleriano della definizione data sopra, deriv a da Le on ha rd E ule r padre della teoria dei grafi. Eulero (1707-17&3) iniziò il suo trattato c on la dis cu ss io ne di un problema che da allora viene indicato come il “problema dei ponti di Königsberg'’, Königsberg, citta della Prussia orientale, è situata sulle sponde e sulle isole del fiume Pregel. Le varie parti della città erano collegate da 7 p on ti. D i do m enica i cittadini compivano il giro della città. 11 pro blema e ra co me fa re ques ta
Elementi di teoria dei grafi
73
t ì
Figura 5.6
passeggiata in modo tale che partendo da casa uno potesse ritornarvi dopo aver attraversato ogni ponte una e una sola volta (*). Naturalmente il problem a ha un equivalente in termini di grafi e consiste nel chiedersi se il seguente grafo è euleriano (Figura 5 7).
Figura 5.7
La risposta al quesito è negativa ed è contenuta nel seguente teorema Sia G un grafo connesso con \ V(G) j> 1. Gè euleriano se e solo se q (v ) è pari pe r ogni v G V (G), cioè se e solo se ogni vertice ha grado pari.
Teorema 5.1
Esercizio 5.1 È facile provare che un grafo completo Kn ha grafo regolare di grado r su n vertici ha ~rn lati.
lati e che un
5.2 Alb eri e arb o res c en ze
Definizione 5.9
Un grafo semplice connesso è un albero se non contiene cicli e un grafo le cui componenti connesse sono alberi è detto foresta
Esempio 5.5 Sono alberi di ordine 4 i grafi della Figura 5.8.
Figura 5.8
Il seguente Teorema caratterizza gli alberi con n vertici: Teorema 5.2 Sia G un grafo con |V(G)| = n. Allora le seguenti affermazioni sono equivalenti: i) G è un albero; ii) G è connesso e ha n - 1 lati. È interessante e curioso osservare che la terminologia degli alberi, in teoria dei grafi, ha origini botaniche e genealogiche. In molti casi, un vertice particolare può essere designato come “radice” e quindi si può assegnare una direzione ad ogni lato a partire dalla radice. Esempio 5.6 Cosideriamo l’albero della Figura 5.9, Se indichiamo con r la ra dice e con a, b, c ì nodi, si ottiene un albero con radice.
Figura 5.9
Definizione 5.10 Un grafo semplice orientato V — V (V,A) è un'arborescenza di radice r se r è un vertice di T e se per ogni altro vertice x esiste un unico cammino dar a x.
Detto T un albero, se u è un vertice di T distinto dalla radice r, il “genitore ” di v è l'unico vertice w tale che esista un arco u>u. In queste ipotesi v è “figlio”. Vertici con lo stesso genitore sono“ fratelli/fratellastri”. Sono “antenati” di un vertice v, oltre alla radice r, quei nodi che si trovano sul cammino da r a v. I “discendenti” di u sono quei vertici che hanno v come antenato. Un vertice di un
Elementi di teoria dei grafi
75
albero è chiamato “foglia” se non ha figli mentre è detto “vertice interno” se ha figli. Osserviamo che la radice è sempre un vertice interno, a meno che sia l’unico vertice del grafo, nel qual caso è una foglia. Esempio 5.7 Spesso le definizioni ricorsive possono essere illustrate da un albe ro, eventualmente infinito. Per esempio la successione dei numeri di Fibonacci (confronta Esempio 2.13 e Figura 2.1). Inoltre si possono rappresentare con alberi con radice oltre agli alberi genea logici, Porganigramma di un’azienda, l’organizzazione dei programmi e dei file in un computer, i risultati di tornei ad eliminazione diretta, ecc. Definizione 5.11 Si dice albero n-ario un albero con radice, in cui ogni vertice ha al più n “figli”. L'albero è detto pienam ente n-ario se ogni vertice ha esattamente n “figli Se n = 2, Valbero si dice binario. In particolare gli alberi binari hanno notevoli e varie applicazioni nel campo del l’informatica e dell’econom ia.
5.3 Alberi sintattici Gli alberi sintattici ci permettono di rappresentare espressioni contenenti parentesi e di dedurne altre senza parentesi. Per meglio comprendere ciò, si pensi alla logica delle proposizioni, al calcolo booleano, all’aritmetica in S, ove, accanto ad ele menti di un insieme, si utilizzano operazioni unarie o binarie in cui le espressioni contenenti parentesi sono del tipo: (-A)
( B v C ) <=> (A A C)
[( 3<2) -I- 5] x (ir —7) + 14c ecc. Con un albero binario è possibile rappresentare ciascuna delle espressioni scritte sopra tenendo conto che:
1. gli operatori unari (negazione, complementazione, funzione potenza, . sono nodi con un figlio a sinistra e nessun figlio a destra;
)
2. gli operatori binari (addizione, moltiplicazione, .. ) sono nodi con un figlio a sinistra e uno a destra; 3. la lettura de ll'albero deve ridare la formula.
Esempio 5.8 Sia data la seguente formula: ((3 x a) + 8) x (b - 5) + c : l'albero associato è:
Figura 5.10
La scrittura senza parentesi, con operatore postposto è:
3a x 8 + x£>5 —c+ Analogamente con l’operatore preposto.
5.4 Algoritmo di Huffman L’algoritmo di Huffman è una procedura utilizzata per la compressione dei dati di un testo e porta alla costruzione di un albero. La procedura può essere schematiz zata come segue:
1. si legge il testo e si crea una lista di nodi, uno per ogni carattere del testo, con l’indicazione della frequenza con cui ciascun carattere compare; 2. si ordina la lista a partire dai caratteri meno frequenti; 3. ì due nodi, Ci, C2, con frequenza più bassa (rispettivamente N\ e N2) ven gono cancellati dalla lista e divengono figli di un nodo fittizio C\ * C2 con frequenza data dalla somma delle frequenze N\ + N2, Esempio 5.9 Consideriamo il testo ARATRO Si ha la seguente tabella di frequenza:
Elementi di teoria dei grafi
Carattere Frequenza
A 2
R 2
T 1
77
O 1
Poiché T ed O hanno le frequenze più basse, li associamo ottenendo una nuova tabella in cui compare il carattere fittizio T*0: Carattere Frequenza
A 2
R 2
T *O 2
Poiché ora tutti ì caratteri hanno la stessa frequenza, ne associamo due qualsiasi, per esempio R e T *0 . Otte niam o la tabella: Carattere Frequenza
A 2
R*T *O 4
Si termina associando A a R*T*0 e otteniamo: Carattere Frequenza
A*R*T*0 6
L’albero binario associato è mostrato in Figura 5.11.
A*R*T*0
Figura 5.11
Partendo dalla radice e arrivando alla foglia corrispondente al carattere si ottieneCarattere Codifica
A 0
—
R 10
T 110 ---------------------
0
.
1
111
e quindi la parola “Aratro” si scrive, in linguaggio binario 010011010111
Per riottenere la parola originaria, basta ripercorrere l’albero. Esempio 5.10
Trovare l’insieme prodotto A x B x C, ove
A = {a,b,c) e disegnarne il grafico.
B = {1,2},C = {D,V}
78
Capitolo 5
Quindi A x B x C = {(fl,1. 0 ) , ( a . ^ V ) , ( f l , 2 ,O),(i7, 2 ,V),(/ ?, l , Q )>(/? j V)
(6,2,d),(^2,V),(c, l,D),(c, 1, V ),(c,2 ,D ),(c,2, V ) }
«
b
c
Esercizio 5.2 Dimostrare che un albero pienamente binario con 5 vertici interni. possiede 11 vertici.
6 A lg o ritm i ed elem en ti di teoria della complessità
“Un tempo esistevano molte domande per le quali non c’erano risposte. Oggi, neH’era dei computer, ci sono molte risposte per le quali non abbiamo nemmeno pensato alle domande” (Peter Ustinov )
L’etimologia della parola algoritmo sì perde nella notte dei tempi e risale al mate matico persiano Al-Khwàrizm l. Questa parte del cognome indica la provenienza della sua famiglia dalla regione di Khwarizm a sud del lago Arai e fu tradotta in latino col vocabolo algorismus da cui algoritmo Indica una procedura meccanica che accetta un certo numero di dati iniziali (input) per ciascuno dei quali è previsto un risultato finale (output) dopo un nu mero finito di passi. Naturalmente per fare ciò è necessario assegnare un numero finito di istruzioni. Per programma, invece, si deve intendere un’espressione o una sequenza di espressioni in un certo linguaggio che sia una concreta realizza zione di un algontmo. L’analisi di un algoritmo prevede, pertanto, il riconoscimento degli input e degli output, il listato delle istruzioni e la dimostrazione che l’algoritmo conver terà gli input in output in un numero finito di passi. Cominceremo con l’analizzare un famoso algontmo, quello euclideo o delle divisioni successive per la ricerca di un Massimo Comun Divisore ( m c d ) tra due interi, che in prima battuta considereremo positivi (per la definizione di m c d si veda 3.4).
1. input: una coppia di interi positivi a,b con a
80
Capitolo 6
successione di resti
a
b = aq\ + ri
0 < rj
a = Q2r\ + r2
0 < ri < ri
ri =
0 < r3 < r2
+ r3
r«—2 — q>i-\1 n—\ T
(ii) Quando rn+i = 0, si ferma il procedimento (stop) e si pone r„ =
m c d
(«,/?)
(iii) 1 resti costituiscono una successione decrescente di interi non negativi e un certo resto deve essere nullo, cioè l’algoritmo termina dopo un numero finito di passi, perché, altrimenti, un altro resto più piccolo sarebbe definito dal punto (i). Per la verifica che r„ è m c d si confronti il Teorema 3.2. La complessità di un algoritmo stima, sostanzialmente, il numero di passi affinché l’algoritmo termini, in funzione della lunghezza de ll’inpu t. Com e tale è misurata da funzioni / (n) ove n è la lunghezza dell’input. Sono in uso alcuni simboli di particolare espressività per enunciare relazioni di confronto tra comportamenti di funzioni, tra questi ricordiamo i simboli o,ae. Data una funzione gin) la classe O {gin)) è costituita dalle funz ioni f i n ) per le quali esistono li e t {h > 0) ed «o £ N tali che per ogni n > /?o
0 < f i n) < hg(n) cioè il rapporto
è limitato superiormente.
La classe £2(g(n)) è invece costituita dalle funzioni f i n ) per le quali esistono k € R {k > 0) ed n i € N tali che per ogni n > ni si abbia
0 5 kgin) < fin)
fin) gin)
cioè il rapporto ———è limitato inferiormente. La classe B(g(n)) è costituita dalle funzioni / (n) per le quali esistono /i, k e R (fc, li > 0) ed n2 e N tali che per ogni n > n2 si abbia
0 < kgin) < f i n) < hgin) cioè il rapporto
fin) v
è Imitato sia inferiormente, sia superiormente.
Algoritm i ed elementi di teoria della complessità
81
Esempio 6.1
/ i ( n ) = n2 + 3 = 0(n2). / 2(/ì ) = nz —2n = Q(n2) M n ) = t r - 2 n + 2 = 0 ( n 2).
Infatti:
n2+ 3 n
«2 - 2/z
<4,
- 1,
Al
0 <
n 2 - 2n + 2 ri
< 1
(no = n\ = n2 ~
La complessità di un algoritmo, che si sviluppa in f ( n) passi, si determina in tre fasi successive:
1. si trova una funz ione gin), i cui valori siano i più piccoli possibili, tale che f i n ) = Oigin))\
2. si descrive f i n ) usando ì simboli Q, ©; 3. si determina la com ples sità med ia de ll’algoritmo.
Osse rvazione 6.1
I più comuni tipi di complessità sono
0 ( 1)
costante
O(log n)
logaritmica
O in)
lineare
OC«*)
polinom iale a e R, a > 0
0 (2")
esponenziale
Esempio 6.2 Se il k-e simo passo di un algoritmo si ottiene dopo k2 secondi, il tempo necessario per compiere i primi n passi è dato da
, , ^2 , ^2 i 1+2
+3
,2
n(n + l)(2n + 1)
+ . . . + « = ----------------------
che è O in7').
Esempio 6.3 Nel cas o d ell’algoritmo euclideo per la ricerca de! v ì c d la sua com plessità risulta essere logaritmica.
82
Capitolo 6
Dimostrazione. Per provare questo dobbiamo, anzitutto, studiare quante sono le divisioni effettuate. Cominciamo con l’osservare che V j , vale la disuguaglianza rj+2 < -r,. Infatti si possono presentare due casi:
1 1* Ser ; +1 < - r } si ha (a) 2.
0+2 <
1
1 Se invece o+i > - r ; si ha (a)
1 o n < 0+1 < r J
e, quindi, dividendo r} per o+ i si ottiene
0 = 1 • O+i + 0+2 e quindi
1 0 +2 < O + i -
2
r J
Poiché ogni 2 passi il resto è più che dimezzato e non scende mai sotto il valore l, si può concludere che ci sono al più 2[lg2 div isio ni cioè ch e l’algor itm o è logaritmico. ■
7 In tro du zion e alle s tru tture algebriche
“Operate secondo le regole dell’Algebra e deH’Almucabala ” (Allievi di Musa al-Khowanzmi, autore di “Al-jabr w’al-muqabala ” 1 )
Cominciamo con l’introdu rre il concetto di opera zio ne tra insiemi, tenendo conto che abbiamo già abusato nell’uso di questa nozione ogniqualvolta abbiamo tratta to, per esempio, l’addizione o la moltiplicazione fra interi Siano, pertanto, X , Y , Z tre insiemi. Definizione 7.1 Si dice operazione tra X e ì a valori in Z una qualunque ap plicazione g : X x Y -> Z. Se {x,y) e X x Y, l ’elemento z = g{x,y) è detto risultato delVoperazione sulla coppia (x,y). Quando i tre insiemi coincidono, g si dice operazione su X o legge di com posizione interna su X. Esempio 7.1 In N la somma e il prodotto ^ono leggi di composizione ma lo è pure la legge che associa a ogni coppia di interi non nulli (a.b), il loro m c d ( ì 7,b) = ( / e N (cioè l’operazione a ★ b = d). Esempio 7.2 In Z la somma e il prodotto sono leggi di composizione ma Io è pure la legge o : (a, b ) e Z x Z - + a 2 + b2 e Z (cioè a o b —a2 + b2). Le operazioni sono in gene re denotate con simboli quali, per esempio, * c . +, D, #, o , • , . . . D’ora in poi, tratteremo operazioni su un insieme X e ci occuperemo delle loro proprietà.
1Libro scritto nell’820 d.C Parte del nome deH’autorc ha dato luogo alla parola algoritmo
Definizione 7.2
Un 'operazione “★ ”su un insieme X si dice
associativa
se
V a,bx e X
è
(a* b ) * c = a * (b +c)
commutativa
se
Va,b £ X
è
a ★ b = b ★ a.
Esempio 7.3 1. Le usuali operazioni di somma e pro dotto in N, Z , IR, C sono sia commutative, sia associative. 2. L’operazione definita neH’esempio precedente o : (a,b) e Z x Z - > t r + / ? 2 e Z è commutativa: infatti a ob = a2 + b2 = b2 + a2 = b o a, ma non associativa, come mostra la seguente scelta (5 o 4) o 3 = (5 2 + 42) o 3 = (25 + 16)2 + 9 = 1681 + 9 = 1690 5 o (4 o 3) = 25 + (16 + 9 )2 = 25 + 625 = 650 £ 1690. Esempio 7.4 Sia Z„ l’insieme delle classi di resti modulo n. Poiché la relazione di congruenza modulo n è compatibile con la somma e il prodotto definiti in Z (cfr. Capitolo 4), le seguenti leggi: [Hi + [Hi =
[a
+ Hi
[a]« • I H = [a • H i definiscono operazioni in Z„. Definizione 7.3 Un elemento us £ X si dice unità sinistra o elemento neutro a sinistra se Va € X si ha us ★ a = a\ un elemento uj e X si dice unità destra o elemento neutro a destra se Va e X si ha: a * uj —a. Si parla di unità bilatera riferendosi ad un elemento u e X tale che: u +a = a ★ u — a. Inoltre se l’operazione
su X è dotata di unità bilatera u, si ha la seguente:
Definizione 7.4 Un elemento xs £ X è inverso sinistro per l ’elemento x £ X se è :cs * x = u; un elemento è inverso destro per l ’elemento x £ X se x* Xd = u. Si parla di inverso bilatero riferendosi a un elemento x £ X tale che x *x —x *x = u. Esempio 7.5 L'operazione di somma tra interi relativi è dotata di elemento neu tro (il numero zero) e ogni intero relativo ha inverso additivo, usualmente detto opposto. Esempio 7.6 L’operazione di prodotto tra inten relativi è dotata di elemento neu tro (il numero 1); gli unici elementi invertibili di Z sono 1 e — 1.
Introduzione alle strutture algebriche
85
Diamo, ora, alcune proprietà relativamente al concetto di unità e di inversi). Proposizione 7.1 Sia ★ : X 2 —► X u n ’operazione rispetto alla quale u sia unita a sinistra e Ud sia unità a destra. Allora us = Ud = u, cioè unità a sinistra e unta a destra coincidono e si ha unità hilatera. Inoltre us e Ud sono univocamente determinate. Dimostrazione. Poiché us è unità a sinistra, si ottiene us * Ud — Ud , poiché u„ è unità a destra è us +Ud = us , pe r la transitività dell’uguaglianza segue = Ud . Se ci fossero due distinte unità a sinistra us e us si avrebbe, u * us — u poiché ùs è unità a sinistra, ùs ★ us = ùs poiché us è anche unità a destra, da cui otteniamo us — ùs. ■ Proposizione 7.2 Sia ★ : X 2 — » X un’operazione associativa dotata di unità bilatera u. Se l ’elemento x ammette un inverso sinistro xs e un inverso destro x,/. allora inverso sinistro e inverso destro coincidono e sono univocamente determi nati. Dimostrazione. Poiché l’operazione ★ è associativa si ha ( X 5 ★ X ) ★ Xd = X s * {X ★ Xd)
cioè u ★ Xd = xs ★ u da cui Xd = x,s. Inoltre se x s fosse un altro inverso sinistro, ancora l’associatività di ★ garantirebbe che (Jc* ★ x) ★ x s = x s ★ (x ★ jcJ cioè u ★ xs = x s ★ u
poiché
è anche inverso de stro per il punto precedente. Da cui i s = ,xs. ■
Consideriamo, ora, il caso in cui l’insieme X sia finito, cioè X = {ai,02. •- xi„ ! Un’operazione ★ : X 2 — ► X può essere descritta as se gn an do una tabella n x n. ove all’incrocio tra la riga /-esima e la colonna j -esima è posto l’elemento a, ★ a}.
★
a\
•
aj
tr
ai Ü2 •
•
an
an
•
•
#
•
•
•
a,
•
•
•
•
a,
★
•
♦
a,
•
•
♦
86
Capìtolo 7
1 problemi che si possono presentare in questo caso so no di due tipi: leggere una tavola interpretando ì dati (per esempio, come proprietà dell’operazione * su X) e viceversa data un’operazione su un insieme finito costruire la tavola di composizione. Vediamo alcuni esempi relativi a entrambe le situazioni. Esempio7.7 Sia X = [a,b,c] e si consideri la tavo la di com po sizione di X rispetto all’operazione ★ 1a a 11 a
b b c | c
b
c
b c a
c a b
Si osserva che l’elemento a funge da elemento neutro rispetto a mentre l’e lemento c è inverso (bilatero) di b e analogamente b lo è di c. Poiché la tavola è simmetrica rispetto alla diagonale principale l’operazione è commutativa. Esempio7.8 Sia X = (a,b,c,d }e sia:
0 a a b c d
a b c d
b b b d d
c c d c d
d d d d d
la tavola di composizione di X rispetto all’operazione “o”. Anche in questo caso la simmetria della tavola rispetto alla diagonale prin cipale garantisce la commutatività dell’operazione, inoltre osserviamo che a è elemento neutro bilatero ed è l'unico elemento invertibile. Esempio 7.9 Vogliamo ora costruire la tavola di com posizione dell’operazione somma di classi di resti in Z4. Occorre ovviamente ricordare che la somma di classi è così definita: [ah + [b]* = [a -f bl 4 e che [0]4 = [414, [1]4 = [5]4 e [2]4 = [6]4. Sicché + [014 1014 [0Ì4 [1]4 i Ul4 [214 [214 1314 1314
[2]4 u u [2]4 [214 [314 [314 [OI4 [014 [1]4
[1]4
[3]4 [314 [014 [114 [214
Definizione 7.5 Si dice struttura algebrica un insieme X su cui sono definite delle operazioni *2,... Essa viene normalmente indicata con il simbolo (X,
, *2 . • . •
•
Introduz ione alle strutture algebriche
87
1. (Q ,+ ) è una struttura algebrica ma anche (Q , 4 v ) lo è. 2. Se X è un insieme, allora (V(X), fi) e (V(X), U) sono strutture algebriche. Vediamo, ora, come raffrontare due strutture algebriche, che in prima battuta sup poniamo entram be dotate di una sola operazione.
Definizione 7.6 Siano ( X ,★) e (7,#) due strutture algebriche. Esse si dicono isomorfe se 3 una bijezione f : X — > 7 tale che Vx\ € X si abbia: fix \ * * 2) = /Cxi)#/C* 2), cioè tale che “f pr es en i l ’operazione”. La relazione di isomorfismo nell’insieme di tutte le strutture algebriche e una relazione di equivalenza (provarlo!) e sottolineiamo che scopo dell'Algebra e quello di studiare le proprietà delle operazioni di una struttura algebrica indipen dentemente dalla natura degli elementi dell’insieme base. Piià in generale, date due strutture algebriche (À\*) e (7.#), una applicazione / : X — » 7 tale che f ( x \ * x 2) = / ( * i ) # / ( *2) è usualmente detta omomorfi smo; se / è iniettìva è detta m on om orfism o e se / è suriettiva epimorfismo. Osserviamo che, se / è bijettiva, ritroviamo il caso dell’isomorfismo definito sopra. Un isomorfismo di (X,*) su se stesso si dice automorfìsmo, mentre un omo morfismo di (X,*0 si dice endomorfismo.
Esempio 7.10 Consideriamo ( Z , + ) ed (IR,-) e la corrispondenza / : Z —► R tale che V/i e Z sia f i n ) = 2”. Mostriamo che / è un monomorfismo. Infatti / è inietti va poiché se n £ m si ha / in) = 2n £ 2m = f (m ). Inoltre f i n + m) = 2n+m = 2" • 2m = / ( n ) • firn). Infine / non è suriettiva poiché non tutti gli elementi di R hanno preimmagine: ad esempio 3 non ha preimmagine, poiché non esiste nessun intero t tale che m = ? = 3. Prima di entrare nello specifico di alcune strutture algebriche, che saranno argomento dei prossimi capitoli, vogliamo precisare il comportamento di certi sottoinsiemi dell’insieme base X , rispetto all'operazione ivi definita. Definizione 7.7 Sia ★ : X 2 —> X un operazione su X e sia Y c X non vuoto. Diciamo che Y è chiuso rispetto a ll ’operazione ★, se Vvi. y2 e Y è vi * >2 € 7 Esempio 7.11 Co nsideriamo l ’operazione di somma tra interi relativi, cioè con sideriamo (Z ,+ ) e il suo sottoinsiem e dei numeri pari, usualmente indicato con 2Z. Si verifica che 2Z è chiuso rispetto alla somma. Infatti, se 2z i ,2 z 2 sono due generici interi relativi pan è 2zi + 2^2 —2(zi + Z 2) ^ 2Z.
Esempio 7.12 Se fissiamo l’attenzione su ll’ope razion e di pro dotto tra interi re lativi, cioè se consideriamo (Z,-) e il suo sotto insiem e Y = \2S \ s > 0 }, sì verifica che Y è chiuso rispetto al prodotto sopra ricordato. Infatti. V vi, V2 € Y, B s\,s2 > 0 tali che y = 2S' , y2 = 2S 2 e quindi si ottiene >i >’2 = 2il 252 = 2Sl+S2. che è ancora una potenza di 2 con esponente positivo e quindi appartiene a Y. Esempio 7.13 Sia Z 6 l’insieme delle classi di resti modulo 6 e sia “+” l’opera zione di somma di classi, La tavola di composizione di (Z é,- f ) è la seguente: -1- 1 [016
[IL
[2]e
[3L
[4L
[5 L
[0]6 [0]6
[IL
[2L
[3L
[4L
[5L
[IL
[He
[2L
[31e
[4L
[5]e
[Ole
[2]e i 12]6
[3L
[4L
[51e
[Ole
[IL
[316
[316
[4L
[5]e
[0L
[He
[21e
[4]6 [4L
[5L
[Ole
[IL
[2L
[3L
[516 1 [5]6
[0]6
[IL
[2L
[31e
[4L
Esempio 7.14 Ancora in si consideri l’operazione di prod otto di classi. La tavola di composizione di (Z ó ,-) è la seguente: [0L
[I L
[2L
[3]e
[4L
[5L
[Ole
[0L
[Ole
[0L
[0L
[Ole
[IL ! [Ole
[He
[2L
[3L
[4L
[5L
[2L | [0L
[2L
[4L
[0L
[2L
[4L
[3L
[Ole
[31e
[0L
[3L
[Ole
[31e
[4L
[Ole
[4L
[2L
[0L
[4L
[2] e
[5L 1 [Ole
[51e
[4L
[3L
[2L
[IL
«
[0L
Esempio 7.15 Se Y —{[0L,[3L) C Zé, si ha che la tavola di composizione di (E,+) è la seguente: 4-
[Ole
[3]6
[Ole
[Ole
[3 ]6
[3 L
Ole
[0]s
e quindi Y è chiuso rispetto all operazione + (cf r. Definizione 7.7).
Intro du zion e alle strutture algebriche algebriche
89
N ell'i l'ins nsie iem m e H = Z x Z = {(x,y)\x, y € Z} si consid consideri eri l ope ope Esercizio 7.1 Nel razione ★ così definita: (x,y) * (z.t) = (x -\-z,yt). Si stabilisca stabilisca se è commu com mutati tativa, va, associa ass ociativa tiva e si si determinino gli elem element entii inve inverti rti bili. ins iemee G = Q x Q = {(x,y)\x, y e Q}, ove 2 e / e / ’insiem insiemee Esercizio 7.2 N e ll ’insiem dei numeri numeri razionali si conside con sideri ri l ’operazione operazio ne o così definita: definita:
U,;y) o { z J )
=
(xz,yz
+ 2/).
Si stabilisc stabilisca a se è commutat comm utativa, iva, associa ass ociativa tiva e se ammette eleme elemento nto neut neutro ro..
Esercizio 7.3 Nel N ell'i l'ins nsie iem m e C = I x R = {{a.b)\a. b e 3}, ove R è l ’insieme insieme dei nume numeri ri reali reali,, si s i consid con sider erii l ’operaz ope razione ione o così definita definita *3
(a,b) o (c , d ) = (ac —bd.ad 4 - bc).
Si verifich verifichii che l ’oper op eraz azio ione ne o è associa asso ciativ tiva a e commutativa. Si determin determinii inol inoltre tre l ’eleme elemento nto neutro e l ’insieme insi eme degli elementi eleme nti invertibi invertibili. li.
8 A l g e b r a d e l l e m atr at r i c i
“Come il ferro in disuso arrugginisce, così l’inazione sciupa l’intelletto” (Leonardo da Vinci)
Il calcolo matriciale gioca un ruolo primario nell’algebra lineare, in particolare ogniqualvolta i dati possono essere organizzati sotto forma di tabella Questo Questo attegg iam ento me ntale facilita, tra 1 altro, altro, l 'implement 'implementazi azione one dei dei dadati stessi stessi e la cre azio az ione ne di algo al go ritm rit m i riso r isoluti lutivi. vi. Un esempio esemp io per tutti tutti è costituito costituito dall’utilizzo delle matrici per analizzare e risolvere sistemi lineari, anche molto complessi. Comi Cominc ncia iamo mo pertanto col definire form alme nte cosa intendiamo intendiamo per matrice
Dic iamo o matri ma trice ce di tipo (m a i ) e la indichiamo con il simbolo Definizione 8.1 Diciam Mmxn, una tabella di m x n elementi appartenenti a un campo K (in particolare noi considereremo K = M) e ordinati secondo m righe ed n colonne . Una tabella di quest questo o tipo si dice dic e “a dopp do ppia ia entrat ent rata a ”. Di solito gli elementi di M = M mxn, indicati con il simbolo m ^ono individuati da un doppio ìndice, ove il primo (i = 1. 2 . .. m indica la riga di appart appartene enenza nza e il sec on do ( j = 1,2 ___ n) indica la colonna 1, 2 __
m u m 12 M — Mmxn Mmxn = ( mij) -
l ì Z21
m i2
mi* mi* ■’ *
fn 2n
_ mm\ tnm2 *•* Mmn _ Osserviamo che le matrici del tipo (rj i ,r i 2, **• ,r\n) — [ r * r ' : R = R\j R \j = (rj
%. • •
n. j
92
Capitolo 8
con una sola riga, sì chiamano anche vettori vettori riga, riga , mentre quelle del tipo ~ C li “
C il \
C21
C = C,\ =
» • •
^Hll ì
_
1 _
con una sola colonna, si chiamano anche vettori vettori co lon na1 na 1* . Nel Nel caso caso in cui il numero delle righe rig he ug ugua uagl glii il n u m ero er o d e lle ll e colo co lonn nnee (cioè (cioè sian = m). la matrice matrice M = M„xn, si si dice quadrata di ordine n. Accan ccanto to a og ogni ni matrice matrice M = Mmx Mmx„ è possib pos sibile ile co c o n sid si d erar er aree la l a matrice ma trice da da essa ottenuta scambiando le righe con le colonne, detta matrice trasposta di M e e indica indicata ta con il simbolo M 7 , Ov Ovvia viame mente nte M 1 è di tipo (n,m). 12 3 Esempio 8.1 Sia M — , la sua trasposta trasp osta è M 7 = 0 15
10 2 1 3 5
È immediato osservare Tidempotenza della trasposizione, cioè che vale l'ugua glianza (M7)7 = M. Sia ora M una matrice quadrata di ordine n. La matri matrice ce M = M„x„ è simmetrica se M — M 1 ; si dice Definizione 8.2 La emisim emisimme metrica trica o antisimmet antisimmetrica rica se M = —Mr —M r .
Esempio Esempio 8.2 La matrice
2 0“ 2 5 - -4 _o - -4 3 _ "1
A = A 3x3 =
è una matrice simmetrica, mentre la matrice • B =
#3x3 =
0
2
-2 -8
0
8 -4
4
0
è emisimmetrica. Osservazione 8.1 In una matrice matrice simmetrica gli elementi sono s ono distri di stribui buiti ti simmetncamente rispetto alla diagonale formata dagli elementi an aji, • • • , a , det tadiagonale principale, cioè si ha che at, — a ^ y i j . In una matrice emisim Jt, (1 < i < n, 1 < j < «), e gli elementi della diagonale metrica si ha a,} — - a Jt, prin princi cipa pale le sono sono tutti tutti nulli. nulli. 11vettori 1vettori riga e colonna si possono trovare indicati, anche in questo quest o lesto, sia si a con le par p arent entes esii ton t onde de,, sia con pare parent ntes esii qua quadr drate ate
le
Algebra delle matrici matrici
93
m atric icee M quadra qua drata ta di ordine n è detta detta triangol triangolare are supe Definizione 8.3 Una matr riore (o triangolare alta) se gli elementi al di sotto della diagonale principale sono sono tutti tutti nulli. nulli. In man m anier iera a ana a nalog loga a si s i definisce la matrice triangolare triangolare inferi inferiore ore (o triangolare bassa). Esempio 8.3
"1 0 A = A 3x3 = _0
2 3“ 5 -4 0 3 _
è triangolare alta, mentre
B =
1 -2 -8
# 3x 3x 3 =
0 2 4
0“ 0 1
è triangolare bassa. matr ice D = (dtJ (dtJ), quadrata quadr ata di ordine ordine n . si dice diagonale Definizione 8.4 Una matrice se gli unici elementi eventualmente non nulli stanno sulla diagonale principale, cioè se d,j = 0 , Vi ^ j. j . V
Esempio 8.4
E diagonale la matrice D — #*3x3 =
10 0 0 0 0 0 0 3
e può essere talvolta indicata con il simbolo D = dìag( 1, 0 , 3). Natura Na turalme lmente nte u na m atri at rice ce diag di agon onal alee è anche anc he triangola trian golare re bassa e triangola triangolare re alta, ma non è vero il viceversa. n. identiche di Osservazione Osservazione 8.2 8. 2 Tra le matrici diagonali ricordiamo le matrici I n. ordine n, in cui gli elementi della diagonale principale sono uguali a 1 e gli altri elementi sono uguali a zero. Per esempio h =
10 0 1
h =
10 0 0 10 00 1
♦ ♦
8tJ così definito In generale, introdotto il simbolo di Kroneker 8tJ
1 s e i = j *0 = < 0 s eeii ^ j la matrice identica /„ può essere indicata brevemente nella forma: In = Introduciamo ora, poiché sarà utile nel seguito, la nozione di matrice a scala
94
Capitolo 8
Una matrice (non necessariamente quadrata), si dice “a scala” se le eventuali righe formate solo da zeri sono le ultime e, per ogni riga non tutta nulla, il primo elemento diverso da zero è situato su una colonna di almeno una posizione più a destra rispetto ai primi elementi non nulli delle righe precedenti. Il primo elemento non nullo di ogni riga è detto “pivot”. Definizione 8.5
Esempio 8.5
A=
0 12 3 4 0 0 5 3 1 0 0 0 12 0 0 0 0 0
è una matrice a scala; ì “pivots” sono 1, 5 , 1. Esempio 8.6 12 0 1
B =
0 0 3 2
0002 è una matrice a scala; i “pivots ’’sono 1,3,2. Dopo aver introdotto il concetto di matrice e prima di procedere a introdurre operazioni, osserviamo che due matrici A = (a ,j) e B = (¿>,7) sono uguali se i) sono dello stesso tipo (m, n ), ii) hanno gli elementi ordinatamente uguali, nel senso che si ha Vi = 1,2 ,... ,m, V j= 1 ,2 ,... ,n .
atJ = b,j,
8.1 Operazioni nell'insiem e delle matrici 8.1.1
Som ma di matr ici
Indicato con Marmxn(R) la totalità delle matrici di tipo (m,n) a coefficienti reali, introduciamo l’operazione di somma + : Matmxn{ R) x Matmxn{ R) -» Matmxn(R ) : con la seguente Definizione8.6 Date due matrici A = (a,/), B = (btJ) e Matmxn(R), diciamo somma di A e Bla matrice C = (c0) e MatmXn(R) ; cui elementi sono c,, = aij + btjy i = 1,2,... ,m, Vj = 1,2 , . . . ,n. J
Algebra delle matrici
Esempio 8.7
95
Siano 2 1
3 0
4 -1 1 4
allora
A + B = C
-
1 6
0
2
2
4
La prima osservazione che sorge spontanea, analizzando la definizione di somma sopra riportata, è che la somma matriciale è ncondotta alla somma di elementi del campo su cui sono d efinite le matrici (nel nostro caso il campo reale). Ne scaturisce, pertanto, che le pro priet à god ute d alla somma matriciale sono in stretto rapporto con quelle della somma fra scalari. Date le matrici
A = (ay)
B = (btJ), Vi = 1,2, . . . ,m
C = (c ìj ) e (Matmxn(R),+) Vy = 1 ,2 ,... ,n
valgono le proprietà segu enti : i) A + B = B + A (proprietà commutativa): infatti
aij + b,j = b,j 4- cijj. ii) A + (B + C) = (A + B) + C (proprietà associativa): infatti
&ij 4" (b,j 4- c,j) = (d[j + b,j) -L ctj . iii)
Esiste in Matmxn(R ) una matrice, detta ma tri ce nulla e indicata con 0 (i cui elementi sono tutti uguali a 0 ) tale che A 4 - 0 = 0 4 - A = A.
iv)
Per ogni A = («atJ) esiste in M a t mxn( R) una matrice, detta opposta di A e indicata con —A = (—a^), tale che A 4- (—A) = (—A) 4~A = 0.
Si può pertanto concludere che V i nsieme Matm „„(IR) delle matrici di tipo (m,n) a coefficienti reali, rispetto all’operazione di somma sopra definita è un gruppo abeliano. Esercizio 8.1 Sia A una matrice quadrata: verificare che la matrice S = Ar 4- A è una matrice simmetrica, mentre la matrice R = A 7 —A è emisimmetnca.
96
Capitolo 8
8.1.2
Prodo tto est ern o
Passiamo ora a considerare una nuova operazione •, detta “p ro d o tto es tern o” • : 1 x Matmxn{ R) -* M atmxn{R) Deiìnizione 8.7 VX 6 R e VA G Matmxn(R) si definisce prodotto esterno di X per la matrice A, /a matrice X • A dello stesso tipo di A, i ct/i elementi sono ottenuti moltiplicando ordinatamente per X tutti gli elementi di A. Esempio 8.8 Sia A=
1 0 12 ’x = ; 12 4
allora
È possibile studiare le proprietà che legano la somma matriciale con il prodotto esterno. Proposizione 8.1 Date A = (a,,).
B = (b.j) € (A fa/„ X„(R), + ,•)
K» e R
valgono le seguenti relazioni:
v) (X + p) - A = X• A + p • A; vi) X*(A + fi) = X- A + X- Zi; vii) (X/z) • A = X • (p • A); viii) 1 • A = A. Dimostrazione. Dimostriamo, come esempio, la proprietà v) (X + p.) A = (X 4- p) • («,;) = ([X 4- /z ]
■
Raffrontando quanto detto sopra con la definizione di spazio vettoriale (cfr. Ca pitolo 11), possiamo concludere che Tinsieme Matmxn(R ) delle matrici di tipo (m,«) a coefficienti reali, rispetto alla somma e al prodotto esterno definiti sopra, costituiscono uno spazio vettoriale.
Algebra delle matrici
97
Tra l’altro questo ci permette di osservare che la generica matrice A — (a,,), può essere espressa come combinazione lineare a coefficienti reali di matrici Efik — (&ij)
^
A i u t m X W(R),
così definite
e,j = 1
se
ì —h
e
j = k
e,j = 0 negli altri casi. Esempio 8.9
In M at 2X3 si ha
' 10 0" £11 = 0 0 0 j
E n =
1 0 0 0 1 -
£21 =
-
_ _ _
0 0 -
E 2 2
=
1
1
"0 1 0 " 0 0 0 J
E l 3 =
‘oo r 000
'0 0 0 " 0 10
E h —
ro 0 0' 0 0 1
La generica matrice
a b c d e f
G A/tì/2x 3 W
si può pertanto scrivere nella forma
A = a E\\ + b E \2 + cE\i + ^ £ 2 1 + ^£22 + / £238.1.3
Prodo tto righ e per co lon ne
Cominciamo a considerare due particolari matrici, la matrice riga R i n =
[ Hi H 2 • ** fin ]
e la matrice colon na
Cn1 = [ cu C12 e consideriamo il prodotto o così definito
c 11 R\n 0 Cn\ = [ r\\ r\2 • • • r\n ] o _ Cfl\ _ — H i^ n + r 12C21 + ••• + /*I«cn\ € R. In particolare si vede che il risultato della composizione di un vettore di tipo (1,/iJ (cioè R\n) per uno di tipo (n,l) (cioè Cn1) è una matrice di tipo 1 x 1 cioè un numero reale.
98
Capitolo 8
Esempio8.10 Verificare che, presi tre vettori R i„, Cni, Dnì valgono le jCo distributive del prodotto rispetto alla somma. ^ Infatti se R[„ e C„i sono definiti come sopra e
Dnì =
- d % • •
_d„i _ si ha "cu ^ln 0 (Cnl + Dn\) = [ Tu r \2
• •
•
*
+
•
V
'dn' m
"
• •
_ dn\ _
_C„\ _
c u + d\\ = [*ìi r i2 ••• rln]o
_
dni _
= r 11(^11 + dn) + ri 2(c2i + d 2i) + ... + rìn(cni + dn\) — -
OìiQi + rj2c2i + . .. + ri„c„i) 4- (m dn + di2c2i + . . . + di„c„i) = ~d\\ ~
"cn ‘ = l rU r 12 ’ ** f'in ] O
•r • ♦
• •
r\n ] 0
+ [ m r i2
•
_ dn1 _
_c„i _ R[n 0 Cn\ -f R\n O Dn1
Siamo ora in grado di definire il prodotto righe per colonne tra due opportune matrici. Definizione 8.8 Due matrici A e B si dicono conformabili o moltiplicabili se il numero di colonne della prima è uguale al numero di righe della seconda . Siano ora A e fi due matrici conformabili, cioè A € Matn;X*(R), fi € Matm*k(R) Consideriamo la matrice A come accostamento di m vettori riga r.r> ___ ,r„ di tipo (kit) e la matrice fi ottenuta per accostamento di k vettori colonna ci-ci ........ ài npo (mr I k Poniamo per definizione r r A B -
ZM
W
! :
c
e-
f |
c* H
r o d r t o c: r 2 o Cj e-* o c>
;
ri c c< r 2 c c<
r
L r« o c : r_ c C'
r* o c<
J
Algebra delle matrici
99
ove il prodotto r, o c, == rnc\j -f rl2c2) + . . . r tncnjA < i < mA < j < k e quello definito so pra (cfr. (★ )). Osserv azione 8.3 Se A è di tipo (m,n) e B è di tipo (n,k) allora si vede che . matrice prodotto C = A B è di tipo (m,k). Sappia il lettore che questo non è l’unico modo di definire un prodotto tra matrici: si possono definire un prodotto colonne per righe, un prodotto colonne per colonne o anche righ e per righe, però, senza ulten on precisazioni quando si parla di prodotto di matrici si intende sempre quello definito sopra “righe per colonne”. Esempio 8.11
Date le matrici 10 2 1 13
A= calcoliamo il prodotto A
B =
10 0 1 1 1
B.
Osserviamo preliminarmente che A è di tipo (2,3) e che B è di tipo (3.2 ■ Quindi le due matrici sono m oltiplicabili La matrice prodotto A B sara di tipo 3 2 (2,2) e precisamente otteniamo A • B = 4 4 Infatti ” 0
" 1 "
r, = [ l 0 2 ]
r 2 = [1 1 3 ]
c, =
0
C:
1
=
1 .
1
e quindi
r t o ci = [ 1 0 2 ]
e infine
o
= 1 *i -uO‘0 + 2- I = 3
q o e: = [ 1 0 2 o
= L0 + 0* lr2 4= 2
f: o C; = [ 1 1 3
= M
e
r L 0t M
“
= 4
k t q*#fw $m
* * ® * < * i ^ * J i» s * ^ i \ *v. $
A » « f c # * > y t f m ~ì
$ %A
k
tìatC V* mtTfièK A di Tip® < m ^ ), #
& $$oito
(n j, v ^
A *(B + C ) = A ' B + A ' C. Esercizio 8.2 Sotto quali con dizio ni sul tipo delle matrici A. #,C vale la pro prietà distributiva (destra), cio è (A E B) • C — A •C -f B • C? Esercizio 8.3 Sotto quali cond izio ni sul tipo de lle matrici A e B è possibile ef fettuare il prodotto A • B e il prodotto B * A?
8.1.4 Matrici quadrate di ordine n Nel caso delle matrici quadrate di ordine n naturalmente valgono tutte le proprietà che abbiamo visto finora: le matrici quadrate sono dello stesso tipo (matnci in Matmyn(R) con m = n ) e quindi cos tituis con o un o spa zio vettoriale2. Inoltre due matrici quadrate sono sempre moltiplicabili (prodotto righe per colon ne) e il risultato è ancora una matrice quadrata di ordine n. Rispetto al prodotto, oltre a valere le proprietà associativa e distributiva (sini stra e destra) si ha che la matrice id entica /„ (g ià definita) funziona da elemento neutro rispetto al prodotto, cioè si ha che VA e Matnxn{R) vale la relazione A • / „ = / „ • A — A . Possiamo quindi concludere che l’insieme delle matrici quadrate di ordine n, Matnxn(R), rispetto alla somma m atriciale e al prodotto righe per colonne è un anello dotato di unità. Vediamo ora di studiare gli elementi invertibili di Matnxn(R).
Sia A € M atnxn(R) ; una matrice B € Matnxn(M) sidice inversa di A se A • B ~ B A ~ ln.
Definizione 8.9
^Confronta ti Car to lo i 1.
AKjdtMa stente
to t
HkM 'M**VC \ % Wvl-**)|A^V '< .-'•' <• <*•!*■? \v ;*'.iV W W t K t ? $WO%V-
Pw qH Uii nMie 8 .4
VH>v ' \\t <&
V *«
IMmo\tu a s to n e $upfMmìamò |v t àxswxlo che \ mMteOa due invece viofr d v due mattivi è e €v # v <\ pe r le quali si abbia t f' H A I* » ) * < € ' A) # * l„ B - ». che è assunto. « Rìmàfte però ape rto il proble m a deH esiston za della matrice inversa, pwbk ma che troverà un a ris pos ta alla (ine del capitolo Esercizio 8.4
“1 A= 0 J
Date le m atrici
5
i■ 1 0 2 --1 -
B r*
2
-2
1
0 r 2 1 1 -- i j
e
■ -1 0 C = 0
0 0* 1 0 0 -t
svolgere i calcoli indicati: 1.
A - B. f l - A , A - C . C - A . f l - C . C - / ?
2. A2 = A A ,B 2 = B
B ,C 2 = C
C
3. A -\~ B, A -H(T,3A,2B -|- 4C Mostrare che una matrice diagonale D di ordine tre pennuta con qualsiasi matrice diagonale A e M a t^ i M ) e che il prodotto di due matrici dia gonali Di, D2 € Afa i 3x 3(R ) è an cora una matrice diagonale in Mat 3X?(R). Esercizio 8.5
8.2 Sis tem i lin eari Vogliamo ora utilizzare gli strumenti matriciali precedentemente introdotti per discutere la risolubiltà dei sistemi lineari, ovvero dei sistemi di equazioni di primo grado. Cominciamo con il richiamare il concetto di equazione lineare. Definizione 8 .10 Un *equazione lineare (o di primo grado) nelle incognite X\,X 2, . . . ,x n a coefficienti nel campo K, è un'equazione del tipo
a 1*1 + a 2*2 + . . . + anxn = b Soluzione dell'equazione è una n-upla ( « i , a 2, . . . ,an) € K n, che, sostituita al posto di (x i,X 2 , . . . ,*«), dà luogo ad una identìtCL Esempio 8.12
una soluzione.
Data l’equazione 3*i + 5*2 4-*3 - 5 = 0, la tema { 1. 1, - 3> è
102
Capitolo 8
Considerando simultaneamente m > 1 eq uaz ioni lin ea ri ne lle incognite x\,x2. .. . ,x„, otteniamo il seguente sistema a \ \ X \ +
£*12*2 4- . . . 4“
<*2lX\+
022
—
0[nXn
X 2 + . . . + a2nXn = b 2 . ♦ •
4"
b \
& m 2x 2 4“
. ♦ •
... 4"
O m nX n
—
(*★)
b m
che si dice lineare, perché tutte le equazioni sono lineari (cioè di primo grado). In esso, come già detto, x\, x 2, . . . ,xn sono le incognite, b\ b2, .. . ,bm sono i termini noti (e appartengono a un campo K , che può essere per esempio il campo reale R o il campo razionale Q), mentre gli sono i co effic ienti delle incognite (e appartengono anch’essi al campo considerato). Nel caso in cui tutti i b, siano uguali a zero, il sistem a si dice omogeneo. Definizione 8.11 Una n-upla ordinata di scalari (a \,a 2, . . . , a „ ) appartenente al campo K , che sia soluzione simultanea delle n equazioni del sistema (★*), è detta soluzione del sistema e il sistema stesso è detto risolubile o compatìbile. Osservazione 8.4 Se il sistema è omogeneo che la n-upla (0 ,0 , . . . , 0) è la soluzione banale.
= 0,V/ = 1 , 2 , . . . ,n) diremo
Definizione 8.12 Due sistemi lineari sono equivalenti quando essi ammettono le stesse soluzioni, ovvero quando le soluzioni dell'uno sono tutte e sole le soluzioni dell'altro. Naturalmente se ad alcune (o a tutte le) equazioni di un sistema si sostitui scono un ugual numero di equazioni equivalenti, il nuovo sistem a è equivalente al sistema dato. Invece si ha la seguente Definizione 8.13 Dati due sistemi di equazioni, si dice che il secondo sistema è conseguente al primo se ogni soluzione del primo è anche soluzione del secondo, ma non vale necessariamente il viceversa. Esempio 8.13 Dato il sistema | 3* i + 2*2 = 5 | 4 *i + 8* 2 = 4
esso è equivalente al sistema | 3*i + 2*2 = 5
( *i 4- 2*2 = 1 Esempio 8.14 Dato il sistema i 4*i + 2*2 +*3 = 5 | *i + 2*2 = i l 4*i +4*2 + * 3 ~ 6
Algebra delle matrici
103
esso è conseguente al sistema ' 3jtj + 2*2 + * 3 = 5 *i + 2*2 = 1 . *i =3
8.2.1
M a t r i c i s t o c a s t i c h e e c a t e n e d i M ar k o v
Questo capitolo ha lo scopo di illustrare alcune applicazioni di tipo probabilistico di vettori e matrici. È noto che la probabilità ha come fine lo studio di esperimenti casuali non deterministici: storicamente essa ha inzio con lo studio dei giochi di sorte dalle carte, alla roulette, ai dadi ecc, per arrivare, ai giorni nostri, a forni re modelli matematici di fenomeni casuali in campo economico, finanziano, ecc. Cominciamo col ricordare che l’insieme di tutti i possibili esiti di un dato esperi mento è detto spazio cam pionario ed è indicato usualmente con Q e un particolare esito è detto punto cam pionario o campione. Un evento è un insieme di esiti, cioè un sottoinsieme dello spazio campionario. Si dice evento elementare, revento {a}, a € Q. Anche l’insieme 0 e Q, sono eventi: 0 è detto evento impossibile, £2 evento certo o sicuro. Esempio 8.15 Si getti un dado e sia A l’evento: si presenta un numero pari Lo spazio campionario è Q = {1,2,3,4,5, 6 }e l’evento A = {2,4,6}. Naturalmente si possono combinare eventi per formarne dei nuovi, utilizzan do le varie operazioni sugli insiemi: unione, intersezione, complementazione ecc. In particolare se A e fi sono due eventi tali che A fi fi — 0, essi si dicono eventi incompatibili. ASSIOMI di PROBABILITÀ Dato uno spazio campionario Q, sia P(£2) la classe degli eventi. Una funzione p : ViSl) è detta m isura di prob ab ilità , se valgono i seguenti assiomi: 1. VA e V ( Q ) è 0 < p(A ) < 1. 2. p(Q) = 1. 3. Se A e fi sono eventi incompatibili, cioè se A fi fi = 0, allora p(A U f i) = p(A ) + p(B ). 4. In generale, se A i , A 2, • • • è una sequenza di eventi incompatibili, allora p(A \ U A2 U • • • ) — p (A \) + p(A2) + • • • Si può dimostrare, ma questo esula dai nostri intenti, che. (a) p(0) = 0 . (fi) P(AC) = 1 - p(A). (y) se A < fi allora p(A ) < p(B ).
104
Capitolo 8
Nel caso in cui Q sia uno spazio finito del ti po Q = {ù)\,a)2, . . . ,(on } si ottiene uno spazio di probabilità finito a sseg na nd o ad og ni co, un num ero reale p, detto probabilità di co, che goda delle seguenti proprietà: (i) Pi > 0 Vi e {1,2 ,... ,n}; n (ii) £ > = 1. ì= i
VETTORI di PROBABILITÀ e MATRICI STOCASTICHE Definizione 8.14 Un vettore v = (v\,v2, • • • ,v„) è detto vettore delle probabi lità se le sue componenti Vi sono non negative e la loro somma è 1.
Esempio 8.16
Si considerino i seguenti vettori: v = (1, - 2,1); w = (1,2,3); t = ( 1 / 2 , 1 /4 , 1 / 4 ) .
Osserviamo che v non è vettore delle probabilità poiché ha una componente ne gativa: w non è vettore delle probabilità poiché la somma delle sue componenti supera 1 mentre t è vettore delle proba bilità.
Definizione 8.15 Una matrice quadrata P — ip ,,) è detta matrice stocastica se ogni elemento di P è non negativo e se la somma degli elementi di ciascuna riga è L In altre parole in una matrice stocastica ogni riga è un vettore delle probabilità.
Esempio 8.17
Si dica quali delle seguenti matrici sono stocastiche
"lì" '0 11 a) = 1 1 ; b) = .22. 1
-
1
I I
L
_
2
•
f i 1 ol ; d) = ? ? 1 f - 3 3 32.
3
La a) è stocastica perché ciascuna riga è un vettore delle probabilità; la b) non è stocastica poiché la somma degli elementi della prima riga non è uguale a 1; la c) non è stocastica poiché ci sono alcuni elementi negativi; la d) non è stocastica poiché non è quadrata. Teorema 8.1 Siano A.B e Matnxn(E) due matrici stocastiche. Allora il pro dotto AB è una matrice stocastica. Dimostrazione. Cominciamo col provare che se A = (a iy) è una matrice stocasti ca di ordine n e v = (vi,v2, • • • ,vn) è un vettore delle probabilità, allora anche vA è un vettore delle probabilità. Infatti, poiché v, e a,j sono non negativi, anche le componenti di vA sono non negative. Resta solo da provare che la som ma delle componenti di vA è 1. Infatti: v \ ù i \ +
v2a2\ -1------ b v„ani -f vial2 + v2a22 H------- b v„an2 -i------- b vria/m =
+a 12 +
• • •
=
+ 01«) + v2(a2ì + a22 + . - • + a2n) + . . . + Vtl(a„ +
Vi 1 -b V2I
,
-I------ b u« 1 =
V \
-b l>2 H-------- b Vfì = 1
a
, ì2
+ •• - W
Algebra delle matrici
105
Dalla definizione di pro dotto righe p er colonne di due matrici, si può osservare che la riga / -esima di A B si ottiene moltiplicando la riga / -esima di A per la matrice B e poiché ogni riga di A è vettore delle probabilità e B e matrice stocastica per il ragionam ento precede nte, si conclude che ogni riga di AB è vettore delie probabilità e quindi A B è matrice stocastica. ■ Corollario 8.1 Sia A una matrice stocastica: allora, per ogni n > 0, ogni po tenza An di A è una matrice stocastica. Una classe notevole di matrici stocastiche è costituita dalle matrici stocastiche regolari . Definizione 8.16 Una matrice stocastica A è regolare se tutti gli elementi di una generica potenza A" sono positivi. Esempio 8.18
10 0 la matrice stocastica A — 0 1 0 „ 0 0 1.
"10 0 per ogni n è An = 0 1 0 , mentre la matrice B = 0 0 1
i r B2 =
? i
non è mai regolare poiché " i i ? ?
è regolare: infatti
.2 2 .
= Bn.
L 2 2 J
Ricordiamo che un vettore v è fissato da una matrice A se \A = v e quindi V& G E \ 0 è: {k\)A = k(\A) = k\, cioè ogni suo multiplo scalare non nullo è fissato da A. Una matrice stocastica regolare ha un particolare comportamento rispetto al problema dell’eventuale unicità dei vettori delle probabilità fissati. Infatti. Teorema 8.2 Sia A e M atnxn(R) una matrice stocastica regolare. Allora A ha un unico vettore v delle probabilità fissato e le componenti di v sono tutte positive 1/3 2/3 una matrice stocastica. Essa è regolare e 1 0 ammette l’unico vettore delle probabilità v = (y, 1 - y) tale che \A = v Infatti: (y, 1 —y) A = (y, 1 —y) da cui si ottiene il sistema:
Esempio 8.19
Sia A =
r
- y=
y
= 1-V 3y = 3 che ammette l’unica soluzione y = - , sicché v =
3 2
106
Capitolo 8
Passiamo, ora, a considerare una successione di prove i cui esiti a\ ,a2, • • •, siano tali che: (*) ogni esito appartiene ad un insieme finito di esiti { j c i , jc2, • • • , jc„) detto spazio degli stati. Se la prova m-esim a ha e sito Xj diremo che il sistema è nello stato Xj, nel periodo m o nella transazione m-esima. (★★) L’esito di qualsiasi prova dipende al massimo dall’esito della prova pre cedente e non da altre.
Definizione 8.17 Per ogni coppia di stati ( x , ,x }) si indica con p tJ la probabilità che si verifichi x } immediatamente dopo x,. Un tale processo è detto catena markoviana. Definizione 8.18 Si dice matrice di transizione una matrice P ottenuta ordinan do i valori p,j delle probabilità di transizione.
Sussiste la seguente proprietà, la cui dim ostraz ion e è im m ed iata conseguenza delle definizioni: Proposizione 8.5 Una matrice di transizione di una catena markoviana è una matrice stocastica. Esempio 8.20 Paolo abita a Rho e frequenta l’università a Milano, ove si reca giornalmente con il treno o con la propria auto. Non pren de mai l’auto due giorni di seguito ma se si reca a Milano in treno la probabilità che il giorno dopo usi l’auto è uguale alla probabilità che prenda il treno. Lo spazio del sistema è {a, /} ove a = auto e t = treno, e il processo è markoviano poiché l’esito di ogni giorno dipende solo da ciò che è avvenuto il giorno prima. La matrice di transizione è:
t 1 a
a 0
1/2 1/2
Dalla prima riga leggiamo che Paolo non prende mai l’auto due giorni consecuti vamente, mentre la seconda nga evidenzia come il giorno dopo aver usato l’auto avrà la stessa probabilità di usare treno o auto. Esercizio 8.6 Dire se le seguenti matrici sono stocastiche e, in caso positivo, dire se sono regol an: 1. A =
2
.
Algebra delle matrici
107
8.3 Sist emi lin eari e m atric i Riprendiamo il sistema lineare a\\X\ + ¿*12*2 + • .. + a\nxn ¿*21*1 + « 22 *2 + • •. + a2„xn <2/ nl*l 4 “ ¿*m2*2
bi b2
(★★)
4" • • • 4” O m n X n — b m
Ad esso, possiamo associare una matrice A e Matmxn(K ), (dove m è il numero delle equazioni ed n il numero delle incognite) i cui elementi sono i coefficienti delle incognite nelle equazioni del sistema. La matrice A è detta matrice dei coefficienti del sistema, mentre la matrice [A|b] ottenuta “orlando" A con la T colonna (vettore colonna) dei termini noti b = [ b\ b2 . . . bm j è detta matrice T
orlata o completa. Inoltre, ponendo x = [* i x2 . . . xn ] , il sistema (★*) può essere scritto nella forma
A • x = b
♦
V
cioè _
¿*11
¿*12 . . .
¿*l„
¿*21 • • »
¿*22 • • • • • • • t #
02n
&m1 Um2
•••
~ bi “ b2
~*i “ •
• • t
Umn _
*2 • • ♦ _ * « _
—
• • • -
-
ove il prodotto A • x è il prodotto righe per colonne tra la matrice A di tipo (m,n) e il vettore x (di tipo (n, 1), che dà come risultato il vettore b di tipo (m, 1) Osservazione 8.5 Per ogni matrice di tipo ( m,n + 1) esiste sempre un sistema di m equazioni nelle n incognite x \ x 2, . . . ,xn di cui essa è matrice completa.
Nel paragrafo precedente abbiamo introdotto la nozione di matrice a scala o a gradini. In conseg uenza diamo la seguente Definizione 8.19 Un sistema di equazioni lineari nelle incognite x \x 2, . detto a gradini (o a scala) se è della form a
a nxi +¿*12*2 . . . ¿*22*2 •
•
•
+¿*1 n*n
# •
+ « 2nXn
#
•
+**
b\ b2
,xn è
(★ ★ ★)
♦ • # •
“fi? mìliti = bm
con ¿*n,¿*22. . . • ,i*mm ^ 0. Ovviam ente m < n. Mostriamo ora la seguente Proposizione 8.6 bile.
Un sistema di equazioni lineari a gradini è sempre compati
Dimostrazione. Distinguiamo due casi: n = m e m < n. 1. Sia m = n. Allora l’ultima equazione di (* ★ ★) è a,wx n = b„ ed è soddisfat ta dall’unica soluzione xn = a~nlbn. Sos tituen do que sto valore nella penultima equazione si ricava xn-\ e cosi vìa risalendo, si otte ng on o x„ _2, . . . ,xi e quindi si trova l’unica soluzione per il sistema (★ ★ ★ ). 2. Sia m < n. il sistema (★ * ★) è equivalente al sistema
011*1 + 012*2“!' ... + 01m*m = b\ — (0 l(m+ l)*(m + l) + ***+ 01«*/i) 022*2+
• • • +02/n*m = ^2 — (02(m + l)*(m +l) + * ** + #2n + *n) « •
•
•
amm-^rn *m — bm
(0m(m+l)*(m+l) ■ +* ** + #mn*n)
che risulta essere un sistema a gradini, di m equazioni in m incognite, qualo ra si assegnino valori arbitrari hm+i,/im+ 2 , . . . M ,, € K alle n — m incognite xm+i,xm+2, .. . ,x„. Esso ammette pertanto un ’unica solu zione. Ne deduciamo che il sistema (* ★ ★) ammette infinite soluzioni ottenu te al variare dei parametri ^m+l>^m+2>• • • Mn € /C. Esprimeremo il fatto che dette soluzioni sono funzioni di n — tn parametri arbitrari dicendo che il sistema ammette oo"~m soluzion i. ■
8.4 Metodo di elim in azio ne di G au s s -J o r d an Questo procedimento si propone di stabilire la compatibilità di un sistema e, nel caso affermativo, di trovarne le effettive soluzioni, sostituendo ad esso, attraverso una serie di operazioni sulle equazioni del sistema, dette “operazioni elementari ’, un sistema a gradini equivalente. Naturalmente, poiché abbiamo visto che ogni sistem a di equazion i lineari ammette una scrittura in forma matriciale, le operazioni elementari sulle equa zioni del sistema si traducono in operazioni elementari sulle righe della matrice rappresentativa del sistema dato. Sono operazioni elementari: 1. Scambiare tra loro due righe della matrice. 2. Moltiplicare una riga della matrice per uno scalare non nullo. 3. Sostituire a una riga quella ottenuta sommando ad essa un m ultiplo di un'altra riga Sia Ax = b un sistema di m equazioni lineari nelle n incognite x t 2, . . . mostriamo come sia possibile ridurre detto sistema a un sistem a a gradini. Natu ralmente A è matrice di tipo rin.n) e (A b] di tipo (m ,n -f 1). Se A = 0 (matrice nulla), non c'è nulla da fare perché siamo già di fronte a oaa matrice a scala (banalmente). Sia quindi 4 # 0: con eventuali operazioni di tipo 1 , facciamo in modo * compente come prona nga quella in cui i "pivot’ com paiono per primi.
Algebra delle matrici
109
rispetto alla succ essio ne de lle co lonne. Può succedere che la matrice sia già a scala, ma può anche succedere che non lo sia, dal momento che due o più pivot di righe diverse possono essere sulla stessa colonna. Sia a\k il pivot della prim a riga. Allora si calcolano 1 moltiplicatori m, = poi si sottrae alla rig a /-esim a la prima moltiplicata per m, Così tutti gii uìk elementi sotto £/,* so no nulli. Si ripete il pro cedim en to de scr itto a partire dalla seconda riga e così via. il procedimento ha term ine dopo un numero finito di passi, quando le ultime m —r righe della matrice dei coefficienti sono tutte nulle (se è r = n non si presentano righe di zeri). Se anche i term ini noti delle ultime m — r righe sono nulli, il sistema è compatibile, altrimenti è impossibile. Notiamo che , es se nd o le istruzioni sempre le stesse, la procedura può essere implementata. Si noti anche che, se A e M atnxn(K ), sono necessarie al più operazioni sulle righe di A per ridurla a scala. Esempio 8.21
Sia dato il siste ma y + 4 z = 5 X + y - 3 z = - 4 4x +2y + z = - 5
la matrice associata è
1 1 2
" 0 1 [Albi = 4
4 -3 1
5 ' -4 .
Indichiamo con r, (/ = 1.2,3) la riga /-esim a e con c (j = 2.3 1 la colonna j-esima: per avere un elem en to non nullo nella prim a riga e prima colonna, cioè in posizione ( 1, 1), scam biamo r i con ri . Si ottiene ■ 1 0 _ 4 operare la sostituzione riga r 3>. Si ottiene
1 l 2
-3 4 1
-4 " gm 0 -5
colonna ri — 4 r possiam o ' I
0 . 0
1 I
-
—2
3 4 13
-
4 1
5 Il j
Per avere, infine, tutti nulli gli elementi caso sulla rx) sostituiamo alla terza risa. r ì 0
L o
i i 0
-
3 4 21
g — 1«*- —
cbe è in forma diagona le. I “pivo t” sono 1. 1.21
2. J
possiamo I :■>1;
A questo punto è agevole ricavare la soluzione. Infatti il sistema equivalente è = -4 = 5
21
=
e quindi si ricava
- y + 3z - 4 = 5 - 4z = 1 e quindi
Esempio 8.22 Sia dato il sistema 3
-8 2 la matrice associata è
r
[Albi
2
L
-
-
1
1
-
3
7
-
-14 2
7
0 L
~ 2ri. Otteniamo:
2
3
1
*2
1
-
-8 2
3
1
0
2 *4 Effettuiamo la sostituzione seguente: V r
3
2
3 1
1
0
-ì Pur non essendo necessario, può essere utile sostituire alla C2 la riga — C2 ottenen do
Rimane da annullare l’elemento al di sotto del secondo pivot. So stituiamo alla C3 la somma C3 + (-co). Otteniamo la matrice
r L
3
2
1
1
1
1
0
0
0 0
3 1 1|2 1 J 0
in cui la terza riga ha tutti gli elementi nulli. In questo caso i pivot sono 1, 1, il sistema equivalente è
x + 3>' + 2z = 3 y + z ~ 2
Algebra delle matrici
111
e le oc 3 2 soluzioni sono: z = k, y = 2 - k, x = 3 - 2Jc - 3(2 - k) = - 3 + k. ove k parametro reale. Esempio 8.23
Sia dato il siste ma f x + 2 y + 3 z = 6 | 3x +2y + z = 6 ( j + 2z = 6
la matrice associata è " 1 3 [A\b] = 0
2 2 1
2 -4 1
6 " 6 6
f 2 —3rj otteniamo la matrice
Effettuiamo la sostituzione seguente: T 2 " 1 0 0
3 1 2
3
-8 2
6 -1 2 6
sostituiamo alla r 2 l a - ^ r 2 ottenendo " 1 0 0
2 1 1
3 2 2
6 ' 3 6
A questo punto sostituiamo la r 2 con la r 3 —r 2. Questa volta si ha la matrice
1 0 0
2 1 0
3 2 0
6 ' 3 3
alla quale è associato il sistema [ x + 2 v + 3 z = 6 y + 2 z = 3 {
l
0 =6
che è chiaramente non compatibile.
Definizione 8.20 Si chiama rango (o caratteristica) di una matrice A di Matmx„(K) il numero dei pivo t di una riduzione a scala. In ogni caso è rg(A) = r < m m(m,n) Definizione 8.21 Una matrice quadrata A di ordine n si dice non singolare se rg(A) = n. In caso contrario si dice singolare. Si può concludere enunciando:
Capìtolo 8
112
Teorema 8.3 Sìa Ax = b un sistema di m equazioni lineari nelle n incognite ,xlvX2. . . . Il sistema è compatibile se e solo se, posto r = rg (A) ed , (1 <
i
dm = 0
Il sistema è equivalente a un sistema a gr adini c he am m ette oo "~ r solu zioni, che dipendono da n —r parametri arbitrari, se r < n\ se r = n si ha un’unica solu zione, che, nel caso di un sistema omogeneo, sempre compatibile, è la soluzione banale. Teorema8.4
(Cramer ) Se A e Matmxn(K), il sistema Ax =
b ammette l!
(una e una sola) soluzione se e solo se la matrice A è non singolare. Esercizio 8.7 Determinare il rango delle seguenti matrici:
2 10 1.
10 1 3 11 " 2 -1 1 3
0 3" 10 11 14
2 0 -3 -1 1 1
8.4.1 Algoritmo e calco lo della mat ri c e in v ers a Abbiamo introdotto nel Paragrafo 8.1.4 il concetto di matrice inversa di una ma trice A quadrata di ordine n; abbiamo dimostrato la sua unicità, ma era rimasto aperto il problema della sua esistenza, problema al quale siamo o ra in grado di dare una risposta. Proposizione 8.7 Data una matrice A e Mat nxn(R), essa è invertibile se e solo se esiste un’unica inversa destra, cioè un’unica matrice X tale che sia A X = /„. Dimostrazione. Banalmente, se la matrice A è invertibile, per definizione, l’in versa destra è unica. Viceversa, se esiste un’unica inversa destra, si ha AX = /„ e quindi AX — ln — 0. Da qui, moltiplicando a destra per A e applicando le prop rietà distributive, si ottiene
(AX - ln)A = AXA - InA = A( XA - /„) = 0 Quindi /„ = AX + 0 = AX + A(XA - /„) = A( X + XA - /„),
Algebra delle matrici
113
L’ipotesi di unicità dell’inversa destra implica che X = X + XA - I„ da cui si ottiene XA = /„. Quindi la matrice A è invertibile. ■ Ora, indicati con Xj, x2, . . . ,x„ i vettori colo nna della matrice X , risolvere il siste ma AX = In è equivalente a risolvere gli n sistemi di equazioni seguenti Axj = e 1? A x 2 = e2, . . . ,Ax„ = e„ ove gli e, sono vettori di R" della forma e, = (0,0......... L ... 0 )7, cioè i vettori con la componente ¿-esim a ug uale a 1 e tutte le altre uguali a 0. Ciascun sistema è risolubile e ammette una e una sola soluzione se e solo se la matrice A è non singolare. Si può quindi enunciare la seguente Proposizione 8.8 non singolare.
Una matrice A e Matnxn (R) è invertibile se e solo se A è
Per trovare la matrice inversa di una matrice (non singolare) data, si può procedere con il metodo di elim inazio ne di Gauss. Poiché i sistem i devono essere verifica ti contemporaneamente, costruiamo la matrice [A|/„} con n righe e 2n colonne, ottenuta affiancando ad A la matrice identica /„. Operando con le operazioni ele mentari sulle righe (con il procedimento visto, dall’alto verso il basso) si ottiene un sistema equivalente in cui la matrice dei coefficienti è triangolare superiore ( T ) e ì termini noti sono i vettori colonna della matrice B. Con un procedimento di riduzione, che procede dal basso verso l’alto, si riduce la matrice dei coefficienti a forma diagonale D. A questo punto, basta sostituire a ogni riga la stessa divisa per il corrispondente pivot, per avere a sinistra la matrice identica e a destra la matrice inversa della matrice A di partenza. Il procedimento descritto è sintetizzato nel seguente schema (e g j indica che si utilizza il procedimento di riduzione di Gauss dall’alto in basso, e analogamente perEG t) . [A|/]
[T\B]
[In\A-'}
Esempio 8.24 Ca lcolare la matrice inversa della matrice
0 1“ 1 0 0 -1 Costruiamo la matrice [A\I^] e seguiamo il procedimento indicato sopra. r ì Wh] =
0
_ 5 ■ 1 tri«] = L
0
1
1
0
1
0
0
1
0
0
0
1
0 0
0
1
0
0
-1 1
1
0
0
-6
-5
0 1
0
0
1
0
0
1
—
/
r-
1
[D\C] =
ih\AÌ =
Esercizio 8.8
1 2 6
1
0 0
0
o
6
0
0 -5
o 1 0 - 6
1
0
0
1 6
0
1
0
0
1
0
0
1
5 6
0
0
1 0
— >
0 1 1 1 — 6 0 1 6 -
Calcolare la matrice inversa di
D =
"1 0 01 0 2 0 LO 0 3_
ri 0 0~ K = 0 2 0 Li 4 3
T
-
r i o i i 0 2 4 _0 0 3_
S
' 1 0 41 0 2 1 4 1 3
9 Gruppi
“Se la matem atica è la regina delle scienze allora l’algebra è il gioiello della sua corona”
Ritornando al concetto di struttura algebrica introdotto nel Capitolo 7, cominciamo con raccostarci alle strutture d otate di un a s ola op eraz ion e, fissand o in pa rticolare l’attenzione su semigruppi e monoidi per pervenire, infine, alla nozione di gruppo.
Definizione 9.1 Si definisce s e m ig r u p p o una struttura algebrica (£,★ ), ove * è operazione associativa su S . Esempio 9.1 Denotato con N* l’insieme dei numeri naturali diversi da zero, allora è un semigrupp o. Definizione 9.2 Sia (5,*) un semigruppo e a e S. Per ogni n > 0 si definisce la potenza n-esima di a ponendo 1 a — a, <
a" = an~l ★ a,
Wn > 1.
Osservazione 9.1 In notazion e add itiva invece è na = (n — \) a + a ,V /2 > l e si parla di multiplo n — esimo di a. Proposizione 9.1
Sia ( S,m) un semigruppo, a e S ed m ,n interi positivi; allora:
i) an • am = an+m ii) (■ an)m = a nm• Dimostrazione, i) Procediamo per induzione su n lasciando fisso m ed osservando che P(n) : an • am = an+m. P(l) è vera, infatti a 1• a m — a x+m,
Supponendo vero P{n - 1) per n > 2, cioè che valga 1‘uguaglianza a"- 1 . am = an~ì+m = an+m~l dimostriamo P{n). Infatti a •a « •
= (a • an ') ‘dm = a • (a" 1 • a m)
1 = a n+m
per ipotesi induttiva
La dimostrazione di il) è lasciata come esercizio al letto re. ■
Proposizione 9.2 Sia (S,*) un semigruppo, a,b e S e a • b = b • a , allora è: i) a*bn
=
bn*a
ii) (a • b)" = a '1 • b". Dimostrazione. Procediamo per induzione su n in entrambi i casi. i) La proprietà da dimostrare è P{n) : a •b" = bn *a e P ( l ) è vera per ipotesi. Supponiamo vera P{n — 1) per n > 2, cioè supponiam o che che sia vera Puguaglianza a • bn~x = bn~l *a e dimostriamo P(/z): a 9bn = a • b n~ì • b
=
bn~l • a • b=bn~l • b • a = bn • a.
per ipotesi induttiva
ii) La proprietà da dimostrare è P(n) : (a • b)n = an • bn. Ora P{\) è vera in quanto (a • b) 1 = a1• b l. Supponiamo l’asserto vero per n - 1, (n > 2), e dimostriamolo per n: (a• b)n= (a• b)n
=
a” [*bn l* a * b = a n '•(/?'
'»a)-/?
per ipotesi induttiva
e utilizzando il punto i) si ottiene che an 1 • a • bn 1 • b = a" • b".m Definizione 9.3 Si dice monoide un semigruppo (M ,★) dotato di umici. In altre parole un monoide è un insieme M dotato di un ’operazione ★ associativa in cui esiste un elemento 1m tuie che \ M-ka — a * \ m = a, Va e M.
Esempio 9.2 (N,+) è un monoide ove il numero zero è l ’unità; (Z,-) è un mo noide ove il numero uno è l’unità; ( X x,•), l’insieme di tutte le applicazioni su un insieme X, è un monoide ove l’applicazione identica Ix è l’unità.
Gruppi
117
Siamo, ora, pronti pe r introdu rre il conc etto di gruppo, concetto che ha importanza non solo per sé ma a nc he in relazion e ad altre strutture quali anelli campi spa/i vettonali, che introdurremo in seguito. Definizione 9.4 Sia G un insieme in cui è stata introdotta la legge di composi zione binaria, indicata con -, (G,-) è un gruppo se: 1. Voperazione è associativa, cioè (a - b) ■ c = a • (b • c), V a, b, c € G
2. esiste un elemento 1g , (detto elemento neutro *) tale che
a • 1g = 1g '
£ G.
esiste un elemento sim metrico 2 per ogni elemento di G, cioè 'ia € G, 3* e G tale che a ■ x = x •a = 1e In altre parole un gruppo è un monoide in cui ogni elemento è invertibile. Esempio 9.3 1. L’insieme Z deg li interi relativi è un gruppo rispetto all’usuale operazione di somma, ove l’elem ento neutro è il nume ro 0 e il simmetrico di a e Z è l’opposto —a. 2. Analogamente (Q ,+ ) e (R ,+ ) sono gruppi. 3. L’insieme R +dei num eri reali positivi è gruppo rispetto all’usuale prodotto ove l’elemento neutro è il numero 1 e il simmetrico d ia e R + è l’inverso a- = i . a
a b a,b,c,d € R, ad —bc ^ 0 } è un gruppo ric d spetto all’usuale prodotto righe per colonne (definito nel Capitolo 8); Tele
4. L’insieme GL2(K) =
mento neutro è l’unità G =
a b c d
* ^ ' e ogni matrice è invertibile essendo 0 1 i
1 _ _
1
1 -
-
ad —bc —c a
L’insieme Z„ delle classi di resti modulo n è gruppo rispetto all’operazione di somma di classi ove la classe [0 ]„ è l’elemento neutro e l’opposto di [a]n è [ tj]n.
'Al variare della notazion e, l’elem ento neutro può essere detto zero oppure unità 'Al variare della notazione re lcm en to simm etrico è detto anche inverso oppure opposto
118
Capriolo 9
6. L'insieme delle applicazioni bijettive di un insiem e X su se stesso ( X x) è gruppo rispetto al prodotto di applicazioni; l x : X — > X è V unità e Y inversa di / : X — ► X è l’applicazione inversa / -1 : X — > X a suo tempo definita (confronta 4.23). Definizione 9.5 Un gruppo (G, ) si dice comm utativo (o abeliano 3)se per ogni a,b e G si ha ab = ba. Naturalmente sé |G | = n, il gruppo si dice finito, in caso co ntrario si dirà infinito. I gruppi presentati nei punti 1, 2, 3, 5 del precedente esempio sono commu tativi, mentre quelli dei punti 4 e 6 non lo sono. 1 gruppi dei punti 1, 2, 3, 4 sono esempi di gruppi infiniti mentre al punto 5 si danno esempi di gruppi finiti, (al variare di n con n > 1, si ottengono infiniti gruppi finiti tutti diversi). La formalizzazione del concetto di gruppo ha richiesto il contributo di alcune generazioni di matematici: si comincia a tracciare nel contesto della teoria delle equazioni algebriche grazie a Lagrange, Ruffini e Abel fino ad arrivare a Galois nei cui lavori vengono per la prima volta usati esplicitam ente il concetto e il nome gruppo (1830). Per altre ragioni, la nozione di gruppo si afferma in geometria verso la metà dell’ottocento. Nel programma di Erlangen, F. K lein (1872) propose l’idea di gruppo di trasformazioni come base per classificare geom etrie. Ancora, nell'ambito della Teona dei numeri, ricordiamo i contributi di Eulero e di Gauss. Attualmente la teona dei Gruppi è una delle branche più sviluppate dell’Algebra e ha applicazioni in cristallografia, in meccanica quantistica e in vari altri contesti. Definizione 9.6 Sia (G ,•) un gruppo e g un suo elemento: si può definire indut tivamente la potenza n-esima di g,Vn e Z, ponendo:
1. g° = lc 2. g" = (g,,_1) •
Vn > 0
3. gn = ( g- lr \ V n < 0 Analogamente a quanto fatto per i semigruppi si possono dimostrare alcune pro prietà. Proposizione 9.3 Sia (G,-) un gruppo, g e G e n,m e Z. Allora 1.
g" . g* =
gn+m
2. ( g T = gnm Inoltre, se a,b e G e ab = ba, vale l ’uguaglianza (ab )" = anbn.
Si lascia al lettore la dimostrazione, che è l’estensione al caso degli esponenti negativi dei punti 1) e 2) della Proposizione 9.1. 311termine “abeliano” deriva dal nome del matematico norvegese Niels Henrik Abel ( 1802-1829)
Gruppt
Osservazione 9.2 Infatti:
Sia (G,-) un gruppo, per ogni a,b e G è (ab)
{ab)(b la ì) = a ( b b l)a l = a l c ci
9.1
=aa
= b
119
a
= ] G.
Sottogruppi
Passiamo ora a trattare particolari sottostrutture di (G.-), dette sottogruppi, ovvero consideriamo quei sottoinsiemi H (non vuoti) di G, che risultano essere gruppi rispetto alla medes ima legge di c om po sizio ne definita in G. Definizione 9.7 Sia (G,*) un gruppo e H un suo sottoinsieme (non vuoto). H è un sottogruppo se (e solo se) sono verificate le seguenti condizioni: i) Va, b e H ==>■ ab e H (pr op rietà di chiu sura rispetto all’operazione): ii) \G e H (l’elemento neutro di G appartiene al sottoinsieme H)\ iii) Va e H ==> a~l e H (l’inverso di ogni elemento di H sta in H).
Per indicare brevemente che un sottoinsieme H è un sottogruppo di un gruppo G. useremo la notazione H < G. Naturalmente ogni gr up po G ha alm eno du e sottogruppi G stesso e il sottogrup po {le} costituito dal solo ele m ento neutro (che sono detti sottogruppi impropri). Inoltre un sottogruppo non può mai essere un insieme vuoto, poiché deve posse dere almeno l’elemento neutro rispetto all’operazione definita in G. Esempio 9.4
1. Sia (Z ,+ ) il grup po additivo degli interi relativi; l ’insieme 2Z dei numeri pari è un sottogruppo di (Z,+). Infatti V 2z i , 2z 2 € 2Z si ha che 2zi -f 2 zi = 2 (z i + Z2) € 2Z; inoltre 0 € Z e -2zi €Z.
2. Nel gruppo additivo (Z 6,+ ) delle classi di resti modulo 6 si consideri il sot toinsieme H = {[0]6,[2]6, [4]6}: verifichiam o che H è sottogruppo di (Z 6,+). Infatti la tavola di com posiz ione di ( / / , + ) è
+ [0]6 [2]6 [4] 6
[0]6 [016 [2] 6 [4]6
[2]6 [2]6 [416 [0]6
[4]6 [41e [0]6 [2]6
Si verifica direttamente che H è chiuso rispetto all’operazione di somma, che la classe [0]6 è l’elemento neutro e che l’opposto della classe [ 2]6 è [4]ó mentre l’opposto della classe [4]é è la classe [2 ]6 (entrambe in H). Diamo ora un criterio che consenta di verificare se un sottoinsieme H un gruppo (G,-) è un suo sottogruppo, senza ricorrere alla definizione.
0 di
0 ). All or a (//,-) è un sottogruppo di (G,-) se e solo se V a,b e H si ha a • ¿>-1 e H.
Proposizione 9.4 Sia (G, •) un gruppo e sia H un suo sottoinsieme
Dimostrazione. Sìa H un sottogruppo di (G,-)- Allora V a,b e H =$ b~l e H per il punto iii) della Definizione 9.7. Per il punto i) si conclud e che a •b~l e H.
Viceversa, per ogni a,b e H sia a • b~{ e H. Allora, se consideriamo b - a otteniamo che a-a “ 1 e H e quindi le G H (ed è verificata la ii) della definizione). Poiché \ g e H, Vb e H si ha che 1G • b~l = b~l e H ed è verificata la iii), Infine, poiché b~{ e H ed a e H segue a • (¿>-1 )-1 = a •b e H ed è quindi anche verificata la i). Si conclude he H è un sottogruppo. ■
Esercizio 9.1
Sia H = |
q
| a e R .Verificare che H è un sottogruppo di
GZ,2(R ).4 H è commutativo? Esercizio 9.2 Dato un gruppo abeliano G e un intero n > 1, si consideri il
sottoinsieme K = {a e G | a" = 1G} e si mostri che K è un sottogruppo di G.
9.2 Gruppi di permutazioni Nel Capitolo 4, abbiamo introdotto il concetto di applicazione bijettiva su un in sieme X e abbiamo osservato che il prodotto (o composizione) di applicazioni bijettive è ancora un’applicazione bijettiva. Anzi, trattando il concetto di gruppo abbiamo sottolineato (9.3.6, in esempi di gruppi) che l’insieme X xdelle appli cazioni bijettive di un insieme X su se stesso è gruppo rispetto al prodotto di applicazioni e viene usualmente indicato come gruppo di trasformazioni su X. Trattiamo, ora, il caso in cui IX1= n. Allora il gruppo X x è di solito indicato con S„, ha ordine n\ ed è detto gruppo di permutazioni su n oggetti o gruppo simmetrico su n oggetti. Indicati con 1,2,3, . . . n gli elementi delTinsieme X, data la natura degli og getti di S n, una possibile notazione per una trasformazione a e Sn è la seguente _ / 1 ° ~ \cr(l)
2 3 .... n 7 (3) . . . . o{n) 2) <
ove nella seconda riga compaiono una ed una sola volta gli interi 1, 2,3 ___ n, che rappresentano le immagini degli elementi elencati nella prima riga.
4Vedi Esempio 9 3.4
Gruppi
Esempio 9.5
121
Se n = 3, gli elementi di S 3 sono 6 = 3! = 3 • 2 • 1 e precisamente: =
1 2 3 12 3
^2
1 2 3 2 3 1
cr 3 =
1 2 3 3 1 2
rr 4 =
12 3 13 2
or 6 =
1 2 3 2 13
/
1 2 3 3 2 1
05
La tavola di composizione di (£ 3,*) è •
I
I I cr 2
v2 V 3 v2 V 3
v3
or4 cr4
V 3 I V 5
5 cr
V 5
ve
ve
ve
V 4
I V 2 Ve cr4 ^5
v4 V 5 v4 V 5 v6 V 4 V 5 ve I v2
V 3
V 3
v2
v2
I V 3
ve ve V 5
v4 I
Fissiamo, ora, l’attenzione su particolari permutazioni.
Sia k < n: un ciclo di lun ghezza k è una permutazione a e S„ che permuta ciclicamente k elementi dell'insieme X = {1,2,3,......... /i} e lascia fissi i restanti n — k elementi. Più precisamente, supponiamo che esista un sot toinsieme X = {ai,¿12, . . . ,ak} Q X , tale che Definizione 9.8
<7(a,) = a,+\ cr(ak) = ai;
V / =
1 , 2 ,3
— 1);
cr(b) = b ,V b e X \ X allora indichiamo il ciclo nella forma a, non vengono indicati). Osservazione 9.3
0
= {ci\a2 . . . ak), (gli elementi fissati da
Un ciclo di lun gh ezz a k si può scrivere in k modi, cioè
{a[02. ■. ak) = (¿Z2CÌ3 . . . aka\) = (a a$ .. . a\02) = 3
Esempio 9.6
ziom (7 =
. . = (aka\
... ak~\).
In S4, gruppo simmetrico su 4 oggetti, consideriamo le trasforma _ / 1 2 3 4 12 3 4\
2 3 1 4 j e T - U 341 La a è un ciclo di lunghezza 3 (o 3-ciclo) ed è solitamente indicata nella forma (123) (la lettera 4 fissata no n vien e scritta!) , mentre la r è un ciclo di lunghezza 4, indicato di solito nella forma (1234).
Osservazione 9.4 I cicli di lunghezza 2 sono detti scambi o trasposizioni per / 12 3\ esempio: a 4 = I ^ 0 ) e S 3 è uno scambio e viene indicato nella forma (23). L’identità è considerata un ciclo di lunghezza 1.
122
Capitolo 9
Definizione 9.9 Due cid i si dicono d is g iu n ti se operano su insiemi disgiunti di lettere. È immediato provare, come conseguenza della precedente definizione, che vale la
Proposizione 9.5 Se oq.co sono due cicli disgiunti di Sn, allora o\ ■ cr: = 02 •a\. Ciò è falso, in generale, se cri,C 2 non sono cicli disgiunti, come provato dal seguente:
Esempio 9.7 Siano
12 3 2 13 = (23),
, <*2 =
12 3 2 3
mentre
07 • 05 =
G S 3 . Allora:
12 3 3 2 1
= (13)
Osserviamo, ora, che i cicli disgiunti possono essere considerati componenti base per una generica permutazione, nel senso precisato dal seguente teorema, del quale omettiamo la dimostrazione.
Teorema 9.1 Ogni permutazione di Sn o è un ciclo o si può scrivere come pro dotto di cicli disgiunti e tale scrittura è unica a meno dell’ordine dei fattori . Esempio 9.8 Sia a —
1234567 2315476
12 3 \ 45 23 1*15 4
G Si- Allora
* l ) = (123)(45)(67).
Tra i cicli un ruolo notevole, ai fini che preciseremo in seguito, è giocato dagli scambi. Infatti
Teorema 9.2 Ogni permutazione può essere scritta come prodotto dì trasposi zioni 0 scambi.
Esempio 9.9 Riprendiamo 0 e S 7 dell’esempio precedente e lo scaviamo come prodotto di scambi: a — (13)(12)(45)(67). In generale un ciclo 0 — ia\a-i . . . a d si può scrivere nella forma 0 = ( a ii if c ) (a i a 4 _ i ) - * - ( a i £ * ù -
Osserviamo che nella scrittura di una permutazione come prodotto di scambi si perde Tunicità: verifichi, il lettore, che, sempre riferendosi alla o € Sn degli esempi precedenti, è: a — (13)(12)(45)(67) = (13)(12)(67)(23)(4S)(32). In ogni caso ciò che rimane inalterato è la parità del numero di scambi in cui una permutazione si decompone. Definizione 9.19 Una permutazione a € S„ si dice pari
3ruppi
123
1. La permutazione identica I £ Sn è una perm utazione p a n 2. Se o £ Sn è par i anche a ~ 1 è pari . 3. La composizione di p er muta zioni p ari dà luogo ad una permutazione pan infatti se o si decompone in 2 k scambi e r si decompone in Ih scambi allora a • x si decompone in 2 k + 2 h = 2 {k + h) scambi. Pertanto i punti 1,2,3 dell’osservazione precedente ci permettono di enunciare il seguente Teorema 9.3 L'insieme delle perm utazion i p a n di Sn è un sottogruppo denotato n con An e detto (sotto) grup po alterno. Esso ha ordine Esempio 9.10 In S 3 l’insieme delle sostituzioni pari è costituito da L 0 2 ,cr? e la tavola di composizione di A 3 è •
I
I
o 2
03
I
02
03
O 3
I
I
02
02 cr 3
Esercizio 9.3
03
De term inare le so stituz ion i pari di S 4.
Esercizio 9.4 Si consideri l'insieme X = {1,2,3,4,5.6 7} e la permutazione a su X così definita:
a =
1 2 3 4 5 6 7 3 4 1 2 6 7 5
1* Si decomponga a nel prodotto di cicli disgiunti; 2. Si dica se a è una sostituzione par i oppure d ispari; 3* Si indichi l'immagine di 6 tramite la permutazione a. Esercizio 9.5
Considerate le seguenti permutazioni di 5V
o
/ 12 3 4 5\ / 1 2 3 44 5 \ \\ 3 5 2 1 4 fi/ * y _ \\ 2 L 3 5 4 ) s<-dica se le seguenti affermazioni sono vere oppure false: *■* & ha periodo 5 ; y 1 = y ;
3.
= y -
4L ai' <*■'=1124 3 5 IL
124
Capìtolo 9
9.3 Equivalenze in un gru p p o Sia (G,*) un gruppo e H un suo sottogruppo. Definiamo in G una relazione 1l H ponendo x H Hy
x • y -1 e H.
Mostriamo che H è una relazione di equivalenza. Infatti:
a) TIh è riflessiva perché Vx G G è x1ZHx, in quanto x x ~ l = l g G b) Considerati due elementi x ,y G G , tali che x'R ny* allora x y _l g H e quindi anche (xy-1)“1 = yx -1 e //, essendo H un sottogruppo. Si ottien e quindi che y'Rtfjt e pertanto 1 Z h è una relazione sim metrica. c) Vale la proprietà transitiva: infatti se x U h y e yLZnZ (x,y,z G G) allora Infatti per ipotesi xy -1 e yz _1 e //, quindi, poiché He un sottogruppo, si ha che (xy_ 1yz_1) = xz _1 G H, da cui si ottiene ch e x 71h Z. Si può quindi concludere che la 1ZH è una relazione di equivalenza in G. Osservazione 9.5 Vx e G, la classe di equiv alenza individuata da x e indicata con [ x \n H coincide con Tinsieme {hx\ h G H ) . Infatti, se y € [ x ] j i h è y'RtfX, cioè y x -1 e H, quindi 3/7 e H tale che yx -1 = h. Moltiplicando membro a membro a destra per x si ottiene y = hx, da cui segue che [ x ^ C {hx\ h g H). Viceversa sia z G {hx | h g H}; allora 3 h tale che z = hx da cui, moltiplican do membro a membro a destra per x _1, si ottiene zx _1 = h e H. Da qui segue che ziZ h x ovvero z G [x]^,, e quindi {hx | h g H) c [ x ] ^ w. Questo ci permette di concludere che [x ]^ 7/ = {/ix| h G H). Definizione 9.11 La classe di equivalenza [x]ftH „vz c/zc^ laterale destro di H in G individuato da x e lo si denota usualmente con il simbolo H x. Osservazione 9.6 Trattandosi di classi di equivalenza, i laterali destri di // in G sono disgiunti, H coincide con il laterale destro individuato da uno qualsiasi dei suoi elementi (per esempio H • \ q = H). Dalla definizione segue anche che Hx = Hy xy -1 G H ovvero, con altra scrittura, x = y (m o d //) . Osservazione 9.7 Se l’operazione definita in G è denotata additivam ente, cioè se abbiamo il gruppo (G,+), il laterale destro di H in G, individuato da x è H + x = {h + x | h G H }.
Verifichi il lettore che, dato un gruppo (G,*) e un suo sottogruppo H è possibile definire un’altra relazione ponendo xC H y <=>• x ~ ly € H. Tale relazione risulta ancora di equivalenza e le sue classi, dette laterali sinistri di H in G, sono così descritte [x]cH- x H — {xh\ h € H)
ove x è l’elemento di G che individua la classe.
Gruppi
Osservazione 9.8
125
In generale i laterali destri non coincidono cori i sinistri.
Esempio 9.11 In S 3 consideriamo il sottogruppo H = { /, ( 12)}: ì laterali sinistri di H in G sono H = { / , ( 12)} , (1 3 )// = {(13),(13)(12) = (123)}, (2 3 )// = {(23), (23) (12) = (132)}
mentre i laterali destri sono H = { / ,( 12 )} , H (13) = {( 13), ( 12) ( 13) = (13 2)} , H (23) = {(23), (12) (23) = (123)}. Proposizione 9.6 Sia (G,-) un gru ppo e sia H un suo sottogruppo. Per ogni x e G si ha che gli insiemi x H , H x , H sono equipotenti \ Dimostrazione. Per mostrare l ’equ ipotenz a dei due insiemi H x e H basta consi derare l’applicazione / : H — >- H x definita ponendo f ( h ) = hx , Vh e H La suriettività di / è gara ntita pe r costruzio ne: infatti gli elementi di Hx sono del tipo hx e quindi una preimm agine per la / dell’elemento hx è h (poiché f(h) = hx). Per l’iniettività, basta osservare che se h / k e /(/z) = f ( k ) si ha hx = kx, da cui, moltiplicando membro a membro a destra per x ~ [ si deduce h = k, assurdo. In modo analogo si prova che x H e H sono equipotenti. ■
Osserviamo che, nel caso finito, si ha che, nelle ipotesi del teorema precedente, la tesi si esprime nella forma: \xH\ = | / / x | = \H\. Teorema 9.4 (noto come Teorema di Lagrange) 6 Sia (G,-) un gruppo finito e H un sottogruppo di G. Allora \H \ divide |G|. Dimostrazione. Siano Hg\ , H g 2, . . . , H g n i laterali destri distinti di H in G; poiché {//gì, Hg 2 , • ♦• , H g r } costitu isce una partizione di G si ha:
|G | = | / / g i | + | / / g 2| + - . . + | // g . | . Per il teorema precedente si ha che | Hg, | = \H\ e quindi si può concludere che |G| = r\H\ da cui segue la tesi, cioè che \H \ divide |G|. ■ Definizione 9.12 Una relazione di equivalenza 7Z definita su un gruppo (G.o) si dice compatibile a sinistra con Voperazione o se Vg{, g 2 € G tali che g ì Rgi si ha che a o g\Ra o g2, Va e G. Analogamente si parla di compatibilità a destra, se gj o a1Zg2 o a, Va e G. Definizione 9.13 Una relazione di equivalenza R definita su un gruppo (G o) si dice compatibile con V operazione o se Vgl , g2, x \ , x 2 e G tali che g{Rgi, <’ X\R x 2 si ha gì o x \R g 2 o x 2.
sSi ricorda che due insiemi X e Y si dicono equipotenti se esiste una applicazione biunivoca da X a Y 6Joscph Louis Lagrange (1736 Torino - 1813 Parigi).
126
Capitolo 9
Definizione 9.14 Una relazione di equivalenza in (G,o) si dice congruenza se è compatibile con l'operazione o del gruppo. Proposizione 9.7 Sia (G,-) un gruppo. Una relazione di equivalenza 11 in G è una congruenza se e solo se esiste un sottogruppo H di G tale che 71 = 7 I h = Definizione 9.15 Dato un gruppo (G,*)> un sottogruppo H di G si dice normale in G, e si scrive H < G se 71h = C r (e quindi se i laterali destri e sinistri di H in G coincidono). Esempio 9.12
1. In un gruppo abeliano tutti i sottogrup pi sono norm ali. 2. In un gruppo G qualsiasi, G stesso e il sottogruppo {le} sono sottogruppi normali.
3. Dato il gruppo di sostituzioni S n , il sottogruppo A„ delle sostituzioni pari è normale in Sn.
9.4 Sottogruppo generato da un so tto in s iem e. Sottogruppi ciclici Proposizione 9.8 Dati due sottogruppi H e K di (G,-)> è un sottogruppo di G.
fi
Dimostrazione. Siano h,k e H n K\ allora h,k e H. che è un sottogruppo di G e quindi hk~l e H; inoltre h, k G K, che è ancora un sottogruppo di G e quindi hk~l e K. Pertanto hk~l e H Pi K e quindi, per la Proposizione 9.4, H fi K è un sottogruppo di G . ■ Osservazione 9.9 Se consideriamo una collezione di sottogruppi Ht di G, con i € /, si può dimostrare che f ] H , è un sottogruppo di G. (La dimostrazione è ie /
lasciata per esercizio).
Osservazione 9.10 In generale, dati due sottogruppi H e K di (G, ), il sottoin sieme H U K non è un sottogruppo di G . Infatti, consideriamo H = {7,(12)}, K = {/,(13)> sottogruppi di S3: la loro unione insiemistica H U K = {/, ( 12), ( 13)} non è un sottogruppo di G perché HDK non è chiuso rispetto all’operazione, in quanto (12)(13 ) = (132) ^ HU K Definizione 9.16 Sia A un sottoinsieme non vuoto di un gruppo G. L ’interse zione di tutti i sottogruppi di G che contengono A, è un sottogruppo di G detto sottogruppo generato dal sottoinsieme A e viene indicato con il simbolo {A). Esso è il minimo sottogruppo di G contenente A, ovvero sono soddisfatte le con dizioni:
Gruppi
1.
a c
127
(a );
2. (A) è contenuto in ogni sottogrup po d i G con tenen te A . Osservazione 9.11
L’insieme A viene detto insieme di generatori per (A).
Osservazione 9.12 assumere A = G.
Ogni gruppo G ha almeno un insieme di generatori, basta
Teorema 9.5 II sottogruppo (A ) è c ostitu ito da tutti g li ele m enti di G es prim ibili come prodotto di un numero fin ito di ele m en ti di A e di inve rsi di e lem en ti di A . In simboli {A) = |
\r > Lfl, € A, Si = ± \ | .
Definizione 9.17 Se A = {ci} => (A) = {a " \n e Z ] = (a). Il sottogruppo (a) prende il nome di sotto gruppo ciclico generato da a. Se po i G = {a) allora G è detto gruppo ciclico. Esempio 9.13
Sono ciclici i seguenti gruppi:
1. (Z,+) ed è generato da l o d a — 1 , cioè Z = ( 1) = (— 1), 2. (ZB,+) = ([l ]n). 3. In 54 il sottogruppo H = {7,(1234), (13 )(24 ), (1432)} è ciclico ed è generato da (1234), cioè H = <(1234)). 4. Nel campo complesso (C,-) il so tto in siem e U = {1, — l,i , — /} è ciclico ge nerato d a/ ( o d a —/). Definizione 9.18 Dati due so ttog ru pp i H, K di un gruppo G, si definisce un ione (gruppale) di H e K, il sottogruppo generato dall’unione insiemistica di H e À . In altri termini, l ’unione gruppale di H e K è l ’in te rs ezio ne d i tutti i sottogru ppi di G che contengono sia H che K. Tale sottogruppo può essere indicato sia con la scrittura H U K, se non c ’è rischio di con fond ere union e grup pa le con unione insiemistica, oppure con la scrittura {H , K ).
Abbiamo visto nell’Osservazione 9.10 che l’unione insiemistica dei sottogruppi H = (7,(12)} e K — (7,(13)} di S 3 non è un sottogrup po di £3 Invece l’unione gruppale H U K — (7, (12 ), (13),(23),(123),(132)} = S 3 è un gruppo. Esempio9.14
Osservazione 9.13 Dati due sottogruppi H e K di un siemistica di H e K coincide con l’unione gruppale se e KCH. Esercizio 9.6
gruppo G, l'unione in solo se H c A" opp ure
Dati i sottogruppi di Z H = (2 h 1 h e Z}
e
determinare i sottogruppi H U K e H n K .
K = (3* | k € Z}
128
Capitolo 9
9.4.1 Proprietà dei gruppi ciclici Ogni sottogruppo di un gruppo ciclico {finito o infinito ) è ancora un gruppo ciclico.
Teorema 9.6
Sia G = (a) e sia H un sottogruppo di G , H {1G}(altrimenti H = (1 g ))- Essendo G ciclico, ogni elemento di H si potrà scrivere come potenza di a. Consideriamo l’insieme degli elementi di H che si possono esprimere come potenze a esponente positivo di a. Questo insieme non è vuoto poiché, essendo H t \ -1 a £ H con —t > 0. un sottogruppo, se af £ H, con t < 0 =>• {a1) Tra gli elementi di H con esponente positivo, consideriamo quello con l’espo nente minimo: diciamo a k. Sia ora a s un generico elemento di H, s ^ 0, Mostriamo che as è potenza di ak. Infatti, dividiamo s per k : si ottiene: s — k q r con 0 < r < k. Se fosse r / 0, avremmo a 5 — a kq+r — a kq • a ’ = {ak)q • ar e quindi aT — a s •[(afc)9] 1 e H, contro la minimalità di r. Si deduce che r = 0, e quindi as =. (ak)q e pertanto si conclude che H = [ak). Dimostrazione.
Ogni sottogruppo proprio H di un gruppo ciclico G è costi tuito dalle potenze di un elemento or, ove a è un generatore di G e k un opportuno intero diverso da 0, -f 1 e —1, cioè si ha:
Osservazione 9.14
H = {ak , a 2k,a~ 2k,a3k,a 3k
•
♦
•
}.
Esempio 9.15
1. Consideriamo il gruppo (Z,+) : si ha che il sottogruppo generato dal numero 2è2Z = {0 ,± 2, ±4 ,. .. , ± 2 n } = (2). 2. Consideriamo la sostituzione or dell’Esempio 9.8. Il sottogruppo ciclico ge nerato da a è : H — (o) — {o — o 5 = ( 1 2 3 ) ( 4 5 ) (6 7 ) , a ct3
= cr = (45)(67), (T4 = a - 2 = (123), ~
3
=
(7
= 032),
= a “ 1= (132)(45)(67), a6= /|.
9.4.2 Periodo di un elemento di un gruppo Definizione 9.19 Sia a un elemento di un gruppo (G, •)• Se (a ) è finito di ordine n, si dice che l’elemento a ha periodo (o ordine) n e si scrive o{a) = n. Se {a) è infinito, si dice che a ha periodo infinito. Osservazione 9.15
1* o(a) = 1 4» a = 1G. 2. o(a) = o{a~]).
Gruppi
129
Esempio 9.16 1.
Sia (Z3,+ ) = {[0 ] 3,[1] 3,[2]3}, allora o([ 1]3) - o([ 2]3) = 3 . (Notabene che [2 ]3 = —[1]3).
2.
Considerata a = (123)(45)(67) e 57 , si ha (cr) = 6 ,
3.
In (E*,-) gli unici elem enti di periodo finito sono 1 e - 1 ed è o(\) = 1 o (— 1) = 2 .
4.
In (Z ,+ ), (Q ,+ ), (M ,+ ), (C ,-f ) ogni elemento non nullo ha periodo infinito.
Sia G un gruppo e a un suo elemento, valgono le seguenti pro
Teorema 9.7 prietà:
1.
Se a ha periodo fin ito n, allora n è il minimo intero positivo per cui an = \ c Inoltre si ha che: i) ii)
2.
gli elementi distinti di (a) sono 1G = a°,a,a2. .. an~l a 1 = am
l = m(modrt)-
Se o{a) — co allora le potenze di a sono a due a due distinte.
Tralasciamo la dim ostr azio ne, che po trà even tualmen te essere svolta per esercizio.
Proposizione 9.9 Sia a e G. A llora, se o(a) = oo =» o{ak) = c».Vifc e Z \{ 0 } . Per assurdo sia o(ak) = r < oo. A llora (ak)r = akr = 1G da cui seguirebbe o{a) < oo, una contraddizione. Proposizione 9.10 n
Siano a e
G, k e Z \ {0}: se o(a) = n => o(ak) =
mc d (k,n)'
Poniamo d = m c d (k,rì). Allora 3 A:',/?' € Z tali che k = dk\ n = dn . Dimostriamo dapp rima che o{a d) = n'. Infatti (ad)n = a" = 1G => o(ad) = m < n . Inoltre, da (ad)m = adm — 1G segue che o{a ) — n — dn < dm => n' < m. Questo implica che n = m. Verifichiamo ora che M
=(«*>•
Infatti si ha che
a* = a" ' = (a')*' 6 Viceversa, poi ché 3
ad = cioè
C
=> (a*) C (a1*).
e Z tali che = -
(ak)x (an)y = (ak)x( l G)y = (ak)x e (ak)
Dalla do pp ia inclu sion e, segue quindi l’uguaglianza.
Poiché (ak) = (ad) si può concludere che o(ak) = o{ad) = n =
k + n>- si ha c
Sia G un gruppo ciclico di ordine n, G = (a). Si provi che ak è un generatore di G O M C D ( fc ,n ) = 1 .
Proposizione9.11
Infatti un elemento ak è un generatore di G se e solo se o(ak) = o{a ) = n. Dalla proposizione precedente si ha che o{ak) = ^ = n O m c d (/ c, h ) = 1. Se G è un gruppo di ordine n e t è un divisore positivo di n, allora esiste uno e un solo sottogrup po di G av ente ord in e t .
Proposizione 9.12
Sia G = (a ), e |G| = n = rt . Allora o(a r) = t e quindi | (a) | = f. Sia ora H un sottogruppo di G avente ordine t. Poiché H è un sottogruppo di un gruppo ciclico, sarà a sua volta ciclico. In dica ndo con a k un suo generatore, per la proposizione 9.10, si ha che \H\ = t = o(ak)
MCD (k,n)
Quindi MCD(fc,n) = - = r, quindi r|/c, cioè
3s
e
=
--- n-
—
Z tale che & = r s . Allora
a* = (flr)s e (ar) . Questo implica che (ak) c (a r ) e, poiché i due insiemi hanno lo stesso ordine, segue che essi coincidono. Esercizio 9.7 Utilizzando i risultati dei te ore m i e de lle pro po sizio ni precedenti: 1. Determinare i generatori del gruppo (Z i 2, + ) . 2. Determinare i generatori del gruppo (Z 16,+). 3. Determinare il periodo degli elementi di (Z g ,+ ). 4. Determinare il periodo degli elem enti di (Z io ,+ ).
10 A n elli e Campi A n el l o dei polinom i
“Nel giardino crescono più cose di quante ne semini il giardiniere.” (Proverbio spagnolo)
Fino ad ora ci siamo occupati di strutture algebriche dotate di una sola legge di composizione (sem igru ppi, mo noid i, grup pi): vogliamo iniziare a esaminare quel le strutture in cui sono coinvolte due leggi di composizione, usualmente indicate come somma e prodotto. Definizione 10.1 Una struttura algebrica (A, + .o) costituita da un insieme A e da due operazioni binarie -F,o su A si dice anello se:
gruppo abeliano;
1.
2. ( A ,o) è un monoide; 3.
Va ,b,c e A valgono le leggi distributive del prodotto rispetto alla somma: { a+ b ) o c = a o c + b o c c o (a + b) — c o a A- c ob.
Nel seguito in dic here m o con e leggeremo “zero dell’anello A ” l’elemento neu tro ripetto alla somma, mentre indicheremo con 1A relem en to neutro nspetto al prodotto che le ggere m o “unità dell’ane llo A '\ Definizione 10.2 commutativo.
Un anello (A, + ,o) in cui V a, b è a o b = b o a si dice
Esempio 10.1 1.
L’insie me de gli inte ri relativi, dei numeri razionali, dei numeri reali rispetto alle usuali operazioni di somma e di prodotto, sono esempi di anelli infiniti commutativi.
132
Capitolo 10
2. L'insieme Z„ delle classi di resti modulo n, rispetto alle operazioni di somma e prodotto di classi a suo tempo introdotte, costituisce un esempio di anello finito di ordine n commutativo. 3 L’insieme delle matrici quadrate di ordine n, Matn xn (E) rispetto alla somma matriciale e al prodotto righe per colonne costituisce un esempio di anello infinito non commutativo. Osservazione 10.1 Sia (A, + ,o) un anello. Pe r ogni a,b e A e per ogni n e Z si ha:
1. 0a oa = 0a = a
o
Oa .
2. a o (-b) = (-a) o b = — (a o b). 3. (na) ob = ao (nb) = n(a o b). Le dimostrazioni di queste proprietà elementari sono lasciate al lettore per eserci zio. Se andiamo con la memoria al Capitolo 7 riguardante le operazioni binarie su un insieme e alla costruzione delle tavole di composizione di Ze (Esempio 7.14), ci accorgiamo subito di un comportamento particolare: il prodotto delle classi [2L e [3L dà la classe [0]6 mentre ciò non succede quando si moltiplicano in Z due numeri entrambi diversi da zero. Questo giustifica la seguente definizione: Definizione 10.3 Dato un anello (A, + ,o), un elemento a e A, a j=. 0^, si dice divisore dello zero, se esiste b e A, b ^ 0 Atale che a ob = 0 ^ oppure boa = 0^. Esempio 10.2 In (Zg, 4- ,•) le classi [2]g e [4]g sono divisori dello zero mentre (Z3, + ,*) è privo di divisori dello zero. Esempio 10.3 In Mai2x2(E), cosiderate le matrici A=
11 00
B
10 -1 0
si ottiene che
A •B = 0A=
00 00
mentre
B A —
1 1 1 -1
Osservazione 10.2 Se i i ^ p (primo), l’anello (Z„, + ,•) contiene divisori dello zero. Infatti, posto n ~ ab con l < a < n , \ < b < n risulta \a~\ ^ TOl e w. * = [«Libi,, = [ab],, = [ni = [0]„. [a]" # [0]" e
Anelli e Campi Anello dei polinomi
133
Teorema 10.1 Un anello (A, 4- ,*) è privo di divisori dello zero se e solo se in esso valgono le leggi di cancellazione rispetto al prodotto, cioè se V a,x,y e A con a ^ 0 si ha che i) ax = ay => x = y ii) xa = ya =>■ x = y. Dimostrazione. Sia per ipotesi A privo di divisori dello zero e sia ax = ay cioè ax - ay = 0A da cui, per le leggi distributive, si ottiene a(x - y) = 0A. Ma a £ Oa e A è privo di divisori dello zero per cui x - y = 0Acioè x —y. Viceversa supponiamo che in A valgano le leggi di cancellazione e siano x, y e A, x / 0A, y ^ 0A. Se fosse xy = 0A, potrem mo scrivere anche xy = 0A = 0A}’ e, cancellando y (che è 0A), dedurremmo x — 0A, in contraddizione con l’ipotesi. ■ Definizione 10.4 Sia (A, + ,•) un anello: un elemento a e A, a ^ 0A si dice unitario o invertibile se ammette inverso rispetto al prodotto, cioè se esiste un b tale che ab = ba = 1A. L ’inverso di un elemento a si indica usualmente con il simbolo a~l. Esempio 10.4 Gli unici elementi invertibili di (Z, + ,•) sono 1e -1 . In (Zg,-f ,•) la classe [5]g è invertibile e am mette com e inverso se stessa. In (R, 4- ,•) tutti gli elementi diversi dallo zero sono invertibili. Osservazione 10.3 Un elemento unitario di un anello non è divisore dello zero. Infatti sia a un elemento unitario di un anello A e supponiamo che esista b e A, b ^ 0Atale che sia ab = 0A. Moltiplicando a sinistra per a~K otterremmo cT'O a = ¿z-1 (ab) = (a~l a)b — b — 0 A, assurdo! Proposizione 10.1 Sia (Z„, -f ,•) Vanello delle classi di resti modulo n: un ele mento [a]n è unitario se e solo se m c d (a,n) = 1. Dimostrazione. Dire che [a]n e Z„ è unitario vuol dire che esiste [c]n e Zn tale che [a]„ ♦[c]„ = [1]„ e quindi un c e Z tale che ac = l(m odn). Deve perciò esistere una soluzione della congruenza lineare ax = l(mod/i) e questo accade se e solo se m c d (a, n) = 1 (cfr. Proposizione 4.5). ■ Osservazione 10.4 Se n = p, numero primo, gli elementi di (Zp, 4-,-) non nulli sono tutti unitari, come conseguenza della proposizione precedente, e quindi (Z* ,-) è un gruppo.
In realtà questa osservazione si inserisce in un discorso di più ampio raggio con tenuto nella seguente Proposizione 10.2 Sia (A, + ,•) un anello e sia U l ’insieme degli elementi uni tati di A: allora (f/,-) è un gruppo.
134
Capitolo 10
Dimostrazione. Infatti U non è vuoto poiché 1A, essendo elemento invertibile, (J Teleappartiene a U. Inoltre U è chiuso rispetto al prodotto poiché Va,/? mento al? e U Infatti esistendo b~] e a~ ] in A, anche l’elemento b~]a~[ sta in A ed essendo {ab){b~la~l) - Ì a segue che ab è unitario e quindi appartiene a U. Da ultimo ogni elemento a non nullo di U è invertibile e l’inverso sta in U poiché («- h )- i _ a. e
.a
___
a
a
A
a
a
1
I
a
_
«
a
Esempio 10.5 Sia (Zs, + ,-) l'an ello delle classi di resti m od ulo 8. Il gruppo degli elementi unitari è U{ Z 8) = {[1]8,[3]8,[5] 8,[7 ]8}. Come differenziare la situazione in cui tutti gli elementi non nulli siano invertibili da quella in cui solo alcuni lo sono?
Definizione 10.5 Un anello commutativo (K, + ,•) con almeno due elementi si dice campo se ogni elemento di K diverso da zero è unitario. Esempio 10.6 Gli anelli (Q, + ,•) e (R, 4- ,•) dei numeri razionali e reali rispet tivamente sono campi così come gli anelli (Z p, + ,•) (p prim o) delle classi di resti modulo un primo p. Osservazione 10.5 Un campo è privo di divisori dello ze ro per definizione, ma un anello pnvo di divisori dello zero non è necessariamente un campo (si veda, per esempio, (Z, + ,•)). Tuttavia V ipotesi di finitezza garantisce che
Proposizione 10.3 Un anello A commutativo finito e privo di divisori dello zero è un campo. Un modo differente di trovare l’inverso di un elemento non nullo nel campo (Zp, + ,•) ci è fornito da un noto Teorema di teoria dei numeri, enunciato da Fer mai nel 1640 e dimostrato circa qu ara ntan ni dopo da L eib niz in un manoscritto e successivamente da Eulero (1736) con un metodo più semplice ed elegante.
Teorema 10.2 Per ogni primo p e per ogni intero a è : ap = a(mod p). In realtà noi dimostriamo questo Teorema, con osciuto come “piccolo Teorema di Fermai”, come caso particolare di un Teorema più generale in cui è coinvolta la funzione Eulenana, detta anche indicatore di Gauss-Eulero, che ora definiamo.
Definizione 10.6 La funzione di Eulero (p : N \ {0} —*■ Z è la funzione definita ponendo 1. Esempio 10.7 Se n - 8 i numeri positivi minori di 8 e primi con 8 sono 1,3,5.7 per cui (pi8) = 4. Se n = l i numeri positivi minori di 7 e primi con 7 sono l,2,3,4.5,6percui >(7) = 6.
Al fine di computare (pin) Vn > 1, osserviamo che vale la seguente:
An elli e Campi Anello dei polinomi
135
Proposizione 10.4 Siati > 1, allora: 1.
0 ; 2. (p(ab) = (p(a)(f){b) se a e b sono primi fra loro cioè se MCD(a,b) = 1 e r
r
quindi, postoti = Y\p?> (Pi 5* Pj J 5* J) à f i n ) = Y\(p“').
i=i
i=i
Siamo, ora, in grado di provare il seguente
Teorema 10.3 (Fermat-Eulero) Se n
> 0 ed a è un intero primo con n, si ha
che a(n) _ 1(mod /2
Dimostrazione. Consideriamo (Z„, + ,•) l'anello delle classi di resti modulo n. Poiché (a,n) = 1, la class e [a]n è invertibile in Z„. Poiché l'ordine di U(Zn) (gruppo degli elementi unitari di Z„) è
congruenze si ha a^ yn) = 1(mod n). ■
Corollario 10.1 Se n — p (primo) ed a è un intero non divisibile per p si ha ap~l = l(mod p).
Dimostrazione. È un caso particolare del precedente risultato, dal momento che cj)(p) = p - 1 e che
m c d
(p,p — 1) = 1. ■
Esercizio 10.1 Provare che (—2/)12:' = — 2(mod5). Poiché —2 = 3( m od 5) , la tesi diventa dimostrare che 312' = 3(mod5) Ora 3^l5) = l(mod5) per il piccolo Teorema di Fermat, sicché 34 = l(mod5) Pertanto, elevando ambo i membri della congruenza alla 3 1 —esima potenza si ha(34)31 = l 31 (mod 5 ) da cui 3 124 = 1(mod 5) e, sfruttando le proprietà aritmetiche delle congruenze, si conclude che 3 i 2:i = 3(mod5) (cfr Proposizioni 4 3, 4 4) Esercizio 10.2 Dire se sono vere o false le seguenti affermazioni 1. 15355 = l(m od 8); 2. I l 48 = 1(mod 104); 3. ( - 5 )433 = 7(m od 12).
Esercizio 10.3 Sia ( M a i 2x2(^ ), + ,•) Panello delle matrici quadrate di ordine 2 a coefficienti reali. Gli elementi unitari sono tutte e sole le matrici del tipo con
ad —bc f 0 .
Esercizio 10.4 Determinare l'insieme D dei divisori dello zero e il gruppo L degli elementi unitari dei seguenti anelli:
1. (Z|2, -+
2. (£ 9. -r 3. (Zìi, + ,’)•
10.1 Anello dei polinomi a una in d eterm in ata In questa sezione del capitolo dedichiamo particolare attenzione a un anello, quel lo dei polinomi, col quale la maggior parte dei lettori ha già acquisito una certa familiantà, per lo meno quando si lavora sul cam po rea le. Il nostro scopo è in realtà quello di estendere certe considerazioni a un campo K qualsiasi. Osser veremo che molti dei risultati a suo tempo illustrati per gli interi (relativi) hanno analoghi in ambito polinomiale, uno per tutti il Teo rem a di fatto rizzazio ne. Sia, ora, A un anello commutativo; consideria mo suc cessioni definitivamente nulle di elementi di A del tipo (c¡o,a\ , . . . , ¿í „ ,0 a ,0 a , ... ). Nell’insieme di dette successioni si definiscono una somm a e un prodotto :
® (ao.fli*•• •
• • • ) T {b0,bi , . . . , 0 a ,0 a , . . . )
(flo T boMi T b \, . . , ,0A,0A,. .. ) ® (flo.fli*...?fiA»^A»*'*)(bQ,bi,.., ,0A,0A,. • • )
(.C-o,^1»*••
••)
ove co = ciobo,
C\ = aob\ 4- ü \ b o , k
c2 — aob2 + (2\b\ + d2bo, . . .
, Ck =
Y l a i b k - i » • • • 1=0
È facile verificare che, rispetto alle operazioni di somma e prodotto così defini te, l’insieme delle successioni definitivamente nulle di elementi di A è un anel lo ove lo zero è la successione (0 a ,0 a , ... ,0 a , ...), l’unità è la successione (1,0a ,0 a , • • • ,0A, ... ) e gli elementi a dell’anello A si identificano con le suc cessioni del tipo (¿i,0A,0A, ... ). Usualmente si introduce un simbolo x (che si definisce indeterminata) e si rappresentala successione (ao,ai, • • • ,¿in,0A,0 A, - • • ) con la più familiare espres sione: (a0,a i, .. . ,a„,0A,0A, . . .) = ¿io*0 + a i* 1+ a2x 2 + . . . + anx n = ¿z(jt). Si indica inoltre con il sìmbolo A[x], l’anello delle successioni definitivamente nulle a coefficienti in A.
Ane lli e Ca mpi. Anello oe' poiinom
13 7
Definizione 10.7 Una successione definitivamente nulla di elementi d. 4 - dia polinomio e, in virtù dell'osservazione fa tta sopra, si può rappresentare nei¡a forma a(x)
—
anx n +
.. .
+
a \ x
1
-f-
o q
X
o
omettendo i termini per i quali a, = 0 . Osservazione 10.6 Con questa rappresentazione le operazioni di somma e pro dotto fra polinomi coincidon o con que lle già note. Definizione 10.8 Dato un polinomio a( x) = anx n + . . . + a\ x -f ao di A[x] con anfi 04, si dice grado del polinomio Vintero positivo n, mentre il coefficiente ar si dice coefficiente direttivo. Se a„ = 1 si dice che a( x) è monico. Osservazione 10.7 Gli elementi non nulli dell’anello A sono polinomi di grado 0, mentre al polinomio nullo si può assegnare, per convenzione, grado - 1. Notazione 10.1 Dato il polinomio a( x) — anx n + . . . - f a\x + ao, con an fi 0 ,4, indicheremo il grado n di a(x) con gr (o(x )). Osservazione 10.8
gr (a(x) + b(x)) < max (gr (a(x)),gr ( b(x))).
Si può avere la disuguaglianza stretta: consi der iam o n ell’anello Z[x] i polinomi a(x) = x2 + 3x —1, b(x) = —x 2 4- 2x. Allora a(x) 4- b(x) — 5.* — 1 e il grado della somma è strettamente minore del grado di ciascun addendo. Osservazione 10.9
gr (a(x) b(x)) < gr (a(x)) 4- gr (b(x)).
Anche in questo caso si può avere la disuguaglianza stretta. Infatti per esempio in li[x\ consideriamo i polinomi a(x) = [2]4 jc 3 -f [1]4 e b(x) = [2]4x. Allora è a{x) b(x) = [4]4 jc4 + [2]4* = [2]4x, poiché [2 ]4 in Z 4 è divisore dello zero1. Proposizione 10.5 Se A è privo di divisori dello zero (per esempio, se A è un campo 0 A = Z) allora g r {(a(x)b(x)) = gr (u ( jc )) 4- gr (b(x)). Dimostrazione. Infatti, siano a(x) = anx n 4- ... 4- a\x + ao
e
b(x) = bmx m 4- -.. + b\x 4- bo.
Allora a(x) b{x) = anbmx n+m + (anbm-i + an- ìbm)xn+m~ì + ... 4- aob0 ed è t^ nb m
f i ^A
Q-n
f i O a f i
bm
e quindi il grado è n 4 - m. ■ Sono importanti le seguenti 'Nel seguito per indicare 1 coefficienti di un polinomio in Zn[x], per semplicità, e quando non si generi confusione, tralasceremo le parentesi neH’indicare le cl assi, cioè scriveremo a al posto di [a]n.
138
Cap itolo 10
Proposizione 10.6 Se un anello A è privo di divisori dello zero allora A[x] è privo di divisori dello zero. Proposizione 10.7 Sia A un anello privo di disori dello zero: gli elementi uni tari di A[x] sono tutti e soli gli elementi unitari di A. Dimostrazione. Infatti a(x) b(x) = 1 se e solo se a{x) = ao e b{x) — bo, poiché il grado del primo membro deve essere eguale al grado del secondo membro, da cuiaofy) = 1. ■ Da questo momento in poi, salvo esplicito avviso, considereremo solo polinomi a coefficienti in un campo K. 10.1.1
Div is io ne in
Z
Teorema 10.4 Siano a{x),b{x) e K[x] con b{x) 7^ 0; 3! q(x),r(x) e K[x] tali che sia:
1. a(x) = b(x) q(x) + r(x) 2. gr(r(x)) < gr (&(*)). Dimostrazione. Esistenza Se a{x) = 0 allora q{x) = r(x) = 0. Supponiamo n > 0 e siano a(x) = anxn + ... + aix +ao e b(x) = bmx m + . . . + b\x + bQ
quindi gr(a(x)) = n e gr (b(x)) = m. Se m > n si può scrivere a{x) = b(x) ■ 0 + a(x), ciò èq(x) = 0 e r(x) = a(x). Se m < n, procediamo per induzione su n. Essendo a„ e bm diversi da 0 poniamo a'(x) = a(x) - a„b~lx n~mb(x)
(o)
e quindi a\x ) = a„xn + ... 4- ao —an(bmlbm)xn + . . . + (—a„)bmlbox" m =
= anxn + . . . + Oq —anx n + . . . + ( —an)bm1box" Poiché gr (a'(x)) < n - 1, per l’ipotesi di induzione 3 q'(x),r'(x) € K[x] tali chea'(x) = b(x) q’{x) + r'(x) con gr (r\x)) < gr (b( x )). Allora, ricavando a (a ) dalla precedente relazione (o) e sostituendo, si ottiene a(x) = a\x) +anb~lx"-mb(x) = b(x)[q' (x) + a„b~1 x ,,~m] + r'(x).
Si perviene alla tesi ponendo q(x) = [q'(x) + a„b~Ix n~m] e r(x) = r'(x)
Ane lli e Ca mp i An ello dei polinomi
139
Unicità Supponiamo che esistano q(x), r(x ) e q\{x),r{{x) tali che
a(x) = b(x) q(x) + r(x)
con
gr (r(x)) < gr (b{x))
a(x) = b(x) qx(x) + rx(x)
con
gr (n (x)) < gr (b(x)).
Uguagliando i due membri si ottiene
b(x)q(x) + r ( x ) = b{x)qì{x) + r i( * ) b(x)[(q(x) - qi(x)] = rx(x) - r(x). Poiché il polinomio al primo m em bro è il po linom io nullo (pe rché altrimenti avrebbe grado strettamente maggiore del grado del polinomio al secondo membro, che è assurdo) si può concludere che q{x) = q\{x) e r ( x) = r ^ x ) . u C’è un’evidente analogia tra l’algoritmo della divisione tra polinomi (con coef ficienti in un campo) e quello tra nu meri interi. Infatti l ’enunciato del teorema precedente si ottiene form almen te da quello a suo tempo visto in Z pur di sosti tuire il valore assoluto del divisore con il grado del polinomio divisore. Osservazione 10.10 Se nella divisio ne di a(x) per b(x) si ha che r(x) = 0, diciamo che b(x) divide a(x) e scriviamo b{x)\a(x). OsservazionelO.il
Se f { x ) e K [ x ] e c e K \ {0*}, allora c f ( x ) \ f ( x ) e
c\f{x). Infatti f ( x ) = ~ { c f { x )) = c ( - f { x ) ) .
c
c
Esempio 10.8 Determinare il qu oz ien te e il resto della divisione del polinomio a(x) = x 4 - 2x 3 + x 2 + x — 1 p er b( x ) = 3x 3 —5 in M[ jc ] Effettuiamo la divisione
x 4 —2 x 3
+x2
-x 4
0
+x 5
3x3
1 -x
+ r
— 2 x 3
JC2
8 + 3*
0
3
-1 10
2 x 3
e otteniamo: q(x) =
-1
3 *2
8
13
+ 3*
3
9 8 2 j 13 - ed r(x) = x~ — x — —.
-5 2 _ 3
140
Capìtolo 10
Esempio 10.9 Determinare il quoziente e il resto de lla divisione del polinomio c{x) = a 3 -f x2 + 3a + 1 per d(x) = x 2 - 2 in Z 5[a ]: Effettuiamo la divisione x 3 ~x 3 0
+
a
+3 a
2
+ 2 + x2
+ 1
a
+5 a
- 1émé
X
+ 1
+ 1
—x 2 0
X 2
+ 2
3
0
e otteniamo q(x) = a + 1 e r{x) = 3. (Nota bene: in Z 5 si ha che 5 = [5]s = tOìs = 0).
Esempio 10.10 Determinare il quoziente e il resto della divisione del polinomio / ( a ) = a 4 + a 2 + 1 per gOx) = 3a 3 —2 in Z7[x].
a
4
+
a
2 + 10
-A 4
0
+ 1
A2
+3 a
3a 3
-2
5x
a
+ 1
e quindi q(x) = 5a , r{x) = x 2 + 3x + 1. (Notabene: in2/7 si ha che 3“ 1 = [3]^ 1 = [5]7 = 5 e 10 = [10]7 = [3]7 = 3).
10.1.2 Massimo comun div is or e di du e p o li n o m i
Definizione 10.9 Siano a(x) e b(x) due polinomi non nulli di K[x). Si dice massimo comun divisore fra a(x) e b(x), e lo si indica con m c d (
divisioni successive. Teorema 10.5 Dati due polinomi a(x), b(x) e K[x] entrambi non nulli, esiste un MCD{a(x)Mx)) = d(x). Esistono inoltre dei polinomi f ( x ) , g ( x ) e K[x ] tali che siad(x) = a(x) f (x ) 4- b(x)g(x).
Ane lli e Cam pì. An ello dei polinomi
141
Dimostrazione. Si s u pp o n ga g r ( a ( * ) ) > g r (b{x)) e si eseguano le divisioni successive (1)
a(x) = b ( x ) q \ ( x ) + r x( x)
(2) se r\{x) ^ 0 : b(x) = rx(x)q2(x) + r2(x)
con gr ( n ( x ) ) < gr (¿( a )) con gr (r2(x)) < g r ( n ( A ) )
(3) se r2(x) £ 0 : ri(A) = r2(x)q3(x) + r3(x) con gr ( r 3(*)) < gr (r2(x)) . .
(k-1) s e r ^ U ) t ^ O : (k)
se
rk- 3{x) = rk- 2(x)q k-\ ( x ) + r * -i (x ) con g r ( r A ._i(A )) < g r(r *_ 2(A))
^ 0 : r fc_2( ^ ) = rk. x{x)qk{x).
Poiché la sequenza dei resti delle successive divisioni è costituita da polinomi il cui grado è strettamente decrescente, dopo un numero finito di passi si ottiene un resto nullo. Se ri (a ) = 0 si ha che b(x)\a{x) e quindi MCD( a( x),b(x )) = b{ x). Se ri (a ) 0 ed r*( a ) è il primo resto ugua le a zero, m ostriamo che allora è rk_\ (a ) = mcd (u (a ),/?(a )). Basta verificare le condizioni 1) e 2) della definizione. 1) r^_i( a )| a{ a ) e rk-\(x)\ b(x). Infatti /> _ i (a )| rk- 2(x) dalla uguaglianza (k) e cosìnsalendo si ottiene dalla (2) e dalla (1) che r^_i(A)| b{x) e rk.. i (a )| a(x). x) e c (a )| b(x) allora c (a )| rjt— ) se c (a )| a{ i (a ). Infatti dalla ( 1 ) si ha che c (a )| ri (a ); se c (a )| ri (a ) e c (a )| b{x) dalla (2) si ha che c (a )| r 2(a ). Così proseguendo, alla fine si ottiene che c (a ) | r^_i (a ) e quindi si conclude che rk-i(x) 2
è un MCD{a(x),b{x). Quanto alla seconda parte dell’enunciato del Teorema, l’equazione (1) per mette di esprimere r\{x) nella forma: ri (a ) = a ( x ) + ¿>(a ) ( — c/ i (a )). Sostituendo l’espressione di rj (a ) nella (2) si ha: r2(.r) = ci (a ) ( q2 (a )) + b{ a )(1 + q\{x)q 2{x)) e così via. In questo modo si esp rim e cia scu n resto c om e c om binazio ne a coef ficienti polinomiali di a(x) e b( a ). In particolare esisteranno f \ x) , g( x) e A' [a ] tali che sia d (a ) — a ( x ) f ( x ) -f b{x)g(x). ■ Osserviamo, ora che m c d (<2(a ),6( a )) è determinato a meno di una costante moltiplicativa non nulla.
Teorema 10.6 Sia d( a ) = m c d (((a(x),b(x)) se e solo se d'(x) = k d ( x ) con k e K* = K \ {0}. Dimostrazione. Per ipotesi sia d ' ( x ) = k d ( a ): essendo k un elemento invertibile si ha che d(x) = k~ld'( a ).
142
Ca pitolo 10
Poiché d(x)\ a(x) esiste a ' ( x ) tale che a ( x ) = d ( x ) a ' ( x ) = k ~ l d' ( x ) a' ( x ) . Si ottiene quindi che d'(x)\a(x) e in modo analogo d ' ( x ) \ b ( x ) . Sia, ora, c(x) un polinomio tale che c(x)| a ( x ) e c ( x ) | b { x ); allora, per defini zione, c(x)| d ( x ), cioè d ( x ) = c ( x ) q ( x ) da cui segue che d ' ( x ) = k d ( x ) = kc{x)q(x) cioè c ( x ) | d'(x). Viceversa supponiamo che sia d \ x ) = MC D { a ( x ) , b ( x ) ) . Allora d ' ( x ) | ¿/(x) e z/Cx)| ì/'( ac) cioè esìstono q \ ( x ) , q 2 ( x ) £[x] tali che d ( x ) = d ' ( x ) q d x ) e d'(x) = d{x)q2{x), quindi si hache d ( x ) = d ( x ) q 2 { x ) q \ (x) e, semplificando per d(x) ¿ 0, si ottiene 1 = q2(x)qi(x) da cui q2{x) = k ^ 0 e q x(x) = k ~ l . m e
Definizione 10.10 Due polinomi a ( x ) e
b ( x ) si dicono r e l a t i v a m e n t e primi (o primi fra loro) se m c d ( u (x ),¿>(x ) ) = k e K, ovvero se il loro m c d monico è 1*.
Esempio 10.11 Determinare in Q[x] il b{x)
m c d
monico tra
a(x)
= x 3 — 2 x 4- 1 e
= x 2 - 1.
Procediamo dividendo anzitutto
a(x)
per b ( x ) si ha
-2x -
0
x3
+1
x2
+x
-1
X
-x
+1
Dividiamo, ora, b(x) per il resto r(x) = —x 4- 1 -1
x 2 -
a :2
0
+
-x —x
x
4-x
+1 — 1
-1 +1
—x
0
0
Quindi un mcd (a(x),b(x)) = - x 4-1, mentre il mc d (a(x),b(x)) monico è a c
-
*•
Esempio 10.12 Determinare in Zs[x] il mc d monico fra a(x) = x 3 4- x 2 4- ac + 1 e b(x) = 3x2 4- 2x 4- 2.
*3
+x2 - x 3 —4x2 -3x2 0 _ ____ +3x2 Ò
4-x —4x -3x +2x —x
+1
3x2 2x
4-2x -1
+T
-1-2 +3
Ora dividiamo b{x) per il resto r](x) = - x + 3
4-2x
__3x2 +9x +X -
ac
+2 +2 +3
—x —3x
+3 —1
+2
Ane lli e Cam pi. Anello dei polinom i
143
Allora un mc d = — x 4- 3. Quello monico è —(— jc + 3) = x - 3 . Esercizio 10.5 Determ inare un m c d monico fra le copp ie di polinomi degli esem pi 10.8, 10.9, 10.10.
10.1.3
P o l in o m i i r r i d u c i b i l i e t e o r e m a d i f a t t o r i z z a z i o n e
Sia a{x) e K[x] un polinomio di grado n > 0. Si dice che a{x) è irriducibile in K[x] se a(x) è divisibile solo per i polinomi di grado zero eperi polinomi della forma Xa(x), con X e K*. In caso contrario il polinomio si dice riducibile. Definizione 10.11
Osservazione 10.12 La noz ione di irrid uc ibilità di un polinom io dipende dal campo K , come mostrano i seguenti esempi: f ( x ) = x 2 + x + 1 e R[x] è ivi irriducibile, mentre lo stesso polinomio è riducibile in Z 3[x]. Infatti in Z 3[x ] è f(x) = x 2 - 2 x -f 1 = (x — l ) 2. Osservazione 10.13
Se gr ( / ( * ) ) = 1, / ( x ) è irriducibile.
Esempio 10.13 In R[x] il polinomio / ( x ) = x 4 + 1 è riducibile. Infatti si può scrivere: x 4 4- 1 = (x 2 + \ f l x -I- l)(x 2 — sfìx -f 1). Osservazione 10.14 Siano p ( x ) , f ( x ) , g ( x ) e K[x] ; inoltre p{x) sia irriducibile e divida il prodotto f( x)g(x). Allora o p ( x ) \ f ( x ) o p( x)\g( x). Teorema 10.7 {di fattorizzazione unica ) n > 0 può essere scritto come prodotto
Ogni polinomio f{x) e K[x] di grado di s > 1 polinomi irriducibili ( non necessariamente distinti). Tale fattorizzazione è essenzialmente unica nel senso che se: a{x) —p\{x)p 2( x ) . . . p 5(x) = q\ {x)q2 Ì x ) . . . qt {x) con i polinomi p, (x) eì qf x) irriducìbili (1 < i < s, 1 < j < t), allora si possono ordinare ìfattori in modochesias = t e p x{x) = /zi#i(x), p 2{x) = h 2q2{x ) , . . . , ps{x) = hsqs{x), conh, e K \ {0}. Dimostrazione.
n = gr (a(x)). a{x) riducibile:
Esistenza della fattorizzazione. Si procede per induzione su
Se a{x) è irriducibile non c ’è nulla da dimos trare. Sia quindi allora a(x) = b(x)c(x) con gr( 6 (x)) < n e g r(c (x )) < n Per ipotesi indutti va b{x) = b[{x) . . . bh{x) e c (x ) = c i ( x ) . . . q (x ), ove i fattori £,(x) e cy(x) sono polinomi irriducibili (1 < / < h e 1 < j < le) . Segue che si può scrive re: a(x) = b\{x)... bh{x)c\{x) . . . Ck{x) e quindi abbiamo una fattorizzazione di a{x) in polinomi irriducibili. Unicità della fattorizzazione. Supponiamo che esistano due fattorizzaziom diflfx) in polinomi irriducibili, sia cioè:
a(x)
=
pi ( x ) . . . ps(x)
con p,{x) eqj(x) irriducibili (1 < / <
e
a{x)
=
q\ (x ) . . . qt{x)
s, 1 < j < t).
Capitolo 10
144
Poiché qi (a ) è irriducibile e divide a(x) = Pl(x ) . .. . . p s(x), s( x), allora qx(x) divi de almeno un fattore p,(x p, (x ): no non n lede la gener gen erali alità tà del disc d iscors orso o supporre supporre che qi(x)\ p\{x). Poiché anche p {(x) è irriducibil irriducibile, e, nec essaria men te Pì (*) (*) = hlq (n 1 ove /li € AT*; qui quindi ndi
a(x) = h\q\(x)p 2(x ) . . . ps(x p s(x)) = q\ ( x ) q 2( x ) . ..qt(x) da cui
h\P h\ P2(x) • •. Psix) = q 2( x ) . ..qt(x) (x ) = h a (a ) n e r e 1ipotesi di induzione ci permette di conludere che s = t e p, (x) \ < ì < s . m ™ Corollario 10.2 10.2 Ogni polinomio o(x) € K[x] di grado n > 0 si può scrivere nellafoima a(x) = ka\(x)a 2(x)... a 5{x) ove k € K* è il coefficiente direttivo di a{x) e i polinomi a,(x) (1 < / < $) sono monici moni ci e irriduc irr iducibil ibili. i. Tale Tale scrittu scrittura ra è unica unica,, a meno meno dell de ll’’ordine dei fatt fa ttor ori. i. 10.1.4 Radici di un po lin om io su un c am p o
Definizione 10.12 Sia A un anello (in particolare un campo), sia A[x] Vanello dei dei polinomi polinomi a coefficienti in A e sia a e A . Per ogni ogni polinomio f (x) = ao + a i* i* + . . . + anx" 6 A[x] si dice valutazione o valo valore re assun assunto to da f( f ( x ) su a l ’elemento elemen to a 0 + a xa + . . . + ana n e A che è di solito solito indicato con il simbolo / ( a ) . Dati due polinomi f ( x ), g(x) e A[x] valgono le proprietà: propr ietà: i) ( f + g)(a) g)(a) = f(ot) f (ot) + g(a) ii) (fg)(a) = /(a)g(a). In altre parole è possibile costruire una corrispondenza (f)a : A[x] — > A che associa a ogni polinomio f ( x ) la sua valutazione / (a) e che lascia fissi gli elementi di A e porta x in a. L’applicazione 0 a è detta sostituzione o valutazione di A[x] su a.
Dato o un anell anello o A , un suo elemento oi si dice radice, o zero, Definizione 10.13 Dat o solu soluzio zione ne del del polinom polinomio io f (x) e A[x] se f (a) = 0. Nel Nel seg segui uito to consid considererem ereremo o sempre sempr e polinom p olinomii a coeff c oefficie icienti nti in un campo ca mpo K. Cominciamo con l’enunciare e provare il
(Teore rem ma di Raff Raf f i ni2 ni 2) Sia K un campo, campo, f ( x ) e K[x] e a un Teorema 10.8 (Teo elem elemen ento to di K. Allora Allora a è radic radicee di f ( x ) se e solo se il polinomi polin omio o (x - a) divi divid de f(x). f( x). 2 paol° paol° Rufi Rufiini ini tale ta lent ntan an o (VT) 1765 1765 - Modena 1822) 1822) matematico matemat ico e medtco.
Dimost Dimostraz razion ione. e. Per ipotesi (x - a) divida divida /( x ) . All Allor oraa è f ( x ) = (x - a) q (x) con q(x) q(x ) € K[x]. K[x]. Ne segue che f (a) (a ) = (oc — cc)q(cc) cc)q(cc) = 0 . Da cui « è radice. —a ) si ha: Viceversa sia a radice, quindi sia f (oc) = 0. Dividendo f ( x ) per (x —a) ct)q(x) 4/(•*) = (x - ct)q(x) 4- r(x) con gr r(x) < gr (x - a) = 1. + ro, con ro € K. K. Sostituendo oc al Si ottiene quindi che f (x) — (x — cc)q(x) — cc)q(x) + po posto sto dell dell indete ind eterm rmin inata ata x seg se g ue che ch e f(oc) )q(a) + ro, il che implica f( oc) = ( a — a)q(a) a ro = 0 cioè cioè (x - oc) divi divide de /( x ). ■ Esempio 10.1 10.14 4 Sia / ( x ) = x 4 - 5 x 2 + 6 . Poi Po i ché ché /( x ) = (x2 - 3 ) ( x 2 - 2) = (x-v ^)(* + \/3)(x —V 2 )(x + \/2 ) e R[x], esso ammett ammettee rad radiici ±V 3, ±>72 >72 e R. K[x] di grado 1 è irri Osser sserva vazi zio one 10.15 10.15 Un polino mio / ( x ) = a 0 + a xx e K[x] irri K[x] e ammette l’unica radice oc = —a ^ l a0 in K. ducibile in K[x] e Osservazio Osservazione ne 10.16 10.1 6 Se f ( x ) e f{x) f{x) è riducib riducibile ile per il Teore Te orem ma ba basta sta considerare f ( x ) = x 4 + 3)(x 2 + 2) ma non f(x) f( x) = C x2 + 3)(x
K [ x ] ha grado > 1 e ammette radice, allora di Ruffini, Ru ffini, m a il vicev ersa ers a non è vero. vero. Infatt Infattii 5x~ + 6 e R [x] : esso è riducibile riducibile in quanto quanto amm ette radici radici in in R.
irriducibile, allora si verif verific ica a Proposizione 10.8 Sia f(x) e R[x], se f ( x ) è irriducibile, ma ed una sola delle due situazioni: / ( x ) ) = 1), 1. il grad rado di f( f ( x ) = 1 ( g r ( /( ppure f ( x ) = a x 2 +bx +c, con A = b 2 - 4 ac < 0. 2. oppu Teorema 10.9 Un polinomio polinomio f (x) € campo K ha al più n radici distinte.
[x] di grado n > 0 a coefficienti in un
Dimostrazione. Si procede per induzione su n. Se n = 0, all allora ora / (x ) = k e K e quindi non possiede radici. Supposto l’asserto vero per polinomi di grado n — 1 dimostriamolo per polinomi di grado n. Na turalm ente se il il polinomio di grad grado o n non ha radici l’asserto è vero; se, invece, possiede una radice a e K, K, per il Teorema di Ruffi Ruffini ni si ha: / ( x ) = (x - a)g(x) con g(x) e K[x]. Ma allora gf (£(* (£(*)) )) = « - 1 e, per ipotesi ind uttiva, g(x) ha g(x) ha al più n - 1 radici distinte Ora un elemento fi elemento fi e K è radice di f ( x ) se e solo se f} = a o fi fi è radice di g(x) Pertanto f Pertanto f ( x ) ha al più n radici distinte. ■ Definizione 10.14 Sia f ( x ) e K[ x ] e sia oc e K una una radic radicee di f (x). f (x). Si dice che (x - a )n \ f ( x ) ma (x - a)n+l f /(x). a è radice di molteplicità n se se (x ma (x po linom omio io di grado n: la somma delle Teorema 10.10 Sia f ( x ) e A^[x] un polin tnolteplicità delle radici non supera n. Dimost Dimo stra razi zion one, e, (traccia) (traccia) Si ragion i per pe r induzione su g r ( / ( x ) ) sulla sulla falsa falsari riga ga di quanto fatto fatto nel prec pr eced eden ente te Teor Te orem em a 10.9. ■
146
Ca pitolo 10
Teorema 10.11 (Prin n +1 ele (Princip cipio io di di identità dei polin pol inom omi) i) Siano a 0, . . . campo K e siano siano f (x) (x),, g( x ) due polinom poli nomii di ATfjc], entrambi menti distinti di un cam di grado minore minore o ugua uguale le a n,ta ,tali che ch e f («,) = ) f( f ( x ) = g(x). g(x). = a(x) a(x ) - b(x) (x) di grado al Dimostrazione. Basta considerare il polinomio p più iù n. esso ammette le n 4- 1 radici «o, ■•. . Per il Teorem Teo remaa preceden precedente te h(x) deve essere il polinomio nullo, pertanto f { x ) = g( x ) . u
Esercizio 10.6 1. Siano a(x) = x 4 + 3x 2 + 2x + 1 e b(x) = x 3 — 4 due polinomi di Z7. Determinare il loro mc d monico ed esprìmerlo come combinazione di nix) e b(x). 2. Si considerino i polinomi poli nomi f ( x ) = x 4 + 3 x 3 - \2x \ 2x - 36 e g(x) = x 2 - 9 di jc]: decomporre f (x) e g(x) nel prodotto di polinomi irriducibili in R[x] e IR[ jc determinare un loro mc d . x e g(x) = x 1 — x in Z 7, se ne determinino le 3. Dati 1 pol polino inomi mi / ( x ) = x 3 — radici. [x]. Si provi 4. Sia K un campo e siano f ( x ) e g(x) due polinomi coprimi in K [x]. che /(x) e g(x) non hanno radici in comune.
10.2 Funzioni unzioni po lin om iali e Sc h em a di Hö rn er anx n+al +a ll- \ x n 1-K . .-\-a\xx+aox° un polinomio a coefficienti reali. Sia /(x) = anx
Abb bbia iam mo già osserva osservato to che ad ogni polinom polin omio io / ( x ) e M[x] si può associare una funzione F : E —> R definita defini ta pone ponendo ndo:: an- i a n~l + . . . + a \a + aQ. F(a) = anan -|- an-
Tale funzione F è è detta detta fun funzion zionee polinomiale associa ass ociata ta al polino p olinomio mio / ( x ) e spe spesso sso si indica l’elemento F(a) con /(a). Per calcolare il valore F(a) si può utilizzare il seguente procedimento di tipo ncorsivo. Poiché : /( *) =
QnX'1
+
Cln - [ X n
1+ . . • +
C 1 \X
+
ClQ
raccogliendo x nei primi n addendi, si ottiene: ottiene : /(*) =
[anXn
1
+
dn-ix'1
“ + . . . + £ li li ] x “T “T
Ciò
raccogliendo ancora x nei primi n — 1 addendi, si ottiene: ottien e: / ( *) —
lX" 3 + . . • -p ób óbjx jx
6fj]x fj ]x + ¿io] io] •
Ane A ne lli e Camp Ca mpi. i. An ello dei polinom i
147
Iterando il procedimento, alla fine si ottiene: / ( * ) = l--[[[anx l--[[[anx + a n- i ] x + a n_2]x + an an- 3\x H----- ]x + a0 detta scrittura di H ò rn er del po linom io f { x ) . Esempio 10.1 10.15 5 Considerati i polin om i / ( x ) = 4 x 5 — 3 jc 4 -f 6x 3 -f x : -f 3x 3x - 5 e g(x) = x 4 - 5 x 2 + 2, le loro scritture di Hò rner sono rispet rispettivame tivamente: nte: / ( x ) = [ [ [ [ 4 x - 3 ]x ]x +
6 ]x +
l ] x + 3] 3 ]x - 5
g(x) = [[ [ x + 0]x 0]x - 5]x 5]x + 0]x 0]x + 2. 2. La scrittura di Hòrner permette di descrivere un efficace algoritmo , il cosiddetto algoritmo di Hòrner, che consente di calcolare il valore F(a) = f(a) al variare di a e R.
I N P U T :
grado n di / ( x ) , coeff coeffic icie ient ntii e a
R = ri su lt at o <—an pe p e r k che che varia da n — 1 a 0 R
R * a + ak f i n e stampa R
Sono così necessari n passi e ogni passo consiste di due operazioni, un’addi zione e una moltiplicazione, per un totale di 2 n operazioni. Esempio 10.16
D a to / ( x ) = 3 x 5 + 0 x 4 - 2 x 3 - 3 x 2 4-4 x4 -1, calcol calcolia iamo mo / ( 2 ).
/(x ) = [[[[3x + 0]x 0]x - 2]x 2]x - 3]x 3]x + 4]x 4]x + 1 / ( 2) = [ [ [ [ 3 - 2 + 0 ] . 2 - 2 ] - 2 - 3 ] . 2 + 4 ] - 2 + 1 = 7 7 .
10.3 II II Campo Co C o m p l es s o Ne Nell’ ll’ insiem insiemee delle copp co ppie ie o rd in ate at e di nu m eri er i reali rea li C = R x R = R 2 si defi defini nisc scaano due opera op erazio zioni, ni, s om m a e prod pr od otto ot to,, com e segue: pe per ogni z = (a,b (a,b), ), z\ = (au b\) e C
Z + Zi = (a, (a , b) + (ax,b \) = (a + ax,b + bi) z zi = (aai (aa i — bb\,ab\ b b\,ab\ + aib). Si verifi rificca facilmente che risp r isp etto ett o a de tte opera op erazio zio ni C risulta risu lta essere un campo che che chiameremo campo complesso e definiremo ì suoi elementi numeri complessi.
148
Cap itolo 10
L'applicazione / : R - » C tale che f ( a ) = (a, 0) è un’applicazione miettiva che conserva somma e prodotto. Questo ci permette di identificare il numero complesso della forma (u ,0 ) con il numero reale a e di vedere quindi R come un sottoinsieme di C. L'elemento (0,1) di € verrà denotato con i e detto unità immaginaria. In virtù dell’identificazione operata ris u ltai 2 = (0 , 1) - ( 0 , 1) = ( —1 , 0 ) = - 1, sicché <[—I = ± i. Pertanto ogni numero complesso ammette una scrittura cosiddetta algebrica, che si ottiene utilizzando l'identificazione di R in C :
Z = (
Asse immaginano '
b ...................-t (a + ìb)
Asse reale
Figura 10.1
Lasse delle ascisse è detto asse reale mentre quello delle ordinate è detto asse
immaginario. La notazione introdotta consente inoltre di utilizzare le usuali regole del cal colo letterale per sommare, sottrarre, moltiplicare e dividere numeri complessi, sempre tenedo conto che i 2 = — 1. Esempio 10.17 Consideriamo i numen complessi a = 1-f J / 5 e ^ = 2 —3/. La loro somma a + /3, il loro prodotto a • il loro quoziente a/fi sono dati da: a + p = (1 + yfli) + (2 - 3/) = 3 + (^5 - 3)i
An elli e Cam pi Anello dei polinom i
« . £ = ( ! + V5i) ■ (2 - 3i) = (2 + 2>V5) +
<*
1 + ^5 /
P= 2-31
( 1 + ^ 5 0 -(2 + 3 0 (2 - 30 • (2 + 30
149
- 3 )i
(2 - 3^ 5) + (2 ^5 4- 3)i 4 - 9 /2
(2 - 3 ^ 5 ) + ( 2 ^ 5 + 3)/ 13 Definizione 10.15
Si dice coniugato di un numero complesso z = a - ih il numero complesso z — a — ib.
Si osserva subito che il coniugato di una somma è la somma dei coniugati, che il coniugato di un prodotto è il prodo tto dei coniugati e che il coniugato del coniugato coincide con 1’ elemento di partenza. Inoltre risulta: z
+
z
= 2 Re z
z
= 2 i Im
z
z
Z ■ z = a~ + b~.
Come detto precedentemente, l’operazione di coniugio ha le seguenti proprietà rispetto alla somma e al prodotto: Zi +
Z2
=
ZI + Zi
Z \ ' Z 2 = Z \ ' Zi
1 Definizione 10.16 Si dice modulo di un numero complesso z = a 4- ib il nu mero reale non negativo indicato con \z\ = Q = \/a 2 + b 2 (distanza assoluta dell'immagine dall’origine degli assi).
Valgono le segenti proprietà:
a) |z| > 0, |z| = 0 se e solo se b) \z\ = | z | c) ki • Z2 I = k i l * \ z i \ ,
1
z
= 0 1
d) ki + Z2I < k il + IZ2I
e) \zi
-
Z2 I > l lz t 'l - IZ2 II-
Geometricamente |z| rappresenta, come abbiamo detto sopra, la distanza del punto z dall’origine; \z\ — Z 2 I rappresenta la distanza tra i punti z\ e z i e le
150
Capitolo 10
disuguaglianze d) ed e) traducono il noto teorema sulle lunghezze dei lati di un tnangolo per cui un lato è minore della somma degli altri due e maggiore della loro differenza. Come è noto, i punti del piano possono essere individuati anche tramite le coordinate polari q (raggio polare) e d (angolo polare, cioè 1*angolo che la retta congiungente il punto dato con 1’ origine forma con il semiasse positivo delle ascisse, percorso in senso antiorario). Sono pertanto giustificate le seguenti. Definizione 10.17 Sia z ^ 0: si dice argomento di z = a + ib e si denota con argz /’ angolo ù (o uno qualsiasi degli infiniti angoli ù + 2kn, k € Z) di cui si
deve ruotare V asse reale per sovrapporlo in direzione e verso al raggio vettore che rappresenta z, con V usuale convenzione secondo cui un angolo è positivo o negativo a seconda che sia descritto in senso orario o antiorario. Fissato il numero complesso z = a + ib, valgono le seguenti relazioni:
a = Re z —Qcos d b = Im z = Qsin d q =
co s d =
yja2 + b2 a Q
. b sin 17 =
Q
Si ottiene così la scrittura trigonometrica di un numero complesso:
z = q (cosi? + i sin d). L’uso della forma trigonometrica è particolarmente utile quando si debbano esprimere prodotti e quozienti di numeri complessi.
Anelli e Campi Anello dei polinomi
151
Dati due numeri complessi z\, Zi
Zi = £>i (cos
+ i sin ù\) e Z 2 = Q2(cos #2 4 i sin i)2)
risulta: i • Zi = Q\Q2(c o s ($ { + d2) + i sin(#i 4 #2))
(*)
— = — (cos(z?i —# 2) 4 i sin(#i — ù2). Z2 Ql La (*) si generalizza, per induzione, al caso di un numero qualsiansi di fattori Zi, Z 2 , . . . , Zn e si ottiene: Z \ ' Z 2 ' " Z n
=
Q\Q2
• • -enCcOSO?!
4
l}2
H
b Ù n ) 4 / SÌn(#i 4
H------+
---------
$n))-
Nel caso in cui i fattori siano tutti uguali si ha: Zn
= Qn(cosini}) 4 i sin (ni})),
Definizione 10.18 Dato un numero complesso u) diremo che z è radice n—esima di cose z" = 00. Proposizione 10.9 Dato un numero complesso co = q (c o s }1 4 i sm }) e un in tero n > 1, esistono esattamente n radici complesse n-esime di co, indicate con Zo.Zi, *zn-b ove .............
}1 4 2kn }1 4 2kn b i s in ), £ = 0 , 1, Zic = yQ (cos n n --------------
-----------
..........
n - 1.
Le radici — esime di un numero complesso si dispongono nel piano di Argand Gauss come vertici di un polìgono regolare di n lati inscritto nella circonferenza di centro (0 ,0) e raggio q » ove il vertice ¿q corrisponde al punto sulla circonferenza }1 di argomento —. n a i
Esempio 10.18 Si calcolino le 4 radici quarte dell’ unità nel campo complesso. Esse sono i numeri Zk = a/T ( c o s ()+^ t -b 1 sin Si ottiene: Zo = cos 0 4 i sin 0 = 1 2 jt -b i sin = cos f 4 / sin | = i Zi = cos ~ cos 4f jt 4- i sin 4n 44r = cos jt 4 i sin 7r = — 1 Z2 = COS _ 6tt 41 /: sm 6^t _ _ _ 3.t = cos f- 4 / sin f3tt = - i . Z 3 = cos •
£ = 0,1,2,3,
♦
i
Risultano pertanto essere i vertici di un quadrato inscritto in una circonferenza di raggio unitario.
152
Capitolo 10
Figura 10.3
Esercizio 10.7 Scrivere in forma algebrica e trigonometrica ì seguenti numeri complessi:
. i + tf 5 1 — i
2. (1 + z)10. 3. (2i + l)(3ì - 1). Esercizio 10.8 Calcolare le radici terze e quinte del numero complesso —i. Esercizio 10.9 Dati z = (1 - i); w = ( - 1 + iV 3), t = ( - 1 + i) determinare:
1- z,
F, z_1, uT1, r 1;
2. z25, u>9, t25.
LJKfc?'- v Jf
X
1
.7 ■v <
11 Spazi vettoriali
“L’importanza del viaggio non sta tanto nel sapere dove siamo, ma verso quale direzione stiamo andando, senza perd ere n ulla di ciò che troviamo lungo il percorso (Romano Battaglia: “Alle porte della vita”)
Il concetto di spazio vettoriale, che introdurremo in questo capitolo, è di grande importanza per le applicazioni che esso ha in vari campi della matematica, della fisica, dell’economia, della bio logia ecc. E cos a nota che la nozione di vettore trae ongine da problemi in cui, accanto a una valutazione quantitativa, sia necessario, per un dato elemento, precisare un a direzio ne e un verso. Comuni esempi di vetton in questo senso sono la v elocità, Fac ce lera zion e, la forza, il campo elettrico ecc . Si è già parlato anche di vettori come di particolari matrici di tipo ( 1./?) o (m, 1) (vettori riga e colonna rispettivamente) e si è osservato che, per esempio, vetton riga dello stesso tipo si possono sommare e moltiplicare per degli scalari (per esempio, reali) e che queste operazioni godono di certe proprietà. Anche in questo capitolo, il campo di riferimento, che potrà anche essere sottinteso, è il campo reale R. Tutte le pro prietà enun ciate rim angono però valide se si considera un campo qualsiasi. Definizione 11.1 Uno spazio vettoriale su R è un insieme non vuoto V di ele menti, che diremo vettori, sul quale sono definite due operazioni, una detta somma e l’altra moltiplicazione per uno scalare (cioè u n ’applicazione f : R x V -*■ V che a ogni coppia (k,v) con k € R e v e V associa uno e un solo elemento di V che sarà denotato con kv) le quali godono delle seguenti proprietà i) (V,+) è un gruppo abeliano ; ii) VA. e IR e Vu,u' e V è : k(v 4 - w) = kv + kw ; ^
€ R e Vv e V
è: (k
+
pt)v —kv
+
p v\
154
Ca pitolo 11
iv) VX. p € R e Vu e V vale l ’uguaglianza: X(juu) = (X/x)tr, v) Vv € V è: I r u = v. Esempi
1. Sia Matmx„(R) l’insieme delle matrici di tipo (m ,n) a coefficienti reali. Allo ra Matmxn(R) è uno spazio vettoriale reale rispetto all’usuale operazione di somma di matrici e alla moltiplicazione per uno scalare definite nel Capitolo 8. In particolare R" è uno spazio vettoriale su R. Come già detto, geometri camente R 2 rappresenta il piano cartesiano ed R 3 lo spazio cartesiano. 2. I vetton della fisica con le note operazioni di addizione (secondo la regola del parallelogramma) e di moltiplicazione per uno scalare, costituiscono uno spazio vettoriale. 3. L’insieme Rfx] di tutti i polinomi in una indeterminata a coefficienti reali, rispetto all’usuale somma di polinomi e al prodotto di un polinomio per un numero reale, è uno spazio vettoriale su R. 4. Fissato un intero non negativo n, l’insieme dei polinomi di R[ jc ] di grado minore o uguale a n è uno spazio vettoriale su R, rispetto alla somma di polinomi e al prodotto di un polinomio per un numero reale, (Verificarlo). 5. Sia R 8 1’ insieme di tutte le applicazioni reali di variabile reale. Allora, rispet to alle operazioni di somma e prodotto per uno scalare, così definite V /, g e
f + g ' R -^ R
R-*-, VX e R
tale che
X/ : R
R
e Vx e R
( / + g)(x) = / (* ) + g(x)
e
(À/)0c) = X/(;c)
si ottiene che R* è uno spazio vettoriale (reale), Elenchiamo, ora, una serie di proprietà della moltiplicazione per uno scalare che seguono immediatamente dagli assiomi definitori, dopo aver convenuto di indicare con Oy Felemento neutro additivo di V e con 0 il numero zero. Proposizione 11.1
S i a V u n o s p a z i o v e t t o r i a l e r ea l e , a l l o r a :
1) X0V = 0V, VX € R; 2) 0i> = 0v.VueV; 3)
se Xv = Oy allora o X =
4) (-X)v =
-Xv
= X ( - v ) ,
0 oppure Vv
v
= Oy ;
€ V e VX e R.
Spazi vettoriali
155
Dimostrazione. 1) Dagli assiomi che definiscono uno spazio vettoriale (essendo 0V l’elemento neutro rispetto alla somma di vettori e valendo la ii) della Definizione 11.1) si ha che: XOy = X(0 y -f- Oy) = XOy 4" XOy e, aggiungendo ad ambo i membri —XOy segue la tesi. 2) Sempre dagli assiomi definitori si ha che: Or = (0 + 0 )r = Ou -F Ou e, sommando ad ambo i membri —Or, segue la tesi. 3) Supponiamo, dapprima, che Xr = Oy e che X ^ 0. Allora X ha inverso molti plicativo X-1 e quindi: V = Ì V = ( X ~ ' X ) r = X - 1(Xv) = X ~ ' 0 y =
Oy.
4) Dal punto 2) e dagli assiomi definitori si ha: X)v Oy = Or = [X + (—X)]r = Xr -f (— Xv, si ha (— X)v = —Xv, e, sommando membro a membro — Dal punto 1) e dai soliti assiomi è infine Oy = Xfr -f (—i1)] = da cui si ottiene —Xi> = X(— v). ■
Xv + X (- v )
11.1 Sottospazi di un o spazio vettoriale Analogamente a quanto fatto nel Capitolo 9, quando abbiamo considerato ì sot togruppi di un gruppo (Definizione 9.7), siamo ora interessati a quei sottoinsiemi non vuoti dì uno spazio vettoriale V su un campo, che a loro volta siano spazi vettoriali sullo stesso campo, rispetto alle medesime operazioni definite in \ Definizione 11.2 Dato uno spazio vettoriale V su M, un suo sottoinsieme V ^ 0 è un sottospazio di V se U è spazio vettoriale su H rispetto alla somma e al prodotto per uno scalare definiti in V. Per verificare se un sottoinsieme è un sottospazio, è utile la seguente Proposizione 11.2 Un sottoinsieme U f 0 di uno spazio vettoriale V è un sot tospazio se e solo se VX e M e V u \ , w2 e U si ha:
a) «i +
«2
e U\
b) Xu j € U.
Capitolo 11
1 5 6
Dimostrazione. Se U è un sottospazio le condizioni a) e b) sono verificate per definizione. Viceversa, poiché le condizioni ii) —v) della Definizione 11.1 sono soddisfatte da tutti gli elementi di V e quindi, in particolare, dagli elementi di U , resta da verificare la i), cioè che U è un sottogruppo additivo di V . Verifichiamo quindi che V u\,u2 e U si ha che u\ —u2 e U, che è, additivamente parlando, la condizione affinché U sia sottogruppo di ( V \+ ). Infatti, per la b) si hache ( - 1)ì<2 = -«2 £ U, Vm2 e i / e quindi per la a) si ottiene che W]-f(—w2) = « 1- «2 € i/,V ni ,»2 G Í/ da cui segue la tesi. ■ Esempi
1. Ogni spazio vettoriale V ha come sottospazi (impropri) V stesso e il sottospa zio ridotto al solo Oy indicato con il simbolo {Oy }• 2. Sia V2(R) = R 2 lo spazio vettoriale delle coppie di numen reali e sia Wi = {(*,0 ) 1*
g
E}.
Ufi è sottospazio vettoriale di E 2: infatti siano w 1 = (*i, 0)
w2 = (* 2, 0)
due generici elementi di W e sia À G E, allora U)\ + w2 = ( * 1 , 0) + ( * 2, 0 ) = Xw\
=
à ( j : i
,0)
(*1 +
* 2 , 0 ) G W
= ( À . * i ,0 ) G W,
3. Analogamente a quanto visto nel caso precedente si verifica che il sottoinsie me W2 = {(0,)0l>! € R) c l 2 è un sottospazio di E 2. 4. Il sottoinsieme W costituito dalle matrici del tipo
0
~
a b a+b
è un sottospazio vettoriale dello spazio vettoriale Mat 2 x2(IR) delle matrici quadrate di ordine due a coefficienti reali. Infatti, se
0
a
b a -f b
allora
Spazi vettoriali
157
e, VA € R si ha Xa 0 A.b X{a 4- b)
e W.
5. Nello spazio vettoriale V costituito dai polinomi di grado < 3. verifichiamo che il sottoinsieme W = {ax 2 + bx\a,b e IR}
è un sottospazio. Infatti, siano v = ax
4- b x , w
=
e x " 4- d x
due genenci elementi di W. Allora si ha che: v + w = (a 4- c)x2+ (b + d)x e W
e
Xv = Xax2 4- Xbx e W.
Proposizione 11.3 Siano V uno spazio vettoriale ed S e T due suoi sottospazi. Allora Vintersezione insiemistica S C\T di S e T è un sottospazio di V. Dimostrazione. Siano 5, t due vettori di SC\T: per definizione s e t appartengono sìa ad S che a T. Poiché per ipotesi S è un sottospazio, allora s + t e S e X s e S . V X e R. Analogamente, poiché anche T è un sottospazio, segue che 5 4- 1 € T e Xs e T,WX e IR. Per definizione di intersezione segue che s 4- 1 e S H T e Xs e S fi T. V/ € ? e quindi sì conclude che S D T è un sottospazio di V. ■ Osservazione 11.1 L’unione insiemistica di due sottospazi non è in generale un sottospazio, come provato dal seguente controesempio. Sia E 2 lo spazio vettoriale delle coppie di numeri reali e siano
Wi = {(u>i,0)|it’i e E}
e
W2 = {(0,u'2)|it’2 e E}
due suoi sottoinsiemi. Abbiam o verificato che entrambi sono sottospazi (efr Esempio 11.2 , punti 2 e 3), ma, presi (1,0) e H j e (0.1) e W, nsulta che la loro somma ( 1, 0 ) 4- ( 0 . 1) = ( 1, 1), non appartenendo né a W\ né a W2, non può appartenere àW\\J W2. Definizione 11.3
Sia V uno spazio vettoriale e siano S e T due suoi sottospazi.
dagli elementi del tipo s + t al variare di s e t rispettivamente in S e T
Proposizione 11.4 La somma S 4- T di due sottospazi di uno spazio vettoriale V è un sottospazio di V. La dimostrazione è lasciata per esercizio.
158
Cap itolo 11
Esercizio 11.1 Nello spazio cartesiano R2, ogni retta passante per l’origine può essere descritta come un particolare sottoinsieme di R 2 della forma L = {( x,y) \a x 4- p y = 0}
Si verifichi che L è un sottospazio di R2. Esercizio 11.2 Nello spazio vettoriale Mat2K 2(R). verificare che il sottoinsieme costituito dalle matrici diagonali costituisce un sottospazio. Esercizio 11.3 Nello spazio vettoriale R r di tutte le applicazioni da R a Msi considen il sottoinsieme delle funzioni continue e si mostri che esso costituisce un sottospazio di RA 11.1.1 Sottospazio generato da un so tto in s iem e non vuoto
Definizione 11.4 Sia n un intero (n >1), siano vi,V2, . . . ,v„, n vettori di uno spazio vettoriale su R e Ài,À2. • •• ,A.„, n scalari di R. Allora il vettore li —
4" X2U2 4" ... 4“ Xnv
si dice combinazione lineare di V\,V 2 , . . . ,vn e k\,X 2 , ... ,X„ sono detti coeffi cienti della combinazione.
Esempio 11.1 Sia R 2 lo spazio vettoriale delle coppie di numeri reali e siano vi = (1,0), v2 = (0,1). Allora il vettore v = (5, - 7) si può esprimere come combinazione lineare di i>i,V2 nel seguente modo v
= (5, - 7) = 5(1 ,0) 4-
( —7)(0,
1)
=
5 w ì - lv2.
dove 5 , - 7 sono ì coefficienti della combinazione. Definizione 11.5 Sia S un sottoinsieme non vuoto di uno spazio vettoriale V sul campo reale. Si dice sottospazio generato da S, e lo si indica con {S), il sottoinsieme di V costituito da tutti e soli i vettori che sono combinazione lineare di un numero finito di vettori di S. L’insieme S è detto sistema di generatori per (S).
Osservazione 11.2 Se W è un qualsiasi sottospazìo di V, W può essere pensato come sottospazio generato da un conveniente sistema di generatori, per esempio W = (S), ove S = W. Il problema è stabilire se accanto a sistemi infiniti di generatori se ne possano determinare altri, formati da un numero finito di vettori e in questo caso quale sia il mimmo numero di vettori necessari a generare l’intero spazio in questione. Definizione 11.6 Si dice che uno spazio vettoriale è finitamente generato se esso ammette un sistema finito di generatori.
Spazi vettoriali
159
Esempio 11.2 La coppia di vettori e\ — ( 1,0), e2 = (0.1) costituisce un sistema finito di generatori per lo spazio vettoriale delle coppie di numeri reali. Infatti V v = (x,y) è
v = (x,y) = * ( 1, 0) + > ( 0 , 1). Le matrici E/,k (cfr. Esempio 8.9):
Esempio 11.3 £11 =
" 1 0 0 “
0
0 0
'0 £12 =
1
0 0
0 0
£13
=
£23
=
"0 0 0'
"0 0 0'
'0 0 0" £21 =
0
1 0"
1 0 0 —1 - - - - - 0 0 0 - - - - - - - 1 1
_ _ _ _
£22 =
0
1 0
0
0 1
sono un sistema di generatori per lo spazio vettoriale Esempio 11.4 Si consideri lo spazio vettoriale V+R) delle quaterne reali e i suoi sottospazi S = (CI,1,1 ,1) ,(1 , — 1,1, — 1)) e T = ((1,0 ,1.0),(1,2.0.2)) Si determini la forma dei vettori dello spazio S fi 7 e se ne indichi un generatore. I vettori s di S e t di T hanno la forma, rispettivamente
s = a{\, 1, 1, 1) + ¿ ( 1, — L I , - 1) = (a + b,a - b,a + b,a - b), t = c ( l , 0 , 1, 0 ) + d{ 1, 2 , 0 , 2 ) = (c + d, 2t/,c, 2d),
a,b e R
c,d e M
e quindi
S = {(a + b,a —b,a + b,a —b)\a,b e R} T = {(c + d,2d,c,2d)\c,d e R}, #
Poiché un elemento h di S n T appartiene per definizione sia ad S che a T dovrà essere del tipo:
h = (a + b,a — b,a + b,a —b) = (c + d,2dx,2d). Quindi uguagliando componente per componente, si ottiene il sistema I
a + b = c + d a —b — 2d
a+b = a —b =
c 2d
le cui soluzioni sono d = 0 , b — a, c = 2a. I vettori dell’intersezione sono gli elementi h = (2a , 0 ,2tf ,0) = «( 2,0, 2, quindi S ri 7 = (( 2 , 0 , 2 ,0 )).
e
160
Capitolo 11
11.2 Dipendenza e in d ip en d en za li n ea r e Sia Vuno spazio vettoriale sul campo reale, e siano uj ,t’2, . . . ,v„, n vettori di V, con n > 1. Definizione 11.7 Si dice che n vettori ui,V2, . . . ,vn sono linearmente dipen denti se esistono n scalari, non tutti nulli, À[,À2, . . . ,X„ tali che sia + X2V2 + . . . +
= 0 y.
In caso contrario i vettori si dicono linearmente indipendenti.
Esempio 11.5 Sia S = {t/i = (2,4, - 6),t >2 = (1,2,3), u 3 = (0 , 0 . 1)) C E 3;
esso è un insieme di vettori linearmente dipendenti in E 3. Infatti: (2,4, - 6) - 2(1,2,3) + 12(0,0,1) = (0,0,0). Proposizione 11.5 Per ogni intero n > 1, n vettori i'i,v2.........vn sono linear mente dipendenti se e solo se almeno uno di essi può essere espresso come com binazione lineare dei restanti.
Dimostrazione. Siano t>i,V2........ v„, n vettori linearmente dipendenti; allora esistono n scalari ori,ce2, ... non tutti nulli, tali che ori Vi + u2v2 4" •. • + &nv,, = 0 y. Non lede la generalità del discorso supporre che sia oc,, ^ 0 e pertanto un elemento invertibile di R. Sicché ori Vi +
012
V 2 + . . . + o r _ 1vw_ 1 — — oì „v „
da cui v n = - o n a n 1vi - . . . - Ctn-\Oln lv n- \
quindi vn è combinazione lineare di i>i,... ,v„_i. Viceversa si supponga che vn sia combinazione lineare dei restanti vettori vi,V2 ... ,v„-i, cioè che esistano x\,x 2, ... ,xn-\ € E
tali che V„ —X\V\ + - •. + Xn-iVn-i
Allora si ha che X] V\
4- X2V2 + . . • + (—l)u„ —Oy
che è una combinazione lineare dei vettori v\,v 2, ... ,v„ in cui i coefficienti non sono tutti nulli (infatti x„ = — 1 ^ 0), da cui segue la dipendenza lineare dei vettori in questione. ■
Spazi vettoriali
161
Osservazione 11.3 1. Un vettore t> e V è linearmente dipendente se e solo se è il vettore nullo, 2. Un sottoinsieme T di un insieme S di vettori linearmente indipendenti è anche esso costituito da vettori linearm ente indipendenti. Esempio 11.6
Dati i vettori u = (0,2,2), v = (1,2,3), w = (1,0,0) e R 3
dire se sono linearmente dipendenti o indipendenti. Consideriamo, al variare di a,b,c e M, la combinazione lineare: « ( 0 , 2 , 2 ) + 6 ( 1, 2 ,3) + c (l , 0 , 0) = (0 , 0 , 0) cioè (0,2«,2«) + (6,26,36) + (c,0,0) = (6 + c,2a + 26,2« 4- 36) = (0,0,0). Si ottiene il sistema r 6 -f c = 0 | 2 « + 26 = 0 l 2« + 36 = 0 che, risolto, dà solo la soluzione banale « = 0 , 6 = 0 , c = 0 . Si può concludere che i tre vettori sono linearmente indipendenti Esempio 11.7 Dire per quali valori del parametro reale k, il vettore v ~ (— 2,1 ,k) e M3
appartiene al sottospazio W = {u,u>), dove u = (1,1,0), tu = (2,6,1). Dobbiamo trovare dei coefficienti «,6 e R tali che valga l’uguaglianza: ( - 2,1,6) = « ( 1,1,0) + 6(2,6,1)
cioè (—2,1,6) = (« + 26,« + 66,6). Si ottiene il sistema
f « + 26 = - 2 | « + 66 = 1 l 6 = 6 che è equivalente a « + 26 = - 2 « + 62 = 1 6 =6
{
162
Capitolo 11
e anche al sistema ( a + 2k = - 2 \ k 2 - 2k = 3 [ b = k da cui si ottiene k — 3 , - 1 . Per k = 3 si ottiene a = - 8,fc = 3 e quindi si ha (—2,1,3) = — 8 ( 1, 1,0 ) + 3(2,3, 1). Per k = - 1 si ha a = 0 .b — — 1 e quindi ( - 2 , 1, - 1) = 0 ( 1, 1, 0 ) - 1(2 , - 1, 1).
11.3 Basi di uno spazio v ett ori ale Definizione 11.8 Un sistema S di vettori di uno spazio vettoriale di V se S è un sistema di generatori linearmente indipendenti.
V è una
base
Esempio 11.8 Sia V3(R) = R3 lo spazio vettoriale delle teme di numeri reali' ì vettori
e\ = ( 1,0 ,0 ), e2 = (0 , 1, 0 ), 3 = (0 , 0 , 1) costituiscono una base per R 3. Infatti V (atb,c) e R 3 si ha (a,b,c) = ae\ + be2 + ce2 e quindi
sono un sistema di generatori. Sono inoltre linearmente indipendenti; infatti, presi x,y ,z e R, considenamo una loro combinazione lineare:
xe\ + ye2 + ze3 = U , 0 ,0) + (0 ,^ , 0) + (0 , 0 , z) = (jc,y,z) = (0 , 0 , 0) otteniamo che x = y = z = 0 , e quindi segue l’indipendenza lineare. Esempio 11.9 Nello spazio vettoriale Mat2x2(R ), le matrici:
r i o[o 0 costituiscono una base
E
2= "o0 0r
e
3=
r o oi 10
£4 =
ol 0 1
"0
Spazi vettoriali
Infatti V A =
a b c d
163
si ha che A = aE\ -f bE 2 + cE 3 -f d £4 e quindi i vettori
dati sono un sistema di generatori. Che siano indipendenti si verifica, come nell’esempio precedente, considerando una combinazione lineare che dia il vettore nullo e deducendo che i coefficienti della combinazione debb ono esse re tutti u guali a zero. Siano perciò x y : J e ?. e sia
xE\ + yE 2 +
z E 3
+ tE 4 = x
'0 r "1 0 ' + z + >’ 0 0 0 0 — 1 0
— x 0 0 0 1 _ _ _ _
—
1
^ * *
0
+
1
l
1
= 1
-
1 -
0" “0 0 “ + t 10 0 1 — *
'0
1 _ 0 0 _ _ ^ 0 _ _ 1 I
1 1 0 0 -
1
+
1
+
_ _ 0 _ 1
-
1
1
0 0
•
0 0 1 1
Si deduce immediatamente che deve essere
x = y = z = t = 0 . Esercizio 11.4 Nello spazio vett oriale dei polin om i di grado < n a coefficienti reali, l’insieme 6 = {\,x,x2, . . . è una base.
Diamo, ora, senza dimostrarle, alcune proposizioni riguardanti proprietà delle basi di uno spazio vettoriale. Proposizione 11.6 Se uno spazio vettoriale ha una base formata da n vettori allora n + 1 vettori sono sempre linearmente dipendenti. Teorema 11.1
(della base) Se uno spazio vettoriale V possiede una base forma
ta da n vettori, ogni altra base è costituita da n vettori. Siamo, ora, in grado di attribuire a uno spazio vettoriale V un invariante legato al concetto di base.
Si dice dimensione di uno spazio vettoriale finitamente gene rato il numero di vettori che costituiscono una base.
Definizione 11.9
Esempio 11.10 Ritorna ndo agli esem pi fom iti per illustrare il concetto di base, si può notare che la dim en sio ne di V3OR) = R 3 è tre; la dimensione di Mat 2 x2(&) è quattro; nel caso dello spazio vettoriale dei polinomi di grado < n a coefficienti reali la dimensione è n + 1. Osservazione 11.4 Nello spazio R" , co me del resto in ogni spazio di dimensio ne n, n + 1 vettori, comunque scelti, sono sempre linearmente dipendenti.
164
Capìtolo 11
Sappia il lettore che esistono spazi vettoriali di dimensione infinita, che tuttavia noi non tratteremo. Per gli spazi vettoriali di dimensione finita, gioca un ruolo fondamentale il seguente teorema, di cui ometteremo la dimostrazione.
Teorema 11.2 (completamento della base) Sia V uno spazio vettoriale non nul lo, finitamente generato, di dimensione n : se iq,i>2, . .. ,vs sono s vettori linear mente indipendenti di V allora o s = n oppure è s < n ed esistono n —s vettori di V, indicati con u+uq,... ,tu„_s, tali che v\,v 2, . . . , i q , to i , . . . ,wn- s sia una base di V. Dopo aver osservato che sottospazi di uno spazio vettoriale di dimensione finita n hanno dimensione finita m con in < n , concludiamo enunciando una proprietà che lega le dimensioni degli spazi somm a U + W e intersezione U fi W a quelle degli spazi U e W
Proposizione 11.7 (formula di Grassmann) Siano U e W due sottospazì di di mensione finita uno spazio vettoriale V. Allora dim[U + W) + dim (U fi W) = dim U + dim W.
Definizione 11.10 Siano U e W due sottospazi di uno spazio vettoriale V dì dimensionefinita. Si dice che V è somma diretta di U e W e si scrive V = U(&W, seU + W = V eU n W = {0V}, Esempio 11.11
R 2 = W\ © W 2 (confronta Osservazione 11.1).
Esempio 11.12 Riprendendo l’Esempio 11.4 in cui dim S = 2, dir uT = 2. dim S H T = 1 si può concludere che dim(S + 71) = 2 + 2 — 1 = 3. Esercizio 11.5 Dati 1 seguenti vettori in R3, dire, senza fare calcoli, se sono linearmente indipendenti 1. l'j = (1,4, - 1),W2 = (0, - 1,1),1* = ( l , 0 , l ) ft>4 = ( - 1 . 1 . 0 ) 2. 1U! = ( 1,0 , - l),u-2 = (0 , - 1,1),u/3 = (1, - 1,0)
3. m = (1,0, - 1 ) ,« 2 = (0,1*2) Esercizio 11.6 Si determini per quali valori di h e k sono linearmente indipen denti 1vettori: v\ = (h, 1,0),U2 = (k,h, l )+3 = (— 2 , 0 , 2 ). Esercizio 11.7 Dati i vettori: a) v = (8,2,*,-10) e iq = (3,1 ,2,- 3) , v2 = (0,0,0,1), u3 = (1,0,1,0), b ) v = (l, 2,fc) e vi — (0 , 1, 2), v2 — ( 1, 1, 1), u3 = ( 1, 0 , - 3 ) . determinare, in ciascun caso, 1 valori del parametro reale k per ì quali il vettore r € (ui,u2,u3). Esercizio 11.8 Sia R 3 = V3(R) lo spazio vettoriale delle teme di numen reali e siano S = ((1,1,2),(1,1.1)) e T — ((1,2,3 ),(2,1 ,2)) due sottospazì. Determinare dim S, dim T, dim S fi T, dim(S + T).
Spazi vettoriali
Esercizio 11.9
165
An alog am ente al pun to preceden te si considerino i sottospa/i
S = ( ( 1, - 1,2),(0,1,1))
T = ((1,2, - 1),(0,3,1))
e
e si determinino dim S, dim T, dim S Pi T, dim(S + T).
11.3.1
Prod otto s c alar e c an o n ic o
Con tecniche di algebra lineare si possono trattare questioni metriche come calco lare distanze o ampiezze di angoli. Introdu ciamo, a tal fine, la nozione di prodotto scalare e di ortogonalità. Definizione 11.11 Sia V uno spazio vettoriale sul campo reale . Si chiama pro dotto scalare su V una funzione f : V x V -*■ R che si denoterà con f( u ,v ) = ( « , v) e si leggerà prodotto scalare di u per i\ la quale gode delle seguenti proprietà:
1. Vw,u e V è (u ,v ) = ( v ,u )
(proprietà di simmetria)
2. V u,v,w e V e V a, f e R valgono le uguaglianze: . . .. . .. .
(au + pv,w) = a(u,w ) + p(v ,w )
(w,au + M 3. («,w) > 0
=
a(w,u)+
anzi è (u,u) = 0
Definizione 11.12 spazio euclideo .
u = 0
Uno spazio vettoriale dotato di prodotto scalare su 3 è detto
Esempio 11.13 E" è uno spazio euclideo qualora per ogni coppia di vettori
V =
( v\ \ V-i
w l \ w~>
e
w = U1J
\ V n /
ri definisca il seguente prodotto scalare (detto prodotto scalare canonico > n
(v.w) = ^ 1= 1
ViWi.
f}(w. v)di
Esempio 11.14 Nello spazio ordinario riferito ad una terna cartesiana ortogona le, siano .v e y due vettori spiccati dall’origine: x
= (*i,*2»x3) e = (y .y .y ) y
1
2
3
Posto (x,y) = |*| • \y\ cos(*y), ove (xy) è l’angolo convesso formato da x e y, si verifica che è definito un prodotto scalare. Definizione 11.13 Dato un vettore v e V, si definisce norma di v Io scalare |!u|| = f( v,v ), ove il radicale è da intendersi in senso aritmetico. In base alle proprietà del prodotto scalare segue che:
1. ||u|| > 0 anzi ||u|| = 0
v = 0.
2. ||Àu|| = |A| ||u|| per ogni v e V e per ogni X e E. 3. ||u + w ||2 = ||u ||2 -1- 2 (v,w) + ||w ||2 per ogni v,w e V. 4. |(iun)| < ||u|| M || (disuguaglianza di Cauchy-Schwarz): vale il segno di uguaglianza se e solo se v e w sono linearmente indipendenti. 5. |||u|| - ||w||| < ||v + w\\ < ||u|| -f ||tu|| (disuguaglianza triangolare). Nota bene: il nome “disuguaglianza triangolare” deriva dal fatto che può essere interpretata come l’affermazione seguente: in un triangolo di vertici 0,u e v + tu, la lunghezza di un lato è minore della somma e maggiore della differenza delle lunghezze degli altri due.
11.3.2 Ortogonalità
La nozione di prodotto interno nello spazio ordinario è definita attraverso la no zione di coseno dell’angolo fra due vettori. In uno spazio vettoriale generico con prodotto scalare non è così naturale la nozione di angolo. Tuttavia la disugua glianza di Cauchy-Schwarz ci permette di definire il coseno dell’angolo tra due vettori u e v, non nulli. Poiché dalla 4. segue che
-1 <
(u,v)
■< 1,
~ IMI IMI -
esiste un unico numero reale 1?, 0 < $ < jt tale che cos ù —
(u,v) IM I I M I
Definizione 11.14 Diremo che due vettori u e v non nulli sono ortogonali se (u,v) = 0, cioè se cos # = 0.
Spazi vettoria li
167
Definizione 11.15
Un sistema S di vettori di uno spazio euclideo V si dira o r togonale se ogni coppia di vettori distinti di S è ortogonale .
Se poi Si ed Si sono due sotto insie mi tali che tutti gli elementi di Si sono ortogonali a tutti i vettori di S 2 , diremo che Si è ortogonale ad S 2 e scriveremo 5,152-
Definizione 11.16
Un sistem a S di vettori di uno spazio euclideo V si dirà ortonorm ale se S è ortogonale ed ogni vettore di S ha norma unitaria (cioè Vv € S => ||v|| = 1).
Osservazione 11.5 Un sistema ortogonale S = {w,}l6/ che non contenga il vet tore nullo è formato da vettori linearmente indipendenti. Infatti, sia X X
m»
= Oy.
Poiché 0 = (0vMj) = ( XXw ,,« y) = XX / ( wi ’My) = kj
u j
e inoltre, poiché
u j fi 0, deve essere kj — 0 .
Teorema 11.3 Ogni spazio vettoriale euclideo di dimensione finita ammette una base ortonormale.
Osservazione 11.6 Nello spazio R", i vettori de lla base ca nonica costituiscono una base ortonormale. Esempio 11.15 Nello lo spazio eu clideo delle tem e di numeri reali R 3 si con siderino i due vettori u = (
\3
3 3/
e v = ( 0 ,-*=,- 4 = ) e si determini un
V
V2 /
vettore w tale che B = {u ,v,w } sia una base ortonormale.
Siaic = U,;y,z) e R3. Poiché deve essere wA-u e wA.v, imponiamo le condi zioni (iu,w) = 0 e (w,v) = 0. Otten iam o il sistema 1
2
2
= 0 5* “ 3y + 1 1 0 y H — —z V X V X *z + >’2 + Zz2 _ = 1 che è equivalente al sistema [ X - 2y + 2z = 0 \ x = 2y — 2z = —4z = 0 => j y + z y = - z x2 + y2 + z2 = \ [ 16 z 2 + z 2 + z 2 = 1
[ x = - 4 z rr => | y | 18z2 = 1.
1 2VX +V X -V X Le soluzioni sono quindi: w\ = ( ------ , ------- , ------- ), W 2
— 2V X
—VX
VX
(— r - ■' i T ’T ’
168
Capitolo 11
Esercizio 11.10 Si provi che la funzione da / f(u yv) = uTv è un prodotto scalare.
: R" x R"
R, definita da
Esercizio 11.11 Si consideri lo spazio euclideo R 3 (dotato del prodotto scalare canonico, definito nell’Esempio 11.14). Si dica se i seguenti insiemi sono ortogo nali: 1. A = {a,b), « = (1,2,2), b = (2,1, - 2 ) . 2. C = {a , b , c) con a = (1,2,2), b = (2,1, - 2), c = (0,1,0). 3. X = (a, )>, z } con .x = (0 ,2 , 1), y = (2 , 0 , 0 ), z = (0 , - 1, 2). Esercizio 11.12 Nello spazio euclideo R 3 (dotato del prodotto scalare canonico) si determini:
1 l.a l’insieme S dei vettori ortogonali al vettore u = ( 1 1 l.b
si verifichi che S è un sottospazio di R3;
2.a l’insieme T dei vettori ortogonali ai vettori w = 2.b si verifichi che T è un sottospazio di R 3.
O l e r
0 i I; o
12 Determinante di una matrice
“Se non riuscite a eccellere con il talento, trionfate con lo sforzo.” (Dave Weinbaum)
La nozione di determinante, f on da m en tale n el l’alg eb ra linear e, si fa risalire a Leibniz1, in relazione alla riso luz ion e dei sis tem i linea ri. Il nom e “dete rm ina n te” sembra sia dovuto a Gauss2* , ma nella trattazione di questi concetti ci sono stati i contributi di molti m atem atici, da L ap lac e a B inet, da K ron eck er a Cayley \ mentre la forma con cui è no ta og gi la te oria è d ov uta a Ja co bi4. Il lettore può aver incontrato nelle scuole medie superiori la nozione di de terminante di una matrice quadrata A =
a ^ c d
e Afat 2*2
det k - a d - bc. Si vede che det : M a t 2 x 2 (M) — > K è un’applicazione che a ogni matrice di tipo ( 2 , 2 ) associa uno e un solo numero reale. Si pone, ora, il problem a di es ten de re la def inizio ne di fun zion e “d et” per una generica matrice quadrata di or dine n qualsiasi. Si osserva che il caso n — 1 è bana le in quanto se A = [a] si può porre det(A) = a. Sia quindi n > 2. Definizione 12.1 Dato l ’insieme M a tnxn(R ), si definisce det : M atnxn(\ R) — > R
'Gottfried Wilhelm Von Leibniz (Lipsia 1646-Hannover 1716) 2Karl Friedrich Gauss (Brunswick 1777-Gótting en 1855) -Arthur Cayley (Richmond, Surrey, 1821-Cambridge 1895)
4Karl Gustav Jacob Jacobi ( Postdam 1804-Berlino 1851)
170
Capitolo 12
lafunzione che a ogni matrice A e M atnxn(R ) associa il numero reale
det(A)
=
E
£•(<7)«ltr(l)«2cr(2) • • •
&na(rì)
aeSn
ove Snè il gruppo di tutte le permutazioni su { 1 , 2 , . . . ,n) ed e (o) = 1 se o è una permutazione pari, e(cr ) = — 1 se o è una permutazione dispari.
Naturalmente salta subito all’occhio che la somma che compare nella defini zione consta di n ! addendi, essendo |S„ | = n !. Inoltre in ciascun addendo compare uno e un solo elemento per ogni riga e per ogni colonna. Notando che la definizione di determ inante è simmetrica rispetto alle righe e alle colonne segue immediatamente la seguente Osservazione 12.1 Per ogni matrice quadrata si ha che det(A ) = det(Ar ). Notazione 12.1 Per ogni A e Mat,lxn(IR), l’immagine tramite la funzione “det” a i i • • • a\„
si indicherà con det A. Sono simboli usati anche | A| e o,i i • • • ann
Dalla definizione di determinante, seguono le seguenti Proprietà 12.1
• • • b\x • • • " •• • b\i +c\, • • •“ • » 1. det •• • • • • = det • • • *♦ • • • + det •' L • • • um J _ *** bm + cni *• ' _ •••
• • • X d \i • • •
2. det
‘ • ♦ •• ♦• • = A. det ♦•• _ . . . _ • • • Xcinl • • • _ •
•• •
3. det
••t _• • •
a \ ì ' 9*ci\j •
#
•
a,n • ' - a nj
•••
Cl\/
L
. . . C\i • • • • • «• •• • • • J • • • Lni
•••
•
*• • • • a,,, • • • _
•••
• ♦• = —det • #• _ • *• • • •_
Cl[ j * • • (l {i
•••
••• •* • • a , u • • • _ •
onj
4. det [/„ ] = 1 Le proprietà 1. e 2. affermano che la funzione “det” è lineare sulla /-esima colon na, per ogni i = 1,2,... ,n, e quindi multilineare, mentre la 3. esprime il fatto che la funzione è alternante, cioè che, scambiando tra loro due colonne, il det(A ) cambia segno. Esempio 12.1 Calcoliamo ora, in base alla definizione, il determinante delle ge neriche matrici quadrate di ordine 2 e 3.
Determ inante di una matrice
171
«n a i2 ; in base alla definizione è <321 «22
1. Sia n = 2 e A =
det(A) = £]e(
a 11 «12 «21 «22
Ricordando che = {/,(12)} e che uno scambio è una permutazione dispan, si ottiene: det(A) = «11022 —« i 2« 2i, che è l’espressione ricordata precedentemente 2. Per n = 3 è |S3| = 3! = 6 e S3 = {/,(123),(132),(12),(13),(23)}, ove l’identità e i 3-cicli sono permutazioni pari mentre gli scambi sono permutazioni dispari. Quindi se A =
« 1 1
« 1 2
«13
« 2 1
« 2 2
«23
_ «31 «3 2 «33 _
det(A) =
£ (« )«lor(l)«2i7(2)« 3cr(3) — creSi
= « I l « 22 «3 3 + « 12 «2 3« 31 + « 13 «2 1« 32 — —« 12«21«33 — «13 «2 2«3 1 ~ «H «23 «32-
Osservazione 12.2 Calcolare il determ inante di una matrice utilizzando la defi nizione diventa molto laborioso già a partire dal caso n — 4 : infatti si tratta di calcolare la somma (algebrica) di 4! = 24 addendi, ciascuno dei quali è il prodotto di quattro fattori. Per scrivere lo sviluppo del determinante di una matrice (quadrata) di ordine 3 si può seguire la cosiddetta R eg ola di S arr us 5. Si accostano alla matrice data le prime due colonne della stessa, ottenendo così una matrice dì tipo (5,3). Si scrivono con il segno “+ ” i tre term ini che sono prodotti di elementi situati sulla diagonale principale e sulle due ad essa parallele, mentre si scrivono con il segno i tre termini che sono prodotti di elementi situati sulla diagonale secondaria che su quelle ad essa parallele secondo il seguente schema: ’ «11
\
«Il «12 «13
se A —
«21 «22 «23
«21
allora
_ « 31 «3 2 «3 3- -
«31 _
/
«12
\
«13
«12
/
/
/ \
/ \
/\
«21
«22
«32
«33
«31
«32
«22
/
«23
«11
\
\
_
e quindi si ottiene det(A) =
an<222«33
+
«12«2 3«31 + «13«21 «32 — «13«22«31 — «H «2 3« 32 — «12«21«33‘
Pierre Sarrus (1798-1861), Professore alla Facoltà di Scienze di Strasburgo.
45D i
172
Capitol Capitolo o 12
12.1 Prime prop pr opri rietà età dei d eter et erm m i n an t i Riportiamo alcune proprietà che seguono immediatamente dalla definizione e dal le prop propri rietà età di linearità linearità e di di alternanz alter nanzaa enun en unciat ciatee ne nella lla Prop Pr oprie rietà tà 12.1, 12.1, e che sara saran n no mol molto to util utilii nel segu seguito. ito. Una riflessione riflessio ne sulla sul la sim s imm m etria et ria rispetto risp etto alle righe e all allee M atnx„ nx„{ { R ), suggerisce colonne della matrice A € Mat sugg erisce immediat imme diatam amente ente che og ognu nuna na dell de llee propri proprietà età qu quii di seguito seguito riportate rimane rima ne va valida lida se nel n ell’enun l’enunciat ciatoo si scam scambi biaa il termine riga con il termine colonna. 1. Se un unaa riga di A è tutta costituita costitu ita da zeri è de det(A t(A)) = 0. 2. Se la matrice A è moltipl mol tiplica icata ta pe perr X si ha che det(ÀA) det(ÀA) = À" det(A). 3. Se du duee righe righe di A sono fra loro proporzio propor zional nalii allora allo ra det(A det( A ) = 0. 4. In partico particolar lare, e, se la matrice A ha due righe righ e uguali ugu ali allor al loraa det(A) det(A ) = 0. 5. Se una riga di A è combin com binazi azione one line l ineare are dell d ellee altre a ltre il determin deter minant antee di di A è nullo.
1 3 3 6 -5 4
0" 0 y allora allora det(A) = — 21 . Esempio 12.2 Sia A = 7 "1 3-51 osserv rvar aree Se invec invecee vogliamo vogliamo calcolare calcola re det (fi) (f i) ove B = 3 6 4 y basta osse 0 0 7 che si tratta del determinante della matrice trasposta di A per concludere che è det(fi) = det(A) = — 21. Esempio Esempio 12 12.3 .3 Senza sviluppare il determ det ermina inante, nte, dimost dim ostrare rare che risulta
1 1 det(A) = det 2(a —b ) 2b l e "
0
b —a
Basta Basta osservare osservare che det(A) det(A ) = —2 det
—b —c
0 1 1 " (b — a ) — —b b —c
- 2 - 0 = 0, avendo
[b — a) —b —c _
la matrice due righe uguali.
12.2 II teorema teorema di Laplace Lap lace s u ll o s v il u p p o del determinante min ore comple complemen menta ta Definizione 12.2 Sia A — (a¡j ) e A/a/„xn(R). Si chiama minore re di a,j il determinante della matrice ottenuta da A sopprimendo la riga i-esìma e la colon colonna na j-esima. Esso sarà indicato indica to con il simb si mbolo olo A ,,. ,, .
De terminan te di una matrice
Esempio Esempio 12.4
173 173
Sia Si a
A =
14 9 2 5 1 3 6 4
il minore complementare di a 13 è
A 13 = d e t
^21 = d et mentre quello di «21 è: ^21 et Definizione 12.3 12. 3
2 5 3 6
4 9 6 4
= -3
= -38
57 chiama complemento algebrico (o cofattore) di atJ Vele
mento (-1 ),+J A, j. j. Esemp empio 12.5 12.5
II com co m plem ple m ento en to alg eb ric o di a 13 è
1)1+3 d e t M o ) = ( —l (— 1)1+3 —l ) 4 d e t
2 5 3 6
= -3
4 9 6 4
= 38
mentre il complemento algebrico di «21 è
1)2+1 det(y421 ( — 1)2+1 det(y421) = ( —l )3 d et
Ricordando il significato del simbolo di Kronecker introdotto al Capitolo 8, siamo in grado di enunciare il
Laplace6) Sia A = (
8l kd kdc t ( A) = t a A - l ) i+JA jk jk . 7=1
Tali formule per i = k forniscono lo sviluppo del determinante di A secondo, rispettivamente, la i-esima riga e la i-esima colonna. In altre parole il det( A) è uguale alla somma dei prodotti degli elementi di una qualunque riga (o colonna) moltiplicati per i rispettivi complementi algebrici. Il procedimento riduce il calcolo del det(4) di ordine n al determinante di una matrice di ordine n — l e così via, iterando il procedimento.
6Pierr ierree Simon Simon de Laplace (Be aum ont-enont -en- Auge Au ge 1749-Pan 1749- Pan s 1827) 1827)
174
Capitolo Cap itolo 12
Osservazion Osserv azionee 12.3 12.3 Per i ^ j è nulla la somma dei prodotti degli elementi di una qualunque qualunque riga r, (o colonn a c, c, ) moltipl mo ltiplica icati ti per pe r i com pleme ple menti nti algebrici algebrici di j=- j) . una una qualu qualunque nque altra altra riga r y (o colonn a cy c y) para llela (con / j= Esempio Esem pio 12.6
Data ' A=
3 2 -8
5 - 1“ 4 0 € M a ì 3 0 1
x
3(®0
calcoliamo il det(A), utilizzando il teorema di Laplace. Scegli Scegliamo amo,, per esempio, la terza riga (r 3 = [ — 8 0 1 ]) e procediamo proced iamo calc calcol olan ando do i complementi comple menti algebrici algebri ci di a 31 = —8, <332 = 0 e di 333 = 1. Essi sono
1)3+1 det A31 = (— 1)3+1
A32 = ( — 1)3+2 det
A33 = (—1 (—1)3+3 det de t
5 -1 4 0
= 4
3 -1
2 3 5 2 4
0
=
-2
= ( 1 2 - 10) = 2 ,
Si conclude che det(A) det(A) = <231^31 + <332^32 + « 33^33 = = - 8 • 4 + 0 • (- 2 ) + 1 • 2 = -3 2 + 2 = - 3 0 . Osserviamo Osserviamo che che la scelta della riga rispetto alla q uale sviluppare svilupp are è stata oper operat ataa te te nendo conto che è ovviamente sempre vantaggioso utilizzare la riga, o la colonna, in cui compare il maggior numero di zeri. Esem pio 12.7 12.7
Sia
"1 0 B = 0 1
2 1 0 2
3 4 5 -1 6 3 0 2
e Mat 4 4(R). x
Per calcolare det(#), usando lo sviluppo di Laplace, scegliamo la prima colonna, in cui cui a2 a 2i = z/31 = 0 ; sicché ri
1)1+1 det det (fi) (fi) = a u (— = 54 - 57 = - 3
_ O _ _ < _ N
1
~2 5 -1 " 6 3 + a 4i(—l)4+l det 1 0 0 2
3 45 -1 6 3
De term inante di una matrice
175
Infatti
"1 det de t 0 2
det
2 3 4 1 5 -1 06 3
5 - 1“ 6 3 = 12 + 3 0 + 1 2 = 5 4 0 2
= 2 ( 1 5 + 6 ) - ( 9 - 2 4 ) = 4 2 + 15 = 5 7 .
Esempio 12.8 Determinare pe r qua li va lori del p ara m etro r eale k si annulla il determinante della matrice A (o equivalentemente per quali valori di k € l è singolare la matrice A) ove ov e
A =
(-1 -* ) 0 3 -1 (2 — k) 1 -2 0 (4 (4 - k)
Nat Natu uralm ralmen ente te si può p erve er ve nire ni re a lla ll a s o lu z io n e d e l l ’es e rc iz io in vari va ri m od i. Volen Vo lendo do utilizzare il teorema di Laplace, poiché lo sviluppo del determinante, rispetto alla seconda colonna, è det(A t(A) = (2 - k) det de t
(-1-*) 3 -2 ( 4 - k)
= (2 (2 -
= ( 2 ~ k ) [ ( - l - * ) ( 4 - * ) + 6] =
k)(k -2 3* + 2) = (2 - k ) ( k - 2 - 1)
si ha che che det(A) = 0 se e sol s olo o se k = 2 o k = 1. Definizione 12.4 Si dice determinante delle differenze (o di Vandermonde 7) il determinante della seguente matrice
n-l 1 1 a¡ a f . . . a } n -l 1 a 2 «2 ••• a2 V
n .. . a% 1_ _ 1 an a 2 Eser sercizio izio 12.1 Provare che il de term te rm inan in an te de lle differe diff erenz nzee si ann ulla se e solo se a, = aj per qualche i ^ j .
7Alexa lexan ndre Théophile Théophile Vandermonde ( Parigi 1735-17 96) fu ma tematico , fisico, ec on om is t
Infatti
1 a\ a\ ... a n 1 a2 a\
a
1 -I
n- 1
det n —ì _ l a n a£ . . . a”
= (a2-
ö i )( ö 3 -
•
•
^i) • • • (ö „ —tf 1X 03 — a2) • • • (ö ;i _ i — ö 2)( ö « — a2) . ..
(a„_i - an- 2)(an - an- 2) • • • (an - a„_ !) = 0
se e solo se uno dei fattori si annulla e quindi se e solo se a, = a} per qualche ì £ ì • Formuleremo, ora, nella sua accezione più semplice il classico Teorema 12.2 (di Binefi) Siano A e B due matrici quadrate dello stesso ordine n e sia C = AB. Allora det(C) = det(A ) • det(Z?). Osservazione 12.4 Nota bene che l’analoga proprietà no n vale per la somma. Consideriamo infatti il seguente controesempio: siano A=
10 11
B =
2 0
2 1 G M at2x2(R)
Allora det(A) + det(£) = 1 + 2 = 3 mentre 30 det(A + B) = det 3 2
= 6
Quanto sin qui discusso, a proposito di determinanti, ci consente di stabilire ’‘ra pidamente” se n vettori a\,a2, . . . ,an e M" siano (o no) linearmente indipendenti. Sussiste, infatti, la seguente Proposizione 12.1 Siano ai,a 2, .. . ,a„, n vettori di ÌRM; essi sono linearmente indipendenti se e solo se det [ a t a 2 | *• * a„ ] ^ 0 . *Jacqucî-Philippc-Mane Binet (Rennes 1786 - Paris 1856)
A
Determinante di una matrice
177
Dim ostrazione. I vettori a j , a 2, . . . ,a„ € R" siano linearmente ìndipendem; per ipotesi e quindi, essendo in numero di n - dimR", costituiscono una base. Per tanto i vettori fondam entali ei,e2, .. . ewsi possono esprimere come loro c o m b i nazione lineare cioè si ha che n
e, = ^ 6 ,(a7, (/ = 1, 2 ...«). j =i Posto quindi A = [ ai | a 2
•
•
a„ ] e B = (bJt) è:
•
AB = [ ej | e 2
•
, ]=
•
10.0 0 1.0 • • •• 0 0 .1
e, poiché det(/„ ) = 1, dal teorema di Binet segue che det(A) ^ 0. Il viceversa è banale.
Esercizio 12.2
Siano b\ b2 £ Mat2x2(R). - b 2 bi
a i a2 —<22
Dimostrare che vale l’uguaglianza: (tfj + a2)(b\ + ¿2) = (ci\b\ — a2b2)~ -f 0*2^1 + # 1^2)“Determinare il valore del parametro reale * per il quale è singo lare la matrice A ottenuta come prodotto delle matrici
Esercizio 12.3
0
e Esercizio 12.4
C =
Mostrare che sono linearmente dipendenti i vettori:
«i = (1.2,3), v2 = ( -2 .1 . - 5), uà = (0.5.1) € R3. Esercizio 12.5
Determinare il valore del parametro reale k per cui i vettori
Vì = (1,2,*,* - 1), v2 = (0.1, - 1,*), t'3 = (1,0,0,1), 14 = (*.0.0.0) € Ri
sono linearmente indipendenti.
178
Capitolo 12
12.2.1
Matric e in ver sa
Ricordiamo che, data una matrice A e Mat„xn(R), si dice inversa di A una ma trice B (se esiste) tale che A B = B A = /„. Affrontiamo, ora, il problema dell’esistenza della matrice inversa, utilizzando gli strumenti che abbiamo introdotto in questo capitolo. Supponiamo che, data una matrice A, esista la sua inversa B. Poiché per definizione si ha che AB - BA = /„, passando ai determinanti e tenendo conto del teorema di Binet si ha: det(Afl) = det(A) • det(fl) = det(/„) = 1 da cui si ricava che deve essere det(A) ^ 0 . Si deduce inoltre che
1 det(fi) = det(A-1) = det(A) Si può mostrare che A 1 = (a,k ) ove u,k =
Ah
det(A)
e At, è il complemento algebrico dell’elemento cik, della matrice trasposta A
10 1 Esempio 12.9 Calcolare la matnce inversa di A =
2 10
0 11
Procediamo per passi successivi: 1. Calcoliamo det(A), È det(A) = 3 ^ 0 , quindi la matrice A è invertibile.
12 0 2. Scnviamo la trasposta di A. E: A7 = ’0 1 1 10 1 3. Costruiamo la matrice dei complementi algebrici di A 1, detta matrice ag giunta (di A), nel seguente modo det ‘ i r -det '0 f 01 11 aggi A) =
--det ‘ 2 0 ‘ _° 1
'0 r L! 0
det
1
det '1 0 ' —det 11 1
det ‘ 2 0 ' -det "l 0 " 11 01
det
1 o t _
_
o _ _ 1
"1 2" 0 1
1 - 2
2
1 -1 1
2
-1
1
De term inante di una matrice
179
4, In base a quanto sopra osservato è A" 1 =
Esercizio
12.6
agg(A)
1
det(A)
3
1
1 -1
- 2
1
2
2
- 1
1
Nel caso in cui esistano, scrivere le matrici inverse di A=
10 0 0 10 4 0 1 1
C =
H =
- 2
1 -1
0
1 0
2 - 1
111 0 11 00 1
1 -1
-2
1
2
2
-1
1
D =
12.3 Sistemi di n equazioni in di Cramer
1
ri incognite:
teorema
Ritorniamo, ora, ad analizzare il generico sistema lineare di n equazioni in n incognite 0 1 1* 1 + 0 1 2* 2 + • • ° + 0 1« *« 0 2 1* 1 + 0 2 2 *2 + . • . + 0 2« *«
b\ b2
0«1*1 4" 0«2*2 4“ • • • 4" 0««*« — bfi che, come già visto, in forma matriciale, si rappresenta nel seguente modo:
0 n 012 •• • 01« 021 022 • • - 02«
*1 " *2
b\ ' b2 —
•
»
cioè Ax = b
•
_ 0«1 0«2 • • • 0«« _
*« _
_ K _
011 012 • • • 01« " JC2 021 022 • • • 02« ove A = è la matrice dei coefficienti, x = •• il vettore •* •• •• •è ♦ • • • • _^/il &n2 • • • ^ ìììi _ - _ b\ b-> il vettore (colonna) dei termini noti. (colonna) delle incognite e b _bn _
180
Capitolo 12
Teorema 12.3 (di Cramer 9) Un sistema lineare Ax — b di n equazioni in n incognite con det(A) ^ 0 ammette una e una sola soluzione. Dimostrazione. L'ipotesi det(A) ^ 0 garantisce, in virtù di quanto visto prece dentemente. 1'esistenza (e unicità) della matrice inversa A -1 . Allora una soluzio ne w del sistema soddisfa l’uguaglianza Aw = b Moltiplicando, quindi, ambo i membn per A-1 si ottiene: A-1 Aw = /„w = w = A- I b. D'altra parte, poiché A(A- 1 b) = (AA_1)b = 7„b = b, segue che A- I b è solu zione del sistema. Quindi la soluzione esiste ed è unica poiché unica è l’inversa di A. Dalla dimostrazione del teorema di Cramer si deduce la seguente: Osservazione 12.5 (Regola di Cramer) Se il sistema Ax = b ammette una ed una sola soluzione, essa è della forma w = (xi,x 2........ *n) ove Xi =
det(A,) det(A)
e la matrice A, si ottiene da A sostituendo alla sua i -esima colonna, la colonna b dei termini noti. Esempio 12.10 Risolvere, se possibile, il sistema
= -2 [ x + y j x + 3 y + z = 2 l 3 jc + 7 y —z = 5. Il sistema scritto in forma matriciale è
1 0 “ ~X '1 Ax = 1 3 1 y 3 7 -l
"
- _ 2 " 2 5.
Poiché det(A) = - 6. il sistema ammette una e una sola soluzione e precisamente si ottiene: i — 2 1 0 1 1 —2 f 1 _9 0 1 3 1 2 1 ! 2 3 1 1 5 7-1 3 7 51 5 9 3 5 -1 j L
—6
2
—6
è la soluzione cercata.
,G* W** 17B4- Bagno les 1752)
2
—6
Determinante di una matrice
181
Esempio 12.11 Per quali valori del parametro reale k il sistema: ì x+ y = 1 | kx 4- 2y — -3
ammette una e una sola soluzione? Scritto il sistema in forma matriciale:
basta imporre che la matnce A sia non singolare, cioè che det(4) = 2 - k £ 0. e quindi k ^ 2. Esercizio 12.7 Risolvere, usando il metodo di Cramer, i seguenti sistemi lineari: •
4-4 z =
5
- 3 z = - 4 4x + 2 y + z = - 5
1)
2)
y
X
i 2x * +3 V 4-2 z l
— 3
-y - 3 z =
y
4- z
=
-8 2
| x +2y +3z = 1 3) | 3x A-2y +z = 0 l x 4-v 4-Z = 1.
12.4 Caratteri stica o rango di una matrice Definizione 12.5 Sia M e \fa tm, r.<.E si dice caratteristica rango de. a iruitrice, e viene indicato con car M o con rg( M ). il massimo ordine di un mmont non nullo estraibile da M.
Osservazione 12.6 È immediato osser- are eie >e ' e
? e
0 < car M < minfm.n}. In particolare car Ai = 0 se e solo se ogni elemento di .«/ è uguale a zero eroe >e e solo se M è la matrice nulla. Se M € Matnxn{R >è car Si = n s e e solo se dei- Si »# 0. :USi confronti la Definizione 8.20
182
Capitolo 12
In base alla definizione che abbiamo dato, una matrice M ha caratteristic a r, quando esiste un suo minore di ordine r non nullo, mentre tutti i minori di ordine r+ 1, r+ 2 ,. . (qualoraesistano) sono nulli. Poiché ogni mino re di ordin e r + 2, in base al teorema di Laplace, si esprime come combinazione lineare di minori di ordine r + 1, si deduce che una matrice M ha caratteristica r se esiste un minore non nullo di ordine r mentre sono nulli tutti ì minori di ordine r + 1. Osservazione 12.7 Sia M e Matmxn(R) allora car M = car M r . \
E evidente che la caratteristica di una matrice non cambia se: i) si aggiunge o si toglie una riga tutta di zeri; ii) si permutano le righe (o le colonne); iii) si aggiunge una riga (o una colonna) che sia combinazion e lin eare delle righe (o delle colonne) della matrice. Interpretiamo, ora, il concetto di caratteristica (o rango) in termini di dimensioni di opportuni spazi vettoriali: Proposizione 12.2 Sia A e Matmxn(R): poiché A può essere ottenuta per accostamento dì n vettori colonna o di m vettori riga, cioè sì può scrivere:
ci C2
a»
A = [ ai | a2
3=
allora
car (A) = dim < ai,a2....... a„ > = dim < cj,c2, .. . ,c,„ >. Quindi, se una matrice ha caratteristica r, risultano lin earm en te dipendenti r + 1 righe o colonne, comunque scelte. Dimostrazione. (Traccia) Sia car (4) = r. Non lede la gen ericità del discorso supporre che il minore di ordine r non nullo sia quello formato dalle prime r righe ed r colonne della matrice, cioè sia «Il * « ♦
« t •
ar\ «(r+l)l • • •
(lm\
«Ir
«l(r+l)
• •
• • ♦
• • •
« r r
«r(r+1)
«(r+l)r
•
•
•
m •
♦ •
.
» .
% •
« •
amr
•
det
»
• • ♦
•
•
9 9
♦
•
arn &(r+l)ti • « •
t •
a\\ • ** a\r ove è
«1»
• • •
»
#
Qmn
Determinante di una matrice
183
Dopo aver mostrato che le prime r righe (o r colonne) sono linearmente indipen denti, si prova che ogni a ltr a riga (o colo nna ) è loro combinazione lineare ■ Dalla p re ce de nte prop osizione , si ricava una regola per la detenni nazione della cara tteristica.
12.4.1
Pro ced im en to di Kr on ecker
Sia Mr un minore di ordine r della matrice M = (mtJ) e Matmxn(E); se r < m ed r < n, esistono minori di ordine r 4- 1.
Definizione 12.6
Si dicono m in o ri orla ti di M, quei minori di ordine r + 1di M che con teng on o M r come minore di ordine r.
Illustriamo, ora, il procedimento (costruttivo) di Kroneckeri 1 Se ogni ele mento m,j di M è nullo si ha car M = 0; in caso contrario esiste almeno un elemento non nullo mrk, e poniamo M\ = mrk. Se tutti gli (m - 1)(n - 1) minori di ordine 2, orlati di M i, sono nulli, la caratteristica di M e 1 In caso contrario esiste almeno un minore di ordine 2, M 2 , diverso da 0. Se tutti gli (in - 2 )(n —2) minori orlati di M i sono nulli, la caratteristica di M è 2, in caso contrano esiste almeno un minore non nullo di ordine 3, A/ 3, e cosi procedendo si determina la caratteristica di M .
Esempio 12.12
Determinare la caratteristica di 12 3 2 3 4 3 5 7
Anzitutto osserviamo che, essendo M e M at 3, 3(^1 si hacar( M ) < 3, Inoltre è car(Af) / 3 poiché de t (M ) = 0, esse ndo Tultima riga combinazione lineare delle pnm e due. Pos to M\ = m \\ = 1 esiste almeno un minore di ordine 2 non nullo che lo contiene, per esempio car ( M) = 2.
quindi
Esempio 12.13
Determinare la caratteristica di 1 2 3 -4 0 5
E
Mcit2x3Ì$0-
Poiché B non è la matr ice nulla si ha che 0 < car \B) < 2 e, poiché
1 2 -4 0
’’Leopokl Kronecker (Liegrutz 1823- Berlino 1891)
e
car ( B ) =
E se m pio 1 2.1 4 D e t e rm i n a re l a c a r a t t e r i s t ic a d e l l a m a t r i c e
023 04 6 069
C =
Poiché C € Mfl/3X3(R) ed esistono in C elementi non nulli è 0 < ca r (C ) < 3; ma det(C) = 0, essendoci una colonna di zeri. Inoltre no n es iste alc un minore di ordine 2 non nullo (perché le righe, e le colonne, sono proporzionali), quindi car(C) = 1. Osservazione 12.8 II metodo dell’orlatura di Kron ecke r è tanto più vantaggioso quanto più crescono i valori n ed m, cioè il numero di righe e di colonne. Esempio 12.15 Data una matrice A g Mai 3X4 determinare il numero delle sot tomatrici (quadrate) di ordine 3 e di ordine 2. Sia '<*11 <*12 <*13 <*14’ A = <*21 <*22 <*23 <*24 = [ c. _<*31 <*32 <*33 <*34.
c2 I c3 | c4 ] =
ri r2 T3
Le sottomatrici di ordine 3 sì ottengono togliendo una colonna alla matrice A, e quindi se ne ottengono 4, precisamente U c n
U
«
C3
c4 ]
A i = l ci 1 C2
<3 ]
A l = [ ci
c2 | c4 ]
Le sottomatrici di ordine 2 si ottengono togliendo due colonne e una riga alla matrice A. Per ogni scelta della riga r, (da togliere) si h an no 6 possibili scelte per le colonne. In totale 18 possibilità. Scrivere le 18 matrici di ordine 2 che è possibile estrarre dalla matrice A. Esempio 12.16 Determinare al variare del parametro rea le k la caratteristica del la matrice
1 1 0 - k 1 2 A = 1 (k + l) L3 (2k + 3) (1 - k) 5 Essendo A una matrice non nulla di tipo (3,4) è 1 < car (A) < 3. Poiché esiste un minore di ordine 2 non nullo non contenente il parametro k precisamente A-) =
10 11 = 1
è
car (A) > 2
V k.
Determinante di una matrice
Si considerano quindi
A, =
1
1 1 1 (* + l)
185
due minori orlati di A 2 precisamente
0 1
= [( 1 —¿ 2) — (2k 4- 3)] —[fi - k) - 3 ] —
(1 - k ) J
L3 (2k + 3)
1 — k 2 — 2 k — 3 + 2 + k = —k 2 — k = - k ( k + 1)
¿3
1
0
- k
1
1
2
3 1-*
= 5 —2(1 —k) —k (\ - k —3) =
5
— k~ + 4 k -f- 3 — {k -j- 3)(* + !)• Se k = —1 son o en tra m bi nulli e quind i è car (A) = 2. Per ogni altro valore di k è car (A) = 3.
Esempio 12.17
Dati i vettori
V =
“ 1“ 2 , 3
w
=
“3 “ 1 , 1
u
=
T 0 0
dire se sono dipendenti o indipendenti. Utilizzando la Pr os izion e 12.2, basta co nsiderare il rango della matrice ottenuta accostando i vettori dati, per ottenere la dimensione del sottospazio generato dai vettori stessi. Se la d im en sio ne (e quindi il rango della matrice) è uguale al numero dei vettori dati, essi sono linearmente indipendenti, altrimenti (se la dimensione è minore) saranno d ipend enti. Nel ca so in esa m e si ha che 13 1 det
2 10
= -l #o
3 10 e quindi si può concludere che la caratteristica della matrice è 3 e quindi i vettori v, w, u sono linearmente indipendenti.
Esercizio 12.8
Stabilire, al variare del parametro reale k il rango delle matrici
seguenti
"1 * 0 - 1 “ 0 2 0 -1
* 0 * 0
"3* 0 k ~ 2 2k 0 1 -5 1 0
1 -2
f 0 0 1 k l ¿111 2 k k 0
0 1* 1J
C a p i to l o 12
186
12.5 Sistemi lineari di
m
equazioni in n incognite
Riprendiamo in considerazione un sistema lineare di m equazioni in n incognite flll*! + #12*2 + . . . +
0 \ nXn
«21^1 + i?22*2 + . . . +
O 2n X n
= b\ = k>2
(**) <3ml*l +
( lm 2 x 2 +
••• +
^ t i l t] ^ i l
= bm
che può essere rappresentato nella forma matriciale Ax = b, ove A e Matmxn (M) è la matrice dei coefficienti, x il vettore colonna delle incognite e b il vettore colonna dei termini noti. Definizione 12.7 Dato un sistema lineare Ax = b, si dice sistema omogeneo associato il sistema Ax = 0. Proposizione 12.3 Dato un sistema omogeneo Ax = 0, l ’insieme zioni costituisce un sottospazio vettoriale di E" (se x € E").
W d e l le s o lu
Dimostrazione. Siano v, w e W < E", due soluzioni del sistema Ax = 0. Verifichiamo che 1) v -w € W 2) Ave WVAeE. Infatti
A(v - w) = Av —Aw = 0 —0 = 0 e quindi (v - w) è soluzione, cioè sta in W ;
A(Av) = A(Av) = A0 = 0 e anche Av è soluzione e quindi sta in W, che pertanto risulta essere sottospazio. ■ Teorema 12.4 L’insieme S delle soluzioni del sistema Ax — b, con b ^ 0 e costituito da tutti e soli i vettori del tipo u = c + w, ove c è una soluzione particolare del sistema e w è una soluzione del sistema omogeneo associato. Dimostrazione. Anzitutto mostriamo che u è una soluzione del sistema Ax = b. Infatti risulta: Au = A(c 4- w) = Ac 4- Aw = b 4- 0 = b. Viceversa supponiamo che u sia una soluzione del sistema cioè che Au = b e verifichiamo che w = u - c è soluzione del sistema omogeneo associato. Infatti: Aw= A(u - c) = Au - Ac = b - b = 0. ■ Osservazione 12.9 Uinsieme S delle soluzioni del sistem a Ax = b, b ^ 0 non è un sottospazio vettoriale, perché, per esempio, il vettore nullo non appartiene a S. Invece, con la terminologia introdotta nel capitolo 9, S è un laterale di W in W,(W come nella Proposizione 12.3).
Determinante di una matrice
187
Rimane, ora, da affrontare il problema di vedere sotto quali condizioni il sistema Ax = b sia risolubile. Una risposta è offerta dal seguente; Teorema 12.5
(Rouché-Capelli12) Un sistema lineare Ax = b di m equa-ioni in n incognite ammette soluzioni se e solo se car A = car[A|b], essendo A la matrice dei coefficienti e [A|b] la matrice completa.
Dimostrazione. Per ipotesi sia car A = car[A|bj. Allora b è combinazione lineare delle colonne di A; detta [ a j a 2 , . . x, j la /z-upla dei coefficienti di questa combinazione, essa è soluzione del sistema, che risulta pertanto compatibile. Viceversa supponiamo che il sistema sia risolubile quindi che esista un A] *2
x =
•
•
t
tale che; “ bi “
*1 "
[ a, | a2
a
«
]
*2
b2
■MH
»
* #t
* « _
_ bm _
#
•
Allora; ai
ai + A2a2 4- .. . + A„a„ = b.
sicché car A = c a r[ A |b ]. 12.5.1
R i c e r c a d e l l e s o l u z i o n i d i u n s i s t e m a l in ear e
Considerato il sistema ¿*11*1 + # 12*2 + . . . + ¿*21*1 + ¿*22*2 + • • . -f
a !,,*„ = b\ = b? a 2n Xn
(**) ¿*wl*l + ¿*w2*2 + . - . + UtnnXn —
vediamo come procedere per la ricerca effettiva delle sue eventuali soluzioni Per il teorema di Rouché-Capelli, il sistema ammette soluzioni se e solo se car A = car [ A |b ]. I9-Alfredo Capelli (Milano 1855-Napoli
1910)Professore airUmversità di Palermo e di Napoli II teorema fu formulato, indipendentemente, anche dal Matematico francese Eugènc Rouché (Sommieres 1832-Lunel 1910) L'enunciato che abbiamo presentato, corrisponde, sostanzialmente, a quello di Capelli, mentre quello di Rouché è di tipo costruttivo.
Dire che t fu
#12
•* • # 1 «
#21
#22
•** #2«
= r
car (A) = car
_ fini 1 Ami
♦
t
a inn _
significa dire che esattamente r righe (o colonne) di A sono linearmente indi pendenti. Senza ledere la generalità del discorso, su pponiamo ch e sian o le prime r righe corrispondenti alle prime r equazioni. Co nside riam o la (r -f l)-esima: essa è ottenibile come combinazione lineare delle r prec ede nti con coefficien ti ki,k 2<••• X - Se anche br+\ si può scrivere come combinazione lineare di b\,bi .. X con gli stessi coefficienti cioè br+\ = k \b \+ k2b2 + . . . + krbr
allora tutte e sole le soluzioni del sistema formato da lle prime r equazioni (sistema ridotto) sono soluzioni anche di questa (/- -I- l)-esima equazione che è sovrabbon dante e quindi eliminabile. Se invece br+\ ^ k\b\ 4 k2b2 4 . .. 4 krb r, l’equazione è incompatibile, ed è car A < car[A|b]. Ripetendo questo ragionamento per ognuna delle restanti righe, nell’ipotesi in cui br+j — k\b\ 4 k2bi 4 .. . 4
i)» j
1, . . . ,tn
r,
si possono presentare due casi se n - r, il sistema ridotto ha una e una sola soluzione, ottenibile con Cramer. se n > r, detta B una sottomatrice quadrata di ordine r a determ inante diverso da zero (noi abbiamo supposto essere quella formata dale prime r righe e colonne) si ha che
det(fi) = det
#11 #12 • • • # l r #21 #22 *• ' # 2r %
7^0
_ # r 1 # r2 * ’ ' # r r _
e quindi il sistema (**) è equivalente al sistema #11*1 4- #12A'2 4
. . 4 # lr* r
#21*1 + #22*2 4 . . . 4 # 2 r* /i
— b\ = b2
«Ur+D^r+l
•
•
•
V
fi\n^n
#2(r-H)*r+l
4 4
#r 1*1 4 #r2*2 4 .. . 4 arrxn = br - ar(r+1)xr+i -
•
finirli
che ammette soluzioni. Si otterranno le prime r incognite in funzione delle rima nenti (n - r), scritte al secondo membro, che po ssono variare in tu tto R. Con
Determinante di una matrice
18 9
la terminologia già usata nel Capitolo 8, si dice che il sistema ammette % ' soluzioni. I t *
Esempio 12.18 Dato il seguente sistema lineare, dire se ammette soluzioni e. in caso affermativo, determinarle.
.
0 x 4 -2 y + 3 z 2x + y + 4 z 1 x -- V + 3 = 1 •S
La matrice dei coefficienti è
'1 A = 2
2 31 4 _1 - 1 1_
mentre la matrice completa è
’1 2 [A\b] = 2 1 1 --1
3 4 1
0 1 1
Poiché la matrice A non ha tutti gli elementi nulli, car A ^ 0 Consideriamo la sottomatrice
12 2 1 Si ha che Ai —
12 3^0 21 = -
per cui car A > 2. Poiché det A = 14-8 — 6 —34-4 —4 = 0 la caratteristica non è 3, quindi si può concludere che car A = 2. Dobbiamo 12 determinare car [A|b]: orliamo la sottomatrice con la colonna dei termini 2 1 noti, si ottiene •
•
1
A' =
2
0
2 1 1 -1
1 1
e, poiché det zi' = 0 , si può concludere che car[4|b] = 2, e quindi il sistema ammette soluzioni; precisamente avremo oc 3-2 = oc 1soluzioni. Il sistema iniziale è quindi equivalente al sistema x +2 y = 0 —3 z 2x 4- v = 1 - 4 z
4
190
Capitolo 12
In questo caso la matrice dei coefficienti è
12 2 1 e. non essendo singolare, il sistema equivalente ammette soluzione, in virtù del teorema di Cramer. Ricaviamo tale soluzione (che dipende dal parametro reale z — h), con la regola esposta nell'Osservazione 12.5
* =
v =
-3 h 2 ( 1 - 4 h) 1
—3h —2 4 - 8h
5/?-2
-3
-3
12 2 1 1 -3/2 2 ( 1 - 4 / 2 ) 12 2 1
1 — 4/2 + 6/2
2/2 + 1
-3
-3
Le infinite soluzioni (al variare di h € E) sono
x =
5/2-2
2/2 + 1
v=
-3
Z =
-3
h
Esempio 12.19 Determinare le soluzioni del se guente siste ma (omogeneo).
x + 2 v 2x 4- j x
-
y
0 0 . 0
In forma matriciale il sistema si può scrivere nel seguente modo
Ax =
1 2 2 1 1 -1
0 0 0
x >’
= b.
Poiché car A = 2 (verificarlo!), il sistema ridotto equivalente è
x +2y = 0 2x -f j = 0 che ammette la sola soluzione banale x = 0 , y = 0 . Esempio 12.20 Dato il seguente sistema lineare, dire se ammette soluzioni
x + y x + y +z . 3x + 3 y +z
0 o 5
Determinante di una matrice
191
La matrice dei coefficienti è A =
1 10 111 33 1
mentre la matrice completa [A |b] =
110 0 1112 3 3 15
Poiché Ai —
10 = 1/0 11
la caratteristica di A (e anche di [A |b]) è > 2 Poiché det(/4) = 0 (verificarlo!) si ha che car A = 2 Considerando la sottomatrice r 1 1 A = L 3
0 0 “1 1 2 1 5
10 1 1 con la colonna dei termini noti, si vede che det(/4) = 3 ^ 0 , per cui car [A |b] = 3 > 2 e quindi non ci sono soluzioni. di [/4|b] ottenuta orlando la
Esempio 12.21 Determinare 1 valori del parametro reale k per i quali ammette soluzione il seguente sistema: kx + y x + ky x + y
1 1 k
La matrice dei coefficienti e la matrice completa associate al sistema sono nspettivamente: ~k 1 “ 1 k A = 1 1
e
~k 1 r [A\b] = 1 k 1 1 1 k
Poiché A non è la matrice nulla la sua caratteristica sarà > 1. Poiché ha solo due colonne car (A) <2. Consideriamo il minore A? =
I
k
II
= 1 — k
0 per
k jé 1.
Poiché per k — 1 nessun altro minore di ordine 2 è diverso da 0, si può concludere che car (A) = 2 Vk yf= 1.
192
Cap itolo 12
La matrice orlata di ordine 3 può essere solo [A\b]. Calcoliamo k 1 1 ¿3 = 1 k 1 = *(*2 - ! ) - ( * - 1) + (1 - k ) = 1 1 k
= k(k - \)(k -1- 1) - {k - 1) - (k - 1) = (k — 1) [k2 + k — 2 ) = = f t - l ) ( * + 2) ( * - l ) . Quindi se k / 1, k ^ —2, car([A|b]) = 3 e in tal caso non ci sono soluzioni perché car (A) < 2 ^ car([A|b]) = 3. Se invece k = - 2 si ha che car([A |b]) = car (A) = 2 e quindi ci sono solu zioni, anzi c’è una e una sola soluzione perché car (A) è uguale al numero delle incognite. Se infine /c = 1, car (A) = 1 = car ([A |b]) e quindi ci sono infinite soluzioni. Determiniamo le soluzioni in corrispondenza dei valori di k: 1) k = - 2: il sistema si riduce al sistema x —2y = 1 x + y = - 2
che, in forma matriciale è '1 1
- 2 '
1 "
X
1
- 2
La soluzione è ì
1-2
x =
- 2
1
T -2
-3
ì
1 -2 y =
= -l,
=
1 -2
1
1 1
-3 -
1
.
1
le 2) k = 1 : il sistema si riduce all’equazione x + y = 1, da cui y = 1 — x e infinite soluzioni sono x = h, y = 1 — h, al variare di h e R. Esercizio 12.9 Determinare gli eventuali valori del parametro reale k per i Qua*' ammettono soluzione i seguenti sistemi:
1)
\
2x + ky — k — 1 x + (* + 2)ky = 1 = 2 * + y
x +y — - k 2) ^ +(7c + l)>’ +z = 2 , 3 jc +(2 k + 3)_y +(1 — k)z = 5 x + ( k - \ ) y +3z +2 1 2 3 )U + 2 y +(1 + k)z + 4/ = 2 + k z +2t = 3 =
13 Applicazioni lineari
“Patet omnibus ventas” La venta è accessibile a tutti (Seneca)
Vogliamo, ora, misurare la correlazione tra due spazi vettoriali, cioè il modo con cui essi si relazionano mediante funzioni che rispettino la struttura algebri ca, usualmente indicate con il termine applicazioni lineari o omomorfismi (dal greco homòs = uguale, simile e morphé = forma). Definizione 13.1 Dati due spazi vettoriali V e W su un campo K, una applica zione f : V -> W è detta lineare se: i) f( v + w) = f ( v ) 4- /(io), Vv,w ii)
v) = Xf(v) , Vu
g
g
e
V
K
In altre parole, / è lineare se preserva le operazioni di somma e di prodotto ester no.
Osservazione 13.1 Nel seguito considereremo sempre K = R, cioè spazi vettortali sul campo reale. Proposizione 13.1 guenti proprietà:
1.
& / è un appi,canone lineare da V a W, valgono le se-
/ (Oy) = 0 ;y.
infatti poiché V » e V si ha che 0 , + „ = „ segue che / ( 0 , + „) = pe rla lmeanta d, / , si ottiene /< 0 „) + / ( „ ) = f ( v) c 'oé2 2.
f ( - v ) = ~ f ( v ) , Vu
da cut
Poiché Ov = -i> + v, ancora per la linearità di / , segue f ( 0 y ) = / ( —r + v \ Utilizzando il punto 1. si ottiene / ( 0V) = f ( - v + v ) = f ( - v ) + f ( v ) = o w da cui segue / ( —v) = - f ( v ) .
Proposizione 13.2 L'immagine di una combinazione lineare di vettori di V è la combinazione lineare delle immagini, in simboli:
Infatti
—/ (tfì^i + 02 V 2 + ...) = J (a 1Vi) + f (0 2 0 2 ) + ... = = a\f(.v\) + a2f { v 2) . . . = ^
a i f ( V i ).
Proposizione 13.3 Sia V7i un sottospazio di V. L'immagine W\ = / ( V i ) di V] tramite l ’applicazione lineare f, è un sottospazio di W. In particolare l'immagine f(V) dello spazio V è un sottospazio dì W indicato con Im f .
Dimostrazione. Siano wie w2 € Wi e k e R. Per provare che W\ è un sottospazio di W dobbiamo mostrare che w\ + w2 € VVi e che kw\ e W\. Poiché per ipotesi esistono vi E V e v2 € V tali che w\ = f{v\) e w2 = f { v 2), per la linearità di / risulta che
u>i + W2 = / ( i'i) + f {v 2) = f ( v 1 + v2) kwi = kf{v 1) = f ( k v 1).
Essendo V! un sottospazio di V7, gli elementi v\ + v2 e kv \ apartengono a V \ , e quindi w\ + uh e ¿wi sono elementi di Wi, ■
Proposizione 13.4 Sia W’ un sottospazio di W: la sua immagine inversa = V1è un sottospazio di V.
Dimostrazione. Siano infatti uj , v’2 e V1e k e R. Occorre al solito provare che 1/, +
€ V e kv[ e V‘. Posto w\ = f ( v\ ) e w'2 = / ( i.\), per ipotesi essi appartengono a W\ sottospazio di W, e quindi w\ + w'2 e W' e fcu/ e Inoltre w\+w2= /(«¡)+/(vJ) = /(tij+uj) e/cu;', = kf{v\) = f[kv\). Q uesto mostra che v'j + 1/2e ta’j sono elementi di V ' in quanto preimmagini rispettivamente di ui'j + ujj e ¿ uìJ, elementi di W". ■
Definizione 13.2 II sottoinsieme di V costituito da tutte le preimmagini dello zero di Wè detto nucleo dell’omomorfismo f ed è indicato con il simbolo ker / [ker deriva dall’inglese kernel-nocciolo, nucleo). Ovviamente ker / non è mai vuoto, contenendo almeno lo zero di V.
Appiicazior linear
195
Esempi 13.1 1. Sia ù : V — » W V applicazione che associa a ogni vettore di l , re nullo di W, cioè l'applicazione ft(v) = 0 « (detta anche applicazione nuda Essa è lineare infatti: + ^2) = 0w = # (t’i) + &(v2) e &(kvi) = 0w = ktiU ,), per ogni V\,i>2 6 V e per ogni k e R. 2. Per ogni spazio vettoriale V l'applicazione 1 V — ► V che manda ogni vettore in se stesso, cioè l'applicazione i(v) = u.Vi e V (detta anche appli cazione identica) è lineare. 3. Sia / : R 3
■* R 2 la legge che associa a ogni vettore v = ì b 1 di R? il
a di R 2. Mostriamo che l'applicazione / (proiezione su R2) b è lineare. Siano infatti:
vettore w =
t'i = generici vettori di R 3 e k un qualsiasi numero reale allora: a1+ a 2 >) f(.vl + v2) = f ( by + b 2 C\ + c 2
ii) f{kv \) = f { k b x\ =
ci\ + a2 b[ 4- b2
«1 b[
ì l i ) = *( 1
1
Ora ker f =
{v
e R 3 | f ( v) = 0j : =
1
= */<’ >>•
0 0 }=
0 {v
= ( 0
c e R) mentre
Im / = R2. a 4. Sia / : R 3 — > R 2 l’applicazione definita ponendo f \ b ) =
h- 1 a
Determinare per quali valori di h € R detta applicazione è lineare Anzitutto deve essere / ^ ( H = |
j quindi
h = 1, sicché si ottiene a
0
f \ cb
a
h- 1
0
0 0
da cui
*
Verifichiamo che / è lineare.
Siano.ora,r, =
j *
”2
=
j due vettorl dl R3 e * e E. È:
/(» i+ K 2)= /^ i + ^ j = ( a + a 1) =
f
{ k
v
>
)
=
f
( 2) + ( r ,
) = /(«i) + /(n2);
(s ) =( i ) =
k
U) =
Pertanto / è lineare per h = 1.
Con la nomenclatura precedentemente introdotta si osserva che Proposizione 13.5 Data un’applicazione lineare f : V — » W si ha: a) f è iniettiva <$=>ker / = {Oy}; b) / è surìettiva <=> Im / = W. Dimostrazione, a) Sia / : V —» W iniettiva: allora elementi distinti di V hanno immagini distinte in W. Se 3u ^ Oy, v e ker / allora f ( v ) = Ow, ma anche / (Ov) = 0w, assurdo! Viceversa sia ker / = {Oy} e siano V\,V 2 € V, iq ^ v2 con /(t?0 = /(U2). Per la linearità di / è f ( v\ —i>2) = 0W e quindi l’elemento vi - u2 fi Ov appartiene a ker /, ancora assurdo, il punto b) segue dalla definizione di applicazione surìettiva, ■ Proposizione 13.6 Sia f : V —> W un'applicazione lineare: se V è finitamen te generato, allora / ’immagine f (V) C W è finitamente generata. Dimostrazione. La Proposizione 13.3 ha provato che f ( V) è un sottospazio di W Sia {vi,V2,...u n} un sistema finito di generatori per V; mostriamo che un sistema finito di generatori per /(V ) è costituito dai vettori {/(ui),/(v2),... Infatti sia w un generico elemento di f(V), allora 3 v e V tale che /( v ) = u>; poiché (vi,V2, . .. u„] è un sistema di generatori per V si ha che v = aji>i + aivi H------ anvn ove a, e E e quindi U - f( v ) = f (a[V j + • • ■+ anvn) = a¡f(vO + a 2f(v2) -4------- h a„f( v„)
'1che prova che /( V) è finitamente generato. ■
App licaz ioni linea n
19 7
Siamo, ora, in grado di enunciare e dimostrare il seguente Teorema 13.1 (Nuli¿tei + Rango) Sia V uno spazio di dimensione finita e )IU f i V — * W un ’applicazione lineare, allora dimfker f ) + dimilm f) = dim V Dimostrazione. Poiché V è finitamente generato, anche /( V) lo è, per la Pro posizione 13.6 e ker / è finitamente generato in quanto sottospazio di V. Posto r = dim f ( V ) e s = dim k e r/ , siano {101, 102, ... ufi} e [t\, /2, .. .fi} due basi rispettivamente di f ( V ) e di ker / . Naturalmente è w, = f{v,) per opportuni vi e V. Mostriamo che B = {v \,v 2, .. vr,t\,t 2,. . .fi} è una base per V Anzitutto proviamo che B è un sistema di generatori per V Sia v e V. poiché f ( v ) e f ( V ) si ha che f ( v ) = V a,w,. /= ! Presi pertanto due vettori x e y di V così definiti Í
y = J 2 “' v‘
e x — v —y
1=1
per la linearità dì / risulta f
t
f ( y ) = £ « / ( * ) = J 2 aiW‘ = 1=1 i=i f ( x ) = f ( v - y) = f ( v ) - /(>■) = f ( y) - f(y) = 0w
quindi x e ker /. Si ottiene quindi che '
* = £ A fi
e
v = x + y = '*T b it,+ Y ^aiVb
'=1
1=1
1=1
Pertanto B è un sistema di generatori per V . Per quanto riguarda l’indipendenza lineare dei vettori di B, considenamo la combinazione lineare s
r
°v = X A fi + X 1=1 ¡=1 Dalla linearità di / segue che
v>• con ai -A e R .
r
r
5
f (Ov) = X A
) + X a>/ ) 1=1
/ = Oiv + X a ' wi ¿=1
1=1 essendo i ti elementi dì ker /. Poiché {ioi,ui 2, •. - ior) è una base per / ( V ) e quindi in particolare un si stema di vettori indipendenti, segue che a, = 0,V/ e {12,. ,r] da cui si 5
ottiene Ov =
fi,fi e ancora, essendo {fi,fi>.... ,fi} una base per ker j , è
A = 0,Vi e {1,2,... ,s). ■
198
Capitolo 13
Lasciamo per esercizio la dimostrazione della Proposizione 13.7 Sia f un'applicazione lineare tra due spazi vettoriali V e W, con V spazio vettonale di dimensione finita, allora a) f è suriettiva dim f (V) = dim IV; b) / è iniettiva<» dim ker / = 0. Definizione 13.3 Siano V e W due spazi vettoriali, f e g due applicazioni li neari di V in W e X uno scalare (X e R) f :V -+ W, g :V
W.
Si definiscono le applicazioni di somma f 4- g e di prodotto pe r uno scalare Xf nel seguente modo
( / + £)(v) = f ( v) +g( v ) (Xf){v) = Xf(v)
VveV.
Le applicazioni / 4 g e Xf sono ancora lineari. Infatti, Vt>i,i>2 e V.p. e R si ha: ( / + £)(*>! + ^ 2) = f (Vl + V 2)+g(Vi+V2) = f i o 1) + f ( v 2) 4- g(ui) 4- g{ v2) = = f(V\) + g(Vì) + f ( v 2) + g(V2) = ( f + g){Vi) + ( f + g)( V2) ( / + g)(pv) = f(liv) + g(pv) = p,f(v) + pigio) = j l ( f 4- g)(v) Xf(v\ + U2) = f i Mv 14-v2)) = /(A.u 1 4- Xv2) = f ( X( t’i)) 4- f (X( v 2).) = = VU’i) + Xf(v 2) {Xf)ipv) = XiJijiv)) = X( pf (v )) = pi{Xf{v)) = /z (Xf ) (v)
Sia Homi V.W) l’insieme delle applicazioni lineari da V a IV; con le operazioni di somma e di prodotto per uno scalare definite sopra, Hom ( V, W) diviene uno spazio vettoriale (lasciamo al lettore la verifica degli assiomi). Definizione 13.4 Dati due spazi vettoriali V e W, essi si dicono isomorfi e si scrive V - W, se esiste una applicazione lineare bijettiva (isomorfismo) tra V e W. Esempio 13.1 Lo spazio vettoriale Matmxn(R) è isomorfo allo spazio vettoriale Matnxm(R) via l'applicazione lineare di trasposizione che associa a ogni matrice A e Matmxn(R) la sua trasposta AJ e Matnxm(R). In particolare si può dimostrare il seguente Teorema 13.2 Dati due spazi vettoriali V e W, con dim V — n dim W = m, allora lo spazio vettoriale Hom(V, W), è isomorfo allo spazio vettoriale Matmxn (R) Inparticolare dim Hom( V. W) = n ♦m.
App lic az ioni line an
19 9
Diamo qui di seguito una traccia di dimostrazione. Per ipotesi V e W sono finitamente generati, in particolare siano
6 = {vi v2, . . . ,u„) e
C = {W] W2, . -. due basi arbitrarie, rispettivam ente per V7 e W Consideriamo una matrice X e Mat,„ 'rii ri 2 • • • ri « *
•
•
•
*
*
_ Xm1
2
Servendosi delle basi di V e di W si può costruire un’applicazione lineare f x : V -+ W tale che a ogni v e V , v = J2'ì=i aìv‘*associ l’elemento m
n
xn wi = X , H x‘iaiWi M i=1 Poiché C è una base, per V unicità di scrittura di v come combinazione lineare dei Wj, si ha che
m n Y ^ Y l Xua,w, j=> '=1
e quindi n bj = J 2 x j ' a ‘ Z= 1
e
1 _ f _ t _ _ _ _
1
X\ \ —
_ b m _
« • _ 1
■«1 "
•• • X\ n ~ • » '
♦ «
•
•
•
Xmn _
Definizione 13.5 Gli elementi a, e R si dicono coordinate di v nella base B — {ui,U2, . •. , vn } e gli elementi b , e M, si dicono coordinate di \ nella base
C = {wiw2, ... , wm} . La corrispondenza f x è lineare, come si può facilmente verificare utilizzando le proprietà del prodotto matriciale. Viceversa, se / : V —> W è un'applicazione lineare, utilizzando le basi 8 e C, possiamo costruire una matrice A . detta matrice rappresentativa dell'appli cazione lineare / , nel modo seguente: per ogni j = 1, 2 , . . . ,n, consideriamo l'immagine f d , ) e U'dei vettori della base B di V; questa si potrà esprimere in modo unico come combinazione lineare dei vettori della base C e quindi sarà: ni
f (.»,) = '£ ,« ijU'i 1=1
/
200
Capitolo 13
La matrice A - [dj,] è di tipo (m,n) e V j = 1,2,... ,n, la j -e sim a colonna è costituita dalle coordinate del traformato del j -esimo ve ttore della b ase ¿3 espresso come combinazione lineare dei vettori della base C. Esempio 13.2 Sia / : R 3 —* R 2 V applicazione così definita
0 a + b + c Costruiamo la matrice rappresentativa di / rispetto alle basi canoniche di R 3 e di R2. Ricordando che la base canonica di R 3 è costituita dai vettori
0 *2 = I 1 0
e3 =
e che quella di R 2 è costituta da i vettori
e\ consideriamo le immagini dei vettori e\,e2 ,e3 ed esprimiamoli come combinazio ne lineare di è\ ed èi.
0 1 + 0 + 0
0 1
M )
0 0 + 1+0
0 1
= 0 - é 1 + l - e 2;
f(e 3) =
0 0 + 0 + 1
0 1
= 0 • è\ + 1 • £2
/(
0 • è[ + 1 • è2\
La matrice rappresentativa, rispetto a questa scelta delle basi, è quindi
M =
000 111
• Costruiamo ora la matnce rappresentativa dell’applicazione / rispetto alle basi
B' =
l o 0
1 1 0
5 2
3
di R-
C =
IO'(VI
di M
Applicazioni linean
201
Consideriamo le immagini dei vettori della base B' di R3
0 1
0 10
0
=
-
#
¡Mfi
-
l J ) + 5 ( 2
0
Quindi la matrice rappresentativa sarà:
M' =
0
00
1 /2 1 5
13.1 Rango Mostriamo, ora, alcuni rilevanti legami tra la matrice A e l’applicazione lineare / a ad essa associata. Sia A = (ciij) una matrice di tipo (m,n) a elementi in K.
Proposizione 13.8
/ vettori colonna dì A sono i generatori dello spazio Im f A
La dimostrazione è immediata, ricordando che V.r e V
f a (x) = Ax e che il prodotto Ax dà una combinazione lineare dei vettori colonna di A. A suo tempo abbiamo definito “rango” di una matrice A di tipo m x // il numero dei piv ots di una sua riduzione a scala S , ottenuta con il metodo di eliminazione di Gauss. Siano ora si,S 2 , . . . ,5r le co lon ne di 5 su cui si trovano i pivots. Allora è possibile prov are le se gu en ti
Proposizione 13.9 I vettori colonna a S],as,. .. ,aSr di A sono linearmente in dipendenti e costituiscono una base per lo spazio generato dai vettori colonna di A. Proposizione 13.10 II rango di A ( indicato con rg (A)) è il numero massimo di
vettori colonna linearmente indipendenti. Osservazione 13.2 Le precedenti proprietà rimangono valide se si sostituisce il termine “colonn a” con il termine “riga”,
n e l l enunciato
/
202
Capitolo 13
Esercizio 13.1
1.
Date le seguenti ap plic azio ni, dire quali sono lineari: a -f- b b c —b
a / : R 3 — * R 3 tale che / | b
2.
g : R 2 —
R 3 tale che g ( C ! ) =
3.
h : R 2 — > R tale che
h
4.
/ : R 2 — > R 2 tale che
/
a
?
—a —ci -f- b —ci b -f~ 2
= 2a + b\ a 1 —a + b
a
Es ercizio 13.2 D eterm inar e la ma trice a ss oc iata alle seguenti applicazioni linea ri da R 3 — > R 3, rispetto alla base canon ica: a
1.
f[ b
a
0 b
2. g
a b c
2a a Q -\r b
0
3.
h
a b c
4.
a t b c
Esercizio 13.3
b c 3a a — b b -c Sìa g : R 3
R 4 Vapplicazione definita da.
x g
a)
1 y
Verificare che G è lineare.
b) Determinare la matrice associata all ’applicazione g. c) Determinare ker g e I m g .
Applicazioni linean
Esercizio 13.4
203
Sia / : R 2 — » IR3, l’applicazione definita da
/
a
a b a+b
Verificare che / è lineare, determ inare ker / e Im /. Esercizio 13.5
Considerate le applicazioni dell’esercizio 13.2, per cmcma ¿//
esse 0 a) determinare Vimmagine del vettore ( 0 1 b) determinare, quando esistono, le preimmagini dei vettori
c) determinare la matrice associata.
14 Autovalori, autovettori, diagonalizzazione
“An investment in knowledge pays thè best interest” (B. Franklin 1750)
Nel precedente capitolo abbiamo trattato la correlazione tra due spazi vettonali V e W attraverso il concetto di applicazione lineare o omomorfismo. Nel caso particolare in cui i due spazi V e W coincidano e / : V — ► V sia un’applicazione lineare, si parla più semplicemente di endomorfismo dello spazio V. Indichiamo con A la matrice rappresentativa di detto endomorfismo rispetto a una scelta della base per V. Risulta spesso comodo cercare una base rispetto alla quale A assuma una forma determinata. In particolare vedremo che se A è una matrice diagonale risulta molto facile risolvere il sistema per la ricerca di eventuali controimmagini di un dato vettore. Procediamo, pertanto, a individuare una base aspetto alla quale A è diagonale. Definizione 14.1 Sia f : V —»■ V un endomorfismo dello spazio V e X un ele mento del campo IR. Un vettore x ^ 0y è detto autovettore relativo all’autovalore Xse f(x) = Xx. Osservazione 14.1 Ogni autovettore jc è associato a un solo autovalore. Infatti se fosse f ( x ) = À r e / ( x ) = p x si avrebbe Xx = px cioè (X - p)x = 0y e per le proprietà degli spazi vettoriali seguirebbe X = p. Osservazione 14.2 L’auto vettore x è sempre non nullo altrimenti l’uguaglianza f(x) = Xx sarebbe verificata per ogni X e E. Osservazione 14.3 L’autovalore A. può essere nullo. Nel caso in cui X = 0 si ha che / ( x) = O.r = Oy e quindi x e ker /. Esempio 14.1
Sia / : R 3 — R 3 l’endomorfismo così definito:
/
P o i c h é r i s u l ta
/
allora À= 1 è un autovalore per / e il vettore v
è un autovettore relativo
all’autovalore À = 1. Osservazione 14.4 Se x\,x 2 sono autovettori relativi allo stesso auto valore Àper un endomorfismo / di V, allora V a\,a2 e R il vettore a\X\ + a2x2, se non è il vettore nullo, è ancora un autovettore per / , relativo all’auto valore X. Infatti f{ci\X\ a2x2) = ci \f(x\ ) ~)~a2f { x 2) = a\ Xx\ -\-a2Xx2 = X{a\X\ -\-a2X 2). Possiamo quindi concludere che V i nsieme Vk(f) = {u G V \ f ( v ) = Xv) degli autovettori relativi all’autovalore X con il vettore nullo è un sottospazio vettoriale Definizione 14.2 II sottospazio V\ ( f ) è detto autospazio relativo alVautovalo re X (n.b.: nel sottospazio V, {f ) è contenuto anche il vettore nullo).
Definizione 14.3 L’insieme degli autovaio ri di un endomorfismo f di V è detto spettro di f e viene spesso indicato con s pf.
Poiché è noto che a un’applicazione lineare / si può associare una matrice rappresentativa A = Af , vediamo come è possibile procedere in pratica nella ricerca degli autovalori di un endomorfismo / . Proposizione 14.1 Sia V uno spazio vettoriale sul campo R con di m V = n e sia / 6 End{V). Uno scalare X e R è autovalore di f se e solo se l'endomorfismo ( / - XI V) definito ponendo ( / - X l v )(v) = / ( v ) - X v , V v e V non è isomorfismo. Dimostrazione. L’applicazione ( f —Xl y ) e End( V) non è isomorfismo se e solo se Ker ( / - XIV) ^ {Oy} cioè se 3v e V,v ^ Oy, tale che valga l’uguaglianza: (*)
( f - X I v ) ( v ) = Oy
cioè tale che f(v) = Xv. In altre parole se e solo se / possiede un autovettore v relativo all’autovalore X. m Considerando, ora, la matrice A , quadrata di ordine n, rappresentativa di / rispetto a un’opportuna scelta di base, l’equazione (★) diventa: (A - XIn)v = ( A - XI ) v = Oy che può essere letta come un sistema lineare omogeneo di n equazioni in n inco gnite del quale si cercano le soluzioni non banali. Ricordando che un tale sistema ha soluzioni non banali se e solo se il determinante della matrice dei coefficienti è nullo (cfr. Teorema di Cramer), deduciamo che gli autovalori di f (o, equivalen temente, di A) sono tutte e sole le radici X, dell’equazione det( A —XI) = 0.
Autovalori, autovettori, diagonalizzazione
207
Definizione 14.4 Sia f : V —» V un endomorfismo dello spazio vettoriale V. Il polinomio p{X) e /?[À] definito ponendo p(X) = det(A - XI ) e detto polinomio caratteristico.
Osservazione 14.5 Se A e M atnxn{R), il polinomio caratteristico ha grado n e il termine noto di detto polinomio è det A. Esempio 14.2 Sia / : R 3 -+ IR 3 l’endomorfismo la cui matrice rappresentativa è la seguente: A =
323 14 3 12 5
Per trovare gli autovalori e gli autovettori di f , determiniamo, anzitutto, la matnce A - X I I l
1
"3 2 3 “ “ 10 0 “ 1 4 3 — X 0 1 0 00 1 12 5
-
■■
"3 —A. 2 3 “ 1 4 - X 3 2 5-X_ 1
e calcoliamone il determinante det(A - XI) = (3 - X)[(4 —A.)(5 — X) - 6 ] —2(5 - X - 3) + 3(2 - 4 + X) = = (3 - À)(20 - 9X 4- X2 - 6) - 2(2 - À) + 3(À - 2) = = (3 - X)(X2 - 9 X + 14) + 5(X - 2) = = (X — 2)[(3 — X)(X —7) + 5] =
= —(X —2) (À —2) (À — 8). Quindi gli autovalori di / sono X = 2 con molteplicità due e X - 8. Cerchiamo, ora, gli autovettori relativi all’auto valore X = 2: si tratta di risolvere il sistema Ax = 2x ovvero il sistema Ax —21x = Oy, cioè “3-2 2 3 “ ~X 1 4-2 3 y 1 2 5-2 “ 1 2 3 “ " -V“ 12 3 y 1 2 3 _ z _
—
“
"0 “ 0 0
“0 “ 0 0
Poiché le tre righe della matrice A coincidono, il sistema si riduce all'unica equa zione: x + 2y + 3z = 0 e ammette pertanto oo2 soluzioni del tipo " —2h - 3k “ h k
- _ 2 “ “-3“ 1 + k 0 = h 1 _ 0 _
ove h,k € M.
Capitolo 14
208
_________________________________________ __________________
Quindi Tautospazio relativo all’autovalore 2 è
V2( / ) =
- - 2“ " - 3 “ 1 9 0 1 0
Procedendo in maniera analoga per X = 8 si ottiene il sistema 3 -8 2 1 4 - 8 1 2
3 3 5-8
~x “
y
—
_z _
"0” 0 0
cioè -5 2 3 1 -4 3 1 2 -3
"x "
y
—
_z _
"0 " 0 0
Poiché il rango della matrice in questione è 2 il sistema ammette oo 1 soluzioni così ottenute
’ •X— -5 x + 2y = - 3 z x - 4 y = - 3 z
-3 h 2 -3/i -4
12 h + 6/i
18
18
- 5 —3h 1 —3h
15/2+3/2
18
18
y —■
— h
= h
z = h
Pertanto l’autospazio relativo all’auto valore 8 è
Vi ( / ) =
1 1 1
14.1 Matrici d iag o n alizzab il i Ricordiamo, anzitutto, la seguente Definizione 14.5 Due matrici A,B e Matnxn(R) si dicono simili se esiste una matrice invertibile P e Matnxn(R) tale che A = P ~l B P.
Autovalori, autovettori, diagonalizzazione
209
In Matnxn(R ) la relazion e di similitudine è una relazione di equivalenza, come si può facilmente verificare. Osserviamo che due matrici simili hanno lo stesso determinante: infatti, applican do il teorema di Binet si ha det(/4) = d et(P - 1Z?/’) = det(/>~ 1)det(B)det(/’) =
1 det(Z?) det(70 =det(Z?) detfP) Inoltre due matrici simili hanno lo stesso rango (o caratteristica) e hanno anche gli stessi auto valori. Ricordando che una matrice quadrata B = (bl}) è diagonale se btJ = 0, per ogni i ^ j , diamo la seguente
Una matrice quadrata A si dice diagonalizzabile se è simile a una matrice diagonale. In altre parole se 3 una matrice P e Matnxn(R) tale che P~[AP sia diagonale. Definizione 14.6
Proposizione 14.2 Sia V uno spazio vettoriale ed f e End[V). Se V ha dimen
sione finita n e se f ha esattamente n autovalori distinti, allora V ha una base costituita da autovettori di f e, rispetto a tale base, la matrice rappresentativa di f è diagonale. Dimostrazione. Indichiamo con X\,X 2, . .. ,À„ gli n autovalori distinti di /. Per ogni / G { 1 ,2 ,... } sia v, un autovettore relativo all’autovalore X,. Mostriamo che5 = {t>i,V2 ___ , u„} èunabasedi V. Anzitutto verifichiamo che i vettori V\,V 2 , ■ ■. ,vn sono linearmente indipen denti, procedendo per induzione su n. Per n = 1, l’asserto è vero poiché v\ Ov e quindi è linearmente indipen dente. Supporre l’asserto vero per n — 1, vuol dire, senza ledere la generalità del discorso, supporre l’indipendenza lineare di Vi,V 2, ... ,u„_i, cioè supporre che, n —1 ogniqualvolta J2ai vi = allora necessariamente a, = 0. V7 = 1,2,. . ,// - 1 issi
Proviamo, quindi, l’indipendenza lineare di vi,V2, . . . ,v„. Sia Allora
n
i= l
= Ov una loro combinazione lineare che dà il vettore nullo.
Qv = / ( Ov) = f ( I M ) = Ì l b J M = t b‘k‘v' 1= 1 \f = 1 / Ov = K, ■ Ov = K, T.b,v, = U„b,v,
210
Capitolo M
poiché
« " T V /» i= w ¡=1
si ha
/I
]P(A( - A„)M; = Oy /=i cioè «-i D/ (A,
A,,)/?, v,
Oy
i=i Facendo intervenire l'ipotesi induttiva, si ha
(A, - A,,)/?, = 0 V Vi = 1, 2. .. (« - 1). Inoltre, poiché gli autovalori sono distinti per ipotesi, la differenza A, - X„ è diversa da zero e quindi b, = 0 Vi G {1 ,2... ,n — 1}. Allora bnvn = Oy e, poiché u„ ^ Oy, si ha = 0. Dato che V ha dimensione n , gli n vettori ui,t>2, . . . vn, linearmente indipendenti, costituiscono una base per V. Poiché /(v j = A,v,, Vz e { 1,2... ,«}, la matrice rappresentativa dell’endomorfismo / nspetto a questa base di autovetton è:
0 ‘ Ai 0 0 0 0 0 a2 0 0 0 A3 0 0 •
4
4
•
•
•
9
•
•
•
*
t
4
•
0 0
•
•
»
"
•
9
0 Xn
e quindi è diagonale. ■ Possiamo ora enunciare la versione matriciale delle precedente proposizione; Proposizione 14.3 Se una matrice quadrata A di ordine n ha n autovalori di stinti allora è diagonalizzabile. Rimane da affrontare il caso in cui un autovalore (o alcuni autovalon) abbiano molteplicità maggiore di 1, cioè siano radici del polinomio caratteristico con molteplicità maggiore di 1. Si ha la seguente Proposizione 14.4 Sia A un autovalore di f € EtuH V). Allora, indicato con \ f l'autospazio relativo a questo autovalore, vale la relazione: dim VK= n — car (A — A /), essendo V, lo spazio delle soluzioni del sistema omogeneo (A —XI )x = 0\
Autovalori, autovettori, diagonalizzazione
211
Definizione 14.7 La dimensione di V, è detta molteplicità geometrica dell’au tovalore X. Studiamo, ora, in che modo si legano tra loro la molteplicità algebrica e la molte plicità geometrica di un autov alore, dimostrando la seguente diseguaglianza Proposizione 14.5 Indicata con n,, (n, > \) la molteplicità algebrica dell’au tovalore X, si ha che
X-, /) < tij dim V>.( = n — c ar (A — cioè la molteplicità geometrica di un autovalore non è mai maggiore della sua molteplicità algebrica. Dimostrazione. (Traccia) Ragioniamo per assurdo supponendo che sia
n —car ( A — X, I) > n, Allora è possibile costruire una base per Tautospazio V, formato da t autovetton con t = n - car (A —X,I). Completando questa base a una base di V, si ha che A X,I M è simile a una matrice (a blocchi) del tipo B ove / è la matrice
0
N
identica di ordine t = n — car (A — X, /). Il polinomio caratteristico di B (che è uguale a quello di A) è ps ( X) = (X —Xl)n~car(A~x‘/>p^(X), assurdo, poiché la molteplicità algebrica di X, è n — car {A - X, I) > n,. u Definizione 14.8 Si dice che un autovalore X di A è regolare se le sue moltepli cità algebrica e geometrica coincidono. Abbiamo già notato che se gli autovalori sono tutti distinti questi sono tutti re golari, cosi se la matrice A quadrata di ordine n ammette n autovalon distinti è diagonalizzabile. Se gli autovalori non sono distinti affinché A sia diagonalizza bile devono essere regolari. Sussiste, infatti, il seguente Teorema 14.1 Sia A e Matnxn(R) : A è diagonalizzabile se e solo se i suoi autovalori sono regolari e la somma delle loro molteplicità è n. Osservazione 14.6 zabile. Esempio 14.3
Si può dimostrare che ogni matrice simmetrica è diagonaliz
Stabilire se è diagonalizzabile la matrice “113“
023 . 00
1.
e in caso affermativo trovare la matrice diagonale B a cui è simile e la matnce diagonalizzante.
212
Capitolo 14
Cominciamo col calcolare il polinomio caratteristico di A: 1- X 1 3 det(A - XI) = det 0 2 - X 3 0 0 1 - X
= (1 - a .)(2
- X)(l — k )
=
(1 — à )2(2 - X).
L'quazione caratteristica ottenuta eguagliando a zero il polinomio caratteristico ha come soluzioni X\ = 2
e A.2 = 1 (quest’ultimo con molteplicità 2).
Affinché A sia diagonalizzabile deve risultare car (A — Àj7) = 3 — 1 = 2 e car (.4 —X2/) = 3 - 2 = 1. Ora sostituendo al posto di X una volta 2 e una volta 1 in A —XI si ottengono le matrici A - 2 /3 =
-1 1 3 0 0 3 0
0-1
che ha caratteristica 2 e 0 13 A - h = 0 1 3 000 che ha caratteristica 1, quindi A è diagonalizzabile e una matrice diagonale simile ad Aè 200
B =
0 10 00 1
Per determinare la matrice diagonalizzante, cioè per trovare una matrice C ta le che sia B = C-1 AC, bisogna individuare gli autovettori dell’endomorfismo rappresentato da A e risolvere pertanto i seguenti sistemi matriciali
■ -1 1 3 (A - 2/)x = 0 0 3 0 0 -1 da cui le x 1soluzioni
”X “ V
~h~ " 1” h = h 1 , V/i € R
0
_ 0 _
01 (A - I) \ ~ 0 1 3 000
x y
rr
-o ~ — 0 0
e
0 0 0
Autovalori, autovettori, diagonalizzazione
213
da cui le oo 2 soluzioni
k -3 h h
- 0 “ ~ \= k 0 + h - 3 V/i, k e R. 1 0
Pertanto si ottiene "1 1 0 “ 1 0 -3 0 0 1 Esercizio 14.1 Si conside rin o le seguenti applicazioni f, : R 3 -» R3. Per ognu na di esse dire se è lineare. In caso affermativo determinare la matrice A, associata a /,. Stabilire quindi se A, è diagonalizzabile e, in caso affermativo, trovare la matrice diagonale associata.
2
.
a a + b 4- c c — a
3.
4.
0 a+b+c c —b
/
15 Reticoli, Algebre di Boote e circuiti
“ Un metodo per significare le proprie idee a qualunque distanza per mezzo di oggetti che siano visibili o invisibili, ma capaci di due possibilità, come fuochi d’artificio, campane, cannoni” (Francis Bacon)
15.1 Elem enti di Teor ia dei Reticoli La teoria dei reticoli ha avuto inizio nel 1897 con la pubblicazione, da parte di Richard Dedekind, del lavoro “Über Zerlegungen von Zahlen durch ihre grössten gemeinensamen Teiler' ed ha assunto via via sempre maggiore importanza in ambito informatico per le sue applicazioni nei linguaggi di programmazione. Definizione 15.1 Una struttura algebrica (H , v , a ) costituita da un insieme 11 e da due operazioni binarie V,A su 7Z si dice reticolo1 se, Va, b ,c e l i valgono i seguenti assiomi: . v \ a v b = b v a /. a aAbi = b, A. a proprietà commutativa *
, , (a v b ) v c = a v ( b v c) 2- 1 (a A b) A c = a A (b A c) propneta assoaat>va aV (a Ab) = a legge di assorbimento 3. a A (a v b) = a Le operazioni V, A si dicono unione e intersezione. Sia S un insieme e V{S) Finsieme delle parti di S. Rispetto alle operazioni di unione ed intersezione insiemistica (V(S), U ,fl) è un reticolo. Esempio 15.1
Lattice ( inglese), treilli (francese)
Sia (H ,V, A) un reticolo. Un sottoìnsieme non vuoto T di R K'X'.reùcolo, se T èchiuso rispetto a V e A.
rVéiKnow 15J
i
Osk "- :;~>o che
le proprietà delle operazioni v e A compaiono in modo simmeCiò dà luogo al seguente:
Teoremi 15.1 ì Principio di dualità) Sia P l ’enunciato di un teorema in teoria ■■-'.v;':. in cui intervengano soltanto le operazioni V, a e sia P* Venunciato .'Tiene da P scambiando fra loro, dove compaiono, i sìmboli di unione e T -uzkmt. Adora anche P* è l’enunciato di un teorema della teoria dei reticoli. » dice duale di P).
lustrazione. Basta osservare che l’insieme degli assiomi 1, 2, 3 della defini.5 i resta invariato se si scambiano fra loro i simboli di v, A. Se dunque 3Ear.se P è una conseguenza degli assiomi di reticolo, lo è necessariamente r. « Tvxemz. 15J Sia CR. v , a ) un reticolo, Va e R valgono le uguaglianze: : 1- a . a = a 1 aAa-a.
lJÌK*3raajoae. 1. Daa a (a vb) = a, ponendo b — a si ottiene a A {a v a ) = a. ' : &ZK che a ’. a = a v (a a (a v a)) = a, ancora per le leggi di assorbimento.
2 tessa?per dualità. ■
&MEBk 15.1 Sia (72,, v ,A) un retìcolo e a,b e R. Si ha: a A b = a & a v b = b.
Sia a = a A b. Allora: a v = (a A b) v - .et -ersi segue per per dualità3scambiando a con b. u q c i i
zmalio 4.
= b v (b A a) = b.
legami tra i reticoli e gli insiemi parzialmente ordinati, introdotti
' '47-1 y può introdurre in modo naturale una relazione d’ordine, infatti temerne: ì**xvm 153 Sia (R / ,
a
) m/i reticolo. Per a,b e 7Z si ponga:
a
a A b — a.
(T j e un insieme ordinato nel quale per ogni a, b € R si ha: 9 V
sup(a,b) — a V b inUa,b) = a a b. «A
Wd * ,h/a
'b) A a =s Ab Va) a a = «
Reticoli, Algebre di Boote e circuiti
217
Dimostrazione. Anzitutto si verifica che < è una relazione d’ordine in 71 Valgono, infatti, le proprietà: riflessiva : Va e R è a < a poiché a A a = a (proprietà di idempotenza); antisimmetrica : siano a , b e R e sia a < b, b < a allora a Ab - a ebr a = 6 da cui, per la proprietà commutativa, segue a = b; transitiva: siano a, b, c e R e a < b. b < c, dobbiamo provare che a < c Poiché, per ipotesi, si ha che a / \ b = a e b / \ c —b, segue
a A c = (a A b) A c = a A (b A c) = a A b = a. Proviamo, ora, che Va,b e R è sup(a,Z?)
=
a
v
b.
1. Infatti a A { a v b ) = a < $ > a < a v b e b A ( a v b ) = b A ( b v a ) — b & b
a A c — a e b
a
c
— b & a v c = c e b v c = c
segue che:
{a v b)
v
c
=
a v (b v c)
=
a v c = c ,
cioè a V b < c e, per il lemma 15.1 si conclude che a
v b
- sup{a,b).
Per provare che a A b — inf ( a , b ) basta osservare che esso è l’enunciato duale di sup(a,fr) = a v b e usare il principio di dualità. ■ La relazione d’ordine <, appena introdotta, è la relazione d’ordine associata al reticolo 71. S
coppia di elem enti a m m ette sup e inf: vale, infatti, il seguente
Teorema 15.4 Sia (1Z, <) un insieme ordinato tale che per ogni a b e II esistano sup{a,b) e \nf(a,b). Si definiscano su 71 le operazioni v,A ponendo Va, b e 7Z: a V b = sup ( a , b ) , a A b = inf ( a,b).
Allora (7£,v , a ) risulta essere un reticolo, e la relazione d'ordine associata a (7Zy,A) coincide con <. Dimostrazione. Co nsideriam o le applicazioni a,fi da 71 x a : ( a , b ,) - » a v b,
: (a ,b )
71 a 71, tali
a Ab .
Esse sono operazioni binarie su R per l’unicità di sup e inf Inoltre valgono le proprietà:
1. Commutativa: a
a
b = b A a, poiché inf i a.b) = inf ( b,a)
av b=
V
a, poiché su p(a,6) = sup(/>,tf)
che :
218
Capitolo 15
2. Associativa: (a A b) A c = a A (b A c) cioè inf[inf(a,/?),c] = inf[a , inf(6,c)]
(a v b) v c = a V (b v c) cioè sup[sup(a,i?),c] = sup [a, sup(b,c)].
Proviamo la seconda proprietà ponendo x = sup(a .b) e y = sup(6 ,c), sicché la tesi diventa: sup(.v,c) = sup(a, y). Cominciamo con l’osservare che in base alla definizione di estremo superiore è: a < x < sup(x,c) =» a < sup(jc,c)
Inoltre valgono contemporaneamente le condizioni: b < x < supU\c), c < supOc.c)
da cui si ottiene: y = sup(i?,c) < sup(x.c) =» sup(a,>')
< sup(jc,c)
(★ )
Inoltre: a < sup(a,>’) b
;t = sup (a,b) < sup(a,y)
e. poiché c < y < supia, y), si ha: c < sup(a,)0 jc < sup(a,y)
sup(;c,c) < sup (a,y).
Da (*) e (*★) segue quindi sup(x,c) = sup (a,y), come volevasi dimostrare. 3. Assorbimento: a v (a A b) = a cioè sup[a, inf (a.b)] — a a A (a v b)
=
a cioè infja, sup(a ,6)l =
a
.
Basta osservare che ìnf(a,b) < a < sup(a,b). Sia, ora. c la relazione d’ordine associata al reticolo (JZ ,v, a ). Allora aQ b & a Ab = a & inf (a,b) = a & a < b,
quindi C coincide con <. ■ Sia (71 ,v
,a )
un reticolo:
Definizione 15.3 Se esiste un elemento neutro rispetto all 'unione, tale elemento si dice zero del reticolo e viene indicato con 0, ciò significa che per ogni elemento a 6 HI è a V0 =a, cioè 0 < a. In altre parole lo zero, se esiste, è elemento mimmo del reticolo (71 visto come struttura ordinata).
R etico li, A lgeb re di Boole e arcuiti
219
15.4 Se esiste un elemento neutro rispetto all’intersezione tale, eU . mento si dice unità del reticolo e viene indicato con 1, ciò significa che per ogni a £ Ti è a A l = a, cioè a < 1. In altre parole l ’unita, se esiste, è elemento massimo del reticolo (71 visto come struttura ordinata). Definizione
15.5 Sia 7 Z un reticolo dotato di zero e unità e sia a e 71. in elemento a' £ 7Z si dice complemento di a se a A a' = 0 e a / a = 1 Definizione
Osservazione
15.1
1=0,
0 = 1 e (a')' = a.
15.6 Un reticolo (71 , v , A ) si dice modulare (o di Dedekind) se Va, b, c £ Ti tali che a < c risulta: Definizione
(a V b) A c = a v (b A c). Definizione
15.7
Un reticolo (71, v, a ) si dice distributivo se Va b. c e 71 a v (b A c) = (a \c b) A (a V c) a A (7? V c) = (a A b) V (a A c).
15.2 Se un retìcolo (7i , v , a ) è distributivo allora è modulare Infatti siano a,c £ 7i con a < c; allora Osservazione
(a V b) A c = (a A c) v (b A c) = a V (b A c). Il seguente esempio mostra che il viceversa non è sempre vero (Figura 15.1):
i
Figura 15.1
Infatti il reticolo è modulare ma non distributivo poiché sussiste il seguente. Teorema 15.5 Sia (7Z, V , a ) un reticolo distributivo dotato di 0 e 1 se un ele mento a £ Ti ammette complemento, questo è unico. Dimostrazione. Siano a' e a" due complementi di a , cioè due elementi verificano le uguaglianze:
a A a! = 0, a V a! — 1, a A a ' — 0, a V a" = 1.
che
A llora è:
d = af A ì = a A(flV a') =
per laproprietà distributiva: = (a' a a) v {a
a
a ”) =
= 0 v (a
a
0
v
(a' A a") = (a A a") = ( « ' A a ') =
a) = (a" A a) v (a" A a') =
ancora per la proprietà distributiva
= a" A (a v a ) = a" A
1
= a"
e quindi a - a ■ Esempi 1. Sia ?((/) Tinsieme delle parti di un insieme £/ e siano v , a le usuali operazioni di unione e intersezione di sottoinsiemi di U, allora (V(U), U ,fì) è un reticolo avente come zero l’insieme vuoto 0 e come unità l’insieme U. La relazione d’ordine associata è la relazione d’inclusione. V{U) è reticolo distri butivo e ogni A 6 V(U) ammette come complemento l’insieme complementare A' = U\ A. 2. Sia R l’insieme dei numen reali e < l’usuale ordinamento per cui (R ,<) è insieme totalmente ordinato. Quindi Va, b e E a v b = sup(a,b) = ma \(a,b) a Ab = inf (a,b) = min(a,b).
Pertanto (R, v , a ) è un reticolo (senza zero e senza unità): 3. Sia N* l’insieme dei numeri naturali diversi da zero e < la relazione per cui a a\b, ove a, b e N. In questo caso la relazione < è una relazione d’ordine parziale in cui, per ogni coppia esistono
inf{a,b) - a K b -
mcd (a,b),
sup (a,b) = a
v
b = mcm (a,b).
Quindi (N*. v ,a ) è un reticolo, ove lo zero è il numero 1, ma non c’è unità.
15.2 Algebre di Boole Il nome del matematico inglese George Boole (1815-1864) è legato a numerose definizioni alcune delle quali riguardanti la formalizzazione e la meccanizzazione del processo logico del pensiero; famoso è il suo trattato dal titolo “The Laws of Thought” scritto nel 1854. L’idea di Boole è quella di sviluppare un processo logico attraverso simboli anziché attraverso parole: si definiscono, in tal senso, le algebre, gli anelli, le funzioni, le espressioni Booleane. Nel 1938 Shannon ha osservato che le algebre booleane potevano essere utilizzate per analizzare circuiti elettrici, discorso che verrà sviluppato nel paragrafo sucessivo. Cominciamo, pertanto, col definire le Algebre di Boole.
Reticoli, Algebre di Boole e arcuiti
221
Definizione 15.8 Un 'algebra di Boole è un reticolo (11. / .A) distributivo, do tato di zero e unità, in cui ogni elemento ha complemento. Osservazione 15.3 rema 15.5).
II com plem ento a di un elemento a e 1Z è unico icfr Teo-
Proposizione 15.1 In un 'algebra (o in un reticolo) di Boole 11 valgono le Leggi di De Morgan, cioè Va, b e 1Z è: 1. (a v b)' = a' A b 2.
(a
A
b)' = a' v b'.
Dimostrazione. 1. Per la distributività del reticolo abbiamo: (a
v
b)
v
(a'
A
&') = [(a
V
b) v a']
A
[(a v b) v ¿'1 =
per le proprietà commutativa ed associativa delFunione e dell’intersezione: = [(a v a') v b] A [a v (6 v b')] = (1 v b)
A
(a v 1) = 1 A 1 = 1.
Inoltre è: (a v b) A (a ' A ¿/) = [a
= [(a
A
A
(a'
A
//)} v [b A (a'
a') A ¿/] v [(¿7 A b') A a'] = (0 A b')
V
A
/?')] =
(0 A a') = 0 v 0 = 0.
Per definizione di complemento possiamo concludere che a' a b' — (a v b)r.
2. Segue per dualità dal punto 1. ■ La classe delle Algebre di Boole è legata ad una particolare classe di anelli, detti anelli di Boole. Definizione 15.9 Un anello (/?, + ,•) con unità è detto anello di Boole se per ogni a e R si ha a2 = a, cioè se ogni elemento di R è idempotente. Osservazione 15.4
Se (R, + ,-) è un anello di Boole Va e R si ha: a = —a.
Dimostrazione. Infatti, considerati a,b e R, per definizione (a + b): = (a + b) ma (a + b)2 = (a + b) (a + b) = a2 + ab + ba + b~ = a +ab + ba + b
quindi a + a b + ba + b = a + b cioè ab = -ba,
ponendo b — a si ottiene a2 = —a2 da cui si può concludere che a —
a
■
222
Capriolo 15
Osservazione 15.5 Un anello di Boole è commutativo. Dimostrazione. Da quanto sopra visto è ab = —ba — ba ■ Esempio 15.2 L’ anello ( I o , + ,•) delle classi di resti modulo 2 è un anello di Boole.
Infatti: |0g = [0]2e [1]| = [1]2. Il legame fra le Algebre dì Boole e gli anelli di Boole è espresso dal seguente: Teorema 15.6 Sia (Jl, v , a ) un’algebra di Boole. Ponendo Va,b e 11 a + b = (a A b ) V (a' A b) a -b = a Ab sono definite su 11 due operazioni binarie +,• tali che (il, + ,•) è un anello di Boole. Inversamente sia (11, 4- ,•) un anello di Boole. Ponendo Va,b e H a v b = a + b + a- b a Ab = a • b sonodefinite su K due operazioni binarie V, A tali che (11, V , A) è un ’algebra di Boole.
15.2.1 Algebre di Boo le e c ir c u it i
Vogliamo ora presentare un’importante applicazione del concetto di Algebra di Boole all’algebra dei circuiti, insistendo sul fatto che tale applicazione fu resa possibile grazie ad alcune osservazioni di Shannon nel 1938, che fece sì che l’al gebra di Boole divenisse uno strumento indispensabile per l’analisi ed il disegno sia di circuiti elettnci sia telefonici. Infatti l’algebra dei cncuiti si inserisce nella teoria generale dell’ algebra booleana come un’algebra con due elementi (0 e 1). Al momento limitiamoci a considerare circuiti molto semplici che coinvolgo no solo interruttori denotati in genere con lettere singole: a, b, c ... Se due interruttori aprono e chiudono contemporaneamente un circuito, sa ranno designati con la stessa lettera, nel caso in cui uno sia aperto quando l’altro è chiuso e vicersa saranno indicati l’uno per esempio con la lettera a e l’altro con la lettera a'.
Reticoli, Algebre di Boole e circuiti
223
La connessione in parallelo sarà indicata con a +b - a v b (Figura 15.2)
----------
a
---------
- r.“ “ " — - ■r i* f
—
i{ w
b —
Figura 15.2
mentre la connessione in serie sarà indicata con ab = a a b (Figura 15.3).
a
b
Figura 15.3
Così ad ogni circuito in serie o in parallelo corrisponde un’espressione algebri ca e viceversa ad ogni espressione algebrica contenente solo gli operatori ' corrisponde un circuito. Esempio 15.3 ra 15.4):
Descrivere un circuito che realizza la funzione booleana (Figu a b c -I- a ( b + c ) =
(a A b A c') V (a A (b V c')).
a ---------- b ----------- c b
Figura 15.4
Assegnamo il valore 1 ad una lettera se essa rappresenta un interruttore chiuso, 0 se aperto. Sicché le lettere giuocano il ruolo dì variabili che possono assumere valore 0 oppure 1. Quindi due espressioni algebriche sono uguali se e solo se i corrispondenti circuiti sono equivalenti. Ricordiamo che due circuiti sono equivalenti se le condizioni di chiusura dei due circuiti sono le stesse per ogni posizionamento degli interruttori Esempio 15.4 Costruire una tabella delle proprietà di chiusura del circuito cor rispondente alla funzione: g = a b + c{a -F b') — (a' A b) v (c A (a v b')).
Una tabella di proprietà di chiusura per una funzione è identica (tranne che nel l’interpretazione) ad una tavola di verità di una proposizione funzionale (vedi Ca pitolo 2) (vedi tabella seguente).
a 1 1 1 1 0 0 0 0
c a' Ab 1 0 0 0 1 0 0 0 1 1 0 1 0 0 1 0 0 0
b 1 1 0 0 1 1
aVb' c A 1 1 1 1 0 0 1 1
(a v b') 1 0 1 0 0 0 1 0
(a' A b)
v
(c A (a V b ')) 1 0 1 0 1 1 1 0
Semplificazione di circuiti Senza addentrarci neH’argomento in questione e invitando il lettore interessato alfargomento ad approfondire metodi formali, possiamo dire che un metodo gene rale per semplificare un circuito è anzitutto quello di trovare la funzione booleana che rappresenta il circuito stesso, quindi semplificare detta espressione e infine ridisegnare il circuito corrispondente all’espressione semplificata. Esempio 15.5 Semplificare il circuito in figura 15.5:
Figura 15.5
Il circuito è rappresentato dalla funzione booleana: / = (x 14- y') - ( jc' + >0 • (a + y) = (a ' v / ) a (a-' v y ) A (a v >’) che può essere così semplificato: Oc'
V/ )
A (a 7 V )’) A
(A V >0
=
(a '
V/
)
A [ ( a V V) A ( a
'
V >>.)]
(*' V y) A>- = (a ' A y) v ( / A y) = (a ' a y). Quindi il circuito è equivalente al circuito semplificato (Figura 15.6):
Figura 15.6
=
16 Elementi di criptografía'
s A T
0
R
A T R E E N P E 0 T
0
R
P 0 E T R A A S
16.1 Term in o lo g ia Che cos’è la criptografia? La sua etimologia, dal greco kryptòs = nascosto, coperto e graphia da graphein = scrivere, suggerisce la risposta: si tratta di una scrittura in forma “cifrata’’ di messaggi, in maniera tale che essi possano essere letti o decrittati solo da chi riceve il messaggio. È usata fin dall’antichità per documenti top secret in campo militare, diplomatico e governativo. La diffusione di nuovi sistemi di comunicazione e dei computer negli anni 60 portarono molte istituzioni sia in campo economico sia finanziano a ricercare nuovi sistemi per proteggere l’informazione digitale. La criptografia è spesso confusa con la “steganografia’' che è. invece, la disciplina dell’occultamento dei messaggi: narra, per esempio, Erodoto che istaio e Aristagora, residenti in due paesi in guerra tra loro per comunicare usassero radere i capelli di uno schiavo, sul cranio di questi disegnavano alcuni simboli e gli facevano attraversare il confine solo quando i capelli fossero ricresciuti Al destinatario non restava che tagliare i capelli allo schiavo e leggere il messaggio. La criptografia (o crittografia), invece, non mira a nascondere il messaggio in sè ma il suo significato, in modo che questo possa essere recuperato al momento opportuno.1 1Si ringrazia il do». Lambrugo per le utili discussioni
226
Capitolo 16
II messaggio originario inviato dal mittente è detto testo chia ro. Un codice (o cifratura) è un metodo per alterare un messaggio in chiaro e ottenere un testo cifrato (ocrittato). Per codificare un messaggio è necessaria una trasformazione, in altre parole un algoritmo matematico, che cambi le lettere del testo chiaro. La chiave determina la particolare trasformazione usata. Colui che nceve il messaggio, essendo a conoscenza della trasformazione e della chiav e usata per codificare, è in grado di ripristinare il testo chiaro. La crittanalisi è la scienza che si occupa di studiare i metodi di ricostruzione di un testo chiaro crittato senza conoscere la chiave. Cominciamo con il definire la trasformazione cifrante. Definizione 16.1 Una trasformazione cifrante è una corrispondenza biunivoca f che associa a ogni messaggio unitario del testo chiaro P un messaggio unitario del testo cifrato C
f : P
C
tale che
f ( P ) = C
Osservazione 16.1 La trasformazione decifrante è la funzione inversa:
f ~ l : C -» P Definizione 16.2 (/, P, C) è detto criptosistema. Il passo iniziale per costruire un crìptosistema è quello di etichettare tutti i messaggi, del testo chiaro e di quello cifrato, con oggetti matematici nei quali si possono costruire funzioni; per esempio Y alfabeto inglese A, B, C, . . . ,X, Y, Z può essere etichettato con 0, 1, 2, ... , 23, 24, 25 utilizzando messaggi unitari costituiti da una lettera. a
! b
Al
c D E F G H I J K L M N 0 P Q R S T U V W X Y Z ? 3 4 5 6 7 8 9 10 II 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Cosi un sistema per cifrare un messaggio è quello di utilizzare una cifratura per sostituzione monoalfabetica, cioè ogni lettera del testo chiaro è sostituita da una lettera dell’alfabeto cifrante secondo una comspondenza biunivoca. Esempio 16.1 Nel codice di Giulio Cesare ogni lettera è sostituita da quella k posti avanti nell’alfabeto, quindi C = /(/>) = P +k (mod 26) Per esempio alla parola GAG (testo chiaro ) corrisponde FLDR se
k = 3.
Definizione 163 Dat o un a lf a b eto d i N le tte r e c o n e q u i v a l e n t i n u m e rie «V- l e dato un intero b si dice trasformazione C = f i P) = P — b
traslante la f u n z i o n e
(mod M )
f
'
t a le
.2. ite
Elementi di criptografía
Osservazione 16.2
227
Per decodificare un messaggio unitario si computa
P = f ~ \ C ) = C - b (mod N) Definizione 16.4 II parametro b è detto chiave del sistema. Supposta nota al crittoanalista la struttura del sistema crittografico, il numeri > di possibili chiavi misura la sicurezza del sistema stesso Nel caso della trasforma zione traslante ci sono 25 possibili chiavi per recuperare il messaggio originario Definizione 16.5 Dato un alfabeto di N lettere con equivalenti numerici 0,1 2,
N — l e dato un intero b si dice mappa affine la funzione f tale che C = f{P) = aP +b (mod N)
af eZ
Esempio 16.2 Supponiamo a = 2, b = 3 e quindi C = 2P 4- 3 (mod 26). Sia “ecco” il messaggio chiaro E 4
C 2
C 2
0 12
L 11
F 7
F 7
B 1
Per decodificare occorre operare computando
P = a'C -f b' (mod N) Se m c d (a,N) = 1 = >• a' = a~[ (mod N) e b' = - a b (mod N). Naturalmente se m c d (a,N) 7^ 1, / non è biunivoca e quindi non è trasformazione codificante Altri esempi di sostituzione monoalfabetica riguardano casi in cui ogni lettera è rimpiazzata da un’altra in base a una chiave e la chiave è l'alfabeto cifrante, ecc. Già nel IX secolo gli Arabi scoprirono un metodo per violare questi cnttosistemi analizzando le frequenze con cui ogni singola lettera compare in un alfabeto per esempio, in italiano la lettera "a" rappresenta circa 1*11% delle lettere nei testi chiari. Consideriamo messaggi unitari formati da blocchi di 2 lettere: se il testo chiaro consta di un numero di lettere dispari si aggiunge alla fine una lettera che non crei confusione (per esempio, X o Q). Ogni blocco di 2 lettere viene pensato come intero di 2 cifre in base N e si costruisce così una corrispondenza biunn oca tra l’insieme di tutti 1 di grafi su un alfabeto di V lettere e l'insieme degli interi non negativi minori di /V: . Posto C = aP 4 - b (mod N1) con mc d
= lè P =
ove
a
—
a - 1 ( m o c
V~
b =
— a
b
a’C -b b
mod
-
228
Capitolo 16
Esempio 16.3 Sia N = 26.N2 = 576 e C = 59 P + 53 (mod 576). Poiché S ? ! hanno come equivalente numerico rispettivamente 18 e 8, il messaggio “sì” ha equivalente numerico 18 •26 + 8 = 476 quindi C = 59‘ 476 + 53 (mod 576)
cioè
C = 421 = 41
(mod 576)
per tradurre C in un blocco di due lettere scriviamo C = jc'- 26 + / = 16-26 + 5 il testo cifrato sarà “q f \ Famoso in questo ordine di idee è il codice di Vigenère del xvi secolo, basato sulla considerazione di blocchi di k lettere come vettori di (Z^)* e codifica secondo la trasformazione traslante C = P + b ove
b € (ZN)k
Rompere il crittosistema è possibile conoscendo o indovinando N e k e con un’analisi delle frequenze delle prime lettere di ogni blocco per individuare b. Un altro cnttosistema fa uso di matrici. Supposto di inviare c om e messaggi unitari dei digrafì su un alfabeto di N lettere, una trasformazione codificante è unabijezione tra Z# xZN e se stesso. Descriviamo detta trasformazione con una matrice A e M u ril i) tale che mc d (det A, N) = 1. Ogni messaggio unitario P = (*) è trasformato in testo cifrato C = (' ) dalla legge C = A • Pdnod N) cioè
a b c d
(mod N)
Poiché mcd (det4,A0 = 1, esiste la matrice A l . Quindi si può decifrare e si ottiene
P = A~[C (mod N).
1 2 si ha det A = 3, mc d (3,26) = 1 5 13 e quindi A è invertibile. Vogliamo codificare la parola “ecco”: dividiamola in 2 blocchi “ecv e “co” e trasformiamoli nei loro equivalenti numerici: “ec dà luogo a “ 4,2” mentre “co” a “2, 14” e calcoliamo il primo blocco cifrato Esempio 16.4 Se N = 26 e A =
8 20
(mod 26)
Elementi di criptografía
229
il secondo (mod 26) il testo cifrato sarà “I U E K”. Per decrittare è necessario calcolare A 1 (mod 26) 13 8 7 9 da cui (mod 26) e così via. Naturalm ente per violare questo tipo di codici occorre procedere analizzando le frequenze dei blocchi di lettere. Dopo la crisi della criptografia dovuta alla violazione della cifratura di Vigenère da parte di B abbage e Kasiski, bisogna arrivare alla prima guerra mondiale per avere un codice ADFGVX la cui forza stava nella sua natura contorta in quan to risultante da procedimenti sia di sostituzione, sia di trasposizione di lettere del testo chiaro in posizioni diverse da quelle originarie. La disposizione delle lettere e dei numeri è la seguente ed è nota sia al mittente che al destinatario
A A D F G V X
J
D P t k u
6
X
s
V
9
e
8 / 7 •
F 3 4
b
y
G d 0 c w l 0
V i
a 5 g
r f
X n h z m 2 q
Il secondo passo è una trasposizione che dipende da una parola d’ordine parte della chiave. La scelta delle lettere ADFGVX dipende dal fatto che il crittotesto era tra smesso con l’alfabeto Morse e si utilizzarono, pertanto, come sole lettere dell’al fabeto cifrante quelle che danno luogo alle sequenze di punti e linee più dissimili le une dalle altre.
230
Capitolo 16
16.2 Codice di Vernam Nel primo ventennio dello scorso secolo Vernam propose un codice polialfabetico sul tipo di quello di Vigenère con chiave generata casualmente di lunghezza pari al testo chiaro. Inizialmente Vernam prese un n astro (detto verme), sul quale aveva perforato una successione casuale di caratteri della stessa lunghezza del testo da cifrare. Anche il testo da cifrare fu riportato su di un nastro perforato e i due tabulati furono inseriti in due lettori diversi tra loro, collegati e regolati dalla funzione “o esclusivo” al fine di ottenere un nuovo nastro contenente un messaggio inintellegibile. Shannon, padre della “teoria matematica della comunicazione”, dimostrò (1949) che un codice è “teoricamente sicuro” se e solo se è un codice di Vernam. La debolezza del codice di Vernam sta nel fatto che la chiave lunga come il testo deve essere comunicata al destinatario in m odo sicuro. Nonostante tutto il codice di Vernam pare sia stato utilizzato dai servizi segreti dell’Est europeo durante la guerra fredda, per il telefono rosso tra Mosca e Washington e pare sia stato trovato tra gli effetti personali di Che Guevara. È noto che nel secolo XX sono state prodotte macchine per rendere sempre più complesse le cifrature, come la macchina Enigm a, usata dai tedeschi durante la seconda guerra mondiale. La decrittazione dei messaggi emessi da Enigma costrinse Alan Turing a inventare la “sua” macchina.
16.3 Crittografia a chiave seg reta e crit tografia a chiave pubblica Ancora ricordiamo che nel 1977 la ib m pubblicò un algoritmo completo a uso crit tografico che risultò uno dei crittosistemi più usati: il Data Encryption Standard (des ). Il des è un codice che opera su blocchi di 64 = 26 bit, ognuno dei quali è diviso in 8 blocchi di 8 bit ciascuno (l’ultimo simbolo è un carattere di controllo). Alternando disposizioni e sostituzioni per 16 volte, questo codice ha 256 chiavi possibili. Il Bancomat e tutte le carte a banda magnetica utilizzano il d e s . La crittografia a chiave pubblica nasce, invece, a seguito dì un articolo dì Diffie e Hellman del 1976 e si basa sul fatto che è possibile rendere pubblico un certo algontmo a chiave, ma non trovarne l ’inverso senza una proibitiva lunghez za computazionale. Una tale trasformazione è detta unidirezionale. La ragione di una tale scelta è da ricercarsi nella necessità di usare un sistema crittografico tra persone site in località geograficamente distanti, di costruire protocolli di identificazione e di firma e di depositare le password dei computer. La ricerca di funzioni unidirezionali su cui fondare cifrature a chiave pubblica conduce, naturalmente, a problemi che la complessità computazionale classifica come NP. Per esempio, il problema della fattorizzazione di un intero “grande” è un problema N P,
Ele m en ti di criptogra fía
231
Esem pio 16.5 II sistema r s a (dai cognomi dei ricercatori Rivest. Shamir. Adle man) è basato su una funzione unidirezionale. Ciascun utente sceglie a caso due numeri primi p e q molto grandi (di almeno 100 cifre) e un esponente k coprirne con il prodotto (p — \){q —1) = (p{n) = (p(p)(p(q) e 1 < k < (p(n). 1. Si trasforma il messaggio in una sequenza di interi, usando un qualsiasi codi ficatore. 2.
Gli interi ottenuti si raggruppano a formare interi più grandi, ognuno dei quali rappresenta un blocco di lettere.
3. Si procede alla codifica, trasform ando ognuno dei numeri a ottenuti al punto 2) nella sua k-t sima potenza mod n, cioè si calcola b = ak (mod n). 4.
Si invia il messaggio.
5. Chi riceve il messaggio cerca l’inverso della classe k modulo (p - \){q - \ ) cioè [A:](” 1_ i)(t/_ 1). Tale inverso esiste perché m c d (k,(p-\){q-\))= 1. Inoltre (cfr. Capitolo 3) esistono due interi h, y tali che kh + y{p - 1)(q - 1)= 1. Allora bh = (ak)h = akh = a l- y{p~lKq~l) Dal “Piccolo Teorema di Fermat” 2 si ottiene che a= 1 (mod p), aiq~l) = 1 (mod q), da cui segue che bh = a(ap~l)y(q~l) = a{ mod p)
e bh = a{aq~l)y(p~l) = a (mod q). Poiché p e q sono primi distinti e quindi mc d (p,q) = 1 si può concludere che bh = a (mod pq) e così si ritrova a e quindi il messaggio originale.
Teorema 10.3 Se MCD (a.n) = 1 =► a ^ n >= 1 (mod «)
17 Codici correttori
“ Errare umanum est, perseverare autem diabolicum”
La trasmissione di messaggi attraverso canali di trasmissione, siano essi unidi mensionali (una frase) o bidimensionali (un’immagine), può introdurre errori. Se si trattasse di una frase sarebbe abbastanza semplice trovare gli errori ma, in ge nere, si tratta di messaggi criptati quindi di sequenze di numeri o di lettere e un errore, difficile da individuare, potrebbe alterare il significato del messaggio. Per rimediare a questo inconveniente, è necessario costruire dei meccanismi di co difica che rendano possibile la loro correzione. Naturalmente ciò comporta un “allungamento” del messaggio. Schematizziamo un sistema di comunicazione: informazione
h->
codifica
trasmissione
decodifica
> —
informazione
ove la trasmissione può avvenire attraverso fibre ottiche o per registrazione su bande magnetiche o su CD o via etere ecc. Il primo passo nella codifica di un messaggio è la sua trasposizione in un alfabeto adatto al canale usato per la trasmissione. Attualmente si è affermata la notazione binaria che permette di convertire facilmente 1simboli 1 e 0 nel passag gio o meno di impulsi elettrici. Assumiamo quindi come alfabeto l’insieme Z 2 = (0,1}, chiamiamo bit gli elementi dell’alfabeto e indichiamo il messaggio da trasmettere con una ¿-pia di bit x = (^ 1,^ 2, . . . ,Xk ) ovvero con la parola di k bit x = x\x2 • • •** e diciamo k la lunghezza di questa parola. La codifica di x consiste nell’associare alle 2k parole di k bit, una parolacodice di n bit con n > k. Indicati con K2k e K2n gli insiemi delle parole di lunghezza k e di lunghezza n rispettivamente, consideriamo x € K2k, m e K 2« e una funzione / imettiva
234
Capitolo 17
(detta funzione di codifica o codice) / : K2i. -> K2n tale che: / : x —► m.
Poiché si è scelta una codifica iniettiva, l m f = { / ( je) | jc e K2k), che è l’insieme delle parole-codice, ha esattamente 2k elementi. Indichiamo con con T la trasmissione. Si avrà
T : m -+ m ' = m + e ove e è l’eventuale errore di trasmissione. Se m! e Im / non si può fare altro che porre m = m \ senza avere la certezza assoluta che il messaggio ricevuto sia x : in tal caso bisogna che il codice abbia la minor probabilità possibile di trasmettere errori. Se m' £ Im / si ha la certezza che si è verificato un errore in fase di trasmissione. Dalla Teoria dei grafi è noto che il grafo cubico (Figura 17.1):
Figura 17.1
può essere utilizzato per rappresentare un codice binario. Sia / la funzione di codifica così definita:
f(x) = xp ove
se il numero dei bi t è dispari se il numero dei bi t è pari.
Allora si ha la seguente tabella: X
/ ( * )
00
000
01
011
10
101
11
110
Se ncevessimo la parola Oli questa appartiene a Im / e non siamo in grado di rilevare errori, anche se non sappiamo con certezza se la parola inviata era 01
Codici correttori
235
oppure 00 con errore. Di contro se ricevessimo la parola 100, poiché 100 £ Im /. la trasmissione presenta sicuramente un errore ed è pertanto necessario chiedere di ritrasmettere il dato. Siamo quindi interess ati ad occupa rci dei cosiddetti “codici correttori ' Se un codice è in grado di trovare gli errori si parla di codice “ error detecting ” se è in grado anche di correggerli si parla di codice “error correcting', Abbiamo precedentemente osservato che ogni parola-codice ( 1, £?21 • • •
)
può essere associata ad un vettore appartenente allo spazio VF ove l'alfabeto F è un campo finito con q elementi e lo spazio vettoriale V ha dimensione n. Definizione 17.1 Un codice forma to da q cifre è detto codice -ario (se q — 2 si parla di codice binario).
17.1 Distan za di Hammin g Definizione 17.2 Date due parole a e b di lunghezza n, definiamo, nello spazio
vettoriale Vf, una distanza d(a,b), detta distanza di Hamming, come il numero di posti in cui le due parole differiscono, cioè d(a,b) = {/11 < i < n,a, f=- b,}se a — {a\,a2 , • - • )Gn) e b — tb\,b2, . • • ,b,¡). Esempio 17.1
Siano a = (1,2,3,4,5) e b = (4,2,3,4,5) è d(a,b) = 1.
Abbiamo visto che nei codici binari le parole-codice di lunghezza n possono essere rappresentate dagli spigoli di un cubo « —dimensionale. La distanza di Hamming è uguale al numero di spigoli che bisogna percorrere per andare dallo spigolo rappresentante la prima parola allo spigolo rappresentante la seconda parola (vedi E sempio 17.1). Definizione 17.3 L ’insieme S delle parole w di VF la cui distanza di Hamming
da a è minore o uguale ad h è detto sfera di Hamming di centro a e raggio h. Cioè S = {w e Vf\d(a,w ) < h }. Il minimo delle distanze di Hamming permette di utilizzare differenti error detecting codes e error correcting codes. Infatti se il minimo delle distanze di Hamming è 2, si avrà un single error detecting code: ogni parola che viene tra smessa con un singolo errore è recepita come parola priva di significato, mentre un duplice errore non è rilevato; se il minimo è 3 si avrà o un single error correcting code o un doublé error detecting code. Ogni parola trasmessa con un singolo errore è un vettore la cui distanza di Hamming dall’originale è minore di ogni altra, quindi si individua e si corregge ogni errore singolo di trasmissione, mentre un errore duplice può essere individuato ma non corretto.
236
Capitolo 17
Se la distanza minima tra ogni coppia di parole è h si parla di un (h - \)-error detecdng code o di un ( ^ ) - e r r o r corecting code.
Definizione 17.4
Pertanto per aumentare il minimo delle distanze di Hamming, ad ogni parola contenente r cifre di informazione se ne aggiungono ulteriori k di controllo. Si ritiene buono un codice per il quale il numero di parole disponibili è il più grande possibile, una volta assegnato il minim o de lle distanze di Ham ming h e la lun ghezza n delle parole-codice. Ci sono varie limitazioni superiori per tale numero e solo per amore di completezza ricordiamo tra esse lo Joshibound.
II numero massimo di parole di lunghezza n in un codice q —arìo con distanza minima h è q n~h+ì. Teorema 17.1
17.2 Codici lineari e codic i g ru p p o Un codice C è detto lineare se C è un 'applicazione lineare tra gli spazi vettoriali Vjt(Zp) e Vn(Zp) (in particolare tra e V/„ (Z 2)j. Definizione 17.5
Se A = (atJ) è la matrice rappresentativa di C, rispetto alle basi canoniche degli spazi vettoriali in questione, A e MatnxkC^i)- S e r € V*(Z2) la sua cifratu ra tramite C è M = Ax. Naturalmente Im C è un sottospazio vettoriale di V,,(Z2) ed essendo C iniettivo segue che d im lm C = k. Osse rviam o che il messaggio nullo (0,0,............ 0) = 0vk{Zz) è codificato nello 0Vn(z2)Indicata con h la distanza di Hamming minimale di un codice lineare, diremo che il codice C è di tipo (n,k,h) per dire che il messa gg io co dificato è di lunghezza n, quello iniziale di lunghezza k e che la distanza di H amm ing è h .
Sia Qn lo spazio vettoriale delle n-uple a coefficienti in Zp e f ’• Qm -> Qn una funzione codificante. Il codice f definisce un codice-gruppo se Im f è un sottogruppo di (<2",+). Definizione 17.6
I codici-gruppo sono vantaggiosi per la facilità con cui si trova la minima distanza tra le parole-codice. Vale infatti il seguente Teorema
17.2 Sia f : Qm -> Qn una funzione codificante tale che I m f sia un
gruppo. La minima distanza tra le parole-codice è data dal peso minimo tra i pesi delle parole-codice non nulle (il peso co dì una parola x è la sua distanza dallo 0, cioè co{x) = d{xr 0)). Poniamo Q = Z2, allora il processo di rilevam ento e co rrezion e dei messaggi ncevuti per codici-gruppo, permette di osservare che se una parola-codice w è stata inviata con un errore nell’ultimo simbolo e v è la parola ricevuta, si ha che i’ = w 4- en ove en è una parola che ha tutti i simboli nulli tranne T ultimo. Sicché la totalità delle parole ricevute con un errore nell ultimo sim bo lo costituiscono il laterale w e, di w in Z i.
Codici correttori
237
17.3 Qu adr ati lati n i Definizione 17.7 Un quadrato latino è una matrice quadrata di ordine n i cui elementi appartengono ad un insieme S di n simboli, con la proprietà che ogni simbolo di S compare esattamente una ed una sola volta in ogni riga ed in ogni colonna. Esempio 17.2
Sia S = {1,2,3}: è un quadrato latino la matrice:
"12 3" 3 12 _ 2 3 1_ Il primo a formulare la definizione di quadrato latino fu Eulero e solo più tardi grazie a Cayley si scoprì l’esistenza di un legame fra quadrati latini e gruppi o meglio tra quadrati latini e quasi gruppi 1, nel senso che un “quadrato latino' è la tavola di moltiplicazione di un quasi gruppo.
Definizione 17.8 Siano A = (atJ) e B = (btJ), 1 < i, j < n, due quadrati latini di ordine n. A e B si dicono ortogonali se ogni coppia ordinata di simboli (a,j bl}) (i = 1 , . . . ,n\ j = 1 , . . . ,n) appare una ed una sola volta fra le n2 coppie iàij, bij).
In altre parole, chiedere che due quadrati latini dello stesso ordine e basati sugli stessi simboli siano ortogonali, significa domandare che, sovrapposti, la stessa coppia di elementi non compaia due volte.
Esempio 17.3 " 1 2 3" "2 1 3 " A = 3 1 2 , B = 1 3 2 2 3 1 3 2 l i = l : (1,1),(1,2),(1,3) i = 2: (2,1),(2,2),(2,3) « = 3 : (3,1),(3,2),(3,3). E possibile costruire una corrispondenza tra quadrati latini di ordine q e insiemi di q2 parole-codice. Sia A = 0atJ) un quadrato latino di ordine q , le q2 triplette (ii.j.aij) possono essere interpretate come insieme di q~ parole-codice definito su un alfabeto di q simboli 1,2.... , q . /y
^
pio 17.4
Dato il quadrato latino f i 2 3“ 3 I 2 2 3 1
1Un quasi gruppo Q e una struttura ( Q .*) ;n cui per ogni a. » € (2 e equazioni u » t — tr ammettono una ed una sola soluzione.
238
Cap itolo 17
le parole-codice sono le seguenti: (1,1,1); (1,2,2); (1,3,3); (2,1,3); (2,2,1); (2,3,2); (3,1,2); (3,2,3);(3,3,1). Essendo gli elementi di un quadrato latino, il minim o delle distanze di Hamming tra due parole è 2. I quadrati latini risultano particolarmente utili nella costruzione di error detecting codes binari. Il seguente Teorema prese nta un alg oritm o p er operare alcune di queste costruzioni. Teorema 17.3 Sia A = (atJ) un quadrato latino dì ordine q. L'insieme delle parole i = \ , .. . ,q\ j = 1 ___ ,q — 1 costituisce un codice q-ario di lunghezza 4 e distanza di Hamming 3. I quadrati latini ortogonali sono invece particolarmente utili per costruire er ror correcting codes. Storicamente Olderogge nel 1963 di ed e un prim o esempio di codice costruito a partire da quadrati latini ortogonali la cui particolarità è quella di essere in grado di correggere errori singoli e doppi. In seguito Golomb e Posner stabilirono legami tra resistenza di quadrati la tini di ordine q e resistenza di codici g-ari, in termini di “dominio delle torri”, concetto suggento loro dal gioco degli scacchi. Concludiamo questo capitolo illustrando un esempio di costruzione di codice di Olderogge nel caso n — 5 (n.b. Olderogge usò copp ie di qu adrati latini orto gonali di ordine n dispari per costruire codici, le cui parole avessero lunghezza n2-1- 4n + 1, ove n2 sono cifre di informazione). Sia 0101101110011110101010100 il messaggio da spedire, contenente n2 = 25 = 52 cifre di inform azione . Al fine di ottenere le 4/i + 1 = 4 x 5 + 1 cifre di controllo, si divide il messaggio in componenti di lunghezza 5
01011 0111001111 01010 10100 Questo suggerisce di considerare ciascuna componente come riga di una matrice quadrata di ordine 5 su un campo Z 2 = {0,1}. Ottenia mo così la matrice: "0 1 0 1 1“ 0 1 1 1 0
A=
0 1 1 1 1 0 10 1 0— 10 10
0 1
“Nulla è mai la fine e nulla lo sarà mai” (K. Vonnegut)