coursAlgo_V6

iUT

ORSAY

Université Paris XI I.U.T. d'Orsay Département Informatique Année scolaire 2003-2004

Algorithmique : Volume 6 • • • •

Recherche Adressage dispersé Tris Complexité

Cécile Balkanski, Nelly Bensimon, Gérard Ligozat

Recherche

2003-2004

Algorithmique 6 : Recherche, complexité, tris

2

Recherche • Problème général abstrait ensemble de valeurs E, élément a; réponse: booléen

est-ce que a ∈ E? (∃x) { x∈E | x=a }

• plus généralement existe-t-il x vérifiant certains critères (∃x) { x∈E | ϕ(x)} trouver tous les x satisfaisant certains critères { x∈E | ϕ(x)} (bases de données)

2003-2004


3

Recherche en informatique • On ne travaille pas sur des ensembles mathématiques, mais sur des structures de données particulières • Les données peuvent être de nature complexe (agrégats, classes) • Exemples : tableau 20 18 9

5

24 13 27 2

8

32 7

12 36 15 17 19

tableau trié 2

5

2003-2004

7

8

9

12 13 15 17 18 19 20 24 27 32 36 Algorithmique 6 : Recherche, complexité, tris

4

arbre binaire de recherche 20 24

18

27

9 19

5

32

13

2 8 7

2003-2004

36

15 12 17


5

Tri de données complexes • Exemple de donnée complexe: type Etudiant = agrégat nom: chaîne âge: entier classement: entier photo: fichier_GIF fin • on peut trier par nom (ordre alphabétique), par âge, par classement • pas par photo • clés, clés primaires ex-aequo, même âge 2003-2004


6

Recherche et type de données • On utilise divers types de données sur lesquelles on fait des opérations de base: -

ajout suppression mise-à jour consultation

• Chaque structure a des avantages et des inconvénients : • tableau, tableau trié, arbre binaire, liste chaînée, etc. 2003-2004


7

Recherche séquentielle fonction rechSeq (tab , nbre , val) retourne (booléen) {renvoie VRAI si val est dans tab, FAUX sinon}

paramètre s (D) tab: tableau[1, MAX] d'entiers (D) nbr, val: entier variables trouvé: booléen i: entier début trouvé ← faux i← 0 tant que non trouvé ET i < nbr faire i ← i+ 1 trouvé ← (tab[i] = val) ftq retourne (trouvé) fin 2003-2004 Algorithmique 6 : Recherche, complexité, tris

8

fonction rechSeq (tab, nbre, val) retourne(entier) {renvoie le premier indice où se trouve val dans tab, -1 sinon} paramètre s (D) tab: tableau [1, MAX] d'entiers (D) nbr, val: entier variables trouvé: booléen i: entier début trouvé ← faux i←0 tant que non trouvé ET i < nbr faire i ← i+1 trouvé ← (tab[i] = val) ftq si trouvé alors retourne (i) sinon retourne (-1) fsi fin 2003-2004


9

Recherche avec critères procédure rechLesMin (tab_d, nbre_d, tab_r, nbre_r, val) {renvoie dans le tableau tab_r les éléments de tab_d ≤ val}

paramètre s (D) tab_d: tableau [1, MAX] d'entiers, nbr_d, val: entier (R) tab_r: tableau [1, MAX] d'entiers, nbr_r: entier variables id, ir: entiers début ir ← 0 pour id ← l à nbre_d faire si (tab_d[id] ≤ val) alors ir←ir+ 1 tab_r[ir] ← tab_d[id] fsi fpour fin 2003-2004


10

fonction rechMin (tab, nbre) retourne(entier) {renvoie la plus petite valeur contenue dans le tableau tab}

paramètre s (D) tab : tableau [1, MAX] d'entiers, nbr : entier variables i, min : entiers début imin ← tab[l] pour id ← 2 à nbre faire si (tab[i] < min) alors min ← tab[i] fsi fpour retourne (tab[min]) fin 2003-2004


11

fonction rechPosMin (tab, nbre) retourne(entier) {retourne le (dernier) indice de la plus petite valeur du tableau tab}

paramètre s (D) tab: tableau [1, MAX] d'entiers, nbr: entier variables i, imin, min: entiers début min ←tab[1] imin ←1 pour id ←2 à nbre faire si (tab[i] ≤ min) alors min ←tab[i] imin ← i fsi fpour retourne (imin) fin 2003-2004


12

Recherche séquentielle dans tableau ordonné

fonction rechSeq (tab, nbre, val) retourne(entier) {renvoie le premier indice où se trouve val s'il est dans tab, -1 sinon}

paramètre s (D) tab: tableau [1, MAX] d'entiers (D) nbr, val: entier variables trouvé, dépassé : booléens ; i : entier début trouvé ← faux; dépassé ← faux; i ← 0 tant que non (trouvé OU dépassé) ET i < nbr faire i ← i+ 1 trouvé ← (tab[i] = val) dépassé ← (tab[i] > val) ftq si trouvé alors retourne (i) sinon retourne(-1) fin 2003-2004


13

Recherche dichotomique • Rappel: les valeurs doivent être triées ! 2

5

7

8

9

12 13 15 17 18 19 20 24 27 32 36

Principe: on vise au milieu du tableau si l'élément visé est plus grand que val, il suffit de chercher à gauche ; s'il est plus grand, il suffit de chercher à droite 2003-2004


14

2

2

5

7

8

9

12 13 15 17 18 19 20 24 27 32 36

5

7

8

9

12 13 15 17 18 19 20 24 27 32 36

2003-2004


15

2

2

5

7

8

9

12 13 15 17 18 19 20 24 27 32 36

5

7

8

9

12 13 15 17 18 19 20 24 27 32 36

2003-2004


16

Recherche dichotomique fonction rechDicho (tab, nbre, val) retourne(entier) {renvoie un indice où se trouve val s'il est dans tab, -1 sinon}

paramètre s

(D) tab : tableau [1, MAX] d'entiers (D) nbr, val : entier variables trouvé : booléen ; id, if, im: entiers début trouvé ← faux; id ← 0 ; if ← nbre + 1 tant que non trouvé ET (if - id) > 1 faire im ← (id + if)/2 trouvé ← (tab[im] = val) si (tab[im] > val) alors if ← im sinon id ← im fsi ftq si (id = 0) alors retourne (-1) sinon si (tab[id]=val) alors retourne(id) sinon retourne (-1) fsi fsi 2003-2004 Algorithmique 6 : Recherche, complexité, tris fin

17

Recherche dichotomique: variantel fonction rechDicho (tab, nbre, val) retourne(entier) {renvoie le plus grand indice où se trouve val s'il est dans tab, -1 sinon} paramètre s (D) tab: tableau [1, MAX] d'entiers (D) nbr, val: entier variables id, if, im: entiers début id ← 0; if ← nbre+1 tant que (if - id) > 1 faire im ← (id + if)/2 si (tab[im] > val) alors if ← im sinon id ← im fsi ftq si (id = 0) alors retourne (-1) sinon si (tab[id]=val) alors retourne(id) sinon retourne (-1) fsi fsi fin 2003-2004


18

Recherche dichotomique : variante2 fonction rechDicho (tab, nbre, val) retourne (entier) {renvoie le plus petit indice où se trouve val s'il est dans tab, -1 sinon} paramètre s (D) tab: tableau [1, MAX] d'entiers (D) nbr, val: entier variables id, if, im: entier début id ← 0 ; if ← nbre+ 1 tant que (if - id) > 1 faire im ← (id + if)/2 si (tab[im] ≥ val) alors if ← im sinon id ← im fsi ftq si (if = nbre + 1) alors retourne (-1) sinon si (tab[if]=val) alors retourne(if) sinon retourne(-1) fsi fsi fin 2003-2004


19

Recherche dans un ABR fonction rech (unAbr, val) retourne(booléen) {renvoieVRAl si val se trouve dans l'ABR unAbr, FAUXsinon} paramètre s (D) unAbr: ABR (D) val: entier variables trouvé: booléen ; id, if, im: entiers début si unAbr.Vide() alors retourner (FAUX) sinon si (unAbr.Info() = val) alors retourner(VRAI) sinon si (unAbr.Info() < val) alors retourner (Rech(unAbr.FD(), val)) sinon retourner (Rech(unAbr.FG(), val)) fsi fsi fsi fin 2003-2004


20

Simulation de recherche 20 24

18

27

9 19

5

32

13

2 8 7

2003-2004

36

15 12 17


21

2003-2004


22

Adressage Dispersé

2003-2004


23

Adressage dispersé • Objectif: classer M éléments dans un tableau • Principe: dans un tableau de p cases, on classe l'élément x, à l’indice k, donné par une fonction d'adressage h - classer un élément x → entier k, compris entre 1 et p

• Fonction h:

h(x)=k

- la valeur k ne dépend que de l'élément x ; - l'élément x n'est pas placé relativement aux autres éléments 24

Quelques exemples de fonctions d’adressage • x : chaîne h1(x) = nombre de caractères de la chaîne h1("Paul") = 4

h1("MmeDupont")=9

• x : entier h2(x) = somme de ses chiffres décimaux h2(342) = 9

h2(100 340) = 8

• x : entier h3(x)= nombre de bits à 1 dans l'écriture binaire h3(342) = h3(101010010) = 4

• x : chaîne de caractères h4(x) = somme des codes ASCII des caractères de la chaîne 25

Exemple de classement par la fonction d’adressage h1 • Suite de prénoms : - Marc, Izabelle, Paule, Jeanne, Ali, Jo, Michèle - Codes associés par h1 (nb caractères) : 4, 8, 5, 6, 3, 2, 7

1

Jo

Ali

2

3

Marc Paule Jeanne Michèle 4

5

6

7

Izabelle 8

• Constatations : - la valeur k ne dépend que de l'élément x ; - la place de l'élément x n'est pas déterminée relativement aux autres éléments classés... - ...à la différence d'un tri avec relation d'ordre où la place d'un élément est déterminée par le nombre d'éléments "meilleurs" selon cet ordre. 26

Une autre fonction d’adressage • h5 associe à c1…ck la somme : - (Somme (rang de ci dans l’alphabet * i) modulo 9) +1

• Suite de prénoms : Marc, Izabelle, Paule, Jeanne, Jo, Michèle - h5 (Marc) = ((13*1+1*2+18*3+3*4) mod 9) + 1 = 81 mod 9 + 1 = 1 - h5 (Jeanne) = ((10*1+5*2+1*3+14*4+14*5+5*6) mod 9) + 1 = 179 mod 9 + 1 = 9 – h5 (Paule) = ((16*1+1*2+21*3+12*4+5*5) mod 9) + 1 = 1 mod 9 + 1 = 2

Marc Paule 1

2

Jo 3

4

5

Izabelle Michèle 6

7

Jeanne 8

9 27

Recherche d’un élément Algorithme de recherche d'un élément x dans une table construite par adressage dispersé d'une suite d'éléments : 1) on calcule le code associé à cet élément x par la fonction d’adressage, soit p. 2) on compare le contenu de la p-ième case de la table avec l’élément x : si identité, la recherche est positive, sinon elle est négative.

28

Ajout d’un élément Algorithme d'ajout d'un élément X dans une table construite par adressage dispersé d'une suite d'éléments: 1) on calcule le code associé à cet élément par la fonction d'adressage, soit p. 2) on affecte l'élément à la p-ième place dans la table, à condition toutefois que cette place ne soit pas déjà occupée risque de collision

29

Exemples (avec h5 ) • Recherche de "Isabelle" - code associé par h5 : 1 et tabAdrDisp [1] ≠ "Isabelle " recherche négative

• Ajout de "Ali" - code associé par h5 : 8 ; tabAdrDisp [8] : " " ajout possible

• Ajout de "Lola" - code associé par h5 : 2 ; or tabAdrDisp [2] : "Paule" collision

Marc Paule 1

2

Jo 3

4

5

Izabelle Michèle 6

7

Ali

Jeanne

8

9 30

Méthodes de résolution des collisions : méthodes internes • lnternes car on opère dans le tableau alloué - première possibilité : on utilise la place libre dans le tableau • Algorithme d'ajout d'un élément entré en collision : - à partir du rang de la collision, rechercher la première place libre et y placer l'élément entré en collision. - arrivé à la dernière case du tableau, continuer la recherche à la première case du tableau. • Exemples: "Lola" (avec h5 : 2) et "Isabelle" (avec h5 : 1)

Marc Paule Lola Isabelle Jo Izabelle Michèle Ali 1

2

3

4

5

6

7

8

Jeanne 9

31

Retrait d’un élément 1) on calcule le code associé à cet élément x par la fonction d'adressage : soit p ; 2) on compare le contenu de la p-ième case de la table avec l'élément x : • si identité, on le supprime puis on place dans cette case une marque pour indiquer que l'élément supprimé a pu provoquer d'éventuelles collisions • si non identité, on poursuit la recherche séquentiellement en cas d'éventuelles collisions • arrêt si case vide ou parcours jusqu’à (p-1) 32

Recherche d’un élément 1) on calcule le code associé à cet élément x par la fonction d'adressage : soit p. 2) on compare le contenu de la p-ième case de la table avec l'élément x : • si identité, la recherche est positive, • sinon on poursuit la recherche séquentiellement, en cas d’éventuelles collisions (utiliser les marques) • arrêt avec recherche négative si case vide ou parcours jusqu’à (p-1)

33

Exemples (avec h5 ) Marc Paule Lola 1

2

3

Isabelle 4

Jo Izabelle Michèle Ali 5

6

7

8

Jeanne 9

retrait de «Marc» (code 1)

X 1

Paule Lola 2

3

Isabelle 4


6

7

8

Jeanne 9

recherche de «Isabelle» (code 1)

X 1

Paule Lola Isabelle 2

3

4


6

7

8

Jeanne 9

retrait de «Ali» (code 8)

X 1

Paule Lola 2

3

Isabelle 4

Jo Izabelle Michèle 5

6

7

X

Jeanne

8

9 34

Résolution interne des collisions (suite) • Deuxième solution: on partitionne le tableau en deux : - une zone d'adressage primaire - une zone de débordement

• Algorithme d'ajout d'un élément entré en collision : rechercher une place libre dans la zone de débordement et y placer l'élément entré en collision

35

Exemple • Ajout de «Lola» (code associé par h5 : 2) • puis de «Isabelle» (code associé par h5 : 1)

Marc

Paule

1

2

Lola

Isabelle

10

11

Jo 3

12

4

13

Izabelle Michèle

5

14

6

15

7

Ali

Jeanne

8

9

Zone de débordement (à la « suite » du tableau)

36

Recherche … 1) on calcule le code associé à cet élément x par la fonction d'adressage, soit p 2) on compare le contenu de la p-ième case de la table avec l'élément x : si identité, la recherche est positive, sinon on mène une recherche séquentielle dans la zone de débordement du tableau

37

… et retrait 1) on calcule le code associé à cet élément x par la fonction d'adressage, soit p 2) on compare le contenu de la p-ième case de la table avec l'élément x : • si identité, on le supprime puis on place dans cette case une marque pour indiquer que l'élément supprimé a pu provoquer d'éventuelles collisions • si non identité, poursuivre la recherche séquentiellement en cas d'éventuelles collisions, dans la zone de débordement du tableau 38

Exemples Marc

Paule

1

2

Lola

Isabelle

10

11

Jo 3

4

5

12

13

14

Izabelle Michèle 6

7

Ali

Jeanne

8

9

15

Recherche de «Ali» (h5 : 8), puis «Lola» (h5 : 2) Retrait de «Marc» (h5 : 1) Recherche «Isabelle» (h5 : 1) 39

Méthodes de résolution externe des collisions • "Externes " car on alloue des zones de stockage supplémentaires • Le tableau contient, pour un code donné, deux informations : - une place de rangement d'un élément (principal) ; - une liste de débordement pour les éléments entrés en collision avec l'élément précédent

40

Ajout d’un élément • Algorithme d'ajout d'un élément entré en collision : - Créer la liste de débordement associée à ce code si celle-ci n'existe pas encore, - puis ajouter à cette liste le nouvel élément

• Exemple (avec h5): ajout de « Lola » (code 2) Marc

Paule

1

2

Jo 3

4

5

Izabelle Michèle 6

7

Ali

Jeanne

8

9

Lola 41

Exemples (suite) ajout de « Isabelle » (1) Marc

Paule

1

2

Isabelle

Lola

Jo 3

4

5

Izabelle Michèle 6

7

Ali

Jeanne

8

9

Ali

Jeanne

8

9

ajout de « José » (1) Marc

Paule

1

2

José

Lola

Isabelle

Jo 3

4

5

Izabelle Michèle 6

7

42

Recherche d’un élément 1) on calcule le code associé à cet élément x par la fonction d'adressage, soit p 2) on compare le contenu de la première information de la p-ième case de la table avec l'élément x • si identité, la recherche est positive ; • sinon, on mène une recherche séquentielle dans la liste associée Marc

Paule

1

2

José

Lola

Isabelle

Jo 3

4

5

Izabelle Michèle 6

7

Ali

Jeanne

8

9

• recherche de « Michèle » (7), • puis « Isabelle » (1)

43

Retrait d’un élément 1) on calcule le code associé à cet élément x par la fonction d'adressage, soit p 2) on compare le contenu de la première information de la p-ième case de la table avec l'élément x • si identité, on retire l’élément et on le remplace par l'élément placé en tête de la liste associée, quand elle existe ; • sinon on mène une recherche séquentiellement dans la liste associée, avec retrait si la recherche est positive Marc

Paule

1

2

José Isabelle

Lola

Jo 3

4

5

Izabelle Michèle 6

7

Ali

Jeanne

8

9

• retrait de « Michèle » (7), • puis « Lola » (2) et enfin « Marc » (1) 44

Algorithmes de la méthode d'adressage dispersé avec résolution externe type Info2 = agrégat principal : chaîne débord : Liste

{première chaîne associée à un code donné} {objet Liste dont l'information est une chaîne}

fin fonction code (uneChaîne) retourne (entier) {retourne la valeur donnée par la fonction d’adressage}

paramètre (D) uneChaîne : chaîne 45

Procédure ajout (table, laChaîne) {ajoute l'élément laChaîne dans une table, par adressage dispersé, avec résolution externe des collisions}

paramètres (D/R) table: tableau [1, TAILLEMAX] de Info2 (D) laChaîne : chaîne variables ok: booléen ind: entier début ind ← code(laChaîne) si table[ind].principal = " " alors {c'est la première occurrence de ce code d'adressage} table[ind].principal ← laChaîne sinon {il y a collision: la place principale est déjà occupée, d’où ajout dans la liste de débordement,en tête}

table[ind].débord.premier() table[ind].débord.insèreAvant(laChaîne) fsi fin

46

Fonction recherche (table, laChaîne) retourne (booléen) {recherche si l'élément laChaîne est présent dans une table, par adressage dispersé, avec résolution externe des collisions}

paramètres (D) table: tableau [1, TAILLEMAX] de Info2 (D) laChaîne : chaîne variables trouvé, ok: booléens; ind : entier début ind ← code(laChaîne) trouvé ← table[ind].principal = laChaîne si non trouvé {recherche de laChaîne dans la liste de débordement} alors table[ind].débord.premier() tant que non trouvé et non table[ind].débord.horsListe() faire trouvé ← (table[ind].débord.info() = laChaîne) table[ind].débord.suivant() ftq fsi retourne (trouvé) 47 fin

Fonction retrait (table, laChaîne) retourne booléen {retire, si possible, l’élément laChaîne d’une table construite par adressage dispersé avec résolution externe des collisions}

paramètres (D/R) table: tableau [1, TAILLEMAX] de Info2 (D) laChaîne : chaîne variables ok : booléen; ind : entier début ind ← code(laChaîne) trouvé ← (table[ind].principal = laChaîne) si trouvé {alors retrait de laChaîne du champ principal de la table} alors retraitPrincipal (table, laChaîne, ind) sinon {recherche, et éventuel retrait, de laChaîne dans la liste de débordement}

ok

rechercheRetraitDeborde (table, laChaîne, ind)

fsi retourne (ok) fin

48

Procédure retraitPrincipal (table, laChaîne, ind) {retire l’élément laChaîne du champ Principal du code adresse ind; ce champ reçoit la valeur de tête de la liste de débordement si possible}

paramètres (D/R) table: tableau [1, TAILLEMAX] de Info2 (D) laChaîne : chaîne; ind : entier variables elt : Info2; ind : entier début si (table[ind].débord.vide()) {il n’y a pas eu de collision sur ce code} alors {ce code n’adresse plus aucune chaîne} table[ind].principal ← " " sinon {on récupère l’élément en tête de liste de débordement} table[ind].débord.premier() ; elt ← table[ind].débord.info() {pour mettre sa valeur dans le champ principal}

table[ind].principal ← elt

{et puis on retire la cellule de tête de la liste de débordement}

fsi fin

table[ind].débord.supprimer() 49

Fonction rechercheRetraitDéborde(table, laChaîne,ind) {recherce et retire, si possible, l’élément laChaîne de la liste de débordement du code adresse ind} paramètres (D/R) table: tableau [1, TAILLEMAX] de Info2 (D) laChaîne : chaîne; ind : entier variable trouvé : booléen début table[ind].débord.premier() trouvé ← faux {recherche de laChaîne dans la !iste de débordement} tant que non trouvé et non table[ind].débord.horsListe() faire trouvé ← (table[ind].débord.info() = laChaîne ) si non trouvé alors table[ind].débord.suivant() ftq {si trouvé, alors retrait dans la liste de débordement de la table} si trouvé alors table[ind].débord.supprimer() {le curseur est placé sur laChaîne} retourne (trouvé) fin 50

Complexité des algorithmes

2003-2004


51

Complexité des algorithmes • Complexité temporelle, complexité spatiale coût en temps: temps nécessaire à l'exécution coût en espace: espace mémoire nécessaire

• Pire des cas, complexité moyenne - la complexité dans le pire des cas n'est pas nécessairement une bonne indication du coût en pratique (exemple de la méthode du simplexe) - comment estimer le cas moyen ?

• Étude a priori, bancs d'essai et évaluation a posteriori - étude théorique - étude pratique de l'algorithme implémenté, bancs d'essai

2003-2004


52

Complexité d'un problème, complexité d’un algorithme • contraintes sur un problème par exemple, recherche d'un élément dans un tableau de n éléments non triés : si l'élément n'est pas présent, n comparaisons seront nécessaires pour le constater

• Attention: si le tableau est trié, une seule peut être suffisante ! - parmi les différents algorithmes possibles, certains sont meilleurs que d'autres - la comparaison des pires des cas peut ne pas être une bonne indication

2003-2004


53

Complexité asymptotique • Nécessité d'étudier la complexité pour de grosses quantités de données • Exemple : deux algorithmes pour une même tâche: - A1 effectue n2 opérations de base, A2 effectue n.log2 n opérations

• Deux machines : - M1 effectue 210 (environ mille) opérations par sçconde - M2 effectue 220 (environ un million d') opérations par seconde

• Temps de calcul (en secondes) :

2003-2004


54

Complexité asymptotique (2) M1 A1

2003-2004

M2 A2

A1

A2

n = 210 210

10

1

< 0,01

n = 220 230

20. 210

220

20


55

Rapidité de croissance comparée de certaines fonctions usuelles

2003-2004


56

Calcul de la complexité d’un algorithme

• Calcul de la valeur d'un polynôme en un point 1. p ← a[0] 2. pour i ←1 à n faire {puissance(a, n) retourne an} 3. xpi ← puissance (x , i) 4. p ← p + a[i]* xpi fpour • Nombre de multiplications en 3 --> 1+2+3+...+ (n-1) = (n-l)n/2 en4 --> n • Nombre d'additions en 4 --> n • soit au total: n(n + 3)/2 < n2 pour n > 3. 2003-2004


57

Notations utilisées • Grand O f(n) = 0(g(n)) s'il existe C> 0 et no > 0 tels que f(n) ≤ C. g(n) pour tout n ≥ no

• Grand oméga f(n) = Ω(g(n)) s'il existe C> 0 et no > 0 tels que f(n) ≥ C. g(n) pour tout n ≥ no

• Grand thêta f(n) = Θ(g(n)) s'il existe C1 et C2 > 0 et no > 0 tels que C1.g(n) ≤ f(n) ≤ C2. g(n) pour tout n ≥ no 2003-2004


58

Exemples • f(n) = O(1) f est majorée • f(n) = Ω (1) f est minorée 3n+2 = O(n) 3n+3 = O(n) 100n+6 = O(n) 10n2+4n+2=O(n2) 3n+3 = O(n2) 1000n2 + 100 n -6 = O(n2) 10n2+4n+2= O(n4) 6*2n + n2 = O(2n) • ----> c'est la plus petite fonction g(n) qui est intéressante 2003-2004


59

Exemples (suite) 3n+3 = Ω (n) 100n+6 = Ω (n) 10n2+4n+2= Ω (n2) 6*2n + n2 = Ω (n2) 6*2n + n2 = Ω (n) 6*2n + n2 = Ω (1) • ----> c'est la plus grande fonction g(n) qui est intéressante

2003-2004


60

Temps d’exécution des algorithmes • Temps constant (rares algorithmes, cf. adressage dispersé) O(1) • Temps logarithmique (exemple: recherche dichotomique) O(log2n) • Temps linéaire (exemple: recherche séquentielle) O(n) • Temps polynomial O(nk) (coûteux si k dépasse 3) - quadratique - cubique

O(n2) O(n3)

• Temps exponentiel 2003-2004

O(cn)

(à éviter en général)


61

Comparaison des complexités d'algorithmes de la même classe • Calcul de la valeur d'un polynôme en un point (1) p ← a[0] pour i ← 1 à n faire xpi ← puissance(x, i) p ← p + a[i]* xpi fpour n(n+1)/2 multiplications, n additions : algorithme en O(n2)

2003-2004


62

Calcul de la valeur d'un polynôme en un point (2) p ← a[0] xpi ← 1 pour i ← 1 à n faire xpi ← xpi * x p ← p + a[i]* xpi fpour 2n multiplications, n additions : algorithme en O(n)

2003-2004


63

• Calcul de la valeur d'un polynôme en un point (3) p ← a[n] pour i ← n - 1 à 0, pas -1 faire p ← p*x + a[i] fpour n multiplications, n additions algorithme en O(n)

Complexité optimale pour cette classe d'algorithmes : en O(n)

2003-2004


64

Calcul de la complexité d’algorithmes de recherche simples

• Opérations élémentaires retenues: les comparaisons 1. Recherche séquentielle dans un tableau non trié -

complexité au pire n comparaisons complexité moyenne n/2 comparaisons algorithme en O(n)

2. Recherche séquentielle dans un tableau trié -

complexité au pire n comparalsons complexité moyenne n/2 comparaisons algorithme en O(n)

2003-2004


65

•

Recherche dichotomique (dans un tableau trié 1) -

•

complexité au pire = complexité moyenne = nombre p d'intervalles considérés

Exemple avec n = 8 = 23

tableau de 8 éléments

niveau 0 niveau 1 niveau 2 niveau 3

Profondeur de l’arbre de décision de l’ordre de log2n : complexité algorithmique en O(log2n) 2003-2004


66

Tris

2003-2004


67

Tris • Données dans un ensemble d'éléments S muni d'un ordre total ordre | a a < c (transitif) | a ~ b et b < a => a = b (antisymétrique) total | ∀a,b a=b OU a

68

• Tris internes et tris externes - internes: l'ensemble des données peut être traité en mémoire centrale - externes: on opère sur une partie des données seulement

• Tris d'entiers: méthode des seaux à trier: des entiers entre 1 et m principe: - on crée m files d'attente vides numérotées 0, …, m-1 - on parcourt linéairement les données, et on place ai dans la file numérotée ai - on place les files d'attente bout à bout 2003-2004


69

• Exemple m = 10, 4 7 3 2 8 1 5 0

1

2

3

4

5

1

2

3

4

5

6

7

8

7

8

9

• Résultat: 1, 2, 3, 4, 5, • Estimation du coût : chaque élément peut être placé dans une file en temps constant, d'où O(n) pour les n éléments ; concaténation de m files en O(m) ; si m = 0(n), coût total en O(n).

2003-2004


70

• Cette méthode peut être généralisée à des k-uplets d'entiers munis de l'ordre lexicographique, et plus généralement à des chaînes (de longueur variable): (s1,..., sp) < (t1,..., tq) si et seulement si • ou bien p < q et si = ti pour 1 ≤ i ≤ p (s est un préfixe de t); • ou bien il existe j tel que si < tj et si = ti pour tout i < j.

• Exemples: 634 < 63472 64589 < 647

tri < triage seau < selle

• Pour des suites de k-uplets dont chaque composante est un entier entre 0 et m-l, on obtient un algorithme de coût O((m+n)k).

2003-2004


71

Cas général: on trie des éléments quelconques munis d'un ordre (total) la seule opération disponible est la comparaison de deux éléments Exemple: tri de trois éléments a, b, c a
b
a, b, c a, c, b

2003-2004

a
c, a, b

b, a, c

b
b, c, a


c, b, a

72

Estimation du coût • Arbre binaire de hauteur h => au plus 2h feuilles •Théorème Un arbre de décision pour n éléments a une hauteur supérieure ou égale à log(n!). - En effet, un arbre de décision doit avoir au moins autant de feuilles que de résultats possibles, c'est-à-dire n! feuilles au moins. Donc la hauteur de cet arbre est ≥ log(n!)

• Estimation Formule de Stirling: n! approximé par (n/e)n, donc le nombre de tests nécessaires est minoré par n(logn - log e) = nlog n -1,44n

• => on ne peut pas espérer faire mieux que O(n log n) 2003-2004


73

Méthodes de tri élémentaires (1) Tri par sélection • Données: un tableau de n éléments à trier • Principe: pour chaque position successive dans le tableau, on cherche l'élément qui occupera cette position dans le tableau trié, et on l'y place en permutant cet élément avec l'élément courant. reste à trier

liste triée

case courante

liste triée

2003-2004

devrait se trouver dans la case courante

reste à trier


74

20

18

2003-2004

9

5

24

13

27

2

8

32

7


12

36

15

17

19

75

Algorithme de tri par sélection procédure triSélection (tab, nbre) {recherche pour chaque case l'élément qui doit y être affecté et y place cet élément} paramètre s (D/R) tab: tableau [1, MAX] d'entiers (D) nbre: entier variables indDuMin, position: entier début pour position ← 1 à nbre -1 faire indDuMin ← sélection(tab, nbre, position,nbre) {recherche l’indice de l’élément minimum entre position et la fin de tab} échanger(tab, position, indDuMin) {échange deux positions dans tab}

fpour fin 2003-2004


76

Algorithme de tri par sélection (2) fonction sélection (tab, nbre, indDébut,indFin) retourne(entier) {recherche l'indice de l'élément minimum de tab entre indDébut et indFin} paramètre s (D) tab: tableau [1, MAX1 d'entiers (D) nbre, indDébut, indFin : entiers variables indDuMin, ind: entiers début indDuMin ← indDébut pour ind ← (indDébut + 1) à indFin faire si tab[indDuMin] > tab[ind] alors indDuMin ← ind fpour retourner(indDuMin) fin 2003-2004


77

Méthodes de tri élémentaires (1) Tri par insertion • Données: un tableau de n éléments à trier • Principe: la partie gauche est triée; on essaie d'insérer chaque nouvel élément dans cette liste, en décalant d'un cran la partie droite restante. place du nouveau reste liste triée

nouveau reste

liste triée

2003-2004

reste à trier


78

20

18

2003-2004

9

5

24

13

27

2

8

32

7


12

36

15

17

19

79

Algorithme de tri par insertion procédure triInsertion (tab, nbre) {recherche pour chaque élément la case où il doit être affecté et y place cet élément} paramètre s (D/R) tab: tableau [1, MAX] d'entiers (D) nbre: entier variables indVal, numPlace: entiers début pour indVal ← 2 à nbre faire {recherche de 1'endroit où doit s'insérer la valeur placée en indVal}

numPlace ← Insertion(tab, nbre, indVal) {si la valeur n'est pas à insérer en fin de zône triée, l'insérer à la place voulue}

si (numPlace ≠ indVal ) alors {libère la position numPlace par décalage et y place tab[indVal]}

décalerEtPlacer(tab, numPlace, indVal) fsi fpour fin

2003-2004


80

procédure décalerEtPlacer(tab, nPlace, indVal) {libère la position nPlace par décalage et y place tab[indVall}

paramètre s (D/R) tab: tableau [1, MAX] d'entiers (D) nPlace, indVal: entiers variables indDuMin, ind, deCôté: entiers début deCôté ← tab[indVal] {faire un trou au rang nPlace en décalant les valeurs qui suivent d'un rang vers la droite}

pour ind ← indVal à nPlace + 1 pas -1 faire tab[ind] ← tab[ind-1] fpour tab[nPlace] ← deCôté fin 2003-2004


81

Simulation du décalage

2003-2004


82

Deux algorithmes pour la recherche de place 1. Recherche séquentielle dans un tableau trié fonction insertion (tab, nbre, indV) retourne(entier) {renvoie la place à laquelle il faut affecter tab[indV] pour respecter l'ordre}

paramètre s (D) tab: tableau [1, MAX] d'entiers (D) nbr, indV: entiers variables dépassé: booléen; i, val, nbValTriées: entiers début val ← tab[indV]; nbValTriées ← indV - 1 dépassé ← faux; i ← 0 tant que i < nbValTriées ET non dépassé faire i←i+ 1 dépassé ← (tab[i] > val) ftq si dépassé alors retourne (i) sinon retourne (i+l) fsi fin 2003-2004


83

Simulation du tri par insertion séquentielle

2003-2004


84

2. Recherche dichotomique fonction insertion (tab, nbre, indV) retourne (entier) {renvoie la place à laquelle ilfaut affecter tab[indV] pour respecter l'ordre}

paramètre s (D) tab: tableau [1, MAX] d'entiers (D) nbr, indV: entiers variables id, if, im, val: entiers début val ← tab[indV]; id ← 0 if ← indV + 1 tant que if - id > 1 faire im ← (id + if)/2 si (tab[im] > val) alors if ←im sinon id ←im fsi ftq retourne (id + 1) fin 2003-2004


85

Simulation du tri par insertion dichotomique

2003-2004


86

Complexité des tris élémentaires • Coût du tri par sélection - on fait (n-l) + (n-2) + ... + 1 tests de comparaison, soit en tout: n(n-l)/2 comparaisons - on peut être amené à faire n-1 échanges

=> algorithme en O(n2)

• Coût du tri par insertion: - en moyenne n2/4 comparaisons - n2/8 échanges deux fois plus dans le pire des cas

=> ici encore algorithme en O(n2) 2003-2004


87

Tris indirects • Problème : tri sur différents critères • On veut mémoriser les résultats des tris par nom, par taille, par date

2003-2004

Rep[1]

Rep[2]

Rep[3]

nom

toto.C

toto.o

toto

taille

20 457

3 456

5 248

date

12.04.01

13.04.01

15.04.1


88

Solution : utilisation de tableaux d’indices • On utilise trois tableaux différents qui contiennent non les agrégats, mais les indices des agrégats dans le tableau triNom

3

1

2

triTaille

2

3

1

triDate

1

2

3

2003-2004


89

Tris indirects (suite) • Dans l’algorithme de tri, la comparaison de deux agrégats se fait relativement à un critère (nom, taille, date) : précède(i, j, Critère, tab) fonction qui retourne vrai si le fichier tab[i] précède le fichier tab[j] relativement au critère Critère 2003-2004


90

Fin du volume 6

2003-2004


91

coursAlgo_V6

Recommend Documents