Deep Learning

R´ esum´ e Notre projet pr ojet vise principalement l’impl´ ementation ementation de Deep Learning Lear ning sur un GPU NVIDIA en premier lieu et sur le Cloud en 2éme eme lieu. Pour le front-end, on a choisi DIGITS, une application web, pour mieux visualiser la fonctionnalit fonctionnalit´é des algorithmes algorithmes de DL sans code. Comme back-en, back-en, c’´ etait etait Caffe le plus adaptable a` nos besoins. Notre projet pro jet se divise globalement en 3 parties principales : la premi` pr emière ere c’est de préparer eparer l’environne l’environnement ment de travail travail (Installation, (Installation, configuration. configuration. . . ) , la 2éme eme sert a` impl´ imp lément em enter er quelques quelques fameux algorithmes algorithmes de classification classification et de détection etection des objets tout en exploiexploitant des diverses diverse s base b ase de données ees normalis´ norma lisées ees et issues de différentes erentes sources sourc es en appliquant appliq uant chaque fois un algorit a lgorithme hme appropri´ appro prié. e. On a insist´ insisté dans ce projet éventuelle eventuellement ment sur l’importance l’importance de Cloud pour tourner les algorithmes algor ithmes de DL qui s’applique s’a ppliquent nt sur des d es grande gr andess bases base s de données ees et e t ce dans la l a derni` der nière ere partie. Ce projet constitue une terre fertile o` u on peut planter des applications d’IA qui peuvent aider l’humanit´ e dans le plus proche avenir.

Mots Mo ts cl´ cl ´ es es : Deep Learning, NVIDIA, DIGITS, Caffe, Cloud.

Table ble des des mat mati` eres er es Table des figures Liste des tableaux

vi viii

Liste des acronymes

ix

Introduction g´ en´ erale

x

1

1

Mont´ ee du Deep Learning 1.1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.2 1.2

La mac machine hine Lear Learni ning ng : l’ap l’appr pren enti tisssage sage au auto toma mati tiqu quee . . . . . . . . . . . . .

1

1.3

Le Deep Lea Learni rning : l’appren rentissage pro profon ond d . . . . . . . . . . . . . . . . . .

4

1.3.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

1.3.2

Quelques fameux algorithmes . . . . . . . . . . . . . . . . . . . . .

6

1.3.3

L’avènement du Deep Learning . . . . . . . . . . . . . . . . . . . .

7

Les pro cesseurs graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

1.4.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

1.4.2

GPU vs CPU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

1.4

1.5

2 Pr´ eparation de l’environnement

12

2.1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2

Compute Unifi nified Device Arch rchitectu cture :CUDA . . . . . . . . . . . . . . . . 12

2.3

2.4 2.4

2.2.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.2.2

Installation du CUDA . . . . . . . . . . . . . . . . . . . . . . . . . 13

Caffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

2.3.2

Installation du Caffe . . . . . . . . . . . . . . . . . . . . . . . . . .

14

NVID NVIDIA IA Deep Deep Lear Learni ning ng GPU GPU Train rainin ingg Syst System em : DIGI DIGITS TS . . . . . . . . . . 14 iv

Table ble des des mat mati` eres er es Table des figures Liste des tableaux

vi viii

Liste des acronymes

ix

Introduction g´ en´ erale

x

1

1

Mont´ ee du Deep Learning 1.1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.2 1.2

La mac machine hine Lear Learni ning ng : l’ap l’appr pren enti tisssage sage au auto toma mati tiqu quee . . . . . . . . . . . . .

1

1.3

Le Deep Lea Learni rning : l’appren rentissage pro profon ond d . . . . . . . . . . . . . . . . . .

4

1.3.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

1.3.2

Quelques fameux algorithmes . . . . . . . . . . . . . . . . . . . . .

6

1.3.3

L’avènement du Deep Learning . . . . . . . . . . . . . . . . . . . .

7

Les pro cesseurs graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

1.4.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

1.4.2

GPU vs CPU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

1.4

1.5

2 Pr´ eparation de l’environnement

12

2.1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2

Compute Unifi nified Device Arch rchitectu cture :CUDA . . . . . . . . . . . . . . . . 12

2.3

2.4 2.4

2.2.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.2.2

Installation du CUDA . . . . . . . . . . . . . . . . . . . . . . . . . 13

Caffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

2.3.2

Installation du Caffe . . . . . . . . . . . . . . . . . . . . . . . . . .

14

NVID NVIDIA IA Deep Deep Lear Learni ning ng GPU GPU Train rainin ingg Syst System em : DIGI DIGITS TS . . . . . . . . . . 14 iv

` TABLE DES MATI ERES

2.4.1 2.4.2 2.5

Définition

v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Installation du DIGITS . . . . . . . . . . . . . . . . . . . . . . . . . 15

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 Impl´ ementation

16

17

3.1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.2

Devices

3.3

3.2.1

Création de Dataset . . . . . . . . . . . . . . . . . . . . . . . . . .

3.2.2

Trainer le mo dèle

3.2.3

Tester le mo dèle

MNIST 3.3.1

3.4

3.5

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Création de DataSet . . . . . . . . . . . . . . . . . . . . . . . . . .

21

3.3.2

Trainer le mo dèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.3

Tester le mod od`èle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

KITTI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.4.1

Création de DataSet . . . . . . . . . . . . . . . . . . . . . . . . . .

3.4.2

Trainer le Mod od`èle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 La solution Cloud 4.1

17

24 28

29

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.1.1

Amazon Web Service . . . . . . . . . . . . . . . . . . . . . . . . . .

4.1.2

Amazon zon Elastic Compute Cloud (EC (EC2) . . . . . . . . . . . . . . . . 29

4.1.3

29

4.1.2.1

Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.1.2.2

Avantages . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.1. 4.1.2. 2.33

Acti Activ vati ation d’in d’inst stan ance ce g2.2 g2.2xl xlar arge ge . . . . . . . . . . . . . . . 31

29

Prépa e parat ration de l’env environn nneement . . . . . . . . . . . . . . . . . . . . 35

Conclusion g´ en´ erale

37

Bibliographie

37

Annexe 1

39

Annexe 2

42

Table des figures 1.1 D´ etermin eterminati ation on d’un d’unee foncti fonction on lin lin´éaire eaire par par la machin machinee learn learning ing [1] . . . . . .

2

1.2 1.2

Sch Schéma e ma du fonc foncti tion onne neme men nt d’un d’un neur neuron onee arti artific ficie iell [2] [2] . . . . . . . . . . . .

3

1.3

Prin rincipe cipe de fonct nctionnem nement de Mach achine Lea Learni rning . . . . . . . . . . . . . .

3

1.4 Introdu Introducti ction on de l’algor l’algorith ithme me interm interm´édiaire ediaire dan danss la la mac machin hinee Learn Learning ing . . . .

4

1.5 1.5

Arc Archite hitect ctur uree d’u d’un n résea e seau u de de neu neuro rone ness multi ultico couc uche hess [3] [3] . . . . . . . . . . . .

5

1.6

Prici ricipe pe de foncti ctionneme ement Deep eep Lear earnin ning . . . . . . . . . . . . . . . . . . .

5

1.7

Architecture de LeNet [4] . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.8

Architecture d’AlexNet [4] . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

1.9

Architecture de Goog oogleNet [4] . . . . . . . . . . . . . . . . . . . . . . . . .

7

1.10 Le massif du Mon Mont-Blanc vu par DeepD epDrea ream [5] . . . . . . . . . . . . . . .

8

1.11 Dispo possition des ALUs : GPU vs CPU [6] . . . . . . . . . . . . . . . . . . .

9

1.12 1.12 Co Comm mmen entt le le GPU GPU acc accél` e lère e re le le cal calcu cull [6] [6] . . . . . . . . . . . . . . . . . . . . 10 2.1

Page d’acceuil de digits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.1

Insertion de chemin po pou ur Devices . . . . . . . . . . . . . . . . . . . . . . . 18

3.2

Inserti rtion de Nom de Base de doon oonées . . . . . . . . . . . . . . . . . . . . . 18

3.3 3.3

Anal An alys ysee de résul e sulta tatt de cr´ créati e ation on de Da Data taSe Sett . . . . . . . . . . . . . . . . . . 19

3.4 3.4

Anal An alys ysee de de r´ résul e sulta tatt de de l’en l’entra train inem emen entt de de Mod` Mod` ele e le . . . . . . . . . . . . . . . 20

3.5

Tester la perf perfoormance nce de mod od`èle . . . . . . . . . . . . . . . . . . . . . . . . 20

3.6

Détecti ectioon des 10 Cat´ atégo e gorie ries . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.7

Détecti ectioon des 10 Cat´ atégo e gorie ries . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.8 3.8

Inse Insert rtio ion n de l’UR l’URL L d’un d’unee imag imagee d’un d’un nom nombre bre man manuscr uscrit it . . . . . . . . . . . 23

3.9

Résultat du test de mod od`èle . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.10 3.10 Arbor Arbor´ésence e sence de l’a l’arc rchi hitec tectur turee de la bas basee de don donn´ n´ ees e es [7] [7] . . . . . . . . . . . 24 3.11 Création de KITTI DataSet . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.12 Taille de KITTI DataSet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.13 Prépara aration tion de Mod Modèle(1) e(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.14 Prépara aration tion de Mod Modèle(2) e(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 vi

vii

TABLE DES FIGURES

3.15 Erreu rreurr de création tion de mod od`èle

. . . . . . . . . . . . . . . . . . . . . . . . . 27

4.1

Sélection du type de service . . . . . . . . . . . . . . . . . . . . . . . . . .

31

4.2

Lancement d’une instance EC2 . . . . . . . . . . . . . . . . . . . . . . . .

32

4.3

Sélection d’une image machine . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.4

Sélection de type d’instance EC2 . . . . . . . . . . . . . . . . . . . . . . . 33

4.5

Choix du taille de stock ockage . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.6

Config figu urat ration de la sécu e curit rité . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.7

Création de paire de clé . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.8

Démarrage de l’instance EC2 . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.9 4.9

La cour courbe be d’en d’entr trai aine neme men nt de de mod mod`èle e le de de KIT KITTI TI . . . . . . . . . . . . . . . . 36

34

4.10 Test du modèle de KITTI . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.11 Installation CUDA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.12 Installation Caffe (packages) . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.13 Installation Caffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

4.14 Instal tallatio tion Caffe (py (pytho hon n packages . . . . . . . . . . . . . . . . . . . . . . 40 4.15 Suite Instal tallation tion de Python pack ackage ages . . . . . . . . . . . . . . . . . . . . . 40 4.16 Configuration de Caffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.17 Installation de Digits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

4.18 4.18 Tél´ e lécha e charg rgem emen entt de Mnis Mnistt DataS ataSet et . . . . . . . . . . . . . . . . . . . . . . . 41 4.19 Execution de prepare ki kitti da data.py . . . . . . . . . . . . . . . . . . . . . . 41 4.20 4.20 Mise Mise a` jou jourr du du sys systtème e me et et ins insta tall llat atio ion n des des pac packages ages . . . . . . . . . . . . . 42 4.21 Installation de Theano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.22 Installation de CUDA

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.23 Installation de CuDNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.24 Installation de Caffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

44

4.25 Installation de Digits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

44

Liste des tableaux 3.1

La listes des fichiers a` télécharger [7] . . . . . . . . . . . . . . . . . . . . . 24

viii

Liste des acronymes IA : Intelligence Artificielle. ML : Machine Learning. DL : Deep Learning. NN : Neural Network. CNN : Convolutional Neural Network. DNN : Deep Neural Network. MPL : Multi Layer Perceptron. GPU : Graphical Processing Unit. CPU : Central Processing Unit. ALU : Arithmetic Logic Unit. CUDA : Compute Unified Device Architecture. cuDNN : Nvidia CUDA Deep Neural Networks. DIGITS : Nvidia Deep Learning GPU Training System. AWS : Amazon Web Service. EC2 : Elastic Compute Cloud. HPDA : High Performance Data Analytics. HPC : High Performance Computer. IOT : Internet Of Things.

ix

Introduction g´ en´ erale Lorsque l’intelligence artificielle a d’abord émergé comme une discipline, les scientifiques avaient de grands espoirs pour cela. Ils voulaient créer l’Intelligence Artificielle Générale, c’est-à-dire un système informatique capable de faire quelque chose d’humain, d’une manière meilleure et plus rapide que nous. Après que l’IA n’a pas réussi a` respecter ses promesses initiales, les scientifiques ont réduit leurs attentes, tout en se concentrant sur des tˆ aches spécifiques. Aujourd’hui, la Machine Learning est le seul domaine qui apporte des résultats prometteurs et pertinents. L’idée derrière elle est assez simple. Plutˆ ot que de programmer des ordinateurs avec un ensemble spécifique d’instructions pour accomplir une tˆ ache particulière, comme le déplacement, la parole ou la reconnaissance de visages, vous codez les machines pour apprendre de leur propre manière a` effectuer la tâche. Différents concepts algorithmiques ont été utilisés pour la Machine Learning, mais ce sont les biomimétiques, ou biomimétrie, qui ont permis une percée réelle. Biomimetics s’inspirent de la biologie, dans ce cas, le cerveau humain, afin de concevoir une machine plus intelligente. Cela a conduit au développement de réseaux de neurones artificiels, qui sont programmés pour traiter l’information de la même manière que notre cerveau. Nos propres processus d’apprentissage sont liés aux synapses du cerveau, qui servent de connexion entre nos neurones. Plus une stimulation est stimulée, plus la connexion est renforcée et l’apprentissage s’est amélioré. Les chercheurs se sont inspirés de ce mécanisme pour concevoir une synapse artificielle, appelée memristor. Ces dernières années, plus précisément en 2012, le Deep Learning est monté sur scène pour voler la vedette a` la Machine Learning. Il a envahi tous les grands titres, ainsi, il est devenu le centre d’attention de tout le monde grˆ ace a` ses réalisations spectaculaires ! Comment fonctionne ce réseau de neurones artificiels ? Du Machine Learning au Deep Learning, pourquoi cette migration ? Comment et o` u peut-on implémenter le Deep Learning ?

x

Chapitre 1 Mont´ ee du Deep Learning 1.1

Introduction

Vers les années 1950, un nouveau terme a été remonté dans le monde c’etait l’intelligence artificielle. Mais, rapidement des histoires des sciences fiction ont montré l’inquiétude envers des machines plus intelligentes que l’homme ce qui a mené a` sa disparition. Aujourd’hui, ce terme revient en force avec l’apparition de nouvelles techniques d’apprentissage, l’apparition des processeurs de grande puissance de calcul ainsi que la disponibilité des données.

1.2

La machine Learning : l’apprentissage automatique

La machine Learning est une technologie de l’intelligence artificielle qui tient a` modéliser et a` classer des données selon des catégories. Elle consiste a` faire tourner des algorithmes qui permettent aux ordinateurs d’apprendre en étudiant, au préalable, des exemples. Ces algorithmes d’apprentissage automatique sont fondés essentiellement sur une analyse des données qui va servir ensuite dans la classification et la reconnaissance de nouvelles données [1]. Le fonctionnement de la machine Learning se résume dans deux phases [3] : — Une phase d’apprentissage utilisée pour entrainer, a` l’aide des exemples d’entrées et de sorties (données étiquetées), l’algorithme a` reconnaitre les données. — Une phase de prédiction utilisée pour tester le modèle.

1

2

CHAPITRE 1.

´ DU DEEP LEARNING MONT EE

Dans un premier temps, le fonctionnement de la machine learning consistait essentiellement a` déterminer une relation linéaire reliant des entrées X avec des sorties Y : Y=aX+b. La figure ci-dessous présente un exemple d’application o` u on trouve une relation simple entre la surface et le prix d’un appartement à Paris [1].

Figure 1.1

– Détermination d’une fonction linéaire par la machine learning [1]

Cependant, pour des exemples assez compliqués (classification des images compliquées, détection des objets sur , la compréhension de la parole. . . ), la machine Learning était incapable de les modéliser et il demeure difficile de trouver des relations simples entre les entrées et la sortie. On est besoin alors de quelque chose qui peut prendre beaucoup d’entrées et qui arrive a` capturer des relations plus complexes d’o` u l’intervention du réseau de neurones. Ce dernier présente une interconnexion entre plusieurs neurones. En réalité ces neurones ne sont que des fonctions math´ ematiques qui vont mettre en relation des entrées avec une sortie [3].

1.2. LA MACHINE LEARNING : L’APPRENTISSAGE AUTOMATIQUE

Figure 1.2

3

– Sch´ ema du fonctionnement d’un neurone artificiel [2]

Ces neurones, polyvalents, sont semblables aux neurones biologiques car ils imitent le fonctionnement du cerveau humain. En effet, on prend un r´ eseau de neurones et on y présente une base de données d’exemples d’entrées et de sorties. Le réseau va analyser les ` chaque itération, il sera informé, données un par un et il prend une décision a` ce sujet.A à l’aide d’une fonction coˆ ut, si sa détermination est correcte ou non. Si sa décision était erronée, l’algorithme va ajuster sur les connexions entre les neurones du réseau afin de changer ses prévisions futures. Ce processus sera réputé jusqu’` a ce que les connexions soient réglées et le réseau devient capable de prédire correctement la sortie si on y présente une entrée [8]. Notons bien que cet entraˆınement peut nécessiter des heures, voire des jours tout dépend de la puissance de l’ordinateur et de la taille de base de données.

Figure 1.3

– Principe de fonctionnement de Machine Learning

Remarque : Plus qu’on a d’entrées (beaucoup de détails et de caractéristiques), plus qu’on ajoute de neurone, plus la phase d’apprentissage sera très compliqu´ ee et donc il

4

CHAPITRE 1.


devient très difficile d’extraire des relations. La solution est donc de faire des algorithmes interm´ ediaires. Ces algorithmes ne sont pas des réseaux de neurones, ils consistent a` analyser les données et extraire toutes ses caractéristiques int´ eressantes qui vont être utilisées comme des entrées pour les réseaux de neurones [3].

Figure 1.4

– Introduction de l’algorithme intermédiaire dans la machine Learning

Mais avec ces algorithmes, on est devant un autre enjeu c’est le dégrée de fidélité aux données car la qualité de prédiction va dépendre des résultats fournis par ces algorithmes interm´ ediaires et pour cela leurs conceptions nécessitent un travail d’intelligence ce qui n’est pas garanti d’o` u la naissance du Deep Learning.

1.3 1.3.1

Le Deep Learning : l’apprentissage profond D´ efinition

Le Deep Learning est un ensemble de technique de classification et d’apprentissage automatique, visant à reproduire le fonctionnement du cerveau humain. Il a née vers 2006 et se base sur des réseaux de neurones artificiels. La particularité de ces réseaux est qu’ils sont organisés en couche et d’une manière hiérarchique [5]. Le DL vient de résoudre le problème de l’algorithme de construction des caractéristiques, son idée est de sauter l’étape de conception de cet algorithme en faisant un gros réseau de neurone avec plein de couches [3].

1.3. LE DEEP LEARNING : L’APPRENTISSAGE PROFOND

Figure 1.5

5

– Architecture d’un réseau de neurones multicouches [3]

Ces couches sont utilisées pour effectuer un traitement, hiérarchisés, des données et extraire tous leurs caractéristiques. Ainsi chaque couche prend comme entrée la sortie de la précédente pour estimer une sortie qui va servir comme entrée pour la couche d’après et avec ce processus le programme arrive a` déterminer la relation d’entrées-sortie même qu’elle parait très compliquée [5].

Figure 1.6

– Pricipe de fonctionnement Deep Learning

Bien que la phase d’apprentissage fˆ ut très difficile avec un gros réseau de neurones, des grands pionniers de Deep Learning (comme Yann LeCun,. . . ) ont arriv´ e a` construire des algorithmes qui sont capables de déterminer des relations assez complexes entre des entrées et une sortie. Ainsi le petit miracle qui se produit avec le Deep Learning c’est que les couches inférieures du réseau de neurone cherchent d’abord a` traiter les éléments les plus simple présentés dans une donnée et les couches supérieures extraient les caractéristiques les plus complexes ce qui va faciliter la phase d’apprentissage [5]. Actuellement il devient facile de faire des réseaux de neurones profonds qui ont plus d’une centaine de couches et plusieurs millions de neurones.

6

CHAPITRE 1.

1.3.2


Quelques fameux algorithmes

Il existe plusieurs catégories d’algorithmes de DL dont les plus fameux sont : — Les réseaux de neurones profonds (Deep Neural Networks) : Ce sont des réseaux MLP ( Multi Layer Perceptron) qui ont le plus grand nombre de couches cachées ce qui permet au réseau de neurones de mieux détecter les légères variations du modèle d’apprentissage. Il est souvent utilisé dans la reconnaissance de parole [2]. — La machine de Boltzmann profonde (Deep Belief Network) : Ces algorithmes fonctionnent suivant deux phases principales : l’une sert a` classer les données en catégorie sans critères prédéfinis (apprentissage non supervisé), suivi de l’entrainement classique (apprentissage supervisé). Cette étape d’apprentissage non-supervisé, permet, en outre, de faciliter l’apprentissage supervisé [2].

eseaux de neurones convolutionnels (CNN ou Convolutional Neural Net— Les r´ works) :Le traitement de données est divisé en sous-parties, et pour chaque partie, un cluster de neurones sera créé afin d’étudier cette portion spécifique. Ce genre de réseaux se base essentiellement sur des opérations de convolution et de pooling exercé sur les images présentées comme matrices [2]. Bien évidemment, on va choisir le CNN comme réseaux de neurones vu qu’il est le meilleur à s’adapter avec nos besoins. Ce type père de NN a des ramifications suite a` l’importance de traitement d’image de nos jours. On peut citer comme exemples : — LeNet : Le premier CNN développ´ e par Yann LeCun dans les années 90 pour la reconnaissance des codes postaux et les chiffres manuscrits [4].

Figure 1.7

– Architecture de LeNet [4]

— AlexNet : développé par Alex Krizhevsky, Ilya Sutskever et Geoff Hinton.Il a été soumis au défi ImageNet ILSVRC en 2012 et a nettement occupé la 2éme place. Le réseau avait une architecture très similaire a` LeNet, mais avec plus grand nombres des couches convolutionnelles empilées les unes sur les autres [4].

1.3. LE DEEP LEARNING : L’APPRENTISSAGE PROFOND

Figure 1.8

7

– Architecture d’AlexNet [4]

— GoogleNet : gagnant ILSVRC 2014 et développé par Szegedy et al. De Google. Son challenge était de réduire considérablement le nombre de paramètres dans le réseau. Il existe également plusieurs versions de suivi vers GoogLeNet, tout récemment DetectNet utilisé pour la détection des objets [4].

Figure 1.9

1.3.3

– Architecture de GoogleNet [4]

L’av` enement du Deep Learning

Aujourd’hui, le Deep Learning a envahi tous les domaines. Il est très utilisé dans [8] :  Computer

Vision : C’est une branche de l’intelligence artificielle, qui consiste a`

entrainer l’ordinateur a` comprendre et a` analyser les images et les flux vidéo grˆ ace à une série de traitements.  Internet

et Cloud

— La reconnaissance de la parole, la fabrication et la classification de l’image. — L’analyse des sc` enes sur une image (analyse du signal visuel) et l’analyse du signal sonore. — L’analyse des détails graphiques de notre vie privée qu’on partage sur les réseaux sociaux

8

CHAPITRE 1.


— Le Traitement Automatique des Langues (TAL) : c’est une technique utilisé pour entrainer l’ordinateur a` traiter des données langagières en tenant compte des caractéristiques du langage humain. edicine  M´

et biologie

— Détection des tumeurs avec la technique de segmentation des images. 

Médias et Loisir — Sous-titrage vidéo.



Sécurité et défense — La reconnaissances faciale et/ou vocale.

 La

conduite autonome

— D´ etection des objets et la reconnaissance du signal de la circulation. Le deep Learning constitue une grande révolution dans l’intelligence artificielle. Des grandes entreprises (IBM, GOOGLE, FACEBOOK, SIRI, CORTANA . . . ) ont été apprécié par cette nouvelle technologie et ils ont décidé de l’intégrer dans de nombreuses applications. En effet, avec des algorithmes de Deep Learning, FACEBOOK a développ´ e une application de reconnaissance de visage nommé « DeepFace » . Quant à Google, il a développé un logiciel, c’est un descripteur d’image, qui prendre une image et la décrit par une phrase ainsi qu’une application intitulée « DeepDream » qui consiste à faire entrainer la machine à reconnaitre des formes sur des images puis les reproduire [5].

Figure 1.10

– Le massif du Mont-Blanc vu par DeepDream [5]

Aujourd’hui, le succès du Deep Learning est non seulement lié a` l’utilisation des architectures particulières de réseau de neurones bien adaptés aux besoins mais aussi lié au puissance énorme de calcul et notamment le progrès de processeurs graphiques : les GPUs.

1.4. LES PROCESSEURS GRAPHIQUES

1.4 1.4.1

9

Les processeurs graphiques D´ efinition

Le GPU (Graphical Processing Unit) est un processeur qui a pour fonction le calcul de l’affichage 2D et 3D (des images, des vidéos, des animations . . . ), on le trouve généralement intégré dans les cartes graphiques. C’est un élément indispensable dans les ordinateurs, sans lui il n’y en a pas d’image sur l’écran [6].

1.4.2

GPU vs CPU

Contrairement au CPU (Central Processing Unit), Le GPU possède de nombreuses unités de calcul (ALU) ce qui le rend très efficace pour le traitement parallèle des données et avec ses opérations parallèles le calcul devient très rapide [6].

Figure 1.11

– Disposition des ALUs : GPU vs CPU [6]

Le fonctionnement du GPU ne fait pas partie de notre étude, cependant on va se concentrer sur les raisons qui ont poussé les fondateurs du Deep Learning a` utiliser le GPU (spécifiquement NVIDIA) pour entrainer leurs algorithmes. Comme on a dit précédemment, pour qu’un réseau de neurones, comportant des milliers de connexions, apprenne a` faire une tâche il faut tout d’abord l’entrainer en utilisant une base de données étiquetées. Mais cette phase d’entrainement peut prendre beaucoup de temps, donc pour pouvoir l’accélérer les fondateurs du Deep Learning ont pensé a` utiliser le GPU en parallèle avec le CPU

10

CHAPITRE 1.

Figure 1.12


– Comment le GPU accélère le calcul [6]

NVIDIA, leader sur le marché des cartes graphiques, a fabriqué des GPUs utilisés essentiellement dans l’industrie de l’intelligence artificielle. Actuellement, tous les algorithmes du Deep Learning tournent autours des systèmes ayant le GPU NVIDIA parce qu’il présente de nombreux avantages [9] : 

L’atout majeur des GPUs est le traitement parallèle des données. En effet le fait de répartir les opérations de calcul sur plusieurs unités de calcul permet d’obtenir le résultat dans un temps raisonnable ce qui entraine une accélération, de 10 a` 20 fois, dans la phase d’entrainement des réseaux de neurones.



Les GPUs sont très adaptés pour l’exécution, dans un temps faible, des algorithmes d’apprentissage qui s’appuient sur des données complexes.



Grâce au service Cloud, on est capable maintenant de traiter un grand nombre de données sur des GPUs hyper puissants comme Tesla, con¸ cu spécialement pour le DL, avec un coˆ ut énergétique et une infrastructure matérielle relativement faible.

1.5. CONCLUSION

1.5

11

Conclusion

Le Deep Learning est une nouvelle technologie qui a été répandit dans tous les domaines et notamment dans la classification et la segmentation des images, la détection des ob jets. . . Nous, on va essayer d’impl´ ementer ces techniques pour qu’on puisse les utiliser ultérieurement dans des applications mais, avant tout, il faut préparer l’environnement nécessaire pour leurs implémentations.

Chapitre 2 Pr´ eparation de l’environnement 2.1

Introduction

Pour toutes applications d’apprentissage profond, comme pour tous autres types d’application, préparation d’un environnement favorable constitue l’une des phases les plus importantes dans leurs développements.

2.2 2.2.1

Compute Unified Device Architecture :CUDA D´ efinition

CUDA est une plate-forme informatique, écrite en C++, comprend un compilateur spécialement con¸cu pour les GPUs NVIDIA ainsi que des bibliothèques mathématiques et des outils de débogage et d’optimisation des performances des applications toute en exploitant la puissance de l’unité de traitement graphique (GPU) [10]. Parmi les bibliothèques inclues dans CUDA on cite le NVIDIA CUDA Deep Neural Network (cuDNN), une bibliothèque de primitives pour les réseaux de neurones profonds. Cette bibliothèque aide a` implémenter beaucoup d’opérations de grandes dimensions telle que la convolution, en donnant une bonne performance a` l’application mais avec une utilisation minimale de la mémoire. Ainsi L’utilisation de cette bibliothèque permet d’augmenter la vitesse d’entrainement des algorithmes de plus de 44% , avec plus de 6 fois de vitesse dans les Frameworks de Deep Learning qu’on les verra ultérieurement. [11] Le cuDNN a permis d’accélérer les Frameworks de Deep Learning toute en laissant les développeurs de ce domaine concentrés sur la formation du réseau de neurones avec une bonne performance plutˆ ot que de se charger par l’optimisation des performances du GPU. 12

13

2.3. CAFFE

2.2.2

Installation du CUDA

Pour installer CUDA on a suit les étapes suivantes [12] : 1. Installation des packages nécessaire pour la configuration du CUDA. 2. Installation de la dernière toolkit CUDA (version 8.0) ainsi que le dernier pilote de NVIDIA (nvidia-375).

2.3

Caffe

2.3.1

D´ efinition

Afin qu’on puisse implémenter certaines algorithmes de Deep Learning il nous faut un Framework qui va faciliter le travail du développeur. Vu le grand succès et la popularité du Deep Learning dans de nombreuses applications plusieurs communautés (Google et Facebook...) ainsi que de nombreuses universités (université de Berkeley...) ont dirigé leurs intérêts pour le développement des Frameworks de Deep Learning, con¸cus essentiellement pour bénéficier de l’accélération du GPU, qui aident a` faire tourner facilement les réseaux de neurones. Comme on a déjà dit dans le chapitre précèdent, on a choisi de faire tourner des réseaux de neurones convolutionnels (CNN) dans ce cas deux Frameworks de DL, Open Source, peuvent être utilisés :  Torch

: C’est un Framework développ´ e en Lua, il est très flexible en termes de

support de diverses architectures de réseau de neurone profondes et aussi en termes de bibliothèques supportées.  Caffe

: C’est un Framework développé, en C++/CUDA,par le centre de vision et

d’apprentissage de Berkeley (BVLC) et par des contributeurs communautaires. Dans le cadre de notre projet, on a choisi d’utiliser le Framework Caffe parce qu’il est très utilisé dans la reconnaissance de l’image et il présente de nombreux avantages. Ces avantages résultent essentiellement dans sa rapidité dans le traitement des données massives ainsi que la manière dont les modèles sont définis. Le modèle défini par caffé est formé par  Blobs,

Layers et Nets : Caffe définit le modèle par son schéma propre (pas de

code), au fur et a` mesure que les données traversent le réseau il y aura une communication entre les données, dans et a` travers les couches, ainsi que leur stockage. Cette opération est réalisée a` l’aide du Blob qui fournit une mémoire unifiée tenant des données (les lots d’images, les paramètres du modèle. . . ).

´ CHAPITRE 2. PR EPARATION DE L’ENVIRONNEMENT

14

 Forward/Backward

: Le passage en avant calcule la sortie compte tenu de l’entrée

pour l’inférence. Le passage en arrière calcule le gradient compte tenu de la perte d’apprentissage.  Loss

: L’apprentissage est guidé par une fonction de perte qui spécifie l’objectif

d’apprentissage en mappant les paramètres du modèle a` une valeur scalaire spécifiant la ”mauvaise” de ces paramètres.  Solver

: Le solver a pour rˆ ole de superviser l’optimisation du modèle et générer

les mises à jour des paramètres du réseau. Parmi les solvers du Caffe on peut citer AdaDelta et Adam.  Layer

catalogue : C’est un fichier de définition du modèle, d’extension ”.prototxt

”, contient la définition de toutes les opérations a` exécuter par chaque couche du modèle ainsi que leurs paramètres.  Interfaces

: Comme on a déj` a dit précédemment Caffe est écrit avec C++/CUDA,

mais ce Framework présente des interfaces en Python et en MATLAB afin de faciliter le travail des développeurs.  Data

: Les données vont subir des opérations de convolutions, de sous échantillon-

nage ainsi que d’autres transformations.

2.3.2

Installation du Caffe

Pour installer Caffe on a suit les étapes suivantes [12] : 1. Installation des packages. 2. Téléchargement du Caffe. 3. Installation des packages de Python. 4. Configuration du Caffe.

2.4

NVIDIA Deep Learning GPU Training System : DIGITS

2.4.1

D´ efinition

On a eu la chance que NVIDIA, leader sur le marché des GPU, a développ´ e, en 2015, un outil qui s’appelle digits permettant de visualiser en temps réel la formation des réseaux de neurones con¸cus pour la classification et la segmentation des images, ainsi que

2.4.

NVIDIA DEEP LEARNING GPU TRAINING SYSTEM : DIGITS

15

la détection des objets toute en exploitant la capacité de calcul de ses fameux processeurs graphiques. C’est cet outil qu’on va utiliser dans le cadre de notre projet. Digits est une application Web écrite en python qui fournit une interface graphique propre pour l’interfa¸cage avec le Caffe. ` l’aide de cette interface intuitive vous pouvez gérer vos données et suivre le comporteA ment et les performances des réseaux de neurones profonds en visualisant en temps réel leurs formations.Vous pouvez concevoir et sélectionner rapidement le réseau de neurones qui s’adapte le mieux avec vos données [13].

2.4.2

Installation du DIGITS

Pour bien configurer digits,il faut que la version CUDA doive être compatible avec la version de NVIDIA driver.Ensuite, il ne reste qu’installer digits et tous ces dependencies Une fois l’installation est terminé, digits devrait maintenant être exécuté a` http : // localhost /[12]. Et voilà notre interface graphique :

Figure 2.1

– Page d’acceuil de digits

´ CHAPITRE 2. PR EPARATION DE L’ENVIRONNEMENT

16

Remarque : Normalement digits va être exécuté automatiquement sur le port 80 si quelqu’un a déj` a un serveur qui s’exécute sur ce port digits ne peut pas être lancé et pour cela il faut reconfigurer digits et le lancer sur un autre port [12].

2.5

Conclusion

CUDA, Caffe, Digits Constituent les principaux outils fournis par NVIDIA Deep Learning SDK afin de déployer des applications d’apprentissage profond accélérées par le GPU. Une fois que tous ces éléments étaient préparés il ne reste que manipuler concrètement les algorithmes d’apprentissage profond via des exemples. C’est ce qui fait l’objectif du suivant chapitre.

Chapitre 3 Impl´ ementation 3.1

Introduction

Maintenant qu’on a bien prépar´ e les joueurs, allons sur le terrain pour contempler les performances et voir si ça va confondre avec nos attentes ou non.

3.2

Devices

Comme tout début classique, on va commencer par trainer le plus simple modèle qui consiste a` distinguer entre les catégories des téléphones portables, autrement dit, le modèle doit être capable de pouvoir bien comprendre si la photo qu’on lui fournit aléatoirement contient un iphone, un ipad ou un sumsung galaxy ! Tout d’abord, on regroupe la base de données d’environ 150 images en total sur trois dossiers portant chacun le nom de celui de la catégorie. On obtient alors un dossier père intitulé « Devices » Contenant nos trois dossiers fils. Ouvrons la jolie page d’accueil de Digits à travers localhost, del` a on peut créer les datasets et les modèles.

3.2.1

Cr´ eation de Dataset

Dans la page d’accueil de Dataset, cliquez images ->classification. Ca ¸ va vous mener a` une autre page o` u vous allez configurer les paramètres de base de données afin de la créer convenablement. Veuillez insérer le chemin complet vers votre dossier qu’on a appel´ e dans notre cas « Devices » dans la case de « Training images ». 17

´ CHAPITRE 3. IMPL EMENTATION

18

Figure 3.1

– Insertion de chemin pour Devices

On a laissé les autres paramètres par défaut tels qu’ils sont. Choisissez le nom de votre DataSet et cliquez « create ».

Figure 3.2

– Insertion de Nom de Base de doonées

Ca ¸ va prendre quelques secondes vu que la taille de notre base de données est assez petite. Vous aurez finalement cette page qui présente le nombre de catégories pour le training et la validation, la taille de votre Dataset. . .

3.2.2 •

Trainer le mod` ele

Revenant au page d’accueil, choisissant maintenant « Models ».

19

3.2. DEVICES

Figure 3.3

– Analyse de résultat de création de DataSet

•

Cliquez models->images->classifier.

•

Choisissez votre Dateset créé précédemment.

• •

Insérez le nom de model. Choisissez l’algorithme d’AlexNet.

` ce point-là, si on crée le modèle ça peut produire une erreur (« Out of Remarque : A memory » ). La solution c’est d’augmenter les paramètres de performance comme suivant : 

erifier le batch size par défaut a` partir de fichier qui se « Batch size » : veuillez v´ trouve dans le dossier de caffe intitulé en général « alexnet.prototxt ». Commencez la valeur par 10 en incr´ ementant tout en gardant l’œil sur la performance de votre GPU en %. (Pour notre cas on a atteint 40 comme limite avec 90% de performance).

 Changer

le « Learning rate » le nombre de l’ « epoch » peut également améliorer la

performance. Vous pouvez également consulter le Learning rate par défaut dans le même fichier ainsi que d’autre information concernant cet algorithme. Vous êtes prêts maintenant de trainer le modèle en cliquant « create ». Le modèle tournera, entre-temps, les courbes peuvent vous visualiser le taux de pr´ ecision et le taux de perte. Ce qui va vous choquer vraiment dans ce state-l` a c’est le taux de précision détérioré qu’on peut bien l’expliquer par la petite taille de notre Dataset dès le début.


20

Figure 3.4

3.2.3

– Analyse de résultat de l’entrainement de Modèle

Tester le mod` ele

Si tout va bien on peut tester le modèle et voir la magie qui charme ! Choisissons une image aléatoirement ou de votre ordinateur ou de l’internet et tester. Vous allez remarquer qu’il est intelligent mais pas assez, donc ça peut nous satisfaire mais pas assez !

Figure 3.5

– Tester la performance de modèle

En suivant notre instinct, on aura recours a` trainer un autre modèle avec une base de données plus grande.

21

3.3. MNIST

3.3

MNIST

3.3.1

Cr´ eation de DataSet

` la fin de cette partie, on sera capable de trainer Caffe à fin de reconnaitre les chiffres A manuscrits. On utilisera « MNIST handwritten digit database » comme base de données, contenant 60000 images pour le training et 10000 exemples d’image pour le testing, et LeNet comme algorithme con¸cu spécialement pour cette tˆ ache. Les deux sont mis a` disposition par Yann LeCun sur son site officiel. Pour le premier pas, on doit préparer la base de données en la téléchageant depuis le site officiel de Yann LeCun. Si le télechargement est bien terminé, ouvriez digits et créez la Dataset en changeant : •

Image type -> Grayscale.

•

Image size -> 28*28.

•

Choisissez un nom sans oublier d’indiquer le chemin vers le dossier « train » qui se trouve dans le dossier « Mnist ».

Lorsque le travail est terminé, retournez a` la page d’accueil en cliquant sur DIGITS dans la partie sup´ erieure gauche de la page. Vous devriez maintenant voir votre ensemble de données répertorié sous l’onglet ”Datasets”.

Figure 3.6

– Détection des 10 Catégories


22

3.3.2

Trainer le mod` ele

Cliquez sur Models -> New Model -> Images -> Classification. Ensuite, dans la nouvelle page « New Image Classification Model » saisissez le suivant : 

« Mnist » dataset dans « Select Dataset »

 LeNet

comme algorithme.

 Nommez  Cliquez

le model.

sur « create ».

Vous pouvez remarquer a` la fin que la précision atteint 100%, c’est le résultat désiré.

Figure 3.7

3.3.3

– Détection des 10 Catégories

Tester le mod` ele

C’est le moment qu’on attend toujours : tester le modèle ! Allons au bas de la page, cliquez sur « upload image » si vous voulez tester une image qui existe déj` a sur votre ordinateur ou bien insérer l’URL d’une image sur internet.

23

3.4. KITTI

Figure 3.8

– Insertion de l’URL d’une image d’un nombre manuscrit

Le résultat est super-intéressante, la performance de Digits avec la base de données de Mnist et LeNet est optimale.

Figure 3.9

– Résultat du test de modèle

Digits a montré qu’il est brillant sur le domaine de classification des images, mais est-ce le cas pour d’autres domaines et d’autres besoins ? Pour répondre a` cette question, on a recours a` essayer avec la détection des objets dans une photo donnée.

3.4

KITTI

Dans ce dernier exemple, on a choisi d’employer les données de la piste de détection d’ob jets de la KITTI Vision Benchmark Suite. Vous pouvez bien évidemment utiliser toute autre donnée que vous souhaitez mais faites attention Digits s’attend a` ce que les données soient étiquetées dans le style des données KITTI. Cette fois-ci on va télécharger la base de données de KITTI a` travers le site web : « http ://www.cvlibs.net/datasets/kitti/eval object.php »


24

Vous serez face a` une liste o` u vous choisissez seulement ces téléchargements : Table 3.1

– La listes des fichiers a` télécharger [7]

Description

Nom du fichier

Left color images of object data set

data bject image 2.zip

Training labels of object data set

data object label 2.zip

Object development kit

devkit object.zip

Maintenant que le téléchargement est fini, copiez ces fichiers dans $DIGITS ROOT/examples/objectdetection/ . Ensuite exécutez le script Python « prepare kitti data.py » pour créer deux sous dossier « train » et « val » , ¸ca peut prendre un peu de temps dépensé principalement pour extraire les fichiers compressés. Enfin vous aurez $DIGITS ROOT/examples/object-detection/kitti-data/train,val/. Si vous jetez un œil sur les donn´ ees vous allez remarquer qu’elles sont organisées de la manière suivante :

⇒

•

Un dossier « image» contenantt les .png , .jpg, ect.

•

Un dossier « label » contenant les .txt.

Pour chaque image du dossier « image » , il doit y avoir un fichier texte correspondant

dans le dossier « label » . Par exemple, si le dossier « image » contient une image nommée toto.png, le dossier « label » doit inclure un fichier texte nommé toto.txt.

Figure 3.10

3.4.1

– Arborésence de l’architecture de la base de données [7]

Cr´ eation de DataSet

Dans la page d’accueil de Digits, cliquez New Dataset->Images->Objet Detection. Lors de la création de Dataset :

25

3.4. KITTI •

Insérer le chemin vers les dossiers train et val o` u vous trouvez dedans deux dossiers nommés « image » et « label ».

•

Gardez les autres paramètres inchangés.

•

Cliquez « Create ».

Figure 3.11

– Création de KITTI DataSet

Vous allez remarquer que la taille de la base de données créée cette fois-ci est très grande comparant aux précédentes (5.32 GB).

Figure 3.12

3.4.2

– Taille de KITTI DataSet

Trainer le Mod` ele

Dérivé de GoogleNet, DetectNet est con¸ cu spécialement pour la détection des objets. Pour plus d’information visitez ce site web : https ://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detectiondigits/ Afin de trainer ce réseau de neurones, on doit avoir la version NVcaffe 0.15.1 ou ultérieur. Veuillez vérifier votre version en haut a` droite de la page d’accueil de Digits -> Info.


26 Vous trouvez la description de DetectNet dans :

$CAFFE ROOT/examples/kitti/detectnet network.prototxt Dans la page de création de Model : •

Sélecter votre base de données précédemment créée.

•

Substract mean -> none.

•

Learning rate -> 0.0001.

•

Solver -> ADAM.

Figure 3.13

– Préparation de Modèle(1)

•

Custom Network -> Caffe -> copier/coller le contenu de detectnet network.prototxt.

•

Visualise l’algorithme en cliquant « Visualize ».

27

3.4. KITTI

Figure 3.14

– Préparation de Modèle(2)

Comme DetectNet est dérivé de GoogleNet, il est bien recommandé d’utiliser le pré-trainé GoogleNet fourni par ImageNet, ceci servira a` accélérer le training de DetectNet. Vous pouvez trouver le modèle pré-trainé de GoogleNet sur ce lien : http ://dl.caffe.berkeleyvision.org/bvlc googlenet.caffemodel

•

Spécifier le chemin vers le fichier téléchargé de GoogleNet.caffemodel dans la case « Pretrained Model(s) »

•

Finalement, cliquez « create ».

Figure 3.15

– Erreur de création de modèle

On avait une erreur de mémoire : pour notre ordinateur on a un GPU de mémoire 2 GB ce qui est insuffisant pour ce modèle parce que DetectNet demande au moins 12 GB de mémoire GPU.


28

3.5

Conclusion

Ce n’est pas la fin de chemin, heureusement, le Cloud nous a sauvés ! Dans le chapitre suivant, Nous découvrirons comment poursuivre notre travail sur le cloud.

Chapitre 4 La solution Cloud 4.1

Introduction

Comme d’habitude, pour tous problèmes de mémoire et de stockage de données, le Cloud est là pour nous offrir, a` travers Amazon Web Service, des machines virtuelles (dans notre cas des GPUs) qui vont accélérer les algorithmes d’apprentissage profond appliqués a` des données énormes.

4.1.1

Amazon Web Service

AWS est une plateforme de service Cloud computing qui fournit des services énormes notamment les capacités de calcul, les options de stockages ainsi que les bases de données.

4.1.2

Amazon Elastic Compute Cloud (EC2)

4.1.2.1

D´ efinition

C’est un service web, destiné aux développeurs d’applications, qui permet de faciliter l’accès a` des ressources, également les instances destinés a` des fins de calcul, fournies par le Cloud Computing.

4.1.2.2

Avantages

Amazon EC2 présente de nombreux avantages [14] :

es  Acc`

´ elastiques aux ressources informatiques :

Amazon EC2 permet aux développeurs d’obtenir et de configurer des capacités facilement ainsi qu’y calibrer, en quelques minutes, selon les besoins de calcul.En plus 29

30

CHAPITRE 4. LA SOLUTION CLOUD

que ça le développeur a le droit de mettre en service plusieurs instances simultan´ ement et de les désactiver a` tout moment.

ole  Contrˆ

total :

Ainsi, à partir de n’importe quelle machine, l’utilisateur peut accéder a` chaque racine de toutes ses instances et conserver tous ses données même après arrêt de l’instance pour les retrouver ensuite en redémarrant cette même instance.

e  Flexibilit´

du service :

Amazon EC2 offre l’occasion aux développeurs de choisir, selon les besoins, le type d’instance, le système d’exploitation. . . Amazon EC2 va compléter la configuration (CPU, la mémoire. . . ) de la machine virtuelle qui répond le mieux a` ses choix.

e  Compatibilit´

avec d’autres Amazon Web Service :

Afin de faciliter les op´ erations de calcul et le stockage des données Amazon EC2 fait appel a` d’autres Amazon Web Services tels que Amazon Simple Storage Service (Amazon S3), Amazon Relational Database Service (Amazon RDS) et Amazon SimpleDB.

e  Fiabilit´

:

La rapidité de la configuration et de la mise en service des instances EC2 prouve la fiabilité de ce service.

ecurit´ e  S´

:

Ce service offre la possibilité aux développeurs de définir les instances figurant au sein d’un cloud privé Virtuel (VPC) ainsi que de contrˆ oler, a` travers des groupes de sécurités, les trafics réseau qui sortent ou entrent a` ses instances.

e  Rentabilit´

:

Les capacités de calcul ne sont pas chères, le développeur paye un tarif très bas par rapport a` ce qu’il consomme ainsi qu’il ne paye que les tarifs des instances en cours d’exécution.

emarrage  D´

:

En ouvrant l’interface web du service EC2, le développeur peut, a` l’aide des clics simples ou la console EC2, configurer et activer les instances EC2. ⇒

Cette instance permet d’accéder aux GPUs qui vont nous aider a` appliquer et

améliorer les performances des algorithmes d’apprentissage profond. Dans les paragraphes suivants on va découvrir la manière avec laquelle on a accédé à une instance g2.2xlarge, les étapes qu’on a suivi pour l’activer et enfin on va implémenter une application de deep Learning (détection des objets) en utilisant des algorithmes d’apprentissage profond accélérés par les GPUs.

31

4.1. INTRODUCTION

4.1.2.3

Activation d’instance g2.2xlarge

Avant tous pour qu’on puisse utiliser et activer des instances EC2 il faut avoir accès vers le Amazon Cloud Service via un compte Amazon. Pour activer l’instance g2.2xlarge il faut suivre les étapes suivantes [?] : 1. Passez par le site web Rosetta HUB pour s’identifier (entrer le login et le mot de passe). 2. Choisissez le service que vous cherchez : EC2.

Figure 4.1

– Sélection du type de service

3. Cliquez sur ”Lancer l’instance” sur le tableau de bord EC2.

32


Figure 4.2

– Lancement d’une instance EC2

4. Sélectionnez ”Ubuntu Server 14.04 LTS ...” comme une image machine.

Figure 4.3

– Sélection d’une image machine

33

4.1. INTRODUCTION

5. Sélectionnez le type d’instance GPU : g2.2xlarge .

Figure 4.4

– Sélection de type d’instance EC2

6. Cliquez sur « next » jusqu’à arriver a` la page « Add Storage », il est recommandé d’augmenter la taille du stockage du « root volume » jusqu’à 20 GB parce que 8 GB (mise par défaut) est insuffisante pour pouvoir utiliser le GPU. .

Figure 4.5

– Choix du taille de stockage

7. Dans la page « Configure Security Group », cliquez sur « add rule » et entrer 5000 dans la plage des ports et définissez la source a` n’importe quel endroit. .

34


Figure 4.6

– Configuration de la sécurité

8. Cliquez sur « review and launch » puis sur « launch» , vous serez invité a` créer et a` télécharger votre paire de clés afin que vous puissiez utiliser SSH dans votre serveur. Téléchargez la paire de clés et conservez-la dans un endroit sˆ ur. .

Figure 4.7

– Création de paire de clé

9. Enfin cliquez sur « launch » et attendez jusqu’` a ce que l’instance démarre. Une fois l’instance est en cours d’exécution une adresse IP public sera attribué a` elle. . Maintenant on a activé l’instance g2.2xlarge il ne reste que se connecter a` cette instance via le SSH.

35

4.1. INTRODUCTION

Figure 4.8

4.1.3

– Démarrage de l’instance EC2

Pr´ eparation de l’environnement

Pour une préparation complète de l’environnement il faut suivre les étapes suivantes [12] : 1. Mettre a` jour votre système. 2. Installer les préliminaires et les packages nécessaires pour l’implémentation. 3. Installer CUDA. 4. Installer la bibliothèque cuDNN. 5. Installer Caffe. 6. Installer digits. Si tout va bien, vous disposez maintenant d’un serveur Web DIGITS que vous pouvez l’accéder a` l’URL http : // : 5000. Vous serez maintenant capable de l’utiliser pour entrainer des algorithmes de Deep Learning. Voilà maintenant qu’on a bien préparé l’environnement on revient au 3ème chapitre et on reconstruit la base de données de KITTI puis on crée le modèle comme on a indiqué ! Cette fois-ci on aura la courbe suivante :

36


Figure 4.9

– La courbe d’entrainement de modèle de KITTI

Sachant que mAP ( main Average Precision) est le meilleur indicateur de pr´ ecision du modèle, on peut bien remarquer qu’on a bien réussi a` trainer un modèle de très bon taux de précision. C’est le moment d’évaluer la performance pratique du modèle a` travers le test. Pour qu’on ait les objets qui se trouvent dans la photo encadrés par des rectangles on doit sélectionner « Bounding Boxes » dans « Select Visualization ».

Figure 4.10

– Test du modèle de KITTI

Remarque : On peut toutefois tester un ensemble d’image en utilisant l’option « Test a list of Images».

Conclusion g´ en´ erale Le BigData, l’IOT et le HPC, ce nouveau triangle qui domine le domaine de l’IT o` u chaque sommet est indispensable pour la persistance de l’autre ! Le Deep learning dans cette situation est le centre de ce triangle, le carburant ! Boule de cristal pleine des milliards des données, Le BigData est considérée aujourd’hui la nouvelle arme sophistiquée et fatale. Le posséder/gérer devient le grand enjeu mondial ce qui mène le monde a` investir dans les Super Calculateurs et les algorithmes d’analyse et d’optimisation des données d’o` u la naissance de nouveau concept HPDA (High Performance Data Analytics). Les données sont donc comme le pétrole, il faut les raffiner pour qu’elles prennent de la valeur. Les raffineries sont des super calculateurs qui trient et analysent des milliards des donn´ ees, issues de plusieurs sources principalement les objets connectés, en temps réel grˆ ace a` des algorithmes intelligents de DL et a` travers les framework comme Apache Spark vu que ce dernier a montré une performance spectaculaire dans le traitement des données. Pour mieux découvrir l’importance de HPC, on a assisté au premier workshop du HPC en Tunisie qui a déroulé a` ESPRIT incubator. C’est dans cette occasion qu’on a réalisé que le Deep Learning en particulier et l’IA en général n’était réalisable qu’avec le progrès de HPC, surtout les GPU, et la solution Cloud qui permet d’allouer des ressources mat´ erielles pour tourner les algorithmes. On a assisté également au JPO de Sup’com pour qu’on puisse s’approcher plus au pouvoir de BigData et c’était l` a où on était surpris par l’effet miraculeux de ce concept dans les nouvelles stratégies d’aujourd’hui dans tous les domaines : commerciales, politiques, médicales, sociales. . . Ce projet nous a ouvert les yeux sur les nouvelles tendances technologiques autour desquelles le monde se déroule aujourd’hui. Il nous a donné également l’opportunité de poursuive un stage d’été dans le domaine de Deep Learning/Machine Learning et pourquoi pas un PFE pour l’année prochaine pour qu’on puisse mettre en valeur notre travail dans une concrète application. 37

Bibliographie [1] Lo¨ıc. Knuchel : Le machine learning, c’est quoi exactement ? Nouvembre 2013. [2] Phillipe. Beraud : Une première introduction au deep learning. Avril 2016. [3] Adil. Moujahid : A practical introduction to deep learning with caffe and python. Juin 2016. [4] Eugenio. Culurciello’s blog : Neural network architectures. Juin 2016. [5] Tual. Morgane : Comment le « deep learning » révolutionne l’intelligence artificielle. Juillet 2015. ` pas : L’implEmentation ´ [6] Le deep learning pas A (2/2). ternet

<

Disponible sur In-

https ://www.technologies-ebusiness.com/langages/le-deep-learning-pas-a-

pas-limplementation-22>. [7] Object

detection.

Disponible

sur

Internet

<

https ://github.com/NVIDIA/DIGITS/tree/master/examples/object-detection>. [8] Louis . Ludovic : Machine learning et deep learning, comment ¸ca marche ? Décembre 2016. [9] Apprentissage

automatique.

Disponible

sur

Internet

<

Internet

<

http ://www.nvidia.fr/object/tesla-gpu-machine-learning-fr.htmltp>. [10] Traitement

` parallEle

cuda.

Disponible

sur

http ://www.nvidia.fr/object/cuda-parallel-computing-fr.html>. [11] Sharan. Chetlur : cudnn : Efficient primitives for deep learning. octobre 2016. [12] Ubuntu

installation.

Disponible

sur

Internet

<

https

://gi-

thub.com/NVIDIA/DIGITS/blob/master/docs/UbuntuInstall.md>. [13] Digits : Deep learning gpu training system. https

Disponible sur Internet

<

://devblogs.nvidia.com/parallelforall/digits-deep-learning-gpu-training-

system/>. [14] Amazon ec2. Disponible sur Internet < https ://aws.amazon.com/fr/ec2/>. 38

Annexe 1 Cette annexe contient les différentes commandes utilisées ,dans la préparation de l’environnement, pour implémenter des algorithmes de Deep Learning sur le GPU NVIDIA.

Figure 4.11

Figure 4.12

– Installation CUDA

– Installation Caffe (packages) 39

40

ANNEXE 1

Figure 4.13

Figure 4.14

Figure 4.15

– Installation Caffe

– Installation Caffe (python packages

– Suite Installation de Python packages

Figure 4.16

– Configuration de Caffe

Figure 4.17

– Installation de Digits

41

Figure 4.18

– Téléchargement de Mnist DataSet

Figure 4.19

– Execution de prepare kitti data.py

Annexe 2 Cette annexe contient les différentes commandes utilisées ,dans la préparation de l’environnement, pour implémenter des algorithmes de Deep Learning sur le cloud.

Figure 4.20

– Mise a` jour du système et installation des packages

Figure 4.21

– Installation de Theano

42

43

Figure 4.22

– Installation de CUDA

Deep Learning

Recommend Documents