Proposition de projet R&D « bootstrap »sur budget TeraLab 2015 !!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!
Résumé
TITRE DU PROJET : HORIZON ou ANTICRIME (exemples)
RESPONSABLE DU PROJET Stéphan Clémençon (Professeur Télécom ParisTech)
DESCRIPTION DU PROJET (4 lignes) : Dans le cadre de son activité de renseignement, le SCRC (Service Central de Renseignement Criminel Gendarmerie Nationale) envisage de développer un projet d’analyse et et de prédiction de la criminalité. Il conviendra à partir de données endogènes et exogènes au champ criminel de réaliser une analyse spatiotemporelle dynamique intégrant les niveaux communal, départemental, régional et national. Ce projet a vocation à délivrer sous forme de démonstrateur un outil d’aide à la décision sur un plan stratégique et tactique.
DESCRIPTION DE LA CONTRIBUTION DU LABO R&D(4lignes) Le labo développera les techniques d’analyse de données et d’apprentissage statistique permettant d’expliquer/prédire le niveau de criminalité aux différentes échelles spatiales et temporelles à partir des données jugées pertinentes par le SCRC. Au delà de l’élaboration des méthodes adéquates (et de routines informatiques afférentes) permettant de résoudre les problèmes liés à l’hétérogénéité des données, leur structure de dépendance spatiale et temporelle, leur caractère « incomplet », à l’aspect multi-tâche du problème de prédiction, le laboratoire fournira un rapport précis quant à la performance prédicitve des règles construites par apprentissage et s’attachera à fournir des indicateurs permettant d’interpréter l’impact de chaque variable sur la criminalité à un niveau spatio-temporel donné. Les aspects méthodologiques développés au cours de ce projet devront pouvoir donner lieu à des publications scientifiques, tout en respectant la confidentialité de certaines données.
DESCRIPTION DE LA CONTRIBUTION DU PARTENAIRE INSTITUTIONNEL (4lignes) Outre la définition du besoin, le SCRC accompagnera l’ensemble des étapes du projet en validant les différents délivrables. Il se chargera également de transmettre sous couvert d’une clause de confidentialité des données d’intérêt criminel. Enfin, il réalisera la validation de l’outil en l’évaluant sur des données opérationnelles.
DESCRIPTION DE LA CONTRIBUTION DU PARTENAIRE INDUSTRIEL (4 lignes) La contribution de Morpho couvrira plusieurs axes : La mise au point d’algorithmes de prédiction traitant des données hétérogènes comportant une dimension spatiale. L’étude de solutions concrètes permettant la manipulation de large volume de données. La mise au point de solutions répondant aux problématiques de prédiction de la criminalité à l’échelle d’un pays à partir de données publiques. Morpho participera aux travaux de recherche algorithmiques en coopération avec les partenaires académiques, puis après une première phase permettant de comprendre la nature et la valeur des résultats pouvant être obtenus, intégrera les solutions proposées sous forme d’un prototype. Celui-ci permettra à minima d’importer les données des années à venir et de visualiser les résultats.
•
• •
""""""""""""""""""""""" """"""""""" """"""""""""""""""""""" """"""""""""""""""""""" """""""""""""""""""""""" """"""""""""""""""""""" """"""""""""""""""""" """""""""" Institut Mines-Télécom – Projets Bootstrap Teralab Octobre 2014
#
Proposition de projet R&D « bootstrap »sur budget TeraLab 2015 !!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!! MARCHES ET APPLICATIONS CIBLES (4 lignes) Indiquer d ans quelles types d’app lications la tec hnologie d éveloppée peut servir, le s marchés a fférents et le business model favorable pour l’industriel Morpho cherche à développer une offre pertinente d’analyse criminalistique sur le marché international, auprès des forces de police et de sécurité qui sont déjà ses clients.
RESSOURCES TERALAB QU’IL EST PREVU DE METTRE EN OEUVRE (4 lignes) Les ressour ces Teralab d evront permettre per mettre d’héb erger les do nnées nécessaires néce ssaires à la c onstruction des modèle s prédicitfs pa r apprentiss age statistiqu e. Les donn ées endogè nes, d’entré e (e.g. répartitio n des effectifs s ur le territoire) territoire) et de sortie (niveau de criminalité), sont peu volumineuse. Par contre, les données exogènes (open data) pourraient l’être, une partie du projet consistant précisément à recenser les données de ce type pouvant permettre d’ accroître la p erformanc e des modèle s, sans toutefo is dépasse r quelques 1 00aines de d e Go. La structu re choisie pour l’entrepôt des données sera fonction de la nature des données sélectionnées. Le niveau d’hétérogénéité/incomplét d’hétérogénéité/incomplétude ude pourra justifier justifier de conserver une structure légère type HDFS. Le langage utilisé pour le dév eloppement eloppemen t des routine s sera le Pytho n. Seront ins tallés sur Tera Lab Python 2 .7+, Numpy , Scipy, Matplotlib, Ip ython ainsi q ue les pack ages nécessaires néce ssaires de ma chine-learning chine-lear ning et d’an alyse de do nnées nécessaire néc essaire (e.g. Scikit-learn, Pandas).
BUDGET TOTAL DU PROJET PROJET K !: 18 mois de post-doc (18*5387,30! =96 =96 971,4! )
Dimensionnement des ressources mobilisées par le partenaire Industriel sur ce projet : Morpho mobilisera m obilisera deu x personnes personn es à mi-temp s sur la duré e du projet. L’u ne sur les a spects reche rche et l’aut re sur les aspe cts métier (défin ition et dévelo ppement d’un d ’un prototyp e)
Cout additionnels R&D Labo Institut Mines Telecom :
""""""""""""""""""""""" """"""""""" """"""""""""""""""""""" """"""""""""""""""""""" """""""""""""""""""""""" """"""""""""""""""""""" """"""""""""""""""""" """""""""" Institut Mines-Télécom – Projets Bootstrap Teralab Octobre 2014
$
DESCRIPTIF DETAILLE (2 pages ) - Points à aborder -
!
#$%$&' & '()*+*, -,. /0)1,2*. 341+5061. 72+ 461 )461*+82( 9 -0 )*(01+46 :2 ;*4<,1 ,1 72+ *,;*(.,61, .46 )0*0)1=*, +6645061>
? ), <42* -0 -211, )461*, -0 )*+3+60-+1( ,.1 ,6 @(6(*0- *(0)1+5, ,1 646 ;*40)1+5,> AB48<,)1+/ :2 ;*4<,1 .B+6.)*+1 :06. 26, :(30*)C, :, *,6.,+@6,3,61 )*+3+6,- 72+ )46.+.1, 9 ;0*1+* :B26, )43;*(C,6.+46 :, -0 )*+3+60-+1( 9 061+)+;,* -,. ;C(643=6,. ,6 52, :B26, 3,+--,2*, .1*01(@+, :, -211, ,6 1,*3, :, ;*(5,61+46 641033,61> D6 ,//,1E -0 )*+3+60-+1( 6, ;425061 F1*, )46.+:(*(, )433, 26 .+@60:(1,*3+6+.1, 42 0-(014+*,E ,--, *(;46: 9 :,. )*+1=*,. ,G;-+)01+/. 72B+- )465+,61 :B+:,61+/+,* 0/+6 :, ;4254+* 061+)+;,* :, 6425,--,. 4))2**,6),.> '=. -4*.E +- )465+,61 :B+61(@*,* 26 ,6.,38-, :, 50*+08-,. -, ;-2. :+5,*. 0/+6 :, :(1,*3+6,* ),--,. 72+ 9 :+//(*,61. ()C,-46. 0:3+6+.1*01+/. H5+--,.E :(;0*1,3,61.E *(@+46.I .461 -,. ;-2. .+@6+/+)01+/.> A, ;*4<,1 *(;46:*0 9 26, 060-J., 9 -0 /4+. .1*01(@+72, ,1 4;(*01+466,--,> K2* 26 ;-06 .1*01(@+72,E +- ;*,6:*0 ,6 )43;1, :,. :466(,. :+.;46+8-,. ,6 .42*),. 425,*1,. HLMKDDE 3(1(4E @(4@*0;C+,NI 106:+. 72, .2* 26 ;-06 4;(*01+466,- 6(),..+1061 26, *0;+:+1( :B0)1+46E :,. :466(,. 646 .1*2)12*(,. ;42**461 F1*, +61(@*(,.E 9 .054+* :,. ,G1*0)1+46. :, 8-4@ 42 :, *(.,02G .4)+02G HO0),844PE QR+11,*NI> S6, (10;, :, 50-+:01+46 )-T12*,*0 -, ;*4<,1 ,6 (50-2061 641033,61 -, *(.2-101 :,. :+//(*,61. ()C,-46. ,65+.0@(. ;0* *0;;4*1 9 -0 ;*(:+)1+46> L- 6B,G+.1, ;0. 9 ), <42* :, ;*4<,1 :, ), 1J;, :06. -, :430+6, :, -0 -211, )461*, -0 )*+3+60-+1( 72+ ,6@-48, -B0.;,)1 :,.)*+;1+/ ,1 ;*(:+)1+/ 9 :,. ()C,--,. :, 1,3;. ,1 :B,.;0), :+//(*,61. ,1 +61(@*061 26, 1,--, 50*+(1( :, :466(,.> D6 421*,E 26 1,- ;*4<,1 :4+1 0;;0*0+1*, )433, 26 5(*+108-, 421+- :B0+:, 9 -0 :()+.+46 ,6 301+=*, :, :(;-4+,3,61 :, *,..42*),. )433, :, 34:, :B0)1+46 9 ,65+.0@,*> '2 ;4+61 :, 52, 3(1C4:4-4@+72,E -,. )C0--,6@,. .461 :, ;-2.+,2*. 4*:*,.> L-. *,-=5,61 1421 :B084*: :, -0 6012*, :,. :466(,. H6+5,02G :, )*+3+60-+1( .,-46 26, 643,6)-012*, ;*(:(/+6+, ,1 /0)1,2*. ,G;-+)01+/.I & Q,3;4*0-+1( K;01+0-+.01+46 U(1(*4@(6(+1( H,>@> ),*10+6,. 50*+08-,. ;,25,61 6B054+* :, .,6. 72B9 ),*10+6,. ;(*+4:,.E 72, :06. ),*10+6,. V46,. @(4@*0;C+72,.E )/ 4;,6 :010I L6)43;-(12:, H,>@> ),*10+6,. :466(,. ;,25,61 6BF1*, *,),6.(,. 72B9 ),*10+6,. ;(*+4:,.E 72, :06. ),*10+6,. V46,. @(4@*0;C+72,.E )/ 4;,6 :010I • • •
•
L-. :()42-,61 02..+ :,. 48<,)1+/. ;42*.2+5+.E 9 .054+* 26, ;*(:+)1+46 32-1+W()C,--, H.;01+0-, ,1 1,3;4*,--,I ,1 32-1+W1X)C, H:(;,6:06),Y)4**(-01+46 ,61*, -,. 6+5,02G 48.,*5(. ;42* :+//(*,61. 1J;,. :, )*+3,I>
!
(&')*+)* ,-$*')$.$/0* & L6:+72,* -,. *(.2-101. :, *,)C,*)C, 72, -B46 )C,*)C, 9 50-4*+.,*>
A0 50.1, 30<4*+1( :,. 3(1C4:,. :B0;;*,61+..0@, .101+.1+72, H;42* -0 *(@*,..+46E -0 )-0..+/+)01+46I 0 (1( )46Z2, :06. 26 )0:*, 4[ -,. ,G,3;-,. .,*5061 9 0;;*,6:*, 26 34:=-, 4;1+3+.061 26 )*+1=*, :, """"""""""""""""""""""" """"""""""" """"""""""""""""""""""" """"""""""""""""""""""" """""""""""""""""""""""" """"""""""""""""""""""" """"""""""""""""""""" """""""""" Institut Mines-Télécom – Projets Bootstrap Teralab Octobre 2014
%
;,*/4*306), :466( .461 .2;;4.(,. F1*, :,. :466(,. +6:(;,6:061,. ,1 +:,61+72,3,61 :+.1*+82(,.> A, )0:*, :2 ;*4<,1 :()*+1 )+W:,..2. ,.1 .+@6+/+)01+5,3,61 :+//(*,61 ,1 *,72+,*1 :, :(5,-4;;,* :,. 1,)C6+72,. 6425,--,.E ;42* -0 *,;*(.,6101+46 :,. :466(,. H,>@> 02 34J,6 :B4;(*01,2*.I 42 -,2* ;*(1*0+1,3,61 H*(.+:2.I ,1 ;42* -B0;;*,61+..0@, ;*4;*,3,61 :+1 H0-@4*+1C3,. 32-1+W1X)C,.E ;42* :466(,. .1*2)12*(,. ,6 ,61*(, ,1 ,6 .4*1+,I> A0 *,)C,*)C, (-084*(, 9 1*05,*. ), ;*4<,1 ;42**0 /0+*, -B48<,1 :, ;28-+)01+46. 3(1C4:4-4@+72,. H0-@4*+1C3,.E )0:*, :, 50-+:+1( 1C(4*+72, ,1 ,G;(*+,6),. 623(*+72,.I *,.;,)1061 -, 6+5,02 :, )46/+:,61+0-+1( :, ),*10+6,. :466(,. *,72+. ;0* -, K]^]> '2 ;4+61 :, 52, :, -B21+-+.01,2* /+60- ,1 :, -B+6:2.1*+,- ;0*1,60+*,E -, 6+5,02 :, ;,*/4*306), ;*(:+)1+5, 011,+61 ;0* -,. 34:=-,. ,1 -, /4*301 H+61,*/0), @*0;C+72,E 421+-. :, 5+.20-+.01+46I :,. *(.2-101. ;*4:2+1. ;0* -,. 421+-. :B060-J., ;42**461 ;,*3,11*, :B(-084*,* 26 )0C+,* :,. )C0*@,. ;42* 26 (5,612,- ;*4:2+1 )433,*)+0-+.08-,> !
($12* 3442$-3)$&' *) 536-78 & _*()+.,* -0 )+8-, 0;;-+)01+5, ,1 -, 30*)C( 5+.(. ,1 -, 82.+6,.. 34:=-, /054*08-, ;42* -B+6:2.1*+,-
!
A0 )+8-, ,.1 )46),61*(, 02142* :,. /4*),. :, .()2*+1( 3F3, .+ -,. 3(1C4:,. ,1 421+-. :(5,-4;;(. :,5*0+,61 F1*, 1*06.;4.08-,. :06. :+//(*,61,. 0;;-+)01+46. 72+ 6(),..+1,61 26, 5+.+46 ;*(:+)1+5, ,1 .;01+0-, :,. :466(,.> !
944&6) :0 436)*'3$6* & ]0. :B2.0@,E '466(,.E ,G;,*1+., 3(1+,*E ,G;,*1 :466(,. N>
A, K]^] 0;;4*1, .0 )4660+..06), )*+3+64-4@+72, :,. ;C(643=6,. )*+3+6,-. 0+6.+ 72, :,. :466(,. -+(,. 02G +6/*0)1+46.> K,. :466(,. +61=@*,61 .2* 26 ;-06 72061+101+/ 26, 5+.+46 .;01+4W1,3;4*,--, :, -B(54-21+46 :,. /0+1. )46.101(.Y(-2)+:(. ;42* )C072, +6/*0)1+46 ,1 ;0* 0@*(@01 9 -B()C,--, :B26, )43326,E :B26 :(;0*1,3,61E :B26, *(@+46 ,1 :2 ;0J.> D6 421*,E :,. +6/4*301+46. 646 643+601+5,. 0J061 1*0+1 9 -0 1J;4-4@+, :,. 021,2*. )433, :,. 5+)1+3,. .,*461 (@0-,3,61 1*06.3+.,.> `4*;C4 0;;4*1, .46 ,G;(*+,6), ,6 0;;*,61+..0@, 30)C+6, .2* :,. :466(,. :, @*06:, :+3,6.+46E .0 )4660+..06), :,. 8,.4+6. :,. 0)1,2*. :, -0 .()2*+1( ;28-+72, ,1 .0 )0;0)+1( 9 :(5,-4;;,* :,. 421+-. :B060-J., ,1 :B+61,*/0), 21+-+.01,2* :, 306+=*, 0@+-, ,1 *0;+:,> !
;23' :<3-)$&'%= -343-$)8 > .$'32$%*6 & _*()+.,* -,. 0)1+46. 72, 542. .42C0+1,V 3,6,* :06. -, ;*4<,1 ,1 <2.1+/+,* -B+61(*F1 :, ),. 0)1+46. ;42* 0..2*,* 26, 50-4*+.01+46 :,. *(.2-101. :, *,)C,*)C, ,1 ;42* *(;46:*, 02 8,.4+6 +:,61+/+( ;0* -B+6:2.1*+,-> D6 ;0*1+)2-+,*E +- ,.1 21+-, :B,G;-+72,* ;42*724+ ),. 0)1+46. .461 ;*+4*+10+*,. ;42* 0..2*,* 26, 50-4*+.01+46
!
?0:@*) :*53':8 A O42*6+* 26 82:@,1 *(;0*1+ ,61*, -,. -084. ,1 ;0*1,60+*,. H-, ;0*1,60+*, +6:2.1*+,- 6, .,*0 ;0. /+606)( :06. -, )0:*, :, ),1 ?aI >
""""""""""""""""""""""" """"""""""" """"""""""""""""""""""" """"""""""""""""""""""" """""""""""""""""""""""" """"""""""""""""""""""" """"""""""""""""""""" """""""""" Institut Mines-Télécom – Projets Bootstrap Teralab Octobre 2014
\