Data science : la réalité dépasse la fiction

Temps de lecture : 5 minutes

Cet article a été lu 977 fois

La confidentialité des données à l’épreuve

Apple et le FBI sont entrés en conflit éthique. Le premier se veut le garant de la confidentialité de ses clients, le 2ème affirme qu’on aurait pu déjouer des attentats en décryptant certaines données. Le FBI veut juridiquement contraindre Apple à décrypter l’iPhone d’un terroriste. Certains affirment que le 11 septembre aurait pu être évité avec Wikileaks.

A l’échelon international, les lignes ont bougé sur la protection des données personnelles. La Cour de Justice de l’UE a mis fin au « safe harbour » et l’UE et les USA sont parvenus à un accord sur un nouveau texte « US privacy shield ». C’est important quand on connait le poids des acteurs spécialisés. Palentir Technologies, société spécialisée dans l’agrégation des données mais aussi la cartographie des utilisateurs, est valorisé 20Md€. Les assureurs, gestionnaires de données, peuvent y trouver matière à réflexion.

L’intelligence artificielle fait peur

Le big data, par une tarification par individu et par risque, peut inquiéter les assureurs en remettant en cause la mutualisation. Ce n’est rien en comparaison de la remise en cause par l’intelligence artificielle.

Les tireurs de sonnettes d’alarme ne sont pas des novices, à l’instar d’Elon Musk* ou de Stephen Hawking. Ce dernier –qui a dépendu de la robotique pour compenser sa sclérose croissante- a indiqué que l’intelligence artificielle pourrait sonner le glas de l’humanité (les machines prenant le contrôle de la marche du monde).

On pense d’abord à l’emploi. Les chiffres sont paradoxaux : 50% des emplois seraient menacés mais seulement 5% seraient exposés. On a constaté, avec la précédente révolution de la robotique, que cela n’avait détruit des emplois que chez ceux qui ne se sont pas adaptés.

Autre source d’inquiétude, les hackers. Le traitement des données massives est en effet à double tranchant (identification mais aussi cyber attaques). Pour positiver, les cyber-risques donnent de la matière assurable nouvelle.

Des développements anarchiques

Les développements sont tous azimuts : pricing games (modèles en compétition) ; algorithmes et predictive analytics technics (choix des données pertinentes,…) ; concours « Kaggle » (ex BNPP sur l’optimisation du règlement des sinistres) ; digital marketing analytics (acquisition de trafic et optimisation du taux de conversion),…

Les forums se multiplient comme celui de l’Institut Louis Bachelier** (Fondation du Risque) qui organise le 21 mars le 9ème « financial risk international forum ». Le Mobile World Forum se tient à Barcelone cette semaine. Le Las Vegas Consumer Electronic Show a vu une imposante délégation française.

Ces développements se font en dehors de tout contrôle administratif. La circulation d’information peut même déstabiliser les institutions (comme Wikileaks fondé par Julian Assange ou Edward Snowden versus le FBI). La communication est d’autant facilitée que les principaux langages sont gratuits (Python ou sous R), les développements sont souvent en open source (utilisables sans paiement de licence), les formations sont accessibles en ligne (« MOOC »), et que les données commencent à s’ouvrir. Mais celles-ci sont à classifier (données pertinentes, redondantes, obsolètes, données cachées). Une des façons les plus sûres de rater le big data est de se noyer dans les réservoirs de données (« data lake »).

Une législation française castratrice

Une pluie de textes est venue couvrir le sujet. 3 textes de lois ne suffisaient pas (cf la Gazette***). Une 4ème est venue plomber le tout.

Sous couvert de confidentialité, certaines administrations publiques veulent garder l’exclusivité de l’accès aux données, vues comme enjeu de pouvoir et d’argent. Ce scrupule de confidentialité n’étouffe pas le législateur quand il s’agit du sens inverse avec la loi sur le renseignement du 24 juillet 2015 (décret du 29/1/16). En France, les administrations pourront avoir accès à des données pour cause de surveillance (« Big brother is watching you » comme écrivait dit George Orwell dans «1984»). Certes le Service Central du Renseignement Criminel dispose d’algorithme d’analyse prédictive utile pour la Gendarmerie. Mais cela ne renforce pas la « confiance numérique ».

L’accès aux données serait pourtant une source de progrès sociaux. Un assureur pourrait faire de la prévention du cancer par exemple, s’il avait accès aux données médicalisées personnelles (par analyse des facteurs de risques, traçabilité, etc). Mais l’assureur est soupçonné d’utiliser ses données pour sa sélection médicale. Par application du –mauvais- principe de précaution (qui empêche les avancées scientifiques et sociales), les assureurs n’investissent pas dans la médecine prédictive personnalisée.

Un malheur ne venant jamais seul, la fiscalité française est également dissuasive. Du coup, les GAFA (Google, Amazon, Facebook, Apple) et assimilés se retrouvent dans des paradis fiscaux ou d’autres pays européens, et ne contribuent pratiquement pas au budget français.

Des perspectives hallucinantes

L’intelligence artificielle (IA) revêt de multiples formes, dont la reconnaissance sensorielle (images, sons,…). C’est un secteur qui se développe, alimenté par un réseau de capteurs et d’objets connectés (« Internet of things or devices »). L’IA couvre également l’apprentissage « profond » (deep learning). Par exemple : une voiture sans conducteur apprenant en conduisant. Au passage, l’automobile (connectée) est alors le conducteur au sens de la Responsabilité Civile.

Après les échecs, l’ordinateur (le logiciel de la société GoogleDeepMind) bat désormais les champions de jeu de go****. Cela est possible grâce à l’apprentissage profond, qui consiste pour l’ordinateur à acquérir de l’expérience. La machine peut même apprendre en jouant contre elle-même. L’expérience tactique développée en extrême orient en 2700 ans est ainsi rattrapée par quelques jours de machines.

Il n’est donc pas étonnant que les assureurs investissent dans le secteur soit par des « labs » soit par des financements (AXA, Allianz, Covea, Aviva,…).

 

*Elon Musk, créateur de Paypal, Tesla Motors, SpaceX, Hyperloop, vient de créer OpenAI, société à but non lucratif spécialisée sur l’intelligence artificielle.

** Louis Bachelier est le créateur des mathématiques financières. Son ouvrage de 1900-Théorie de la spéculation- intègre les mouvements browniens (également chers à Albert Einstein). Il est utilisé aujourd’hui pour valoriser les options (formule de Black-Scholes). Longtemps ignoré, il a été reconnu par Andreï Kolmogorov et Benoît Mandelbrot (inventeur des fractales).

*** Loi sur le numérique d’Axelle Lemaire, axée sur les droits et libertés internet. Projet « Macron 2 » axé sur l’innovation qui sera à reprendre par un autre ministre. Loi de Clotilde Valter sur la gratuité des données publiques (« open data »), cf La Gazette du 29 septembre 2015.

**** Le jeu de go (碁) consiste pour 2 adversaires munis respectivement de pierres blanches et noires à déposer ses pierres sur un quadrillage de 19*19 (goban) pour encercler l’adversaire dans des « territoires ». Cela donne 2 à la puissance 361 possibilités de disposer les pierres. C’est beaucoup plus par exemple en ordre de grandeur que le nombre de neurones dans un cerveau (10 puissance 11) et même de connexions synaptiques (environ 10 puissance 14 suivant l’âge). C’est même plus que le nombre d’atomes dans l’univers (2 puissance 240, à quelques 0 près).

print

Soyez le premier à commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*


Lire les articles précédents :
Projet de loi El Khomri : les débuts hésitants de l’intersyndicale

Les responsables des principaux syndicats de salariés et de la jeunesse, à l'exception de ceux de la CFTC, se sont...

Fermer