vendredi 23 juin 2017

Difficultés de la gestion éthique des données

Keynote à Voxxa Days à Luxembourg

Éthique de la recherche en apprentissage machine

La Cerna publie un rapport sur l'Éthique de la recherche en apprentissage machine

Le document complet

Le plan

  • Préambule
  • Composition du groupe de travail et personnalités auditionnées
  • Introduction
  • I. Qu’est-ce que l’apprentissage machine ?
  • II. Exemples d’applications de l’apprentissage machine
  • III. Questions éthiques
  • IV. Les préconisations sur les systèmes apprenants en six thèmes
    • Les données des systèmes d’apprentissage
    • L’autonomie des systèmes apprenants
    • L’explicabilité des systèmes d’apprentissage et leur évaluation
    • Les décisions des systèmes d’apprentissage
    • Le consentement lors de l’apprentissage machine
    • La responsabilité dans les relations homme-machine apprenantes
  • V. Contexte national et international
  • VI. Conclusion
  • VII. Liste des préconisations

Le préambule

Dans le numérique, le foisonnement et la rapidité de déploiement des usages issus de l’innovation contribuent à la complexité de l’interaction entre l’offre technologique et l’appropriation par la société, et réduit de ce fait la portée des prévisions scientifiques sur les conséquences de la recherche. Cette relative imprévisibilité des usages ne doit pas dédouaner les scientifiques, mais doit au contraire motiver la réflexion éthique et la recherche d’attitudes et de méthodes adaptées. En effet les chercheurs doivent avoir à l’esprit que leurs travaux contribuent de facto à transformer la société et peut-être l’Homme, comme l’ont fait beaucoup d’outils et de techniques depuis des millénaires, même si ce processus n’est pas toujours prévisible. Ainsi si l’on ne saurait attribuer aux seuls chercheurs la responsabilité de l’impact potentiel de leurs travaux, ceux-ci doivent être conscients qu’ils sont partie prenante d’une responsabilité collective. Le monde de la recherche doit organiser en son sein et d’une manière transdisciplinaire la prise en compte de la dimension éthique, et éclairer ses choix vis-à-vis de la société en contribuant aux débats publics, afin que la science demeure un facteur de progrès et que les croyances infondées et l’irrationnel ne conduisent pas à une défiance à son égard. Dans ce contexte, les réflexions de la CERNA - dont la vocation est de se prononcer sur l’éthique de la recherche en sciences et technologies du numérique - visent à inciter et aider les chercheurs à la vigilance éthique « chemin faisant » plutôt qu’à émettre des prescriptions normatives qui seraient vite obsolètes. Elles n’envisagent que des perspectives plausibles du point de vue scientifique, afin de ne pas nourrir la confusion avec ce qui relève de la science-fiction.
Conçu dans un esprit pratique en premier lieu à l'attention des chercheurs et développeurs dans le numérique, le document aborde les questions sous l'angle des sciences et technologies. Des questions de société que le concepteur doit avoir à l'esprit sont évoquées sans être approfondies. Le présent travail n'est qu'une contribution à une réflexion qui doit être plus vaste au sein du monde de la recherche, notamment avec les sciences humaines et sociales, et au niveau de la société toute entière, comme l'évoque la conclusion.

Fondation Blaise Pascal

La Fondation Blaise Pascal a pour vocation de promouvoir, soutenir, développer et pérenniser les actions de médiation scientifique en mathématiques et informatique à destination de tout citoyen.

Une ambition : réenchanter les mathématiques et l'informatique
Cette fondation a pour ambition de changer la perception de ces disciplines en donnant envie aux jeunes d'investir ces connaissances fondamentales.

La Fondation Blaise Pascal a été créée sous égide de la Fondation pour l’Université de Lyon, le 14 novembre 2016. Les fondateurs sont le CNRS et l’Université de Lyon.

La Fondation Blaise Pascal constitue la mise en oeuvre de la troisième phase du projet Cap'Maths.

--

Isabelle GUERIN-LASSOUS (Université Lyon 1) est déléguée générale

Stéphane GAUSSENT (Université Jean Monnet, Saint-Étienne) est président du conseil scientifique

J'ai l'honneur de participer à cette fondation comme président du conseil stratégique.

jeudi 15 juin 2017

Vidéos de la Conférence Éthique et numérique à l'Académie des sciences

Vidéos de la conférence-débat à l'académie des sciences du
  • Mardi 23 mai 2017 de 14h30 à 16h30
  • Grande salle des séances de l’Institut de France
  • 23, quai de Conti, 75006 Paris 
Éthique numérique ? Entre programme et apprentissage, Milad Douehi
Éthique et algorithmes, Gilles Dowek
Éthique et données, Serge Abiteboul
Éthique en apprentissage machine, Laurence Devillers

mardi 6 juin 2017

Séminaire Nasse : Algos et concurrence

SÉMINAIRE PHILIPPE NASSE
Algorithmes et concurrence
Mardi 6 juin 2017, Ministère de l’Économie et des Finances
  • Serge Abiteboul, directeur de recherche à l'Institut national de recherche en  informatique et automatique (Inria), ENS Paris, membre de l’Académie des  sciences
  • Thierry Pénard, professeur d'économie à l'Université de Rennes 1 et chercheur au CREM (CNRS)
  • Jérôme Philippe, économiste, avocat associé chez Freshfields Bruckhaus Deringer
Débat animé par Emmanuel Combe, Vice-Président de l’Autorité de la concurrence

samedi 3 juin 2017

Le temps des Algorithmes



flyer

 La presse écrite parle de nous - merci 

 La radio/podcast aussi - merci 

Citations d'articles pas en accès ouvert

  • S'en saisissant, les chercheurs en informatique Serge Abiteboul et Gilles Dowek nous livrent ici un ouvrage à la portée de tous, aussi intéressant quand il retrace l'histoire de ce « premier outil à la mesure des aspirations humaines » que quand il en anticipe les développement futurs. Yann Verdo, Les Échos  
  • ... nous proposent une réflexion générale sur notre époque, marquée par ces calculs qui se glissent dans tous les ordinateurs. TB. Passionnant. La Liberté. Suisse
  • Cet ouvrage peut être lu a partir du lycée, C.M., Inter CDI 

Et aussi le Web - merci aussi - par exemple

Le mot du Libraire, Pierre Morize, La lettre des Fous de sciences, Mars à Août 2017

Et des présentations publiques


Terra Data


 https://www.editions-lepommier.fr/sites/default/files/public/assets/images/74651241_0.jpg

Terra Data,  Valérie Peugeot et Serge Abiteboul

  flyer

La presse écrite parle de nous - merci 

  1. La planète des données, Bertrand Lemaire, CIO, 26/03/2017
  2. Données, Ô données, dites-moi mon avenir !, Les Echos, Jacques Henno, avril 2017. 
  3. Les données numériques, un continent à explorer, Sciences et Avenir, 5/4/17
  4. Terra data, nos vies à l'ère du numérique, Usine digitale, 3/4:2017
  5. Terra data : tout savoir sur le big data à la Cité des Sciences à Paris !, NousVousIls, Avril 2017
  6. Il a assisté à la première démo de Google par Brin et Page, Frédérique Lemonnier, Fabernovel, Avril 2017
  7. Pour une utilisation responsable de la data, La gazette des communes des départements des régions, 15/21 Mai 17 
  8. Voyage en Terre des Données, David Larousserie, Le Monde, Sciences et Médecine, 17/5/2017 
  9. Une exposition à la Cité des Sciences, La Nouvelle République, 20/5//2017
  10. Serge Abiteboul, Par delà des données, La Nouvelle République, Loir-et-Cher - Romorantin-Lanthenay, 20/5//2017  
  11. Data scientist est un métier qui demande énormément de neurones, Marie Miller, Le Monde Campus 17/5/2017   
  12. Des choix de société s'imposent pour l'avenir de nos données, Clémence Jost, Archimag, juin 2017
  13. Maitriser les flux de données : entre performance et éthique, Dominique Herbert, Best Practices, Biblio, Juin 2017

La radio/podcast aussi - merci 

  1. Autour de la question, Simon Rozé, RFI, 2/5/2017

Aussi des présentations publiques

Des sites de la Toile

Exposition Terra Data, Nos vies à l'heure du numérique


https://www.youtube.com/watch?v=qqvsiTUJy7k&feature=youtu.be


mercredi 31 mai 2017

Big data et recommandation @ Cité des sciences

Aucun texte alternatif disponible.

La communauté scientifique face au renseignement @ Ecole Militaire

Je participe à l'organisation de ce colloque le 12 juin à l’École Militaire.

Programme

8h30 Accueil
9h00 Ouverture

9h15 Introduction générale

  • Edgar MORIN (sous réserve) 
  • Alain BRAVO

9h30 Les rapports entre les sciences et le renseignement à travers le XXème siècle

Présidence : M. Pascal GRISET
  • David AUBIN - Sciences et renseignement : retour historique depuis la 1ère guerre mondiale 
  • Ksenia TATARCHENKO - Coopérations scientifiques entre Russie/France/USA pendant la Guerre Froide 
  • Simone TURCHETTI - Environnement, sciences et renseignement

11h15 La surveillance en temps réel

Présidence : M. Serge ABITEBOUL
  • Louis DUBERTRET - Comment traitons-nous les sujets éthiques au sein de l'académie des technologies? L'exemple du Big Data
  • Daniel LE METAYER - Anonymisation et respect de la vie privée
  • Emmanuel PIETRIGA - Visualisation et analyse collaborative de masses de données sur un mur d'écran très haute résolution
12h45 Intersession

14h00 La sécurité à travers les sciences

Présidence : M. François MORAIN
  • François MORAIN - Cryptologie : l'apport des sciences 
  • Nozha BOUJEMAA - Transparence et équité des algorithmes 
  • Eric FREYSSINET -  Lutte contre les botnets : comprendre et échanger

15h45 Le renseignement grâce à l'innovation

Présidence : M. Serge TISSERON
  • David Vissiere : témoignage d’une start up : Sysnav
  • Grégoire BIETTE - Lutte contre la cybercriminalité par analyse de la Blockchain
  • Lorraine TOURNYOL DU CLOS - L’Intelligence Campus à la direction du renseignement militaire
17h30 Conclusions
Patrick PAILLOUX - Le renseignement face aux défis des vulnérabilités numériques

samedi 27 mai 2017

Le théorème d’Abiteboul-Vianu

Tout ce que vous voulez savoir sur ce théorème et plus important ce que veut dire complexité en temps et espace

Arthur Milchior à podcastscience : http://www.podcastscience.fm/emission/2017/05/24/podcast-science-295-le-theoreme-dabiteboul-vianu/
Mercredi 26 avril – Dossier de Arthur Milchior du podcast Trajectoires



Comment sait on si un problème informatique est vraiment complexe ? Parfois, on a des solutions qui coûtent chères (en temps de calcul, en espace mémoire, ou autre). Alors on continue de chercher des solutions, moins chères. Mais, rarement pour l’instant, on sait prouver qu’on a atteint l’optimale. La complexité computationnelle, une branche de l’informatique fondamentale, cherche ce qu’on peut dire des solutions optimales — que cette solution soit connue ou non aujourd’hui.

Les informathématiciens ont développés énormément de techniques tarabiscotés pour attaquer ce problème. En particulier, en 1991, Serge Abiteboul (invité du Podcast #266) et Victor Vianu ont publié le théorème d’Abiteboul-Vianu. Celui-dit donne une piste assez surprenante qui permettra peut-être un jour de montrer que certains problème ne pourront jamais être résolu rapidement. Ce théorème va servir de prétexte à Arthur Milchior (déjà venu parler de Calculabilité dans le podcast #290) pour vous faire découvrir ce domaine de recherche de l’informatique fondamentale.

» RDV en ligne le mercredi 26 avril 2017 à 20h30 sur live.podcastscience.fm/

mercredi 24 mai 2017

Le Conseil national du numérique a un rôle important à jouer dans notre démocratie

Je suis signataire d'un manifeste publié dans Les Echos du 24 mai 2017.

Au moment de l’installation du nouveau Gouvernement, 70 personnalités du numérique — actuels et anciens membres du CNNum — ont signé un manifeste pour interpeller l’exécutif sur l'urgence d'une politique publique à la hauteur de la transformation numérique du pays.
Dans les prochaines semaines le Gouvernement va devoir prendre des décisions importantes, à la fois sur l’organisation de l’appareil d’État et sur les grandes orientations de la transformation numérique. Le CNNum, par sa composition, son rôle particulier dans le paysage institutionnel et sa capacité à mobiliser l’écosystème numérique, peut contribuer à la co-construction de ces orientations. Le manifeste est un appel du pied dans ce sens.
Cette profession de foi est aussi l’occasion pour le Conseil d’affirmer sa volonté de renforcer son impact au niveau européen. Données, plateformes numériques, intelligence artificielle… tous ces sujets sont au cœur de la réflexion de la mandature actuelle. Le CNNum prendra notamment appui sur le socle des relations nouées avec son homologue allemand, afin de permettre un dialogue européen constructif sur les perspectives de la transformation numérique.
Ce manifeste a enfin vocation à être vivant et à évoluer avec le temps. Nous souhaitons renforcer notre rôle de plateforme d’échange à destination de l’écosystème et des citoyens. Nous organiserons dans les prochaines semaines un large événement réunissant plusieurs représentants de l’écosystème autour des questions de transformation numérique du pays..




vendredi 12 mai 2017

Pour une intelligence artificielle maîtrisée, utile et démystifiée

Rapport d'information de M. Claude DE GANAY, député et Mme Dominique GILLOT, sénatrice, fait au nom de l'Office parlementaire d'évaluation des choix scientifiques et technologiques n° 464 tome II (2016-2017) - 15 mars 2017

vendredi 28 avril 2017

Les transformations du travail et de l'économie

Les transformations du travail et de l'économie, avec Gilles Dowek, Séminaire "Histoire économique : État, entreprises et marchés", à l'EHESS, CRH-GrHEco, 28/4/2017

And also 26/4/2017, The European Joint Conferences on Theory and Practice of Software (ETAPS)


Unifying Public Lecture : Issues in Ethical Data Management

Data science holds incredible promise of improving people's lives, accelerating scientific discovery and innovation, and bringing about positive societal change. Yet, if not used responsibly, this technology can propel economic inequality, destabilize global markets and affirm systemic bias. In this talk, we consider issues such as violation of data privacy, or biases in data analysis. We discuss desirable properties in data analysis such as fairness, transparency, or diversity. A goal of the talk is to draw the attention of the computer science community to the important emerging subject of responsible data management and analysis. We will present our perspective on the issue, and motivate research directions.

Les algorithmes : un outil neutre

Académie des sciences et techniques comptables et financières, avec Gilles Dowek : la video

mercredi 26 avril 2017

Il a assisté à la première démo de Google par Brin et Page

`
Frédérique Lemonnier, FABERNOVEL

English version 

Nous sommes allés à la rencontre de Serge Abiteboul, chercheur et informaticien français à Inria et à l'ENS, ancien titulaire de la Chaire d’informatique et Sciences Numériques du Collège de France, récemment co-auteur avec Gilles Dowek du livre « Le temps des algorithmes », et avec Valérie Peugeot de « Terra data ». Son parcours et son histoire atypiques nous ont bluffés. Serge Abiteboul a vécu le Stanford de Larry Page et Sergey Brin à la fin des années 90. Dans cette interview il nous raconte cette époque et la “révolution de pensée” qu’a permis l’arrivée des algorithmes. Une révolution que nous craignons et aimons à la fois et qui n’a pas fini de se développer et de nous étonner.

Retrouvez l'entretien  - merci Frédérique

Photo Frédérique Lemonnier - les équations ne sont pas de moi :)

mercredi 19 avril 2017

Les enjeux scientifiques de l'éthique du numérique

Conférence-débat à l'académie des sciences
  • Mardi 23 mai 2017 de 14h30 à 16h30
  • Grande salle des séances de l’Institut de France
  • 23, quai de Conti, 75006 Paris 
Éthique numérique ? Entre programme et apprentissage, Milad Douehi
Éthique et algorithmes, Gilles Dowek
Éthique et données, Serge Abiteboul
Éthique en apprentissage machine, Laurence Devillers

 Consulter le programme

Big Data et recommandations : menace ou opportunité ?

Projection suivie d’une intervention du réalisateur Thibaut Sève, puis d’un débat. Avec Serge Abiteboul, Milad Doueihi, Édouard Geffray, et Emmanuelle Jardat.



vendredi 24 mars 2017

EDBT, Headwork...

Panel at the Extending Database Conference, in Venice, Italy. Participation to the panel : Database Technology and Behavior, Security, Ethics, Rights and Duties of Citizens

Participation to the ANR project Headwork; http://headwork.gforge.inria.fr

 Crowdsourcing relies on potentially huge numbers of on-line partic- ipants to resolve data acquisition or analysis tasks. It is an exploding area that impacts various domains, ranging from scientific knowledge enrichment to market analysis support. But currently, existing crowd platforms rely mostly on low level programming paradigms, rigid data models and poor participant profiles, which yields severe limitations. The low- level nature of existing solutions prevents the design of complex data acquisition workflows, that could be executed, composed, searched and even be proposed by participants them- selves. Taking into account the quality, uncertainty, inconsistency and representativeness of participant contributions is still an open problem. Methods for assigning a task to the correct participant according to his trust, motivation and expertise, automatically improving crowd execution time, computing optimal participant rewards, are missing. Similarly, usual crowd campaigns produce isolated and rigid data sets: A flexible and common data model for the produced knowledge about data and participants could allow participative knowledge acquisition. To overcome these challenges, Headwork will define:
  • Rich workflow, participant, data and knowledge models to capture various kind of crowd applications with complex data acquisition tasks and human specificities
  • Methods for deploying, verifying, optimizing, but also monitoring and adapting crowd- based workflow executions at run time.

Partners

To reach its goals, Headwork will rely on two experts of large participative knowledge acquisition platforms
  • Cesco (Musée National d'Histoire Naturelle)
  • FouleFactory
  • Valda (INRIA Paris)
  • Druid (Rennes 1)
  • Links (Inria-Lille)
  • Sumo (Inria-Bretagne)
 

vendredi 17 mars 2017

Big data and Law

Presentation at the conference on "Law and Big Data: How Information Analytics Will Change the Law"
March 17th, 2017, Palais du Luxembourg, Paris

Vidéo



samedi 11 mars 2017

Fondation Sopra-Steria, Prix étudiant

Participation au jury du prix. Des projets super sympas.

Participation au comité éditorial de "Les Big Data à découvert", CNRS édition, sous la direction de Mokrane Bouzeghoub et Rémy Mosseri
  • le livre est plus intéressant que son titre 
  • avec "L'analyse de données, dérives et bonnes pratiques : écrit avec Julia Stoyanovich de Drexel U.

vendredi 3 mars 2017

Algorithmes, données numériques et gouvernement

Présentations dans le cadre d'un séminaire à France stratégie avec Dominique Cardon sur : Diffusion de l’information : quels enjeux démocratiques ?

mercredi 22 février 2017

Soirée Gamma à Boston Consulting Group

Mardi 21 février 2017 : Les données hier et demain

Aussi des présentations de Francis Bach, Fabien Gandon (Inria) et Thomas Lewiner (BCG)

mercredi 25 janvier 2017

Avec tout le respect dû à la Cnil...


La Cnil lance un vaste débat public sur les algorithmes.  On s'en réjouit. Mais un texte utilisé par l'IFOP pour un sondage, repris dans un débat organisé par la Cnil inquiète. Une capture d'écran (merci @IgorCarron) : 

La définition accumule les imprécisions, mélange tout. Sapristi ! Un algorithme n'est pas une formule mathématique : ce n'est pas une formule, et ce n'est pas des maths. Modèles statistiques ? Diable pourquoi ? Ils élaborent... Diantre, oui. Mais il font tant d'autres choses...

Quand les algorithmes deviennent aussi importants dans nos vies, quand l’État s'en inquiète au point de vouloir les réguler, il faudrait faire attention à ce qu'on dit, nous tous et en particulier, la CNIL. La Société informatique de France a proposé une définition de l'informatique : Informatique - Quèsaco ?

Et puis cela vient à point pour vous conseiller le livre qui va enfin vous expliquer simplement ce que sont les algorithmes : Le temps des Algorithmes, Le Pommier, 26/01/2017.

Voir justement : Qu’est-ce qu’un algorithme? par Annabelle Laurent, 20minutes.fr, 26/01/2017

lundi 23 janvier 2017

Mooc Bador -- Saison 2

A la demande générale, le Mooc Bador chez Fun :

Bases de données relationnelles : Comprendre pour maîtriser 

démarre une deuxième saison.

Co-starring : Serge Abiteboul, Benjamin Nguyen et Philippe Rigaux

Plus de 8000 inscrits pour la Saison 1. Déjà près de 6000 en Saison 2. Comprenez pour maîtriser !

vendredi 20 janvier 2017

L'intelligence artificielle au Sénat

Participation à une audition publique sur l'intelligence artificielle organisée par l'OPECST,  19 janvier 2017
Aspects éthiques dans le cadre des données massives
Bientôt sur http://www.senat.fr/opecst

Vidéo : vers 18:07