mardi 12 décembre 2017

Ethical issues in data management

presented at Université Paris-Dauphine in the workshop "Social Responsibility
of Algorithms" (www.lamsade.dauphine.fr/sra2017)
organized by Alexis Tsoukias

Les données de l'éducation

Mon lycée.net

Serge Abiteboul

La question des données, de leur protection, est présente partout. On a toutefois l’impression que dans le domaine de l’éducation, elle est particulièrement sensible. Le ressentez-vous également et cela vous parait-il justifié ?

Le numérique produit de plus en plus de données, c’est une évidence. On est face à un phénomène d’accumulation et, simultanément, d’explosion des échanges de données. L’éducation n’échappe évidemment pas à un phénomène aussi massif.
La prolifération des données a fait émerger une notion importante qui est celle de données personnelles ou de données privées, c’est-à-dire de données qui concernent une personne en particulier. Personne n’est propriétaire des données qui le concernent mais chacun a des droits sur elles et en particulier sur leur utilisation. Ce qui compte c’est donc moins la donnée elle-même que ce qui en est fait, en particulier lorsqu’il s’agit de données personnelles.

En éducation, on peut faire toutes sortes de choses avec les données personnelles, des choses bonnes ou moins bonnes…

Tout à fait. On peut par exemple utiliser des données personnelles dans des logiciels pédagogiques performants qui sauront s’adapter à l’utilisateur parce qu’ils tiendront compte à la fois de ce qu’il ou elle a fait précédemment mais aussi de ce que d’autres ont fait avec le même logiciel. C’est une utilisation des données personnelles positive, même si elle est encore embryonnaire et que l’on n’en connait pas tous les effets. Ce qui serait négatif par contre, ce serait par exemple qu’une entreprise vende des données sur des lycéens ou des étudiants à des cabinets d’embauche qui les revendraient eux-mêmes à leurs entreprises clientes.
Il me semble que l’on pourrait retenir un principe très simple : que les données produites à l’intérieur du système éducatif national restent à l’intérieur de l’éducation nationale. Mais là encore il faut être prudent car même à l’intérieur du système, le risque existe de mauvaises utilisations. Par exemple, si on classe, si on étiquette les enfants et que l’on se sert de ces données pour les orienter, il y a un risque. Car dès lors qu’il existe des mesures, on va avoir tendance à leurs donner trop d’importance, à se cacher derrière elles. Or il faut toujours préférer le contact humain, une évaluation individuelle. Je dirais donc que l’extérieur de l’éducation nationale, c’est une zone interdite, une zone noire pour les données personnelles, mais à l’intérieur, c’est une zone grise, il faut rester vigilant.
Serge Abiteboul

Qu’avez-vous pensé de ce qui s’est passé avec APB qui est justement un système d’orientation exploitant des données scolaires personnelles ?

C’est un cas intéressant en effet. APB a été un progrès par rapport à ce qui se pratiquait avant. Il faut le rappeler. De plus, le recours au tirage aléatoire qui a été tant critiqué n’est pas la responsabilité du code mais de contraintes sur le système, de choix faits par des cadres de l’éducation nationale. Sur le plan informatique, je dirais que le code d’APB n’est pas terrible mais l’algorithme est bon. Ce qui est important, dans le cas d’APB comme en général, c’est que l’algorithme soit public, de façon à ce qu’il puisse être compris, discuté. Pour cette raison, il faut préférer les logiciels en Open Source quand on parle de décisions aussi importantes pour la vie de la cité.

L’autre problème auquel les responsables de l’éducation doivent faire face est celui de l’hébergement des données. Quelle est votre position sur cette question ?

Je dirais d’abord que l’hébergement dans le cloud est une avancée naturelle de l’informatique qui simplifie grandement la gestion des données. Mais quel cloud ?
Ce qui compte surtout ce n’est pas tant le lieu que les conditions d’utilisation. Le principe essentiel reste celui-ci : l’éducation nationale doit contrôler pleinement l’accès aux données et les mettre au service exclusif de l’éducation. Cette responsabilité est aussi bien-sûr celle des collectivités.
Ceci étant rappelé, en pratique, l’hébergement des données doit être négocié avec des industriels. C’est une question délicate. Pour cela, nous avons besoin de garanties. C’est une affaire de confiance et de rapport de force. Je préfèrerais que l’éducation nationale choisisse des industriels nationaux et européens avec lesquels il lui est plus facile de discuter d’égal à égal, plutôt que des entreprises nord-américaines comme les fameux GAFAM (Google Amazon Facebook Apple Microsoft) en lesquelles nous avons le droit d’avoir une confiance limitée et avec lesquelles le rapport de force n’est clairement pas en notre faveur.
La localisation des données est aussi importante : en Europe, elles dépendent de règlements européens beaucoup plus protecteurs. Et puis, nous avons d’excellentes entreprises françaises et européennes…
Serge Abiteboul
Je profite de l’occasion pour répéter l’importance considérable dans un monde numérique de l’enseignement de l’informatique depuis le primaire. La situation a évolué. Mais les cours sont donnés le plus souvent par des professeurs de mathématiques ou de technologie que l’on n’a pas pris le temps de former correctement – un enseignant d’informatique doit avoir en gros un niveau Bac+5, comme en mathématiques ou en histoire-géographie. La formation de ces enseignants en informatique est devenue le cœur du problème. Quand les élèves montent en compétence, ce qui est en train de se passer, ils doivent avoir en face d’eux de vrais professeurs d’informatique.
Et pour revenir sur notre sujet, nous devons aussi préparer tous nos élèves au monde numérique et par exemple, leur apprendre à protéger leurs données. L’éducation nationale doit être irréprochable dans ce domaine et leur donner un bon exemple.

Expo contre Mooc : les masses

Combien de visiteurs ?

Terra Data à La Cité des sciences : 145 000 visiteurs au 10 12 2017  en un peu plus de 8 mois d’exploitation
  • super pour un tel sujet !
Le Mooc Bador "Maitriser les Bases de Données Relationnelles" sur Fun : 16 780 en deux sessions
  • 50% des inscrits sont en France
  • les autres majoritairement du Maghreb et d'Afrique noire
  • 25% de femmes -- nous aimerions mieux faire, mais c'est déjà mieux qu'à la fac 
  • 51% ont un master ou plus
  • super pour un tel sujet !
 

jeudi 7 décembre 2017

Une nouvelle promotion d'académicien.ne.s des sciences

Ils sont à l'arrivée 18 dont 4 femmes. Cela ne mérite-t-il pas une écriture inclusive ? Elles sont quatre. Bravo Mesdames ! Aussi brillantes que vous soyez, vous rejoignez quelques points singuliers dans une foule masculine. Singulières.  Pourtant, pendant cette séance, on a senti souffler comme un soupçon de vent (une micro bise) féministe sur l'AS. Sans elle, ce n'est pas 4 mais 2 seulement que nous aurions élues !!! Cela aurait pu être pire. Devons-nous nous en réjouir ?

Même l'optimiste que je suis n'y croit pas. Je ne pense pas que l'institution saura se transformer de l'intérieur, ou alors cela prendra un temps infini (genre des dizaines d'années). Je pense que la pression devra venir de l'extérieur, de l'état, de la société. Ou alors, cette institution vénérable rejoindra dans le néant d'autres qui n'ont su se transformer.

Métier data scientist

Les vidéos des interventions de l’atelier Digit_Hum 2017 « Data deluge : Quelles compétences pour quelles données ? » sont désormais consultables à cette adresse : https://transfers.huma-num.fr/digithum/atelier/2017/ 
 
https://transfers.huma-num.fr/digithum/atelier/2017/2_abiteboul.php
 

mardi 5 décembre 2017

Privacy and Bigdata @ Sciences Po

Ce soir, je participe à une conférence sur IA, Big data et privacy avec Rand Hindi présenté par Hugo Ruggieri, c'est ce soir en salle Eugène d'Eichtal au 27 rue St Guillaume ! Vous ne pouvez pas vous déplacer ou vous n'avez pas de place ? Pas de souci, vous pouvez suivre la conférence en direct sur https://lnkd.in/gKUTZGg ! Et poser toutes vos questions sur sli.do #galatia !

jeudi 23 novembre 2017

Namur, Angers, Paris, Oxford et Versailles

Un peu oublié de causer dans ce blog...
  1. 10 oct, ESAIP, Ecole d'ingénieur, Angers : Le temps des Algorithmes
  2. 7 nov, Paris : keynote et panel au 50 ans d'Inria : Algorithmes, données et vie privée
  3. Issues in Ethical Data Management
    1. 9 oct., International Symposium on Principles and Practice of Declarative Programming, Namur
    2. 14 nov, Oxford : Computer science seminar  
    3. 21 nov, Versailles :keynote and panel au European Big Data Value Forum
Video in English on the topic from ETAPS: https://www.youtube.com/watch?v=a_RBsEWGAUM

Vidéo en français sur le sujet au 50 ans d'Inria (vers 4':30) : https://www.youtube.com/watch?v=NeCokuYDnAM

samedi 28 octobre 2017

Ecriture inclusive et académie

La sortie de l'Académie française contre l'écriture inclusive était sexiste et pathétique, profondément irritante de par son archaïsme.

Un article de Langue sauce piquante raconte assez bien avec des références utiles, et dit :

L’Académie est un astre mort, elle n’a heureusement plus de pouvoir de nuisance. Rappelons que la Révolution l’avait dissoute à juste titre, et que Napoléon l’a ressuscitée, comme beaucoup d’oripeaux de l’Ancien Régime. Rappelons aussi que son rôle prescrit par la monarchie était de publier une grammaire, ce qu’elle n’a jamais été capable de faire, et de renouveler son dictionnaire périodiquement, ce dont elle se montre incapable. La « Compagnie », c’est surtout celle des bras cassés.

A titre personnel, je ne suis pas un grand fan de l'écriture inclusive que je trouve un peu lourde. (C'est peut-être juste une question d'habitude ; on s'y fait). Mais il existe plein d'autres pistes que l'Académie française se garde bien de considérer comme la féminisation des noms de métiers. J'aime  ce qui commence à se faire dans le monde anglo-saxon. Par exemple, quand vous parlez d'un.e utilisateur.rice, un coup vous le conjuguez au masculin, un coup au féminin. Et j'adore la règle de proximité que l'académie a remplacée par la règle absurde "le masculin l'emporte sur le féminin" : Sarah et Jean sont des étudiants mais Jean et Sarah sont des étudiantes.

L'académie des Sciences, dont je fais partie, mérite aussi son lot de critiques :
  • peu de femmes, et incapacité à affronter ce problème. Êtes-vous sexistes messieurs les académicien.ne.s ?
  • peu de scientifiques des nouvelles sciences, comme l'informatique, les différentes disciplines défendant leur pré-carré.
  • peu de jeunes scientifiques à cause de la règle absurde que vous devenez académicien.ne à vie.
 Serge Abiteboul

Le monde numérique a vraiment besoin d'être inclusif à plusieurs titres (ref: https://cnnumerique.fr/inclusion toujours d'actualité), y compris de permettre à chacune et chacun de s'y sentir bien, avec fraternité, à égalité, en liberté. C'est pour ces raisons que la question du "genre" est essentielle pour binaire.

Les éditeurs 

jeudi 28 septembre 2017

mercredi 27 septembre 2017

Bêtise bloguera

Bêtise bloguera en pdf : télécharger.  
  1. Fanny Ardant et moi
  2. Que reste-t-il de nos amours ?
  3. Gare au gorille
  4. Marinella
  5. Cette année-là  
  6. Lune ma banlieue (sur binaire.blog.lemonde.fr)
  7. Il pleut sur Knokke-le-Zoute
Si vous les appréciez ces textes, n'oubliez pas de les partager
Ces livres pourraient vous intéresser :


chez votre libraire

chez Publie.net

chez Lulu.com.

chez votre libraire

PAP 2017 et autres présentations en septembre


Conseil Général de l’Économie : Cyber-résiliance, avec Didier Remy, Inria, 9 septembre 2017

Ligue des Droits de l'Homme : Présentation sur Big data, Algorithmes, Intelligence artificielle, c’est quoi ? à la réunion sur Big data, algorithmes et risques de discriminations, l’exemple de l’assurance, LDH, rue Marcadet, Paris, 17 septembre 2017

PAP 2017 Conférence invitée sur Personal Knowledge Management Systems à la 1st International Workshop on Personal Analytics and Privacy (In conjunction with ECML PKDD 2017), Skopje, Macedonia, Monday 18t Septembre 2017 

Conseil scientifique de l'INS2I : L'éthique des algorithmes, 25 septembre 2017

Centre de recherche de l'école des officiers de la gendarmerie nationale : présentation Quel monde construire ? sur aux Ateliers « Algorithmes prédictifs : quels enjeux éthiques et juridiques ? », École Militaire, mardi 26 septembre 2017







   

samedi 23 septembre 2017

Adieu Maurice

Deux géants de l’informatique :
Maurice Nivat (à droite) et David Harel,
lors d’un interview de David pour le blog Binaire, CC S. Abiteboul

J’étais doctorant aux Etats-Unis quand j’ai rencontré Maurice Nivat pour la première fois. C’était à Santa Barbara, en 1979 je crois, pour un séminaire sur la théorie des langages, alors la branche peut-être la plus active de l’informatique théorique. Il y avait quelque chose de surréaliste à croiser dans les couloirs des Euler,  des Newton, des Poincaré des temps présents : Jeff Ullman, Sheila Greibach et… Maurice Nivat, les pionniers de la théorie des langages et des automates. Assis au fond de la salle, ses questions pointues pouvaient terroriser certains conférenciers. Fumer une cigarette en discutant avec lui dans un des salons de l’hôtel a été pour moi un grand moment.

Maurice a participé à la construction de la communauté de recherche européenne en informatique. Il est le père du domaine en France, en particulier, pour ce qui est de la théorie. On a parfois reproché à l’informatique théorique française d’avoir été trop tournée sur elle même, sur ses sujets phares. Ce n’est pas la faute de Maurice. Quand je suis rentré des US dans les années 80, je travaillais sur la théorie des bases de données. Le sujet l’intéressait et nous avons organisé avec lui et Georges Gardarin un séminaire essentiellement pour attirer certains de ses anciens étudiants vers ce nouveau domaine. Il ne se contentait pas de labourer son territoire de confort.

J’ai plus tard côtoyé le Maurice « militant de l’enseignement de l’informatique ». Je suis tombé sur le sujet par hasard, parce qu’il fallait un académicien dans un comité. Maurice m’a rapidement contaminé – il savait être terriblement convaincant. Nous avons travaillé d’arrache-pied avec d’autres comme Gilles Dowek et Gérard Berry, sur des textes, dans des groupes comme le K12. Que de discussions acharnées, de moments de découragement, d’engueulades parfois, et le bonheur de voir émerger une pensée collective, de voir ces idées progresser dans la société.

Plus récemment, j’ai la chance de pouvoir dire qu’il était devenu un ami. Je n’oublierai jamais par exemple cette discussion devant une bière, dans un café près de la Gare du Nord, où nous avons parlé de tout, de son travail associatif pour la sauvegarde du patrimoine rural, de la vie, de la religion… Et comment oublier les moments dans sa maison d’Attainville, parfois avec son épouse, Paule, autour de thés ? La maladie commençait son travail de sape.

Ce que je retiens surtout de Maurice : l’intensité dans la recherche, dans la vie, dans son humanisme intransigeant, en tout.

Adieu Maurice. Tu vas manquer.

samedi 9 septembre 2017

Data, responsibly à Gênes

Summer school on Extending Database Technology, Genova, September 2017

Data Responsibly, Serge Abiteboul, Inria, and Julia Stoyanovich, Drexel University


vendredi 23 juin 2017

Difficultés de la gestion éthique des données

Keynote à Voxxa Days à Luxembourg

Video : https://www.youtube.com/watch?v=r5fwb8C0jtQ&list=PL4PrrYCV-zckBjMEzVScrs-BRCgUs2AOZ&index=2

Éthique de la recherche en apprentissage machine

La Cerna publie un rapport sur l'Éthique de la recherche en apprentissage machine

Le document complet

Le plan

  • Préambule
  • Composition du groupe de travail et personnalités auditionnées
  • Introduction
  • I. Qu’est-ce que l’apprentissage machine ?
  • II. Exemples d’applications de l’apprentissage machine
  • III. Questions éthiques
  • IV. Les préconisations sur les systèmes apprenants en six thèmes
    • Les données des systèmes d’apprentissage
    • L’autonomie des systèmes apprenants
    • L’explicabilité des systèmes d’apprentissage et leur évaluation
    • Les décisions des systèmes d’apprentissage
    • Le consentement lors de l’apprentissage machine
    • La responsabilité dans les relations homme-machine apprenantes
  • V. Contexte national et international
  • VI. Conclusion
  • VII. Liste des préconisations

Le préambule

Dans le numérique, le foisonnement et la rapidité de déploiement des usages issus de l’innovation contribuent à la complexité de l’interaction entre l’offre technologique et l’appropriation par la société, et réduit de ce fait la portée des prévisions scientifiques sur les conséquences de la recherche. Cette relative imprévisibilité des usages ne doit pas dédouaner les scientifiques, mais doit au contraire motiver la réflexion éthique et la recherche d’attitudes et de méthodes adaptées. En effet les chercheurs doivent avoir à l’esprit que leurs travaux contribuent de facto à transformer la société et peut-être l’Homme, comme l’ont fait beaucoup d’outils et de techniques depuis des millénaires, même si ce processus n’est pas toujours prévisible. Ainsi si l’on ne saurait attribuer aux seuls chercheurs la responsabilité de l’impact potentiel de leurs travaux, ceux-ci doivent être conscients qu’ils sont partie prenante d’une responsabilité collective. Le monde de la recherche doit organiser en son sein et d’une manière transdisciplinaire la prise en compte de la dimension éthique, et éclairer ses choix vis-à-vis de la société en contribuant aux débats publics, afin que la science demeure un facteur de progrès et que les croyances infondées et l’irrationnel ne conduisent pas à une défiance à son égard. Dans ce contexte, les réflexions de la CERNA - dont la vocation est de se prononcer sur l’éthique de la recherche en sciences et technologies du numérique - visent à inciter et aider les chercheurs à la vigilance éthique « chemin faisant » plutôt qu’à émettre des prescriptions normatives qui seraient vite obsolètes. Elles n’envisagent que des perspectives plausibles du point de vue scientifique, afin de ne pas nourrir la confusion avec ce qui relève de la science-fiction.
Conçu dans un esprit pratique en premier lieu à l'attention des chercheurs et développeurs dans le numérique, le document aborde les questions sous l'angle des sciences et technologies. Des questions de société que le concepteur doit avoir à l'esprit sont évoquées sans être approfondies. Le présent travail n'est qu'une contribution à une réflexion qui doit être plus vaste au sein du monde de la recherche, notamment avec les sciences humaines et sociales, et au niveau de la société toute entière, comme l'évoque la conclusion.

Fondation Blaise Pascal

La Fondation Blaise Pascal a pour vocation de promouvoir, soutenir, développer et pérenniser les actions de médiation scientifique en mathématiques et informatique à destination de tout citoyen.

Une ambition : réenchanter les mathématiques et l'informatique
Cette fondation a pour ambition de changer la perception de ces disciplines en donnant envie aux jeunes d'investir ces connaissances fondamentales.

La Fondation Blaise Pascal a été créée sous égide de la Fondation pour l’Université de Lyon, le 14 novembre 2016. Les fondateurs sont le CNRS et l’Université de Lyon.

La Fondation Blaise Pascal constitue la mise en oeuvre de la troisième phase du projet Cap'Maths.

--

Isabelle GUERIN-LASSOUS (Université Lyon 1) est déléguée générale

Stéphane GAUSSENT (Université Jean Monnet, Saint-Étienne) est président du conseil scientifique

J'ai l'honneur de participer à cette fondation comme président du conseil stratégique.

jeudi 15 juin 2017

Vidéos de la Conférence Éthique et numérique à l'Académie des sciences

Vidéos de la conférence-débat à l'académie des sciences du
  • Mardi 23 mai 2017 de 14h30 à 16h30
  • Grande salle des séances de l’Institut de France
  • 23, quai de Conti, 75006 Paris 
Éthique numérique ? Entre programme et apprentissage, Milad Douehi
Éthique et algorithmes, Gilles Dowek
Éthique et données, Serge Abiteboul
Éthique en apprentissage machine, Laurence Devillers

mardi 6 juin 2017

Séminaire Nasse : Algos et concurrence

SÉMINAIRE PHILIPPE NASSE
Algorithmes et concurrence
Mardi 6 juin 2017, Ministère de l’Économie et des Finances
  • Serge Abiteboul, directeur de recherche à l'Institut national de recherche en  informatique et automatique (Inria), ENS Paris, membre de l’Académie des  sciences
  • Thierry Pénard, professeur d'économie à l'Université de Rennes 1 et chercheur au CREM (CNRS)
  • Jérôme Philippe, économiste, avocat associé chez Freshfields Bruckhaus Deringer
Débat animé par Emmanuel Combe, Vice-Président de l’Autorité de la concurrence

samedi 3 juin 2017

Le temps des Algorithmes



flyer

Sélectionné 

  • pour le prix La Science se livre 2018
  • pour le prix Le goût des sciences 2017
  • pour le prix Roberval 2017, catégorie Grand Public
  • pour le prix Tangente des lycéens 2018. 

La presse écrite parle de nous - merci 

Début de l'article de Michel Serres

 La radio/podcast aussi - merci 

Citations d'articles pas en accès ouvert

  • S'en saisissant, les chercheurs en informatique Serge Abiteboul et Gilles Dowek nous livrent ici un ouvrage à la portée de tous, aussi intéressant quand il retrace l'histoire de ce « premier outil à la mesure des aspirations humaines » que quand il en anticipe les développement futurs. Yann Verdo, Les Échos  
  • ... nous proposent une réflexion générale sur notre époque, marquée par ces calculs qui se glissent dans tous les ordinateurs. TB. Passionnant. La Liberté. Suisse
  • Cet ouvrage peut être lu a partir du lycée, C.M., Inter CDI 

Et aussi le Web - merci aussi - par exemple

Le mot du Libraire, Pierre Morize, La lettre des Fous de sciences, Mars à Août 2017

Et des présentations publiques