mardi 12 décembre 2017

Ethical issues in data management

presented at Université Paris-Dauphine in the workshop "Social Responsibility
of Algorithms" (www.lamsade.dauphine.fr/sra2017)
organized by Alexis Tsoukias

Les données de l'éducation

Mon lycée.net

Serge Abiteboul

La question des données, de leur protection, est présente partout. On a toutefois l’impression que dans le domaine de l’éducation, elle est particulièrement sensible. Le ressentez-vous également et cela vous parait-il justifié ?

Le numérique produit de plus en plus de données, c’est une évidence. On est face à un phénomène d’accumulation et, simultanément, d’explosion des échanges de données. L’éducation n’échappe évidemment pas à un phénomène aussi massif.
La prolifération des données a fait émerger une notion importante qui est celle de données personnelles ou de données privées, c’est-à-dire de données qui concernent une personne en particulier. Personne n’est propriétaire des données qui le concernent mais chacun a des droits sur elles et en particulier sur leur utilisation. Ce qui compte c’est donc moins la donnée elle-même que ce qui en est fait, en particulier lorsqu’il s’agit de données personnelles.

En éducation, on peut faire toutes sortes de choses avec les données personnelles, des choses bonnes ou moins bonnes…

Tout à fait. On peut par exemple utiliser des données personnelles dans des logiciels pédagogiques performants qui sauront s’adapter à l’utilisateur parce qu’ils tiendront compte à la fois de ce qu’il ou elle a fait précédemment mais aussi de ce que d’autres ont fait avec le même logiciel. C’est une utilisation des données personnelles positive, même si elle est encore embryonnaire et que l’on n’en connait pas tous les effets. Ce qui serait négatif par contre, ce serait par exemple qu’une entreprise vende des données sur des lycéens ou des étudiants à des cabinets d’embauche qui les revendraient eux-mêmes à leurs entreprises clientes.
Il me semble que l’on pourrait retenir un principe très simple : que les données produites à l’intérieur du système éducatif national restent à l’intérieur de l’éducation nationale. Mais là encore il faut être prudent car même à l’intérieur du système, le risque existe de mauvaises utilisations. Par exemple, si on classe, si on étiquette les enfants et que l’on se sert de ces données pour les orienter, il y a un risque. Car dès lors qu’il existe des mesures, on va avoir tendance à leurs donner trop d’importance, à se cacher derrière elles. Or il faut toujours préférer le contact humain, une évaluation individuelle. Je dirais donc que l’extérieur de l’éducation nationale, c’est une zone interdite, une zone noire pour les données personnelles, mais à l’intérieur, c’est une zone grise, il faut rester vigilant.
Serge Abiteboul

Qu’avez-vous pensé de ce qui s’est passé avec APB qui est justement un système d’orientation exploitant des données scolaires personnelles ?

C’est un cas intéressant en effet. APB a été un progrès par rapport à ce qui se pratiquait avant. Il faut le rappeler. De plus, le recours au tirage aléatoire qui a été tant critiqué n’est pas la responsabilité du code mais de contraintes sur le système, de choix faits par des cadres de l’éducation nationale. Sur le plan informatique, je dirais que le code d’APB n’est pas terrible mais l’algorithme est bon. Ce qui est important, dans le cas d’APB comme en général, c’est que l’algorithme soit public, de façon à ce qu’il puisse être compris, discuté. Pour cette raison, il faut préférer les logiciels en Open Source quand on parle de décisions aussi importantes pour la vie de la cité.

L’autre problème auquel les responsables de l’éducation doivent faire face est celui de l’hébergement des données. Quelle est votre position sur cette question ?

Je dirais d’abord que l’hébergement dans le cloud est une avancée naturelle de l’informatique qui simplifie grandement la gestion des données. Mais quel cloud ?
Ce qui compte surtout ce n’est pas tant le lieu que les conditions d’utilisation. Le principe essentiel reste celui-ci : l’éducation nationale doit contrôler pleinement l’accès aux données et les mettre au service exclusif de l’éducation. Cette responsabilité est aussi bien-sûr celle des collectivités.
Ceci étant rappelé, en pratique, l’hébergement des données doit être négocié avec des industriels. C’est une question délicate. Pour cela, nous avons besoin de garanties. C’est une affaire de confiance et de rapport de force. Je préfèrerais que l’éducation nationale choisisse des industriels nationaux et européens avec lesquels il lui est plus facile de discuter d’égal à égal, plutôt que des entreprises nord-américaines comme les fameux GAFAM (Google Amazon Facebook Apple Microsoft) en lesquelles nous avons le droit d’avoir une confiance limitée et avec lesquelles le rapport de force n’est clairement pas en notre faveur.
La localisation des données est aussi importante : en Europe, elles dépendent de règlements européens beaucoup plus protecteurs. Et puis, nous avons d’excellentes entreprises françaises et européennes…
Serge Abiteboul
Je profite de l’occasion pour répéter l’importance considérable dans un monde numérique de l’enseignement de l’informatique depuis le primaire. La situation a évolué. Mais les cours sont donnés le plus souvent par des professeurs de mathématiques ou de technologie que l’on n’a pas pris le temps de former correctement – un enseignant d’informatique doit avoir en gros un niveau Bac+5, comme en mathématiques ou en histoire-géographie. La formation de ces enseignants en informatique est devenue le cœur du problème. Quand les élèves montent en compétence, ce qui est en train de se passer, ils doivent avoir en face d’eux de vrais professeurs d’informatique.
Et pour revenir sur notre sujet, nous devons aussi préparer tous nos élèves au monde numérique et par exemple, leur apprendre à protéger leurs données. L’éducation nationale doit être irréprochable dans ce domaine et leur donner un bon exemple.

Expo contre Mooc : les masses

Combien de visiteurs ?

Terra Data à La Cité des sciences : 145 000 visiteurs au 10 12 2017  en un peu plus de 8 mois d’exploitation
  • super pour un tel sujet !
Le Mooc Bador "Maitriser les Bases de Données Relationnelles" sur Fun : 16 780 en deux sessions
  • 50% des inscrits sont en France
  • les autres majoritairement du Maghreb et d'Afrique noire
  • 25% de femmes -- nous aimerions mieux faire, mais c'est déjà mieux qu'à la fac 
  • 51% ont un master ou plus
  • super pour un tel sujet !
 

jeudi 7 décembre 2017

Une nouvelle promotion d'académicien.ne.s des sciences

Ils sont à l'arrivée 18 dont 4 femmes. Cela ne mérite-t-il pas une écriture inclusive ? Elles sont quatre. Bravo Mesdames ! Aussi brillantes que vous soyez, vous rejoignez quelques points singuliers dans une foule masculine. Singulières.  Pourtant, pendant cette séance, on a senti souffler comme un soupçon de vent (une micro bise) féministe sur l'AS. Sans elle, ce n'est pas 4 mais 2 seulement que nous aurions élues !!! Cela aurait pu être pire. Devons-nous nous en réjouir ?

Même l'optimiste que je suis n'y croit pas. Je ne pense pas que l'institution saura se transformer de l'intérieur, ou alors cela prendra un temps infini (genre des dizaines d'années). Je pense que la pression devra venir de l'extérieur, de l'état, de la société. Ou alors, cette institution vénérable rejoindra dans le néant d'autres qui n'ont su se transformer.

Métier data scientist

Les vidéos des interventions de l’atelier Digit_Hum 2017 « Data deluge : Quelles compétences pour quelles données ? » sont désormais consultables à cette adresse : https://transfers.huma-num.fr/digithum/atelier/2017/ 
 
https://transfers.huma-num.fr/digithum/atelier/2017/2_abiteboul.php
 

mardi 5 décembre 2017

Privacy and Bigdata @ Sciences Po

Ce soir, je participe à une conférence sur IA, Big data et privacy avec Rand Hindi présenté par Hugo Ruggieri, c'est ce soir en salle Eugène d'Eichtal au 27 rue St Guillaume ! Vous ne pouvez pas vous déplacer ou vous n'avez pas de place ? Pas de souci, vous pouvez suivre la conférence en direct sur https://lnkd.in/gKUTZGg ! Et poser toutes vos questions sur sli.do #galatia !

jeudi 23 novembre 2017

Namur, Angers, Paris, Oxford et Versailles

Un peu oublié de causer dans ce blog...
  1. 10 oct, ESAIP, Ecole d'ingénieur, Angers : Le temps des Algorithmes
  2. 7 nov, Paris : keynote et panel au 50 ans d'Inria : Algorithmes, données et vie privée
  3. Issues in Ethical Data Management
    1. 9 oct., International Symposium on Principles and Practice of Declarative Programming, Namur
    2. 14 nov, Oxford : Computer science seminar  
    3. 21 nov, Versailles :keynote and panel au European Big Data Value Forum
Video in English on the topic from ETAPS: https://www.youtube.com/watch?v=a_RBsEWGAUM

Vidéo en français sur le sujet au 50 ans d'Inria (vers 4':30) : https://www.youtube.com/watch?v=NeCokuYDnAM

samedi 28 octobre 2017

Ecriture inclusive et académie

La sortie de l'Académie française contre l'écriture inclusive était sexiste et pathétique, profondément irritante de par son archaïsme.

Un article de Langue sauce piquante raconte assez bien avec des références utiles, et dit :

L’Académie est un astre mort, elle n’a heureusement plus de pouvoir de nuisance. Rappelons que la Révolution l’avait dissoute à juste titre, et que Napoléon l’a ressuscitée, comme beaucoup d’oripeaux de l’Ancien Régime. Rappelons aussi que son rôle prescrit par la monarchie était de publier une grammaire, ce qu’elle n’a jamais été capable de faire, et de renouveler son dictionnaire périodiquement, ce dont elle se montre incapable. La « Compagnie », c’est surtout celle des bras cassés.

A titre personnel, je ne suis pas un grand fan de l'écriture inclusive que je trouve un peu lourde. (C'est peut-être juste une question d'habitude ; on s'y fait). Mais il existe plein d'autres pistes que l'Académie française se garde bien de considérer comme la féminisation des noms de métiers. J'aime  ce qui commence à se faire dans le monde anglo-saxon. Par exemple, quand vous parlez d'un.e utilisateur.rice, un coup vous le conjuguez au masculin, un coup au féminin. Et j'adore la règle de proximité que l'académie a remplacée par la règle absurde "le masculin l'emporte sur le féminin" : Sarah et Jean sont des étudiants mais Jean et Sarah sont des étudiantes.

L'académie des Sciences, dont je fais partie, mérite aussi son lot de critiques :
  • peu de femmes, et incapacité à affronter ce problème. Êtes-vous sexistes messieurs les académicien.ne.s ?
  • peu de scientifiques des nouvelles sciences, comme l'informatique, les différentes disciplines défendant leur pré-carré.
  • peu de jeunes scientifiques à cause de la règle absurde que vous devenez académicien.ne à vie.
 Serge Abiteboul

Le monde numérique a vraiment besoin d'être inclusif à plusieurs titres (ref: https://cnnumerique.fr/inclusion toujours d'actualité), y compris de permettre à chacune et chacun de s'y sentir bien, avec fraternité, à égalité, en liberté. C'est pour ces raisons que la question du "genre" est essentielle pour binaire.

Les éditeurs 

jeudi 28 septembre 2017

mercredi 27 septembre 2017

Bêtise bloguera

Bêtise bloguera en pdf : télécharger.  
  1. Fanny Ardant et moi
  2. Que reste-t-il de nos amours ?
  3. Gare au gorille
  4. Marinella
  5. Cette année-là  
  6. Lune ma banlieue (sur binaire.blog.lemonde.fr)
  7. Il pleut sur Knokke-le-Zoute
Si vous les appréciez ces textes, n'oubliez pas de les partager
Ces livres pourraient vous intéresser :


chez votre libraire

chez Publie.net

chez Lulu.com.

chez votre libraire

PAP 2017 et autres présentations en septembre


Conseil Général de l’Économie : Cyber-résiliance, avec Didier Remy, Inria, 9 septembre 2017

Ligue des Droits de l'Homme : Présentation sur Big data, Algorithmes, Intelligence artificielle, c’est quoi ? à la réunion sur Big data, algorithmes et risques de discriminations, l’exemple de l’assurance, LDH, rue Marcadet, Paris, 17 septembre 2017

PAP 2017 Conférence invitée sur Personal Knowledge Management Systems à la 1st International Workshop on Personal Analytics and Privacy (In conjunction with ECML PKDD 2017), Skopje, Macedonia, Monday 18t Septembre 2017 

Conseil scientifique de l'INS2I : L'éthique des algorithmes, 25 septembre 2017

Centre de recherche de l'école des officiers de la gendarmerie nationale : présentation Quel monde construire ? sur aux Ateliers « Algorithmes prédictifs : quels enjeux éthiques et juridiques ? », École Militaire, mardi 26 septembre 2017







   

samedi 23 septembre 2017

Adieu Maurice

Deux géants de l’informatique :
Maurice Nivat (à droite) et David Harel,
lors d’un interview de David pour le blog Binaire, CC S. Abiteboul

J’étais doctorant aux Etats-Unis quand j’ai rencontré Maurice Nivat pour la première fois. C’était à Santa Barbara, en 1979 je crois, pour un séminaire sur la théorie des langages, alors la branche peut-être la plus active de l’informatique théorique. Il y avait quelque chose de surréaliste à croiser dans les couloirs des Euler,  des Newton, des Poincaré des temps présents : Jeff Ullman, Sheila Greibach et… Maurice Nivat, les pionniers de la théorie des langages et des automates. Assis au fond de la salle, ses questions pointues pouvaient terroriser certains conférenciers. Fumer une cigarette en discutant avec lui dans un des salons de l’hôtel a été pour moi un grand moment.

Maurice a participé à la construction de la communauté de recherche européenne en informatique. Il est le père du domaine en France, en particulier, pour ce qui est de la théorie. On a parfois reproché à l’informatique théorique française d’avoir été trop tournée sur elle même, sur ses sujets phares. Ce n’est pas la faute de Maurice. Quand je suis rentré des US dans les années 80, je travaillais sur la théorie des bases de données. Le sujet l’intéressait et nous avons organisé avec lui et Georges Gardarin un séminaire essentiellement pour attirer certains de ses anciens étudiants vers ce nouveau domaine. Il ne se contentait pas de labourer son territoire de confort.

J’ai plus tard côtoyé le Maurice « militant de l’enseignement de l’informatique ». Je suis tombé sur le sujet par hasard, parce qu’il fallait un académicien dans un comité. Maurice m’a rapidement contaminé – il savait être terriblement convaincant. Nous avons travaillé d’arrache-pied avec d’autres comme Gilles Dowek et Gérard Berry, sur des textes, dans des groupes comme le K12. Que de discussions acharnées, de moments de découragement, d’engueulades parfois, et le bonheur de voir émerger une pensée collective, de voir ces idées progresser dans la société.

Plus récemment, j’ai la chance de pouvoir dire qu’il était devenu un ami. Je n’oublierai jamais par exemple cette discussion devant une bière, dans un café près de la Gare du Nord, où nous avons parlé de tout, de son travail associatif pour la sauvegarde du patrimoine rural, de la vie, de la religion… Et comment oublier les moments dans sa maison d’Attainville, parfois avec son épouse, Paule, autour de thés ? La maladie commençait son travail de sape.

Ce que je retiens surtout de Maurice : l’intensité dans la recherche, dans la vie, dans son humanisme intransigeant, en tout.

Adieu Maurice. Tu vas manquer.

samedi 9 septembre 2017

Data, responsibly à Gênes

Summer school on Extending Database Technology, Genova, September 2017

Data Responsibly, Serge Abiteboul, Inria, and Julia Stoyanovich, Drexel University


vendredi 23 juin 2017

Difficultés de la gestion éthique des données

Keynote à Voxxa Days à Luxembourg

Video : https://www.youtube.com/watch?v=r5fwb8C0jtQ&list=PL4PrrYCV-zckBjMEzVScrs-BRCgUs2AOZ&index=2

Éthique de la recherche en apprentissage machine

La Cerna publie un rapport sur l'Éthique de la recherche en apprentissage machine

Le document complet

Le plan

  • Préambule
  • Composition du groupe de travail et personnalités auditionnées
  • Introduction
  • I. Qu’est-ce que l’apprentissage machine ?
  • II. Exemples d’applications de l’apprentissage machine
  • III. Questions éthiques
  • IV. Les préconisations sur les systèmes apprenants en six thèmes
    • Les données des systèmes d’apprentissage
    • L’autonomie des systèmes apprenants
    • L’explicabilité des systèmes d’apprentissage et leur évaluation
    • Les décisions des systèmes d’apprentissage
    • Le consentement lors de l’apprentissage machine
    • La responsabilité dans les relations homme-machine apprenantes
  • V. Contexte national et international
  • VI. Conclusion
  • VII. Liste des préconisations

Le préambule

Dans le numérique, le foisonnement et la rapidité de déploiement des usages issus de l’innovation contribuent à la complexité de l’interaction entre l’offre technologique et l’appropriation par la société, et réduit de ce fait la portée des prévisions scientifiques sur les conséquences de la recherche. Cette relative imprévisibilité des usages ne doit pas dédouaner les scientifiques, mais doit au contraire motiver la réflexion éthique et la recherche d’attitudes et de méthodes adaptées. En effet les chercheurs doivent avoir à l’esprit que leurs travaux contribuent de facto à transformer la société et peut-être l’Homme, comme l’ont fait beaucoup d’outils et de techniques depuis des millénaires, même si ce processus n’est pas toujours prévisible. Ainsi si l’on ne saurait attribuer aux seuls chercheurs la responsabilité de l’impact potentiel de leurs travaux, ceux-ci doivent être conscients qu’ils sont partie prenante d’une responsabilité collective. Le monde de la recherche doit organiser en son sein et d’une manière transdisciplinaire la prise en compte de la dimension éthique, et éclairer ses choix vis-à-vis de la société en contribuant aux débats publics, afin que la science demeure un facteur de progrès et que les croyances infondées et l’irrationnel ne conduisent pas à une défiance à son égard. Dans ce contexte, les réflexions de la CERNA - dont la vocation est de se prononcer sur l’éthique de la recherche en sciences et technologies du numérique - visent à inciter et aider les chercheurs à la vigilance éthique « chemin faisant » plutôt qu’à émettre des prescriptions normatives qui seraient vite obsolètes. Elles n’envisagent que des perspectives plausibles du point de vue scientifique, afin de ne pas nourrir la confusion avec ce qui relève de la science-fiction.
Conçu dans un esprit pratique en premier lieu à l'attention des chercheurs et développeurs dans le numérique, le document aborde les questions sous l'angle des sciences et technologies. Des questions de société que le concepteur doit avoir à l'esprit sont évoquées sans être approfondies. Le présent travail n'est qu'une contribution à une réflexion qui doit être plus vaste au sein du monde de la recherche, notamment avec les sciences humaines et sociales, et au niveau de la société toute entière, comme l'évoque la conclusion.

Fondation Blaise Pascal

La Fondation Blaise Pascal a pour vocation de promouvoir, soutenir, développer et pérenniser les actions de médiation scientifique en mathématiques et informatique à destination de tout citoyen.

Une ambition : réenchanter les mathématiques et l'informatique
Cette fondation a pour ambition de changer la perception de ces disciplines en donnant envie aux jeunes d'investir ces connaissances fondamentales.

La Fondation Blaise Pascal a été créée sous égide de la Fondation pour l’Université de Lyon, le 14 novembre 2016. Les fondateurs sont le CNRS et l’Université de Lyon.

La Fondation Blaise Pascal constitue la mise en oeuvre de la troisième phase du projet Cap'Maths.

--

Isabelle GUERIN-LASSOUS (Université Lyon 1) est déléguée générale

Stéphane GAUSSENT (Université Jean Monnet, Saint-Étienne) est président du conseil scientifique

J'ai l'honneur de participer à cette fondation comme président du conseil stratégique.

jeudi 15 juin 2017

Vidéos de la Conférence Éthique et numérique à l'Académie des sciences

Vidéos de la conférence-débat à l'académie des sciences du
  • Mardi 23 mai 2017 de 14h30 à 16h30
  • Grande salle des séances de l’Institut de France
  • 23, quai de Conti, 75006 Paris 
Éthique numérique ? Entre programme et apprentissage, Milad Douehi
Éthique et algorithmes, Gilles Dowek
Éthique et données, Serge Abiteboul
Éthique en apprentissage machine, Laurence Devillers

mardi 6 juin 2017

Séminaire Nasse : Algos et concurrence

SÉMINAIRE PHILIPPE NASSE
Algorithmes et concurrence
Mardi 6 juin 2017, Ministère de l’Économie et des Finances
  • Serge Abiteboul, directeur de recherche à l'Institut national de recherche en  informatique et automatique (Inria), ENS Paris, membre de l’Académie des  sciences
  • Thierry Pénard, professeur d'économie à l'Université de Rennes 1 et chercheur au CREM (CNRS)
  • Jérôme Philippe, économiste, avocat associé chez Freshfields Bruckhaus Deringer
Débat animé par Emmanuel Combe, Vice-Président de l’Autorité de la concurrence

samedi 3 juin 2017

Le temps des Algorithmes



flyer

Sélectionné 

  • pour le prix La Science se livre 2018
  • pour le prix Le goût des sciences 2017
  • pour le prix Roberval 2017, catégorie Grand Public
  • pour le prix Tangente des lycéens 2018. 

La presse écrite parle de nous - merci 

Début de l'article de Michel Serres

 La radio/podcast aussi - merci 

Citations d'articles pas en accès ouvert

  • S'en saisissant, les chercheurs en informatique Serge Abiteboul et Gilles Dowek nous livrent ici un ouvrage à la portée de tous, aussi intéressant quand il retrace l'histoire de ce « premier outil à la mesure des aspirations humaines » que quand il en anticipe les développement futurs. Yann Verdo, Les Échos  
  • ... nous proposent une réflexion générale sur notre époque, marquée par ces calculs qui se glissent dans tous les ordinateurs. TB. Passionnant. La Liberté. Suisse
  • Cet ouvrage peut être lu a partir du lycée, C.M., Inter CDI 

Et aussi le Web - merci aussi - par exemple

Le mot du Libraire, Pierre Morize, La lettre des Fous de sciences, Mars à Août 2017

Et des présentations publiques


Terra Data


 

Terra Data,  Valérie Peugeot et Serge Abiteboul

  flyer


Sélectionné
  • pour le prix Roberval 2017, catégorie Grand Public

La presse écrite parle de nous - merci 

  1. Comment maîtriser nos données numériques ? Jactive.ouest-france.fr, Anne-Flore Hervé, Octobre 2017 
  2. Terra Data : qu’allons-nous faire des données numériques ? Contrepoint, Farid Gueham, Octobre 2017
  3. La planète des données, Bertrand Lemaire, CIO, 26/03/2017
  4. Données, Ô données, dites-moi mon avenir !, Les Echos, Jacques Henno, avril 2017. 
  5. Les données numériques, un continent à explorer, Sciences et Avenir, 5/4/17
  6. Terra data, nos vies à l'ère du numérique, Usine digitale, 3/4:2017
  7. Terra data : tout savoir sur le big data à la Cité des Sciences à Paris !, NousVousIls, Avril 2017
  8. Il a assisté à la première démo de Google par Brin et Page, Frédérique Lemonnier, Fabernovel, Avril 2017
  9. Pour une utilisation responsable de la data, La gazette des communes des départements des régions, 15/21 Mai 17 
  10. Voyage en Terre des Données, David Larousserie, Le Monde, Sciences et Médecine, 17/5/2017 
  11. Une exposition à la Cité des Sciences, La Nouvelle République, 20/5//2017
  12. Serge Abiteboul, Par delà des données, La Nouvelle République, Loir-et-Cher - Romorantin-Lanthenay, 20/5//2017  
  13. Data scientist est un métier qui demande énormément de neurones, Marie Miller, Le Monde Campus 17/5/2017   
  14. Des choix de société s'imposent pour l'avenir de nos données, Clémence Jost, Archimag, juin 2017
  15. Maitriser les flux de données : entre performance et éthique, Dominique Herbert, Best Practices, Biblio, Juin 2017
  16. Découvertes, Science Magazine Août-Septembre 2017.
  17. Déconnectez, Blog Binaire, Août 2017.
  18. Terra Data, EpiNet, Septembre 2017
  19. Terra Data, Educavox, Septembre 2017

La radio/podcast aussi - merci 

  1. Autour de la question, Simon Rozé, RFI, 2/5/2017
  2. Nouveau monde. N'ayez pas peur des algorithmes, France Info, 30/7/17, interview de S. Abiteboul par Jérôme Colombain 
  3. ReVue D'actu, France 3 Régions, 1er Août 2017

Aussi des présentations publiques

Des sites de la Toile

Exposition Terra Data, Nos vies à l'heure du numérique


https://www.youtube.com/watch?v=qqvsiTUJy7k&feature=youtu.be



mercredi 31 mai 2017

Big data et recommandation @ Cité des sciences

Aucun texte alternatif disponible.

La communauté scientifique face au renseignement @ Ecole Militaire

Je participe à l'organisation de ce colloque le 12 juin à l’École Militaire.

Programme

8h30 Accueil
9h00 Ouverture

9h15 Introduction générale

  • Edgar MORIN (sous réserve) 
  • Alain BRAVO

9h30 Les rapports entre les sciences et le renseignement à travers le XXème siècle

Présidence : M. Pascal GRISET
  • David AUBIN - Sciences et renseignement : retour historique depuis la 1ère guerre mondiale 
  • Ksenia TATARCHENKO - Coopérations scientifiques entre Russie/France/USA pendant la Guerre Froide 
  • Simone TURCHETTI - Environnement, sciences et renseignement

11h15 La surveillance en temps réel

Présidence : M. Serge ABITEBOUL
  • Louis DUBERTRET - Comment traitons-nous les sujets éthiques au sein de l'académie des technologies? L'exemple du Big Data
  • Daniel LE METAYER - Anonymisation et respect de la vie privée
  • Emmanuel PIETRIGA - Visualisation et analyse collaborative de masses de données sur un mur d'écran très haute résolution
12h45 Intersession

14h00 La sécurité à travers les sciences

Présidence : M. François MORAIN
  • François MORAIN - Cryptologie : l'apport des sciences 
  • Nozha BOUJEMAA - Transparence et équité des algorithmes 
  • Eric FREYSSINET -  Lutte contre les botnets : comprendre et échanger

15h45 Le renseignement grâce à l'innovation

Présidence : M. Serge TISSERON
  • David Vissiere : témoignage d’une start up : Sysnav
  • Grégoire BIETTE - Lutte contre la cybercriminalité par analyse de la Blockchain
  • Lorraine TOURNYOL DU CLOS - L’Intelligence Campus à la direction du renseignement militaire
17h30 Conclusions
Patrick PAILLOUX - Le renseignement face aux défis des vulnérabilités numériques

samedi 27 mai 2017

Le théorème d’Abiteboul-Vianu

Tout ce que vous voulez savoir sur ce théorème et plus important ce que veut dire complexité en temps et espace

Arthur Milchior à podcastscience : http://www.podcastscience.fm/emission/2017/05/24/podcast-science-295-le-theoreme-dabiteboul-vianu/
Mercredi 26 avril – Dossier de Arthur Milchior du podcast Trajectoires



Comment sait on si un problème informatique est vraiment complexe ? Parfois, on a des solutions qui coûtent chères (en temps de calcul, en espace mémoire, ou autre). Alors on continue de chercher des solutions, moins chères. Mais, rarement pour l’instant, on sait prouver qu’on a atteint l’optimale. La complexité computationnelle, une branche de l’informatique fondamentale, cherche ce qu’on peut dire des solutions optimales — que cette solution soit connue ou non aujourd’hui.

Les informathématiciens ont développés énormément de techniques tarabiscotés pour attaquer ce problème. En particulier, en 1991, Serge Abiteboul (invité du Podcast #266) et Victor Vianu ont publié le théorème d’Abiteboul-Vianu. Celui-dit donne une piste assez surprenante qui permettra peut-être un jour de montrer que certains problème ne pourront jamais être résolu rapidement. Ce théorème va servir de prétexte à Arthur Milchior (déjà venu parler de Calculabilité dans le podcast #290) pour vous faire découvrir ce domaine de recherche de l’informatique fondamentale.

» RDV en ligne le mercredi 26 avril 2017 à 20h30 sur live.podcastscience.fm/

mercredi 24 mai 2017

Le Conseil national du numérique a un rôle important à jouer dans notre démocratie

Je suis signataire d'un manifeste publié dans Les Echos du 24 mai 2017.

Au moment de l’installation du nouveau Gouvernement, 70 personnalités du numérique — actuels et anciens membres du CNNum — ont signé un manifeste pour interpeller l’exécutif sur l'urgence d'une politique publique à la hauteur de la transformation numérique du pays.
Dans les prochaines semaines le Gouvernement va devoir prendre des décisions importantes, à la fois sur l’organisation de l’appareil d’État et sur les grandes orientations de la transformation numérique. Le CNNum, par sa composition, son rôle particulier dans le paysage institutionnel et sa capacité à mobiliser l’écosystème numérique, peut contribuer à la co-construction de ces orientations. Le manifeste est un appel du pied dans ce sens.
Cette profession de foi est aussi l’occasion pour le Conseil d’affirmer sa volonté de renforcer son impact au niveau européen. Données, plateformes numériques, intelligence artificielle… tous ces sujets sont au cœur de la réflexion de la mandature actuelle. Le CNNum prendra notamment appui sur le socle des relations nouées avec son homologue allemand, afin de permettre un dialogue européen constructif sur les perspectives de la transformation numérique.
Ce manifeste a enfin vocation à être vivant et à évoluer avec le temps. Nous souhaitons renforcer notre rôle de plateforme d’échange à destination de l’écosystème et des citoyens. Nous organiserons dans les prochaines semaines un large événement réunissant plusieurs représentants de l’écosystème autour des questions de transformation numérique du pays..




vendredi 12 mai 2017

Pour une intelligence artificielle maîtrisée, utile et démystifiée

Rapport d'information de M. Claude DE GANAY, député et Mme Dominique GILLOT, sénatrice, fait au nom de l'Office parlementaire d'évaluation des choix scientifiques et technologiques n° 464 tome II (2016-2017) - 15 mars 2017

vendredi 28 avril 2017

Les transformations du travail et de l'économie

Les transformations du travail et de l'économie, avec Gilles Dowek, Séminaire "Histoire économique : État, entreprises et marchés", à l'EHESS, CRH-GrHEco, 28/4/2017

And also 26/4/2017, The European Joint Conferences on Theory and Practice of Software (ETAPS)


Unifying Public Lecture : Issues in Ethical Data Management

Data science holds incredible promise of improving people's lives, accelerating scientific discovery and innovation, and bringing about positive societal change. Yet, if not used responsibly, this technology can propel economic inequality, destabilize global markets and affirm systemic bias. In this talk, we consider issues such as violation of data privacy, or biases in data analysis. We discuss desirable properties in data analysis such as fairness, transparency, or diversity. A goal of the talk is to draw the attention of the computer science community to the important emerging subject of responsible data management and analysis. We will present our perspective on the issue, and motivate research directions.

Les algorithmes : un outil neutre

Académie des sciences et techniques comptables et financières, avec Gilles Dowek : la video

mercredi 26 avril 2017

Il a assisté à la première démo de Google par Brin et Page

`
Frédérique Lemonnier, FABERNOVEL

English version 

Nous sommes allés à la rencontre de Serge Abiteboul, chercheur et informaticien français à Inria et à l'ENS, ancien titulaire de la Chaire d’informatique et Sciences Numériques du Collège de France, récemment co-auteur avec Gilles Dowek du livre « Le temps des algorithmes », et avec Valérie Peugeot de « Terra data ». Son parcours et son histoire atypiques nous ont bluffés. Serge Abiteboul a vécu le Stanford de Larry Page et Sergey Brin à la fin des années 90. Dans cette interview il nous raconte cette époque et la “révolution de pensée” qu’a permis l’arrivée des algorithmes. Une révolution que nous craignons et aimons à la fois et qui n’a pas fini de se développer et de nous étonner.

Retrouvez l'entretien  - merci Frédérique

Photo Frédérique Lemonnier - les équations ne sont pas de moi :)

mercredi 19 avril 2017

Les enjeux scientifiques de l'éthique du numérique

Conférence-débat à l'académie des sciences
  • Mardi 23 mai 2017 de 14h30 à 16h30
  • Grande salle des séances de l’Institut de France
  • 23, quai de Conti, 75006 Paris 
Éthique numérique ? Entre programme et apprentissage, Milad Douehi
Éthique et algorithmes, Gilles Dowek
Éthique et données, Serge Abiteboul
Éthique en apprentissage machine, Laurence Devillers

 Consulter le programme

Big Data et recommandations : menace ou opportunité ?

Projection suivie d’une intervention du réalisateur Thibaut Sève, puis d’un débat. Avec Serge Abiteboul, Milad Doueihi, Édouard Geffray, et Emmanuelle Jardat.



vendredi 24 mars 2017

EDBT, Headwork...

Panel at the Extending Database Conference, in Venice, Italy. Participation to the panel : Database Technology and Behavior, Security, Ethics, Rights and Duties of Citizens

Participation to the ANR project Headwork; http://headwork.gforge.inria.fr

 Crowdsourcing relies on potentially huge numbers of on-line partic- ipants to resolve data acquisition or analysis tasks. It is an exploding area that impacts various domains, ranging from scientific knowledge enrichment to market analysis support. But currently, existing crowd platforms rely mostly on low level programming paradigms, rigid data models and poor participant profiles, which yields severe limitations. The low- level nature of existing solutions prevents the design of complex data acquisition workflows, that could be executed, composed, searched and even be proposed by participants them- selves. Taking into account the quality, uncertainty, inconsistency and representativeness of participant contributions is still an open problem. Methods for assigning a task to the correct participant according to his trust, motivation and expertise, automatically improving crowd execution time, computing optimal participant rewards, are missing. Similarly, usual crowd campaigns produce isolated and rigid data sets: A flexible and common data model for the produced knowledge about data and participants could allow participative knowledge acquisition. To overcome these challenges, Headwork will define:
  • Rich workflow, participant, data and knowledge models to capture various kind of crowd applications with complex data acquisition tasks and human specificities
  • Methods for deploying, verifying, optimizing, but also monitoring and adapting crowd- based workflow executions at run time.

Partners

To reach its goals, Headwork will rely on two experts of large participative knowledge acquisition platforms
  • Cesco (Musée National d'Histoire Naturelle)
  • FouleFactory
  • Valda (INRIA Paris)
  • Druid (Rennes 1)
  • Links (Inria-Lille)
  • Sumo (Inria-Bretagne)
 

vendredi 17 mars 2017

Big data and Law

Presentation at the conference on "Law and Big Data: How Information Analytics Will Change the Law"
March 17th, 2017, Palais du Luxembourg, Paris

Vidéo



samedi 11 mars 2017

Fondation Sopra-Steria, Prix étudiant

Participation au jury du prix. Des projets super sympas.

Participation au comité éditorial de "Les Big Data à découvert", CNRS édition, sous la direction de Mokrane Bouzeghoub et Rémy Mosseri
  • le livre est plus intéressant que son titre 
  • avec "L'analyse de données, dérives et bonnes pratiques : écrit avec Julia Stoyanovich de Drexel U.

vendredi 3 mars 2017

Algorithmes, données numériques et gouvernement

Présentations dans le cadre d'un séminaire à France stratégie avec Dominique Cardon sur : Diffusion de l’information : quels enjeux démocratiques ?

mercredi 22 février 2017

Soirée Gamma à Boston Consulting Group

Mardi 21 février 2017 : Les données hier et demain

Aussi des présentations de Francis Bach, Fabien Gandon (Inria) et Thomas Lewiner (BCG)

mercredi 25 janvier 2017

Avec tout le respect dû à la Cnil...


La Cnil lance un vaste débat public sur les algorithmes.  On s'en réjouit. Mais un texte utilisé par l'IFOP pour un sondage, repris dans un débat organisé par la Cnil inquiète. Une capture d'écran (merci @IgorCarron) : 

La définition accumule les imprécisions, mélange tout. Sapristi ! Un algorithme n'est pas une formule mathématique : ce n'est pas une formule, et ce n'est pas des maths. Modèles statistiques ? Diable pourquoi ? Ils élaborent... Diantre, oui. Mais il font tant d'autres choses...

Quand les algorithmes deviennent aussi importants dans nos vies, quand l’État s'en inquiète au point de vouloir les réguler, il faudrait faire attention à ce qu'on dit, nous tous et en particulier, la CNIL. La Société informatique de France a proposé une définition de l'informatique : Informatique - Quèsaco ?

Et puis cela vient à point pour vous conseiller le livre qui va enfin vous expliquer simplement ce que sont les algorithmes : Le temps des Algorithmes, Le Pommier, 26/01/2017.

Voir justement : Qu’est-ce qu’un algorithme? par Annabelle Laurent, 20minutes.fr, 26/01/2017

lundi 23 janvier 2017

Mooc Bador -- Saison 2

A la demande générale, le Mooc Bador chez Fun :

Bases de données relationnelles : Comprendre pour maîtriser 

démarre une deuxième saison.

Co-starring : Serge Abiteboul, Benjamin Nguyen et Philippe Rigaux

Plus de 8000 inscrits pour la Saison 1. Déjà près de 6000 en Saison 2. Comprenez pour maîtriser !

vendredi 20 janvier 2017

L'intelligence artificielle au Sénat

Participation à une audition publique sur l'intelligence artificielle organisée par l'OPECST,  19 janvier 2017
Aspects éthiques dans le cadre des données massives
Bientôt sur http://www.senat.fr/opecst

Vidéo : vers 18:07