lundi 5 novembre 2018

La boîte à chaussures, dépositaire de notre mémoire

Comment notre patrimoine littéraire a-t-il traversé les siècles ? Le contenu d'un livre - une suite de caractères (oubliant pour simplifier les enluminures, la texture, l'odeur du papier...) - est imprimé sur des supports conservés dans des bibliothèques. Une copie peut « disparaître », une bibliothèque être inondée, un tyran décider de faire brûler toutes les copies d'un ouvrage dans un espace géographique particulier... tant qu'une seule copie subsiste, le livre est sauvé ; on peut le répliquer. C'est ce seul coût de réplication qui limite. Si nous perdons le contenu d'un livre, ce ne peut être que par négligence, par absence d'intérêt. Au contraire, une information numérique - un livre, une image, une vidéo... - peut être stockée et reproduite massivement à coût presque nul. Elle peut être dispersée dans l'espace pour la préserver du feu, de l'eau, des tyrans... Alors pourquoi semble-t-il si difficile de sauvegarder notre mémoire numérique ?
D'abord, les formats évoluent. Par exemple, nous avons des vidéos des premiers jours de nos enfants en VHS et nous ne pouvons plus les visionner. Les solutions existent pourtant, comme celle d'utiliser un programme qui transforme un ancien format en un plus récent pour lequel nous avons un lecteur. Un autre problème est que les supports standards actuels d'information ont des durées de vie relativement courtes (de quelques années à quelques dizaines d'années), typiquement moins que les tablettes sumériennes ou le papier. Pour surmonter cette difficulté, c'est simple, il suffit de répliquer régulièrement l'information sur de nouveaux supports afin de garantir en permanence l'existence d'au moins une copie complète - tout cela demande des efforts. Si elle n'est pas totalement gratuite, la préservation d'une information numérique est néanmoins possible et bien moins onéreuse que celle de son analogue physique.
Où se situe donc vraiment le problème ? Dans le déluge de données qui nous force à choisir ce que nous voulons préserver : il nous est impossible de tout garder. On dit que si on vidait tous les disques de la planète, tous les supports d'information le 31 décembre et que l'on commençait à les reremplir le jour suivant sans plus rien effacer, on n'aurait plus de place disponible avant la fin de l'année. L'hypermnésie n'est pas une option pour l'humanité. Elle ne l'est pas davantage pour chacun d'entre nous, parce que nous finirions par nous noyer dans un océan de données. Il nous faut choisir... et la tâche est laborieuse.

Hier, nous triions. Nous avions peut-être une boîte à chaussures où nous rangions nos photos les plus précieuses. Les plus organisés faisaient des albums. Aujourd'hui, où sont nos clichés ? Quelque part sur un compte Instagram ou Facebook, sur notre téléphone, sur un ordinateur, sur un disque externe... Les matériels s'abîment, se font voler, pirater. Le cloud nous aide en nous évitant une dépendance à des matériels spécifiques, mais nous nous y perdons aussi lorsque nous en avons plusieurs. Et un fournisseur peut décider qu'il n'archivera pas nos données au-delà de quelques années, sans que nous en ayons vraiment conscience. Nous changeons d'ordinateur, fermons un compte, le temps passe... et nous perdons des pans entiers de notre mémoire.

Que pouvons-nous y faire ? Rangeons dans une boîte à chaussures numérique ce à quoi nous tenons - nos photos numériques préférées, mais aussi les films, les textes, les livres... auxquels nous sommes attachés. Le coût : payer un prestataire de services pour garantir sa persistance, ou garder plusieurs copies de cette boîte et vérifier de temps en temps qu'un nombre suffisant d'entre elles sont fonctionnelles. Mais, surtout, il nous faut choisir ce que nous conservons. Les entreprises, les gouvernements, les archivistes de tous bords sont confrontés aux mêmes problèmes. La vraie difficulté, pour nous comme pour eux, est bien celle du choix de ce que nous voulons préserver. À terme, avec l'explosion du volume des données, nous n'avons pas le début d'une chance de nous en sortir sans l'appui des algorithmes. Le salut viendra d'assistants numériques qui se chargeront de préserver notre mémoire. En attendant, contentons-nous de gérer nos boîtes à chaussures numériques à la sueur de nos neurones.

Serge Abiteboul, Inria et ENS, Paris

Cet article est paru dans Le magazine La Recherche, N°532 • Février 2018

Académie, APL, IHEJ, Education au numérique @ Beyrouth

13 octobre, Speed Sciences @ Académie des sciences

18 octobre, présentation pour l'inauguration des nouveaux locaux d'APL

22 octobre, présentation à l'Institut des Hautes Études pour la Justice

2 novembre, présentation au symposium "Innovating technologies and their impacton eduction and the needed skills for future jobs in Mena region, Beirouth

mardi 23 octobre 2018

Internet : neutre mais pas trop ?

Titre : Internet : neutre mais pas trop ?
Intervenants : Serge Abiteboul - Benjamin Bayart - Mathilde Morineaux - Sébastien Soriano - Céline Loozen - Nicolas Martin
Lieu : Émission La méthode scientifique - France Culture
Date : septembre 2018
Durée : 58 min
Écouter sur le site de l'émission ou écouter le podcast

Retranscription verbatim par april

mardi 16 octobre 2018

Un robot dans la robe des juges

Les algorithmes exécutés par des ordinateurs sont entrés dans nos vies : ils nous conseillent des films, nous proposent des chemins pour nous rendre à notre prochain rendez-vous... Bientôt, ils conduiront nos voitures ou nous permettront de rester chez nous dans notre quatrième âge. En prenant autant d'importance, ils soulèvent des questionnements, des inquiétudes. Prenons un exemple frappant dans un domaine régalien, la justice. Aux États-Unis, le logiciel Compas assiste les juges pour décider de libérations conditionnelles, en évaluant le risque de possibles récidives - la décision de remise en liberté est strictement liée à la probabilité de récidive. L'algorithme assiste, mais ne décide pas. Oui, mais un juge aura-t-il le courage, ou la légèreté, de remettre un condamné en liberté contre l'avis du logiciel si l'on peut prouver que l'algorithme fait statistiquement de meilleures prédictions que les juges ?

La question est philosophique : y a-t-il des tâches de telles natures que les confier à des machines nous ferait perdre une part de notre humanité, des tâches qu'il faut leur interdire même si elles les réalisent mieux que nous ? Nous ne répondrons pas à cette question, mais relativisons son importance aujourd'hui. Si les algorithmes deviennent de plus en plus intelligents, ils sont loin de pouvoir, par exemple, remplacer les juges dans des cas encore plus complexes que celui de la libération conditionnelle aux États-Unis. Quand des algorithmes participent à la vie de la cité se pose également la question de leur responsabilité. Revenons sur le logiciel Compas. Il présente sur un juge l'avantage d'une certaine cohérence. Il a été montré notamment que les décisions des juges sont dépendantes de l'heure ; il vaut mieux passer après le repas qu'avant. Et celles des cours de justice, par exemple aux prud'hommes, varient énormément d'une chambre à une autre. Pas de cela avec les algorithmes ! Ils peuvent garantir une certaine cohérence.

Nous pourrions également espérer qu'ils soient plus « justes », qu'ils ne discriminent pas suivant les origines ethniques, le genre... Pourtant, des journalistes ont évalué les prédictions de Compas et découvert qu'il surestimait largement les risques de récidives des condamnés noirs. Des informaticiens racistes ? Pas vraiment, mais on ne sait pas écrire un algorithme qui prédise les récidives - la question est trop complexe. Alors on utilise un algorithme d'apprentissage automatique. On lui apprend le travail à réaliser en l'entraînant sur un grand volume de données de décisions de juges, à imiter des humains. Ce sont ces décisions, qui présentaient des biais raciaux, que Compas a reproduites. Il faut avoir conscience des problèmes que l'utilisation de programmes informatiques peut soulever, vérifier ces programmes et les données qui sont utilisées pour les « entraîner », surveiller leurs résultats.

Notre exemple nous a permis d'insister sur un aspect essentiel de la responsabilité : l'absence de biais, l'équité. La transparence en est un autre. Nous pouvons, par exemple, nous inquiéter de ce que Facebook fait de nos données personnelles dans une relative opacité. Nous pourrions aussi parler de la loyauté : faut-il accepter un service qui propose des restaurants en disant ne tenir compte que des avis de consommateurs et qui remonte en réalité dans sa liste de résultats les commerçants qui paient pour ça ? La responsabilité sociétale des algorithmes a nombre de facettes.

Les algorithmes peuvent nous permettre d'améliorer nos vies. Il faut corriger leurs défauts, combattre leurs biais inacceptables. Il peut s'avérer difficile de vérifier, d'expliquer leurs choix, s'ils proviennent de statistiques mettant en jeu des milliards d'opérations ou s'ils se basent sur des motifs complexes découverts par des algorithmes d'apprentissage. Pourtant, notre incompétence ne peut pas servir de justification pour autoriser le viol de principes moraux. Quand les effets des décisions sont sérieux, comme garder une personne incarcérée, sans doute vaut-il mieux attendre d'être certain du fonctionnement de l'algorithme, exiger qu'il explique ses choix et, bien sûr, faut-il pouvoir les contester.

Serge Abiteboul, Inria et ENS, Paris

Cet article est paru dans Le magazine La Recherche, N°531 • Janvier 2018

Le bot qui murmurait à l'oreille de la vieille dame




ça y est, le livre est publié par Le Pommier (octobre 2018)
disponible dans toutes les bonnes librairies
et bientôt en version électronique

La page du livre sur Le slow blog

La Poste, L'Oréal, Filfocs et Theconversation

9 octobre : IA @ La Poste, panel sur Données et IA

8 octobre : Prix L'Oréal-UNESCO Pour les Femmes et la Science, participation au jury et à la remise du prix

4 octobre : 7th French-Israeli Workshop on Foundations of Computer Science, présentation : Explanations and Transparency in Collaborative Workflows

2 octobre : soirée anniversaire de theconversation.fr

mercredi 5 septembre 2018

Internet : neutre mais pas trop ? sur France Q

Participation à La Méthode scientifique par Nicolas Martin, sur France Culture, 5 septembre 2018

Le podcast 

avec Benjamin Bayart, président de l’association Fonds de Défense de la Neutralité du Net, et co-fondateur de la Quadrature du Net.


Le titre du jour : Get off the Internet par Le Tigre

Micro 18 @ Neuchâtel, Suisse

keynote : Terra Data

1 septembre 2018 à Neuchâtel

mercredi 1 août 2018

Ils encouragent l'inculture du numérique


En juillet 2018, l’Assemblée Nationale a voté un article de loi qui « interdit, sauf disposition dérogatoire au règlement intérieur, l’usage des téléphones mobiles et autres moyens de communications dans les écoles et collèges de France ». On croit rêver ! Le problème en France tient, à mon avis, bien moins en une prétendue trop grande exposition au numérique des jeunes que dans la sous-exposition d’une part massive de la population, y compris ces mêmes jeunes. Le vrai sujet en France est l’éducation et la formation de tous à l’informatique et au numérique, à commencer par les millions de gosses qui en auraient besoin. 

mardi 10 juillet 2018

Pourquoi Internet doit rester neutre

Dans Libé et le Journal du CNRS : https://lejournal.cnrs.fr/billets/pourquoi-internet-doit-rester-neutre


 

En anglais : 
https://news.cnrs.fr/opinions/why-the-internet-must-remain-neutral

et dans une chronique du Monde (que pour les abonnés)


Assistants vocaux : « Nous ne pouvons confier nos vies à des machines »

Assistants vocaux : « Nous ne pouvons confier nos vies à des machines »

LE MONDE ECONOMIE | 26 juin 2018
Les logiciels dont nous disposons exigent, pour fonctionner, des volumes massifs de conversations, et donc de données personnelles, en particulier pour offrir des services personnalisés. ...Dans des pays totalitaires, cela représente des risques pour les citoyens, explique dans sa chronique...
« Exigeons que les informations publiées soient accompagnées de métadonnées »

« Exigeons que les informations publiées soient accompagnées de métadonnées »

LE MONDE | 3 avril 2018
Dans cette chronique, le chercheur en informatique Serge Abitboul, déplorant la viralité des « bobards » sur la Toile, milite pour que soit attaché à chaque information circulant sur le Web une origine....Transformations. Régulièrement, dans le monde du numérique, un nouveau terme s’impose, qui n’a...

mardi 3 juillet 2018

Congrés de philosophie des sciences à Nantes, et autres


4 juillet : Le temps des algorithmes, avec Gilles Dowek, RDV de midi DGESIP/DGRI, Ministère de l'Enseignement Supérieur et de la Recherche

4 juillet : Éducation et informatique, Apéro Tip Top CGénial, au lycée Chaptal, Paris

6 juillet : Les sciences questionnées par le numérique, 7ème Congrès de la Société de Philosophie des Sciences, Nantes

9 juillet : Reporters sans frontières

vendredi 29 juin 2018

Le bot qui murmurait à l'oreille de la vieille dame et autres nouvelles numériques

Annonce dans Livre Hebdo n° 1189 de juin 2018 de la parution en octobre de ce nouveau texte, un recueil de nouvelles de science-fiction :


mercredi 20 juin 2018

Un mois de juin bien varié en thématiques

6 juin : participation à la table ronde organisée par Isoc France, "Neutralité partout, pour tous" modérée par Lucien Castex avec (membre de l'assemblée nationale, et

12 juin : participation au Jury Bourses France L'Oréal-UNESCO Pour les Femmes et la Science. Des dossiers de jeunes femmes scientifiques brillantes.

14 juin : participation à un panel super sympa sur l'IA modéré par Tristan Nitot avec Roberto Di Cosmo (Software Heritage) et Sylvain Peuronnet. Pour l'anniversaire de Qwant.

18 juin : audition au Conseil de développement de la Métropole du Grand Paris sur la ville agile (smart city) ; avec une amie, Sophie Pène (Professeur en sciences de l'information à l'Univ. Paris Descartes)

20 juin : sur France Culture,  "l'éducation au codage et au numérique" dans l'émission, La méthode scientifique, avec Sophie de Quatrebarbes et Marine Roche (Passe ton code d’abord !)
21 juin : Economic Ideas Forum, Paris, participation au panel "The New Digital Economy and Ecosystem" avec Martin Bailey, (DG Connect, European Commission) et Gérard Pogorel (Professor of Economics and Management, Telecom ParisTech)

22 juin : CEA Saclay, invité par Alexei Grinbaum, présentation à l'Atelier LARSIM-ESNT, "What is (the) observable ?" (je vais parler d'analyse éthique de données)

jeudi 31 mai 2018

Visite à Hasselt, Belgique

30 mai : l'Université de Hasselt m'a décerné un Doctorat Honoris Causa
(je sais : c'est un peu ringard. Mais c'était sympa.)

Jarige UHasselt reikt 7 eredoctoraten uit

31 mai : à cette occasion, un Mini-Symposium, Big Data: Science, Industry, People
  • keynote sur Ethical data analysis

dimanche 27 mai 2018

Fête des libertés numériques : atelier Mes données (2)


Proposé avec Antoine Amarilli, David Montoya, et Fabian Suchanek

Pour ceux qui n'ont pas pu venir :

Le matériel pour l'atelier Mes données
  • Récupérer mes données de Facebook et Google
  • Effacer l’historique de navigation sur Google
  • Récupérer sa géolocalisation avec GPSLogger
  • Récupérer ses données avec l’outil Cozy
  • Utiliser Signal vs. SMS/WhatsApp
  • Dégooglisons avec Framasoft
  • Tor browser
  • Comment sécuriser mes données avec des backups
  • Bien choisir ses mots de passe
  • Comment garder ses mots de passe Garder ses mots de passe Lastpass 

Terra Data,   Serge Abiteboul et Valérie Peugeot



jeudi 24 mai 2018

Fête des libertés numériques : atelier Mes données

Atelier mes données

Le 25/05/2018
Horaires : 14h à 15h et de 15h à 16h
Lieu : Maison du Libre et des Communs - 226 rue Saint-Denis 75002 Paris
Atelier mes données à la Maison du Libre et des Communs. L’idée est de découvrir quelles données les services que nous utilisons ont de nous. Des exercices permettront de voir comment récupérer ses données de Lire la suite…

Jaine : Quelle culture numérique pour tous au 21ème siècle ?


JAINE-ac@rt 2018, l'innovation pédagogique et la créativité numérique se donnent rendez-vous à La Halle de la Villette le 23 mai 2018
conférences: quelle culture numérique pour tous au 21ème siècle ?
Serge ABITEBOUL, directeur de recherche à l'Inria et Thibaud HULIN, maître de conférences à Dijon et chercheur au CIMEOS

lundi 14 mai 2018

Données et éthique

Conférence-débat - Les enjeux scientifiques de l'éthique du numérique - Académie des sciences - Paris - Mai 2017

Texte de ma présentation sur Données et éthique