Le site de Serge - web site

mardi 26 novembre 2013

Avis du CNNUM sur l'inclusion numérique

Citoyens d'une société numérique
ACCÈS, LITTÉRATIE, MÉDIATIONS, POUVOIR D’AGIR :
POUR UNE NOUVELLE POLITIQUE D’INCLUSION

Quelques phrases en teaser :

L'e‐inclusion doit désormais prendre un sens positif, offensif. Le numérique peut se mettre au service d'une société plus équitable, plus juste, plus solidaire, plus participative...
Chaque personne doit pouvoir accéder à la littératie numérique, qui se définit comme « l'aptitude à comprendre et à utiliser le numérique dans la vie courante, à la maison, au travail et dans la collectivité en vue d’atteindre des buts personnels et d’étendre ses compétences et capacités ». Cet accès est à la fois un impératif moral et une nécessité économique.
Dans une société où les besoins d’accompagnement et de proximité se renouvellent sans cesse, nous devons installer des médiations durables qui s’appuient sur le numérique.
Chaque citoyen doit pouvoir disposer, gratuitement si nécessaire, d'un "trousseau numérique"
qui contient les éléments indispensables pour évoluer dans une société où la plupart des actes
de la vie courante s'appuient sur des dispositifs numériques. Ce trousseau peut comporter une
"domiciliation numérique", une identité certifiée par un agent public et rattachée à une adresse
e‐mail qui, elle, peut changer ; un espace de stockage en ligne des principaux documents
administratifs numérisés ; un numéro de téléphone et une messagerie, etc.
Déployer l’enseignement de la littératie numérique, depuis le primaire jusqu’au lycée, dans
toutes les filières. Cet enseignement doit inclure notamment la discipline informatique, mais
également toutes les autres composantes d’une véritable culture critique du monde
numérique.
...

Valérie Peugeot, Vice‐présidente du Conseil national du numérique, en charge du groupe de travail sur l’inclusion numérique

J'ai appris énormément en participant à ce groupe de travail, notamment à remettre en question des idées reçues. Je vous encourage à lire ce rapport. Oui, ce n'est qu'un rapport mais il peut aussi changer votre façon de penser le problème de l'inclusion numérique et celui de l'inclusion en général.

lundi 25 novembre 2013

Numérique: Grande cause nationale 2014 et 1024

Un collectif, à l'initiative de la CNIL, propose de faire de l'éducation au numérique une " Grande cause nationale " en 2014. Ça inclut bien sûr l'enseignement de l'informatique. Et là ça m'interpelle. Un anagramme de 2014, c'est 1024 = $2^{10}$ . Ce serait trop beau pour un tournant de l'enseignement de l'informatique...

Pub : 1024 est aussi le nom du bulletin de la Société Informatique de France.

mercredi 20 novembre 2013

The Web of tomorrow

Royal Society Milner Award Lecture
(Milner Awards - video)

Le plaisir (l'honneur) de bavarder avec Sir Tony Hoare, une star de l'informatique

We are more and more living within an ocean of machines, systems, objects that produce, exchange, and analyze information. Our world is changing and we have to adapt to the changes. This is the topic of this paper. We will make several assumptions, clearly arguable, about the future. First, we assume that the information will continue to be managed by many systems, i.e., that a unique company will not conquer all the information of the world, a dreadful future. Then, we assume that the various systems are intelligent in the sense that they produce and consume knowledge and not simply raw data. Finally, we assume that these systems are willing to exchange knowledge and collaborate to serve you (vs. capture you and keep you within islands of proprietary knowledge). Under such assumptions, how will access to information change? How will people’s relation to information evolve? What new challenges to computer systems is this raising? These are some of the questions we will try to address.

Perhaps, the main issue is “how to survive the information deluge”. From the point of view of the systems, the challenge is to select some information, to filter out some. The more information there is the more difficult it is to choose. For instance, indexing billions of Web pages is simple compared to selecting the links that appear on the first page of answers, which has become a business and even political issue.

A particular instance of the “what to select” problem is “what to keep for the future”. From this immaterial ocean of information, what will we leave to future generations? Technology comes to our rescue with the cost of information storage decreasing more rapidly that the meaningful information we produc. But we are still producing each year more data that we would be able to store using all the disks and tapes of the world. We have to select what to keep. The issue of keeping everything also arises, for a person. It is clearly not desirable for a person to live in a world knowing that all his actions, all his words, are recorded; one uses the term hypermnesia. Here again the difficulty is to choose what to select, what to filter out. The criteria may be very diverse: one may want to get ride of floods of unimportant items, but also prefer to erase a few important but traumatizing ones.

Some criteria to select information may be easy to evaluate: e.g., cost, size. Others are not: e.g., importance, timeliness, or quality. As a consequence, it is nontrivial for a system to predict what interests a user now, what may still interest her or what she may need in many years.

At the core of all the selection of information is its analysis to understand its semantics, its essence, its value, to extract knowledge. This is a problem almost as old as computer science. Very early, companies started collecting data and wanted to extract business value from it. With variations, these activities became popular under the names of data analytics, data mining, business intelligence, and more recently, big data… They typically involve the management of (growing) quantities of information, rely on complex algorithms and mathematics. From the point of view of a pure statistics, this may be somewhat disappointing because one often has to rely on very rough approximation and heuristics.

The difficulties raised by these tasks are well understood. They are grouped under the acronym 4V:

Volume: Huge quantities of information have to be analyzed. Their analysis requires the use of complex algorithms and heavy computer systems that rapidly reach their limits.
Velocity: Some of this information may change very rapidly (e.g., a GPS position, the stock market). One also has to manage flows of information from tweets, from censors.
Variety: From very structured data (e.g., formal knowledge) to less structured (e.g., images) have to be handled. Applications may choose to organize information in different ways, with different terminologies and languages. Instead of asking a user to adapt to the ontologies of the many systems she uses each day, we would like the systems to adapt to her ontology.
Veracity: the information is imprecise, uncertain. There are errors, contradictions. The information includes opinions, sentiments, and lies.

There are also issues of a mathematical logic flavor that are directly brought up by the management of knowledge:

· Where is the truth? People rarely publish that something is false, e.g., “Elvis was not French”, because there are too many false statements to state. But positive statements may be contradictory, e.g., Elvis is born in Tupelo, Mississippi, and he is born in Paris, France. This allows for instance defining quality and probability measures on the facts in different data sources. A human learns to make the difference between a newspaper and a tabloid. In the digital world, there are too many information sources, so machines have to help us separate the wheat from the chaff.

· Open vs. Closed world. In a classical database: everything that is not in the database is assumed to be false (closed world assumption). On the Web, if a system does not know a fact, this fact may be known by some other system out there, or not (open world assumption). Since, a system cannot bring all the world information locally, deciding whether a fact holds is complicated, which not surprisingly complicates reasoning.

The research is progressing to propose answers to these problems. But there are also issues that are not technical. In their professional and social interactions, people want to understand the information they receive? Knowledge used to be determined by religion. Then it was determined scientifically. Is it going to be determined now by machines? Will then the machines run everything as in fully automated factories, cars, match making, medical diagnosis, trading, killer drones, etc.

It may be preferable to let humans be in control. But the machines are already winning one fight, that for information. For business reasons, companies and governments are getting/keeping more and more information. They are exchanging this information, consolidating it, analyzing it to discover the little and big secrets of everyone. There are good reasons to accept this: with all the personal information, they can serve the world better. For instance, they can provide better movie recommendations, or they can better fight terrorism. But, this results in humans loosing control over their own information, over their privacy. This is clearly going to be one of the main issues in the years to come.

To conclude, suppose that all the technical problems have been fixed and that perfect search engine, perfect recommendation systems, perfect computer assistants are available that are even respecting the privacy of every individual. Would this be desirable? Perhaps system would have to going beyond that perfection to reintroduce serendipity.

Conclusion

The massive use of digital information has modified in depth all facets of our life: work, science, education, health, politics, etc. We will soon be living in a world surrounded by machines that acquire knowledge for us, remember knowledge for us, reason for us, communicate with other machines at a level unthinkable before. This raises a number of issues, such as: What will we do with that technology? Will we become smarter ? Will we become master or slave of the new technology? How can we get prepared to these changes? Computer science and digital humanities are at the cross road of these questions.

Reference

Sciences des données : de la logique du premier ordre à la Toile, S. Abiteboul, Collège de France, 2012

Il est maintenant possible de s'abonner à ce blog génial

Pour cela remplir la case: Follow by Email

Merci Christine pour cette suggestion.

jeudi 14 novembre 2013

Cours de bases de données gratuits

disponibles à http://abiteboul.com/teaching.html

Lili	Bases de données relationnelles avec Benjamin Nguyen et Yannick Le Bras
Poucette	Site du Collège de France
Alice	Database theory with Rick Hull and Victor Vianu
Jorge	Web data management with Ioana Manolescu, Philippe Rigaux, Marie-Christine Rousset, and Pierre Senellart

vendredi 8 novembre 2013

Et Inria est son prophète

Et Dieu créa l'Internet (Christian Huitema qui sait ce qu’il dit)

Inria est inventeur du numérique

Donc Inria est son prophète

Serge A. et Stéphane G. (s’ennuyant à un meeting)

jeudi 31 octobre 2013

Chercher sur le Web : juste un point fixe et quelques algorithmes

Un article

dans La brochure « Mathématiques, l'explosion continue », conçue par la Fondation Sciences Mathématiques de Paris (FSMP), la Société Française de Statistiques (SFdS), la Société de Mathématiques Appliquées et Industrielles (SMAI) et la Société Mathématique de France (SMF), a été réalisée grâce au soutien financier de Cap'Maths.

Le Web met à notre disposition une masse considérable d'information, plusieurs dizaines de milliards de documents. Sans les moteurs de recherche, ces systèmes de plus en plus sophistiqués qui nous aident à nous focaliser sur un petit nombre de pages, le Web ne serait qu'une poubelle à ciel ouvert, gigantesque et inutilisable. Le rôle de ces systèmes est de faire surgir de la masse des internautes une intelligence collective pour évaluer, classer, filtrer les informations. Comment les moteurs de recherche gèrent-ils ces volumes d'information véritablement phénoménaux? Comment aident-ils les utilisateurs à trouver ce qu'ils cherchent dans cette masse ? Retour sur un des plus beaux succès du Web.

Un déluge de données

Article avec Pierre Senellart dans Pour la science.
texte accessible sur Interstices

Numéro de Pour la science sur le Big bang numérique

Couverture du dernier numéro de Pour la Science

Couverture du dernier numéro de Pour la Science

lundi 7 octobre 2013

Apprenez leur le calame !

Préambule : comme beaucoup, je passe des heures chaque jour sur un clavier et je n'écris que très rarement à la main. Je ne sais pas si c'est mal, mais c'est comme ça.

Donc quand 45 états des USA décident d'abandonner l'écriture cursive - l'écriture attachée, ça m'interpelle. Entendez comme moi : ils enseignaient déjà l'utilisation du clavier. Les ricains sont des sauvages ! L'école suédoise donne des ipads aux gosses avant de leur apprendre l'écriture cursive, les vikings sont des barbares ! Heureusement, que la France défend la civilisation.

Et tout le monde - journalistes en tête - d'avoir sa petite idée sur les déficits cognitifs qui "résulteraient" de l'abandon de l'écriture cursive. C'est impressionnant comme les français sont au courant des futures recherches en science cognitive. Je n'ai pas entendu parler du handicap de taper avec deux doigts à longueur de journée... Peut-être que d'être ramollo de la frappe accélère le fonctionnement du cerveau ? Il faudrait lancer des recherches là-dessus ?

Je ne sais pas s'il faut abandonner l'enseignement de l'écriture cursive, s'il faut le remplacer par des cours de calligraphie, de pâte à modeler, ou de magie, pour développer l'agilité manuelle. Mais je me demande pourquoi le débat se focalise là-dessus et ignore une question : pourquoi n'enseigne-t-on toujours pas en France l'utilisation du clavier d'un ordinateur. On attend le grand retour du calame ?

Blog sur rue89: Au début de cette année, les nouveaux standards américains de l’enseignement ont été publiés par le ministère fédéral de l’Education, et acceptés par 45 des 50 Etats américains. Ils fixent le niveau de maths et d’anglais qu’un jeune doit avoir atteint à la fin du lycée. Plus rien en revanche sur la maîtrise de l’écriture, alors que le document précise bien qu’une bonne pratique du clavier d’un ordinateur doit être acquise à la fin du CM1.

mercredi 25 septembre 2013

L'impact du numérique dans nos vies ? Euh...

Interview pour Carlos Moreno.
J'ai répondu à 5 questions:

Pour vous, qu’est-ce que la révolution numérique ?
Selon vous, quel est l’impact du numérique dans nos vies actuelles ?
Quel sera l’impact du numérique dans nos vies d’ici 5 ans ?
Quels sont les domaines de recherche actuels les plus porteurs pour la ville ?
Pour vous qu’est-ce qu’une ville vivante et comment la favoriser ?

http://www.moreno-web.net/5-minutes-serge-abiteboul/

jeudi 12 septembre 2013

La parité au sénat académique de l'université Paris Saclay

Je sais ce n'est pas le sujet le plus passionnant au monde. Le contexte: le sénat académique vient d'être élu et patatras, la ministre balance de nouvelles règles pour sa composition/son élection. Quand on voit tout le taffe pour arriver à élire le sénat actuel, on rigole mais c'est désolant... Et puis la rumeur, c'est que les nouvelles règles sont débiles.
Vraiment ?

Les responsables d'unités n'ont plus de places réservées. Je n'avais pas compris pourquoi ils en avaient.
Seuls les titulaires de doctorats peuvent être électeurs. C'est une assemblée de chercheurs. Demander une thèse ou des publications de recherche parait raisonnable - ce n'était pas le cas pour le sénat actuel. Par contre, je connais d'excellents chercheurs sans thèse.
Les élections se font sur scrutin de listes paritaires. Quand j'ai fait remarqué qu'en observant le sénat actuel, imposer la parité était plutôt une bonne chose, le président du sénat m'a répondu qu'il n'y avait pas assez de femmes dans certaines disciplines. Sa réponse m'a conforté dans l'idée qu'imposer la parité était la bonne solution.

Donc, les nouvelles règles autant que je les comprenne vont à mon avis dans le bon sens...

mardi 10 septembre 2013

La fiscalité du Net au CNNUM

Ce n'est sûrement pas mon sujet préféré mais le résultat est intéressant:
Le CNNum a remis ce matin ses conclusions sur la fiscalité du numérique

A l’issue de ce travail, le CNN a voté un avis recommandant :

* une initiative immédiate au niveau international et infra-européen
* le renforcement de la transparence et des contrôles
* d’éviter la mise en œuvre unilatérale et immédiate d’une taxe nationale spécifique
* le déploiement d’une stratégie industrielle numérique européenne

Plus de détails sur http://www.cnnumerique.fr/avis-fiscalite/

mercredi 3 juillet 2013

Donnez-nous un moteur de recherche neutre...

Google a construit sa réputation avec un moteur de recherche neutre. Son PageRank vous donnait une vision impartiale de la popularité des pages. On pouvait regretter que cela ne soit que la popularité et que cela manque de sérendipité mais au moins c'était impartial. Depuis, le moteur a évolué et la part de cette vision "neutre" a diminué . Aujourd'hui, la notion de localité participe à la démolition des grands principes.

Il faut un moteur de recherche neutre. Et si ce n'est pas Google, Bing ou un des poids lourds existants, cela ouvre la porte à un challenger. Exalead ?

Voir: http://blog.tutorspree.com/post/54349646327/death-of-organic-search

mardi 2 juillet 2013

L'oeil de Washington (2)

L'affaire Snowden est pathétique. On savait que les états y compris le notre faisaient ce genre de surveillance sur Internet. Maîtrisent-ils vraiment ces technologies ? Google, Facebook ou Amazone savent surveiller/analyser des volumes énormes de données. Probablement pas les gouvernements ? Est-ce que cela me satisfait. Non !

Avec la surveillance et l'analyse des données de la Toile, on peut réaliser des trucs dingues comme de surveiller ses citoyens et perfectionner le concept d'état policier ou de surveiller les gouvernants (états et grandes entreprises) et construire une meilleure démocratie. Alors, on va faire quoi ?

Pour revenir à Snowden. S'il est reconduit aux Etats-Unis ou s'il finit dans un pays qui s'assoit sur les droits de l'Internet, c'est un échec de la démocratie. Il faut qu'il trouve refuge en Europe pour redorer le blason de nos démocraties.

Un avis de Fleur Pellerin

vendredi 7 juin 2013

L'oeil de Washington

Les organismes gouvernementaux américains auraient des accès directs aux données des géants du Web

http://www.guardian.co.uk/world/2013/jun/07/prism-tech-giants-shock-nsa-data-mining

Mes données Facebook intéressent la NSA ?

jeudi 23 mai 2013

La toile des fictions et les connaissances

Nous passons d'un Web de documents à un Web des données et des connaissances. Au cœur de cette transition, des logiciels permettent d'extraire des connaissances du texte ou de comprendre la sémantique de données disponibles ici ou là. La présence d'imprécisions, d'incohérences, l'expression d'opinions, d'erreurs, de mensonges, etc., rendent difficile l'émergence de connaissances. Et dans ce cadre, la fiction construit dans les espaces qui lui sont spécifiques d'autres vérités, voire d'autres mondes répondant à des logiques particulières.

Un exposé sur ce sujet à un séminaire sur le Web, fa fiction, la logique, les connaissances, la création numérique...

samedi 18 mai 2013

Mais qu'est-ce qui fait courir Tournesol ?

Dans des commentaires de ce blog, a été soulevé la question : pourquoi fait-on de la recherche ?

Je vais essayer de donner ma réponse personnelle.

D'abord et avant tout parce que j'adore ça, que c'est le métier le plus beau qui soit, et qu'après tant d'années il me passionne toujours autant.

Ensuite, parce que je suis bien payé pour faire ça par l'état français. Ce n'était pas le cas quand j'étais jeune chercheur et j'avais autant de plaisir à faire mon boulot. J'aime ça mais c'est quand même pour un salaire que je bosse. Je fais de mon mieux pour le mériter.

Par ambition collective : pour mon équipe, pour le pays où j'habite. Je ne vois pas pourquoi ce serait plus con d'être supporteur d'INRIA ou de la recherche française que du PSG ou de l'équipe de France de rugby. (J'insiste sur l'esprit sportif et la place importante des troisièmes mi-temps.) Je peux même me trouver des excuses : la France propose des valeurs dans le cadre de la recherche que je défends.
-- Sans cela, il n'y a aucune raison pour essayer d'attirer les meilleurs étudiants dans nos labos. Laissons les aller à Stanford, Pékin ou Bangalore. --

Par ambition personnelle ? Finalement assez peu je crois ; car pour moi la recherche est plutôt un truc collectif. Bien sûr, un papier accepté à une conf prestigieuse me procure un plaisir énorme. Idem pour un invitation à un comité de programme d'une telle conf. Mais c'est parce que la qualité de ce que je fais est reconnu. La gloire ? La célébrité ? Faut pas déconner. On est connu par quelques dizaines de personnes. Non désolé. Ce n'est pas ça qui me motive.

Pour l'avancement de la science ? Ouais. Si on veut. Mais si je pensais trop à ça, j'aurais arrêté la recherche depuis longtemps, tétanisé par l'importance de l'enjeu. Chacun pose sa pierre plus ou moins grosse, plus ou moins solide, plus ou moins belle. Et ensemble nous construisons un bel édifice. Non désolé c'est trop abstrait pour moi. Ce n'est pas ça qui me motive.

mercredi 15 mai 2013

Enseignement de l'informatique - rapport de l'académie des sciences

L’enseignement de l’informatique en France
Il est urgent de ne plus attendre

Le rapport

Extrait : La décision essentielle à prendre est de mettre en place un enseignement de science informatique depuis le primaire jusqu’au lycée, orienté vers la compréhension et la maîtrise de l’informatique, et dépassant donc largement les seuls usages des matériels et logiciels. Cette mise en place ne doit plus être différée.

dimanche 12 mai 2013

La ligne bleue des Vosges

Régulièrement les politiques s'énervent sur la défense de la langue française. Récemment http://circulaires.legifrance.gouv.fr/pdf/2013/05/cir_36918.pdf
J'adore la langue française. J'écris des romans en français et en rien d'autre.
Mais, dans mon microcosme - recherche & enseignement en informatique
1) je suis pour que l'on puisse rédiger les thèses dans la langue qu'on veut et même en serbo-croate si on y tient. Au moins en anglais parce que les confs et journaux internationaux sont en anglais et que nous sommes des feignants.
2) je suis pour que l'on puisse donner des cours de master en anglais pour pouvoir attirer des étudiants serbes, croates, chinois, indiens, etc.

dimanche 28 avril 2013

Les DRMs dans HTML5. Je ne comprends pas mais j'aime pas

Les DRM. Vous savez ce sont ces trucs qui vous ennuient et qui n'ont sans doute jamais arrêté un vrai pirate. Même quand on veut utiliser une musique, un livre, un film qu'on a acheté, le regarder, le passer à un copain, les DRM vous cassent les pieds. (Oui. Je sais si j'avais lu le contrat, je saurais que...)

Wikipedia: Digital rights management is a class of controversial access control technologies that are used by hardware manufacturers, publishers, copyright holders, and individuals with the intent to limit the use of digital content and devices after sale. DRM is any technology that inhibits uses of digital content that are not desired or intended by the content provider.

Un truc dont je viens d'apprendre l'existence c'est les EME (Encrypted Media Extensions) de HTML5. Si j'ai bien compris c'est un genre de DRM qui permet au navigateur d'intégrer des contenus qui sont protégés par des droits d'accès. Où est passé le monde ouvert du Web ? C'est inquiétant et il faudrait passer par là pour que HTML ne se fasse pas détrôner par un protocole non public ?

La théorie sous-jacente encore une fois la même : un web libre et idyllique est condamné à rétrécir comme la peau de chagrin de Balzac. Noooooon !

Et si j'ai bien compris, avec les EME, HTML5 doit dialoguer avec des DRM de vendeurs différents. Ca parait un peu n'importe quoi. Je vais demander à des copains s'il est possible de faire des trucs comme des DRMs qui soient open source ? Qui soient interopérables et pas spécifiques à un fabriquant particulier ? Si ça existe déjà ?

Un site à fond contre: l'electronic frontier fondation
Et un site à fond pour: John Foliot
Pour en savoir plus les dangers des DRM: le blog de Tristant Nitot.