mercredi 12 mai 2010

Mégalo campus - suite

Si vous avez comme moi un avis réservé sur le mégalo campus Cassoulet, allez lire:

La cité scientifique de Tsukuba gagnée par l’obsolescence

[Tôgo Tsukahara et Hironori Ayabé, Annales de la Recherche Urbaine]

Ca parle de Tsukuba (le mégalo campus Sushi?) et des problemes d'urbanisme notamment. Un morceau choisi:

Actuellement, Tsukuba est confrontée à tant de problèmes qu’on ne peut tous les énumérer. Citons seulement le grand nombre de terrains inutilisés, le retard dans l’ancrage de la population, la faible propension à accueillir des étrangers et la pauvreté du réseau de transports en commun. Aujourd’hui, on espère beaucoup du train express Tsukuba de la compagnie JR, qui relira dès août 2005 Tsukuba au centre de Tokyo.

Les mauvaises langues vont dire que c'est ce que sera le mégalo campus dans 20 ans.

lundi 3 mai 2010

NoSQL. La fin d'un mythe ?

Comme pas mal d'autres chercheurs en bases de données, j'ai développé avec le temps une schizophrénie certaine. J'enseigne les bases de données relationnelles et je parle aux élèves de la beauté du calcul relationnel (First-order logic, les petits!), de l'algèbre relationnelle, et de notre standard SQL. Et à coté, j'aligné la recherche sur des données N1NF, des données déductives, des données objet, des données semistructurées; autant d'agressions contre le dogme relationnel. Et si on trouvait toujours quelqu'un pour nous dire que ça ne servait rien, que le monde était relationnel, ça ne nous a jamais empêché de vivre.

Et puis est arrivé XML qui est devenu un standard pour les données, plus standard que le standard relationnel. A l'occasion, on en a profité pour réaliser que maintenant que tout le monde programmait en objet, les bases de données objets s'imposaient sans combat. Même la déduction qui revevait à la mode! Mais elle était où la mode?

Une rumeur venue des US: Le monde devient NoSQL!

Késako NoSQL? Pour les prudents: cela veut dire "not only SQL". Donc c'est juste une platitude car tout le monde sait qu'il n'y a pas que des tableaux à deux dimensions dans la vie. Alors du pipeau? Non! C'est comme Web 2.0, c'est scientifiquement indéfinissable, mais c'est un état d'esprit, un mouvement, presqu'un art de vivre (ouf: je vais me faire chambrer). En tous cas, NoSQL ça doit être cool car même Mike Stonebraker se met tirer à dessus.

Bienvenue dans le monde fascinant de la gestion de données à l'échelle du Web avec ses DHT, ses map-reduce, et ses annotations sémantiques! Enfin de la techno qui décoiffe. [Voir le livre là-dessus "Web Data Management and Distribution", Pub (*).]

Un avis personnel, on peut voir dans NoSQL deux aspects principaux :

  • On peut faire de la gestion de données avec un opérateur scan, un index clé/valeur et basta!
  • On peut faire de la gestion de données en utilisant massivement la distribution.
Tout ça, c'est ce qu'on gagne: la simplicité et le passage à l'échelle. Le prix à payer: on zappe la gestion stricte de la concurrence, style ACID, et les requêtes compliquées, genre plein de jointures.

D'un point de vue logiciel, ça conduit à plein de logiciels souvent libres. (NoSQL, c'est un peu "A bas les serveurs relationnels d'Oracle, IBM et Microsoft".) Notamment:

  • Des systèmes autour de Map-Reduce comme Hadoop.
  • Des bases de données objet comme db4o.
  • Des bases de données XML comme eXist.
  • Des systèmes de stockage massif de documents.
  • Des systèmes de clé/valeur autour d'une DHT comme Dynamo.
(*) SA, Ioana Manolescu, Philippe Rigaux, Marie-Christine Rousset, Pierre Senellart. Version alpha à http://webdam.inria.fr/textbook/ - écrivez moi si vous voulez les login et passwd. Sortie cette année chez un éditeur. Stay tuned!