Généalogie (in)signifiante de mèmes

Il y a quelques temps, j’avais été “taggé” par un camarade blogueur Xichopili pour participer à une chaîne. Celui-ci m’avait invité sur son blog à exposer six choses insignifiantes me concernant sur le mien, et à désigner à mon tour six victimes blogueuses pour continuer la chaîne. Je me suis lancé dans un petit travail généalogique pour comprendre un peu mieux la structure de ces chaînes de blogs.

Comme je l’avais expliqué dans mon billet précédent sur le sujet, l’ancêtre commun de la plupart des blogs sur lesquels je zone était vraisemblablement le vénérable monsieur Pingouin. Je suis donc remonté au billet original et ai relevé un à un tous les descendants de monsieur Pingouin dans cette chaîne de tags. J’ai réalisé ce travail la semaine avant Pâques et ai arrêté mon relevé le Samedi 22 à minuit. Je me suis limité aux blogs francophones.
Cela n’a pas été sans difficulté : quelques blogueurs (dont certains très illustre comme maitre Eolas) n’ont pas indiqué l’adresse des blogs taggés, mais juste une liste de noms. Dans ces cas, j’ai pu parfois remonter une autre chaîne de tags (de nombreux blogueurs ont été taggés deux fois). Certains blogs avaient aussi purement et simplement disparu entre temps, comme le blog d’odanel qui m’a néanmoins gentiment indiqué deux de ses taggés par e-mail (mal m’en a pris car sa descendance a été très prolifique !). Certains blogs étaient aussi tout simplement en rade, inaccessibles, ou je n’ai tout simplement pas trouvé la suite de la chaîne  …

Au final, j’ai sans doute manqué quelques liens et sans doute certains taggés ont-ils répondu depuis mon passage sur leur blog, et j’ai peut-être fait quelques erreurs. Toutes mes excuses d’avance aux concernés. Néanmoins, avec 585 blogs visités (voir liste complète sur cette page) et 201×6 choses insignifiantes lues , je pense avoir suffisamment d’éléments pour pouvoir répondre à quelques questions insignifiantes sur les chaînes de tags. En 6 points évidemment.


1. L’arbre généalogique de 585 blogs

Pour représenter le réseau, j’ai utilisé le langage dot qui place automatiquement les noeuds et permet en particulier de minimiser les longueurs des flèches, etc … Le fichier est énorme, comme vous pouvez vous en douter. J’en ai fait néanmoins une version PDF :
Cliquez ici pour visualiser la généalogie en PDF. Quelques mots sur le code de couleurs. Les noeuds coloriés sont les noeuds ayant répondu à la chaîne de tags, avec un code de couleur maison qui me paraissait pertinent. En vert sont les membres ou ex-membres du groupe des Kiwis. En bleu ciel les blogs politiques, sauf les blogs de membres actifs et autoproclamés du modem qui eux sont en orange. En jaune sont les blogs d’économie/sociologie, en rose les blogs de droit, en rouge les blogs scientifiques, en violet les blogs High-Tech. Enfin les blogs en gris sont ceux que je n’ai pas vraiment réussi à associer à une catégorie ou une autre. Les catégories sont difficiles à établir et ont été établies par moi-même en visitant ces blogs; j’ai fait cet exercice de coloriage uniquement sur les blogs ayant eux-mêmes participé à la chaîne. Les blogs sont ordonnés de haut en bas par génération : le blog le plus haut est monsieur pingouin, ancêtre de tous les blogs de cet arbre. Je n’ai indiqué en général qu’un lien entrant par blog pour garder une structure en arbre, le lien indiqué étant le tag du blog de la plus vieille génération. Allons maintenant un peu plus dans le détail.

2. Alors, exponentiel or not ?
generation.png La figure ci-contre représente le nombre de blogs taggés à la génération n en vert. Ce sont tous les blogs taggés, i.e. même ceux n’ayant pas répondu au tag. La génération 0 correspond à monsieur Pingouin (1 blog), la génération 1 aux 6 enfants de monsieur Pingouin, la génération deux ses petits enfants, etc … Le nombre de blogs taggés monte vite au début, Puis entre les générations 4 à 10, on a une croissance très molle du nombre de blogs, enfin le nombre de représentants s’écroule complètement à la génération 12 !

La courbe bleue correspond au nombre de blogs ayant répondu au tag et effectivement continué la chaîne à chaque génération. Même tendance que la courbe verte, en plus atténuée car seule une partie des gens répondent à la sollicitation dans la chaîne.

La courbe rouge représente le nombre “théorique” de blogs taggés à la génération n, la fameuse exponentielle. Comme vous pouvez le voir, on est très très loin d’avoir la croissance exponentielle théorique dans cette chaîne !

Comment expliquer cette courbe verte étrange ? Une interprétation : au début, une simple fluctuation statistique pour commencer, puis croissance rapide, probablement un effet de mode, et aussi un effet collectif lié au fait que les premiers taggés étaient bien intégrés dans une communauté de blogueurs (les kiwis, au sommet de l’arbre). Du coup, la greffe a en quelque sorte bien pris au départ, et les gens ont beaucoup taggé. Ensuite, le ralentissement est probablement dû au fait que les gens ne savaient plus qui tagguer, taggaient des gens déjà taggés ou ne voulaient pas continuer la chaîne. Par exemple, à la génération 8, sur 36 personnes ayant repris le tag, 14 n’ont taggé personne, 4 ont taggé une seule personne. Enfin, la chute impressionnante du nombre de blogs s’explique par une conjugaison de cet effet et une autre raison très simple : le temps ! Il faut un certain temps pour que la chaîne de blogs se propage, et les derniers taggés ont le cas échéant transmis la chaîne à des gens … qui n’ont pas encore eu le temps d’écrire leur billet. Un exemple typique d’artefact dans une mesure.

Il est assez difficile à partir de cette tendance d’évaluer la croissance typique du nombre de blogs taggés. Cependant, les courbes vertes et bleues sont relativement plates : cela signifie que le nombre de blogs taggés par génération est à peu près constant, et donc qu’en définitive, à peine plus d’un taggé par blog taggueur en moyenne continue la chaîne à chaque génération (un petit calcul donne à peine 1.07 blogueurs sur 6 taggés continuant la chaîne sur ce plateau). C’est pour cela que la chaîne existe toujours d’ailleurs : si on avait par exemple 2 taggés sur 6 reprenant la chaîne à chaque génération, on atteindrait 1 000 000 de blogs en 20 générations, alors que la chaîne des six mèmes insignifiants court encore après 34 générations depuis son entrée dans la francophonie le 2 Février.

3. Dis-moi qui te tagge, je te dirai qui tu es

Arbre des taggés

Le graphe ci-dessus (cliquez sur l’image pour une version plus grande) représente l’arbre des personnes ayant repris le tag, avec mon code de couleur. Une propriété saute immédiatement aux yeux : les couleurs ont tendance à se regrouper entre elles. Admirez ce bel îlot orange (blogs taggés modem) à gauche de l’arbre, ces blogs violets au milieu (high-tech), les blogs de droit en rose, les blogs des économistes en jaune juste au-dessus des blogs scientifiques. Preuve s’il en était besoin que le jeu du tag est d’abord et avant tout un jeu entre proches et familiers; on ne taggue que ses copains, que les gens dans sa propre petite blogosphère d’influence.

Taggés avec feedback

Le graphe ci-dessus (cliquez sur l’image pour agrandir) représente les mêmes blogs, avec cette fois tous les liens (i.e. y compris les liens des blogs ayant taggé leurs ancêtres ou leurs cousins). Le nouvel arrangement calculé par dot permet de voir de façon un peu différente la structure fondamentalement modulaire du réseau : il y a clairement un module orange modem, un module rouge science, etc … Ce genre de structure est moins anodin qu’on ne le croit et permet de déduire des informations sur les blogs : par exemple, sans aller sur son blog, je peux savoir a priori que Luc Mandret est probablement un Cluster de gènessympathisant modem, vu qu’il a été taggé par pas moins de quatre membres que j’ai classés dans le module modem. De même devrais-je peut-être reclasser dans la catégorie modem o-les-vivants. Quoi qu’il en soit, c’est peut-être l’enseignement principal de ce petit exercice : une structure de réseau permet en général de déduire des informations sur les membres de ce réseau. On pourrait par exemple imaginer des robots spammeurs qui ciblent une certaine catégorie de blogueurs en analysant les modules d’un tel réseau. Des techniques d’analyse ont été développées pour trouver de telles structures dans des ensembles de données : analyse en composante principale, clustering… Par exemple, pour trouver les gènes impliqués dans le cancer, le gens regardent les ensembles de gènes exprimés en même temps dans les cellules cancereuse et créent ainsi … des arbres généalogiques entre gènes co-exprimés (voir figure ci-contre, tirée de ce site spécialisé, on voit bien les arbres en haut et à gauche)

4. Quelques records

Trois blogs ont été taggés 4 fois : Luc Mandret , jeunemodem31. Le troisième blog taggé 4 fois est ecopublix, mais c’est un blog collectif.

Dans l’autre sens, les plus prolifiques sont les deux économistes d’optimum : 8 de leurs 12 taggés ont répondu à la chaîne.

Pour les blogueurs seuls, boule de fourrure s’illustre avec 6 taggés ayant répondu sur 8.

Seuls deux blogueurs ont 100% de réussite (6 tags sur 6) : le chafouin, et (correction 30 mars) modem-canton-lavardac.

5. Anecdotes, regrets et remerciements :

Jean-Pierre Raffarin a été taggé deux fois, Bill Gates une fois.

Je suis l’arrière-arrière grand père de Dieu.

Après être partie du Québec et être arrivée en France, la chaîne a atteint la dynamique blogosphère marocaine que j’ai découverte à l’occasion.

Un regret : j’espérais au début remonter suffisamment loin pour trouver mon ancêtre commun avec mon amie titechofie. Il s’agit de tichat, qui est 14 générations au-dessus de monsieur Pingouin. Sachant que l’arbre ici s’étend sur 15 générations, j’ai bien vite renoncé ;) .

Merci à tous ceux qui n’ont taggé personne; ils m’ont considérablement simplifié le travail, et moi-même je ne relaierai plus de chaînes.

6. Conclusion

Je ne sais toujours pas comment s’ écrit “taggé”.

Popularity: 81% [?]

* * * * * 3 votes pour ce billet

20 commentaires à “Généalogie (in)signifiante de mèmes”

  1. Fabrice a dit:

    Merci pour cette analyse. Sacré boulot, en tout cas.
    F.

  2. Sophie a dit:

    He ben Mister Roud, je suis impressionnnée, c’est un très très joli travail !

    Bon je suis un peu déçue que la connection avec la blogosphère girly n’ai pu se faire, mais bon je vous bien que la quantité de boulot nécessaire était alors bien trop grande (et en prennant un stagiaire ?), enfin bon… tu crois pas que tu pourrais en faire un papier court ?

    Il aurait peut être aussi été intéressant de voir s’il y a une corrélation entre la génération d’un taggé et le classement de son blog (wikio ou autre, je ne sais pas quel indicateur est le plus pertinent), en effet je pense qu’on tagge plus facilement un blog “en dessous” du sien pour deux raison :
    - la personne, lit votre blogue, se sent flattée d’être citée (ce système fonctionne clairement sur l’égo des bloggeurs qui aiment que l’on parlent d’eux et parler d’eux), et donc transmet la chaîne.
    - la personne a moins de chance d’avoir déjà été taggée.

    PS : Je suis sérieuse pour l’article court, je suis sure que ça pourrait passer quelque part !!!

  3. blog-memetics etc. « Coffee and Sci(ence) a dit:

    [...] 30, 2008 par Oldcola Tom Roud à un petit morceau tout mignon sur les blogs et la diffusion des mèmes à travers les canaux de la blogosphère. Comme le mème [...]

  4. Tom Roud a dit:

    @ Fab et Sophie : en fait il y a des tas de trucs que je voulais faire mais que j’ai préféré laisser tomber (en tous cas provisoirement) faute de temps. Je voulais faire ce que Sophie suggérait, une corrélation avec le classement wikio (ou peut-être plus lissé avec l’authority de technorati); surtout je voulais faire une analyse en composante principale du réseau pour identifier quantitativement les modules de blogs.

  5. blop a dit:

    Comment s’écrit “taggé” ? et bien “étiquetté” !
    En physique des particules, il nous arrive d’avoir des électrons taggés. La première fois qu’un prof anglais mais très francophone m’a parlé d’électron étiquetté, je n’ai pas compris de quoi il parlait !

    A part ça, Mandret a sa carte au Modem et ne s’en est jamais caché sur son blog
    http://777socrate.blogspot.com/2007/12/congrs-du-modem-bayrou-chavez-marchais.html

  6. Timothée a dit:

    Ca m’intéresse, cette histoire d’identification quantitative des modules sur une ACP…

    Pour le moment, je n’ai pas trouvé d’autre proxy que de faire des catégories a priori (facile avec mon modèle) et de faires des ANOVA/test de Kruskal-Wallis sur le premier axe pour voir si quantitativement les moyennes diffèrent.

    Tu connais une technique pour étudier quantitativement ce genre de choses?

  7. Tom Roud a dit:

    @ blob : merci pour la précision syntaxique.
    Pour Luc Mandret, ce n’est certes pas une surprise, mais tu vois, même sans lire son blog, par simple analyse du graphe, on le sait. Imagine si le réseau était un réseau génétique et que les gens du modem étaient des gènes impliqués dans les cellules souches ou le cancer …
    @ Timothée : je ne suis pas un grand expert de ces trucs là, mais un truc faisable est d’écrire une grosse matrice d’interaction et de calculer les valeurs propres. Les directions propres devraient correspondre aux modules. Bon, j’ai bien conscience que dit comme ça cela ne doit pas être super clair pour les novices …

  8. Ah ben quand mème… « Seeds Aside a dit:

    [...] francophones, vous pouvez lire chez Tom Roud l’anatomie d’un essaimage mémétique. C’est assez intéressant, et en fait, ca fait un certain temps que je me demandais si ce [...]

  9. Matthieu a dit:

    Passionant ! tu as vraiment fait du bon boulot. Le regroupement par centre d’interet etait prévisible mais tu l’as vraiment bien illustré. Je me demande s’il n’est pas possible de le faire automatiquement, pour pouvoir remonter plus loin et a moindre effort ? Je ne connais pas grand chose en informatique web, malheureusement.

  10. Tom Roud a dit:

    @ Matthieu : Merci !

    J’ai pas mal réfléchi à une façon de faire cela automatiquement, mais c’est un vrai casse-tête car il faut retrouver le billet du tag, identifier ensuite les taggés dans le billet, etc … Ce n’est pas très facile car les gens ne mettent parfois pas de liens, linkent des gens sans les tagger, ou tout un tas de choses qu’il faut analyser intelligemment : le blogueur est trop inventif pour faire une analyse automatique. Au final, tout faire à la main me paraissait le plus simple, même si j’ai forcément manqué des blogs en route sans le vouloir et n’ai donc pas été complètement exhaustif. Ce n’est pas tellement grave car je voulais voir les propriétés typiques, genre les connectivités, les modules; si j’ai oublié 10% des blogs ces trucs ne changeront pas beaucoup. Mais c’est vrai que c’est très long : j’estime qu’il m’a fallu une dizaine d’heures pour descendre la chaîne.

    Au passage : je te rappelle (?) que je t’ai taggé ;) (mais tu n’es pas obligé de continuer la chaîne, cela me simplifiera la tâche si, dieu m’en garde, j’ai l’idée saugrenue de faire une mise à jour du réseau)

  11. Chroniques d’un pingouin ordinaire » Blog Archive » Avec des six… a dit:

    [...] Petite précision en date du 31 Mars 2008 : Ce cher Tom Roud a continué de récolter les fruits de l’étude de son arbre généalogique, …. [...]

  12. Monsieur Pingouin a dit:

    Mon cher arrière-arrière-arrière-arrière-arrière petit-fils ou plutôt devrais-je dire :

    Cher Tom Roud,
    Bravo pour cette enquête, riche en éclaircissements sur le phénomène du guten tag, cette autre façon de se dire bonjour entre blogueurs.

    Sinon ce n’est pas pour jaboter, mais si j’en crois le petit robert 2008 taggé s’écrit tagué de paraît-il taguer, qui est synonyme de bomber et de graffiter. Au sujet de la chaîne, je pense que l’on aurait pu oser une traduction comme “Je me suis fait assigner à vous livrer six choses sans intérêt sur mon humble personne”.

    Le mot tagger existe mais c’est une variante du nom tagueur. Bref, tout ceci pour répondre à vôtre petit n°6 et vous souhaiter une bonne continuation. :=)

  13. vf a dit:

    “Ce n’est pas très facile car les gens ne mettent parfois pas de liens, linkent des gens sans les tagger, ou tout un tas de choses qu’il faut analyser intelligemment ”

    vous devriez en déduire des recommandations universelles sur le type de lien, mots clés etc. à mettre en méta pour que les infos soient analysables. Sauf si ça pose des pbs d’éthique, évidemment.

  14. Tom Roud a dit:

    @ vf : ce n’est pas faux, mais le problème est que la chaîne de tags est tout autant un exercice de style, dans lequel les gens essaient de faire preuve d’une certaine créativité ! Difficile alors de contraindre qui que ce soit, même si c’est pour la Science :P.

  15. Xochipilli a dit:

    Bravo Tom pour ton enquete: super interessant, je suis fier d’etre ton pere!

    On n’en attendait pas moins de la blogosphere scientifique, qu’elle verifie la carte genealogique du phenomene, analyse sa vitesse de propagation et identifie ses principaux clusters. Comme quoi, meme -et surtout! - avec des carambistouilles , on peut toujours tirer quelque chose d’interessant: jolie demonstration.

    J’aurais bien vu la blogosphere high tech prendre le relais de la discussion au sujet des outils statistiques les mieux adaptés pour automatiser ton analyse sous javascript. Et puis la blogosphere feminine s’interroger sur la tendance a taguer plutôt une personne du meme sexe que soi, signe d’un machisme inavoué ou au contraire d’une regrettable desexualisation de la blogosphere. Et la blogosphere economique se pencher sur les mecanismes naturels d’autoregulation de ce phenomene incontrole. Et enfin la blogosphere de droit/socio aurait pu identifier dans ce phenomene une nouvelle preuve d’un nouveau communautarisme au service de l’ego. Tant pis, ce sera pour la prochaine fois ;-)

  16. mycr a dit:

    Merci de votre commentaire sur mon site, auquel je viens de répondre.

    Félicitations pour le vôtre très intéressant!

  17. Brèves #4 | Le blog du Doc’ a dit:

    [...] Tom Roud nous a fait un joli travail de “mémétique évolutive”. [...]

  18. QLog a dit:

    Je suis en retard dans la lecture des blogs…
    En tout cas, bravo ! c’est franchement intéressant. Ca me fait penser à quelques articles d’un autre blog sur les “technologies du langage”. En particulier une cartographie sémantique des blogs référencés sur Wikio : http://aixtal.blogspot.com/2008/03/blogs-cartographie-smantique.html

  19. Dr. Goulu rejoint le [email protected]é des Sciences « Dr. Goulu a dit:

    [...] sur le Web 2.0, ou le mécanisme de publication sur les blogs excellement étudié dans “Généalogie (in)signifiante de mèmes” par [...]

  20. Le blog du Doc’ » Opinions (et réflexions) Tous les billets » Good genes. Et c’est tout? a dit:

    [...] Pour ceux qui n’auraient pas suivi, un meme, c’est une unité d’information culturelle, qui est transmise, mute, s’adapte à son noosystème, l’écosystème des idées. Les memes, c’est ce que les parents transmettent à leurs enfants, ce que vous recevez dans votre boîte mail, les chaînes de blog dont on retrace l’histoire évolutive. [...]

Laisser un commentaire