Vous vous demandez peut-être parfois combien de blogs sur Cowblog sont vraiment vivants et combien ne sont plus que des coquilles vides.
Pour essayer de tirer cela au clair, j'ai étudié ce qu'on appelle un échantillon, échantillon que je considère comme représentatif. Que les vrais sociologues viennent me tirer les oreilles si ce n'est pas le cas !
J'ai pris une nouvelle fois la liste des membre de Cowblog, mais ordonnés cette fois par ordre alphabétique. Cette liste se présente sous forme de pages contenant chacune 50 noms. Le 10 septembre, la liste comportait 383 pages. Sur chaque page, j'ai considéré le deuxième blog (c'est comme ça) et j'ai relevé chaque fois la date du dernier article posté. L'échantillon compte donc exactement 383 blogs, ce qui représente 2% des 19122 blogs de la liste. On peut considérer que du point de vue de l'ancienneté et de la provenance géographiques, ces 383 blogs sont tirés au hasard.
Conclusions :
1. Une bonne nouvelle d'abord : sur 124 blogs de l'échantillon, soit 32,5 %, un article a été posté depuis le trois septembre (une semaine).
2. On trouve ensuite 105 blogs, soit 27,5 %, sur lesquels un article a été posté entre le 10 août et le 2 septembre.
60% des blogs de l'échantillon sont actifs. C'est plus que je ne l'imaginais.
3. 66 blogs (17%) ont reçu leur dernier article entre le 10 juillet et le 9 août. Ces blogs sont en sursis.
4. Enfin, 88 blogs ne se sont plus manifestés depuis le 9 juillet (23%), ils ont probablement été abandonnés.
Si l'échantillon est valable, pour l'ensemble des membres inscrits au moment du décompte (19122), ces pourcentages nous donnent en gros :
- 6120 blogs en pleine santé,
- 5200 blogs moins réguliers mais actifs,
- 3250 blogs en sommeil,
- 4400 blogs plus ou moins abandonnés.
- 5200 blogs moins réguliers mais actifs,
- 3250 blogs en sommeil,
- 4400 blogs plus ou moins abandonnés.
Soyons francs, je m'attendais à pire. Une communauté de plus de 10000 personnes représente un gros potentiel. Cowblog peut maigrir encore sans que son avenir soit compromis.
un échantillon de 2%, je ne trouve pas ça vraiment très représensatif.
Et puis, on peut considérer que comme on ne prend que les deuxièmes blogs par page, on a une ordonnance cyclique dans les noms... Si on imaginait maintenant que les noms de blogs sont le reflet de l'activité du blog. Et bien on ne pourrait plus proposer qu'on a pris des échantillons au hasard...
Oui bon d'accord, c'est n'importe quoi...
Maintenant, un travail plus fastidieu serait d'ajouter un critère de pertinence des articles ou prendre en compte un rapport texte^2/images et assigner un score à chaque échantillon...
Pour ça, on pourrait peut-être faire un petit robot. Mais je n'ai pas vraiment le temps de m'occuper à faire ça.
Bon et bien, bon courage pour d'autre statistiques !