Mortalité à Gaza : incompétence en statistiques ou mauvaise foi ?

toto2

Un statisticien américain affirme que le Hamas « falsifie » le nombre de 31 988 morts, dont 13 600 enfants, à Gaza. À moins qu’il n’avalise aveuglément tous les arguments à l’appui de la guerre d’Israël.

Depuis les massacres du Hamas en Israël, le 7 octobre, et ceux qui le suivent depuis à Gaza mais aussi, dans une moindre mesure, en Cisjordanie, une question cruciale est de compter les morts. Ainsi, en Israël, le nombre de 1400 morts en octobre a été revu à la baisse, ce qui montre que, dans une situation dramatique, il n’est pas facile de faire immédiatement et précisément un comptage de victimes, même si on dispose de tous les moyens nécessaires.

À Gaza, dans des conditions qui n’ont rien à voir avec celles d’Israël, le ministère de la Santé du Hamas a rapporté quotidiennement le nombre de morts et ces résultats ont été contestés par certains, comme étant sous-évalués, mais surtout sur-évalués, alors qu’Israël affirmait début novembre que « 20 000 personnes, pour la plupart des terroristes, ont été tuées dans les attaques de l’armée israélienne dans la bande de Gaza », ce qui revient à dire que, dans cet environnement urbain surpeuplé, les bombes, missiles et balles ont l’extraordinaire faculté de ne tuer, pour l’essentiel, que les combattants du Hamas.

Dans ce contexte, un journal a publié le 7 mars un article d’un statisticien américain, Abraham Wyner, intitulé « Comment le Ministère de la santé de Gaza falsifie les chiffres des victimes ». Cet article affirme que les données du Hamas « n’étaient pas réelles » et que « c’est évident pour quiconque comprend le fonctionnement normal des nombres ». Cet article a été analysé dans un article de Checknews de Libération pointant ses multiples « erreurs ». Nous allons voir que ces erreurs sont si grossières qu’elles sont parfaitement incompréhensibles quand elles sont faites par un professeur d’université – et que le but de cet article semblait être de faire douter des pertes civiles de l’offensive à Gaza, ce que dit clairement son auteur : « Le nombre total de victimes civiles est probablement extrêmement surestimé ». Que Wyner soutienne visiblement le point de vue israélien est son affaire personnelle, mais utiliser ses compétences de statisticien pour présenter des analyses biaisées serait une attitude inacceptable venant d’un chercheur.

Est-ce à dire que certaines données n’ont pas été arrangées par le Hamas ? Personne ne peut le dire, mais le Hamas n’a probablement pas (ou plus) besoin de gonfler les données qu’il arrive à récolter, car on se doute que quand des bombes tombent depuis des mois sur le ghetto de Gaza où sont forcées de vivre plus de deux millions de personnes, la mortalité est effroyable chez les civils.

Curieusement, l’article de Wyner utilise les seules données du 26 octobre au 10 novembre, alors que le nombre de victimes était trois fois plus faible que celui rapporté ces jours-ci et que les données existent donc au-delà du 10 novembre. En statistiques, plus la base de données est étendue, moins on a de risques d’aboutir à des conclusions erronées. Mais restons-en à cette courte période de 15 jours : qu’en est-il ?

Le premier point qui étonne est que, dès le mois de décembre, un article paru dans The Lancet, expliquait que le bilan rapporté par le Hamas jusqu’au 10 novembre semblait crédible, car suivant la même dynamique que le bilan de la mortalité des employés de l’ONU sur place, quoi qu’à un niveau plus faible que celui des employés de l’ONU, ce qui pourrait être interprété comme le fait que le Hamas non seulement ne surestime pas la mortalité, mais la sous-estime, probablement à cause des difficultés d’enregistrement.

Wyner critique cette étude en disant que des employés de l’ONU sont membres du Hamas (au moins 12 sur 13 000) et donc soumis à la même mortalité qu’eux, mortalité a priori forcément plus élevée que celle des civils puisqu’il s’agit de combattants. En somme, on comprend que les 101 morts de l’ONU au 10 novembre seraient pour l’essentiel des combattants du Hamas et que, donc, la mortalité des civils rapportée par le Hamas serait bien surestimée, puisque similaire à celle des employés de l’ONU qui sont des combattants. Le raisonnement semble fragile.

Wyner commence son article en montrant un graphique du nombre cumulé de morts et commet une erreur, le 27 octobre, en comptant ce jour 7362 morts, et non 7326, ce qui amène à rectifier le nombre de morts depuis la veille à 298 au lieu de 334 et celui du jour suivant à 377 et non 341. Il commet une autre erreur, le 4 novembre, comptant 9485 morts au lieu de 9488, ce qui amène aussi à rectifier la mortalité quotidienne : on utilise ici ces valeurs corrigées. Wyner indique que la mortalité cumulée jour après jour est trop régulière pour être honnête, puisque la corrélation entre les valeurs est presque parfaite (0,99, le maximum étant de 1). Tout statisticien sait que, puisque chaque nouvelle valeur est ajoutée à la somme de toutes les précédentes, les valeurs cumulées ont, par construction, toutes les chances d’être très corrélées : on s’étonne donc que Wyner s’appuie sur cette corrélation dont on sait qu’elle est biaisée par construction. La figure le montre parfaitement, alors qu’il n’y a aucune relation nette entre les valeurs quotidiennes (coefficient de corrélation de -0,41, non significatif), celles-ci variant d’un jour à l’autre. Comme le font remarquer des statisticiens, si on augmentait nettement le nombre de morts quotidiens, par exemple en le multipliant par 10, la variabilité du nombre de morts quotidiens serait multipliée par 100, mais la relation entre les valeurs cumulées ne changerait pas. Premier problème, donc : l’utilisation d’une présentation cumulée des données donne l’impression que la mortalité est identique d’un jour à l’autre, alors que ce n’est pas le cas.

Mortalité cumulée à Gaza du 26 octobre au 10 novembre 2023 et mortalité quotidienne. Les erreurs de Wyner ont été corrigées avant calcul (voir le texte). Les équations indiquent les corrélations entre le jour de la mesure (x) et la mortalité (y), quotidienne  (-0,41) ou totale (0,99).


Deuxième problème : Wyner écrit qu’il est tout à fait anormal que la mortalité des femmes et des enfants soit inversement corrélée à la mortalité masculine (coefficient de corrélation de -0,91) et donc que les données sont truquées. Le résultat d’une mortalité inverse des hommes à celle des femmes et enfants s’explique simplement par le fait que les données comptabilisent les femmes et les enfants, mais pas les hommes, ceux-ci étant déterminés par différence par rapport au nombre total de morts. Quand les données sur le sexe et l’âge des victimes ne remontent pas bien au ministère de la Santé du Hamas, le nombre de femmes et enfants tués diminue et celui des hommes augmente, par différence. Cette imperfection des données explique aussi qu’il arrive qu’aucune femme ne soit ajoutée à la liste des morts certains jours, comme le note Libération, et même que le 29 octobre Wyner enregistre un nombre d’hommes morts… négatif. Tout ceci indique que les données sont imparfaites, comptabilisant mal l’âge et le sexe des victimes, et déduisant le nombre de morts masculins par une soustraction et non par l’observation réelle des morts. Il faut donc être très prudent avant de tirer des conclusions définitives comme le fait Wyner.

En résumé, soit Wyner est totalement incompétent en analyse des données, tombant dans les pièges les plus grossiers, soit il prend ses lecteurs pour des idiots en espérant qu’ils ne le verront pas, pour la plupart.

Si c’est la première explication, il faut savoir que la première chose qu’on apprend à un étudiant débutant dans l’analyse des données est de s’assurer de leur fiabilité avant de conclure n’importe quoi, mais Wyner fait comme si les fonctionnaires du Hamas pouvaient récolter en toute tranquillité, avec exactitude et exhaustivité, leurs données de mortalité, comme on le ferait dans un laboratoire universitaire, et que ces données seraient donc parfaites en l’absence de fraude. Sur un terrain de guerre urbain, il est sûrement plus « facile » de compter les morts que de déterminer leur sexe et leur âge, et les données peuvent être lacunaires et mettre du temps à remonter. Les données publiées par le ministère de la Santé du Hamas sont nécessairement mauvaises et incomplètes et on peut être sûr que beaucoup de morts échapperont à l’enregistrement : ces données ne peuvent être utilisées que pour avoir une idée approximative de la mortalité à Gaza, qui est aussi documentée par ailleurs par les vidéos ou les témoignages, mais en aucun cas pour faire des analyses statistiques précises, en ventilant ces données par âge et par sexe.

Est-ce à dire que certaines données n’ont pas été arrangées par le Hamas ? Personne ne peut le dire, mais le Hamas n’a probablement pas (ou plus) besoin de gonfler les données qu’il arrive à récolter, car on se doute que quand des bombes tombent depuis des mois sur le ghetto de Gaza où sont forcées de vivre plus de deux millions de personnes, la mortalité est effroyable chez les civils. Dire cela n’est en aucun cas soutenir le Hamas, oublier ses massacres du 7 octobre, ou être antisémite, puisqu’il semble bien qu’au yeux de certains le monde entier est antisémite dès qu’il n’avalise pas aveuglément tous les arguments à l’appui de la guerre d’Israël.

Si c’est la seconde explication, alors il n’y a plus rien à dire, si ce n’est que Wyner salit la science.

7 commentaires

  1. Lucien Matron le 26 mars 2024 à 05:39

    «  le monde entier est antisémite dès qu’il n’avalise pas aveuglément tous les arguments à l’appui de la guerre d’Israël » , c’est bien un des sujets concernant cette sale guerre. Au fond, peu importe le nombre de morts, ils sont des milliers, voire des dizaines de milliers qui tombent sous les obus, les missiles et les drones utilisés par l’armée israélienne : ce sont pour l’immense majorité des victimes innocentes. D’une façon ou d’une autre, l’armée israélienne et son gouvernement devront répondre de crimes de guerre devant une juridiction internationale, tout comme le Hamas.

  2. lecteur le 26 mars 2024 à 08:02

    Mais il n’y a pas qu’aux USA que des « experts » défendent le comportement israélien dans la bande de Gaza. Dernier exemple en date, le toutoulogue eurobéat qui nous explique dans Libération du 24 mars qu’on ne peut pas accuser Israël de génocide à Gaza.

  3. Patalf_le gris le 27 mars 2024 à 16:05

    Si la courbe des morts cumulés est linéaire alors que le nombre de morts par jour ne l’est pas c’est que le Hamas ne donnait visiblement pas de score quotidien. On peut en déduire que seul le chiffre du jour du scoring est trafiqué et pas les jours sans scoring. Genre je veux (car c’est clairement une volonté avec une mise en oeuvre stupide) atteindre 200. J’étais à 180 (déjà fictif), hier j’ai eu 8, je force à 12 pour aujourd’hui et hop je suis à 200. 8 et 12 c’est différent et la courbe cumulé demeure bien droite.

    Que ce soit en cumulé ou pas, une linéarité pareille est le signe certain d’une fraude particulièrement stupide qui n’a pas tenu compte d’une distribution gaussienne.

  4. Rodrigue le 27 mars 2024 à 17:02

    Abraham Wyner est professeur de statistiques à la Wharton School of the University of Pennsylvania. Le fait que les données journalières soient différentes ne justifie en rien l’anomalie statistiques évidente mise en lumière par ce statisticien. En plus pas besoin d’avoir fait polytechnique.

    La maman de Toto veut que son fils ait 10 de moyenne. Chaque semaine elle lui demande ses notes et chaque mois, quand elle fait les calculs, Toto a toujours 10 de moyenne. Les notes de Toto varient (tout comme vos données journalières) mais la moyenne est toujours calée sur 10. Et bien croyez le ou pas, mais la Maman de Toto a eu des doutes et est allé voir le professeur…

    Il est évident que le « Ministère de la Santé du Hamas » a enfumé la presse. De combien on ne peut pas le savoir, mais enfumage il y a.

  5. Juliette le 27 mars 2024 à 17:29

    La seule question qui se pose c’est comment est il possible de se tromper ainsi ? Ce n’est probablement pas Einstein, mais la question est élémentaire. Comment a t’il pu se permettre d’accuser ce professeur de « salir la science » alors que sa réfutation est inepte : la non linéarité des données unitaires ne blanchit en rien la linéarité du cumul. Par quoi sa raison était elle obscurcie ?

  6. Roméo le 28 mars 2024 à 11:45

    Éric Le Bourg est bon pour retourner à l’école, sa « démonstration » fait rigoler tout le monde. Le Hamas a bidonné les chiffres. D’ailleurs sans même cette grotesque erreur du Hamas, il faut quand même être très « militant au front bas » pour donner le moindre crédit aux communiqués de terroristes. Vous allez me dire que c’est ce que font tous les journalistes, mais eux ils doivent vendre leur papier, donc l’écriture selon ce que les gens ont envie d’entendre. Et la presse officielle (AFP, le Monde, …) s’est bien gardé de revenir sur cette histoire, sachant parfaitement que le statisticien américain avait mis le doigt sur un truc qui fait mal. Alors ils ont fait comme si ils n’étaient pas au courant et parlé d’autres choses comme toujours.

  7. R.Montgolfier le 28 mars 2024 à 11:54

    Regards devrait publier un complément d’enquête sur cette histoire. On ne peut pas publier n’importe quoi puis rester silencieux face aux critiques. A part cela il est évident que les accusations de génocide sont de la pure propagande. Un état a le droit de se défendre quand il est attaqué, que plus d’un millier de civils sont tués et plus d’une centaine emmenés en captivité. Si il y a des victimes collatérales parce que les terroristes se cachent dans la population, dans les hôpitaux, et prends des boucliers humains, c’est la faute des agresseurs. Surtout quand ces attaques proviennent d’une organisation classée « terroriste ». Il faut vraiment n’avoir que de la haine et aucune connaissance juridique pour prétendre le contraire.

Laissez un commentaire