Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme
CHAPITRE 8Combien? Faire des estimations Le roi perdit son chemin dans la jungle et dut passer la nuit dans un arbre. Le jour suivant il déclara à un de ses compagnons de voyage que le nombre de feuilles sur l'arbre était «de tant» (un chiffre réel fut donné). Alors qu'on lui demandait s'il avait compté toutes les feuilles, il répondit, «Non, mais j'ai compté les feuilles de quelques branches et je connais la science du jet de dé.» (Nal-Damayanti Akhyan) Contenu du chapitre INTRODUCTION: Pourquoi avons-nous besoin d'estimations?
INTRODUCTION: Pourquoi avons-nous besoin d'estimations? Que ce soit une disparition, une exécution sommaire, un cas de torture ou un viol, c'est toujours un de trop. Pourtant, une des questions les plus souvent posées aux défenseurs des droits de l'homme est «combien?» Pourquoi est-ce si important? Les gouvernements, les organisations non-gouvernementales, les médias, et même le public ont tendance, lorsqu'il s'agit des droits de l'homme, à être concernés surtout par l'amplitude («combien?») des violations. Le dénombrement des violations représente une importante part des rapports annuels du Ministère Américain des Affaires Etrangères, Country Reports on Human Rights Practices, qui sont publiés pour assister les membres du Congrès dans leur considération de la loi. De nombreux autres pays tracent le statut des droits de l'homme dans les pays auxquels ils apportent de l'aide. Dans cet effort pour pénétrer «les barrières à la croyance», les chiffres sont également importants. Dans la course pour gagner l'attention du public -- souvent jouée par les médias -- les violations à grande échelle attirent l'attention par leur amplitude. Dans cette course-là, les chiffres comptent aussi. Bien sûr, la meilleure preuve serait de savoir exactement combien de personnes ont disparu, ont été assassinées, etc. Mais obtenir un compte exact n'est pas souvent possible, surtout dans les situations extrêmement instables. En général, la meilleure solution est de faire des estimations. Il vaut mieux faire la meilleure estimation possible que d'essayer de deviner. Il y a deux principaux moyens pour faire des estimations: Méthode 1: Pour trouver la valeur approximative d'une caractéristique (morts, hospitalisations, disparitions) d'une «population» (personnes, armes, cas hospitaliers, etc.) que vous ne pouvez pas compter, prenez un échantillon de cette population, rassemblez les données sur cette population, et calculez un nombre à partir de ces données. Utilisez ce nombre comme valeur approximative de la caractéristique de cette population. Ci-dessous, un exemple de cette première méthode d'estimation: Exemple 8.1 Malheureusement, le nombre de dossiers était trop important pour qu'ils aient le temps d'analyser et de calculer durant la période de temps qu'ils avaient de disponible. S'ils ne pouvaient pas analyser tous les dossiers, que pouvaient-ils faire? Discussion Pour obtenir la valeur approximative, ils procédèrent de la manière suivante. Ils prirent un échantillon au hasard de plusieurs centaines de dossiers de patients qu'ils pourraient analyser et calculer en temps voulu. (Comment choisir un échantillon au hasard est expliqué plus loin dans ce chapitre.) A partir de ces échantillons, ils calculèrent la proportion de dossiers d'enfants traités pour des maladies dues à une sévère malnutrition. La proportion qu'ils obtinrent de cette façon est leur estimation de la proportion d'enfants traités pour des maladies dues à une sévère malnutrition pour tous les dossiers de patients. Le résultat obtenu n'est pas basé sur une analyse de tous les dossiers, mais seulement sur les dossiers faisant partie de l'échantillon. Méthode 2: Pour trouver la valeur approximative d'une caractéristique (morts, hospitalisations, disparitions) d'une «population» (personnes, armes, cas hospitaliers, etc.) que vous ne pouvez pas compter, estimez une valeur par calcul basé sur des hypothèses plutôt que sur des données tirées d'un échantillon systématique (comme dans la méthode 1). Ci-dessous, un exemple de cette seconde méthode d'estimation: Exemple 8.2 Discussion Si les estimations étaient fondées sur une analyse statistique d'un échantillon, tous les observateurs, quels que soient leurs points de vue politiques, auraient trouvé à peu près la même valeur. Pour calculer une estimation à partir de cet exemple, les personnes (qui n'ont probablement pas ou qui ne pouvaient pas obtenir de données réelles) faisant des estimations doivent travailler avec toutes les sources disponibles et doivent faire de nombreuses hypothèses. Différentes données et différentes hypothèses résultent en des estimations numériques variées. Le point de vue politique joue un rôle important dans la façon dont les définitions, les données et les hypothèses sont utilisées et où elles sont utilisées. Dans ce livre, nous n'utilisons pas cette seconde méthode d'estimation. Dans ce chapitre, nous discutons de la façon d'obtenir des estimations à partir d'échantillons, comme nous l'avons présenté dans la première méthode. 8.1 PRINCIPES DES ESTIMATIONS A PARTIR D'ECHANTILLONS Ci-dessous, une situation dans laquelle nous essayons de mesurer l'ampleur de la situation en ce qui concerne les droits humains. Cet exemple est tiré d'un événement réel. Exemple 8.3 Un grand camp, relativement isolé, fut mis en place dans un pays pour les réfugiés d'un pays voisin. Afin de mieux subvenir aux besoins des réfugiés, une organisation non-gouvernementale voulait savoir combien de réfugiés vivaient dans le camp. Discussion Comme nous l'avons discuté dans le chapitre 4, compter tous les réfugiés un par un est l'approche directe pour obtenir le nombre de réfugiés dans le camp. Mais compter tous les réfugiés un par un requiert des ressources et de l'organisation. Au minimum, il vous faudra: * Suffisamment de travailleurs formés pour faire le travail en temps voulu. * Un système de calcul qui vous donne l'assurance que vous ne manquez pas quelques réfugiés ou que vous ne les comptez pas plus d'une fois. * Des moyens efficaces pour recenser les réfugiés. Tout cela nécessite des ressources que vous n'avez peut-être pas. Plus grand sera le nombre de personnes (ou de maisons ou d'équipement ou d'armes, etc.) à compter, plus complexe sera le procédé. Vous aurez aussi besoin de plus de travailleurs sur le terrain, de plus de statisticiens, etc. Vous manquerez peut-être de temps ou de travailleurs ou de moyens pour établir un système complexe de dénombrement. Si vous avez les moyens de faire un dénombrement complexe et précis, alors n'hésitez pas. Les organisations de défense des droits de l'homme ont rarement assez de moyens pour faire un dénombrement complet. Le mieux est de faire une estimation basée sur un dénombrement fait à partir d'un échantillon que vous pouvez obtenir en comptant une partie des réfugiés du camp. Les ressources nécessaires pour obtenir un échantillon de taille modeste sont moins importantes que celles nécessaires pour un dénombrement complet. Comme nous l'avons vu dans le chapitre 3, si vous prenez un échantillon de probabilité, vous pouvez mesurer scientifiquement la précision de votre estimation (Quelle erreur résulte de la façon dont vous avez mesuré?) En général, le modèle, l'implantation et l'analyse préliminaire d'un échantillon pour faire une estimation de ce genre nécessitent l'expertise d'un statisticien qui connaît la théorie de l'échantillonnage et son application. Nous n'irons pas aussi loin dans ce manuel. Mais il est important pour le défenseur des droits de l'homme de connaître les principes de base qui permettent de faire de telles estimations. 1. Si vous recueillez vos données selon ces principes, un statisticien pourra faire une analyse pour vous. 2. Vous pourrez travailler d'une façon plus efficace avec un expert en statistique. 3. Lorsque d'autres - surtout de grandes organisations non-gouvernementales et des gouvernements avec leurs propres experts - évalueront votre travail, ils le jugeront selon les principes de base discutés dans ce chapitre. Comprendre leurs points de vue vous aidera à répondre efficacement à leurs questions. Voici comment vous pouvez utiliser un échantillon de probabilité, pour obtenir une estimation du nombre total de réfugiés dans le camp, qui sera crédible aux yeux des autres. Exemple 8.4 La figure 8.1 représente la grille rectangulaire des tentes du camp de réfugiés:
8.1 Grille rectangulaire des tentes dans l'exemple 8.4 Discussion S'il y avait le même nombre de réfugiés dans chaque tente, il serait facile de déterminer le nombre exact de réfugiés. Vous pourriez compter le nombre de réfugiés vivant dans une tente et multiplier la valeur obtenue par 300. Si vous comptiez le nombre de réfugiés dans une tente et trouviez le chiffre sept, alors le nombre exact de réfugiés serait 7x300=2 100. Mais il est peu probable qu'il y aura le même nombre de réfugiés dans chaque tente. Les défenseurs des droits de l'homme qui ont travaillé avec des réfugiés savent que le nombre de personnes vivant en camp varie de façon considérable. Si vous comptiez le nombre de réfugiés dans une tente et que vous multipliez par 300, vous obtiendriez une estimation du nombre total de réfugiés qui ne serait pas crédible. Après tout, cette tente pourrait contenir moins (ou plus) de réfugiés que les autres tentes. Que faire? Un statisticien mettant au point une telle étude prendrait probablement un échantillon de tentes et, à partir de cet échantillon, calculerait une estimation du nombre moyen de réfugiés par tente, et multiplierait cette valeur par le nombre total de tentes (300) pour obtenir une meilleure estimation que celle décrite ci-dessus. Note: Pour obtenir une moyenne, trouvez la somme de toutes les données (dans ce cas, le nombre de personnes dans chacune des tentes choisies pour l'échantillon) et divisez cette somme par le nombre d'items (dans ce cas, le nombre de tentes choisies). Supposons que vous avez un camp avec dix tentes. Vous choisissez un échantillon de quatre tentes pour déterminer le nombre moyen de personnes dans les tentes du camp. Vous trouvez que dans la tente A, il y a quatre personnes; dans la tente B, il y a cinq personnes; dans la tente C, il y a neuf personnes et, dans la tente D, il y a deux personnes. Vous pouvez ensuite calculer la somme des personnes dans les tentes choisies pour l'échantillon: 4+5+9+2=20 Pour obtenir la moyenne, divisez la somme (20) par le nombre de tentes de l'échantillon (4), et vous obtenez une moyenne de 5: 20/4=5 Puisque c'est votre estimation du nombre moyen de personnes par tente, vous pouvez multiplier par le nombre total de tentes pour estimer le nombre total de personnes dans le camp. Pour trouver l'estimation du nombre de personnes dans le camp, vous multipliez la moyenne (5) par le nombre total de tentes dans le camp (10): 10x5=50 Votre estimation du nombre total de personnes dans le camp est 50. La formule pour votre calcul est la suivante: Estimation du Nombre Moyen de Réfugiés Par Tente x Nombre Total de Tentes Bien sûr, pour un camp avec seulement dix tentes vous n'avez pas besoin de faire une estimation. Vous pouvez tout simplement compter tout le monde. Mais pour des camps plus grands, vous n'aurez pas d'autre choix que de prendre un échantillon. Ce que vous avez vu ci-dessus est l'essence même d'une approche solide pour estimer le nombre total de réfugiés. Mais, comment obtenir une estimation correcte du nombre moyen de réfugiés par tente? Bien choisir les tentes pour votre échantillon est une étape critique. Si vous voulez que votre estimation soit solide, vous devez choisir les tentes selon une règle de probabilité. Pour un cas comme celui-ci, la méthode appropriée est de choisir un échantillon pris au hasard. Vous voulez un échantillon au hasard pour les raisons suivantes: *Un échantillon pris au hasard assure qu'aucun biais n'entre dans la sélection des tentes de votre échantillon. Par exemple, si vous avez choisi les tentes de votre échantillon parmi celles situées près de l'entrée principale, votre exemple sera sans doute constitué de tentes plus bondées que celles du reste du camp. *Un statisticien peut calculer la précision (voir le Chapitre 4) d'une estimation à partir d'un échantillon pris au hasard. Vous saurez donc si votre estimation est bonne. Toujours avec les mêmes exemples, nous démontrons la forme la plus simple d'un échantillon pris au hasard. Puisque le camp est organisé de façon systématique, on peut facilement assigner un numéro d'identification de 1 à 300 (15 rangées de 20 tentes) à chaque tente. Vous pouvez faire cette attribution de numéros en mettant un nombre sur chaque tente ou en utilisant un plan. La figure 8.2 montre une possibilité pour numéroter les 300 tentes.
8.2 Grille rectangulaire des tentes de la figure 8.1 après numérotation En assumant que vous avez le personnel, le temps et les autres ressources nécessaires pour compter les personnes dans les 15 tentes et pour enregistrer les résultats, comment obtenez-vous un échantillon au hasard de 15? Une première méthode serait de faire comme pour une loterie: Vous mettez des étiquettes numérotées de 1 à 300 dans une boîte, vous la secouez, et sans regarder vous retirez 15 étiquettes de la boîte. Vous vous rendez ensuite aux tentes choisies et comptez les personnes dans chacune de ces tentes. Cela vous semble-t-il insensé? ça ne l'est pas. De nombreuses loteries nationales choisissent leurs numéros gagnants de cette façon. De nombreux pays, les Etats-Unis inclus, ont utilisé cette méthode de tirage avec des étiquettes numérotées pour choisir les hommes pour le service militaire. Ci-dessous, 15 numéros de tentes que nous avons sélectionnés en utilisant les étiquettes numérotées, placées dans une boîte:
Dans la figure 8.3, nous avons entouré les tentes qui seraient sélectionnées pour votre exemple:
8.3 Grille numérotée rectangulaire des tentes de la figure 8.2 qui ont été sélectionnées au hasard et entourées. Vous pouvez maintenant visiter chaque tente et trouver combien de personnes se trouvent dans chacune d'entre elles. Ci-dessous, une liste du nombre de personnes qui auront été comptées dans les tentes que vous aurez visitées:
Pour obtenir une estimation du nombre moyen de personnes par tente de cet échantillon, additionnez le nombre total de personnes des 15 tentes (164) et divisez par 15; 164/15=10,933. Nous pouvons maintenant compléter notre formule:
Si vous faites une estimation de cette manière, et que vous mettez au clair ce que vous avez fait, votre estimation sera hautement crédible. Bien sûr, cette estimation est fondée sur un échantillon bien particulier et il faut savoir que l'incertitude est propre au processus d'échantillonnage. Si vous choisissez un autre échantillon (un autre groupe de 15 tentes obtenu par sélection d'étiquettes numérotées), vous obtiendrez une autre valeur pour le nombre moyen de personnes par tente. Néanmoins, votre estimation est bonne et la différence entre les deux estimations est une question de précision; l'erreur provient de l'utilisation d'un processus d'échantillonnage plutôt que de l'utilisation d'un processus de dénombrement de chaque réfugié. L'avantage de cette méthode est qu'un statisticien peut scientifiquement confirmer la précision de votre estimation. Pour les données que vous avez rassemblées dans cet exemple, un statisticien peut vous affirmer que le nombre réel de réfugiés se trouve entre 2 957 et 3 603, avec une précision de plus ou moins 10%. Avez-vous besoin d'une estimation plus précise? Si oui, alors prenez un échantillon plus large (plus de tentes), si vous le pouvez. Note: Dans cet ouvrage, nous ne montrons pas comment calculer la précision d'une telle estimation. En général, cela est le travail du statisticien et vous devriez en trouver un qui pourra vous assister dans le calcul de la précision. L'Association Américaine pour l'Avancement de la Science et l'Association Américaine de Statistique ont compilé un registre de consultants qui peuvent vous aider dans de tels cas. Voir la Préface pour l'adresse.Nous insistons sur la nécessité de prendre un vrai échantillon au hasard. La méthode de la loterie remplit ces conditions si la boîte a été bien secouée. Cette méthode n'est pas très pratique lorsqu'il s'agit d'un grand nombre. Qui écrira 1 000 numéros sur des étiquettes? Dans l'Annexe 3, nous vous montrons comment obtenir les mêmes résultats avec une méthode qui peut être utilisée sur le terrain et qui réduit de beaucoup la somme de travail. Un autre problème pratique peut se présenter: Que se passe-t-il si les tentes ne sont pas organisées comme dans une grille rectangulaire? Nous avions pris cette hypothèse seulement pour vous montrer comment obtenir un échantillon au hasard. Vous ne serez pas souvent dans des situations aussi faciles à calculer que celle décrite ci-dessus, mais les principes discutés dans la section 8.1 sont les fondements de notre estimation. Nous allons maintenant appliquer ces principes d'estimation à des situations plus réalistes. Quelque soit la façon dont les tentes sont organisées, si vous pouvez identifier chaque tente avec un nombre, vous pouvez alors faire une estimation comme celle décrite ci-dessus. 8.2 APPLIQUER LES PRINCIPES DES ESTIMATIONS A PARTIR D'ECHANTILLON Exemple 8.3 Discussion Ce camp n'avait pas qu'une sorte d'habitation, telle qu'une structure identifiée comme une «tente» que vous pouviez échantillonner d'une façon systématique pour estimer le nombre moyen de réfugiés par habitation. Puisque le camp est aménagé sur un terrain relativement plat, vous pouvez définir une unité de zone. Les hectares occupés par le camp seront peut-être connus ou pourront être trouvés en regardant une carte ou quelqu'un pourra les trouver en mesurant les contours du camp. Lorsque vous aurez la surface totale du camp, vous pourrez procéder à l'échantillonnage. Vous devez d'abord décider de l'unité de base: De quelle grandeur la zone devra-t-elle être pour un compte exact? Vous pourriez utiliser un carré de cinq mètres de côté comme unité de base. Il y a donc 25 mètres carrés dans chaque zone et 10 000 mètres carrés dans un hectare. Il y a donc 400 zones dans un hectare. Si le camp occupe 4 hectares, il y a alors 4x400=1 600 zones dans le camp. Comme auparavant, si le même nombre de réfugiés vivaient dans chacune des 1 600 zones, il serait facile de déterminer exactement le nombre de réfugiés. Vous pourriez compter combien de réfugiés vivent dans une zone (comme vous l'avez fait avec l'exemple des tentes) et multiplier par 1 600. Si vous comptiez le nombre de réfugiés dans une zone et que vous trouviez cinq, alors le nombre exact de réfugiés serait 5x1 600=8 000. Une fois de plus, il est peu probable qu'il y aura le même nombre de réfugiés dans chaque zone. Si vous comptiez le nombre de réfugiés dans une des zones et que vous multipliez par 1 600, vous auriez une estimation du nombre total de réfugiés qui serait probablement fausse, comme nous l'avons discuté dans la section précédente. L'étape suivante est la même que lorsque les réfugiés étaient dans des tentes. Déterminez une estimation de la moyenne du nombre de réfugiés par zone et multipliez par le nombre de zones:
Comme auparavant, vous obtenez une valeur convenable pour l'estimation du nombre moyen de réfugiés par zone en choisissant un échantillon au hasard des zones. C'est un peu plus compliqué que de choisir un échantillon au hasard de tentes et de compter les habitants des tentes de l'échantillonnage. Si vous avez une carte, vous pouvez entourer les zones sur la carte, les numéroter et choisir un échantillon au hasard comme dans l'exemple précédent. Il sera sûrement difficile d'identifier les zones avec des nombres. Au mieux, les zones dans lesquelles les réfugiés seront comptés pourront être identifiées approximativement par leur emplacement suite à l'utilisation d'une carte pour numéroter les zones et les choisir au hasard. Ce que vous avez de mieux à faire, c'est de demander aux personnes qui font le dénombrement d'aller «vers le nord jusqu'à tel point et vers l'est jusqu'à cet autre point». Cela est parfaitement satisfaisant s'ils n'émettent aucun avis, comme par exemple de choisir les emplacements les plus faciles. Vous avez alors un échantillon utilisable. Mais comment les personnes comptant les réfugiés doivent-elles faire leur travail? Une façon de faire, est de délimiter une zone rectangulaire en la mesurant au pas, en marchant cinq mètres dans chaque direction. Puisque un pas normal est d'à peu près un mètre, il est facile de compter des pas métrés. Vous pourriez aussi marcher en faisant un cercle de trois mètres de diamètre. De nombreux problèmes pratiques se posent. Par exemple, quelques habitations pourraient dépasser vos limites, apparaissant ainsi dans deux ou plusieurs zones. Que faire? Une façon de faire serait de définir l'emplacement de l'habitation dans la zone où son entrée principale se situe. Lorsqu'on connaît l'environnement changeant et chaotique d'un camp de réfugiés, il est naïf de croire que les personnes que vous voulez compter vont rester au même endroit. Pour faciliter les choses, il serait bien d'avoir deux personnes pour sélectionner les zones et compter. L'une peut délimiter les zones pendant que l'autre compte. Il y aura des problèmes avec le va-et-vient des réfugiés et avec la délimitation de la zone. Vous devez aussi vous inquiéter des personnes faisant le dénombrement. Elles auront souvent tendance à augmenter les chiffres. C'est un problème perpétuel en pratique. Ces erreurs de précision doivent être minimisées. Cependant, des dénombrements légèrement imprécis, mais dont la précision peut être calculée, constituent une bien meilleure solution que de deviner. Exemple 8.5 Discussion Avec des photos aériennes, une façon de compter les réfugiés serait d'étudier celles-ci avec une loupe. Cela serait possible, s'il n'y a que peu de réfugiés dans les habitations. Cela est souvent fait pour des raisons militaires. En assumant que les photos soient de très bonne qualité, compter les milliers de réfugiés serait un travail énorme. Mais, vous savez maintenant quoi faire: divisez le camp en zones égales, choisissez un échantillon au hasard, calculez l'estimation du nombre moyen de réfugiés par zone et multipliez par le total de zones pour obtenir une estimation du nombre total de réfugiés. Il peut y avoir d'autres raisons pour lesquelles vous ne pourriez pas faire le dénombrement d'un camp. Les réfugiés pourraient être hostiles à la visite d'étrangers dans leurs habitations; le travail ne pourrait être fait rapidement; les réfugiés auraient été massés délibéré afin de maximiser le dénombrement; etc. Les photos aériennes peuvent parfois être un moyen économique, sûr et relativement précis. Vous pourriez être intéressés par des variables autres que le total du nombre de réfugiés. L'étendue d'une violation des droits de l'homme peut être mesurée non seulement par le nombre de victimes, mais aussi par la proportion. Exemple 8.6 Discussion Le nombre de disparitions n'est peut-être pas révélateur de l'impact. De nombreux individus peuvent s'absenter de façon inattendue de leur communauté à un rythme assez constant. Par exemple, une petite proportion de la population peut disparaître de la communauté pour des raisons économiques, pour échapper à des responsabilités, pour cause d'humiliations subies, pour cause de maladie mentale, etc. Dans une situation où il y a une menace des violations des droits de l'homme, quelques personnes vont certainement fuir pour échapper à un danger présumé avant même que rien d'évident ne se passe. Dans toute société, il peut être possible de connaître le taux normal d'absences inattendues. Des archives de naissance peuvent exister ou les autorités ont pu conserver une liste des personnes disparues. S'il y a raison de croire que la situation a changé et qu'il y a une augmentation apparente du nombre de disparitions, alors un défenseur des droits de l'homme devrait comparer le taux courant de disparition avec le taux antérieur. Si durant une période de temps donnée, 50 personnes disparaissent, peut-on considérer cela comme un signe d'intimidation? Si nous ne connaissons pas la taille du groupe ethnique, nous ne pouvons rien dire. Si le groupe n'a que 2 000 membres, alors 50 disparitions peuvent apparaître comme beaucoup. Si le groupe a 20 000 membres, alors 50 disparitions peuvent correspondre au taux normal de disparition. Dans ce cas, vous pouvez mettre les données plus en évidence en regardant la proportion des membres du groupe qui ont disparu. Si la taille du groupe était de 2 000, alors la proportion de disparus est de 50 pour 2 000 ou 1 pour 40 (50/2000=1/40). Cependant, si la taille du groupe était de 20 000, alors la proportion de disparus est de 50 pour 20 000 ou 1 pour 400 (50/20 000=1/400). Ci-dessous, le calcul pour cet exemple:
Le taux de disparition, si la taille du groupe est de 2 000, est 2.5%; si la taille du groupe est de 20 000, le taux de disparition est de 0.25%. Il y a une différence d'impact! Après avoir illustré le concept de proportion et la façon d'obtenir un pourcentage, nous donnons un exemple dans lequel nous estimons une proportion à partir d'un échantillon. Exemple 8.7 Discussion Si les habitations peuvent être identifiées par des numéros, alors choisissez un échantillon au hasard des habitations avec une des méthodes que nous avons décrites. Au moment de choisir une habitation, l'enquêteur demande aux habitants de faire le calcul du nombre d'adultes mâles qui vivaient dans l'habitation au début de la période et du nombre d'adultes mâles qui ont disparu depuis le début de la période. Les données que l'enquêteur recueille pour chaque habitation représentent le nombre d'adultes mâles résidents au début de la période et le nombre d'adultes mâles qui ont disparu depuis le début de la période et jusqu'à la fin de la période. Note: De nombreux problèmes pratiques se posent pendant la collecte de ces données; nous n'en discuterons pas ici car nous ne nous servons de cet exemple que pour montrer l'approche de l'estimation. La présentation sous forme de tableau de ces données pourrait ressembler à ce qui suit:
Pour ces données, l'estimation de la proportion de personnes tuées ou de personnes disparues est 0,107 (46/429) ou 10,7%. Un statisticien peut calculer et vous confirmer que la vraie proportion d'adultes tués ou disparus se situe entre 7% et 14%. Si la valeur la plus basse de 7% est, comme elle le sera probablement, plus élevée que le taux normal de disparition de la communauté, alors il y a raison de suspecter qu'il y a une action délibérée. Note: Nous ne montrons pas comment faire un tel calcul dans cet ouvrage. C'est le travail d'un statisticien et vous devriez en chercher un qui pourra vous aider. L'Association Américaine pour l'Avancement de la Science et l'Association Américaine de Statistique ont compilé un registre des consultants qui peuvent vous aider dans de tels cas. Voir la Préface pour l'adresse. Avez-vous besoin d'une estimation plus précise? Prenez donc un échantillon plus large si vous le pouvez. Vous pourrez défendre la validité de cette estimation si elle est questionnée. Vous savez à quel point elle est précise. Une conjecture reste une conjecture. 8.3 UTILISATION DE METHODES INDIRECTES POUR ESTIMER Vous ne serez pas toujours capable d'utiliser un échantillon de probabilité. Parfois, quelles que soient vos ressources, vous ne serez pas capable de faire un dénombrement direct, même avec un échantillon. Il existe un autre moyen d'estimer: en utilisant une méthode indirecte. L'exemple suivant est rapporté par C. Rao, un statisticien connu. Exemple 8.8 Le problème parut difficile à cause des troubles qui existaient à l'époque. Une autre complication se présenta lorsque les statisticiens appelés pour faire le travail se trouvèrent faire partie de la communauté majoritaire (différente de celle des réfugiés). Leur sécurité ne pouvait être garantie si les méthodes statistiques qu'ils allaient utiliser pour estimer le nombre de réfugiés nécessitaient qu'ils entrent dans Fort Rouge. Le problème qui se présenta donc aux experts fut d'évaluer le nombre de personnes à l'intérieur d'une zone donnée sans aucune information sur l'amplitude du chiffre, sans aucune opportunité de regarder la concentration de personnes à l'intérieur de la zone et sans utiliser aucune méthode d'échantillonnage connue pour une estimation.... (1) Discussion Les experts durent penser à une façon de résoudre les problèmes... Ils avaient accès aux factures soumises par l'entreprise au gouvernement qui donnaient les quantités des différentes matières premières tels que riz, haricots et sel achetés pour nourrir les réfugiés.... D'après des sondages de consommation, les besoins par habitant de ces matières étaient connus. Quand les statisticiens divisèrent le montant du riz fourni par la consommation par habitant connue, ils obtinrent un chiffre que nous supposerons être de 30 000 réfugiés. Cela était une estimation de la population du Fort Rouge fondée sur la consommation de riz. Quand ils divisèrent le montant des haricots fournis par la consommation par habitant connue, ils obtinrent un chiffre qui était deux tiers de 30 000, c'est à dire 20 000 réfugiés. Cela était une estimation de la population du Fort Rouge fondée sur la consommation de haricots. Lorsqu'ils firent le même calcul pour le sel, ils obtinrent un autre chiffre d'une valeur de 10 000. Ces trois chiffres, fondés sur les consommations de riz, haricots et sel - 30 000, 20 000, 10 000 - étaient tous des estimations de la même population! Pourquoi y avait-il tant de différence? A cette époque, en Inde, le riz était la matière première la plus chère, les haricots étaient un peu moins chers et le sel était peu cher. Il était donc évident que l'entreprise avait exagéré les montants des matières les plus chères, le riz et les haricots, et qu'elle avait facturé le sel d'une façon plus honnête. La meilleure estimation de la population de Fort Rouge était 10 000, le nombre calculé en utilisant la moins chère des matières premières, le sel (il y avait moins de raison d'augmenter la consommation du sel). L'utilisation de la consommation de sel était une méthode d'estimation indirecte appropriée pour le dénombrement des réfugiés comme il le fut confirmé plus tard dans un plus petit camp où les statisticiens purent entrer. Quelle précision peut-on attribuer à une estimation de cette sorte? Il y a deux sources majeures d'incertitude dans ce type d'estimation. Tout d'abord, même s'il n'existe aucune intention de frauder, il y aura des erreurs propres à l'évaluation du montant de la quantité acheminée. Comment les quantités de sel ont-elles pu être mesurées? Si le sel était en sac, chaque sac aurait pu contenir 100 kilogrammes. Mais tous les sacs ont-ils été pesés? Même s'ils ont été pesés, il y aurait pu y avoir des erreurs dues à l'imprécision de la balance ou à une négligence dans la façon de peser. Il est plus probable que le sel a été entassé à la pelle ou versé dans les sacs. Le poids des sacs serait donc variable. Le poids total a dû être mesuré en pesant les camions ou les chariots dans lesquels le sel a été livré. A moins que l'équipement soit maintenu en bon ordre et que le processus soit supervisé, peser de cette façon implique de considérables erreurs. Une autre source d'erreur est l'utilisation de la consommation moyenne de sel par personne. Cette moyenne a sûrement dû être obtenue grâce à un processus d'échantillonnage avec sa propre imprécision. De telles erreurs ont besoin d'être mises à jour. De nombreuses publications statistiques gouvernementales indiquent les erreurs de calcul des statistiques dont elles tiennent compte. L'exactitude, qui n'a rien à voir avec les erreurs dues à l'échantillonnage, est aussi un facteur. Nous ne savons pas comment l'estimation de la consommation de sel par habitant a été obtenue. Qui peut dire combien de sel est consommé annuellement? Si l'estimation était fondée sur la fraction, production totale de sel par la population, alors chacune de ces variables aurait ses propres sources d'incertitude. Par conséquent, l'estimation du nombre de réfugiés n'est probablement pas plus précise que plus ou moins 10 à 15% (de 8 500 ou 9 000 à 11 000 ou 11 500). C'est suffisant pour détecter des fraudes majeures mais pas des fraudes mineures. C'est en tout cas suffisant pour planifier l'alimentation, l'habillement et le logement des réfugiés. Supposons que les réfugiés aient dû recevoir une compensation monétaire d'un montant fixe. Cette imprécision de l'estimation du nombre de réfugiés aurait pu résulter soit en une insuffisance de fonds soit en un surplus que le gouvernement aurait pu trouver embarrassant. Une fois de plus, cette estimation est bien meilleure pour la défense des droits de l'homme que de tenter de deviner. 1. Les chiffres ont de l'importance lorsqu'il s'agit d'obtenir l'attention du public et une action gouvernementale. 2. Un dénombrement complet nécessite de nombreuses ressources: *Des travailleurs formés *Du temps *Des systèmes et des procédures *De l'argent 3. En plus d'un très probable manque de ressources, un dénombrement complet est souvent impossible. Dans les deux cas, la meilleure chose à faire est de procéder à une estimation à partir d'un échantillon. 4. Avec un échantillon de probabilité, vous pouvez mesurer la précision de votre estimation. 5. Normalement, vous avez besoin de l'aide d'un statisticien pour prendre un échantillon de probabilité. Connaître les principes de base peut vous aider pour les raisons suivantes: *Vous serez peut-être capable d'utiliser les méthodes décrites dans ce chapitre et dans l'Annexe 1. *Si vous suivez ces principes, vous rendrez la tâche plus facile au statisticien qui analysera vos données. *Vous pouvez obtenir de l'aide pour préparer le processus d'échantillonnage et pour analyser les données de votre échantillon en consultant le Registre des Statisticiens décrit dans la Préface. *Certaines personnes évalueront votre travail en fonction de sa conformité à ces principes. 6. Vous obtenez une moyenne en additionnant toutes les valeurs et en divisant par le nombre d'items. 7. Si vous comptez les réfugiés d'un camp, par exemple, et si vous divisez le camp en unités de n'importe quelle sorte (tentes, abris, zones, etc.), vous pouvez obtenir un échantillon au hasard de probabilité en numérotant les unités et en les sélectionnant comme pour une loterie. (Voir aussi l'Annexe 3 pour une autre méthode.) 8. Lorsque vous avez une valeur moyenne pour l'échantillon, vous pouvez estimer la population totale: Nombre Moyen par Unité dans l'Echantillon x Nombre Total d'Unités=Nombre Total Estimé 9. Un statisticien peut calculer la précision d'une telle estimation. 10. Si vous avez besoin d'une estimation plus précise, prenez un échantillon plus large. 11. Dans la pratique de nombreux problèmes se posent, affectant ainsi la précision. Toutefois, des estimations légèrement imprécises avec une précision mesurable sont bien meilleures que de tenter de deviner. 12. L'étendue d'une violation des droits de l'homme peut être mesurée non seulement par le nombre de victimes mais aussi par leur proportion, tels que la proportion ou le pourcentage de personnes tués ou disparues, etc. 13. La proportion est un ratio tel que 200 pour 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||