Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme



CHAPITRE 8

Combien? Faire des estimations

Le roi perdit son chemin dans la jungle et dut passer la nuit dans un arbre. Le jour suivant il déclara à un de ses compagnons de voyage que le nombre de feuilles sur l'arbre était «de tant» (un chiffre réel fut donné). Alors qu'on lui demandait s'il avait compté toutes les feuilles, il répondit, «Non, mais j'ai compté les feuilles de quelques branches et je connais la science du jet de dé.»

D'après la légende indienne, Mahabharat
(Nal-Damayanti Akhyan)

Contenu du chapitre

INTRODUCTION: Pourquoi avons-nous besoin d'estimations?
8.1 Principes des estimations à partir d'échantillons
8.2 Appliquer les principes des estimations à partir d'échantillons
8.3 Utilisation de méthodes indirectes pour estimer
SOMMAIRE DES PRINCIPES
REFERENCES
EXERCICES

 

INTRODUCTION: Pourquoi avons-nous besoin d'estimations?

Que ce soit une disparition, une exécution sommaire, un cas de torture ou un viol, c'est toujours un de trop. Pourtant, une des questions les plus souvent posées aux défenseurs des droits de l'homme est «combien?» Pourquoi est-ce si important?

Les gouvernements, les organisations non-gouvernementales, les médias, et même le public ont tendance, lorsqu'il s'agit des droits de l'homme, à être concernés surtout par l'amplitude («combien?») des violations. Le dénombrement des violations représente une importante part des rapports annuels du Ministère Américain des Affaires Etrangères, Country Reports on Human Rights Practices, qui sont publiés pour assister les membres du Congrès dans leur considération de la loi. De nombreux autres pays tracent le statut des droits de l'homme dans les pays auxquels ils apportent de l'aide. Dans cet effort pour pénétrer «les barrières à la croyance», les chiffres sont également importants.

Dans la course pour gagner l'attention du public -- souvent jouée par les médias -- les violations à grande échelle attirent l'attention par leur amplitude. Dans cette course-là, les chiffres comptent aussi.

Bien sûr, la meilleure preuve serait de savoir exactement combien de personnes ont disparu, ont été assassinées, etc. Mais obtenir un compte exact n'est pas souvent possible, surtout dans les situations extrêmement instables. En général, la meilleure solution est de faire des estimations. Il vaut mieux faire la meilleure estimation possible que d'essayer de deviner.

Il y a deux principaux moyens pour faire des estimations:

Méthode 1: Pour trouver la valeur approximative d'une caractéristique (morts, hospitalisations, disparitions) d'une «population» (personnes, armes, cas hospitaliers, etc.) que vous ne pouvez pas compter, prenez un échantillon de cette population, rassemblez les données sur cette population, et calculez un nombre à partir de ces données. Utilisez ce nombre comme valeur approximative de la caractéristique de cette population.

Ci-dessous, un exemple de cette première méthode d'estimation:

Exemple 8.1

Pour une étude des effets de la guerre sur les enfants, le personnel médical d'une organisation non-gouvernementale visita un grand centre pédiatrique. Ils voulaient déterminer la proportion des enfants traités dans ce centre pour des maladies dues à une sévère malnutrition depuis le début de la guerre. Au départ, il semblait facile de consulter les dossiers médicaux de tous les patients et de déterminer si le patient était traité pour une maladie due à une sévère malnutrition durant la période en question. Par la suite, ils pourraient calculer la proportion de ces dossiers pour donner une valeur à tout le groupe.

Malheureusement, le nombre de dossiers était trop important pour qu'ils aient le temps d'analyser et de calculer durant la période de temps qu'ils avaient de disponible. S'ils ne pouvaient pas analyser tous les dossiers, que pouvaient-ils faire?

Discussion

Pour obtenir la valeur approximative, ils procédèrent de la manière suivante. Ils prirent un échantillon au hasard de plusieurs centaines de dossiers de patients qu'ils pourraient analyser et calculer en temps voulu. (Comment choisir un échantillon au hasard est expliqué plus loin dans ce chapitre.) A partir de ces échantillons, ils calculèrent la proportion de dossiers d'enfants traités pour des maladies dues à une sévère malnutrition. La proportion qu'ils obtinrent de cette façon est leur estimation de la proportion d'enfants traités pour des maladies dues à une sévère malnutrition pour tous les dossiers de patients. Le résultat obtenu n'est pas basé sur une analyse de tous les dossiers, mais seulement sur les dossiers faisant partie de l'échantillon.

Méthode 2: Pour trouver la valeur approximative d'une caractéristique (morts, hospitalisations, disparitions) d'une «population» (personnes, armes, cas hospitaliers, etc.) que vous ne pouvez pas compter, estimez une valeur par calcul basé sur des hypothèses plutôt que sur des données tirées d'un échantillon systématique (comme dans la méthode 1).

Ci-dessous, un exemple de cette seconde méthode d'estimation:

Exemple 8.2

Un professeur du Cambodge estima que le régime de Pol Pot causa «à peu près un million - au plus, un million et demi» de morts. Mais il précisa que «d'autres nombres avaient été donnés, allant de centaines de milliers à trois millions, mais qu'ils reflétaient très souvent des points de vue politiques.»

Discussion

Si les estimations étaient fondées sur une analyse statistique d'un échantillon, tous les observateurs, quels que soient leurs points de vue politiques, auraient trouvé à peu près la même valeur. Pour calculer une estimation à partir de cet exemple, les personnes (qui n'ont probablement pas ou qui ne pouvaient pas obtenir de données réelles) faisant des estimations doivent travailler avec toutes les sources disponibles et doivent faire de nombreuses hypothèses. Différentes données et différentes hypothèses résultent en des estimations numériques variées. Le point de vue politique joue un rôle important dans la façon dont les définitions, les données et les hypothèses sont utilisées et où elles sont utilisées.

Dans ce livre, nous n'utilisons pas cette seconde méthode d'estimation. Dans ce chapitre, nous discutons de la façon d'obtenir des estimations à partir d'échantillons, comme nous l'avons présenté dans la première méthode.

8.1 PRINCIPES DES ESTIMATIONS A PARTIR D'ECHANTILLONS

Ci-dessous, une situation dans laquelle nous essayons de mesurer l'ampleur de la situation en ce qui concerne les droits humains. Cet exemple est tiré d'un événement réel.

Exemple 8.3 Un grand camp, relativement isolé, fut mis en place dans un pays pour les réfugiés d'un pays voisin. Afin de mieux subvenir aux besoins des réfugiés, une organisation non-gouvernementale voulait savoir combien de réfugiés vivaient dans le camp.

Discussion

Comme nous l'avons discuté dans le chapitre 4, compter tous les réfugiés un par un est l'approche directe pour obtenir le nombre de réfugiés dans le camp. Mais compter tous les réfugiés un par un requiert des ressources et de l'organisation.

Au minimum, il vous faudra:

* Suffisamment de travailleurs formés pour faire le travail en temps voulu.

* Un système de calcul qui vous donne l'assurance que vous ne manquez pas quelques réfugiés ou que vous ne les comptez pas plus d'une fois.

* Des moyens efficaces pour recenser les réfugiés.

Tout cela nécessite des ressources que vous n'avez peut-être pas. Plus grand sera le nombre de personnes (ou de maisons ou d'équipement ou d'armes, etc.) à compter, plus complexe sera le procédé. Vous aurez aussi besoin de plus de travailleurs sur le terrain, de plus de statisticiens, etc. Vous manquerez peut-être de temps ou de travailleurs ou de moyens pour établir un système complexe de dénombrement.

Si vous avez les moyens de faire un dénombrement complexe et précis, alors n'hésitez pas. Les organisations de défense des droits de l'homme ont rarement assez de moyens pour faire un dénombrement complet. Le mieux est de faire une estimation basée sur un dénombrement fait à partir d'un échantillon que vous pouvez obtenir en comptant une partie des réfugiés du camp. Les ressources nécessaires pour obtenir un échantillon de taille modeste sont moins importantes que celles nécessaires pour un dénombrement complet.

Comme nous l'avons vu dans le chapitre 3, si vous prenez un échantillon de probabilité, vous pouvez mesurer scientifiquement la précision de votre estimation (Quelle erreur résulte de la façon dont vous avez mesuré?)

En général, le modèle, l'implantation et l'analyse préliminaire d'un échantillon pour faire une estimation de ce genre nécessitent l'expertise d'un statisticien qui connaît la théorie de l'échantillonnage et son application.

Nous n'irons pas aussi loin dans ce manuel. Mais il est important pour le défenseur des droits de l'homme de connaître les principes de base qui permettent de faire de telles estimations.

1. Si vous recueillez vos données selon ces principes, un statisticien pourra faire une analyse pour vous.

2. Vous pourrez travailler d'une façon plus efficace avec un expert en statistique.

3. Lorsque d'autres - surtout de grandes organisations non-gouvernementales et des gouvernements avec leurs propres experts - évalueront votre travail, ils le jugeront selon les principes de base discutés dans ce chapitre. Comprendre leurs points de vue vous aidera à répondre efficacement à leurs questions.

Voici comment vous pouvez utiliser un échantillon de probabilité, pour obtenir une estimation du nombre total de réfugiés dans le camp, qui sera crédible aux yeux des autres.

Exemple 8.4

D'après l'exemple précédent, les représentants des organisations non-gouvernementales visitèrent le camp pour voir s'ils pouvaient faire une estimation du nombre de réfugiés dans le camp. A leur surprise, ils constatèrent que le camp était organisé de façon systématique avec des tentes individuelles placées dans un rectangle, comme dans la figure ci-dessous. Il y avait 15 rangées de 20 tentes (300 tentes.)

La figure 8.1 représente la grille rectangulaire des tentes du camp de réfugiés:

                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       

 

8.1 Grille rectangulaire des tentes dans l'exemple 8.4

Discussion

S'il y avait le même nombre de réfugiés dans chaque tente, il serait facile de déterminer le nombre exact de réfugiés. Vous pourriez compter le nombre de réfugiés vivant dans une tente et multiplier la valeur obtenue par 300. Si vous comptiez le nombre de réfugiés dans une tente et trouviez le chiffre sept, alors le nombre exact de réfugiés serait 7x300=2 100.

Mais il est peu probable qu'il y aura le même nombre de réfugiés dans chaque tente. Les défenseurs des droits de l'homme qui ont travaillé avec des réfugiés savent que le nombre de personnes vivant en camp varie de façon considérable.

Si vous comptiez le nombre de réfugiés dans une tente et que vous multipliez par 300, vous obtiendriez une estimation du nombre total de réfugiés qui ne serait pas crédible. Après tout, cette tente pourrait contenir moins (ou plus) de réfugiés que les autres tentes.

Que faire? Un statisticien mettant au point une telle étude prendrait probablement un échantillon de tentes et, à partir de cet échantillon, calculerait une estimation du nombre moyen de réfugiés par tente, et multiplierait cette valeur par le nombre total de tentes (300) pour obtenir une meilleure estimation que celle décrite ci-dessus.

Note: Pour obtenir une moyenne, trouvez la somme de toutes les données (dans ce cas, le nombre de personnes dans chacune des tentes choisies pour l'échantillon) et divisez cette somme par le nombre d'items (dans ce cas, le nombre de tentes choisies).

Supposons que vous avez un camp avec dix tentes. Vous choisissez un échantillon de quatre tentes pour déterminer le nombre moyen de personnes dans les tentes du camp. Vous trouvez que dans la tente A, il y a quatre personnes; dans la tente B, il y a cinq personnes; dans la tente C, il y a neuf personnes et, dans la tente D, il y a deux personnes. Vous pouvez ensuite calculer la somme des personnes dans les tentes choisies pour l'échantillon:

4+5+9+2=20

Pour obtenir la moyenne, divisez la somme (20) par le nombre de tentes de l'échantillon (4), et vous obtenez une moyenne de 5:

20/4=5

Puisque c'est votre estimation du nombre moyen de personnes par tente, vous pouvez multiplier par le nombre total de tentes pour estimer le nombre total de personnes dans le camp. Pour trouver l'estimation du nombre de personnes dans le camp, vous multipliez la moyenne (5) par le nombre total de tentes dans le camp (10):

10x5=50

Votre estimation du nombre total de personnes dans le camp est 50. La formule pour votre calcul est la suivante:

Estimation du Nombre Moyen de Réfugiés Par Tente x Nombre Total de Tentes
= Estimation du Nombre Total de Réfugiés

Bien sûr, pour un camp avec seulement dix tentes vous n'avez pas besoin de faire une estimation. Vous pouvez tout simplement compter tout le monde. Mais pour des camps plus grands, vous n'aurez pas d'autre choix que de prendre un échantillon.

Ce que vous avez vu ci-dessus est l'essence même d'une approche solide pour estimer le nombre total de réfugiés. Mais, comment obtenir une estimation correcte du nombre moyen de réfugiés par tente? Bien choisir les tentes pour votre échantillon est une étape critique. Si vous voulez que votre estimation soit solide, vous devez choisir les tentes selon une règle de probabilité. Pour un cas comme celui-ci, la méthode appropriée est de choisir un échantillon pris au hasard.

Vous voulez un échantillon au hasard pour les raisons suivantes:

*Un échantillon pris au hasard assure qu'aucun biais n'entre dans la sélection des tentes de votre échantillon. Par exemple, si vous avez choisi les tentes de votre échantillon parmi celles situées près de l'entrée principale, votre exemple sera sans doute constitué de tentes plus bondées que celles du reste du camp.

*Un statisticien peut calculer la précision (voir le Chapitre 4) d'une estimation à partir d'un échantillon pris au hasard. Vous saurez donc si votre estimation est bonne.

Toujours avec les mêmes exemples, nous démontrons la forme la plus simple d'un échantillon pris au hasard.

Puisque le camp est organisé de façon systématique, on peut facilement assigner un numéro d'identification de 1 à 300 (15 rangées de 20 tentes) à chaque tente. Vous pouvez faire cette attribution de numéros en mettant un nombre sur chaque tente ou en utilisant un plan. La figure 8.2 montre une possibilité pour numéroter les 300 tentes.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

8.2 Grille rectangulaire des tentes de la figure 8.1 après numérotation

En assumant que vous avez le personnel, le temps et les autres ressources nécessaires pour compter les personnes dans les 15 tentes et pour enregistrer les résultats, comment obtenez-vous un échantillon au hasard de 15? Une première méthode serait de faire comme pour une loterie: Vous mettez des étiquettes numérotées de 1 à 300 dans une boîte, vous la secouez, et sans regarder vous retirez 15 étiquettes de la boîte. Vous vous rendez ensuite aux tentes choisies et comptez les personnes dans chacune de ces tentes.

Cela vous semble-t-il insensé? ça ne l'est pas. De nombreuses loteries nationales choisissent leurs numéros gagnants de cette façon. De nombreux pays, les Etats-Unis inclus, ont utilisé cette méthode de tirage avec des étiquettes numérotées pour choisir les hommes pour le service militaire.

Ci-dessous, 15 numéros de tentes que nous avons sélectionnés en utilisant les étiquettes numérotées, placées dans une boîte:

 

Tente Echantillon

Numéro de Tente

 1

 77

 2

267

 3

207

 4

 12

 5

 60

 6

190

 7

255

 8

  5

 9

 58

10

235

11

102

12

159

13

259

14

195

15

 71

Dans la figure 8.3, nous avons entouré les tentes qui seraient sélectionnées pour votre exemple:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

8.3 Grille numérotée rectangulaire des tentes de la figure 8.2 qui ont été sélectionnées au hasard et entourées.

Vous pouvez maintenant visiter chaque tente et trouver combien de personnes se trouvent dans chacune d'entre elles. Ci-dessous, une liste du nombre de personnes qui auront été comptées dans les tentes que vous aurez visitées:

 

Tente Echantillon

Numéro des Tentes

Nombre de Personnes

1

 77

11

2

267

14

3

207

10

4

 12

 8

5

 60

11

6

190

12

7

255

 8

8

  5

10

9

102

11

10

235

10

11

 58

15

12

159

 9

13

259

11

14

195

12

15

237

12

Total (nombre de personnes dans les 15 tentes choisies)

164

Pour obtenir une estimation du nombre moyen de personnes par tente de cet échantillon, additionnez le nombre total de personnes des 15 tentes (164) et divisez par 15; 164/15=10,933. Nous pouvons maintenant compléter notre formule:

Estimation du Nombre Moyen de Réfugiés Par Tente

x

Nombre Total de Tentes

=

Estimation du Nombre Total de Réfugiés

         

10 933

x

300

=

3 280

Si vous faites une estimation de cette manière, et que vous mettez au clair ce que vous avez fait, votre estimation sera hautement crédible.

Bien sûr, cette estimation est fondée sur un échantillon bien particulier et il faut savoir que l'incertitude est propre au processus d'échantillonnage. Si vous choisissez un autre échantillon (un autre groupe de 15 tentes obtenu par sélection d'étiquettes numérotées), vous obtiendrez une autre valeur pour le nombre moyen de personnes par tente. Néanmoins, votre estimation est bonne et la différence entre les deux estimations est une question de précision; l'erreur provient de l'utilisation d'un processus d'échantillonnage plutôt que de l'utilisation d'un processus de dénombrement de chaque réfugié.

L'avantage de cette méthode est qu'un statisticien peut scientifiquement confirmer la précision de votre estimation. Pour les données que vous avez rassemblées dans cet exemple, un statisticien peut vous affirmer que le nombre réel de réfugiés se trouve entre 2 957 et 3 603, avec une précision de plus ou moins 10%. Avez-vous besoin d'une estimation plus précise? Si oui, alors prenez un échantillon plus large (plus de tentes), si vous le pouvez.

Note: Dans cet ouvrage, nous ne montrons pas comment calculer la précision d'une telle estimation. En général, cela est le travail du statisticien et vous devriez en trouver un qui pourra vous assister dans le calcul de la précision. L'Association Américaine pour l'Avancement de la Science et l'Association Américaine de Statistique ont compilé un registre de consultants qui peuvent vous aider dans de tels cas. Voir la Préface pour l'adresse.

Nous insistons sur la nécessité de prendre un vrai échantillon au hasard. La méthode de la loterie remplit ces conditions si la boîte a été bien secouée. Cette méthode n'est pas très pratique lorsqu'il s'agit d'un grand nombre. Qui écrira 1 000 numéros sur des étiquettes? Dans l'Annexe 3, nous vous montrons comment obtenir les mêmes résultats avec une méthode qui peut être utilisée sur le terrain et qui réduit de beaucoup la somme de travail.

Un autre problème pratique peut se présenter: Que se passe-t-il si les tentes ne sont pas organisées comme dans une grille rectangulaire? Nous avions pris cette hypothèse seulement pour vous montrer comment obtenir un échantillon au hasard.

Vous ne serez pas souvent dans des situations aussi faciles à calculer que celle décrite ci-dessus, mais les principes discutés dans la section 8.1 sont les fondements de notre estimation. Nous allons maintenant appliquer ces principes d'estimation à des situations plus réalistes. Quelque soit la façon dont les tentes sont organisées, si vous pouvez identifier chaque tente avec un nombre, vous pouvez alors faire une estimation comme celle décrite ci-dessus.

8.2 APPLIQUER LES PRINCIPES DES ESTIMATIONS A PARTIR D'ECHANTILLON

Exemple 8.3

Un camp de réfugiés se trouvait dans une région relativement plate d'un pays. Malheureusement, le camp n'était pas aménagé d'une façon systématique. Les réfugiés vivaient seuls ou en famille. Pour s'abriter, ils utilisaient des tentes, des huttes de fortune faites de morceaux récupérés, ou des morceaux de tissus ou de plastique, représentant une unité familiale. Quelques unes des familles couchaient à même le sol sans abri. Une fois de plus, une organisation non-gouvernementale voulait connaître le nombre de réfugiés.

Discussion

Ce camp n'avait pas qu'une sorte d'habitation, telle qu'une structure identifiée comme une «tente» que vous pouviez échantillonner d'une façon systématique pour estimer le nombre moyen de réfugiés par habitation.

Puisque le camp est aménagé sur un terrain relativement plat, vous pouvez définir une unité de zone. Les hectares occupés par le camp seront peut-être connus ou pourront être trouvés en regardant une carte ou quelqu'un pourra les trouver en mesurant les contours du camp.

Lorsque vous aurez la surface totale du camp, vous pourrez procéder à l'échantillonnage. Vous devez d'abord décider de l'unité de base: De quelle grandeur la zone devra-t-elle être pour un compte exact? Vous pourriez utiliser un carré de cinq mètres de côté comme unité de base. Il y a donc 25 mètres carrés dans chaque zone et 10 000 mètres carrés dans un hectare. Il y a donc 400 zones dans un hectare. Si le camp occupe 4 hectares, il y a alors 4x400=1 600 zones dans le camp.

Comme auparavant, si le même nombre de réfugiés vivaient dans chacune des 1 600 zones, il serait facile de déterminer exactement le nombre de réfugiés. Vous pourriez compter combien de réfugiés vivent dans une zone (comme vous l'avez fait avec l'exemple des tentes) et multiplier par 1 600. Si vous comptiez le nombre de réfugiés dans une zone et que vous trouviez cinq, alors le nombre exact de réfugiés serait 5x1 600=8 000.

Une fois de plus, il est peu probable qu'il y aura le même nombre de réfugiés dans chaque zone. Si vous comptiez le nombre de réfugiés dans une des zones et que vous multipliez par 1 600, vous auriez une estimation du nombre total de réfugiés qui serait probablement fausse, comme nous l'avons discuté dans la section précédente.

L'étape suivante est la même que lorsque les réfugiés étaient dans des tentes. Déterminez une estimation de la moyenne du nombre de réfugiés par zone et multipliez par le nombre de zones:

Estimation du Nombre Moyen de Réfugiés Par Zone

x

Nombre Total de Zones

=

Estimation du Nombre Total de Réfugiés

Comme auparavant, vous obtenez une valeur convenable pour l'estimation du nombre moyen de réfugiés par zone en choisissant un échantillon au hasard des zones. C'est un peu plus compliqué que de choisir un échantillon au hasard de tentes et de compter les habitants des tentes de l'échantillonnage.

Si vous avez une carte, vous pouvez entourer les zones sur la carte, les numéroter et choisir un échantillon au hasard comme dans l'exemple précédent. Il sera sûrement difficile d'identifier les zones avec des nombres. Au mieux, les zones dans lesquelles les réfugiés seront comptés pourront être identifiées approximativement par leur emplacement suite à l'utilisation d'une carte pour numéroter les zones et les choisir au hasard.

Ce que vous avez de mieux à faire, c'est de demander aux personnes qui font le dénombrement d'aller «vers le nord jusqu'à tel point et vers l'est jusqu'à cet autre point». Cela est parfaitement satisfaisant s'ils n'émettent aucun avis, comme par exemple de choisir les emplacements les plus faciles. Vous avez alors un échantillon utilisable.

Mais comment les personnes comptant les réfugiés doivent-elles faire leur travail? Une façon de faire, est de délimiter une zone rectangulaire en la mesurant au pas, en marchant cinq mètres dans chaque direction. Puisque un pas normal est d'à peu près un mètre, il est facile de compter des pas métrés. Vous pourriez aussi marcher en faisant un cercle de trois mètres de diamètre.

De nombreux problèmes pratiques se posent. Par exemple, quelques habitations pourraient dépasser vos limites, apparaissant ainsi dans deux ou plusieurs zones. Que faire? Une façon de faire serait de définir l'emplacement de l'habitation dans la zone où son entrée principale se situe.

Lorsqu'on connaît l'environnement changeant et chaotique d'un camp de réfugiés, il est naïf de croire que les personnes que vous voulez compter vont rester au même endroit. Pour faciliter les choses, il serait bien d'avoir deux personnes pour sélectionner les zones et compter. L'une peut délimiter les zones pendant que l'autre compte.

Il y aura des problèmes avec le va-et-vient des réfugiés et avec la délimitation de la zone. Vous devez aussi vous inquiéter des personnes faisant le dénombrement. Elles auront souvent tendance à augmenter les chiffres. C'est un problème perpétuel en pratique. Ces erreurs de précision doivent être minimisées. Cependant, des dénombrements légèrement imprécis, mais dont la précision peut être calculée, constituent une bien meilleure solution que de deviner.

Exemple 8.5

Un grand camp de réfugiés fut installé dans une région à la fois montagneuse et plate. Malheureusement, il était impossible d'utiliser une des deux méthodes discutées ci-dessus pour estimer le nombre total de réfugiés. Cependant, les forces chargées du maintien de la paix dans cette région prenaient régulièrement des photos aériennes.

Discussion

Avec des photos aériennes, une façon de compter les réfugiés serait d'étudier celles-ci avec une loupe. Cela serait possible, s'il n'y a que peu de réfugiés dans les habitations. Cela est souvent fait pour des raisons militaires. En assumant que les photos soient de très bonne qualité, compter les milliers de réfugiés serait un travail énorme. Mais, vous savez maintenant quoi faire: divisez le camp en zones égales, choisissez un échantillon au hasard, calculez l'estimation du nombre moyen de réfugiés par zone et multipliez par le total de zones pour obtenir une estimation du nombre total de réfugiés.

Il peut y avoir d'autres raisons pour lesquelles vous ne pourriez pas faire le dénombrement d'un camp. Les réfugiés pourraient être hostiles à la visite d'étrangers dans leurs habitations; le travail ne pourrait être fait rapidement; les réfugiés auraient été massés délibéré afin de maximiser le dénombrement; etc. Les photos aériennes peuvent parfois être un moyen économique, sûr et relativement précis.

Vous pourriez être intéressés par des variables autres que le total du nombre de réfugiés. L'étendue d'une violation des droits de l'homme peut être mesurée non seulement par le nombre de victimes, mais aussi par la proportion.

Exemple 8.6

La prévention en temps utile des violations des droits de l'homme est le but de beaucoup de défenseurs des droits de l'homme. Un gouvernement essaie-t-il intentionnellement d'intimider un groupe ethnique en faisant disparaître des membres du groupe? L'intention est normalement difficile à déterminer et les défenseurs des droits de l'homme doivent chercher l'intention en regardant l'impact: Qu'a-t-il été fait au groupe? Plutôt que: Quelle est la véritable intention inconnue de l'auteur du crime?

Discussion

Le nombre de disparitions n'est peut-être pas révélateur de l'impact. De nombreux individus peuvent s'absenter de façon inattendue de leur communauté à un rythme assez constant. Par exemple, une petite proportion de la population peut disparaître de la communauté pour des raisons économiques, pour échapper à des responsabilités, pour cause d'humiliations subies, pour cause de maladie mentale, etc. Dans une situation où il y a une menace des violations des droits de l'homme, quelques personnes vont certainement fuir pour échapper à un danger présumé avant même que rien d'évident ne se passe.

Dans toute société, il peut être possible de connaître le taux normal d'absences inattendues. Des archives de naissance peuvent exister ou les autorités ont pu conserver une liste des personnes disparues. S'il y a raison de croire que la situation a changé et qu'il y a une augmentation apparente du nombre de disparitions, alors un défenseur des droits de l'homme devrait comparer le taux courant de disparition avec le taux antérieur.

Si durant une période de temps donnée, 50 personnes disparaissent, peut-on considérer cela comme un signe d'intimidation? Si nous ne connaissons pas la taille du groupe ethnique, nous ne pouvons rien dire. Si le groupe n'a que 2 000 membres, alors 50 disparitions peuvent apparaître comme beaucoup. Si le groupe a 20 000 membres, alors 50 disparitions peuvent correspondre au taux normal de disparition.

Dans ce cas, vous pouvez mettre les données plus en évidence en regardant la proportion des membres du groupe qui ont disparu. Si la taille du groupe était de 2 000, alors la proportion de disparus est de 50 pour 2 000 ou 1 pour 40 (50/2000=1/40).

Cependant, si la taille du groupe était de 20 000, alors la proportion de disparus est de 50 pour 20 000 ou 1 pour 400 (50/20 000=1/400).

Ci-dessous, le calcul pour cet exemple:

Disparitions

Population

Proportion

Pourcentage

50

 2 000

 1/40

100x1/40 = 2.5%

50

20 000

1/400

100x1/400 = 0.25%

Le taux de disparition, si la taille du groupe est de 2 000, est 2.5%; si la taille du groupe est de 20 000, le taux de disparition est de 0.25%. Il y a une différence d'impact!

Après avoir illustré le concept de proportion et la façon d'obtenir un pourcentage, nous donnons un exemple dans lequel nous estimons une proportion à partir d'un échantillon.

Exemple 8.7

Une organisation non-gouvernementale suspecte qu'il y a un taux excessif de disparition d'adultes mâles dans un village de plusieurs milliers d'habitants. Les villageois vivent par famille dans des habitations individuelles. Le nombre d'habitants et d'habitations est inconnu. A moins d'entrer dans chaque habitation, on ne saura jamais le nombre total d'adultes mâles et le nombre de ceux qui ont disparu. Par conséquent, on ne saura jamais le taux de disparition pendant la période qui nous intéresse. Afin de mesurer et de rapporter l'étendue des violations, l'organisation non-gouvernementale veut estimer la proportion des adultes mâles qui ont disparu dans le village.

Discussion

Si les habitations peuvent être identifiées par des numéros, alors choisissez un échantillon au hasard des habitations avec une des méthodes que nous avons décrites.

Au moment de choisir une habitation, l'enquêteur demande aux habitants de faire le calcul du nombre d'adultes mâles qui vivaient dans l'habitation au début de la période et du nombre d'adultes mâles qui ont disparu depuis le début de la période. Les données que l'enquêteur recueille pour chaque habitation représentent le nombre d'adultes mâles résidents au début de la période et le nombre d'adultes mâles qui ont disparu depuis le début de la période et jusqu'à la fin de la période.

Note: De nombreux problèmes pratiques se posent pendant la collecte de ces données; nous n'en discuterons pas ici car nous ne nous servons de cet exemple que pour montrer l'approche de l'estimation.

La présentation sous forme de tableau de ces données pourrait ressembler à ce qui suit:

Numéro de l'Habitation

Nombre d'Adultes Mâles à l'Origine

Nombre d'Adultes Mâles Disparus

 1

13

1

 2

13

2

 3

14

2

 4

14

0

 5

 9

2

 6

14

1

 7

12

0

 8

 8

2

 9

11

1

10

14

1

11

11

3

12

13

1

13

 8

2

14

 9

2

15

12

1

16

11

1

17

 9

2

18

10

2

19

12

1

20

10

0

21

11

0

22

12

2

23

14

2

24

10

0

25

13

0

26

12

0

27

13

2

28

14

3

29

10

2

30

13

1

31

12

2

32

12

0

33

12

1

34

11

2

35

 8

0

36

12

2

37

13

0

Totals

429

46

 

Pour ces données, l'estimation de la proportion de personnes tuées ou de personnes disparues est 0,107 (46/429) ou 10,7%. Un statisticien peut calculer et vous confirmer que la vraie proportion d'adultes tués ou disparus se situe entre 7% et 14%. Si la valeur la plus basse de 7% est, comme elle le sera probablement, plus élevée que le taux normal de disparition de la communauté, alors il y a raison de suspecter qu'il y a une action délibérée.

Note: Nous ne montrons pas comment faire un tel calcul dans cet ouvrage. C'est le travail d'un statisticien et vous devriez en chercher un qui pourra vous aider. L'Association Américaine pour l'Avancement de la Science et l'Association Américaine de Statistique ont compilé un registre des consultants qui peuvent vous aider dans de tels cas. Voir la Préface pour l'adresse.

Avez-vous besoin d'une estimation plus précise? Prenez donc un échantillon plus large si vous le pouvez.

Vous pourrez défendre la validité de cette estimation si elle est questionnée. Vous savez à quel point elle est précise. Une conjecture reste une conjecture.

8.3 UTILISATION DE METHODES INDIRECTES POUR ESTIMER

Vous ne serez pas toujours capable d'utiliser un échantillon de probabilité. Parfois, quelles que soient vos ressources, vous ne serez pas capable de faire un dénombrement direct, même avec un échantillon. Il existe un autre moyen d'estimer: en utilisant une méthode indirecte.

L'exemple suivant est rapporté par C. Rao, un statisticien connu.

Exemple 8.8

Il y eut des émeutes communales à Delhi en 1947, immédiatement après que l'Inde eut obtenu son indépendance. Un grand nombre de personnes d'une communauté minoritaire prirent refuge au Fort Rouge... Le gouvernement avait la responsabilité de nourrir ces réfugiés. Cette tâche avait été confiée à une entreprise privée. Puisqu'il ne connaissait pas le nombre de réfugiés, le gouvernement fut forcé d'accepter et de payer les montants réclamés par l'entreprise pour les diverses matières premières qu'elle avait achetées pour nourrir les réfugiés. La dépense du gouvernement pour ce compte semblait être très élevée et il fut suggéré que des statisticiens évaluent le nombre de réfugiés dans le Fort Rouge.

Le problème parut difficile à cause des troubles qui existaient à l'époque. Une autre complication se présenta lorsque les statisticiens appelés pour faire le travail se trouvèrent faire partie de la communauté majoritaire (différente de celle des réfugiés). Leur sécurité ne pouvait être garantie si les méthodes statistiques qu'ils allaient utiliser pour estimer le nombre de réfugiés nécessitaient qu'ils entrent dans Fort Rouge. Le problème qui se présenta donc aux experts fut d'évaluer le nombre de personnes à l'intérieur d'une zone donnée sans aucune information sur l'amplitude du chiffre, sans aucune opportunité de regarder la concentration de personnes à l'intérieur de la zone et sans utiliser aucune méthode d'échantillonnage connue pour une estimation.... (1)

Discussion

Les experts durent penser à une façon de résoudre les problèmes... Ils avaient accès aux factures soumises par l'entreprise au gouvernement qui donnaient les quantités des différentes matières premières tels que riz, haricots et sel achetés pour nourrir les réfugiés....

D'après des sondages de consommation, les besoins par habitant de ces matières étaient connus.

Quand les statisticiens divisèrent le montant du riz fourni par la consommation par habitant connue, ils obtinrent un chiffre que nous supposerons être de 30 000 réfugiés. Cela était une estimation de la population du Fort Rouge fondée sur la consommation de riz.

Quand ils divisèrent le montant des haricots fournis par la consommation par habitant connue, ils obtinrent un chiffre qui était deux tiers de 30 000, c'est à dire 20 000 réfugiés. Cela était une estimation de la population du Fort Rouge fondée sur la consommation de haricots.

Lorsqu'ils firent le même calcul pour le sel, ils obtinrent un autre chiffre d'une valeur de 10 000.

Ces trois chiffres, fondés sur les consommations de riz, haricots et sel - 30 000, 20 000, 10 000 - étaient tous des estimations de la même population! Pourquoi y avait-il tant de différence?

A cette époque, en Inde, le riz était la matière première la plus chère, les haricots étaient un peu moins chers et le sel était peu cher. Il était donc évident que l'entreprise avait exagéré les montants des matières les plus chères, le riz et les haricots, et qu'elle avait facturé le sel d'une façon plus honnête. La meilleure estimation de la population de Fort Rouge était 10 000, le nombre calculé en utilisant la moins chère des matières premières, le sel (il y avait moins de raison d'augmenter la consommation du sel). L'utilisation de la consommation de sel était une méthode d'estimation indirecte appropriée pour le dénombrement des réfugiés comme il le fut confirmé plus tard dans un plus petit camp où les statisticiens purent entrer.

Quelle précision peut-on attribuer à une estimation de cette sorte? Il y a deux sources majeures d'incertitude dans ce type d'estimation. Tout d'abord, même s'il n'existe aucune intention de frauder, il y aura des erreurs propres à l'évaluation du montant de la quantité acheminée. Comment les quantités de sel ont-elles pu être mesurées?

Si le sel était en sac, chaque sac aurait pu contenir 100 kilogrammes. Mais tous les sacs ont-ils été pesés? Même s'ils ont été pesés, il y aurait pu y avoir des erreurs dues à l'imprécision de la balance ou à une négligence dans la façon de peser. Il est plus probable que le sel a été entassé à la pelle ou versé dans les sacs. Le poids des sacs serait donc variable.

Le poids total a dû être mesuré en pesant les camions ou les chariots dans lesquels le sel a été livré. A moins que l'équipement soit maintenu en bon ordre et que le processus soit supervisé, peser de cette façon implique de considérables erreurs.

Une autre source d'erreur est l'utilisation de la consommation moyenne de sel par personne. Cette moyenne a sûrement dû être obtenue grâce à un processus d'échantillonnage avec sa propre imprécision. De telles erreurs ont besoin d'être mises à jour. De nombreuses publications statistiques gouvernementales indiquent les erreurs de calcul des statistiques dont elles tiennent compte.

L'exactitude, qui n'a rien à voir avec les erreurs dues à l'échantillonnage, est aussi un facteur. Nous ne savons pas comment l'estimation de la consommation de sel par habitant a été obtenue. Qui peut dire combien de sel est consommé annuellement? Si l'estimation était fondée sur la fraction, production totale de sel par la population, alors chacune de ces variables aurait ses propres sources d'incertitude.

Par conséquent, l'estimation du nombre de réfugiés n'est probablement pas plus précise que plus ou moins 10 à 15% (de 8 500 ou 9 000 à 11 000 ou 11 500). C'est suffisant pour détecter des fraudes majeures mais pas des fraudes mineures. C'est en tout cas suffisant pour planifier l'alimentation, l'habillement et le logement des réfugiés.

Supposons que les réfugiés aient dû recevoir une compensation monétaire d'un montant fixe. Cette imprécision de l'estimation du nombre de réfugiés aurait pu résulter soit en une insuffisance de fonds soit en un surplus que le gouvernement aurait pu trouver embarrassant.

Une fois de plus, cette estimation est bien meilleure pour la défense des droits de l'homme que de tenter de deviner.

SOMMAIRE DES PRINCIPES

1. Les chiffres ont de l'importance lorsqu'il s'agit d'obtenir l'attention du public et une action gouvernementale.

2. Un dénombrement complet nécessite de nombreuses ressources:

*Des travailleurs formés

*Du temps

*Des systèmes et des procédures

*De l'argent

3. En plus d'un très probable manque de ressources, un dénombrement complet est souvent impossible. Dans les deux cas, la meilleure chose à faire est de procéder à une estimation à partir d'un échantillon.

4. Avec un échantillon de probabilité, vous pouvez mesurer la précision de votre estimation.

5. Normalement, vous avez besoin de l'aide d'un statisticien pour prendre un échantillon de probabilité. Connaître les principes de base peut vous aider pour les raisons suivantes:

*Vous serez peut-être capable d'utiliser les méthodes décrites dans ce chapitre et dans l'Annexe 1.

*Si vous suivez ces principes, vous rendrez la tâche plus facile au statisticien qui analysera vos données.

*Vous pouvez obtenir de l'aide pour préparer le processus d'échantillonnage et pour analyser les données de votre échantillon en consultant le Registre des Statisticiens décrit dans la Préface.

*Certaines personnes évalueront votre travail en fonction de sa conformité à ces principes.

6. Vous obtenez une moyenne en additionnant toutes les valeurs et en divisant par le nombre d'items.

7. Si vous comptez les réfugiés d'un camp, par exemple, et si vous divisez le camp en unités de n'importe quelle sorte (tentes, abris, zones, etc.), vous pouvez obtenir un échantillon au hasard de probabilité en numérotant les unités et en les sélectionnant comme pour une loterie. (Voir aussi l'Annexe 3 pour une autre méthode.)

8. Lorsque vous avez une valeur moyenne pour l'échantillon, vous pouvez estimer la population totale:

Nombre Moyen par Unité dans l'Echantillon x Nombre Total d'Unités=Nombre Total Estimé

9. Un statisticien peut calculer la précision d'une telle estimation.

10. Si vous avez besoin d'une estimation plus précise, prenez un échantillon plus large.

11. Dans la pratique de nombreux problèmes se posent, affectant ainsi la précision. Toutefois, des estimations légèrement imprécises avec une précision mesurable sont bien meilleures que de tenter de deviner.

12. L'étendue d'une violation des droits de l'homme peut être mesurée non seulement par le nombre de victimes mais aussi par leur proportion, tels que la proportion ou le pourcentage de personnes tués ou disparues, etc.

13. La proportion est un ratio tel que 200 pour 2