Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme



CHAPITRE 7

Ce que révèlent les cas exceptionnels

Le progrès humain est favorisé, non par la conformité, mais par l'aberration

H. L. Mencken

Contenu du chapitre

INTRODUCTION: Pourquoi chercher des cas exceptionnels?
7.1 Utiliser des compteurs pour trouver des cas exceptionnels
7.2 Utiliser des histogrammes pour trouver des cas exceptionnels
7.3 Utiliser une série chronologique pour trouver des situations exceptionnelles
7.4 Mises en garde sur l'analyse des cas exceptionnels.
SOMMAIRE DES PRINCIPES
REFERENCES
EXERCICES



INTRODUCTION: Pourquoi chercher des cas exceptionnels?

Les cas exceptionnels sont souvent le premier indice de violations des droits de l'homme. Les rendre visibles d'une façon crédible peut aider à cibler de telles violations et à agir en conséquence.

    • Le nombre de détentions en mars et avril était-il élevé d'une façon inhabituelle par rapport aux autres mois?
    • Le nombre de morts d'une année particulière était-il typique, ou bien les chiffres étaient-ils si élevés - ou si faibles - qu'une enquête supplémentaire est essentielle?
    • Pouvons-nous montrer que certains quartiers militaires ont connu beaucoup plus de violations des droits de l'homme que d'autres quartiers?
    • Pouvons-nous montrer aux autorités qu'il a fallu plus de temps pour faire juger, dans une région donnée, un cas de violation des droits de l'homme que dans certaines autres régions du pays?

Ces cas «exceptionnels» sont les drapeaux rouges, mais les données ne peuvent nous dire pourquoi ils ont eu lieu; voici sur quoi le partisan des droits de l'homme doit maintenant travailler.

Exemple 7.1

Quand l'ambassadeur hollandais en Allemagne a pris connaissance de rapports concernant un grand nombre de décès attribués à des crises cardiaques arrivées le même jour à des juifs déportés en 1941 vers des «camps de travail» polonais, il a demandé une enquête officielle. Le nombre exceptionnel de morts rapportées le même jour, pour la même cause, conduit l'ambassadeur à suspecter, à juste titre, que ces personnes ont été tuées de manière systématique.

Pour identifier un événement exceptionnel, on doit d'abord savoir ce que sont les événements habituels - ou communs - ou sans intérêt. On a aussi besoin de méthodes pour séparer les événements exceptionnels qui peuvent être dus à une violation des droits de l'homme, du cours ordinaire des événements.

Dans ce chapitre, nous allons montrer que beaucoup des méthodes déjà étudiées dans ce livre, associées à d'autres, peuvent être utilisées pour séparer l'exceptionnel de l'ordinaire. Ce sont des outils de base dont on peut se servir facilement.

7.1 UTILISER DES COMPTEURS POUR TROUVER DES CAS EXCEPTIONNELS

Dans le Chapitre 4, nous vous avons montré comment chiffrer des catégories (personne tuée, personne disparue, etc.) à l'aide de compteurs utilisés couramment. Le résultat a été un récapitulatif du dénombrement d'une catégorie comme dans l'exemple suivant. Remarquez que chaque barre dans le compteur doit représenter le même type d'élément.

13 personnes tuées lors d'un événement particulier: //// //// ///

Mais supposons qu'on veuille compter le nombre de personnes tuées lors de plusieurs événements différents. On peut utiliser une approche similaire, comme nous le montrons dans l'exemple suivant. A partir d'une telle analyse, on trouve souvent les exceptions qui peuvent indiquer une violation des droits de l'homme.

Exemple 7.2

Le droit des personnes de quitter leur pays de résidence et d'y retourner est considéré comme un droit de l'homme sous le Pacte International relatif aux Droits Civils et Politiques. Mais parfois, on refuse à une personne le droit de quitter son pays ou d'y rentrer, et elle doit faire un procès contre de tels agissements.

Supposons que, dans un pays déterminé, on s'intéresse au temps d'attente (en jours) qu'il faut dans un tel cas pour que le jugement soit rendu. On voudra savoir si certaines caractéristiques de la personne (comme le sexe, l'âge, l'éducation, l'origine ethnique) changent le temps d'attente.

Discussion

Si on a les données (le temps en jours) d'un nombre de cas, vous allez pouvoir remarquer s'il existe des valeurs exceptionnelles. Une fois trouvées, il est possible de voir si elles sont associées à une catégorie particulière de personnes. Si vos données montrent, par exemple, que le jugement se fait attendre plus pour des femmes en attente de procès pour quitter ou rentrer dans leur pays que pour des hommes, cela pourrait fortement suggérer une violation possible des droits des femmes.

En poursuivant cet exemple, supposons que les données suivantes aient été enregistrées pour tous les cas qui sont arrivés devant un tribunal pendant une période de six mois.

TEMPS AVANT QUE LE JUGEMENT NE SOIT RENDU

Numéro
du Cas

Temps
(Jours)

 

Numéro
du Cas

Temps
(Jours)

 1

5

 

12

 2

 2

2

 

13

 3

 3

8

 

14

 2

 4

1

 

15

 2

 5

3

 

16

14

 6

5

 

17

 2

 7

3

 

18

 6

 8

3

 

19

 4

 9

4

 

20

12

10

8

 

21

12

11

4

 

22

 3

Vous pouvez voir, à partir de ces données, que la variable Temps Pour Que le Jugement Soit Rendu («Temps») a des valeurs qui partent d'un minimum de 1 jusqu'à un maximum de 14. Pour faire un compteur, il suffit de mettre les valeurs (nombre de jours) 1, 2, 3,... ,14 sous forme de liste et de cocher dans votre compteur à chaque fois qu'une valeur a lieu.

(La valeur du premier cas est 5 (jours), ainsi on fait une marque à côté de 5 jours dans le compteur qui suit:

Temps en jours

Compteur

 1

 

 2

 

 3

 

 4

 

 5

/

 6

 

 7

 

 8

 

 9

 

10

 

11

 

12

 

13

 

14

 

Vous faites la même chose, cas par cas, pour tous les 22 cas jusqu'à ce que vous obteniez ce qui suit:

Temps en jours

Compteur

1

/

2

////

3

////

4

///

5

//

6

/

7

 

8

//

9

 

10

 

11

 

12

//

13

 

14

/

Le compteur a l'avantage d'être une représentation graphique de la distribution des valeurs - comme le montre la longueur du compteur sur une ligne donnée. Il nous dit visuellement où sont situées les valeurs élevées ou faibles, et comment elles sont réparties. Par exemple, les valeurs de «deux» jours et «trois» jours apparaissent cinq fois chacune dans les 22 cases; la valeur de «un» jour apparaît seulement une fois. Ceci est facile à voir si on regarde le compteur.

Quel schéma ce compteur vous suggère-t-il? Nous remarquons cinq cas pour lesquels le Temps Avant Que le Jugement Ne Soit Rendu prenait des valeurs élevées par rapport aux 17 autres événements. Ces cas exceptionnels ont pris les valeurs de 8, 12 et 14 jours. Aucun autre cas n'a dépassé six jours.

L'étape suivante est de voir s'il n'existe pas de cause particulière qui pourrait expliquer ces cinq temps exceptionnels de 8, 12 et 14 jours. Pour ce faire, on devra rechercher au-delà du compteur et trouver d'autres informations à propos de ces cas.

Pour vous donner une idée du mode de raisonnement que nous utilisons dans ce type d'analyse, supposons que la répartition ethnique de ces 22 cas soit la suivante:

Exemple 7.3

TEMPS AVANT QUE LE JUGEMENT NE SOIT RENDU

Numéro
du Cas

Temps
(Jours)

Groupe
Ethnique

 

Numéro
du Cas

Temps
(Jours)

Groupe
Ethnique

1

5

A

 

12

 2

B

2

2

B

 

13

 3

C

3

8

B

 

14

 2

A

4

1

C

 

15

 2

A

5

3

A

 

16

14

D

6

5

B

 

17

 2

C

7

3

A

 

18

 6

B

8

3

C

 

19

 4

B

9

4

C

 

20

12

D

10

8

D

 

21

12

D

11

4

B

 

22

 3

A

Discussion

Si on étudie la représentation des groupes ethniques pour ces 22 cas, on peut constater que les trois valeurs de temps les plus élevées (12, 12, 14 jours) ont toutes lieu pour l'origine ethnique D, et que les autres valeurs les plus élevées (8,8) ont lieu pour les origines ethniques D et B. Il n'y a pas d'autres valeurs faibles pour l'origine ethnique D. Ceci est facile à voir si on donne au compteur la forme suivante.

Temps en jours

Compteur

 1

C

 2

BBAAC

 3

AACCA

 4

CBB

 5

AB

 6

B

 7

 

 8

BD

 9

 

10

 

11

 

12

DD

13

 

14

D

Ces résultats nous poussent à supposer que le groupe ethnique D a été traité différemment - plus durement - que les autres. Cependant, on doit continuer la recherche pour être sûr que d'autres facteurs, liés à l'identité ethnique, mais pas forcément à un problème de violations des droits de l'homme, ne soient pas la cause de ces longues périodes du Temps Avant Que le Jugement Ne Soit Rendu pour le groupe ethnique D.

Supposons, par exemple, que vous trouviez que les membres du groupe ethnique D vivent tous éloignés du tribunal le plus proche, et que les retards dans le traitement de leur cas sont dus au temps du voyage. Il est évident que ceci n'est pas une violation des droits de l'homme. Afin qu'un cas de violation des droits de l'homme soit crédible, on ne peut pas laisser de possibilités non vérifiées. La crédibilité est importante!

7.2 UTILISER DES HISTOGRAMMES POUR TROUVER DES CAS EXCEPTIONNELS

Avec un mode de représentation différent, appelé histogramme, on peut mieux visualiser la distribution en représentant les décomptes de chaque valeur du Temps Avant Que le Jugement Ne Soit Rendu en jours par un bâton, comme le montre la Figure 7.1.

7.1. Un histogramme pour les données sur le Temps Pour Que le Jugement Soit Rendu. La longueur de chaque bâton est proportionnelle au nombre de cas pour lesquels il a fallu un nombre donné de jours (0, 1, 2, 3, ..., 15) avant que le jugement ne soit rendu.

Dans ce cas particulier de diagramme à barres (l'histogramme), la longueur de chaque barre adjacente montre le nombre de cas pour lesquels on a observé un nombre donné de victimes : la longueur d'une barre correspond au nombre de fois qu'un nombre donné de jours a été observé.

Par conséquent, on peut voir d'un seul coup d'oeil que cinq affaires sont passées en jugement au bout de deux jours, deux affaires au bout de 12 jours et une affaire au bout de 14 jours, et ainsi de suite.

A quelles questions sur cette situation peut-on répondre en utilisant cet histogramme?

*Y a-t-il eu des cas pour lesquels il a fallu 0 jour pour que le jugement soit rendu? Non, donc il n'y a pas de bâton au niveau 0 sur l'axe horizontal.

*Pour la même raison, il n'y a pas de bâton au niveau 7 ou 9 ou 10 ou 11 ou 13 ou 15 (jours) sur l'axe horizontal.

*Y a-t-il eu des cas dans lesquels il a fallu seulement trois jours avant que le jugement ne soit rendu? Oui, on peut trouver cinq cas qui ont pris trois jours, donc le bâton vertical représentant 3 jours sur l'axe horizontal est haut de cinq unités.

*Et, plus important, y a-t-il des cas exceptionnels? Comme on l'a déjà remarqué, il y a des cas qui ont pris les temps extrêmes de 8, 12 et 14 jours.

L'utilisation de ce type d'histogramme convient parfaitement pour des cas où les valeurs sont de petits nombres (0, 1, 2, ..., 20, etc.) et pas trop nombreuses. Mais lorsque les valeurs sont de grands nombres (dans les centaines ou dans les milliers), ou des nombres décimaux (8,25, 100,5, etc.), ou correspondent à un nombre important d'événements (plus de 100 par exemple), on ne peut pas montrer chaque valeur dans un histogramme parce qu'il va être trop grand ou trop détaillé pour l'analyse.

Afin d'analyser de telles données, on doit rassembler les données pour qu'elles se regroupent dans un nombre limité de bâtons. Dans la plupart des cas, un histogramme contenant de 10 à 20 bâtons est le plus facile à dessiner pour vous et pour faire comprendre vos auditeurs. Pour grouper les données, nous utilisons des «intervalles».

A. Remplir les intervalles

Définition: Un intervalle pourrait être appelé un conteneur de données; chaque intervalle contient les cas dans lesquels les valeurs des données tombent selon un niveau donné (de 10 à moins de 20, 50 à moins de 100, etc.).

Pour manier ces cas qui comportent de grandes quantités de données, on établit une série d'intervalles et on comptabilise le nombre de valeurs qui tombent dans chaque intervalle; ce sont ces chiffres qu'on met en bâton.

Par exemple, si vous utilisez des intervalles avec les valeurs de 10, c'est-à-dire, de 0 à moins de 10, de 10 à moins de 20, etc., et qu'on a deux valeurs 12 et 16, alors ces deux valeurs iront dans l'intervalle comprenant les valeurs de 10 à moins de 20 et le chiffre correspondant à cet intervalle sera 2. A cet instant, l'histogramme ressemblera à la Figure 7.2.

7.2. Histogramme montrant le bâton correspondant à un intervalle qui contient deux valeurs tombant dans l'intervalle de 10 à moins de 20. Dans ce cas, les valeurs des données sont 12 et 16.

Pour continuer avec cet exemple dans lequel on utilise des intervalles avec les valeurs de dix, c'est-à-dire, de 0 à moins de 10, de 10 à moins de 20, etc., supposons qu'on ait trois valeurs de plus : 21, 25 et 29. Ces trois valeurs appartiennent à l'intervalle comprenant les valeurs de 20 à moins de 30 et le chiffre de cet intervalle sera trois. A présent, l'histogramme ressemblera à la Figure 7.3.

7.3. Histogramme montrant les deux bâtons correspondant aux deux intervalles. Les deux valeurs des données tombant dans l'intervalle de 10 à moins de 20 sont 12 et 16; les trois valeurs des données tombant dans l'intervalle de 20 à moins de 30 sont 21, 25 et 29.

Afin de montrer comment des intervalles plus complexes sont construits, nous allons utiliser une nouvelle série de données pour le Temps en Jours Avant Que le Jugement Ne Soit Rendu.

Voici la nouvelle série de données sur le temps nécessaire pour amener les affaires devant le tribunal, quand les valeurs sont plus élevées, partant de 22 jours à 193, pour 60 cas (au lieu de 22).

Exemple 7.4

TEMPS AVANT QUE LE JUGEMENT NE SOIT RENDU

Numéro
du Cas

Temps
(Jours)

 

Numéro
du Cas

Temps
(Jours)

 

Numéro
du Cas

Temps
(Jours)

 1

108

 

21

189

 

41

 80

 2

139

 

22

104

 

42

 37

 3

48

 

23

193

 

43

124

 4

112

 

24

79

 

44

100

 5

121

 

25

174

 

45

113

 6

117

 

26

103

 

46

122

 7

132

 

27

101

 

47

122

 8

133

 

28

115

 

48

 92

 9

174

 

29

119

 

49

121

10

123

 

30

168

 

50

 85

11

78

 

31

 97

 

51

110

12

185

 

32

 88

 

52

 29

13

59

 

33

119

 

53

98

14

22

 

34

 99

 

54

 67

15

129

 

35

108

 

55

 76

16

106

 

36

 51

 

56

108

17

172

 

37

128

 

57

105

18

112

 

38

 61

 

58

112

19

126

 

39

 95

 

59

100

20

114

 

40

120

 

60

109

Discussion

Ces données vont d'un minimum de 22 jours à un maximum de 193 jours. Si on avait dessiné un histogramme qui comprenait toutes les valeurs (de 0 à 200) représentées par une marque pour chaque nombre de jour, l'axe horizontal (le long du bas de l'histogramme) aurait été trop long et déroutant pour l'audience ainsi que pour le chercheur.

Cependant, en plaçant les données dans des intervalles, on peut faire un histogramme avec seulement dix intervalles le long de la ligne horizontale - chaque intervalle regroupant 20 jours complets.

Aucune valeur ne peut tomber dans deux intervalles simultanément, ainsi donc on doit décider où situer les bornes des intervalles. La méthode la plus facile consiste à définir chaque intervalle comme partant de sa borne gauche incluse jusqu'à la gauche de la délimitation suivante (borne droite exclue) - par exemple, de 20 à moins de 40 (on peut dire de 20 à 39,99999...!).

Voici les intervalles construits pour les données précédentes. Remarquez que ces données vont être contenues dans 10 intervalles au total.

INTERVALLES

De
(jours)

A

Moins de
(jours)

  0

à moins de

 20

 20

à moins de

 40

 40

à moins de

 60

 60

à moins de

 80

 80

à moins de

100

100

à moins de

120

120

à moins de

140

140

à moins de

160

160

à moins de

180

180

à moins de

200

 

A présent on compte combien de valeurs tombent dans chaque intervalle. Comme aucun jugement n'a mis moins de 20 jours à être rendu, il n'y a pas de valeurs dans l'intervalle de 0 à moins de 20.

Mais trois affaires ont été entendues dans un délai de 20 à 40 jours (cas n°14 : 22 jours; cas n°42 : 37 jours et cas n°52 : 29 jours). Cette information est contenue dans l'intervalle allant de 20 à moins de 40 jours, et ainsi de suite. Ci-dessous le récapitulatif des données dans cet exemple:

INTERVALLES

De
(jours)

A moins de
(jours)

Nombre
de cas

  0

 20

 0

 20

 40

 3

 40

 60

 3

 60

 80

 5

 80

100

 8

100

120

21

120

140

13

140

160

 0

160

180

 4

180

200

 3

 

Si on dessine un bâton pour chaque intervalle, avec une hauteur correspondant au nombre de cas ci-dessus, vous obtenez l'histogramme de la Figure 7.4.

7.4. Histogramme avec des intervalles de largeur de 20 jours avant que le jugement ne soit rendu (Exemple 7.4).

La Figure 7.5 est un autre histogramme pour les même données. Cet histogramme a 20 intervalles (deux fois plus d'intervalles que dans l'histogramme précédent), chacun ayant une largeur de 10 jours (moitié moins que dans l'histogramme précédent). Nous montrons cela afin qu'on puisse voir comment la forme essentielle de la distribution des données est conservée avec des différentes tailles d'intervalles.

7.5. Histogramme avec des intervalles de largeur de 10 Jours Avant Que le Jugement Ne Soit Rendu (Exemple 7.4). Remarquez que les caractéristiques de la distribution des données sont essentiellement les mêmes que dans la Figure 7.4 où les largeurs des intervalles étaient de 20 jours.

Attention! Il faut être prudent quand on décide du nombre d'intervalles à utiliser. Choisir trop peu d'intervalles par rapport à la quantité de données peut être insuffisant car vous perdriez des détails. Les cas exceptionnels peuvent disparaître de votre vue. L'histogramme de nos données sur les jugements rendus dans la Figure 7.6 a trop peu d'intervalles :

7.6. Histogramme avec des intervalles d'une largeur de 50 jours pour le Temps Avant Que le Jugement Ne Soit Rendu (Exemple 7.4). Remarquez que la plupart des caractéristiques de la distribution des données sont perdues à cause du manque de précision des détails, dû à la largeur trop importante des intervalles.

Attention! Il peut aussi y avoir trop d'intervalles d'une largeur trop petite; dans ce cas, vous pouvez avoir trop de détails à voir dans le schéma général de la distribution. La Figure 7.7 est un histogramme de ces mêmes données avec des intervalles qui correspondent à 2 jours complets. Il est évident qu'il y a trop d'éléments à voir dans l'ensemble du schéma.

7.7. Histogramme avec des intervalles d'une largeur de 2 jours pour le temps avant que le jugement ne soit rendu (Exemple 7.4). Remarquez que les principales caractéristiques de la distribution des données sont perdues à cause du trop grand nombre de détails dû à la trop petite largeur des intervalles.

B. Quels sont les cas exceptionnels?

Si on regarde maintenant les histogrammes avec des intervalles de 20 ou 10 jours (Figures 7.4 et 7.5) pour les données pour le Temps Pour Que le Jugement Soit Rendu, on peut se rendre compte facilement que la plupart des valeurs du Temps Pour Que le Jugement Soit Rendu est concentrée entre 70 et 140. Cinquante-trois valeurs des 60 se situent en dessous de 140 jours.

On peut voir facilement qu'un groupe de valeurs entre 160 et 200 jours est séparé de la majorité des valeurs, qu'il dépasse numériquement.

Les sept valeurs qui constituent ce groupe se situent toutes au-dessus de 160 jours. Ces sept valeurs - 168, 172, 174, 174, 185, 189 et 193 - représentent les cas qui ont pris un temps inhabituellement long (en nombre de jours) avant que le jugement ne soit rendu : ce sont les valeurs exceptionnelles.

Une fois qu'on a vu un schéma comme celui-ci, on peut demander : quelle est la raison pour l'existence de ces cas exceptionnels? Pourquoi ces sept affaires ont-elles nécessité un temps si long? Ces valeurs exceptionnelles correspondent-elles à des variables reliées aux droits de l'homme, comme le groupe ethnique, la classe professionnelle, le sexe ou l'âge? L'histogramme ne peut pas remplacer les réponses à ces questions; c'est ce qu'on a à trouver. L'histogramme peut, par contre, montrer, au chercheur et à d'autres, que quelque chose est arrivé.

Note: Ces exemples résultent d'une version simplifiée de l'expérience actuelle d'une organisation non-gouvernementale qui travaille sur les droits de l'homme. Les récapitulatifs graphiques montrés ici, ainsi que les résultats d'une analyse des valeurs exceptionnelles, ont été suffisants pour atteindre l'objectif de cette organisation qui était de montrer, d'une manière indiscutable, une discrimination ethnique qui avait lieu lors de la détermination du temps requis avant qu'une affaire n'arrive devant un tribunal.

7.3 Utiliser une série chronologique pour trouver des situations exceptionnelles

Les cas exceptionnels qui apparaissent dans des séries chronologiques peuvent être un premier indice concernant les violations des droits de l'homme, comme on l'a vu dans les exemples des Chapitres 4 et 5 à propos des tombes portant l'inscription Ningún Nombre en Argentine. Ou, comme dans le cas des séries chronologiques des avortements dans l'ex-Yougoslavie, qui ont servi de preuve indirecte aux viols, les cas exceptionnels ont fourni des matériaux utiles pour informer le public et les autorités légales.

Dans les cas de droits économiques et sociaux, les séries chronologiques peuvent montrer des zones où une recherche complémentaire est nécessaire; ici aussi, les cas exceptionnels dans de telles séries chronologiques sont nos guides.

Exemple 7.5

Dans une étude sur les droits de l'homme à Cuba, des chercheurs ont trouvé que, dans l'Anuario Estadístico de Cuba (le récapitulatif statistique de Cuba) du gouvernement cubain, la série chronologique concernant l'émigration nette était compatible avec les estimations indépendantes (considérées comme reconnues) des expatriés cubains.

Emigration nette de Cuba, de 1960 à 1988

Année

Emigration
Définitive
(milliers)

Année

Emigration
Définitive
(milliers)

1960

62,5

1975

  5,5

1961

67,5

1976

  5,8

1962

65,0

1977

  2,5

1963

15,0

1978

  5,0

1964

15,0

1979

  17,5

1965

20,0

1980

142,5

1966

55,0

1981

 20,0

1967

53,0

1982

 10,0

1968

58,0

1983

 12,0

1969

51,2

1984

 11,0

1970

57,0

1985

 11,2

1971

48,8

1986

 12,5

1972

18,0

1987

  4,5

1973

 7,5

1988

  7,5

1974

 5,0

   

Comme nous en avons débattu, la méthode pour traiter les données de séries chronologiques est de tracer une courbe de ces données, que l'on peut voir dans la Figure 7.8.

7.8. Représentation graphique des données de la série chronologique de l'exemple 7.5 concernant l'émigration nette de Cuba, de 1960 à 1988.

Discussion

Il suffit de regarder cette courbe (Figure 7.8) pour constater un certain nombre de périodes exceptionnelles dans la série chronologique de l'émigration nette (tous les nombres sont exprimés en milliers).

A. Au point A de la courbe de la Figure 7.8, l'émigration nette de 1963 est de 15,0, ce qui représente une baisse significative par rapport à la valeur 65,0 de 1962. Mais ceci tout seul n'est pas suffisant pour nous permettre de dire que cette valeur constitue une baisse exceptionnelle; en effet l'émigration nette annuelle a pu fluctuer considérablement pendant les années précédentes.

Mais ce n'était pas le cas! Lors des trois années précédentes, l'émigration nette était de 62,5, 67,5 et 65,0. Ces valeurs correspondent à de petits changements arrivant naturellement d'année en année. Ces changements étaient les suivants :

 

De

De

A

Changement d'année en année

1960 �

62,5 en augmentation

67,5

5,0

1961 �

67,5 en diminution

65,0

-2,5

La baisse de 1962 à 1963 est de 10 à 20 fois plus grande que tous les autres changements de la période précédente pour laquelle nous avons des données :

De

De

A

Changement d'année en année

1962 à 1963

65,0 en diminution

15,0

-50,0

 

Nous disons que la valeur A est exceptionnelle parce que la baisse de 50,0 est très importante par rapport aux deux changements précédents d'année en année de 5,0 et -2,5.

On retrouve cette nouvelle valeur faible pendant 3 ans, ce qui nous fait penser qu'elle est due à des causes particulières et non à des fluctuations normales. En fait, nous savons que c'était le résultat d'un changement de politique gouvernementale : l'annulation de vols commerciaux et autres modes de transport suivant la crise des missiles de Cuba à la fin de l'année 1962, qui a affecté les relations américano-cubaines.

B. Au point B de la courbe de la Figure 7.8, nous trouvons une situation similaire en 1966, mais dans la direction opposée, quand l'émigration nette s'est élevée de 20,0 en 1965 à 55,0 en 1966, ce qui représente une augmentation de 35,0. Une fois encore, nous pouvons nous demander si cette valeur est exceptionnelle? Notre critère est le même que précédemment : quelle était la nature de la variation dans la série chronologique antérieure à cet événement?

Pour les années 1960 et 1963, les changements annuels de l'émigration nette étaient les suivants :

De

De

A

Changement d'année en année

1963 à 1964

15,0

15,0

0

1964 à 1965

15,0 en augmentation

20.0

5,0

 

Mais de 1965 à 1966, le changement était plus important :

De

De

A

Changement d'année en année

1965 à 1966

20,0 en augmentation

55,0

35,0

Nous disons que la valeur B est exceptionnelle parce que l'augmentation de 35 000 est très importante par rapport aux deux précédents changements d'année en année de 0 et 5 000.

On observe une telle valeur élevée pendant 6 ans (jusqu'en 1971), ce qui nous fait penser encore une fois que cette augmentation de 35 000 est due à une cause particulière (changement de politique gouvernementale?) et non à des fluctuations normales.

C. Au point C de la courbe de la Figure 7.8, la valeur exceptionnelle élevée d'émigration en 1980 représente un changement très important, comme on peut le voir par rapport aux changements antérieurs d'année en année :

DE

A

Changement

1960

1961

  5,0

1961

1962

 -2,5

1962

1963

-50,0

1963

1964

  0,0

1964

1965

  5,0

1965

1966

 35,0

1966

1967

  -2,0

1967

1968

  5,0

1968

1969

 -6,8

1969

1970

  5,8

1970

1971

 -8,2

1971

1972

 -30,8

1972

1973

 -10,5

1973

1974

  -2,5

1974

1975

  0,5

1975

1976

  0,3

1976

1977

 -3,3

1977

1978

  2,5

1978

1979

 12,5

1979

1980

-125,0

Nous venons de voir qu'un changement important - comme les changements précédents - nous conduit à classer une valeur comme exceptionnelle.

Nous avons utilisé comme exemple la série chronologique sur l'émigration nette cubaine parce que les changements illustrent ce point de façon nette. On ne verra pas toujours des changements aussi radicaux, mais la première règle est de toujours vérifier si le changement de certaines valeurs particulières est important en comparaison des variations «normales» qui ont lieu dans la série chronologique. Mais qu'est-ce que la «normale»? On détermine ce qui est normal en regardant le schéma des changements dans les valeurs de la série chronologique pendant une période de temps pendant laquelle on juge qu'il n'y a pas de raison de changement inhabituelle ou «particulière» (telle qu'une nouvelle politique gouvernementale, un conflit ethnique, une pénurie de nourriture ou d'autres ressources).

Parfois une raison particulière change le schéma normal de la série chronologique de façon moins marquée. Au lieu d'un seul bond important d'une année à l'autre, la variable commence à changer plus doucement, mais dans une même direction. Nous pouvons lire dans de tels mouvements lents un avertissement précoce, et ainsi identifier une modification progressive de tendance avant qu'elle ne prenne une amplitude plus importante - et probablement catastrophique.

Exemple 7.6

Les totaux, par périodes de six mois, du nombre des victimes de violations des droits de l'homme au Salvador pour les années 1983 et 1984 (collectés par Tutela Legal) ont été publiés dans le Human Rights Quarterly («Bulletin trimestriel des droits de l'homme») (3). Nous voyons ces données représentées dans la courbe de la Figure 7.9.

7.9. Représentation des données de l'exemple 7.6 pour les deux séries chronologiques, «meurtres par les escadrons de la mort» et «disparitions» au Salvador, 1983-1984.

Discussion

Il n'y a pas de valeurs extrêmes ou de changements radicaux évidents dans ces deux séries chronologiques. C'est la baisse continue qui représente l'élément exceptionnel ici. Si aucune cause particulière n'était à l'oeuvre, on s'attendrait que la série chronologique varie autour d'un niveau constant en raison des fluctuations normales. Nous avons ici trois baisses successives dans le nombre de meurtres et de disparitions enregistrés. Une forte présomption de l'existence d'une cause particulière réside non seulement dans la baisse régulière de chaque série, mais aussi dans la baisse simultanée des deux séries.

Les commentaires des auteurs sont les suivants : «L'interprétation de la tendance à la baisse est multiple. Premièrement, cela peut être dû à une amélioration dans le respect des droits de l'homme. Deuxièmement, cela peut signifier qu'une fraction importante de l'opposition politique au gouvernement est partie en exil. Troisièmement, cela peut signifier que les efforts du gouvernement salvadorien ont été redirigés vers des engagements militaires comme le bombardement de zones écartées. La vérification de ces interprétations est complexe.»

Remarquez que les auteurs ne doutent pas qu'une cause particulière soit présente; il s'agit seulement pour eux de déterminer cette cause.

Jusqu'à quel point sont exceptionnels les trois mouvements successifs dans la même direction (même s'ils ne sont pas importants)? C'est un événement improbable. S'il n'existe pas de causes spéciales et plus il y a de mouvements successifs dans une même direction, plus la probabilité d'un hasard diminue. Les statisticiens peuvent calculer combien une telle série de mouvements est exceptionnelle, dans le but de montrer clairement l'ampleur des changements. De tels calculs montrent que la probabilité que trois baisses successives arrivent par hasard est de 1/8. Mais, ces calculs dépassent la portée de ce cours.

7.4 MISES EN GARDE SUR L'ANALYSE DES CAS EXCEPTIONNELS

Il n'y a pas de formule magique pour trouver des exceptions significatives, seules comptent la vigilance et une connaissance minutieuse du sujet.

Voici un exemple d'une situation réelle dans laquelle un problème n'était pas reflété par les données. Les données ont été récoltées correctement et les analyses ont été valables, mais c'est seulement grâce à une connaissance approfondie de la situation, que ce qui ne semblait pas exceptionnel se révéla exceptionnel.

Exemple 7.7

En évaluant les effets d'une sécheresse, des données sur les variables suivantes ont été rassemblées comme des mesures de malnutrition chez les enfants de moins de six ans: taille, poids et âge. Quand la taille et le poids des enfants mal nourris sont comparés aux normes de l'âge, ils donnent des mesures de «chétivité» (combien d'enfants sont exceptionnels en étant en-dessous de la norme de la taille) et de «maigreur» (combien d'enfants sont exceptionnels en étant en-dessous de la norme du poids) et d'une condition d'ensemble (combien d'enfants sont exceptionnels en étant en-dessous du quotient normal du poids par la taille). Le Docteur John H. Gay, des Ressources de Transformation du Lesotho, a trouvé que beaucoup d'enfants étaient gonflés d'eau et de nourriture à base de maïs à cause de la maladie kwashiorkor de déficience protéique, ce qui leur donnait un taux normal pour le rapport du poids à la taille, même s'ils souffraient sévèrement de malnutrition.

Sommaire des principes de base

1. Les cas exceptionnels sont souvent le premier indice pour déceler des violations des droits de l'homme.

2. Les cas exceptionnels sont des indices, mais un travail de recherche doit être effectué par les militants des droits de l'homme.

3. Afin d'identifier les événements exceptionnels, on doit d'abord savoir quels sont les événements communs, habituels, peu remarquables.

4. Le compteur est un récapitulatif utilisé couramment, qui donne une représentation graphique de la distribution des valeurs. Cette représentation est la longueur du compteur ligne par ligne. Cela peut vous aider à différencier visuellement ce qui est courant de ce qui constitue des valeurs exceptionnelles.

5. L'étape suivante est de déterminer s'il y a des causes particulières qui pourraient justifier les valeurs exceptionnelles, en allant au-delà du compteur pour trouver d'autres informations sur les cas associés à ces valeurs.

6. Si les cas ont une identification unique, telle que l'origine ethnique, on peut obtenir des indices pour la recherche de causes particulières en utilisant des symboles dans le compteur.

7. A l'aide d'un histogramme, on peut rendre le compteur plus clair en représentant les nombres de cas associés à chaque valeur par des barres adjacentes. Cela convient à des situations où les valeurs sont des nombres petits (0, 1, 2, ..., 20 environ) et ne sont pas trop nombreuses.

8. Quand les valeurs sont de grands nombres (centaines ou milliers) ou des nombres décimaux, vous devez réduire les données pour qu'elles se répartissent dans 10 à 20 intervalles, donnant ainsi un histogramme avec 10 à 20 barres.

9. Un intervalle est un conteneur de données; il regroupe les données dont les valeurs sont situées entre deux bornes. On établit une série d'intervalles et on regarde combien de valeurs tombent dans chaque intervalle.

10. Aucun cas ne peut appartenir à deux intervalles simultanément. Une méthode facile consiste à définir chaque intervalle comme partant de sa borne gauche incluse jusqu'à la gauche de la délimitation suivante (borne droite exclue).

11. Le fait d'avoir choisi trop peu d'intervalles peut donner des barres trop larges, ce qui cache des détails importants et des cas exceptionnels.

12. Le fait d'avoir choisi trop d'intervalles peut donner des barres trop étroites, ce qui donne trop de détails et encombre le dessin général.

13. L'histogramme ne peut fournir les réponses aux questions «pourquoi», c'est ce que le chercheur doit éclaircir. L'histogramme peut cependant montrer que quelque chose est arrivé.

14. Les valeurs exceptionnelles dans les séries chronologiques peuvent aussi donner des indices de violations des droits de l'homme.

15.Une façon d'identifier les cas exceptionnels dans les séries chronologiques est de comparer le changement représenté par une valeur apparemment exceptionnelle aux schémas de l'habituel, du courant ou des changements banals dans les séries qui ont précédé la valeur suspecte.

16. Parfois, une situation exceptionnelle dans une série chronologique se révèle d'elle-même par des changements incompatibles avec un schéma de changements normaux, par exemple quand une variable commence à changer dans une direction continue (une augmentation ou une baisse progressive).

17. Même un groupe contenant aussi peu que trois mouvements successifs dans la même direction d'une série chronologique est improbable et doit être examiné.

REFERENCES

1.Gilbert, M. The Holocaust: A History of the Jews During the Second World War. New York: Holt, Rhinehart & Winston, 1985, pp. 318, 671.

2.Romeu, J., Samuelson, D., and Spirer, H. An assessment of the human rights situation in Cuba. Paper read at the Social Statistics Section, 1992 Joint Statistical Meetings, August 1992, at Boston MA.

3.Valencia-Weber, G. and Weber, R. J. El Salvador: Methods used to document human rights violations, Human Rights Quarterly, 8:4(1986), p. 749.

4.Ibid. p. 748.

EXERCICES POUR LE CHAPITRE 7

7.1. Dans leur article, Systematic monitoring of the rights of minorities: Progress report on a global survey (Le Contrôle systématique des droits des minorités: rapport d'étape d'une vue d'ensemble globale), J. Scarritt et T. Gurr donnent une liste des minorités par région, par pays et par groupe minoritaire. Ci-dessous nous présentons leur liste pour l'Europe de l'Ouest avec les variables Pays, Groupe Minoritaire et Situation Géographique. Les valeurs de la variable Situation Géographique sont les suivantes:

R : Régionale, la plupart des membres du groupe habite dans une région contiguë.

U : Urbaine, la plupart des membres du groupe habite dans des villes.

D : Dispersée, les membres du groupe habitent très éloignés les uns des autres.

M : Mélangée, des membres du groupe vivent dans une région contiguë; les autres sont plus éloignés les uns des autres.

 

Pays

Groupe Minoritaire

Situation Géographique

Autriche

Travailleurs itinérants

U

Belgique

Wallons

R

Grande-Bretagne

Asiatiques

U

Grande-Bretagne

Personnes de couleur

U

Finlande

Saami

R

France

Alsaciens

R

France

Basques

R

France

Bretons

R

France

Corses

R

France

Travailleurs immigrants

U

Grèce

Musulmans

R

Italie

Allemands

R

Italie

Sardes

R

Pays-Bas

Catholiques

D

Pays-Bas

Moluquois

D

Irlande du Nord

Catholiques

D

Norvège

Saami

R

Espagne

Basques

R

Suède

Saami

R

Suisse

Travailleurs itinérants

D

Suisse

Jurassiens

R

Allemagne de l'Est

Travailleurs itinérants

U

a. Faire un compteur pour les quatre valeurs de la variable Situation Géographique.

b. Qu'est-ce que vous apprenez sur les situations géographiques des groupes minoritaires en Europe de l'Ouest, comme les chercheurs les ont définies?

c. Faire un compteur pour la variable Nombre de Groupes Minoritaires dans chaque pays.

d. Quels sont les pays, s'il y en a, qui semblent être des cas exceptionnels?

e. Dans le compteur que vous avez fait pour la question (c) ci-dessus, changez les marques du compteur par les valeurs appropriées (R, U, D ou M) pour montrer la situation géographique du groupe.

f. A partir de la question (e) ci-dessus, voyez-vous un schéma qui vaudrait la peine d'être remarqué?

7.2. H. Edmonson et S. Lee, dans leur discussion sur les facteurs concernant l'émigration des réfugiés (Population Studies Center (Centre d'Etude des Populations), article de l'institut urbain PSC-DPS-UI-3, Août 1990, Table 1), ont estimé que les taux moyens d'émigration de réfugiés en 1986 par région étaient les suivants :

 

 

Région

Taux moyen de réfugiés (par millier de personnes)

Afrique de l'ouest

 1,0

Afrique de l'est

10,3

Afrique du nord

98,5

Afrique centrale

15,2

Afrique du sud

13,5

Amérique du sud

 1,0

Amérique centrale

 7,3

Amérique du nord

 0,0

Asie de l'est

 0,0

Asie du Sud

66,9

Asie du sud-est

 4,4

Asie de l'ouest

 0,6

Europe de l'ouest

 0,0

Europe de l'est

 0,4

URSS

 0,0

a. Faire un histogramme du taux moyen de réfugiés.

b. Voyez-vous des cas exceptionnels? Lesquels? Pourquoi sont-ils exceptionnels?

7.3. Dans le Rapport sur le Développement Humain de 1991 des Nations Unies, la Table 3.8 indique les données des dettes intérieures pour neuf pays choisis, montrés ci-dessous.

Dettes intérieures pour des pays choisis

     
 

Pourcentage des dettes intérieures par rapport aux:

Pays

Dépenses Totales du Gouvernement

Dettes Nationales

 

(%)

(%)

Chili

14,5

61,5

Côte d'Ivoire

 8,2

20,7

Inde

 4,1

92,3

Jordanie

 8,1

23,6

Malaisie

33,7

69,9

Niger

 9,2

38,2

Pakistan

 7,1

97,6

Philippines

22,5

62,6

Zimbabwe

 8,8

55,7

a. Faire un histogramme du Service des Dettes Nationales comme pourcentage des Dépenses Totales du Gouvernement en utilisant des intervalles d'une largeur de 4%.

b. Voyez-vous des cas exceptionnels? Lesquels? Pourquoi?

c. Faire un histogramme du Service des Dettes Nationales comme pourcentage du Service Total des Dettes. Choisissez votre propre taille d'intervalles.

d. Voyez-vous des cas exceptionnels? Lesquels? Pourquoi?

7.4. Le tableau suivant représente la série chronologique de détentions individuelles par année, de 1979 à 1986, au Chili :

 

Année

Détentions Individuelles

1979

323

1980

678

1981

678

1981

648

1982

306

1983

641

1984

1960

1985

739

1986

921

a. Faire une courbe de la série chronologique pour ces données.

b. Voyez-vous des années exceptionnelles? Lesquelles?

c. Si vous répondez «oui» à la question (b) précédente, justifiez votre décision.

7.5. Le tableau suivant donne la série chronologique du nombre d'exécutions sous une autorité civile, aux Etats-Unis, de 1968 à 1990 :

Année

Exécutions

1968

 0

1969

 0

1970

 0

1971

 0

1972

 0

1973

 0

1974

 0

1975

 0

1976

 0

1977

 3

1978

 3

1979

 3

1980

 3

1981

 1

1982

 2

1983

 5

1984

21

1985

18

1986

18

1987

25

1988

11

1989

16

1990

23

1991

14

1992

31

1993

38

   

a. Faire une courbe de la série chronologique pour ces données.

b. Voyez-vous quelque chose d'exceptionnel? Qu'est-ce qui est exceptionnel?

c. Si vous répondez «oui» à la question (b) précédente, justifiez votre décision.




L’Analyse des données pour le contrôle des droits de l’homme:

[
Contenu] [Preface] [Chapitre 1] [Chapitre 2] [Chapitre 3] [Chapitre 4] [Chapitre 5] [Chapitre 6] [Chapitre 7] [Chapitre 8] [Chapitre 9] [Annexes]



Back to Index HRE Library

Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme