Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme
CHAPITRE 7Ce que révèlent les cas exceptionnels Le progrès humain est favorisé, non par la conformité, mais par l'aberration Contenu du chapitre INTRODUCTION: Pourquoi chercher des cas exceptionnels? INTRODUCTION: Pourquoi chercher des cas exceptionnels? Les cas exceptionnels sont souvent le premier indice de violations des droits de l'homme. Les rendre visibles d'une façon crédible peut aider à cibler de telles violations et à agir en conséquence.
Ces cas «exceptionnels» sont les drapeaux rouges, mais les données ne peuvent nous dire pourquoi ils ont eu lieu; voici sur quoi le partisan des droits de l'homme doit maintenant travailler. Exemple 7.1 Pour identifier un événement exceptionnel, on doit d'abord savoir ce que sont les événements habituels - ou communs - ou sans intérêt. On a aussi besoin de méthodes pour séparer les événements exceptionnels qui peuvent être dus à une violation des droits de l'homme, du cours ordinaire des événements. Dans ce chapitre, nous allons montrer que beaucoup des méthodes déjà étudiées dans ce livre, associées à d'autres, peuvent être utilisées pour séparer l'exceptionnel de l'ordinaire. Ce sont des outils de base dont on peut se servir facilement. 7.1 UTILISER DES COMPTEURS POUR TROUVER DES CAS EXCEPTIONNELS Dans le Chapitre 4, nous vous avons montré comment chiffrer des catégories (personne tuée, personne disparue, etc.) à l'aide de compteurs utilisés couramment. Le résultat a été un récapitulatif du dénombrement d'une catégorie comme dans l'exemple suivant. Remarquez que chaque barre dans le compteur doit représenter le même type d'élément. 13 personnes tuées lors d'un événement particulier: Mais supposons qu'on veuille compter le nombre de personnes tuées lors de plusieurs événements différents. On peut utiliser une approche similaire, comme nous le montrons dans l'exemple suivant. A partir d'une telle analyse, on trouve souvent les exceptions qui peuvent indiquer une violation des droits de l'homme. Exemple 7.2 Supposons que, dans un pays déterminé, on s'intéresse au temps d'attente (en jours) qu'il faut dans un tel cas pour que le jugement soit rendu. On voudra savoir si certaines caractéristiques de la personne (comme le sexe, l'âge, l'éducation, l'origine ethnique) changent le temps d'attente. Discussion Si on a les données (le temps en jours) d'un nombre de cas, vous allez pouvoir remarquer s'il existe des valeurs exceptionnelles. Une fois trouvées, il est possible de voir si elles sont associées à une catégorie particulière de personnes. Si vos données montrent, par exemple, que le jugement se fait attendre plus pour des femmes en attente de procès pour quitter ou rentrer dans leur pays que pour des hommes, cela pourrait fortement suggérer une violation possible des droits des femmes. En poursuivant cet exemple, supposons que les données suivantes aient été enregistrées pour tous les cas qui sont arrivés devant un tribunal pendant une période de six mois. TEMPS AVANT QUE LE JUGEMENT NE SOIT RENDU
Vous pouvez voir, à partir de ces données, que la variable Temps Pour Que le Jugement Soit Rendu («Temps») a des valeurs qui partent d'un minimum de 1 jusqu'à un maximum de 14. Pour faire un compteur, il suffit de mettre les valeurs (nombre de jours) 1, 2, 3,... ,14 sous forme de liste et de cocher dans votre compteur à chaque fois qu'une valeur a lieu. (La valeur du premier cas est 5 (jours), ainsi on fait une marque à côté de 5 jours dans le compteur qui suit:
Vous faites la même chose, cas par cas, pour tous les 22 cas jusqu'à ce que vous obteniez ce qui suit:
Le compteur a l'avantage d'être une représentation graphique de la distribution des valeurs - comme le montre la longueur du compteur sur une ligne donnée. Il nous dit visuellement où sont situées les valeurs élevées ou faibles, et comment elles sont réparties. Par exemple, les valeurs de «deux» jours et «trois» jours apparaissent cinq fois chacune dans les 22 cases; la valeur de «un» jour apparaît seulement une fois. Ceci est facile à voir si on regarde le compteur. Quel schéma ce compteur vous suggère-t-il? Nous remarquons cinq cas pour lesquels le Temps Avant Que le Jugement Ne Soit Rendu prenait des valeurs élevées par rapport aux 17 autres événements. Ces cas exceptionnels ont pris les valeurs de 8, 12 et 14 jours. Aucun autre cas n'a dépassé six jours. L'étape suivante est de voir s'il n'existe pas de cause particulière qui pourrait expliquer ces cinq temps exceptionnels de 8, 12 et 14 jours. Pour ce faire, on devra rechercher au-delà du compteur et trouver d'autres informations à propos de ces cas. Pour vous donner une idée du mode de raisonnement que nous utilisons dans ce type d'analyse, supposons que la répartition ethnique de ces 22 cas soit la suivante: Exemple 7.3 TEMPS AVANT QUE LE JUGEMENT NE SOIT RENDU
Discussion Si on étudie la représentation des groupes ethniques pour ces 22 cas, on peut constater que les trois valeurs de temps les plus élevées (12, 12, 14 jours) ont toutes lieu pour l'origine ethnique D, et que les autres valeurs les plus élevées (8,8) ont lieu pour les origines ethniques D et B. Il n'y a pas d'autres valeurs faibles pour l'origine ethnique D. Ceci est facile à voir si on donne au compteur la forme suivante.
Ces résultats nous poussent à supposer que le groupe ethnique D a été traité différemment - plus durement - que les autres. Cependant, on doit continuer la recherche pour être sûr que d'autres facteurs, liés à l'identité ethnique, mais pas forcément à un problème de violations des droits de l'homme, ne soient pas la cause de ces longues périodes du Temps Avant Que le Jugement Ne Soit Rendu pour le groupe ethnique D. Supposons, par exemple, que vous trouviez que les membres du groupe ethnique D vivent tous éloignés du tribunal le plus proche, et que les retards dans le traitement de leur cas sont dus au temps du voyage. Il est évident que ceci n'est pas une violation des droits de l'homme. Afin qu'un cas de violation des droits de l'homme soit crédible, on ne peut pas laisser de possibilités non vérifiées. La crédibilité est importante! 7.2 UTILISER DES HISTOGRAMMES POUR TROUVER DES CAS EXCEPTIONNELS Avec un mode de représentation différent, appelé histogramme, on peut mieux visualiser la distribution en représentant les décomptes de chaque valeur du Temps Avant Que le Jugement Ne Soit Rendu en jours par un bâton, comme le montre la Figure 7.1. 7.1. Un histogramme pour les données sur le Temps Pour Que le Jugement Soit Rendu. La longueur de chaque bâton est proportionnelle au nombre de cas pour lesquels il a fallu un nombre donné de jours (0, 1, 2, 3, ..., 15) avant que le jugement ne soit rendu. Dans ce cas particulier de diagramme à barres (l'histogramme), la longueur de chaque barre adjacente montre le nombre de cas pour lesquels on a observé un nombre donné de victimes : la longueur d'une barre correspond au nombre de fois qu'un nombre donné de jours a été observé. Par conséquent, on peut voir d'un seul coup d'oeil que cinq affaires sont passées en jugement au bout de deux jours, deux affaires au bout de 12 jours et une affaire au bout de 14 jours, et ainsi de suite. A quelles questions sur cette situation peut-on répondre en utilisant cet histogramme? *Y a-t-il eu des cas pour lesquels il a fallu 0 jour pour que le jugement soit rendu? Non, donc il n'y a pas de bâton au niveau 0 sur l'axe horizontal. *Pour la même raison, il n'y a pas de bâton au niveau 7 ou 9 ou 10 ou 11 ou 13 ou 15 (jours) sur l'axe horizontal. *Y a-t-il eu des cas dans lesquels il a fallu seulement trois jours avant que le jugement ne soit rendu? Oui, on peut trouver cinq cas qui ont pris trois jours, donc le bâton vertical représentant 3 jours sur l'axe horizontal est haut de cinq unités. *Et, plus important, y a-t-il des cas exceptionnels? Comme on l'a déjà remarqué, il y a des cas qui ont pris les temps extrêmes de 8, 12 et 14 jours. L'utilisation de ce type d'histogramme convient parfaitement pour des cas où les valeurs sont de petits nombres (0, 1, 2, ..., 20, etc.) et pas trop nombreuses. Mais lorsque les valeurs sont de grands nombres (dans les centaines ou dans les milliers), ou des nombres décimaux (8,25, 100,5, etc.), ou correspondent à un nombre important d'événements (plus de 100 par exemple), on ne peut pas montrer chaque valeur dans un histogramme parce qu'il va être trop grand ou trop détaillé pour l'analyse. Afin d'analyser de telles données, on doit rassembler les données pour qu'elles se regroupent dans un nombre limité de bâtons. Dans la plupart des cas, un histogramme contenant de 10 à 20 bâtons est le plus facile à dessiner pour vous et pour faire comprendre vos auditeurs. Pour grouper les données, nous utilisons des «intervalles». A. Remplir les intervalles Définition: Un intervalle pourrait être appelé un conteneur de données; chaque intervalle contient les cas dans lesquels les valeurs des données tombent selon un niveau donné (de 10 à moins de 20, 50 à moins de 100, etc.). Pour manier ces cas qui comportent de grandes quantités de données, on établit une série d'intervalles et on comptabilise le nombre de valeurs qui tombent dans chaque intervalle; ce sont ces chiffres qu'on met en bâton. Par exemple, si vous utilisez des intervalles avec les valeurs de 10, c'est-à-dire, de 0 à moins de 10, de 10 à moins de 20, etc., et qu'on a deux valeurs 12 et 16, alors ces deux valeurs iront dans l'intervalle comprenant les valeurs de 10 à moins de 20 et le chiffre correspondant à cet intervalle sera 2. A cet instant, l'histogramme ressemblera à la Figure 7.2. 7.2. Histogramme montrant le bâton correspondant à un intervalle qui contient deux valeurs tombant dans l'intervalle de 10 à moins de 20. Dans ce cas, les valeurs des données sont 12 et 16. Pour continuer avec cet exemple dans lequel on utilise des intervalles avec les valeurs de dix, c'est-à-dire, de 0 à moins de 10, de 10 à moins de 20, etc., supposons qu'on ait trois valeurs de plus : 21, 25 et 29. Ces trois valeurs appartiennent à l'intervalle comprenant les valeurs de 20 à moins de 30 et le chiffre de cet intervalle sera trois. A présent, l'histogramme ressemblera à la Figure 7.3. 7.3. Histogramme montrant les deux bâtons correspondant aux deux intervalles. Les deux valeurs des données tombant dans l'intervalle de 10 à moins de 20 sont 12 et 16; les trois valeurs des données tombant dans l'intervalle de 20 à moins de 30 sont 21, 25 et 29. Afin de montrer comment des intervalles plus complexes sont construits, nous allons utiliser une nouvelle série de données pour le Temps en Jours Avant Que le Jugement Ne Soit Rendu. Voici la nouvelle série de données sur le temps nécessaire pour amener les affaires devant le tribunal, quand les valeurs sont plus élevées, partant de 22 jours à 193, pour 60 cas (au lieu de 22). Exemple 7.4 TEMPS AVANT QUE LE JUGEMENT NE SOIT RENDU
Discussion Ces données vont d'un minimum de 22 jours à un maximum de 193 jours. Si on avait dessiné un histogramme qui comprenait toutes les valeurs (de 0 à 200) représentées par une marque pour chaque nombre de jour, l'axe horizontal (le long du bas de l'histogramme) aurait été trop long et déroutant pour l'audience ainsi que pour le chercheur. Cependant, en plaçant les données dans des intervalles, on peut faire un histogramme avec seulement dix intervalles le long de la ligne horizontale - chaque intervalle regroupant 20 jours complets. Aucune valeur ne peut tomber dans deux intervalles simultanément, ainsi donc on doit décider où situer les bornes des intervalles. La méthode la plus facile consiste à définir chaque intervalle comme partant de sa borne gauche incluse jusqu'à la gauche de la délimitation suivante (borne droite exclue) - par exemple, de 20 à moins de 40 (on peut dire de 20 à 39,99999...!). Voici les intervalles construits pour les données précédentes. Remarquez que ces données vont être contenues dans 10 intervalles au total. INTERVALLES
A présent on compte combien de valeurs tombent dans chaque intervalle. Comme aucun jugement n'a mis moins de 20 jours à être rendu, il n'y a pas de valeurs dans l'intervalle de 0 à moins de 20. Mais trois affaires ont été entendues dans un délai de 20 à 40 jours (cas n°14 : 22 jours; cas n°42 : 37 jours et cas n°52 : 29 jours). Cette information est contenue dans l'intervalle allant de 20 à moins de 40 jours, et ainsi de suite. Ci-dessous le récapitulatif des données dans cet exemple: INTERVALLES
Si on dessine un bâton pour chaque intervalle, avec une hauteur correspondant au nombre de cas ci-dessus, vous obtenez l'histogramme de la Figure 7.4. 7.4. Histogramme avec des intervalles de largeur de 20 jours avant que le jugement ne soit rendu (Exemple 7.4). La Figure 7.5 est un autre histogramme pour les même données. Cet histogramme a 20 intervalles (deux fois plus d'intervalles que dans l'histogramme précédent), chacun ayant une largeur de 10 jours (moitié moins que dans l'histogramme précédent). Nous montrons cela afin qu'on puisse voir comment la forme essentielle de la distribution des données est conservée avec des différentes tailles d'intervalles. 7.5. Histogramme avec des intervalles de largeur de 10 Jours Avant Que le Jugement Ne Soit Rendu (Exemple 7.4). Remarquez que les caractéristiques de la distribution des données sont essentiellement les mêmes que dans la Figure 7.4 où les largeurs des intervalles étaient de 20 jours. Attention! Il faut être prudent quand on décide du nombre d'intervalles à utiliser. Choisir trop peu d'intervalles par rapport à la quantité de données peut être insuffisant car vous perdriez des détails. Les cas exceptionnels peuvent disparaître de votre vue. L'histogramme de nos données sur les jugements rendus dans la Figure 7.6 a trop peu d'intervalles :
7.6. Histogramme avec des intervalles d'une largeur de 50 jours pour le Temps Avant Que le Jugement Ne Soit Rendu (Exemple 7.4). Remarquez que la plupart des caractéristiques de la distribution des données sont perdues à cause du manque de précision des détails, dû à la largeur trop importante des intervalles. Attention! Il peut aussi y avoir trop d'intervalles d'une largeur trop petite; dans ce cas, vous pouvez avoir trop de détails à voir dans le schéma général de la distribution. La Figure 7.7 est un histogramme de ces mêmes données avec des intervalles qui correspondent à 2 jours complets. Il est évident qu'il y a trop d'éléments à voir dans l'ensemble du schéma. 7.7. Histogramme avec des intervalles d'une largeur de 2 jours pour le temps avant que le jugement ne soit rendu (Exemple 7.4). Remarquez que les principales caractéristiques de la distribution des données sont perdues à cause du trop grand nombre de détails dû à la trop petite largeur des intervalles. B. Quels sont les cas exceptionnels? Si on regarde maintenant les histogrammes avec des intervalles de 20 ou 10 jours (Figures 7.4 et 7.5) pour les données pour le Temps Pour Que le Jugement Soit Rendu, on peut se rendre compte facilement que la plupart des valeurs du Temps Pour Que le Jugement Soit Rendu est concentrée entre 70 et 140. Cinquante-trois valeurs des 60 se situent en dessous de 140 jours. On peut voir facilement qu'un groupe de valeurs entre 160 et 200 jours est séparé de la majorité des valeurs, qu'il dépasse numériquement. Les sept valeurs qui constituent ce groupe se situent toutes au-dessus de 160 jours. Ces sept valeurs - 168, 172, 174, 174, 185, 189 et 193 - représentent les cas qui ont pris un temps inhabituellement long (en nombre de jours) avant que le jugement ne soit rendu : ce sont les valeurs exceptionnelles. Une fois qu'on a vu un schéma comme celui-ci, on peut demander : quelle est la raison pour l'existence de ces cas exceptionnels? Pourquoi ces sept affaires ont-elles nécessité un temps si long? Ces valeurs exceptionnelles correspondent-elles à des variables reliées aux droits de l'homme, comme le groupe ethnique, la classe professionnelle, le sexe ou l'âge? L'histogramme ne peut pas remplacer les réponses à ces questions; c'est ce qu'on a à trouver. L'histogramme peut, par contre, montrer, au chercheur et à d'autres, que quelque chose est arrivé. Note: Ces exemples résultent d'une version simplifiée de l'expérience actuelle d'une organisation non-gouvernementale qui travaille sur les droits de l'homme. Les récapitulatifs graphiques montrés ici, ainsi que les résultats d'une analyse des valeurs exceptionnelles, ont été suffisants pour atteindre l'objectif de cette organisation qui était de montrer, d'une manière indiscutable, une discrimination ethnique qui avait lieu lors de la détermination du temps requis avant qu'une affaire n'arrive devant un tribunal. 7.3 Utiliser une série chronologique pour trouver des situations exceptionnelles Les cas exceptionnels qui apparaissent dans des séries chronologiques peuvent être un premier indice concernant les violations des droits de l'homme, comme on l'a vu dans les exemples des Chapitres 4 et 5 à propos des tombes portant l'inscription Ningún Nombre en Argentine. Ou, comme dans le cas des séries chronologiques des avortements dans l'ex-Yougoslavie, qui ont servi de preuve indirecte aux viols, les cas exceptionnels ont fourni des matériaux utiles pour informer le public et les autorités légales. Dans les cas de droits économiques et sociaux, les séries chronologiques peuvent montrer des zones où une recherche complémentaire est nécessaire; ici aussi, les cas exceptionnels dans de telles séries chronologiques sont nos guides. Exemple 7.5 Emigration nette de Cuba, de 1960 à 1988
Comme nous en avons débattu, la méthode pour traiter les données de séries chronologiques est de tracer une courbe de ces données, que l'on peut voir dans la Figure 7.8. 7.8. Représentation graphique des données de la série chronologique de l'exemple 7.5 concernant l'émigration nette de Cuba, de 1960 à 1988. Discussion Il suffit de regarder cette courbe (Figure 7.8) pour constater un certain nombre de périodes exceptionnelles dans la série chronologique de l'émigration nette (tous les nombres sont exprimés en milliers). A. Au point A de la courbe de la Figure 7.8, l'émigration nette de 1963 est de 15,0, ce qui représente une baisse significative par rapport à la valeur 65,0 de 1962. Mais ceci tout seul n'est pas suffisant pour nous permettre de dire que cette valeur constitue une baisse exceptionnelle; en effet l'émigration nette annuelle a pu fluctuer considérablement pendant les années précédentes. Mais ce n'était pas le cas! Lors des trois années précédentes, l'émigration nette était de 62,5, 67,5 et 65,0. Ces valeurs correspondent à de petits changements arrivant naturellement d'année en année. Ces changements étaient les suivants :
La baisse de 1962 à 1963 est de 10 à 20 fois plus grande que tous les autres changements de la période précédente pour laquelle nous avons des données :
Nous disons que la valeur A est exceptionnelle parce que la baisse de 50,0 est très importante par rapport aux deux changements précédents d'année en année de 5,0 et -2,5. On retrouve cette nouvelle valeur faible pendant 3 ans, ce qui nous fait penser qu'elle est due à des causes particulières et non à des fluctuations normales. En fait, nous savons que c'était le résultat d'un changement de politique gouvernementale : l'annulation de vols commerciaux et autres modes de transport suivant la crise des missiles de Cuba à la fin de l'année 1962, qui a affecté les relations américano-cubaines. B. Au point B de la courbe de la Figure 7.8, nous trouvons une situation similaire en 1966, mais dans la direction opposée, quand l'émigration nette s'est élevée de 20,0 en 1965 à 55,0 en 1966, ce qui représente une augmentation de 35,0. Une fois encore, nous pouvons nous demander si cette valeur est exceptionnelle? Notre critère est le même que précédemment : quelle était la nature de la variation dans la série chronologique antérieure à cet événement? Pour les années 1960 et 1963, les changements annuels de l'émigration nette étaient les suivants :
Mais de 1965 à 1966, le changement était plus important :
Nous disons que la valeur B est exceptionnelle parce que l'augmentation de 35 000 est très importante par rapport aux deux précédents changements d'année en année de 0 et 5 000. On observe une telle valeur élevée pendant 6 ans (jusqu'en 1971), ce qui nous fait penser encore une fois que cette augmentation de 35 000 est due à une cause particulière (changement de politique gouvernementale?) et non à des fluctuations normales. C. Au point C de la courbe de la Figure 7.8, la valeur exceptionnelle élevée d'émigration en 1980 représente un changement très important, comme on peut le voir par rapport aux changements antérieurs d'année en année :
Nous venons de voir qu'un changement important - comme les changements précédents - nous conduit à classer une valeur comme exceptionnelle. Nous avons utilisé comme exemple la série chronologique sur l'émigration nette cubaine parce que les changements illustrent ce point de façon nette. On ne verra pas toujours des changements aussi radicaux, mais la première règle est de toujours vérifier si le changement de certaines valeurs particulières est important en comparaison des variations «normales» qui ont lieu dans la série chronologique. Mais qu'est-ce que la «normale»? On détermine ce qui est normal en regardant le schéma des changements dans les valeurs de la série chronologique pendant une période de temps pendant laquelle on juge qu'il n'y a pas de raison de changement inhabituelle ou «particulière» (telle qu'une nouvelle politique gouvernementale, un conflit ethnique, une pénurie de nourriture ou d'autres ressources). Parfois une raison particulière change le schéma normal de la série chronologique de façon moins marquée. Au lieu d'un seul bond important d'une année à l'autre, la variable commence à changer plus doucement, mais dans une même direction. Nous pouvons lire dans de tels mouvements lents un avertissement précoce, et ainsi identifier une modification progressive de tendance avant qu'elle ne prenne une amplitude plus importante - et probablement catastrophique. Exemple 7.6 7.9. Représentation des données de l'exemple 7.6 pour les deux séries chronologiques, «meurtres par les escadrons de la mort» et «disparitions» au Salvador, 1983-1984. Discussion Il n'y a pas de valeurs extrêmes ou de changements radicaux évidents dans ces deux séries chronologiques. C'est la baisse continue qui représente l'élément exceptionnel ici. Si aucune cause particulière n'était à l'oeuvre, on s'attendrait que la série chronologique varie autour d'un niveau constant en raison des fluctuations normales. Nous avons ici trois baisses successives dans le nombre de meurtres et de disparitions enregistrés. Une forte présomption de l'existence d'une cause particulière réside non seulement dans la baisse régulière de chaque série, mais aussi dans la baisse simultanée des deux séries. Les commentaires des auteurs sont les suivants : «L'interprétation de la tendance à la baisse est multiple. Premièrement, cela peut être dû à une amélioration dans le respect des droits de l'homme. Deuxièmement, cela peut signifier qu'une fraction importante de l'opposition politique au gouvernement est partie en exil. Troisièmement, cela peut signifier que les efforts du gouvernement salvadorien ont été redirigés vers des engagements militaires comme le bombardement de zones écartées. La vérification de ces interprétations est complexe.» Remarquez que les auteurs ne doutent pas qu'une cause particulière soit présente; il s'agit seulement pour eux de déterminer cette cause. Jusqu'à quel point sont exceptionnels les trois mouvements successifs dans la même direction (même s'ils ne sont pas importants)? C'est un événement improbable. S'il n'existe pas de causes spéciales et plus il y a de mouvements successifs dans une même direction, plus la probabilité d'un hasard diminue. Les statisticiens peuvent calculer combien une telle série de mouvements est exceptionnelle, dans le but de montrer clairement l'ampleur des changements. De tels calculs montrent que la probabilité que trois baisses successives arrivent par hasard est de 1/8. Mais, ces calculs dépassent la portée de ce cours. 7.4 MISES EN GARDE SUR L'ANALYSE DES CAS EXCEPTIONNELS Il n'y a pas de formule magique pour trouver des exceptions significatives, seules comptent la vigilance et une connaissance minutieuse du sujet. Voici un exemple d'une situation réelle dans laquelle un problème n'était pas reflété par les données. Les données ont été récoltées correctement et les analyses ont été valables, mais c'est seulement grâce à une connaissance approfondie de la situation, que ce qui ne semblait pas exceptionnel se révéla exceptionnel. Exemple 7.7 Sommaire des principes de base 1. Les cas exceptionnels sont souvent le premier indice pour déceler des violations des droits de l'homme. 2. Les cas exceptionnels sont des indices, mais un travail de recherche doit être effectué par les militants des droits de l'homme. 3. Afin d'identifier les événements exceptionnels, on doit d'abord savoir quels sont les événements communs, habituels, peu remarquables. 4. Le compteur est un récapitulatif utilisé couramment, qui donne une représentation graphique de la distribution des valeurs. Cette représentation est la longueur du compteur ligne par ligne. Cela peut vous aider à différencier visuellement ce qui est courant de ce qui constitue des valeurs exceptionnelles. 5. L'étape suivante est de déterminer s'il y a des causes particulières qui pourraient justifier les valeurs exceptionnelles, en allant au-delà du compteur pour trouver d'autres informations sur les cas associés à ces valeurs. 6. Si les cas ont une identification unique, telle que l'origine ethnique, on peut obtenir des indices pour la recherche de causes particulières en utilisant des symboles dans le compteur. 7. A l'aide d'un histogramme, on peut rendre le compteur plus clair en représentant les nombres de cas associés à chaque valeur par des barres adjacentes. Cela convient à des situations où les valeurs sont des nombres petits (0, 1, 2, ..., 20 environ) et ne sont pas trop nombreuses. 8. Quand les valeurs sont de grands nombres (centaines ou milliers) ou des nombres décimaux, vous devez réduire les données pour qu'elles se répartissent dans 10 à 20 intervalles, donnant ainsi un histogramme avec 10 à 20 barres. 9. Un intervalle est un conteneur de données; il regroupe les données dont les valeurs sont situées entre deux bornes. On établit une série d'intervalles et on regarde combien de valeurs tombent dans chaque intervalle. 10. Aucun cas ne peut appartenir à deux intervalles simultanément. Une méthode facile consiste à définir chaque intervalle comme partant de sa borne gauche incluse jusqu'à la gauche de la délimitation suivante (borne droite exclue). 11. Le fait d'avoir choisi trop peu d'intervalles peut donner des barres trop larges, ce qui cache des détails importants et des cas exceptionnels. 12. Le fait d'avoir choisi trop d'intervalles peut donner des barres trop étroites, ce qui donne trop de détails et encombre le dessin général. 13. L'histogramme ne peut fournir les réponses aux questions «pourquoi», c'est ce que le chercheur doit éclaircir. L'histogramme peut cependant montrer que quelque chose est arrivé. 14. Les valeurs exceptionnelles dans les séries chronologiques peuvent aussi donner des indices de violations des droits de l'homme. 15.Une façon d'identifier les cas exceptionnels dans les séries chronologiques est de comparer le changement représenté par une valeur apparemment exceptionnelle aux schémas de l'habituel, du courant ou des changements banals dans les séries qui ont précédé la valeur suspecte. 16. Parfois, une situation exceptionnelle dans une série chronologique se révèle d'elle-même par des changements incompatibles avec un schéma de changements normaux, par exemple quand une variable commence à changer dans une direction continue (une augmentation ou une baisse progressive). 17. Même un groupe contenant aussi peu que trois mouvements successifs dans la même direction d'une série chronologique est improbable et doit être examiné. 1.Gilbert, M. The Holocaust: A History of the Jews During the Second World War. New York: Holt, Rhinehart & Winston, 1985, pp. 318, 671. 2.Romeu, J., Samuelson, D., and Spirer, H. An assessment of the human rights situation in Cuba. Paper read at the Social Statistics Section, 1992 Joint Statistical Meetings, August 1992, at Boston MA. 3.Valencia-Weber, G. and Weber, R. J. El Salvador: Methods used to document human rights violations, Human Rights Quarterly, 8:4(1986), p. 749. 4.Ibid. p. 748. 7.1. Dans leur article, Systematic monitoring of the rights of minorities: Progress report on a global survey (Le Contrôle systématique des droits des minorités: rapport d'étape d'une vue d'ensemble globale), J. Scarritt et T. Gurr donnent une liste des minorités par région, par pays et par groupe minoritaire. Ci-dessous nous présentons leur liste pour l'Europe de l'Ouest avec les variables Pays, Groupe Minoritaire et Situation Géographique. Les valeurs de la variable Situation Géographique sont les suivantes: R : Régionale, la plupart des membres du groupe habite dans une région contiguë. U : Urbaine, la plupart des membres du groupe habite dans des villes. D : Dispersée, les membres du groupe habitent très éloignés les uns des autres. M : Mélangée, des membres du groupe vivent dans une région contiguë; les autres sont plus éloignés les uns des autres.
a. Faire un compteur pour les quatre valeurs de la variable Situation Géographique.b. Qu'est-ce que vous apprenez sur les situations géographiques des groupes minoritaires en Europe de l'Ouest, comme les chercheurs les ont définies? c. Faire un compteur pour la variable Nombre de Groupes Minoritaires dans chaque pays. d. Quels sont les pays, s'il y en a, qui semblent être des cas exceptionnels? e. Dans le compteur que vous avez fait pour la question (c) ci-dessus, changez les marques du compteur par les valeurs appropriées (R, U, D ou M) pour montrer la situation géographique du groupe. f. A partir de la question (e) ci-dessus, voyez-vous un schéma qui vaudrait la peine d'être remarqué? 7.2. H. Edmonson et S. Lee, dans leur discussion sur les facteurs concernant l'émigration des réfugiés (Population Studies Center (Centre d'Etude des Populations), article de l'institut urbain PSC-DPS-UI-3, Août 1990, Table 1), ont estimé que les taux moyens d'émigration de réfugiés en 1986 par région étaient les suivants :
a. Faire un histogramme du taux moyen de réfugiés. b. Voyez-vous des cas exceptionnels? Lesquels? Pourquoi sont-ils exceptionnels? 7.3. Dans le Rapport sur le Développement Humain de 1991 des Nations Unies, la Table 3.8 indique les données des dettes intérieures pour neuf pays choisis, montrés ci-dessous. Dettes intérieures pour des pays choisis
a. Faire un histogramme du Service des Dettes Nationales comme pourcentage des Dépenses Totales du Gouvernement en utilisant des intervalles d'une largeur de 4%. b. Voyez-vous des cas exceptionnels? Lesquels? Pourquoi? c. Faire un histogramme du Service des Dettes Nationales comme pourcentage du Service Total des Dettes. Choisissez votre propre taille d'intervalles. d. Voyez-vous des cas exceptionnels? Lesquels? Pourquoi? 7.4. Le tableau suivant représente la série chronologique de détentions individuelles par année, de 1979 à 1986, au Chili :
a. Faire une courbe de la série chronologique pour ces données. b. Voyez-vous des années exceptionnelles? Lesquelles? c. Si vous répondez «oui» à la question (b) précédente, justifiez votre décision. 7.5. Le tableau suivant donne la série chronologique du nombre d'exécutions sous une autorité civile, aux Etats-Unis, de 1968 à 1990 :
a. Faire une courbe de la série chronologique pour ces données.b. Voyez-vous quelque chose d'exceptionnel? Qu'est-ce qui est exceptionnel? c. Si vous répondez «oui» à la question (b) précédente, justifiez votre décision. [Contenu] [Preface] [Chapitre 1] [Chapitre 2] [Chapitre 3] [Chapitre 4] [Chapitre 5] [Chapitre 6] [Chapitre 7] [Chapitre 8] [Chapitre 9] [Annexes] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Electronic Resource Centre for Human
Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme