Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme
CHAPITRE 4Les types de données Un fait en lui-même n'est rien. Il n'a de valeur que pour l'idée qui lui est attachée, ou pour la preuve qu'il fournit. Contenu du chapitre Les types de données4.1 Dénombrements/Comptages 4.2 Catégories 4.3 Mesures 4.4 Séries temporelles SOMMAIRE DES PRINCIPES REFERENCES EXERCICES Les types de données Les données se présentent sous différentes formes. On doit avoir quelques connaissances de ces formes, pour savoir comment les présenter et les analyser. On n'a pas besoin d'en connaître les nomenclatures et les définitions pour le travail de défense des droits de l'homme. On n'a besoin que de savoir comment les rassembler et les analyser. Définition: Les «comptages» sont des nombres entiers incluant zéro: 0,1,2,3,... Ils sont une forme de base des données dans tout travail statistique. Voici des exemples de nombres qui ne sont pas entiers: 3/2, 8.6, 10 1/4.Les dénombrements sont particulièrement importants dans le domaine des droits de l'homme. Pour ceux qui travaillent dans ce domaine, un individu qui a été victime de violence c'est toujours un de trop. Mais pour attirer l'attention du public et des gouvernements, l'amplitude du dénombrement (combien?) est importante: Combien de personnes ont disparu, combien ont été enlevées de force, combien de corps sont enterrés dans une fosse commune, combien de fois un village a-t-il été bombardé? Même si on ne peut qu'estimer le nombre de violations, même si le comptage n'est peut-être pas complet, on doit commencer par dénombrer les incidents qu'on peut obtenir. La façon la plus fiable pour déterminer «combien» est de compter physiquement le nombre de morts, le nombre de blessés, etc. C'est parce qu'il avait besoin d'un compte exact que le représentant, décrit dans le Chapitre 2, a pris le risque qui l'a conduit à être torturé. Mais il est souvent difficile d'obtenir des comptages précis. Il existe de nombreuses études qui montrent combien d'erreurs sont faites même si la personne effectue son comptage en situation de laboratoire contrôlée et qu'elle compte des objets inanimés; les dénombrements de seconde main sont encore moins fiables. Cependant, si des dénombrements de seconde main sont les seuls qu'on peut obtenir, ils doivent être utilisés. Pourvu que le rapport publié indique de quelle façon les données ont été obtenues. A. La Variable Définition: Les statisticiens définissent une variable comme une quantité pouvant prendre différentes valeurs. Toutes les données doivent se rapporter à une variable. Exemple 4.1 En utilisant cette base de données, on peut obtenir les valeurs de nombreuses variables. Par exemple, le nombre de violations par la Police Nationale dans la zone J est une variable pour laquelle on peut obtenir une valeur dans l'Index.
Si l'Index indique qu'il y a 180 violations, alors vous obtenez le résultat suivant:
Pouvez-vous aussi faire des dénombrements à partir de variables qui ne sont pas numériques? Exemple 4.2 Discussion Chaque événement documentant «confiscations» représente «un» comptage de confiscation. Cette description apparaît fréquemment, et pour obtenir le nombre total de confiscations, on n'a qu'à compter combien de fois «oui» apparaît dans les témoignages. B Le Pointage Compter n'est pas facile! Doigts, compteurs mécaniques ou automatiques, etc sont quelques-uns des nombreux moyens de compter un par un. Un moyen classique pour compter est de pointer, c'est-à-dire en utilisant une marque écrite. Les anciens Sumériens pointaient avec des marques sur des tableaux d'argile, les premiers Anglais faisaient des entailles sur du bois, et quelques-uns des caractères chinois pour les nombres sont une forme de pointage représenté par un trait pour chaque unité. Un compteur mécanique sera peut-être disponible. Si on n'en a pas et qu'on doit utiliser crayon et papier, on peut pointer en utilisant une méthode simple: Une marque pour chaque item compté avec une barre horizontale en travers pour marquer le cinquième item.
Cette méthode est comprise partout. Elle n'est pas une garantie de précision, mais elle vaut mieux que des méthodes non-écrites. Elle comporte aussi un avantage: Elle indique un nombre graphiquement, car si le comptage est plus élevé, le marquage est plus long. Note: A propos des méthodes de pointage: la méthode que nous montrons est courante dans les pays occidentaux industrialisés. D'autres cultures pourront avoir des méthodes intéressantes qui leur sont propres. Exemple 4.3 Discussion Pour obtenir ces nombres, vous devez regarder chaque fiche. Si une mort a été enregistrée, vous le marquez sur une ligne. Si une disparition a été enregistrée, vous le marquez sur la ligne suivante.
Vous pouvez ainsi voir rapidement le nombre de disparus et de tués - une comparaison présentée de façon dramatique. Notez que les marques peuvent s'additionner pour donner un nombre:
Définition: Une catégorie est le nom pour une caractéristique grâce à laquelle des gens ou des objets peuvent être identifiés. Suivent des exemples de catégories: mâle ou femelle, chrétien, musulman, juif, animiste, bouddhiste, blessé ou non-blessé, combattant ou non-combattant, disparu, tué. Les catégories doivent être reliées à une variable, comme nous le montrons dans l'exemple suivant. Exemple 4.4
Discussion Dans cet exemple, les valeurs des variables sont des catégories. La première variable est «genre», et les valeurs qu'elle peut prendre sont «mâle» ou «femelle». Cependant, si on a une série de dossiers, on peut compter le nombre de fois où les catégories «mâle» et «femelle» apparaissent et cela donnera le compte. Ce compte est un item numérique de données. Dans le Chapitre 5, nous montrons comment ces comptes sont déterminés, utilisés et présentés.
Exemple 4.5 En utilisant l'origine ethnique pour exemple, on pourait obtenir ce qui suit:
Pour une victime en particulier, on pourrait obtenir:
L'obligation statistique fondamentale pour les catégories, c'est qu'elles doivent être réciproquement exclusives et exhaustives. A. Catégories réciproquement exclusives Définition: «Réciproquement exclusive» signifie que les catégories ne se chevauchent pas. Aucune personne ou aucune chose ne peut appartenir à deux catégories en même temps. Par conséquent, si on prépare un ensemble de catégories religieuses, on ne peut utiliser à la fois musulman et sunnite musulman. Un sunnite musulman est aussi un musulman. Donc, si on a une victime qui est identifiée comme sunnite musulman, on pourrait la compter deux fois. Une fois comme musulman et une fois comme sunnite musulman, ce qui produirait un mauvais compte pour les deux groupes. Pour résoudre cela, on pourrait utiliser les catégories sunnite musulman et autres musulmans; vous pourriez tous les identifier comme musulman; ou vous pourriez donner une liste de tous les groupes connus de musulmans plus autres musulmans. Notez que cette règle fonctionne de façon hiérarchique. Si on décide de séparer les musulmans en plusieurs catégories, alors ces catégories doivent être réciproquement exclusives. En observant cette règle, voici la manière de séparer les musulmans en plusieurs catégories:
B. Catégories Exhaustives Définition: «Exhaustive» signifie qu'il existe une catégorie pour chaque cas (dossier, victime, auteur du meurtre, événement, etc.) Par conséquent, dans le cas de la dénomination religieuse, il ne serait pas satisfaisant dans certaines régions de travailler à partir d'une liste de catégories de vicarial dont les religions seraient limitées comme ce qui suit: Juif, Chrétien, Musulman Ces trois catégories ne seraient pas exhaustives si quelques-unes des vicarial sont, par exemple, bouddhistes. Dans certaines régions, la liste suivante serait exhaustive: Juif, Chrétien, Musulman Bouddhiste, Animiste, Hindou, Autres Comment savez-vous quelle catégories utiliser? Voici quelques directives possibles: *Utiliser la connaissance qu'on a de la situation, ou demander de l'aide à quelqu'un, pour déterminer quelles catégories sont importantes. *Créer une catégorie pour chaque groupe qui est plus nombreux que le groupe de référence. *Inclure les groupes qui sont ciblés pour l'analyse ou ceux qui sont vicarial de façon disproportionnée de violations des droits de l'homme, même si le groupe est plus petit que le groupe référence. On peut toujours être certain d'obtenir des catégories exclusives et exhaustives si on se souvient de la règle suivante: Pour chaque variable, chaque cas doit Cependant, un cas donné peut avoir plusieurs variables: *Les vicarial peuvent être associées à plusieurs variables: Religion, origine ethnique, sexe, etc. La valeur de la variable n'est pas un nombre mais une catégorie. *Pour un cas donné, il peut y avoir des valeurs différentes: région bombardée, nombre de maisons détruites, pièces d'équipement volées, etc. Ces variables sont numériques. Une variable non-numérique comme «origine»peut produire des variables numériques si l'on compte les cas, comme dans l'exemple ci-dessus: De telles données peuvent être recueillies ou converties sous la forme suivante:
On peut constater qu'il y a de nombreux types de données. Ils doivent être spécifiques à chaque situation et aussi précis que possible.
Des événements tels que les confiscations de nourriture (quel poids de viande a été confisqué? quel volume de grain?), les bombardements d'une région (quelle surface a été affectée?) ne sont pas mesurés en comptant, mais par une opération telle que peser, mesurer, estimer, lire des instruments spéciaux (appareil de radiation ou détecteur de gaz résiduel), et en mesurant et calculant (multiplier une longueur par une largeur pour obtenir une surface, etc.) De tels mesurages peuvent être constitués de parties fractionnelles. Utilisez de préférence des décimales plutôt que des fractions car les décimales sont plus faciles à utiliser dans un calcul. Ainsi, écrivez 340.25 et non pas 340 1/4. Même dans les meilleures des circonstances, il y a toujours des erreurs. Par exemple, on peut très bien compter 50 personnes, mais en enregistrer 60. Ou en copiant d'un document à un autre, un secrétaire peut lire un nom et en écrire un autre. En utilisant un ordinateur, on peut taper une valeur qui sera fausse, ou une erreur de programmation peut entraîner une erreur de calcul. Les intervenants travaillant sur le terrain, s'ils ne sont pas familiers avec le language de lieu, peuvent mal épeler les noms de famille ou de lieux. La liste de telles erreurs est longue. Le défenseur des droits de l'homme qui collecte et/ou analyse les données doit toujours être conscient de la possibilité d'erreur dans les données. C'est une bonne pratique statistique d'indiquer l'amplitude possible (la taille) d'erreur dans les mesurages lorsqu'on les enregistre et qu'on les rapporte.
A. Précision Définition: La «précision» est l'exactitude de l'instrument de mesurage. Meilleurs seront les instruments, meilleurs seront les mesurages. Par exemple, si on mesure un endroit endommagé avec un mètre, la précision dépend de la façon dont on tient le mètre, de la plus petite distance entre les marques successives sur le mètre, et d'autres facteurs qui entraîneraient des variations quand les mesurages sont répétés. Quelquefois, on doit estimer la précision. Supposez qu'on veuille mesurer une tombe rectangulaire et qu'on n'ait pas de mètre. Si vous mesurez la longueur et la largeur de la tombe en comptant le nombre de pas qu'il faut pour marcher la longueur et la largeur, quelle sera la précision? Si le pas est de deux mètres, avec quelle précision connaît-on la longueur? A 20 centimètres près? Ou à 25 centimètres près? Dans de tels cas, la meilleure chose à faire est de dire comment on a obtenu les mesures et les lecteurs seront capables de faire leur propre estimation. Une autre façon de régler le problème de précision est de répéter les mesurages. Beaucoup de personnes font une pratique régulière de répéter tous les mesurages importants. C'est un bon moyen d'éviter des erreurs et cela aide à estimer la précision des mesurages. B. Exactitude Définition: «L'exactitude» indique à quel degré l'instrument de mesurage a été bien gradué. Si on reprend l'exemple précédent de l'endroit endommagé et qu'on utilise un mètre utilitaire, on s'attend à ce qu'il ait été produit par un processus mécanique fondé sur des mesures standard et qu'il soit probablement précis. Dans l'exemple de la tombe, quelle précision ont les pas? Les pas, ont-ils été mesurés avec un instrument standard tel qu'un mètre? Ou a-t-on simplement deviné? On doit toujours rapporter la façons dont on a fait les mesurages, en donnant les méthodes et les instruments utilisés. Cela permet aux autres de connaître la précision de vos mesurages. Dans la collecte des données pour la défense des droits de l'homme, le biais est la source la plus commune d'imprécision. Si des personnes interrogées dans une enquête sur des disparitions forcées augmentent les chiffres qu'elles donnent pour une raison ou une autre, alors les données seront imprécises. On doit dire comment on traite les situations qui peuvent produire des biais. Cela permettra aux autres de connaître la précision de vos mesurages. En incluant cette information on rend les conclusions crédibles.
De nombreuses données sur les droits de l'homme concernent une série de valeurs, des mesures ou des comptages qui se produisent à des époques successives. Elles sont appelées données de série temporelle car elles sont une série de valeurs classées par ordre chronologique. Exemple 4.6
Discussion Notez l'augmentation d'enterrements Ningún Nombre pendant les années 1976-1983 quand un gouvernement militaire était au pouvoir en Argentine. De 1970 à 1974, le nombre de ce type d'enterrements n'a pas dépassé 162. L'augmentation à 236 en 1975 peut être due à un facteur chance mais les valeurs très élevées de 1976 et 1977 suggèrent un effet systématique. Que peut-on conclure? La disposition des données dans l'exemple ci-dessus est une bonne façon de présenter de telles données. On travaillera de manière efficace si on utilise les règles suivantes: *Faire tout l'effort possible pour collecter les données en série de temps en séquence régulière: Années (1982, 1983, 1984, ...), mois (janvier, février, mars...), jours (janvier 1, 11, 21, ....), trimestres (premier, deuxième, troisième, ...) et ainsi de suite. *Ne pas mélanger les périodes de temps: Collecter les données par année ou mois ou jour. Dans l'exemple 4.6, toutes les données sont par année. *Essayer d'obtenir une valeur pour toutes les périodes de temps. Cela ne sera cependant pas toujours possible. 1. Les types de données dont nous parlons sont des comptages, des mesurages et des séries temporelles. 2. Les comptages sont des nombres entiers incluant zéro; 0, 1, 2, 3,... 3. Pour les statisticiens, toute quantité qui a différentes valeurs est une variable. 4. Le pointage est un bon moyen, compris partout, d'enregistrer les comptages. 5. Le mot «catégorie» s'applique à une caractéristique identifiant des gens ou des objets. 6. Les catégories doivent être mutuellement exclusives et exhaustives. 7. Les mesurages sont des nombres qui peuvent être fractionnés et qui demandent qu'on obtienne des poids, des longueurs, des largeurs et diamètres, des lectures d'instruments, etc. 8. Les décimales sont préférables aux fractions lorsqu'on enregistre des mesurages. 9. Chaque mesurage est sujet à erreur. 10. Les deux moyens d'évaluer une erreur sont la précision (à quel point le mesurage est-il bon?) et l'exactitude (ajustement ou biais de l'instrument). 11. La taille des erreurs devrait être estimée pour obtenir de la crédibilité. 12. Une série temporelle est une série de valeurs se passant à des moments successifs. 13. Les données de série temporelle doivent être collectées et enregistrées en séquences régulières. 14. Des intervalles de temps différents, tels que les mois et semaines, ne devraient pas être mélangés. 15. Faire un effort pour obtenir une valeur pour chaque période de temps. 1.Snow, C. C., and Bihurriet, M.J. Ningún Nombre burials in the Province of Buenos Aires from 1970 to 1984. Report to the Subsecretariat de Derechos Humanos, Ministerio del Interior, Republica de Argentina, 19 June 1987, p.19.
4.1 Instructions: Cet exercice est à l'intention d'au moins deux personnes. Donnez deux minutes à chacune pour compter le nombre de «e» dans le paragraphe suivant. Si vous faites l'exercice seul, comptez deux fois le nombre de «e». Après l'invasion de Grenade, l'amiral américain McDonald déclara que les documents saisis montraient que Cuba avait prévu d'envoyer 341 officiers et 4000 réservistes de plus pour la prise de pouvoir de l'île. Mais après que les documents furent rendus publics, ils ne montraient qu'une seule référence aux soldats cubains: une promesse d'envoyer 27 conseillers militaires pour entraîner les troupes de Grenade. Quatre mille trois cent quatorze officiers et réservistes cubains étaient des fantômes, aussi éphémères que d'autres émanations statistiques. Comparez les comptages obtenus. Quelle leçon pouvez-vous retenir de cet exercice? 4.2 Vous voulez estimer le nombre d'enfants dans les rues d'une ville qui sont des mendiants. 1. Définissez un «mendiant». 2. Définissez un mendiant qui est un enfant. 3. Comment allez-vous faire ce comptage? 4. Préparez un formulaire pour ceux qui vont faire le comptage (Voir annexe 1). 5. Quelles sont vos variables? 6. Quelles seront les valeurs de vos variables? 7. Quels problèmes anticipez-vous? 8. Comment allez-vous vérifier le travail de ceux qui auront fait le comptage? 4.3 La liste suivante de prisonniers, des mois et années de leurs arrestations, des prisons et de leur statut médical, est fondée sur un rapport réel d'une organisation non-gouvernementale. Les noms des prisonniers et des prisons ont été arbitrairement raccourcis.
1. Faites une liste des variables que vous pouvez définir pour ce groupe de données. 2. Faites une liste des valeurs possibles pour chacune des variables. 3. Faites un pointage des valeurs pour chaque variable. 4. Supposez qu'un journaliste vous a demandé de résumer le cas de cette organisation et répondez au journaliste en vous fondant sur le pointage ci-dessus.
4.4 Ce qui suit fait partie d'une liste de cas actifs sur lesquels une organisation non-gouvernementale est en train de travailler. Vous voulez faire le sommaire de ces cas. Acevedo, R; Chili; physicien; menacé 1987Adote R; Bénin; étudiant; détenu; 1989 Alofa, B; Bénin; étudiant; détenu; 1988 Berges JA; Argentine; physicien; relâché 1987 Chiluwe A; Malawi; statisticien; détenu; 1988 Degnovi, B; Bénin; sociologue; détenu; 1989 El Mamy, O; Mauritanie; économiste; détenu; 1988 Godoy Caceres, J; Pérou; étudiant; détenu; 1989 Gwaza, G; Malawi; statisticien; détenu; 1988 Ikhas, C; République du Congo; infirmier; détenu; 1989 Khin, A; Birmanie; inspecteur de la santé détenu; 1988 Lain, N; Birmanie; physicien; détenu; 1988 Lwin, T; Birmanie; inspecteur de la santé détenu; 1988 Machira, B; Malawi; conférencier; détenu; 1988 Mapanje, J; Malawi; conférencier; détenu; 1987 Mhango, G; Malawi; vétérinaire; détenu; 1987 Mtafu, G; Malawi; physicien; détenu; 1988 Naing, K; Birmanie; physicien; détenu; 1988 Nyan, T; Birmanie; physicien; détenu; 1988 Nyunt, K; Birmanie; physicien; détenu; 1988 OO, Z; Birmanie; étudiant; détenu; 1989 Oukouli, T; République du Congo; infirmier; détenue; 1987 Sessouma G; Burkina-Faso; professeur; détenu; 1989 Shrestha, M; Népal; physicien; en fuite; 1990 Tinda, E; Malawi; économiste; détenu; 1988 Tun, H; Buma; inspecteur de la santé détenu; 1988 1. Faites une liste des variables que vous pouvez définir pour ce groupe de données. 2. Faites une liste des valeurs possibles pour chacune des variables. 3. Faites un pointage des valeurs pour chaque variable. 4. Supposez qu'un journaliste vous a demandé de résumer le cas de cette organisation et répondez au journaliste en vous fondant sur le pointage ci-dessus. 4.5 Pour votre pays, donnez les valeurs catégoriques pour les variables qui suivent: 1. Religion 2. Groupe ethnique [Contenu] [Preface] [Chapitre 1] [Chapitre 2] [Chapitre 3] [Chapitre 4] [Chapitre 5] [Chapitre 6] [Chapitre 7] [Chapitre 8] [Chapitre 9] [Annexes] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Electronic Resource Centre for Human
Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme