Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme



CHAPITRE 4

Les types de données

Un fait en lui-même n'est rien. Il n'a de valeur que pour l'idée qui lui est attachée, ou pour la preuve qu'il fournit.

Claude Bernard

Contenu du chapitre

INTRODUCTION: Les types de données
4.1 Dénombrements/Comptages
4.2 Catégories
4.3 Mesures
4.4 Séries temporelles
SOMMAIRE DES PRINCIPES
REFERENCES
EXERCICES



INTRODUCTION Les types de données

Les données se présentent sous différentes formes. On doit avoir quelques connaissances de ces formes, pour savoir comment les présenter et les analyser. On n'a pas besoin d'en connaître les nomenclatures et les définitions pour le travail de défense des droits de l'homme. On n'a besoin que de savoir comment les rassembler et les analyser.

4.1 DENOMBREMENTS/COMPTAGES

Définition: Les «comptages» sont des nombres entiers incluant zéro: 0,1,2,3,... Ils sont une forme de base des données dans tout travail statistique. Voici des exemples de nombres qui ne sont pas entiers: 3/2, 8.6, 10 1/4.

Les dénombrements sont particulièrement importants dans le domaine des droits de l'homme. Pour ceux qui travaillent dans ce domaine, un individu qui a été victime de violence c'est toujours un de trop. Mais pour attirer l'attention du public et des gouvernements, l'amplitude du dénombrement (combien?) est importante: Combien de personnes ont disparu, combien ont été enlevées de force, combien de corps sont enterrés dans une fosse commune, combien de fois un village a-t-il été bombardé? Même si on ne peut qu'estimer le nombre de violations, même si le comptage n'est peut-être pas complet, on doit commencer par dénombrer les incidents qu'on peut obtenir.

La façon la plus fiable pour déterminer «combien» est de compter physiquement le nombre de morts, le nombre de blessés, etc. C'est parce qu'il avait besoin d'un compte exact que le représentant, décrit dans le Chapitre 2, a pris le risque qui l'a conduit à être torturé.

Mais il est souvent difficile d'obtenir des comptages précis. Il existe de nombreuses études qui montrent combien d'erreurs sont faites même si la personne effectue son comptage en situation de laboratoire contrôlée et qu'elle compte des objets inanimés; les dénombrements de seconde main sont encore moins fiables. Cependant, si des dénombrements de seconde main sont les seuls qu'on peut obtenir, ils doivent être utilisés. Pourvu que le rapport publié indique de quelle façon les données ont été obtenues.

A. La Variable

Définition: Les statisticiens définissent une variable comme une quantité pouvant prendre différentes valeurs. Toutes les données doivent se rapporter à une variable.

Exemple 4.1

L'ouvrage, «Index to Accountability» est un projet salvadorien de El Rescate, une organisation non-gouvernementale. L'Index est une base de données qui contient des informations sur l'armée salvadorienne ainsi que sur les violations des droits de l'homme et il est documenté par la Tutelle Légale (Tutela Legal).

En utilisant cette base de données, on peut obtenir les valeurs de nombreuses variables. Par exemple, le nombre de violations par la Police Nationale dans la zone J est une variable pour laquelle on peut obtenir une valeur dans l'Index.

Variable

Valeur

Nombre de violations par la Police Nationale dans la Zone J

Dénombrement obtenu grâce à l'Index

Si l'Index indique qu'il y a 180 violations, alors vous obtenez le résultat suivant:

Variable

Valeur

Nombre de violations par la Police Nationale dans la Zone J

180

Pouvez-vous aussi faire des dénombrements à partir de variables qui ne sont pas numériques?

Exemple 4.2

Des défenseurs des droits de l'homme travaillant sur le terrain peuvent avoir fourni un grand nombre de témoignages individuels documentant un événement - disparitions, morts, confiscations de terres ou de biens, etc. Une organisation non-gouvernementale s'est assurée que chaque témoignage comprend une description détaillée des événements: «Confiscation de terres ou de biens, oui/non».

Discussion

Chaque événement documentant «confiscations» représente «un» comptage de confiscation. Cette description apparaît fréquemment, et pour obtenir le nombre total de confiscations, on n'a qu'à compter combien de fois «oui» apparaît dans les témoignages.

B Le Pointage

Compter n'est pas facile! Doigts, compteurs mécaniques ou automatiques, etc sont quelques-uns des nombreux moyens de compter un par un. Un moyen classique pour compter est de pointer, c'est-à-dire en utilisant une marque écrite. Les anciens Sumériens pointaient avec des marques sur des tableaux d'argile, les premiers Anglais faisaient des entailles sur du bois, et quelques-uns des caractères chinois pour les nombres sont une forme de pointage représenté par un trait pour chaque unité.

Un compteur mécanique sera peut-être disponible. Si on n'en a pas et qu'on doit utiliser crayon et papier, on peut pointer en utilisant une méthode simple: Une marque pour chaque item compté avec une barre horizontale en travers pour marquer le cinquième item.

3 items comptés:

///

5 items comptés:

////

8 items comptés:

//// ///

12 items comptés:

//// //// //

Cette méthode est comprise partout. Elle n'est pas une garantie de précision, mais elle vaut mieux que des méthodes non-écrites. Elle comporte aussi un avantage: Elle indique un nombre graphiquement, car si le comptage est plus élevé, le marquage est plus long.

Note: A propos des méthodes de pointage: la méthode que nous montrons est courante dans les pays occidentaux industrialisés. D'autres cultures pourront avoir des méthodes intéressantes qui leur sont propres.

Exemple 4.3

Supposons qu'une organisation non-gouvernementale est en train de préparer un cas concernant un événement dans lequel les membres d'un groupe ethnique ont été tués ou ont disparu. L'organisation a une fiche séparée pour chaque victime, et chacune de ces fiches dit si la victime a été tuée ou si elle a disparu. L'organisation veut compter et comparer le nombre de morts et le nombre de disparus pour l'ensemble des fiches.

Discussion

Pour obtenir ces nombres, vous devez regarder chaque fiche. Si une mort a été enregistrée, vous le marquez sur une ligne. Si une disparition a été enregistrée, vous le marquez sur la ligne suivante.

Morts

//// ///

Disparitions

//// //// //// //// //// ///

Vous pouvez ainsi voir rapidement le nombre de disparus et de tués - une comparaison présentée de façon dramatique. Notez que les marques peuvent s'additionner pour donner un nombre:

Morts

//// ///

5+3=8

Disparitions

//// //// //// //// //// ///

5+5+5+5+5+3=28

4.2 CATEGORIES

Définition: Une catégorie est le nom pour une caractéristique grâce à laquelle des gens ou des objets peuvent être identifiés.

Suivent des exemples de catégories: mâle ou femelle, chrétien, musulman, juif, animiste, bouddhiste, blessé ou non-blessé, combattant ou non-combattant, disparu, tué.

Les catégories doivent être reliées à une variable, comme nous le montrons dans l'exemple suivant.

Exemple 4.4

Variable

Catégories Possibles

Genre

Mâle, Femelle

Religion

Chrétien, Musulman, Juif

Statut

Combattant, Non-Combattant

Statut

Disparu, Tué, Inconnu

Origine Ethnique

Serbe, Croate, Mixte, Inconnu

Discussion

Dans cet exemple, les valeurs des variables sont des catégories. La première variable est «genre», et les valeurs qu'elle peut prendre sont «mâle» ou «femelle». Cependant, si on a une série de dossiers, on peut compter le nombre de fois où les catégories «mâle» et «femelle» apparaissent et cela donnera le compte. Ce compte est un item numérique de données. Dans le Chapitre 5, nous montrons comment ces comptes sont déterminés, utilisés et présentés.

 

Exemple 4.5

En utilisant l'origine ethnique pour exemple, on pourait obtenir ce qui suit:

Variable

Valeur

Origine Ethnique

Obtenue à partir de la liste des catégories

Pour une victime en particulier, on pourrait obtenir:

Variable

Valeur

Origine Ethnique

Croate

L'obligation statistique fondamentale pour les catégories, c'est qu'elles doivent être réciproquement exclusives et exhaustives.

A. Catégories réciproquement exclusives

Définition: «Réciproquement exclusive» signifie que les catégories ne se chevauchent pas. Aucune personne ou aucune chose ne peut appartenir à deux catégories en même temps.

Par conséquent, si on prépare un ensemble de catégories religieuses, on ne peut utiliser à la fois musulman et sunnite musulman. Un sunnite musulman est aussi un musulman. Donc, si on a une victime qui est identifiée comme sunnite musulman, on pourrait la compter deux fois. Une fois comme musulman et une fois comme sunnite musulman, ce qui produirait un mauvais compte pour les deux groupes. Pour résoudre cela, on pourrait utiliser les catégories sunnite musulman et autres musulmans; vous pourriez tous les identifier comme musulman; ou vous pourriez donner une liste de tous les groupes connus de musulmans plus autres musulmans.

Notez que cette règle fonctionne de façon hiérarchique. Si on décide de séparer les musulmans en plusieurs catégories, alors ces catégories doivent être réciproquement exclusives. En observant cette règle, voici la manière de séparer les musulmans en plusieurs catégories:

Musulmans

Sunnites

Chiites

Ahmadis

Druzes

Autres

B. Catégories Exhaustives

Définition: «Exhaustive» signifie qu'il existe une catégorie pour chaque cas (dossier, victime, auteur du meurtre, événement, etc.)

Par conséquent, dans le cas de la dénomination religieuse, il ne serait pas satisfaisant dans certaines régions de travailler à partir d'une liste de catégories de vicarial dont les religions seraient limitées comme ce qui suit:

Juif, Chrétien, Musulman

Ces trois catégories ne seraient pas exhaustives si quelques-unes des vicarial sont, par exemple, bouddhistes. Dans certaines régions, la liste suivante serait exhaustive:

Juif, Chrétien, Musulman

Bouddhiste, Animiste, Hindou, Autres

Comment savez-vous quelle catégories utiliser? Voici quelques directives possibles:

*Utiliser la connaissance qu'on a de la situation, ou demander de l'aide à quelqu'un, pour déterminer quelles catégories sont importantes.

*Créer une catégorie pour chaque groupe qui est plus nombreux que le groupe de référence.

*Inclure les groupes qui sont ciblés pour l'analyse ou ceux qui sont vicarial de façon disproportionnée de violations des droits de l'homme, même si le groupe est plus petit que le groupe référence.

On peut toujours être certain d'obtenir des catégories exclusives et exhaustives si on se souvient de la règle suivante:

Pour chaque variable, chaque cas doit
avoir une et une seule catégorie à
laquelle il correspond.

Cependant, un cas donné peut avoir plusieurs variables:

*Les vicarial peuvent être associées à plusieurs variables: Religion, origine ethnique, sexe, etc. La valeur de la variable n'est pas un nombre mais une catégorie.

*Pour un cas donné, il peut y avoir des valeurs différentes: région bombardée, nombre de maisons détruites, pièces d'équipement volées, etc. Ces variables sont numériques.

Une variable non-numérique comme «origine»peut produire des variables numériques si l'on compte les cas, comme dans l'exemple ci-dessus:

De telles données peuvent être recueillies ou converties sous la forme suivante:

   

VARIABLES

 

Nom de la Victime

Religion

Origine

Age

Neto, V

Chrétien

Portugais

54

Neto, A

Chrétien

Portugais

32

Lee, R

Bouddhiste

Chinois

16

Chatterjee, B

Hindou

Indien

87

On peut constater qu'il y a de nombreux types de données. Ils doivent être spécifiques à chaque situation et aussi précis que possible.

 

4.3 MESURAGES

Des événements tels que les confiscations de nourriture (quel poids de viande a été confisqué? quel volume de grain?), les bombardements d'une région (quelle surface a été affectée?) ne sont pas mesurés en comptant, mais par une opération telle que peser, mesurer, estimer, lire des instruments spéciaux (appareil de radiation ou détecteur de gaz résiduel), et en mesurant et calculant (multiplier une longueur par une largeur pour obtenir une surface, etc.)

De tels mesurages peuvent être constitués de parties fractionnelles. Utilisez de préférence des décimales plutôt que des fractions car les décimales sont plus faciles à utiliser dans un calcul. Ainsi, écrivez 340.25 et non pas 340 1/4.

Même dans les meilleures des circonstances, il y a toujours des erreurs. Par exemple, on peut très bien compter 50 personnes, mais en enregistrer 60. Ou en copiant d'un document à un autre, un secrétaire peut lire un nom et en écrire un autre. En utilisant un ordinateur, on peut taper une valeur qui sera fausse, ou une erreur de programmation peut entraîner une erreur de calcul. Les intervenants travaillant sur le terrain, s'ils ne sont pas familiers avec le language de lieu, peuvent mal épeler les noms de famille ou de lieux. La liste de telles erreurs est longue. Le défenseur des droits de l'homme qui collecte et/ou analyse les données doit toujours être conscient de la possibilité d'erreur dans les données.

C'est une bonne pratique statistique d'indiquer l'amplitude possible (la taille) d'erreur dans les mesurages lorsqu'on les enregistre et qu'on les rapporte.

 

A. Précision

Définition: La «précision» est l'exactitude de l'instrument de mesurage. Meilleurs seront les instruments, meilleurs seront les mesurages.

Par exemple, si on mesure un endroit endommagé avec un mètre, la précision dépend de la façon dont on tient le mètre, de la plus petite distance entre les marques successives sur le mètre, et d'autres facteurs qui entraîneraient des variations quand les mesurages sont répétés.

Quelquefois, on doit estimer la précision. Supposez qu'on veuille mesurer une tombe rectangulaire et qu'on n'ait pas de mètre. Si vous mesurez la longueur et la largeur de la tombe en comptant le nombre de pas qu'il faut pour marcher la longueur et la largeur, quelle sera la précision? Si le pas est de deux mètres, avec quelle précision connaît-on la longueur? A 20 centimètres près? Ou à 25 centimètres près? Dans de tels cas, la meilleure chose à faire est de dire comment on a obtenu les mesures et les lecteurs seront capables de faire leur propre estimation.

Une autre façon de régler le problème de précision est de répéter les mesurages. Beaucoup de personnes font une pratique régulière de répéter tous les mesurages importants. C'est un bon moyen d'éviter des erreurs et cela aide à estimer la précision des mesurages.

B. Exactitude

Définition: «L'exactitude» indique à quel degré l'instrument de mesurage a été bien gradué.

Si on reprend l'exemple précédent de l'endroit endommagé et qu'on utilise un mètre utilitaire, on s'attend à ce qu'il ait été produit par un processus mécanique fondé sur des mesures standard et qu'il soit probablement précis.

Dans l'exemple de la tombe, quelle précision ont les pas? Les pas, ont-ils été mesurés avec un instrument standard tel qu'un mètre? Ou a-t-on simplement deviné?

On doit toujours rapporter la façons dont on a fait les mesurages, en donnant les méthodes et les instruments utilisés. Cela permet aux autres de connaître la précision de vos mesurages.

Dans la collecte des données pour la défense des droits de l'homme, le biais est la source la plus commune d'imprécision. Si des personnes interrogées dans une enquête sur des disparitions forcées augmentent les chiffres qu'elles donnent pour une raison ou une autre, alors les données seront imprécises. On doit dire comment on traite les situations qui peuvent produire des biais. Cela permettra aux autres de connaître la précision de vos mesurages. En incluant cette information on rend les conclusions crédibles.

 

4.4 SERIES TEMPORELLES

De nombreuses données sur les droits de l'homme concernent une série de valeurs, des mesures ou des comptages qui se produisent à des époques successives. Elles sont appelées données de série temporelle car elles sont une série de valeurs classées par ordre chronologique.

Exemple 4.6

Ce qui suit est le total d'enterrements Ningún Nombre (sans nom ou non nommé) dans certains cimetières d'Argentine (1).

Année

Nombre

1970

116

1971

145

1972

161

1973

162

1974

139

1975

236

1976

553

1977

565

1978

222

1979

230

1980

210

1981

196

1982

193

1983

186

1984

158

Discussion

Notez l'augmentation d'enterrements Ningún Nombre pendant les années 1976-1983 quand un gouvernement militaire était au pouvoir en Argentine. De 1970 à 1974, le nombre de ce type d'enterrements n'a pas dépassé 162. L'augmentation à 236 en 1975 peut être due à un facteur chance mais les valeurs très élevées de 1976 et 1977 suggèrent un effet systématique. Que peut-on conclure?

La disposition des données dans l'exemple ci-dessus est une bonne façon de présenter de telles données. On travaillera de manière efficace si on utilise les règles suivantes:

*Faire tout l'effort possible pour collecter les données en série de temps en séquence régulière: Années (1982, 1983, 1984, ...), mois (janvier, février, mars...), jours (janvier 1, 11, 21, ....), trimestres (premier, deuxième, troisième, ...) et ainsi de suite.

*Ne pas mélanger les périodes de temps: Collecter les données par année ou mois ou jour. Dans l'exemple 4.6, toutes les données sont par année.

*Essayer d'obtenir une valeur pour toutes les périodes de temps. Cela ne sera cependant pas toujours possible.

SOMMAIRE DES PRINCIPES

1. Les types de données dont nous parlons sont des comptages, des mesurages et des séries temporelles.

2. Les comptages sont des nombres entiers incluant zéro; 0, 1, 2, 3,...

3. Pour les statisticiens, toute quantité qui a différentes valeurs est une variable.

4. Le pointage est un bon moyen, compris partout, d'enregistrer les comptages.

5. Le mot «catégorie» s'applique à une caractéristique identifiant des gens ou des objets.

6. Les catégories doivent être mutuellement exclusives et exhaustives.

7. Les mesurages sont des nombres qui peuvent être fractionnés et qui demandent qu'on obtienne des poids, des longueurs, des largeurs et diamètres, des lectures d'instruments, etc.

8. Les décimales sont préférables aux fractions lorsqu'on enregistre des mesurages.

9. Chaque mesurage est sujet à erreur.

10. Les deux moyens d'évaluer une erreur sont la précision (à quel point le mesurage est-il bon?) et l'exactitude (ajustement ou biais de l'instrument).

11. La taille des erreurs devrait être estimée pour obtenir de la crédibilité.

12. Une série temporelle est une série de valeurs se passant à des moments successifs.

13. Les données de série temporelle doivent être collectées et enregistrées en séquences régulières.

14. Des intervalles de temps différents, tels que les mois et semaines, ne devraient pas être mélangés.

15. Faire un effort pour obtenir une valeur pour chaque période de temps.

REFERENCES

1.Snow, C. C., and Bihurriet, M.J. Ningún Nombre burials in the Province of Buenos Aires from 1970 to 1984. Report to the Subsecretariat de Derechos Humanos, Ministerio del Interior, Republica de Argentina, 19 June 1987, p.19.

 

EXERCICES POUR LE CHAPITRE 4

4.1 Instructions: Cet exercice est à l'intention d'au moins deux personnes. Donnez deux minutes à chacune pour compter le nombre de «e» dans le paragraphe suivant. Si vous faites l'exercice seul, comptez deux fois le nombre de «e».

Après l'invasion de Grenade, l'amiral américain McDonald déclara que les documents saisis montraient que Cuba avait prévu d'envoyer 341 officiers et 4000 réservistes de plus pour la prise de pouvoir de l'île. Mais après que les documents furent rendus publics, ils ne montraient qu'une seule référence aux soldats cubains: une promesse d'envoyer 27 conseillers militaires pour entraîner les troupes de Grenade. Quatre mille trois cent quatorze officiers et réservistes cubains étaient des fantômes, aussi éphémères que d'autres émanations statistiques.

Comparez les comptages obtenus. Quelle leçon pouvez-vous retenir de cet exercice?

4.2 Vous voulez estimer le nombre d'enfants dans les rues d'une ville qui sont des mendiants.

1. Définissez un «mendiant».

2. Définissez un mendiant qui est un enfant.

3. Comment allez-vous faire ce comptage?

4. Préparez un formulaire pour ceux qui vont faire le comptage (Voir annexe 1).

5. Quelles sont vos variables?

6. Quelles seront les valeurs de vos variables?

7. Quels problèmes anticipez-vous?

8. Comment allez-vous vérifier le travail de ceux qui auront fait le comptage?

4.3 La liste suivante de prisonniers, des mois et années de leurs arrestations, des prisons et de leur statut médical, est fondée sur un rapport réel d'une organisation non-gouvernementale. Les noms des prisonniers et des prisons ont été arbitrairement raccourcis.

 

Arrestation

   

Nom

Mois

Année

Prison

Statut Médical

Abde

Mars

90

Half

Hypertension

Abdi

Mai

90

Kobe

Ok

Bash

Mai

90

Kass

Besoin d'attention

Fara

Mai

90

Kobe

Ok

Faro

Juillet

89

Shal

Leishmaniose

Faru

Novembre

89

?

Ok

Kami

Mai

90

Kobe

Ulcères gastriques

Khal

Juillet

89

Kobe

Angine

Moha

Mai

90

Kobe

Référé pour traitement

Mahm

Juillet

89

Kass

Problèmes de vision

Mohe

Juin

90

Ghos

Ok

Mohd

Novembre

89

Shal

Ok

Mohr

Mai

90

Kobe

Ok

Osam

Mai

90

Kobe

Ok

Usha

Juillet

89

Shal

Infection de la peau

Yous

Mars

90

Kass

Maladie de coeur

1. Faites une liste des variables que vous pouvez définir pour ce groupe de données.

2. Faites une liste des valeurs possibles pour chacune des variables.

3. Faites un pointage des valeurs pour chaque variable.

4. Supposez qu'un journaliste vous a demandé de résumer le cas de cette organisation et répondez au journaliste en vous fondant sur le pointage ci-dessus.

 

4.4 Ce qui suit fait partie d'une liste de cas actifs sur lesquels une organisation non-gouvernementale est en train de travailler. Vous voulez faire le sommaire de ces cas.

Acevedo, R; Chili; physicien; menacé 1987

Adote R; Bénin; étudiant; détenu; 1989

Alofa, B; Bénin; étudiant; détenu; 1988

Berges JA; Argentine; physicien; relâché 1987

Chiluwe A; Malawi; statisticien; détenu; 1988

Degnovi, B; Bénin; sociologue; détenu; 1989

El Mamy, O; Mauritanie; économiste; détenu; 1988

Godoy Caceres, J; Pérou; étudiant; détenu; 1989

Gwaza, G; Malawi; statisticien; détenu; 1988

Ikhas, C; République du Congo; infirmier; détenu; 1989

Khin, A; Birmanie; inspecteur de la santé détenu; 1988

Lain, N; Birmanie; physicien; détenu; 1988

Lwin, T; Birmanie; inspecteur de la santé détenu; 1988

Machira, B; Malawi; conférencier; détenu; 1988

Mapanje, J; Malawi; conférencier; détenu; 1987

Mhango, G; Malawi; vétérinaire; détenu; 1987

Mtafu, G; Malawi; physicien; détenu; 1988

Naing, K; Birmanie; physicien; détenu; 1988

Nyan, T; Birmanie; physicien; détenu; 1988

Nyunt, K; Birmanie; physicien; détenu; 1988

OO, Z; Birmanie; étudiant; détenu; 1989

Oukouli, T; République du Congo; infirmier; détenue; 1987

Sessouma G; Burkina-Faso; professeur; détenu; 1989

Shrestha, M; Népal; physicien; en fuite; 1990

Tinda, E; Malawi; économiste; détenu; 1988

Tun, H; Buma; inspecteur de la santé détenu; 1988

1. Faites une liste des variables que vous pouvez définir pour ce groupe de données.

2. Faites une liste des valeurs possibles pour chacune des variables.

3. Faites un pointage des valeurs pour chaque variable.

4. Supposez qu'un journaliste vous a demandé de résumer le cas de cette organisation et répondez au journaliste en vous fondant sur le pointage ci-dessus.

4.5 Pour votre pays, donnez les valeurs catégoriques pour les variables qui suivent:

1. Religion

2. Groupe ethnique




L’Analyse des données pour le contrôle des droits de l’homme:

[
Contenu] [Preface] [Chapitre 1] [Chapitre 2] [Chapitre 3] [Chapitre 4] [Chapitre 5] [Chapitre 6] [Chapitre 7] [Chapitre 8] [Chapitre 9] [Annexes]



Back to Index HRE Library

Electronic Resource Centre for Human Rights Education:
L’Analyse des données pour le contrôle des droits de l’homme