Test statistique du χ2

BMI: ATIC, Thursday, May 5, 1955

Dans le même temps, des graphiques mirroirs ont été construits d'après les tabulations de fréquence qui ont semblé montrer que, lorsque les connus et les inconnus sont regroupés selon 1 des 6 caractéristiques, le pourcentage des connus et le pourcentage des inconnus dans chaque groupe de caractéristique ont montré la même tendance générale. En d'autres mots, sur la base de ces graphiques, il semble qu'il y ait eut une bonne possibilité que les inconnus ne soient pas différents des connus, au moins au sein de l'aggrégat. Il a été décidé d'investiguer ceci en utilisant une procédure statistique nommée "test du χ2".

Le test du χ2 est un test statistique de la probabilité que 2 distributions viennent de la même population, c'est-à-dire qu'il donne la probabilité qu'il n'y ait pas de différence dans le [make-up] des 2 distributions mesurées.

Les méthode est dégagée comme suit :

  1. Adjuster les distributions en multipliant les connus dans chaque groupe de caractéristique par le ratio du nombre total des inconnus pour le nombre total de connus (le test du χ2 est applicable seulement aux distributions qui ont le même nombre total d'éléments)
  2. Prendre la différence entre le nombre d'inconnus et le nombre ajusté de connus dans chaque groupe de caractéristique.
  3. Elever le reste de l'étape 2 au carré.
  4. Diviser le résultat de l'étape 3 par le nombre correspondant de connus ajustés.

Ceci est le χ2 pour le groupe particulier. Faire la somme des χ2 individuels par delà des groupes d'une caractéristique donne le chi2 pour cette caractéristique. Ce nombre est alors comparé avec un tableau de la distribution du χ2 qui peut être trouvé dans de nombreux textes sur les statistiques élémentaires.

On notera que ce χ2 est tabulé en termes de degrés de liberté qui dans ce cas est 1 de moins que le nombre de groupes d'observations pour chaque caractéristique.

Les tabulations des connus et inconnus sur les 6 caractéristiques et le test du χ2 tel qu'il a été appliqué sont montrés dans les tableaux II à VII. Dans chaque cas, le nombre de degrés de liberté est donné, comme l'est la valeur des χ2 correspondant aux probabilités de 5 % et 1 % que 2 distributions avec ce nombre de degrés de liberté viennent de la même population. Plus grande étant la valeur du χ2 et plus petite étant la probabilité d'homogénéité de 2 distributions, une valeur calculée du chi2 supérieure aux valeurs des 5 % ou des 1 % indiquera une probabilité inférieure à 5 % ou à 1 %, respectivement, que les 2 distributions soient homogènes. Le terme d'homogénéité est utilisé ici pour indiquer que les 2 distributions puissent être venues de la même population.

Tableau 2 - Test du χ2 des connus versus les inconnus sur la base de la couleur
Couleur Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) χ2,
(K-n)2

K
Blanc 405 100 112 1,44
Métallique 313 77 76 0,01
Non précisé 209 51 62 2,37
Orange 172 42 49 1,17
Rouge 146 36 33 0,25
Jaune 128 31 31 0
Vert 130 32 14 10,13
Bleu 67 17 26 4,76
Autre 195 48 31 6,02
Total 1765 434 434 26,15
Degrés de liberté 8
5 % 15,5
1 % 20,1

Tableau 3 - Test du χ2 des connus versus les inconnus sur la base du nombre
Nombre d'objets par observation Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) χ2,
(K-n)2

K
1 1339 329 297 3,11
2 159 39 37 0,10
3-10 185 46 70 12,52
11 ou plus 41 10 25 22,50
Non précisé 41 10 5 2,50
Total 1765 434 434 40,73
Degrés de liberté 4
5 % 9,5
1 % 13,3

Tableau 4 - Test du χ2 des connus versus les inconnus sur la base de la forme
Forme Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) χ2,
(K-n)2

K
Elliptique 838 206 195 0,59
Fusée ou appareil 80 20 33 8,45
Météore ou comète 55 14 4 7,14
Goutte d'eau, lenticulaire ou conique 103 25 22 0,36
Flamme 96 24 10 8,17
Autre 193 47 54 1,04
Non précisé 400 98 116 3,30
Total 1765 434 434 29,05
Degrés de liberté 6
5 % 12,6
1 % 16,8

Tableau 5 - Test du χ2 des connus versus les inconnus sur la base de la durée d'observation
Durée d'observation Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) χ2,
(K-n)2

K
5 s ou moins 259 64 27 21,39
6-10 s 92 23 21 0,17
11-30 s 153 38 33 0,66
31-60 s 108 26 42 9,85
61 s-5 mn 269 66 99 16,50
6-30 mn 305 75 71 0,21
Plus de 30 mn 135 33 37 0,48
Non précisé 444 109 104 0,23
Total 1765 434 434 49,49
Degrés de liberté 7
5 % 14,1
1 % 18,5

Tableau 6 - Test du χ2 des connus versus les inconnus sur la base de la vitesse
Vitesse Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) χ2,
(K-n)2

K
Stationnaire 249 61 53 1,05
Moins de 100 miles/h 154 38 26 3,79
100 à 400 miles/h 181 45 58 3,76
Plus de 400 miles/h 403 99 145 21,37
Comme un météore 83 20 16 0,80
Non précisé 695 171 136 7,16
Total 1765 434 434 37,93
Degrés de liberté 5
5 % 11,1
1 % 15,1

Tableau 7 - Test du χ2 des connus versus les inconnus sur la base de la brillance lumineuse
Intensité lumineuse Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) χ2,
(K-n)2

K
Lumière du soleil du mirroir 47 11 14 0,82
Lumière du soleil sur aluminium 151 37 28 2,19
Lumière du soleil sur plâtre, pierre ou sol 76 19 16 0,47
Plus brillant que la Lune 273 67 61 0,55
Comme la Lune ou plus mat que la Lune 68 17 22 1,47
Non précisé 1150 283 293 0,35
Total 1765 434 434 5,85
Degrés de liberté 5
5 % 11,1
1 % 15,1

Dans 5 des 6 cas, la probabilité est de moins de 1 % que les distributions soient les mêmes. Dans le 6ème cas, l'intensité lumineuse, les classifications sont trop nébuleuses pour être de réelle valeur. Cependant, ces tests ne signifient pas nécessairement que les inconnus sont principalement des "soucoupes volantes" et non des appareils, ballons ou autres objets ou phénomènes naturels connus. Les inconnus pourraient toujours être des connus non identifiés si un des cas suivants arrivait :

  1. Les caractéristiques qui ont été observées pour les inconnus étaient différentes de celles observées pour les connus en raison de la constitution psychologique de l'observateur ou de la distortion atmosphérique. Ceci suppose que la distribution des objets dans les connus et les inconnus est la même.
  2. Les inconnus pourraient être des objets connus dans des proportions différentes de celles du groupe identifié comme les connus (c'est-à-dire qu'un plus grand pourcentage des inconnus pourrait représenter des appareils que le pourcentage des appareils dans les connus identifiés).

Le 2nd cas est le plus probable. A cet égard, il est intéressant de noter les facteurs qui ont contribué à un grand résultats chi2 dans les tests effectués ci-dessus :

  1. Couleur : La contribution majeur au chi2 en couleur est la couleur verte. Il y a un grand excès d'observations vertes parmi les connus au-dessus des inconnus. Sur les 130 objets connus dans cette classification, 98 sont astronomiques, et sont en principalement dus aux boules de feu vertes rapportées dans le Sud-Ouest des U. S.
  2. Nombre : Le grand chi2 est dû à une plus grande proportion des inconnus dans la classification des objets multiples. Apparemment ils sont plus difficiles à identifier.
  3. Forme : Dans ce cas, il y a un pourcentage plus élevé des inconnus dans la classification de forme fusée-appareil. Il pourrait s'agir d'objets familiers pour lesquels des manœuvres inhabituelles ont été rapportées.
    Il y a un pourcentage plus élevé de connus dans la catégorie des forme de météore ou de comète, qui dans les 2 cas semble principalement résulter d'un excès d'observations astronomiques.
Tableau 8 - Test du Chi2 des connus révisés versus les inconnus sur la base de la couleur
Couleur Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) X2,
(K-n)2

K
Blanc 281 95 112 3,04
Métallique 298 101 76 6,19
Non précisé 189 64 62 0,06
Orange 117 39 49 2,56
Rouge 92 31 33 0,13
Jaune 90 30 31 0,03
Vert 32 11 14 0,82
Bleu 29 10 26 0,57
Autre 158 53 31
Total 1286 434 434 13,40
Degrés de liberté 7
5 % 14,1
1 % 18,5

Tableau 9 - Test du Chi2 des connus revisés versus les inconnus sur la base du nombre
Nombre d'objets par observation Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) X2,
(K-n)2

K
1 913 308 297 0,39
2 142 48 37 2,52
3-10 168 57 70 2,96
11 ou plus 34 11 25 15,36
Non précisé 29 10 5 2,50
Total 1286 434 434 23,73
Degrés de liberté 4
5 % 9,5
1 % 13,3

Tableau 10 - Test du Chi2 des connus versus les inconnus sur la base de la forme
Forme Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) X2,
(K-n)2

K
Elliptique 632 213 195 1,52
Fusée ou appareil 72 24 33 3,37
Météore ou comète 9 3 4 1,32
Flamme 47 16 10
Goutte d'eau, lenticulaire ou conique 79 27 22 0,93
Autre 151 51 54 1,76
Non précisé 296 100 116 2,56
Total 1286 434 434 11,46
Degrés de liberté 6
5 % 11,1
1 % 15,1

Tableau 11 - Test du Chi2 des connus révisés versus les inconnus sur la base de la durée d'observation
Durée d'observation Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) X2,
(K-n)2

K
5 s ou moins 92 31 27 0,52
6-10 s 47 16 21 1,56
11-30 s 118 40 33 1,23
31-60 s 92 31 42 3,90
61 s-5 mn 252 85 99 2,31
6-30 mn 259 87 71 2,94
Plus de 30 mn 91 31 37 1,16
Non précisé 335 113 104 0,72
Total 1286 434 434 14,34
Degrés de liberté 7
5 % 14,1
1 % 18,5

Tableau 12 - Test du Chi2 des connus révisés versus les inconnus sur la base de la vitesse
Vitesse Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) X2,
(K-n)2

K
Stationnaire 196 66 53 2,56
Moins de 100 miles/h 128 43 26 6,72
100 à 400 miles/h 156 53 58 0,47
Plus de 400 miles/h 291 98 145 28,54
Comme un météore 24 8 16
Non précisé 259 87 71 2,94
Total 1286 434 434 43,71
Degrés de liberté 4
5 % 9,5
1 % 13,5

Tableau 13 - Test du Chi2 des connus révisés versus les inconnus sur la base de la brillance lumineuse
Intensité lumineuse Nombre de connus Nombre ajusté de connus (K) Nombre d'inconnus (n) X2,
(K-n)2

K
Lumière du soleil du mirroir 24 8 14 2,67
Lumière du soleil sur aluminium 136 46 28
Lumière du soleil sur plâtre, pierre ou sol 63 21 16 1,19
Plus brillant que la Lune 143 48 61 3,52
Comme la Lune ou plus mat que la Lune 42 15 22 3,27
Non précisé 878 296 293 0,03
Total 1286 434 434 10,68
Degrés de liberté 4
5 % 9,5
1 % 13,3

Un autre aspect intéressant de ces nouveaux tests est qu'il y a seulement 2 grandes anomalies dans l'ensemble des groupes. Elles sont pour les 11 groupes ou plus dans la classification par nombre d'objets par observation et pour le groupe supérieur à 400 miles/h et comme un météore pour la classification par vitesse. La 1ère a été relativement unchangée par suppression des observations astronomiques principalement en raison de la concentration des observations dans la catégorie des objets seuls. La 2nde a été légèrement accrue par la suppression des observations astronomiques de la classification comme un météore. Cependant, la principale anomalie, celle de l'excès des inconnus dans la classe supérieur à 400 miles/h, a été peu changée.

Les résultats de ces tests ne sont pas concluants puisqu'ils ne confirment ni ne nient que les inconnus sont principalement des connus non identifiés, bien qu'ils indiquent que relativement peu des inconnus sont en fait des phénomènes astronomiques.

Il a été décidé que ce processus ne serait pas amené jusqu'à sa conclusion logique (c'est-à-dire, la détermination d'une combinaison linéaire de connus qui donnerait un chi2 négligeable, comparé aux inconnus), puisqu'il a été considéré que les anomalies dans les rapports donneraient un résultats déformé et non significatif.