Comment rejeter les valeurs aberrantes dans les données

Les données recueillies lors des expériences, des enquêtes et autres procédures de collecte d'informations est généralement soumis à une certaine quantité de hasard. Dans certains cas, des mesures ou des réponses individuelles peuvent sembler loin l'attendu result- ce sont les valeurs aberrantes. Si vous tombez sur une valeur aberrante, vous devriez vérifier pour déterminer si vous devriez rejeter entièrement.

Instructions

  1. Inspectez la valeur aberrante pour être sûr qu'il correspond qualitativement avec le reste des données. Par exemple, si vous demandez à 20 personnes pour mesurer la largeur d'un centime, mais l'un d'eux mesure effectivement la largeur d'un trimestre, vous pourriez avoir une valeur aberrante dans les données. Vous devriez rejeter cette aberrant parce qu'il ne correspond pas qualitativement avec l'expérience.

  2. Utilisez Q-test de Dixon si vous ne rejetez pas la valeur aberrante sur la base du critère de l'étape 1. Le Q-test est une mesure quantitative dans les statistiques de l'importance d'une valeur particulière par rapport à un ensemble de données.




  3. Déterminer le niveau de confiance pour la Q-test. Si vous voulez être 90 pour cent sûr que la valeur aberrante devrait ou ne devrait pas être rejetée, choisissez un niveau de 90 pour cent de la confiance.



  4. Trouver la valeur de Q critique (Qcrit) en utilisant une table. Vous avez besoin de connaître le nombre de valeurs dans l'ensemble de données (par exemple, N) et le niveau de confiance que vous choisissez à l'étape 3.



  5. Disposez les énoncés dans l'ordre croissant de données. Ainsi, pour chaque valeur dans l'ensemble, X (i), organiser les données de sorte que X (1) lt; X (2) lt; ... lt; X (N - 1) lt; X (N).

  6. Calculer la valeur de Q expérimentale (Qexp) de la valeur aberrante. Pour les valeurs aberrantes simples, la valeur aberrante est soit X (1) ou X (N) dans l'agencement de données provenant de l'étape 5. Les valeurs Q respectives de ces deux cas sont [X (2) - X (1)] / [X (N ) - X (1)] et [X (N) - x (n - 1)] / [x (n) - X (1)].

  7. Comparer la valeur de Q expérimentale de l'étape 6 à la valeur de Q critique de l'étape 4. Si Qexp est supérieure à Qcrit, alors vous devriez rejeter la valeur aberrante. Si Qexp est inférieure à Qcrit, alors vous devez garder la valeur aberrante dans les données. Votre acceptation ou le rejet de la valeur aberrante a un niveau de confiance selon ce que vous avez choisi à l'étape 3 (par exemple, vous êtes 90 pour cent sûr que vous devriez rejeter la valeur aberrante).

Conseils Avertissements

  • Les niveaux de confiance plus élevés conduisent à des valeurs de Q critiques plus élevées. En conséquence, si vous voulez être plus certain que vous devriez rejeter une valeur aberrante particulier, que des valeurs aberrantes doit être plus évidemment hors de propos par rapport au reste des données.
  • Q-test de Dixon fonctionne le mieux pour de petits échantillons. Des échantillons plus importants peuvent nécessiter d'autres tests statistiques.
  • Si vous avez plusieurs valeurs aberrantes, vous devez utiliser un test statistique différente de la Q-test.

éditerdans sélectionnéimprimer

» » » » Comment rejeter les valeurs aberrantes dans les données