Quelle est la distribution gaussienne?

Dans les statistiques, la gaussienne, ou normale, la distribution est utilisé pour caractériser les systèmes complexes avec de nombreux facteurs. Comme décrit dans Stephen Stigler est l'histoire de la statistique, Abraham De Moivre a inventé la distribution qui porte le nom de Karl Fredrick Gauss. La contribution de Gauss réside dans sa demande de la distribution à l'approche des moindres carrés pour minimiser l'erreur dans les données de montage avec une ligne de meilleur ajustement. Il a fait ainsi la distribution d'erreur le plus important dans les statistiques.

Motivation

  • Quelle est la répartition d'un échantillon de données? Que faire si vous ne connaissez pas les données sous-jacentes de ce distribution? Est-il possible de tester des hypothèses sur les données sans connaître la distribution sous-jacente? Merci à l'théorème central limite, la réponse est oui.

Déclaration du Théorème

  • Il précise qu'un échantillon signifie d'une population infinie est approximativement normale ou gaussienne, avec le même sens que la population sous-jacente, et de variance égale à la variance de la population divisée par la taille de l'échantillon. Le rapprochement améliore aussi la taille de l'échantillon devient grand.




    La déclaration de rapprochement est parfois erronée comme une conclusion au sujet de la convergence d'une distribution normale. Depuis les changements de distribution normales d'approximation que la taille de l'échantillon augmente, une telle déclaration est trompeuse.

    Le théorème a été développé par Pierre Simon Laplace.

Pourquoi elle est partout



  • Les distributions normales sont omniprésents. La raison vient du théorème central limite. Souvent, quand une valeur est mesurée, elle est la somme de l'effet de plusieurs variables indépendantes. Par conséquent, la valeur mesurée étant lui-même a une qualité d'échantillonnage moyenne à elle. Par exemple, une répartition des performances de l'athlète peut avoir une forme de cloche, en raison de différences dans le régime alimentaire, de la formation, de la génétique, de coaching et de la psychologie. Même les hauteurs pour hommes a une distribution normale, étant fonction de nombreux facteurs biologiques.

Copules gaussiennes

  • Ce qu'on appelle une «fonction de copule" avec une distribution gaussienne était dans les nouvelles en 2009 en raison de son utilisation dans l'évaluation du risque d'investir dans des obligations adossées à des actifs. L'utilisation abusive de la fonction a contribué à la crise financière de 2008-2009. Bien qu'il y ait de nombreuses causes de la crise, dans les distributions gaussiennes Hindsight probable ne devrait pas avoir été utilisé. Une fonction avec une queue plus épaisse aurait affecté plus grande probabilité d'événements indésirables.

Dérivation



  • Le théorème central limite peut être prouvé dans de nombreuses lignes en analysant la fonction génératrice des moments (mgf) de (moyenne de l'échantillon - moyenne de la population)? / (Taille de la population de variance / échantillon) en fonction des mgf de la population sous-jacente. La partie de l'approximation du théorème est introduit par l'expansion du mgf de la population sous-jacente comme une série d'alimentation, puis montrent la plupart des termes sont insignifiants que la taille de l'échantillon devient grand.

    Il peut être prouvé dans beaucoup moins de lignes en utilisant un développement de Taylor sur l'équation caractéristique de la même fonction et prise de la taille importante de l'échantillon.

Computational Commodité

  • Certains modèles statistiques supposent les erreurs gaussien. Cela permet la distribution des fonctions de variables normales, comme le chi-carrée et F de distribution destiné à être utilisé dans le test d'hypothèse. Plus précisément, dans le F-test, la statistique F est composé d'un ratio de distribution du chi-carré, qui eux-mêmes sont les fonctions d'un paramètre de variance normale. Le rapport des deux causes de la variance à annuler, permettant des tests d'hypothèses sans connaissance des écarts en dehors de leur normalité et de la constance.

éditerdans sélectionnéimprimer

» » » » Quelle est la distribution gaussienne?