中心極限定理 (CLT): それが何であり、どのように機能するか

CLT は、有限レベルの分散を持つ母集団からのサンプル サイズが十分に大きい場合、同じ母集団からサンプリングされたすべての変数の平均は母集団全体の平均にほぼ等しいという統計的仮定です。中心極限定理によれば、データの実際の分布に関係なく、サンプルサイズが増加するにつれて、データのサンプルの平均は対象となる母集団全体の平均に近づきます。中心極限定理とは何なのか、その目的とその主要な構成要素を見てみましょう。 

中心極限定理 (CLT) とは何ですか

確率理論では、中心極限定理 (CLT) は、すべてのサンプルのサイズが同一であると仮定し、サンプル サイズが増加するにつれて、サンプル変数の分布は正規分布 (つまり「釣鐘曲線」) に近づくと述べています。人口分布の実際の形状。言い換えれば、CLT は、有限レベルの分散を持つ母集団のサンプル サイズが十分に大きい場合、同じ母集団からサンプリングされたすべての変数の平均は母集団全体の平均にほぼ等しいという統計的仮定です。さらに、大数の法則に従って、これらのサンプルは正規分布に近づき、サンプルサイズが増加するにつれてその分散は母集団の分散とほぼ等しくなります。この概念は 1733 年にアブラハム・ド・モアブルによって最初に開発されましたが、有名なハンガリーの数学者ジョージ・ポリャがそれを中心極限定理と名付けた 1920 年まで正式なものではありませんでした。

式

中心極限定理の公式。出典: Inchcalculator.com。

中心極限定理 (CLT) は何のためにありますか?

中心極限定理によれば、データの実際の分布に関係なく、サンプルサイズが増加するにつれて、データのサンプルの平均は対象となる母集団全体の平均に近づきます。言い換えれば、データは分布が正規分布であるか異常であるかに関係なく正確です。一般に、サンプル サイズが 30 ~ 50 であれば、CLT を満たすのに十分であると考えられます。これは、サンプル平均の分布がかなり正規であることを意味します。したがって、より多くのサンプルが取得されるほど、結果はより正規分布に近づきます。ただし、中心極限定理は、n=8 on=5.3 など、サンプル サイズがはるかに小さい場合でも多くの場合に近似されることに注意してください。

グラフィック

偏った値の母集団に対する中心極限定理の図。出典: リサーチゲート

中心極限定理の主要な構成要素

中心極限定理はいくつかの重要な特徴で構成されています。これらの特性は主に、サンプル、サンプルサイズ、データ母集団を中心に展開されます。

  1. サンプリングは連続して行われます。これは、一部のサンプル単位が、以前に選択されたサンプル単位と共通であることを意味します。
  2. サンプリングはランダムです。すべてのサンプルは、統計的に同じ確率で選択されるように、ランダムに選択する必要があります。
  3. サンプルは独立している必要があります。 1 つのサンプルからの選択や結果が、将来のサンプルや他のサンプルの結果に影響を与えてはなりません。
  4. サンプルは制限する必要があります。非復元抽出を行う場合、サンプルは母集団の 10% を超えてはいけないとよく言われます。一般に、母集団サイズが大きいほど、より大きなサンプル サイズを使用することが正当化されます。
  5. サンプルサイズが増加する。中心極限定理は、より多くのサンプルが選択されるほど関連性が高くなります。

コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。