概要

統計の分野では、データを収集、要約、分析して結果を解釈するための原理と手法が用意されています。統計を使用してデータを表し、推定します。そして、その推定を使用して工程や製品を改善します。

Minitabには、多くの統計分析(回帰分析、分散分析、品質ツール、時系列分析など)が用意されています。組み込みのグラフは、データを視覚化して結果を検証する場合に役立ちます。Minitabでは、統計量や診断指標を表示および保存することもできます。

この章では、配達遅延の注文数と入荷待ちの注文数を評価して、3つの配送センター間の配達時間の差が統計的に有意であるかどうかを検定します。

データを要約する

記述統計量は、データの顕著な特徴を要約し、記述します。記述統計量表示を使用して、各配送センターの書籍注文において、予定どおりに配達された数、配達が遅延した数、および入荷待ちの数を調べます。

記述統計量を表示する

  1. サンプルデータを開く、配送データ.MTW.
  2. 統計 > 基本統計 > 記述統計量表示を選択します。
  3. 変数に「日数」と入力します。
  4. グループ変数 (オプション)センターステータスと入力します。
    ほとんどのMinitabコマンドは、メインダイアログボックスの各項目を入力するだけで実行できます。多くの場合、サブダイアログボックスを使用して、分析を修正したり、グラフなどの追加出力を表示したりすることもできます。
  5. 統計量をクリックします。
  6. 第1四分位数中央値第3四分位数非欠損値の数欠損値の数のチェックマークを外します。
  7. 合計個数をクリックします。
  8. 各ダイアログボックスでOKをクリックします。

    統計量サブダイアログボックスで行った変更は、現在のセッションにのみ影響します。今後のセッションのデフォルトのオプションを変更するには、ツール > オプションを選択します。個別のコマンドを展開し、記述統計量表示を選択します。表示する統計量を選択します。統計量サブダイアログボックスを再度開くと、新しいオプションが表示されます。

記述統計量: 日数

センター = 中央に対する結果

統計量 平均の標 変数 ステータス 合計数 平均 準誤差 標準偏差 最小 最大 日数 取り寄せ注文 6 * * * * * 遅延 6 6.431 0.157 0.385 6.078 7.070 時間通り 93 3.826 0.119 1.149 1.267 5.983

センター = 東部に対する結果

統計量 平均の標 変数 ステータス 合計数 平均 準誤差 標準偏差 最小 最大 日数 取り寄せ注文 8 * * * * * 遅延 9 6.678 0.180 0.541 6.254 7.748 時間通り 92 4.234 0.112 1.077 1.860 5.953

センター = 西部に対する結果

統計量 平均の標 変数 ステータス 合計数 平均 準誤差 標準偏差 最小 最大 日数 取り寄せ注文 3 * * * * * 時間通り 102 2.981 0.108 1.090 0.871 5.681

セッションウィンドウにはテキスト出力が表示され、それをMicrosoft WordやMicrosoft PowerPointに送ることができます。PowerPointへの出力の送信に関する詳細は、Minitabから結果を表示を参照してください。

結果を解釈する

セッションウィンドウには、各配送センターの結果が個別に表示されます。各配送センターのTotal Count(合計数)列には、入荷待ちの注文、配達遅延の注文、および予定どおりに配達された注文の件数が表示されています。

  • 東部配送センターは、入荷待ちの注文(8)と配達遅延の注文(9)があり、最大の件数です。
  • 中央配送センターは、入荷待ちの注文(6)と配達遅延の注文(6)があり、2番目に多い件数です。
  • 西部配送センターは、入荷待ちの注文(3)と配達遅延の注文は0件であり、件数が最小です。

また、このセッションウィンドウ出力には、各配送センターの配達までの日数の平均、平均の標準誤差、標準偏差、最大値、および最小値も含まれます。入荷待ちの注文では、これらの統計量は存在しません。

2つ以上の平均を比較する

統計分析で一般的に使用される方法の1つに、仮説検定があります。Minitabには、t検定や分散分析など、多数の仮説検定が用意されています。通常、仮説検定を実行する場合、初期主張を真であると仮定し、その主張をサンプルデータを使用して検定します。

仮説検定には、帰無仮説(H0)と対立仮説(H1)の2つの仮説(主張)があります。帰無仮説は初期主張であり、多くの場合、以前の調査や一般的な知識に基づいて指定されます。対立仮説とは、あなたが正しいと確信する仮説を指します。

前の章のグラフによる分析と先ほどの記述統計量に基づいて、配送センター間の配達までの日数の平均値の差が、統計的に有意であると推測します。これを検証するために、2つ以上の平均の同等性を検定する、一元配置分散分析を実行します。また、どの配送センターの平均が異なっているかを調べるために、Tukeyの多重比較検定も行います。この一元配置分散分析では、配達までの日数が応答、配送センターが因子になります。

分散分析を実行する

  1. 統計 > 分散分析 > 一元配置を選択します。
  2. すべての因子水準の応答データが1つの列にあるを選択します。
  3. 応答に「日数」と入力します。因子に「センター」と入力します。
  4. 比較をクリックします。
  5. 等分散を前提とする比較手順の下のTukeyをチェックします。
  6. OKをクリックします。
  7. グラフをクリックします。 Minitabでは、多くの統計コマンドに対して、結果の解釈と統計的仮説の妥当性の評価に役立つ、グラフが用意されています。これらのグラフは、組み込みのグラフと呼ばれます。
  8. データプロットで、区間プロット個別値プロット箱ひげ図のチェックマークをつけます。
  9. 残差プロット一覧表示を選択します。
  10. 各ダイアログボックスでOKをクリックします。

一元配置分散分析 (ANOVA):日数 対 センター

方法 帰無仮説 すべての平均が等しい 対立仮説 少なくとも1つの平均が異なっている 有意水準 α = 0.05 未使用の行 17 等分散性は分析で仮定されました。
因子情報 因子 水準 値 センター 3 中央, 東部, 西部
分散分析 調整平 調整平 要因 自由度 方和 均平方 F値 p値 センター 2 114.6 57.317 39.19 0.000 誤差 299 437.3 1.462 合計 301 551.9
モデル要約 R二乗 (調 R二乗 S R二乗 整済み) (予測) 1.20933 20.77% 20.24% 19.17%
平均 センター N 平均 標準偏差 95%信頼区間 中央 99 3.984 1.280 (3.745, 4.223) 東部 101 4.452 1.252 (4.215, 4.689) 西部 102 2.981 1.090 (2.746, 3.217) 併合標準偏差=1.20933

Tukeyペアワイズ比較

Tukey法と95%の信頼性を使用したグループ化情報 グルー センター N 平均 プ化 東部 101 4.452 A 中央 99 3.984 B 西部 102 2.981 C 文字を共有しない平均は、有意差があります。

セッションウィンドウ出力を解釈する

仮説検定の意思決定プロセスは、p値に基づいています。p値は、帰無仮説が実際には真実であるのに誤って棄却してしまう確率です。

  • p値があらかじめ設定されている有意水準(αまたはアルファとも呼ばれる)以下の場合、帰無仮説を棄却して対立仮説を選択します。
  • p値がαより大きい場合は、帰無仮説を棄却できず、対立仮説を許容できません。

0.05のαを使って、分散分析表のp値(0.000)は、少なくとも2つの配送センターの平均配達時間が有意に異なると結論付けるための十分な証拠となります。

テューキーの検定の結果は、有意または有意でない比較がハイライト表示されるグループ化情報表に含まれます。各配送センターは異なるグループにあるため、すべての配送センターの平均配達時間はそれぞれ有意に異なります。

分散分析のグラフ

分散分析のグラフを解釈する

Minitabで次のグラフが作成されました。
  • 一覧表示残差プロット
  • 区間プロット
  • 個別値プロット
  • 箱ひげ図
  • Tukeyの95%信頼区間プロット

まず、残差プロットを調べます。次に、区間プロット、個別値プロット、箱ひげ図を一緒に調べ、平均の同等性を評価します。最後に、Tukeyの95%信頼区間プロットを調べて、統計的有意性を判断します。

残差プロットを解釈する

統計的仮説を検証するには、多くの統計コマンドで利用できる残差プロットを使用します。
正規確率プロット
このプロットは、非正規性を検出するために使用します。各点がほぼ直線になっている場合は、残差が正規分布に従っていることを示します。
ヒストグラム
このプロットは、複数の頂点、外れ値、非正規性を検出するために使用します。ほぼ対称でつりがね型になっている正規ヒストグラムを調べます。
対適合値
このプロットは、不均一分散、高次の項の欠損、外れ値を検出するために使用します。ゼロ周辺にランダムに散在している残差を調べます。
対順序
このプロットは、残差の時間依存性を検出するために使用します。プロットを検査して、残差に明らかなパターンがないことを確認します。

配送データについては、1の4残差プロットは、統計的仮説の違反がないことを示しています。一元配置分散分析モデルは、データに比較的良く適合しています。

Minitabでは、各残差プロットを個別のページに表示できます。

区間プロット、個別値プロット、箱ひげ図を解釈する

区間プロット、個別値プロット、箱ひげ図を調べます。各グラフでは、配達時間が配送センターによって変わることが示されており、これは前の章のヒストグラムと一致します。東部配送センターの箱ひげ図にはアスタリスクがあります。アスタリスクは外れ値を示しています。この外れ値は配送時間が異常に長かった注文です。

区間プロットを再度調べます。区間プロットには、各平均の95%の信頼区間が表示されています。グラフの点の上にポインタを置くと、その平均が表示されます。区間バーの上にポインタを置くと、95%の信頼区間が表示されます。区間プロットでは、西部配送センターの平均配達時間が最短(2.981日)で、信頼区間が2.75~3.22日であることが示されています。

テューキーの95%の信頼区間のプロットを解釈する

テューキーの95%の信頼区間のプロットは、差が含まれる可能性が高い範囲を特定し、これらの差の実質的な有意性を評価するのに最適なグラフです。テューキーの信頼区間は、次のペアワイズ比較を示します:
  • 東部配送センターの平均から中央配送センターの平均を引いた差
  • 西部配送センターの平均から中央配送センターの平均を引いた差
  • 西部配送センターの平均から東部配送センターの平均を引いた差

ポインタをグラフの点に合わせると、推定値(中央、上限、下限)が表示されます。東部から中央を引いた差の比較に対応する区間は0.068~0.868です。つまり、東部配送センターの平均配達時間から中央配送センターの平均配達時間を引いた差は0.068~0.868日になると推定されます。東部配送センターの配達には、中央配送センターの配達よりも長い時間がかかっています。他のテューキーの信頼区間も同様に解釈します。また、値ゼロにおける破線に注目してください。区間にゼロがない場合、対応する平均に有意差があります。したがって、すべての配送センターの平均配達時間は有意に異なります。

主要な結果のアクセス

一元配置分散分析の解釈方法について、特にテューキーの多重比較の方法について、詳しい情報が知りたいとします。Minitabには、ほとんどの統計コマンドについて、セッションウィンドウ出力とグラフに関する詳細情報が記載されています。

  1. カーソルを、一元配置分散分析のセッションウィンドウ出力内の任意の場所に置きます。
  2. 標準ツールバーで、ヘルプボタン .

プロジェクトを保存する

Minitabプロジェクトにすべての作業情報を保存します。

  1. ファイル > プロジェクトに名前を付けて保存するを選択します。
  2. ファイルの保存先のフォルダに移動します。
  3. ファイル名に、MyStatsと入力します。
  4. 保存をクリックします。

MinitabのProject Managerを使用する

これまでに、1つのワークシート、いくつかのグラフ、および分析からのセッションウィンドウ出力を含むMinitabプロジェクトを作成しました。Project Managerを使用すると、Minitabプロジェクトの構成部分をナビゲートしたり、表示したり、操作したりすることができます。

Project Managerを使用して、先ほど実行した統計分析を表示します。

セッションウィンドウ出力を表示する

Project Managerを使用して、一元配置分散分析のセッションウィンドウ出力を確認します。

  1. [Project Manager]ツールバーで、[セッションフォルダを表示]ボタン.
  2. 左側の枠で、[一元配置分散分析(ANOVA):日数 対 センター]をダブルクリックします。

右側の枠に、一元配置分散分析のセッションウィンドウ出力が表示されます。

グラフを表示する

箱ひげ図を再び表示します。セッションフォルダで[日数の箱ひげ図]をダブルクリックするか、[グラフフォルダを表示]ボタン をクリックします。

  1. [Project Manager]ツールバーで、[グラフフォルダを表示]ボタン .
  2. 左側の枠で、[日数の箱ひげ図]をダブルクリックします。

グラフウィンドウに、箱ひげ図が表示されます。

次の章の内容

記述統計量と分散分析の結果により、西部配送センターが配達遅延の注文数および入荷待ちの注文数が最小で、配達時間も最短であることがわかりました。次の章では、管理図を作成し、工程能力分析を実行して、西部配送センターの工程が、時間が経過しても安定しているかどうか、また規格内で機能しているかどうかを調べます。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください