dummy

国家统计局目前对地区的划分中,将我国 31 个省市自治区划分为东部地区、中部地区、西部地区、东北地区。

    1. 要分析四个地区的平均消费水平是否存在显著差异,所用的统计方法有哪些?这些方法的区别是什么?
    1. 你会选择什么方法进行分析?你的假设是什么?

答:

  1. 可两两之间进行 t 检验或 4 组数据进行方差分析。
  • T 检验:两独立样本 t 检验(two independent samples t-test),又称成组 t 检验。 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是 否相等。完全随机设计是分别从不同总体中随机抽样进行研究,即本项目中从不同地 区随机抽样进行研究相符合。

  • 单因素方差分析:研究一个分类型自变量对一个数值型因变量的影响,如本项目中就 是研究四个不同地区对平均消费水平的影响。

区别:T 检验属于均值分析,它是用来检验两类母体均值是否相等。均值分析是来考察 不同样本之间是否存在差异,即两个不同地区之间消费水平是否存在显著差异;而方 差分析则是评估不同样本之间的差异是否由某个因素起主要作用,即消费水平的显著 差异是否是由地区不同引起的。并且通过单因素方差分析只能得出 4 组数据是否存在 显著差异,并不能得出具体是哪几个地区之间有显著差异。

  • Kruskal-Wallis 检验: 用于检验多个独立总体是否相同的一种非参数检验方法。 原假设: 四 个地区平均消费水平相等,备择假设: 四个地区平均消费水平不全相等。不需要方差分析的 正态分布且方差相等的假设。该检验可用于顺序数据也可用于数值型数据
  1. 我选择用单因素方差分析,因为本项目共分为 4 组数据,只要求分析他们之间是 否存在显著差异,并不用确定具体差异如何存在的。原假设为:四个地区之间的平均 消费水平没有显著差异。若最终拒绝原假设,则说明四个地区之间的平均水平存在显 著差异。即证明了题目中的要求。因为对四个地区的分布和方差未知,选择非参数方法。