-
P
值的意义:有显著性差异
< br>统计学意义(
P
值)
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,
< br>P
值为
结果可信程度的一个递减指标,
< br>P
值越大,我们越不能认为样本中变量的关联是总体中各变
量关联的可靠指标。
P
值是将观察结果认为有效即具有总体代
表性的犯错概率。如
P=0.05
提示样本中变量关联有
5%
的可能是由于偶然性造成的。
即假设总体
中任意变量间均无关联,
我们重复类似实验,会发现约
20
p>
个实验中有一个实验,我们所研究的变量关联将等于或强
于我们的实
验结果。
(这并不是说如果变量间存在关联,我们可得到
5%<
/p>
或
95%
次数的相同结
< br>果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。
< br>)
在许多研究领域,
0.05
的
P
值通常被认为是可接受错误的边界水平。
如何判定结果具有真实的显著性
在最后结论中判断什么样的显著性水平具有统计学意义,
不可避免地带有武断性。
p>
换句
话说,
认为结果无效而被拒绝接受的水
平的选择具有武断性。
实践中,
最后的决定通常依赖
于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两
>
p>
比较,依赖于总体数
据集里结论一致的支持性证据的数量,
依赖于以往该研究领域的惯例。
通常,
许多的科
学领
域中产生
P
值的结果≤0.05<
/p>
被认为是统计学意义的边界线,但是这显著性水平还包含了相
当高
的犯错可能性。
结果
0.05≥P>0.01
< br>被认为是具有统计学意义,
而
0.01≥P≥0.001
被认
为具有高度统计学意义。但要注意这种分类仅仅是研究基础
上非正规的判断常规。
所有的检验统计都是正态分布的吗?
并不完全如此,
但大多数检验都直接或间接与之有关,
可以从正
态分布中推导出来,
如
t
检验、
f
检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态
分布,即满
足所谓的正态假设。
许多观察变量的确是呈正态分布
的,
这也是正态分布是现实世界的基本
特征的原因。
当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产
生了,
(参阅非参数和方差分析的正态性检验)
。
这种条件下有两种方法:
一是用替代的非参
数检验
(即无分布性检验)
,但这种方法不方便,因为从它所提供的结论形式看,这种方法
p>
统计效率低下、
不灵活。
另一种方法是:<
/p>
当确定样本量足够大的情况下,通常还是可以使用
基于正态分布前
提下的检验。
后一种方法是基于一个相当重要的原则产生的,
该
原则对正态
方程基础上的总体检验有极其重要的作用。
即,
p>
随着样本量的增加,
样本分布形状趋于正态,
即使所研究的变量分布并不呈正态
统计分析软件中的
F
值、
P
值有何现实
意义(简单明了)?
F
值是
方差分析
中的一个指标,
一般方差分析是比较组
间差异的。
F
值
越大,
P
值越小,
表示你的结果越可靠。
比如,
你的结果表明三组之间差别有
统计学
意义,
P
值
如果等于
0.01
,
表示有
1-
0.01=0.99
即
99%
的把握认
为你的结论是正确的。
T
检验、
F
检验和统计学意义(
P
值或
sig
值)
(
转载
)
1,T
检验和<
/p>
F
检验的由来
一般而言,
为了确定从样本
(sample)
< br>统计结果推论至总体时所犯错的概率,
我们会利用统计
学
家所开发的一些统计方法,进行统计检定。
通过把所得到的统
计检定值,与统计学家建立了一些随机变量的概率分布
(probability
p>
distribution)
进行比较,我们可以知道在多少
%
的机会下会得到目前的结果。倘若经比较后
发现,出现这结果的机率很少,亦即是说,是在机会很
少、很
罕有的情况下才出现;那我
们便可以有信心的说,这不是巧合,是具有统计学上的意义的
(
用统计学的话讲,就是能够
拒绝虚无
假设
null hypothesis,Ho)
。相反,若比较
后发现,出现的机率很高,并不罕见;那
我们便不能很有信心的直指这不是巧合,也许是
巧合,也许不是,但我们没
能确定。
F
值和
t
值就
是这些统计检定值,与它们相对应的概率分布,就是
F
分布和<
/p>
t
分布。统计显
著性(
< br>sig
)就是出现目前样本这结果的机率。
2
,统计学意义(
P
值或
sig
值)
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,
p
值为结果
可信程度的一个递减指标,
p
值越大,我们越不能认为样本中变量的关联
是总体中各变量
关联的可靠指标。
p
值
是将观察结果认为有效即具有总体代表性的犯错概率。如
p=0.05
< br>提
示样本中变量关联有
5%
的可
能是由于偶然性造成
的。
即假设总体
中任意变量间均无关联,
我们重复类似实验,会发现约
20
p>
个实验中有一个实验,我们所研究的变量关联将等于或强
于我们的实
验结果。(这并不是
说如果变量间存在关联,我们可得到
p>
5%
或
95%
次数
的相
同结果,
当总体中的变量存在关联,
重复研究和发现关联的可能性与设计的统计学效力有关。
)
在
许多研
究领域,
0.05
的
p
值通常被认为是可接受错误的边界水平。
p>
3
,
T
检验和
F
检验
至於具体要检定的内容,须看你是在做哪一个统计程序。
p>
举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的
t
检验。
两样本
(
如某班男生和女生
)
某
变量
(
如身高
)
的均数并不相同,但这差别是否能推论至总体,
代表总体的情况也是存在著差异呢?<
/p>
会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这<
/p>
2
样本的数值不同?
< br>为此,我们进行
t
检定,算出一个
t
检定值。
与统计学家建立的以「
总体中没差别」作基础的随机变量
t
分布进行比较,看看在多少
%
的
机会
(<
/p>
亦即显著性
sig
值
)
下会得到目前的结果。
若显著
性
sig
值很少,比如
<0.05(<
/p>
少於
5%
机率
)
,亦即是说,「如果」总体「真的」没有差
别,那麼就只有在机
会很少
(5%)
、很罕有的情况
p>
下,才会出现目前这样本的情况。虽然还
是有
5%
机会出错
(1-0.05=5%)
,
但我们还是可以
「比较有信心」
的
说:
目前样本中这情况
(
男
女生出现差异的
情况
)
不是巧合,是具统计学意义的,
「总体中男女生不存差异」的虚
无假
设应予拒绝,简言之,总体应该存在著差异。
-
-
-
-
-
-
-
-
-
上一篇:商务英语自测及答案
下一篇:初懂影片名称:电影TS、TC、BD、HD等是什么意思