-
R
语言入门第十讲:使用函数
sample
p>
进行抽样
R
p>
语言入门第十讲:使用函数
sample
进
行抽样负基础
学
R
语言(Anonym
ous) · 2016
-06-08
17:44
今天第十篇
~~~
p>
上一篇给大家介绍了在
R
中使用
t
检验的方法,让大家稍微
熟悉了一下
R
的统计推断功能。
以后会陆续介绍更多的推断<
/p>
方法。今天介绍一些运算函数,它们的使用很简单,没有什
么难度
,但是也会用的着。在医学统计学或者流行病学里的
现场调查、样本选择经常会提到一个
词:随机抽样。随机抽
样是为了保证各比较组之间均衡性的一个很重要的方法。那
么今天介绍的第一个函数就是用于抽样的函数
sample
:
>
x=1:10>
sample(x=x) [1]
3
5
9
6 10
7
2
1
8
4
第一行代码表示给
x
向量赋值
1~10
,第二行代码表示对
x
向量进行随机抽样。结果输出为每次抽样抽得的结果,可以
< br>看出该抽样为无放回抽样
------
最多抽
n
次,
n
为
x
向量中元
素的个数。
<
/p>
如果想指定在该向量中抽取元素的个数,需要
加一个参数
size
:
>
x=1:1000> sample(x=x,size=20) [1]
66 891 606 924 871 374 879 573 284 305
914 792 398
497 721 897 324 437[19] 901
33
这是在
1~1000
的正整数
中抽样,其中
s
ize
指定抽样的次数,抽了
20
次,
结果如上
所示。这些都是无放回抽样。所谓无放回抽样,也就是说某
个元素一旦被选择,该总体中就不会再有该元素。如果是有
放回抽样,则需添加一个
参数
repalce=T
:
>
x=1:10>
sample(x=x,size=5,replace=T)[1] 4 7 2 4
8“replace”就是重
复的意思。即可以重复对元素进行抽样,也就是所谓的有放
回抽样。我们看上面的结果,元素
4
在
5
次随机抽样的过程
中被抽取了两次。
R
语言代码有一个特性就是“对位性
”,也许我的词不专业,
但是它的意思就是:如果我们输入代码的位置与某个函数中
p>
参数的位置一一对应的话,
我们可以不写该函数的参数,
如:
> x=1:10> sample(x,20,T)
[1] 1 2 2 1 5 5 5 9 9 5 2 9 8
3 4 8 8 8
1 1
在上述代码中我们省略了参数
x
,
size
和
repalce
,
但是仍然可以运算并且表示对
x
向量有放回随机抽取
20
次。
我们之所以尽量在每次编写代码时带上参数是因为我觉得
这个习惯比较好,而且看起来
清楚明白。另外,省略参数的
前提是你非常熟悉某个函数参数的位置,否则一旦没有“对
位”,那么结果肯定是错误的。而且很多函数有较多的参数,
想
记住它们的位置是困难的。而如果带上参数,那么即使位
置不对应,也一样可以运算:<
/p>
> x=1:10>
sample(size=20,replace=T,x=x) [1]
4
9
2
6
4
5
4
7
10
5
2
2
3
4
2
4
6
8
7
8
这种
优点显
而易见,不仅清楚,而且无需对应。另外我们也可以看出,
有放回抽样的话
size
可以无穷大,而无放回抽样
size
的大
小就取决于总体的容量了。对于掷
骰子,投硬币(这可能是
介绍抽样必介绍的内容)
,
都属于有放回抽样。
这里要说明,
对于
sample
函数,参数
x
可以是数值,也可以是字符,实
际上参数
x
< br>代表任意一个向量:
>
a=c(
sample(x=a,size=10,replace=T) [1] <
/p>
上述代码可以理解为掷硬币,抛了
10<
/p>
次,其
中正面(
A
)与反面(
B
)出现的次数。
p>
上述抽样过程,每一个元素被抽取的概率相等,称为随机抽
样。有时
候我们的抽取元素的概率未必相等(如常见的二项
分布概率问题)
,此时我们需要添加一个参数
prob
,也就是
“probability”(概率)的缩写。假设一名医生给患者做某手术
成功的概率是
80%
,那么现在他给
2
0
例病人做手术,可能
有哪几次是成功的呢?代码如下:
> x=c(
sample(x,size=20,repla
ce=T,prob=c(0.8,0.2)) [1]
p>
其中“S”代表成功,“F”代表失败。
>
x=c(1,3,5,7)
> sample(x,s
ize=20,replace=T,prob=c(0.1,0.2,0.3,0.9))
[1] 3 5 7 3 7 3 7 5 3 7 7 7 1 5 7 5 7 7
3 7
这些代码告诉我们,
对每一个元素都可以给定一个概率,
且每个概率是独立的,
即在参数
prob
中,
不一定所有元素的概率加起来等于
1
,
它
只代表某元素被抽取的概率而已。
对于
sample
函数,其参数
x
可以是
R
中
任意一个对象(如
-
-
-
-
-
-
-
-
-
上一篇:最新SPSS中各种参数意思
下一篇:人教版四年级上册语文辅导计划