-
Epi Info
软件在流行病学中的应用
1990<
/p>
年美国乔治亚州亚特兰大疾病控制中心
(
CDC
)
流行病学软件研究室和
瑞士日
内瓦世界卫生组织
(
WHO
)
艾滋病全球控制小组合作,共同研制成功
5.00
版本的
Epi
Info
疾病数据管
理软件;
1992
年卫生部卫生统计信息中心委托上海
医科大学卫生统计学教研室并合作译制成功
Epi
Info
5.01a
汉化版;
1996
年美国
CDC
与
WHO
又成功推出
6.04
版;该版在功能上有了较大的增加和提高。用户
可从
< br>/
免费下载。
Epi
Info
软件深受各国医学科研工作者的欢迎,该软件充分考虑了疾病
调查
数据的特点,能很方便地对数据进行存储、核对、连接、与其他
16
种数据文件
相互转换以及进行流行病学研究中各种常用
的统计分析。
问题
1
目前流行病学研究中还有哪些较流行的统计软件?你使用过吗?
问题
2
你知道
Epi
Info
软件有哪些常用的可执行程序吗?
?
课题一
?
Epi
Info
软件中常用的可执行程序有以下几种。
()
STA
V
ALIDA
主菜单程序
文本编辑
数据输入
数据核对
数据分析
统计计算器
数据文件输出
数据文件输入
数据文件连接
文件比较
与
Epi Info
5.0
版相比,
Epi Info 6.04
< br>增加了
、
、
三个应用程序。
问题
3
你能说出以上可执行程序各自的主要用途吗?
[
课题二
]
在将流行病学调查数据录入微机之前,首先应编写调查表文件,
Epi
Info
软件将根据建立好的调查表文件格式自动生成
数据文件结构。
一旦数据文件结构
产生之后,
< br>便可开始输入数据。
有了数据,
就可利用
Epi Info
进行常用的统计分
1
析。
标
准的数据文件由原始数据和文件结构两部分组成。而文件结构又由字段
名(变量名)
p>
、类型和长度组成。
Epi
Info
p>
不同于其他数据库软件的特别之处在
于用户可按原始调查表样式建立
数据文件结构。
这对调查项目较多的流行病学调
查表,有利于录
入界面和调查表一致,可减少录入错误,提高效率。
问题
4
根据所学统计学知识,
你知道流行病学资料中的数据常见类型有哪
几种?试各举一例予以说明
。
编写调查表文件时,使用者主要考虑如何依据原始调查表的
数据设置字段
名
(变量名)
、
类型和长度。
所谓字段
(
Field
)
是指原始调查表中的调查项目
< br>(数
据分析时又可称为变量,
V
ariable
)
。
Epi
Info
软件可自动地从调查
表建立变量或字段名,当遇到下划线或其他
特殊字符时,就在本行查找文字,这些文字成
为变量名的基础,其前
10
个非标
点字
符为变量名。此变量名在数据录入(
ENTER
)和分析程序(
ANALYSIS
)
中用来输入该字段
数据和分析该变量。
例如“
They
like
to
eat
vegetables
_____”
,则该字段的变量名为
“
V
egeta
bles
”
,句子其他部分因空格和标点符号而被自动删除。<
/p>
如果想给变量名标上序号,则可以这样:
“
Disease7
____”
,
不要写成
“
7Disease
___
”
,因为程序要求变量名要以字母开头,若以数字开头,
Epi
Info
将在数字前加“
N
”字符。当然,数据文件建立之后,也可在
CHECK
模块
中完成变量名的修改。
问题
5
如果你的原始调查表中调查项
目多达数百项,
则在设计变量名时要
注意哪些问题?
EPI
软件对字段的类型、长度规定如下:
p>
表
1
Epi
Info
软件的字段类型及示例
字段类型
字符型
数字型
大写字符型
逻辑字段型
日期型
编辑样式
_____
(下划线)
##
2
举
例
Cough,
139666
139
,
139.666
HAO,
H
Y
,
N
11/28/98
11/28
11/28/1996
28/11/96
28/11
28/11/1996
修改日期型
记录号字段
月、日
月、日、
2
位年份
月、日、
4
位年份
139666
问题
6
对于类似“
< br>13966696
”的数据,你认为该属上述字符型变量值,还
< br>是数字型变量值?为什么?
文本编辑模块
(
EPED
)
是用于建立<
/p>
Epi Info
调查表及一般文本编辑的文字
< br>处理器,
其主要功能是用于编写调查表文件,
但也可编写
分析程序、
信函及疾病
报告等。调查表文件编好后,其扩展名必
须为
?
QES
,可保存于硬盘或软盘上
。
另外,
也可用其他字处理软件如
WO
RD
或
WPS
、
写字本等编写,
应注意用
ASC
Ⅱ文
件形式(即
DOS
文本文件形式)存储。
进入
EPED
程序可有两种方式:
EPI
主菜单或直接在
MS-DOS<
/p>
环境下键入
EPED
,回车运行。进入<
/p>
EPED
模块后,用户可以象用
WORD
等文字处理软件
一样,按原始调查表样式建立新的
EPED
文件或修改已经存在的调查表文件。
建立或
修改完毕后,按
<
F9
>
或
<
F10
>
键将调查表文件保存在软盘或硬盘上。
EPED
文本
编辑模块的窗口如图
1
所示?
F1-
帮助
F2-
文件
F3-Epiaid
F4-
文本
F5-
打印
F6-
设置
F7-
查找
F8-
块
F9-
贮存
F10-
结束
1
未命名窗口
423911 Pg 1
EPED
Ln 1
Col 1
InsInd
图
1
EPDE
文本编辑的窗口
在屏幕顶部
,显示了主要操作的十个功能键
<
F1
>
~
<
F10
>
的命令提示,每
一命令即可直接执行命令,也可在屏幕中央引
出一选择菜单。
问题
7
请你针对下面研究生微机知识的原始调查表建立一个名为
AQ
·
QES
的调查表文件。
研究生微机知识调查表
调查表编号
________
6.
专业
___
①大内科
②大外科
③基础
④预防
⑤管理
一、基本情况
1.
姓名
____
(
可不填写
)
3
2.
性别
____
3.
年龄
____
4.
入学前所在单位城市
____
5.
入学形式
_____
①统招
②课程班
11. Epi
对你是
____
①必修课
②选修课
7.
出生日期
____
年
____
月
____
日
8.
最后学历
_____
①中专
②大专
③本科
9.
入学前月收入
_____ (
人民币
,
元
)
10.
上月生活费
_____
(
人民币
,
元
)
<
/p>
13.
如用过微机,微机操作系统是
__
_
①
DOS
②
WINDOWS
③
DOS+WINDOWS
④其他
15.
如用过
,
统计软件名称为
____
①
Epi
②
SPSS
③
SAS
④
BMDP
⑤其它
17.
核对者
______
二、微机知识
12.
入学前是否用过微机
____
①用过
②未用过
14.
是否用统计软件处理过科研数据
___
①是
②否
16.
填表时间
_______
[
课题三
]
在进行流行病学资料分析时,
有时并非都要用原始调查表的数据,
可能是一
些中间数据,
如病例对照研究分层分析的四格表资料
等。
对这种中间数据的处理
可利用
Ep
i Info
的
STATCALC
程序
。
同样可以
EPI
< br>主菜单方式或从
DOS
状态下直接键入
< br>STATCALC
,
回车后
进入
STATCALC
程序进行分析。
Epi
Info
V
ersion 6
Statcalc
Tables (2 x 2, 2 x n)
T
表
(2 x 2, 2 x n)
Sample size & power
C
样本大小与把握度
Chi square for trend
S
趋势卡方
F1-Help
F6-Open File
图
2
STA
TCALC
程序窗口屏幕
November 1993
F10-Done
运行后屏幕出现
可供选择的菜单(图
2
)
,移动光标控
制键并按回车或直按
增强显示的字母键例如
T
< br>等,可进行选择。按<
F1
>键显示有关统计方法信息<
/p>
的求助屏幕。
四格表资料分析
< br>选择
Tables
时,屏幕将显示
2
×
2
表格。若进行单个
四格表的分析,只需键入四个数字,然后再按
<
F
4
>
键,屏幕将会显示具有可信
4
限范围的比值比、
相对危险度、<
/p>
三种卡方检验值等统计结果。
数字录入时注意列
< br>是疾病结局有无,第一列为有此疾病(+)
,第二列为无此疾病(-)
;行是暴露
因素有无,
(+)
表示暴露,
(-)
表示无暴露。
如
果表中数字过小,
则显示
Fisher
精确概率计算值;另外,也可进一步计算精确法可信限范围。
问题
8
分析一般
2
×
2
表资料,通常有
3
种
?
2
值可供选择,请你谈谈每种
?
2
值的各自适用条件。
为了解铅中毒病人是否有尿棕色素增加
现象,分别对病例组和对照组的尿
液作尿棕色素定性检查,结果见表
2
,问铅中毒病人与对照人群的尿棕色素阳性
率有无差别?
表
2
两组人群尿棕色素阳性率比较
组
别
阳性数
阴性数
29
7
铅中毒病人
9
28
对照组
(倪宗瓒,卫生统计学,第四
版,
2000
)
问题
9
对表
2
资料进行分析,并对结果做出合理的解释。
分层分析
如果在输入第一层次四个数字后,接下去按
F2
键则可继续输
入另一层次四个数字。这样当输完所有层次的数字后,按
<
F4
>
键,得到第一
层
的分析结果;按
<
F4
>
键将显示总的分层分析结果。
问题
10
何谓资料分层分析?为什么要进行分层分析?
对表
3
的资料,
因考虑到年龄
与口服避孕药
(
OC
)
有关,
也与心肌梗死
(
MI<
/p>
)
有关,可能是个混杂因素。故按年龄分层,分为年龄<
40
岁和≥
40
岁两层
;如
表
4
表
3
某病例对照资料结果
组别
病例
对照
服
OC
39
24
未服
OC
114
154
(李立明,流行病学,第四版,
1999
)
表
4
表<
/p>
3
资料按年龄分层的结果
组别
服
OC
病例
21
<40
岁
未服
OC
26
≥
40
岁
服
OC
18
未服
OC
88
5
对照
17
59
7
95
(李立明,流行病学,第四
版,
1999
)
问题
11
请对表
4
的资料进行分析,并对结果予以解释。
2
×
n
的列联表分析
在表格中连续输入数字,
< br>即每输入一个数字后按一次
回车,用户可进行
2
×
n
的列联表卡方检验,但
n
的最大值为
10
。
某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,
资料如
表
5
,问其血型构成有无差别?
表
5
鼻咽癌患者与眼科病人血型构成比较
组
别
鼻咽癌患者
眼科病人
A
型
55
44
B
型
45
23
O
型
57
36
AB
型
19
9
(倪宗瓒,卫生统计学,第四版,
2000
)
问题
12
< br>分析
2
×
n
列联表时,若程序运行后显示有理论频数小于
5
,这种
p>
情况应如何处理?有无补救方法?
样本大小计算
当选择
Sample
size
进行样本大小计算时,屏幕将出现
另一个选
择菜单
Population
survey
Cohort or cross-sectional
Unmatched case-control
P
群体调查
C
队列或横断面研究
U
非配比病例对照研究
用户可进行抽样调查、
队列或横断面
研究以及非配对病例对照研究样本大小
的计算。
计算样本大小时
,
应按提示输入可信限水平和用户本人所期望的实际比
例、
p>
相对危险度或比值比相接近的估计假定值。
例如在队列研究或横断面
研究时,
假定选择非暴露人群对某一问题具有阳性回答的比例是
10
%,可以输入
20
%作
为能用以区别暴露人群的比例。这意味着任何大于
20
%的比例都会使最终研究
结果产生统计学检验显著性,例如,
P
<
0.05
。这里应用
20
%的比例与应用
2
的
相对危险度及
0.5
的比值比都是相同
的;
即它们都能通过计算获得同样的样本估
计值。在输入有关参
数值后,按
<
F4
>
< br>键进行样本大小的计算。
问题
13
现拟进行一项病例对照研究,研究吸烟与肺癌关系。预期吸烟者
6
-
-
-
-
-
-
-
-
-
上一篇:高三一模英语试题(word版含答案)
下一篇:英语修辞中的重复手段-精选资料