统计学和生物统计学的区别

2017-02-06 推荐阅读 阅读:

统计学和生物统计学的区别【一】:生物统计学

生物统计学-数理统计对生命的诠释

生物统计(biostatistics)即用数理统计的原理和方法,分析和解释生物界的种种现象和数据资料,以求把握其本质和规律性。这个专业非常Interdisciplinary ,跟统计、生物信息、计算机(尤其是 data mining)等关系很密切。

生统学什么?在美国的专业设置以及课程设置是怎样的?

先从生物统计项目的开设情况说起,在美国Top30的学校中,有19所学校开设了生统的Master项目,Top70的院校中超过一半的学校均开设有Biostatistics项目。

按学院名称分类:

School of Public Health

- e.g. JHU, Harvard, Yale, Columbia, Emory, U Mich, Brown etc.

School/ College of Medicine, Medical Center

-e.g. Duke, U Penn, WUSTL, USC, Case etc.

School of Arts and Science

-e.g. UCD, Connecticut etc.

这其中,大部分学校是开设在公共卫生学院下的(School of Public Health)

按项目名称分类:

-MS/MA in Biostatistics

-MPH/MSPH in Biostatistics

MPH in Biostatistics核心课程,以Emory为例:

Statistical Methods-统计方法

Statistics for Experimental Biology-统计实验生物学

Biostatistical Methods-生物统计方法

Statistical Inference-统计推断

Probability Theory-概率论

Modern Regression Analysis-现代回归分析

SAS Programming-SAS编程

Statistical Computing-统计计算

Stochastic Processes-随机过程

一般来说要求的先修课程:

Multivariable Calculus-多元微积分

Linear Algebra-线性代数

Probability-概率论基础

Theoretical and applied statistics-理论和应用统计学

One statistical system R(SAS)-一门统计学软件比如SAS或者R

One computer language C(Python,Java)-一门计算机语言,C/C++

MS in Biostatistics课程设置,以WUSTL为例:

Biostatistics Pathway:

Statistical Computing with SAS-应用SAS的统计计算

Fundamentals of Genetic Epidemiology-遗传流行病学原理

R Primer

Introduction to Bioinformatics-生物信息学导论

Biostatistics I,II-生物统计学

Introduction to Epidemiology-流行病学导论

Study Design and Clinical Trials-研究设计和临床试验

Survival Analysis-生存分析

Ethical & Legal Issues in Clinical Research

Internship Preparation

Biostatistics Consulting Lab

Thesis or Electives*

从Research Area来看,主要领域为:

1.临床统计学 Clinical Statistics

-生存分析(survival analysis),主要处理临床实验中的个体寿命,是研究生存现象和响应时间数据及其统计规律的一门学科。该方向近二三十年来一直受到国内外统计学家的关注。生存分析以前主要用KAplan-Meier和Cox两大模型,现在又出现了frailty models, accelerated failure time models, transformation models等新的理论。

-纵向数据分析(longitudinal data analysis),主要处理临床实验中对同一个体重复观测得到的数据。描述纵向数据常用的模型有random effects models,marginal models等等。

-临床试验设计(clinical trial and design),主要研究在随机化实验中,如何在保证统计功效的条件下,尽可能让患者接受新药治疗(intention to treat)进行实验设计。这方面较新的理论是alpha spending functions。

2.统计遗传学 Statistical Genetics

-运用统计手段研究遗传学与分子生物学中的问题,统计手段有:建模,Monte Carlo等等。教授通常是通过基因表达数据对基因的调控行为与功能进行研究。

统计和生物统计专业有什么区别?

很多人申请的时候,统计statistics和生物统计biostatistics两个专业同时考虑,最近有人询问两个专业之间的不同,尤其是应该选择读哪个专业。小编在这里做一下总结:

1)统计专业就业出路更广阔,生物统计出路自然要狭窄,看专业名字就知道了。如果不确定自己想读什么,就选择出路更广阔的。

2)TOP院校一般统计学项目会比生统项目更难申请,比如DUKE。

3)如果一个生物(硕士)前30名校的录取和一个计算机普通学校(比如80名)的录取做比较,想在美国找工作,那么无疑计算机专业是占优的,尽管学校差一些,但是就业前景会好很多。而统计和生统之间的差距,并没有这么大,这二者本质上是一个专业和这个专业的一个分支,所以在一个生统名校和一个统计普通学校之间,到底选择哪个,要根据自己的职业规划来定。如果去药厂、科研机构、health care、学统计和学生统没有多大区别,可以等同对待。如果去IT、Market research、金融这类行业,生统这种更加specialized的专业,就没有“专业性”的优点了,招人的公司有可能看到“生统”

会怀疑你的背景是否匹配;

统计学和生物统计学的区别【二】:生物统计学名词解释大全

1.

2.

3.

4.

5.

6.

7. 样本: 样本 从总体中抽出的若干个体所构成的集合称为样本。 总体: 总体 指具有相同性质的个体所组成的集合称为总体。 连续变量:表示在不变量范围内可抽出某一范围的所有值。 非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。 准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。 精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。 资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或

现象观察的结果。

8. 数量性状资料:指一般是由计数和测量或度量得到的。

9. 质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。

10. 计数资料;指由计数得到的数据。

11. 计量资料:有测量或度量得到的数据。

12. 普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。

13. 抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度

量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。

14. 全距(极差) :是指样本数据资料中最大观测值与最小观测值的差值。组中值:是指两个组

限下线和上限的中间值。

15. 算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。

16. 中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。

17. 众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。

18. 几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。

19. 方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。

20. 标准差:指方差的平方根和。

21. 变异系数:指将样本标准差除以样本平均数得出的百分比。

22. 概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发

生的频率 W(A) 概率 就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.

23. 和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。

24. 积事件:指事件 A 和事件 B 同时发生而构成的新事件,称为事件 A 和事件 B 的积事件。

25. 互斥事件:指事件 A 和事件 B 不能同时发生,称为事件 A 和事件 B 互斥。

26. 对立事件:指事件 A 和事件 B 必有一个事件发生,但两者不能同时发生。

27. 独立事件:指事件 A 的发生与事件 B 的发生毫无关系。

28. 完全事件系:指如果多个事件 A1、A2、、、 、、、An 两两相斥,且每次试验结果必然发生其一,

则称事件 A1、 完全事件系 A2、、、 、、、An 为一个完全事件系。

29. 概率加法定理: 指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和,

P(A+B)=P(A)+P(B)。

30. 概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同时发生的概率等于事件 A

和事件 B 各自概率乘法定理的乘积,即:P(A*B)=P(A)*P(B)。

31. 伯努利大数定律:设 M 是 n 次独立试验中事件 A 出现的次数,而不是事件 A 在每次试验

中出现的概率,则对于任意小的正数 ε ,有如下关系:limp{m/n-p< ε }=1

32. 辛钦大数定律:是用来说明为什么可以用算术平均数来推断总体平均数 m 的。

33. 统计推断:指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验。

34. 假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立

的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。

35. 参数估计:指由样本结果对总体参数在一定概率水平下所作出的估计。

点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X拔不同的样本将会得到不同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足

36. 小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件 A 出现的概率 a

为很小,则在假设条件下的 n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。

37. 显著水平:指在无效假设和备择假设后,要确定一个否定 H0 的概率标准,这个概率称为显著

水平。

38. 方差同质性:就是指各个总体的方差是相同的。

39. α 错误 :H0 是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为 α 错

误。

40. β 错误:指如果H0 不是真实的,假设检验时却接受了 H0,否定了 HA 这样就犯了接受不真

实假设的错误,称为 β 错误。

41. 适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验。

42. 独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方

法。

43. 相关分析:是研究现象之间是否存在某种依存关系, 并对具体有依存关系的现象探讨其相关方

向以及相关程度,是研究随机变量间的相关关系的一种统计方法。

44. 回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。

45. 回归系数:y^=a+bx,自变量 x 改变一个单位,依变量 y 平均增加或减少的单位数,即回归

直线的斜率 b。

46. 回归截距:y^=a+bx,a 是当 x=0 时的 Y^值,即直线在 y 轴上的截距,称为回归截距。

47. 离回归平方和:它反映除去 x 与 y 相关程度和性质的统计数。

48. 回归平方和:它反映在 y 的总体变异种由于 x 与 y 的直线关系而产生 y 变异减小的部分。

49. 相关系数:是指通过计算表示 x 和 y 相关程度和性质的统计数。

50. 决定系数:是变量 x 引起 y 变异的回归平方和与 y 变异总平方和的比率。

51. 转换:指估计总体相关系数 p 的置信区间时,需要将 r 转换成 z。

52. 试验设计:广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位

的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容。

53. 试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的

结果。

54. 处理因素:一般指对受试对象给予的某种外部干预。

55. 主效应:多因素中试验中引起实验结果发生变化的主要。

56. 互作:因素之间的交互作用。

57. 受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观测总体。

58. 处理效应:是处理因素作用于受试对象的反应,是研究最终体现

59. 误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异。

60. 随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误

差。

61. 系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差

62. 重复:在试验中,同一处理设置的试验单位数。

63. 随机:是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见。

64. 均积:是 x 与 y 的平均的离均差的乘积和,简称均积。

65. 协方差:与均积相应的总体参数。

66. 协方差分析:把回归分析与方差分析结合。

67. 试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽

可能一致的条件下。

68. 统计控制:是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产

生的影响。

69. 估计量:估计总体参数的统计量

70. 无偏估计量:如果一个统计量的理论平均数(即数学期望)等于总体参数,这个统计量就叫无

偏估计量

71. 矩估计:用样本矩作为总体矩的估计值

72. 矩估计法(数字特征法、矩法)用样本矩作为相应总体矩的估计量,也可以用样本数字特征作

为相应的总体数字特征的估计量。用矩法获得的估计值,叫据估计值。据发的思想实质是用样本去替换总体矩的原则,称之为替换原则

73. 有效估计量:设a1,a2是A的两个无偏估计量,若var(a1)<var(a2),则a1为有效估计量

74. 抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:总体中各个体

之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在

75. 标注误差(标准误):描述样本平均数波动情况的统计量,就是X拔的方差或标准差,计均数

抽样误差为西格玛X拔,=西格玛/根号n,西格玛X拔就是标准误(差)

76. 估计样本平均数方差:SX拔平方,=S平方/n

77. 估计标准误:SX拔,=S/根号n

78. 置信区间:达到某一置信度(如95%)时,预报量可能出现的范围(如E(y)±1.96西格玛,这

里西格玛是标准差)

置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间[a1,a2],这个区间包含a的概率是100(1-阿尔法)%,不包含a的概率是100阿尔法%

79. 置信水平(置信度,置信系数,可靠度)是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

80. 拟合优度检验:对总体分布类型的检验,包括检验观测数与理论书之间的一致性,通过检验观

测数与理论书之间的一致性来判断事件之间的独立性

81. 皮尔逊定理:若n充分大,则不论总体服从什么分布,卡平方总是近似服从自由度为m-a-1的

卡平方分布

82. 方差分析:能同时判断多组数据平均数之间的差异显著性,能把随机变异从混杂状态中分离开

来,从而为判断因素对实验结果有无确实的影响提供依据

83. 方差分析的前提条件:等方差,正态性、独立性

84. 固定因素:若因素的a个水平是经过特意选择的,则该因素为固定因

统计学和生物统计学的区别

http://m.zhuodaoren.com/tuijian625833/

推荐访问:

推荐阅读推荐文章

推荐内容

上一篇:亚马孙日本 下一篇:单位离职后社保怎么办