如何选择数据分析方法

时间:2022-11-23 15:26:19 选择方法 我要投稿
  • 相关推荐

如何选择数据分析方法

数据分析技术层面须把握三大关键:变量、数据分析方法、变量和方法的关联

认识数据分析方法:对数据进行统计分析时,选择正确的分析方法是非常重要的。选择统计分析方法时,必须考虑许多因素,主要有:

(1)统计分析的目的,

(2)所用变量的特征,

(3)对变量所作的假定,

(4)数据的收集方法(即抽样过程)。

选择统计分析方法时一般考虑前两个因素就足够了。

小样本并且两个变量服从双正态分布,则用pearson相关系数做统计分析

大样本或两个变量不服从双正态分布,则用spearman相关系数进行统计分析

2、两个变量均为有序分类变量,可以用spearman相关系数进行统计分析

3、一个变量为有序分类变量,另一个变量为连续型变量,可以用spearman相关系数进行统计分析

【2】回归分析

1、直线回归:

如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。

2、多重线性回归:

应变量(y)为连续型变量(即计量资料),自变量(x1,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。

观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

3、二分类的logistic回归:

应变量为二分类变量,自变量(x1,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。

非配对的情况:用非条件logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

配对的情况:用条件logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

4、有序多分类有序的logistic回归:

应变量为有序多分类变量,自变量(x1,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。

观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

5、无序多分类有序的logistic回归:

应变量为无序多分类变量,自变量(x1,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。

观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

如何选择数据分析方法 [篇2]

把握两个关键

1、抓住业务问题不放松。您费大力气收集数据的动机是什么?你想解决什么问题?这是核心,是方向,这是业务把握层面。

2、全面理解数据。哪些变量,什么类型?适合或者可以用什么统计方法,这是数据分析技术层面。须把握三大关键:变量、数据分析方法、变量和方法的关联。

认识变量认识数据分析方法

选择合适的数据分析方法是非常重要的。选择数据分析(统计分析)方法时,必须考虑许多因素,主要有:

1、数据分析的目的,

2、所用变量的特征,

3、对变量所作的假定,

4、数据的收集方法。选择统计分析方法时一般考虑前两个因素就足够了。

将变量与分析方法关联、对应起来

【如何选择数据分析方法】相关文章:

怎样选择数据分析方法07-05

数据分析师就业前景如何08-04

如何根据体型选择健身方法11-30

如何选择正确的健身减肥方法11-30

汽车养护如何选择机油方法11-29

如何培养小学生建立数据分析观念09-21

留学新西兰中学院校该如何选择方法12-01

导师选择方法12-19

数据分析助理的职责内容09-13

数据分析工作总结04-29