当前位置 博文首页 > 少年休闲海:【学习笔记】高等数据基础

    少年休闲海:【学习笔记】高等数据基础

    作者:[db:作者] 时间:2021-09-14 13:32

    一、数学概况

    ?

    ?二、数据类型

    【分类1】

    离散型数据 : 比如骰子,无论怎么掷,概率都是1/6。

    离散随机变量是指一个只取有限个数或可数无限个数值的随机变量。

    通常用古典概型来描述。

    连续型数据 :比如 时间/长度/面积 ,概览都是1/∞=0。

    连续随机变量是指一个取任何实数的概率都为零的变量。

    通常用几何概型来描述。

    【分类2】

    横截面数据:某个时间点/时间段内取到的数据,比如商业领域数据,是处理方法最全面最完善的数据。有各种各样的模型来处理横截面数据,比如回归模型,神经网络,决策树等。

    时间序列数据:比如金融领域数据,例如股票,随着时间的改变,股票的市值呈现折线图,其自带因果性,过去的数据或多或少会影响未来。

    面板数据:既有时间属性又有空间属性,比如去年一年所有省市自治区的销售数据,该类企业很少处理使用。

    【分类3】

    定类尺度:比如国籍/男女,不可排序,不可运算,因为中国不可能大于美国,中国也不可以加减美国。

    定序尺度:比如健康状况,可以排序,不可运算,比如健康可依次分为优良差,但不可以优加减良。

    定距尺度:数值型数据,可以排序,可以运算,比如年份,0点是有意义的,公元零年。

    定比尺度:数值型数据,可以排序,可以运算,比如体重,0点是没有意义的,0体重不存在。

    ?最后,注意不同类型数据要用不同数据类型去处理。

    ?

    ?

    ?

    cs