当前位置 博文首页 > ?:R语言与数据分析练习:计算特征间的Pearson相似系数

    ?:R语言与数据分析练习:计算特征间的Pearson相似系数

    作者:[db:作者] 时间:2021-07-17 19:06

    R语言与数据分析练习:计算特征间的Pearson相似系数

    Pearson相关系数

    Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。

    Pearson相关系数简介

    如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。

    其计算公式为:

    在这里插入图片描述

    题目:

    计算表中特征间的Pearson相似系数

    数据如下:

    在这里插入图片描述

    实现代码:

    # 切换当前目录
    setwd("D:/bigdata/R语言与数据分析/data04")
    
    # 读取数据
    datafile <- read.csv("./data.csv")
    
    # 计算pearson相关系数 保留2位小数
    dataPearson <- round(cor(datafile,method = c("pearson")) , 2)
    
    # 将数据写入新建的csv文件中 保存
    write.csv(dataPearson,"./dataPearson.csv")
    

    运行结果:

    在这里插入图片描述

    cs
    下一篇:没有了