当前位置 博文首页 > ?:R语言与数据分析练习:计算特征间的Pearson相似系数
Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。
如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。
其计算公式为:
计算表中特征间的Pearson相似系数
# 切换当前目录
setwd("D:/bigdata/R语言与数据分析/data04")
# 读取数据
datafile <- read.csv("./data.csv")
# 计算pearson相关系数 保留2位小数
dataPearson <- round(cor(datafile,method = c("pearson")) , 2)
# 将数据写入新建的csv文件中 保存
write.csv(dataPearson,"./dataPearson.csv")