程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

皮爾遜相關系數python實現

編輯:Python

皮爾遜pearson相關系數和斯皮爾曼spearman等級相關系數。
它們可用來衡量兩個變量之間的相關性的大小

總體數據與樣本數據

1. 總體:所要考察對象的全部個體叫做總體
(我國10年進行一次的人口普查得到的數據就是總體數據)
2. 樣本:從總體中所抽取的一部分個體叫做總體的一個樣本
(在QQ群發問卷叫同學幫忙填寫得到的數據就是樣本數據)

  • ps:我們總希望得到總體數據的一些特征,例如均值和方差等,但是我們所接觸到的數據多數是樣本數據,所以我們需要使用樣本的統計量來估計總體的統計量
  • 例如使用樣本均值、樣本標准差來估計總體的均值(平均水平)和總體的標准差(偏離程度)。

總體Pearson相關系數

樣本Pearson相關系數

Pearson系數的幾個誤區

基於python的Pearson相關系數實現

import pandas as pd
data = pd.read_excel('八年級女生體測數據.xlsx')
data.corr() # 計算相關性系數

運行結果:

## 相關性系數熱力圖
import seaborn as sns
import matplotlib.pyplot as plt
corr = data.corr()
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] =False #減號unicode編碼
ax = plt.subplots(figsize=(20, 16))#調整畫布大小
ax = sns.heatmap(corr, vmax=.8, square=True, annot=True)#畫熱力圖 annot=True 表示顯示系數
# 設置刻度字體大小
plt.xticks(fontsize=13)
plt.yticks(fontsize=13)

運行結果:

pearson相關系數的假設檢驗

檢驗步驟

pearson相關系數假設檢驗的條件


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved