Python数据科学 专题
您的位置:python > Python数据科学专题 > Python测量方差
Python测量方差
作者:--    发布时间:2019-11-20

在统计中,方差是衡量数据集中的值与平均值相差多少的指标。 换句话说,它表示值的分散程度。 它通过使用标准偏差来衡量。 另一种常用的方法是偏斜。

这两个都是通过使用pandas库中可用的函数来计算的。

测量标准偏差

标准偏差是方差的平方根。 方差是数据集中平均值与平均值的平方差。 在python中,我们使用pandas库中的函数std()来计算这个值。

import pandas as pd

#create a dictionary of series
d = {'name':pd.series(['tom','james','ricky','vin','steve','smith','jack',
   'lee','chanchal','gasper','naviya','andres']),
   'age':pd.series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'rating':pd.series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#create a dataframe
df = pd.dataframe(d)

# calculate the standard deviation
print (df.std())

执行上面示例代码,得到以下结果 -

age       7.265527
rating    0.661628
dtype: float64

测量偏斜度

它用于确定数据是对称的还是倾斜的。 如果索引在-11之间,则分布是对称的。 如果指数不超过-1,那么它向左倾斜,如果它至少为1,那么它向右偏斜

import pandas as pd

#create a dictionary of series
d = {'name':pd.series(['tom','james','ricky','vin','steve','smith','jack',
   'lee','chanchal','gasper','naviya','andres']),
   'age':pd.series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'rating':pd.series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#create a dataframe
df = pd.dataframe(d)
print (df.skew())

执行上面示例代码,得到以下结果 -

age       1.443490
rating   -0.153629
dtype: float64

因此,年龄分布是对称的,而年龄分布则偏向右侧。


网站声明:
本站部分内容来自网络,如您发现本站内容
侵害到您的利益,请联系本站管理员处理。
联系站长
373515719@qq.com
关于本站:
编程参考手册