发布网友 发布时间:2022-04-23 02:20
共5个回答
懂视网 时间:2022-04-06 09:48
我们在做A/B试验评估的时候需要借助p_value,这篇文章记录如何利用python计算两组数据的显著性。
一、代码
# TTest.py # -*- coding: utf-8 -*- ''' # Created on 2020-05-20 20:36 # TTest.py # @author: huiwenhua ''' ## Import the packages import numpy as np from scipy import stats def get_p_value(arrA, arrB): a = np.array(arrA) b = np.array(arrB) t, p = stats.ttest_ind(a,b) return p if __name__ == "__main__": get_p_value([1, 2, 3, 5, ], [6, 7, 8, 9, 10])
二、T检验:两样本T检验
两样本t检验是比较两个样本所代表的两个总体均值是否存在显著差异。除了要求样本来自正态分布,还要求两个样本的总体方差相等也就是“方差齐性”。
检验原假设:样本均值无差异(μ=μ0)
Python命令stats.ttest_ind(data1,data2)
当不确定两总体方差是否相等时,应先利用levene检验检验两总体是否具有方差齐性stats.levene(data1,data2)如果返回结果的p值远大于0.05,那么我们认为两总体具有方差齐性。如果两总体不具有方差齐性,需要加上参数equal_val并设定为False,如下。
stats.ttest_ind(data1,data2,equal_var=False) // TTest中默认是具有方差齐性
三、结果解释
当p值小于某个显著性水平α(比如0.05)时,则认为样本均值存在显著差异,具体的分析要看所选择的是双边假设还是单边假设(又分小于和大于)注意stats.ttest_ind进行双侧检验。
当t值大于0,则有((1-p)* 100)%的把握认为认为第一组数据好与第二组数据。例如p=0.05,那么我们有95%的把握认为第一组数据好于第二组数据。
相关学习推荐:python视频教程
热心网友 时间:2022-04-06 06:56
lst = [] #定义一个空列表
str = raw_input("请输入数值,用空格隔开:")
lst1 = str.split(" ")#lst1用来存储输入的字符串,用空格分割
i = 0
while i <= len(lst1)+1:
lst.append(int(lst1.pop()))#将lst1的数据转换为整型并赋值给lst
i += 1
#print(lst)
def sum(list):
"对列表的数值求和"
s = 0
for x in list:
s += x
return s
def average(list):
"对列表数据求平均值"
avg = 0
avg = sum(list)/(len(list)*1.0) #调用sum函数求和
return avg
print("avg = %f"%average(lst))
扩展资料:
for循环小括号里第一个“;”号前为一个为不参与循环的单次表达式,其可作为某一变量的初始化赋值语句, 用来给循环控制变量赋初值; 也可用来计算其它与for循环无关但先于循环部分处理的一个表达式。
执行的中间循环体可以为一个语句,也可以为多个语句,当中间循环体只有一个语句时,其大括号{}可以省略,执行完中间循环体后接着执行末尾循环体。
执行末尾循环体后将再次进行条件判断,若条件还成立,则继续重复上述循环,当条件不成立时则跳出当下for循环。
热心网友 时间:2022-04-06 08:14
def cal(numbers):
热心网友 时间:2022-04-06 09:49
def b():热心网友 时间:2022-04-06 11:40
avg = sum(list) / len(list)