Python线性回归用于什么,怎样实现的
Admin 2022-11-24 群英技术资讯 927 次浏览
关于“Python线性回归用于什么,怎样实现的”的知识有一些人不是很理解,对此小编给大家总结了相关内容,具有一定的参考借鉴价值,而且易于学习与理解,希望能对大家有所帮助,有这个方面学习需要的朋友就继续往下看吧。线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
拟合线性模型主要通过statsmodels包中OLS类的fit()方法完成,下表列举了对拟合线性模型常用的其他函数。
对上证综指和深证综指1990-2022年期间的的收益率构造一元线性回归函数:
注意:statsmodel模块当中有两个实现线性回归的库方法:ols和OLS,其中OLS用于python方差通胀因子计算,默认情况下不添加截距。需要再添加截距项。 二者可以通过以下方式导入:
import statsmodels.formula.api as smf import statsmodels.api as sm输出结果 
结果分析 通过summary()可以看到拟合模型的最终结果:
最终得到的回归模型如下: $$sh_i = 0.019443 + 0.736213*{sz}_i + \varepsilon_i$$
检验随机干扰项和拟合值之间的关系,绘制的图应该是围绕0随机分布的状态
import matplotlib.pyplot as plt # 导入需要的第三方库 from pylab import mpl # 设置默认字体 mpl.rcParams['font.sans-serif'] = ['SimHei'] # 解决保存图像出现负号时导致的显示异常问题 mpl.rcParams['axes.unicode_minus'] = False plt.scatter(model.fittedvalues, model.resid) plt.xlabel("拟合值") plt.ylabel("残差值")
结果显示数据点基本在0周围,既满足线性假定。
通过绘制Q-Q图来观察样本点是否落在一条直线上,如果是则表明服从正态分布,反之则不是。
import scipy.stats as stats sm.qqplot(model.resid_pearson, stats.norm, line='45')
可以看到首尾段严重脱离直线,说明样本不符合正态性假定
满足同方差性的数据的各点分布应该呈现出一条水平的、宽度一致的条带形状。
plt.scatter(model.fittedvalues, model.resid_pearson**0.5) plt.xlabel("拟合值") plt.ylabel("标准化残差的平方根")
可以数据看出基本是符合同方差假定的。
==意味着深证综指的回报率每增加1%,上证综指的回报率就平均增加0.736个百分点==
多元线性回归除了要满足一元线性回归所有的假设外还要满足自变量之间不存在多重共线性这里通过探究房子年龄、是否有电梯、楼层高度、房间平方对房价`的影响

配套电梯与其他解释变量之间的相关系数较高,可能存在多重共线性,去掉后重新进行回归,得到结果如下: 
最终得到的回归模型如下: $$房价 = -6.699045+ 1.760482平方 + 2.777285房龄+ \varepsilon$$
关于“Python线性回归用于什么,怎样实现的”的内容今天就到这,感谢各位的阅读,大家可以动手实际看看,对大家加深理解更有帮助哦。如果想了解更多相关内容的文章,关注我们,群英网络小编每天都会为大家更新不同的知识。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
堆栈是一个后进先出的数据结构,其工作方式就像一堆汽车排队进去一个死胡同里面,最先进去的一定是最后出来。我们可以设置一个类,用列表来存放栈中元素的信息,利用列表的append
这篇文章主要为大家介绍了R语言条形图及分布密度图代码总结,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
这篇文章主要介绍了Python如何对文件进行重命名,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
在某些编程语言中,例如C/C++、C#、PHP、Java、JavaScript等等,do-while是一种基本的循环结构。它的核心语义是:先执行一遍循环体代码,然后执行一遍条件语句,若条件语句判
本文详细讲解了python爬虫之selenium模块,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008