用Python实现插值算法
作者:Ken_zju 时间:2021-07-16 11:01:22
数模比赛中,常常需要对数据进行处理和分析,但有时候数据不多,就需要一些方法“模拟产生”一些靠谱的值来满足需求,这就是插值的作用。本文不再具体介绍每个插值算法的内在原理,将直接通过调包实现。
下面,先上三件套,看一下原始数据的大致情况:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_excel('data.xlsx')
拉格朗日插值算法
原始数据我们采用sin(x)的形式,看一下原始数据点:
import scipy
from scipy.interpolate import lagrange
x = np.linspace(0,10,6) #0~10等差插入11个数,需要预测的值
y = np.sin(x)
x_new = np.linspace(0,10,200) #用于绘制图形
y_new = np.sin(x_new)
plt.plot(x,y,'ro')
plt.plot(x_new,y_new,'b')
f1 = lagrange(x,y)
plt.plot(x,y,'ro')
plt.plot(x_new,y_new,'b')
plt.plot(x_new,f1(x_new),'g')
看一下拟合效果:
分段线性插值
f4 = scipy.interpolate.interp1d(x,y,kind='linear')
plt.plot(x,y,'ro')
plt.plot(x_new,y_new,'b')
plt.plot(x_new,f4(x_new),'g')
分段二次(三次)插值
f5 = scipy.interpolate.interp1d(x,y,kind='quadratic') #三次就是cubic
plt.plot(x,y,'ro')
plt.plot(x_new,y_new,'b')
plt.plot(x_new,f5(x_new),'g')
牛顿插值法:暂未找到相应的库
分段三次埃尔米特插值
f5 = scipy.interpolate.interp1d(x,y,kind='quadratic') #三次就是cubic
plt.plot(x,y,'ro')
plt.plot(x_new,y_new,'b')
plt.plot(x_new,f5(x_new),'g')
三次样条插值
f3 = scipy.interpolate.CubicSpline(x,y)
plt.plot(x,y,'ro')
plt.plot(x_new,y_new,'b')
plt.plot(x_new,f3(x_new),'g')
接下来,让我们看看一个具体实例的比较:
y = np.array(data)[:,1]
x = np.linspace(2009,2018,10)
x_new = np.array([2019,2020,2021])
f2 = scipy.interpolate.PchipInterpolator(x,y)
f3 = scipy.interpolate.CubicSpline(x,y)
#coding:utf-8
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.plot(x,y,color='black',marker='o',label='样本点')
plt.plot(x_new,f2(x_new),'b-',marker='x',label='分段三次埃米尔特')
plt.plot(x_new,f3(x_new),'r-',marker='x',label='三次样条插值')
plt.xticks(range(2009,2022,1)) #调整x轴间距
plt.legend()
plt.show()
Tips:①最常用的就是埃尔米特三次插值、三次样条插值
②拉格朗日插值虽然在训练集上表现良好,但是在测试集上着实难堪,尤其拟合高阶函数时,千万不要轻易用此预测
来源:https://blog.csdn.net/qq_22841119/article/details/122953561
标签:Python,插值
0
投稿
猜你喜欢
python 名称空间与作用域详情
2021-06-10 23:12:38
Python pandas之多级索引取值详解
2022-05-09 14:12:31
解决jupyter加载文件失败的问题
2022-07-21 19:17:05
Python中的延迟绑定原理详解
2022-07-08 16:18:35
利用Python实现模拟登录知乎
2023-09-23 08:32:15
python中的print()输出
2023-06-27 18:07:03
python实现在多维数组中挑选符合条件的全部元素
2022-06-02 03:43:12
Python批量修改文件名,文件再多也只要一秒
2022-01-18 20:35:06
Python写入CSV文件的方法
2021-08-21 19:09:44
[译稿]Web 字体的未来
2008-07-31 17:50:00
Python 用户登录验证的小例子
2021-07-04 09:39:25
Python实现矩阵加法和乘法的方法分析
2023-07-30 09:39:06
scrapy+scrapyd+gerapy 爬虫调度框架超详细教程
2023-02-06 23:08:41
由浅入深讲解MySQL数据库索引的选择性
2008-12-17 15:06:00
python 邮件检测工具mmpi的使用
2022-03-18 04:56:45
JavaScript十二月新标准ECMA262v5快速浏览
2009-12-27 12:56:00
Python控制浏览器自动下载歌词评论并生成词云图
2022-04-17 11:24:56
基于Python绘制子图及子图刻度的变换等的问题
2023-12-12 14:14:33
删除pandas中产生Unnamed:0列的操作
2021-07-27 03:12:03
如果用JS得到字符串中出现次数最多的字母
2007-12-03 21:01:00