numpy.ma.polyfit#
- ma.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)[源代码]#
最小二乘多项式拟合.
备注
这是旧多项式 API 的一部分.自 1.4 版本以来,首选在
numpy.polynomial中定义的新多项式 API.差异摘要可以在 transition guide 中找到.将 deg 阶多项式
p(x) = p[0] * xdeg + ... + p[deg]拟合到点 (x, y) .返回一个系数向量 p ,该向量以 deg , deg-1 ,… 0 的顺序最小化平方误差.建议新代码使用
Polynomial.fit类方法,因为它在数值上更稳定.有关更多信息,请参见该方法的文档.- 参数:
- xarray_like,形状 (M,)
M 个采样点
(x[i], y[i])的 x 坐标.- yarray_like,形状 (M,) 或 (M, K)
采样点的 y 坐标.可以通过传入一个 2D 数组一次性拟合多个共享相同 x 坐标的采样点数据集,该数组的每一列包含一个数据集.
- degint
拟合多项式的阶数
- rcondfloat,可选
拟合的相对条件数.小于最大奇异值的此相对值的奇异值将被忽略.默认值为 len(x)eps,其中 eps 是浮点类型的相对精度,在大多数情况下约为 2e-16.
- fullbool, 可选
决定返回值的性质的开关.当为 False(默认值)时,仅返回系数,当为 True 时,还会返回奇异值分解的诊断信息.
- warray_like,形状 (M,),可选
权重.如果不是 None,则权重
w[i]应用于x[i]处的未平方残差y[i] - y_hat[i].理想情况下,选择权重是为了使乘积w[i]y[i]的误差都具有相同的方差.当使用逆方差加权时,使用w[i] = 1/sigma(y[i]).默认值为 None.- covbool 或 str,可选
如果给定且不为 False ,则不仅返回估计值,还返回其协方差矩阵.默认情况下,协方差按 chi2/dof 缩放,其中 dof = M - (deg + 1),即假定权重是不可靠的,除非在相对意义上,并且所有内容都被缩放,以便减少的 chi2 为 unity.如果
cov='unscaled',则省略此缩放,这与权重为 w = 1/sigma 的情况相关,其中 sigma 被认为是不确定性的可靠估计.
- 返回:
- pndarray,形状 (deg + 1,) 或 (deg + 1, K)
多项式系数,最高次幂优先.如果 y 是 2-D 的,则 k -th 数据集的系数在
p[:,k]中.- residuals, rank, singular_values, rcond
这些值仅在
full == True时返回.residuals – 最小二乘拟合的残差平方和
- rank – 缩放后的 Vandermonde 的有效秩
系数矩阵
- singular_values – 缩放后的 Vandermonde 的奇异值
系数矩阵
rcond – rcond 的值.
有关更多详细信息,请参见
numpy.linalg.lstsq.- Vndarray,形状 (deg + 1, deg + 1) 或 (deg + 1, deg + 1, K)
仅当
full == False和cov == True时才显示.多项式系数估计值的协方差矩阵.此矩阵的对角线是每个系数的方差估计值.如果 y 是一个 2-D 数组,则第 k 个数据集的协方差矩阵在V[:,:,k]中
- Warns:
- RankWarning
最小二乘拟合中系数矩阵的秩不足.仅当
full == False时才会引发该警告.可以通过以下方式关闭警告
>>> import warnings >>> warnings.simplefilter('ignore', np.exceptions.RankWarning)
参见
polyval计算多项式值.
linalg.lstsq计算最小二乘拟合.
scipy.interpolate.UnivariateSpline计算样条拟合.
注释
x 中的任何屏蔽值都会在 y 中传播,反之亦然.
该解决方案最小化了平方误差
\[E = \sum_{j=0}^k |p(x_j) - y_j|^2\]在以下方程式中:
x[0]**n * p[0] + ... + x[0] * p[n-1] + p[n] = y[0] x[1]**n * p[0] + ... + x[1] * p[n-1] + p[n] = y[1] ... x[k]**n * p[0] + ... + x[k] * p[n-1] + p[n] = y[k]
系数 p 的系数矩阵是一个范德蒙矩阵.
当最小二乘拟合的条件不佳时,
polyfit会发出 RankWarning . 这意味着由于数值误差,最佳拟合未明确定义. 通过降低多项式阶数或将 x 替换为 x - x .mean() 可以改善结果. rcond 参数也可以设置为小于其默认值,但由此产生的拟合可能是虚假的:包括来自小奇异值的贡献可能会为结果增加数值噪声.请注意,当多项式的阶数很大或样本点间隔未正确居中时,拟合多项式系数本质上条件不佳. 在这些情况下,应始终检查拟合的质量. 当多项式拟合不令人满意时,样条曲线可能是一个不错的选择.
参考
[1]维基百科,“曲线拟合”,https://en.wikipedia.org/wiki/Curve_fitting
[2]维基百科,“多项式插值”,https://en.wikipedia.org/wiki/Polynomial_interpolation
示例
>>> import numpy as np >>> import warnings >>> x = np.array([0.0, 1.0, 2.0, 3.0, 4.0, 5.0]) >>> y = np.array([0.0, 0.8, 0.9, 0.1, -0.8, -1.0]) >>> z = np.polyfit(x, y, 3) >>> z array([ 0.08703704, -0.81349206, 1.69312169, -0.03968254]) # may vary
使用 poly1d 对象处理多项式很方便:
>>> p = np.poly1d(z) >>> p(0.5) 0.6143849206349179 # may vary >>> p(3.5) -0.34732142857143039 # may vary >>> p(10) 22.579365079365115 # may vary
高阶多项式可能会剧烈振荡:
>>> with warnings.catch_warnings(): ... warnings.simplefilter('ignore', np.exceptions.RankWarning) ... p30 = np.poly1d(np.polyfit(x, y, 30)) ... >>> p30(4) -0.80000000000000204 # may vary >>> p30(5) -0.99999999999999445 # may vary >>> p30(4.5) -0.10547061179440398 # may vary
图示:
>>> import matplotlib.pyplot as plt >>> xp = np.linspace(-2, 6, 100) >>> _ = plt.plot(x, y, '.', xp, p(xp), '-', xp, p30(xp), '--') >>> plt.ylim(-2,2) (-2, 2) >>> plt.show()