numpy.polynomial.polynomial.polyfit#
- polynomial.polynomial.polyfit(x, y, deg, rcond=None, full=False, w=None)[源代码]#
多项式对数据的最小二乘拟合.
返回次数为 deg 的多项式的系数,该多项式是对在点 x 给出的数据值 y 的最小二乘拟合.如果 y 是 1-D 的,则返回的系数也将是 1-D 的.如果 y 是 2-D 的,则执行多个拟合,每个拟合对应于 y 的每一列,并且结果系数存储在 2-D 返回的相应列中.拟合的多项式形式为
\[p(x) = c_0 + c_1 * x + ... + c_n * x^n,\]其中 n 是 deg .
- 参数:
- x : array_like, shape ( M ,)array_like, shape (M,)
M 个样本(数据)点
(x[i], y[i])的 x 坐标.- y : array_like, shape ( M ,) or ( M , K )array_like, shape (M,) or (M, K)
样本点的 y 坐标.可以通过一次调用
polyfit为 y 传入一个 2-D 数组,该数组包含每列一个数据集,从而(独立地)拟合共享相同 x 坐标的多个样本点集.- deg整数或类数组 (array_like) 的一维数组
拟合多项式的阶数.如果 deg 是一个整数,则最多包括 deg 阶的所有项都包含在拟合中.对于 NumPy 版本 >= 1.11.0,可以使用指定要包含的项的阶数的整数列表.
- rcondfloat, optional
拟合的相对条件数.相对于最大奇异值,小于 rcond 的奇异值将被忽略.默认值为
len(x)eps,其中 eps 是平台浮点类型的相对精度,在大多数情况下约为 2e-16.- fullbool,可选
决定返回值的性质的开关.当
False(默认值)时,仅返回系数;当True时,还会返回来自奇异值分解(用于求解拟合的矩阵方程)的诊断信息.- w : array_like, shape ( M ,), optionalarray_like, shape (M,), optional
权重.如果不是 None,则权重
w[i]应用于x[i]处未平方的残差y[i] - y_hat[i].理想情况下,选择权重使得乘积w[i]y[i]的误差都具有相同的方差.当使用逆方差加权时,使用w[i] = 1/sigma(y[i]).默认值为 None.
- 返回:
- coef : ndarray, shape ( deg + 1,) or ( deg + 1, K )ndarray, shape (deg + 1,) or (deg + 1, K)
从低到高排序的多项式系数.如果 y 是 2-D 的,则 coef 的第 k 列中的系数表示对 y 的第 k 列中的数据进行的多项式拟合.
- [residuals, rank, singular_values, rcond]列表
仅当
full == True时才返回这些值.residuals – 最小二乘拟合的残差平方和
rank – 缩放的 Vandermonde 矩阵的数值秩
singular_values – 缩放的范德蒙矩阵的奇异值
rcond – rcond 的值.
有关更多详细信息,请参见
numpy.linalg.lstsq.
- Raises:
- RankWarning
如果最小二乘拟合中的矩阵是秩亏的,则会引发此异常.只有当
full == False时才会引发警告.可以通过以下方式关闭警告:>>> import warnings >>> warnings.simplefilter('ignore', np.exceptions.RankWarning)
参见
注释
解是多项式 p 的系数,它使加权平方误差之和最小:
\[E = \sum_j w_j^2 * |y_j - p(x_j)|^2,\]其中 \(w_j\) 是权重.这个问题通过建立(通常)超定的矩阵方程来解决:
\[V(x) * c = w * y,\]其中 V 是 x 的加权伪范德蒙矩阵, c 是要解的系数, w 是权重, y 是观测值.然后使用 V 的奇异值分解来求解该方程.
如果 V 的某些奇异值太小以至于被忽略(并且 full ==
False),则会引发 RankWarning .这意味着系数的值可能确定得很差.拟合到较低阶的多项式通常会消除警告(但可能不是你想要的;如果你有选择不工作的次数的独立原因,你可能需要:a) 重新考虑这些原因,和/或 b) 重新考虑数据的质量). rcond 参数也可以设置为小于其默认值的值,但由此产生的拟合可能是虚假的,并且具有来自舍入误差的较大贡献.使用双精度进行多项式拟合,通常在多项式阶数为 20 左右时会"失效".使用切比雪夫或勒让德级数进行拟合通常条件更好,但很大程度上仍然取决于采样点的分布和数据的平滑度.如果拟合质量不足,样条可能是个不错的选择.
示例
>>> import numpy as np >>> from numpy.polynomial import polynomial as P >>> x = np.linspace(-1,1,51) # x "data": [-1, -0.96, ..., 0.96, 1] >>> rng = np.random.default_rng() >>> err = rng.normal(size=len(x)) >>> y = x**3 - x + err # x^3 - x + Gaussian noise >>> c, stats = P.polyfit(x,y,3,full=True) >>> c # c[0], c[1] approx. -1, c[2] should be approx. 0, c[3] approx. 1 array([ 0.23111996, -1.02785049, -0.2241444 , 1.08405657]) # may vary >>> stats # note the large SSR, explaining the rather poor results [array([48.312088]), # may vary 4, array([1.38446749, 1.32119158, 0.50443316, 0.28853036]), 1.1324274851176597e-14]
相同内容,没有添加噪声
>>> y = x**3 - x >>> c, stats = P.polyfit(x,y,3,full=True) >>> c # c[0], c[1] ~= -1, c[2] should be "very close to 0", c[3] ~= 1 array([-6.73496154e-17, -1.00000000e+00, 0.00000000e+00, 1.00000000e+00]) >>> stats # note the minuscule SSR [array([8.79579319e-31]), np.int32(4), array([1.38446749, 1.32119158, 0.50443316, 0.28853036]), 1.1324274851176597e-14]