非线性回归_范文大全

非线性回归

【范文精选】非线性回归

【范文大全】非线性回归

【专家解析】非线性回归

【优秀范文】非线性回归

范文一:非线性回归 投稿:严艱色

非线性回归模型

一、 非线性模型

前面所讲的线性回归模型在一般情况下(特别在不要求较高精度的时候)可以解决许多问题,然而它并非适用于一切问题。现实生活中,尤其是像经济领域这样存在复杂活动的情况下,我们很难直观判定线性模型是否适;更有许多事实表明非线性模型在有的情况下比线性模型更加准确。

当然,我们可以将某些简单的非线性模型通过变量变化,通曲为直,进而利用最小二乘法估计参数。这部分内容属于曲线回归,其思想是将非线性函数通过变量代替的方式转换成线性模型。

1.1曲线回归模型简介

变量间先关关系可分为两大类:线性和非线性关系。对于线性关系在这里就不多说了,而非线性关系又可以画分为两类:本质线性关系(曲线回归模型)和本质非线性关系。如图所示:

所谓的本质线性关系指的是变量关系形式上呈现出非线性表征,但可以通过变量变换转化为线性关系。也即是上面提到的曲线回归。常见的本质线性模型如下表:

曲线

(1)𝑦=𝛽0+𝛽1𝑥+𝛽2𝑥2

𝑥

(2)𝑦=𝛽0𝛽1

变换

令𝑥,=𝑥2

变换后的线性方程 𝑦=𝛽0+𝛽1𝑥+𝛽2𝑥,

,,,,

令𝑦,=ln 𝑦 ,𝛽0=ln 𝛽0 𝛽1=ln⁡(𝛽1) 𝑦,=𝛽0+𝛽1𝑥

(3)𝑦=𝑒𝛽0+𝛽1𝑥 (4)𝑦=𝛽0+𝛽1ln⁡(𝑥) (5)𝑦=𝑒𝛽0+𝛽1 𝑥 (6)𝑦=𝛽0𝑒𝛽1𝑥

令𝑦,=ln 𝑦 令𝑥,=ln⁡(𝑥)

令𝑦,=ln 𝑦 ,𝑥,=1 𝑥

,令𝑦,=ln 𝑦 ,𝛽0=𝑙𝑛 𝛽0

𝑦,=𝛽0+𝛽1𝑥 𝑦=𝛽0+𝛽1𝑥, 𝑦,=𝛽0+𝛽1𝑥,

,

𝑦,=𝛽0+𝛽1𝑥

但此种方式存在明显的局限性,为了说明它,我们先来回顾一下线性回归模型中核心的最小二乘法(OLS)。

1.1最小二乘法回顾

在线性回归中,我们学会了普通最小二乘法(OLS),但它在使用时有相应的前提假设:

(1)正确的期望函数。第一个条件意味着计量模型的适用性,它不仅指出期望函数部分包括所有重要的自变量,同时随机变量部分包括不重要的可以忽略的自变量;此外,还意味着我们需要确定一个较为合理的模型形式(不论是线性还是非线性模型),这一点可以通过观察散点图进行判定。

(2)自变量(Y)等于期望函数与随机变量之和,这一条假设使得Y的概率密度函数可以通过随机变量的概率密度函数加以计算:

𝜌𝛾= 𝑦 𝛽,𝜎2 =𝜌随机变量 y−

(3)随机变量独立于期望函数。简单说来就是随机干扰项与X之间独立,也即任何不包含在模型中的重要变量均与Y没有系统性的关联。

(4)随机变量项服从正态分布。它描述因变量的样本分部,还帮助推导出最小二乘法准则。我们可以通过中心极限定理验证:如果随机变量X中各个子变量的影响都很小,则由自变量合成的随机变量趋近于正态分布。

(5)随机变量具有零均值,齐方差。这里应该指出,残差图能够揭示方差齐性的假设是否成成立。若出现异方差的情况,我们可以通过数据变换或者加权最小二乘法修改模型;若残差图是一条直线则表明正态性的假设成立。(注意:直线不代表是一条水平线)

(6)随机变量之间相互独立。

相应的,在满足了上述前提条件的由普通最小二乘法所求出来的参数估计值服从正态分布、具有无偏性。

通过回顾最小二乘法使用的前提假设,我们可以明白这样一个道理:由于OLS适用的前提条件比较苛刻,任何一条不满足均会导致计量模型参数的估计值非最优,这样就失去了它原有的意义。因此,这里推荐一个正确的做法:

(1)在设立一个计量模型时,要尽可能的采用合理的模型形式; (2)根据模型,进行相应的数据分析;

(3)对有关普通最小二乘法的假设条件进行诊断,若出现自变量或者随机变量的假设不合适,那么修正该模型并且重复上述循环过程以求最优。

1.2曲线回归的局限性

第一,通过变量变化的方式用最小二乘法求解其参数估计值时,难以根据最终结果还原原始数值,即不能确定是否是方程的最优解(尤其涉及到开方、求对数这些对符号很敏感的变换);

第二,能够通过变量变化的非线性模型只是极少部分,对于无法转化的非线性模型的参数的估计,还须借助相应的方法解决;

第三,之前学过的最小二乘法对于更加复杂的拟合方式无法实现,比如最小一乘法、复杂的加权法等。

2非线性回归模型

所谓的非线性回归模型,指的是模型中参数的出现是非线性的。一般可以表示为如下形式:

𝑦𝑖=𝑦 +𝑒𝑖=𝑓 𝑥,𝜃 +𝑒𝑖

其中f为期望函数,x为自变量(组),θ表需要求解的未知参数。此模型与线性回归模型相似,不同的是因变量y是关于自变量x的非线性函数,在有的情况下甚至没有表达式存在。

前面提到过一些简单的非线性模型通过变量变换才用最小二乘法求解参数的方法,尽管它可以帮助我们求解未知参数以及方便我们求解其参数值的初始值等等,然而由于变量变换会带来随机误差项分布的改变,由此进一步影响到最小二乘法求解的含义、模型的使用条件等。例如:

𝜃

𝑌𝑡=𝑋𝑡+𝑒𝑡 (1)

此模型与线性模型类似,我们采用最小二乘法极小化:

𝜃2

𝑆 𝜃 = (𝑌𝑡−𝑋𝑡) (2)

估计θ,S代替S(θ),S对θ求微分后导数等于零得到S的最小值,

∂𝑆∂θ

𝜃 =−2 𝑌𝑡−𝑋𝑡 𝑙𝑜𝑔𝑋𝑡 𝑋𝑡𝜃=0 (3)

(hat西塔)表示,整理(3)式有: 设法求出θ的解,用𝜃

𝜃 𝑌𝑡 𝑙𝑜𝑔𝑋𝑡 𝑋𝑡= (𝑙𝑜𝑔𝑋𝑡)𝑋𝑡2𝜃 (4)

的值时,采用迭代的方法从某一假定数值开始,最终得到最小二最终求解𝜃 。 乘法的估计值𝜃

的性质,仅仅具有 值不再具有线性模型中𝛽此时,通过最小二乘法求解的𝜃

的性质(无 的性质才趋近于𝛽渐近性。换句话说,当样本大小趋近于无穷时,𝜃偏、有效)。

透过上面的例子,我们知道:

一、当需要更加精准的参数估计值时,通过最小二乘法求解的变量变换后的线性模型并非最优,此法要慎重使用;

二、非线性回归模型求解思想类似于线性模型,首先建立含有误差项的函数,使该函数取值最小化,并以迭代方式求解参数估计值。

3非线性模型的类型

范文二:非线性回归 投稿:陶涴涵

非线性回归

一、可化为线性回归的曲线回归

在实际问题当中,有许多回归模型的被解释变量y与解释变量x之间的关系都不是线性的,其中一些回归模型通过对自变量或因变量的函数变换可以转化为线性关系,利用线性回归求解未知参数,并作回归诊断。如下列模型。

y01e

x

-------(1) y01x2x2pxp--------(2)

yae

bx

e

--------------------(3) yaebx-------------(4)

对于(1)式,只需令xex即可化为y对x是线性的形式y01x,需要指出的是,新引进的自变量只能依赖于原始变量,而不能与未知参数有关。

xp

对于(2)式,可以令x1=x,x2=x2,…, xp=xp,于是得到y关于x1,x2,…, 的线性表达式y01x12x2pxp

对与(3)式,对等式两边同时去自然数对数,得lnylnabx,令

,1b,于是得到y关于x的一元线性回归模型:

ylny,0lnay01x

。对于(4)式,当b未知时,不能通过对等式两边同时取自然

数对数的方法将回归模型线性化,只能用非线性最小二乘方法求解。

回归模型(3)可以线性化,而(4)不可以线性化,两个回归模型有相同的回归函数aebx,只是误差项的形式不同。(3)式的误差项称为乘性误差项,(4)式的误差项称为加性误差项。因而一个非线性回归模型是否可以线性化,不仅与回归函数的形式有关,而且与误差项的形式有关,误差项的形式还可以有其他多种形式。

乘性误差项模型和加性误差项模型所得的结果有一定差异,其中乘性误差项模型认为yt本身是异方差的,而lnyt是等方差的。加性误差项模型认为yt是等方差的。从统计性质看两者的差异,前者淡化了yt值大的项(近期数据)的作用,强化了yt值小的项(早期数据)的作用,对早起数据拟合得效果较好,而后者则对近期数据拟合得效果较好。

影响模型拟合效果的统计性质主要是异方差、自相关和共线性这三个方面。异方差可以同构选择乘性误差项模型和加性误差项模型解决,必要时还可以使用加权最小二乘。 二、多项式回归

多项式回归模型是一种重要的曲线回归模型,这种模型通常容易转化为一般的多元线性回归来做处理。

1、常见的多项式回归模型

回归模型yi01xi2xi2i称为一元二阶多项式模型。通常将回归模型中的系数表示成:yi01xi11xi2i,回归函数yi01xi11xi2是一条抛物线方程,通常称为二项式回归函数。回归系数1为线性效应系数,11为二次效应系数。

当自变量的幂次超过3时,回归系数的解释变得困难起来,回归函数也变得很不稳定,对回归模型的应用会收到影响。因而,幂次超过3 的多项式回归模型不常使用。在实际应用当中,常遇到含两个或两个以上自变量的情况,称回归模型:yi01xi111xi212xi222xi2212xi1xi2i为二元二阶多项式回归模型。它的回归系数中分别含有两个自变量的线性项系数1和2,二次项系数11和22,并含有交叉乘积项系数12,交叉乘积项表示x1与x2的交互作用,系数12通常称为交互影响系数。

三、非线性模型

在非线性回归中,平方和分解式SST=SSR+SSE不在成立,类似于线性回归中的复决定系数,定义非线性回归的相关指数:R^2=1-SSE/SST

用非线性最小二乘法求解非线性回归方程,非线性最小二乘是使残差平方和达到最小,这种平方损失函数的优点是数学性质好,在一定条件下具有统计学的一些优良性质,但其最大的缺点是缺乏稳健性。当数据存在异常值时,参数的估计效果变得很差。因而在一些场合,可以用一些更稳健的残差损失函数代替平方和

n

损失函数,例如绝对值损失函数。绝对值残差损失函数为:Q()

i1

yif(xi,)

有时候用最小绝对值法的最大残差比普通最小二乘法的最大残差更大,这是否与最小绝对值法的稳健性相矛盾?其实这正说明了最小绝对值法的稳健性。这是因为最小绝对值法受异常值的影响程度小,回归线向异常值靠拢的程度也小,因而异常值的残差反而大。

四、非线性回归的一些问题

根据实际观测数据配以合适的曲线模型一般有两个重要的步骤。

一是确定曲线类型。对一个自变量的情况,确定曲线类型一般是把样本观测值画成散点图,由散点图的形状来大体确定曲线类型。再就是根据专业知识来确定曲线类型,如商品的销售量与广告费之间的关系,一般用S形曲线来描述;在农业生产中,粮食的产量与种植密度之间的关系往往服从抛物线关系。对于由专业知识可以确定的曲线类型,就用相应的模型去试着拟合,如果拟合的效果可以,问题就解决了。

二是参数估计问题。如果可将曲线模型转化为线性模型,就可用普通最小二乘法去估计未知参数,如果不能用某种变换把它转化成线性模型,则参数的估计就要用非线性最小二乘法进行。非线性最小二乘法比普通最小二乘法要复杂得

多,一般都是用迭代方法。

由于任一连续函数都可用分段多项式来逼近,所以在实际问题中,不论变量y与其他变量的关系如何,在相当宽的范围内总可以用多项式来拟合。例如在一元回归关系中,如果变量y与x的关系可以假定为p次多项式,就可以转化为多元线性回归模型来处理。利用多项式回归模型可能会把已有的数据拟合得十分漂亮,但是,如果对较大的x作外推预测,这种多项式回归函数就可能会得到很差的结果,预测值可能会朝着意想不到的方向转折,可能会与实际情况严重不符。所有类型的多项式回归函数,尤其是高阶多项式回归都具有外推风险。特别的,对于一元回归,只要用一元n-1次多项式就可以把n对数据完全拟合,多项式曲线通过所有n-1个点,残差平方和为零,但是这种的回归拟合却没有任何实际意义。因此,必须谨慎地使用高阶多项式回归模型,因为得到的回归函数只是数据的良好拟合,而并不能如实地表明x与y之间回归关系的基本特征,并会导致不规则的外推。所以在应用多项式回归时,阶数一般不要超过三阶。

一般地说,当非线性回归模型选择正确,回归拟合效果好时,相关指数R2能够如实反映回归拟合效果;而当回归拟合效果差时,相关指数R2则不能够如实反映回归拟合效果,甚至可能取为负值。

范文三:excel非线性回归 投稿:黎褉褊

省 软天  件地

利 用 E cl 件 进 行 非 线性 拟 合 的 非 编 程 方 法  xe 软

安 徽华东 金学院 机科学 230 )  亮 冶 计算 系(402  余   P 卜 2L J 

・-— —_ —- _一   I   l  

要:  

种 在 E cl 件 q进 行 非 线 性 拟 合 的 方 法 , x e软 - 并通过 实例 说 明 了该 方 法的有 效 

性和 实用性  关 键 词 : 数 据 分 析  非线 性 曲线 拟 合  非 线 性规 划   

^ 鹄     非

曲线 拟 合 是 数 据 分 析 和 数 据 处 理 的 重 要 工 作 之 一 。   在 利 用 数 据 对 系 统 的物 理 和 化 学 现 象 进 行 深 人 研 究 时 ,  

有 数 据 x Y各 为 以 列 向 量 ,假 定 它们 具 有 关 系 y f 和 =  (, ,)其 中 : 为 已知 常数 共 n 、 为 待 定参 数 共 m 个 。 x ab, a 个 b   定义最4-乘误差为 : '  

往往需要 利用机理数学模 型和试 验数据拟合 。另 外 由于  机 理 数 学 模 型 是 在 一 定 的物 理 化 学 理 论 基 础 上 建 立 的 ,   所 以各个参 数 以及不 同数据的性 质也是各不相 同的 。因   此 在 进 行 数 据 分 析 的 时 候 ,不 同 的 数 据 往 往 需 要 根 据 它 

在 模 型 中 的地 位 和 特 性 进 行 特 殊 的处 理 :  

E ∑( f,, . bb … b = y ( a ‰ t: , ix   -    ,,  

问题为 : b使得 E为最小 。 求   () 2 规划 问题 的 数学 表示 

目标 函 数 :( ) f O  b 限制 条 件 : (O<   G b )O 其 中 :O为 待 定 参 数 : b   不 失 一 般 性 , 定 需 要 得 到 目标 函 数 的最 小值 。 假   问题 为 :在 满 足 限制 条 件 的前 提 下 求 解 目标 函数 的  最小值以及相应的参数 b 。 O  () 3 拟台 与规 划之 间 的等 价 关 系   显 然 ,令 拟 合 问题 中 的待 定 参 数 b为 规 划 问 题 中 的 

微软公 司 O f e 件 中的 E cl fc 套 i x e 已经成 为许多 场合  下的数据台帐工具 。作 为一种标 准的数据记 录和管理工  具. 它具有 大多数数据分析 时所需 的基本工具 , 包括 图形  和线性 回归 等。 了能够利用 E c l 为 xe 进行更 多的数据分析  工 作 , 些 人 提 出 了 利 用 其 内 嵌 B SCV A 进行 编 程 处  一 A I(B ) 理 的方法 。但 是由于要求进行程序编制 , 以并不是一般  所

工 程技 术人 员 可 以容 易 掌握 的一 种 途 径 。   对 于非 线 性 拟 合 这 个 特 殊 的 问 题 , 过 适 当转 换 . 经 可 

以将它转换为一个非线性规则问题 , 从而利用 E c l xe 附属  的规 划 求 解 工

具 能 很 容 易 地 进 行 处 理 :  

工 具  ( ) 合 问 题 的 数 学 表 示  1拟

参 数 b ,令拟台问题中的最小二乘误差函数 E为规 划问  O 题 中的 目标 函数 , 令规 划 问题 中的限制条件为空 , 求解  则

题 中 的 E函 数 为 非 线 性 函数 ,在 这 里 需 要 规 划 问题 也 是 

因为拟合 问   1 拟合 和规 划的等 价关 系及 E c l x e 中的 规划 求解  该规划问题就可以得到拟台 问题 的解 。显然 ,

个非线性规划问题 。  

不失一 般性 , 以最 小二乘 法为例 , 拟合 问题 的数学 表  示如下 :  

一   一 … … … … 一 一 … … … …   一 … … … 一   一 :   一 一

( )x e 中的规划求解 工具  4E cl 当安装 0 ie套件选择 了规划求解 工具时 ,在软件  fc

… 一   一 一 一   … 一 … … … 一 一 一   … 一 … ; 

( 接上页)  

络化  西安 : 西北 工业 大学 出 版社 , 9   1 6 9

实现基于 v B与 F r a 语 言 的可 视 化混 合 编 程 , 充 分 利  ot n r 可

3 崔俊 芝. 有限 元软件 方 法. 现代 北京 : 国防 工业 出版社 ,  

用v B方便快速 的界面开发与 F r a 语 言强大 的数值计  o rn t 算 能 力 。 文介 绍 的创 建 F r a 动 态链 接 库 并在 V 本 o rn t B应 用 程 序 中调用 Fra ot n动 态 链 接 库 的 方 法 ,为 基 于 V r B与  F r a 言 可视 化 混 合 编 程提 供 了一种 简 单 可 行 的方 法 。 o r 语 t  

参 考 文 献  1 潭 浩强 , 田淑清 F R R O T AN语 言一 OR R 7 F T AN 7结 构 化程  序设 计. 北京 : 清华大 学 出版社 , 9 0 1 9 

2 蔡青.   高光 焘 C / A 系统 的可视 化集 成化 智能 化 网  AD C M

19  95 4 胡衡 江 , 蔡寒 阳・ n o s V Widw 下 B调用 C动态 链接 库 微 型   机与 应用 ,9 7 1 (  19 ;63 ) 5 贾宏 宇 , 俊峰 ・B应用 程序 中用 户 自定义 动态链 接库  赵 V

的关 键技术 计 算 机系统 应用 ,9 8; ) 19 (   5 6 王 向 阳・ 如何在 V s a  ai iu l B sc应用 程序 中调 用动态 链接  库・ 型机 与应用 ,9 9;8 1 微 l 9 1 ()    

( 收稿 日期 :9 9  — 6  l 9 —1 0 ) 2

1 一  6

《 型 期与 应 用 》 0 0 第 5   微 20 年 期

嘧 软天  件地

菜单 的工具菜单 中会出现规划求解项 目, 中该 项 目, 选 填 

写 对 话 框 以 后 .工 具 会 根 据 对 话 框 中 的定 义 自动 进 行 规 

划求解 。  

8 9 87 91 4  6 3  

2 】8 2 53   4 80 4 2 8 5 91 7   7 .0 0 6 2 4 41 28 2 9  3 0   3 34 2 0   2   0 2 0】 3 15 8 5   3   4 21 3 3 0 1 7 03   6  9 0 6 35 0 4 3 9  7 9 8  

表 3 计 算 结 果 

Mi ootE cl 规划求解” 自德克 萨斯 大学奥  c sf x e 的“ r   取

斯 汀 分 校 的 L o   ad n和 克 里 夫 兰 州 立 大 学 的 A ln e n L so l   a

Wae 共 同 开 发 的 Ge e aie   R d c d Grd e t rn n r l d e u e  a in  z

( R 2 ̄线性最优化代码 。线性和整数 规划取 自 Fo t G G) rn—   l e Ss ms 司 的 Jh  t n和 D n F lt i   yt 公 n e o n Was o a  ys a提 供 的  r

有 界 变 量 单 纯 形 法 和 分 支 边 界 法 。 M coot x e irsf  E cl  

41  8 5 6   688 5 3

4 44 7 8   4   91 7 3 >   36 9 3 4 5 95 7 0  

S le 程序代码是 以宏 的方式提供 调用 的。 o r v 使用时不需要  关 - 具 体 的 实 现 方 法 , 只需 要 和 它 的 对 话 框 进 行 交 互  L其

就 可以了。  

45   0

4 0 0  

2 一个 实 例 

下 面是 液 相 吸 附平 衡 式 的实 例  往 D S水 溶 液 中投 人 活 性 炭 ,在 等 温 下 放 置 到 达 吸  B 附平衡  B D S的平 衡浓度 C与 投入 活性炭 的吸 附量 q之  问 的关 系列 于 表 1中。  

30 5  30 0 

2 0 5 

. /

、  

20 0 

10 5  

  . .  

O 

2  0

C  

4  0

∞ 

表 1 待 拟 合 原 始数 据 

6   45 l O l 6 l 1  l27 I  2   I8  f73 0 I-2   8   81  1j 1. 6  I82 90 3  5    I 9   7 -_2 .15  18  l2 . 3 __ 7.l 3  4 13 4 9   07 2 81  80  37  1   4 386 4 46I0  i2  2 2 3 3l 0

图 1 数 据点 和拟旨 线 对照   

应用非线性最小二乘 法估 计下式中的参数 :  

日 b (+ C ) : C/1 a   

3 方 法 讨 论 和 结 论 

从 以上 实例 可 以看 出 , 求 解 过 程 中没 有使 用 任 何 程  在

显 然这个 非线 性函数是 无 法直 接将它线 性 化 的 , 必 

须进行非线性拟 合求解 。 根据经验将初始参数指定 为 :: a 

03 b 10 B 08 . ,= O , = .:表 2 在 E cl 为 xe 中进 行

求 解 的 数 据 准  备情况 :  

础 ∞ 凹   ㈨ 

序的概念 。 求解过程准备阶段的工作为 E c l x e 表格的公式  计算 , 求解过程中人工操作 的仅仅是对话框填充 :所以本 

方 法 在使 用上 是非 常 简便 的 。  

表 2 数据 准备 

1 0.  7 7 2 81 2.   28 5  28     37 3 13 2    3    354 3 86 7 .  16 ,  45    2 68 .  81   .6 l1     5 1    27 1 .  82 lL  48 8 8   13 0 0   2 5 6 94 2   2 .7 4 9 2 447 5 8 8   5 51   3 28 02 4   l  0 2 9 3 8 9 83 5   6  6 4 5 3 58 4 7   8   l 8 81 3 2  5 3 2 52 0 l   5 8 09 8 7 .59 6 6   70 .5 8 8 09 4 41   8 68 0 8   4   23 8 5 2 7 .7I 6   2 22 l2 2 1 598 54   9 3   4 3 7 62 9 9l   9 3  

由于问题 的定义对使 用者透 明 , 以使用者能很方便  所 地根据实 际要求 进行修正 。比如 根据 已知参 数 的物 理化  学 意义设定 参数的变化范 围( 利用规划 问鼯的约束条件) ;   或者指定某参数 为整数( 利用规划求解 中的整 数规划或者  混合规划求解器) 。   另外 ,由于问题 的定 义是 直接在 E cl xe 表上构造 的 .   所 以 可 以 方 便 地 改变 问题 的 构 造 方 法 。从 而 引入 其 它 的  拟合计算方 法。比如在表格 的误差列 中 , 将原来的计算方  法 由误差平方更 改为误差和原值 的 比值 ,则 可以按 照相  对 误 差 的最 小 重 新 求 得 参 数 的估 计 值 。 这 种 改 变 对 于数   值 变化范围 比较大 的情 况具有很实用 的意义 ,而在求解  时 则 只需 要 像 书 写 公 式 一 样 更 改 表 格 中 的 计 算 公 式 , 没  有 增 加 任 何 多余 的操 作 。  

参 考 文 献  1 张治 文 , 何磊 中文 E cl70 f   n o s9 教 程 北  xe . o Widw  5     r

京: 科学 出版 社 , 9 7 19 

他 加 珏  拍   鲫  墨  如   ”  H “ 鲫

2  ∞ 抖9   3    89

5   73

4 .98 7 3 486 4 5  

4 46 3    4    013

49 2 

∞ 2  4 N 5 鲫3 2 1   盯 4 “ 73 5 83 6 8 9 8 64 7  

6 24 9 8   6   4 9 07

96  1 7 781  3 99 .7 8   4 380 9

5 4 88 3   4 9 9 5

误差平方和一  >

l4 6 .9 8 l0 45 6 

表格从左到 右

各列分别为 : 因变量 的原始数 据 、 自变  量 的原始数据 、 根据参数计 算的估计 因变量数据 、 单个样  本点 的误差平方 。将 待定参数 的初始值填写存储 在准备  用 于计算 的单元格 区域 F : 3 并使单 元格 F 1F , 4的数 值 等  于 由误 差 平 方 累 计 的误 差 平 方 和数 值 。   设定规划求 解对话框使 目标单 元为误差平方 和数值  对应 的单 元格 F , 4 并设 目标为求 极小值 , 设定 可变单 元为  

待定 参 数 数 值 对 应 的 3个单 元 格 ( 1F  约束 条件 为 空  F :3, J

2 朱 中南 , 戴迎 春  化工数 据处 理与 实验设 计 . 加工 出版  烃

社 ,9 9 18 

3 邓乃洋 . 约束最 优化方 法 北京 : 无 科学 出版社 , 9 2 18 

4 J n t a Bad No ie r a a t r Esi to   w    o a h n, r   nl a P r mee   tmai n Ne n

Yo k: a e c r s , 9 4 r Ac d mi P e s 1 7  

经过计 算可 得对应 的 3个参 数分别 为 := .5 , = 8 . a O6 4 b 1 5   10, = .7 。 O B 08 8 此时对应 的因变量估计值 以及 误差数 据如 

表 3 图 1 数 据 点 和拟 舍 线 的对 照 。 。 为  

( 收稿 日期 : 9 9 2 2 ) I 9 —1- 0 

《 型 机 与应 用} o o年 第 5期  微 2o

1 一   7

范文四:非线性回归分析 投稿:彭凃凄

SPSS—非线性回归(模型表达式)案例解析

2011-11-16 10:56

由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二!

非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型 非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型

还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢?

答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究:

第一步:非线性模型那么多,我们应该选择“哪一个模型呢?”

1:绘制图形,根据图形的变化趋势结合自己的经验判断,选择合适的模型 点击“图形”—图表构建程序—进入如下所示界面:

点击确定按钮,得到如下结果:

放眼望去, 图形的变化趋势,其实是一条曲线,这条曲线更倾向于

在“模型”选项中,勾选”二次项“和”S

通过“二次”和“S “ 两个模型的对比,可以看出S 模型的拟合度

明显高于

“二次”模型的拟合度 (0.912 >0.900)不过,几乎接近

接着,我们采用S 模型,得到如下所示的结果:

结果分析:

1:从ANOVA表中可以看出:总体误差= 回归平方和 + 残差平方和 (共计:0.782) F统计量为(240.216)显著性SIG为(0.000)由于0.000<0.01 (所以具备显著性,方差齐性相等)

2:从“系数”表中可以看出:在未标准化的情况下,系数为(-0.986) 常数项为2.672

所以 S 型曲线的表达式为:Y(销售量)=e^(b0+b1/t) = e^(2.672-0.986/广告费用)

当数据通过标准化处理后,常数项被剔除了,所以标准化的S型表达式为:Y(销售量) = e^(-0.957/广告费用)

下面,我们直接采用“非线性”模型来进行操作

第一步:确定“非线性模型”

从绘图中可以看出:广告费用在1千万——4千多万的时候,销售量增加的跨度较大,当广告费用超过“4千多万

从图形可以看出:它符合The asymptotic regression model (渐近回归模型) 表达式为:Y(销售量)= b1 + b2*e∧b3*(广告费用)

当b1>0, b2<0, and b3<0,时,它符合效益递减规律,我们称之为:Mistcherlich's model

第二步:确定各参数的初始值

1:b1参数值的确定,从表达式可以看出:随着”广告费用“的增加,销售量也会增加,最后达到一个峰值,由于:b2<0, b3<0 ,随着广告费用的增加:

b2*e∧b3*(广告费用)会逐渐趋向于“0” 而此时 Y(销售量)将接近于 b1值,从上图可以看出:Y(销售量)的最大值为12点多,接近13,所以,我们设定b1的初始值为13

2:b2参数值确定:当Y(销售量)最小时,此时应该广告费用最小,基本等于“0”,可以得出:b1+b2= Y(销售量)此时Y销售量最小,从图中可以看出:第一个值为6.7左右,接近7这个值,所以:b2=7-13=-6

3: b3参数值确定:可以用图中两个分离点的斜率来确定b3的值,例如取

(x1=2.29,y1=8.71) 和( x2=5.75, y2=12.74) 通过公式 y2-y1/x2-x1=1.16,(此处可以去整数估计值来算b3的值)

确定参数初始值和参数范围的方法如下所示:

1:通过图形确定参数的取值范围,然后在这个范围里选择初始值。

2:根据非线性方程的数学特性进行某些变换后,再通过图形帮助判断初始值的范围。

3:先使用固定的数代替某些参数,以此来确定其它参数的取值范围。 4:通过变量转换,使用线性回归模型来估计参数的初始值

第三步:建立模型表达式和选择损失函数

点击“分析”—回归——非线性,进入如下所示界面:

如上图中,点击参数,分别添加b1,b2,b3进入参数框内,在模型表达式中输入:b1 + b2*Exp(b3*广告费用) (步骤为:选择“函数组”—算术——Exp函数),将“销售量”变量拖入“因变量”框内

“损失函数”默认选项为“残差平方和” 如果有特需要求,可以自行定义 点击“约束”进入如下所示的界面:

点击“继续”按钮,此时会弹出警告信息,提示用户是否接受建议, 建议内容为:将采用序列二次编程进行参数估计,点击确定,接受建议即可

参数的取值范围指在迭代过程中,将参数限制在有意义的范围区间内,提供两种对参数范围约束的方法:

1:线性约束,在约束表达式里只有对参数的线性运算

2:非线性约束,在约束表达式里,至少有一个参数与其它参数进行了乘,除运算,或者自身的幂运算

在“保存”选项中,勾选“预测值”和“残差”即可,点击继续

点击“选项”得到如下所示的界面:

此处的“估计方法”选择“序列二次编程”的方法, 此方法主要利用的是双重迭代法进行求解,每一步迭代都建立一个二次规划算法,以此确定优化的方向,把估计参数不断的带入损失函数进行求值运算,直到满足指定的收敛条件为止 点击继续,再点击“确定”得到如下所示的结果:

上图结果分析:

1:从“迭代历史记录”表中可以看出:迭代了17次后,迭代被终止,已经找到最优解

此方法是不断地将“参数估计值”代入”损失函数“求解, 而损失函数采用的是”残差平方和“最小,在迭代17次后,残差平方和达到最小值,最小值为(6.778)此时找到最优解,迭代终止

2:从参数估计值”表中可以看出:

b1= 12.904 (标准误为0.610,比较小,说明此估计值的置信度较高) b2=-11.268 (标准误为:1.5881,有点大,说明此估计值的置信度不太高) b3=-0.496(标准误为:0.138,很小,说明此估计值的置信度很高)

非线性模型表达式为:Y(销售量)= 12.904-11.268*e^(-0.496*广告费用) 3:从“参数估计值的相关性”表中可以看出:b1 和 b3的相关性较强,b2和b1或b3的相关性都相对弱一些,其中b1和b2的相关性最弱

4:从anova表中可以看出:R方 = 1- (残差平方和)/(已更正的平方和) = 0.909, 拟合度为0.909,说明此模型能够解释90多的变异,拟合度已经很高了

前面已经提到过,S行曲线的拟合度更高,为(0.916)那到底哪个更合适呢? 如果您的数据样本容量够大,我想应该是“非线性模型”的拟合度会更高! 其实想想,我们是否可以将“非线性”转换为“线性”后,再利用线性模型进行分析了? 后期有时间的话,将还是以本例为说明,如何将“非线性”转换为“线性”后进行分析!!

范文五:一元非线性回归 投稿:唐姰姱

一元非线性回归

有时,回归函数并非是自变量的线性函数,但通过变换可以将之化为线性函数,从而利用一元线性回归对其分析,这样的问题是非线性回归问题。

为了检验X射线得到杀菌作用。用200kv的X射线照射杀菌,每次照射6分钟,照射次数为x,照射后所剩的细菌数为y,下表是一组试验结果

x

1

2 3 4 5 6 7 y

783 621 433 431 287 251 175

x

8 9 10 11 12 13 14

y

154 129 103 72 50 43 31

x

15 16 17 18 19 20

y

28 20 16 12 9 7

根据经验知道y关于x的曲线回归方程如

ˆaey

bx

试给出具体的回归方程,并对其对应的决定系数R^2和剩余标准差s。

一、首先描出数据的散点图,如下图

散点图呈现出一个明显的向下且下凸的趋势,可能选择的函数关系很多,比如我们可以给出如下三个曲线函数:

1b

a

x (1) 1.y

2.yaxb (2) 3.yae (3)

bx

二、参数估计

1.为了能采用一元线性回归分析方法,我们做如下变换 vlny u=x 则(1)式的曲线图就化为如下的散点图

uu

2

i

= 3655 vi=87.22497

u=182.75 v=4.361248

2i

=1611149 uivi=21281.69

nu=667951.3 nuv=15940.36

luu= 943197.8 luv=5341.329

B1=

luv

=130.9375 luu

B

=v- B1=-388.301

得出方程

v=-388.301+130.9375x

四、结束语

对于可化为线性模型的回归问题,一般先将其化为线性模型,然后再用最小二乘法求出参数的估计值,最后再经过适当的变换,得到所求回归曲线。在熟练掌握最小二乘法的情况下,解决上述问题的关键是确定曲线类型和怎样将其转化为线性模型。确定曲线类型一般从两个方面考虑:一是根据专业知识,从理论上推导或凭经验推测、二是在专业知识无能为力的情况下,通过绘制和观测散点图确定曲线大体类型。

范文六:SPSS非线性回归 投稿:彭瘗瘘

SPSS数据统计分析与实践

主讲:周涛 副教授 北京师范大学资源学院 2007-12-18

教学网站:http://www.ires.cn/Courses/SPSS

第十四章:非线性回归

Contents:

1. 非线性回归概述 2. SPSS实例 3. 常用的非线性模型

SPSS procedures for Regression

1.

2.

3.

The Nonlinear Regression procedure allows you to create powerful and flexible models for nonlinear relationships between a dependent variable and one or more independent variables. The Linear Regression procedure provides more statistics for models that are intrinsically linear. The Curve Estimation procedure allows you to more easily specify certain nonlinear models, and can be useful for quickly comparing several different types of models.

Linear vs. Nonlinear models. Regression models, whether linear or nonlinear, assume that the form of the model is Y=F(X,B) +error, where Y is the dependent variable, X represents the predictors, and F is a function of X. In linear models, F is of the form:

F ( X , B) = ∑ b j X j

j =1

p

Where xj is the jth predictor, and bj is the jth regression coefficient. Note that for a model to be considered linear, F must be a linear function of the parameters, not necessarily the predictors. Thus, y=bx2 + error is a linear predictors model. Additionally, some models in which the error is multiplicative, such as y=ebxerror, are linear models under the log-transformation: ln(y) = bx + ln(error). These model are known as intrinsically linear. Nonlinear models are all other forms of F.

Parameters estimation in Nonlinear Regression

A difference from linear regression is that the solution of the normal equations usually requires an iterative numerical search procedure because analytical solutions generally cannot be found. To make things still more difficult, multiple solutions may be possible.

Basic Ideas for parameter estimation

Examples for Search methods

Methods of parameter estimation (1)

解析解(Analytic solution) 梯度下降算法(Gradient descent algorithms) Steepest-descent quasi-Newton Levenberg-Marquardt 剃度下降法的优点:速度快 算法相对简单

缺点:通常只能找到“Local minimum” 需要提供“Gradient vector”

∇ y J = ∂J / ∂y k

Methods of parameter estimation (2)

解析解(Analytic solution) 梯度下降算法(Gradient descent algorithms) 全参数空间搜索算法(Global search methods) 优点:能搜索到全局最优参数(Global minimum) 很多算法不需要提供“Gradient vector” 缺点:速度慢,需要消耗较大的计算时间

代表性算法:模拟退火(Simulated annealing) 遗传算法(Genetic Algorithms)

马尔可夫链蒙特卡洛法(Markov chain Monte Carlo)

Example

Example

Example

SPSS解决方案

1. 2.

根据散点图或经验确定模型 根据经验给出初始值和参数空间(非常重 要)

Example

A retailer wants to examine the relationship between money spent on advertising and the

resulting sales. To this end, they have collected past sales figures and the associated advertising costs. This data file was previously analyzed using Linear and Quadratic models via the Curve Estimation procedure, and the the Quadratic model was found to be superior to the Linear model for this situation. However, the retailer is concerned that the Quadratic model may not be appropriate because it suggests that increased advertising will eventually decrease sales. Use Nonlinear Regression to fit an appropriate model.

Step 1: Scatter plot

The resulting scatterplot shows that sales increase with increased advertising; however, the sales return on advertising investment appears to decrease with increased spending, until increased advertising has no further effect on sales. An appropriate model for this kind of pattern is the asymptotic(]渐近线的) regression model.

Step 2: Choosing Model

The asymptotic regression model (渐近回归模型) has form: b3 X

Y = b1 + b2 e

When b1>0, b2<0, and b3<0, it gives Mistcherlich's model of the rameter constraint. Select b1 as the parameter to be constrained. Select >= from the dropdown list. Type 0 as the constraint Click Add Select b2 as the parameter to be constrained. Select <= from the dropdown list Type 0 as the constraint. Click Add Select b3 as the parameter to be constrained. Select <= from the dropdown list Type 0 as the constraint. Click Add

Step 4: Running Nonlinear Regression (3) Constrains

Step 4: Running Nonlinear Regression (3) Constrains

Click OK in the warning. The sequential quadratic programming algorithm (顺序二次规划)will be used instead.

Step 4: Running Nonlinear Regression (4) Save variables

6. Click Save in the Nonlinear Regression dialog box.

• Select Predicted values and Residuals.

Step 5: Output and Interpreting

Parameter Estimates 95% Confidence Interval Lower Bound Upper Bound 11.636 14.173 -14.556 -7.979 -.782 -.209

Parameter b1 b2 b3

Estimate 12.904 -11.268 -.496

Std. Error .610 1.581 .138

The parameter estimates table summarizes the modelestimated value of each parameter. Parameters in a nonlinear regression model usually do not have the same interpretation as linear regression coefficients, and often vary from model to model.

Step 5: Output and Interpreting

Parameter Estimates 95% Confidence Interval Lower Bound Upper Bound 11.636 14.173 -14.556 -7.979 -.782 -.209

Parameter b1 b2 b3

Estimate 12.904 -11.268 -.496

Std. Error .610 1.581 .138

As previously discussed, b1 represents the maximum possible sales, even if infinite advertising money were available. Its small standard error with respect to the value of the estimate suggests that you can be confident in the estimate.

Step 5: Output and Interpreting

Parameter Estimates 95% Confidence Interval Lower Bound Upper Bound 11.636 14.173 -14.556 -7.979 -.782 -.209

Parameter b1 b2 b3

Estimate 12.904 -11.268 -.496

Std. Error .610 1.581 .138

b2 is the difference between maximum possible sales and sales when no advertising money is spent. Its standard error is large and confidence interval is wide compared to the value of the estimate, so there is some uncertainty here.

Step 5: Output and Interpreting

Parameter Estimates 95% Confidence Interval Lower Bound Upper Bound 11.636 14.173 -14.556 -7.979 -.782 -.209

Parameter b1 b2 b3

Estimate 12.904 -11.268 -.496

Std. Error .610 1.581 .138

b3 controls the rate at which the maximum is reached, the so-called ed Total Corrected Total Sum of Squares 2748.519 6.778 2755.297 74.520 df 3 21 24 23 Mean Squares 916.173 .323

Dependent variable: Detrended sales a. R squared = 1 - (Residual Sum of Squares) / (Corrected Sum of Squares) = .909.

The Uncorrected Total represents the entire variability in the dependent variable, while the Corrected Total is adjusted to only reflect variability about hich the proportion drops appears to decrease with time, until the virus threat is essentially eliminated. An appropriate model for this kind of pattern is the asymptotic regression model (渐近线回归模型). A segmented model that uses a logistic equation for the first 19 hours and an asymptotic regression for the remaining hours should provide a good fit and interpretability over the entire time period.

Choosing starting values for the logistic model

The logistic model has form:

b1 Y= 1 + b2 e −b3 X

Generally, b1>0, b2>0, and b3>0. This model has an .027

The parameter estimates table summarizes the modelestimated value of each parameter. The standard errors of the logistic model's parameter estimates are considerably larger than those of the asymptotic regression model, relative to the values of the estimates. This is due in part to the fewer observations available to fit the logistic portion of the model; the rest is likely due to greater variation in the data during the first 20 hours.

Outputs

ANOVAa Source Regression Residual Uncorrected Total Corrected Total Sum of Squares 4.884 .082 4.966 1.212 df 6 36 42 41 Mean Squares .814 .002

Dependent variable: Proportion of infected messages a. R squared = 1 - (Residual Sum of Squares) / (Corrected Sum of Squares) = .933.

The ANOVA table provides a breakdown of the sum of squares, a measure of variability in the dependent variable, for this model. The Residual sum of squares and Corrected Total are used to compute r2. An r2 value of 0.933 means that the model accounts for about 93.3% of the variability in the dependent variable.

Scatter Plot

These residuals do not show a pattern, thus the model is acceptable in the sense the residuals are independent of the fit values

常用非线性模型: 2D Model

1. Polynomial

Model a*x+b a*x^2+b*x+c a*x^3+b*x^2+c*x+d a*x^4+b*x^3+...+e a*x^5+b*x^4+...+f a*x^6+b*x^5+...+g a*x^7+b*x^6+...+h a*x^8+b*x^7+...+i a*x^9+b*x^8+...+j a*x^10+b*x^9+...+k Group Polynomial Polynomial Polynomial Polynomial Polynomial Polynomial Polynomial Polynomial Polynomial Polynomial Description First Order Polynomial Second Order Polynomial Third Order Polynomial Fourth Order Polynomial Fifth Order Polynomial Sixth Order Polynomial Seventh Order Polynomial Eighth Order Polynomial Ninth Order Polynomial Tenth Order Polynomial

常用非线性模型: 2D Model

2. Single Parameter Convex/Concave Curves

Model log(x-a) 1/(1+a*x) exp(x-a) x^a a^(1/x) 1/(x+a) 1-1/(x^a) Group Single Parameter Convex/Concave Single Parameter Convex/Concave Single Parameter Convex/Concave Single Parameter Convex/Concave Single Parameter Convex/Concave Single Parameter Convex/Concave Single Parameter Convex/Concave Description

Root Model

常用非线性模型: 2D Model

3. Two Parameter Convex/Concave Curves

Model

log(a+b*x) a*x^b a*b^x a*exp(b*x) a*exp(b/x) exp(a+b*x) a*b*x/(1+b*x) x/(a*x+b) 1/(a+b*x) a/(1+b*x) a*(x-b) a*(1+x)^b a+b*log(x) 1/(a+b*log(x)) a*x^(b*x) a*x^(b/x) a*x/(b+x) a+b/x

Group

Description

Power (Freundlich) Modified Power Exponential Modified Exponential Rectangular Hyperbola Reciprocal Model

Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave Two Paramet

er Convex/Concave Two Parameter Convex/Concave Two Parameter Convex/Concave

Logarithm Model Reciprocal Logarithm Model Geometric Model Modified Geometric Model Saturation Growth Model Hyperbolic Model

常用非线性模型: 2D Model

4. Three Parameter Convex/Concave Curves

Model a*b^x*x^c a*b^(1/x)*x^c Hoerl Model Modified Hoerl Model 1/(a+b*x+c*x^2) Three Parameter Convex/Concave Reciprocal Quadratic (Holliday) exp(a+b/x+c*log(x)) Three Parameter Convex/Concave Vapor Pressure Model a+b*x+c/x^2 Three Parameter Convex/Concave Heat Capacity Model a/(1+b*x+c*x^2) Three Parameter Convex/Concave Group Description Three Parameter Convex/Concave Three Parameter Convex/Concave

常用非线性模型: 2D Model

5. Single Parameter Curves with Maxima and Minima

Model cos(x+a) sin(x+a) 1-exp(-a*x^2) exp(-a*x^2) Group Description Single Parameter with Max and Min Single Parameter with Max and Min Single Parameter with Max and Min Single Parameter with Max and Min Trigonometric Trigonometric II

常用非线性模型: 2D Model

6. Two Parameter Curves with Maxima and Minima

Model a*cos(x)+b*sin(x) Group Two Parameter with Max and Min Description

常用非线性模型: 2D Model

7. Three Parameter Curves with Maxima and Minima

Model x/(a+b*x+c*x^2) a+b*cos(x)+c*sin(x) exp(a+b*x+c*x^2) x/(a+b*x+c*sqr(x)) a*x^b*exp(-c*x) x^a*exp(b-c*x) a*x^b*(1-x)^c Group Description Three Parameter with Max and Min Three Parameter with Max and Min Three Parameter with Max and Min Three Parameter with Max and Min Gunary Model Three Parameter with Max and Min Three Parameter with Max and Min Three Parameter with Max and Min Beta Distribution Model a*exp((-(x-b)^2)/(2*c^2)) Three Parameter with Max and Min Gaussian Distribution Model

常用非线性模型: 2D Model

8. Single Parameter Sigmoidally Shaped (S 形曲线)

Model 1-exp(-x^a) exp(-x^a) Group Description Single Parameter Sigmoidally Shaped Single Parameter Sigmoidally Shaped

常用非线性模型: 2D Model

9. Two Parameter Sigmoidally Shaped (S 形曲线)

Model Group Description 1-exp(-a*x^b) Two Parameter Sigmoidally Shaped 1-exp(-a*b^x) Two Parameter Sigmoidally Shaped exp(-exp(a-b*x)) Two Parameter Sigmoidally Shaped

常用非线性模型: 2D Model

10. User Defined Models

常用非线性模型: 3D Model

1. 3 Parameter Power

a*x1^b*x2^c a*b^x1*x2^c a*x1^b*c^x2

常用非线性模型: 3D Model

2. 3 Parameter Polynomials

a+b*x1+c*x2 a+b*x1+c*log(x2) a+b*x1+c/x2 a+b*log(x1)+c*x2 a+b*log(x1)+c*log(x2) a+b*log(x1)+c/x2 a+b/x1+c*x2 a+b/x1+c*log(x2) a+b/x1+c/x2

常用非线性模型: 3D Model

3. Four Parameter Polynomials

a+b*x1+c*x2+d*x2^2 a+b*x1+c*log(x2)+d*log(x2)^2 a+b*x1+c/x2+d/x2^2 a+b*x1+c*x1^2+d*x2 a+b*x1+c*x1^2+d*log(x2) a+b*x1+c*x1^2+d/x2 a+b*log(x1)+c*x2+d*x2^2 a+b*log(x1)+c*log(x2)+d*log(x2)^2 a+b*log(x1)+c/x2+d/x2^2 a+b*log(x1)+c*log(x1)^2+d*x2 a+b*log(x1)+c*log(x1)^2+d*log(x2) a+b*log(x1)+c*log(x1)^2+d/x2 a+b/x1+c*x2+d*x2^2 a+b/x1+c*log(x2)+d*log(x2)^2 a+b/x1+c/x2+d/x2^2 a+b/x1+c/x1^2+d*x2 a+b/x1+c/

x1^2+d*log(x2) a+b/x1+c/x1^2+d/x2

END

范文七:多元线性回归与非线性回归 投稿:任濩濪

实验三 多元线性回归与非线性回归

实验目的:

1、 学会多元线性回归的参数估计方法;

2、 掌握多元线性回归的检验方法,包括拟合优度检验、F检验和t检验,尤其是掌握调

整的判断系数和F检验的内容;

3、 掌握非线性回归的参数估计方法,尤其是能够利用EViews软件进行参数估计。 实验内容:

1、下表列出了某地区家庭人均鸡肉年消费量Y与人均可支配收入X、鸡肉价格P1、猪肉价格的相关数据P2,试利用这些资料,设定适当的模型进行回归分析。

(1)、计算相关系数

(2)绘制散点图

2建立模型

2、为了度量投资和劳动投入之间的替代弹性,当今著名的CES(恒定替代弹性)模型形式设定为

lnV/Lln01lnW

其中,V/L表示单位劳动的附加值,L表示投入的劳动,W表示实际工资率。系数1表示劳动与资本之间的替代弹性。用下表给出的数据,验证估计的弹性是1.324,并且它和1在统计上无显著差异。

范文八:实验8多元线性回归与非线性回归 投稿:许圵圶

实验 8

多元线性回归分析与非线性回归分析

多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验、参数的估计与检验、回归诊断与预测。很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归、指数回归、对数回归、幂函数回归等。

8.1 实验目的

掌握使用 SAS多元线性回归分析与非线性回归分析的方法。

8.2 实验内容

一、用“分析家”作多元线性回归分析 二、用 INSIGHT模块作多项式回归 三、使用 REG过程作回归分析 四、一元非线性回归分析

8.3 实验指导

一、用“分析家”作多元线性回归分析

【实验 8-1】某研究人员需要分析我国固定资产投资状况的影响因素,选取 5个可能的影响因素:国内生产总值、商品房屋销售额、财政支出、社会消费品零售总额、进出口总额,统计 1987~2001共 15年的各项指标如表 8-1所示( sy8_1.xls)所示。试在 0.05的显著性水平下进行多元回归分析,判断哪些因素对固定资产投资有着显著影响,给出回归方程。

表 8-1 15年的统计数据

年度 1987 1988 1989 1990 1991

固定投资总国内生产总商品房屋销售

额 值 额 3791.7 4753.8 4410.4 4517 5594.5

11962.5 14928.3 16909.2 18547.9 21617.8

1100967 1472164 1637542 2018263 2378597

财政支

出 2262.18 2491.21 2823.78 3083.59 3386.62

社会消费品零售

总额

5820 7440 8101.4 8300.1 9415.6

进出口总额 3084.2 3821.8 4155.9 5560.1 7225.8

1. 生成数据集

在“分析家”中直接打开上面的 Excel数据表(sy8_1.xls),选择编辑状态,修改每个变量的属性,将变量名分别改为:年度: n、固定投资总额: y、国内生产总值: x1、商品房屋销售额:x2、财政支出:x3、社会消费品零售总额: x4、进出口总额:x5。

以数据集 Mylib.sy8_1存盘。

2. 全回归分析

1)选择主菜单“ Statistics(统计)”→ “Regression(回归)”→“Linear(线性) ”,打开 “Linear Regression(线性回归)”对话框。

2)选择变量列表中的变量 y,单击“Dependent”按钮,选定响应变量,选择变量列表中的变量 x1、 x2、x3、x4、x5,单击“ Explanatory”按钮,选定解释变量,如图 8-1所示。

图8-1 Linear Regression对话框

3)单击“ OK”按钮,得到分析结果如图 8-2所示。

图8-2 多元回归分析结果

分析结果包括方差分析表、拟合的汇总信息以及回归系数估计值与显著性检验。方差分析表中显示模型的作用是显著的( F统计量的值为 1567.35,p值<0.0001<0.05 = α)。参数显著性检验表明,进入回归的 5个自变量,其作用在其它变量进入回归的前提下并不都是显著的。例如 x3、x4、x5的作用就不显著。因此有必要适当选择变量建立一个“最优”的回归方程。 3. 逐步回归分析

1)重复上面 2中 1),在“Linear Regression(线性回归)”对话框(图 8-1)中,单击“ Model”按钮,打开“Linear Regression:Model”对话框。在 “Method”选项卡中选择“ Stepwise selection(逐步选择法)”,如图 8-3所示。

两次单击“OK”按钮,得到分析结果。

2)在显示结果中,第 1步记录了只有 x1进入回归方程的回归分析结果,其中回归方程和系数的检验

2

均为显著,此时 R=0.9911,C(p)=58.5161;接着第 2步是自变量x1和x2进入回归方程后的回归分析结果,回归方程及 x1和x2的系数检验均为显著,但常数项检验不显著。接着第 3步是自变量 x1、x2和x3进入回归方程后的回归分析结果。其中回归方程及所有系数检验均为显著,常数项检验也显著。且 2

R=0.9984提高了, C(p)=5.5226减少了。

图8-3 选择逐步回归法

图8-4 逐步回归第 1、2步、3步及最后结果

在图 8-4右下中指出在 0.05的检验水平下,不能再有其它变量进入模型。比较 R和C(p)的值(图 8-4右),应取包含变量 x1、x2和x3的第三个模型作为较优的模型,对应的回归方程是:

2

y = 3023.27814 + 0.36911x1 + 0.00078157x2 − 2.09048x3

4. 回归诊断

进行回归诊断的步骤如下:

1) 重复上面2中的1),在打开的“ Linear Regression(线性回归) ”对话框中,单击“Plots”

按钮。在打开的“ Linear Regression:Plots”对话框中,选择“ Residual”选项卡,按图 8-5所示选择有关复选框。

2)两次单击“OK”按钮,得到回归诊断结果,在“分析家”窗口的项目管理器中依次双击“Residual Plots”下的“ Plot of STUDET vs PRED”和“ Plot of RESIDUAL vs NQQ”得到标准化后的残差图(图 8-6左)和残差的 QQ图(图 8-6右)。

从标准化后的残差图(图 8-6左)看出,数据点随机地散布在零线附近,表明模型中误差等方差、独立性的假设没有问题。残差的 QQ图(图 8-6右)近似一条直线,可以初步判定残差来自正态分布总体,所建回归模型是有效的。

3)对残差作进一步检验:

在上述操作打开的“Linear Regression(线性回归)”对话框中,单击 “Save Data”按钮。在打开的“ Linear Regression:Save Data”对话框中,选中“Crate and save diagnostics data”复选框,并将列表中的

第二项“ RESIDUAL Residuals”添加到左边方框内,如图 8-7所示。

两次单击“OK”后得到分析结果。

4)在“分析家”窗口的项目管理器中双击“Diagnostics”下的“Diagnostics Table”可以看到在数据集中生成了残差数据,如图 8-8所示。

图8-8 生成残差数据

将“Diagnostics Table”存盘(sy8_1_r)后在“分析家”中打开。

5)选择主菜单“ Statistics(统计)”→“Descriptive(描述性统计) ”→“Distributions…(分布)”,打开“ Distributions”对话框,选择变量列表中的 _RESID,单击“ Analysis”按钮,选定分析变量,如图 8-9左所示。

图8-9 设置选项

6)单击“ Fit(拟合)”按钮,在打开的对话框中选择拟合的分布类型: Normal,使用样本估计量 (Sample estimates),如图 8-9右所示。

7)两次单击“OK”按钮,并在分析家窗口的项目管理器中双击“ Fitted Distributions of sy8_1_r”项,得到对残差 _RESID的正态分布检验结果,如图 8-10所示。

图8-10 残差分布检验结果

三种检验均有p值>0.05,因此不能拒绝残差来自正态总体的假定。 5. 预测

通过回归诊断得知模型:

y =3023.27814 + 0.36911x1 + 0.00078157x2 − 2.09048x3

是合适的,可以用于预测。

1) 假定 02,03年国内生产总值( x1)、商品房屋销售额( x2)、财政支出(x3)的数据已存入

数据集 Mylib.sy8_1_new中,如图所示。

图8-11 数据集 Mylib.sy8_1_new

2) 重复上面逐步回归步骤,并在图 8-1所示的“ Linear Regression(线性回归)”对话框中,单击

“predictions”按钮,打开“ Linear Regression:predictions”对话框。按图 8-12所示进行预测的 Input(输入)、Output(输出)设置。

图8-12 “Linear Regression:predictions”对话框

3) 两次单击“ OK”,得到结果。在分析家的项目管理器中点击“ predictions”可以看到预测结果,如

图 8-13所示。

图8-13 预测结果

二、用 INSIGHT模块作多项式回归

【实验 8-2】某研究人员统计了房地产行业 2003年主营业务收入和净利润的关系,从中随即抽取 20家上市公司,统计后的主营业务收入和净利润如表 8-2(sy8_2.xls)所示。试采用多项式回归方程给出净利润y与主营业务收入x的关系。

1. 生成数据集

将表 8-2在 Excel中修改后导入成 SAS数据集 Mylib.sy8_2,在 INSIGHT中打开后如图 8-14所示。其中变量 n、x、y分别表示股票代码、主营业收入和净利润。

2. 回归分析

为了大致地了解y与x的关系,首先利用INSIGHT作y与x的带有曲线拟合的散点图,具体方法是: 1) 选择菜单“ Analyze(分析)”→“Fit(Y X) (拟合)”打开“ Fit(Y X)”对话框,选择变量如图 8-15

所示。

单击“OK”,得到拟合线性模型:

y =β0+β1 x +ε

主要部分如图 8-16所示。

从图8-16可以发现,虽然模型检验显著,但R2只有0.6494,且常数项未通过检验。为改进模型,移动图 8-16右上第一张表中“ Degree(Polynomial)”栏下的滚动条,可以做高次多项式拟合试验,其中 R-Square、F Stat可以说明拟合的效果。

作二次和三次多项式拟合试验的结果如图 8-17所示。

拟合三次多项式的 R已接近 94%,不需要再高的阶次了。重新回到“Fit(Y X)”对话框,按图 8-18左设置分析变量,可以拟合下面的三次多项式模型:

2

图8-18 设置拟合变量

单击“ Output”按钮,按图 8-18右选择输出结果,两次单击“ OK”后,得到拟合结果,如图 8-19所示。

虽然模型检验通过,但常数项未通过检验,进一步改进模型,再次回到“ Fit(Y X)”对话框,按图 8-18进行有关设置后,取消常数项复选框,如图 8-20所示。

单击“OK”按钮,得到拟合模型

主要部分如图 8-21、8-22所示。

其中模型和系数检验均通过,且 R高达 84.98%,所以该模型为比较理想的模型,最后的回归方程具体形式为:

2

3. 回归诊断

从图 8-22可以看出残差数据随机独立并大致服从均值为零的正态分布。

三、使用 REG过程作回归分析

【实验 8-3】某种水泥在凝固时放出的热量 y(cal/g)与水泥中四种化学成分x1,x2,x3,x4有关,现测得 13组数据,如表 8-3(sy8_3.xls)所示。试从中选出主要的变量,建立 y关于它们的线性回归方程。

1. 建立数据集

输入以下代码建立数据集 sy8_3并显示:

data mylib.sy8_3; input x1 x2 x3 x4 y; cards;

7 26 11 56 11 31 7 52 11 55

6 8 8 6 9 60 78.5 20 104.3 47 87.6 33 95.9 22 109.2 6 102.7

1 29 15 52 74.3

3 71 17

1 31 22 44 72.5 2 54 18 22 93.1 21 47

4 26 115.9

1 40 23 34 83.8 11 66

9 12 113.3

10 68 ;

8

12 109.4

Title '数据集 sy8_3'; Proc print ; run;

运行结果如图8-23所示。

2. 向后逐步剔出法进行回归

执行以下代码:

proc reg data = Mylib.sy8_3; var y x1 - x4;

model y = x1 - x4/selection=backward; plot residual. * predicted.; run;

输出结果如下:

向后逐步剔除法的分析结果给出回归模型:

残差对预测值的散点图显示如下:

3. 结果分析

采用向后逐步剔除法回归的第 0步是做全回归,结果如图 8-24所示,所有系数均未通过检验(P值均大于 0.05),向后逐步剔除法第 1步将变量x3剔除,结果如图 8-25所示,其中 x2和x4的系数仍不能通过检验,接下来第 2步将变量 x4剔除,结果如图 8-26所示,此时的回归方程及x1和x2的系数均能通过检验,残差对预测值的散点图(图 8-28)基本正常符合模型假定,所以方程 Y = 52.57735 + 1.46831x1 + 0.66225x2为有效回归方程。

四、一元非线性回归分析

【实验 8-4】已知数据如表 8-4(sy8_4.xls)所示。试分别采用指数回归、对数回归、幂函数回归和倒幂函数回归 4种非线性回归方法进行回归分析,并选择一个较好的回归方程。

表 8-4 实验数据

1. 生成数据集

运行下面程序生成并显示数据集 sy8_4,如图

8-29所示。

data sy8_4; input x y; cards;

1.1 109.95 1.2 40.45 1.3 20.09 1.4 24.53 1.5 11.02 1.6 7.39 1.7 4.95 1.8 2.72 1.9 1.82 2 1.49 2.1 0.82 2.2 0.3 2.3 0.2 2.4 0.22; run;

title '数据集sy8_4'; proc print; run;

由图可见 x和y有一定的非线性关系,根据散点分布的形状考虑用下面几种非线性回归方法建立非线性回归方程,并从中选出较为合适的回归方程。 2. 对x和y作相关分析 执行如下代码:

/*画 x和 y的散点图 */

goptions ftext='宋体

'; proc gplot data = sy8_4; plot y*x; title 'x和 y的散点图';

symbol v=dot i=none cv=orange ; run;

/*求 x和 y的相关系数 */ proc corr data = sy8_4; var x y; run;

运行上面程序,得到散点图(图 8-30左)以及 x与 y的相关系数(图 8-30右):

由图可见,x和y有一定的非线性关系,根据散点分布的形状考虑用下面几种非线性回归

方法建立非线性回归方程,并从中选出较为合适的回归方程。

首先考虑倒幂函数拟合,执行如下代码:

goptions ftext='宋体'; data new1; set sy8_4; u = 1/x; v = y;

run; /*画 u和 v的散点图 */ title 'u和 v的散点图'; proc gplot data = new1;

plot v*u; 图8-31 u和v的散点图 symbol v=dot i=none cv=red ; run;

运行结果得到散点图 8-31,由图可见,u

和 v有着较弱的线性关系。做线性回归:

proc reg data = new1; var v u; model v = u; print cli; title '残差图'; plot residual. * predicted.; run;

运行结果如图 8-32和图 8-33所示。

倒幂函数回归结果(图 8-32):方差分析表中显示模型的作用是显著的( F统计量的值为

24.95,p值<0.0003<0.05 = α)。参数显著性检验表明,自变量的作用是显著的。回归方程为: v = -78.56560+156.53887u 即:

残差对预测值的散点图 (图 8-33)表明,残差有一定趋势,不符合模型的假定,以上回归方程无效。

4. 幂函数y =ax回归

考虑幂函数拟合,执行如下代码:

data new2; set sy8_4; u = log(x);

v = log(y); run; /*画 u和 v的散点图 */

b

title 'u和 v的散点图';

run; title '残差图';

proc gplot data = new2; plot v*u; symbol v=dot i=none cv=red ;

proc reg data = new2; var v u; model v = u; print cli; plot residual. * predicted.; run;

得到散点图如图 8-34所示:

幂函数回归的结果见图 8-35左:

残差对预测值的散点图 (如图8-35右)表明,残差有微弱趋势,不符合模型的假定,上

面回归方程不佳。

5. 指数函数y =aebx 回归

考虑指数函数拟合,执行如下代码:

data new3; set sy8_4; u = x;

v=log(y);

title 'u和 v的散点图';

run; /*画

u和 v的散点图 */

proc gplot data = new3; plot v*u; symbol v=dot i=none cv=red ; run; title '残差图'; proc reg data = new3; var v u; model v = u; print cli; plot residual. * predicted.;

run;

得到散点图如图 8-36所示:指数函数回归结果见图 8-37左:

图8-36 u与v的散点图

图8-37 指数函数回归结果与残差对预测值的散点图

得回归方程:v = 9.58399 – 4.73895u 即: y =14530.28e−4.73895x

从残差对预测值的散点图 (如图8-37右)可以看出,残差基本符合模型的假定,上面回归方程有效。

6. 对数

y =a +b ln x 回归

考虑对数函数拟合,执行如下代码:

data new4; set sy8_4; u = log(x); v = y;

title 'u和 v的散点图';

run; title '残差图';

proc reg data = new4; var v u; model v = u; print cli; plot residual. * predicted.; run;

run; /*画 u和 v的散点图 */

proc gplot data = new4; plot v*u; symbol v=dot i=none cv=red ;

得到散点图如图 8-38所示。对数函数回归结果见图 8-39左。

图8-38 u与v的散点图

图8-39 对数函数回归结果

得回归方程: v = 64.58847 – 91.11730u即:y = 64.58847 – 91.11730lnx

从残差对预测值的散点图 (如图8-39右)可以看出,残差有二次趋势,不符合模型的假定,上面回归方程无效。

7. 结论

比较上述 4个回归方程,第三种指数函数回归的 Root MSE(均方残差平方根)最小(0.25991)、R-Square(判定系数R2)最大(0.9844),效果最好。

执行下述代码,得到模型y =14530.28e−4.73895x 的拟合图形如图8-40所示。

data new5; set new1;

y1 = 14530.28*exp(-4.73895*x);

run; title '回归图'; run;

proc gplot data = new5; plot y*x=1 y1*x=2/overlay ; symbol v=dot i=none cv=red ; symbol2 i=sm color=blue;

图8-40 指数函数拟合图形

8.4 上机演练

【练习 8-1】某学校20名一年级女大学生体重(公斤)、胸围(厘米)、肩宽(厘米)及肺活量(升)实测值如表8-5(lx8_1.xls)所示。试对影响女大学生肺活量的有关因素作多元回归分析。

表 8-5 20名一年级女大学生肺活量及有关变量测量结果

编号 1 2 3 4 5

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

体重X1/公斤

51.3 48.9 42.8 55.0 45.3 45.3 51.4 53.8 49.0 53.9 48.8 52.6 42.7 52.5 55.1 45.2 51.4 48.7 51.3 45.2

胸围X2/厘米

73.6 83.9 78.3 77.1 81.7 74.8 73.7 79.4 72.6 79.5 83.8 88.4 78.2 88.3 77.2 81.6 78.3 72.5 78.2 74.7

肩宽X3/厘米

36.4 34.0 31.0 31.0 30.0 32.0 36.5 37.0 30.1 37.1 33.9 38.0 30.9 38.1 31.1 30.2 36.5 30.0 36.4 32.1

肺活量Y/升

2.9 3.11 1.91 2.63 2.86 1.91 2.98 3.28 2.52 3.27 3.10 3.28 1.92 3.27 2.64 2.85 3.16 2.51 3.15 1.92

【练习 8-2】在光刻工艺过程中,要求找出国产光致抗蚀剂显影的腐蚀速率与显影时间的关系,实验中观测的数据经整理如表 8-6(lx8_2.xls)所示。

表 8-6 腐蚀速率与显影时间的关系

试分别采用指数回归、对数回归、幂函数回归和倒幂函数回归四种非线性回归方法分别给出回归

方程,并选择一个较为合适的回归方程。

8.5 实验报告

请按练习内容写出包括如下内容的实验报告: 一、实验目的;

二、实验内容及程序与结果分析;

三、实验体会(问题、评价、感想与建议等 )。

范文九:spss多元回归及非线性 投稿:潘勲勳

多元回归

分析→回归→线性,

拟合优度检验

总离差平方和(tss)=回归平方和(ess)+残差平方和(rss);

可决系数的取值范围:[0,1] 。 R2越接近1,说明实际观测点离样本线越近,拟合优度高。由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。

调整的可决系数思路是:将残差平方和与总离差平方和分别除以各自的自由度(df),以剔除变量个数对拟合优度的影响:

(2)方程总体线性的显著性检验(F检验

H0:?1=?2= ? =?k=0

H1:?j不全为0

F?F?(k,n-k-1) 或 F?F?(k,n-k-1)

来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。

(3)变量的显著性检验(t检验)

如果变量X对Y的影响是显著的,那么X前的参数应该显著的不为0

检验步骤:

1)对总体参数提出假设

H0:?1=0,H1:?1?0

若|t|> t ?/2(n-2),则拒绝H0,接受H1;(小概率事件发生)

若|t|? t ?/2(n-2),则接受H0 ;

看指标选模型

: 拟合程度Adjusted R2越接近1拟合程度越好

回归方程的显著性检验F统计量的值,及其

Sig

回归系数表回归系数B和显著性检验Sig

(4)满足基本要求的样本容量

从统计检验的角度:

n?30 时,Z检验才能应用;

n-k?8时, t分布较为稳定

四、预测

一元或多元模型预测的SPSS实现:

特征根和方差比

特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。最大特征根的值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。

解释变量标准化后它的方差为1。如果某个特征根既能够刻画某解释变量方差的较大部分(0.7以上),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量间存在较强的线性相关关系。

4、条件指数

条件指数反映解释变量间多重共线性的指标。当0<=Ki<10时,多重共线性较弱;当10<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。

? 分析→回归→线性→绘制→选正态概率图→继续→确定→查看输出

窗口→数据点围绕基准线还存在一定的规律性。

? 分析→回归→线性→保存,选残差中的标准化→继续→确定→分析→非参数检验→

1样本k-s(1)把standardized residual 放入检验变量列表→确定→查看输出窗口,

范文十:spss-非线性回归分析 投稿:高狪狫

实验三 非线性回归分析(2学时)

一、实验重点

掌握非线性回归分析的方法。

二、实验难点

模型的选择及对SPSS软件的输出结果进行分析和整理。

三、实验举例

例1、对GDP(国内生产总值)的拟合。选取GDP指标为因变量,单位为亿元,

拟合GDP关于时间t的趋势曲线。以1981年为基准年,取值为t=1,1998年t=18,1991-1998年的数据如下:

解:分析过程

(一)画散点图

图3.1:Y与t的散点图

图3.2:LnY与t的散点图

(二)根据画散点图,及经济背景可选用模型 复合函数:

yb0b1t (也称增长模型或半对数模型)

yb0b1t 以作比较。

同时,做简单线性回归

(三)模型求解

直接用SPSS软件的Curve Estimation 命令计算。(也可以用线性化的方法求解,结果基本一致。) 运行结果如下:

(四)结果分析

线性回归方程:

复合函数回归方程:

ˆ133754417.52tyR20.856

ˆ3603.06(1.1924)t ………(*) y

ˆ8.190.176tlnyR20.992

注意:不能直接比较两模型的拟合优度,需要对复合函数模型处理,利用(*)式,得到复合函数的残差,计算该模型的残差平方和RSS=2.1696×108 ,并计算y的离差平方和TSS=1.1×1010 ,得到非线性回归的相关指数

RSS2.169610810.98 R110

TSS1.110

2

由于该相关指数大于线性回归的拟合优度,所以可以判断复合函数模型比线性回归模型要好。

例2 、一位药物学家是用下面的非线性模型对药物反应拟合回归模型

yic0

c0

ui ic1

1()

c2

其中,自变量x为药剂量,用级别表示; 因变量y为药物反应程度,用百分

数表示。三个参数c0 ,c1 ,c2都是非负的, c0 的上限是100%,三个参数的初始值取为c0 =100,c1=5 ,c2=4.8.测得9个数据如下表:

解:

分析过程:

(一)画散点图

从图形上看,y与x确实呈非线性关系! (二)模型求解

用SPSS软件的Nonlinear 命令计算,具体操作如下: (1)建立数据集;

(2)在数据窗口点击:Analyze → Regression → Nonlinear…,出现窗口

在将y点入Dependent 框中,

在Model Expression框中输入表达式:c0-c0/(1+(x/c2)**c1)

(3) 点击Parametere…, 出现下图:

在Name 框中输入: c0

Starting Value框中输入:100

点击add,即可得到参数c0的初始赋值,类似的方法可以得到c1和c2

参数的初始赋值,Continue 。

(三)输出主要结果

(四)结果分析

ˆ99.54 回归模型:y

99.54

x6.76

1()

4.80

2

非线性回归的相关指数R1

RSS20.18803

10.99865 TSS14917.88889

注:在非线性回归中,TSS≠ESS+RSS ,如本例中,RSS=20.18803

TSS=14917.88889 ,ESS=37839.85179

四、实验内容

Logistic 回归函数常用于拟合某种消费品的拥有率,下表是北京市每百户

家庭平均拥有的照相机数,试针对以下两种拟合Logistic回归函数:

1y

1

b0b1tu (1) 已知u=100,用线性化方法拟合; (2) u

五、思考练习

某种商品的流通率y(%)与销售额x之间呈双曲线函数模型:

y0

1

x

u

对9个商店该种商品的销售额与流通率的统计资料如下所示。

字典词典社会主义本质论的特点社会主义本质论的特点【范文精选】社会主义本质论的特点【专家解析】团支书期末工作总结团支书期末工作总结【范文精选】团支书期末工作总结【专家解析】李揆字端卿陇西成纪人李揆字端卿陇西成纪人【范文精选】李揆字端卿陇西成纪人【专家解析】