实战演练：多元回归分析在数学建模中的应用

最编程 2024-08-07 22:24:58

...

1.多元线性回归

某品种水稻糙米含镉量y(mg/kg)与地上部生物量x1(10g/盆)及土壤含镉量x2(100mg/kg)的8组观测值如表。试建立多元线性回归模型。

1.1SAS代码

data ex;
input x1-x2 y@@;
cards;
1.7 9.08 4.93 12 1.89 1.86
9.67 3.06 2.33 0.76 10.2 5.78
17.67 0.05 0.06 15.91 0.73 0.43
15.74 1.03 0.87 5.41 6.25 3.86
;
proc reg;
model y=x1 x2;
run;

1.2结果分析

我们可以通过WORD将这些复制做成表格更加美观直接，每个表下面都需要有文字说明：

由方差分析表可知，其F value=386.30,pr>F的值<0.0001，远小于0.05，说明F值落在了拒绝域里面，故拒绝原假设，接受备择假设，认为y1与x1,x2之间具有显著性的线性关系；

由参数估计表可知，x2对应的t值为1.61，Pr>|t|的值=0.1691，大于0.05，说明1.61落在了接受域中，接受x2为0的假设，x2对外没有比较显著的线性贡献。

为此，需要在程序中model y1=x1 x2中去掉x2，再次运行：

对常数检验t值分别为t=37.53、,Pr>|t|的值<0.0001,远小于0.05，说明截距项通过检验，估计值为5.67953。
同理可知x1的系数通过检验，估计值为-0.32103

回归方程：y=-0.32103x1+5.67953

许多实际问题中可能还会出现某几个变量的系数并没有通过检验，此时，可以在原程序中的modely1=x1-x2中去掉没用通过的变量,直到所有的系数均通过检验。或者使用逐步回归方法，让软件自动保留通过检验的变量。

2.多元非线性回归

将非线性回归方程转化为线性回归方程。转化时应首先选择适合的非线性回归形式，并将其线性化。再确定线性化回归方程的系
数，最后确定非线性回归方程中未知的系数或参数。

湖北省油菜投入与产出的统计分析

1.投入指标
（1）土地（S）。土地用播种面积来表示。农作物播种面积是指当年从事农业
（2）劳动（L）。劳动用劳动用工数（成年劳动力一人劳动一天为一个工）来表示。劳动用工中包含着直接和间接生产用工。
（3）资本（K）。资本用物质费用来表示。物质费用包含直接费用和间接费用。主要有种子秧苗费、农家肥费、化肥费、农药费、畜力、固定资产折旧费和管理及其他费用等。

2.产出指标
产出指标用湖北省历年油菜生产的总产量(Y)来表示。

2.1SAS代码

data ex;input y k s l t @@;
x1=log(k);x2=log(s);x3=log(l);y1=log(y);
cards;
70.8972 40076.5884 825.1305 15347.4273 1
83.7506 48008.7690 915.1500 15832.0950 2
70.8627 44593.8425 804.150 13306.8090 3
78.3451 43460.3229 783.2100 13314.5700 4
98.0749 72657.2633 923.8050 14596.1190 5
134.8767 146108.3421 1282.8900 20911.1070 7
147.5315 162433.3500 1244.7000 18670.5000 8
154.7607 166979.6325 1330.5150 18627.2100 9
159.9743 190395.5262 1505.4600 20775.3480 10
198.4942 205914.6645 1738.4100 22599.3300 11
194.7943 189762.7335 1677.0900 20963.6250 12
187.1013 193463.610 1761.9450 21936.2153 14
235.1184 183768.4035 1779.1500 19606.2330 15
;
proc reg;model y1=x1 x2 x3 t ; /*selection=stepwise*/
run;