线性代数 --- 反转矩阵的 4 种方法
线性代数 --- 矩阵求逆的4种方法
写在最前面:在大多数情况下,我们学习线性代数的目的是为了求解线性方程组Ax=b,而不是为了求A的逆。
单就解方程而言,LU分解是最实用的算法。只需按照A=LU——>Ax=b,LUx=b——>Ly=b(正向回代求得y),Ux=y(反向回代,最终求得x)的步骤求解即可。根本就不应该去求逆,而且求逆本身就有比较大的精度损失。
因此,单就解方程而言,求逆可以说是下下策。可是,时至今日,我跟很多同事聊起来(下至三流专科,上至985,211,不论是本科学历,还是硕士博士),他们对于解方程的第一反应还是求逆,好像在CN不求逆就没法解方程了一样。这种,在畸形edu模式下的错误思维,真的是害人不浅。而且,不仅如此,如果大家都认为解方程就应该求逆,结果就你一个人觉得求逆的“大错特错”,则他们就会群起而攻之,其势然也。。。(此四字,出自《三国演义》,郭嘉死后,曹操观沧海处)。
感兴趣的朋友可以看看这篇文章:
別再算逆矩陣了 | 線代啟示錄https://ccjou.wordpress.com/2014/06/19/%E5%88%A5%E5%86%8D%E7%AE%97%E9%80%86%E7%9F%A9%E9%99%A3%E4%BA%86/
1,待定系数法
2,高斯消元法
已知矩阵A和对应维度的单位矩阵I,先写出增广矩阵A|I,然后对A进行高斯消元,在对A消元的同时,单位矩阵I也在变,直到把A消成单位矩阵,A旁边的单位矩阵也会随之变成A的逆矩阵。
Matlab的计算结果:
3,用LU分解求矩阵的逆
跟我们平时用LU分解的结果来解方程不同的是,以往,我们面对的是Ax=b(x和b都是和A同维度的列向量),当我们已经求得了A的LU分解以后,我们会按照先求Ly=b,得到y,再求Ux=y的步骤,得到最终的x。如果,我们使用的是PA=LU的分解,则是先求Ly=Pb,再求Ux=y。而这里,我们面对的是AX=I(X和I都是和A同维度的矩阵,且X就是A-1)。因此,我这里的做法是把单位矩阵中的每一列,都看成是Ax=b中的一个b,同时,也把“未知矩阵”A-1中的每一列看成是Ax=b中的x。
实际上,我的这个做法也是符合矩阵与矩阵的乘法的意义的,例如AB=C,则,C中的每一列,实际上都是B中的对应列,对A中所有列的线性组合的结果。B的对应列中的每一个元素就是线性组合的权重。
MATLAB的计算结果:
4,伴随矩阵+代数余子式
上面的四个矩阵求逆例子,大多是针对2x2矩阵而言的,下面补充一些3x3矩阵上应用。
补充1,伴随矩阵法在3x3矩阵上的应用:
MATLAB的计算结果:
补充2,伴随矩阵法:
MATLAB的计算结果:
补充3,其他网站关于伴随矩阵法的说明:
相关文章,怎么判断一个矩阵是否可逆?:
线性代数 --- 如何判断矩阵是否可逆(奇异与非奇异)?_松下J27的博客-****博客如何判断矩阵是否可逆?如何判断一个矩阵是否可逆?一个可逆的矩阵有那些性质?https://blog.****.net/daduzimama/article/details/120510778
(全文完)
作者 --- 松下J27
本文于2022年5月26日晚,对LU分解的笔记部分增加了文字补充。
本文于2022年11月08日,增加了MATLAB的计算结果,便于大家参考。大家也可以在matlab中用他的自带求逆函数inv()对自己的计算结果加以验证。
本文于2022年11月28日,增加了拓展阅读的链接。
本文于2023年4月10号,利用上班的空暇时间,对本文开始处的第4种求逆的方法代数余子式的插图进行了更换。
修改了文中的一个错误,2023/05/18。
人生格言:
忠于自己的内心,比不负众望更重要!
参考文献(鸣谢):
用余子式、代数余子式和伴随来求逆矩阵https://www.shuxuele.com/algebra/matrix-inverse-minors-cofactors-adjugate.html
(配图与本文无关)
版权声明:文中的部分图片,文字或者其他素材,可能来自很多不同的网站和说明,在此没法一一列出,如有侵权,请告知,立即删除。欢迎大家转载,但是,如果有人引用或者COPY我的文章,必须在你的文章中注明你所使用的图片或者文字来自于我的文章,否则,侵权必究。 ----松下J27
推荐阅读
-
在 CentOS 7 上安装 Node.js 的 4 种方法(yum 安装和源代码安装)
-
在 LINUX 中查看进程的 4 种方法(摘要)
-
在 Windows 11 上查找或查看 WiFi 密码的 4 种方法
-
通过 Mac 电脑操作教程完美卸载 Mac 应用程序的 4 种方法
-
在 JavaScript 中创建枚举的 4 种方法
-
NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法-完美信息蒸馏(PTIE) 在斗地主游戏中,非完美信息的引入主要是由于三位玩家均不能看到别人的手牌,对于任意一位玩家而言,仅可知道其余两位玩家当前手牌的并集,而难于精准判断每位玩家当前手牌。完美信息蒸馏的思路是针对这种非完美问题,构建一个第三方角色,该角色可以看到三位玩家的手牌,该角色在不告知每位玩家完美信息的情况下通过信息蒸馏的方式引导玩家打出当前情况下合理的出牌。 以强化学习常用的 Actor-Critic 算法为例,PTIE 在 Actor-Critic 算法的应用中可以利用 Critic 的 Value 输出作为蒸馏手段来提升 Actor 的表现。具体而言即在训练中 Critic 的输入为完美信息(包含所有玩家的手牌信息),Actor 的输入为非完美信息(仅包含自己手牌信息),此种情况下 Critic 给予的 Value 值包含了完美信息,可以更好地帮助 Actor 学习到更好的策略。 从更新公式上来看,正常的 Actor-Critic 算法 Actor 更新的方式如下: 在 PTIE 模式下,对于每个非完美信息状态 h,我们可以在 Critic 中构建对应的完美信息状态 D(h),并用 Critic 的输出来更新 Actor 的策略梯度,从而达到完美信息蒸馏的效果。 PTIE 框架的整体结构如下图所示: 无论是训练还是执行过程中智能体都不会直接使用完美信息,在训练中通过蒸馏将完美信息用于提升策略,从而帮助智能体达到一个更高的强度。 PTIE 的另一种蒸馏方式是将完美信息奖励引入到奖励值函数的训练中,PerfectDou 提出了基于阵营设计的完美信息奖励 node reward,以引导智能体学习到斗地主游戏中的合作策略,其定义如下: 如上所示,完美信息部分 代表 t 时刻地主手牌最少几步可以出完,在斗地主游戏中可以近似理解为是距游戏获胜的距离, 代表 t 时刻地主阵营和农民阵营距游戏获胜的距离之差, 为调节系数。通过此种奖励设计,在训练时既可以一定程度地引入各玩家的手牌信息(出完的步数需要知道具体手牌才能计算),同时也鼓励农民以阵营的角度做出决策,提升农民的合作性。 特征构建: PerfectDou 针对牌类游戏的特点主要构建了两部分特征:牌局状态特征和动作特征。其中牌局状态特征主要包括当前玩家手牌牌型特征、当前玩家打出的卡牌牌型特征、玩家角色、玩家手牌数目等常用特征,动作特征主要用于刻画当前状态下玩家的所有可能出牌,包括了每种出牌动作的牌型特征、动作的卡牌数目、是否为最大动作等特征。 牌型特征为 12 * 15 的矩阵,如下图所示: 该矩阵前 4 行代表对应每种卡牌的张数,5-12 行代表该种卡牌的种类和对应位置。 网络结构和动作空间设计 针对斗地主游戏出牌组合数较多的问题,PerfectDou 基于 RLCard 的工作上对动作空间进行了简化,对占比最大的两个出牌牌型:飞机带翅膀和四带二进行了动作压缩,将整体动作空间由 27472 种缩减到 621 种。 PerfectDou 策略网络结构如下图所示: 策略网络结构同样分为两部分:状态特征部分和动作特征部分。 在状态特征部分,LSTM 网络用于提取玩家的历史行为特征,当前牌局状态特征和提取后的行为特征会再通过多层的 MLP 网络输出当前的状态信息 embedding。 在动作特征部分,每个可行动作同样会经过多层 MLP 网络进行编码,编码后的动作特征会与其对应的状态信息 embedding 经过一层 MLP 网络计算两者间的相似度,并经由 softmax 函数输出对应的动作概率。 实验结果
-
如何卸载电脑上的软件?彻底卸载软件,4种方法分享 - 第一步:打开第三方卸载软件,找到软件卸载功能。 第二步:找到需要卸载的软件,点击勾选,然后点击立即卸载完成卸载。 好了,以上就是笔者分享的关于如何在电脑上卸载软件的全部内容啦。本文我一共分享了4种卸载软件的方法,小伙伴们可以尝试不同的卸载方法,彻底卸载电脑上的软件哦! 往期回顾
-
实现矩阵键盘扫描的两种方法(带程序)
-
4*4 矩阵键盘的工作原理
-
详细解释梳理F4汇总序列编制的矩阵键盘 (I)