欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

矩阵范式和矩阵衍生物

最编程 2024-04-23 15:56:40
...

今天发现两篇宝藏文章,关于矩阵范数和矩阵求导的,转载收藏一下。感谢大佬们的分享!{抱拳}
矩阵范数 转载自:https://blog.****.net/sylar49/article/details/77510160

今天看了半天强化学习,看得很不开心。。。因为一直处于懵圈状态。。。
于是乎不想看了,稍微总结一下矩阵范数的求解来放松一下身心吧~

这里总结的矩阵范数主要是F范数、1范数、2范数、核范数以及全变分TV范数与1、2的搭配

1、F范数

概念:

XF=i=1mj=1nxij2

矩阵各个元素平方和开根,概念上非常像向量的L2范数
导数:求导的方法则是将其展开来,一般情况下我们不会直接求原始的范数||A||F,因为很麻烦,即使是在损失函数中也是用F范数的平方项来简化运算,而常见的损失函数一般是
12||YX||F2
,此时对X求导,则需要将内部的Y-X展开来
YXTYX=YTY+2XTY+XTX,所以对 12||YX||F2中X求导即为 XY

2、1范数

概念:║A║1 = max{ ∑|ai1|, ∑|ai2| ,…… ,∑|ain| } (列和范数,A每一列元素绝对值之和的最大值) (其中∑|ai1|第一列元素绝对值的和∑|ai1|=|a11|+|a21|+…+|an1|,其余类似);
矩阵的1范数和向量的1范数雷同,不能直接求解,只能分情况讨论
求导:常规的L1范数的求导是在损失函数中作为正则项出现,即12||YX||F2+λ1||X||1,这里前半部分求导是XY,后半部分则需要分情况讨论,最终结果为为

[Sλ(Y)]i={yiλifyi>λ0ifλyiλyi+λifyi<λ

3、2范数

概念:||A||2指的是A最大的奇异值或者半正定矩阵A*A最大特征值开根
求导:对于问题