算法_欧拉公式
1. 引子
看傅立叶变换的时候,一直奇怪,幂指数是怎么映射成三角函数的?学习了一下欧拉公式,果然很神奇,用到了自然常数e,圆周率π,虚数i,三角函数sin/cos,指数,还有泰勒展开.不是算法有多难,只是涉及基础太多,经常被卡住,总结如下.
2. 泰勒展开
泰勒展开是用多项式逼近原函数,这么做是因为像sin(x)这样的函数,如果代入x=4很难算出结果,但是将x的值代入形如f(x)=a0+a1x+a2x2+a3x3…的多项式就很容易计算。具体是用原函数的导数实现的,把函数展开成多项式,公式如下:
其中Rn(x)是余项
3. 自然常数e
e是自然常数(欧拉数),它是一个约等于2.718的无理数,定义是
它的含义可以通过复利来理解,假设你有1块钱,年利息是1块钱(100%),一年后可拿到两块钱(1+1/1)1=2;按利滚利计算,如果半年付一次利息(1+1/2)2=2.25;一个月付一次息,(1+1/12)12=2.61;每天付一次息,(1+1/365)365=2.715,当x驱于无穷时e约为2.718.
4. 自然指数e^x的泰勒级数展开
把ex在x=0处展开,由于e0=1且ex的导数还是ex,展开后得到
上图是e^x,以及展开式前5项和前10项拟合的图像
5. 复数
复数是形如a+b*i的数,其中a,b是实数,i^2=-1.(对应直角坐标系)
在复变函数(复数作为自变量和因变量的函数)中,变量z可以写成z=r (cosθ+ isinθ) .r是z的模,即r = |z|; θ是z的辐角,复数记作点Z(a,b)或向量OZ(对应极坐标系)
把乘一次i看成相对0点逆时针转90度,乘两次,转180度,转成实轴的-1,转三次是-i,转四次又回到单位1。因此可以把其虚部看成定义如何旋转。
6. 把虚数i代入e^x的展开式
虚数i是-1开方,因此有i^1=i, i2=-1,i3=-i,i^4=1
此时可以看到其结果分为实部和虚部两部分
7. 把sin(x)做泰勒级数展开
在x=0处展开,由于sin(0)=0,cos(0)=1,sin’(x)=cos(x),cos’(x)=-sin(x)
8. 把cos(x)做泰勒级数展开
在x=0处展开
9. 欧拉公式
由以上几步,可以看到e^ix的实部和虚部正好对应sin(x)和cos(x)的展开,据此,得到欧拉公式:
欧拉公式将指数函数的定义域扩大到了复数域,建立了三角函数和指数函数的关系,被誉为“数学中的天桥”。
下图中,将上式右侧表示为二维坐标中的点,xy轴分别表示其实部虚部,θ为转角(即上式中的x),转动半径为单位1(模不变).它的几何意义就是随着虚部x的增加不断转圈.
可以把 e^(ix) 看作通过单位圆的圆周运动来描述单位圆上的点,e^(ix)表示在单位圆上转动了x弧度(即某个角度时)得到的向量,以此类推,e^(πi)在单位圆上转了半圈。显然得到的是实轴上的-1,然后与1合并可抵消得到0 ,由此得到 :
10. 扩展成时间的函数
上图中又加入了t,把e(ix)想成e(iwt),t是时间,w是系数。把平面上的转圈扩展成了空间中的转圈,纵轴表示时间t,两个横轴分别为实部(cos(t))和虚部(sin(t)),蓝线经过的点是eix,即,把时域上的eix分别投射到了实轴cos(t)和虚轴sin(t),它们都是时间t的函数.图中可看到正余和余弦的投射(红/绿),如果用python做3D图,拖动旋转角度效果更直观.这就傅立叶变换原理:将时域值拆分映射到频域,通过三角函数的叠加表示。
上一篇: 1.5.数制的扩展和复数的引入
下一篇: 如何求出复数的模数
推荐阅读
-
2021 年开放欧拉峰会亮点
-
操作优化学习 06:拉格朗日松弛算法(I)
-
NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法-完美信息蒸馏(PTIE) 在斗地主游戏中,非完美信息的引入主要是由于三位玩家均不能看到别人的手牌,对于任意一位玩家而言,仅可知道其余两位玩家当前手牌的并集,而难于精准判断每位玩家当前手牌。完美信息蒸馏的思路是针对这种非完美问题,构建一个第三方角色,该角色可以看到三位玩家的手牌,该角色在不告知每位玩家完美信息的情况下通过信息蒸馏的方式引导玩家打出当前情况下合理的出牌。 以强化学习常用的 Actor-Critic 算法为例,PTIE 在 Actor-Critic 算法的应用中可以利用 Critic 的 Value 输出作为蒸馏手段来提升 Actor 的表现。具体而言即在训练中 Critic 的输入为完美信息(包含所有玩家的手牌信息),Actor 的输入为非完美信息(仅包含自己手牌信息),此种情况下 Critic 给予的 Value 值包含了完美信息,可以更好地帮助 Actor 学习到更好的策略。 从更新公式上来看,正常的 Actor-Critic 算法 Actor 更新的方式如下: 在 PTIE 模式下,对于每个非完美信息状态 h,我们可以在 Critic 中构建对应的完美信息状态 D(h),并用 Critic 的输出来更新 Actor 的策略梯度,从而达到完美信息蒸馏的效果。 PTIE 框架的整体结构如下图所示: 无论是训练还是执行过程中智能体都不会直接使用完美信息,在训练中通过蒸馏将完美信息用于提升策略,从而帮助智能体达到一个更高的强度。 PTIE 的另一种蒸馏方式是将完美信息奖励引入到奖励值函数的训练中,PerfectDou 提出了基于阵营设计的完美信息奖励 node reward,以引导智能体学习到斗地主游戏中的合作策略,其定义如下: 如上所示,完美信息部分 代表 t 时刻地主手牌最少几步可以出完,在斗地主游戏中可以近似理解为是距游戏获胜的距离, 代表 t 时刻地主阵营和农民阵营距游戏获胜的距离之差, 为调节系数。通过此种奖励设计,在训练时既可以一定程度地引入各玩家的手牌信息(出完的步数需要知道具体手牌才能计算),同时也鼓励农民以阵营的角度做出决策,提升农民的合作性。 特征构建: PerfectDou 针对牌类游戏的特点主要构建了两部分特征:牌局状态特征和动作特征。其中牌局状态特征主要包括当前玩家手牌牌型特征、当前玩家打出的卡牌牌型特征、玩家角色、玩家手牌数目等常用特征,动作特征主要用于刻画当前状态下玩家的所有可能出牌,包括了每种出牌动作的牌型特征、动作的卡牌数目、是否为最大动作等特征。 牌型特征为 12 * 15 的矩阵,如下图所示: 该矩阵前 4 行代表对应每种卡牌的张数,5-12 行代表该种卡牌的种类和对应位置。 网络结构和动作空间设计 针对斗地主游戏出牌组合数较多的问题,PerfectDou 基于 RLCard 的工作上对动作空间进行了简化,对占比最大的两个出牌牌型:飞机带翅膀和四带二进行了动作压缩,将整体动作空间由 27472 种缩减到 621 种。 PerfectDou 策略网络结构如下图所示: 策略网络结构同样分为两部分:状态特征部分和动作特征部分。 在状态特征部分,LSTM 网络用于提取玩家的历史行为特征,当前牌局状态特征和提取后的行为特征会再通过多层的 MLP 网络输出当前的状态信息 embedding。 在动作特征部分,每个可行动作同样会经过多层 MLP 网络进行编码,编码后的动作特征会与其对应的状态信息 embedding 经过一层 MLP 网络计算两者间的相似度,并经由 softmax 函数输出对应的动作概率。 实验结果
-
基于拉格朗日分布算法的电动汽车充放电调度 MATLAB 程序 - 程序介绍
-
C 语言基础(三角形面积、阶乘算法、sqrt、pow 函数、海伦公式、get、getchar、scanf 之间的区别、字符转换、增长率计算、分支和循环结构编程)
-
高斯混合模型和 EM 算法聚类 - 公式
-
编辑迪克斯特拉算法
-
置换公式和置换算法[通俗易懂]
-
组合数递推计算法 c 语言,组合数公式中的递推公式
-
PnP 算法解析(超详细公式推导)