在大二的概率论课上,张老师讲到特征函数时只是匆匆证明了一些定理,并没有告诉我们为什么教材上要如此定义特征函数——必须承认,初见时,只觉得特征函数长得也太奇怪且丑陋了,一个实随机变量怎么还能牵扯到复数呢?
事实上,用特征函数可以很简单地证明特定条件下的强大数律与 Peason
本文用
傅里叶级数
由于本文的主旨是“用卷积定理直观地解释特征函数”,因此在正文开始以前有必要先直观地解释一下傅里叶级数与傅里叶变换。傅里叶级数的条件参考前文所述的另一篇文章。
傅里叶级数(Fourier Series)是指:
注:可以将
傅里叶级数通过
在泛函分析中,更为广义的傅里叶系数被定义在内积空间上。若
展开/收起希尔伯特空间中的规范正交系理论
综上所述,在数学分析/高等数学中提到到傅里叶级数,其不过是广义傅里叶系数在
通常将傅里叶系数的集合称为频域、将傅里叶级数值的集合称为时域,这样的说法源自于数字信号处理。频域与时域都在反应(广义)傅里叶级数的性质,对于同一组基而言是等价的。
在这里有一个绝佳的傅里叶级数可视化动画,完美阐述了频域与时域的关系,来源 Wikipedia:
傅里叶变换
傅里叶变换(Fourier Transform)是在傅里叶级数展开式的周期趋向于无穷大时的推广(极限形式),通过这样的操作将傅里叶级数推广到应用于非周期函数情形。
我们知道某些无穷级数是可以直接写为黎曼和从而等价为黎曼积分的,所以可以不严谨地认为傅里叶变换就是傅里叶级数的连续版本。
傅里叶积分定理:若函数
- 在任一有限区间上均满足 Dirichlet 条件;
- 在
上绝对可积,
则
一般的傅里叶变换定义式通过复指数(欧拉公式
接下来的目标是把式子推广到
注意到
即,傅里叶变换是指下式:
傅里叶级数适用于周期函数(周期信号),而傅里叶变换可以处理非周期函数(非周期信号)。
直观上解释:
- 傅里叶系数:傅里叶级数将所有周期信号均分解为不同频率的各次谐波分量,是其频谱函数,也是周期信号时域的一种表达方式;其系数则对应频域;
- 傅里叶变换:是非周期信号可以看作不同频率的余弦分量叠加,其中频率分量可以是从
到无穷大的任意频率;傅里叶变换本身就是频域的一个表达,表达了观测值的周期性。时域为随时间观测值 。
另一常用的式子为拉普拉斯变换,定义如下:
- 拉普拉斯变换:
- 拉普拉斯逆变换:
拉普拉斯变换在傅里叶变换基础上添加了衰减因子;拉普拉斯变换不是本文重点,不再多言。
本部分参考文章:傅里叶变换(及离散傅里叶变换、快速傅里叶变换)
从随机变量的和出发
理解了傅里叶变换后,从分析学回到概率论,首先思考这样一个问题:已知相互独立随机变量
显然答案并不是
先考虑计算随机变量
联想到此,考虑到积分运算不便,如果能将
卷积定理与傅里叶变换
幸运的是,利用傅里叶变换与卷积定理(Convolution Theorem),这一点是可以实现的。
时域卷积定理:若记函数
频域卷积定理:
以上两个卷积定理对拉普拉斯变换、Z变换、Mellin变换等各种基于傅里叶变换的方法均成立;证明略去。
基于此,可以进一步得到:
特征函数方便了我们计算和表示随机变量和的
此外,众所周知的是多元正态分布的线性组合仍服从多元正态分布,且相互独立的正态分布的乘积与卷积,结果依然服从正态分布——更进一步的,标准正态分布
值得注意的是,这并不是正态分布
特征函数与矩
这一部分内容只是直观表象,不是严谨的证明。
我们知道,如果我们有一个随机变量的所有矩,那么就能得到这个随机变量的全部信息,换句话说我们可以唯一地确定这个随机变量:一阶原点矩代表均值,二阶中心矩代表方差,三阶矩代表偏度,四阶矩代表峰度……
根据特征函数的唯一性定理,特征函数也能唯一确定一个随机变量,自然地也应该能唯一确定各阶矩。事实上这是显而易见的,利用泰勒公式(麦克劳林级数)与期望的性质即可:
最后简要给出逆转公式:
值得一提的是,所有的随机变量都有特征函数(矩母函数则不一定有)。根据逆转公式能够看出,特征函数是一种傅里叶逆变换的推广,因为对没有概率密度函数的随机变量来说,特征函数依然存在且唯一。
关于特征函数更多的性质,可以参考知乎上的一篇文章:3.3 特征函数(1)——定义与逆转公式;
若需要相应分布的特征函数,建议 Google 查找 Wiki 的文档,即使是一些不常见的分布相关信息也有给出,包括特征函数。