高斯过程

在概率论和统计学中，高斯过程（英語：Gaussian process）是观测值出现在一个连续域（例如时间或空间）的随机过程。在高斯过程中，连续输入空间中每个点都是与一个正态分布的随机变量相关联。此外，这些随机变量的每个有限集合都有一个多元正态分布，换句话说他们的任意有限线性组合是一个正态分布。高斯过程的分布是所有那些（無限多个）随机变量的联合分布，正因如此，它是连续域（例如时间或空间）上函数的分布。

高斯過程被認為是一種機器學習算法，是以惰性學習（英语：lazy learning）方式，利用點與點之間同質性的度量作為核函數（英语：Kernel function），以從輸入的訓練數據預測未知點的值。其預測結果不僅包含該點的值，而同時包含不確定性的資料－它的一維高斯分佈（即該點的邊際分佈）。^[1]^[2]

對於某些核函數，可以使用矩陣代數（見克里金法（英语：kriging）條目）來計算預測值。若核函數有代數參數，則通常使用軟體以擬合高斯過程的模型。

由於高斯過程是基於高斯分佈（正態分佈）的概念，故其以卡爾·弗里德里希·高斯為名。可以把高斯過程看成多元正態分佈的無限維廣義延伸。

高斯過程常用於統計建模中，而使用高斯過程的模型可以得到高斯過程的屬性。举例来说，如果把一隨機過程用高斯過程建模，我们可以显示求出各種導出量的分布，这些导出量可以是例如隨機過程在一定範圍次數內的平均值，及使用小範圍採樣次數及採樣值進行平均值預測的誤差。

定義

一統計學分佈定義為{X_t, t∈T}是一个高斯过程，当且仅当对下标集合T的任意有限子集t₁,...,t_k，

$X_{t_{1},\ldots ,t_{k}}=(X_{t_{1}},\ldots ,X_{t_{k}})$

是一个多元正态分布，这等同于说 $(X_{t_{1}},\ldots ,X_{t_{k}})$ 的任一线性组合是一单变量正態分佈。更準確地，取樣函數X_t 的任一線性泛函均會得出正態分佈。可以寫成X ~ GP(m,K)，即隨機函數X 以高斯過程（GP）方式分佈，且其平均數函數為m 及其協方差函數為K。^[3]當輸入向量t為二維或多維時，高斯過程亦可能被稱為高斯自由场（高斯場（英语：Gaussian random field））。^[4]

有些人^[5] 假設隨機變量 X_t 平均為0；其可以在不失一般性的前提下簡化運算，且高斯過程的均方屬性可完全由協方差函數K得出。^[6]

协方差函数

高斯過程的關鍵事實是它們可以完全由它們的二階統計量來定義.^[4]因此，如果高斯過程被假定為具有平均值零, defining 協方差函數完全定義了過程的行為。重要的是，這個函數的非負定性使得它的譜分解使用了 K-L轉換.

可以通過協方差函數定義的基本方面是過程的平穩過程, 各向同性, 光滑函數和週期函數。^[7]^[8]

平穩過程指的是過程的任何兩點x和x'的分離行為。如果過程是靜止的，取決於它們的分離x-x'，而如果非平穩則取決於x和x'的實際位置。例如，一個特例 Ornstein–Uhlenbeck 過程, 一個布朗運動過程，是固定的。

如果過程僅依賴於 $|x-x'|$ ，x和x'之間的歐幾里德距離（不是方向），那麼這個過程被認為是各向同性的。同時存在靜止和各向同性的過程被認為是同質與異質;^[9]在實踐中，這些屬性反映了在給定觀察者位置的過程的行為中的差異（或者更確切地說，缺乏這些差異）。

最終高斯過程翻譯為功能先驗，這些先驗的平滑性可以由協方差函數引起。如果我們預期對於“接近”的輸入點x和x'，其相應的輸出點y和y'也是“接近”，則存在連續性的假設。如果我們希望允許顯著的位移，那麼我們可以選擇一個更粗糙的協方差函數。行為的極端例子是Ornstein-Uhlenbeck協方差函數和前者不可微分和後者無限可微的平方指數。週期性是指在過程的行為中引發週期性模式。形式上，這是通過將輸入x映射到二維向量 $u(x)=(\cos(x),\sin(x))$ 來實現的。

常見的协方差函數

一些常見的协方差函數:^[8]

常值： $K_{\operatorname {C} }(x,x')=C$
線性： $K_{\operatorname {L} }(x,x')=x^{T}x'$
高斯噪聲: $K_{\operatorname {GN} }(x,x')=\sigma ^{2}\delta _{x,x'}$
平方指數: $K_{\operatorname {SE} }(x,x')=\exp {\Big (}-{\frac {\|d\|^{2}}{2\ell ^{2}}}{\Big )}$
Ornstein–Uhlenbeck : $K_{\operatorname {OU} }(x,x')=\exp \left(-{\frac {|d|}{\ell }}\right)$
Matérn: $K_{\operatorname {Matern} }(x,x')={\frac {2^{1-\nu }}{\Gamma (\nu )}}{\Big (}{\frac {{\sqrt {2\nu }}|d|}{\ell }}{\Big )}^{\nu }K_{\nu }{\Big (}{\frac {{\sqrt {2\nu }}|d|}{\ell }}{\Big )}$
定期: $K_{\operatorname {P} }(x,x')=\exp \left(-{\frac {2\sin ^{2}\left({\frac {d}{2}}\right)}{\ell ^{2}}}\right)$
有理二次方: $K_{\operatorname {RQ} }(x,x')=(1+|d|^{2})^{-\alpha },\quad \alpha \geq 0$

註譯

^ Platypus Innovation: A Simple Intro to Gaussian Processes (a great data modelling tool). [2016-11-02]. （原始内容存档于2018-05-01）.
^ Chen, Zexun; Wang, Bo; Gorban, Alexander N. Multivariate Gaussian and Student-t process regression for multi-output prediction. Neural Computing and Applications. 2019-12-31. ISSN 0941-0643. doi:10.1007/s00521-019-04687-8 （英语）.
^ Rasmussen, C. E. Gaussian Processes in Machine Learning. Advanced Lectures on Machine Learning. Lecture Notes in Computer Science 3176. 2004: 63–71. ISBN 978-3-540-23122-6. doi:10.1007/978-3-540-28650-9_4.
^ ^4.0 ^4.1 Bishop, C.M. Pattern Recognition and Machine Learning. Springer. 2006. ISBN 0-387-31073-8.
^ Simon, Barry. Functional Integration and Quantum Physics. Academic Press. 1979.
^ Seeger, Matthias. Gaussian Processes for Machine Learning. International Journal of Neural Systems. 2004, 14 (2): 69–104. doi:10.1142/s0129065704001899.
^ Barber, David. Bayesian Reasoning and Machine Learning. Cambridge University Press. 2012 [2018-06-26]. ISBN 978-0-521-51814-7. （原始内容存档于2020-11-11）.
^ ^8.0 ^8.1 Rasmussen, C.E.; Williams, C.K.I. Gaussian Processes for Machine Learning. MIT Press. 2006 [2018-06-26]. ISBN 0-262-18253-X. （原始内容存档于2021-05-22）.
^ Grimmett, Geoffrey; David Stirzaker. Probability and Random Processes. Oxford University Press. 2001. ISBN 0198572220.

[1] Platypus Innovation: A Simple Intro to Gaussian Processes (a great data modelling tool). [2016-11-02]. （原始内容存档于2018-05-01）.

[2] Chen, Zexun; Wang, Bo; Gorban, Alexander N. Multivariate Gaussian and Student-t process regression for multi-output prediction. Neural Computing and Applications. 2019-12-31. ISSN 0941-0643. doi:10.1007/s00521-019-04687-8 （英语）.

[3] Rasmussen, C. E. Gaussian Processes in Machine Learning. Advanced Lectures on Machine Learning. Lecture Notes in Computer Science 3176. 2004: 63–71. ISBN 978-3-540-23122-6. doi:10.1007/978-3-540-28650-9_4.

[prml-4] 4.0 ^4.1 Bishop, C.M. Pattern Recognition and Machine Learning. Springer. 2006. ISBN 0-387-31073-8.

[5] Simon, Barry. Functional Integration and Quantum Physics. Academic Press. 1979.

[seegerGPML-6] Seeger, Matthias. Gaussian Processes for Machine Learning. International Journal of Neural Systems. 2004, 14 (2): 69–104. doi:10.1142/s0129065704001899.

[brml-7] Barber, David. Bayesian Reasoning and Machine Learning. Cambridge University Press. 2012 [2018-06-26]. ISBN 978-0-521-51814-7. （原始内容存档于2020-11-11）.

[gpml-8] 8.0 ^8.1 Rasmussen, C.E.; Williams, C.K.I. Gaussian Processes for Machine Learning. MIT Press. 2006 [2018-06-26]. ISBN 0-262-18253-X. （原始内容存档于2021-05-22）.

[PRP-9] Grimmett, Geoffrey; David Stirzaker. Probability and Random Processes. Oxford University Press. 2001. ISBN 0198572220.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

查论编概率论：随机过程
离散时间（英语：Discrete-time stochastic process）	伯努利过程分支过程中餐馆过程高尔顿-沃特森过程（英语：Galton–Watson process）独立同分布马尔可夫链莫兰过程（英语：Moran process）隨機漫步循环擦除随机游走（英语：Loop-erased）自避行走
连续时间	贝塞尔过程出生-死亡過程维纳过程/布朗运动布朗桥 Excursion（英语：Brownian excursion）分数布朗运动（英语：Fractional Brownian motion）几何布朗运动 Meander（英语：Brownian meander）柯西过程（英语：Cauchy process） Contact process（英语：Contact process (mathematics)） Cox process（英语：科克斯过程） Diffusion process（英语：Diffusion process） Empirical process（英语：Empirical process）费勒过程（英语：Feller process）弗莱明-维奥过程（英语：Fleming–Viot process）伽马过程（英语：Gamma process）亨特过程（英语：Hunt process） Interacting particle system（英语：Interacting particle system）s 伊藤积分伊藤過程跳跃扩散（英语：Jump diffusion）跳跃过程萊維過程 Local time（英语：Local time (mathematics)）马尔可夫加过程（英语：Markov additive process）麦基恩-弗拉索夫过程（英语：McKean–Vlasov process）奥恩斯坦-乌伦贝克过程泊松过程复合泊松过程（英语：Compound Poisson process）非齐次泊松过程泊松点过程施拉姆-勒夫纳演进半鞅 Sigma-martingale（英语：Sigma-martingale） Stable process（英语：Stable process） Superprocess（英语：Superprocess） Telegraph process（英语：Telegraph process） Variance gamma process（英语：Variance gamma process）维纳过程 Wiener sausage（英语：Wiener sausage）
离散时间与连续时间	分支過程高斯过程隐马尔可夫模型（HMM）馬可夫過程鞅鞅差序列（英语：Martingale difference sequence）局部鞅（英语：Local martingale） Sub- Super-（英语：Super-） Random dynamical system（英语：Random dynamical system） Regenerative process（英语：Regenerative process） Renewal process（英语：Renewal process）白雜訊
场及其它	狄利克雷过程（英语：Dirichlet process）高斯隨機場（英语：Gaussian random field）吉布斯测度（英语：Gibbs measure）霍普菲尔德神经网络易辛模型马尔可夫网络渗流理论皮特曼-约尔过程（英语：Pitman–Yor process）点过程 Cox（英语：Point process#Cox point process）泊松过程玻茨模型随机场随机图
时间序列模型	ARCH模型 ARIMA模型自我迴歸模型 ARMA模型广义ARCH模型移动平均模型
金融模型	布莱克-德尔曼-托伊模型（英语：Black–Derman–Toy model）布莱克-卡拉辛斯基模型（英语：Black–Karasinski model）布莱克-舒尔斯模型陈模型 Constant elasticity of variance (CEV)（英语：Constant elasticity of variance model）科克斯-英格索尔-罗斯模型 (CIR)（英语：Cox–Ingersoll–Ross model） Garman–Kohlhagen（英语：Garman–Kohlhagen model） HJM框架赫斯顿模型（英语：Heston model） Ho–Lee（英语：Ho–Lee model）赫爾-懷特模型 LIBOR市场模型（英语：LIBOR market model） SABR volatility（英语：SABR volatility model）瓦西塞克模型（英语：Vasicek model）
精算學	Bühlmann（英语：Bühlmann model） Cramér–Lundberg（英语：Cramér–Lundberg model） Risk process（英语：Risk process） Sparre–Anderson（英语：Sparre–Anderson model）
等候理論	Bulk（英语：Bulk queue） Fluid（英语：Fluid queue） Generalized queueing network（英语：G-network） M/G/1（英语：M/G/1 queue） M/M/1 M/M/c（英语：M/M/c queue）
性质	右连左极函数 Continuous（英语：Continuous stochastic process） Continuous paths（英语：Sample-continuous process）遍历性 Exchangeable（英语：Exchangeable random variables） Feller-continuous（英语：Feller-continuous process） Gauss–Markov（英语：Gauss–Markov process）马尔可夫性质 Mixing（英语：Mixing (mathematics)） Piecewise deterministic（英语：Piecewise deterministic Markov process）可预测过程循序可测过程 Self-similar（英语：Self-similar process）平稳过程 Time-reversible（英语：Time reversibility）
极限定理	中心极限定理 Donsker's theorem（英语：Donsker's theorem） Doob's martingale convergence theorems（英语：Doob's martingale convergence theorems）遍历理论 Fisher–Tippett–Gnedenko theorem（英语：Fisher–Tippett–Gnedenko theorem） Large deviation principle（英语：Large deviation principle）大數法則重对数律 Maximal ergodic theorem（英语：Maximal ergodic theorem） Sanov's theorem（英语：Sanov's theorem）
不等式	Burkholder–Davis–Gundy（英语：Burkholder–Davis–Gundy inequalities） Doob's martingale（英语：Doob's martingale inequality） Kunita–Watanabe（英语：Kunita–Watanabe inequality）
工具	Cameron–Martin formula（英语：Cameron–Martin formula）随机变量的收敛 Doléans-Dade exponential（英语：Doléans-Dade exponential） Doob decomposition theorem（英语：Doob decomposition theorem） Doob–Meyer decomposition theorem（英语：Doob–Meyer decomposition theorem） Doob's optional stopping theorem（英语：Doob's optional stopping theorem） Dynkin's formula（英语：Dynkin's formula）费曼-卡茨公式右连左极函数 Girsanov theorem（英语：Girsanov theorem） Infinitesimal generator（英语：Infinitesimal generator (stochastic processes)）伊藤积分伊藤引理 Kolmogorov continuity theorem（英语：Kolmogorov continuity theorem） Kolmogorov extension theorem（英语：Kolmogorov extension theorem） Lévy–Prokhorov metric（英语：Lévy–Prokhorov metric） Malliavin calculus（英语：Malliavin calculus） Martingale representation theorem（英语：Martingale representation theorem） Optional stopping theorem（英语：Optional stopping theorem） Prohorov theorem（英语：Prohorov theorem）二次變差 Reflection principle（英语：Reflection principle (Wiener process)） Skorokhod integral（英语：Skorokhod integral） Skorokhod's representation theorem（英语：Skorokhod's representation theorem）右连左极函数 Snell envelope（英语：Snell envelope）隨機微分方程 Tanaka（英语：Tanaka equation）停时隨機积分 Uniform integrability（英语：Uniform integrability） Usual hypotheses（英语：Usual hypotheses）维纳空间 Classical（英语：Classical Wiener space） Abstract 漂移项
相关领域	精算學计量经济学遍历理论极值理论（EVT） Large deviations theory（英语：Large deviations theory）數理金融學数理统计学概率论等候理論 Renewal theory（英语：Renewal theory） Ruin theory（英语：Ruin theory）统计学随机分析时间序列分析机器学习
分类