跳至內容

英文维基 | 中文维基 | 日文维基 | 草榴社区

加伯轉換

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

加伯轉換窗函數高斯函數短時距傅立葉變換

數學定義

[編輯]

短時距傅立葉轉換中的窗函數代入高斯函數,即可得下面的標準定義:

以下是幾種常見的替代定義:

  • 註:在文獻上可能會看到不同形式的加伯轉換,但本質上都是一樣的。

由於實作時,不能計算無限大的積分式子,所以根據高斯函數會從兩側遞減的性質,我們可以將上式進一步化簡:

為何選擇高斯函數作為窗函數

[編輯]
  1. 其他窗函數短時距傅立葉變換,如利用方型窗函數的短時距傅立葉變換,無法同時兼顧時間軸和頻率軸的解像度;一者解像度提升,另一者解像度必定下降。但高斯函數由海森堡測不準原理可得知,是最能同時讓兩軸兼顧解像度的窗函數(將於下面章節詳述)。
  2. 高斯函數傅立葉轉換的特徵函數:

因此經過轉換後其性質不變。因此可讓加伯轉換後在時間軸和頻率軸的性質相互對稱。

由測不準原理了解高斯函數的性質

[編輯]

上述提到,高斯函數是最能兼顧時間與頻率解像度的窗函數。我們利用這個章節來詳細討論。

對於一個信號 ,當,若,則
其中
由於兩者標準差相乘有下限,這個定理說明了我們沒有辦法同時精準量測時間和頻率,其中一者標準差下降(解像度上升),另一者標準差就上升(解像度下降)。
加伯轉換後的結果,橫軸是時間(秒),縱軸是頻率(赫茲)
套用以上函式求得變異數(其中由於高斯函數為偶對稱函數,所以其)
藉由微積分公式可得:
即高斯函數滿足測不準定理的最下限,所以是所有窗函數中能使時間和頻率兩者解像度都達到最高的函數。
  • 變形的高斯函數同樣會滿足測不準原理的下限,如以下例子:
  1. :對概率分佈做位移,標準差不會改變。
  2. :分子與分母同乘A,可消掉。因此標準差不會改變。
  3. :在時域乘上相當於在頻域對頻率做位移,標準差一樣不會改變。
  4. :在時域做縮放,頻域會做相反的縮放,因此標準差也不會改變。
  • 以下提供一個簡單的例子來做模擬,
右圖為即加伯轉換的結果,可以看出其時間和頻率都維持相當程度的解像度。

高斯窗函數與方形窗函數比較

[編輯]

以下提供一個簡單的範例來比較加伯轉換以及利用方形窗函數的短時傅立葉轉換:

方形窗函數短時傅立葉轉換(橫軸:時間, 縱軸:頻率)
加伯轉換(橫軸:時間, 縱軸:頻率)

從圖中可以發現方形窗函數的短時傅立葉轉換會有能量擴散的情形,而加伯轉換則是清晰的時頻圖。

加伯轉換的縮放

[編輯]
由於高斯窗函數的寬度可以由一常數做調整,因此我們將這個參數加入加伯轉換的數學式子中,讓轉換更加彈性,如下式:
而根據前面章節所述。實作時,不能計算無限大的積分式子,所以根據高斯函數會從兩側遞減的性質,我們可以將上式進一步化簡:
  • 根據傅立葉轉換的縮放公式,假設,則傅立葉轉換後為,使其能根據需求而調整時域解像度或頻域解像度
  • 改變高斯函數的寬度,和改變方形窗函數短時距傅立葉變換的效果類似。若選取較大的,時域的高斯窗函數較窄,則時域有較高的解像度,而頻域的高斯窗函數較寬,所以頻域的解像度會下降(通常用於需要時域解像度較高的應用,例如:音樂訊號);反之,若選取較小的,時域的高斯窗函數較寬,則時域的解像度下降,而頻域的高斯窗函數較窄,所以頻域的解像度會上升(通常運用在需要頻域解像度較高的應用,例如:氣候)。雖然還是有兩軸之間的解像度的犧牲,但比起其他無法滿足測不準原理下限的窗函數,加伯轉換的兩軸還是能相對維持較高的解像度。
  • 若應用於瞬時頻率改變較劇烈的應用,則可考慮使用窗寬度隨時間而變動的加伯轉換數學式子,如下
當瞬時頻率變動非常快時,使用較大的值,使其時域解像度能較高;當瞬時頻率變動很慢時,使用較小的值,使其頻域解像度能較高。

實現方法及注意事項

[編輯]

Direct Implementation

[編輯]

  • Discrete Form:

可將式子改寫為離散形式:


, therefore,only when is nonzero 可改寫為:

按照此式即可實現

限制

[編輯]
  • 避免贋頻效應(aliasing effect)

(1)

時間複雜度

[編輯]

O(TFQ) T:時間取樣點數 F:頻率取樣點數 Q:

優缺點

[編輯]
優點:簡單實現,限制條件少
缺點:時間複雜度高

FFT-Based Method(快速傅立葉轉換)

[編輯]

由Direct Implementation可得下式


且離散傅立葉轉換標準式 可將式子整理為:

按照此式將以fft()算出帶入即可實現

其中 ,,

  • Matlab及python 皆可呼叫fft函式完成
  • 演算法

假設

step 1:計算
step 2:
step 3:決定
step 4:
step 5:轉換
step 6:設 and return to Step 3 until

限制

[編輯]
  • 避免贋頻效應(aliasing effect)
(1)(基本上任何實現方法都要避免贋頻效應)
(2)
(3)

時間複雜度

[編輯]

優缺點

[編輯]
優點:時間複雜度低
缺點:限制條件較直接實現法多

Chirp Z Transform

[編輯]

可改寫為: 由Direct Implementation可得下式


可將式子改寫為:

按此式即可實現
  • 演算法
Step1:
Step2:
Step3:

限制

[編輯]
  • 避免贋頻效應(aliasing effect)

(1)

時間複雜度

[編輯]

優缺點

[編輯]
優點:限制條件與Direct Implementation法一樣基本上沒有限制
缺點:時間複雜度與FFT-Based Method(快速傅立葉轉換)一樣
  • 但由於加伯轉換無法使用Recursive Method(遞迴法)所以此不能算是缺點

特性

[編輯]

加伯轉換的大部分的特性和方形窗函數短時距傅立葉轉換的特性都相似,有些特性甚至更加接近傅立葉轉換的特性。

  • 積分特性
(還原成原始信號)
  • 位移特性
,則
  • 調變特性
,則
  • 線性特性
若有一信號分別為做加伯轉換的結果,則
  • 功率衰減特性
,則
  • 能量積分特性
  • 能量總和特性
  • 特殊信號
1. 當
2. 當
和方形窗函數短時距傅立葉轉換不同的是,加伯轉換的結果對於時間和頻率軸較對稱,也比較沒有旁波(sidelobe);也印證了上述所說的,加伯轉換較能維持兩個軸的解像度。

優缺點

[編輯]

Gabor Transform 的優點

[編輯]
  • 最佳時間-頻率局部化特性
    • Gabor Transform 使用高斯窗函數,與其他常見窗函數(如Rectangle、Triangle、Hanning、Hamming)相比,滿足測不準定理的最小下限(Minimum Uncertainty Principle)。這意味着,高斯函數能夠在時間域和頻率域中同時提供最佳的解像度,避免信號特徵的模糊或失真。
      • 高時間解像度:能捕捉信號的快速變化,對於瞬態信號(如語音中的短促音位或振動信號中的瞬時變化)尤為重要。
      • 高頻率解像度:能精確分辨信號中的穩態頻率成分,特別適合於分析連續且平穩的周期信號。
  • 算法穩健且實現簡單
    • Gabor Transform 基於傅里葉變換的數學理論,其結構清晰且實現相對簡單。現代數值計算技術(如快速傅里葉變換,FFT)的發展進一步提升了 Gabor Transform 的計算效率,使其能夠在高效實現的同時保持穩健性。
    • 穩健性:由於其依賴於成熟的數學基礎,在實施中容易檢測和修正潛在錯誤。
    • 實現便利性:現有的數學工具庫(如 MATLAB、Python 的 Scipy、Octave)提供了高度封裝的 Gabor Transform 函數,大幅降低了實現門檻,讓開發者能更專注於應用場景設計,而非底層算法調試。
  • 廣泛的應用場景
    1. 語音識別:利用 Gabor Transform 提取時頻特徵,提升語音識別準確性,尤其在噪聲環境中。
    2. 圖像處理
      • 紋理分析:有效捕捉圖像的方向與頻率特徵,用於紋理分類和圖像分割。
      • 邊緣檢測:適用於醫學圖像和場景理解,改善邊緣檢測效果。
    3. 機械振動信號分析
      • 故障檢測:檢測機械設備(如齒輪、軸承)異常頻率,應用於設備維護。
      • 非平穩信號分析:用於旋轉機械的健康監測。

Gabor Transform 的缺點

[編輯]
  • 計算複雜度較高
    • Gabor Transform在高維數據(如圖像信號處理)中,計算複雜度可能顯著增大,特別是在多頻段或多方向分析時。每個窗函數的計算都需要執行一次傅立葉變換,這對於大數據或實時應用場景來說,可能成為性能瓶頸。
      1. 計算複雜度的挑戰
        • 在圖像處理中,Gabor Transform通常需要對圖像的不同尺度和方向應用一組 Gabor 濾波器,以提取豐富的特徵資訊。這意味着需要對每個尺度和方向分別進行濾波操作,導致計算量隨着濾波器數量的增加而線性增長。此外,對於高解像度圖像,每次濾波操作都涉及大量像素的計算,進一步增加了計算負擔。
      2. 多頻段和多方向分析的負擔
        • 為了捕捉圖像中不同方向和頻率成分的特徵,通常需要使用多個 Gabor 濾波器組,涵蓋各種頻率和方向。這種多頻段和多方向的分析策略雖然能夠提供豐富的特徵表示,但也導致了計算資源的高需求。特別是在實時應用中,如視頻處理或即時圖像分析,這種高計算量可能導致延遲,影響系統的即時性和效率。
  • 解像度折衷的不可避免性
    • 根據測不準定理,Gabor Transform 的時間和頻率解像度達到了理論的最佳折衷,但這也意味着:
      • 受測不凖定理約束,當需要同時對信號的快速變化與細微頻率差異進行精確分析時,時間和頻率的解像度會有可能不足以同時滿足所有需求。
      • 相較於 Gabor Transform, Wigner Distribution Function(WDF)等方法,因是對訊號的自相關函數做傅立葉轉換,可以超越測不準原理約束的下限,因此能提供更高的時頻解像度,尤其是對於結構複雜的信號。然而,WDF 的非線性特性容易引入交叉干擾項(cross-terms),而為了為了結合兩者的優點,Gabor Wigner Transform應運而生

參見

[編輯]

參考書目、資料來源

[編輯]
  1. Jian-Jiun Ding, Time frequency analysis and wavelet transform class notes, the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2024.
  2. Alan V. Oppenheim, Ronald W. Schafer, John R. Buck : Discrete-Time Signal Processing, Prentice Hall, ISBN 0-13-754920-2
  3. S. Qian and D. Chen, Joint Time-Frequency Analysis: Methods and Applications, Chap. 5, Prentice Hall, N.J., 1996.
  4. Jian-Jiun Ding, Time frequency analysis and wavelet transform class notes, the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2020.
  5. S.C.Pei and S.G.Huang, STFT with adaptive window width based on the chirp rate. IEEE Transactions on Signal Processing, vol. 60,issue 8,pp. 4065-4080,2012.