小提琴圖
小提琴圖是一種用於比較機率分布的統計圖形。它與箱形圖類似,但在兩側多了翻轉的核密度估計圖。[1]
歷史
[编辑]小提琴圖由 Jerry L. Hintze 和 Ray D. Nelson 於1997年提出,作為比箱形圖提供更多資訊的一種方法,而箱形圖由John Tukey於1977年發明。[2] 名稱來源於圖形的形狀類似於小提琴。[2]
介紹
[编辑]小提琴圖與箱形圖相似,不同的是它還顯示了不同值下數據的機率密度函數,通常透過核密度估計平滑顯示。小提琴圖包含所有箱形圖的資訊,例如數據的中位數標記;表示四分位距的框或標記;如果樣本數不多,還可能包含所有樣本點。
雖然箱形圖顯示的是平均數或中位數及四分位範圍等統計摘要,但小提琴圖顯示的是數據的完整分布。小提琴圖可用於具有多峰分布的數據(即具有多個峰值)。在這種情況下,小提琴圖顯示不同峰值的存在、位置及相對幅度。
與箱形圖一樣,小提琴圖用來比較不同類別變量的分布(或樣本分布),例如比較白天和夜晚的溫度分布,或者比較不同汽車製造商之間的汽車價格分布。
小提琴圖可以具有多層結構。例如,外層形狀代表所有可能的結果。下一層內的圖形可能代表95%發生的值,接下來的內層可能代表50%發生的值。
小提琴圖不如箱形圖流行。對於不熟悉小提琴圖的讀者來說,理解可能會比較困難。在這種情況下,可以使用更容易理解的替代方法,如繪製一系列堆疊的直方圖或核密度估計圖。
小提琴圖的原始含義是箱形圖和雙側核密度圖的結合。[1] 然而,現在「小提琴圖」有時被理解為僅包含雙側核密度圖,而不包含箱形圖或其他元素。[3][4]
相關條目
[编辑]參考文獻
[编辑]- ^ 1.0 1.1 Violin Plot. NIST DataPlot. National Institute of Standards and Technology. 2015-10-13.
- ^ 2.0 2.1 Hintze, Jerry L.; Nelson, Ray D. Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician. May 1998, 52 (2): 181–184. ISSN 0003-1305. doi:10.1080/00031305.1998.10480559 (英语).
- ^ Wilke, Claus O. Fundamentals of Data Visualization.
- ^ Violin plot — geom_violin. ggplot2.tidyverse.org. [2023-11-19] (英语).
外部連結
[编辑]- Vioplot add-in for Stata
- 使用寬格式數據集繪製小提琴圖 使用基於matplotlib的統計可視化庫 seaborn
本条目引用的公有领域材料来自國家標準技術研究所的文档《Dataplot reference manual: Violin plot》。