简介

小提琴图是用来展示多组数据的分布状态以及概率密度。跟箱线图类似,但是可以密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。而python里面的seaborn包可以很方便的画出小提琴图。

参数

《seaborn画小提琴图(violin plot)》

小提琴图各位置对应参数,中间一条就是箱线图数据,25%,50%,75%位置,细线区间为95%置信区间。

seaborn实现画小提琴图

单变量数据

如果只有一个变量的话使用箱线图就好了,但是使用小提琴图当然也是可以的

    import seaborn as sns
    sns.set(color_codes=True)
    sns.set_style("white")
    df = sns.load_dataset('iris')
    sns.violinplot( y=df["sepal_length"] )

《seaborn画小提琴图(violin plot)》

单变量数据多组

当数据有多个组的时候,使用分组来比较

    import seaborn as sns
    sns.set(color_codes=True)
    sns.set_style("white")
    df = sns.load_dataset('iris')
    sns.violinplot( x=df["species"], y=df["sepal_length"] )
    #sns.plt.show()

《seaborn画小提琴图(violin plot)》

多变量比较

小提琴图比较多个变量也是非常方便的,这里使用前4个变量比较。

    import seaborn as sns
    sns.set(color_codes=True)
    sns.set_style("white")
    df = sns.load_dataset('iris')
    sns.violinplot(data=df.iloc[:,0:4])
    #sns.plt.show()

《seaborn画小提琴图(violin plot)》

总结

到此已经把python使用seaborn包话小提琴图(violin plot)都介绍完了,如果想要更详细的文档,请参考https://seaborn.pydata.org/generated/seaborn.violinplot.html