内容目录
箱线图¶
箱线图概念及介绍¶
箱线图是一种用于显示数据分布情况的统计图表,通过展示数据的中位数、上下四分位数、最大值和最小值来描述数据的整体分布情况,同时可以帮助检测异常值。箱线图通常用于比较不同组数据的分布、观察数据的离散程度和异常值情况。
箱线图的主要用途包括:
- 显示中位数和四分位数: 箱线图能够清晰展示数据的中位数、上下四分位数,帮助了解数据的集中趋势。
- 发现异常值: 箱线图能够直观地显示异常值,有助于识别数据中的离群点。
- 比较不同组数据: 可以通过箱线图比较不同组数据的分布情况,从而观察它们之间的差异。
箱线图函数说明¶
plt.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None, manage_ticks=True, autorange=False, zorder=None, *, data=None)
- x (array or a sequence of arrays): 输入的数据,可以是单个数组或多个数组。
- notch (bool, optional): 是否显示缺口框。
- sym (str, optional): 异常值标记符号。
- vert (bool, optional): 箱线图方向,True表示垂直,False表示水平。
- whis (float or (float, float), optional): 箱线图须端点与四分位距倍数关系。
- positions (array-like, optional): 箱线图位置。
- widths (array-like, optional): 箱线图宽度。
详细使用说明:https://matplotlib.org/3.8.4/api/_as_gen/matplotlib.pyplot.boxplot.html#matplotlib.pyplot.boxplot
箱线图示例代码¶
In [4]:
import matplotlib.pyplot as plt
import numpy as np
# 假设有两只股票的历史收盘价数据
stock1_prices = [100, 105, 110, 115, 120, 125, 130, 135, 140, 145]
stock2_prices = [90, 95, 100, 105, 110, 115, 120, 125, 130, 135]
# 设置中文显示字体
plt.rcParams['font.sans-serif'] = ['PingFang HK']
plt.figure(figsize=(15,8))
# 绘制箱线图
plt.boxplot([stock1_prices, stock2_prices], labels=['股票1', '股票2'])
# 添加标题和标签
plt.title('两只股票历史收盘价箱线图')
plt.xlabel('股票')
plt.ylabel('收盘价(美元)')
plt.show()
增加显示平均值showmean和meanline参数¶
In [8]:
# 假设有两只股票的历史收盘价数据
stock1_prices = [100, 105, 110, 115, 120, 125, 130, 135, 140, 145]
stock2_prices = [90, 95, 100, 105, 110, 115, 120, 125, 130, 135]
# 设置中文显示字体
plt.rcParams['font.sans-serif'] = ['PingFang HK']
plt.figure(figsize=(15,8))
# 绘制箱线图
plt.boxplot([stock1_prices, stock2_prices], labels=['股票1', '股票2'], showmeans=True, meanline=True)
# 添加标题和标签
plt.title('两只股票历史收盘价箱线图')
plt.xlabel('股票')
plt.ylabel('收盘价(美元)')
plt.show()
In [ ]: