如何在 seaborn 中创建三角相关热图?
在本教程中,我们将学习在 seaborn 中创建三角形相关热图;顾名思义,相关性是一种度量,用于显示变量的相关程度。相关热图是一种表示数值变量之间关系的图。这些图用于了解哪些变量彼此相关以及它们之间的关系强度。而热图是使用不同颜色的数据的二维图形表示。
Seaborn是一个用于数据可视化的Python库。它在制作静态图时很有用。它建立在matplotlib之上,并与Pandas数据结构紧密集成。它提供了几个图来表示数据。在熊猫的帮助下,我们可以创造有吸引力的情节。在本教程中,我们将说明三个创建三角形热图的示例。最后,我们将学习如何使用 Seaborn 库来创建令人惊叹的信息丰富的热图。
语法
这是创建三角形相关热图的语法。
sns.heatmap(df.corr(),annot=True,fmt=".2f,mask=np.triu(np.ones_like(df.corr(),dtype=bool)))
在此语法中,我们使用 sns.heatmap() 创建了一个热图。然后我们使用'df.corr()'传入数据帧'df'的相关矩阵。我们还设置了“annot=True”以在热图上显示相关值,“fmt=”.2f“”将值格式化为小数点后2位,并将“mask=np.triu(np.ones_like(df.corr(),dtype=bool)”设置为遮盖热图的上三角形部分。这使得热图呈三角形,仅显示表示唯一相关性的下三角形部分。
例 1
下面是一个我们使用“提示”作为数据集的示例。它包含有关给餐厅服务员的小费的信息。它包括诸如账单总额、派对规模和小费金额等变量。接下来,我们使用Seaborn的“load_dataset()”函数加载了Tips数据集,并在数据集上使用“corr()”方法创建了一个相关矩阵。然后,我们使用Seaborn的“heatmap()”函数创建了一个三角相关热图。最后,我们设置属性并将地图的颜色设置为“spring”,并使用“plt.show()”函数绘制它。生成的热图显示账单总额、小费和大小变量之间的相关性。
import seaborn as sns import numpy as np from matplotlib import pyplot as plt import seaborn as sns tips = sns.load_dataset("tips") corr = tips.corr() mask = np.zeros_like(corr, dtype=np.bool_) mask[np.triu_indices_from(mask)] = True sns.heatmap(corr, mask=mask, cmap='spring', annot=True) plt.show()
输出
例 2
在这个例子中,我们使用的是“泰坦尼克号”数据集,这是一个用于机器学习和统计的数据集,其中包含有关泰坦尼克号上乘客的信息,包括他们的年龄、性别、票舱以及他们是否幸存下来。首先,我们使用Seaborn的“load_dataset()”函数加载泰坦尼克号数据集,并在数据集上使用“corr()”方法创建了一个相关矩阵。然后,我们使用Seaborn的“heatmap()”函数创建一个三角形相关热图并设置其属性。最后,我们使用 Matplotlib 的 'show()' 函数来显示它。生成的热图显示变量年龄、票价和等级之间的相关性。
import seaborn as sns import numpy as np from matplotlib import pyplot as plt import seaborn as sns titanic = sns.load_dataset("titanic") corr = titanic.corr() mask = np.zeros_like(corr, dtype=np.bool_) mask[np.triu_indices_from(mask)] = True sns.heatmap(corr, mask=mask, cmap='copper', annot=True) plt.show()
输出
例 3
在此示例中,我们使用鸢尾花数据集,这是机器学习和统计中使用的另一个经典数据集。它包含三种鸢尾花的萼片长度、萼片宽度、花瓣长度和花瓣宽度的测量值:Setosa、Versicolor 和 Virginia。首先,我们使用“Seaborn's load_dataset()”函数加载Iris数据集,并在数据集上使用“corr()”方法创建了一个相关矩阵。然后,我们使用Seaborn的“heatmap()”函数创建了一个三角相关热图,并使用Matplotlib的“show()”函数显示它。生成的热图显示了变量萼片长度、萼片宽度、花瓣长度和花瓣宽度之间的相关性。
import seaborn as sns import numpy as np from matplotlib import pyplot as plt import seaborn as sns # Load the Iris dataset iris = sns.load_dataset("iris") # Create a correlation matrix corr = iris.corr() # Create a heatmap using Seaborn mask = np.zeros_like(corr, dtype=np.bool_) mask[np.triu_indices_from(mask)] = True sns.heatmap(corr, mask=mask, cmap='coolwarm', annot=True) plt.show()
输出
我们了解到Seaborn是Python中一个强大的数据可视化库,它提供了各种功能来创建不同类型的可视化,包括热图,这是可视化数据集中变量之间相关性的有用方法,尤其是在变量数量很大的情况下。此外,Seaborn的“热图()”函数允许我们自定义调色板,并分别使用cmap和annot参数在热图上显示相关系数。它还提供了几个用于练习数据可视化的内置数据集,例如 Iris 数据集、泰坦尼克号数据集和 Tips 数据集。使用Seaborn创建热图对于必须探索和理解大型数据集中的相关性的数据科学家和分析师非常有用。借助这些热图,数据科学家和分析师可以深入了解他们的数据,并根据他们的发现做出明智的决策。
本站发布的内容若侵犯到您的权益,请邮件联系站长删除,我们将及时处理!
从您进入本站开始,已表示您已同意接受本站【免责声明】中的一切条款!
本站大部分下载资源收集于网络,不保证其完整性以及安全性,请下载后自行研究。
本站资源仅供学习和交流使用,版权归原作者所有,请勿商业运营、违法使用和传播!请在下载后24小时之内自觉删除。
若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,使用者自行承担,概与本站无关。