想象一下,你在 Jupyter Notebook 中有一堆数据需要分析和可视化。PyGWalker 就像一个神奇的工具,使这一过程变得非常简单。它将你的数据转化为一种特殊的交互式表格,就像使用 Tableau 一样。你可以直观地探索数据,随意操作,发现模式和洞察,而无需陷入复杂的代码中。PyGWalker 简化了一切,因此你可以快速轻松地分析和理解数据,PyGWalker 由 Kanaries 开发。
官方库:https://github.com/Kanaries/pygwalker
pip安装PyGWalker:
pip3 install pygwalker
要在 Jupyter Notebook 中开始使用 PyGWalker,您需要导入两个基本库:pandas
和 pygwalker
。
import pandas as pd
这一行代码允许你以表格格式处理数据,而 import pygwalker as pyg
则引入了 PyGWalker 库。
导入后,你可以将 PyGWalker 无缝集成到现有的工作流程中。
例如,你可以使用 pandas 加载你的数据。
df = pd.read_csv('my_data.csv')
接着,你可以通过将你的数据框(dataframe)传递为参数,创建一个名为 “gwalker” 的 PyGWalker 实例,例如:
gwalker = pyg.walk(df)
当你执行所提供的命令时,一个新的输出将出现在代码单元格的下方。这个输出将包含一个交互式用户界面。
这个界面提供了多种拖放功能,供你分析和探索数据。它为你提供了一种便捷且交互式的方式与数据互动,使你能够执行诸如数据可视化、关系探索等任务。
借助 PyGWalker,你现在拥有了一个类似于 Tableau 的用户界面,可以用来分析和可视化你的数据。
PyGWalker 提供了更改标记类型的灵活性,使你能够创建不同的图表。例如,你可以通过选择所需的变量并选择线形标记类型,轻松切换到折线图。
你还可以通过创建拼接视图来比较不同的度量。只需将多个度量添加到行或列中,就能轻松地并排分析和比较它们。
你可以根据特定的类别或特征将数据组织成独立的部分。这有助于你分别分析和比较数据的不同子集。
PyGWalker 允许你以表格格式查看数据,并自定义分析类型和语义类型。你可以轻松地以结构化的方式可视化数据,并根据具体需求调整数据的分析和解释方式。
你还可以将数据探索结果保存到本地文件。
PyGWalker 是一个多功能的库,提供了许多功能。探索这个强大的工具可以提升你在数据分析和可视化方面的技能。
欢迎扫码关注: