使用这些 Python 工具可视化地探索数据
创始人
2024-03-02 15:27:42
0

结合 Python、Pygwalker、Pandas 和 Jupyter Notebook,为你的数据提供一个动态的可视化界面。

开源工具在推动技术进步和使其更加普及方面发挥了重要作用。数据分析也不例外。随着数据变得越来越丰富和复杂,数据科学家 始终在寻找简化工作流程并创建交互式和吸引人的可视化的方式。PyGWalker 就是为解决此类问题而设计的。

PyGWalker(Graphic Walker 的 Python 绑定)将 Python Jupyter Notebook 的工作环境连接到 Graphic Walker,以创建开源数据可视化工具。你可以通过简单的拖放操作将 Pandas 数据帧 转化为精美的数据可视化。

开始使用 PyGWalker

使用 pip 安装 PyGWalker:

$ python3 -m pip install pygwalker

导入 pygwalkerpandas 以在项目中使用它:

import pandas as pd
import pygwalker as pyg

将数据加载到 Pandas 数据报中并调用 PyGWalker:

df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)

你现在有一个图形用户界面来探索和可视化你的 Pandas 数据帧!

使用 Graphic Walker 探索数据

Graphic Walker 的主要功能之一是能够更改标记类型以创建不同类型的图表。例如,通过将标记类型更改为折线来创建折线图。

Line charts generated by Pygwalker

你还可以通过创建 concat 视图来比较不同的度量,该视图将多个度量添加到行和列中。

将维度放入行或列中,以创建一个 facet 视图,这个视图包含多个子视图,这些子视图由一个维度中的值分隔开。

在 数据 Data 选项卡中,你可以在表格中查看数据帧并配置分析和语义类型。

Table data in Graphic Walker.

使用 PyGWalker 进行数据探索

你可以使用 PyGWalker 将 Pandas 数据转换为高度可定制的图形图表。你也可以使用 PyGWalker 作为探索数据的强大工具,以发现潜在的模式、趋势和洞察力。

数据探索选项可以在“ 探索模式 Exploration Mode ”选项(工具栏中)中找到。它们可以设置为点模式刷模式

  • 点模式:通过将你的鼠标光标指向数据的一个特定部分来探索数据。
  • 刷模式:通过在数据范围周围画一个选择框来探索数据,然后拖动选择框来查看生成的报告。

试试看你的数据

你可以在这些云演示中试用 PyGWalker:Google ColabBinderGraphic Walker Online Demo

PyGWalker 是一个用于简化数据分析和可视化工作流程的优秀工具,特别是对于那些想要使用 Pandas 进行界面可视化的人。借助 PyGWalker 和 Graphic Walker,数据科学家可以在 Jupyter Notebook 中通过简单的拖放操作轻松创建令人惊叹的可视化效果。请查看 PyGWalker Git 仓库获取源代码。

对于寻求自动化数据探索和高级增强分析的开源解决方案的数据科学家,该项目还适用于 RATH,这是一种开源自动 EDA、人工智能支持的数据探索和可视化工具。你还可以查看 RATH Git 仓库 获取源代码和活跃的社区。

(题图:MJ/21c21716-b900-4466-98a9-51268960c9b8)


via: https://opensource.com/article/23/4/data-visualization-pygwalker-jupyter-notebook

作者:Bill Wang 选题:lkxed 译者:geekpi 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

大数据可视化技术教与学(大...
1 课程的性质和教学目的 2 课程教学内容 第一章数据可视化概述...
2025-12-17 08:46:16
【Python】如何使用P...
如何使用Pandas进行数据可视化?1. 如何创建简...
2025-05-29 08:27:25
bi数据可视化
随着人工智能和大数据技术的不断发展,数据可视化已经成为了数据科学家...
2024-12-19 06:02:47
AutodeskForge...
要在使用Autodesk Forge数据可视化组件时使用SVF2模...
2024-11-12 10:31:11
Autodesk数据可视化...
此错误通常是由于试图更改只读变量(如“t”)而导致的。解决此问题的...
2024-09-23 00:01:57
Autodesk数据可视化...
可能是由于缺少开启深度测试导致的。可以尝试在渲染 Sprite 前...
2024-09-23 00:01:27

热门资讯

2020 年的 GitHub ... 距离 2020 年结束只剩下区区 24 天,我们即将结束魔幻的 2020 ,迎来新的一年,新的一年或...
开源新闻速递:openSUSE... 今日关注openSUSE 项目组的 Dominique Leuenberger 在他的周报中说:“这...
KDE4.11 Beta1 正...   KDE 项目工作组刚刚发布了 KDE Software Compilation 4.11 Bet...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
使用时间序列数据,用开源工具助... InfluxData 是一个开源的时间序列数据库平台。下面介绍了它是如何被用于边缘应用案例的。收集到...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
Textual:为 Pytho... 快速入门使用 TextualPython 在 Linux 上有像 TkInter 这样的优秀 GUI...
硬核观察 #1245 Open... #1 OpenAI 悄然删除禁止将 ChatGPT 用于 “军事和战争” 的禁令在 1 月 10 日...