使用这些 Python 工具可视化地探索数据
创始人
2024-03-02 15:27:42
0

结合 Python、Pygwalker、Pandas 和 Jupyter Notebook,为你的数据提供一个动态的可视化界面。

开源工具在推动技术进步和使其更加普及方面发挥了重要作用。数据分析也不例外。随着数据变得越来越丰富和复杂,数据科学家 始终在寻找简化工作流程并创建交互式和吸引人的可视化的方式。PyGWalker 就是为解决此类问题而设计的。

PyGWalker(Graphic Walker 的 Python 绑定)将 Python Jupyter Notebook 的工作环境连接到 Graphic Walker,以创建开源数据可视化工具。你可以通过简单的拖放操作将 Pandas 数据帧 转化为精美的数据可视化。

开始使用 PyGWalker

使用 pip 安装 PyGWalker:

$ python3 -m pip install pygwalker

导入 pygwalkerpandas 以在项目中使用它:

import pandas as pd
import pygwalker as pyg

将数据加载到 Pandas 数据报中并调用 PyGWalker:

df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)

你现在有一个图形用户界面来探索和可视化你的 Pandas 数据帧!

使用 Graphic Walker 探索数据

Graphic Walker 的主要功能之一是能够更改标记类型以创建不同类型的图表。例如,通过将标记类型更改为折线来创建折线图。

Line charts generated by Pygwalker

你还可以通过创建 concat 视图来比较不同的度量,该视图将多个度量添加到行和列中。

将维度放入行或列中,以创建一个 facet 视图,这个视图包含多个子视图,这些子视图由一个维度中的值分隔开。

在 数据 Data 选项卡中,你可以在表格中查看数据帧并配置分析和语义类型。

Table data in Graphic Walker.

使用 PyGWalker 进行数据探索

你可以使用 PyGWalker 将 Pandas 数据转换为高度可定制的图形图表。你也可以使用 PyGWalker 作为探索数据的强大工具,以发现潜在的模式、趋势和洞察力。

数据探索选项可以在“ 探索模式 Exploration Mode ”选项(工具栏中)中找到。它们可以设置为点模式刷模式

  • 点模式:通过将你的鼠标光标指向数据的一个特定部分来探索数据。
  • 刷模式:通过在数据范围周围画一个选择框来探索数据,然后拖动选择框来查看生成的报告。

试试看你的数据

你可以在这些云演示中试用 PyGWalker:Google ColabBinderGraphic Walker Online Demo

PyGWalker 是一个用于简化数据分析和可视化工作流程的优秀工具,特别是对于那些想要使用 Pandas 进行界面可视化的人。借助 PyGWalker 和 Graphic Walker,数据科学家可以在 Jupyter Notebook 中通过简单的拖放操作轻松创建令人惊叹的可视化效果。请查看 PyGWalker Git 仓库获取源代码。

对于寻求自动化数据探索和高级增强分析的开源解决方案的数据科学家,该项目还适用于 RATH,这是一种开源自动 EDA、人工智能支持的数据探索和可视化工具。你还可以查看 RATH Git 仓库 获取源代码和活跃的社区。

(题图:MJ/21c21716-b900-4466-98a9-51268960c9b8)


via: https://opensource.com/article/23/4/data-visualization-pygwalker-jupyter-notebook

作者:Bill Wang 选题:lkxed 译者:geekpi 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

【Python】如何使用P...
如何使用Pandas进行数据可视化?1. 如何创建简...
2025-05-29 08:27:25
bi数据可视化
随着人工智能和大数据技术的不断发展,数据可视化已经成为了数据科学家...
2024-12-19 06:02:47
AutodeskForge...
要在使用Autodesk Forge数据可视化组件时使用SVF2模...
2024-11-12 10:31:11
Autodesk数据可视化...
此错误通常是由于试图更改只读变量(如“t”)而导致的。解决此问题的...
2024-09-23 00:01:57
Autodesk数据可视化...
可能是由于缺少开启深度测试导致的。可以尝试在渲染 Sprite 前...
2024-09-23 00:01:27
API在d3.js中的数据...
可以使用d3.js处理和可视化API数据。以下是一个代码示例://...
2024-09-08 18:01:48

热门资讯

Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
通过 SaltStack 管理... 我在搜索Puppet的替代品时,偶然间碰到了Salt。我喜欢puppet,但是我又爱上Salt了:)...
Epic 游戏商店现在可在 S... 现在可以在 Steam Deck 上运行 Epic 游戏商店了,几乎无懈可击! 但是,它是非官方的。...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
2024 开年,LLUG 和你... Hi,Linuxer,2024 新年伊始,不知道你是否已经准备好迎接新的一年~ 2024 年,Lin...
什么是 KDE Connect... 什么是 KDE Connect?它的主要特性是什么?它应该如何安装?本文提供了基本的使用指南。科技日...
Opera 浏览器内置的 VP... 昨天我们报道过 Opera 浏览器内置了 VPN 服务,用户打开它可以防止他们的在线活动被窥视。不过...