Skip to content
返回全部主题

Pandas

浏览此主题下的实用教程、参考指南和问题排查内容。

文章33

Pandas Melt:将宽表数据重塑为长表格式(完整指南)

学习如何使用 pandas melt() 将 DataFrame 从宽格式反透视(unpivot)为长格式。涵盖 id_vars、value_vars、多层级 melt,以及真实场景的数据重塑示例。

Pandas 数据透视表:像 Excel 一样汇总并重塑数据(指南)

掌握 pandas pivot_table() 的数据汇总能力。学习聚合函数、多级索引透视、margins 小计/总计、缺失值填充,以及与 groupby、crosstab 的对比。

Pandas reset_index():重置 DataFrame 索引的完整指南

通过实用示例掌握 pandas reset_index():涵盖 drop 参数、level 分层重置、MultiIndex 处理、inplace 操作与索引操作最佳实践。

Pandas DataFrame导出CSV:to_csv()完全指南

学习如何使用to_csv()将Pandas DataFrame导出为CSV文件。掌握分隔符、编码、索引处理、压缩和大文件策略。

Pandas Sort Values:Python中DataFrame排序完全指南

学习如何使用sort_values()和sort_index()在pandas中对DataFrame进行排序。掌握单列、多列和自定义排序的实用示例。

Pandas删除列:如何从DataFrame中删除列

学习Pandas中删除列的所有方法:drop()、del、pop()和列选择。通过示例处理单列、多列和条件删除。

Pandas Apply: 使用自定义函数转换DataFrame

学习如何使用pandas apply()通过自定义函数转换DataFrame和Series。掌握axis、result_type、lambda和向量化替代方案。

Pandas Concat:如何在 Python 中连接 DataFrame

学习如何使用 pandas concat 纵向和横向合并 DataFrame。掌握 pd.concat() 的 axis、ignore_index、keys 和 join 参数。

Pandas Drop Duplicates:如何在Python中删除重复行

学习如何使用 pandas drop_duplicates() 从 DataFrame 中删除重复行。通过实用示例掌握 subset、keep、inplace 参数。

Pandas Merge:Python中合并DataFrame的完整指南

学习如何使用pandas merge在Python中组合DataFrame。通过实用代码示例和最佳实践掌握内连接、外连接、左连接和右连接。

Pandas Read Excel: 如何在Python中导入Excel文件

学习如何使用pandas read_excel将.xlsx和.xls文件导入DataFrame。掌握sheets、dtypes、headers、usecols和大文件处理。

Pandas 过滤行:在 Python 中按条件选择数据

学习如何使用布尔索引、query()、loc[] 和 where() 过滤 pandas DataFrame 的行。掌握使用多个条件的条件选择。

Pandas MultiIndex:分层索引实用指南

使用 set_index、swaplevel、reorder_levels、xs、stack 和 unstack 创建、切片与重塑分层索引。

Pandas 字符串操作:向量化文本清洗

使用 pandas string dtype 和向量化 .str 方法清洗、过滤和规范化文本;在安全处理正则、NA 值和分裂的同时,避免 Python 循环。

Pandas 滚动窗口:Rolling、Expanding 和 EWM

使用 rolling、expanding 和 ewm 计算移动平均、累积统计和指数平滑;控制窗口对齐、min_periods 和基于时间的窗口。

Pandas Data Cleaning:实用工作流(2025)

面向生产的 Pandas 数据清洗流程:处理缺失、类型统一、列名规范、外值应对和质量校验。

Pandas GroupBy:聚合、Transform、Apply 全面指南(2025)

用清晰示例掌握 Pandas GroupBy:聚合、transform、apply、多重聚合,以及排序、dropna 等常见坑位的处理。

Pandas Merge & Join:像 SQL 一样稳妥地做连接

精简指南覆盖 Pandas merge/join:inner/left/right/outer、suffixes、indicator、validate,以及处理重复键或索引键的技巧.

Pandas Pivot vs Melt:正确的重塑方式

学习用 pivot、pivot_table、melt、stack、unstack 重塑数据,包含总计行/列、多级列以及 tidy 数据流程。

Pandas DataFrame 添加列:6种最佳方法(2025 指南)

学习向 Pandas DataFrame 添加新列的最有效方式,包括赋值、insert、assign、concat、条件逻辑等方法,含最佳实践和常见错误提示。

Pandas read_csv() 教程:像专业人士一样导入 CSV 文件

一份完整且最新的 pandas.read_csv() 使用教程,教你如何高效导入 CSV 文件。涵盖参数说明、日期解析、编码问题修复、常见错误以及适用于 pandas 2.0+ 的性能优化技巧。

如何在 Pandas DataFrame 的列中轻松搜索值

学习如何使用布尔索引、query、isin、字符串搜索等方法,在 Pandas DataFrame 的列中查找特定值,高效清晰地提取所需数据。

如何在 Pandas 中创建空 DataFrame

学习多种在 Pandas 中创建空 DataFrame 的方法,包括列名、数据类型以及最佳实践。含更新示例与现代 Pandas 技巧。

如何将 Pandas DataFrame 转换为 List?(2025 指南)

学习在现代 Pandas 中高效地把 DataFrame 转换成列表 —— 包括列表嵌套列表(list of lists)、字典列表(list of dicts)、元组列表(list of tuples),以及用 to_numpy()、tolist()、to_dict() 做列转列表等操作。

如何在 Pandas 中重命名列:简单高效的方法

学习在 Pandas DataFrame 中重命名列的最快、最有效方法。更新至 Pandas 2.x,涵盖最佳实践、示例及保持数据分析整洁有序的技巧。

Modin:加速 Python Pandas

学习如何在 Python 中使用 Modin 加速 Pandas DataFrame —— 这个轻量、易用的库通过并行计算加快 DataFrame 操作。

Pandas 类型标注:高效且易维护代码的最佳实践

一份关于在 Python 中结合 pandas 使用类型标注的完整指南。学习如何在机器学习等场景中使用 type hints、DataFrame 以及 typing 模块来编写高效、易维护的代码。

Pandasql - 使用 SQL 查询 DataFrame 的 Python 包

了解 Pandasql,这是一款强大的 Python 包,可使用 SQL 语法对 Pandas DataFrame 进行查询和操作。通过这篇完整指南学习如何安装、使用并优化 Pandasql 性能。

Python 向量数据库:空间数据与生成式 AI 的最佳数据库与工具

探索在 Python 中用于空间数据存储与检索的向量数据库威力。通过 Jina AI 的 DocArray 解锁生成式 AI 和自然语言处理的新能力。

在 Pandas 中优化 SQL 查询:Pandas 到 SQL 其实很简单!

了解如何在 pandas 中使用 to_sql() 方法高效、安全地将 DataFrame 写入 SQL 数据库。学习最佳实践、技巧与常见坑点,帮助你优化性能。

Pandas 2.0:你必须了解的新特性

通过 Pandas 2.0 升级你的数据处理技能。了解其在机器学习、时间序列数据等方面的最新特性和最佳实践,从今天就开始上手。

Pandas Where:利用 Pandas 的强大功能管理空值

了解 Pandas 中用于处理缺失数据的各种技术和函数,包括 isnull()、dropna() 和 fillna()。

Pandas Fillna