【pandas怎么用】Pandas 是 Python 中一个非常强大的数据处理和分析库,广泛应用于数据分析、数据清洗、数据可视化等领域。对于初学者来说,掌握 Pandas 的基本操作是进行数据科学工作的第一步。本文将简要总结 Pandas 的常用功能,并通过表格形式展示其核心方法和用途。
一、Pandas 常用功能总结
Pandas 提供了两种主要的数据结构:`Series` 和 `DataFrame`。其中,`DataFrame` 类似于 Excel 表格,是二维的、带标签的数据结构,支持多种数据类型。
以下是 Pandas 中常用的函数和方法及其作用:
功能 | 方法/函数 | 说明 |
创建数据 | `pd.DataFrame()` | 创建一个 DataFrame 对象 |
查看数据 | `df.head()` / `df.tail()` | 查看前几行或后几行数据 |
数据信息 | `df.info()` | 显示数据的基本信息(列名、数据类型、非空值等) |
描述统计 | `df.describe()` | 显示数值型列的统计信息(如均值、标准差、最大最小值等) |
选择数据 | `df['列名']` / `df.loc[]` / `df.iloc[]` | 按列名、标签或位置选择数据 |
添加列 | `df['新列名'] = 值` | 向 DataFrame 添加新列 |
删除列 | `df.drop(columns=['列名'])` | 删除指定列 |
处理缺失值 | `df.isnull().sum()` / `df.fillna()` / `df.dropna()` | 检查、填充或删除缺失值 |
数据排序 | `df.sort_values(by='列名')` | 按某一列对数据进行排序 |
分组聚合 | `df.groupby('列名').agg({'列名': '函数'})` | 按某列分组并进行聚合计算 |
数据合并 | `pd.merge(df1, df2, on='公共列')` | 合并两个 DataFrame |
数据导出 | `df.to_csv('文件名.csv')` | 将数据保存为 CSV 文件 |
二、使用示例
以下是一个简单的 Pandas 使用示例,帮助你快速上手:
```python
import pandas as pd
创建一个 DataFrame
data = {
'姓名': ['张三', '李四', '王五'],
'年龄': [25, 30, 28],
'城市': ['北京', '上海', '广州'
}
df = pd.DataFrame(data)
查看前两行数据
print(df.head(2))
添加一列
df['工资'] = [10000, 12000, 9500
删除一列
df = df.drop(columns=['城市'])
输出结果
print(df)
```
运行结果如下:
```
姓名年龄 工资
0张三2510000
1李四3012000
```
三、总结
Pandas 是 Python 中处理结构化数据的强大工具,掌握其基本操作可以大大提升数据处理效率。本文通过表格形式总结了 Pandas 的常用功能,并提供了简单示例,帮助读者快速理解如何使用 Pandas 进行数据操作。建议在实际项目中多练习,逐步掌握更高级的功能,如时间序列处理、数据透视表等。