请先阅读前置文章Python库类简介与实践:提升开发效率的利器
2. 数据读取与处理:Pandas可以轻松地读取和处理各种数据源,如CSV文件、Excel文件、数据库等,方便进行数据清洗、转换和整理。
2.1. 数据读取:
python
import pandas as pd
df = pd.read_csv('data.csv')
python
df = pd.read_excel('data.xlsx')
python
import pandas as pd
import sqlite3
conn = sqlite3.connect('database.db')
query = "SELECT * FROM table"
df = pd.read_sql(query, conn)
2.2. 数据预览和基本信息:
python
df.head() # 默认显示前5行数据
df.head(10) # 显示前10行数据
python
df.tail() # 默认显示最后5行数据
df.tail(10) # 显示最后10行数据
python
df.info() # 显示数据的列名、非空计数和数据类型等信息
df.describe() # 显示数据的基本统计信息,如平均值、标准差等
2.3. 数据选择和过滤:
python
df['column_name'] # 选择单个列
df[['column1', 'column2']] # 选择多个列
python
df.loc[row_index] # 通过行标签选择单个行
df.loc[start_index:end_index] # 选择连续的多个行
df.iloc[row_index] # 通过行索引选择单个行
df.iloc[start_index:end_index] # 选择连续的多个行
python
df[df['column'] > value] # 过滤满足条件的行
2.4. 数据清洗和转换:
python
df.dropna() # 删除包含缺失值的行
df.fillna(value) # 用指定值填充缺失值
python
df.drop_duplicates() # 删除重复的行
python
df.sort_values('column') # 按列的值进行升序排序
df.sort_values('column', ascending=False) # 按列的值进行降序排序
python
df['new_column'] = df['column'].apply(function) # 对列的值应用指定函数
df['new_column'] = df['column'].map(mapping) # 根据映射关系转换列的值
2.5. 数据分组和聚合:
python
grouped = df.groupby('column') # 按列进行分组
python
grouped.mean() # 计算每个组的平均值
grouped.sum() # 计算每个组的总和
grouped.max() # 计算每个组的最大值
以上就是Pandas库的基础用法,如有其他疑问欢迎评论留言!
结语:
Python的库类为开发者提供了丰富的功能和工具,可以大大提升开发效率。本文介绍了几个常用的Python库类,并通过实例演示了它们的用法和应用场景。希望通过这些示例,读者能够更好地理解和运用这些库来解决实际问题。除了介绍的库外,Python还有许多其他强大的库,读者可以继续深入学习和探索,提升自己的编程能力。祝愿读者在使用Python库类的过程中取得更多的成果!
原创不易,如果觉得文章对你有帮助,欢迎点赞、评论。文章有疏漏之处,欢迎批评指正。
欢迎转载,转载请注明原文链接:https://blog.beibeiling.com/66618105/33.html