logo

Python库类简介与实践:提升开发效率的利器2

Python库类简介与实践:提升开发效率的利器2

请先阅读前置文章Python库类简介与实践:提升开发效率的利器

 

2. 数据读取与处理:Pandas可以轻松地读取和处理各种数据源,如CSV文件、Excel文件、数据库等,方便进行数据清洗、转换和整理。

 

2.1. 数据读取:

  • 从CSV文件中读取数据:
python
     import pandas as pd
     
     df = pd.read_csv('data.csv')
     

 

  • 从Excel文件中读取数据:
python
     df = pd.read_excel('data.xlsx')
     

 

  • 从数据库中读取数据:
python
     import pandas as pd
     import sqlite3
     
     conn = sqlite3.connect('database.db')
     query = "SELECT * FROM table"
     df = pd.read_sql(query, conn)
     

 

2.2. 数据预览和基本信息:

  • 查看数据的前几行:
python
     df.head()  # 默认显示前5行数据
     df.head(10)  # 显示前10行数据

 

  • 查看数据的后几行:
python
     df.tail()  # 默认显示最后5行数据
     df.tail(10)  # 显示最后10行数据
     

 

  • 查看数据的基本信息:
python
     df.info()  # 显示数据的列名、非空计数和数据类型等信息
     df.describe()  # 显示数据的基本统计信息,如平均值、标准差等
     

 

2.3. 数据选择和过滤:

  • 选择列:
python
     df['column_name']  # 选择单个列
     df[['column1', 'column2']]  # 选择多个列

 

  • 选择行:
python
     df.loc[row_index]  # 通过行标签选择单个行
     df.loc[start_index:end_index]  # 选择连续的多个行
     df.iloc[row_index]  # 通过行索引选择单个行
     df.iloc[start_index:end_index]  # 选择连续的多个行
     

 

  • 根据条件过滤数据:
python
     df[df['column'] > value]  # 过滤满足条件的行
     

 

2.4. 数据清洗和转换:

  • 处理缺失值:
python
     df.dropna()  # 删除包含缺失值的行
     df.fillna(value)  # 用指定值填充缺失值
     

 

  • 去重:
python
     df.drop_duplicates()  # 删除重复的行
     

 

  • 数据排序:
python
     df.sort_values('column')  # 按列的值进行升序排序
     df.sort_values('column', ascending=False)  # 按列的值进行降序排序
     

 

  • 数据转换:
python
     df['new_column'] = df['column'].apply(function)  # 对列的值应用指定函数
     df['new_column'] = df['column'].map(mapping)  # 根据映射关系转换列的值
     

 

2.5. 数据分组和聚合:

  • 按列对数据进行分组:
python
     grouped = df.groupby('column')  # 按列进行分组
     

 

  • 对分组后的数据进行聚合操作:
python
     grouped.mean()  # 计算每个组的平均值
     grouped.sum()  # 计算每个组的总和
     grouped.max()  # 计算每个组的最大值
     

 

以上就是Pandas库的基础用法,如有其他疑问欢迎评论留言!

结语:

Python的库类为开发者提供了丰富的功能和工具,可以大大提升开发效率。本文介绍了几个常用的Python库类,并通过实例演示了它们的用法和应用场景。希望通过这些示例,读者能够更好地理解和运用这些库来解决实际问题。除了介绍的库外,Python还有许多其他强大的库,读者可以继续深入学习和探索,提升自己的编程能力。祝愿读者在使用Python库类的过程中取得更多的成果!

 

原创不易,如果觉得文章对你有帮助,欢迎点赞、评论。文章有疏漏之处,欢迎批评指正。

欢迎转载,转载请注明原文链接:https://blog.beibeiling.com/66618105/33.html

标签: 基础语法 Pandas NumPy python