当前位置: 首页 > news >正文

Python数据分析及可视化中常用的6个库及函数(二)

Python数据分析及可视化中常用的6个库及函数(二)

       摘要:以下是Python数据分析及可视化常用的6个库的详细介绍,包括它们的概述以及每个库中最常用的10个函数(如果某些库常用函数不足10个,则列出所有常用函数)。每个函数都附带功能描述、用法说明和使用示例。这些库在数据科学、机器学习和数据可视化领域被广泛使用。

1. NumPy

  • 概述:NumPy 是 Python 中用于科学计算的基础库,提供多维数组对象和各种数学函数,支持高效的数值运算。

1.1 常用函数

  1. numpy.array()功能:创建一个 NumPy 数组。
    用法numpy.array(object, dtype=None)object 是输入数据(如列表、元组),dtype 是数据类型。
    示例

    import numpy as np
    data = [1, 2, 3, 4]
    arr = np.array(data)
    print(arr)  # 输出: [1 2 3 4]
    
  2. numpy.mean()
    功能:计算数组的平均值。
    用法numpy.mean(a, axis=None)a 是输入数组,axis 指定计算平均值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    avg = np.mean(arr)
    print(avg)  # 输出: 2.5
    
  3. numpy.sum()
    功能:计算数组元素的总和。
    用法numpy.sum(a, axis=None)a 是输入数组,axis 指定求和的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    total = np.sum(arr)
    print(total)  # 输出: 10
    
  4. numpy.reshape()
    功能:改变数组的形状。
    用法numpy.reshape(a, newshape)a 是输入数组,newshape 是新的形状。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4, 5, 6])
    reshaped = np.reshape(arr, (2, 3))
    print(reshaped)  # 输出: [[1 2 3] [4 5 6]]
    
  5. numpy.zeros()
    功能:创建一个全零数组。
    用法numpy.zeros(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.zeros((2, 3))
    print(arr)  # 输出: [[0. 0. 0.] [0. 0. 0.]]
    
  6. numpy.ones()
    功能:创建一个全一数组。
    用法numpy.ones(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.ones((2, 3))
    print(arr)  # 输出: [[1. 1. 1.] [1. 1. 1.]]
    
  7. numpy.random.rand()
    功能:生成均匀分布的随机数(0到1之间)。
    用法numpy.random.rand(d0, d1, ...)d0, d1, ... 是数组的维度。
    示例

    import numpy as np
    rand_arr = np.random.rand(2, 3)
    print(rand_arr)  # 输出: 2x3 的随机数数组
    
  8. numpy.std()
    功能:计算数组的标准差。
    用法numpy.std(a, axis=None)a 是输入数组,axis 指定计算标准差的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    std_dev = np.std(arr)
    print(std_dev)  # 输出: 1.118033988749895
    
  9. numpy.max()
    功能:返回数组中的最大值。
    用法numpy.max(a, axis=None)a 是输入数组,axis 指定查找最大值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    max_val = np.max(arr)
    print(max_val)  # 输出: 4
    
  10. numpy.min()
    功能:返回数组中的最小值。
    用法numpy.min(a, axis=None)a 是输入数组,axis 指定查找最小值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    min_val = np.min(arr)
    print(min_val)  # 输出: 1
    

2. Pandas

  • 概述:Pandas 是一个强大的数据分析和操作库,提供 DataFrame 和 Series 数据结构,适用于数据清洗、分析和处理。

2.1 常用函数

  1. pandas.read_csv()
    功能:从 CSV 文件读取数据并创建 DataFrame。
    用法pandas.read_csv(filepath, delimiter=',')filepath 是文件路径,delimiter 是分隔符。
    示例

    import pandas as pd
    df = pd.read_csv('data.csv')
    print(df.head())  # 输出数据的前5行
    
  2. pandas.DataFrame.groupby()
    功能:按指定列对数据进行分组,并可应用聚合函数。
    用法DataFrame.groupby(by)by 是分组依据的列名。
    示例

    import pandas as pd
    data = {'Name': ['Alice', 'Bob', 'Alice'], 'Score': [85, 90, 88]}
    df = pd.DataFrame(data)
    grouped = df.groupby('Name').mean()
    print(grouped)  # 输出: 按Name分组的平均分
    
  3. pandas.DataFrame.describe()
    功能:生成数据的描述性统计信息(如均值、标准差)。
    用法DataFrame.describe()
    示例

    import pandas as pd
    data = {'Score': [85, 90, 88, 92]}
    df = pd.DataFrame(data)
    stats = df.describe()
    print(stats)  # 输出: Score列的统计信息
    
  4. pandas.DataFrame.fillna()
    功能:用指定值填充数据中的缺失值。

http://www.xdnf.cn/news/788275.html

相关文章:

  • 腾讯云国际版和国内版账户通用吗?一样吗?为什么?
  • Eureka 高可用集群搭建实战:服务注册与发现的底层原理与避坑指南
  • Redis中的fork操作
  • impala中更改公网ip为内网ip
  • CLion社区免费后,使用CLion开发STM32相关工具资源汇总与入门教程
  • “刹车思维”:慢,是为了更快
  • 超临界二氧化碳再热再压缩布雷顿循环建模与先进控制
  • CppCon 2014 学习:Wishful Thinking
  • Gitee Wiki:重塑关键领域软件研发的知识管理范式
  • Android Kotlin 算法详解:链表相关
  • 关于线缆行业设备数据采集异构问题的解决
  • D2-基于本地Ollama模型的多轮问答系统
  • [蓝桥杯]最大化股票交易的利润
  • HarmonyOS图片image使用
  • linux的实时性
  • python第31天打卡
  • Python 接口:从协议到抽象基 类(使用猴子补丁在运行时实现协议)
  • LangChain实战:文档加载、分割与向量存储详解
  • 第三十三天打卡复习
  • 机器学习——放回抽样
  • 008房屋租赁系统技术揭秘:构建智能租赁服务生态
  • Matlab自学笔记五十七:符号运算、可变精度运算、双精度浮点型运算,三种运算精度的概念、比较、选择和应用
  • 【25-cv-05991】Keith律所代理Ana Maria油画版权
  • kubeSphere安装使用
  • 流、线程、任务、队列等相关在不同语言的区别联系
  • 项目计划缺乏风险评估和应对策略,如何完善
  • Qiskit:量子计算模拟器
  • Prj09--8088单板机C语言8253产生1KHz方波(1)
  • HTTP Error 400 Bad request 问题分析解决
  • spring boot应答500问题跟踪