当前位置: 首页 > news >正文

如何正确处理音频数据:16位整数与32位浮点数

在音频处理领域,音频数据的格式对后续的分析和处理至关重要。常见的音频格式包括16位整数和32位浮点数。本文将介绍如何正确处理这两种格式的音频数据,包括使用 scipy.io.wavfile 读取音频、使用 librosa 进行处理,以及使用 soundfilesf)写入音频文件。

1. 16位整数音频

在这里插入图片描述

1.1 读取音频

16位整数音频通常以 int16 格式存储。使用 scipy.io.wavfile 读取音频文件时,返回的数据类型为 numpy.int16

import numpy as np
from scipy.io import wavfile# 读取 WAV 文件
sample_rate, audio_data = wavfile.read('your_audio_file_16bit.wav')# 打印数据类型和范围
print(f'Data type: {audio_data.dtype}')
print(f'Data range: {audio_data.min()} to {audio_data.max()}')

1.2 处理音频

在使用 librosa 处理音频数据之前,需要将16位整数数据转换为浮点数格式,并归一化到 [-1, 1] 的范围。

import librosa# 如果数据是整数格式(例如 int16),则需要归一化
if audio_data.dtype == np.int16:audio_data = audio_data.astype(np.float32) / 32768.0  # 归一化到 [-1, 1]# 使用 librosa 进行处理
audio_data_processed = librosa.effects.preemphasis(audio_data)

1.3 写入音频

使用 soundfile 库将处理后的音频数据写入文件时,需要将浮点数数据转换回16位整数格式(如果需要)。

import soundfile as sf# 将浮点数数据转换为 int16
audio_data_int16 = (audio_data_processed * 32768).astype(np.int16)# 写入 WAV 文件
sf.write('output_16bit.wav', audio_data_int16, sample_rate)

2. 32位浮点音频

在这里插入图片描述

2.1 读取音频

32位浮点音频通常以 float32 格式存储。使用 scipy.io.wavfile 读取音频文件时,返回的数据类型为 numpy.float32

# 读取 WAV 文件
sample_rate, audio_data = wavfile.read('your_audio_file_32bit.wav')# 打印数据类型和范围
print(f'Data type: {audio_data.dtype}')
print(f'Data range: {audio_data.min()} to {audio_data.max()}')

2.2 处理音频

32位浮点音频数据通常已经在 [-1, 1] 的范围内,因此可以直接使用 librosa 进行处理。

# 使用 librosa 进行处理
audio_data_processed = librosa.effects.preemphasis(audio_data)

2.3 写入音频

使用 soundfile 库将处理后的音频数据写入文件时,可以直接写入浮点数数据。

# 写入 WAV 文件
sf.write('output_32bit.wav', audio_data_processed, sample_rate)
http://www.xdnf.cn/news/1061929.html

相关文章:

  • 【考研数学:高数11】一元函数积分学的应用(二)——积分等式和积分不等式
  • SSE 流与普通 HTTP 响应的区别
  • FPGA基础 -- Verilog 层次路径名
  • 物体变化下的迈克尔逊干涉:条纹密度、载波解调与双曝光去畸变
  • DAY 54 python打卡
  • 解锁数据宝藏:数据挖掘之数据预处理全解析
  • 【MySQL性能优化】DISTINCT和GROUP BY去重性能深度剖析
  • 基于存储过程的MySQL自动化DDL同步系统设计
  • 技术评测:三丰云免费服务器的真实能力边界
  • Vue 比较两个数组对象,页面展示差异数据值
  • GO 原子操作面试题及参考答案
  • 前端页面Javascript数组
  • 西门子PLC模块上的SF(系统故障)红灯故障分析
  • 前端工程结构设计指南:如何让模块解耦、易维护、可拓展
  • postgresql 函数调试
  • 接口测试需要注意的一些BUG
  • 多相机三维人脸扫描仪:超写实数字人模型制作“加速器”
  • chili3d笔记19 读取dxf
  • 阿里巴巴开源的 分布式事务解决方案Seata
  • iOS应用启动时间优化:通过多工具协作提升iOS App性能表现
  • 1532.在区间范围内统计奇数数目
  • Android 当apk是系统应用时,无法使用webView的解决方案
  • 京运通601908,一只值得长期跟踪操作的波段投资标的,两个指标即可做好
  • Cargo 与 Rust 项目
  • Spring Boot自动配置原理
  • 【智能安全帽新升级】搭载VTX316TTS语音合成芯片,让安全“听得见”!
  • 【国产AI服务器】全国产PCIE5.0交换板,替代博通89104/89144,支持海光、龙芯等平台
  • HTTP 请求方法与状态码
  • “地标界爱马仕”再拓疆域:世酒中菜联袂赤水金钗石斛定义中国GI
  • 力扣-169.多数元素