当前位置: 首页 > news >正文

Java—— IO流 第二期

计算机存储说明

在计算机中,任意数据都是以二进制的形式来存储的
计算机中最小的存储单元是一个字节

常用的字符集

1.ASCII字符集:基于拉丁字母的字符编码,共收录 128 个字符,用一个字节就可以存储。
2.GBK字符集:兼容ASCII并收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。windows系统默认使用的就是GBK,系统显示:ANSI。
3. Unicode字符集:国际标准字符集,又称万国码,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。

计算机存储规则

ASCII字符集存储规则

GBK字符集存储规则

英文

中文 

细节:

根据GBK编码规则,英文的码都是0开头且占一个字节,汉字的码一定以1开头且占两个字节

所以看到0开头的一个字节表示英文,看到1开头的两个字节表示汉字

例如:

01100001  10011011  00010000  01100100

英文           汉字                            英文

Unicode字符集存储规则

UTF-8是Unicode字符集存储规则中的一种,最常使用

UTF-8编码规则

用1-4个字节存储数据,其中ASCII码表上的符号用1个字节,简体中文用3个字节。

UTF-8编码固定格式
0XXXXXASCII码表上的符号
1110XXXX 10XXXXXX 10XXXXXX简体中文

其中红色部分是固定的,X部分根据不同字符对应不同数字的二进制进行填入

英文 

中文 

如何设定想要使用的字符集

Java中编码的方法

String类中的方法说明
byte[] getBytes()使用默认方式进行编码
byte[] getBytes(String charsetName)使用指定方式进行编码

Java中解码的方法

String类中的方法说明
new String(byte[] bytes)使用默认方式进行解码
new String(byte[] bytes,string charsetName)使用指定方式进行解码

代码演示

import java.io.UnsupportedEncodingException;
import java.util.Arrays;public class Test1 {public static void main(String[] args) throws UnsupportedEncodingException {String str1 = new String("ai爱");//进行编码//idea默认使用UTF-8,英文占1个字节,中文占3个字节//所以字节数组应该有5个数据byte[] b1 = str1.getBytes();System.out.println(Arrays.toString(b1));//[97, 105, -25, -120, -79]//传参使用GBK,英文占1个字节,中文占2个字节//所以字节数组应该有4个数据byte[] b2 = str1.getBytes("GBK");System.out.println(Arrays.toString(b2));//[97, 105, -80, -82]//进行解码//用什么字符集编码就要用什么字符集解码,否则会出现乱码//默认UTF-8编码,默认UTF-8解码String str2 = new String(b1);System.out.println(str2);//ai爱//传参使用GBK编码,传参使用GBK解码String str3 = new String(b2, "GBK");System.out.println(str3);//ai爱}
}

字节流的局限性

字节流一次只能读取一个字节,而中文是用多个字节表示的,所以使用字节流读取中文时会出现乱码,因此需要使用字符流

字符流

字符流的底层其实就是字节流
字符流 = 字节流 + 字符集
特点:
字符输入流:一次读一个字节,遇到中文时,一次读多个字节
字符输出流:底层会把数据按照指定的编码方式进行编码,变成字节再写到文件中
使用场景:
对于纯文本文件进行读写操作

字符流的实现类

操作本地文件的字符输入流FileReader

创建字符输入流对象
构造方法说明
public FileReader(File file)创建字符输入流关联本地文件
public FileReader(String pathname)创建字符输入流关联本地文件

细节:如果文件不存在,就直接报错。 

读取数据
成员方法说明
public int read()读取数据,读到末尾返回-1
public int read(char[] buffer)读取多个数据,读到末尾返回-1

read()细节:
read()默认一个字节一个字节读取,如果遇到中文就会一次读取多个字节
在读取之后,方法的底层还会进行解码并转成十进制,最终把这个十进制作为返回值返回
这个十进制的数据表示该字符在字符集上对应的数字

例如:

英文:文件里面二进制数据0110 0001,read方法进行读取,解码并转成十进制97
中文:文件里面的二进制数据11100110 10110001 10001001,read方法进行读取,解码并转成十进制27721
再把这些十进制数据进行char强转就能看到对应的字符了

read(char[])细节:

返回的int类型的数据是读取到的字符个数

底层将读取数据,解码,强转三步合并了,把强转之后的字符存放到了传递的char数组当中

释放资源
成员方法说明
public int close()释放资源/关流 
代码演示

读取本模块下

import java.io.FileReader;
import java.io.IOException;public class Test2 {public static void main(String[] args) throws IOException {FileReader fr = new FileReader("day04\\a.txt");int b;/*while ((b = fr.read()) != -1) {System.out.print(b + " ");}//20320 22909 74 97 118 97 21704 21704 */while ((b = fr.read()) != -1) {System.out.print((char) b + " ");}//你 好 J a v a 哈 哈 fr.close();}
}
import java.io.FileReader;
import java.io.IOException;public class Test3 {public static void main(String[] args) throws IOException {FileReader fr = new FileReader("day04\\a.txt");int len;char[] ch = new char[3];while ((len = fr.read(ch)) != -1) {String str = new String(ch, 0, len);System.out.println(len + " " + str);}//3 你好J//3 ava//2 哈哈fr.close();}
}

操作本地文件的字符输出流FileWriter

创建字符输出流对象
构造方法说明
public FileWriter(File file)创建字符输出流关联本地文件
public FileWriter(String pathname)创建字符输出流关联本地文件
public FileWriter(File file, boolean append)创建字符输出流关联本地文件,是否续写
public FileWriter(String pathname, boolean append)创建字符输出流关联本地文件,是否续写

细节1:参数是字符串表示的路径或者File对象
细节2:如果文件不存在会创建一个新的文件,但是要保证父级路径是存在的
细节3:如果文件已经存在,则会清空文件,如果不想清空可以打开续写开关

写数据
成员方法说明
void write(int c)写出一个字符
void write(String str)写出一个字符串
void write(String str, int off, int len)写出一个字符串的一部分
void write(char[] cbuf)写出一个字符数组
void write(char[] cbuf, int off, int len)写出字符数组的一部分

细节:如果write方法的参数是整数,但是实际上写到本地文件中的是整数在字符集上对应的字符

释放资源
成员方法说明
public int close()释放资源/关流 

细节:每次使用完流之后都要释放资源 

代码演示
import java.io.FileWriter;
import java.io.IOException;public class Test4 {public static void main(String[] args) throws IOException {FileWriter fw = new FileWriter("day04\\a.txt");fw.write(97);fw.write("你好");char[] ch = {'a','i','爱'};fw.write(ch);fw.close();}
}

缓冲区

与FileInputStream和FileOutputStream不同的是,FileReader和FileWriter底层具有缓冲区

创建FileReader和FileWriter对象
底层:关联文件,并创建缓冲区(长度为8192的字节数组)

注:FileReader和FileWriter的缓冲区不是同一个,各自使用各自的缓冲区

读数据FileReader

底层:

判断缓冲区中是否有数据可以读取
缓冲区没有数据:就从文件中获取数据,装到缓冲区中,每次尽可能装满缓冲区,如果文件中也没有数据了,返回-1
缓冲区有数据:就从缓冲区中读取。

写数据FileWriter

底层:

数据会先装到缓冲区中,缓冲区数据装满时,调用flush方法刷新时,调用close方法关流时,会将缓冲区中的数据加载到文件中

flush刷新:刷新之后,还可以继续往文件中写出数据
close关流: 断开通道,无法再往文件中写出数据

http://www.xdnf.cn/news/561439.html

相关文章:

  • 怎么把cursor(Cursor/ollama)安装到指定路径
  • 从 CANopen到 PROFINET:网关助力物流中心实现复杂的自动化升级
  • 软考 测试 静态测试 动态测试
  • 2025ICPC南昌邀请赛流水账
  • 有理函数积分的一般方法
  • Data Vault 2.0:企业数据建模的现代方法
  • IDEA推送到gitlab,jenkins识别,然后自动发布到需要的主机
  • 【Django】Django DRF 中如何手动调用分页器返回分页数据(APIView,action场景)
  • eclipse 生成函数说明注释
  • 手术机器人行业新趋势:Kinova多机械臂协同系统如何突破复杂场景适应性瓶颈?
  • Idea 查找引用jar包依赖来源的Maven pom坐标
  • 实践大模型提示工程(Prompt Engineering)
  • 01. C#入门系列【你的第一个程序】从Hello World开始
  • 智能驾驶中的深度学习:基于卷积神经网络的车道线检测
  • Linux:进程信号---信号的保存与处理
  • docker使用
  • SRS流媒体服务器,配置国标协议对接和HTTPS视频流输出功能
  • 孤岛检测应用背景及实现原理
  • 解决Query Error: [S1000][15233] 无法添加属性。‘dbo.xxx.area_ids‘ 已存在属性‘MS_Description‘。
  • PaddleOCR的Pytorch推理模块
  • 每日算法-250521
  • RISC-V IDE MRS2 开发笔记一:volatile关键字的使用
  • ArcGIS Pro 3.4 二次开发 - Arcade
  • react中运行 npm run dev 报错,提示vite.config.js出现错误 @esbuild/win32-x64
  • vue项目启动报错(node版本与Webpack)
  • 创建Workforce
  • Apollo10.0学习——cyber常用指令
  • windows7安装node18
  • DeepSeek源码解构:从MoE架构到MLA的工程化实现
  • 基于 Node.js 的 HTML 转 PDF 服务