微信
支付宝
# 4. Python文本操作 ### 1. 文本的编码 \*\*编码技术\*\*即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。 计算机只认识0和1,所以需要将内容翻译成0和1才能保存在计算机中。同时也需要编码, 将计算机保存的0和1,反向翻译回可以识别的内容。 计算机中有许多可用编码:UTF-8,GBK,Big5等。不同的编码,将内容翻译成二进制也是不同的。 编码有许多,所以要使用正确的编码, 才能对文件进行正确的读写操作。 UTF-8是目前全球通用的编码格式,除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。 ### 2.\*\*文件\*\* 内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U 盘等设备。为了便于数据的管理和检索,引入了"文件"的概念。 一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。 文件操作主要包括打开、关闭、读、写等操作。 \*\*打开函数:open()方法 \*\*open(name, mode, encding) 在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下: \* name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。 \* mode:设置打开文件的模式(访问模式):只读、写入、追加等。 \* encoding:编码格式(推荐使用UTF-8) \*\*mode常用的三种基础访问模式\*\* \| \*\*模式\*\* \| \*\*描述\*\* \| \| -------- \| ------------------------------------------------------------ \| \| r \| 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 \| \| w \| 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。如果该文件不存在,创建新文件。 \| \| a \| 打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 \| \*\*注意:\*\* \* encoding的顺序并不是open()函数的第三位,所以不能用位置参数,用关键字参数直接指定,如:f = open('python.txt', 'r', encoding="UTF-8") \* 注意:此时的\`f\`是\`open\`函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问。 \* 文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被一直占用。 \*\*读操作相关方法:\*\* \* \*\*read()方法\*\*:文件对象.read(num) \* num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。 \* \*\*readlines()方法\*\*:readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个==列表==,其中每一行的数据为一个元素。 \* \*\*readline()方法\*\*:一次读取一行内容 \* \*\*for line in 循环读取文件行\*\*  \* \*\*close()方法:\*\* 关闭文件对象  \* \*\*with open 语法\*\*:可以在操作完成后自动关闭close文件,避免遗忘掉close方法 !\[image-20240308155441437\](https://hgh-typora-image.oss-cn-guangzhou.aliyuncs.com/img/image-20240308155441437.png) \| 操作 \| 功能 \| \| ------------------------------------- \| --------------------------------------- \| \| 文件对象 = open(file, mode, encoding) \| 打开文件获得文件对象 \| \| 文件对象.read(num) \| 读取指定长度字节不指定num读取文件全部 \| \| 文件对象.readline() \| 读取一行 \| \| 文件对象.readlines() \| 读取全部行,得到列表 \| \| for line in 文件对象 \| for循环文件行,一次循环得到一行数据 \| \| 文件对象.close() \| 关闭文件对象 \| \| with open() as f \| 通过with open语法打开文件,可以自动关闭 \| \`\`\`python """ 演示对文件的读取 """ import time # 打开文件 f = open("D:/测试.txt", "r", encoding="UTF-8") print(type(f)) # 读取文件 - read() print(f"读取10个字节的结果:{f.read(10)}") print(f"read方法读取全部内容的结果是:{f.read()}") print("-----------------------------------------------") # 读取文件 - readLines() lines = f.readlines() # 读取文件的全部行,封装到列表中 print(f"lines对象的类型:{type(lines)}") print(f"lines对象的内容是:{lines}") # 读取文件 - readline() line1 = f.readline() print(f"第一行数据是:{line1}") # for循环读取文件行 for line in f: print(f"每一行数据是:{line}") # # 文件的关闭 f.close() time.sleep(500000) # with open 语法操作文件 with open("D:/测试.txt", "r", encoding="UTF-8") as f: for line in f: print(f"每一行数据是:{line}") \`\`\` \*\*文件的写操作(覆盖):\*\* "w"模式 \> 1.打开文件:f = open('python.txt', 'w') \> \> 2.文件写入:f.write('hello world') \> \> 3.刷新内容到硬盘:f.flush() \*\*注意:\*\* \* 直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区 \* 当调用flush的时候,内容会真正写入文件 \* 这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘) \* 写入文件使用open函数的"w"模式进行写入 \* 文件如果不存在,使用"w"模式,会创建新文件文件 \* 如果存在,使用"w"模式,会将原有内容清空 \* close()方法,带有flush()方法的功能 \`\`\`python """ 演示文件的写入(覆盖) """ # 打开一个存在的文件 f = open("D:/test.txt", "w", encoding="UTF-8") # write写入、flush刷新 f.write("黑马程序员") # f.flush() # 将内存中积攒的内容,写入到硬盘的文件中 f.close() \`\`\` \*\*文件的写操作(追加):\*\* "a"模式 \> 1. 打开文件,通过a模式打开即可:f = open('python.txt', 'a') \> 2. 文件写入:f.write('hello world') \> 3. 内容刷新:f.flush() \*\*注意:\*\* \* a模式,文件不存在会创建文件 \* a模式,文件存在会在最后,追加写入文件 \* 可以使用"\\n"来写出换行符 \*\*综合案例:\*\* 题目:读取文件,将文件写出到bill.txt.bak文件作为备份,同时,将文件内标记为测试的数据行丢弃 \> (bill.txt.bak文件) \> \> name,date,money,type,remarks \> \> 周杰轮,2022-01-01,11200,消费,正式 \> \> 刘德滑,2023-01-01,63200,收入,测试 实现思路: \* open和r模式打开一个文件对象,并读取文件 \* open和w模式打开另一个文件对象,用于文件写出 \* for循环内容,判断是否是测试不是测试就write写出,是测试就continue跳过 \* 将2个文件对象均close() \`\`\`python """ 演示文件操作综合案例:文件备份 """ # 打开文件得到文件对象,准备读取 fr = open("D:/bill.txt", "r", encoding="UTF-8") # 打开文件得到文件对象,准备写入 fw = open("D:/bill.txt.bak", "w", encoding="UTF-8") # for循环读取文件 for line in fr: line = line.strip() # 判断内容,将满足的内容写出 if line.split(",")\[4\] == "测试": continue # continue进入下一次循环,这一次后面的内容就跳过了 # 将内容写出去 fw.write(line) # 由于前面对内容进行了strip()的操作,所以要手动的写出换行符 fw.write("\\n") # close2个文件对象 fr.close() fw.close() # 写出文件调用close()会自动flush() \`\`\`
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 Veylor
最近发布
常用SQL