博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
文件IO
阅读量:6232 次
发布时间:2019-06-21

本文共 21426 字,大约阅读时间需要 71 分钟。

hot3.png

IO: input/out

本篇讲的IO专指文件IO

一、打开和关闭文件

In [1]: help(open)Help on built-in function open in module io:open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)    Open file and return a stream.  Raise IOError upon failure.        file is either a text or byte string giving the name (and the path    if the file isn't in the current working directory) of the file to    be opened or an integer file descriptor of the file to be    wrapped. (If a file descriptor is given, it is closed when the    returned I/O object is closed, unless closefd is set to False.)...
In [2]: f = open('./hello.py')In [3]: fOut[3]: <_io.TextIOWrapper name='./hello.py' mode='r' encoding='UTF-8'>In [4]: f.read()Out[4]: ''In [5]: f.close()In [6]: f.read()---------------------------------------------------------------------------ValueError                                Traceback (most recent call last)
in
()----> 1 f.read()ValueError: I/O operation on closed file.In [7]:

二、文件对象的操作

In [7]: f = open('./hello.py')  In [8]: f.write('test')           # mode=r  默认权限:只读---------------------------------------------------------------------------UnsupportedOperation                      Traceback (most recent call last)
in
()----> 1 f.write('test')UnsupportedOperation: not writableIn [9]: f.close()
In [10]: f = open('./hello.py', mode='r')In [11]: f.write('test')---------------------------------------------------------------------------UnsupportedOperation                      Traceback (most recent call last)
in
()----> 1 f.write('test')UnsupportedOperation: not writableIn [12]: f.read()Out[12]: ''In [13]: f.close()In [14]:
In [14]: f = open('./hello.py', mode='w')  # mode=w 文件不可读;即使文件打开后不做任何操作,也会清空文件In [15]: %cat hello.pyIn [16]: f.read()---------------------------------------------------------------------------UnsupportedOperation                      Traceback (most recent call last)
in
()----> 1 f.read()UnsupportedOperation: not readable # mode=w 当文件不存在的时候,会创建该文件 In [17]: f.write('aaaaa')Out[17]: 5In [18]: f.close()In [19]: %cat hello.pyaaaaaIn [20]: f = open('./hello.py', mode='w')In [21]: f.close()In [22]: %cat hello.pyIn [23]:
In [28]: f = open('./hello.py', mode='x')   # 当文件存在的时候, 会报错---------------------------------------------------------------------------FileExistsError                           Traceback (most recent call last)
in
()----> 1 f = open('./hello.py', mode='x')FileExistsError: [Errno 17] File exists: './hello.py'In [29]: %rm hello.pyIn [30]: f = open('./hello.py', mode='x') # 当文件存在的时候, 会报错, 不可读,可写In [31]: f.read()---------------------------------------------------------------------------UnsupportedOperation Traceback (most recent call last)
in
()----> 1 f.read()UnsupportedOperation: not readableIn [32]: f.write('abcd')Out[32]: 4In [33]: f.close()In [34]: %cat hello.pyabcdIn [35]:
In [40]: %rm hello.pyIn [41]: f = open('./hello.py', mode='a')   # mode=a, 不可读, 可写;并且是追加写 In [42]: f.write('abcd')Out[42]: 4In [43]: f.read()---------------------------------------------------------------------------UnsupportedOperation                      Traceback (most recent call last)
in
()----> 1 f.read()UnsupportedOperation: not readableIn [44]: f.close()In [45]: %cat hello.pyabcdIn [46]:

总结:

从 控制读写的模式:

  • r 只读,文件必须存在
  • w 只写,清空文件,文件不存在会创建文件
  • x 只写,文件必须不存在
  • a 只写,追加到文件末尾,文件不存在会创建文件

从其他方面来看:

  • 从读写方面来看,只有r 是 可读不可写的,其他都是可写不可读
  • 从文件不存在来看,只有r 抛出异常,其他都是创建新文件
  • 从文件存在来看,只有x 抛出异常
  • 从是否影响内容来看,只有w 会清空文件
In [46]: f = open('./hello.py', mode='rt')  # mode=t 是以文本方式打开文件In [47]: s = f.read()In [48]: sOut[48]: 'abcd'In [49]: f.close()In [50]: f = open('./hello.py', mode='rb')  # mode=b 是以字节方式打开文件In [51]: s = f.read()In [52]: sOut[52]: b'abcd'In [53]: f.close()In [54]:
  • mode=t  按字符操作
  • mode=b 按字节操作
In [55]: f = open('./hello.py', mode='r+')  # mode=r+  可读可写,并且是一个追加写In [56]: f.read()Out[56]: 'abcd'In [57]: f.write('efgh')Out[57]: 4In [58]: f.read()Out[58]: ''In [59]: f.close()In [60]: %cat hello.pyabcdefghIn [61]:
In [62]: f = open('./hello.py', mode='w+')    # mode=w+ 可读可写, 同时会清空文件In [63]: f.read()Out[63]: ''In [64]: f.write('马哥教育')Out[64]: 4In [65]: f.close()In [66]: %cat hello.py马哥教育In [67]:
  • 由于 w+ 会先清空文件,所以一般打开文件都会使用 r+
  • rwxa 模式有且仅有一种,存在于场上;并且 + 不能单独使用
     

三、文件指针

In [67]: help(f.tell)Help on built-in function tell:tell() method of _io.TextIOWrapper instance    Return current stream position.~   # 返回当前流的位置(END)
In [69]: f = open('./hello.py')             # mode=rt   In [70]: f.tell()Out[70]: 0In [71]: f.read()Out[71]: '马哥教育'In [72]: f.tell()Out[72]: 12In [73]: f.close()In [74]: f = open('./hello.py', mode='a')   In [75]: f.tell()Out[75]: 12In [76]: f.close()In [77]:
In [78]: f = open('./hello.py')In [79]: help(f.seek)Help on built-in function seek:seek(cookie, whence=0, /) method of _io.TextIOWrapper instance    Change stream position.        Change the stream position to the given byte offset. The offset is    interpreted relative to the position indicated by whence.  Values    for whence are:                                          # 偏移量应当为0 或正整数      * 0 -- start of stream (the default); offset should be zero or positive     * 1 -- current stream position; offset may be negative  # 偏移量可以为0或负整数    * 2 -- end of stream; offset is usually negative  # 偏移量 通常为 负整数        Return the new absolute position.    # 返回新的绝对位置~(END)In [91]: f = open('./hello.py', 'w+')In [92]: f.write('magedu')Out[92]: 6In [93]: f.close()In [94]: %cat hello.pymageduIn [95]: f = open('./hello.py')In [96]: f.tell()Out[96]: 0In [97]: f.read()Out[97]: 'magedu'In [98]: f.tell()Out[98]: 6In [99]: f.seek(0, 0)Out[99]: 0In [100]: f.tell()Out[100]: 0In [101]: f.read()Out[101]: 'magedu'In [102]: f.seek(2, 0)Out[102]: 2In [103]: f.tell()Out[103]: 2In [104]: f.read()Out[104]: 'gedu'In [105]: f.seek(0, 0)Out[105]: 0In [106]: f.read()Out[106]: 'magedu'In [107]: f.seek(4, 1)---------------------------------------------------------------------------UnsupportedOperation                      Traceback (most recent call last)
in
()----> 1 f.seek(4, 1)UnsupportedOperation: can't do nonzero cur-relative seeksIn [108]: f.seek(0, 1)Out[108]: 6In [109]: f.seek(0, 2)Out[109]: 6In [110]: f.tell()Out[110]: 6In [111]: f.close()In [112]:

总结:

mode=t

  • 按字节移动文件指针
  • 当whence (第二个参数)位 start(0) (默认值) , 可以移动任意位置,offset 可以是任意整数,(offset 就是他的第一个参数)
  • 当whence 位current 也就是1,或者是end 也就是2的时候,offset 只能为0
In [113]: f = open('./hello.py', mode='w')In [114]: f.write('马哥教育')Out[114]: 4In [115]: f.close()In [116]: f = open('./hello.py', mode='rb')In [117]: f.tell()Out[117]: 0In [118]: f.seek(3)Out[118]: 3In [119]: f.read()Out[119]: b'\xe5\x93\xa5\xe6\x95\x99\xe8\x82\xb2'In [120]: f.seek(3)Out[120]: 3In [121]: f.read().decode()Out[121]: '哥教育'In [122]: f.seek(3)Out[122]: 3In [123]: f.seek(3, 1)Out[123]: 6In [124]: f.seek(3, 2)Out[124]: 15In [125]: f.read()Out[125]: b''In [126]: f.read().decode()Out[126]: ''In [127]: f.seek(-3, 2)Out[127]: 9In [128]: f.read().decode()Out[128]: '育'In [129]: f.seek(13)Out[129]: 13In [130]: f.seek(-13, 2)---------------------------------------------------------------------------OSError                                   Traceback (most recent call last)
in
()----> 1 f.seek(-13, 2)OSError: [Errno 22] Invalid argumentIn [131]:

总结:

mode=b

  • 按字节移动指针
  • 当whence start(0), 可以移动任意位置,offset 可以是任意整数
  • 当whence 位 为 current 也就是1,end 也就是2的时候,也可以是任意整数

移动文件指针:

  • 文件指针按字节操作
  • tell 方法返回当前文件指针位置
  • seek 方法移动文件指针
  • whence 参数start(0), current(1), end(2) 事实上,这些变量有我们的常量 SEEK_SET(0), SEEK_CUR(1), SEEK_END(2)
    • SEEK_SET(0) 从0开始向后移动offset 个字节
    • SEEK_CUR(1) 从当前位置向后移动offset个字节
    • SEEK_END(2) 从EOF向后移动offset个字节  EOF:END OF FILE
  • offset 是整数
  • 当mode 为t 时,whence 为SEEK_CUR 或者SEEK_END ,offset 只能为0
  • 文件指针不能为负数
  • 读文件的时候,从文件指针开始向后读
  • 写文件的时候,从min(EOF)处 开始向后写
  • 当以mode 为a 模式打开的时候,无论文件指针在何处,都从EOF开始写

1、落盘操作(flush)

In [132]: f = open('./hello.py', 'wb')In [133]: f.write(b'abc')Out[133]: 3In [134]: %cat hello.pyIn [135]: f.flush()          # 落盘In [136]: %cat hello.pyabcIn [137]: f.write(b'apapapa')Out[137]: 7In [138]: %cat hello.pyabcIn [139]: f.close()          # 自带 flushIn [140]: %cat hello.pyabcapapapaIn [141]:

2、buffering(缓冲区)

In [145]: f = open('./hello.py', 'wb', buffering=5)In [146]: f.write(b'abc')Out[146]: 3In [147]: %cat hello.pyIn [148]: f.write(b'abc')Out[148]: 3In [149]: %cat hello.pyabcIn [150]: f.close()In [151]: %cat hello.pyabcabcIn [152]: f = open('./hello.py', 'wb', buffering=5)In [153]: f.write(b'a')Out[153]: 1In [154]: f.write(b'b')Out[154]: 1In [155]: f.write(b'q')Out[155]: 1In [156]: f.write(b'ab')Out[156]: 2In [157]: f.write(b'1')Out[157]: 1In [158]: %cat hello.pyabqabIn [159]: f.close()In [160]:
In [161]: f = open('./hello.py', 'wb', buffering=0)In [162]: f.write(b'a')Out[162]: 1In [163]: %cat hello.pyaIn [164]: f.write(b'b')Out[164]: 1In [165]: %cat hello.pyabIn [166]: f.close()In [167]: f = open('./hello.py', 'wb', buffering=0)In [168]: f.write(b'abcdefg')Out[168]: 7In [169]: %cat hello.pyabcdefgIn [170]:
In [170]: import ioIn [171]: io.DEFAULT_BUFFER_SIZEOut[171]: 8192In [172]: f = open('./hello.py', 'wt', buffering=1)   # 只有当buffering=1 的时候,才是 line bufferIn [173]: f.write('abc')Out[173]: 3In [174]: %cat hello.pyIn [175]: f.write('\n')Out[175]: 1In [176]: %cat hello.pyabcIn [177]: f.close()
In [185]: f = open('./hello.py', 'wt', buffering=5)In [186]: f.write('abc')Out[186]: 3In [187]: %cat hello.pyIn [188]: f.write('\n')Out[188]: 1In [189]: %cat hello.pyIn [190]: f.write('a' * io.DEFAULT_BUFFER_SIZE)Out[190]: 8192In [191]: f.close()In [192]: f = open('./hello.py', 'wt', buffering=5)In [193]: f.write('a' * io.DEFAULT_BUFFER_SIZE)Out[193]: 8192In [194]: %cat hello.pyIn [195]: f.write('b')Out[195]: 1In [196]: %cat hello. [197]: f.close()In [198]:

buffering>1 的时候, 缓冲区的大小为 io.DEFAULT_BUFFER_SIZE; 当缓冲区满时,flush缓冲区连同本次写入的内容一起 落盘。

总结:

  • buffering = -1
    • 二进制模式:io.DEFAULT_BUFFER_SIZE
    • 文本模式:io.DEFAULT_BUFFER_SIZE
  • buffering = 0
    • 二进制模式:关闭buffering 也就是unbuffered
    • 文本模式:不允许
  • buffering = 1
    • 二进制模式:1
    • 文本模式: line buffer
  • buffering > 1
    • 二进制模式:buffering
    • 文本模式:io.DEFAULT_BUFFER_SIZE
    • 二进制模式:判断缓冲区的位置是否足够存放当前字节,如果不能,先flush,再把当前字节写入缓冲区,如果当前字节大于缓冲区大小,直接flush
    • 文本模式:line buffering,遇到换行就flush;非line buffering,当前字节加缓冲区中的字节超出缓冲区大小,直接flush 缓冲区和当前字节

flush 和 close 方法可以强制刷新缓冲区

 

In [217]: f = open('hello.py', 'w+', buffering=1)In [218]: f.write('abcd')Out[218]: 4In [219]: f.read()Out[219]: ''In [220]: f.seek(0)Out[220]: 0In [221]: f.tell()Out[221]: 0In [222]: f.read()Out[222]: 'abcd'In [223]: f.close()
  • readline 方法
In [242]: f = open('hello.py', 'w+', buffering=1)In [243]: f.write('abc')Out[243]: 3In [244]: f = open('hello.py', 'r+')In [245]: f.write('1234\n')Out[245]: 5In [246]: f.write('hjhk\n')Out[246]: 5In [247]: f.write('op976\n')Out[247]: 6In [248]: f.seek(0)Out[248]: 0In [249]: f.read(4)       # 跟着指针走Out[249]: '1234'In [250]: f.read(4)Out[250]: '\nhjh'In [251]: f.read(-1)Out[251]: 'k\nop976\n'In [252]: f.seek(0)Out[252]: 0In [253]: f.read(0)Out[253]: ''In [254]: f.readline()Out[254]: '1234\n'In [255]: help(f.readline)Help on built-in function readline:readline(size=-1, /) method of _io.TextIOWrapper instance    Read until newline or EOF.        Returns an empty string if EOF is hit immediately.~(END)
In [256]: f.seek(0)Out[256]: 0In [257]: f.readline(2)Out[257]: '12'In [258]: f.readlines()Out[258]: ['34\n', 'hjhk\n', 'op976\n']In [259]: f.seek(0)Out[259]: 0In [260]: for line in f:     ...:     print(line)     ...:     1234hjhkop976In [261]: f.writable()Out[261]: TrueIn [262]: f.write('bnm\n')Out[262]: 4In [263]: f.writelines(['bnm\n', '098765fgh\n'])In [264]: f.flush()In [265]: %cat hello.py1234hjhkop976bnmbnm098765fghIn [266]: f.seekable()Out[266]: TrueIn [267]:

2、sys 模块

In [272]: import sysIn [273]: sys.stderr.seekable()     # 进行指针测试Out[273]: FalseIn [274]: f.fileno()                # 如果 f 含有文件描述符则返回;如果 f 没有使用文件描述符,则返回osError Out[274]: 12In [275]: f.isatty()                # 返回这是否是一个“交互”流 ;如果不能确定,则返回 falseOut[275]: FalseIn [276]: f.name                    # 返回 f 的名字 Out[276]: 'hello.py'In [277]: f.buffer                  # 返回缓冲区 信息?Out[277]: <_io.BufferedRandom name='hello.py'>In [278]: f.truncate()    # 文件指针保持不变。大小默认为当前IO ;根据据tell()位置,返回新的大小。Out[278]: 34In [279]: f.close()
In [322]: f = open('hello.py', 'r+b')In [323]: f1 = open('test.txt', 'r+b')In [324]: f1.write(b'lkjhgfdsajytr')Out[324]: 13In [325]: f1.close()In [326]: f.seek(0)Out[326]: 0In [327]: f.readinto(f1)    # readinto(缓冲,/)_io.bufferedrandom的实例方法---------------------------------------------------------------------------TypeError                                 Traceback (most recent call last)
in
()----> 1 f.readinto(f1)TypeError: readinto() argument must be read-write bytes-like object, not _io.BufferedRandom# TypeError:readinto()参数必须是可读写的, 字节的形式的对象,不能够是_io.bufferedrandomIn [328]: In [328]: f.close()In [329]: f1.close()In [330]: f1 = open('test.txt', 'r+b')In [331]: f = open('hello.py', 'r+b')In [332]: buffer = bytearray()In [333]: f.readinto(buffer)Out[333]: 0In [334]: f.close()In [335]: f1.close()In [336]:

 

转载于:https://my.oschina.net/u/3552459/blog/1572643

你可能感兴趣的文章
java 账号密码登陆验证码_介绍javaweb登录验证码的实现方法步骤
查看>>
java 上传 分片技术_java 大文件分片上传处理
查看>>
java 平滑 停止_设计Java应用程序的平滑停止
查看>>
java生成8位数随机码_JAVA 生成无重复8位随机码
查看>>
java范围查询treemap_java集合-TreeMap
查看>>
Java解决主从数据库延迟问题_MySQL主从数据库同步延迟问题解决
查看>>
java将jfif格式转换成ipg_jfif是什么格式?Win10将图片JFIF格式转成JPG格式的方法
查看>>
socket.io java 点对点_netty-socket.io点对点通讯和聊天室通讯
查看>>
python java thrift_Apache Thrift PythonJava“连接被拒绝”
查看>>
java测试邮箱是否_javaWEB邮件测试
查看>>
java里booelan_Java Web应用开发技术与案例教程 教学课件 张继军 第4章_JDBC数据库访问技术.ppt...
查看>>
php mysql记录用户行为_用户参与记录存储的演变_PHP教程
查看>>
python中使用缩进来体现代码之间的逻辑关系_Python使用缩进来体现代码之间的逻辑关系。...
查看>>
python图像对比度拉伸_python库skimage 图像直方图均衡化、自适应均衡化、对比度拉伸实现...
查看>>
java判断是不是disable_Java Compiler disable()方法与示例
查看>>
php 发送 二进制,PHP处理二进制数据的实现方法
查看>>
用php写上传文件的代码,php多文件上传实现代码
查看>>
php发送邮件怎么配置,php 配置smtp发送邮件
查看>>
java文件名要和什么一致,Java源程序的文件名一定要与文件中某个类的名称一致。...
查看>>
c php结合,腾讯熊月:企点将php嵌入到高性能C/C++框架运行的探索实践
查看>>