• 技术文章 >后端开发 >Python教程

    Ubuntu下使用python读取doc和docx文档的内容方法

    不言不言2018-05-08 14:18:12原创2269
    这篇文章主要介绍了关于Ubuntu下使用python读取doc和docx文档的内容方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下

    读取docx文档

    使用的包是python-docx

    1. 安装python-docx包

    sudo pip install python-docx

    2. 使用python-docx包读取数据

    #encoding:utf8 
    import docx 
    doc = docx.Document('test.docx') 
    docText = '\n'.join([paragraph.text for paragraph in doc.paragraphs]) 
    #print(docText)

    python-docx这个包是不能处理doc文档的,要读取doc文档内容的话需要使用antiword这个工具。

    读取doc文档

    1. 到网站下载antiword。

    2. 下载完毕之后解压,在解压得到的文件夹中依次运行make和make install命令。

    3. 使用antiword读取doc文档内容

    #encoding:utf8 
    import subprocess 
    word = 'test.doc' 
    output = subprocess.check_output(['antiword',word]) 
    print(output)

    相关推荐:

    基于python批量处理dat文件及科学计算的方法

    用python处理MS Word的实例

    php入门到就业线上直播课:查看学习

    以上就是Ubuntu下使用python读取doc和docx文档的内容方法的详细内容,更多请关注php中文网其它相关文章!

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

    前端(VUE)零基础到就业课程:点击学习

    清晰的学习路线+老师随时辅导答疑

    自己动手写 PHP MVC 框架:点击学习

    快速了解MVC架构、了解框架底层运行原理

    专题推荐:Ubuntu python docx
    上一篇:基于python批量处理dat文件及科学计算的方法 下一篇:自己动手写 PHP MVC 框架(40节精讲/巨细/新人进阶必看)

    相关文章推荐

    • ❤️‍🔥共22门课程,总价3725元,会员免费学• ❤️‍🔥接口自动化测试不想写代码?• Python NumPy教程之数据类型对象• Python标准库中的logging用法示例• 使用Python处理KNN分类算法• python发腾讯微博代码分享• python自动化测试实例解析
    1/1

    PHP中文网