这篇文章给大家分享的是有关python怎么在word中读取表格内容的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
淮上网站制作公司哪家好,找创新互联公司!从网页设计、网站建设、微信开发、APP开发、响应式网站建设等网站项目制作,到程序开发,运营维护。创新互联公司公司2013年成立到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联公司。
word文件看起来很复杂,不方便结构化。事实上,word文档中大概有几种内容:paragraph(段落)、table(表格)、character(字符)。我现在要分析的word文档基本都是段落和表格。本文主要讲述从word中分析表格,并将表格信息结构化的方法。
1、为了使用python解析word文件,可以使用包docx,首先需要在python中安装它。
pip install python-docx
2、安装后,就可以读取word文件。
importdocx fn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据 for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据 for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text) table_num=len(doc.tables)#获取文档的表格个数 print(table_num) table_0=doc.tables[0]#选取第一个表 table_rows =len(table_0.rows)#获取第一个表的行数 print(table_rows) tab=doc.tables[0].rows[0].cells[0]#获取第一张表第一行第一列数据 print(tab.text) par= doc.paragraphs[2]#读取第三段数据 print(par.text)
感谢各位的阅读!关于“python怎么在word中读取表格内容”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!