当前位置 : 首页 » 互动问答 » 正文

PDF to text Python 3.6 pdfminer no module named'pdfminer'

分类 : 互动问答 | 发布时间 : 2018-04-27 17:16:29 | 评论 : 2 | 浏览 : 734 | 喜欢 : 0

我尝试使用pdfminer.six将目录中的多个pdf转换为使用python 3.6.3的多个.txt文件

在运行下面的代码时出现了这些错误: ModuleNotFoundError:没有名为'pdfminer'的模块。或者,当我运行pdf2txt.py filename.pdf时,它给出了 env:python \ r:没有这样的文件或目录

我做了一些关于这个问题的研究。我已经从我的pip中删除了原始pdfminer,目前,它只有pdfminer.six在我的点中。另外,我在virtualenv上运行python 3.6.3

下面是我运行的代码:

从io import StringIO
从pdfminer.pdfinterp导入PDFResourceManager,PDFPageInterpreter
从pdfminer.converter导入TextConverter
从pdfminer.layout导入LAParams
从pdfminer.pdfpage导入PDFPage
进口操作系统
导入sys,getopt

#converts pdf,将其文本内容作为字符串返回
def convert(fname,pages = None):
    如果不是页面:
        pagenums = set()
    其他:
        pagenums = set(页面)

    输出= StringIO()
    manager = PDFResourceManager()
    converter = TextConverter(manager,output,laparams = LAParams())
    解释器= PDFPageInterpreter(管理器,转换器)

    infile = file(fname,'rb')
    对于PDFPage.get_pages(infile,pagenums)中的页面:
        interpreter.process_page(页)
    infile.close()
    converter.close()
    text = output.getvalue()
    output.close
    返回文本

#转换目录pdfDir中的所有pdfs,将所有生成的txt文件保存到txtdir
def convertMultiple(pdfDir,txtDir):
    if pdfDir ==“”:pdfDir = os.getcwd()+“\\”#if否pdfDir传入
    for pdf in os.listdir(pdfDir):#iterate through pdfs in pdf directory
        fileExtension = pdf.split(“。”)[ -  1]
        如果fileExtension ==“pdf”:
            pdfFilename = pdfDir + pdf
            文本=转换(pdfFilename)#get字符串的文本内容的PDF
            textFilename = txtDir + pdf +“.txt”
            textFile =打开(textFilename,“w”)#制作文本文件
            textFile.write(文本)#将文本写入文本文件

pdfDir =“../../data/raw/”
txtDir =“../../data/interim/”
convertMultiple(pdfDir,txtDir)

回答(2)

  • 1楼
  • 安装Python 3.X的软件包pdfminer3k

  • 2楼
  • 下载pdfminer3k tar.gz 解压缩它 运行 python setup.py install

相关阅读:

raw_input function in Python

Convert HTML to PDF in .NET

How to import the class within the same directory or sub directory?

How to return dictionary keys as a list in Python?

How to return dictionary keys as a list in Python?

Python `if x is not None` or `if not x is None`?

Assign output of os.system to a variable and prevent it from being displayed on the screen

How can I reverse a list in Python?

What are the differences between type() and isinstance()?

How to install packages using pip according to the requirements.txt file from a local directory?