用python提取/Users/pzj.228/Desktop/mypycharm/img.pdf里面图片到Excel中保存
要将PDF中的图片提取到Excel中,可以使用Python的`pdf2image`库将PDF转换为图像,然后使用`openpyxl`库将图像保存到Excel文件中。以下是具体的操作步骤和代码:
1. 首先,确保已经安装了`pdf2image`和`openpyxl`库。如果没有安装,可以使用以下命令进行安装:
```bash
pip install pdf2image openpyxl
```
2. 接下来,使用以下代码将PDF中的图片提取到Excel中:
```python
import os
from pdf2image import convert_from_path
import openpyxl
from openpyxl.drawing.image import Image
# PDF文件路径
pdf_path = '/Users/pzj.228/Desktop/mypycharm/img.pdf'
# 将PDF转换为图像列表
images = convert_from_path(pdf_path)
# 创建一个新的Excel工作簿
workbook = openpyxl.Workbook()
sheet = workbook.active
# 将每个图像添加到Excel工作表中
for index, image in enumerate(images):
# 将图像保存到临时文件中
image.save(f'temp_image_{index}.png', 'PNG')
# 在Excel工作表中插入图像
img = Image(filename=f'temp_image_{index}.png')
img.width = image.width // 6
img.height = image.height // 6
sheet.add_image(img, f'A{index + 1}')
# 删除临时文件
os.remove(f'temp_image_{index}.png')
# 保存Excel工作簿
workbook.save('output.xlsx')
```
这段代码将会将`/Users/pzj.228/Desktop/mypycharm/img.pdf`中的图片提取到名为`output.xlsx`的Excel文件中。每个图片都会被缩小为原始尺寸的1/6,并按照顺序插入到Excel工作表中。
1. 首先,确保已经安装了`pdf2image`和`openpyxl`库。如果没有安装,可以使用以下命令进行安装:
```bash
pip install pdf2image openpyxl
```
2. 接下来,使用以下代码将PDF中的图片提取到Excel中:
```python
import os
from pdf2image import convert_from_path
import openpyxl
from openpyxl.drawing.image import Image
# PDF文件路径
pdf_path = '/Users/pzj.228/Desktop/mypycharm/img.pdf'
# 将PDF转换为图像列表
images = convert_from_path(pdf_path)
# 创建一个新的Excel工作簿
workbook = openpyxl.Workbook()
sheet = workbook.active
# 将每个图像添加到Excel工作表中
for index, image in enumerate(images):
# 将图像保存到临时文件中
image.save(f'temp_image_{index}.png', 'PNG')
# 在Excel工作表中插入图像
img = Image(filename=f'temp_image_{index}.png')
img.width = image.width // 6
img.height = image.height // 6
sheet.add_image(img, f'A{index + 1}')
# 删除临时文件
os.remove(f'temp_image_{index}.png')
# 保存Excel工作簿
workbook.save('output.xlsx')
```
这段代码将会将`/Users/pzj.228/Desktop/mypycharm/img.pdf`中的图片提取到名为`output.xlsx`的Excel文件中。每个图片都会被缩小为原始尺寸的1/6,并按照顺序插入到Excel工作表中。