Форум сайта python.su
Доброе время суток, такая проблемка. Есть код который конвертирует файлы формата doc в docx, все работает. После конвертации из полученных файлов docx пытаюсь прочитать информацию (вложенные таблицы) выдает ошибку что не может найти вложенную таблицу. Если в ручную открыть файл docx внести любые изменения и сохранить то все работает.
Код конвертации
import os import time import win32com.client dir_path = 'D:\\doc\\' wrd = win32com.client.Dispatch("Word.Application") wrd.visible = 0 for item in os.listdir(dir_path): if item.endswith(".doc"): print(item) file_name, file_exteniosn = os.path.splitext(item) file_path = os.path.join(dir_path, item) wb = wrd.Documents.Open(file_path) wb.Convert wb.SaveAs2(f'{file_path}x', FileFormat=16) wb.Close() wrd.Quit()
from docx import Document doc = Document(file_path) tb = doc.tables[0] fio_inn = tb.cell(3,3).tables[0].cell(0,0).text
Офлайн