Además de analizar datos, Python permite crear, leer y modificar documentos en formatos populares como PDF y Word. Para estas tareas existen varias bibliotecas especializadas, cada una con funciones muy útiles para automatizar la gestión de documentos en tus proyectos.
ReportLab es ideal para crear archivos PDF desde cero, permitiéndote agregar texto, imágenes, tablas y más. PyPDF2 sirve para leer, extraer texto, combinar o dividir archivos PDF ya existentes. Por su parte, python-docx permite crear y editar documentos de Word (.docx) de forma sencilla.
ReportLab te permite generar un archivo PDF y escribir texto en él de manera sencilla:
from reportlab.pdfgen import canvas
pdf = canvas.Canvas("ejemplo.pdf")
pdf.drawString(100, 750, "¡Hola, este es un PDF creado con Python!")
pdf.save()
Con PyPDF2 puedes leer el contenido de un PDF o combinar varios archivos PDF en uno solo:
import PyPDF2
# Leer un PDF y mostrar el texto de la primera página
with open("ejemplo.pdf", "rb") as archivo:
lector = PyPDF2.PdfReader(archivo)
pagina = lector.pages[0]
print(pagina.extract_text())
# Unir dos PDFs en uno solo
from PyPDF2 import PdfMerger
merger = PdfMerger()
merger.append("archivo1.pdf")
merger.append("archivo2.pdf")
merger.write("combinado.pdf")
merger.close()
python-docx permite crear documentos de Word y agregarles títulos y párrafos fácilmente:
from docx import Document
# Crear un documento Word nuevo
doc = Document()
doc.add_heading("Título del Documento", 0)
doc.add_paragraph("Este documento fue creado con Python.")
doc.save("ejemplo.docx")
Para instalar estas herramientas en tu entorno de Python, ejecuta:
!pip install reportlab
!pip install PyPDF2
!pip install python-docx
Con estas bibliotecas puedes automatizar la generación y manipulación de documentos, facilitando la presentación y el intercambio de resultados en tus proyectos de programación.