Buen día, tengo un pdf, el cual tiene una información, de toda esta información, necesito seleccionar únicamente un dato, pero este dato cambiara constantemente ya que es variable, que comando o herramienta podria utilizar? ya que he probado ocr a imagen pero no lo he logrado.
Share
Bender
Hola Yeimi,
Si el PDF es digital, puedes utilizar el comando Extraer texto de PDF del menú Archivos->PDF, si el dato variable está entre palabras filas, debes tomar esas para capturar la información, lo puedes realizar con un split o con expresiones regulares de Python.
Te dejo un video que te puede servir: https://youtu.be/QEaM_CkvrhM
Si es un PDF escaneado, entonces tendría que ser por OCR, la dinámica para obtener el texto deseado sería la misma, split o regex.
luis88
split o con expresiones regulares podria pasar las formula para me ha costado conseguir las que quiero.. o por donde ver para ir probando