Su recurso integral para las principales herramientas para la conversión de PDF a Excel

Por Yvonne
2022-10-25

Para evaluar los datos en un archivo PDF, debe extraerlos en una hoja de cálculo. Aprenda cómo siete opciones para convertir PDF a sobresaltar en las pruebas de comparación utilizando fuentes de datos progresivamente más difíciles.

cw pdf to excel

La información que debemos evaluar idealmente estaría disponible en un formato fácilmente utilizable. Pero en el mundo en que vivimos, mucha información importante está contenida en archivos de formato de documento portátil (PDF). ¿Cómo puedo sacar la información de PDF y en una hoja de cálculo de Excel? Puede elegir desde una variedad de PDF hasta convertidores de Excel.

Hay software de fabricantes conocidos como Adobe y Microsoft, servicios en la nube específicos de tareas como PDFTables, servicios en la nube de uso general como Amazon e incluso alternativas gratuitas de código abierto.

¿Qué PDF para el convertidor de Excel es el"mejor"? Similar a"Mejor computadora,"La respuesta se basa en su propia situación.

Tres consultas para hacer antes de seleccionar un PDF a Excel Converter

Al elegir un convertidor PDF, hay una serie de factores cruciales a tener en cuenta.

1. ¿Es mi PDF una imagen escaneada o fue producida por un programa?

Los archivos PDF pueden ser de dos tipos diferentes. El primero es creado por un programa como Microsoft Word, mientras que el segundo se deriva de un documento escaneado u otro archivo de imágenes. Intente resaltar algún texto en la página para ver cuál tiene. Su PDF fue creado por una aplicación si puede resaltar texto con un clic y arrastrar. Si no lo hace't, se requiere un escaneo. Algunos software de conversión de PDF no admiten PDF escaneados.

2. ¿Qué tan intrincada es la arquitectura de datos?

Una mesa sencilla de una página funcionará con casi todas las herramientas. Cuando las tablas se distribuyen en numerosas páginas, cuando las células de la tabla se combinan, o cuando algunos de los datos en una celda de tabla abarcaron múltiples líneas, las cosas se vuelven más desafiantes.

3. ¿Requiere conversiones de automatización o archivos por lotes ya que tengo muchos archivos?

Si con frecuencia realiza conversiones por lotes, nuestra solución que produce los mejores PDF generados por aplicaciones podría no ser la opción ideal para usted.

Además, al igual que con cualquier selección de programa, debe determinar cuánto valore el rendimiento en relación con el precio y la usabilidad.

Cómo evaluamos el software de conversión

Probamos siete PDF para Excel Software de conversión utilizando cuatro archivos PDF diferentes, que van desde fácil hasta difícil, para ayudarlo a determinar cuál es ideal para sus tareas. Tú'Observa cómo se desempeña cada herramienta en cada circunstancia y aprende sobre sus ventajas y desventajas.

How to convert a PDF to Excel for free

PDF probado para convertidores de Excel

Las herramientas que evaluamos se enumeran a continuación, comenzando con nuestros mejores artistas generales (tenga en cuenta que"mejor"se basa en parte en el documento de origen en particular). Las clasificaciones para estas herramientas van desde"Excelente"a"Bueno,"indicando que todos se desempeñaron admirablemente en al menos algunas de nuestras tareas.

Membresía a Adobe Acrobat Export PDF

Puede anticipar que Adobe le vaya bien en el análisis de PDF dado que desarrolló el estándar de formato de documento portátil, y lo hace. Hay una membresía de conversión completa con todas las funciones, pero también hay una opción de bajo costo de $ 2/mes (se requiere una suscripción anual) que ofrece PDF ilimitado a las conversiones de Excel. (Con esta utilidad, los archivos de Microsoft Word también se pueden emitir).

Cualquier texto en páginas con texto y tablas se convierte en un formato de Excel. Esto puede ser ventajoso si desea mantener ese contexto o desventajos si simplemente necesita los datos para futuras investigaciones.

  • Excelente—Campeón indiscutible para PDF no escaneados.
  • $ 24 por año.
  • Resultados sobresalientes, un excelente manejo de tablas que abarcan varias páginas, conversiones ilimitadas de archivos de hasta 100 MB y precios razonables para usuarios frecuentes son solo algunos de los profesionales.
  • Contras: Si solo convierte algunos documentos al año,'s caro y no hay't cualquier procedimiento de secuencia de comandos o automatización incorporado.
  • En conclusión, esta es una opción maravillosa si no'Necesita escribir o automatizar muchas conversiones y no'Me importa pagar $ 24 cada año.

AWS Amazon Textract

Textract'La interfaz de usuario S es sorprendentemente simple para un servicio en la nube de AWS. Si bien es posible configurar Textract a través del proceso de codificación y configuración estándar de AWS de múltiples pasos, Amazon también proporciona una demostración web de arrastrar y soltar que le permite descargar los resultados como archivos CSV con cremallera. Todo lo que tiene que hacer es crear una cuenta gratuita de Amazon AWS.

  • Excelente: esta fue, con mucho, la mejor opción que podríamos haber hecho para un PDF escaneado desafiante.
  • Costo por página: 1.5 centavos (100 páginas por mes gratis para sus primeros tres meses en AWS)
  • Pros: proporciona la opción de ver los resultados con un diseño de celda fusionado o sin cebos; es simple de usar; tiene un precio razonable; se descubrió que era la mejor opción para un PDF escaneado desafiante.
  • Contras: solo puede cargar 10 páginas de archivos a la vez. Usar esta API es más complicado que otras soluciones para las personas que desean automatizar.
  • Conclusión: si no'Mindir la configuración de AWS y la carga manual o la codificación con una API sofisticada, esta es una gran opción.

Tabula

Prueba Tabula si'RE BUSCANDO SOFTWARE GRATUITO y OPEN SOFTWARE. Tabula es fácil de instalar y usar, en contraste con algunas alternativas de Python gratuitas. Además, presenta una interfaz de línea de comandos y una interfaz del navegador, lo que lo hace adecuado para el uso de apuntar y hacer clic y conversiones por lotes.

A pesar de tener un problema con el PDF difícil, Tabula funcionó excepcionalmente bien con PDF de baja a complejidad de baja a moderada (al igual que muchas de las plataformas pagas). En Linux y Windows, Tabula necesita una instalación de Java separada.

  • Muy buena calificación, y el precio es inmejorable.
  • Precio: gratis
  • Pros: gratis; instalación sencilla; GUI y opciones de secuencias de comandos; control manual sobre qué partes del sitio web deben verificarse en busca de tablas; Capacidad para exportar los resultados como CSV, TSV, JSON o Script; Dos métodos para extraer datos.
  • Contras: solo funciona con PDF creados por aplicaciones; Formateo complicado requerido Limpieza de datos manuales.
  • Conclusión: si las posibilidades de costo, usabilidad y automatización son importantes para usted y sus pdfs'T escaneó, esta es una solución decente.

Pdftables

La automatización de este servicio es un gran beneficio. Su API está bien documentada y admite una amplia gama de lenguajes de programación, incluidos Java, C ++, PHP, Python, R, Windows PowerShell y VBA (Office Visual Basic para aplicaciones).

La mayoría de las tablas PDF creadas por las aplicaciones funcionaron sin problemas gracias a PDFTables, lo que incluso reconoció que una fila de encabezado de dos columnas funcionaría mejor como una fila de encabezado de una sola columna. Aunque la mayoría de las columnas estaban vacías, tenía algunos problemas con los datos en celdas que se estiraron en dos líneas. Al menos no lo hizo'Me cobra por eso, incluso si se atragantaba en el PDF escaneado de la pesadilla.

  • Puntaje general de muy bueno; Puntuación de automatización de excepcional.
  • 50 páginas son gratuitas cuando se registra, incluido el uso de la API. Sus créditos solo son válidos por un año después de eso, y cuesta $ 40 por hasta 1,000 páginas.
  • Pros: excelente API; Superenta a algunos de sus competidores pagados en el PDF moderadamente complicado.
  • Contras: costoso, especialmente si usa más páginas que las 50 páginas gratuitas pero convierte menos de 1,000 páginas anualmente. No aplicable a los PDF escaneados.
  • Resumen: funciona bien y es fácil de usar tanto en línea como a través de secuencias de comandos y programación. Sin embargo, si no'Necesita una API elegante, podría favorecer una opción menos costosa.

Pdftoexcel.com

Hay opciones pagas en esta plataforma freemium. Resultó ser la solitaria opción que podría administrar nuestro problema de PDF escaneado.

  • Puntuación: Bien.
  • Costo: GRATIS en la nube, $ 5 por mes o $ 49 por año para un servicio en la nube premium que ofrece un servicio más rápido y conversiones de lotes, software de escritorio $ 35 por un suministro de 30 días o $ 150 en el transcurso de la vida.
  • Pros: la opción gratuita es realmente funcional, funciona con PDF escaneados y's a un precio razonable.
  • Contras: no hay automatización en la nube o API (no lo hicimos't prueba el programa de escritorio); Las conversiones por lotes requieren una opción premium; Los datos de una sola fila con muchas líneas se dividen en múltiples filas.
  • Conclusión: buena simetría entre el precio y las características. Esto es cierto para los complicados PDF escaneados mejor, pero algunos funcionaron mejor cuando los datos celulares abarcan numerosas líneas.

Cometdocs

Este servicio basado en el sitio web es famoso por su capacidad para convertir muchos formatos de archivo: puede producir Excel, así como Word, PowerPoint, AutoCAD, HTML, OpenOffice y otros resultados. Se pueden convertir hasta cinco archivos (30 MB cada uno) con una cuenta gratuita por semana; Los clientes que pagan tienen derecho a un número infinito de conversiones (2 GB de datos cada día).

CometDocs apoya el periodismo del servicio público y proporciona a los miembros de reporteros y editores de investigación cuentas premium gratuitas (divulgación: tengo uno).

  • Puntuación: Bien.
  • Cinco conversiones gratuitas por semana; De lo contrario, los costos son de $ 10 por mes, $ 70 por año o $ 130 para toda la vida.
  • Pro: produce resultados típicamente buenos; realizado notablemente bien en un PDF de 2 páginas con un formato de tabla sofisticado. Trabaja con PDF escaneados. Formatos de entrada y salida múltiples.
  • Contras: divide datos de múltiples líneas de una fila a numerosas filas; no tan resistente en los complejos PDF escaneados como otras soluciones; Opción de script/automatización poco clara.
  • Conclusión: particularmente intrigante si'Interesado en las exportaciones a algo más que Excel y numerosos formatos.

Microsoft Excel

Muchas personas desconocen que Excel tiene una función de importación PDF directa, pero solo está disponible en las computadoras de Windows con una suscripción de Microsoft 365 o Office 365. Era una buena opción para el archivo sencillo, pero a medida que aumentaba la complejidad PDF, se hizo más difícil de utilizar. Personas que no están familiarizadas con Excel'S Power Query / Get & Transform Interface también puede encontrarlo desconcertante.

Cómo importar una hoja de cálculo de Excel desde un PDF: ir a datos>Obtener datos>Desde el archivo>Desde PDF en la barra de herramientas de cinta y elija su archivo. Tú'Probablemente solo tenga una opción para importar una sola tabla. Cuando lo selecciona, debe aparecer una vista previa de la tabla y una opción para cargarlo o alterar los datos antes de la carga. La tabla aparecerá en su hoja de Excel después de hacer clic en Cargar.

Esta es una opción rápida y relativamente directa para una sola tabla en una sola página. Esto también funciona bien si tiene numerosas tablas en un PDF de varias páginas siempre que cada tabla esté contenida en una sola página. Sin embargo, las cosas se vuelven un poco más complicadas y tú'Debe estar familiarizado con los métodos de consulta de potencia si tiene una tabla repartida en numerosas páginas PDF.

Comparar la transformación de datos de consulta de potencia con las alternativas es un poco injusto porque la salida de cualquiera de estos otros convertidores PDF a Excel podría importarse a Excel para la manipulación de la consulta de potencia.

  • Puntuación: Bien.
  • Costo: GRATIS con una suscripción de Windows a Microsoft 365 y Office 365.
  • Pro: Si está familiarizado con Power Query, puede hacer una gran cantidad de datos incorporados sin salir de Excel.
  • Contras: requiere una suscripción de Microsoft 365/Office 365 en Windows; Difícil de usar en cualquier PDF más simple; no'T trabajo con PDF escaneados.
  • En conclusión, vale la pena intentarlo si ya tiene Microsoft 365/Office 365 en Windows y tiene una tarea de conversión directa. Si está familiarizado con Power Query, debe probar esto para más conversiones PDF. (Si no't, Learning Power Query es una excelente habilidad para recoger para todos los usuarios de Excel). Pero tú'Probablemente sea mejor con otra opción si su PDF es más difícil y usted no'ya utiliza Power Query / Get & Transform.