Seu recurso abrangente para as principais ferramentas para o PDF para Excel Conversão

Yvonne
Updated on 2022-10-25
Para avaliar os dados em um arquivo PDF, você deve extraí -los para uma planilha.Aprenda como sete opções para converter o PDF para Excel se saíram nos testes de comparação usando fontes de dados progressivamente mais difíceis.

Para avaliar os dados em um arquivo PDF, você deve extraí -los para uma planilha. Aprenda como sete opções para converter o PDF para Excel se saíram nos testes de comparação usando fontes de dados progressivamente mais difíceis.

cw pdf to excel

As informações que precisamos avaliar estariam idealmente disponíveis em um formato facilmente utilizável. Mas no mundo em que vivemos, muitas informações importantes estão contidas nos arquivos portáteis de formato de documentos (PDF). Como posso obter as informações de PDFs e em uma planilha do Excel? Você pode escolher de uma variedade de conversores PDF para Excel.

Há software de fabricantes conhecidos como Adobe e Microsoft, serviços em nuvem específicos de tarefas, como PDFTABLES, serviços em nuvem de uso geral como a Amazon e até alternativas gratuitas de código aberto.

Qual conversor de PDF para Excel é o"melhor"? Semelhante ao"Melhor computador,"A resposta é baseada em sua própria situação.

Três consultas a serem feitas antes de selecionar um conversor PDF para Excel

Ao escolher um conversor em PDF, há vários fatores cruciais a serem levados em consideração.

1. Meu PDF é uma imagem digitalizada ou foi produzida por um programa?

Os arquivos PDF podem ter dois tipos diferentes. O primeiro é criado por um programa como o Microsoft Word, enquanto o segundo é derivado de um documento digitalizado ou outro arquivo de imagem. Tente destacar algum texto na página para ver qual você tem. Seu PDF foi criado por um aplicativo se você pode destacar o texto com um clique e arrastar. Se não for't, uma varredura é necessária. Algum software de conversão de PDF não suporta PDFs digitalizados.

2. Quão complexa é a arquitetura de dados?

Uma tabela direta de uma página funcionará com quase todas as ferramentas. Quando as tabelas são distribuídas em várias páginas, quando as células da tabela são combinadas ou quando alguns dos dados em uma célula de tabela abrangem várias linhas, as coisas se tornam mais desafiadoras.

3. Preciso de conversões de automação ou arquivo em lote, pois tenho muitos arquivos?

Se você frequentemente fizer conversões em lote, nossa solução que produz os melhores PDFs gerados por aplicativos pode não ser a opção ideal para você.

Além disso, como em qualquer seleção do programa, você deve determinar quanto valoriza o desempenho em relação ao preço e à usabilidade.

Como avaliamos o software de conversão

Testamos sete software de conversão PDF para Excel usando quatro arquivos PDF diferentes, variando de fácil a difícil, para ajudar você a determinar qual é o ideal para suas tarefas. Você'Observarei como cada ferramenta executa em cada circunstância e aprende sobre suas vantagens e desvantagens.

How to convert a PDF to Excel for free

PDF testado para Excel conversores

As ferramentas que avaliamos estão listadas abaixo, começando com nossos melhores artistas em geral (lembre -se de que"melhor"conta em parte no documento de origem específico). As classificações para essas ferramentas variam de"Excelente"para"Bom,"indicando que todos eles tiveram desempenho admirável em pelo menos algumas de nossas tarefas.

Associação para a Adobe Acrobat Export PDF

Você pode antecipar a Adobe se sair bem na análise do PDF, uma vez que desenvolveu o padrão de formato de documento portátil e o faz. Há uma associação de conversão completa bastante cara, mas também há uma opção de US $ 2/mês de baixo custo (é necessária uma assinatura anual) que oferece conversões de PDF ilimitadas para excel. (Com esse utilitário, os arquivos do Microsoft Word também podem ser emitidos.)

Qualquer texto em páginas com texto e tabelas é convertido em um formato do Excel. Isso pode ser vantajoso se você quiser manter esse contexto ou desvantajoso se você apenas precisar dos dados para mais pesquisas.

  • Excelente—Campeão indiscutível para PDFs não escapados.
  • US $ 24 por ano.
  • Resultados excelentes, excelente manuseio de tabelas abrangendo várias páginas, conversões ilimitadas de arquivos de até 100 MB e preços razoáveis ​​para usuários frequentes são apenas alguns dos profissionais.
  • Contras: Se você converter apenas alguns documentos por ano, ele's caro e não há't Qualquer procedimento de script ou automação interno.
  • Em conclusão, esta é uma opção maravilhosa se você não'preciso de script ou automatizar muitas conversões e não'T MENTE pagando US $ 24 a cada ano.

AWS Amazon Textract

Textract's A interface do usuário é surpreendentemente simples para um serviço em nuvem da AWS. Embora seja possível configurar o Textract através do processo de configuração e codificação AWS de várias etapas padrão, a Amazon também fornece uma demonstração da Web de arrastar e soltar que permite baixar os resultados como arquivos CSV com zíper. Tudo o que você precisa fazer é criar uma conta gratuita da Amazon AWS.

  • Excelente - essa foi de longe a melhor escolha que poderíamos ter feito para um PDF digitalizado desafiador.
  • Custo por página: 1,5 centavos (100 páginas por mês grátis para seus primeiros três meses na AWS)
  • Prós: fornece a opção de ver os resultados com o layout de células mesclado ou não ridículo; é simples de usar; tem preços razoáveis; Foi considerado a melhor opção para um PDF digitalizado desafiador.
  • Contras: Você pode fazer upload apenas de 10 páginas de arquivos de uma só vez. O uso dessa API é mais complicado do que algumas outras soluções para indivíduos que desejam automatizar.
  • Conclusão: Se você não'T Mosting a configuração da AWS e o upload manual ou a codificação com uma API sofisticada, esta é uma ótima opção.

Tabula

Tente tabula se você'está procurando um software gratuito e de código aberto. O Tabula é simples de instalar e usar, em contraste com algumas alternativas gratuitas do Python. Além disso, ele possui uma interface de linha de comando e uma interface do navegador, tornando-o adequado para conversões de uso e clique e conversões em lote.

Apesar de ter um problema com o PDF difícil, o Tabula teve um desempenho excepcionalmente bem com PDFs de complexidade baixa a moderada (assim como muitas das plataformas pagas). No Linux e Windows, o Tabula precisa de uma instalação Java separada.

  • Classificação muito boa, e o preço é imbatível.
  • Preço: grátis
  • Prós: grátis; instalação direta; GUI e opções de script; Controle manual sobre quais partes do site devem ser verificadas quanto a tabelas; Capacidade de exportar resultados como CSV, TSV, JSON ou Script; Dois métodos para extrair dados.
  • Contras: funciona apenas com PDFs criados por aplicativos; Formatação complicada necessária a limpeza manual de dados.
  • Conclusão: Se o custo, a usabilidade e as possibilidades de automação são importantes para você e seus PDFs não'T digitalizado, esta é uma solução decente.

Pdftables

A automação deste serviço é um grande benefício. Sua API está bem documentada e suporta uma ampla gama de linguagens de programação, incluindo Java, C ++, PHP, Python, R, Windows PowerShell e VBA (Office Visual Basic for Applications).

A maioria das tabelas PDF criadas pelos aplicativos correu sem problemas, graças ao PDFTABLES, que até reconheceu que uma linha de cabeçalho de duas colunas funcionaria melhor como uma linha de cabeçalho de uma única coluna. Embora a maioria das colunas estivesse vazia, ela tinha alguns problemas com dados em células que foram esticadas em duas linhas. Pelo menos não fez'Não me cobre por isso, mesmo que tenha engasgado com o PDF digitalizado do pesadelo.

  • Pontuação geral de muito bom; Pontuação de automação de excepcional.
  • 50 páginas são gratuitas quando você se inscreve, incluindo o uso da API. Seus créditos são válidos apenas por um ano depois disso e custam US $ 40 por até 1.000 páginas.
  • Prós: Excelente API; Supera alguns de seus concorrentes pagos no PDF moderadamente complicado.
  • Contras: Caro, especialmente se você usar mais páginas do que as 50 páginas gratuitas, mas converter menos de 1.000 páginas anualmente. Não aplicável a PDFs digitalizados.
  • Resumo: Funciona bem e é simples de usar on -line e através de scripts e programação. No entanto, se você não'T requer uma API elegante, você pode favorecer uma escolha mais barata.

Pdftoexcel.com

Existem opções pagas nesta plataforma freemium. Acabou sendo a opção isolada que poderia gerenciar nosso problema de PDF digitalizado.

  • Pontuação: Bom.
  • Custo: Grátis na nuvem, US $ 5 por mês ou US $ 49 por ano para serviços em nuvem premium que oferecem conversões mais rápidas de serviço e lote, software de desktop $ 35 para uma oferta de 30 dias ou US $ 150 ao longo de uma vida.
  • Prós: a opção gratuita é realmente funcional, funciona com PDFs digitalizados e'é um preço razoável.
  • Contras: não há automação ou API em nuvem (nós não fizemos't teste o programa de desktop); As conversões em lote exigem uma opção premium; Dados de fila única com muitas linhas são divididos em várias linhas.
  • Conclusão: boa simetria entre preço e recursos. Isso é verdade para o melhor PDFs digitalizado complicado, mas alguns tiveram melhor desempenho quando os dados celulares abrangem inúmeras linhas.

COMETDOCS

Este serviço baseado no site é famoso por sua capacidade de converter muitos formatos de arquivo: pode produzir Excel, bem como Word, PowerPoint, AutoCAD, HTML, OpenOffice e outros resultados. Até cinco arquivos (30 MB cada) podem ser convertidos com uma conta gratuita por semana; Os clientes pagantes têm direito a um número infinito de conversões (2 GB de dados todos os dias).

O COMETDOCS apóia o jornalismo de serviço público e fornece membros de repórteres e editores investigativos com contas premium gratuitas (divulgação: eu tenho uma).

  • Pontuação: Bom.
  • Cinco conversões gratuitas por semana; Caso contrário, os custos são de US $ 10 por mês, US $ 70 por ano ou US $ 130 por toda a vida.
  • Pro: produz resultados normalmente bons; realizou-se notavelmente bem em um PDF de 2 páginas com um formato de tabela sofisticado. Trabalha com PDFs digitalizados. Múltiplos formatos de entrada e saída.
  • Contras: divide dados de várias linhas de uma linha em inúmeras linhas; não tão resiliente em PDFs complexos digitalizados quanto em algumas outras soluções; Opção de script/automação pouco claro.
  • Conclusão: particularmente intrigante se você'está interessado em exportações para mais do que apenas excel e numerosos formatos.

Microsoft Excel

Muitas pessoas não sabem que o Excel possui um recurso de importação em PDF direto, mas está disponível apenas em computadores do Windows com uma assinatura do Microsoft 365 ou do Office 365. Era uma boa opção para o arquivo direto, mas à medida que a complexidade do PDF aumentava, tornou -se mais difícil de utilizar. Pessoas que não estão familiarizadas com o Excel'S Power Query / Get & Transform Interface também pode achar desconcertante.

Como importar uma planilha do Excel de um PDF: vá para dados>Obter dados>De arquivo>Do PDF na barra de ferramentas da faixa de opções e escolha seu arquivo. Você'Provavelmente, só tenho uma opção para importar uma única tabela. Quando você o seleciona, uma visualização da tabela e uma opção para carregá -la ou alterar os dados antes de carregar devem aparecer. A tabela aparecerá na sua planilha do Excel depois de clicar em carregar.

Esta é uma opção rápida e comparativamente direta para uma única tabela em uma única página. Isso também funciona bem se você tiver inúmeras tabelas em um PDF de várias páginas, desde que cada tabela esteja contida em uma única página. No entanto, as coisas se tornam um pouco mais complicadas e você'Eu precisará estar familiarizado com os métodos de consulta de energia se você tiver uma tabela espalhada por inúmeras páginas em PDF.

Comparar a transformação dos dados da consulta de energia com as alternativas é um pouco injusto, porque a saída de qualquer um desses outros conversores de PDF para Excel pode ser importado no Excel para manipulação de consultas de energia.

  • Pontuação: Bom.
  • Custo: Grátis com uma assinatura do Windows no Microsoft 365 e Office 365.
  • PRO: Se você está familiarizado com a consulta de energia, pode fazer muitas disputas de dados embutidas sem sair do Excel.
  • Contras: requer uma assinatura Microsoft 365/Office 365 no Windows; difícil de usar em qualquer um dos PDFs mais simples; não'T trabalho com PDFs digitalizados.
  • Em conclusão, o Excel vale a pena tentar se você já tiver o Microsoft 365/Office 365 no Windows e você terá uma tarefa de conversão direta. Se você estiver familiarizado com a consulta de energia, experimente mais conversões em PDF. (Se você não'T, Aprendendo o poder da consulta é uma excelente habilidade para obter para todos os usuários do Excel.) Mas você'provavelmente está melhor com outra opção se o seu pdf for mais difícil e você não'J Já utiliza a consulta / get & transformada de energia.