Votre ressource complète pour les meilleurs outils pour PDF à exceller la conversion

Yvonne
Updated on 2022-10-25
Pour évaluer les données dans un fichier PDF, vous devez les extraire dans une feuille de calcul.Découvrez comment sept options pour convertir le PDF en Excel ont réussi dans les tests de comparaison en utilisant des sources de données progressivement plus difficiles.

Pour évaluer les données dans un fichier PDF, vous devez les extraire dans une feuille de calcul. Découvrez comment sept options pour convertir le PDF en Excel ont réussi dans les tests de comparaison en utilisant des sources de données progressivement plus difficiles.

cw pdf to excel

Les informations que nous devons évaluer seraient idéalement disponibles dans un format facilement utilisable. Mais dans le monde dans lequel nous vivons, de nombreuses informations importantes sont contenues dans les fichiers de format de document portables (PDF). Comment puis-je obtenir les informations des PDF et dans une feuille de calcul Excel? Vous pouvez choisir parmi une variété de convertisseurs PDF à Excel.

Il existe des logiciels de fabricants bien connus comme Adobe et Microsoft, des services cloud spécifiques aux tâches comme PDFTables, des services cloud à usage général comme Amazon et même des alternatives open source gratuites.

Quel pdf à exceller le convertisseur est le"meilleur"? Semblable à la"Meilleur ordinateur,"La réponse est basée sur votre propre situation.

Trois demandes à faire avant de sélectionner un convertisseur PDF à Excel

Lors du choix d'un convertisseur PDF, il existe un certain nombre de facteurs cruciaux à prendre en compte.

1. Mon PDF est-il une image numérisée ou a-t-elle été produite par un programme?

Les fichiers PDF peuvent être de deux types différents. Le premier est créé par un programme comme Microsoft Word, tandis que le second est dérivé d'un document numérisé ou d'un autre fichier d'image. Essayez de mettre en évidence un texte dans la page pour voir celui dont vous avez. Votre PDF a été créé par une application si vous pouvez mettre en surbrillance le texte avec un clic et glisser. Si ce n'est pas'T, un scan est requis. Certains logiciels de conversion PDF ne prennent pas en charge les PDF numérisés.

2. Dans quelle mesure l'architecture de données est-elle complexe?

Une table d'une page simple fonctionnera avec presque tous les outils. Lorsque les tables sont distribuées sur de nombreuses pages, lorsque les cellules de table sont combinées, ou lorsque certaines des données d'une cellule de table s'étendent sur plusieurs lignes, les choses deviennent plus difficiles.

3. Dois-je avoir besoin de conversions d'automatisation ou de fichiers batch puisque j'ai beaucoup de fichiers?

Si vous effectuez fréquemment des conversions par lots, notre solution qui produit les meilleurs PDF générés par l'application pourrait ne pas être l'option idéale pour vous.

De plus, comme pour toute sélection de programme, vous devez déterminer dans quelle mesure vous appréciez les performances par rapport au prix et à la convivialité.

Comment nous avons évalué le logiciel de conversion

Nous avons testé sept PDF pour exceller le logiciel de conversion à l'aide de quatre fichiers PDF différents, allant de facile à difficile, pour vous aider à déterminer ce qui est idéal pour vos tâches. Tu'Observez comment chaque outil fonctionne dans chaque circonstance et découvrez ses avantages et ses inconvénients.

How to convert a PDF to Excel for free

PDF testé pour exceller les convertisseurs

Les outils que nous avons évalués sont répertoriés ci-dessous, en commençant par nos meilleurs interprètes globaux (gardez à l'esprit que"meilleur"s'appuie en partie sur le document source particulier). Les classements de ces outils vont de"Excellent"à"Bien,"indiquant qu'ils ont tous effectué admirablement au moins certaines de nos tâches.

Adhésion à Adobe Acrobat Export PDF

Vous pouvez anticiper Adobe pour bien faire dans l'analyse PDF étant donné qu'il a développé la norme de format de document portable, et c'est le cas. Il y a une adhésion à la conversion complète assez coûteuse, mais il existe également une option de 2 $ / mois à faible coût (un abonnement annuel est requis) qui offre des conversions PDF illimitées à Excel. (Avec cet utilitaire, les fichiers Word Microsoft peuvent également être sortis.)

Tout texte sur les pages avec du texte et des tables est converti en format Excel. Cela peut être avantageux si vous souhaitez maintenir ce contexte ou désavantageux si vous avez simplement besoin des données pour de nouvelles recherches.

  • Excellent—Champion incontesté pour les PDF non balayés.
  • 24 $ par an.
  • Résultats exceptionnels, excellente gestion des tables couvrant plusieurs pages, conversions illimitées de fichiers jusqu'à 100 Mo et prix raisonnables pour les utilisateurs fréquents ne sont que quelques-uns des pros.
  • Inconvénients: si vous ne convertiez que quelques documents par an, il'est cher et il n'y a pas't toute procédure de script ou d'automatisation intégrée.
  • En conclusion, c'est une merveilleuse option si vous ne'T a besoin de scripter ou d'automatiser de nombreuses conversions et de ne pas'T MINDAGE PAYER 24 $ chaque année.

AWS Amazon textract

Textract'L'interface utilisateur est étonnamment simple pour un service Cloud AWS. Bien qu'il soit possible de configurer du textract via le processus de configuration et de codage standard en plusieurs étapes AWS, Amazon fournit également une démo Web glisser-déposer qui vous permet de télécharger les résultats sous forme de fichiers CSV zippés. Tout ce que vous avez à faire est de créer un compte Amazon AWS gratuit.

  • Excellent - c'était de loin le meilleur choix que nous aurions pu faire pour un PDF numérisé difficile.
  • Coût par page: 1,5 cents (100 pages par mois gratuitement pour vos trois premiers mois à AWS)
  • Avantages: fournit la possibilité de voir des résultats avec une disposition de cellules fusionnée ou non fusionnée; est simple à utiliser; est à un prix raisonnable; a été trouvé la meilleure option pour un PDF numérisé difficile.
  • Inconvénients: vous ne pouvez télécharger que 10 pages de fichiers à la fois. L'utilisation de cette API est plus délicate que certaines autres solutions pour les personnes qui souhaitent automatiser.
  • Conclusion: si vous ne faites pas'T Mister la configuration AWS et le téléchargement manuel ou le codage avec une API sophistiquée, c'est une excellente option.

Tabula

Essayez tabula si vous'Recherchez des logiciels gratuits et open source. Tabula est simple à installer et à utiliser, contrairement à certaines alternatives Python gratuites. De plus, il dispose d'une interface de ligne de commande et d'une interface de navigateur, ce qui le rend adapté à la fois pour l'utilisation ponctuelle et cliquer et les conversions par lots.

Malgré un problème avec le PDF difficile, Tabula a exceptionnellement bien fonctionné avec des PDF de complexité faible à modérée (comme le fait de nombreuses plateformes payantes). Sur Linux et Windows, Tabula a besoin d'une installation Java distincte.

  • Très belle note et le prix est imbattable.
  • Prix: gratuit
  • Avantages: gratuit; installation simple; GUI et options de script; Contrôle manuel sur les parties du site Web doit être vérifiée pour les tables; capacité d'exporter les résultats en tant que CSV, TSV, JSON ou script; Deux méthodes d'extraction de données.
  • Inconvénients: fonctionne uniquement avec les PDF créés par les applications; Formatage compliqué requise le nettoyage des données manuelles.
  • Conclusion: Si les possibilités de coût, d'utilisation et d'automatisation sont importantes pour vous et vos PDF'T scanné, c'est une solution décente.

Pdftables

L'automatisation de ce service est un avantage majeur. Son API est bien documentée et prend en charge une large gamme de langages de programmation, notamment Java, C ++, PHP, Python, R, Windows PowerShell et VBA (Office Visual Basic pour les applications).

La majorité des tables PDF créées par les applications fonctionnaient en douceur grâce à PDFTables, qui a même reconnu qu'une ligne d'en-tête à deux colonnes fonctionnerait le mieux comme une ligne d'en-tête à colonne. Bien que la plupart des colonnes soient vides, elle avait des problèmes avec les données dans les cellules qui ont été étirées sur deux lignes. Au moins ça n'a pas fait'T me chargez pour cela, même si cela s'étouffait sur le PDF numérisé du cauchemar.

  • Score global de très bon; Score d'automatisation exceptionnel.
  • 50 pages sont gratuites lorsque vous vous inscrivez, y compris l'utilisation de l'API. Vos crédits ne sont valables que pour un an après cela, et il en coûte 40 $ pour jusqu'à 1 000 pages.
  • Avantages: Excellente API; surpasse certains de ses concurrents payés sur le PDF modérément compliqué.
  • Inconvénients: cher, surtout si vous utilisez plus de pages que les 50 pages libres mais convertissez moins de 1 000 pages par an. Non applicable aux PDF numérisés.
  • Résumé: fonctionne bien et est simple à utiliser à la fois en ligne et via les scripts et la programmation. Cependant, si tu ne fais pas'T a besoin d'une API élégante, vous pourriez favoriser un choix moins cher.

Pdftoexcel.com

Il existe des options payantes sur cette plate-forme freemium. Il s'est avéré être l'option libre qui pourrait gérer notre problème de PDF numérisé.

  • Score: bon.
  • Coût: GRATUIT dans le cloud, 5 $ par mois ou 49 $ par an pour le service cloud premium qui offre un service plus rapide et des conversions par lots, un logiciel de bureau 35 $ pour une offre de 30 jours ou 150 $ au cours d'une vie.
  • Avantages: L'option gratuite est vraiment fonctionnelle, elle fonctionne avec des PDF numérisés, et il'est à prix raisonnable.
  • Inconvénients: il n'y a pas d'automatisation du cloud ou d'API (nous n'avons pas fait'T tester le programme de bureau); Les conversions par lots nécessitent une option premium; Les données à une seule rangée avec de nombreuses lignes sont divisées en plusieurs lignes.
  • Conclusion: Bonne symétrie entre le prix et les fonctionnalités. Cela était vrai pour le mieux pour les PDF numérisés compliqués, mais certains ont mieux performé lorsque les données cellulaires s'étendent sur de nombreuses lignes.

Cométraves

Ce service basé sur le site Web est célèbre pour sa capacité à convertir de nombreux formats de fichiers: il peut produire Excel ainsi que Word, PowerPoint, AutoCAD, HTML, OpenOffice et d'autres résultats. Jusqu'à cinq fichiers (30 Mo chacun) peuvent être convertis avec un compte gratuit par semaine; Les clients payants ont droit à un nombre infini de conversions (2 Go de données chaque jour).

CometDocs soutient le journalisme de service public et fournit aux membres des journalistes et éditeurs d'investigation des comptes premium gratuits (divulgation: j'en ai un).

  • Score: bon.
  • Cinq conversions gratuites par semaine; Sinon, les coûts sont de 10 $ par mois, 70 $ par an ou 130 $ pour une vie.
  • Pro: produit généralement de bons résultats; a réalisé remarquablement bien sur un PDF de 2 pages avec un format de table sophistiqué. Fonctionne avec des PDF numérisés. Plusieurs formats d'entrée et de sortie.
  • Inconvénients: divise les données multi-lignes d'une ligne dans de nombreuses lignes; Pas aussi résilient sur les PDF numérisés complexes que certaines autres solutions; Option de script / automatisation peu claire.
  • Conclusion: particulièrement intrigant si vous'Ce qui est intéressé par les exportations vers plus que Excel et de nombreux formats.

Microsoft Excel

Beaucoup de gens ne savent pas qu'Excel possède une fonction d'importation PDF directe, mais elle n'est disponible que sur les ordinateurs Windows avec un abonnement Microsoft 365 ou Office 365. C'était une bonne option pour le fichier simple, mais à mesure que la complexité du PDF augmentait, il est devenu plus difficile à utiliser. Les gens qui ne connaissent pas Excel'S Interface de requête / get & transformée de puissance peut également le trouver déroutant.

Comment importer une feuille de calcul Excel à partir d'un PDF: accédez aux données>Obtenir des données>À partir du fichier>À partir de PDF dans la barre d'outils du ruban et choisissez votre fichier. Tu'LL a probablement une option pour importer une seule table. Lorsque vous le sélectionnez, un aperçu du tableau et un choix pour le charger ou modifier les données avant le chargement doivent apparaître. Le tableau apparaîtra sur votre feuille Excel après avoir cliqué sur le chargement.

Il s'agit d'une option rapide et relativement simple pour une seule table sur une seule page. Cela fonctionne également bien si vous avez de nombreuses tables dans un PDF de plusieurs pages tant que chaque tableau est contenu sur une seule page. Cependant, les choses deviennent un peu plus compliquées et vous'LL doit être familier avec les méthodes de requête d'alimentation si vous avez un tableau réparti sur de nombreuses pages PDF.

La comparaison de la transformation des données de requête de puissance en alternatives est un peu injuste car la sortie de l'un de ces autres convertisseurs PDF à Excel pourrait être importé dans Excel pour la manipulation de la requête de puissance.

  • Score: bon.
  • Coût: GRATUIT avec un abonnement Windows à Microsoft 365 et Office 365.
  • Pro: Si vous connaissez Power Query, vous pouvez faire beaucoup de données de données intégrées sans quitter Excel.
  • Inconvénients: nécessite un abonnement Microsoft 365 / Office 365 sur Windows; Difficile à utiliser sur n'importe quel PDF les plus simples; ne fait pas'T œuvre avec des PDF numérisés.
  • En conclusion, Excel vaut la peine d'essayer si vous avez déjà Microsoft 365 / Office 365 sur Windows et que vous avez une affectation de conversion simple. Si vous connaissez Power Query, vous devriez essayer ceci pour plus de conversions PDF. (Si tu ne fais pas'T, Learning Power Query est une excellente compétence à ramasser pour tous les utilisateurs Excel.) Mais vous'est probablement mieux avec un autre choix si votre PDF est plus difficile et que vous ne faites pas't Utilisez déjà Power Query / Get & Transform.