Ваш комплексный ресурс для лучших инструментов для PDF для преобразования преобразования

Yvonne
Обновлено на 2022-10-25
Чтобы оценить данные в файле PDF, вы должны извлечь их в электронную таблицу.Узнайте, как семь вариантов преобразования PDF в Excel Far -Fars в тестировании на сравнение с использованием постепенно более сложных источников данных.

Чтобы оценить данные в файле PDF, вы должны извлечь их в электронную таблицу. Узнайте, как семь вариантов преобразования PDF в Excel Far -Fars в тестировании на сравнение с использованием постепенно более сложных источников данных.

cw pdf to excel

Информация, которая нам необходима для оценки, в идеале будет доступна в легко полезном формате. Но в мире, в котором мы живем, много важной информации содержится в файлах портативного формата документов (PDF). Как я могу получить информацию из PDF -файлов в электронную таблицу Excel? Вы можете выбрать из разных PDF в Excel Converters.

Существует программное обеспечение от известных производителей, таких как Adobe и Microsoft, облачные сервисы для конкретных задач, такие как PDFTABLES, общие облачные сервисы, такие как Amazon, и даже бесплатные альтернативы с открытым исходным кодом.

Какой PDF для преобразователя Excel - это"Лучший"? Похоже на"лучший компьютер,"Ответ основан на вашей собственной ситуации.

Три запроса, которые нужно сделать перед выбором PDF для преобразователя Excel

При выборе преобразователя PDF существует ряд важных факторов, которые следует учитывать.

1. Является ли мой PDF отсканированным изображением или его производили программой?

PDF -файлы могут быть двух разных видов. Первый создается программой, такой как Microsoft Word, тогда как второе получено из отсканированного документа или другого файла изображения. Попробуйте выделить немного текста на странице, чтобы увидеть, какой из них у вас есть. Ваш PDF был создан приложением, если вы можете выделить текст с помощью щелчка и перетаскивания. Если это не так'Т, требуется сканирование. Некоторое программное обеспечение для преобразования PDF не поддерживает отсканированные PDF -файлы.

2. Насколько сложна архитектура данных?

Прямой одностраничный стол будет работать практически с каждым инструментом. Когда таблицы распределяются на многочисленных страницах, когда ячейки таблицы объединяются, или когда некоторые данные в табличной ячейке охватывают несколько линий, все становится более сложным.

3. Требуются ли мне автоматизационные или пакетные преобразования файлов, так как у меня много файлов?

Если вы часто делаете пакетные преобразования, наше решение, которое создает лучшие PDF-файлы, созданные приложениями, может не быть идеальным вариантом для вас.

Кроме того, как и в любом выборе программы, вы должны определить, насколько вы цените производительность по сравнению с ценой и удобством для использования.

Как мы оценили программное обеспечение для преобразования

Мы протестировали семь PDF для преобразования программного обеспечения Excel, используя четыре различных файла PDF, от простого до трудного, чтобы помочь вам определить, что идеально подходит для ваших задач. Ты'LL отмечает, как каждый инструмент работает в каждом обстоятельстве, и узнайте о его преимуществах и недостатках.

How to convert a PDF to Excel for free

Протестировано PDF для преобразователей Excel

Инструменты, которые мы оценили, перечислены ниже, начиная с наших главных общих исполнителей (имейте в виду, что"Лучший"частично полагается на конкретный исходный документ). Рейтинги для этих инструментов варьируются от"Превосходно"к"Хороший,"указывая на то, что все они превосходно выступали, по крайней мере, на некоторых наших задачах.

Членство в экспорте Adobe Acrobat PDF

Вы можете ожидать, что Adobe будет хорошо преуспеть в анализе PDF, учитывая, что он разработал стандарт формата портативного документа, и это так. Существует довольно дорогое полнофункциональное членство в конверсии, но существует также недорогой вариант в размере 2 долл. США в месяц (требуется годовая подписка), которая предлагает безграничный PDF для преобразования Excel. (С помощью этой утилиты файлы Microsoft Word также могут быть выведены.)

Любой текст на страницах с текстом и таблицами преобразуется в формат Excel. Это может быть выгодно, если вы хотите сохранить этот контекст или невыгодное, если вам просто нужны данные для дальнейших исследований.

  • Превосходно—Бесспорный чемпион для не сканированных PDF.
  • 24 доллара в год.
  • Выдающиеся результаты, отличная обработка таблиц, охватывающих несколько страниц, неограниченные преобразования файлов до 100 МБ и разумные цены для частых пользователей - это лишь некоторые из профессионалов.
  • Минусы: если вы конвертируете только несколько документов в год, это'S дорого и там'T любая встроенная процедура сценариев или автоматизации.
  • В заключение, это замечательный вариант, если вы надете'Не нужно сценарии или автоматизировать многие преобразования и не'T Mind платит 24 доллара в год.

AWS Amazon Textract

Textract'S пользовательский интерфейс на удивление прост для облачной службы AWS. Несмотря на то, что можно настроить Textract через стандартный многоэтапный процесс настройки и кодирования AWS, Amazon также предоставляет демонстрацию перетаскивания, которая позволяет загружать результаты в виде файлов CSV с помощью ZEPP. Все, что вам нужно сделать, это создать бесплатную учетную запись Amazon AWS.

  • Отлично - это был лучший выбор, который мы могли сделать для сложного сканированного PDF.
  • Стоимость за страницу: 1,5 цента (100 страниц в месяц бесплатно в течение первых трех месяцев в AWS)
  • Плюсы: предоставляет возможность увидеть результаты с объединенной или неэтажной компоновкой ячейки; прост в использовании; по разумной цене; Было установлено, что является лучшим вариантом для сложного сканированного PDF.
  • Минусы: вы можете загрузить только 10 страниц файлов одновременно. Использование этого API сложнее, чем некоторые другие решения для людей, которые хотят автоматизировать.
  • Заключение: если вы надеваете'Посмотрите на настройку AWS и либо ручную загрузку, либо кодирование с сложным API, это отличный вариант.

Табула

Попробуйте Табулу, если вы'Повторный поиск бесплатного и программного обеспечения с открытым исходным кодом. Табула прост в установке и использовании, в отличие от некоторых бесплатных альтернатив Python. Кроме того, он имеет интерфейс командной строки и интерфейс браузера, что делает его подходящим как для использования точки и щелчка, так и для преобразования партий.

Несмотря на проблему с трудным PDF, Tabula отлично показала PDF -файлы с низкой или умеренной сложностью (как и многие платные платформы). На Linux и Windows Tabula нужна отдельная установка Java.

  • Очень хороший рейтинг, и цена непревзойденная.
  • Цена: бесплатно
  • Плюсы: бесплатно; Прямая установка; Варианты графического интерфейса и сценариев; Ручной контроль над тем, какие части сайта следует проверить на таблицы; способность экспортировать результаты как CSV, TSV, JSON или сценарий; Два метода извлечения данных.
  • Минусы: работает только с формами PDF, созданных приложениями; Сложное форматирование требуется ручное очищение данных.
  • Заключение: если для вас важны стоимость, удобство использования и автоматизация.'T отсканировал, это приличное решение.

Pdftables

Автоматизация этой услуги является основным преимуществом. Его API хорошо документирован и поддерживает широкий спектр языков программирования, включая Java, C ++, PHP, Python, R, Windows PowerShell и VBA (Office Visual Basic для приложений).

Большинство таблиц PDF, созданные приложениями, прошло гладко благодаря PDFTABLES, что даже признало, что строка заголовка с двумя столбцами будет работать лучше всего в качестве ряда заголовка с одним столбцом. Хотя большинство столбцов были пустыми, у него были некоторые проблемы с данными в клетках, которые были растянуты по двум линиям. По крайней мере, это не так'T зарядите меня за это, даже если это задыхалось от сканируемого PDF кошмара.

  • Общий балл очень хорошего; Оценка автоматизации исключительного.
  • 50 страниц бесплатны при регистрации, включая использование API. Ваши кредиты действительны только в течение года после этого, и это стоит 40 долларов США на 1000 страниц.
  • Плюсы: отличный API; Превзошено некоторых своих платных конкурентов в умеренно сложном PDF.
  • Минусы: дорого, особенно если вы используете больше страниц, чем 50 бесплатных страниц, но конвертируете менее 1000 страниц в год. Не применимо к отсканированным PDF.
  • Резюме: хорошо функционирует и прост в использовании как онлайн, так и с помощью сценариев и программирования. Однако, если вы не надо'Т требуется элегантный API, вы можете предположить, что вы можете поддержать менее дорогой выбор.

Pdftoexcel.com

На этой платформе Freemium есть платные варианты. Оказалось, что это был одинокий вариант, который мог бы справиться с нашей проблемой сканированного PDF.

  • Счет: хорошо.
  • Стоимость: бесплатно в облаке, 5 долларов США в месяц или 49 долларов в год для облачного сервиса премиум-класса, который предлагает более быстрые услуги и конверсии партии, настольное программное обеспечение $ 35 за 30-дневную поставку или 150 долларов в течение всей жизни.
  • Плюсы: бесплатный вариант действительно функциональный, он работает со сканируемыми PDF -файлами, и он'S по разумной цене.
  • Минусы: нет автоматизации облаков или API (мы не сделали't тестирование программы рабочего стола); Партийные преобразования требуют премиального варианта; Данные с одним рядом со многими линиями разбиваются на несколько строк.
  • Вывод: хорошая симметрия между ценой и функциями. Это было верно для сложных сканированных PDFS лучше всего, но некоторые работали лучше, когда данные ячейки охватывают многочисленные линии.

Cometdocs

Этот сервис на основе веб-сайтов известен своей способностью конвертировать многие форматы файлов: он может создавать Excel, а также Word, PowerPoint, AutoCAD, HTML, OpenOffice и другие результаты. До пяти файлов (30 МБ каждый) могут быть преобразованы с бесплатной учетной записью в неделю; Платные клиенты имеют право на бесконечное количество конверсий (2 ГБ данных каждый день).

Cometdocs поддерживает журналистику государственной службы и предоставляет членам расследователей журналистов и редакторов бесплатных премиальных учетных записей (раскрытие: у меня есть).

  • Счет: хорошо.
  • Пять бесплатных конверсий в неделю; В противном случае расходы составляют 10 долларов в месяц, 70 долларов в год или 130 долларов за всю жизнь.
  • Pro: дает обычно хорошие результаты; Удивительно хорошо выполнил 2-страничный PDF с сложным форматом таблицы. Работает со сканированными PDF. Несколько входных и выходных форматов.
  • Минусы: разбивает многострочные данные из одной строки в многочисленные строки; не так устойчиво на сложных сканированных PDF, как некоторые другие решения; Непонятный сценарий/опция автоматизации.
  • Заключение: особенно интригует, если вы'Заинтересованы в экспорте больше, чем просто превзойти и многочисленные форматы.

Майкрософт Эксель

Многие люди не знают, что Excel имеет прямой функцию импорта PDF, но она доступна только на компьютерах Windows с подпиской Microsoft 365 или Office 365. Это был хороший вариант для простого файла, но по мере увеличения сложности PDF его стало сложнее. Люди, которые не знакомы с Excel'S Power Query / Get & Transform Interface также может найти его сбивает с толку.

Как импортировать электронную таблицу Excel из PDF: перейти к данным>Получить данные>Из файла>Из PDF на панели инструментов ленты и выберите ваш файл. Ты'У LL, вероятно, есть один вариант для импорта одной таблицы. Когда вы выбираете его, должен быть предварительный просмотр таблицы и выбор для его загрузки или изменить данные перед загрузкой. Таблица появится на вашем листе Excel после нажатия Load.

Это быстрый и сравнительно простой вариант для одной таблицы на одной странице. Это также работает хорошо, если у вас есть многочисленные таблицы в многостраничном PDF, если каждая таблица содержится на одной странице. Тем не менее, все становится немного сложнее, и вы'LL необходимо быть знакомым с методами запроса питания, если у вас есть одна таблица, разбросанная по многочисленным страницам PDF.

Сравнение преобразования данных запросов электроэнергии с альтернативами немного несправедливо, потому что вывод любого из этих других PDF для преобразователей Excel может быть импортирован в Excel для манипулирования электроэнергией.

  • Счет: хорошо.
  • Стоимость: бесплатно с подпиской Windows на Microsoft 365 и Office 365.
  • Pro: Если вы знакомы с Power Query, вы можете сделать много встроенных данных, не покидая Excel.
  • Минусы: требует подписки Microsoft 365/Office 365 в Windows; Трудно использовать любой, кроме самых простых PDF; не'T Работа со сканируемыми PDF.
  • В заключение, Excel стоит попробовать, если у вас уже есть Microsoft 365/Office 365 в Windows, и у вас есть прямое задание конверсии. Если вы знакомы с запросом Power, вы должны попробовать еще больше конверсий в PDF. (Если вы не надо'T, учебный запрос - отличный навык для всех пользователей Excel.) Но вы'Re, вероятно, лучше с другим выбором, если ваш PDF сложнее, и вы не надеваете't уже используют энергетический запрос / Get & Transform.