Import Daten aus PDF op Excel iwwer Power Query

D'Aufgab fir Daten vun enger Tabellen an enger PDF Datei op e Microsoft Excel Blat ze transferéieren ass ëmmer "Spaass". Besonnesch wann Dir keng deier Unerkennungssoftware wéi FineReader oder sou eppes hutt. Direkt kopéieren féiert normalerweis net zu eppes Guddes, well. nodeems se déi kopéiert Donnéeën op de Blat gepecht hunn, wäerte se héchstwahrscheinlech an eng Kolonn "zesummenhalen". Also mussen se dann ustrengend mat engem Tool getrennt ginn Text duerch Kolonnen vum Tab Daten (Daten - Text zu Kolonnen).

An natierlech kann een nëmme fir déi PDF Dateien kopéieren wou et eng Textschicht gëtt, also mat engem Dokument dat just vu Pabeier op PDF gescannt ass, dat funktionnéiert am Prinzip net.

Mä et ass net sou traureg, wierklech 🙂

Wann Dir Office 2013 oder 2016 hutt, dann an e puer Minutten, ouni zousätzlech Programmer, ass et ganz méiglech Daten aus PDF op Microsoft Excel ze transferéieren. A Word a Power Query hëlleft eis an dësem.

Loosst eis zum Beispill dëse PDF-Rapport mat enger Rëtsch Texter, Formelen an Dëscher vun der Websäit vun der Wirtschaftskommissioun fir Europa huelen:

Import Daten aus PDF op Excel iwwer Power Query

... a probéiert et an Excel eraus ze zéien, sot déi éischt Tabell:

Import Daten aus PDF op Excel iwwer Power Query

Lass!

Schrëtt 1. Open PDF am Word

Aus e puer Grënn wëssen wéineg Leit, awer zënter 2013 huet Microsoft Word geléiert PDF Dateien opzemaachen an z'erkennen (och gescannt, dat heescht ouni Textschicht!). Dëst gëtt op eng komplett Standard Manéier gemaach: Word opmaachen, klickt Datei - Open (Datei - Open) a spezifizéiert de PDF-Format an der Dropdown-Lëscht an der ënneschter rechter Ecke vun der Fënster.

Da wielt déi PDF Datei déi mir brauchen a klickt Open (Opmaachen). Word seet eis datt et OCR op dësem Dokument op Text leeft:

Import Daten aus PDF op Excel iwwer Power Query

Mir stëmmen d'accord an an e puer Sekonnen gesi mer eisen PDF opgemaach fir schonn am Word z'änneren:

Import Daten aus PDF op Excel iwwer Power Query

Natierlech fléien den Design, Stiler, Schrëften, Header a Fousszeilen, asw. Am Prinzip, op dëser Etapp, ass et scho verlockend einfach den Dësch aus dem unerkannten Dokument an Word ze kopéieren an einfach an Excel Paste. Heiansdo funktionnéiert et, awer méi dacks féiert et zu all Zorte vun Dateverzerrungen - zum Beispill kënnen d'Zuelen an d'Datume verwandelen oder Text bleiwen, wéi an eisem Fall, well. PDF benotzt Net-Separatoren:

Import Daten aus PDF op Excel iwwer Power Query

Also loosst eis net Ecken schneiden, awer alles e bësse méi komplizéiert maachen, awer richteg.

Schrëtt 2: Späichert d'Dokument als Websäit

Fir dann déi empfaangen Donnéeën an Excel (iwwer Power Query) ze lueden, muss eist Dokument am Word am Websäitformat gespäichert ginn - dëst Format ass an dësem Fall eng Aart gemeinsame Nenner tëscht Word an Excel.

Fir dëst ze maachen, gitt op de Menü Datei - Späicheren als (Datei - späicheren als) oder Press de Schlëssel F12 op der Tastatur an an der Fënster déi opmaacht, wielt de Dateityp Websäit an engem Fichier (Websäit - Eenzeldatei):

Import Daten aus PDF op Excel iwwer Power Query

Nodeems Dir gespäichert hutt, sollt Dir e Fichier mat der mhtml Extensioun kréien (wann Dir Dateierweiterungen am Explorer gesitt).

Etapp 3. Eroplueden der Datei op Excel via Power Query

Dir kënnt déi erstallt MHTML-Datei direkt an Excel opmaachen, awer da kréie mir éischtens all den Inhalt vum PDF gläichzäiteg, zesumme mat Text an eng Rëtsch onnéideg Dëscher, an zweetens wäerte mir erëm Daten verléieren wéinst falschen separators. Dofir maache mir den Import an Excel duerch den Power Query Add-in. Dëst ass e komplett gratis Add-on, mat deem Dir Daten op Excel vu bal all Quell eropluede kënnt (Dateien, Ordner, Datenbanken, ERP Systemer) an dann déi empfangen Donnéeën op all méiglech Manéier transforméieren, sou datt et déi gewënscht Form gëtt.

Wann Dir Excel 2010-2013 hutt, da kënnt Dir Power Query vun der offizieller Microsoft Websäit eroflueden - no der Installatioun gesitt Dir e Tab Muecht Ufro. Wann Dir Excel 2016 oder méi nei hutt, da musst Dir näischt eroflueden - all d'Funktionalitéit ass scho Standard an Excel agebaut a läit op der Tab Daten (Datum) am Grupp Eroflueden an Convertéieren (Kréien & Transforméieren).

Also gi mir entweder op d'Tab Daten, oder op der Tab Muecht Ufro a wielt eng Equipe Fir Daten ze kréien or Erstellt Ufro - Vun Datei - Vun XML. Fir net nëmmen XML-Dateien sichtbar ze maachen, ännert d'Filtere an der Dropdown-Lëscht an der ënneschter rechter Ecke vun der Fënster op All Dateien (All Dateien) a spezifizéiert eis MHTML Datei:

Import Daten aus PDF op Excel iwwer Power Query

Maacht weg datt den Import net erfollegräich ofgeschloss ass, well. Power Query erwaart XML vun eis, awer mir hunn tatsächlech en HTML Format. Dofir, an der nächster Fënster déi erschéngt, musst Dir mat der rietser Maustast klickt op d'Datei onverständlech fir Power Query a spezifizéieren säin Format:

Import Daten aus PDF op Excel iwwer Power Query

Duerno gëtt d'Datei korrekt unerkannt a mir gesinn eng Lëscht vun all den Dëscher déi et enthält:

Import Daten aus PDF op Excel iwwer Power Query

Dir kënnt d'Inhalter vun den Dëscher kucken andeems Dir op de lénksen Maustast am wäissen Hannergrond klickt (net am Wuert Table!) vun den Zellen an der Kolonn Daten.

Wann de gewënschte Dësch definéiert ass, klickt op de grénge Wuert Dësch - an Dir "fällt duerch" an säin Inhalt:

Import Daten aus PDF op Excel iwwer Power Query

Et bleift e puer einfache Schrëtt ze maachen fir säin Inhalt ze "kämmen", nämlech:

  1. onnéideg Spalten läschen (riets klickt op de Kolonn Header - ewechhuelen)
  2. ersetzen Punkte mat Komma (wielt Spalten, klickt op - Wäerter ersetzen)
  3. Ewechzehuelen Gläichzeechen am Header (wielt Spalten, klickt riets - Wäerter ersetzen)
  4. ewechzehuelen déi iewescht Linn (Home - Linnen läschen - Top Linnen läschen)
  5. ewechzehuelen eidel Linnen (Home - Zeilen läschen - eidel Zeilen läschen)
  6. erhéijen déi éischt Zeil op den Dësch Header (Home - Benotzt éischt Zeil als Rubriken)
  7. filtert onnéideg Donnéeën mat engem Filter aus

Wann den Dësch op seng normal Form bruecht gëtt, kann en op d'Blat mat dem Kommando entlooss ginn zoumaachen an erofzelueden (Zoumaachen & Lueden) on der Haaptentrée tab. A mir kréien esou Schéinheet mat där mir scho kënne schaffen:

Import Daten aus PDF op Excel iwwer Power Query

  • Transforméiere vun enger Kolonn an eng Tabell mat Power Query
  • Klebstoff Text a Spalten opzedeelen

Hannerlooss eng Äntwert