Iompórtáil sonraí ó PDF go Excel trí Power Query

Is “spraoi” i gcónaí é sonraí a aistriú ó scarbhileog i gcomhad PDF go bileog Microsoft Excel. Go háirithe mura bhfuil bogearraí aitheantais costasacha agat mar FineReader nó rud éigin mar sin. De ghnáth ní bhíonn aon rud maith mar thoradh ar chóipeáil dhíreach, mar gheall ar. tar éis na sonraí cóipeáilte a ghreamú ar an mbileog, is dóichí go gcloífidh siad le chéile i gcolún amháin. Mar sin beidh orthu iad a dheighilt go cúramach le huirlis Téacs de réir colúin ón táb Dáta (Sonraí — Téacs go Colúin).

Agus ar ndóigh, ní féidir cóipeáil a dhéanamh ach amháin do na comhaid PDF sin ina bhfuil ciseal téacs, ie le doiciméad atá díreach scanadh ó pháipéar go PDF, ní oibreoidh sé seo i bprionsabal.

Ach níl sé chomh brónach, i ndáiríre 🙂

Má tá Office 2013 nó 2016 agat, ansin i gceann cúpla nóiméad, gan cláir bhreise, is féidir go leor sonraí a aistriú ó PDF go Microsoft Excel. Agus cabhróidh Word and Power Query linn leis seo.

Mar shampla, glacaimis an tuarascáil PDF seo le bunchóip de théacs, foirmlí agus táblaí ó shuíomh Gréasáin Choimisiún Eacnamaíochta na hEorpa:

Iompórtáil sonraí ó PDF go Excel trí Power Query

... agus déan iarracht é a tharraingt amach in Excel, abair an chéad tábla:

Iompórtáil sonraí ó PDF go Excel trí Power Query

A ligean ar dul!

Céim 1. Oscail PDF i Word

Ar chúis éigin, is beag duine a fhios, ach ó 2013 tá sé foghlamtha ag Microsoft Word comhaid PDF a oscailt agus a aithint (fiú cinn scanta, is é sin, gan ciseal téacs!). Déantar é seo ar bhealach iomlán caighdeánach: Word oscailte, cliceáil Comhad - Oscail (Comhad - Oscail) agus sonraigh an fhormáid PDF sa liosta anuas sa chúinne íochtarach ar dheis den fhuinneog.

Ansin roghnaigh an comhad PDF a theastaíonn uainn agus cliceáil Oscail (Oscailte). Insíonn Word dúinn go bhfuil sé chun OCR a rith ar an doiciméad seo chun téacs a chur:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Aontaímid agus i gceann cúpla soicind feicfidh muid ár PDF ar oscailt le haghaidh eagarthóireacht cheana féin i Word:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Ar ndóigh, beidh an dearadh, na stíleanna, na clónna, na ceanntásca agus na buntásca, etc. ag eitilt go páirteach as an doiciméad, ach níl sé seo tábhachtach dúinne - ní gá dúinn ach sonraí ó tháblaí. I bprionsabal, ag an gcéim seo, tá sé tempting cheana féin an tábla a chóipeáil ón doiciméad aitheanta go Word agus é a ghreamú go Excel. Uaireanta oibríonn sé, ach níos minice tá sé mar thoradh ar gach cineál saobhadh sonraí - mar shampla, is féidir uimhreacha iompú isteach i dátaí nó fanacht téacs, mar atá inár gcás, mar gheall ar. Úsáideann PDF neamhdheighilteoirí:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Mar sin, ná déanaimis coirnéil a ghearradh, ach déan gach rud beagán níos casta, ach ar dheis.

Céim 2: Sábháil an Doiciméad mar Leathanach Gréasáin

Chun na sonraí a fuarthas a luchtú ansin isteach i Excel (trí Power Query), ní mór ár ndoiciméad Word a shábháil i bhformáid an leathanaigh ghréasáin - is cineál comhainmneora í an fhormáid seo, sa chás seo, idir Word agus Excel.

Chun seo a dhéanamh, téigh go dtí an roghchlár Comhad - Sábháil Mar (Comhad - Sábháil Mar) nó brúigh an eochair F12 ar an méarchlár agus san fhuinneog a osclaíonn, roghnaigh an cineál comhaid Leathanach gréasáin i comhad amháin (Leathanach Gréasáin - Comhad singil):

Iompórtáil sonraí ó PDF go Excel trí Power Query

Tar éis duit a shábháil, ba cheart duit comhad a fháil leis an síneadh mhtml (má fheiceann tú síntí comhaid in Explorer).

Céim 3. An comhad a uaslódáil chuig Excel trí Power Query

Is féidir leat an comhad MHTML cruthaithe a oscailt in Excel go díreach, ach ansin gheobhaidh muid, ar an gcéad dul síos, a bhfuil sa PDF go léir ag an am céanna, mar aon le téacs agus sraith táblaí gan ghá, agus, sa dara háit, caillfimid sonraí arís mar gheall ar mhícheart. deighilteoirí. Mar sin, déanfaimid an allmhairiú isteach i Excel tríd an mbreiseán Power Query. Is breiseán iomlán saor in aisce é seo inar féidir leat sonraí a uaslódáil chuig Excel ó beagnach aon fhoinse (comhaid, fillteáin, bunachair shonraí, córais ERP) agus ansin na sonraí a fuarthas a athrú ar gach bealach is féidir, ag tabhairt an cruth atá ag teastáil dó.

Má tá Excel 2010-2013 agat, is féidir leat Power Query a íoslódáil ó láithreán gréasáin oifigiúil Microsoft - tar éis é a shuiteáil feicfidh tú cluaisín Ceist Chumhachta. Má tá Excel 2016 nó níos nuaí agat, ní gá duit aon rud a íoslódáil - tá an fheidhmiúlacht go léir ionsuite cheana féin in Excel de réir réamhshocraithe agus tá sé suite ar an táb Dáta (Dáta) i ngrúpa Íoslódáil agus Tiontaigh (Faigh & Trasfhoirmigh).

Mar sin téann muid chuig an táb ach an oiread Dáta, nó ar an táb Ceist Chumhachta agus roghnaigh foireann Chun sonraí a fháil or Cruthaigh Iarratas - Ó Chomhad - Ó XML. Chun comhaid XML amháin a bheith infheicthe, athraigh na scagairí sa liosta anuas sa chúinne íochtair ar dheis den fhuinneog go Gach comhad (Gach comhad) agus sonraigh ár gcomhad MHTML:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Tabhair faoi deara le do thoil nach gcríochnóidh an t-iompórtáil go rathúil, mar gheall ar. Tá Power Query ag súil le XML uainn, ach tá formáid HTML againn i ndáiríre. Mar sin, sa chéad fhuinneog eile atá le feiceáil, beidh ort cliceáil ar dheis ar an gcomhad dothuigthe do Power Query agus a fhormáid a shonrú:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Ina dhiaidh sin, aithneofar an comhad i gceart agus feicfimid liosta de na táblaí go léir atá ann:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Is féidir leat ábhar na dtáblaí a fheiceáil ach cliceáil ar an gcnaipe luiche ar chlé sa chúlra bán (ní sa fhocal Tábla!) de na cealla sa cholún Sonraí.

Nuair a shainítear an tábla atá ag teastáil, cliceáil ar an bhfocal glas tábla – agus “titeann tú tríd” isteach ina bhfuil ann:

Iompórtáil sonraí ó PDF go Excel trí Power Query

Tá roinnt céimeanna simplí fós le déanamh chun a bhfuil ann a “chíor”, mar atá:

  1. scrios colúin nach bhfuil gá leo (cliceáil ar dheis ar cheanntásc an cholúin - Bain)
  2. cuir camóga in ionad na poncanna (roghnaigh colúin, deaschliceáil - Luachanna a athsholáthar)
  3. bain comharthaí comhionanna sa cheanntásc (roghnaigh colúin, deaschliceáil - Luachanna a athsholáthar)
  4. bain an barr líne (Baile – Scrios línte – Scrios barrlínte)
  5. bhaint línte bána (Baile - Scrios línte - Scrios línte folamh)
  6. ardaigh an chéad ró go dtí ceanntásc an tábla (Baile – Úsáid an chéad líne mar cheannteidil)
  7. scagadh amach sonraí nach bhfuil gá leo ag baint úsáide as scagaire

Nuair a thugtar an tábla go dtí a ghnáthfhoirm, is féidir é a dhíluchtú ar an mbileog leis an ordú dhúnadh agus a íoslódáil (Dún & Luchtaigh) on An príomh- cluaisín. Agus gheobhaidh muid áilleacht den sórt sin ar féidir linn oibriú léi cheana féin:

Iompórtáil sonraí ó PDF go Excel trí Power Query

  • Colún a Athrú go Tábla le Ceist Cumhachta
  • Téacs greamaitheach a roinnt ina cholúin

Leave a Reply