| | |
| Stránka: 1 z 1
| [ Príspevkov: 3 ] | |
Autor | Správa |
---|
Registrovaný: 14.05.13 Prihlásený: 12.03.24 Príspevky: 122 Témy: 47 | Napísal jumper: 04.02.2020 14:47 | |
|
zdravim,
vie mi niektor prosim poradit ako vytiahnut urcite texty z PDF do textu aby som s nim vedel pracovat dalej v php scripte? Samozrejme v PHP.
Mam PDF kde je meno autora a nejake cislo daneho diela a to potrebujem zapisat do db aby som vedel dalej s tym pracovat.
PDF subory sa stale menia/pribudaju cize potrebujem to zautomatizovat aby nemusel clovek rucne vypisovat nejake fields author, name atd...
Dik.
|
|
Registrovaný: 19.03.07 Prihlásený: 26.03.24 Príspevky: 7076 Témy: 85 Bydlisko: BA | Napísal void: 04.02.2020 15:22 | |
|
deployol by som si tesseract-ocr a robil to cez to. I ked je to ako pouzit pirata priviazaneho k laku na vlasy na zabitie muchy v miestnosti. Je to len prvy napad co ma napadol, ze ako by som to riesil, cize dovolil by som si tvrdit, ze existuju aj lepsie riesenia
_________________ Desktop: CPU AMD R7 1700x @ 3.85GHz | Cooling be quiet! Dark Rock Pro 4 | MB ASRock X470 Taichi Ult. | RAM 4x8GB DDR4 G-SKILL TridentZ RGB 3000 CL16-16-16-36 | VGA Powercolor VEGA56 + Raijintek Morpheus II | SSD Crucial MX300 525GB | HDD Seagate Ironwolf 3TB 5900rpm | PSU CORSAIR RM750X | MONITOR AOC Q3279VWFD8 | MOUSE HyperX Pulsefire FPS + Razer eXactMat | HyperX Alloy FPS Brown | HyperX Cloud | ARCH x64 & Notebook: DELL inspiron 7537 i7 4500U, 16GB RAM, nv750, FHD IPS,Crucial M4 128GB | ARCH x64 & Surface Go 8/128 & Mobil: LG v40 ThinQ (2018) & SBC: Raspberry pi 0 | 3B+ & Headphones: Senheiser HD58X | AKG K551 + detachable cable mod | Linsoul TIN T2 | KZ SZN |
|
Registrovaný: 01.05.05 Príspevky: 13343 Témy: 1494 Bydlisko: Bratislava | Napísal JanoF: 04.02.2020 17:32 | |
|
Moc si nemyslim, tu pomoze asi jedine nejake ocr, to je jedine co ma tiez napada, vytahovat z pdfka text je samo o sebe sado maso, par veci som robil na generovanie dokumentov, zo zaciatku som chcel menit cely text v konkretnej predlohe a nakoniec som sa na to vykaslal a len skusil trafit font a do pdfka na volne miesto dany text vkladal do nevyplnenej pdf predlohy a nasledne z toho vytvoril nove pdf. Nedokazal som nejako jednoducho vytiahnut ten text, mozno po par tyzdnoch mesiacoch by som dosiel na nieco lepsie, ale az tak to zmysel pri tych pdfkach nemalo. Lenze ja som mal opacny pripad, nepotreboval som text stahovat z roznych pdfiek, ale chvilu som sa s tym tiez zaoberal ze ako ho citat.
_________________ Streacom DA2 | SilverStone Titanium SX800-LTI 800W | ASRock X299E-ITX/ac | Intel Core i9-9980XE & be quiet! Dark Rock TF | Kingston HyperX Impact 64 GB DDR4 2666 MHz | NVIDIA Titan RTX 24 GB | Intel SSD Optane 905P 480 GB NVMe U.2 & Intel SSD 750 1,2 TB NVMe U.2 & Intel SSD 660p 2 TB NVMe M.2 & Seagate BackUp Plus Portable 56 TB USB | 55" 4K OLED Dell Alienware AW5520QF & 24" LCD EIZO FlexScan EV2451 | Ergotron LX Wall Mount Keyboard Arm | Logitech Craft | Logitech G603 | Logitech F710 | Harman Kardon Sabre SB 35 & Sennheiser RS 175 | Microsoft Windows 7 Ultimate | APC Back-UPS ES 700 | Lenovo ThinkPad X250 | iPhone X 256 GB & Pitaka Aramid | SilverStone ML05B Milo | Corsair SF600 SFX 600W | ASRock X99E-ITX/ac | Intel Xeon E5-2683 v4 & NOCTUA NH-L12S | Kingston HyperX Savage 32 GB DDR4 2400 MHz | NVIDIA GeForce GT 710 1 GB | Intel SSD Optane Memory 32 GB NVMe M.2 & Intel SSD 730 240 GB SATA | Ubuntu Server |
|
| Stránka: 1 z 1
| [ Príspevkov: 3 ] | |
| Nemôžete zakladať nové témy v tomto fóre Nemôžete odpovedať na témy v tomto fóre Nemôžete upravovať svoje príspevky v tomto fóre Nemôžete mazať svoje príspevky v tomto fóre
|
|