nyttige artikler

Hvordan opretter jeg et søgbart arkiv med PDF-filer?

I denne uges teknologirådgivningskolonne på Goldavelez.com - hold dine spørgsmål kommende, folk! - Vi hjælper en læser, der har alt for mange vigtige papirer, der har brug for en magisk overgang til den digitale verden. I det mindste lyder det meget mere spændende end "Optisk karaktergenkendelse", som ikke ruller virkelig af tungen.

Goldavelez.com-læser Phil skriver:

Tak for de venlige ord, Phil! Jeg er glad for at hjælpe - ikke på grund af smigningen, men fordi dit spørgsmål er et, som mange læsere sandsynligvis har tænkt på (mig selv inkluderet). Jeg har en hel stak ting, som jeg ville elske at flytte fra den fysiske verden til den digitale verden, så jeg kan derefter Marie Kondo originale dokumenter og fotos glemmes. Bunker af papir giver mig ikke glæde.

Du har et par muligheder, du kan prøve. Jeg vil starte med en åbenlyst en: Google. Hvis du antager, at du opretter PDF-filer, skal du uploade dine filer til Google Drev. Højreklik på en hvilken som helst individuel PDF, hold musen over "Åbn med" og vælg "Google Dokumenter." Google vil derefter forsøge at køre nogle OCR på din PDF, og du skal være i stand til at gemme den resulterende fil som et dokument. Du kan derefter søge gennem dette dokument (og alle andre, du konverterer) via selve Drevet.

Jo mere jeg tænker på det, men den løsning synes en smule inelegant i betragtning af hvor mange filer du skal arbejde med. I stedet kan jeg prøve et stykke software som TesseractStudio.Net — eller bare Tesseract OCR, hvis du ikke frygter kommandolinjen. Du skal være i stand til at bruge dette til at oprette OCR-data fra dine filer, og du kan derefter søge efter dem direkte via Windows eller macOS. OCRmyPDF er en anden mulighed, der ligner Tesseract OCR, men igen, vil du spille med indtastede kommandoer for at anvende OCR på dine filer. Der er ingen GUI, og der er heller ikke (direkte) Windows-support.

Der er også papirarbejde, et open source-dokumentkatalogiseringsværktøj, der leveres med OCR indbygget lige i, som jeg helt sikkert ville overveje, da det er designet til at være et alt-i-ett-stykke software til arkivering, sortering og søgning i dokumenter. Det lyder som om det måske er lige det, du leder efter.

Jeg har ikke brugt PDF-XChange Viewer, men andre har anbefalet det som en mulighed. Den gratis version sænker vandmærker i dine PDF-filer, men den kan oprette PDF-filer fra billeder, og hvis jeg har ret, tilføj OCR til disse eksisterende PDF-filer, du har. Det er værd at udforske, selvom det ikke er den ideelle (gratis) løsning. Tilsvarende kan FreeOCR tage dine billeder eller PDF-filer, anvende OCR og eksportere resultaterne som almindelige tekstfiler eller Word-dokumenter. Hvis du ikke har noget imod at søge gennem dine arkiver på den måde, er det en mulighed.

Hvad angår betalte løsninger, er der altid Adobe Acrobat Pro eller Foxit PhantomPDF . Begge giver dig mulighed for at tilføje OCR til PDF-filer, og du skal være i stand til at behandle alle dine dokumenter som en stor batch (eller oprette et script, der gør dette med mappernes indhold). Du kan muligvis endda få alt dette gjort under apps 'gratis forsøg, hvis de ikke sætter begrænsninger på deres OCR-kapaciteter. Jeg har også set andre med dit særlige problem finde succes ved hjælp af en app som PDF OCR, som kunne være et billigere alternativ.

Det er alt, hvad jeg kan tænke på fra toppen af ​​hovedet (og med lidt research). Forhåbentlig fungerer en af ​​disse løsninger for dig - uden at koste dig en lille formue. Skriv tilbage, og lad mig vide, hvilken app der fungerede bedst for dig!

Tech 911 Har du et teknisk spørgsmål, der holder dig op om natten? Vi vil meget gerne svare på det! E-mail med "Tech 911" i emnelinjen.