Befiehlt pdfgrep, um in PDF-Dateien zu suchen. Terminal Linux

Die Betriebssysteme basieren auf Befehlszeilen, die uns mehrere Optionen bieten , um die Funktionen der Distribution zu erweitern und Suchvorgänge, Verwaltungsaktionen, Support und vieles mehr auszuführen.

Nur eine dieser Optionen hängt mit der Möglichkeit zusammen, in Linux nach bestimmten Dateitypen zu suchen und auf diese Weise leicht auf deren Inhalt zuzugreifen. Aus diesem Grund werden wir heute über pdfgrep sprechen, das sich auf die Suche nach PDF- Dateien konzentriert .

Was ist pdfgrep?
Pdfgrep ist ein Befehlszeilenprogramm, mit dem auf einfache und funktionale Weise nach Text in PDF-Dateien gesucht werden kann. So sparen wir Zeit, um auf jede Datei zuzugreifen und den Text mit unseren eigenen PDF-Tools zu durchsuchen.
Einige seiner Eigenschaften sind:

  • Kompatibel mit Grep können wir viele grep-Parameter wie -r, -i, -no -c ausführen.
  • Möglichkeit, in mehreren PDF-Dateien nach Text zu suchen
  • Diese GNU Grep-Farboption ist für bestimmte Farben geeignet und standardmäßig aktiviert.
  • Unterstützt die Verwendung von regulären Ausdrücken.
  • Freie Software

Um auf dem Laufenden zu bleiben, sollten Sie unseren YouTube-Kanal abonnieren. ABONNIEREN

1. Installieren Sie Pdfgrep unter Linux

Schritt 1

In diesem Fall verwenden wir Ubuntu, es reicht also aus, die folgende Zeile auszuführen. Dort geben wir den Buchstaben S ein, um den Download und die Installation der Pakete zu akzeptieren.

 sudo apt install pdfgrep 

1-Install-Pdfgrep-en-Linux.png

Schritt 2

Andere Installationsoptionen sind:

  • Laden Sie die .TAR.GZ-Datei unter folgendem Link herunter.
Pdfgrep
Schritt 3
  • Oder führen Sie den folgenden Befehl aus:
 Git-Klon https://gitlab.com/pdfgrep/pdfgrep.git 
Schritt 4

Dann geben Sie jede der folgenden Zeilen in Ihrer Bestellung ein:

 ./configure machen sudo make install 

2. Verwenden Sie Pdfgrep unter Linux

Schritt 1

Nach der Installation von pdfgrep ist dies die zu verwendende Syntax:

 pdfgrep [OPTION ...] MUSTER [ARCHIV] 
Schritt 2

Jedes der Elemente sind:

  • Option: Gibt die Attribute an, die bei der Suche hinzugefügt werden können, z. B. -i oder –ignore-case , wobei die Unterscheidung von Groß- und Kleinbuchstaben zwischen dem angegebenen Muster und dem Muster, das mit der Datei übereinstimmen muss , ignoriert wird.
  • Muster: Zeigt einen erweiterten regulären Ausdruck an.
  • Datei: Dies ist die PDF-Datei, in der die Suche ausgeführt wird.
Schritt 3

Wir beginnen mit einer einfachen Suche, suchen beispielsweise in der Datei TechnoWikis.pdf nach dem Wort TechnoWikis und führen dazu Folgendes aus:

 pdfgrep TechnoWikis TechnoWikis.pdf 

2-pdfgrep-TechnoWikis-TechnoWikis-pdf.png

Schritt 4

In diesem Fall ist diese Datei nur einmal vorhanden. Jetzt suchen wir in einer offiziellen Microsoft PDF-Datei nach dem Begriff Windows. Das Ergebnis ist: 3-buscar-pdf-linux.png

Schritt 5

Wir können sehen, dass das gesuchte Wort hervorgehoben ist, was die Lokalisierung erleichtert. Wenn wir nun den Parameter -in hinzufügen , können die Ergebnisse mit der Seitenzahl angezeigt werden, auf der der Begriff gefunden wurde: 4-buscar-pdf-linux.png

Schritt 6

Eine weitere Option, die wir mit pdfgrep verwenden können, besteht darin, die PDF-Dateien aufzulisten, die einen bestimmten Begriff enthalten. Dazu führen wir Folgendes aus:

 pdfgrep TechnoWikis * pdf 
Schritt 7

Auf diese Weise wird die PDF-Datei aufgelistet, in der sich der Begriff TechnoWikis befindet: 5-liste-die-dateien-PDF - linux.png

Schritt 8

Wenn wir die PDF-Datei öffnen möchten, können wir den folgenden Befehl ausführen:

 xdg-open (File.PDF) 

6-xdg-open.png

Schritt 9

Die allgemeinen Optionen von pdfgrep sind:

-i, –ignore-case
Dabei werden die Unterscheidungen der Fälle sowohl im Ursprung als auch in den Eingabedateien ignoriert.

-F, –fixed-strings
Interpretiert PATTERN als Liste fester Ketten, die durch neue Zeilen getrennt sind.

–cache
Verwenden Sie einen Cache für den gerenderten Text, um den Vorgang großer Dateien zu beschleunigen.

-P, –perl-regexp
Interpretiert PATTERN als Perl-kompatiblen regulären Ausdruck (PCRE).

-H, –mit-Dateiname
Gibt den Namen der Datei für jede Übereinstimmung aus.

-h, –no-Dateiname
Löscht das Präfix des Dateinamens in der Ausgabe.

-n, –seitennummer
Stellen Sie jeder Übereinstimmung die Nummer der Seite voran, auf der der Suchbegriff gefunden wurde.

-c, –count
Unterdrückt die normale Ausgabe und druckt stattdessen die Anzahl der Übereinstimmungen für jede Eingabedatei.

-p, – Seitenzahl
Drucken Sie die Anzahl der Übereinstimmungen pro Seite. Implizieren -n.

–color
Es ermöglicht das Hervorheben von Dateinamen, Seitenzahlen und übereinstimmendem Text in verschiedenen Sequenzen, um sie im Terminal in Farbe anzuzeigen. Einige der Optionen sind Immer, Nacken oder Automatisch.

-o, –nur passend
Druckt nur den passenden Teil einer Zeile ohne umgebenden Kontext.

-r, –rekursiv
Es ermöglicht uns, alle Dateien (eingeschränkt durch –include und –exclude) in jedem Verzeichnis rekursiv zu durchsuchen und den symbolischen Links nur zu folgen, wenn sie sich in der Befehlszeile befinden.

-R, – referenzrekursiv
Wie -r, aber folgen Sie allen symbolischen Links.

-ruhig o -q
Es ermöglicht uns, die Anwendung zu beenden.

Mit diesem pdfgrep wird eine ideale Lösung beim Arbeiten mit PDF-Dateien in Linux-Umgebungen.

See also  Diktieren: So diktieren Sie Text mit Sprache in Microsoft Office

administrator

Leave a Reply

Your email address will not be published. Required fields are marked *