Installation: „poppler“ von GIT

Ich hatte Probleme mit „Poppler“ unter CYGWIN, sodass die Befehle „pdftotext“ usw. nicht funktionierten. Die Lösung Installation direkt von GIT:

git clone https://github.com/danigm/poppler
cd poppler
./autogen.sh
./configure
MAKE
MAKE Install

./configure unter CYGWIN

Zwischenzeitlich können einige Fehlermeldungen auftauchen, also nicht ins Boxhorn jagen lassen. Nach diversen Nachinstallationen von fehlenden Compilern und Paketen funktioniert dann alles. Fazit: Etwas Geduld mitbringen.

CYGWIN vs. RASPBERRY

Einleitung

Ein bisschen Linux zum Mitnehmen, gerne am Windows-PC. Aber was empfiehlt sich nun für unbedarften Neuling? Mit welchem System wir nachhaltiger gelernt und ein tiefes Verständnis für die angewendete Technologie entwickelt.

Zwei Systeme stehen bei mir zur Auswahl, zum einen ein Raspberry mit aktuellem Betriebssystem und Fernzugriff via VNC. Zum anderen CYGWIN (Cygwin Hompage), eine Software die das Abspielen von Linux Applikationen auf Windows Rechnern ermöglicht.

Raspberry

Der Raspberry ist ein kleiner Computer. Die Kosten des Gerätes belaufen sich auf ca. 30€, zusammen mit Speicherkarte, Netzteil, Gehäuse, Maus, Tastatur und Kabel summiert sich ein Komplettsystem auf ca. 50-60€.

Über den HDMI Anschluss kann das Gerät an fast jeden neueren TV angeschlossen werden. Das Betriebssystem, wenn nicht schon vorhanden, wird auf der SD-Karte gespeichert. Frei nach dem Motto: Plug&Play – hereinstecken, zusammenbauen und fertig.

Ab hier beginnt das Abenteuer. Es gibt eine schier unendliche Anzahl von Anleitungen und Projektvorschlägen. Zig Zeitschriften und Internetportale beschäftigen sich mit dem Raspberry. Die meisten Tutorials sind pädagogisch sinnvoll aufbereitet, dass Laien und Kinder, mühelos die gesteckten Ziele erreichen können. Wie heißt es schön, man(n) wächst mit den Aufgaben.

Die große Anzahl an Fans und die hohen Verkaufszahlen lassen den Schluss zu, dass der Raspberry einen ähnlichen Einfluss auf die Jugend von heute haben kann, wie der legendäre C64 am Ende der achtziger Jahre.

Für meine Aufgaben greife ich auf die Geräte mit dem RealVNC Player zu, für Anwendungen auf Konsolen-Ebene benutze ich das Windows-Tool „Putty“.

Raspberry Desktop via VNC

Fazit: Die Brombeere macht nicht nur Spaß, sondern bei jeder Aufgabe wird Wissen vermittelt. Leider ist der Betrieb einer Brombeere mit Kosten verbunden.

CYGWIN

CYGWIN ist eine Software, welche die Möglichkeit eröffnet Computerprogramme von UNIX, BSD oder Linux-Betriebssystemen auf dem Windows Betriebssystem (ab Vista) lauffähig zu machen. Eine Integration von klassischen Linux-Applikationen in Windows ist damit möglich:

KDE Menü in Windows Taskleiste

Die Installation gestaltet sich auf den „ersten“ Blick einfach. Das „Nachinstallieren“ von Applikationen oder einzelnen Bibliotheken glich bei mir einem Glücksspiel. Bei CYGWIN erfolgt die nachträgliche Installation über den CYGWIN Installationssatz, ein recht umständliches Vorgehen. Wer die Installation in der Form: "sudo apt-get install xyz" gewohnt ist, der muss sich umstellen.

Vergleichskriterien

Um eine realistische Bewertung abzugeben vergleiche ich die beiden Systeme anhand folgender Kriterien:

Bedeutung Wertigkeit von: 1 Wertigkeit bis: 5
Installation Laie Ingenieur
Nachinstalltion schnell langsam
Bedienung intuitiv kompliziert
compiling from GIT klappt sofort aufwändig
Spaßfaktor Spaß Frust

Ergebnis:

Raspberry CYGWIN
Installation 2 2
Nachinstallation 2 3
Bedienung 3 3
compiling from GIT 3 4
Spaßfaktor 2 3
Gewichtung 2,4 3,0

Am Ende liegen unsere Kandidaten so gut wie gleich auf. Wer einen Allround-PC mit viel Spaß und eine große Helfergemeinde sucht, der ist beim Raspberry gut aufgehoben. Abschrecken können hier nur die Investitionskosten von maximal 100 Euro. Die CYGWIN Variante bietet nicht den Charme eines kleinen Computers, wartet aber mit Linux Funktionalitäten unter Windows auf, also eher etwas für Softwareentwickler die beide Welten, Windows und Posix, bedienen. Ich persönlich nutze den Raspberry, da Installation und Nachinstallation im Vergleich zum CYGWIN ein Kinderspiel ist.

Dateitransfer zwischen Windows und Raspberry mit pscp

Schnell ein paar Dateien zwischen Windows und dem Raspberry hin und herschieben ist, wenn nicht gerade ein VNC Server benutzt wird, mit Aufwand verbunden.

Für schnellste Lösungen benutze ich das Tool „pscp“. PSCP stet für (p)utty (s)ecure (c)o(p)y“. Wer dieses Tool nutzen möchte, der benötigt Putty auf seinem Windows Rechner.

Und schon kann es losgehen …

pscp *.txt pi@192.168.YYY.XXX:/

Mit diesem Befehl werden alle Dateien mit der Endung: „.txt“ aus dem lokalen Verzeichnis, in dem ich mich gerade befinde, an den Raspberry mit der Adresse 192.168.YYY.XXX geschickt. Die Daten werden in das „home“ Verzeichnis des Nutzer (in unserem Fall „pi“) geschrieben. Eine Abwandlung dieser Zeile könnte z. B. lauten:

pscp c:\text\*.txt pi@192.168.YYY.XXX:/text

Jetzt werden alle Dateien mit der Endung: „.txt“ aus dem Verzeichnis „c:\text“ in das Verzeichnis „/home/pi/text“ auf dem Raspberry geschrieben. Das Kopieren einer einzelnen Datei wird wie folgt durchgeführt:

pscp c:\zip\demo.zip pi@192.168.YYY.XXX:/zip/demo.zip

Hinweis: Vor dem Kopieren fragt das Programm nach dem Passwort des Nutzers, erst nach dieser Eingabe beginnt der Kopierprozess.

Wichtig: Funktioniert die SSH-Verbindung, dann funktioniert auch das Programm „pscp“. Deshalb: Vor dem Kopieren mittels „pscp“ eine SSH Verbindung zwischen Windows – Rechner und Raspberry aufbauen und testen. Eine gute Anleitung zu diesem Thema findet ihr hier:  Anleitung SSH Verbindung einrichten

PDF Dateien in Text umwandeln


Bei meiner Betriebssystemversion war „XPDF“ bereits enthalten, sollte dies nicht der Fall sein. Mit folgenden Befehlen kann schnell nachinstalliert (Debian) werden:

sudo apt-get install update
sudo apt-get install upgrade
sudo apt-get install xpdf

Für meinen Anwendungsfall benutze ich die grafische Benutzeroberfläche. Ich steuere meine Brombeere mithilfe des vorinstallierten RealVNC fern.

Oberfläche Brombeere

Die Datei Übertragung des RealVNC ist schnörkellos und kann mit dem Klick auf das Symbol  gestartet werden. Ich lege alle PDF-Dateien auf dem Desktop meiner Brombeere ab. Vom Desktop aus kopiere ich mir die Dateien in den gewünschten Ordner (in meinem Fall heißt der Ordner: PDF)

Danach geht es in der Konsole weiter…

In der Konsole sind folgende Dinge zu erledigen: Erstens, in den Ordner mit den zu konvertierenden PDF Dateien wechseln. Zweitens, die PDF-Dateien in Text umwandeln. Das realisiere ich mit folgenden zwei Befehlszeilen:

cd PDF
for file in *.pdf; do x=${file%.*}; pdftotext -layout "$file" "$x.txt"; done

Anschließend befinden sich zu jeder PDF eine Textdatei im Ordner. Durch die Option „-layout“ werden die Texte so wie in der PDF abgebildet. Bei Tabellen oder mehreren Textspalten ist diese Funktion sehr hilfreich.

Wer sich mehr zu dem Thema „xpdf“ belesen möchte, kann sich hier die Anleitung für PDFtoTEXT durchlesen: Manual PDFtoText

Ein gutes Bash-Script Tutorial findet ihr hier: Tutorial