urllib

Wir werden uns daran machen das Internet auf unsere Pi zu hohlen und dabei noch ein wenig über das Internet lernen

Mit dem deinem Browser kannst du einfach durch das World Wide Web Surfen aber würdest du mir glauben das es noch eine andere Seite gibt. Den nicht nur Menschen Surfen durchs Webs und rufen Daten ab erstellen neue sondern auch Computer Programme. Es gibt für Computer Programme auch besondere Dienste mit den Maschinenlesbar Informationen gespeichert werden können. Diese werden auch API genannt.

Vorraussetzung:

Für diese Aufrufe benutzen wir die urllib Libary. Deswegen lass uns doch einmal anfangen:

$ nano urllib_einfach.py
import urllib.request

website = urllib.request.urlopen('http://codetrainer.de')
print(website.read())

Wenn ihr euer Programm dann ausführt sollte ihr so einen Salat bei euch im Terminal sehen:

Aber was haben wir überhaupt gemacht?

In Zeile 1 haben wir die Libary urllib eingebunden. Diese hat mehrere Komponenten deswegen müssen wir sagen das wir die urllib.request Komponente brauchen. In Zeile 3 öffnen wir unsere Wunsch URL. Ich habe einfach mal den codetrainer.de ausgewählt. Die Funktion heißt dabei urlopen. Den gesamten Inhalt speichern wir dann in der Variable website. In Zeile 4 "lesen" wir dann den Gesamten Inhalt der Website. Diesen ganzen Text den du jetzt in deiner Konsole siehst, sollte ungefähr so aussehen wie auf dem Bild, ist der Inhalt den dein Webbrowser in die Visuelle Form umwandelst, welches dein Browser ausgibt. Dies wird auch html genannt.

Wie du vielleicht bemerkst hast, ist es nett das mal zu sehen, aber hierbei handelt es sich nicht um eine API den unser Computer Programm kann nicht wirklich etwas mit dem html-Salat anfangen.

In unserem nächsten Beispiel/Einheit werden wir uns nützlichere Daten mit unserem Programm auslesen.

Titelbild Randi Hausken von unter CC BY-SA 2.0 Lizens.

Questions? Feedback?