How to: Python Umgebung auf eigenem Rechner einrichten

Python ist eine Programmiersprache, welche sich besonders im Data Science Bereich großer Beliebtheit erfreut. Die Gründe dafür sind vielfältig. Die Sprache ist leicht zu erlernen und man muss sich über viele Dinge wie Speicherverwaltung oder Variablendeklaration keine Gedanken machen. In diesem Beitrag möchte ich euch zeigen wie ihr euch eine Python Umgebung einrichten könnt und neue Librarys installieren könnt.

Python wird anders als viele andere Programmiersprachen, welche vor Ausführung kompiliert werden müssen, zur Laufzeit von einem Interpreter interpretiert.  Außerdem ermöglicht Python eine Objektorientierte Programmierung und ist ohne Anpassungen auf vielen verschiedenen Systemen einsetzbar. Inzwischen gibt es für fast jede Problemstellung in Python eine passende Bibliothek, was es gerade für Analysten und Data Scientisten zu einer extrem hilfreichen Programmiersprache macht. Die offizielle Python Webseite ist http://python.org.

Über die offizielle Python Webseite kann man sich die aktuellste Version von Python downloaden. Es gibt aber auch Distributionen die Python direkt mit den häufigsten Librarys und einer IDE ausliefern. Die bekannteste davon ist die Anaconday Distribution. Über https://www.anaconda.com/Distribution/ lässt sich unkompliziert die aktuellste Version downloaden. Diese beinhaltet neben wichtigen Packages wie NumPy, Pandas auch Erweiterungen für Tensorflow ( Googles AI Framework) oder die IDE Jupyter Notebook.

Von Python sind vor allem zwei Versionen verbreitet. Python 2.x und Python 3.x. Grundsätzlich sollte man sich für die neuere Version also 3.x entscheiden. Wenn ihr aber für Umgebungen die unter 2.x Versionen laufen entwickelt solltet ihr auch die ältere Python Version installieren, da nicht alle Funktionen in Python 3 auch unter Python 2 funktionieren und umgekehrt. Beim Download ist darauf zu achten, dass ihr die richtige Version für  euer Betriebssystem ladet. Es gibt unter anderem Versionen für Windows, MacOs und Linux Nutzer.

Habt ihr die Dateien geladen müsst ihr diese entpacken und die installer .exe ausführen. Im weiteren Verlauf müsst ihr dem Installations-Wizard einfach nur folgen. Nach Abschluss der Installation habt ihr eine funktionierende Python Umgebung eingerichtet. In eurem Startmenü findet ihr nun die Anwendung „Anaconda Prompt“. Damit startet ihr die Python Umgebung und könnt in dieser über die Konsole direkt Code ausführen lassen. mit dem Befehl „pip list“ könnt ihr eure installierten Packages in einer Liste ausgeben lassen. pip ist dabei der Package Installer in Python. mit dem Befehl „pip install pandas“ wird das Pandas Package in Python downloaden und installieren. Auch andere Packages können über diesen Befehl installiert werden.

Anaconda bietet allerdings auch eine grafische Benutzeroberfläche. Diese ka über den Anacondy Navigator aufgerufen werden und ermöglicht es die verschiedenen IDE’s zu starten und auch Packages nach zu installieren ohne die Konsole benutzen zu müssen. Nach dem Start könnt ihr unter „Environments“ eure Python Packages sehen und weitere nachinstallieren.

Als IDE’s zur Entwicklung nutzen viele Data Scientisten die Jupyter Notebooks. Inzwischen gibt es auch das Jupyter Lab. Dies bietet noch zusätzliche Funktionen. Auch diese Entwicklungsumgebungen sind in der Anaconda Distribution enthalten und lassen sich einfach starten.

Ich hoffe ihr habt nun eine funktionierende Python Umgebung eingerichtet und könnt erfolgreich euer Wissen in Sachen Data Science erweitern. Kritik und Feedback zu meinen Artikeln sind natürlich gerne gesehen.