Pakete und IDEs

Python ist rund drei Jahrzehnte alt und es existiert eine riesige Anzahl von Paketen in der Python-Repository. Aktuell (Stand September 2021) gibt es über 320.000 Projekte, davon mehr als 4.000 beziehungsweise mehr als 3.000 Projekte in den für Data Science besonders wichtigen Gebieten künstliche Intelligenz und Datenbanken. Als beispielhaften Stellvertreter für wissenschaftliche Gebiete habe ich die Astronomie und die Mathematik als Themen bei der Paketsuche gewählt und bekam über 1.000 Pakete für astronomische beziehungsweise über 2.600 Pakete für mathematische Themen gelistet.

Stellenmarkt
  1. Systemadministrator*in (m/w/d) für IT-Basisdienste
    Stiftung Preußischer Kulturbesitz, Berlin
  2. IT Generalist (m/w/d)
    Hays AG, Göppingen
Detailsuche

Die Zahlen selbst sollte man nicht überbewerten, weil auch die Qualität der Pakete berücksichtigt werden muss. Obwohl es mehr als 4.000 Pakete in der Kategorie künstliche Intelligenz für Python gibt, verwenden Data Scientists vermutlich nur wenige Dutzend Pakete im Alltag. Viele Pakete sind nur Forks anderer Projekte oder begonnene, aber nicht mehr weiterentwickelte Programme oder sehr spezielle Nischen-Projekte.

Bezüglich der Anzahl von Paketen kann natürlich eine so junge Programmiersprache wie Julia mit ihren aktuell etwas über 6.000 Paketen nicht mit Python mithalten. Davon sind etwa 120 bis 130 Pakete dem Bereich künstliche Intelligenz zugeordnet. Etwa 30 Pakete gehören zur Kategorie Datenbanken. Es gibt 24 Pakete für das Fachgebiet Astronomie und einige Hundert Pakete im Bereich Mathematik. Eine komfortable Suche nach Julia-Paketen bietet die Webseite Juliahub.

Die Julia-Pakete in diesem Artikel vorzustellen, wäre ausufernd. Dennoch, um Data Scientists, die aus der Python-Welt kommen, den Einstieg in Julia etwas zu erleichtern: Ja, auch in Julia gibt es Dataframes und schöne Diagramme kann man schnell und einfach mit Plots erstellen. Plots stellt eine High-Level API bereit, die im Backend Frameworks wie zum Beispiel GR, PyPlot, PGFPlotsX und PlotlyJS verwendet. Einen visuellen Einstieg bietet die Julia Plots Gallery.

Golem Akademie
  1. Java EE 8 Komplettkurs
    25.-29. Oktober 2021, online
  2. Masterclass: Data Science mit Pandas & Python
    22.-23. November 2021, online
  3. Kotlin für Java-Entwickler
    14.-15. Oktober 2021, online
Weitere IT-Trainings

Unabhängig davon, wie benutzerfreundlich eine Programmiersprache und die APIs der verwendeten Frameworks und Pakete sind, die meisten Programmierer werden ungern mit simplen Texteditoren arbeiten. Gute Entwicklungsumgebungen (englisch: IDEs) sind für den Erfolg einer Programmiersprache von großer Bedeutung.

Entwicklungsumgebungen für Python

Bei Python gibt es nicht die eine dominierende IDE. Je nach Vorliebe und Einsatzweck haben sich mehrere IDEs etabliert.

Von Microsoft gibt es Visual Studio IDE und Visual Studio Code, die aber unter Data Scientists eher seltener Einsatz finden. Visual Studio IDE bietet sich eher für die Entwicklung von Anwendungen und Visual Studio Code für das Skripten mit Python an.

Eine Alternative für die Anwendungsentwicklung mit Python ist PyCharm von Jetbrains, welche für Linux, MacOS und Windows verfügbar ist. Auch diese IDE ist bei Data Scientist eher selten in Einsatz.

Data Scientist verwenden viel lieber die IDE Jupyter Notebook. Sie läuft im Browser und ist eine Art interaktives Notiz- oder Forschungsheft. Darin kann man sowohl Beschreibungen und Kommentare mit einer sehr einfachen Formatierungssprache verfassen als auch Python-Quellcode schreiben, ausführen und die Ergebnisse im Heft persistent halten.

Datenanalyse mit Julia: Einstieg in die Datenanalyse mit der Programmiersprache Julia

Der große Nutzen für Data Scientists ist, dass sie sowohl den Weg, die Ergebnisse zu bekommen - nämlich die Formeln und den Quellcode - als auch die Ergebnisse selbst in Form von Beschreibungen, Ergebnistabellen, statistischen Werten und Diagrammen in einem sequenziellen Heft aufbewahren und ihren Kunden präsentieren können.

Zudem sind die Ergebnisse so replizierbar und bei Bedarf kann man einige Parameter im Python-Quellcode verändern und ausprobieren, ob man dadurch neue Erkenntnisse über die Daten bekommt beziehungsweise das Machine-Learning-Modell besser arbeitet.

Beispiele von Jupyter Notebooks bei Machine-Learning-Projekten werden auf Github gezeigt.

Will man jedoch nicht statistische Ergebnisse und Diagramme als Forschungsbericht präsentieren, sondern eine Machine-Learning-Anwendung entwickeln, dann ist oft Spyder (Scientific Python Development Environment) eine interessante IDE. Spyder zählt zu den beliebtesten Python-Entwicklungsumgebungen für Wissenschaftler. Sie ist relativ einfach, nicht überladen und verfügt über die wichtigsten Features wie einen komfortablen Debugger und Variablenmonitor.

Muss man sich unbedingt für eine bestimmte IDE entscheiden? Wenn man mehrere IDEs verwenden will, muss man jede einzeln installieren und sich um Updates kümmern? Muss man unterschiedliche Python-Versionen für unterschiedliche Projekte installieren und konfigurieren? Die Lösung all dieser Probleme ist der Anaconda Navigator.

Anaconda Navigator bietet die Installation von Jupyter Notebook, Spyder, Visual Studio Code und einigen anderen IDEs an - alles unter einer Haube samt grafischer Benutzeroberfläche. Zudem enthält der Anaconda Navigator einen benutzerfreundlichen Paketmanager für Python, mit dem man Pakete suchen, installieren und updaten kann. Auch das Updaten der IDEs selbst wird angeboten. Zudem bietet der Anaconda Navigator die Konfiguration mehrerer Environments an. Das sind unterschiedliche Umgebungen, unter denen der Python-Code laufen soll.

Man stelle sich zum Beispiel vor, dass man eine bestimmte Umgebung mit Tensorflow (ein Framework für die Entwicklung neuronaler Netze) und einer bestimmten Python-Version benötigt, weil vielleicht die aktuelle Version von Tensorflow nicht mit jeder Python-Version läuft; dagegen braucht man vielleicht für Keras (ein High-Level-Framework, das meistens Tensorflow im Backend verwendet) eine andere Python-Version oder man möchte unterschiedliche Cuda-Versionen ausprobieren. Statt Anaconda Navigator mehrmals zu installieren, installiert man ihn nur einmal und erstellt unter ihm mehrere Environments.

Wie man sieht, ist die Auswahl an IDEs bei Python groß. Doch wie sieht es bei Julia aus?

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Benchmarks für Julia und PythonEntwicklungsumgebungen für Julia 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


fabiwanne 00:01 / Themenstart

Julia gibt es noch gar nicht in der Version 3. Die 30 Jahre Entwicklungszeit von denen...

ronda-melmag 15. Okt 2021 / Themenstart

Sagen wir mal so: Das Tool was ich nutzen möchte gibt mir eine Sprache vor. Ich...

franzropen 14. Okt 2021 / Themenstart

Wieso? Julia ist auch einsteigerfreundlicher als C oder Java und wenn jetzt auch...

fabiwanne 14. Okt 2021 / Themenstart

Soll noch einer über die Singlecore-Leistung von meinem FX-8370 beschweren hängt er hier...

franzropen 14. Okt 2021 / Themenstart

Für die Zielgruppe ist auch Excel eine IDE. Es geht darum möglichst schnell und einfach...

Kommentieren



Aktuell auf der Startseite von Golem.de
Drucker
Ohne Tinte kein Scan - Klage gegen Canon

In den USA wurde eine Sammelklage gegen Canon eingereicht: Klagegrund ist, dass einige 3-in-1-Geräte nur scannen, wenn Tinte vorhanden ist.

Drucker: Ohne Tinte kein Scan - Klage gegen Canon
Artikel
  1. Microsoft: Xbox-Kühlschrank kostet 100 Euro
    Microsoft
    Xbox-Kühlschrank kostet 100 Euro

    Microsoft bringt wie angekündigt einen Minikühlschrank im Design der Xbox Series X auf den Markt, der auch nach Deutschland kommen wird.

  2. Silicon Valley: Apple entlässt #Appletoo-Aktivistin
    Silicon Valley
    Apple entlässt #Appletoo-Aktivistin

    Apple hat Janneke Parrish gekündigt, die sich für die Offenlegung von Diskriminierung in dem Unternehmen einsetzte. Auch Netflix entlässt offenbar eine Aktivistin.

  3. Streaming: Squid Game soll Netflix 900 Millionen US-Dollar bringen
    Streaming
    Squid Game soll Netflix 900 Millionen US-Dollar bringen

    Die südkoreanische Serie Squid Game ist dabei, sich zu Netflix' größtem Erfolg zu entwickeln: Die Survival-Serie bricht mehrere Rekorde.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Cyber Week: Bis zu 37% Rabatt auf Corsair-Produkte • Mehrwertsteuer-Aktion bei MediaMarkt • Crucial BX500 1 TB 69€ • Aerocool Aero One White 41,98€ • Creative Sound BlasterX G5 89,99€ • Alternate (u. a. AKRacing Core SX 248,99€) • Gamesplanet Anniv. Sale Classic & Retro [Werbung]
    •  /