DaMu-Analytics

Python – Pandas, Import, Export, DataFrames und Datenmodellierung

Pandas ist eines der besten Packages in Python um Daten in ein Programm zu laden und auch große Mengen lassen sich mithilfe von Pandas aufbereiten und wieder in z.B. Datenbanken zurückschreiben oder mit weiteren Packages zu visualisieren. In Datenanalyse Projekten kommt man also um Pandas, wenn man mit Python arbeitet, gar nicht vorbei. Deshalb möchte ich mit diesem Beitrag einen Überblick über häufig genutzte Funktionen bieten.

Was ist Pandas jetzt eigentlich? Pandas ist ein Package in Python. Der Fokus liegt auf die Datenaufbereitung und Modellierung von Tabellen. Dabei bietet Pandas umfassende Funktionen um aus verschiedenen Quellen die Daten in dein Analyseprojekt zu laden und auch wieder zu exportieren. Außerdem sind die performanten Modellierungsfunktionen ein großer Pluspunkt, die auch die Arbeit mit großen Datenmengen erlauben. Pandas ist quasi aufgesetzt auf das Package Numpy, welches bereits das Konzept von Arrays einführt. Während in Numpy Arras allerdings nur Daten in einem Array mit dem gleichen Datentyp erlaubt, arbeitet Pandas vor allem mit Dataframes. Diese erlauben auch in einem Dataframe unterschiedliche Datentypen, wie z.B. in der ersten Spalte Integer und in der zweiten Spalte Daten vom Typ String etc. Weiterlesen

Hallo Welt ! Ein neuer Blog ist geboren.

Es ist so weit. Lange habe ich überlegt ob ich einen Blog erstellen soll und ob ich überhaupt etwas anbieten kann, was für jemanden einen Mehrwert bieten könnte. Da ich mich sehr viel mit Daten Analyse aufgrund meines Jobs beschäftige und ich finde es gibt zwar einige Data Analytics Blogs aber nur wenige in Deutsch und mit konkreten Fragestellungen die mich in letzter Zeit beschäftigt haben, möchte ich auf damu-analytics.com hier meine Erfahrungen teilen.

Darum werde ich auf diesem Blog meine persönlichen Erfahrungen zum Thema Daten Analyse und Machine Learning teilen und gerne auch in Diskussion dazu gehen und Fragen beantworten. Aber auch weitere Themen werde ich behandeln. So habe ich mich auch bereits mit dem Raspberry Pi beschäftigt und einige private Projekte damit realisiert. Ich bin gespannt wie sich das entwickelt mit dem Blog.

Der aktuelle Beitrag ist aber vor allem dazu gedacht einmal das weltberühmte „Hello World“ hinaus zu posaunen und mich bekannt zu machen. Also was gibt es über mich zusagen? Mein Name ist Daniel Müller und ich beschäftige mich jetzt seit einigen Jahren mit dem sammeln, aufbereiten und analysieren von Daten. Ich arbeite bei einem großen deutschen Konzern, bei dem ich auch meine kaufmännische Ausbildung absolviert habe, seit 2019 als Analyst und Data Scientist. In dem Unternehmen bin ich bereits seit dem Jahr 2011 tätig. Mein „Sprachschatz“ umfasst vor allem Sprachen wie C, Java, VBA, Python und SQL. Wobei ein Entwickler mich wahrscheinlich in den genannten Sprachen allemal abhängen kann. Aber als Analyst sollte man ein gewisses Maß an Programmierkenntnissen und auch Interesse daran mitbringen. Darum entsteht ja auch der Blog hier. Vor allem anhand von Python werde ich einige Projekte von mir vorstellen und meine Gedanken dazu erläutern. Vor allem mit dem Thema Textanalyse werde ich mich zu Beginn auseinandersetzen.

Also viel Spaß beim lesen und ich freue mich immer über Feedback und Verbesserungsvorschläge.

WordPress Cookie Plugin von Real Cookie Banner