R Datenmanagement

Der arbeitsintensivste Teil

Das Datenmanagement ist der arbeitsintensivste Teil jeder Analyse und unterscheidet sich von Projekt zu Projekt sehr. Aus diesem Grund ist hier effizientes Arbeiten besonders wichtig.

R stellt für das Datenmanagement eine breite Auswahl an Paketen zur Verfügung und hilft so, den Aufwand zu reduzieren.

Die wichtigsten Schritte

Datenimport

Mit Hilfe der Importassistenten in RStudio können Sie Text-, csv-Dateien sowie Daten aus unterschiedlichen Statistikprogrammen wie SAS, SPSS ... einfach importieren. Weiters gibt es Schnittstellen zu allen gängigen relationalen Datenbanken wie Microsoft SQL Server, Db2, Oracle ...

  • Ich zeige Ihnen, wie diese Importassistenten funktionieren und wie Datenbanken über die Odbc Schnittstelle eingebunden werden.

Datenaufbereitung

Im ersten Schritt werden zunächst alle für die Analyse benötigten Merkmale gesammelt. Einige davon werden transformiert, um die statistischen Anforderungen zu erfüllen. Andere werden skaliert, um die Gewichte bei neuronalen Netzen zu stabilisieren. Dies ist nur eine kleine Auswahl an Tätigkeiten, die bei der Aufbereitung der Daten anfallen. Mit der tidyverse-Familie steht Ihnen dafür eine umfangreiche Paketsammlung zur Verfügung.

  • Ich zeige Ihnen, wie Sie die tidyverse-Familie effektiv nutzen, Ausreißer lokalisieren und mit Fehlwerten umgehen.

Explorative Analyse

Mit Hilfe der explorativen Analyse gewinnen Sie erste Einblicke in Ihre Daten. Kennzahlen beschreiben diese, Histogramme liefern Hinweise zur Überprüfung der Annahmen und Grafiken geben einen Einblick darüber, wie Merkmale voneinander abhängen. Die daraus gewonnenen Erkenntnisse bilden die Basis für die Auswahl möglicher Analyseverfahren.

  • Erforschen Sie mit mir gemeinsam Ihre Daten. Entdecken Sie die visuellen Möglichkeiten der Datensichtung in R und lernen Sie nebenbei wichtige Transformationsregeln kennen.

Dokumentation

Dokumentieren Sie den Datenbestand mit Unterstützung von RMarkdown. In einem RMarkdown-Dokument können Sie Texte und interaktiven Programmcode einbinden. Für erfahrene Teammitglieder verkürzt sich damit die Einarbeitungszeit. Und Sie erleichtern so neuen Mitarbeitern den Einstieg. Die Qualität künftiger Analysen wird damit deutlich gesteigert.

  • Ich habe für Sie wertvolle praktikable Tipps parat, damit die Dokumentation ein Erfolg wird.

Haben Sie Fragen?

Vereinbaren Sie Ihren Wunschtermin zur Abklärung offener Fragen.