Eine Frau zeigt bei einer Besprechung Kollegen auf einem Bildschirm verschiedene Statistiken.
IoT

R: Das kann die beschreibende Programmiersprache für Statistiken

Während sich Allround-Programmiersprachen wie Java, Python, C++ und C# wachsender Beliebtheit erfreuen, gibt es gleichzeitig auch weiter Bedarf für Spezialsprachen. Sie beherrschen nur wenige Aufgaben, diese aber richtig gut. Die Programmiersprache R ist eine solche Sprache. Ihr Aufgabengebiet ist die Statistik und da leistet sie Erstaunliches. So können auch Sie die Stärken von R für Ihre Arbeit nutzen.

Inhaltsverzeichnis

Verbreitete Anwendungen für Statistiker:innen

Menschen, die beruflich viel mit Statistiken arbeiten, haben in der Regel ihre bevorzugten Werkzeuge: Viele, insbesondere Quereinsteiger:innen, arbeiten mit der Tabellenkalkulation Excel von Microsoft. Meist haben sie schon vorher Office-Anwendungen genutzt und hierbei auch die Analyse- und Diagramm-Werkzeuge in Excel entdeckt. Tatsächlich enthält Excel einige sehr brauchbare Statistik-Funktionen. Zudem ermöglicht Excel dank der mitgelieferten Scriptsprache VBA (Visual Basic for Applications) einfache bis mittelkomplexe Abfragen und Automationen.
Andere Anwender:innen haben im Studium das Software-Paket SPSS (Statistical Package for the Social Studies) kennengelernt. Es ist besonders in den Sozialwissenschaften und in der Psychologie weit verbreitet, kommt mittlerweile aber auch in der Marktforschung zum Einsatz. SPSS ist ein Urgestein der Computertechnik aus dem Jahr 1968, anfangs sogar noch mit Lochkarten programmiert. In den Jahren 2009 bis 2010 lief die Software unter dem Kürzel PA SW, seit der Übernahme durch IBM heißt sie wieder SPSS. Daneben gibt es noch weitere Statistik-Anwendungen wie SAS oder Stata. Auch Python wird als Programmiersprache in der Analyse genutzt.
Das Bild zeigt eine Hand unter einer symbolischen Wolke

Flexibel, skalierbar und sicher: Vodafone Cloud- und Hosting-Services

Sie suchen Cloud-Lösungen, die sich individuell und flexibel entsprechend Ihrer Business-Anforderungen anpassen lassen?

Bei der Sie bei Bedarf alle Services aus einer Hand erhalten und sich über Performance und Datensicherheit keine Gedanken machen müssen?

Gerne helfen wir Ihnen bei der Auswahl der passenden Cloud & Hosting Services für Ihr Unternehmen und unterstützen Sie mit Informationen, worauf es anderen Unternehmen bei der Auswahl eines passendens Cloud-Anbieters ankommt. 

Die Programmiersprache R als Alternative

Platz 1 unter den beliebtesten Tools für Statistiker:innen belegt die Spezialsprache R. Das ist deshalb bemerkenswert, weil die Einarbeitung hier deutlich aufwendiger ist als bei anderen Statistik-Paketen. Excel und SPSS beispielsweise sind durch ihre sofort nach der Installation verfügbaren grafischen Oberflächen gerade für Lai:innen wesentlich intuitiver. Entsprechend kommen viele R-Nutzer:innen aus der Informatik oder den Naturwissenschaften und haben bereits mit anderen Programmiersprachen gearbeitet. Trotzdem oder gerade deswegen hat R viele Vorteile und Alleinstellungsmerkmale, die es nicht nur bei Statistik-Profis so beliebt machen:
  • Alle Arbeitsschritte der Datenauswertung sind aus den benutzergenerierten Skripten auch später noch ablesbar. Während einmal ausgeführte Analysen bei anderen Programmen im Nachhinein oft nicht mehr nachvollziehbar sind, bleibt in R alles durchgängig transparent. Das ist praktisch für die Zusammenarbeit in Arbeitsgruppen: Jedes Team-Mitglied kann im Code sehen, welche Daten in welcher Form analysiert und aufbereitet wurden. Nützlich ist dies aber auch für Wissenschaftler:innen. So können beispielsweise für Reviews alle Analyseschritte der zugrunde liegenden Forschungsarbeit auch später noch ausgelesen, Schritt für Schritt durchgegangen und auf eventuelle Fehler überprüft werden.
  • Die Sprache R wird unter der GNU-Lizenz vertrieben. Das heißt: Anwender:innenJa dürfen den Code kostenlos nutzen, bearbeiten und um eigene Inhalte erweitern. Bereitgestellt wird R von der R-Foundation über das CRAN (Comprehensive R Archive Network). Auf den CRAN-Servern steht nicht nur die Software selbst mit ihren rund 30 Funktionsbibliotheken („Pakete“ oder „Packages“) zum Download bereit. Hier liegen insgesamt über 15.000 Funktions-Pakete von Anwender:innen – und es kommen täglich neue hinzu. Die Mächtigkeit der Sprache wird somit immer größer, während SPSS und Excel nur zu festen Release-Terminen überarbeitet werden.
  • Die gute Erweiterbarkeit von R erlaubt das Programmieren von sehr leistungsfähigen Funktionspaketen, die weit über reine Erweiterungen der Rechenfunktionen hinausgehen. So können Sie etwa mit dem Paket Shiny Daten direkt in interaktive Webseiten hinein exportieren. Die Besucher:innen Ihrer Seite können dort beispielsweise in dynamisch aus ihren Daten befüllte Landkarten oder Tabellen klicken, um Abhängigkeiten zwischen Datenmengen sichtbar zu machen. Egal, ob Sie Erweiterungen wie Shiny für das interne Research in Ihrem Unternehmen nutzen möchten oder aber Kund:innen mit individualisierten Datenanalysen ansprechen wollen: R gibt Ihnen die Werkzeuge dazu an die Hand.
  • Eine große Community steht Ihnen bei Fragen rund um die Arbeit mit R hilfreich zur Seite. Auch knifflige Probleme werden so schnell gelöst. An Hochschulen und Forschungseinrichtungen finden Sie ebenfalls schnell Kontakt zu entsprechenden Nutzergruppen.
Viele bedeutende Software-Hersteller haben mittlerweile die Bedeutung von R erkannt und schaffen Schnittstellen zu ihren eigenen Produkten. Microsoft beispielsweise ermöglicht die die Ausführung von R-Code auf seiner Cloud-Computing Plattform Azure. Auch Oracle, SAP und IBM setzen bereits auf R als führende Sprache für Data Mining und Data Analysis.
Mann steht inmitten einer Server-Racklandschaft in einem Rechenzentrum

Vodafone Total Cloud Professional Services

Wir beraten Sie in jeder Phase Ihres Cloud-Projekts und erarbeiten mit Ihnen, welche IT-Ressourcen Sie haben – und welche Sie brauchen. Zusammen entwerfen wir in unserer Roadmap das Design und den Aufbau Ihrer optimalen IT-Landschaft.

  • Effiziente Beratung auf den Punkt
  • Alles aus einer Hand

Erste Schritte mit R

Nach der Installation Ihres Programmpaketes für Windows, MacOS oder Linux können Sie R über die standardmäßig mitgelieferte Oberfläche RGui bedienen. Wesentlich komfortabler ist die Arbeit allerdings mit integrierten Entwicklungsumgebungen (IDEs) von Drittanbietern.
Sehr beliebt ist beispielsweise RStudio des gleichnamigen Software-Unternehmens. Die Community-Version der Software ist für Privatanwender:innen kostenfrei. RStudio kommt mit Funktionen wie integrierter Hilfe, Syntaxhervorhebung, Autovervollständigung oder automatischen Einrückungen. Für die Entwicklung und das Versenden eigener Packages liefert RStudio ebenfalls ein paar nützliche Funktionen. Aber auch die auf Java basierende Benutzeroberfläche JGR oder der Editor Visual Studio Code von Microsoft werden für die Arbeit mit R gerne genutzt.
Haben Sie die Software auf Ihrem Rechner installiert und sich mit der Oberfläche vertraut gemacht, sollten Sie sich für den Einstieg eines der vielen Tutorials auf YouTube oder anderen Plattformen anschauen. Sehr hilfreich sind beispielsweise die Videos von Björn Walther, die dieser auf seiner Homepage verlinkt hat. Wenn Sie R lieber in Buchform kennenlernen wollen, finden Sie entsprechende PDF-Dateien auf zahlreichen Hochschul-Seiten, etwa mit der „Einführung in R“ der TU Dresden oder mit den Kursunterlagen von Dr. Haiko Lüpsen von der Uni Köln (teilweise in Englisch). Zu den Standard-Werken für R-Nutzer:innen gehört außerdem das Handbuch R for Data Science (englisch) von Hadley Wickham und Garrett Grolemund. Auch dieses finden Sie kostenlos im Netz.
Empfohlener externer Inhalt
Hier ist ein Video-Inhalt von YouTube. Er ergänzt die Informationen auf dieser Seite.
Sie können ihn mit einem Klick anzeigen und wieder ausblenden.
Ich bin einverstanden, dass externe Inhalte angezeigt werden. So können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr in unserer  Datenschutzerklärung.
Datenschutzerklärung

Austausch mit anderen R-Nutzern

Rund um R hat sich eine äußerst aktive und gut vernetzte Community herausgebildet. An vielen Hochschulen und Forschungseinrichtungen finden Sie beispielsweise R-Nutzergruppen und Schulungsangebote. Zu den ersten Internet-Adressen für deutschsprachige Anwender gehören das R-Forum und das Deutsche R-Forum. Englischsprachige User:innen finden Hilfe bei Nabble sowie im Unterbereich für R des Entwicklerforums Stack Overflow.
Ein eigenes englischsprachiges Blog über das Thema Data Mining mit R hat Yanchang Zhao aufgesetzt. Die Seite R-Bloggers verknüpft weltweit Blogger:innen, die selber mit R arbeiten, regelmäßig News aus der Community berichten oder eigene Funktionen vorstellen möchten. Nutzen Sie also gerne das Wissen und die Unterstützung anderer R-Anwender:innen. Die Hilfsbereitschaft ist groß.
Das könnte Sie auch interessieren:
Digitalisierung

„So geht Corporate Influencing” – mit Céline Flores Willers

Céline Flores Willers ist LinkedIn-Pionierin und Top Voice der "The People Branding Company". Wie Unternehmen gezielt Reichweite und Einfluss gewinnen, verrät sie in dieser Podcast-Folge.

Verlasse Vodafone Webseite: Zum PodcastZum Podcast

Céline Flores Willers und Christoph Burseg vor rotem Hintergrund zur Podcast-Folge 279
46:01
Telefon

Digitalisierungs-Beratung

Sie haben Fragen zur Digitalisierung? Jetzt kostenlos beraten lassen. Montag-Freitag von 8-18 Uhr, außer an Feiertagen.

0800 505 4539

Hilfe und Service

Montag bis Freitag von 8 bis 20 Uhr, außer an Feiertagen.

0800 172 1234
Online
Vor Ort