Data Science & Data Mining - ProjekteData Science und Data Mining

Comelio Data ScienceIch unterstütze Sie, statische Analyse mit Werkzeugen von MS Excel über Minitab oder IBM SPSS bis hin zur R durchzuführen. Dabei begleite ich Sie sowohl bei der Einführung von statistischer Analyse als auch bei der Automatisierung durch Softwareentwicklung und Server-Bereitstellung mit Datenbanken wie Oracle und MS SQL Server.

Statistik mit R

Ich unterrichte Sie in der Programmierung und statistischen Analyse mit R, programmiere Ihre Analysen direkt in R oder berate Sie, welche Pakete und Strategien beim Einsatz von Statistik mit R die geeigneten sind. Ob Daten aus Forschung, betrieblichen Prozessen oder Befragungen, Analysen mit R erlauben wiederverwendbare und automatisierte multivariate Analyse und Data Mining.

Beratung Projekte
Oft kann es unklar sein, welches R-Paket oder welche statistische Methodik für eine bestimmte Frage oder Analyse geeignet ist. Solche R-spezifischen Themen und Fragen bzgl. statistischer Methodik können wir optimal durch eine Beratung klären. Auch damit Sie R in Ihren Analyseprozess integrieren und es effizient nutzen, kann ich durch Consulting beantworten. Ein R-Projekt stellt eine enge Begleitung bei konkreten statistischen Analysen dar. Dabei unterstütze ich Sie, das geeignete R-Paket zu wählen, programmiere R-Skripte, um Daten zu integrieren oder zu bereinigen, entwickele den Analyse-Code und definiere Diagramme und kann so den vollständigen Analyseprozess mit R automatisieren.

Statistische Qualitätskontrolle mit Minitab

Ich vermittele Ihnen durch Seminare und Workshops, wie Sie Minitab für statistische Qualitäts- und Prozesskontrolle (SPC) nutzen können. Zusätzlich biete ich Minitab-Beratung an und begleite Sie bei der Einführung von SPC, Design and Analysis of Experiments (DOE) oder der statistischen Prozessoptimierung mit Robust Design und Response Surface Methodology (RSM).

Beratung Projekte
Sollten Sie derzeit die Techniken SPC, DOE und statistische Analysen nur rudimentär oder gar nicht einsetzen und vor allen Dingen noch keinen Analyseprozess aufgebaut haben, dann kann eine Minitab-Beratung hier hilfreich sein. Ich unterstütze Sie bei der Einführung der statistischen Techniken, ihrer Umsetzung in Minitab und der kontinuierlichen Nutzung. Auch wenn Minitab über die grafische Oberfläche alle Analyseschritte für statistische Qualitätskontrolle ermöglicht, so ist ein eigenes Minitab-Projekt nötig, um Minitab und die statistische Analyse als Prozess einzuführen. Ich helfe Ihnen bei der Auswahl der geeigneten Methoden, der Integration der Daten aus den betrieblichen Prozessen und ihrer statistischen Analyse.

Statistische Analysen in der Datenbank

Comelio DatenbankenIch biete eine 360-Grad-Unterstützung bei der Datenanalyse an. Hier schließe ich auch Datenbanken MS SQL Server und Oracle ein. Diese Systeme bieten eingebaute Statistik- und Datenanalysefunktionen oder lassen sich durch geeignete Produkte ergänzen. Ich helfe Ihnen, Ihre Daten und Ihre Analysen mit den großen Datenbanken zu integrieren.

Über SQL kann man in den von mir genutzten Datenbaken bereits viele analytische Fragestellungen beantworten. Dazu zählen insbesondere komplexe Gruppierungen, die Fensteraggregate, gleitende Durchschnitte oder Kumulationen – alles prozentual und in absoluten Werten. Doch die Datenbanken bieten dazu auch entweder direkt oder über externe Zusatzprodukte weitere Funktionen für deskriptive und induktive Statistik. Die Verwendung dieser Funktionen ist dann sinnvoll, wenn große Datenmengen analysiert werden sollen oder wenn Prozeduren, Funktionen und Sichten serverseitig benötigt werden, welche dann statistische Analysen durchführen.

Oracle

In der Oracle Datenbank gibt es eine von Version zur Version zunehmende Anzahl von statistischen Funktionen. Über diese direkt in der DB implementierten Funktionen kann man dann Berechnungen der deskriptiven Statistik, Korrelationsanalyse, Kreuztabellen mit Chi-Quadrat-Statistik, Hypothesentests oder Anpassungstests durchführen und auch anspruchsvollere Techniken wie lineare Regression und Varianzanalyse (ANOVA) verwenden.

MS SQL Server

In MS SQL Server sind nur wenige statistische Funktionen fest eingebaut, sodass man nur sehr einfache deskriptive Kennwerte erhält. Verwendet man aber ein Paket wie „XLeratorDB - Statistics Package“, dann kann man tatsächlich deskriptive und induktive Statistik wie auch Korrelation und Kontingenz sowie Regressionsanalyse direkt in T-SQL durchführen und daher Funktionen, Prozeduren oder Sichten programmieren, welche statistische Analysen durchführen.

IBM SPSS Statistics / Modeler / Amos

Ich biete Ihnen ein umfangreiches Service-Angebot für IBM SPSS an, das von Seminaren und Workshops bis hin zu Beratung und ganzen Projekten führt. Dabei führe ich IBM SPSS und statistische Analyse bei Ihnen ein oder zeige Ihnen, wie Sie Strukturen und Muster in Daten mit IBM SPSS erkennen oder Vorhersagen, Prognosen und Klassifikationen durchführen können.

Ich versuche, ein möglichst alle Aspekte abdeckendes Angebot an IBM SPSS Dienstleistungen anzubieten, sodass Sie für Ihre Bedürfnisse die geeignete Lösung finden.

Beratung Projekte
Fragen nach dem geeigneten Produkt oder der richtigen statistischen Methode lassen sich am besten im Rahmen einer Beratung klären. Auch um ein so komplexes Produkt erfolgreich einzuführen und es effizient in einem Analyseprozess zu integrieren, ist eine Beratung eine sinnvolle Entscheidung. Ich begleite Sie durch den Akquiseprozess und das erste statistische Projekt. Eine intensivere Begleitung bei konkreten statistischen Analysen und Analyseprojekten mit IBM SPSS biete ich durch Projekte und Projektbegleitung an. Hier wähle ich mit Ihnen erfolgversprechende statistische Methoden aus, bereite die Daten vor, führe die Datenanalyse und die Präsentation der Ergebnisse durch und kann auch den gesamten Prozess automatisieren.

DienstleistungenBusiness Intelligence Data Warehousing

Ich versuche, ein 360 Grad-Angebot an Dienstleistungen im Bereich Data Science / Data Mining anzubieten.

  • Ermittlung der Anforderungen an die statistische Fragestellung
  • Durchführung von Workshops
  • Integration und Aufbereitung / Bereinigung von Daten
  • Statistische Modellierung und statistische Programmierung
  • Entwicklung von grafischen Ausgaben / Diagrammen
  • Automatisierung des Analyseprozesses
  • Integration der statistischen Analyse in MS SQL Server oder Oracle
  • Schulung zu Statistik / Data Mining
Comelio Data Science

TechnikBusiness Intelligence Data Warehousing Produkte

Ich setze Produkte von Microsoft und Oracle sowie die beiden Open Source-Technologien R und Python ein, um Data Science / Data Mining durchzuführen.

  • Statistische Programmierung
    • R Programmierung
    • Python Programmierung
  • Minitab für DOE und SPC
  • Oracle
    • Integration von R
    • Oracle Data Mining
  • MS SQL Server
    • Integration von R
    • Analysis Services Data Mining
    • MS Power BI und R / Python
  • IBM
    • IBM SPSS Statistics
    • IBM SPSS Modeler
    • IBM SPSS Amos

ReferenzenBusiness Intelligence Data Warehousing Referenzen

In den letzten 15 Jahren habe ich für verschiedenen Branchen und an sehr unterschiedlichen Standorten BI / OLAP-Systeme realisiert. Teilweise handelte es sich um große Projekte, in denen ich einen Teilaspekt betreute, oder eher kleine Projekte, bei denen ich an der Entwicklung der gesamten Lösung beteiligt war.

  • Data Warehouse für die Analyse und Prognose von deutschen Steuerdaten (Einnahmen und Ausgaben) bei einer Regierungsbehörde
  • Konkurrenzbeobachtungs­system zur Bewertung des Technologievorsprungs bei einem Unternehmen aus dem Bereich der Telekommunikation
  • Durchführung und Analyse von Mitarbeiter-Befragungen mit umfassendem Reporting für eine Beratungsfirma im Bereich Personal
  • System für Reporting im Marktforschung für ein Unternehmen im Bereich Getränke
  • Data Warehouse zur Analyse und Prognose für österreichische Arbeitsmarktdaten bei einer Regierungsbehörde
  • Data Warehouse für E-Commerce-Daten
  • Data Warehouse für eine Krankenversicherung

ForschungBusiness Intelligence Data Warehousing

Ich führe bei der Comelio GmbH Forschungsprojekte durch. Im Bereich Datenanalyse zählen dazu bspw. die folgenden:

  • Zukunftsorientierte Gebäudebewertung
  • Ontologie-basiertes Fragebogensystem
  • Innovative Frage-Antwort-Darstellungen im elektronischen Fragebogen

SeminareBusiness Intelligence Data Warehousing Seminare

Seit 2012 unterrichte ich Statistik / Data Science und Data Mining mit verschiedenen Produkten.

  • Seminare zu R
  • Seminare zu Minitab
  • Seminare zu Data Mining

BücherBusiness Intelligence Data Warehousing Referenzen

Seit 2002 bin ich auch als Autor von Büchern, Kurzreferenzen und Magazin-Artikeln tätig.

  • MS SQL Server - Abfragen und Analysen
  • MS SQL Server - Data Mining
  • Oracle - SQL
  • Grundlagen der Empirischen Sozialforschung