Magnus Reimann

Mit AzureML steht seit Mitte des Jahres eine Cloud-Komplettlösung zur Vorhersageanalyse von Microsoft als Preview zur Verfügung. Dieses zukunftsweisende Angebot ermöglicht Unternehmen schnell und wirtschaftlich den Einstieg in den Bereich Predictive Analytics.

Das Akronym ML steht für Maschinelles Lernen, durch das Gesetzmäßigkeiten in großen Mengen von Daten erkannt werden können und anschließend durch Verallgemeinerung vorhersagt werden kann, mit welchen Ergebnissen zu rechnen ist, wenn neue, unbekannte Daten vorliegen.

Unternehmen sind stark an dieser Technik interessiert, da dadurch Vorhersagemodelle für z.B. die Warenbewirtschaftung, Werbeaktionen oder Ersatzteileschaffung erstellt werden können. Dies erschließt oft ungenutzte Optimierungspotenziale.

Ein Hauptgrund für den jedoch geringen Einsatz liegt oft in den benötigten Hilfsmitteln: Für temporäre Fragen Hochleistungsrechner kaufen? Erlernen komplexer Softwareumgebungen?

Dies ist dank AzureML nun nicht mehr nötig. Es erspart den Kauf und die Wartung komplexer Software und Hochleistungsrechnern und indem es als Cloud-Lösung zur Verfügung steht, die nur bei aktiver Nutzung berechnet wird, steht es einem breiteren Publikum zur Verfügung.

In dieser zweiteiligen Reihe wird die Funktionsweise von AzureML demonstriert.

Voraussetzung ist ein Azure-Account und ein aktueller Browser, mit dessen Hilfe das ML Studio aufgerufen wird. Anhand eines Beispiels soll die einfache und schnelle Erstellung eines sogenannten Experiments – die Überprüfung der Anwendbarkeit von Algorithmen – gezeigt werden.

Nach dem Login in Azure erstellen Sie zunächst unter Machine Learning einen Workspace:

image

Den erstellten Workspace öffnen Sie in ML Studio:

image

Basis für Fragestellungen ist ein Dataset, aus dem maschinell Wissen generiert werden soll. Dieses kann in AzureML importiert werden. Alternativ können Sie eines der zahlreichen Beispiel-Datasets nutzen.

image

Nach dem Hochladen des Datasets erstellen Sie über „New“ ein neues Experiment.

image

In der folgenden Abbildung ist das ML Studio mit dem noch leeren Experiment dargestellt:

image

Ziehen Sie das gewünschte Dataset per Drag&Drop in den Arbeitsbereich und wählen Sie per Rechtsklick “Visualize”. Für unser Beispiel wird das bereits vorhandene Dataset „Adult Census Income Binary Classification dataset“ benutzt. Es handelt sich um Datensätze von Personen, bei denen neben Attributen wie Geschlecht, Alter und Bildung auch angegeben ist, ob das Gehalt niedriger oder höher als 50.000 liegt (Spalte income).

image

image

Da mit den Daten ein Modell sowohl trainiert als auch überprüft werden soll, erfolgt per „Split“ eine Unterteilung: 70% der Daten werden für das Training, die restlichen 30% zum Testen des Modells benutzt.

image  image

Im nächsten Schritt folgt „Train Model“, mit dem Sie Trainingsdaten und Algorithmus verbinden. Hier wird das Attribut festgelegt, das von dem Modell vorausgesagt werden soll.

image image

In unserem Experiment wollen wir anhand der übrigen Attribute das erwartete Gehalt voraussagen:

image image

Als Algorithmus bietet sich in diesem Fall eine Klassifizierung an: Verbinden Sie „Two-Class Decision Forest“ mit „Train Model“:

image image

Um die Qualität des trainierten Modells zu testen, verbinden Sie „Score Model“ mit „Train Model“ sowie den restlichen 30% an Ursprungsdaten und darunter „Evaluate Model“.

image image

Das Experiment kann nun gestartet werden. Die Ergebnisse können durch Rechtsklick und “Visualize” auf „Score Model“ bzw. „Evaluate Model“ angezeigt werden:

image

Der vorhergesagte Wert befindet sich in der Spalte “Scored Labels”:

image

Unterhalb der Grafik ist eine Übersicht über die korrekt bzw. inkorrekt getätigten Vorhersagen:

image

Im zweiten Teil werden wir aus diesem Experiment einen Web Service erstellen, auf den man mit beliebigen Anwendungen zugreifen kann. Auf diese Weise können Sie mit Hilfe des trainierten Modells für neue Daten Ergebnisse generieren lassen.

Informationen zu AzureML und den verfügbaren Algorithmen finden sich unter folgenden Link:

Azure Machine Learning Center: http://azure.microsoft.com/en-us/documentation/services/machine-learning/