Was ist Maschinelles Lernen? Ein leicht verständlicher Leitfaden

Jazmie Jamaludin

Stellen Sie sich vor, Sie bringen einem Kind bei, eine Katze zu erkennen. Sie geben ihm kein Regelbuch mit "vier Beine, spitze Ohren, Schnurrhaare, Schwanz". Sie zeigen auf Katzen. "Das ist eine Katze." "Das ist auch eine Katze." Nach genügend Beispielen macht es Klick, und das Kind kann eine Katze erkennen, die es noch nie zuvor gesehen hat, selbst eine dicke, eine haarlose oder eine, die halb hinter einem Vorhang versteckt ist. Maschinelles Lernen funktioniert auf ähnliche Weise. Anstatt einem Computer explizite Anweisungen für jede Situation zu programmieren, zeigen Sie ihm Beispiele und lassen ihn das Muster selbst herausfinden.

Diese einzige Veränderung, vom Schreiben von Regeln zum Lernen aus Daten, ist eine der wichtigsten Ideen in der modernen Technologie. Sie treibt still und leise den Spam-Filter an, der Ihren Posteingang sauber hält, die App, die Ihr Gesicht erkennt, die Empfehlungen, die entscheiden, was Sie als Nächstes sehen, und die Chatbots, die jetzt ein Gespräch führen können. In diesem Leitfaden erklären wir, was maschinelles Lernen eigentlich ist, wie es lernt, seine Hauptarten und die ehrlichen Grenzen, die Sie kennen sollten, bevor Sie ihm etwas Wichtiges anvertrauen. Keine Gleichungen, kein Fachjargon, der unerklärt bleibt.

Von Regeln zu Beispielen: Was sich geändert hat

Während des größten Teils der Computergeschichte bestand Software aus einer Liste von Anweisungen. Ein Programmierer nahm jede Situation vorweg und schrieb eine Regel dafür: wenn dies, dann das. Das funktioniert hervorragend für Aufgaben mit klarer Logik, wie das Berechnen von Steuern oder das alphabetische Sortieren von Namen. Aber es versagt, sobald die Welt unübersichtlich wird. Wie würden Sie Regeln schreiben, um eine handschriftliche Adresse zu erkennen? Handschriften variieren endlos. Die Anzahl der "wenn"-Anweisungen wäre unendlich.

Maschinelles Lernen kehrt den Ansatz um. Anstatt die Regeln vorzugeben, geben Sie dem Computer Tausende von beschrifteten Beispielen und eine Möglichkeit, zu messen, wie falsch seine Vermutungen sind. Das System passt sich immer wieder an, um weniger falsch zu liegen. Das "Lernen" ist einfach dieser Prozess der Feinabstimmung, bis die Muster in den Daten erfasst sind. Wenn Sie unsere Übersicht über was künstliche Intelligenz ist gelesen haben, ist maschinelles Lernen der Motor, der die meisten heutigen KIs tatsächlich zum Laufen bringt.

Ein kurzes Wort zu "Modellen"

Sie werden das Wort Modell ständig hören. Ein Modell ist einfach das Endergebnis des Trainings, das erfasste Muster, gespeichert als eine große Menge von Zahlen, in das Sie neue Daten einspeisen können, um eine Vorhersage zu erhalten. Stellen Sie es sich als die Erfahrung vor, die das System destilliert hat. Ein Spam-Modell hat "gelernt", wie Junk-Mails aussehen; ein Wettermodell hat gelernt, wie sich Bedingungen entwickeln. Das Modell ist nicht die Daten und es ist nicht der Code, es ist die gelernte Zusammenfassung dazwischen.

Muster, keine Anweisungen
Traditionelle Software folgt von Menschen geschriebenen Regeln. Maschinelles Lernen schreibt seine eigenen Regeln, indem es Muster in Beispielen findet, weshalb es unübersichtliche, reale Aufgaben bewältigt, die handcodierte Logik niemals könnte.
Quelle: Stanford HAI

Wie eine Maschine tatsächlich "lernt"

Machen wir das konkret mit dem Spam-Filter, denn fast jeder hat einen. Sie beginnen mit einem Stapel E-Mails, die bereits als "Spam" oder "kein Spam" gekennzeichnet sind. Das Modell betrachtet Merkmale jeder Nachricht, die verwendeten Wörter, ob viele Links vorhanden sind, verdächtige Absenderdetails, und macht eine Vermutung. Zuerst sind die Vermutungen im Grunde zufällig. Aber jedes Mal, wenn es falsch rät, passt das System seine internen Einstellungen ein wenig an, so dass es diese Vermutung eher richtig gemacht hätte.

Wiederholen Sie dies über Hunderttausende von E-Mails, und das Modell wird allmählich gut. Der entscheidende Teil ist die Rückkopplungsschleife: eine Vermutung, ein Maß dafür, wie falsch sie war, und eine kleine Korrektur. Forscher nennen das Maß für die Falschheit eine Verlustfunktion und die sanfte Korrektur Training. Man braucht die Mathematik nicht, um den Geist dessen zu erfassen: Übung plus Korrektur, enorm skaliert. Wir gehen in unserem Artikel über wie KI-Modelle trainiert werden tiefer darauf ein.

Warum die Datenqualität so wichtig ist

Da ein Modell ausschließlich aus seinen Beispielen lernt, entscheidet die Qualität dieser Beispiele alles. Wenn man ihm voreingenommene, eingeschränkte oder schlampige Daten zuführt, wird es diese Fehler treu lernen. Ein Einstellungsmodell, das hauptsächlich mit einer Art von erfolgreichen Mitarbeitern trainiert wurde, wird stillschweigend Menschen wie diese bevorzugen. Dies ist der Ursprung des alten Sprichworts "Garbage in, Garbage out", und deshalb ist ein Großteil des realen maschinellen Lernens unglamouröse Arbeit beim Bereinigen und Ausbalancieren von Daten und nicht clevere Algorithmen.

Die drei Hauptlernstile

Nicht alle Formen des maschinellen Lernens funktionieren auf die gleiche Weise. Es ist hilfreich, die drei großen Familien zu kennen, denn die richtige hängt davon ab, welche Art von Beispielen Sie haben und was Sie erreichen wollen.

Die drei Hauptfamilien des maschinellen Lernens
Stil Wie es lernt Alltägliches Beispiel
Überwacht Lernt aus gekennzeichneten Beispielen (die "Antwort" wird geliefert) Spamfilter, Kreditgenehmigung, Fototagging
Unüberwacht Findet versteckte Gruppierungen ohne vorgegebene Labels Kundensegmente, Anomalieerkennung
Verstärkend Lernt durch Versuch und Irrtum, belohnt für gute Ergebnisse Spielende KI, Robotik, Empfehlungen

Überwachtes Lernen

Dies ist der häufigste Stil. Sie stellen Beispiele und die richtigen Antworten zur Verfügung, und das Modell lernt, eins dem anderen zuzuordnen. Zeigen Sie ihm Fotos, die als "Hund" oder "nicht Hund" gekennzeichnet sind, und es lernt, neue Fotos zu klassifizieren. Die meisten Geschäftsanwendungen, Betrugserkennung, Nachfrageprognose, medizinische Vorsorgeuntersuchungen, sind überwacht, da die Antwort, die Sie vorhersagen möchten, etwas ist, von dem Sie bereits historische Aufzeichnungen haben.

Unüberwachtes Lernen

Hier gibt es keine Bezeichnungen. Sie übergeben dem Modell einfach einen Haufen Daten und bitten es, eine Struktur zu finden. Es könnte entdecken, dass Ihre Kunden sich natürlich in einige verschiedene Gruppen aufteilen, oder eine Transaktion markieren, die anders aussieht als alles, was es zuvor gesehen hat. Dies ist besonders leistungsfähig für die Erkundung, wenn Sie noch nicht wissen, wonach Sie suchen.

Bestärkendes Lernen

Dieses lernt durch Handlungen. Das System ergreift Maßnahmen, erhält Belohnungen oder Strafen und erarbeitet schrittweise eine Strategie, die die größte Belohnung einbringt. So hat die KI komplexe Spiele gemeistert und so lernen Roboter zu gehen. Es ist auch ein Teil davon, wie moderne Chatbots verfeinert werden, indem sie für hilfreiche, wohlüberlegte Antworten belohnt werden.

Wo maschinelles Lernen auf die KI trifft, von der Sie hören

Sie haben wahrscheinlich bemerkt, dass sich die KI in den Schlagzeilen, die Systeme, die Essays schreiben, Fragen beantworten und Bilder generieren, anders anfühlt als ein bescheidener Spamfilter. Das ist so, aber sie basiert auf denselben Grundlagen. Diese Systeme verwenden einen Zweig des maschinellen Lernens, der als Deep Learning bezeichnet wird und viele Schichten der Mustererkennung stapelt, um außergewöhnlich komplexe Daten wie Sprache und Bilder zu verarbeiten. Wenn Sie die einfache Version wünschen, knüpft unser Leitfaden zu Deep Learning ohne Mathematik genau dort an, wo dieser Artikel aufhört, und unser Durchgang durch wie neuronale Netze funktionieren erklärt die Bausteine.

Die größten dieser Systeme sind als große Sprachmodelle bekannt und basieren auf breiten, wiederverwendbaren Grundlagenmodellen. Der entscheidende Punkt: Maschinelles Lernen ist die Familie, und diese auffälligen Systeme sind einfach ihre ambitioniertesten Mitglieder. Das gleiche Prinzip, aus Beispielen lernen, liegt ihnen allen zugrunde.

Eine Familie, viele Gesichter
Von Spamfiltern bis zu Chatbots unterscheiden sich die Systeme enorm im Umfang, aber sie teilen einen Motor: Muster aus Daten lernen, anstatt von Hand geschriebenen Regeln zu folgen.
Quelle: DeepLearning.AI

Was maschinelles Lernen gut kann und wo es Schwierigkeiten hat

Maschinelles Lernen glänzt bei Aufgaben, bei denen es viele Daten gibt und die Muster zu subtil oder zahlreich sind, um von einem Menschen erfasst zu werden. Betrug in Millionen von Transaktionen erkennen, vorhersagen, welche Maschinen ausfallen werden, Sprache erkennen, Sprachen übersetzen, Produkte empfehlen – all das spielt seine Stärken aus. Es ist unermüdlich, schnell und entdeckt oft Signale, die Menschen völlig übersehen.

Aber es hat echte blinde Flecken. Es kann sich selbstbewusst irren, besonders in Situationen, die sich von den Trainingsdaten unterscheiden. Es versteht Ursache und Wirkung nicht wirklich, es erkennt Korrelationen, weshalb es manchmal etwas Irrelevantes aufgreift, das in den Beispielen zufällig übereinstimmte. Und da moderne Systeme fließenden Unsinn erzeugen können, halluzinieren sie manchmal und produzieren Antworten, die richtig klingen, es aber nicht sind. Für ein vollständigeres, ehrliches Bild lohnt sich unser Artikel über die Grenzen der KI, bevor Sie sich bei wichtigen Entscheidungen darauf verlassen.

Es braucht die richtigen Beispiele, nicht nur viele davon

Ein Modell, das nur mit Fotos von Sonnentagen trainiert wurde, wird bei Regen Schwierigkeiten haben. Eines, das mit den Einkaufsgewohnheiten von gestern trainiert wurde, kann einen plötzlichen Trendwechsel falsch einschätzen. Maschinelles Lernen ist ein Spiegel seiner Daten, und die Welt verändert sich ständig, weshalb eingesetzte Modelle überwacht und aktualisiert werden müssen, anstatt sie als für immer fertig anzusehen.

Einstieg ohne Überforderung

Sie müssen nichts selbst entwickeln, um vom maschinellen Lernen zu profitieren, die meisten nützlichen Tools haben es bereits integriert. Die praktische Fähigkeit besteht darin, zu wissen, wo es wirklich einen Mehrwert bietet: repetitive Aufgaben mit vielen historischen Daten, Vorhersagen, die Sie häufig treffen, oder Muster, die in zu großen Informationen verborgen sind, um sie mit bloßem Auge zu erkennen. Beginnen Sie klein, mit einer Aufgabe, bei der ein falsches Ergebnis günstig zu korrigieren ist, und halten Sie einen Menschen in der Schleife, während Sie Vertrauen aufbauen.

Es lässt sich auch hervorragend mit neueren Ideen wie multimodaler KI kombinieren, die es Systemen ermöglicht, mit Bildern, Audio und Text zusammenzuarbeiten, wodurch Anwendungen eröffnet werden, die reine Text-Tools nicht erreichen können. Und wenn Sie darüber nachdenken, wie Lernsysteme reale Arbeitsabläufe in einem Unternehmen automatisieren könnten, zeigt unser interdisziplinärer Leitfaden zu einer agentischen KI-Geschäftsstrategie, wohin dies führt. Wenn Sie Hilfe bei der Anpassung an Ihre eigene Situation benötigen, können Sie uns jederzeit kontaktieren.

Häufig gestellte Fragen

Ist maschinelles Lernen dasselbe wie künstliche Intelligenz?+
Nicht ganz. Künstliche Intelligenz ist das übergeordnete Ziel, Maschinen intelligent handeln zu lassen. Maschinelles Lernen ist der erfolgreichste Ansatz, um dorthin zu gelangen, indem es aus Daten lernt, anstatt handgeschriebenen Regeln zu folgen. Maschinelles Lernen ist also ein Teil der KI, derjenige, der für das meiste, was heute funktioniert, verantwortlich ist.
Muss ich gut in Mathematik sein, um es zu verstehen?+
Nein. Die Kernidee, Muster aus Beispielen durch Vermutungen und Korrekturen zu lernen, ist intuitiv. Das Erstellen von Systemen von Grund auf beinhaltet Mathematik, aber das Verständnis dessen, was maschinelles Lernen tut, wo es hilft und wo es versagt, erfordert keine davon.
Wie viele Daten benötigt maschinelles Lernen?+
Das hängt von der Aufgabe ab. Einfache Probleme können aus einigen tausend guten Beispielen gelernt werden, während komplexe Probleme wie das Sprachverständnis riesige Mengen benötigen. Entscheidend ist, dass Qualität und Vielfalt wichtiger sind als die reine Quantität; voreingenommene oder eingeschränkte Daten führen zu einem voreingenommenen, eingeschränkten Modell.
Kann ein Machine-Learning-Modell falsch liegen?+
Absolut, und oft mit großer Sicherheit. Modelle prognostizieren auf der Grundlage von Mustern in früheren Daten, daher können sie bei allem Ungewöhnlichen oder in Situationen, die sich seitdem geändert haben, stolpern. Aus diesem Grund sollten bei wichtigen Entscheidungen menschliche Prüfungen des Ergebnisses erfolgen, anstatt blind zu vertrauen.

Referenzen

  1. Stanford HAI. "Artificial Intelligence Index and Foundations." hai.stanford.edu.
  2. DeepLearning.AI. "Machine Learning Foundations." deeplearning.ai.
  3. Google AI. "Machine Learning Education." ai.google.
Zurück zum Blog

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.

Optimieren Sie Ihre Betriebsabläufe und bieten Sie ein reibungsloses Kundenerlebnis. Unsere Experten implementieren modernste Technologien und optimierte Arbeitsabläufe, damit Sie sich auf Ihre Kernkompetenzen konzentrieren können.