Deep Learning ohne Mathematik erklärt

Jazmie Jamaludin

Jahrzehntelang war es eines der schwierigsten Probleme in der Technologie, einen Computer dazu zu bringen, ein Foto eines Hundes zu erkennen. Ingenieure versuchten, Regeln zu schreiben, "suche nach Fell, suche nach einer Schnauze, suche nach Schlappohren", und die Ergebnisse waren peinlich. Dann, um die frühen 2010er Jahre herum, änderte sich etwas. Fast über Nacht wurden Maschinen erstaunlich gut darin, Bilder zu erkennen, Sprache zu verstehen und Sprachen zu übersetzen. Der Durchbruch hinter diesem Sprung hat einen Namen, der einschüchternd klingt, es aber eigentlich nicht ist: Deep Learning.

Wenn Sie sich jemals gefragt haben, was moderne KI antreibt, ist Deep Learning meistens die Antwort. Es ist die Technik hinter den Assistenten auf Ihrem Telefon, den Systemen, die Videos automatisch untertiteln, und den Chatbots, die auf Anfrage ein Gedicht schreiben können. In diesem Leitfaden erklären wir, was Deep Learning ist, worauf sich das "Deep" tatsächlich bezieht und warum es so gut funktioniert, alles ohne eine einzige Gleichung. Am Ende werden Sie den Maschinenraum der heutigen KI in einfacher Sprache verstehen.

Was "deep" wirklich bedeutet

Deep Learning ist ein Zweig des maschinellen Lernens, der umfassenden Idee, Computern das Lernen durch Zeigen von Beispielen beizubringen, anstatt Regeln vorzugeben. Was Deep Learning auszeichnet, ist die Struktur. Es lernt durch viele geschichtete Verarbeitungsebenen, wobei jede auf der vorhergehenden aufbaut. Das Wort "deep" bezieht sich einfach auf die Anzahl dieser Ebenen. Ein flaches System könnte ein oder zwei haben; ein tiefes kann Dutzende oder Hunderte haben.

Stellen Sie sich eine Montagelinie vor. Die erste Station verarbeitet etwas Grobes, vielleicht nur das Erkennen von Kanten und Farbflecken in einem Bild. Die nächste Station kombiniert diese Kanten zu einfachen Formen. Die darauf folgende Station setzt Formen zu Teilen zusammen, einem Auge, einem Rad, einem Blatt. An der letzten Station erkennt das System ganze Objekte. Keine einzelne Ebene versteht das Bild; Intelligenz entsteht aus der Kette. Dieser geschichtete, aufbauende Ansatz ist das Herzstück des Deep Learning.

Warum dieser Ansatz den alten übertraf

Der alte Ansatz erforderte, dass Menschen im Voraus entschieden, welche Merkmale wichtig waren, die "Suche nach Fell"-Anweisungen. Deep Learning beseitigte diesen Engpass. Mit genügend Beispielen entdeckt das System die nützlichen Merkmale von selbst und findet oft Muster, an die kein Mensch gedacht hätte. Diese Fähigkeit, eigene Repräsentationen zu lernen, anstatt sich auf die von uns vorgegebenen zu verlassen, ist genau der Grund, warum Deep Learning alles zuvor Dagewesene übertraf.

Schichten, die von selbst lernen
Frühere Methoden erforderten, dass Menschen definierten, wonach gesucht werden sollte. Deep Learning entdeckt seine eigenen Merkmale über gestapelte Schichten hinweg, weshalb es Probleme wie Bild- und Spracherkennung löste, die Forscher jahrzehntelang vor Rätsel stellten.
Quelle: DeepLearning.AI

Der Baustein: ein künstliches Neuron

Deep Learning basiert auf künstlichen neuronalen Netzen, die lose vom Gehirn inspiriert sind. Die Basiseinheit ist ein künstliches Neuron, und man kann es sich als einen winzigen Entscheidungsträger vorstellen. Es empfängt mehrere Eingaben, gewichtet, wie wichtig jede einzelne ist, summiert sie auf und leitet ein Signal weiter, wenn die Summe stark genug ist. Für sich genommen ist es fast trivial einfach, ein Schalter, der in die eine oder andere Richtung neigt.

Die Magie entsteht, indem Millionen dieser winzigen Schalter in Schichten verbunden werden, wobei die Ausgabe jedes Neurons die nächste Schicht speist. Das Lernen geschieht durch Anpassen der "Gewichte", wie viel Bedeutung jede Verbindung trägt. Während des Trainings macht das Netzwerk eine Vermutung, sieht, wie falsch es lag, und stößt jedes Gewicht ein wenig an, um es beim nächsten Mal besser zu machen. Wiederholt man dies über enorme Datensätze hinweg, verdrahtet sich das Netzwerk allmählich zu etwas wirklich Leistungsfähigem. Die Trainingsseite behandeln wir in unserem Leitfaden wie KI-Modelle trainiert werden.

Man braucht die Mathematik nicht, um die Idee zu verstehen

Im Grunde ist das alles nur Arithmetik in atemberaubendem Umfang, Milliarden kleiner Multiplikationen und Additionen. Aber man muss der Mathematik nicht folgen, um den Geist zu erfassen: ein riesiges Netz einfacher Teile, die sich jeweils leicht anpassen, bis das Ganze zuverlässig Eingaben in nützliche Ausgaben umwandelt. Es ist weniger eine clevere Formel als vielmehr ein weitläufiges, sich selbst abstimmendes Netzwerk.

Was sich geändert hat, damit es funktioniert

Neuronale Netze sind nicht neu, die Kernideen reichen Jahrzehnte zurück. Warum hat Deep Learning dann erst in den 2010er Jahren eingeschlagen? Drei Dinge kamen gleichzeitig zusammen, und ihr Verständnis erklärt, warum die KI plötzlich beschleunigte.

Warum Deep Learning damals so erfolgreich war
Zutat Was es lieferte Warum es wichtig war
Big Data Millionen von beschrifteten Bildern, Texten und Aufnahmen Tiefe Netzwerke sind hungrig, sie glänzen nur mit vielen Beispielen
Leistungsstarke Chips Grafikprozessoren, die viele Summen gleichzeitig verarbeiten Machten das Training riesiger Netzwerke praktisch, anstatt unmöglich langsam
Bessere Methoden Klugere Wege, tiefe Netzwerke zu trainieren, ohne dass sie stocken Lösten technische Probleme, die das Feld jahrelang zurückgehalten hatten

Als reichlich Daten auf erschwingliche Rechenleistung und verfeinerte Trainingsmethoden trafen, lieferten tiefe Netzwerke, die theoretische Kuriositäten gewesen waren, plötzlich Ergebnisse. Diese Konvergenz, nicht eine einzelne Erfindung, ist die wahre Entstehungsgeschichte des modernen KI-Booms.

Wo Deep Learning in Ihrem Alltag auftaucht

Sie nutzen Deep Learning fast sicher viele Male am Tag, ohne es zu bemerken. Wenn Ihr Telefon sich durch Gesichtserkennung entsperrt, ist das ein tiefes Netzwerk. Wenn ein Sprachassistent das, was Sie sagen, transkribiert, ist es Deep Learning. Automatische Fotoorganisation, Echtzeitübersetzung, Videoempfehlungen, Betrugswarnungen auf Ihrer Karte – die Fingerabdrücke des Deep Learning sind überall.

Seinen größten Erfolg hatte es jedoch im Bereich Sprache. Die großen Sprachmodelle hinter den heutigen Chatbots sind Deep Learning in außergewöhnlichem Ausmaß und basieren auf breiten, wiederverwendbaren Grundlagenmodellen, die an unzählige Aufgaben angepasst werden können. Neuere Systeme kombinieren sogar Wörter, Bilder und Töne miteinander, ein Ansatz, der als multimodale KI bezeichnet wird und alle auf demselben geschichteten Lernprinzip beruhen.

Offensichtlich verborgen
Gesichtsentsperrung, Sprachtranskription, Übersetzung, Empfehlungen – die alltäglichen Annehmlichkeiten, die wir für selbstverständlich halten, sind Deep Learning in Aktion, dieselbe Technik, die jetzt auch konversationelle KI antreibt.
Quelle: MIT

Die ehrlichen Einschränkungen

Deep Learning ist mächtig, aber keine Magie, und es lohnt sich, seine Schwächen zu kennen, bevor man ihm etwas Wichtiges anvertraut. Erstens ist es datenhungrig und energiehungrig; das Training eines großen Modells erfordert enorme Mengen an Beispielen und Rechenleistung. Zweitens ist es eine Art Black Box, die Millionen von Gewichten des Netzwerks machen es schwer zu erklären, genau warum es zu einer bestimmten Antwort kam, was in Bereichen wie Medizin oder Kreditvergabe ein echtes Problem darstellt.

Drittens lernt es Korrelation, nicht Verständnis. Ein tiefes Netzwerk besitzt keinen gesunden Menschenverstand, es kann durch Eingaben, die für uns unsinnig erscheinen, getäuscht werden, und es kann flüssige, selbstbewusste Ausgaben produzieren, die einfach falsch sind, ein Fehler, der oft als Halluzination bezeichnet wird. Für eine fundierte Sicht darauf, wo diese Systeme an ihre Grenzen stoßen, ist unser Artikel über die Grenzen der KI eine essentielle Lektüre.

Es erbt die Fehler seiner Daten

Da ein tiefes Netzwerk rein aus Beispielen lernt, wird jede Voreingenommenheit oder Lücke in diesen Daten mit eingebacken, manchmal unsichtbar. Ein Modell, das auf einem engen Ausschnitt der Welt trainiert wurde, wird außerhalb davon schlecht funktionieren. Deshalb wenden verantwortungsbewusste Teams so viel Mühe auf die Kuratierung, das Testen und die Überwachung ihrer Daten, anstatt anzunehmen, dass mehr Schichten alles beheben werden.

Deep Learning und das große Ganze

Es hilft, die Hierarchie klar zu halten. Künstliche Intelligenz ist das übergeordnete Ziel. Maschinelles Lernen ist der Hauptweg dorthin. Deep Learning ist die leistungsfähigste maschinelle Lerntechnik, die wir haben, und sie hat die jüngste Welle der KI überhaupt erst möglich gemacht. Die darauf basierenden Systeme können überraschend viel Kontext gleichzeitig verarbeiten, etwas, das wir in unserem Leitfaden zu KI-Kontextfenstern untersuchen.

Für die meisten Menschen ist die praktische Schlussfolgerung einfach: Deep Learning ist der Grund, warum sich KI plötzlich so leistungsfähig anfühlt, und zu wissen, wie es ungefähr funktioniert, hilft Ihnen zu beurteilen, was Sie vertrauen und was Sie überprüfen sollten. Wenn Sie abwägen, wie diese Fähigkeiten in reale Operationen passen könnten, verbindet unser interdisziplinärer Blick auf eine Agenten-KI-Geschäftsstrategie die Punkte, und Sie können uns jederzeit kontaktieren, um darüber zu sprechen.

Häufig gestellte Fragen

Was ist der Unterschied zwischen maschinellem Lernen und Deep Learning?+
Deep Learning ist eine Art des maschinellen Lernens. Jedes Deep Learning ist maschinelles Lernen, aber nicht umgekehrt. Was es „deep“ macht, sind seine vielen gestapelten Schichten, die es ihm ermöglichen, komplexe Muster zu lernen und nützliche Merkmale selbst zu entdecken, anstatt sich auf vom Menschen definierte Merkmale zu verlassen.
Kopiert Deep Learning tatsächlich das menschliche Gehirn?+
Nur lose. Die Idee vernetzter "Neuronen" wurde von der Biologie inspiriert, aber künstliche neuronale Netze sind weitaus einfacher und funktionieren ganz anders als ein echtes Gehirn. Die Gehirnanalogie ist ein hilfreiches Ausgangsbild, keine wörtliche Beschreibung dessen, was passiert.
Warum benötigt Deep Learning so viel Rechenleistung?+
Ein tiefes Netzwerk kann Millionen oder Milliarden von Verbindungen haben, und das Training passt jede einzelne davon über enorme Datensätze an. Das ist eine immense Anzahl kleiner Berechnungen, weshalb spezialisierte Chips und viel Energie benötigt werden, um große Modelle in angemessener Zeit zu trainieren.
Kann Deep Learning seine Entscheidungen erklären?+
Oft nicht klar. Da die Argumentation über unzählige gewichtete Verbindungen verteilt ist, kann es schwierig sein, genau zu sagen, warum ein Modell eine bestimmte Antwort gegeben hat. Diese "Black-Box"-Eigenschaft ist ein aktiver Forschungsbereich und ein echtes Problem in hochriskanten Bereichen wie Gesundheitswesen und Finanzen.

Referenzen

  1. DeepLearning.AI. "Deep Learning Specialization Foundations." deeplearning.ai.
  2. MIT. "Introduction to Deep Learning." mit.edu.
  3. Stanford HAI. "Foundations of Modern AI." hai.stanford.edu.
Zurück zum Blog

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.

Optimieren Sie Ihre Betriebsabläufe und bieten Sie ein reibungsloses Kundenerlebnis. Unsere Experten implementieren modernste Technologien und optimierte Arbeitsabläufe, damit Sie sich auf Ihre Kernkompetenzen konzentrieren können.