Glossary

Was ist Selbstüberwachtes Lernen?

Selbstüberwachtes Lernen ist ein Ansatz des maschinellen Lernens, der darauf abzielt, Modelle mit unbeschrifteten Daten zu trainieren, um nützliche Merkmalsdarstellungen zu erzeugen. Diese Methode hat in den letzten Jahren, insbesondere in der Bildverarbeitung und der Verarbeitung natürlicher Sprache, erhebliche Aufmerksamkeit erlangt.


Der Hintergrund des selbstüberwachten Lernens ergibt sich aus den Einschränkungen des überwachten Lernens, das eine große Menge an beschrifteten Daten erfordert, die in praktischen Anwendungen oft schwer zu beschaffen sind. Durch die Nutzung des selbstüberwachten Lernens können Modelle Informationen aus unbeschrifteten Daten extrahieren und so Merkmalsdarstellungen aufbauen.


In Bezug auf die Funktionsweise umfasst das selbstüberwachte Lernen in der Regel die Einrichtung von Vorhersageaufgaben während des Trainings. In der Bildverarbeitung muss ein Modell beispielsweise Teile eines Bildes vorhersagen oder versteckte Bilder rekonstruieren. Im Bereich der Verarbeitung natürlicher Sprache verwenden Modelle wie BERT maskierte Sprachmodellierung für das selbstüberwachte Training, was die Leistung in nachgelagerten Aufgaben verbessert.


Die Vorteile des selbstüberwachten Lernens umfassen die effektive Nutzung großer Mengen unbeschrifteter Daten und die Verbesserung der Modellleistung. Ein Nachteil besteht jedoch darin, dass Modelle unnötigen Lärm lernen können, was die Leistung potenziell verschlechtert. Darüber hinaus müssen das Design und der Trainingsprozess des Modells in der Praxis sorgfältig behandelt werden, obwohl es theoretisch breite Anwendungsperspektiven gibt.


In der Zukunft hat das selbstüberwachte Lernen das Potenzial, in weiteren Bereichen angewendet zu werden, insbesondere in datenarmen Situationen. Es könnte als Brücke zwischen unüberwachtem und überwachten Lernen dienen und den Fortschritt in der künstlichen Intelligenz vorantreiben.