Adaptive künstlichen Intelligenz: Wie Sprachmodelle durch gezieltes Training klüger werden
Eine neue Forschungsarbeit des MIT hat kürzlich demonstriert, wie große Sprachmodelle durch eine besondere Trainingsmethode deutlich bessere Ergebnisse bei komplexen Denkaufgaben erzielen können. Die Methode nennt sich „Test-Time Training“ (TTT) und funktioniert ähnlich wie ein Mensch, der sich kurz vor einer Aufgabe nochmal intensiv mit ähnlichen Beispielen beschäftigt. Das Besondere dabei: Für jede neue Aufgabe wird ein spezieller „Adapter“ trainiert, der das Grundmodell temporär erweitert…