Teil 2 | Vom Gedächtnis zur Navigation: Skalierung autonomer Agenten über den Abruf hinaus
In einem früheren Beitrag habe ich untersucht, wie acht unabhängige Forschungsteams zu derselben Erkenntnis kamen: anstatt Speichersysteme um das Modell herum zu bauen, trainiert man das Modell selbst im Umgang mit dem Speicher als erlernte Fähigkeit. Post-Memory-Training – die Verwendung von Reinforcement Learning in der Post-Training-Phase – erzeugt Agenten, die entscheiden, was gespeichert, gelöscht, konsolidiert und abgerufen wird, alles optimiert für den Erfolg bei der Erledigung von Aufgaben.





