Deel 2 | Van geheugen tot navigatie: Autonome agenten schalen voorbij ophalen
In een vorig artikel onderzocht ik hoe acht onafhankelijke onderzoeksteams tot hetzelfde inzicht kwamen: in plaats van geheugensystemen rond het model te bouwen, moet het model zelf getraind worden om het geheugen te beheren als een aangeleerde vaardigheid. Post-memory training - met behulp van versterkingsleren in de post-training fase - produceert agenten die beslissen wat ze moeten opslaan, verwijderen, consolideren en terughalen, allemaal geoptimaliseerd voor het voltooien van een taak.





