Reinforcement Learning mit Metakognition verbessert Unsicherheitsausdruck in LLMs1. Juli 20264. Juli 2026AI ModelsReinforcement Learning mit metakognitiven Rückmeldungen (RLMF) ermöglicht es LLMs, ihre eigene Unsicherheit kalibriert auszudrücken und übertrifft Standard-RL-Methoden um bis zu 63 Prozent. Share on: