Metakognitiivne tugevdusõpe parandab LLM-ide ebakindluse väljendamist1. juuli 2026Tehisintellekti mudelidMetakognitiivse tagasisidega tugevdusõpe (RLMF) võimaldab suurtel keelemudelitel väljendada oma ebakindlust kalibreeritud viisil ning ületab standardsed tugevdusõppe meetodid kuni 63 protsendi võrra. Share on: