Metakognitiivne tugevdusõpe parandab LLM-ide ebakindluse väljendamist

1. juuli 2026
Tehisintellekti mudelid

Metakognitiivse tagasisidega tugevdusõpe (RLMF) võimaldab suurtel keelemudelitel väljendada oma ebakindlust kalibreeritud viisil ning ületab standardsed tugevdusõppe meetodid kuni 63 protsendi võrra.

Share on:

Metakognitiivne tugevdusõpe parandab LLM-ide ebakindluse väljendamist

Lumi AI News

Õiguslik

Teemavaldkonnad