Skip to content

Claude Code kasutab kuritarvitamise tuvastamiseks stegonograafiat

Lühidalt: Claude Code lisab päringutesse nähtamatuid märgistusi, et hiljem kuritarvitamisi tuvastada ja liigitada.

Üks arendaja avastas, et Claude Code põimib päringutesse praktiliselt nähtamatuid märgiseid. See stegonograafiline tehnika võimaldab Anthropicil ilmselt lubamatuid kasutusmustreid tagantjärele tuvastada.

Claude Code’i päringuid analüüsides leidis üks arendaja peaaegu märkamatud markerid, mille mudel ise päringutesse lisab. Need varjatud märgistused ei ole kasutajatele nähtavad, kuid mõjutavad tehisintellektisüsteemi töötlusprotsessi.

Metaandmete stegonograafiline põimimine võimaldab Anthropicil päringuid hiljem liigitada ja võimalikke kuritarvitusi tuvastada. Sellise tehnilise organisatsiooni jaoks nagu Anthropic pakub see meetod kontrollivõimalust, mõjutamata seejuures kasutajakogemust. Nii saab ettevõte muuta jälgitavaks probleemsed kasutusmustrid või reeglite rikkumised, ilma et see päringus nähtavale tuleks.

Tehniliselt on lähenemine huvitav seetõttu, et stegonograafilised meetodid võimaldavad suurte keelemudelite kontekstis teist kontrolli- ja jälgimistasandit. CTO-de jaoks tähendab see, et tänapäevased suurte keelemudelite platvormid võivad kasutada varjatud liigitusmehhanisme, mis täiendavad tavapäraseid API logimise lähenemisi. Samas tekitab see küsimusi selliste meetmete läbipaistvuse ja ulatuse kohta.


Allikas: www.golem.de · Avaldatud 1. juuli 2026
Lumi AI News — tehisintellekti abil kureeritud vastavalt tehisintellektimääruse artiklile 50. Parafraseerimine ja liigitus Lumi News Pipeline v1.7.2 abil.

Share on: