Thinking Machines‘ TML-Interaction-Small: Neue Maßstäbe in Echtzeit-Sprachverarbeitung
Thinking Machines präsentiert TML-Interaction-Small mit 276B Parametern für natürliche Echtzeit-Sprachinteraktion. Das encoder-freie Modell nutzt 200ms-Microturns und zeigt überragende Cache-Effizienz. Skeptik wächst bei TurboQuant, während Open-Source-Modelle weiter rasant an Leistung gewinnen und


