FlashMorph: Automatische Auswahl von Attention-Layern in Hybrid-Modellen3. Juli 20264. Juli 2026AI ModelsFlashMorph konvertiert Transformer zu Hybrid-Attention-Modellen, indem es optimal bestimmt, welche Layer volle Attention brauchen und welche durch lineare Attention ersetzt werden können. Share on: