CausalMix: Daten-Mischverhältnisse durch kausale Inferenz optimieren

2. Juli 20264. Juli 2026
AI Models

CausalMix nutzt kausale Modellierung statt statischer Annahmen, um optimale Daten-Mischverhältnisse zu finden, die über unterschiedliche Datenpoolgrößen und Modellskalen generalisieren.

Share on:

GEAR: Gemeinsames Training von Tokenizer und Generator für schnellere Bildsynthese

1. Juli 20264. Juli 2026
AI Models

End-to-End-Training des Tokenizers und Generators mit dualer Codebook-Auslese beschleunigt die ImageNet-Konvergenz um bis zu 10x gegenüber LlamaGen-REPA.

Share on:

Evolution Fine-Tuning: LLMs lernen Optimierungsstrategien über mehrere Aufgaben

1. Juli 20261. Juli 2026
AI Models

Evolution Fine-Tuning lehrt Sprachmodelle, Lösungsstrategien über verschiedene Optimierungsprobleme hinweg zu generalisieren und dabei 10,22 Prozent bessere Ergebnisse als Basismodelle zu erreichen.

Share on:

LUMOS: Semantische OS-Schicht für zugänglichkeits-gestützte KI-Agenten

1. Juli 20264. Juli 2026
AI Models

Semantische OS-Schicht ermöglicht KI-Agenten, über Accessibility-Metadaten statt Screenshots zu interagieren, was Token-Kosten und Latenz senkt.

Share on:

NVIDIA BioNeMo Agent Toolkit integriert sich in Claude Science für beschleunigte Life-Sciences-Workflows

30. Juni 20264. Juli 2026
AI Models, Claude AI

Claude Science ruft NVIDIA-beschleunigte Life-Sciences-Tools über natürlichsprachige Agenten auf, wodurch komplexe Analysen wie Proteinstrukturvorhersagen und Wirkstoffoptimierung ohne manuelle Konfiguration beschleunigt werden.

Share on:

Google stellt Evaluierungs-Framework für Code-Agenten vor

30. Juni 20264. Juli 2026
Google, Google Gemini

Googles neues Framework automatisiert ein fünfstufiges Evaluierungs-Verfahren für Code-Agenten und ermöglicht sichere Optimierungen durch adaptive Bewertung und Cluster-Analyse von Fehlern.

Share on:

Asynchrone Pipeline-Parallelisierung für LLM-Vortraining bei Gradient-Verzögerung praktikabel

30. Juni 20264. Juli 2026
AI Models

Asynchrone Pipeline-Parallelisierung mit PipeDream-2BW und neueren Optimizern überwindet die Gradienten-Staleness-Problematik und erlaubt effizientes Pretraining großer Sprachmodelle ohne GPU-Idle-Zeit.

Share on:

Vision-AI-Agenten: Synthetic Data und Fine-Tuning für höhere Genauigkeit

30. Juni 20264. Juli 2026
AI Models

Vision-AI-Agenten brauchen systematische Wege zur Datensynthese und Fine-Tuning, um seltene Fälle zu erkennen und sich an lokale Bedingungen anzupassen.

Share on:

Ornith-1.0: Open-Source-Modell für agentengesteuerte Softwareentwicklung

29. Juni 20264. Juli 2026
AI Models

Ornith-1.0 bietet in den Größen 9B, 31B, 35B MoE und 397B MoE agentengesteuerte Fähigkeiten für Code-Aufgaben und erreicht bei vergleichbarer Größe State-of-the-Art-Performance auf Coding-Benchmarks.

Share on:

Lokale Sprachmodelle in die Anwendung integrieren: Von Ollama zum produktiven Code

28. Juni 20264. Juli 2026
AI Models

Die Qualität lokaler Open-Source-LLMs hängt weniger vom Modell ab als vielmehr von der Codequalität, Fehlerbehandlung und API-Integration rund um die Modellanfrage.

Share on:

InfoKV: Entropie-basierte KV-Cache-Kompression für lange Reasoning-Sequenzen

26. Juni 20264. Juli 2026
AI Models

InfoKV kombiniert Attention-Scores mit Unsicherheitssignalen zur KV-Cache-Kompression und übertrifft damit reine Attention-basierte Methoden bei langem Reasoning um messbare Margen.

Share on:

JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding

26. Juni 20264. Juli 2026
AI Models

JetSpec überwindet Skalierungsgrenzen von Speculative Decoding durch paralleles Tree Drafting mit kausaler Konditionierung und erreicht bis zu 9,64x Speedup bei LLM-Inferenz.

Share on:

« Zurück
1
…
3
4
5
6
7
…
42
Weiter »

CausalMix: Daten-Mischverhältnisse durch kausale Inferenz optimieren

GEAR: Gemeinsames Training von Tokenizer und Generator für schnellere Bildsynthese

Evolution Fine-Tuning: LLMs lernen Optimierungsstrategien über mehrere Aufgaben

LUMOS: Semantische OS-Schicht für zugänglichkeits-gestützte KI-Agenten

NVIDIA BioNeMo Agent Toolkit integriert sich in Claude Science für beschleunigte Life-Sciences-Workflows

Google stellt Evaluierungs-Framework für Code-Agenten vor

Asynchrone Pipeline-Parallelisierung für LLM-Vortraining bei Gradient-Verzögerung praktikabel

Vision-AI-Agenten: Synthetic Data und Fine-Tuning für höhere Genauigkeit

Ornith-1.0: Open-Source-Modell für agentengesteuerte Softwareentwicklung

Lokale Sprachmodelle in die Anwendung integrieren: Von Ollama zum produktiven Code

InfoKV: Entropie-basierte KV-Cache-Kompression für lange Reasoning-Sequenzen

JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding

Lumi AI News

Rechtliches

Themenbereiche