Kurzfassung: Viele KI-Debatten verwenden „Agent“ als Sammelbegriff für fast alles: Modell, Tool-Aufruf, Workflow, Automatisierung, Speicher, Rechte und UI. Das klingt bequem, führt in der Praxis aber zu falschen Erwartungen. Wer zwischen Modell, Harness, Scaffold und Agent sauber unterscheidet, baut kontrollierbarere Workflows — und erkennt schneller, wo Sicherheit, Evaluation und Verantwortung wirklich liegen.
Was ist passiert / was ist neu?
Hugging Face hat mit „Harness, Scaffold, and the AI Agent Terms Worth Getting Right“ eine nützliche Begriffsklärung veröffentlicht. Der Kern: Ein Sprachmodell ist noch kein vollständiger Agent. Erst die umgebende Struktur — Tools, Speicher, Schleifen, Regeln, Zustände und Ausführung — macht daraus ein arbeitsfähiges System.
Die OpenAI-Dokumentation zu Codex CLI zeigt denselben Punkt aus der Coding-Praxis: Entscheidend ist nicht nur das Modell, sondern die Umgebung, in der Aufgaben ausgeführt, Befehle gestartet, Änderungen bewertet und Iterationen gesteuert werden.
Auch das Model Context Protocol zeigt, dass Agenten in der Praxis Schnittstellen, Kontext und kontrollierten Tool-Zugriff brauchen. Die OpenAI Agents-Dokumentation beschreibt denselben Trend aus Produktsicht: Agentische Systeme bestehen aus Modellen, Werkzeugen, Instruktionen und Übergaben — nicht aus einem einzelnen Chatfenster.
Warum relevant?
Für Teams ist diese Unterscheidung mehr als Wortklauberei. Wenn ein Projekt „einen Agenten“ einführt, muss klar sein, was tatsächlich gemeint ist: ein stärkeres Modell, ein Tool-Connector, ein mehrstufiger Workflow, ein autonomer Prozess oder ein System mit Schreibrechten?
Ohne präzise Begriffe werden Risiken unsichtbar. Ein Modell, das Vorschläge macht, ist etwas anderes als ein Agent, der Dateien ändert, APIs aufruft oder Daten in ein Produktivsystem schreibt. Je mehr Handlungsspielraum ein System bekommt, desto wichtiger werden Rechte, Protokollierung, Tests und menschliche Freigaben.
Praxis-Einordnung
Eine robuste Agentenarchitektur lässt sich einfacher prüfen, wenn sie in Schichten gedacht wird. Das Modell erzeugt Vorschläge und Entscheidungen. Der Harness steuert Ausführung, Tool-Zugriff, Schleifen und Rückmeldungen. Das Scaffold gibt dem Ganzen eine wiederverwendbare Struktur: Rollen, Prompting, Zustände, Speicher, Fehlerbehandlung und Übergaben. Erst aus dieser Kombination entsteht ein Agent, der eine Aufgabe über mehrere Schritte bearbeiten kann.
- Modell: liefert Sprache, Code, Klassifikation oder Planung — aber noch keine kontrollierte Ausführung.
- Harness: verbindet Modell, Tools, Tests, Umgebung und Feedbackschleifen.
- Scaffold: macht den Workflow wiederholbar: Rollen, Zustände, Regeln, Speicher und Eskalationen.
- Agent: nutzt diese Bausteine, um eine Aufgabe zielgerichtet und überprüfbar abzuarbeiten.
Für Agentenkompass ist der praktische Filter deshalb: Nicht fragen „Welcher Agent ist der beste?“, sondern „Welche Schicht übernimmt welche Verantwortung — und wie wird sie geprüft?“
Risiken und Grenzen
Der Begriff „Agent“ kann leicht mehr Autonomie suggerieren, als tatsächlich vorhanden ist. Manche Systeme sind nur Chatbots mit Tool-Aufruf. Andere laufen in Schleifen, schreiben Dateien oder treffen operative Entscheidungen. Beides gleich zu nennen, macht Architektur- und Sicherheitsentscheidungen unnötig unscharf.
Hinzu kommt die Evaluation. Hugging Face betont in „Towards More Standardized AI Evaluation“, dass Bewertung reproduzierbarer und vergleichbarer werden muss. Für Agenten gilt das besonders: Nicht nur die Antwortqualität zählt, sondern ob ein Workflow zuverlässig stoppt, Fehler erkennt, Nebenwirkungen begrenzt und nachvollziehbare Zwischenschritte liefert.
Fazit
Präzise Begriffe bremsen Agentenprojekte nicht aus — sie machen sie belastbarer. Wer Modell, Harness, Scaffold und Agent trennt, kann Rechte sauberer vergeben, Tests gezielter bauen und bessere Reviews durchführen. Genau dort entscheidet sich, ob KI-Agenten nur beeindruckende Demos bleiben oder im Alltag kontrolliert Arbeit abnehmen.
