26. Juni 20266 min Lesezeit

Agentic Engineering: nicht das Modell, die Methode

Agentic Engineering
Verification
Coding Agents

Alle paar Wochen ein neues Modell, ein neuer Benchmark, eine neue Schlagzeile. Ich schreibe hier viel darüber, aber das Entscheidende ist nicht, welches Modell gerade vorn liegt. Entscheidend ist die Methode, mit der Sie es einsetzen. Modelle kommen und gehen, die Disziplin drumherum bleibt. Diese Disziplin nenne ich Agentic Engineering, und so denke ich darüber, nach drei großen Technologiewechseln in meiner Laufbahn.

Was ist Agentic Engineering?

Agentic Engineering ist kein Werkzeug und kein Produkt, sondern eine Arbeitsweise. KI schreibt Code, plant Schritte, übernimmt ganze Aufgaben. Die eigentliche Ingenieursarbeit ist, diese Fähigkeit mit so viel Struktur und Prüfung zu umgeben, dass am Ende etwas Verlässliches herauskommt, etwas, das auch in einem Jahr noch trägt. Nicht die KI macht den Unterschied, sondern wie viel Handwerk Sie um sie herum legen.

Warum nicht ob KI, sondern wie?

Ob man KI nutzt, ist längst entschieden, fast alle tun es. Der Unterschied liegt im Wie. Eine Ausgabe ohne Kontext und ohne Prüfung ist ein Vorschlag, mehr nicht. Erst Struktur macht sie brauchbar: guter Kontext, klare Vorgaben, eine Prüfung, die das Ergebnis gegen die Wirklichkeit hält. Und Kontext schlägt fast immer den cleveren Prompt. Wer dem Modell zeigt, woran es arbeitet, bekommt bessere Antworten als der, der an der perfekten Formulierung feilt. Ausführlicher habe ich das in nicht ob KI, sondern wie beschrieben.

Was ist Loop Engineering?

Der nächste Schritt: Hören Sie auf, Agents einzeln zu prompten, bauen Sie Schleifen, die das tun. Eine Schleife findet Arbeit, verteilt sie, prüft das Ergebnis, hält fest, was erledigt ist, und stößt das Nächste an. Die Bausteine sind überschaubar: Automationen als Takt, getrennte Arbeitsbereiche fürs Parallele, festgehaltenes Projektwissen, die Anbindung an echte Werkzeuge, ein Agent der baut und ein zweiter der prüft, und ein Speicher außerhalb des Gesprächs. Denn das Modell vergisst zwischen den Läufen, das Repo nicht. Das verschiebt den Hebelpunkt: weg vom einzelnen Prompt, hin zum Entwurf der Schleife. Wie das konkret aussieht, steht in Loop Engineering.

Warum bleibt die Verantwortung beim Menschen?

Je besser die Schleife läuft, desto wichtiger wird dieser Punkt. „Fertig“ ist eine Behauptung, kein Beweis, deshalb trenne ich den, der baut, von dem, der prüft, das Modell benotet die eigene Arbeit zu nett. Bessere Modelle helfen dabei, sie heben den Boden an, auf dem ein Review steht; ein neueres Modell übersieht zum Beispiel seltener Fehler im Code. Aber die Prüfung nehmen sie Ihnen nicht ab.

Dazu kommt eine stille Gefahr: Je mehr Code entsteht, den niemand selbst geschrieben hat, desto größer die Lücke zwischen dem, was im Repo steht, und dem, was Sie wirklich durchdrungen haben. Eine glatte Schleife vergrößert sie schneller, außer Sie lesen, was sie gebaut hat. Werkzeuge, die ihre Unsicherheit offen ausweisen, etwa Konfidenzwerte, sind genau deshalb wertvoll: Sie sagen Ihnen, wo Sie hinschauen müssen.

Was heißt das fürs Fundament?

Wenn ein Modell so zentral wird, stellt sich die Architekturfrage. Ein Modell ist kein Fundament. Es kann teurer werden, sich ändern oder über Nacht nicht mehr verfügbar sein. Verlässlichkeit entsteht deshalb nicht im Modell, sondern in der Architektur: eine klare Abstraktion über dem Modell, ein Rückfall auf ein verfügbares, und eine Prüfung, die nicht davon abhängt, welches Modell gerade antwortet. Dann ist der Ausfall eines Anbieters ein schlechter Tag und kein Stillstand. Warum das mehr als Theorie ist, habe ich an einem konkreten Fall gezeigt.

Was bringt Ihnen das?

Zwei Leute setzen dieselben Werkzeuge ein und bekommen gegenteilige Ergebnisse. Der eine wird schneller bei Arbeit, die er versteht. Der andere vermeidet, die Arbeit überhaupt zu verstehen. Das Werkzeug kennt den Unterschied nicht. Der Ingenieur schon. Agentic Engineering heißt, das Tempo der KI zu nutzen und die Kontrolle zu behalten. Für Ihr Projekt bedeutet das Software, die schneller entsteht und trotzdem wartbar, prüfbar und unabhängig von kurzlebigen Trends bleibt. Das Modell von morgen kenne ich nicht. Die Methode, mit der ich es einsetze, schon.