*Teil 2 von 5 in der Reihe [The Human Inversion](/posts/series/the-human-inversion). Zurück: [The Inversion](/posts/the-human-inversion) · Weiter: [Async Parallel Specialists](/posts/the-human-inversion-async-parallel-specialists)*

---

## Wichtige Erkenntnisse

- **Ausführungsrückstand bei der Einstellung** verliert an Bedeutung, wenn der Durchsatz auf der Implementierungsebene nicht mehr durch die Anzahl der Mitarbeiter begrenzt ist.
- Der eigentliche Auslöser ist die **Aufmerksamkeitsgrenze**: Eine Person kann die Qualität von **grundlegenden Inputs**, **Überprüfung des Modelloutputs** und **strategischen Aufrufen** nicht mehr gleichzeitig aufrechterhalten.
- **Frühere Einstellungen sorgen oft für Koordination ohne Einfluss auf das Urteilsvermögen**; Bleiben Sie schlank, bis die Aufmerksamkeit, nicht der Rückstand, bricht.
- **Die Überprüfungslast variiert je nach Vertrauensinfrastruktur** – die Überprüfung strukturierter Ansprüche im Vergleich zur erneuten Ableitung von Rohunterschieden bewegt sich, wenn die Obergrenze erreicht wird.
- **Obergrenze-Signale kommen, bevor der Durchsatz sinkt**: Eine knappe KI-Ausgabe, dünnere Grundlagen oder eine aufgeschobene Strategie zeigen sich lange bevor das Team sie als Einstellungsproblem bemerkt, als stille Qualitätsschuld.

[Im vorherigen Beitrag](/posts/the-human-inversion) wurde argumentiert, dass sich der Mensch an die Enden des Softwareentwicklungsprozesses bewegt – Grundlage und Überprüfung –, während die KI die Mitte übernimmt. In diesem Beitrag geht es darum, was das bedeutet, wenn Sie einem Team einen Menschen hinzufügen.

Die Einstellungsberatung für Startups geht seit langem in zwei Richtungen. Canonical-Gründer haben sich im Allgemeinen für eine langsame Einstellung von Mitarbeitern ausgesprochen: Sam Altmans [YC Startup Playbook](https://playbook.samaltman.com/) beginnt seinen Einstellungsbereich mit „Mein erster Ratschlag zum Thema Einstellungen ist, tun Sie es nicht“, und die meisten YC-Partner sagen seit einem Jahrzehnt Versionen derselben Aussage. Inhalte zur operativen Skalierung – Investorenpräsentationen, Skalierungsberater, Essays zum Thema „Wie Sie Ihr Startup skalieren“ – drängen hingegen auf den gegenteiligen Ratschlag: [Stellen Sie frühzeitig ein](https://growth.eladgil.com/book/chapter-4-building-the-executive-team/hiring-executives/), bauen Sie das Team für Ihr Ziel auf, denn die Einstellung dauert Monate und eine Unterbesetzung beschleunigt sich schneller als eine Überbesetzung. Die meisten Gründer verinnerlichen eine Mischung dieser beiden Positionen, wobei die Mischung je nach Erfahrung und dem, was sie kürzlich gelesen haben, variiert.

Aufmerksamkeit war schon immer ein Teil der Einstellungskalkulation – man stellt einen Delegierten ein, wenn man zu wenig Personal hat. Aber es war zweitrangig gegenüber dem Rückstand bei der Ausführung: Der Hauptauslöser war die Anhäufung von Arbeit und nicht die Verschlechterung des Urteilsvermögens. Die Aufmerksamkeitsgrenze ist kein neuer Einstieg in die Debatte „langsam vs. schnell“. Es handelt sich um eine andere Achse, nach der keine Seite gefragt hat und die sich vom Hintergrundfaktor zum primären Auslöser verlagert hat.

In der aktuellen Debatte geht es darum, *wie schnell* man im Verhältnis zur Nachfrage neue Leute hinzugewinnen kann. Der Ratschlag für eine langsame Einstellung lautet: Warten Sie länger. Der vorausschauende Ratschlag lautet: Gehen Sie schneller vor. Beide gehen davon aus, dass die Einstellung von Mitarbeitern grundsätzlich eine Reaktion auf die Ausführungsnachfrage ist – die Frage dreht sich nur um den Zeitpunkt. Diese Annahme war im Gleichgewicht vor der KI richtig. Es ist jetzt nicht korrekt.

Die Annahme war richtig, denn die Ausführung war teuer. Als für das von Ihnen erstellte Artefakt ein PM erforderlich war, um die Spezifikation zu schreiben, ein Designer, der daraus einen Entwurf machte, und ein Ingenieur, der daraus Code machte, war die Ausführungsebene der Geschwindigkeitsbegrenzer für alles andere. Wenn Sie einen Ingenieur hatten und dieser den Engpass darstellte, verdoppelte sich der Durchsatz durch die Einstellung eines zweiten Ingenieurs ungefähr. Wenn Sie einen Designer hatten und dieser den Engpass darstellte, verdoppelte sich die Designkapazität durch die Einstellung eines zweiten Designers ungefähr. Die Ökonomie der Einstellung wurde durch die Ökonomie der Ausführung bestimmt, und die Ausführung skalierte in etwa mit der Anzahl der Mitarbeiter, da jeder zusätzliche Spezialist unabhängige Arbeit aus dem Rückstand übernehmen konnte.

Die Skalierung war nie wirklich linear – das Hinzufügen von Ingenieuren zu einem späten Projekt kann es später ermöglichen. Aber jeder zusätzliche Spezialist konnte immer noch unabhängige Ausführungsarbeiten übernehmen, so dass der Koordinationsaufwand eher eine Belastung für die Gewinne als eine Eliminierung dieser war.

Diese Steuer wurde sowohl durch langsames Personal als auch durch vorausschauende Beratung bewältigt. Slow-Hiring sagte: „Warten Sie länger, denn der Overhead ist größer als Sie denken.“ Ahead-of-the-curve sagte: „Machen Sie schneller, denn die Onboarding-Steuer ist geringer als die Kosten für Unterbesetzung.“ Beide stritten sich um die gleiche zugrunde liegende Frage: Wann lohnt sich der geringfügige Ausführungsaufwand für die Koordinierungskosten?

## Wenn sich der Auslöser ändert

Wenn die Ausführung auf KI reduziert wird, ändert sich die zugrunde liegende Frage. Die lineare Beziehung zwischen Mitarbeiterzahl und Durchsatz bricht zusammen, aber auch der Rahmen der Koordinierungssteuer – da der Großteil dieser Steuer speziell für die Koordinierung der Ausführungsarbeit zwischen Menschen existierte und die Ausführungsarbeit nicht mehr von Menschen erledigt wird.

Durch das Hinzufügen eines zweiten Ingenieurs wird der Output nicht mehr verdoppelt, da der einzelne Ingenieur, den Sie bereits haben, keinen Engpass bei der Ausführung hat – er hat einen Engpass bei den menschlichen Eingaben zur Ausführung. Die grundlegenden Eingaben, die architektonischen Beurteilungen, die Überprüfung dessen, was die KI hervorgebracht hat, die strategischen Entscheidungen darüber, was als nächstes gebaut werden soll.

Ein zweiter Ingenieur parallelisiert diese Eingaben nicht auf die Art und Weise, wie er es früher bei der Parallelisierung der Implementierungsarbeit getan hat. Stattdessen führen sie zu Koordinierungskosten, Kosten für die gemeinsame Nutzung von Kontexten und der Notwendigkeit, zwei Menschen auf Entscheidungen abzustimmen, die ein Mensch einseitig und in Ordnung getroffen hat. Das Gleiche gilt für den zweiten Designer, den zweiten Premierminister, den zweiten von allem.

Grundlage und Überprüfung profitieren von der Kontextintegration in einem einzigen Kopf und nicht von der Aufteilung auf mehrere Köpfe.

Dadurch ändert sich, was der eigentliche Einstellungsauslöser ist. Es heißt nicht mehr: „Wir haben zu viel Ausführungsarbeit für das aktuelle Team.“ Es ist:

> **Das Aufmerksamkeitsbudget des aktuellen Teams ist für die menschlichen Eingaben in die KI und die Überprüfung ihrer Ergebnisse erschöpft.**

Die Aufmerksamkeitsgrenze ist eine reale und spezifische Sache. Es ist der Moment, in dem der einzelne Mensch, der ein Produkt oder eine Funktion steuert, den drei Lasten, die er trägt, nicht mehr ausreichend Aufmerksamkeit schenken kann:

1. Grundlegende Artefakte mit ausreichender Sorgfalt erstellen, damit die KI sie gut bearbeiten kann.
2. Überprüfung der KI-Ausgabe mit ausreichender Dichte, damit sich die Qualität nicht verschlechtert.
3. Treffen Sie strategische Entscheidungen, die darüber entscheiden, was als Nächstes gebaut wird.

Wenn einer dieser drei Punkte vernachlässigt wird, sind Sie am Limit. Die Vernachlässigung zeigt sich, bevor der Durchsatz sinkt, weshalb Teams sie oft übersehen.

## Wie die Decke aussieht

Die drei Belastungen sind weder teamübergreifend noch zeitlich stabil. Die Überprüfungslast hängt insbesondere davon ab, wie viel davon *Verifizierung von KI-Ansprüchen* ist und wie viel *Neuableitung dessen, was die KI nicht erklärt hat*. Teams, die immer noch das Vertrauen in ihre KI-Tools kalibrieren, zahlen die höhere Steuer. Ein Prüfer, der der strukturierten Behauptung des Agenten vertraut, dass eine bestimmte Invariante überprüft wurde, liest eine kurze Zusammenfassung und fährt fort; ein Prüfer, der die Invariante nicht noch einmal von Grund auf überprüft. Die Aufmerksamkeitsgrenze erreicht früher – oft viel früher – bei Teams, bei denen die Verifizierung noch eine erneute Ableitung ist, was bei den meisten Teams zu Beginn des Übergangs und bei allen Teams auf Oberflächen der Fall ist, bei denen die Kosten eines verpassten Sprungs die erneute Ableitung trotzdem rechtfertigen. Dies ist kein Grund, die Anmietung zu verschieben. Dies ist ein Grund zu erkennen, dass die Ankunftszeit der Obergrenze sowohl von der Vertrauensinfrastruktur als auch vom Rohdurchsatz abhängt, und in die Infrastruktur zu investieren, die die Überprüfung kostengünstig macht, bevor die Obergrenze die Einstellung erzwingt.

Praktisch sieht es so aus: Der Gründer, der jede KI-Ausgabe sorgfältig überprüft hat, beginnt zu überfliegen. Der Premierminister, der eine umfassende Benutzerrecherche durchgeführt hat, beginnt, alte Interviewnotizen wiederzuverwenden. Der Ingenieur, der die Architekturstandards verfeinerte, beginnt, Abweichungen zuzulassen, weil das ordnungsgemäße Schreiben des Einschränkungsdokuments eine Woche dauern würde, die er nicht hat. Keines davon führt zu sofortigen Ausfällen. Die Artefakte werden weiterhin produziert, die Funktionen werden weiterhin bereitgestellt und die Benutzer verwenden sie weiterhin. Aber die Gesamtqualität der Arbeit beginnt sich zu verschlechtern, und die Verschlechterung ist monatelang unsichtbar, bevor sie im Produkt lesbar wird.

Das ist der Auslöser. Nicht, wenn Sie mit der Ausführung nicht Schritt halten können, denn die Ausführung wird selbst erledigt. Nicht, wenn der Umsatz besagt, dass Sie sich eine Miete leisten können, denn die Erschwinglichkeit war nie der verbindliche Faktor dafür, ob eine Miete hilft. Der Auslöser liegt darin, dass die menschliche Aufmerksamkeit für die Ein- und Ausgänge der KI über das hinausgeht, was eine einzelne Person an Qualität aufrechterhalten kann.

Die Aufmerksamkeitsobergrenze stellt beide Seiten der bestehenden Debatte neu dar. Bleiben Sie so lange allein, wie es das Aufmerksamkeitsbudget zulässt, denn jede Einstellung vor der Aufmerksamkeitsgrenze ist Reibung ohne Hebelwirkung – und das Timing-Signal war weder eine langsame Einstellung noch eine vorausschauende Beratung.

## Die Einwände

Für Leute, die beide Seiten der bestehenden Debatte verinnerlicht haben, wird das falsch klingen, weil keine Seite die Frage gestellt hat, auf die diese Antwort antwortet.

**Aber was ist mit dem Rückstand?** Es gibt keinen Rückstand im alten Sinne. Der Rückstand war früher eine Warteschlange von Ausführungsarbeiten, die auf Spezialisten warteten. Nun ist die Einschränkung nicht die Ausführung; Es ist die Beurteilung dessen, was es wert ist, ausgeführt zu werden. Ein Rückstand an „Dingen, deren Bau der Gründer noch nicht entschieden hat“ ist kein Einstellungssignal – es ist ein Priorisierungssignal. Ein zweiter Mensch löst keine Priorisierung; Sie fügen eine weitere Perspektive hinzu, die in Einklang gebracht werden muss.

**Aber was ist mit der Spezialisierung?** Spezialisierung wird in großem Maßstab von Bedeutung sein, und ich werde im nächsten Beitrag argumentieren, dass die Vertiefung der Spezialisten am Ende die Form ist, die Teams annehmen, wenn sie wachsen. Aber das Spezialisierungsargument ist ein Grund, bestimmte Leute einzustellen, sobald Sie die Obergrenze überschritten haben, und kein Grund, frühzeitig einzustellen. Ein generalistischer Gründer, der mit KI arbeitet, kann die gesamte Ausführungsfläche eines kleinen Produkts abdecken. Was sie nicht abdecken können, ist ihre eigene Aufmerksamkeit im großen Maßstab. Stellen Sie ein, um die Aufmerksamkeit zu steigern, nicht um die Oberfläche abzudecken – die Oberfläche wird von der KI abgedeckt.

**Aber wie sieht es mit der Belastbarkeit aus? Bus-Faktor?** Das ist ein echtes Problem, und die ehrliche Antwort lautet: Ein Einzelgründer mit KI hat einen schlechteren Bus-Faktor als ein Dreierteam und einen besseren Bus-Faktor als ein Dreierteam im Gleichgewicht vor der KI. Der Grund dafür ist, dass die Artefakte, die die KI zum Funktionieren benötigt – die Rubriken, die Standards, die grundlegenden Dokumente – selbst dauerhaftes organisatorisches Wissen sind, in einer Weise, wie es bei der Stammesverständigung zwischen drei Menschen nicht der Fall war. Die Frage nach dem Busfaktor ist real, löst sich jedoch nicht automatisch bei größeren Teams.

**Aber was ist mit dem Wachstum? Werde ich mit mehr Menschen nicht schneller wachsen?** Wahrscheinlich nicht, in den Phasen, in denen dieser Rat zutrifft. Das Wachstum im Frühstadium wird dadurch gesteuert, dass man herausfindet, was es wert ist, angebaut zu werden. Bei dieser Feststellung handelt es sich um ein Beurteilungsproblem, nicht um ein Ausführungsproblem, und die Beurteilung lässt sich nicht gut parallelisieren. Sobald Sie das Ding gefunden haben – sobald die Eignung des Produkts für den Markt tatsächlich bestätigt und nicht nur erhofft wurde –, wird das Wachstum teilweise realisierbar, und dann beginnt die Aufmerksamkeitsobergrenze zu binden, da die Menge an KI-Inputs, die erforderlich ist, um mit der wachsenden Nachfrage Schritt zu halten, tatsächlich das übersteigt, was ein Mensch schaffen kann. Das ist das Mietsignal. Nicht vorher.

## Was das in der Praxis bedeutet

Für Gründer in der Anfangsphase bedeutet dies Folgendes: Sie sind wahrscheinlich zu stark besetzt im Verhältnis zu Ihrem tatsächlichen Einfluss. Der zweite Ingenieur, den Sie vor sechs Monaten eingestellt haben, produziert wahrscheinlich weniger Grenzwert als Sie angenommen haben, weil die Ausführungsebene, die er beschleunigen sollte, keine Beschleunigung mehr benötigt. Der PM, den Sie einstellen wollten, würde die Koordinationskosten wahrscheinlich schneller erhöhen als die Urteilsfähigkeit. Der Designer, von dem Sie ein schlechtes Gewissen hatten, dass Sie ihn nicht eingestellt haben, erschließt möglicherweise erst etwas, wenn Ihre Aufmerksamkeit bereits auf zu viele Bereiche gerichtet ist, um sie abzudecken.

Die gleiche Realität liest sich innerhalb des Teams anders. Wenn die Ausführungsebene schrumpft, müssen einige Rollen, die hauptsächlich durch die Ausführung definiert wurden, rund um die Grundlage und Überprüfung neu definiert werden, und diese Neudefinition ist echte Arbeit und keine fröhliche Umbenennung. Der technische Leiter, dessen Berichte fragen, ob er Produktmanager werden soll, befindet sich von innen heraus in derselben Übergangsphase. Die Neudefinition fordert den Spezialisten auf, das Gewicht seiner Identität vom Hinrichtungshandwerk zum Urteilshandwerk zu verlagern, eine Migration, für die die meisten Menschen noch nicht über das Vokabular verfügen.

## Die Oberflächenexpansionsfalle

Was die Migration verwirrend macht, ist, dass KI die Oberfläche erweitert, die jede einzelne Person abdecken kann. Derselbe Ingenieur, der früher einen PM zur Definition des Problems benötigte, kann jetzt neben der Architekturarbeit auch die Kundenfindung übernehmen. Derselbe PM, der früher einen Ingenieur zur Validierung der Machbarkeit benötigte, kann jetzt einen funktionierenden Prototyp erstellen.

Die Erweiterung ist real und wertvoll. Aber die Erweiterung liegt in dem, was die *Person* tun kann, und nicht in dem, was eine einzelne *Rolle* erfordert. Integrative Produktbeurteilung und architektonische Systembeurteilung bleiben unterschiedliche Disziplinen mit unterschiedlichen Qualitätskriterien, selbst wenn eine Person beides praktiziert.

Das Risiko besteht darin, dass Organisationen die erweiterte Person sehen und zu dem Schluss kommen, dass die Disziplinen zusammengewachsen sind, und dann aufhören, in einer der Disziplinen Tiefe zu entwickeln. Ich habe über [eine Version davon in der PM-Welt](/posts/the-argument-cagan-already-won) geschrieben, in der die einflussreichste Stimme in der Disziplin die Rolle rund um das Prototyping genau definierte, als Prototyping zur Massenaktivität wurde. Die Gesamtkosten steigen, wenn die Aufmerksamkeitsgrenze erreicht wird und das Team Spezialisten braucht, deren Urteilsvermögen nie geschärft wurde, weil die Rolle nie als eigenständige Sache behandelt wurde.

[Teil 4](/posts/the-human-inversion-the-reconciler-and-the-rubric) hat etwas über die Infrastruktur zu sagen, die diese Neudefinition für die Organisation dauerhaft macht; [Teil 5](/posts/the-human-inversion-how-the-architecture-bends) hat etwas über die Oberflächen zu sagen, auf denen die Neudefinition langsamer erfolgt. Keiner der Beiträge macht die individuelle Erfahrung schmerzlos. Beide gehen davon aus, dass es sich bei der Erfahrung um eine reale Sache handelt, mit der sich die Teams zurechtfinden müssen, und nicht um eine vorübergehende Stimmung.

[Im nächsten Beitrag](/posts/the-human-inversion-async-parallel-specialists) geht es darum, wie Teams nach der Aufmerksamkeitsgrenze tatsächlich aussehen – wenn Spezialisten hinzukommen und sich die Frage stellt, wie sie zusammenarbeiten, ohne den Koordinationsaufwand wieder einzuführen, den die Inversion eigentlich beseitigen sollte.

---

*Lesen Sie weiter: [Teil 3 – Async-Parallel-Spezialisten](/posts/the-human-inversion-async-parallel-specialists)*