*Parte 2 de 5 da série [A Inversão Humana](/posts/series/the-human-inversion). Anterior: [A Inversão](/posts/the-human-inversion) · Próximo: [Especialistas em Paralelo Assíncrono](/posts/the-human-inversion-async-parallel-specialists)*

---

## Principais conclusões

- **A contratação com pendências de execução** perde seu sinal quando a produtividade não é mais limitada pelo número de funcionários na camada de implementação.
- O verdadeiro gatilho é o **teto de atenção**: uma pessoa não consegue mais sustentar a qualidade em **insumos fundamentais**, **revisão dos resultados do modelo** e **chamadas estratégicas** de uma só vez.
- **Contratações anteriores geralmente adicionam coordenação sem influência de julgamento**; permaneça magro até que a atenção, e não o acúmulo, seja interrompida.
- **A carga de revisão varia de acordo com a infraestrutura de confiança** — verificação de declarações estruturadas versus re-derivação de movimentos de diferenças brutas quando o teto atinge.
- **Sinais de teto chegam antes que o rendimento caia**: skimming na produção de IA, fundações mais estreitas ou estratégia adiada aparecem como dívida de qualidade silenciosa muito antes de a equipe perceber isso como um problema de contratação.

[A postagem anterior](/posts/the-human-inversion) argumentou que os humanos estão avançando para as extremidades do processo de desenvolvimento de software – fundação e revisão – enquanto a IA fica no meio. Esta postagem é sobre o que isso significa quando você adiciona um humano a uma equipe.

Os conselhos de contratação de startups há muito tempo seguem duas direções. Os escritos dos fundadores da Canonical geralmente defendem a contratação lenta: o [YC Startup Playbook] de Sam Altman (https://playbook.samaltman.com/) abre sua seção de contratação com "meu primeiro conselho sobre contratação é não faça isso", e a maioria dos parceiros da YC disseram versões da mesma coisa por uma década. Enquanto isso, o conteúdo de escalonamento operacional - apresentações para investidores, consultores de escalonamento, ensaios sobre "como escalar sua startup" - empurra o conselho oposto: [contrate à frente da curva](https://growth.eladgil.com/book/chapter-4-building-the-executive-team/hiring-executives/), construa a equipe para onde você está indo, porque a contratação leva meses e a falta de pessoal aumenta mais rápido do que o excesso de pessoal. A maioria dos fundadores internaliza alguma combinação dessas duas posições, variando a combinação de acordo com a experiência e o que leram recentemente.

A atenção sempre fez parte do cálculo de contratação – você contrata para delegar quando está muito disperso. Mas era secundário em relação ao atraso na execução: o principal gatilho foi o acúmulo de trabalho, e não a degradação do julgamento. O limite de atenção não é uma nova entrada no debate lento versus rápido. É um eixo diferente sobre o qual nenhum dos lados questionava, um eixo que passou do fator de fundo para o gatilho primário.

O debate existente é sobre *quão rápido* adicionar pessoas em relação à procura. O conselho sobre contratação lenta diz para esperar mais; conselhos avançados dizem para avançar mais rápido. Ambos assumem que a contratação é fundamentalmente uma resposta à procura de execução – a questão é apenas sobre o timing. Essa suposição estava correta no equilíbrio pré-IA. Não está correto agora.

A suposição estava correta porque a execução era cara. Quando o artefato que você estava construindo exigia que um PM escrevesse a especificação, um designer para transformá-lo em um design e um engenheiro para transformá-lo em código, a camada de execução era o limitador de taxa de todo o resto. Se você tivesse um engenheiro e ele fosse o gargalo, contratar um segundo engenheiro praticamente dobraria o rendimento. Se você tivesse um designer e ele fosse o gargalo, contratar um segundo designer praticamente dobraria a capacidade de design. A economia da contratação era governada pela economia da execução, e a execução era escalonada aproximadamente de acordo com o número de funcionários, porque cada especialista adicional poderia assumir trabalho independente da carteira de pedidos.

O dimensionamento nunca foi realmente linear – adicionar engenheiros a um projeto tardio pode torná-lo mais tarde. Mas cada especialista adicional ainda poderia assumir o trabalho de execução independente, de modo que as despesas gerais de coordenação representavam um imposto sobre os ganhos, e não uma eliminação deles.

Tanto a contratação lenta quanto a consultoria antecipada estavam administrando esse imposto. A contratação lenta dizia “espere mais, porque as despesas gerais são maiores do que você pensa”. Ahead-of-the-curve disse “aja mais rápido, porque a taxa de integração é menor que o custo da falta de pessoal”. Ambos discutiam sobre a mesma questão subjacente: quando é que o aluguer de execução marginal vale o seu custo de coordenação.

## Quando o gatilho muda

Quando a execução entra em colapso para a IA, a questão subjacente muda. A relação linear entre o número de funcionários e o rendimento quebra, mas o mesmo acontece com a estruturação de impostos de coordenação – porque a maior parte desse imposto existia especificamente para coordenar o trabalho de execução entre humanos, e o trabalho de execução não está mais sendo feito por humanos.

Adicionar um segundo engenheiro não duplica mais a produção, porque o único engenheiro que você já possui não tem gargalos na execução — eles têm gargalos nas entradas humanas para a execução. Os insumos fundamentais, os julgamentos arquitetônicos, a revisão do que a IA produziu, as decisões estratégicas sobre o que construir a seguir.

Um segundo engenheiro não paraleliza essas entradas da mesma forma que costumava paralelizar o trabalho de implementação. Em vez disso, introduzem custos de coordenação, custos de partilha de contexto e a necessidade de alinhar dois seres humanos em decisões de julgamento que um ser humano estava a fazer unilateralmente e sem problemas. O mesmo se aplica ao segundo designer, ao segundo PM, ao segundo de qualquer coisa.

A fundação e a revisão se beneficiam da integração do contexto em um único cabeçalho, em vez da divisão em vários cabeçalhos.

Isso muda o que realmente é o gatilho de contratação. Não é mais “temos muito trabalho de execução para a equipe atual”. É:

> **O orçamento de atenção da equipe atual se esgotou nas contribuições humanas para IA e na revisão de seus resultados.**

O teto de atenção é algo real e específico. É o momento em que o único ser humano que dirige um produto ou função não consegue mais dar atenção adequada às três cargas que carrega:

1. Criar artefatos fundamentais com cuidado suficiente para que a IA possa executá-los bem.
2. Revisar a produção da IA ​​com densidade suficiente para que a qualidade não seja degradada.
3. Fazer o julgamento estratégico que determina o que será construído a seguir.

Quando qualquer um desses três começa a ser negligenciado, você está no teto. A negligência aparece antes que o rendimento caia, e é por isso que as equipes muitas vezes não percebem.

## Como é o teto

As três cargas não são estáveis entre equipes ou ao longo do tempo. A carga de revisão, em particular, varia de acordo com o quanto é *verificação de reivindicações de IA* e quanto é *rederivação do que a IA não explicou.* As equipes que ainda calibram a confiança em suas ferramentas de IA pagam o imposto mais alto. Um revisor que confia na afirmação estruturada do agente de que uma determinada invariante foi verificada lê um breve resumo e segue em frente; um revisor que não verifica novamente a invariante do zero. O limite de atenção chega mais cedo – muitas vezes muito mais cedo – em equipes onde a verificação ainda é uma rederivação, ou seja, a maioria das equipes no início da transição e todas as equipes em superfícies onde o custo de um salto perdido justifica a rederivação independentemente. Isso não é motivo para atrasar a contratação. É uma razão para reconhecer que o tempo de chegada do limite máximo depende tanto da infra-estrutura de confiança como do rendimento bruto, e para investir na infra-estrutura que torna a verificação barata antes que o limite máximo force a contratação.

Na prática, é assim: o fundador que estava revisando cuidadosamente cada resultado da IA ​​começa a analisar. O PM que estava fazendo uma pesquisa profunda com os usuários começa a reutilizar anotações de entrevistas antigas. O engenheiro que estava refinando os padrões arquitetônicos começa a deixar o desvio se acumular porque escrever o documento de restrição corretamente levaria uma semana que eles não têm. Nada disso produz falhas imediatas. Os artefatos ainda são produzidos, os recursos ainda são enviados, os usuários ainda os utilizam. Mas a qualidade composta do trabalho começa a degradar-se, e a degradação fica invisível durante meses antes de se tornar legível no produto.

Esse é o gatilho. Não quando você não consegue acompanhar a execução, porque a execução é controlada. Não quando a receita diz que você pode pagar uma contratação, porque a acessibilidade nunca foi a restrição vinculativa para saber se uma contratação ajuda. O gatilho ocorre quando a atenção humana nas entradas e saídas da IA ​​ultrapassa o que uma única pessoa pode sustentar com qualidade.

O limite de atenção reformula ambos os lados do debate existente. Permaneça sozinho enquanto o orçamento de atenção permitir, porque cada contratação antes do limite de atenção é um atrito sem alavancagem - e o sinal de tempo que nem a contratação lenta nem o aconselhamento antecipado estavam monitorando.

## As objeções

Isto parecerá errado para as pessoas que internalizaram qualquer um dos lados do debate existente, porque nenhum dos lados estava a fazer a pergunta à qual esta resposta responde.

**Mas e quanto ao backlog?** Não existe backlog no sentido antigo. O backlog era uma fila de trabalhos de execução à espera de especialistas. Agora a restrição não é a execução; é um julgamento sobre o que vale a pena executar. Um acúmulo de “coisas que o fundador ainda não decidiu se construirá” não é um sinal de contratação – é um sinal de priorização. Um segundo humano não resolve a priorização; eles acrescentam outra perspectiva que precisa ser reconciliada.

**Mas e a especialização?** A especialização será importante em escala, e argumentarei no próximo post que o aprofundamento do especialista nas extremidades é a forma que as equipes assumem quando crescem. Mas o argumento da especialização é um motivo para contratar pessoas específicas quando o limite for ultrapassado, e não um motivo para contratar antecipadamente. Um fundador generalista operando com IA pode cobrir toda a superfície de execução de um pequeno produto. O que eles não conseguem cobrir é a sua própria atenção em grande escala. Contrate para ampliar a atenção, não para cobrir a área de superfície – a área de superfície é coberta pela IA.

**Mas e a resiliência? Fator de ônibus?** Esta é uma preocupação real, e a resposta honesta é que um fundador solo com IA tem pior fator de barramento do que uma equipe de três, e melhor fator de barramento do que uma equipe de três teria no equilíbrio pré-IA. A razão é que os artefatos de que a IA precisa para funcionar – as rubricas, os padrões, os documentos fundamentais – são eles próprios conhecimento organizacional durável de uma forma que o entendimento tribal entre três humanos não era. A questão do fator ônibus é real, mas não se resolve automaticamente em equipes maiores.

**Mas e quanto ao crescimento? Não crescerei mais rápido com mais pessoas?** Provavelmente não, nos estágios em que este conselho se aplica. O crescimento no estágio inicial é determinado pela descoberta de algo que vale a pena crescer. Essa conclusão é um problema de julgamento, não um problema de execução, e o julgamento não é bem paralelo. Uma vez que você tenha encontrado a coisa - uma vez que o ajuste do produto ao mercado seja realmente validado, e não apenas esperado - o crescimento torna-se parcialmente executável, e é aí que o teto de atenção começa a se tornar obrigatório, porque o volume de insumos de IA necessários para acompanhar a demanda crescente na verdade excede o que um ser humano pode criar. Esse é o sinal de contratação. Não antes.

## O que isso significa na prática

A implicação para os fundadores em estágio inicial é esta: você provavelmente tem uma equipe muito grande em relação a onde realmente está sua influência. O segundo engenheiro que você contratou há seis meses provavelmente está produzindo menos valor marginal do que você supunha, porque a camada de execução que eles deveriam acelerar não precisa mais de aceleração. O PM que você estava prestes a contratar provavelmente acrescentaria custos de coordenação mais rapidamente do que capacidade de julgamento. O designer que você se sentiu culpado por não contratar pode não desbloquear nada até que sua atenção já esteja esticada em muitas superfícies para cobrir.

A mesma realidade é lida de forma diferente dentro da equipe. Se a camada de execução estiver diminuindo, algumas funções que foram definidas principalmente pela execução precisarão ser redefinidas em torno da fundação e da revisão, e essa redefinição é um trabalho real, e não uma reetiquetagem alegre. O gerente de engenharia cujos subordinados perguntam se deveriam se tornar gerentes de produto está operando dentro da mesma transição, de dentro para fora. A redefinição pede ao especialista que migre o peso de sua identidade da arte da execução para a arte do julgamento, que é uma migração para a qual a maioria das pessoas ainda não tem vocabulário.

## A armadilha de expansão de superfície

Uma coisa que torna a migração confusa é que a IA expande a superfície que qualquer pessoa pode cobrir. O mesmo engenheiro que precisava de um PM para definir o problema agora pode fazer a descoberta do cliente junto com o trabalho de arquitetura. O mesmo PM que precisava de um engenheiro para validar a viabilidade agora pode construir um protótipo funcional.

A expansão é real e valiosa. Mas a expansão está naquilo que a *pessoa* pode fazer, e não naquilo que qualquer *papel* único exige. O julgamento integrativo do produto e o raciocínio do sistema arquitetônico permanecem disciplinas distintas com critérios de qualidade distintos, mesmo quando uma pessoa pratica ambos.

O risco é que as organizações vejam a pessoa expandida e concluam que as disciplinas se fundiram, parando então de desenvolver profundidade em qualquer uma delas. Escrevi sobre [uma versão disso no mundo PM](/posts/the-argument-cagan-already-won), onde a voz mais influente na disciplina definiu o papel em torno da prototipagem assim que a prototipagem se tornou a atividade comoditizada. O custo composto chega quando o limite de atenção atinge e a equipe precisa de especialistas cujo julgamento nunca foi cultivado porque a função nunca foi tratada como algo próprio.

[Parte 4](/posts/the-human-inversion-the-reconciler-and-the-rubric) tem algo a dizer sobre a infraestrutura que torna essa redefinição durável para a organização; [Parte 5](/posts/the-human-inversion-how-the-architecture-bends) tem algo a dizer sobre as superfícies onde a redefinição acontece mais lentamente. Nenhuma das postagens torna a experiência individual indolor. Ambos assumem que a experiência é algo real que as equipes precisam navegar, e não um clima que passa.

[A próxima postagem](/posts/the-human-inversion-async-parallel-specialists) é sobre como as equipes realmente se parecem além do limite de atenção - quando os especialistas chegam, e a questão é como eles trabalham juntos sem reintroduzir a sobrecarga de coordenação que a inversão deveria eliminar.

---

*Continue lendo: [Parte 3 — Especialistas em Paralelo Assíncrono](/posts/the-human-inversion-async-parallel-specialists)*