Hvordan Anthropic udvikler internt - det er helt, helt vildt....

Her er et glimt af, hvad vi alle kan vente os om nogle år....

Først den originale “post” fra Twitter på engelsk, og så den engelske oversættelse (tak til ChatGPT):


1. Anthropic’s product development timelines have gone from six months to one month, sometimes one week, sometimes one day. Part of this acceleration is access to the latest models (i.e. Mythos). Another is shipping new products into “research preview,” making clear it's early, experimental, and might not be supported forever. Another is an evergreen "launch room "where engineers post ready features and marketing turns around announcements the next day.


2. The PM role is shifting from coordinating multi-month roadmaps to enabling teams to ship daily. As Cat puts it, “There should be less emphasis on making sure you are aligning your multi-quarter roadmaps with your partner teams and more emphasis on, OK, how can we figure out the fastest way to get something out the door?”


3. The most efficient shipping unit is an engineer with great product taste. On Cat’s team, many engineers go end-to-end—from seeing user feedback on Twitter to shipping a product by the end of the week—without a PM involved. Also, almost all the PMs on the Claude Code team have either been engineers or ship code themselves, and the designers have been front-end engineers. The roles are merging, and the most valuable skill is product taste, not job title.


4. Build products that are on the edge of working. Claude Code’s code review product failed multiple times because earlier models weren’t accurate enough. But because the prototype was already built, they could swap in Opus 4.5 and 4.6 and immediately test whether the gap was closed. Teams that wait for the model to be ready will always be a cycle behind.


5. The most underrated skill for building AI products is asking the model to introspect on its own mistakes. Cat regularly asks the model why it made an unexpected decision. The model will explain that something in the system prompt was confusing, or that it delegated verification to a subagent that didn’t check its work. This reveals what misled the model so the team can fix the harness.


6. Every model release forces their team to revisit existing products and audit their system prompt to remove features the model no longer needs. Claude Code’s to-do list was a crutch for earlier models that couldn’t track their own work. With Opus 4, the model handles it natively. Features built as scaffolding for weaker models become debt when the model catches up—so the team actively strips them.


7. Anthropic employees build custom internal tools instead of buying SaaS products. A sales team member built a web app that pulls from Salesforce, Gong, and call notes to auto-customize pitch decks—work that used to take 20 to 30 minutes now takes seconds. Their core stack is Claude Code, Cowork, and Slack. No Notion, no Linear, no Figma.


8. People underestimate how much Claude’s personality contributes to its success. As Cat describes it, “When you reflect on everyone you’ve worked with, there’s just some people where you’re like, I really like their energy, their vibe.” Claude is designed to be low-ego, positive, competent, and earnest—qualities that make it feel like a great coworker, not just a tool. This isn’t cosmetic; it’s what makes people want to use Claude for hours every day. The team has a dedicated person, Amanda, who “molds Claude’s character,” and it’s one of the hardest roles at the company because success is so subjective.


9. The future of work is managing fleets of AI agents, not doing the work yourself. Cat sees a clear progression: first, individual tasks become successful. Then people start running multiple tasks at the same time (multi-Clauding). Next, people will run 50 or 100 tasks simultaneously, which will require new infrastructure—remote execution, better interfaces for managing tasks, agents that fully verify their work, and self-improving systems that incorporate feedback. The human role shifts from doing the work to knowing which tasks to look into, verifying outputs, and giving feedback that makes the system better over time.


10. Hire people who lean into chaos and face every challenge with a smile. At Anthropic, there are weeks when a P0 on Sunday becomes a P00 by Monday and a P000 by Monday afternoon. If you get too stressed about any one thing, you’ll burn out. Their team looks for people who can look at a hard challenge and say, “Wow, that’s gonna be hard. But I’m excited to tackle it and I’m gonna do the best that I possibly can.” This mindset—optimism, resilience, and comfort with constant change—is increasingly essential as the pace of AI development accelerates.


Dansk oversættelse:

  1. Anthropics produktudviklingstidslinjer er gået fra seks måneder til én måned – nogle gange én uge, nogle gange én dag. En del af denne acceleration skyldes adgang til de nyeste modeller (f.eks. Mythos). En anden del er, at man lancerer nye produkter i “research preview”, hvor det tydeligt fremgår, at det er tidligt, eksperimentelt og måske ikke bliver understøttet permanent. Derudover har de et vedvarende “launch room”, hvor ingeniører lægger færdige funktioner op, og marketing følger op med annonceringer allerede dagen efter.

  2. Produktlederrollen (PM) er ved at ændre sig fra at koordinere fler-måneders roadmaps til at muliggøre, at teams kan lancere noget dagligt. Som Cat siger: “Der bør være mindre fokus på at sikre, at du afstemmer dine fler-kvartals roadmaps med partnerteams, og mere fokus på: hvordan finder vi den hurtigste måde at få noget ud ad døren på?”

  3. Den mest effektive enhed til at levere produkter er en ingeniør med god produktfornemmelse. På Cats team går mange ingeniører hele vejen fra at se brugerfeedback på Twitter til at lancere et produkt inden for en uge – uden en PM involveret. Næsten alle PM’er på Claude Code-teamet har enten været ingeniører eller skriver selv kode, og designerne har været frontend-ingeniører. Roller smelter sammen, og den vigtigste kompetence er produktfornemmelse – ikke jobtitel.

  4. Byg produkter, der ligger på kanten af at virke. Claude Codes code review-produkt fejlede flere gange, fordi tidligere modeller ikke var præcise nok. Men fordi prototypen allerede var bygget, kunne de udskifte modellen med Opus 4.5 og 4.6 og straks teste, om problemet var løst. Teams, der venter på, at modellen er klar, vil altid være en cyklus bagud.

  5. Den mest undervurderede færdighed i udvikling af AI-produkter er at få modellen til at reflektere over sine egne fejl. Cat spørger jævnligt modellen, hvorfor den traf en uventet beslutning. Modellen kan forklare, at noget i systemprompten var uklart, eller at den overlod verifikation til en underagent, der ikke kontrollerede sit arbejde. Det afslører, hvad der førte modellen på afveje, så teamet kan rette opsætningen.

  6. Hver modelopdatering tvinger teamet til at genbesøge eksisterende produkter og gennemgå deres systemprompter for at fjerne funktioner, modellen ikke længere har brug for. Claude Codes to-do-liste var en krykke for tidligere modeller, som ikke kunne holde styr på deres eget arbejde. Med Opus 4 klarer modellen det selv. Funktioner, der blev bygget som støtte til svagere modeller, bliver til teknisk gæld, når modellen indhenter dem – så teamet fjerner dem aktivt.

  7. Anthropics medarbejdere bygger interne værktøjer i stedet for at købe SaaS-løsninger. En medarbejder i salgsteamet byggede en webapp, der trækker data fra Salesforce, Gong og opkaldsnoter for automatisk at tilpasse præsentationer – arbejde, der før tog 20–30 minutter, tager nu sekunder. Deres kerneværktøjer er Claude Code, Cowork og Slack. Ingen Notion, ingen Linear, ingen Figma.

  8. Folk undervurderer, hvor meget Claudes personlighed bidrager til dens succes. Som Cat beskriver det: “Når du tænker på alle, du har arbejdet med, er der bare nogle mennesker, hvor du tænker: jeg kan virkelig godt lide deres energi og deres vibe.” Claude er designet til at være ydmyg, positiv, kompetent og oprigtig – egenskaber, der får den til at føles som en god kollega, ikke bare et værktøj. Det er ikke kosmetisk; det er det, der får folk til at bruge Claude i timevis hver dag. Teamet har en dedikeret person, Amanda, som “former Claudes karakter”, og det er en af de sværeste roller i virksomheden, fordi succes er så subjektiv.

  9. Fremtidens arbejde handler om at styre flåder af AI-agenter – ikke om selv at udføre arbejdet. Cat ser en klar udvikling: først bliver individuelle opgaver løst succesfuldt. Derefter begynder folk at køre flere opgaver samtidig (multi-Clauding). Næste skridt er at køre 50 eller 100 opgaver parallelt, hvilket kræver ny infrastruktur – fjernkørsel, bedre grænseflader til opgavestyring, agenter der fuldt ud verificerer deres arbejde, og selvforbedrende systemer, der indarbejder feedback. Menneskets rolle ændrer sig fra at udføre arbejdet til at vide, hvilke opgaver man skal kigge nærmere på, verificere output og give feedback, der løbende forbedrer systemet.

  10. Ansæt mennesker, der trives i kaos og møder enhver udfordring med et smil. Hos Anthropic er der uger, hvor en P0 om søndagen bliver til en P00 mandag og en P000 mandag eftermiddag. Hvis man bliver for stresset over enkelte ting, brænder man ud. Teamet søger folk, der kan se en svær udfordring og sige: “Wow, det bliver svært. Men jeg glæder mig til at tage fat på det og vil gøre mit allerbedste.” Denne tilgang – optimisme, robusthed og komfort med konstant forandring – er i stigende grad afgørende i takt med, at udviklingen inden for AI accelererer.

Og for de af os, der aldrig har hørt om P0, P00 & P000: Det er interne betegnelser for prioritet og alvorlighed af problemer (issues) – typisk brugt i tech- og udviklingsmiljøer.

  • P0 (Priority 0): Kritisk problem
    → Noget er helt nede eller ødelagt. Skal fixes med det samme.

  • P00: Endnu mere kritisk (uformel eskalering)
    → Bruges ikke altid formelt, men signalerer: det her er virkelig slemt

  • P000: Ekstremt kritisk / “alt brænder”
    → Ofte humoristisk eller kulturelt internt – betyder: drop alt, fix nu

Pointen i teksten er ikke de præcise definitioner, men kulturen:
prioriteter kan eskalere meget hurtigt, og det, der var kritisk i går, kan føles endnu mere presserende i dag.

Så P0 er standard – P00 og P000 er en slags “forstærkede” versioner, ofte brugt lidt uformelt for at understrege alvoren.


Kommentarer

Populære opslag fra denne blog

De fem forbandede år

Udvikling af Danmarks forsvar: Lærdomme fra Ukraine og anbefalinger mod Rusland 2025–2045

Evaluering af DR's nye strategi fra hhv. Claude, Gemini og ChatGPT