Tanker

Bevis, ikke løfter

Der er en sætning, jeg er holdt op med at stole på: "Det virker nu." Ikke fordi folk lyver — men fordi AI har gjort det håbefuldt nemt at TRO, det virker, uden nogensinde at have set det.

Generering blev gratis. Verifikation gjorde ikke

For et par år siden var flaskehalsen at SKRIVE koden. I dag skriver en AI-agent en funktion på sekunder. Flaskehalsen er flyttet — den ligger nu i at bevise, at det, der blev skrevet, rent faktisk gør det, det skulle. Kompilerer koden? Fint, det er en forudsætning, ikke et bevis. Returnerer API'et 200? Fint, det beviser en HTTP-status, ikke en brugeroplevelse.

Jeg har set det ske for ofte: en funktion "virker" ifølge terminalen, men i en rigtig browser er knappen usynlig, formularen sender ikke, eller redirect'en peger det forkerte sted hen. Terminalen løj ikke — den blev bare aldrig spurgt om det, der faktisk betød noget.

Reglen, vi arbejder efter

En opgave skifter ikke status til "færdig", før den er blevet klikket igennem i en rigtig browser — udfyldt, indsendt, og set gøre det, den skulle. Ikke en antagelse. Et screenshot, en gennemført handling, et faktisk bevis.

Det lyder kedeligt. Det er meningen. Den kedelige disciplin er præcis det, der adskiller "jeg tror, det virker" fra "jeg har set det virke."

Hvorfor det er en pointe værd at dele

Fordi AI har gjort det billigt at PRODUCERE og dyrt at IGNORERE verifikation. Jo mere en AI-agent kan bygge på egen hånd, jo vigtigere bliver spørgsmålet: hvem — eller hvad — tjekkede, at det virkede? Hvis svaret er "ingen, men koden ser rigtig ud," har du ikke bygget noget. Du har bygget en hypotese.

Bevis slår løfter. Hver gang.