A Software Library with No Code

A Software Library with No Code

Kring AI-agenter pratas det mycket om ”evals” just nu. Hur skapar man test som säkerställer att språkmodellen faktiskt gör det du vill. Det här är ett exempel på hur det kan se ut i praktiken, en lång lista med input/output-par som är de förväntade resultaten från den programkod språkmodellen får instruktioner att skapa. Tack vare den blir det möjligt för AI-agenten att själv iterera på sin kod och successivt få den att göra på rätt sätt.

Vidare till källan: dbreunig.com