Expletus Logo
EXPLETUS
Blog
Context Engineering3 min read

Context engineering is de echte AI-interface

Een technische kijk op context als beheerde runtime: wat erin hoort, wat niet, hoe status bewaard blijft en waarom een groter venster contextontwerp niet oplost.

Het model is niet het volledige AI-systeem. Het model is een functie die context ontvangt en een vervolg produceert.

Wat de toepassing rond die functie plaatst, bepaalt een groot deel van het resultaat: instructies, gespreksstatus, opgehaalde kennis, tooldefinities, toolresultaten, gebruikersvoorkeuren, bestanden en een beschrijving van de huidige taak.

Dit allemaal “prompt engineering” noemen is te beperkt. Context engineering is nuttiger: de informatieomgeving ontwerpen waarin een model zijn volgende beslissing neemt.

Een contextvenster is werkgeheugen

Behandel het contextvenster als schaars werkgeheugen, zelfs wanneer het groot is.

Een typische agentcontext bevat:

OnderdeelDoelVeelvoorkomende fout
SysteeminstructiesGedrag en grenzen bepalenTegenstrijdige of te lange regels
TaakstatusDoel en voortgang uitleggenOude plannen blijven actief
GesprekIntentie van de gebruiker bewarenIrrelevante historiek verdringt recente instructies
Opgehaalde kennisBeslissingen baseren op externe feitenGelijkaardige maar verkeerde passages
Toolschema'sBeschikbare acties beschrijvenTe veel tools bemoeilijken selectie
ToolresultatenWaarnemingen leverenRuwe output verbruikt het hele budget

Het technische probleem is bepalen wat nu aanwezig moet zijn.

Context heeft een levenscyclus

Goede context wordt niet één keer samengesteld. Ze verandert tijdens het werk.

  1. Verwerven: een bestand, bericht, databaserij of toolresultaat ophalen.
  2. Normaliseren: herkomst, tijdstip, rechten en type toevoegen.
  3. Selecteren: alleen opnemen wat relevant is voor de huidige beslissing.
  4. Comprimeren: materiaal samenvatten zonder kritieke details te verliezen.
  5. Laten vervallen: status verwijderen die oud, vervangen of niet meer nuttig is.
  6. Bewaren: duurzame feiten buiten de prompt opslaan wanneer ze later nodig zijn.

Deze levenscyclus lijkt meer op cache- en geheugenbeheer dan op copywriting.

Gesprekshistoriek is geen geheugen

Elk vorig bericht opnieuw meesturen wekt de indruk van geheugen. Het is kwetsbaar en duur.

Duurzaam geheugen hoort expliciet en getypeerd te zijn. Een bruikbaar systeem onderscheidt:

  • Gebruikersvoorkeuren: stabiele keuzes zoals taal of programmeerstijl.
  • Projectfeiten: structuur, beslissingen, beperkingen en terminologie.
  • Taakstatus: huidig plan, voltooide stappen en onopgeloste blokkades.
  • Episodes: eerdere acties die later als voorbeeld relevant kunnen zijn.
  • Bronkennis: documenten die opgehaald moeten worden, niet als absolute waarheid onthouden.

Elk type vereist andere bewaartermijnen, rechten en updateregels. Een voorkeur kan maanden blijven bestaan. Een tijdelijke foutmelding moet verdwijnen zodra het probleem opgelost is.

Samenvattingen zijn verlieslatende compressie

Samenvatten is nodig voor langlopend werk, maar elke samenvatting verwijdert informatie.

De gevaarlijke aanpak vervangt historiek door een vlot geschreven alinea en neemt aan dat niets belangrijks verloren ging. Betere samenvattingen bewaren gestructureerde velden: doel, beperkingen, beslissingen, gewijzigde bestanden, testresultaten, open vragen en bronverwijzingen.

Kritieke details moeten adresseerbaar blijven. Een samenvatting kan melden dat een beslissing genomen werd en tegelijk een verwijzing naar het originele bewijs bewaren.

Tooloutput heeft een budget nodig

Agents falen vaak omdat een tool te veel teruggeeft, niet te weinig. Een volledige log, databasedump of repositoryboom kan instructies en recente observaties uit de aandacht van het model duwen.

Tools horen gerichte queries, paginering, filters en gestructureerde antwoorden te ondersteunen. De orchestrator bewaart ruwe output buiten de context en voegt alleen het relevante deel toe. Grote resultaten kunnen worden samengevat, terwijl exacte identificatoren en foutregels opvraagbaar blijven.

Grote vensters lossen het probleem niet op

Langere context vermindert druk. Ze levert geen perfect geheugen of perfecte aandacht.

Irrelevante informatie concurreert nog steeds met nuttige informatie. Tegenstrijdige instructies blijven tegenstrijdig. Oude status kan een nieuwere werkelijkheid overschrijven. Kosten en latency stijgen nog steeds met de inputgrootte.

Het juiste doel is niet “alles past erin”. Het is “elke belangrijke beslissing gebruikt voldoende, actuele en herleidbare context”.

Onze mening

Duurzame AI-platformen zullen context zichtbaar maken als een systeem dat gebruikers en ontwikkelaars kunnen inspecteren. Ze tonen wat het model ontving, waar het vandaan kwam, hoelang het blijft bestaan en welke regel het selecteerde.

Onzichtbare context kan een assistent magisch laten aanvoelen. Inspecteerbare context maakt hem betrouwbaar.