🎙️ Sessione con Sepehr Samadi: “Designing Deterministic Agents Around Non-Deterministic LLMs”
⚠️ Le LLM sono probabilistiche. Il software in produzione no. E quando qualcosa “va storto in silenzio”… è già troppo tardi.
🚀 Approccio engineering-first, con pattern davvero testati su sistemi agentici reali (LangChain/LangGraph, AutoGen, CrewAI, Azure OpenAI) — niente demo da laboratorio.
✅ Cosa vedremo:
🧩 Contratti strutturati & validazione
• Schema JSON + vincoli di tool-calling
• Guard rail semantici tra gli step
• Confidence scoring: quando fidarsi (e quando NO)
🧨 Failure mode taxonomy
• Tool misuse & loop incontrollati
• Allucinazioni “sicure” in catene multi-step
• Context drift su run lunghi
• Spirali ricorsive in grafi multi-agent
🛡️ Resilience patterns
• Retry vs escalation: riprovo, re-instrado o fermo?
• Tool execution idempotente in LangGraph
• Gestione token budget su pipeline multi-step
• Riduzione blast radius: sandbox + permessi minimi
🔍 Observability
• Tracing turn-by-turn (LangGrap...
⚠️ Le LLM sono probabilistiche. Il software in produzione no. E quando qualcosa “va storto in silenzio”… è già troppo tardi.
🚀 Approccio engineering-first, con pattern davvero testati su sistemi agentici reali (LangChain/LangGraph, AutoGen, CrewAI, Azure OpenAI) — niente demo da laboratorio.
✅ Cosa vedremo:
🧩 Contratti strutturati & validazione
• Schema JSON + vincoli di tool-calling
• Guard rail semantici tra gli step
• Confidence scoring: quando fidarsi (e quando NO)
🧨 Failure mode taxonomy
• Tool misuse & loop incontrollati
• Allucinazioni “sicure” in catene multi-step
• Context drift su run lunghi
• Spirali ricorsive in grafi multi-agent
🛡️ Resilience patterns
• Retry vs escalation: riprovo, re-instrado o fermo?
• Tool execution idempotente in LangGraph
• Gestione token budget su pipeline multi-step
• Riduzione blast radius: sandbox + permessi minimi
🔍 Observability
• Tracing turn-by-turn (LangGrap...