Skip to content

Il Playground

Il Playground è un ambiente di test dove puoi sperimentare diverse configurazioni prima di applicarle all'azienda. È come un laboratorio dove testare le impostazioni senza impattare l'ambiente di produzione.

Accesso limitato

Il Playground è disponibile solo per utenti con ruolo Admin o superiore. Se non vedi questa opzione nel menu, contatta l'amministratore.

Quando usare il Playground

Il Playground è utile quando vuoi:

  • Testare un nuovo preset prima di renderlo attivo
  • Ottimizzare le risposte per un tipo specifico di documenti
  • Confrontare configurazioni diverse per capire quale funziona meglio
  • Debug: capire perché le risposte non sono soddisfacenti

Come funziona

Il Playground ha due aree principali:

1. Pannello di configurazione (sinistra)

Qui imposti tutti i parametri della ricerca AI:

Selezione Azienda

  • Scegli l'azienda su cui testare
  • Ogni azienda ha i propri documenti e impostazioni

Selezione Topic

  • Opzionale: limita la ricerca a un topic specifico

Preset

  • Scegli un preset esistente come base
  • Vedi se ci sono personalizzazioni "(mod)" attive

Provider AI

  • Ollama: Modello locale di default (Qwen 2.5 32B)
  • Ollama Cloud: Per test con server remoto
  • Groq: Provider cloud gratuito
  • Custom: Usa il provider configurato dall'azienda (OpenAI/Anthropic/Google)

Provider Custom

Se la tua azienda ha configurato un provider custom (es. OpenAI), puoi testarlo selezionando "Custom" nel dropdown Provider.

Parametri del Modello AI

  • Temperature (0.0-1.0): controlla la "creatività"
  • Max Tokens: lunghezza massima della risposta

Toggle Sorgenti Dati

  • Usa Knowledge Base: Include la knowledge base aziendale nella ricerca
  • Usa Documenti: Include i documenti utente nella ricerca

Puoi disabilitare una o entrambe le sorgenti per testare comportamenti specifici.

Parametri di Ricerca

Adaptive Retrieval (v2.4.0)

A partire dalla v2.4.0, i parametri Top K, Score Threshold e altri vengono ottimizzati automaticamente in base alla complessità della query.

  • Query semplici → topK basso (10), threshold alto (0.7)
  • Query complesse → topK medio (50), threshold moderato (0.5)
  • Query aggregative (liste, conteggi) → topK alto (200), threshold basso (0.4)

Nel pannello Retrieval vedrai il banner "Adaptive Retrieval attivo". Per override manuali, attiva la modalità Advanced (⚡).

  • Max Sources to Show: quante fonti mostrare nella risposta (sempre visibile)
  • Top K, Score Threshold, etc.: visibili solo in modalità Advanced per override manuali

System Prompt

  • Il prompt base che istruisce l'AI
  • Ogni topic può sovrascrivere questo prompt

2. Area Chat (destra)

Qui fai le domande di test:

  • Scrivi una domanda nel campo in basso
  • Premi Invio per inviare
  • La risposta mostra:
    • Il testo generato dall'AI
    • Le fonti utilizzate con percentuale di rilevanza
    • Tempo di risposta e token utilizzati

Workflow consigliato

1. Identifica il problema

Prima di entrare nel Playground, chiarisci cosa vuoi migliorare:

  • "Le risposte sono troppo lunghe"
  • "L'AI non trova documenti rilevanti"
  • "Il tono non è appropriato"

2. Scegli la configurazione base

  1. Seleziona l'azienda
  2. Se necessario, seleziona un topic
  3. Applica il preset più vicino al tuo caso d'uso

3. Testa con domande reali

Usa domande che i tuoi utenti farebbero realmente:

  • "Qual è la procedura per..."
  • "Quanto costa..."
  • "Chi è responsabile di..."

4. Analizza le risposte

Per ogni risposta, verifica:

  • Accuratezza: la risposta è corretta?
  • Fonti: i documenti citati sono pertinenti?
  • Tono: il linguaggio è appropriato?
  • Completezza: manca qualcosa di importante?

5. Regola i parametri

In base all'analisi, prova a modificare:

ProblemaPossibile soluzione
Risposte troppo creativeAbbassa Temperature
Non trova documentiAttiva Advanced mode e abbassa Score Threshold
Risposte troppo corteAumenta Max Tokens
Manca contestoAttiva Advanced mode e aumenta Top K
Tono sbagliatoModifica System Prompt

Adaptive Retrieval

Nella maggior parte dei casi, il sistema ottimizza automaticamente i parametri. Attiva la modalità Advanced (⚡) solo se hai bisogno di controllo manuale.

6. Salva la configurazione

Quando sei soddisfatto:

  • Clicca Salva in Azienda per applicare all'azienda selezionata
  • Oppure Salva come Preset per creare un template riutilizzabile

Capire le metriche

Tempo di risposta

Visualizzato in millisecondi (ms). Un tempo normale è:

  • < 2000ms: veloce
  • 2000-5000ms: nella norma
  • 5000ms: lento (potrebbe indicare troppi documenti o modello sovraccarico)

Token utilizzati

I token sono le "unità" di testo elaborate. Più token = risposta più lunga e più costo computazionale.

Score delle fonti

Ogni fonte ha una percentuale di rilevanza:

  • 80-100%: molto pertinente
  • 60-80%: pertinente
  • 40-60%: parzialmente pertinente
  • < 40%: potrebbe essere rumore

Confrontare configurazioni

Per confrontare due configurazioni:

  1. Testa la configurazione A con una serie di domande
  2. Annota i risultati (tempo, accuratezza, fonti)
  3. Modifica i parametri (configurazione B)
  4. Ripeti le stesse domande
  5. Confronta i risultati

Suggerimento

Usa sempre le stesse domande per confrontare configurazioni diverse. Questo ti permette un confronto oggettivo.

Reset delle modifiche

Se hai fatto modifiche che non vuoi mantenere:

Reset Preset: clicca l'icona di refresh accanto al preset per tornare alla configurazione originale (rimuove le modifiche "(mod)")

Reset Completo: ricarica la pagina per azzerare tutte le modifiche non salvate

Salvare le configurazioni

Salva in Azienda

Applica la configurazione corrente all'azienda selezionata:

  • Tutti gli utenti dell'azienda useranno queste impostazioni
  • Il sistema prompt viene salvato
  • Se usi un preset, viene creata una versione "(mod)" personalizzata

Salva come Preset (solo Admin di Sistema)

Crea un nuovo preset riutilizzabile:

  • Inserisci nome e descrizione
  • Il preset sarà disponibile per tutte le aziende
  • Utile per creare template settoriali

RAG Features (v2.4.0)

Il pannello RAG Features controlla le funzionalità intelligenti del sistema:

Orchestrazione Intelligente

FeatureDescrizioneDefault
Query DecompositionScompone query complesse in sub-query✓ On
Adaptive RetrievalOttimizza automaticamente topK, threshold✓ On
Query RewritingLLM riscrive la query per migliorare il retrieval✓ On
CRAGVerifica e corregge le risposte iterativamente✓ On
Aggregative DetectionRiconosce query di lista/conteggio✓ On

Query Decomposition

Quando attivo, il sistema analizza la query e decide la strategia:

  • sequential: "Chi sono gli eredi e che quote hanno?" → prima trova eredi, poi le quote
  • parallel: "Confronta contratto A con B" → cerca entrambi in parallelo
  • hierarchical: Query esplorative → da generale a specifico
  • comparative: "Differenze tra X e Y" → confronto side-by-side

Adaptive Retrieval

Quando attivo, i parametri vengono calcolati automaticamente:

Tipo QuerytopKThresholdReranking
Semplice100.7
Moderata300.6
Complessa500.5
Aggregativa2000.4

Disabilitare con cautela

Disabilitare Query Decomposition o Adaptive Retrieval può peggiorare i risultati per query complesse. Fallo solo per debug o test specifici.

Suggerimenti per l'ottimizzazione

I preset esistenti sono già ottimizzati per ogni settore. Ecco i valori principali di riferimento:

Temperature: 0.0 (zero creatività)
Top K: 25
Reranker Threshold: 0.18 (alta rilevanza)
Abstain: abilitato (rifiuta se incerto)

Per FAQ e supporto clienti (preset SUPPORT)

Temperature: 0.1 (leggermente naturale)
Top K: 15 (risposte veloci)
Reranker Threshold: 0.08 (flessibile)
Semantic Cache: abilitata

Per ricerca accademica (preset RESEARCH)

Temperature: 0.0 (preciso)
Top K: 40 (copertura ampia)
MMR: abilitato (diversifica fonti)
Context: 10000 tokens

Per HR e analisi CV (preset HR)

Temperature: 0.0
Top K: 35 (confronta candidati)
MMR: abilitato (diversifica profili)
Min Sources: 10

TIP

Per vedere tutti i parametri disponibili, consulta il Riferimento Parametri RAG.

Queria - Two-Tier Retrieval System