Cantiere arcocat · costruzione live

Dashboard arcocat

Stato live del cantiere: cosa funziona, cosa pende, cosa arriva. Pagina aggiornata ad ogni iterazione (passaggio L*, Iter*, Step*) per non perdere la bussola fra sigle, REPORT, master version.

Ultimo aggiornamento: 2026-05-07 (milestone finale Blum-only chatbot done, M1+M2+M3+M4+M5) · master pubblico v2.3.7 · torna alla mappa dello studio

In una frase

Stiamo migrando BlumCat (chatbot tecnico in produzione) verso arcocat v2.3.x: piattaforma multi-brand CPQ con interfaccia conversazionale.

7 nodi gia' funzionanti (BlumKnowledge MCP, PIM lite, Supervisor, TQL formale, Eval baseline, Demo chatbot, BlumCat prod), 2 in attesa (R-rule esperto, 2°brand), 3 futuri (Configuration Context, Rule Engine, Mexal MCP).

Tu sei qui: Demo chatbot lato utente chiuso il 2026-05-07 notte (~2.5h, 7/7 test verdi). Pagina HTML chat single-page sopra Supervisor MCP, localhost only, stateless. Plus baseline numeri ancorati invariati: grounding 30% · faithfulness 0.80 · status accuracy Tier 2 91%. Decisione aperta: aspettare R-rule esperto (atteso grounding >50%, ora visibile in chat) e in parallelo Step 5 Configuration Context.

1. Diagramma sistema

La constellation arcocat v2.3.6 in ASCII. Verde = done, giallo = pendente, grigio = futuro, azzurro = produzione live.

done (in arcocat repo) pendente (parallelo o decisione) futuro (Step 5+) produzione (BlumCat 192.168.100.106)

UTENTE PMI | v ┌────────────────────────────────────────┐ │ SUPERVISOR MCP (L3 + Step4) │ ●●● done │ risolvi_query: TQL → filter → judge │ │ 56 test verdi · cross-validate 3/3 │ └────────────────────────────────────────┘ │ │ │ ┌──────────────┴──────────────────┐ │ │ EVAL BASELINE (CP1..CP5) │ ●●● done │ │ 60 query MD-Karpathy + 11 T2 │ │ │ grounding 30% · faith 0.80 │ │ │ status acc T2 91% · cost $1.19│ │ │ arcocat/eval/ standalone │ │ └─────────────────────────────────┘ │ │ FILTER (PIM) VALIDATE (Knowledge brand) │ │ v v ┌──────────────────────┐ ┌──────────────────────────────────┐ │ PIM LITE (L2) │ │ BLUMKNOWLEDGE MCP (L1+Iter1+Iter2) │ │ ●●● done │ │ ●●● done │ │ 363 prodotti │ │ 25 test · 14 R-rule cached │ │ sistemi_box (C001) │ │ temperature=0 deterministico │ │ schema MD-Karpathy │ │ grounding rate 11% (gap reale) │ │ 26 test verdi │ │ │ └──────────────────────┘ └──────────────────────────────────┘ │ │ (riferisce a) v ┌────────────────────────┐ │ R-RULE WIKI BLUM │ ◐◯◯ pendente │ esperto Arco edita │ (parallelo, │ R015..R019 bozza │ decisione │ in RULE_COVERAGE.md │ fuori arcocat) └────────────────────────┘ ─── futuri (Step 5+) ─────────────────── ┌──────────────────────┐ ┌──────────────────────────────────┐ │ CONFIG. CONTEXT (S5) │ │ RULE ENGINE (Step 5) │ │ ◯◯◯ futuro │ │ ◯◯◯ futuro │ │ state persistito │ │ constraint cross-brand │ │ sessione utente │ │ X-COMPAT-001 type vincoli │ └──────────────────────┘ └──────────────────────────────────┘ ┌──────────────────────────────┐ │ MEXAL MCP (Step 6+) │ │ ◯◯◯ futuro │ │ business: prezzo/dispon. │ │ integrazione gestionale │ └──────────────────────────────┘ ─── parallelo ────────────────────────── ┌──────────────────────────────────────────────────────────────────┐ │ BLUMCAT PROD (192.168.100.106:8001) │ ●●● live │ uptime continuativo 120+ ore dal 2026-05-02 11:29:31 │ │ 4131 chunks · 32 active sessions · 5 utenti reali │ │ INVARIATO durante tutto L1+Iter1+L2+L3+Iter2+Step4 │ └──────────────────────────────────────────────────────────────────┘

2. Stato corrente (TU SEI QUI)

6 nodi done, 2 pendenti, 3 futuri. Plus 1 in produzione live invariato.

Done (7 nodi in arcocat/)

BlumKnowledge MCP L1 + Iter1 + Iter2

Knowledge Tool brand standalone Blum. 8 tool dominio + 3 contratto comune. Pattern definitivo "rule completo cached + hint dinamico" (Iter1) + temperature=0 deterministico (Iter2).

📁 arcocat/blum-knowledge-mcp/ ✓ 25 test verdi 📊 grounding 11% (gap reale, non variance) 💰 cache HIT 95-100%

PIM lite L2

Singleton centralizzato cross-brand. 3 tool MCP (filtra / attributi_per_codice / list_categorie). 363 prodotti popolati read-only da blumcat.db. Schema CategorySchema C001 in MD-Karpathy editabile.

📁 arcocat/pim-lite/ ✓ 26 test verdi incl. cross-validate fonti 📊 sub-5ms latency 📦 SQLite + JSON1

Supervisor MCP L3 + Step 4 TQL

Orchestratore Filter-then-Validate. 1 tool MCP (risolvi_query). Slot filling formale (regex raffinato + sinonimi MD-Karpathy, no LLM). Synthesize pure function in 3 stati distinti.

📁 arcocat/supervisor-mcp/ ✓ 56 test verdi (vs 20 L3, +36 nuovi) 📊 cross-validate strict 3/3 🎯 15/15 edge case L3-OP1 risolti

Pattern Karpathy esteso L2 + Step 4

4 tipi di knowledge editabile dall'esperto Arco senza release Python: schema PIM (C*.md), regole brand (R*.md, BlumCat originale), distinte (D*.md), guide (G*.md), schede famiglia (F*.md), sinonimi TQL (TQL_SINONIMI.md) aggiunto in Step 4.

📁 arcocat/wiki_arcocat/ 📁 blumcat/wiki_blum/ (BlumCat originale) 📝 ownership esperto, no codice

Eval baseline arcocat v2.3.6 CP1..CP5

Misurazione oggettiva del cantiere: 60 query MD-Karpathy in 6 bucket (10 baseline + 10 varianti + 12 prosa libera + 5 codici diretti + 13 borderline + 10 negative), 11 Tier 2 ground truth. Stack Promptfoo (provider Python in-memory + asserzioni Python pure) + RAGAS (faithfulness + context precision con Anthropic Haiku 4.5, NO embeddings) + arcocat custom metrics TypedDict. Stato baseline ancorato: grounding 30%, faithfulness 0.80, status accuracy Tier 2 91%, distribuzione 36 consigliato + 66 compatibile + 21 sconsigliato. RAGAS success 100% (fix max_tokens=4096 vs pilot 73%). Pacchetto standalone (NO MCP server), tooling di sviluppo. Snapshot riproducibile in data/baseline_v2.3.6.json + HTML report Jinja2.

📁 arcocat/eval/ ✓ 20 test verdi + 1 slow E2E 💰 cost $1.19 (sotto target $1.50) 📊 grounding 30% · faith 0.80 · status acc T2 91%

Demo chatbot lato utente Demo A

Pagina HTML chat single-page sopra Supervisor MCP. Stateless: 1 query = 1 risposta. Localhost only (127.0.0.1:8765), no auth, no logging persistente. Frontend zero-dipendenze (vanilla JS + DOM API safe, port dimagrito di blumcat/markdown.js). Status badge AA contrast (verde / ambra / rosso), citation pills R*, expandable attributi PIM, copy-to-clipboard codice. Empty/error/loading state + responsive 600px+380px. Plus deploy frontend pubblico statico opzionale (a freddo). Vincoli noti baseline esposti in footer.

📁 arcocat/demo-chatbot/ ✓ 7/7 test verdi (5 deterministici 0.36s + 2 slow 21.82s) ⏱ effort 2.5h (factor 1x stima centrata) 🔌 in-memory client diretto (no MCP transport)

BlumCat in produzione live invariato

Chatbot tecnico Blum su LAN Arco (192.168.100.106:8001). Uptime continuativo dal 2026-05-02 11:29:31 (~120+ ore). 4131 chunks, 5 utenti reali, 32 active sessions. Invariato durante tutto il lavoro arcocat (L1+Iter1+L2+L3+Iter2+Step4+Eval+Demo).

🌐 192.168.100.106:8001 (LAN-only) 👥 5 utenti reali 📊 31-32 active sessions 🔒 anti-pattern test verdi su mtime/size

Pendenti (2 nodi)

R-rule wiki Blum (esperto Arco) parallelo

Bozza 5 R-rule (R015..R019) consegnate all'esperto Arco in arcocat/RULE_COVERAGE_ANALYSIS.md. Coprono: carico interno cassetto LEGRABOX (R015), portata MERIVOBOX 70kg (R016), variante METABOX H/M (R017), guida cm vs mm (R018), slot portata vs vincolo (R019). Decisione e edit fuori arcocat (richiede review esperto).

📍 BlumCat editor (UI /editor) 🎯 sblocca grounding rate 11% → >50% ⏱ tempo: 1-N giorni esperto (parallelo)

2°brand (Hettich/Salice/Bosch) post R-rule

Validazione registry BRAND_CLIENTS della constellation. Da rimandare dopo R-rule edit per non amplificare il rumore (variance + gap × N brand). Onboarding richiede playbook 7 fasi (catalogo PDF nuovo, ~2-4 sett realistiche).

📁 arcocat/wiki_arcocat/sinonimi/ da estendere 📁 arcocat/wiki_arcocat/categorie/ da estendere ⏱ effort: ~2-4 sett 1° brand, scala con esperienza

Futuri (3 nodi, Step 5+)

Configuration Context Step 5

Stato persistito tipizzato della sessione utente (preferenze, scelte precedenti, configurazione progetto). Singolo TypedDict che il Supervisor passa avanti tra interazioni. Sblocca conversazioni multi-turno consulenziali del CPQ.

⏱ stima master: 1 sett · atteso: ~3-5h pattern Claude 🔗 integra naturalmente con TQL

Rule Engine standalone Step 5+

Constraint cross-brand deterministico. Esempio X-COMPAT-001: "lavastoviglie 60 in cucina con cassetti retrostanti necessita nicchia >560mm". Riceve prodotto + Configuration Context, ritorna ok/motivazione/alternative. Singolo per la piattaforma (a differenza dei Knowledge Tool brand-specifici).

⏱ stima master: 2-3 sett 🔗 dipende da Configuration Context (Step 5)

Mexal MCP Step 6+

Business layer: prezzo per cliente, disponibilita', sconti, ordini. Integrazione gestionale Mexal/Passepartout via WebAPI. Singleton centralizzato. Plus integrazione con Promo MCP (offerte attive).

⏱ stima master: 2-4 sett 🔗 indipendente da knowledge / PIM / Supervisor

3. Prossimi passi

2 alternative ortogonali post eval baseline. Plus la pendenza R-rule esperto Arco gira in parallelo (NO blocco). Tutte le decisioni ora hanno ancoraggio quantitativo: grounding 30%, faithfulness 0.80, status accuracy Tier 2 91%, solo 3 R-rule citate (R008/R009/R010 spondine LEGRABOX).

★ raccomandato

Aspettare R-rule esperto Arco

L'esperto Arco edita R015..R019 nel wiki BlumCat (decisione fuori arcocat). Atteso grounding 30% → >50% misurabile via re-run eval baseline. Plus stabilizza i casi borderline post-Iter2. Mitiga anche Eval-OP3 (out-of-scope filter) se R-XX include "blocca contesti non-cassetto".

⏱ 1-N giorni esperto NO blocco (gira in background)

Sblocca: grounding rate misurabile +66% (30→50%+). Plus delta quantificato pre/post via baseline_v2.3.6.json.

tecnico

Step 5 Configuration Context

Stato persistito sessione utente. Integra naturalmente con TQL: il Supervisor accumula slot fra turni multi. Sblocca conversazioni consulenziali ("ho gia' scelto LEGRABOX, ora vorrei..."). Pattern stateful CPQ. Beneficio quantificabile: re-run eval baseline post-Step 5 misura quanto migliora la shortlist con contesto persistito.

⏱ 1 sett master ⏱ ~3-5h reali atteso

Sblocca: state cross-turno. Ortogonale a R-rule edit (parallelo).

parcheggiato

2°brand (Hettich/Salice/Bosch)

Validazione registry BRAND_CLIENTS della constellation. Da rimandare DOPO R-rule edit per non amplificare il rumore (variance + gap × N brand). Onboarding richiede playbook 7 fasi (catalogo PDF nuovo, ~2-4 sett realistiche). Plus richiede setup eval baseline 2°brand (replica del pattern arcocat-eval).

⏱ 2-4 sett master aspettare R-rule edit prima

Sblocca: grounding rate del KB Blum. NON impedisce di lavorare su altri nodi.

Raccomandazione a freddo (post eval baseline): aspettare R-rule edit esperto (1-N giorni, parallelo) e in parallelo iniziare Step 5 Configuration Context. Quando R-rule arrivano, re-run python -m eval.scripts.run_cp4_baseline e confronta i numeri vs baseline_v2.3.6.json: atteso grounding >50%, distribuzione consigliato +50% relativo, status accuracy Tier 2 invariata o migliorata. Senza eval baseline questo confronto sarebbe rimasto qualitativo. Eval baseline e' meta-ROI: ancora ogni iterazione futura.

4. Timeline cronologica

3 giorni di calendar-time, 7 versioni master, 7 nodi arcocat (incluso demo chatbot lato utente). Pattern Claude end-to-end factor 1-15x sotto-stima master in tutte le iterazioni (demo chatbot factor 1x: stima centrata su scope chirurgico).

2026-05-07 · ora

★ TU SEI QUI: milestone finale Blum-only chatbot done, side-by-side BlumCat vs arcocat abilitato

M1+M2+M3+M4+M5 in 1 sessione del 2026-05-07, ~6.5h calendar-time, 10 checkpoint. Pacchetto nuovo arcocat/chatbot/ (~4500 righe) + estensione chirurgica supervisor-mcp (Step 5 ConfigurationContext: TypedDict + merge pure function + SQLite store + integration risolvi_query con contesto_id opzionale, BC 100%). 174 test deterministici cumulativi verdi. Cost LLM cumulato ~$0.13 (sotto target $0.20). Endpoint completi: chat multi-turno con session_id, sidebar cronologia, banner trasparenza, citazioni espandibili, attributi PIM expandable, feedback wizard 4-step Haiku 4.5 categorizer, media foto/PDF + rate limiter + modale fullscreen, admin X-Internal-Key. Demo LAN side-by-side BlumCat (192.168.100.106:8001) vs arcocat (192.168.100.x:8770) ora possibile per confronto qualitativo lato utente. BlumCat dati invariati (4131 chunks identici). Vedi REPORT_FINAL_BLUMONLY.md.

2026-05-07 notte (precedente)

Demo chatbot lato utente (~2.5h)

CP1..CP5: pagina HTML chat single-page + FastAPI minimale (POST /risolvi + GET /health + GET /suggerimenti) che invoca Supervisor MCP via in-memory client. Stateless, localhost only (127.0.0.1:8765), no auth no logging. Frontend zero-dipendenze (vanilla JS + DOM API safe, ~770 righe HTML+CSS+JS), port dimagrito di blumcat/markdown.js (145 vs 405 righe). 3 status badge AA contrast (verde/ambra/rosso), citation pills, expandable attributi PIM, copy-to-clipboard. 7/7 test verdi (5 deterministici 0.36s + 2 slow 21.82s). Cost ~$0.09 (riusa cache Supervisor). 6 nodi arcocat invariati. Lezioni: hook security come opportunita' (refactor verso DOM API safe), pydantic 422 detail e' array, frontend zero-deps fattibile per demo single-page. Master invariato (e' tooling, non architettura).

2026-05-07 sera

Eval baseline arcocat v2.3.6 (~3.5h)

CP1..CP5: 60 query MD-Karpathy in 6 bucket (11 Tier 2 spalmate). Stack Promptfoo (provider Python in-memory) + RAGAS (faithfulness + context precision con Haiku 4.5) + arcocat custom metrics. Stato baseline ancorato: grounding 30%, faithfulness 0.80, status acc T2 91%, RAGAS success 100%. Cost $1.19 (sotto target $1.50). Lezione strategica: eval baseline come ancoraggio quantitativo per gap noti (R-rule edit avra' delta misurabile pre/post). 5 punti aperti documentati (Eval-OP1..5).

2026-05-07 pomeriggio

Step 4 TQL formale (~2.5h)

Typed Query Layer formale. Opzione C ibrido scelta empiricamente (regex + sinonimi MD-Karpathy, NO LLM fallback necessario). 56 test verdi (+36), 15/15 edge case L3-OP1 risolti. Lezione: TQL non deve essere perfetto, ROI R-rule > LLM puro. Master → v2.3.6.

2026-05-07 mattina

Iter2 minore BlumKnowledge (~1.5h)

temperature=0 in valida_compatibilita (+1 riga). Cross-validate strict 3/3 pass (vs L3 bucket invariant). Grounding 11% invariato → prova diagnostica gap reale, non variance. Lezione: variance vs gap separabili. Master → v2.3.5. Bozza R015..R019 per esperto.

2026-05-06 pomeriggio

L3 Supervisor minimale (~5h)

Filter-then-Validate orchestrator. 20 test verdi. Distribuzione 1+7+1 (3 stati distinti). Pattern emergente: shortlist comparativa di default. Master → v2.3.4.

2026-05-06 mattina

L2 PIM lite (~5h)

Singleton centralizzato. 363 prodotti sistemi_box. CategorySchema C001 MD-Karpathy. 26 test verdi. Cross-validate fonti 42/42. Lezione: vincoli aspirazionali vs effettivi. Master → v2.3.3.

2026-05-05

L1 + Iter1 BlumKnowledge (~8h totali)

Knowledge Tool MCP standalone. 11 tool. 20 → 25 test verdi. Hybrid retrieval (BM25 FTS5 + cosine + RRF k=60). Pattern definitivo "rule completo cached + hint dinamico". Master → v2.3.1, v2.3.2.

2026-05-05

Master v2.3 + meta-pattern Claude-assisted ingest

Master allineato pre-implementation. Pattern "Claude-assisted ingest": 95% struttura derivata via script Python in sessione, esperto edita solo body narrativo. Riduzione effort 5-10x.

2026-05-02 11:29:31

BlumCat prod start (uptime origin)

BlumCat in produzione su 192.168.100.106:8001. Da qui parte l'uptime continuativo, riferimento per tutti gli anti-pattern test successivi.

2026-04-29

BlumCat wiki rework (4 categorie)

Singolo-fonte MD: 11 distinte D*, 10 guide G*, 14 regole R*, 35 schede famiglia F*. 4061 chunks 768d. Editor wiki UI + AI auto-fix.

5. Glossario sigle

Decifratore rapido per quando perdi il filo.

Sigla	Significato	Esempio
`L1` / `L2` / `L3`	Livello / Step della migration v2.3.x (sequenziale)	L2 = PIM lite
`Iter1` / `Iter2`	Iterazione minore di refinement su un nodo gia' done	Iter2 = temperature=0 in BlumKnowledge
`Step 4`	Step master v2.3 (1, 2, 3, 4, 5, 6) numerati — NON uguale a Lx (a volte coincidono, a volte no)	Step 4 = Typed Query Layer formale
`OP1..N`	Open Point (punto aperto) di un REPORT_*.md, con priorita' e trigger esplicito	L3-OP2 = non-determinismo LLM
`R001..R019`	Regola tecnica del wiki Blum (frontmatter YAML eseguibile + body MD)	R001 = peso anta vs portata LEGRABOX
`D001..D011`	Distinta canonica per famiglia Blum (composizione codici)	D003 = LEGRABOX standard
`G001..G010`	Guida (decision tree) wiki Blum	G001 = scelta cassetto
`F001..F035`	Scheda narrativa famiglia Blum ("cos'e' X")	F005 = LEGRABOX
`C001`	CategorySchema PIM (schema attributi tipizzati per categoria)	C001 = sistemi_box
`NL_mm`	Profondita' cassetto Blum in mm (asse principale di filtro)	NL_mm = 500
`TQL`	Typed Query Layer (livello 1 v2.3.x): slot filling pre-LLM	"LEGRABOX 500mm" → TypedQuery
`CPQ`	Configure-Price-Quote (software industriale 30 anni)	arcocat = CPQ con interfaccia conversazionale
`PIM`	Product Information Management (singleton attributi tipizzati)	PIM lite L2 (SQLite + JSON1)
`MCP`	Model Context Protocol (Anthropic) — "USB-C degli agenti AI"	BlumKnowledge MCP, PIM MCP, Supervisor MCP
`Filter-then-Validate`	Pattern centrale Supervisor: PIM filtra (recall) → Knowledge brand valida (precision)	L3 implementation
`3 stati`	Output Supervisor: compatibile / consigliato / sconsigliato	Distribuzione L3: 1+7+1
`Karpathy / MD-Karpathy`	Knowledge editabile come MD con frontmatter YAML eseguibile (pattern Andrej Karpathy "LLM Wiki")	R.md, C.md, TQL_SINONIMI.md
`RRF k=60`	Reciprocal Rank Fusion: formula `1/(k+rank)` per merge BM25 + cosine	Iter1 hybrid retrieval
`cache HIT`	Cache prompt Anthropic ephemeral (TTL 5 min): -90% costo sui token cached	BlumKnowledge 95-100% cache HIT

6. Documenti collegati & comandi

Studi pubblici (live su andreapellizzari.it)

Master architetturale	v2.3.6	stack-agentico-pmi
Volume operativo flussi	v1.3	flussi-agentici-pmi
Wiki narrativo AI-maintained	v1.1	wiki-narrativo-ai-maintained
Playbook onboarding catalogo PDF	v1.1	playbook-onboarding-catalogo-pdf
Mappa dello studio	—	mappa-studio.html

REPORT operativi (privati, in `arcocat/`)

`REPORT_L1.md`	L1 done, BlumKnowledge MCP standalone	2026-05-05
`REPORT_ITERAZIONE_1.md`	Iter1 hybrid retrieval, pattern definitivo valida_compatibilita	2026-05-05
`REPORT_L2.md`	L2 done, PIM lite singleton + sistemi_box	2026-05-06
`REPORT_L3.md`	L3 done, Supervisor minimale Filter-then-Validate	2026-05-06
`REPORT_ITER2_BLUMKNOWLEDGE.md`	Iter2 done, temperature=0 + lezione variance vs gap	2026-05-07
`REPORT_STEP4_TQL.md`	Step 4 done, TQL formale + sinonimi MD-Karpathy	2026-05-07
`RULE_COVERAGE_ANALYSIS.md`	Bozza R015..R019 per esperto Arco (parallelo)	2026-05-07
`REPORT_EVAL_BASELINE.md`	Eval baseline done, stato v2.3.6 ancorato (grounding 30% / faith 0.80 / status acc T2 91%)	2026-05-07
`arcocat/eval/data/baseline_v2.3.6.json`	Snapshot baseline riproducibile (input per delta pre/post iterazioni future)	2026-05-07
`arcocat/eval/data/baseline_v2.3.6.html`	HTML report Jinja2 navigabile (apri in browser)	2026-05-07
`REPORT_DEMO.md`	Demo chatbot lato utente done, pagina HTML chat su Supervisor MCP (localhost, stateless, 7/7 test)	2026-05-07
`arcocat/demo-chatbot/README.md`	Setup + run + endpoint + vincoli noti della demo (`python -m demo_chatbot.server`)	2026-05-07
`REPORT_FINAL_BLUMONLY.md`	Milestone finale Blum-only chatbot done: M1 ConfigurationContext + M2 backend FastAPI + M3 frontend chat UI + M4 feedback wizard Haiku categorizer + M5 media foto/PDF. 174 test verdi cumulativi, ~$0.13 cost LLM, 6.5h calendar.	2026-05-07
`arcocat/chatbot/README.md`	Setup LAN + run + endpoint + vincoli (`python -m chatbot.server`, bind 0.0.0.0:8770)	2026-05-07
`MAPPA_STUDIO.md`	Indice navigabile interno (privato in andreapellizzari/_private/)	vivente

Comandi essenziali

# Verifica stato BlumCat in produzione (LAN Arco)
$key = (Get-Content $env:USERPROFILE\.blumcat-internal-key).Trim()
Invoke-RestMethod -Uri "http://192.168.100.106:8001/admin/status" -Headers @{'X-Internal-Key'=$key}

# Test suite arcocat (per ogni nodo)
cd C:\Users\pelli\claude\arcocat\blum-knowledge-mcp ; pytest tests -v
cd C:\Users\pelli\claude\arcocat\pim-lite          ; pytest tests -v
cd C:\Users\pelli\claude\arcocat\supervisor-mcp    ; pytest tests -v
cd C:\Users\pelli\claude\arcocat\eval              ; pytest tests -v -m "not slow"

# Boot --check Supervisor (smoke health)
cd C:\Users\pelli\claude\arcocat\supervisor-mcp ; python -m supervisor_mcp.server --check

# Eval baseline re-run (post R-rule edit per misurare delta)
cd C:\Users\pelli\claude\arcocat\eval ; python -m eval.scripts.run_cp4_baseline
# Genera HTML report da baseline_v2.3.6.json
cd C:\Users\pelli\claude\arcocat\eval ; python -m eval.reports.render_html

# Deploy sito (master + dashboard)
cd C:\Users\pelli\claude\andreapellizzari ; npm run build-and-deploy

# BlumCat prod LAN Arco
cd C:\Users\pelli\claude\blumcat ; .\deploy_update.ps1 -Restart

Quando torni dopo una pausa: apri questa pagina, leggi sezione 2 (TU SEI QUI) e sezione 3 (Prossimi passi) in 2 minuti. Hai il quadro. Plus se hai 5 minuti, sezione 4 (timeline) ti rimette in pista cronologicamente.

1. Diagramma sistema

2. Stato corrente (TU SEI QUI)

Done (7 nodi in arcocat/)

BlumKnowledge MCP L1 + Iter1 + Iter2

PIM lite L2

Supervisor MCP L3 + Step 4 TQL

Pattern Karpathy esteso L2 + Step 4

Eval baseline arcocat v2.3.6 CP1..CP5

Demo chatbot lato utente Demo A

BlumCat in produzione live invariato

Pendenti (2 nodi)

R-rule wiki Blum (esperto Arco) parallelo

2°brand (Hettich/Salice/Bosch) post R-rule

Futuri (3 nodi, Step 5+)

Configuration Context Step 5

Rule Engine standalone Step 5+

Mexal MCP Step 6+

3. Prossimi passi

Aspettare R-rule esperto Arco

Step 5 Configuration Context

2°brand (Hettich/Salice/Bosch)

4. Timeline cronologica

5. Glossario sigle

6. Documenti collegati & comandi

Studi pubblici (live su andreapellizzari.it)

REPORT operativi (privati, in arcocat/)

Comandi essenziali

REPORT operativi (privati, in `arcocat/`)