- eval/mock_executor.py: intercepts execute_on_client, serves fixture files from disk, records all mutations (insert/update/delete) - eval/config.py: YAML fixture loader with prompt variants, expected results, seed records, model overrides - eval/scorer.py: FieldMatchScorer (fuzzy title match, per-field accuracy, precision/recall/F1) + LLMJudgeScorer (semantic eval) - eval/langfuse_eval.py: sync fixtures to Langfuse datasets, create dataset runs, post scores, link traces to runs - eval/runner.py: orchestrates fixture → mock → agent pipeline → scoring → Langfuse reporting - eval/cli.py: CLI (python -m eval run/list/sync) with --models, --variants, --fixture, --no-judge flags - eval/fixtures/: example Italian freelance scenario with 3 prompt variants (baseline, detailed_italian, minimal)
19 lines
614 B
Plaintext
19 lines
614 B
Plaintext
FATTURA N. 2026-0042
|
|
Data: 15 Marzo 2026
|
|
Cliente: Studio Architettura Bianchi
|
|
|
|
Progetto: Redesign Sito Web Corporate
|
|
|
|
Descrizione lavori:
|
|
- Sviluppo frontend React (40 ore) — URGENTE, completare entro 20 marzo
|
|
- Integrazione API backend (20 ore) — priorità media
|
|
- Design UI/UX mockup homepage (8 ore) — completato
|
|
- Testing cross-browser e fix bug responsive (12 ore) — da iniziare
|
|
|
|
Totale: €4.800,00 + IVA
|
|
|
|
Note:
|
|
Meeting di revisione previsto per il 18 marzo alle 10:00.
|
|
Il cliente ha richiesto modifiche al layout mobile della sezione contatti.
|
|
Attendere conferma budget aggiuntivo per sezione blog.
|