Edizioni

Community per il team open. Pro per la scala produttiva.

Lo stesso engine core, in due pacchetti molto diversi. Community è AGPL-3.0 con installazione one-command. Pro aggiunge un data warehouse strutturato, retrieval ibrido, uno scheduler intelligente e un admin panel — per i team che devono interrogare migliaia di documenti come dati, non solo come testo.

Community

AGPL-3.0 · open-source

RAG sovrana, a un comando di distanza.

Installazione con un comando in ~1 ora
Retrieval vettoriale con embedding multilingua
Backup integrato verso 70+ destinazioni (rclone)
Gira su NVIDIA, AMD o solo CPU
Fino a ~10.000 documenti per nodo

Vai su GitHub

Pro

Licenza commerciale

Più potente

Production-grade per carichi regolamentati.

Inference engine EuLLM custom (sovrano di default)
Retrieval ibrido: vector + BM25 + cross-encoder rerank
Estrazione LLM verso un warehouse SQL
Scheduler intelligente con coordinamento live
Admin panel + modalità completamente air-gapped

Parla con noi

Fondamenta condivise

Entrambe le edizioni girano interamente dentro il tuo perimetro. Niente chiamate in uscita, niente telemetria, niente dipendenze gestite.

Backend FastAPI con autenticazione JWT e RBAC
Frontend React + Vite
Vector store Qdrant (open-source, sviluppato a Berlino)
Inferenza LLM locale (Ollama oppure EuLLM)
Apache Tika + Tesseract per ingestion e OCR
10+ formati documentali, PDF scansionati inclusi
Porte di default diverse — le due edizioni possono coesistere sullo stesso host

Cosa aggiunge Pro

Sei capability concrete che l'edizione Community open non include.

Inference engine EuLLM custom

Pro integra EuLLM come backend di generazione di default: uno stack di inferenza LLM sovrano europeo costruito attorno a pesi GGUF, con continuous batching e finestra di contesto da 16K token. Ollama resta disponibile come profilo di fallback per la valutazione.

Continuous batching per throughput elevato su host single-GPU
Context window da 16K token per contratti lunghi, trascrizioni e report
Completamente air-gapped: modalità HuggingFace offline, nessuna chiamata casa
Compatibile con Mistral 7B (made in France) e altri modelli GGUF

Retrieval ibrido

La pure vector search manca i match keyword precisi; il puro BM25 manca la semantica. Pro li esegue entrambi, li fonde con Reciprocal Rank Fusion e riordina il risultato con un cross-encoder.

Vector + BM25 con bilanciamento lessicale-semantico configurabile
Cross-encoder reranking per precisione sui top-K
Multi-query expansion per domande ambigue
Analytics di query su ogni step della pipeline

Warehouse di dati strutturati

Esclusiva Pro

Pro non si limita a indicizzare i documenti — estrae entità, eventi e importi in un database relazionale normalizzato. Quel database diventa una sorgente di fatti verificati che la pipeline di chat può citare con provenance.

Schema a sei tabelle: extraction jobs, entities, events, amounts, progress, document summaries
Colonne indicizzate e foreign key — le query analitiche sono veloci
SQLite con WAL oggi; portabile a PostgreSQL quando serve scalare
Quattro profili di dominio: Generic, Intelligence/OSINT, Medical, Legal
Validazione Pydantic con recovery automatico per JSON LLM malformati
Ogni fatto estratto è linkato al chunk sorgente per audit

Risultato: domande come "quanti contratti citano il fornitore X", "elenca tutti gli eventi del Q3 2025" o "esposizione totale per controparte" si rispondono da SQL, non tirando a indovinare dalla similarità vettoriale.

Query router

Un piccolo classifier decide a runtime se la domanda è aggregate, semantica o ibrida — poi la indirizza al backend giusto e compone la risposta.

Domande aggregate (count, elenca, group-by, filtri per data) → warehouse SQL
Domande semantiche ("perché", "come", "spiega") → vector retrieval
Domande ibride ricevono entrambi: i fatti SQL iniettati nel prompt LLM come "dati verificati", i chunk recuperati come contesto
Deterministico, trasparente, ispezionabile per ogni richiesta

Scheduler intelligente con coordinamento live

L'estrazione è un job pesante. Pro la coordina con le persone che stanno effettivamente usando il sistema, invece di rompere l'esperienza di chat.

Orario di esecuzione configurabile (default 20:00); polling ogni 60 secondi
Gli utenti connessi ricevono una notifica WebSocket prima dell'avvio
Conferma adesso, oppure rinvia — fino a 3 volte, 15 minuti l'una
Switch dinamico del modello durante l'estrazione: la chat passa da 14B a 8B per liberare VRAM, poi torna su
Checkpoint per documento: si riprende senza ripartire da zero

Ingestion hands-free + admin panel

Lasci un file in una cartella sorvegliata e finisce sia nell'indice vettoriale sia in coda di estrazione. L'admin panel dà agli operatori un'unica console.

Folder watcher per ingestion batch — niente step di upload manuale
Pipeline OCR estesa per moduli compilati a mano, scansioni multi-colonna e fax di qualità bassa
Resource monitoring (CPU, memoria, GPU) integrato in UI
Service control: riavvia i componenti dall'admin panel
Dashboard dei job di estrazione con stato, errori e rerun manuale
UI di configurazione per scheduler, retention e selezione modello

Community copre l'80% dei casi

Quasi nessun team ha bisogno di un warehouse di estrazione — e per quelli, Community è la scelta giusta.

Best fit: reparti fino a qualche centinaio di utenti, dataset fino a decine di migliaia di documenti, deployment single-host
Killer feature: backup rclone integrato con 70+ destinazioni, cron scheduling, retention e restore zero-downtime
AGPL-3.0 significa che puoi auditarlo, modificarlo ed embeddarlo nel tuo lavoro AGPL-compatibile
Nessun contratto commerciale, nessuna dipendenza dal vendor — è forkabile il giorno in cui smettiamo di mantenerlo

Quando scegliere Pro

Se anche solo una di queste condizioni è vera, l'edizione Pro si ripaga in fretta.

Hai bisogno di query aggregate su migliaia di documenti (count, elenca, group-by, filtro per data)
La compliance richiede output strutturati deterministici (KYC, reporting regolatorio, audit trail)
Operi in un settore regolamentato — legale, sanità, intelligence/OSINT, difesa — e ti serve un profilo di estrazione tarato sul dominio
Ti serve operatività completamente air-gapped, modelli e metadata offline inclusi
Hai già Community in produzione e vuoi affiancarci Pro sugli stessi host durante la valutazione

Progettate per coesistere

Pro e Community usano porte di default diverse, così puoi farle girare entrambe sullo stesso hardware durante la valutazione o la migrazione.

Componente	Community	Pro
Frontend	:3000	:3002
Backend API	:8000	:8001
Qdrant	:6333	:6334
LLM engine	:11434	:11435

Stessi formati dati. Passare da Community a Pro è un cambio di configurazione e una license key, non una re‑ingestion.

Parti da dove sei. Fai l'upgrade quando serve.

L'edizione Community è su GitHub oggi. Per Pro, prenota una call da 30 minuti e ti torniamo con una proposta di deployment in due giorni lavorativi.

Ottieni Community Parla con noi di Pro

Pronto a far girare RAG sulla tua infrastruttura?

Parti dall'edizione Community open-source, oppure parla con noi di Pro con estrazione strutturata, SSO, audit log e SLA.

Metti una star su GitHub Prenota una call