Edizioni

Community per il team open. Pro per la scala produttiva.

Lo stesso engine core, in due pacchetti molto diversi. Community è AGPL-3.0 con installazione one-command. Pro aggiunge un data warehouse strutturato, retrieval ibrido, uno scheduler intelligente e un admin panel — per i team che devono interrogare migliaia di documenti come dati, non solo come testo.

Community

AGPL-3.0 · open-source

RAG sovrana, a un comando di distanza.

  • Installazione con un comando in ~1 ora
  • Retrieval vettoriale con embedding multilingua
  • Backup integrato verso 70+ destinazioni (rclone)
  • Gira su NVIDIA, AMD o solo CPU
  • Fino a ~10.000 documenti per nodo
Vai su GitHub

Pro

Licenza commerciale

Più potente

Production-grade per carichi regolamentati.

  • Inference engine EuLLM custom (sovrano di default)
  • Retrieval ibrido: vector + BM25 + cross-encoder rerank
  • Estrazione LLM verso un warehouse SQL
  • Scheduler intelligente con coordinamento live
  • Admin panel + modalità completamente air-gapped
Parla con noi

Fondamenta condivise

Entrambe le edizioni girano interamente dentro il tuo perimetro. Niente chiamate in uscita, niente telemetria, niente dipendenze gestite.

  • Backend FastAPI con autenticazione JWT e RBAC
  • Frontend React + Vite
  • Vector store Qdrant (open-source, sviluppato a Berlino)
  • Inferenza LLM locale (Ollama oppure EuLLM)
  • Apache Tika + Tesseract per ingestion e OCR
  • 10+ formati documentali, PDF scansionati inclusi
  • Porte di default diverse — le due edizioni possono coesistere sullo stesso host

Cosa aggiunge Pro

Sei capability concrete che l'edizione Community open non include.

01

Inference engine EuLLM custom

Pro integra EuLLM come backend di generazione di default: uno stack di inferenza LLM sovrano europeo costruito attorno a pesi GGUF, con continuous batching e finestra di contesto da 16K token. Ollama resta disponibile come profilo di fallback per la valutazione.

  • Continuous batching per throughput elevato su host single-GPU
  • Context window da 16K token per contratti lunghi, trascrizioni e report
  • Completamente air-gapped: modalità HuggingFace offline, nessuna chiamata casa
  • Compatibile con Mistral 7B (made in France) e altri modelli GGUF
02

Retrieval ibrido

La pure vector search manca i match keyword precisi; il puro BM25 manca la semantica. Pro li esegue entrambi, li fonde con Reciprocal Rank Fusion e riordina il risultato con un cross-encoder.

  • Vector + BM25 con bilanciamento lessicale-semantico configurabile
  • Cross-encoder reranking per precisione sui top-K
  • Multi-query expansion per domande ambigue
  • Analytics di query su ogni step della pipeline
03

Warehouse di dati strutturati

Esclusiva Pro

Pro non si limita a indicizzare i documenti — estrae entità, eventi e importi in un database relazionale normalizzato. Quel database diventa una sorgente di fatti verificati che la pipeline di chat può citare con provenance.

  • Schema a sei tabelle: extraction jobs, entities, events, amounts, progress, document summaries
  • Colonne indicizzate e foreign key — le query analitiche sono veloci
  • SQLite con WAL oggi; portabile a PostgreSQL quando serve scalare
  • Quattro profili di dominio: Generic, Intelligence/OSINT, Medical, Legal
  • Validazione Pydantic con recovery automatico per JSON LLM malformati
  • Ogni fatto estratto è linkato al chunk sorgente per audit
Risultato: domande come "quanti contratti citano il fornitore X", "elenca tutti gli eventi del Q3 2025" o "esposizione totale per controparte" si rispondono da SQL, non tirando a indovinare dalla similarità vettoriale.
04

Query router

Un piccolo classifier decide a runtime se la domanda è aggregate, semantica o ibrida — poi la indirizza al backend giusto e compone la risposta.

  • Domande aggregate (count, elenca, group-by, filtri per data) → warehouse SQL
  • Domande semantiche ("perché", "come", "spiega") → vector retrieval
  • Domande ibride ricevono entrambi: i fatti SQL iniettati nel prompt LLM come "dati verificati", i chunk recuperati come contesto
  • Deterministico, trasparente, ispezionabile per ogni richiesta
05

Scheduler intelligente con coordinamento live

L'estrazione è un job pesante. Pro la coordina con le persone che stanno effettivamente usando il sistema, invece di rompere l'esperienza di chat.

  • Orario di esecuzione configurabile (default 20:00); polling ogni 60 secondi
  • Gli utenti connessi ricevono una notifica WebSocket prima dell'avvio
  • Conferma adesso, oppure rinvia — fino a 3 volte, 15 minuti l'una
  • Switch dinamico del modello durante l'estrazione: la chat passa da 14B a 8B per liberare VRAM, poi torna su
  • Checkpoint per documento: si riprende senza ripartire da zero
06

Ingestion hands-free + admin panel

Lasci un file in una cartella sorvegliata e finisce sia nell'indice vettoriale sia in coda di estrazione. L'admin panel dà agli operatori un'unica console.

  • Folder watcher per ingestion batch — niente step di upload manuale
  • Pipeline OCR estesa per moduli compilati a mano, scansioni multi-colonna e fax di qualità bassa
  • Resource monitoring (CPU, memoria, GPU) integrato in UI
  • Service control: riavvia i componenti dall'admin panel
  • Dashboard dei job di estrazione con stato, errori e rerun manuale
  • UI di configurazione per scheduler, retention e selezione modello

Community copre l'80% dei casi

Quasi nessun team ha bisogno di un warehouse di estrazione — e per quelli, Community è la scelta giusta.

  • Best fit: reparti fino a qualche centinaio di utenti, dataset fino a decine di migliaia di documenti, deployment single-host
  • Killer feature: backup rclone integrato con 70+ destinazioni, cron scheduling, retention e restore zero-downtime
  • AGPL-3.0 significa che puoi auditarlo, modificarlo ed embeddarlo nel tuo lavoro AGPL-compatibile
  • Nessun contratto commerciale, nessuna dipendenza dal vendor — è forkabile il giorno in cui smettiamo di mantenerlo

Quando scegliere Pro

Se anche solo una di queste condizioni è vera, l'edizione Pro si ripaga in fretta.

  • Hai bisogno di query aggregate su migliaia di documenti (count, elenca, group-by, filtro per data)
  • La compliance richiede output strutturati deterministici (KYC, reporting regolatorio, audit trail)
  • Operi in un settore regolamentato — legale, sanità, intelligence/OSINT, difesa — e ti serve un profilo di estrazione tarato sul dominio
  • Ti serve operatività completamente air-gapped, modelli e metadata offline inclusi
  • Hai già Community in produzione e vuoi affiancarci Pro sugli stessi host durante la valutazione

Progettate per coesistere

Pro e Community usano porte di default diverse, così puoi farle girare entrambe sullo stesso hardware durante la valutazione o la migrazione.

ComponenteCommunityPro
Frontend:3000:3002
Backend API:8000:8001
Qdrant:6333:6334
LLM engine:11434:11435

Stessi formati dati. Passare da Community a Pro è un cambio di configurazione e una license key, non una re‑ingestion.

Parti da dove sei. Fai l'upgrade quando serve.

L'edizione Community è su GitHub oggi. Per Pro, prenota una call da 30 minuti e ti torniamo con una proposta di deployment in due giorni lavorativi.

Pronto a far girare RAG sulla tua infrastruttura?

Parti dall'edizione Community open-source, oppure parla con noi di Pro con estrazione strutturata, SSO, audit log e SLA.

Edizioni — I3K RAG Enterprise