La nostra offerta Large Language Model as a Service (LLMaaS) vi dà accesso a modelli linguistici all'avanguardia, la cui inferenza viene eseguita con un'infrastruttura qualificata SecNumCloud, certificata HDS per l'hosting di dati sanitari, e quindi sovrana, calcolata in Francia. Beneficiate di prestazioni elevate e di una sicurezza ottimale per le vostre applicazioni AI. I vostri dati rimangono strettamente confidenziali e non vengono né sfruttati né conservati dopo l'elaborazione.
Chat e ragionamento
I nostri modelli di grandi dimensioni offrono prestazioni all'avanguardia per i compiti più impegnativi. Sono particolarmente adatti alle applicazioni che richiedono una comprensione profonda del linguaggio, ragionamenti complessi o l'elaborazione di documenti lunghi.
qwen3.6:27b
gpt-oss:120b
gpt-oss:20b
lama3.3:70b
gemma3:27b
nemotron-3-super:120b
nemotron3-nano:30b
nemotron-cascata:30b
glm-4.7-flash:30b
cogito:32b
olmo-3:32b
olmo-3:7b
qwen3-2507:235b
mistral-small3.2:24b
mistral-small4:119b
ministeriale-3:14b
ministeriale-3:8b
ministeriale-3:3b
qwen3.5:9b
qwen3.5:4b
qwen3.5:0.8b
qwen3:0.6b
qwen3-2507-pensiero:4b
qwen3-omni:30b
Programmazione e agenti
I nostri modelli di programmazione e di agenti sono appositamente ottimizzati per l'ingegneria del software agenziale, la generazione di codice su larga scala e l'automazione del flusso di lavoro di sviluppo.
qwen3.6:35b
qwen-coder-next:80b
qwen3-next:80b
devstral-small-2:24b
rnj-1:8b
funzione gemma: 270 m
Visione e multimodalità
I nostri modelli di visione e multimodali possono analizzare immagini, video e documenti visivi. Eccellono nell'OCR, nel rilevamento di oggetti, nell'estrazione di strutture e nel ragionamento spazio-temporale.
qwen3-vl:235b
qwen3-vl:32b
qwen3-vl:30b
qwen3-vl:8b
qwen3-vl:4b
qwen3-vl:2b
gemma4:31b
gemma4:e2b
gemma4:e4b
granito3.2-visione:2b
deepseek-ocr
Incorporazione
I nostri modelli di embedding trasformano il testo in rappresentazioni vettoriali per la ricerca semantica, il clustering e le pipeline RAG (Retrieval-Augmented Generation).
bge-m3:567m
qwen3-embedding:4b
qwen3-embedding:8b
qwen3-embedding:0.6b
granito-embedding:278m
embeddinggemma:300m
Reranking
I nostri modelli di reranking riordinano i risultati della ricerca in base alla rilevanza per affinare la qualità delle pipeline RAG. Compatibile con l'API Cohere.
nvidia/llama-nemotron-rerank-vl-1b-v2
qwen3-reranker:4b
qwen3-reranker:0.6b
bge-reranker-grande
Sicurezza
I nostri modelli di sicurezza sono specializzati nel rilevamento di contenuti problematici, nella prevenzione di jailbreak e nella garanzia di conformità alle normative (RGPD, HDS). Possono essere utilizzati come pre-filtri o post-filtri nei vostri flussi di lavoro.
granito3-guardia:8b
granito3-guardiano:2b
Traduzione
I nostri modelli di traduzione offrono un'elevata fedeltà in 55 lingue, rispettando la grammatica, le sfumature culturali e le specificità tecniche dei documenti.
translategemma:27b
translategemma:12b
translategemma:4b
Audio e immagini
I nostri modelli audio e immagine consentono la trascrizione vocale in tempo reale (streaming ASR) e la generazione di immagini da descrizioni testuali, compatibili con le API OpenAI.
voxtral
immagine z:16b
Modello a confronto
Questa tabella di confronto vi aiuterà a scegliere il modello più adatto alle vostre esigenze, in base a vari criteri come le dimensioni del contesto, le prestazioni e i casi d'uso specifici.
| Modello | Editore | Parametri | Contesto (k token) | Visione | Agente | Ragionamento | Sicurezza | Rapido * | Efficienza energetica * |
|---|---|---|---|---|---|---|---|---|---|
| Chat e ragionamento | |||||||||
| qwen3.6:27b | Squadra Qwen | 27B | 1000000 | ||||||
| gpt-oss:120b | OpenAI | 120B | 120000 | ||||||
| gpt-oss:20b | OpenAI | 20B | 120000 | ||||||
| lama3.3:70b | Meta | 70B | 132000 | ||||||
| gemma3:27b | 27B | 120000 | |||||||
| nemotron-3-super:120b | NVIDIA | 120B | 1000000 | ||||||
| nemotron3-nano:30b | NVIDIA | 30B | 1000000 | ||||||
| nemotron-cascata:30b | NVIDIA | 30B | 1000000 | ||||||
| glm-4.7-flash:30b | Zhipu AI | 30B | 120000 | ||||||
| cogito:32b | Cogito profondo | 32B | 32000 | ||||||
| olmo-3:32b | AllenAI | 32B | 65536 | ||||||
| olmo-3:7b | AllenAI | 7B | 65536 | ||||||
| qwen3-2507:235b | Squadra Qwen | 235B | 200000 | ||||||
| mistral-small3.2:24b | Mistral AI | 24B | 128000 | ||||||
| mistral-small4:119b | Mistral AI | 119B | 262144 | ||||||
| ministeriale-3:14b | Mistral AI | 14B | 250000 | ||||||
| ministeriale-3:8b | Mistral AI | 8B | 250000 | ||||||
| ministeriale-3:3b | Mistral AI | 3B | 250000 | ||||||
| qwen3.5:9b | Squadra Qwen | 9B | 250000 | ||||||
| qwen3.5:4b | Squadra Qwen | 4B | 250000 | ||||||
| qwen3.5:0.8b | Squadra Qwen | 0.8B | 250000 | ||||||
| qwen3:0.6b | Squadra Qwen | 0.6B | 40000 | ||||||
| qwen3-2507-pensiero:4b | Squadra Qwen | 4B | 250000 | ||||||
| qwen3-omni:30b | Squadra Qwen | 30B | 32768 | ||||||
| Programmazione e agenti | |||||||||
| qwen3.6:35b | Squadra Qwen | 35B | 1000000 | ||||||
| qwen-coder-next:80b | Squadra Qwen | 80B | 250000 | ||||||
| qwen3-next:80b | Squadra Qwen | 80B | 250000 | ||||||
| devstral-small-2:24b | Mistral AI e All Hands AI | 24B | 200000 | ||||||
| rnj-1:8b | Essential AI | 8B | 32000 | ||||||
| funzione gemma: 270 m | 270M | 32768 | |||||||
| Visione e multimodalità | |||||||||
| qwen3-vl:235b | Squadra Qwen | 235B | 200000 | ||||||
| qwen3-vl:32b | Squadra Qwen | 32B | 250000 | ||||||
| qwen3-vl:30b | Squadra Qwen | 30B | 250000 | ||||||
| qwen3-vl:8b | Squadra Qwen | 8B | 250000 | ||||||
| qwen3-vl:4b | Squadra Qwen | 4B | 250000 | ||||||
| qwen3-vl:2b | Squadra Qwen | 2B | 250000 | ||||||
| gemma4:31b | 31B | 250000 | |||||||
| gemma4:e2b | 31B (E2B) | 128000 | |||||||
| gemma4:e4b | 31B (E4B) | 128000 | |||||||
| granito3.2-visione:2b | IBM | 2B | 16384 | ||||||
| deepseek-ocr | DeepSeek AI | 3B | 8192 | ||||||
| Incorporazione | |||||||||
| bge-m3:567m | BAAI | 567M | 8192 | ||||||
| qwen3-embedding:4b | Squadra Qwen | 4B | 40000 | ||||||
| qwen3-embedding:8b | Squadra Qwen | 8B | 40000 | ||||||
| qwen3-embedding:0.6b | Squadra Qwen | 0.6B | 32768 | ||||||
| granito-embedding:278m | IBM | 278M | 512 | ||||||
| embeddinggemma:300m | 300M | 2048 | |||||||
| Reranking | |||||||||
| nvidia/llama-nemotron-rerank-vl-1b-v2 | NVIDIA | 1B | 4096 | N.C. | |||||
| qwen3-reranker:4b | Squadra Qwen | 4B | 4096 | N.C. | |||||
| qwen3-reranker:0.6b | Squadra Qwen | 0.6B | 4096 | N.C. | |||||
| bge-reranker-grande | BAAI | 335M | 512 | N.C. | |||||
| Sicurezza | |||||||||
| granito3-guardia:8b | IBM | 8B | 8192 | ||||||
| granito3-guardiano:2b | IBM | 2B | 8192 | ||||||
| Traduzione | |||||||||
| translategemma:27b | 27B | 120000 | |||||||
| translategemma:12b | 12B | 128000 | |||||||
| translategemma:4b | 4B | 128000 | |||||||
| Audio e immagini | |||||||||
| voxtral | Mistral AI | 4B | 32768 | N.C. | |||||
| immagine z:16b | Comunità | 16B | N.C. | ||||||
Casi d'uso consigliati
Ecco alcuni casi d'uso comuni e i modelli più adatti per ciascuno di essi. Queste raccomandazioni si basano sulle prestazioni e sulle capacità specifiche di ciascun modello.
Dialogo multilingue
- nemotron-3-super:120b
- qwen3.6:27b
- nemotron3-nano:30b
- gpt-oss:120b
Analisi di documenti lunghi
- nemotron-3-super:120b
- qwen3.6:27b
- qwen3-2507:235b
Programmazione e sviluppo
- qwen3.6:35b
- qwen-coder-next:80b
- devstral-small-2:24b
- nemotron-3-super:120b
Analisi visiva
- qwen3-vl:235b
- gemma4:31b
- deepseek-ocr
- qwen3-vl:30b
Sicurezza e conformità
- granito3-guardia:8b
- granito3-guardiano:2b
- mistral-small4:119b
Impieghi leggeri
- qwen3.5:0.8b
- qwen3-vl:2b
- ministeriale-3:3b
RAG (Generazione Aumentata dal Recupero)
- bge-m3:567m
- nvidia/llama-nemotron-rerank-vl-1b-v2
- qwen3.6:27b