La nostra offerta Large Language Model as a Service (LLMaaS) vi dà accesso a modelli linguistici all'avanguardia, la cui inferenza viene eseguita con un'infrastruttura qualificata SecNumCloud, certificata HDS per l'hosting di dati sanitari, e quindi sovrana, calcolata in Francia. Beneficiate di prestazioni elevate e di una sicurezza ottimale per le vostre applicazioni AI. I vostri dati rimangono strettamente confidenziali e non vengono né sfruttati né conservati dopo l'elaborazione.
Modelli grandi
I nostri modelli di grandi dimensioni offrono prestazioni all'avanguardia per i compiti più impegnativi. Sono particolarmente adatti alle applicazioni che richiedono una comprensione profonda del linguaggio, ragionamenti complessi o l'elaborazione di documenti lunghi.
gemma4:31b
glm-4.7-flash:30b
qwen3-omni:30b
gpt-oss:120b
lama3.3:70b
gemma3:27b
qwen3.6:35b
qwen3.5:35b
qwen3.5:27b
qwen-coder-next:80b
qwen3-next:80b
qwen3-vl:30b
qwen3-vl:32b
olmo-3:7b
olmo-3:32b
qwen3-2507:235b
qwen3-vl:235b
ministeriale-3:14b
cogito:32b
nemotron3-nano:30b
nemotron-cascata:30b
nemotron-3-super:120b
Modelli specializzati
I nostri modelli specializzati sono ottimizzati per compiti specifici come la generazione di codice, l'analisi di immagini o l'elaborazione di dati strutturati. Offrono un eccellente rapporto prestazioni/costo per casi d'uso mirati.
ministeriale-3:3b
ministeriale-3:8b
funzione gemma: 270 m
granito3.2-visione:2b
qwen3-embedding:0.6b
granito-embedding:278m
qwen3-embedding:4b
bge-m3:567m
embeddinggemma:300m
gpt-oss:20b
qwen3-2507-pensiero:4b
rnj-1:8b
qwen3-vl:2b
qwen3-vl:4b
qwen3.5:0.8b
qwen3.5:4b
qwen3.5:9b
qwen3:0.6b
qwen3-vl:8b
devstral-small-2:24b
deepseek-ocr
mistral-small3.2:24b
mistral-small4:119b
translategemma:12b
translategemma:4b
translategemma:27b
voxtral
immagine z:16b
Modello a confronto
Questa tabella di confronto vi aiuterà a scegliere il modello più adatto alle vostre esigenze, in base a vari criteri come le dimensioni del contesto, le prestazioni e i casi d'uso specifici.
| Modello | Editore | Parametri | Contesto (k token) | Visione | Agente | Ragionamento | Sicurezza | Rapido * | Efficienza energetica * |
|---|---|---|---|---|---|---|---|---|---|
| Modelli grandi | |||||||||
| gemma4:31b | 31B | 250000 | |||||||
| glm-4.7-flash:30b | Zhipu AI | 30B | 120000 | ||||||
| qwen3-omni:30b | Squadra Qwen | 30B | 32768 | ||||||
| gpt-oss:120b | OpenAI | 120B | 120000 | ||||||
| lama3.3:70b | Meta | 70B | 132000 | ||||||
| gemma3:27b | 27B | 120000 | |||||||
| qwen3.6:35b | Squadra Qwen | 35B | 1000000 | ||||||
| qwen3.5:35b | Squadra Qwen | 35B | 1000000 | ||||||
| qwen3.5:27b | Squadra Qwen | 27B | 1000000 | ||||||
| qwen-coder-next:80b | Squadra Qwen | 80B | 250000 | ||||||
| qwen3-next:80b | Squadra Qwen | 80B | 250000 | ||||||
| qwen3-vl:30b | Squadra Qwen | 30B | 250000 | ||||||
| qwen3-vl:32b | Squadra Qwen | 32B | 250000 | ||||||
| olmo-3:7b | AllenAI | 7B | 65536 | ||||||
| olmo-3:32b | AllenAI | 32B | 65536 | ||||||
| qwen3-2507:235b | Squadra Qwen | 235B | 200000 | ||||||
| qwen3-vl:235b | Squadra Qwen | 235B | 200000 | ||||||
| ministeriale-3:14b | Mistral AI | 14B | 250000 | ||||||
| cogito:32b | Cogito profondo | 32B | 32000 | ||||||
| nemotron3-nano:30b | NVIDIA | 30B | 1000000 | ||||||
| nemotron-cascata:30b | NVIDIA | 30B | 1000000 | ||||||
| nemotron-3-super:120b | NVIDIA | 120B | 1000000 | ||||||
| Modelli specializzati | |||||||||
| ministeriale-3:3b | Mistral AI | 3B | 250000 | ||||||
| ministeriale-3:8b | Mistral AI | 8B | 250000 | ||||||
| funzione gemma: 270 m | 270M | 32768 | |||||||
| granito3.2-visione:2b | IBM | 2B | 16384 | ||||||
| qwen3-embedding:0.6b | Squadra Qwen | 0.6B | 32768 | ||||||
| granito-embedding:278m | IBM | 278M | 512 | ||||||
| qwen3-embedding:4b | Squadra Qwen | 4B | 40000 | ||||||
| bge-m3:567m | BAAI | 567M | 8192 | ||||||
| embeddinggemma:300m | 300M | 2048 | |||||||
| gpt-oss:20b | OpenAI | 20B | 120000 | ||||||
| qwen3-2507-pensiero:4b | Squadra Qwen | 4B | 250000 | ||||||
| rnj-1:8b | Essential AI | 8B | 32000 | ||||||
| qwen3-vl:2b | Squadra Qwen | 2B | 250000 | ||||||
| qwen3-vl:4b | Squadra Qwen | 4B | 250000 | ||||||
| qwen3.5:0.8b | Squadra Qwen | 0.8B | 250000 | ||||||
| qwen3.5:4b | Squadra Qwen | 4B | 250000 | ||||||
| qwen3.5:9b | Squadra Qwen | 9B | 250000 | ||||||
| qwen3:0.6b | Squadra Qwen | 0.6B | 40000 | ||||||
| qwen3-vl:8b | Squadra Qwen | 8B | 250000 | ||||||
| devstral-small-2:24b | Mistral AI e All Hands AI | 24B | 200000 | ||||||
| deepseek-ocr | DeepSeek AI | 3B | 8192 | ||||||
| mistral-small3.2:24b | Mistral AI | 24B | 128000 | ||||||
| mistral-small4:119b | Mistral AI | 119B | 262144 | ||||||
| translategemma:12b | 12B | 128000 | |||||||
| translategemma:4b | 4B | 128000 | |||||||
| translategemma:27b | 27B | 120000 | |||||||
| voxtral | Mistral AI | 4B | 32768 | N.C. | |||||
| immagine z:16b | Comunità | 16B | N.C. | ||||||
Casi d'uso consigliati
Ecco alcuni casi d'uso comuni e i modelli più adatti per ciascuno di essi. Queste raccomandazioni si basano sulle prestazioni e sulle capacità specifiche di ciascun modello.
Dialogo multilingue
- nemotron-3-super:120b
- qwen3.6:27b
- nemotron3-nano:30b
- gpt-oss:120b
Analisi di documenti lunghi
- nemotron-3-super:120b
- qwen3.6:27b
- qwen3-2507:235b
Programmazione e sviluppo
- qwen3.6:27b
- qwen3-2507:235b
- qwen-coder-next:80b
- nemotron-3-super:120b
Analisi visiva
- qwen3.6:27b
- deepseek-ocr
- qwen3.6:35b
Sicurezza e conformità
- granito3-guardia:8b
- qwen3.6:27b
- granito3-guardiano:2b
Impieghi leggeri e a bordo
- qwen3.5:0.8b
- qwen3-vl:2b
- ministeriale-3:3b