AI affidabile - Il cloud affidabile

La nostra offerta Lingua grande Modello come servizio (LLMaaS) vi dà accesso a modelli linguistici all'avanguardia, desunti da un'infrastruttura qualificata SecNumCloudcertificato HDS per l'hosting di dati sanitari, e quindi sovrani, calcolati in Francia. Beneficiate di prestazioni elevate e di una sicurezza ottimale per le vostre applicazioni AI. I vostri dati rimangono strettamente confidenziali e non vengono utilizzati o conservati dopo l'elaborazione.

Prezzi semplici e trasparenti

0.9 €

per milione di token in ingresso

4 €

per milione di token emessi

21 €

per milione di gettoni di ragionamento

0,01 €

per minuto di audio trascritto *

Calcolato su un'infrastruttura basata in Francia, qualificata SecNumcloud e certificata HDS.

Nota sul premio "Ragionamento" : Questo prezzo si applica specificamente ai modelli classificati come ragionatori" o "ibridi" (modelli con l'abilità "Ragionare" attivata) quando il ragionamento è attivo e solo sui gettoni legati a questa attività. ") quando il ragionamento è attivo e solo sulle pedine legate a questa attività. solo sulle pedine legate a questa attività.

* Ogni minuto iniziato viene contato

Modelli grandi

I nostri modelli di grandi dimensioni offrono prestazioni all'avanguardia per i compiti più impegnativi. Sono particolarmente adatti alle applicazioni che richiedono una comprensione profonda del linguaggio, ragionamenti complessi o l'elaborazione di documenti lunghi.

Combinando una notevole efficienza con risorse computazionali ridotte, questo modello offre ampie capacità multilingue che coprono 8 lingue principali (inglese, francese, tedesco, spagnolo, italiano, portoghese, hindi e tailandese). La sua finestra contestuale di 60.000 token consente un'analisi approfondita di documenti complessi e lunghe conversazioni, mantenendo un'eccezionale coerenza complessiva. Ottimizzato per ridurre al minimo i pregiudizi e le risposte problematiche.

Parametri :

70 milliardi

Dimensione del contesto :

60000

Licenza :

Licenza comunitaria LLAMA 3.3

Efficacia energetica :

11.75 kWh/Mtoken

CO₂ equivalente :

270.25 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Dialogo

Multilingua

Fa parte della serie Qwen3. Questo modello da 235 miliardi di parametri è stato progettato per eccellere nel ragionamento profondo, nella generazione di codice complesso e nella comprensione sfumata in contesti ampi. Supporta oltre 100 linguaggi e modalità di pensiero ibride.

Parametri :

235 milliardi

Dimensione del contesto :

60000

Licenza :

Apache 2.0

Efficacia energetica :

7.84 kWh/Mtoken

CO₂ equivalente :

180.32 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Multilingua

Molto grande

DeepSeek-R1 671B è uno dei modelli aperti più grandi, progettato per i compiti di ragionamento più impegnativi e per generare testi di qualità eccezionale.

Parametri :

671 milliardi

Dimensione del contesto :

16000

Licenza :

Licenza MIT

Efficacia energetica :

11.11 kWh/Mtoken

CO₂ equivalente :

255.53 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Estremamente ampio

Con un'efficienza hardware senza pari, questo modello incorpora funzionalità multimodali native ed eccelle nelle prestazioni multilingue in oltre 140 lingue. L'impressionante finestra contestuale di 120.000 token lo rende la scelta ideale per l'analisi di documenti di grandi dimensioni, la ricerca documentale e qualsiasi applicazione che richieda la comprensione di contesti estesi. La sua architettura ottimizzata consente una distribuzione flessibile senza compromettere la qualità dei risultati.

Parametri :

27 milliardi

Dimensione del contesto :

120000

Licenza :

Condizioni di utilizzo di Google Gemma

Efficacia energetica :

6.67 kWh/Mtoken

CO₂ equivalente :

153.41 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Ampio contesto

Versione FP8 del modello MoE Qwen3 30B-A3B. Include una modalità "Thinking" per ragionamenti complessi e una modalità veloce "Non-Thinking". Capacità migliorate di ragionamento, codice, matematica e agente (strumenti/MCP). Supporta oltre 100 lingue. Ideale per un equilibrio ottimale tra prestazioni e costi.

Parametri :

30 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

2.88 kWh/Mtoken

CO₂ equivalente :

66.24 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

MoE

Agente

Ragionamento

Veloce

Multilingua

DeepSeek-R1 70B è progettato per compiti complessi di ragionamento e generazione.

Parametri :

70 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

12.56 kWh/Mtoken

CO₂ equivalente :

288.88 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Grande

Questo modello di linguaggio visivo da 32 miliardi di parametri è stato progettato per i compiti più impegnativi, combinando una comprensione visiva profonda con capacità di ragionamento avanzate per interagire con interfacce grafiche e analizzare documenti complessi.

Parametri :

32 milliardi

Dimensione del contesto :

120000

Licenza :

Apache 2.0

Efficacia energetica :

7.41 kWh/Mtoken

CO₂ equivalente :

170.43 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Ragionamento

OCR

Posizione visiva

Grande

Questo modello di linguaggio visivo da 72 miliardi di parametri è stato progettato per i compiti più impegnativi, combinando una comprensione visiva profonda con capacità di ragionamento avanzate per interagire con interfacce grafiche e analizzare documenti complessi.

Parametri :

72 milliardi

Dimensione del contesto :

128000

Licenza :

Apache 2.0

Efficacia energetica :

8.89 kWh/Mtoken

CO₂ equivalente :

204.47 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Ragionamento

OCR

Posizione visiva

Molto grande

Modelli specializzati

I nostri modelli specializzati sono ottimizzati per compiti specifici come la generazione di codice, l'analisi di immagini o l'elaborazione di dati strutturati. Offrono un eccellente rapporto prestazioni/costo per casi d'uso mirati.

Parte della serie Qwen3, addestrato su ~36T token. Capacità di ragionamento, codifica, matematica e agente (strumenti/MCP) migliorate. Supporta oltre 100 linguaggi e modi di pensare ibridi.

Parametri :

14 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

3.88 kWh/Mtoken

CO₂ equivalente :

89.24 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Veloce

Multilingua

Questo modello di medie dimensioni combina prestazioni di alta qualità con l'efficienza operativa, offrendo molte delle funzionalità del fratello più grande con parametro 27B in un formato più leggero. Ideale per le installazioni che richiedono qualità e velocità senza le risorse di calcolo dei modelli più grandi.

Parametri :

12 milliardi

Dimensione del contesto :

120000

Licenza :

Condizioni di utilizzo di Google Gemma

Efficacia energetica :

4.71 kWh/Mtoken

CO₂ equivalente :

108.33 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Veloce

Sfondo

Questa versione compatta di Gemma 3 è ottimizzata per le distribuzioni con risorse limitate, pur mantenendo prestazioni eccezionali per le sue dimensioni. La sua efficiente architettura consente una rapida inferenza su hardware standard, ideale per le applicazioni che richiedono reattività e distribuzione su larga scala. Nonostante le dimensioni ridotte, mantiene le funzionalità multimodali per l'elaborazione di testi e immagini.

Parametri :

4 milliardi

Dimensione del contesto :

120000

Licenza :

Condizioni di utilizzo di Google Gemma

Efficacia energetica :

0.58 kWh/Mtoken

CO₂ equivalente :

13.34 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Veloce

Compatto

Sfondo

Efficiente

Questo modello ultracompatto rappresenta l'epitome dell'efficienza, consentendo l'implementazione in ambienti con risorse estremamente limitate. Nonostante le sue dimensioni minime, offre funzionalità di base sorprendenti per compiti testuali semplici o moderati, con un'eccezionale velocità di inferenza. Supporta inoltre l'integrazione con strumenti esterni tramite chiamate di funzione.

Parametri :

1 milliardi

Dimensione del contesto :

32000

Licenza :

Condizioni di utilizzo di Google Gemma

Efficacia energetica :

0.15 kWh/Mtoken

CO₂ equivalente :

3.45 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ultra-compatto

Incorporato

Efficiente

Veloce

Messa a punto su istruzioni sintetiche (ChatGPT, Gemma) e prompt personalizzati. Non ottimizzato per il codice e la matematica. Addestrato in un contesto 4k, ma mantiene la capacità del modello di base per 32k. Modello in fase di sviluppo.

Parametri :

7 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

8.33 kWh/Mtoken

CO₂ equivalente :

191.59 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Francese

Open-Source

Efficiente

Nonostante le sue dimensioni moderate, questo modello offre prestazioni notevoli, in grado di competere con quelle di modelli proprietari molto più grandi. La sua architettura ingegnosamente ottimizzata lo rende facile da implementare localmente su una varietà di infrastrutture. Grazie alle funzionalità multimodali native, è in grado di elaborare sia testi che immagini senza dover ricorrere a sistemi esterni. La licenza Apache 2.0 offre la massima flessibilità per le implementazioni e le personalizzazioni commerciali, rendendolo la scelta ideale per le aziende che desiderano bilanciare prestazioni e vincoli legali.

Parametri :

24 milliardi

Dimensione del contesto :

120000

Licenza :

Apache 2.0

Efficacia energetica :

3.72 kWh/Mtoken

CO₂ equivalente :

85.56 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Sicurezza

Questa versione 3.2 mantiene i punti di forza del suo predecessore, pur apportando miglioramenti mirati. È in grado di seguire meglio istruzioni precise, produce meno generazioni infinite o risposte ripetitive e il suo modello di chiamata di funzione è più robusto. Per il resto, le sue prestazioni sono equivalenti o leggermente migliori rispetto alla versione 3.1.

Parametri :

24 milliardi

Dimensione del contesto :

120000

Licenza :

Apache 2.0

Efficacia energetica :

3.72 kWh/Mtoken

CO₂ equivalente :

85.56 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Sicurezza

Istruzioni successive

Parametri :

24 milliardi

Dimensione del contesto :

120000

Licenza :

Apache 2.0

Efficacia energetica :

5.28 kWh/Mtoken

CO₂ equivalente :

121.44 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Sicurezza

Istruzioni successive

Prestazioni eccezionali nella generazione di codice e nel ragionamento algoritmico (60,6% LiveCodeBench Pass@1, 1936 Codeforces, 92,6% HumanEval+). Addestrato tramite RL (GRPO+) con estensione progressiva del contesto (32k -> 64k). Progetto trasparente (codice aperto, dataset, log). Consente l'integrazione di funzionalità avanzate di generazione del codice senza affidarsi a soluzioni proprietarie.

Parametri :

14 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

4.12 kWh/Mtoken

CO₂ equivalente :

94.76 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Programmazione

Ragionamento

Open-Source

Matematica

Veloce

Questo modello compatto è in grado di eguagliare le prestazioni di modelli molto più grandi in un'ampia gamma di compiti di comprensione visiva. La sua capacità di interpretare direttamente il contenuto visivo dei documenti - testo, tabelle, grafici e diagrammi - senza passare attraverso la tradizionale fase OCR rappresenta un significativo progresso in termini di efficienza e accuratezza. Questo approccio integrato riduce significativamente gli errori di riconoscimento e fornisce una comprensione più contestuale e sfumata del contenuto visivo.

Parametri :

2 milliardi

Dimensione del contesto :

16384

Licenza :

Apache 2.0

Efficacia energetica :

0.69 kWh/Mtoken

CO₂ equivalente :

15.87 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Sicurezza

Compatto

Efficiente

Questa versione 8B del modello Granite 3.3 offre miglioramenti significativi su benchmark generici (AlpacaEval-2.0, Arena-Hard) e miglioramenti in matematica, codifica e tracciamento delle istruzioni. Supporta 12 linguaggi, Fill-in-the-Middle (FIM) per il codice, la modalità Thinking per la riflessione strutturata e la chiamata di funzione. Licenza Apache 2.0. Ideale per compiti generali e per l'integrazione in assistenti AI.

Parametri :

8 milliardi

Dimensione del contesto :

60000

Licenza :

Apache 2.0

Efficacia energetica :

1.11 kWh/Mtoken

CO₂ equivalente :

25.53 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Sicurezza

Efficiente

Versione compatta di Granite 3.3 (parametri 2B) che offre gli stessi miglioramenti della versione 8B per quanto riguarda il ragionamento, il seguire le istruzioni, la matematica e la codifica. Supporta 12 lingue, Fill-in-the-Middle (FIM), modalità di ragionamento e chiamata di funzione. Licenza Apache 2.0. Scelta eccellente per implementazioni leggere che richiedono ampie capacità contestuali e di ragionamento.

Parametri :

2 milliardi

Dimensione del contesto :

120000

Licenza :

Apache 2.0

Efficacia energetica :

0.74 kWh/Mtoken

CO₂ equivalente :

17.02 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Sicurezza

Efficiente

Ideale per un uso generale che richiede un'elaborazione del pensiero più lunga e una maggiore precisione. Utile per ricerche legali, previsioni finanziarie, sviluppo di software e narrazione creativa. Risolve le sfide in più fasi in cui trasparenza e accuratezza sono essenziali.

Parametri :

24 milliardi

Dimensione del contesto :

40000

Licenza :

Apache 2.0

Efficacia energetica :

5.33 kWh/Mtoken

CO₂ equivalente :

122.59 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Multilingua

L'architettura MoE (Mixture-of-Experts) di questo modello rappresenta un progresso significativo nell'ottimizzazione dei modelli linguistici, consentendo di ottenere prestazioni paragonabili a quelle di modelli molto più grandi, pur mantenendo un ingombro di memoria notevolmente ridotto. Questo approccio innovativo attiva dinamicamente solo le parti rilevanti della rete per ogni compito specifico, garantendo una notevole efficienza energetica e computazionale senza compromettere la qualità dei risultati.

Parametri :

3 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

0.45 kWh/Mtoken

CO₂ equivalente :

10.35 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Sicurezza

Veloce

MoE

Efficienza

Efficiente

Grazie alle eccellenti capacità di ragionamento logico e alla profonda comprensione semantica, questo modello si distingue per la sua capacità di cogliere le sottigliezze e le implicazioni di testi complessi. Il suo design enfatizza il ragionamento coerente e la precisione analitica, rendendolo particolarmente adatto alle applicazioni che richiedono un'analisi attenta e contestuale delle informazioni. Le sue dimensioni moderate consentono un'implementazione flessibile, pur mantenendo prestazioni di alta qualità in un'ampia gamma di compiti analitici impegnativi.

Parametri :

14 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza comunitaria LLAMA 3.2

Efficacia energetica :

4.4 kWh/Mtoken

CO₂ equivalente :

101.2 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Comprensione

Analisi

Veloce

Questa versione estesa del modello Cogito porta le capacità di ragionamento e comprensione ancora più in là, offrendo una profondità di analisi senza pari per le applicazioni più complesse. La sua sofisticata architettura gli consente di affrontare ragionamenti in più fasi con rigore e precisione, mantenendo una notevole coerenza complessiva. Ideale per le applicazioni mission-critical che richiedono un'intelligenza artificiale capace di ragionamenti ricchi di sfumature e di una comprensione contestuale profonda, paragonabile alle analisi di esperti umani in campi specialistici.

Parametri :

32 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza comunitaria LLAMA 3.2

Efficacia energetica :

8.25 kWh/Mtoken

CO₂ equivalente :

189.75 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Comprensione

Analisi

Fa parte della serie Qwen3, addestrata su un vasto corpus di dati. Questo modello da 32 miliardi di parametri è stato progettato per eccellere in compiti complessi, supportare oltre 100 lingue e incorporare modalità di pensiero ibride per migliorare le prestazioni.

Parametri :

32 milliardi

Dimensione del contesto :

40000

Licenza :

Apache 2.0

Efficacia energetica :

7.41 kWh/Mtoken

CO₂ equivalente :

170.43 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Multilingua

Sfondo

Questo modello utilizza un approccio RL innovativo con ricompense basate sui risultati (controlli di precisione per la matematica, esecuzione di codice per la codifica) e un addestramento in più fasi per migliorare le abilità generali senza degradare le prestazioni specialistiche. Include funzionalità di agente per l'utilizzo di strumenti e l'adattamento del ragionamento. Licenza Apache 2.0.

Parametri :

32 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

7.54 kWh/Mtoken

CO₂ equivalente :

173.42 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Codifica

Matematica

Rappresentando un equilibrio ottimale tra prestazioni ed efficienza, questa versione compatta di DeepSeek-R1 mantiene le principali qualità di ragionamento e analisi della sua controparte più grande, consentendo al contempo un'implementazione più leggera e flessibile. Il suo design accuratamente ottimizzato garantisce risultati di qualità in un'ampia gamma di attività, riducendo al minimo i requisiti di risorse computazionali. Questa combinazione lo rende la scelta ideale per le applicazioni che richiedono un'implementazione agile senza compromettere le funzionalità principali.

Parametri :

14 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

4.26 kWh/Mtoken

CO₂ equivalente :

97.98 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Compatto

Versatile

Veloce

Questa versione di fascia media del modello DeepSeek-R1 combina in modo intelligente potenza ed efficienza, offrendo prestazioni significativamente migliori rispetto alla versione 14B e mantenendo un ingombro inferiore rispetto alla versione 70B. Questa posizione strategica nella gamma lo rende un'opzione particolarmente interessante per le implementazioni che richiedono capacità di ragionamento avanzate senza i requisiti hardware dei modelli più grandi. La sua versatilità gli consente di eccellere in un'ampia gamma di compiti, dall'analisi del testo alla generazione di contenuti strutturati.

Parametri :

32 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

7.99 kWh/Mtoken

CO₂ equivalente :

183.77 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Versatile

Offre le capacità di ragionamento della famiglia Cogito in un formato molto leggero (3 miliardi di parametri), ideale per implementazioni embedded o ambienti CPU.

Parametri :

3 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza comunitaria LLAMA 3.2

Efficacia energetica :

0.61 kWh/Mtoken

CO₂ equivalente :

14.03 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Compatto

Incorporato

Efficiente

Veloce

Progettato per generare rappresentazioni vettoriali dense del testo, questo modello è ottimizzato per garantire efficienza e prestazioni nei compiti di similarità semantica, clustering e classificazione. Le sue dimensioni ridotte lo rendono ideale per le implementazioni su larga scala.

Parametri :

0.278 milliardi

Dimensione del contesto :

512

Licenza :

Apache 2.0

Efficacia energetica :

N.C.

CO₂ equivalente :

N.C.

Strumenti (Fonctions) :

Visione (immagini) :

Incorporazione

Compatto

Semantica

Efficiente

Versione leggera della famiglia Guardian, addestrata per identificare e filtrare contenuti dannosi, pregiudizi e rischi per la sicurezza nelle interazioni testuali. Offre una protezione robusta con un'impronta computazionale ridotta. Contesto limitato a 8k token.

Parametri :

2 milliardi

Dimensione del contesto :

8192

Licenza :

Apache 2.0

Efficacia energetica :

N.C.

CO₂ equivalente :

N.C.

Strumenti (Fonctions) :

Visione (immagini) :

Sicurezza

Conformità

Compatto

Filtraggio

Efficiente

Modello di medie dimensioni della famiglia Guardian, che offre un'analisi di sicurezza più approfondita rispetto alla versione 2B. Ideale per le applicazioni che richiedono un monitoraggio rigoroso dei contenuti e una rigorosa conformità.

Parametri :

8 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

N.C.

CO₂ equivalente :

N.C.

Strumenti (Fonctions) :

Visione (immagini) :

Sicurezza

Conformità

Filtraggio

Il modello più piccolo della serie Qwen 2.5, che offre capacità di elaborazione linguistica di base con un ingombro minimo. Ideale per compiti molto semplici su dispositivi IoT o mobili.

Parametri :

0.5 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

0.1 kWh/Mtoken

CO₂ equivalente :

2.3 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ultra-compatto

Veloce

Incorporato

Efficiente

Modello leggermente più grande della versione 0.5B, che offre maggiori capacità pur rimanendo altamente efficiente. Adatto per applicazioni mobili o embedded che richiedono una maggiore potenza.

Parametri :

1.5 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

0.33 kWh/Mtoken

CO₂ equivalente :

7.59 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Compatto

Veloce

Incorporato

Efficiente

Offre forti capacità multilingue e comprensione generale in un formato 14B. Adatto a un'ampia gamma di applicazioni che richiedono un modello affidabile senza i requisiti di modelli molto grandi.

Parametri :

14 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

4.33 kWh/Mtoken

CO₂ equivalente :

99.59 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Versatile

Multilingua

Veloce

Versione 32B di Qwen 2.5, che offre prestazioni migliori rispetto alla versione 14B, in particolare nel ragionamento e nel seguire istruzioni complesse, pur rimanendo più leggero del modello 72B.

Parametri :

32 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

8.51 kWh/Mtoken

CO₂ equivalente :

195.73 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Versatile

Multilingua

Ragionamento

Offre un buon compromesso tra le capacità dei modelli 1.5B e 14B. Ideale per applicazioni che richiedono una buona comprensione generale in un formato leggero e veloce.

Parametri :

3 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

0.52 kWh/Mtoken

CO₂ equivalente :

11.96 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Compatto

Veloce

Versatile

Efficiente

Offre un buon compromesso tra le capacità dei modelli ultracompatti e quelle dei modelli più grandi. Ideale per applicazioni che richiedono una buona comprensione generale in un formato leggero e veloce.

Parametri :

0.6 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

0.15 kWh/Mtoken

CO₂ equivalente :

3.45 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Compatto

Veloce

Versatile

Efficiente

Modello leggermente più grande della versione 0.6B, che offre maggiori capacità pur rimanendo altamente efficiente. Adatto per applicazioni mobili o embedded che richiedono una maggiore potenza.

Parametri :

1.7 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

0.38 kWh/Mtoken

CO₂ equivalente :

8.74 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Compatto

Veloce

Incorporato

Efficiente

Questa versione compatta del modello Qwen3 è ottimizzata per le distribuzioni con risorse limitate, pur mantenendo prestazioni eccezionali per le sue dimensioni. La sua efficiente architettura consente una rapida inferenza su hardware standard.

Parametri :

4 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

0.68 kWh/Mtoken

CO₂ equivalente :

15.64 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Compatto

Efficiente

Versione 8B di Qwen3, che offre capacità di ragionamento, codifica, matematica e agenti migliorate. Supporta oltre 100 linguaggi e modi di pensare ibridi.

Parametri :

8 milliardi

Dimensione del contesto :

32000

Licenza :

Apache 2.0

Efficacia energetica :

1.01 kWh/Mtoken

CO₂ equivalente :

23.23 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Agente

Multilingua

Efficiente

Qwen2.5-VL è il nuovo modello di linguaggio di visione di punta di Qwen, che segna un significativo progresso rispetto a Qwen2-VL. Caratteristiche principali - Comprensione visiva (oggetti comuni, testo, grafica, icone, layout). Capacità di agente visivo (ragionamento, direzione dinamica degli strumenti per l'uso del computer/telefono). Localizzazione visiva precisa (bounding box, punti, output JSON stabile). Generazione di output strutturato (fatture, moduli, tabelle). Qwen2.5-VL-3B supera anche la versione 7B di Qwen2-VL.

Parametri :

3.8 milliardi

Dimensione del contesto :

128000

Licenza :

Apache 2.0

Efficacia energetica :

0.51 kWh/Mtoken

CO₂ equivalente :

11.73 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Ragionamento

Veloce

Efficiente

OCR

Posizione visiva

Edge AI

Parametri :

8.3 milliardi

Dimensione del contesto :

128000

Licenza :

Apache 2.0

Efficacia energetica :

0.95 kWh/Mtoken

CO₂ equivalente :

21.85 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Visione

Agente

Ragionamento

Efficiente

OCR

Posizione visiva

Modello Foundation-Sec-8B (Llama-3.1-FoundationAI-SecurityLLM-base-8B) basato su Llama-3.1-8B, pre-addestrato su un corpus di cybersecurity. Progettato per il rilevamento delle minacce, la valutazione delle vulnerabilità, l'automazione della sicurezza, ecc. Ottimizzato per la distribuzione locale. Contesto di 16k token.

Parametri :

8 milliardi

Dimensione del contesto :

16384

Licenza :

Apache 2.0

Efficacia energetica :

1.59 kWh/Mtoken

CO₂ equivalente :

36.57 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Sicurezza

Compatto

Devstral è un LLM agenziale per attività di ingegneria del software. Eccelle nell'uso di strumenti per esplorare basi di codice, modificare più file e alimentare agenti di ingegneria del software. È stato perfezionato a partire da Mistral Small 3.1, con una finestra contestuale lunga fino a 128k token.

Parametri :

24 milliardi

Dimensione del contesto :

120000

Licenza :

Apache 2.0

Efficacia energetica :

5.86 kWh/Mtoken

CO₂ equivalente :

134.78 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Programmazione

Open-Source

Sfondo

Questa versione 8B si posiziona tra i modelli compatti e quelli più grandi, offrendo solide capacità di ragionamento per un'ampia gamma di applicazioni analitiche senza richiedere le risorse dei modelli più grandi.

Parametri :

8 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza comunitaria LLAMA 3.2

Efficacia energetica :

1.11 kWh/Mtoken

CO₂ equivalente :

25.53 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Agente

Ragionamento

Versatile

Efficiente

Basato sull'architettura Llama 3.1, questo modello 8B è un ottimo punto di partenza per compiti generali, in quanto offre generazione e comprensione di buona qualità in un formato efficiente.

Parametri :

8 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza comunitaria LLAMA 3.1

Efficacia energetica :

1.08 kWh/Mtoken

CO₂ equivalente :

24.84 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Versatile

Efficiente

Questo modello è specificamente addestrato per eccellere in compiti che richiedono un ragionamento logico in più fasi, il che lo rende particolarmente bravo nei problemi di matematica, logica e codifica.

Parametri :

14 milliardi

Dimensione del contesto :

32000

Licenza :

Licenza MIT

Efficacia energetica :

3.71 kWh/Mtoken

CO₂ equivalente :

85.33 CO₂e/Mtoken

Strumenti (Fonctions) :

Visione (immagini) :

Ragionamento

Matematica

Programmazione

Veloce

Modello a confronto

Questa tabella di confronto vi aiuterà a scegliere il modello più adatto alle vostre esigenze, in base a vari criteri come le dimensioni del contesto, le prestazioni e i casi d'uso specifici.

Modello	Editore	Parametri	Contesto (k token)	Efficienza energetica *
Modelli grandi
Lama 3.3 70B	Meta	70B	60000
Qwen3 235B	Squadra Qwen	235B	60000
DeepSeek-R1 671B	DeepSeek AI	671B	16000
Gemma 3 27B	Google	27B	120000
Qwen3 30B-A3B FP8	Squadra Qwen	30B-A3B	32000
DeepSeek-R1 70B	DeepSeek AI	70B	32000
Qwen2.5-VL 32B	Squadra Qwen	32B	120000
Qwen2.5-VL 72B	Squadra Qwen	72B	128000
Modelli specializzati
Qwen3 14B	Squadra Qwen	14B	32000
Gemma 3 12B	Google	12B	120000
Gemma 3 4B	Google	4B	120000
Gemma 3 1B	Google	1B	32000
Lucie-7B-Istruzione	OpenLLM-Francia	7B	32000
Mistral Piccolo 3.1	Mistral AI	24B	120000
Mistral Piccolo 3.2	Mistral AI	24B	120000
Mistral Piccolo 3.2	Mistral AI	24B	120000
DeepCoder	Agentica x Together AI	14B	32000
Granito 3.2 Visione	IBM	2B	16384
Granito 3.3 8B	IBM	8B	60000
Granito 3.3 2B	IBM	2B	120000
Magistrale 24B	Mistral AI	24B	40000
Granito 3.1 MoE	IBM	3B	32000
cogito:14b	Cogito profondo	14B	32000
Cogito 32B	Cogito profondo	32B	32000
Qwen3 32B	Squadra Qwen	32B	40000
QwQ-32B	Squadra Qwen	32B	32000
DeepSeek-R1 14B	DeepSeek AI	14B	32000
DeepSeek-R1 32B	DeepSeek AI	32B	32000
Cogito 3B	Cogito profondo	3B	32000
Incasso di granito	IBM	278M	512	N.C.
Granito 3 Guardiano 2B	IBM	2B	8192	N.C.
Granito 3 Guardiano 8B	IBM	8B	32000	N.C.
Qwen 2,5 0,5B	Squadra Qwen	0.5B	32000
Qwen 2,5 1,5B	Squadra Qwen	1.5B	32000
Qwen 2.5 14B	Squadra Qwen	14B	32000
Qwen 2.5 32B	Squadra Qwen	32B	32000
Qwen 2,5 3B	Squadra Qwen	3B	32000
Qwen3 0.6b	Squadra Qwen	0.6B	32000
Qwen3 1.7b	Squadra Qwen	1.7B	32000
Qwen3 4b	Squadra Qwen	4B	32000
Qwen3 8b	Squadra Qwen	8B	32000
Qwen2.5-VL 3B	Squadra Qwen	3.8B	128000
Qwen2.5-VL 7B	Squadra Qwen	7B (8,3B)	128000
Fondazione-Sec-8B	Fondazione AI - Cisco	8B	16384
devstral 24B	Mistral AI e All Hands AI	24B	120000
Cogito 8B	Cogito profondo	8B	32000
Lama 3.1 8B	Meta	8B	32000
Ragionamento Phi-4 14B	Microsoft	14B	32000

Legenda e spiegazione

Funzionalità o capacità supportata dal modello

Funzionalità o capacità non supportate dal modello

* Efficienza energetica Indica un consumo energetico particolarmente basso (< 2.0 kWh/Mtoken)

* Veloce Modello in grado di generare più di 50 gettoni al secondo

Nota sulle misure di performance

I valori di velocità (token/s) rappresentano gli obiettivi di performance in condizioni reali. Il consumo energetico (kWh/Mtoken) è calcolato da calcolato dividendo la potenza stimata del server d'inferenza (in Watt) per la velocità misurata del modello (in token/secondo). Watt) per la velocità misurata del modello (in token/secondo) e quindi convertito in kilowattora. convertito in chilowattora per milione di token (divisione per 3,6). Questo metodo offre un confronto pratico dell'efficienza energetica di diversi modelli, da utilizzare come di diversi modelli, da utilizzare come indicatore relativo piuttosto che come misura assoluta del consumo energetico. come misura assoluta del consumo energetico.

Casi d'uso consigliati

Ecco alcuni casi d'uso comuni e i modelli più adatti per ciascuno di essi. Queste raccomandazioni si basano sulle prestazioni e sulle capacità specifiche di ciascun modello.

Dialogo multilingue

Chatbot e assistenti in grado di comunicare in diverse lingue, con rilevamento automatico, mantenimento del contesto durante la conversazione e comprensione delle specificità linguistiche.

Modelli consigliati

Llama 3.3
Mistral Piccolo 3.1
Qwen 2.5
Granito 3.3

Analisi di documenti lunghi

Elaborazione di documenti di grandi dimensioni (>100 pagine), mantenendo il contesto in tutto il testo, estraendo le informazioni chiave, generando sintesi pertinenti e rispondendo a domande specifiche sui contenuti

Modelli consigliati

Gemma 3
DeepSeek-R1
Granito 3.3

Programmazione e sviluppo

Generazione e ottimizzazione di codice in più linguaggi, debugging, refactoring, sviluppo di funzionalità complete, comprensione di implementazioni algoritmiche complesse e creazione di test unitari.

Modelli consigliati

DeepCoder
QwQ
DeepSeek-R1
Granito 3.3
Devstral

Analisi visiva

Elaborazione diretta di immagini e documenti visivi senza pre-elaborazione OCR, interpretazione di diagrammi tecnici, grafici, tabelle, disegni e foto con generazione di spiegazioni testuali dettagliate del contenuto visivo

Modelli consigliati

Granito 3.2 Visione
Mistral Piccolo 3.1
Gemma 3
Qwen2.5-VL

Sicurezza e conformità

Applicazioni che richiedono specifiche funzionalità di sicurezza; filtraggio di contenuti sensibili, tracciabilità dei ragionamenti, verifica RGPD/HDS, minimizzazione dei rischi, analisi delle vulnerabilità e conformità alle normative settoriali.

Modelli consigliati

Guardiano del granito
Granito 3.3
Devstral
Mistral Piccolo 3.1
Magistrale 24b
Fondazione-Sec-8B

Impieghi leggeri e a bordo

Applicazioni che richiedono un ingombro minimo di risorse, implementazione su dispositivi a capacità limitata, inferenza in tempo reale su CPU standard e integrazione in sistemi embedded o IoT.

Modelli consigliati

Gemma 3
Granito 3.1 MoE
Guardiano del granito
Granito 3.3

IA affidabile

Modelli grandi

Lama 3.3 70B

Qwen3 235B

DeepSeek-R1 671B

Gemma 3 27B

Qwen3 30B-A3B FP8

DeepSeek-R1 70B

Qwen2.5-VL 32B

Qwen2.5-VL 72B

Modelli specializzati

Qwen3 14B

Gemma 3 12B

Gemma 3 4B

Gemma 3 1B

Lucie-7B-Istruzione

Mistral Piccolo 3.1

Mistral Piccolo 3.2

Mistral Piccolo 3.2

DeepCoder

Granito 3.2 Visione

Granito 3.3 8B

Granito 3.3 2B

Magistrale 24B

Granito 3.1 MoE

cogito:14b

Cogito 32B

Qwen3 32B

QwQ-32B

DeepSeek-R1 14B

DeepSeek-R1 32B

Cogito 3B

Incasso di granito

Granito 3 Guardiano 2B

Granito 3 Guardiano 8B

Qwen 2,5 0,5B

Qwen 2,5 1,5B

Qwen 2.5 14B

Qwen 2.5 32B

Qwen 2,5 3B

Qwen3 0.6b

Qwen3 1.7b

Qwen3 4b

Qwen3 8b

Qwen2.5-VL 3B

Qwen2.5-VL 7B

Fondazione-Sec-8B

devstral 24B

Cogito 8B

Lama 3.1 8B

Ragionamento Phi-4 14B

Modello a confronto

Casi d'uso consigliati

Dialogo multilingue

Analisi di documenti lunghi

Programmazione e sviluppo

Analisi visiva

Sicurezza e conformità

Impieghi leggeri e a bordo