Unser Large Language Model as a Service (LLMaaS)-Angebot ermöglicht Ihnen den Zugriff auf hochmoderne Sprachmodelle, deren Inferenz mit einer qualifizierten SecNumCloud-Infrastruktur durchgeführt wird, die für das Hosting von Gesundheitsdaten HDS-zertifiziert und damit souverän ist und in Frankreich berechnet wird. Profitieren Sie von einer hohen Leistung und optimaler Sicherheit für Ihre KI-Anwendungen. Ihre Daten bleiben streng vertraulich und werden nach der Verarbeitung weder ausgewertet noch gespeichert.
Große Modelle
Unsere großen Modelle bieten Spitzenleistungen für die anspruchsvollsten Aufgaben. Sie eignen sich besonders für Anwendungen, die ein tiefes Sprachverständnis, komplexes Denken oder die Verarbeitung langer Dokumente erfordern.
gemma4:31b
glm-4.7-flash:30b
qwen3-omni:30b
gpt-oss:120b
llama3.3:70b
gemma3:27b
qwen3.6:35b
qwen3.5:35b
qwen3.5:27b
qwen-coder-next:80b
qwen3-next:80b
qwen3-vl:30b
qwen3-vl:32b
Olmo 3:7b
Olmo 3:32b
qwen3-2507:235b
qwen3-vl:235b
ministral-3:14b
cogito:32b
nemotron3-nano:30b
nemotron-Kaskade:30b
nemotron-3-super:120b
Spezialisierte Vorlagen
Unsere spezialisierten Modelle sind für bestimmte Aufgaben wie Code-Generierung, Bildanalyse oder die Verarbeitung strukturierter Daten optimiert. Sie bieten ein hervorragendes Verhältnis von Leistung und Kosten für gezielte Anwendungsfälle.
ministral-3:3b
Ministral-3:8b
functiongemma:270m
granite3.2-vision:2b
qwen3-Einbettung: 0.6b
granite-embedding:278m
qwen3-Einbettung:4b
bge-m3:567m
embeddinggemma:300m
gpt-oss:20b
qwen3-2507-think:4b
rnj-1:8b
qwen3-vl:2b
qwen3-vl:4b
qwen3.5:0.8b
qwen3.5:4b
qwen3.5:9b
qwen3:0.6b
qwen3-vl:8b
devstral-small-2:24b
deepseek-ocr
mistral-small3.2:24b
mistral-small4:119b
translategemma:12b
translategemma:4b
translategemma:27b
voxtral
z-Bild:16b
Vergleich der Modelle
Diese Vergleichstabelle hilft Ihnen bei der Auswahl des für Sie am besten geeigneten Modells anhand verschiedener Kriterien wie Kontextgröße, Leistung und spezifische Anwendungsfälle.
| Modell | Herausgeber | Einstellungen | Kontext (k tokens) | Vision | Agent | Argumentation | Sicherheit | Schnell * | Energieeffizienz * |
|---|---|---|---|---|---|---|---|---|---|
| Große Modelle | |||||||||
| gemma4:31b | 31B | 250000 | |||||||
| glm-4.7-flash:30b | Zhipu AI | 30B | 120000 | ||||||
| qwen3-omni:30b | Qwen Team | 30B | 32768 | ||||||
| gpt-oss:120b | OpenAI | 120B | 120000 | ||||||
| llama3.3:70b | Meta | 70B | 132000 | ||||||
| gemma3:27b | 27B | 120000 | |||||||
| qwen3.6:35b | Qwen Team | 35B | 1000000 | ||||||
| qwen3.5:35b | Qwen Team | 35B | 1000000 | ||||||
| qwen3.5:27b | Qwen Team | 27B | 1000000 | ||||||
| qwen-coder-next:80b | Qwen Team | 80B | 250000 | ||||||
| qwen3-next:80b | Qwen Team | 80B | 250000 | ||||||
| qwen3-vl:30b | Qwen Team | 30B | 250000 | ||||||
| qwen3-vl:32b | Qwen Team | 32B | 250000 | ||||||
| Olmo 3:7b | AllenAI | 7B | 65536 | ||||||
| Olmo 3:32b | AllenAI | 32B | 65536 | ||||||
| qwen3-2507:235b | Qwen Team | 235B | 200000 | ||||||
| qwen3-vl:235b | Qwen Team | 235B | 200000 | ||||||
| ministral-3:14b | Mistral AI | 14B | 250000 | ||||||
| cogito:32b | Deep Cogito | 32B | 32000 | ||||||
| nemotron3-nano:30b | NVIDIA | 30B | 1000000 | ||||||
| nemotron-Kaskade:30b | NVIDIA | 30B | 1000000 | ||||||
| nemotron-3-super:120b | NVIDIA | 120B | 1000000 | ||||||
| Spezialisierte Vorlagen | |||||||||
| ministral-3:3b | Mistral AI | 3B | 250000 | ||||||
| Ministral-3:8b | Mistral AI | 8B | 250000 | ||||||
| functiongemma:270m | 270 Mio. | 32768 | |||||||
| granite3.2-vision:2b | IBM | 2B | 16384 | ||||||
| qwen3-Einbettung: 0.6b | Qwen Team | 0.6B | 32768 | ||||||
| granite-embedding:278m | IBM | 278M | 512 | ||||||
| qwen3-Einbettung:4b | Qwen Team | 4B | 40000 | ||||||
| bge-m3:567m | BAAI | 567M | 8192 | ||||||
| embeddinggemma:300m | 300M | 2048 | |||||||
| gpt-oss:20b | OpenAI | 20B | 120000 | ||||||
| qwen3-2507-think:4b | Qwen Team | 4B | 250000 | ||||||
| rnj-1:8b | Essential AI | 8B | 32000 | ||||||
| qwen3-vl:2b | Qwen Team | 2B | 250000 | ||||||
| qwen3-vl:4b | Qwen Team | 4B | 250000 | ||||||
| qwen3.5:0.8b | Qwen Team | 0.8B | 250000 | ||||||
| qwen3.5:4b | Qwen Team | 4B | 250000 | ||||||
| qwen3.5:9b | Qwen Team | 9B | 250000 | ||||||
| qwen3:0.6b | Qwen Team | 0.6B | 40000 | ||||||
| qwen3-vl:8b | Qwen Team | 8B | 250000 | ||||||
| devstral-small-2:24b | Mistral AI & All Hands AI | 24B | 200000 | ||||||
| deepseek-ocr | DeepSeek AI | 3B | 8192 | ||||||
| mistral-small3.2:24b | Mistral AI | 24B | 128000 | ||||||
| mistral-small4:119b | Mistral AI | 119B | 262144 | ||||||
| translategemma:12b | 12B | 128000 | |||||||
| translategemma:4b | 4B | 128000 | |||||||
| translategemma:27b | 27B | 120000 | |||||||
| voxtral | Mistral AI | 4B | 32768 | N.C. | |||||
| z-Bild:16b | Community | 16B | N.C. | ||||||
Empfohlene Anwendungsfälle
Im Folgenden finden Sie einige häufige Anwendungsfälle und die dafür jeweils am besten geeigneten Modelle. Diese Empfehlungen basieren auf der spezifischen Leistung und den Fähigkeiten der einzelnen Modelle.
Mehrsprachiger Dialog
- nemotron-3-super:120b
- qwen3.6:27b
- nemotron3-nano:30b
- gpt-oss:120b
Analyse langer Dokumente
- nemotron-3-super:120b
- qwen3.6:27b
- qwen3-2507:235b
Programmierung und Entwicklung
- qwen3.6:27b
- qwen3-2507:235b
- qwen-coder-next:80b
- nemotron-3-super:120b
Visuelle Analyse
- qwen3.6:27b
- deepseek-ocr
- qwen3.6:35b
Sicherheit und Compliance
- granite3-guardian:8b
- qwen3.6:27b
- granite3-guardian:2b
Leichte und eingebettete Einsätze
- qwen3.5:0.8b
- qwen3-vl:2b
- ministral-3:3b