Unser Large Language Model as a Service (LLMaaS)-Angebot ermöglicht Ihnen den Zugriff auf hochmoderne Sprachmodelle, deren Inferenz mit einer qualifizierten SecNumCloud-Infrastruktur durchgeführt wird, die für das Hosting von Gesundheitsdaten HDS-zertifiziert und damit souverän ist und in Frankreich berechnet wird. Profitieren Sie von einer hohen Leistung und optimaler Sicherheit für Ihre KI-Anwendungen. Ihre Daten bleiben streng vertraulich und werden nach der Verarbeitung weder ausgewertet noch gespeichert.
Katze & Vernunft
Unsere großen Modelle bieten Spitzenleistungen für die anspruchsvollsten Aufgaben. Sie eignen sich besonders für Anwendungen, die ein tiefes Sprachverständnis, komplexes Denken oder die Verarbeitung langer Dokumente erfordern.
qwen3.6:27b
gpt-oss:120b
gpt-oss:20b
llama3.3:70b
gemma3:27b
nemotron-3-super:120b
nemotron3-nano:30b
nemotron-Kaskade:30b
glm-4.7-flash:30b
cogito:32b
Olmo 3:32b
Olmo 3:7b
qwen3-2507:235b
mistral-small3.2:24b
mistral-small4:119b
ministral-3:14b
Ministral-3:8b
ministral-3:3b
qwen3.5:9b
qwen3.5:4b
qwen3.5:0.8b
qwen3:0.6b
qwen3-2507-think:4b
qwen3-omni:30b
Programmierung & Agenten
Unsere Programmier- und Agentenmodelle sind speziell für das agentische Software-Engineering, die groß angelegte Code-Generierung und die Automatisierung von Entwicklungs-Workflows optimiert.
qwen3.6:35b
qwen-coder-next:80b
qwen3-next:80b
devstral-small-2:24b
rnj-1:8b
functiongemma:270m
Vision & Multimodal
Unsere Vision & Multimodal-Modelle ermöglichen die Analyse von Bildern, Videos und visuellen Dokumenten. Sie zeichnen sich durch OCR, Objekterkennung, strukturierte Extraktion und räumlich-zeitliche Argumentation aus.
qwen3-vl:235b
qwen3-vl:32b
qwen3-vl:30b
qwen3-vl:8b
qwen3-vl:4b
qwen3-vl:2b
gemma4:31b
gemma4:e2b
gemma4:e4b
granite3.2-vision:2b
deepseek-ocr
Einbetten
Unsere Einbettungsmodelle wandeln Text in Vektordarstellungen für die semantische Suche, das Clustering und RAG-Pipelines (Retrieval-Augmented Generation) um.
bge-m3:567m
qwen3-Einbettung:4b
qwen3-Einbettung:8b
qwen3-Einbettung: 0.6b
granite-embedding:278m
embeddinggemma:300m
Reranking
Unsere Reranking-Modelle ordnen die Suchergebnisse nach Relevanz neu an, um die Qualität der RAG-Pipelines zu verfeinern. Kompatibel mit der Cohere API.
nvidia/llama-nemotron-rerank-vl-1b-v2
qwen3-reranker:4b
qwen3-reranker:0.6b
bge-reranker-large
Sicherheit
Unsere Sicherheitsmodelle sind auf die Erkennung problematischer Inhalte, die Verhinderung von Jailbreaks und die Einhaltung gesetzlicher Vorschriften (RGPD, HDS) spezialisiert. Sie können als Vorfilter oder Nachfilter in Ihren Workflows verwendet werden.
granite3-guardian:8b
granite3-guardian:2b
Übersetzung
Unsere Übersetzungsvorlagen bieten hohe Wiedergabetreue für 55 Sprachen, wobei Grammatik, kulturelle Nuancen und technische Besonderheiten der Dokumente berücksichtigt werden.
translategemma:27b
translategemma:12b
translategemma:4b
Audio & Bild
Unsere Audio- & Bildvorlagen ermöglichen Sprachtranskription in Echtzeit (ASR-Streaming) und die Generierung von Bildern aus textuellen Beschreibungen, die mit der OpenAI-API kompatibel sind.
voxtral
z-Bild:16b
Vergleich der Modelle
Diese Vergleichstabelle hilft Ihnen bei der Auswahl des für Sie am besten geeigneten Modells anhand verschiedener Kriterien wie Kontextgröße, Leistung und spezifische Anwendungsfälle.
| Modell | Herausgeber | Einstellungen | Kontext (k tokens) | Vision | Agent | Argumentation | Sicherheit | Schnell * | Energieeffizienz * |
|---|---|---|---|---|---|---|---|---|---|
| Katze & Vernunft | |||||||||
| qwen3.6:27b | Qwen Team | 27B | 1000000 | ||||||
| gpt-oss:120b | OpenAI | 120B | 120000 | ||||||
| gpt-oss:20b | OpenAI | 20B | 120000 | ||||||
| llama3.3:70b | Meta | 70B | 132000 | ||||||
| gemma3:27b | 27B | 120000 | |||||||
| nemotron-3-super:120b | NVIDIA | 120B | 1000000 | ||||||
| nemotron3-nano:30b | NVIDIA | 30B | 1000000 | ||||||
| nemotron-Kaskade:30b | NVIDIA | 30B | 1000000 | ||||||
| glm-4.7-flash:30b | Zhipu AI | 30B | 120000 | ||||||
| cogito:32b | Deep Cogito | 32B | 32000 | ||||||
| Olmo 3:32b | AllenAI | 32B | 65536 | ||||||
| Olmo 3:7b | AllenAI | 7B | 65536 | ||||||
| qwen3-2507:235b | Qwen Team | 235B | 200000 | ||||||
| mistral-small3.2:24b | Mistral AI | 24B | 128000 | ||||||
| mistral-small4:119b | Mistral AI | 119B | 262144 | ||||||
| ministral-3:14b | Mistral AI | 14B | 250000 | ||||||
| Ministral-3:8b | Mistral AI | 8B | 250000 | ||||||
| ministral-3:3b | Mistral AI | 3B | 250000 | ||||||
| qwen3.5:9b | Qwen Team | 9B | 250000 | ||||||
| qwen3.5:4b | Qwen Team | 4B | 250000 | ||||||
| qwen3.5:0.8b | Qwen Team | 0.8B | 250000 | ||||||
| qwen3:0.6b | Qwen Team | 0.6B | 40000 | ||||||
| qwen3-2507-think:4b | Qwen Team | 4B | 250000 | ||||||
| qwen3-omni:30b | Qwen Team | 30B | 32768 | ||||||
| Programmierung & Agenten | |||||||||
| qwen3.6:35b | Qwen Team | 35B | 1000000 | ||||||
| qwen-coder-next:80b | Qwen Team | 80B | 250000 | ||||||
| qwen3-next:80b | Qwen Team | 80B | 250000 | ||||||
| devstral-small-2:24b | Mistral AI & All Hands AI | 24B | 200000 | ||||||
| rnj-1:8b | Essential AI | 8B | 32000 | ||||||
| functiongemma:270m | 270 Mio. | 32768 | |||||||
| Vision & Multimodal | |||||||||
| qwen3-vl:235b | Qwen Team | 235B | 200000 | ||||||
| qwen3-vl:32b | Qwen Team | 32B | 250000 | ||||||
| qwen3-vl:30b | Qwen Team | 30B | 250000 | ||||||
| qwen3-vl:8b | Qwen Team | 8B | 250000 | ||||||
| qwen3-vl:4b | Qwen Team | 4B | 250000 | ||||||
| qwen3-vl:2b | Qwen Team | 2B | 250000 | ||||||
| gemma4:31b | 31B | 250000 | |||||||
| gemma4:e2b | 31B (E2B) | 128000 | |||||||
| gemma4:e4b | 31B (E4B) | 128000 | |||||||
| granite3.2-vision:2b | IBM | 2B | 16384 | ||||||
| deepseek-ocr | DeepSeek AI | 3B | 8192 | ||||||
| Einbetten | |||||||||
| bge-m3:567m | BAAI | 567M | 8192 | ||||||
| qwen3-Einbettung:4b | Qwen Team | 4B | 40000 | ||||||
| qwen3-Einbettung:8b | Qwen Team | 8B | 40000 | ||||||
| qwen3-Einbettung: 0.6b | Qwen Team | 0.6B | 32768 | ||||||
| granite-embedding:278m | IBM | 278M | 512 | ||||||
| embeddinggemma:300m | 300M | 2048 | |||||||
| Reranking | |||||||||
| nvidia/llama-nemotron-rerank-vl-1b-v2 | NVIDIA | 1B | 4096 | N.C. | |||||
| qwen3-reranker:4b | Qwen Team | 4B | 4096 | N.C. | |||||
| qwen3-reranker:0.6b | Qwen Team | 0.6B | 4096 | N.C. | |||||
| bge-reranker-large | BAAI | 335M | 512 | N.C. | |||||
| Sicherheit | |||||||||
| granite3-guardian:8b | IBM | 8B | 8192 | ||||||
| granite3-guardian:2b | IBM | 2B | 8192 | ||||||
| Übersetzung | |||||||||
| translategemma:27b | 27B | 120000 | |||||||
| translategemma:12b | 12B | 128000 | |||||||
| translategemma:4b | 4B | 128000 | |||||||
| Audio & Bild | |||||||||
| voxtral | Mistral AI | 4B | 32768 | N.C. | |||||
| z-Bild:16b | Community | 16B | N.C. | ||||||
Empfohlene Anwendungsfälle
Im Folgenden finden Sie einige häufige Anwendungsfälle und die dafür jeweils am besten geeigneten Modelle. Diese Empfehlungen basieren auf der spezifischen Leistung und den Fähigkeiten der einzelnen Modelle.
Mehrsprachiger Dialog
- nemotron-3-super:120b
- qwen3.6:27b
- nemotron3-nano:30b
- gpt-oss:120b
Analyse langer Dokumente
- nemotron-3-super:120b
- qwen3.6:27b
- qwen3-2507:235b
Programmierung und Entwicklung
- qwen3.6:35b
- qwen-coder-next:80b
- devstral-small-2:24b
- nemotron-3-super:120b
Visuelle Analyse
- qwen3-vl:235b
- gemma4:31b
- deepseek-ocr
- qwen3-vl:30b
Sicherheit und Compliance
- granite3-guardian:8b
- granite3-guardian:2b
- mistral-small4:119b
Leichte Bereitstellungen
- qwen3.5:0.8b
- qwen3-vl:2b
- ministral-3:3b
RAG (Retrieval-Augmented Generation)
- bge-m3:567m
- nvidia/llama-nemotron-rerank-vl-1b-v2
- qwen3.6:27b