Skip to main content
    Zum Hauptinhalt springenZur Navigation springenZur Fußzeile springen
    Technologie

    Replicate

    Aktualisiert: 11.2.2026

    Cloud-Plattform für das Hosten und Ausführen von Open-Source-ML-Modellen via API mit Cog-Packaging.

    Kurz erklärt

    Replicate hostet Open-Source-ML-Modelle als One-Line-APIs – Stable Diffusion, LLaMA & Co. ohne eigene GPU-Infrastruktur.

    Erklärung

    Replicate ermöglicht das Ausführen populärer Open-Source-Modelle (Stable Diffusion, LLaMA, Whisper) über einfache API-Calls. Eigene Modelle werden mit Cog (Docker-Wrapper) paketiert. Pay-per-Second-Billing.

    Relevanz für Marketing

    Replicate ist die einfachste Art, Open-Source-ML-Modelle ohne eigene GPU-Infrastruktur zu nutzen.

    Häufige Fallstricke

    Cold Starts bei selten genutzten Modellen. Per-Second-Kosten können bei hohem Volume steigen. Weniger Kontrolle als Self-Hosting.

    Entstehung & Geschichte

    Ben Firshman und Andreas Jansson gründeten Replicate 2019. Cog (Open-Source-Container-Format) wurde 2021 veröffentlicht. Die Plattform profitierte stark vom Generative-AI-Boom 2023 und hostet tausende populäre Modelle.

    Abgrenzung & Vergleiche

    Replicate vs. Hugging Face Inference API

    HF bietet Community-Hub und Transformers-Ökosystem; Replicate fokussiert auf einfaches API-basiertes Model Hosting mit Cog.

    Replicate vs. Modal

    Modal ist eine allgemeine GPU-Compute-Plattform; Replicate ist spezialisiert auf Model-Hosting mit vorgefertigten Modellen.

    Verwandte Services

    Verwandte Begriffe

    Model ServingHugging FaceGPU ComputingInference API
    👋Fragen? Chatte mit uns!