En Docker-image. Från en server till Kubernetes.
Samma tjänst kör överallt, en enda Docker-image i olika roller. Börja med Docker Compose på en server, skala de tunga delarna var för sig och flytta till Kubernetes när ni växer. Allt på er egen infrastruktur.
Samma Docker-image, flera roller
ghcr.io/oddly-even/ladan kör som webbserver eller som någon av kö-arbetarna. Orkestratorn väljer rollen via kommandot. Inget separat bygge per komponent, ingen specialhantering.
app tar emot trafik (gränssnitt, REST, MCP). Arbetarna betar av varsin kö och tar aldrig emot inkommande trafik. En engångs-migrate kör schemamigreringar och avslutar.
Behöver ni service och ingress? Endast runt app. Behöver ni Postgres, Redis och S3? Använd de medföljande eller ange egna tjänster: AWS S3, Cloudflare R2, Backblaze B2 eller MinIO.
Skala de mest belastade delarna separat
Lasten kommer från två köer: crawl och file-ingest. Resten har låg kostnad, körs sällan eller startas manuellt. Total kapacitet är repliker × samtidighet, och båda styrs av miljövariabler och replikantal. Ingen kodändring.
- Sök mot lasten. Endast
crawlochfile-ingestdimensioneras mot arbetsmängd. Reconcile, migrate och eval är sällan flaskhalsen. - Två styrmedel. Fler repliker av en arbetare, eller högre samtidighet per process. Ingen ny kod, endast miljövariabler och replikantal.
- Väx med behovet. Börja med
worker-alli ett paket, byt till separata arbetar-containrar när en kö behöver skalas separat.
Vet exakt vad som kostar.
Ladan mäter kostnad i två tydligt åtskilda lager, så ni kan svara på både "vad kostar modellanropen?" och "vad kostar driften?".
- Modellkostnad. Varje anrop till språk- och inbäddningsmodeller bokförs med pris i modellens valuta, er kostnad på era egna nycklar.
- Driftfotavtryck. Databasens storlek och objektlagringens byte, det som växer med varje genomsökning och uppladdning.
- De största posterna syns. Sökindex, textindex och vektortabeller redovisas var för sig, så ni ser vad som faktiskt tar plats.
- Budgettak. Tak över ett rullande 30-dagarsfönster, totalt eller per modelltyp och valuta. Varning vid 80 procent, stopp vid taket, och varje ändring av taken hamnar i granskningsloggen.
Igång på er infrastruktur, eller på vår.
Klona och skala själv, eller låt Oddly Even drifta en dedikerad instans åt er. Samma datasuveränitet, utan att ni sköter driften.