Ladan · Produktsida Drift & skalning

En Docker-image. Från en server till Kubernetes.

Samma tjänst kör överallt, en enda Docker-image i olika roller. Börja med Docker Compose på en server, skala de tunga delarna var för sig och flytta till Kubernetes när ni växer. Allt på er egen infrastruktur.

En Docker-image, flera roller Compose · Kubernetes · Fly · Railway Egen Postgres · Redis · S3
Distribution

Samma Docker-image, flera roller

ghcr.io/oddly-even/ladan kör som webbserver eller som någon av kö-arbetarna. Orkestratorn väljer rollen via kommandot. Inget separat bygge per komponent, ingen specialhantering.

app tar emot trafik (gränssnitt, REST, MCP). Arbetarna betar av varsin kö och tar aldrig emot inkommande trafik. En engångs-migrate kör schemamigreringar och avslutar.

app worker-crawl worker-files worker-reconcile worker-migrate worker-eval worker-exec worker-all migrate

Behöver ni service och ingress? Endast runt app. Behöver ni Postgres, Redis och S3? Använd de medföljande eller ange egna tjänster: AWS S3, Cloudflare R2, Backblaze B2 eller MinIO.

Skalning

Skala de mest belastade delarna separat

Lasten kommer från två köer: crawl och file-ingest. Resten har låg kostnad, körs sällan eller startas manuellt. Total kapacitet är repliker × samtidighet, och båda styrs av miljövariabler och replikantal. Ingen kodändring.

  • Sök mot lasten. Endast crawl och file-ingest dimensioneras mot arbetsmängd. Reconcile, migrate och eval är sällan flaskhalsen.
  • Två styrmedel. Fler repliker av en arbetare, eller högre samtidighet per process. Ingen ny kod, endast miljövariabler och replikantal.
  • Väx med behovet. Börja med worker-all i ett paket, byt till separata arbetar-containrar när en kö behöver skalas separat.
Kostnad & mätning

Vet exakt vad som kostar.

Ladan mäter kostnad i två tydligt åtskilda lager, så ni kan svara på både "vad kostar modellanropen?" och "vad kostar driften?".

  • Modellkostnad. Varje anrop till språk- och inbäddningsmodeller bokförs med pris i modellens valuta, er kostnad på era egna nycklar.
  • Driftfotavtryck. Databasens storlek och objektlagringens byte, det som växer med varje genomsökning och uppladdning.
  • De största posterna syns. Sökindex, textindex och vektortabeller redovisas var för sig, så ni ser vad som faktiskt tar plats.
  • Budgettak. Tak över ett rullande 30-dagarsfönster, totalt eller per modelltyp och valuta. Varning vid 80 procent, stopp vid taket, och varje ändring av taken hamnar i granskningsloggen.
Drift

Igång på er infrastruktur, eller på vår.

Klona och skala själv, eller låt Oddly Even drifta en dedikerad instans åt er. Samma datasuveränitet, utan att ni sköter driften.