Loading…
Onwinds is een OpenAI‑compatibele gateway voor teams en productiesystemen. Je organisatie stuurt modellen, routing, governance en spend centraal aan, en gebruikers en apps delen hetzelfde control‑plane.
Onwinds exposeert drie publieke endpoints. Ze zijn OpenAI‑compatibel, dus bestaande SDK’s werken met alleen een base‑URL wissel.
geeft de logische modellen van de tenant terug.
ondersteunt streaming en dwingt policy + spend af voordat tokens doorlopen.
routeert embeddings via je allowlist en factureert deterministisch.
Gebruik je Onwinds‑API‑key met een standaard OpenAI‑client. Zet de base‑URL op .
Governance wordt per request afgedwongen. Gebruik deze headers om EU‑only routing en een strengere retention‑houding af te dwingen.
Zet op om een EU‑conforme route te eisen. Als er geen EU‑route bestaat, wordt het request niet uitgevoerd (fail‑closed).
Zet op om Zero Data Retention te vragen voor Onwinds‑logging, met behoud van billing‑metadata.
curl https://api.onwinds.com/v1/chat/completions \
-H "Authorization: Bearer ow_…" \
-H "Content-Type: application/json" \
-H "x-onwinds-region-required: eu" \
-H "x-onwinds-retention-mode: zdr" \
-d '{"model":"gpt-5-mini","stream":true,"max_tokens":256,"messages":[{"role":"user","content":"Write a concise incident update."}]}'Embeddings zijn tenant‑gebonden. Gebruik het embeddings‑endpoint met het logische model `onwinds/embeddings`.
Bekijk de logische modellen die je tenant heeft ingeschakeld en allowlisted.
Requests worden altijd uitgevoerd in tenant‑context. API‑keys zijn tenant‑gebonden en de gateway bepaalt context server‑side; clients geven geen tenant‑IDs mee.
Gebruikers melden zich aan in de workspace en het platform past automatisch organisatie‑policy toe (allowed models, governance en spend).
Apps gebruiken een API‑key op de OpenAI‑compatibele endpoints. Elk request wordt deterministisch toegeschreven en gefactureerd.
Onwinds retourneert gestructureerde errors en voegt request‑identifiers toe om failures deterministisch te debuggen.
Bij fouten ontvang je een machine‑leesbare en (waar beschikbaar) een .
Responses bevatten request‑identifiers (bijv. via / ) zodat incidenten zonder giswerk te debuggen zijn.