
Begreper i denne artikkelen
USA: OpenAI (GPT-5.4), Anthropic (Claude Opus), Google (Gemini), Meta (Llama) — brikker: Nvidia Kina: DeepSeek, Alibaba (Qwen), ByteDance — brikker: Huawei Ascend Pil mellom kolonnene markert "Prispress ↓" Nøkkeltall: "2,6M vs 30,8M GPU-timer (treningseffektivitet)"
I desember 2024 lanserte DeepSeek R1 — en resonneringsmodell trent til en brøkdel av kostnadene til vestlige konkurrenter. Markedet reagerte som om noen hadde avfyrt et varselskudd. Nvidia-aksjen falt. Investorer begynte å stille spørsmål ved antagelsen om at AI-dominans krever ubegrensede budsjetter.
Femten måneder senere er den kinesiske AI-sektoren ikke lenger et varselskudd. Den er et alternativt økosystem.
Modellene
Tre kinesiske aktører leverer frontier-nære modeller i 2026.
DeepSeek fortsetter å presse grensene for hva som er mulig med begrenset compute. V3-modellen brukte 2,6 millioner GPU-timer mot Llama 3 405Bs 30,8 millioner — en størrelsesorden forbedring i treningseffektivitet. R1 matchet OpenAIs o1 på de fleste benchmarks til anslagsvis 3 % av kostnadene. Innovasjonene inkluderer FP8 mixed-precision trening, Multi-Head Latent Attention som reduserer KV-cache med 93,3 %, og Group Relative Policy Optimization som halverer RL-kostnadene. DeepSeek V4 — forventet i Q2 2026 — sikter mot 1 billion totale parametere med 32B aktive, nativ multimodalitet og 1M-tokens kontekstvindu, trent på Huawei Ascend-brikker i stedet for Nvidia.
Alibabas Qwen-team lanserte 3.5-serien i februar med modeller fra 0,8B til 397B parametere. 397B-A17B bruker Mixture-of-Experts og aktiverer bare 17 milliarder parametere per forespørsel. Flaggskipet scorer 88,4 på GPQA Diamond — høyere enn alle andre Open source AI-modeller. Alle er tilgjengelige med permissive lisenser. 9B-modellen gir kapabel ytelse på en vanlig laptop uten dedikert GPU.
ByteDances modeller er mindre synlige internasjonalt men brukes massivt i Kinas interne marked — i TikTok, i e-handel, i innholdsproduksjon. Selskapets investering i Huawei-brikker (rapportert over 5,6 milliarder dollar i 2026) signaliserer et strategisk skifte mot innenlandsk infrastruktur.
Brikkene
Pris: ~$6 900 (DDR) / ~$9 660 (HBM) vs. ~$30 000+ CUDA-kompatibilitet: CANN Next (SIMT) vs. Nativ Hovedstyrke: Inference vs. Training + Inference Planlagt volum 2026: 750 000 vs. Begrenset i Kina (eksportkontroll) Masseproduksjon: April 2026 vs. Tilgjengelig
Huawei sikter på å levere 750 000 enheter av Ascend 950PR-prosessoren i 2026, med masseproduksjon fra april og fullskala leveranser i andre halvår. ByteDance og Alibaba planlegger begge å legge inn ordrer, ifølge Reuters. Standardversjonen med DDR-minne prises til omtrent 50 000 yuan ($6 900) per kort, mens en premiumversjon med HBM-minne koster rundt 70 000 yuan.
Den viktigste egenskapen er CUDA-kompatibilitet. Huaweis nye CANN Next-programvarestakk introduserer en SIMT-programmeringsmodell med thread blocks, warps og kernel launches — tilnærmet identisk med CUDAs modell. Tidligere kinesiske brikker krevde at labber omskrev hele programvarestakken. 950PR lar utviklere migrere eksisterende modeller med betydelig lavere friksjon.
Brikken tilbyr bare en marginal forbedring i rå regnekraft sammenlignet med forgjengeren 910C, men den er optimalisert for Inference-arbeidsbelastninger — prosessen med å kjøre ferdige AI-modeller for å besvare spørsmål eller utføre oppgaver. Det er en bevisst posisjonering: Kinas AI-sektor skifter fokus fra modellutvikling til reell deployment, en trend akselerert av rask adopsjon av åpne AI-agenter.
Hvis disse enhetene leveres i planlagt volum, har Kina en reell egen AI-infrastruktur som ikke er avhengig av vestlig hardware. Det er den mest betydningsfulle utviklingen i det globale AI-kappløpet siden eksportkontrollene ble innført.
Prispress nedenfra
2023: GPT-4 — $30/$60 per million tokens 2024: GPT-4o — $5/$15 2025: Claude Sonnet — $3/$15 2026: Gemini Flash-Lite — $0,25 / GPT-5.4 — $2,50/$15 / Qwen lokalt — ~$0 Markering: "Kinesiske åpne modeller presser hele prisstrukturen"
Den viktigste konsekvensen av kinesisk AI for resten av verden er ikke geopolitisk — den er økonomisk. Kinesiske modeller setter et pristak som vestlige labber ikke kan ignorere.
Når Qwen 3.5 27B — en åpen modell som kan kjøres lokalt — leverer ytelse som nærmer seg vestlige frontier-modeller, presser det hele priskjeden. MIT Sloan-studien viser at lukkede modeller koster seks ganger mer enn åpne i gjennomsnitt — og at optimal bruk av åpne alternativer kunne spare AI-industrien 25 milliarder dollar årlig. Kina er en av hoveddriverne bak dette prisdeflaterende presset.
Svaret fra vestlige aktører er allerede synlig. Googles Gemini 3.1 Flash-Lite til $0,25 per million input-tokens er et direkte svar. OpenAI har lansert Mini- og Nano-varianter. Anthropic har Claude Haiku for kostnadssensitive arbeidsbelastninger. Prisene beveger seg nedover langs hele spekteret.
For selskaper som bygger AI-produkter er dette positivt uavhengig av geopolitisk posisjon: billigere inferens betyr lavere terskel for AI-drevne tjenester.
Hva det betyr for Norge
For norske selskaper er Kina relevant av to grunner.
Første: kinesiske åpne modeller er et reelt alternativ for mange brukstilfeller. Qwen og DeepSeek kan kjøres lokalt, noe som løser personvernproblematikken under GDPR og den kommende AI-forordningen. De er gratis å bruke. Og de leverer tilstrekkelig kvalitet for klassifisering, oppsummering, oversettelse og enkel kodeassistanse.
Andre: priskonkurransen fra Kina vil presse vestlige API-priser ned, noe som senker kostnadene for alle — uavhengig av hvilken modell du bruker. Epoch AI-data viser at åpne modeller nå ligger tre måneder bak state-of-the-art i stedet for ett år. Det betyr at prisfordelen ved åpne modeller vokser raskere enn kvalitetsgapet krymper.
"Bruke kinesiske åpne modeller lokalt" — Risiko: Lav — Gevinst: Høy "Bruke kinesiske modeller via sky-API" — Risiko: Middels — Gevinst: Middels "Avhengighet av kinesisk hardware" — Risiko: Høy — Gevinst: Lav (for norske selskaper)
Risikoen er at avhengighet av kinesisk utviklet teknologi kan bli politisk og regulatorisk problematisk. EU AI Act stiller krav til dokumentasjon som kan være vanskeligere å oppfylle med modeller der treningsdataene er ugjennomsiktige. Og sanksjonspolitikk kan endre tilgjengeligheten for europeiske aktører.
AI-kappløpet mellom Kina og USA er ikke et nullsumspill. Det er et prispress som kommer alle brukere til gode — med komplikasjoner for de som prøver å bygge varige forretningsmodeller i mellomrommet mellom gratis åpne modeller og dyre frontier-API-er.


