Modeller·3. april 2026·1 min lesing

Alibabas Qwen3.6-Plus tar opp kampen om agentisk AI

1 million tokens kontekst, topp på Terminal-Bench — og kompatibel med Claude Code. Kina leverer.

Av Redaksjonen

Alibabas Qwen3.6-Plus tar opp kampen om agentisk AI

Begreper i denne artikkelen

BenchmarkStandardisert test for å måle og sammenligne ytelsen til AI-modeller på bestemte oppgaver.

Context windowMengden tekst en AI-modell kan prosessere i én forespørsel. Måles i tokens.

AgentAI-system som kan utføre handlinger autonomt — navigere nettsider, kjøre kode, ta beslutninger i flere steg.

Open source AIAI-modeller der kode og/eller vekter er offentlig tilgjengelige, slik at hvem som helst kan bruke og forbedre dem.

Ytelse på tvers av benchmarks

Alibaba lanserte Qwen3.6-Plus 2. april. Modellen scorer 78,8 på benchmark-en SWE-bench Verified — bak Claude Opus 4.5 (80,9) men foran Kimi-K2.5 (76,8) og GLM5 (77,8), ifølge Alibaba Cloud. På Terminal-Bench 2.0, som måler komplekse terminaloperasjoner og automatisert oppgaveutførelse, leder Qwen3.6-Plus med 61,6 — over Opus 4.5 (59,3). GPQA-scoren på 90,4 er den høyeste blant alle testede modeller, rapportert av Dataconomy.

Tallene plasserer Qwen3.6-Plus i toppsjiktet globalt. Ikke på topp overalt — men konkurransedyktig på hver enkelt test.

Agentisk arkitektur

Modellen støtter 1 million context window-tokens som standard, ifølge Alibaba. Det gir kapasitet til å prosessere store kodebaser i én operasjon. Ifølge Alibabas tekniske blogg kan den tolke UI-skjermbilder og håndtegnede wireframes for å generere funksjonell frontend-kode — en multimodal kapasitet rettet mot produktteam og designere.

Qwen3.6-Plus integreres i Wukong, Alibabas enterprise-plattform for agent-arbeidsflyter (for øyeblikket i lukket beta). Den er også kompatibel med tredjepartsverktøy som Claude Code, Cline og OpenClaw, ifølge Caixin og Seeking Alpha.

Hva dette betyr

For utviklere utenfor Kina er kompatibiliteten med vestlige kodeverktøy det viktigste. En kinesisk open source AI-modell som kjører via Claude Code er et konkret alternativ — ikke bare en benchmark-øvelse. Deler av Qwen3.6-serien forblir åpen kildekode i utviklervennlige størrelser.

Alibaba har lansert tre modeller på under en uke, ifølge The Decoder. Tempoet signaliserer at den kinesiske AI-fronten ikke bremser — den akselererer. For norske team som allerede bruker Claude Code eller Cline, er Qwen3.6-Plus verdt å teste på repository-oppgaver der det lange kontekstvinduet gir en reell fordel over modeller med 200K-begrensning.

Kilder

Relaterte artikler

Modeller

Claude Opus 5: halve prisen av Fable 5, nesten samme resultat

24. juli 2026

Modeller

Qwen3.8-Max: Alibabas svar på Kimi K3 kom på tre døgn

19. juli 2026

Modeller

Kimi K3: verdens største åpne modell er ikke billig lenger

16. juli 2026

Alibabas Qwen3.6-Plus tar opp kampen om agentisk AI

1 million tokens kontekst, topp på Terminal-Bench — og kompatibel med Claude Code. Kina leverer.

Av Redaksjonen

Begreper i denne artikkelen

BenchmarkStandardisert test for å måle og sammenligne ytelsen til AI-modeller på bestemte oppgaver.

Context windowMengden tekst en AI-modell kan prosessere i én forespørsel. Måles i tokens.

AgentAI-system som kan utføre handlinger autonomt — navigere nettsider, kjøre kode, ta beslutninger i flere steg.

Open source AIAI-modeller der kode og/eller vekter er offentlig tilgjengelige, slik at hvem som helst kan bruke og forbedre dem.

Ytelse på tvers av benchmarks

Tallene plasserer Qwen3.6-Plus i toppsjiktet globalt. Ikke på topp overalt — men konkurransedyktig på hver enkelt test.