Alibabas Qwen3.6-Plus tar opp kampen om agentisk AI
1 million tokens kontekst, topp på Terminal-Bench — og kompatibel med Claude Code. Kina leverer.

Begreper i denne artikkelen
Ytelse på tvers av benchmarks
Alibaba lanserte Qwen3.6-Plus 2. april. Modellen scorer 78,8 på benchmark-en SWE-bench Verified — bak Claude Opus 4.5 (80,9) men foran Kimi-K2.5 (76,8) og GLM5 (77,8), ifølge Alibaba Cloud. På Terminal-Bench 2.0, som måler komplekse terminaloperasjoner og automatisert oppgaveutførelse, leder Qwen3.6-Plus med 61,6 — over Opus 4.5 (59,3). GPQA-scoren på 90,4 er den høyeste blant alle testede modeller, rapportert av Dataconomy.
Tallene plasserer Qwen3.6-Plus i toppsjiktet globalt. Ikke på topp overalt — men konkurransedyktig på hver enkelt test.
Agentisk arkitektur
Modellen støtter 1 million context window-tokens som standard, ifølge Alibaba. Det gir kapasitet til å prosessere store kodebaser i én operasjon. Ifølge Alibabas tekniske blogg kan den tolke UI-skjermbilder og håndtegnede wireframes for å generere funksjonell frontend-kode — en multimodal kapasitet rettet mot produktteam og designere.
Qwen3.6-Plus integreres i Wukong, Alibabas enterprise-plattform for agent-arbeidsflyter (for øyeblikket i lukket beta). Den er også kompatibel med tredjepartsverktøy som Claude Code, Cline og OpenClaw, ifølge Caixin og Seeking Alpha.
Hva dette betyr
For utviklere utenfor Kina er kompatibiliteten med vestlige kodeverktøy det viktigste. En kinesisk open source AI-modell som kjører via Claude Code er et konkret alternativ — ikke bare en benchmark-øvelse. Deler av Qwen3.6-serien forblir åpen kildekode i utviklervennlige størrelser.
Alibaba har lansert tre modeller på under en uke, ifølge The Decoder. Tempoet signaliserer at den kinesiske AI-fronten ikke bremser — den akselererer. For norske team som allerede bruker Claude Code eller Cline, er Qwen3.6-Plus verdt å teste på repository-oppgaver der det lange kontekstvinduet gir en reell fordel over modeller med 200K-begrensning.
Relaterte artikler


