Två nya AI-modeller utmanar DeepSeks dominans

Det har länge varit en självklarhet att DeepSeek är en av de främsta aktörerna inom området för AI med öppen källkod. Nu blåser det dock nya vindar, och två imponerande språkmodeller har dykt upp som utmanare. Vi talar om modeller från Allen Institute for AI och Alibaba. Dessa två kraftpaket kan mycket väl komma att skaka om den nuvarande AI-scenen.

Allen Institute for AI lanserar Tülu 3

Allen Institute for AI, en amerikansk forskningsorganisation, har presenterat en ny version av deras språkmodell, Tülu 3. Modellen har en enorm kapacitet med 405 miljarder parametrar. Den är dessutom öppen källkod, vilket gör den tillgänglig för alla. Projektet krävde enorma datorkraft, då 32 noder med 256 GPU:er arbetade tillsammans under utvecklingen. Teamet som byggde modellen mötte en del utmaningar under arbetet. Systemkrascher var något de fick hantera och krävde konstant uppmärksamhet.

Tülu 3:s verkliga innovation ligger i det nya träningssystemet, Reinforcement Learning with Verifiable Rewards (RLVR). Det här systemet ger modellen omedelbar feedback på om svaren är korrekta, vilket resulterar i väldigt hög precision vid matematiska och logiska uppgifter. Det är dock värt att notera att modellen inte presterar lika bra i uppgifter som kräver kreativt skrivande, rollspel eller faktakontroll.

Modellen är tillgänglig via Allen AI:s plattform och har ett gränssnitt som påminner om ChatGPT. Tester visar att Tülu 3 är en mästare på att lösa problem inom matematik och naturvetenskap genom logiskt tänkande. Den brister dock något när det gäller språkrelaterade logiska uppgifter. Tülu 3 är inte multimodal, vilket innebär att den bara kan generera text. Modellen går att ladda ner via Hugging Face, i olika storlekar från 8 miljarder till 405 miljarder parametrar.

Alibaba släpper Qwen 2.5-Max

Samtidigt som Allen Institute presenterade sin modell, har Alibaba lanserat Qwen 2.5-Max. Denna imponerande språkmodell har tränats på över 20 biljoner tokens. I jämförande tester har det visat sig att Qwen 2.5-Max presterar bättre än DeepSeek V3. Det gäller särskilt inom områden som kodning, matematik, logiskt resonemang och allmän kunskap. Modellen har även visat sig vara konkurrenskraftig mot andra ledande modeller som GPT-4 och Claude 3.5.

Modellen är tillgänglig via Alibabas molnplattform med ett API som är kompatibelt med OpenAI. Alibabas Qwen Chat webportal erbjuder också ett användarvänligt alternativ för allmänheten. Portalen har funktioner för att skapa text, kod, bilder och videor. En intressant detalj är möjligheten att låta två olika modeller ”tävla” mot varandra för att hitta det bästa svaret. Qwen 2.5-Max är särskilt bra på kreativa skrivuppgifter och resonemangsuppgifter där språkanalys är viktigt. Den är även mer effektiv på dessa uppgifter jämfört med Tülu 3.

En betydande boost för öppen källkod AI

Lanseringarna av DeepSeek, Qwen 2.5-Max och Tülu 3 markerar ett stort framsteg för öppen källkod AI. DeepSeks tidigare användning av Qwens struktur visade att AI med öppen källkod kan konkurrera med de stora aktörerna utan att kosta skjortan. Tülu 3 har potential att bli ett bra alternativ till dyrare modeller som OpenAIs kommande o3-modell.

Relaterat

Från Vision till Kod: Hitta de Bästa Utvecklarna för Din Startup

En guide för startups om hur man hittar och anställer de bästa utvecklarna. Lär dig om viktiga färdigheter, var man ska leta och hur man behåller topptalanger.

AI:s påverkan på arbetsmarknaden: 41% av företagen minskar personalen

En djupgående analys av hur AI-utvecklingen påverkar arbetsmarknaden. Lär dig om vilka jobb som är i riskzonen, hur företag anpassar sig, och hur vi som samhälle kan hantera förändringen.

3 AI Saker Som Förändrar Hur Företag Arbetar

Artificiell intelligens (AI) revolutionerar företagsvärlden genom att möjliggöra kontinuerlig förändring, realtidsinformation och bearbetning av olika datatyper. Lär dig hur AI omdefinierar samarbetet mellan människor och maskiner och skapar nya affärsstrategier.

DeepSeek: Den kinesiska AI-appen som alla pratar om

En kinesisk AI vid namn DeepSeek har snabbt blivit populär och skapat stor uppmärksamhet i teknikvärlden, vilket har lett till oro och ifrågasättande bland investerare och experter.