Anthropic en OpenAI brengen hun AI-oorlog naar wetenschappelijk onderzoek

  • Anthropic lanceert Claude Science, een AI-werkbank verbonden met 60+ wetenschappelijke databases.
  • OpenAI lanceert GeneBench-Pro, een benchmark voor AI-oordeel in computationele biologie.
  • OpenAI’s beste model haalde slechts 28,7% van GeneBench-Pro’s biologieproblemen.
Promo

Anthropic en OpenAI hebben op dinsdag allebei hun concurrentiestrijd uitgebreid naar wetenschappelijk onderzoek. Anthropic lanceerde Claude Science, een AI-werkbank voor onderzoekers. OpenAI bracht GeneBench-Pro uit, een benchmark voor computationele biologie.

De lanceringen op dezelfde dag brengen de AI-wedloop verder dan alleen chatbots en coderen, richting laboratoriumwerk. Het ene bedrijf kwam met een hulpmiddel dat wetenschappers nu kunnen gebruiken. Het andere bedrijf introduceerde een meetlat om te bepalen hoever de technologie nog te gaan heeft.

Gesponsord
Gesponsord

Wat doet Claude Science van Anthropic

Claude Science combineert de databases, code en rekenkracht die wetenschappers gebruiken in één app. Het verbindt meer dan 60 wetenschappelijke databases op het gebied van genomica, proteomica en cheminformatica.

Claude Science is een app, geen nieuw model. Het wordt uitgebracht terwijl de krachtigste Fable 5- en Mythos 5-modellen van Anthropic beperkt blijven vanwege exportregels in de VS. Elk resultaat is controleerbaar en altijd te herleiden naar de code die het produceerde.

De werkbank bouwt voort op Anthropic’s focus op life sciences die in oktober 2025 begon. Tijdens de bèta wist Jérôme Lecoq van het Allen Institute recensies, die eerder tot twee jaar duurden, terug te brengen tot korte samenvattingen.

Anthropic gaat ook tot 50 onderzoeksprojecten sponsoren, elk met tot $30.000 aan credits.

OpenAI zet de standaard hoger met GeneBench-Pro

Kort na de release van Claude Science bracht OpenAI GeneBench-Pro uit. Deze benchmark test of AI-agenten de lastige keuzes kunnen maken die biomedisch onderzoek vereist.

De benchmark bevat 129 problemen uit de genomica, kwantitatieve biologie en translationele geneeskunde.

Het krachtigste model van OpenAI, GPT-5.6 Sol, loste 28,7% van de problemen op het hoogste redeneerniveau op. In Pro-modus stijgt dat naar 31,5%. De eerdere gefaseerde release van GPT-5.6 gebeurde op verzoek van Washington.

GPT-5 scoorde minder dan 5% op het originele GeneBench, terwijl de Opus 4.8 van Anthropic 16% haalde op de moeilijkere test.

Gesponsord
Gesponsord

Volg ons op X voor het laatste nieuws terwijl het gebeurt.

Twee strategieën, één race

De splitsing laat twee routes naar hetzelfde doel zien. Anthropic levert een product dat meteen in het lab te gebruiken is. OpenAI meet hoe betrouwbaar modellen door ongestructureerde data kunnen redeneren.

Beide lanceringen komen ook terwijl Chinese AI-modellen steeds sterker worden in wetenschappelijk onderzoek. De cijfers van OpenAI zelf temperen de hype, want hun beste model faalt nog op de meeste GeneBench-Pro-taken.

De druk is zowel geopolitiek als wetenschappelijk. Amerikaanse exportbeperkingen hebben Anthropic er al toe aangezet om nieuwe landen als standplaats voor hun modellen te overwegen.

Beoordelaars schatten dat elke GeneBench-Pro-opgave een menselijke expert 20 tot 40 uur zou kosten, met kosten van duizenden dollars. OpenAI zegt dat hun model diezelfde analyse voor een paar dollar kan uitvoeren.

Aubrey de Grey, biomedisch gerontoloog, ziet AI nu al de grootste knelpunten in onderzoek oplossen, ook al duurt het langer voor bredere vooruitgang zichtbaar wordt.

“Wat we heel snel gaan zien, is dat AI bepaalde delen van het proces, vooral de ontwikkeling van medicijnen, niet langer tot een knelpunt maakt,” zei Aubrey de Grey, voorzitter en hoofdwetenschapper van de Longevity Escape Velocity Foundation, in een BeInCrypto-podcast.

Gesponsord
Gesponsord

De Grey waarschuwde dat het sneller doen van onderzoek niet automatisch betekent dat behandelingen ook sneller worden goedgekeurd – dat hangt af van regelgeving en de tolerantie voor risico’s in de samenleving.

Onderzoekers verwachten snellere adoptie

Sommige specialisten vinden dat de omslag nu al gaande is. Dr. Derya Unutmaz, hoogleraar immunologie, vertelde in hetzelfde BeInCrypto-panel dat AI hem inmiddels zelfs beter helpt dan zijn eigen beoordelingsvermogen.

“Ik vertrouw persoonlijk meer op AI dan op mijn eigen inzichten in mijn vakgebied van 35 jaar.”

Hij verwacht dat deze manier van werken snel in de klinische praktijk zal verspreiden.

“Het is onethisch en ik denk dat het heel snel zelfs medische wanpraktijk zal zijn om géén AI in de geneeskunde te gebruiken.”

Dat optimisme loopt nog iets vooruit op de benchmarks. De komende maanden zullen uitwijzen of wetenschappers deze tools gaan gebruiken en of de GeneBench-Pro-scores ook gaan stijgen.


Om de nieuwste analyse van de cryptomarkt van BeInCrypto te lezen, klik hier.

Disclaimer

Alle informatie op onze website wordt te goeder trouw en uitsluitend voor algemene informatiedoeleinden gepubliceerd. Elke actie die de lezer onderneemt op basis van de informatie op onze website is strikt op eigen risico.

Gesponsord
Gesponsord