Anthropic en OpenAI hebben op dinsdag allebei hun concurrentiestrijd uitgebreid naar wetenschappelijk onderzoek. Anthropic lanceerde Claude Science, een AI-werkbank voor onderzoekers. OpenAI bracht GeneBench-Pro uit, een benchmark voor computationele biologie.
De lanceringen op dezelfde dag brengen de AI-wedloop verder dan alleen chatbots en coderen, richting laboratoriumwerk. Het ene bedrijf kwam met een hulpmiddel dat wetenschappers nu kunnen gebruiken. Het andere bedrijf introduceerde een meetlat om te bepalen hoever de technologie nog te gaan heeft.
Wat doet Claude Science van Anthropic
Claude Science combineert de databases, code en rekenkracht die wetenschappers gebruiken in één app. Het verbindt meer dan 60 wetenschappelijke databases op het gebied van genomica, proteomica en cheminformatica.
Claude Science is een app, geen nieuw model. Het wordt uitgebracht terwijl de krachtigste Fable 5- en Mythos 5-modellen van Anthropic beperkt blijven vanwege exportregels in de VS. Elk resultaat is controleerbaar en altijd te herleiden naar de code die het produceerde.
De werkbank bouwt voort op Anthropic’s focus op life sciences die in oktober 2025 begon. Tijdens de bèta wist Jérôme Lecoq van het Allen Institute recensies, die eerder tot twee jaar duurden, terug te brengen tot korte samenvattingen.
Anthropic gaat ook tot 50 onderzoeksprojecten sponsoren, elk met tot $30.000 aan credits.
OpenAI zet de standaard hoger met GeneBench-Pro
Kort na de release van Claude Science bracht OpenAI GeneBench-Pro uit. Deze benchmark test of AI-agenten de lastige keuzes kunnen maken die biomedisch onderzoek vereist.
De benchmark bevat 129 problemen uit de genomica, kwantitatieve biologie en translationele geneeskunde.
Het krachtigste model van OpenAI, GPT-5.6 Sol, loste 28,7% van de problemen op het hoogste redeneerniveau op. In Pro-modus stijgt dat naar 31,5%. De eerdere gefaseerde release van GPT-5.6 gebeurde op verzoek van Washington.
GPT-5 scoorde minder dan 5% op het originele GeneBench, terwijl de Opus 4.8 van Anthropic 16% haalde op de moeilijkere test.
Volg ons op X voor het laatste nieuws terwijl het gebeurt.
Twee strategieën, één race
De splitsing laat twee routes naar hetzelfde doel zien. Anthropic levert een product dat meteen in het lab te gebruiken is. OpenAI meet hoe betrouwbaar modellen door ongestructureerde data kunnen redeneren.
Beide lanceringen komen ook terwijl Chinese AI-modellen steeds sterker worden in wetenschappelijk onderzoek. De cijfers van OpenAI zelf temperen de hype, want hun beste model faalt nog op de meeste GeneBench-Pro-taken.
De druk is zowel geopolitiek als wetenschappelijk. Amerikaanse exportbeperkingen hebben Anthropic er al toe aangezet om nieuwe landen als standplaats voor hun modellen te overwegen.
Beoordelaars schatten dat elke GeneBench-Pro-opgave een menselijke expert 20 tot 40 uur zou kosten, met kosten van duizenden dollars. OpenAI zegt dat hun model diezelfde analyse voor een paar dollar kan uitvoeren.
Aubrey de Grey, biomedisch gerontoloog, ziet AI nu al de grootste knelpunten in onderzoek oplossen, ook al duurt het langer voor bredere vooruitgang zichtbaar wordt.
“Wat we heel snel gaan zien, is dat AI bepaalde delen van het proces, vooral de ontwikkeling van medicijnen, niet langer tot een knelpunt maakt,” zei Aubrey de Grey, voorzitter en hoofdwetenschapper van de Longevity Escape Velocity Foundation, in een BeInCrypto-podcast.
De Grey waarschuwde dat het sneller doen van onderzoek niet automatisch betekent dat behandelingen ook sneller worden goedgekeurd – dat hangt af van regelgeving en de tolerantie voor risico’s in de samenleving.
Onderzoekers verwachten snellere adoptie
Sommige specialisten vinden dat de omslag nu al gaande is. Dr. Derya Unutmaz, hoogleraar immunologie, vertelde in hetzelfde BeInCrypto-panel dat AI hem inmiddels zelfs beter helpt dan zijn eigen beoordelingsvermogen.
“Ik vertrouw persoonlijk meer op AI dan op mijn eigen inzichten in mijn vakgebied van 35 jaar.”
Hij verwacht dat deze manier van werken snel in de klinische praktijk zal verspreiden.
“Het is onethisch en ik denk dat het heel snel zelfs medische wanpraktijk zal zijn om géén AI in de geneeskunde te gebruiken.”
Dat optimisme loopt nog iets vooruit op de benchmarks. De komende maanden zullen uitwijzen of wetenschappers deze tools gaan gebruiken en of de GeneBench-Pro-scores ook gaan stijgen.









