GPT-4o był poniżej poziomu profesjonalistów medycznych w benchmarkach rozumowania medycznego, podczas gdy GPT-5 (najwyraźniej Thinking medium) teraz znacznie ich przewyższa. (Zwykłe zastrzeżenia dotyczące benchmarków mają zastosowanie)
elvis
elvis12 sie, 20:58
GPT-5 w multimodalnym rozumieniu medycznym Na MedXpertQA MM, GPT-5 poprawia wyniki w zakresie rozumowania i zrozumienia o +29,62% i +36,18% w porównaniu do GPT-4o. Przewyższa licencjonowanych ekspertów ludzkich o +24,23% w rozumowaniu i +29,40% w zrozumieniu.
101,29K