Egyre erősebb a mesterséges intelligencia, most kiderült, hogyan boldogul a magyar kompetenciamérések feladataival

1 hónapja

A PeakX bemutatott egy új megközelítést az AI-modellek teljesítményének mérésére, amely a magyar közoktatás kompetenciamérési feladatsorait használja. Sajtos István, a cég innovációs igazgatója kritizálta a hagyományos benchmarkokat, amelyek nem tükrözik a valós problémákat. A tesztek során az OpenAI O1-es modellje teljesített a legjobban, míg más modellek, mint az Antropic Claude Sonnet 3.7 és az xAI Grok2, vegyes eredményeket mutattak. A PeakX hangsúlyozza, hogy az AI-modellek nem helyettesítik az emberi gondolkodást, és a bizalom hiánya, valamint a szakemberhiány akadályozza az integrációjukat. Teljes cikk (Portfolio.hu)