OpenAI సంస్థ ఇటీవల విడుదల చేసిన కొత్త GDPval బెంచ్మార్క్ ప్రకారం, వారి GPT-5 మరియు Anthropic సంస్థ దిగ్గజం Claude Opus 4.1 AI మోడళ్లు పలు రంగాల్లో మానవ నిపుణుల సమానమైన పనితీరును సాదించినట్లు కనుగొన్నాయి. ఈ GDPval బెంచ్మార్క్ 9 పరిశ్రమలలో 44 ఉద్యోగాలపై నిర్వహించబడింది, వీటిలో హెల్త్ కేర్, ఫైనాన్స్, గవర్నమెంట్ వంటి అమెరికా ఆర్థికంలో ప్రధాన పాత్ర వహించే రంగాలు ఉన్నాయి.
OpenAI తెలిపిన వివరాల ప్రకారం, GPT-5 యొక్క ఒక అధిక శక్తిగల వెర్షన్ GPT-5-high, మానవ నిపుణుల కంటే మెరుగైన లేదా సమానమైన పనితీరు 40.6% సార్లు చూపించింది, కాగా Claude Opus 4.1 అయితే 49% సార్లు అలాంటి పనితీరు అందించింది. Claude Opus 4.1 ఎక్కువ సార్లు విజువల్ డిజైన్, డాక్యూమెంట్ ఫార్మాటింగ్ వంటి అంశాలలో మెరుగైనది, GPT-5 మాత్రం ఖచ్చితత్వంలో మునుపైగా ఉంది.
ఈ పరీక్షలో భాగంగా, సూచించబడిన AI వర్గాలు మార్కెట్ అనాలిసిస్, సాఫ్ట్వేర్ రిపోర్ట్స్ రచన, హెల్త్ కేర్ సమ్మరీలు తయారీ వంటి ఆర్థికంగాను విలువైన దైనందిన పనులు నిర్వహించడంలో మానవుల సమాన స్థాయిలో ఉన్నతమైన సత్తా ప్రదర్శించాయి.
OpenAI అంగీకరిస్తోంది ఈ పరీక్ష ప్రస్తుతం ఉద్యోగాల్లోని అన్ని అప్పర్తుల పనులను చూడటం లేదు, కానీ ఈ ప్రయోగం AI సాంకేతికత మానవులను సాయపడే స్థాయికి సన్నిహితమైందని సూచిస్తుంది. భవిష్యత్తులో మరింత విస్తృత పరీక్షలు నిర్వహించి మరిన్ని పరిశ్రమలు, మరింత పూర్తిగా ఇంటరాక్టివ్ పనులను కోరి పరీక్షలు తీస్తుందని ప్రకటించింది.
సాంకేతిక నిపుణులు, అభివృద్ధి దారులు, పరిశోధకులు ఇప్పుడు AI ని సహాయక సాధనంగా ఉపయోగించి మరిన్ని అధిక విలువ చేసే పనులకు సమయం కేటాయించవచ్చని ఈ పురోగతి సూచిస్తోంది







