తెలుగు వారికి తెలుగు వార్తలు

+1 202 555 0180

Have a question, comment, or concern? Our dedicated team of experts is ready to hear and assist you. Reach us through our social media, phone, or live chat.

GPT-5, Claude Opus 4.1 మానవ నిపుణుల పనితీరును చేరుకున్నాయి

GPT-5, Claude Opus 4.1 మానవ నిపుణుల పనితీరును చేరుకున్నాయి


OpenAI సంస్థ ఇటీవల విడుదల చేసిన కొత్త GDPval బెంచ్‌మార్క్ ప్రకారం, వారి GPT-5 మరియు Anthropic సంస్థ దిగ్గజం Claude Opus 4.1 AI మోడళ్లు పలు రంగాల్లో మానవ నిపుణుల సమానమైన పనితీరును సాదించినట్లు కనుగొన్నాయి. ఈ GDPval బెంచ్‌మార్క్ 9 పరిశ్రమలలో 44 ఉద్యోగాలపై నిర్వహించబడింది, వీటిలో హెల్త్ కేర్, ఫైనాన్స్, గవర్నమెంట్ వంటి అమెరికా ఆర్థికంలో ప్రధాన పాత్ర వహించే రంగాలు ఉన్నాయి.

OpenAI తెలిపిన వివరాల ప్రకారం, GPT-5 యొక్క ఒక అధిక శక్తిగల వెర్షన్ GPT-5-high, మానవ నిపుణుల కంటే మెరుగైన లేదా సమానమైన పనితీరు 40.6% సార్లు చూపించింది, కాగా Claude Opus 4.1 అయితే 49% సార్లు అలాంటి పనితీరు అందించింది. Claude Opus 4.1 ఎక్కువ సార్లు విజువల్ డిజైన్, డాక్యూమెంట్ ఫార్మాటింగ్ వంటి అంశాలలో మెరుగైనది, GPT-5 మాత్రం ఖచ్చితత్వంలో మునుపైగా ఉంది.

ఈ పరీక్షలో భాగంగా, సూచించబడిన AI వర్గాలు మార్కెట్ అనాలిసిస్, సాఫ్ట్‌వేర్ రిపోర్ట్స్ రచన, హెల్త్ కేర్ సమ్మరీలు తయారీ వంటి ఆర్థికంగాను విలువైన దైనందిన పనులు నిర్వహించడంలో మానవుల సమాన స్థాయిలో ఉన్నతమైన సత్తా ప్రదర్శించాయి.

OpenAI అంగీకరిస్తోంది ఈ పరీక్ష ప్రస్తుతం ఉద్యోగాల్లోని అన్ని అప్పర్తుల పనులను చూడటం లేదు, కానీ ఈ ప్రయోగం AI సాంకేతికత మానవులను సాయపడే స్థాయికి సన్నిహితమైందని సూచిస్తుంది. భవిష్యత్తులో మరింత విస్తృత పరీక్షలు నిర్వహించి మరిన్ని పరిశ్రమలు, మరింత పూర్తిగా ఇంటరాక్టివ్ పనులను కోరి పరీక్షలు తీస్తుందని ప్రకటించింది.

సాంకేతిక నిపుణులు, అభివృద్ధి దారులు, పరిశోధకులు ఇప్పుడు AI ని సహాయక సాధనంగా ఉపయోగించి మరిన్ని అధిక విలువ చేసే పనులకు సమయం కేటాయించవచ్చని ఈ పురోగతి సూచిస్తోంది

Share this article
Shareable URL
Prev Post

బంగారం ధర 24 క్యారెట్లకు 10 గ్రాములకు రూ.1,18,960కు చేరింది

Next Post

Canva AI 16 కొత్త భాషలకు విస్తరణ

Read next

చైనా “మెదడు తరహా” ఎయ్ ఐ సర్వర్ వ్యాప్తి – 90% తక్కువ విద్యుత్తు వినియోగంతో సైనిక, పరిశోధనలో ప్రాముఖ్యత

చైనా పరిశోధకులు ప్రపంచంలోనే అత్యంత అత్యాధునిక “మెదడు తరహా” (brain-like/neuromorphic) AI సర్వర్‌ను అభివృద్ధి…
చైనా “మెదడు తరహా” ఎయ్ ఐ సర్వర్ వ్యాప్తి – 90% తక్కువ విద్యుత్తు వినియోగంతో సైనిక, పరిశోధనలో ప్రాముఖ్యత