Sarvam AI: స్వదేశీ ఏఐ విప్లవం.. చాట్జీపీటీ, జెమినీ ఏఐలకే షాక్!
భారత్ చాలా కాలంగా ఎదురుచూస్తున్న స్వదేశీ ఏఐ మోడల్ వచ్చేసింది. అదే సర్వం ఏఐ (Sarvam Vision AI). ప్రస్తుతం బెంగళూరుకు చెందిన సర్వం ఏఐ అనే స్టార్టప్ ప్రపంచ టెక్ వర్గాల దృష్టిని ఆకర్షిస్తోంది. ఇప్పటివరకు ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (ఏఐ) రంగంలో అమెరికా, చైనా దేశాల ఆధిపత్యమే కొనసాగింది. కావాల్సినంత టాలెంట్, విస్తారమైన మార్కెట్ ఉన్నప్పటికీ భారత్ నుంచి బలమైన లోకల్ ఏఐ మోడల్ లేకపోవడం చాలా మందికి ఆశ్చర్యం కలిగించింది. ఆ లోటును ఇప్పుడు సర్వం విజన్ భర్తీ చేసినట్లు టెక్ వర్గాలు చెబుతున్నాయి.
సహవ్యవస్థాపకుడు ప్రత్యుష్ కుమార్ ఎక్స్లో ఓ పోస్ట్ చేసి.. సర్వం విజన్ సాధించిన కీలక విజయాలను వెల్లడించారు. ముఖ్యంగా ఓసీఆర్ (డాక్యుమెంట్లలోని అక్షరాలను గుర్తించే ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్) రంగంలో సర్వమ్ విజన్ ప్రదర్శన అంతర్జాతీయ స్థాయిలో సంచలనం సృష్టిస్తోంది. ఓఎల్ఎం ఓసీఆర్ బెంచ్లో 84.3 శాతం ఖచ్చితత్వం సాధించింది. ఇది గూగుల్ జెమినీ 3 ప్రో (Google Gemini 3 Pro), డీప్ సీక్ ఓసీఆర్ వీ2 (DeepSeek OCR v2) వంటి అత్యాధునిక మోడళ్ల కన్నా ఎక్కువగా ఉండటం విశేషం. ఇక చాట్జీపీటీ ఈ బెంచ్మార్క్లో చాలా వెనుకబడింది. చాట్జీపీటీ, జెమినీ ఏఐలకే ఇది పెద్ద షాక్ అని చెప్పాలి. ఎందుకంటే ఇప్పటివరకు ఈ విభాగంలో ఈ రెండింటిదే హవా.
సర్వం విజన్ ప్రత్యేకత ఏమిటంటే.. తన ప్రధాన నైపుణ్యమైన ఓసీఆర్ విభాగంలోనే ప్రపంచ దిగ్గజాలను వెనక్కి నెడుతోంది. ఓసీఆర్ అనేది ఏఐ మోడళ్లకు అత్యంత కఠినమైన పరీక్షగా భావిస్తారు. అలాంటి క్లిష్టమైన బెంచ్మార్క్లో ChatGPT, Google Gemini, Anthropic Claude వంటి మోడళ్లను సర్వం వెనక్కి నెట్టడం భారత టెక్ రంగానికి గర్వకారణంగా మారింది. క్లిష్టమైన లేఅవుట్లు, టెక్నికల్ టేబుల్స్, గణిత సూత్రాలు ఉన్న డాక్యుమెంట్లను కూడా మన ఏఐ సులభంగా చదువుతోంది. డాక్యుమెంట్లను ఏఐ ఎంత సమర్థంగా అర్థం చేసుకుంటుందో పరీక్షించే OmniDoc Bench v1.5 లో ఏకంగా 93.28% స్కోర్ సాధించింది.
బెంగళూరుకు చెందిన ఈ స్టార్టప్ పనితీరుపై నిపుణులు, యూజర్లు ప్రశంసల వర్షం కురిపిస్తున్నారు. సర్వం ఏఐపై టెక్ ప్రపంచంలో స్పందన కూడా బలంగానే ఉంది. ప్రముఖ టెక్ వ్యాఖ్యాత డీడీ దాస్ తన అభిప్రాయాన్ని వెల్లడించారు. 'సర్వం విషయంలో నేను తప్పు చేశాను. ఏడాది క్రితం వీరి దిశ సరైంది కాదని భావించాను. కానీ ఇప్పుడు వారు పరిస్థితిని పూర్తిగా మార్చేశారు. ఇండిక్ భాషల కోసం అత్యుత్తమ టెక్స్ట్-టు-స్పీచ్, స్పీచ్-టు-టెక్స్ట్, ఓసీఆర్ మోడళ్లను అందిస్తున్నారు. ముఖ్యంగా ధరలు కూడా చాలా సమంజసంగా ఉన్నాయి' అని ప్రశంసించారు. సర్వం ఏఐ విడుదల చేసిన మరో టూల్ బుల్బుల్ v3.. టెక్స్ట్ను సహజమైన వాయిస్గా మార్చే ఆధునిక టెక్స్ట్-టు-స్పీచ్ మోడల్. ఈ టూల్ ElevenLabs వంటి కంపెనీలకు గట్టి పోటీగా నిలుస్తోంది.
మొత్తంగా చూస్తే.. సర్వం విజన్ ఏఐ భారత్కు కేవలం ఒక స్టార్టప్ మాత్రమే కాదు, గ్లోబల్ ఏఐ మ్యాప్లో భారత స్థానం బలంగా నిలబెట్టే కీలక అడుగుగా మారుతోంది. అమెరికా, చైనా మధ్య పోటీగా ఉన్న ఏఐ ప్రపంచంలో ఇప్పుడు భారత్ పేరు గట్టిగా వినిపించబోతోందని టెక్ వర్గాలు భావిస్తున్నాయి.