టెక్ ప్రపంచంలో భారతీయ సత్తా.. గూగుల్, చాట్జీపీటీలకు 'సర్వమ్ ఏఐ' సవాల్!
- గూగుల్ జెమిని, చాట్జీపీటీలను మించి పనిచేస్తున్న భారతీయ ఏఐ
- సర్వమ్ ఏఐ నుంచి 'విజన్', 'బుల్ బుల్ V3' అనే కొత్త మోడళ్లు
- భారతీయ భాషల్లో డాక్యుమెంట్లు చదవడంలో 'విజన్' అత్యుత్తమ ప్రదర్శన
- సహజమైన వాయిస్ అందించడంలో 'బుల్ బుల్' సత్తా
- ఫిబ్రవరి 2026 వరకు ఉచితంగా ఏపీఐ సేవలు
టెక్నాలజీ రంగంలో ఓ భారతీయ స్టార్టప్ సంచలనం సృష్టిస్తోంది. బెంగళూరు కేంద్రంగా పనిచేస్తున్న ‘సర్వమ్ ఏఐ’ సంస్థ, తాము అభివృద్ధి చేసిన కొన్ని ఏఐ మోడళ్లు భారతీయ భాషల విషయంలో గూగుల్ జెమిని, ఓపెన్ఏఐ చాట్జీపీటీ వంటి గ్లోబల్ దిగ్గజాలను మించి అత్యుత్తమ పనితీరు కనబరుస్తున్నాయని ప్రకటించింది. ఈ మేరకు ‘సర్వమ్ విజన్’, ‘బుల్ బుల్ V3’ పేరుతో రెండు కొత్త ఏఐ మోడళ్లను ఆవిష్కరించింది.
‘సర్వమ్ విజన్’ అనేది భారతీయ భాషల్లోని డాక్యుమెంట్లను చదివి, విశ్లేషించగల ఒక శక్తిమంతమైన ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) మోడల్. ఇది హిందీ, తెలుగు, తమిళం సహా 22 అధికారిక భాషల్లోని పత్రాలను అధిక కచ్చితత్వంతో అర్థం చేసుకోగలదని సంస్థ తెలిపింది. మరోవైపు, ‘బుల్ బుల్ V3’ అనేది టెక్ట్స్ను అత్యంత సహజమైన మానవ స్వరంలోకి మార్చే టెక్స్ట్-టు-స్పీచ్ మోడల్.
ప్రస్తుతం ఉన్న గ్లోబల్ ఏఐ మోడళ్లు ఆంగ్ల భాషకే అధిక ప్రాధాన్యం ఇస్తుండటంతో, భారతీయ భాషల్లో వాటి పనితీరు తక్కువగా ఉంటోందని, ఆ లోటును భర్తీ చేయడానికే ఈ మోడళ్లను రూపొందించినట్లు సర్వమ్ ఏఐ సహ వ్యవస్థాపకులు డాక్టర్ వివేక్ రాఘవన్, డాక్టర్ ప్రత్యూష్ కుమార్ తెలిపారు. olmOCR-Bench మార్క్లో ‘సర్వమ్ విజన్’ 84.3 శాతం కచ్చితత్వం సాధించిందని పేర్కొన్నారు. అలాగే, టెలిఫోనీ ఆడియో నాణ్యతలో ‘బుల్ బుల్ V3’ ఇతర పోటీ మోడళ్ల కన్నా మెరుగైన ఫలితాలు ఇచ్చిందని ఓ స్వతంత్ర అధ్యయనంలో తేలినట్లు వివరించారు.
ఈ డాక్యుమెంట్ ఇంటెలిజెన్స్ ఏపీఐలు, విజన్ అనుభవాన్ని ఫిబ్రవరి 2026 వరకు ఉచితంగా అందిస్తున్నట్లు సంస్థ ప్రకటించింది. ప్రస్తుతం 11 భాషల్లో అందుబాటులో ఉన్న ‘బుల్ బుల్’ను త్వరలో 22 భాషలకు విస్తరించాలని లక్ష్యంగా పెట్టుకుంది.
‘సర్వమ్ విజన్’ అనేది భారతీయ భాషల్లోని డాక్యుమెంట్లను చదివి, విశ్లేషించగల ఒక శక్తిమంతమైన ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) మోడల్. ఇది హిందీ, తెలుగు, తమిళం సహా 22 అధికారిక భాషల్లోని పత్రాలను అధిక కచ్చితత్వంతో అర్థం చేసుకోగలదని సంస్థ తెలిపింది. మరోవైపు, ‘బుల్ బుల్ V3’ అనేది టెక్ట్స్ను అత్యంత సహజమైన మానవ స్వరంలోకి మార్చే టెక్స్ట్-టు-స్పీచ్ మోడల్.
ప్రస్తుతం ఉన్న గ్లోబల్ ఏఐ మోడళ్లు ఆంగ్ల భాషకే అధిక ప్రాధాన్యం ఇస్తుండటంతో, భారతీయ భాషల్లో వాటి పనితీరు తక్కువగా ఉంటోందని, ఆ లోటును భర్తీ చేయడానికే ఈ మోడళ్లను రూపొందించినట్లు సర్వమ్ ఏఐ సహ వ్యవస్థాపకులు డాక్టర్ వివేక్ రాఘవన్, డాక్టర్ ప్రత్యూష్ కుమార్ తెలిపారు. olmOCR-Bench మార్క్లో ‘సర్వమ్ విజన్’ 84.3 శాతం కచ్చితత్వం సాధించిందని పేర్కొన్నారు. అలాగే, టెలిఫోనీ ఆడియో నాణ్యతలో ‘బుల్ బుల్ V3’ ఇతర పోటీ మోడళ్ల కన్నా మెరుగైన ఫలితాలు ఇచ్చిందని ఓ స్వతంత్ర అధ్యయనంలో తేలినట్లు వివరించారు.
ఈ డాక్యుమెంట్ ఇంటెలిజెన్స్ ఏపీఐలు, విజన్ అనుభవాన్ని ఫిబ్రవరి 2026 వరకు ఉచితంగా అందిస్తున్నట్లు సంస్థ ప్రకటించింది. ప్రస్తుతం 11 భాషల్లో అందుబాటులో ఉన్న ‘బుల్ బుల్’ను త్వరలో 22 భాషలకు విస్తరించాలని లక్ష్యంగా పెట్టుకుంది.