Microsoft: మూడు వెరైటీలు... కొత్త ఏఐ మోడళ్లు విడుదల చేసిన మైక్రోసాఫ్ట్
టెక్నాలజీ దిగ్గజం మైక్రోసాఫ్ట్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (ఏఐ) రంగంలో తన స్థానాన్ని మరింత పటిష్ఠం చేసుకునే దిశగా ఓ కీలక ముందడుగు వేసింది. ఓపెన్ఏఐ, గూగుల్ వంటి సంస్థలకు గట్టి పోటీనిచ్చే లక్ష్యంతో, తమ సంస్థలోనే అభివృద్ధి చేసిన 3 అత్యాధునిక ఏఐ మోడల్స్ను అధికారికంగా ఆవిష్కరించింది. స్పీచ్ రికగ్నిషన్, వాయిస్ జనరేషన్, ఇమేజ్ జనరేషన్ వంటి అత్యంత కీలకమైన విభాగాలపై దృష్టి సారిస్తూ ఈ మోడల్స్ను రూపొందించడం విశేషం. ఈ పరిణామం ఏఐ సాంకేతికతలో స్వయం సమృద్ధి సాధించాలనే మైక్రోసాఫ్ట్ వ్యూహాన్ని స్పష్టం చేస్తోంది.
మైక్రోసాఫ్ట్ ఏఐ (MAI) బృందం ఈ కొత్త మోడల్స్ను అభివృద్ధి చేసింది. ఇటీవల మైక్రోసాఫ్ట్లో చేరిన ప్రముఖ ఏఐ నిపుణుడు ముస్తఫా సులేమాన్ ఈ బృందానికి నాయకత్వం వహిస్తున్నారు. ఈ కొత్త మోడల్స్కు MAI-Transcribe-1, MAI-Voice-1, మరియు MAI-Image-2 అని నామకరణం చేశారు. ఇవి ఎంటర్ప్రైజ్ వినియోగదారులకు, డెవలపర్లకు వాణిజ్యపరంగా అత్యంత విలువైన సేవలను అందించేందుకు సిద్ధమయ్యాయి.
కొత్త మోడల్స్ ప్రత్యేకతలు ఇవే..
MAI-Transcribe-1 (స్పీచ్ టు టెక్స్ట్): ఇది మాటలను టెక్స్ట్గా మార్చే (స్పీచ్ రికగ్నిషన్) మోడల్. సుమారు 25 భాషల్లో అత్యంత కచ్చితత్వంతో పనిచేస్తుంది. ప్రస్తుతం మార్కెట్లో ఉన్న ఇతర పోటీ మోడల్స్తో పోలిస్తే దాదాపు 50 శాతం తక్కువ జీపీయూ (GPU) వనరులను వినియోగించుకుంటుందని, ఇది సంస్థలకు నిర్వహణ వ్యయాన్ని గణనీయంగా తగ్గిస్తుందని మైక్రోసాఫ్ట్ పేర్కొంది.
MAI-Voice-1 (వాయిస్ జనరేషన్): ఈ మోడల్ టెక్స్ట్ను సహజమైన స్వరంగా మార్చగలదు. కేవలం ఒక్క జీపీయూపై సెకను కంటే తక్కువ సమయంలోనే 60 సెకన్ల నిడివి గల ఆడియోను సృష్టించగల వేగం దీని సొంతం. ఇది కంటెంట్ క్రియేటర్లకు, వ్యాపారాలకు ఎంతో ఉపయోగకరంగా ఉంటుంది.
MAI-Image-2 (టెక్స్ట్ టు ఇమేజ్): ఇది టెక్స్ట్ ఆధారంగా చిత్రాలను రూపొందించే మోడల్ యొక్క రెండో తరం. ఇది మునుపటి వెర్షన్ కన్నా వేగంగా పనిచేయడమే కాకుండా, మరింత సహజంగా, జీవకళ ఉట్టిపడే చిత్రాలను సృష్టిస్తుందని కంపెనీ వివరించింది.
ఈ మూడు మోడల్స్ కూడా 'మైక్రోసాఫ్ట్ ఫౌండ్రీ' మరియు కొత్తగా ప్రారంభించిన 'MAI ప్లేగ్రౌండ్' ద్వారా డెవలపర్లు, ఎంటర్ప్రైజ్ కస్టమర్లకు వెంటనే అందుబాటులో ఉంటాయి. ఈ ఆవిష్కరణలతో మైక్రోసాఫ్ట్ తన ఏఐ సామర్థ్యాలను గణనీయంగా పెంచుకుంటూ, ప్రపంచ ఏఐ మార్కెట్లో తన పోటీని మరింత తీవ్రతరం చేసింది.
మైక్రోసాఫ్ట్ ఏఐ (MAI) బృందం ఈ కొత్త మోడల్స్ను అభివృద్ధి చేసింది. ఇటీవల మైక్రోసాఫ్ట్లో చేరిన ప్రముఖ ఏఐ నిపుణుడు ముస్తఫా సులేమాన్ ఈ బృందానికి నాయకత్వం వహిస్తున్నారు. ఈ కొత్త మోడల్స్కు MAI-Transcribe-1, MAI-Voice-1, మరియు MAI-Image-2 అని నామకరణం చేశారు. ఇవి ఎంటర్ప్రైజ్ వినియోగదారులకు, డెవలపర్లకు వాణిజ్యపరంగా అత్యంత విలువైన సేవలను అందించేందుకు సిద్ధమయ్యాయి.
కొత్త మోడల్స్ ప్రత్యేకతలు ఇవే..
MAI-Transcribe-1 (స్పీచ్ టు టెక్స్ట్): ఇది మాటలను టెక్స్ట్గా మార్చే (స్పీచ్ రికగ్నిషన్) మోడల్. సుమారు 25 భాషల్లో అత్యంత కచ్చితత్వంతో పనిచేస్తుంది. ప్రస్తుతం మార్కెట్లో ఉన్న ఇతర పోటీ మోడల్స్తో పోలిస్తే దాదాపు 50 శాతం తక్కువ జీపీయూ (GPU) వనరులను వినియోగించుకుంటుందని, ఇది సంస్థలకు నిర్వహణ వ్యయాన్ని గణనీయంగా తగ్గిస్తుందని మైక్రోసాఫ్ట్ పేర్కొంది.
MAI-Voice-1 (వాయిస్ జనరేషన్): ఈ మోడల్ టెక్స్ట్ను సహజమైన స్వరంగా మార్చగలదు. కేవలం ఒక్క జీపీయూపై సెకను కంటే తక్కువ సమయంలోనే 60 సెకన్ల నిడివి గల ఆడియోను సృష్టించగల వేగం దీని సొంతం. ఇది కంటెంట్ క్రియేటర్లకు, వ్యాపారాలకు ఎంతో ఉపయోగకరంగా ఉంటుంది.
MAI-Image-2 (టెక్స్ట్ టు ఇమేజ్): ఇది టెక్స్ట్ ఆధారంగా చిత్రాలను రూపొందించే మోడల్ యొక్క రెండో తరం. ఇది మునుపటి వెర్షన్ కన్నా వేగంగా పనిచేయడమే కాకుండా, మరింత సహజంగా, జీవకళ ఉట్టిపడే చిత్రాలను సృష్టిస్తుందని కంపెనీ వివరించింది.
ఈ మూడు మోడల్స్ కూడా 'మైక్రోసాఫ్ట్ ఫౌండ్రీ' మరియు కొత్తగా ప్రారంభించిన 'MAI ప్లేగ్రౌండ్' ద్వారా డెవలపర్లు, ఎంటర్ప్రైజ్ కస్టమర్లకు వెంటనే అందుబాటులో ఉంటాయి. ఈ ఆవిష్కరణలతో మైక్రోసాఫ్ట్ తన ఏఐ సామర్థ్యాలను గణనీయంగా పెంచుకుంటూ, ప్రపంచ ఏఐ మార్కెట్లో తన పోటీని మరింత తీవ్రతరం చేసింది.