होम बिजनेस छोटे भाषा मॉडल में भी शक्तिशाली उपयोग के मामले होते हैं

छोटे भाषा मॉडल में भी शक्तिशाली उपयोग के मामले होते हैं

नोब्रोकर सह संस्थापक Akhil Gupta, जो मुख्य तकनीकी एवं उत्पाद अधिकारी भी हैं, और उनके इंजीनियरों की छोटी टीम वर्षों से अपने ग्राहक एजेंटों की उत्पादकता में सुधार करने की कोशिश कर रही है। उनके सामने जो समस्या आई वह सरल थी: नोब्रोकर का एजेंटों को उच्च-मूल्य वाली खरीद वस्तुओं – मुख्य रूप से घरों और फ्लैटों के संबंध में बड़ी संख्या में संभावित ग्राहकों से जुड़ना पड़ता है।
एजेंटों के प्रभावी होने के लिए, उन्हें मानक संचालन प्रक्रियाओं का सख्ती से पालन करना होगा और सही जानकारी उन तक आसानी से पहुंचनी होगी। अखिल कहते हैं, लेकिन ग्राहक सेवा प्रतिनिधियों के बीच नौकरी छोड़ने की उच्च दर को देखते हुए, सेवा की उच्च गुणवत्ता बनाए रखना इसमें शामिल सभी लोगों के लिए एक बुरा सपना था।
NoBroker की पहेली का समाधान AI पर भरोसा करना था। तभी उन्होंने अपनी दूसरी बाधा पार की: एआई समाधान बाजार में महंगे थे. इसलिए उन्होंने स्वयं एआई समाधान बनाने का निर्णय लिया।
पिछले आधे दशक की उनकी यात्रा ने उन्हें बहुत कुछ विकसित करने के लिए प्रेरित किया है छोटे भाषा मॉडल (एसएलएम) और संवादी विश्लेषणात्मक मॉडल न केवल उनके आंतरिक उपयोग के लिए बल्कि कई व्यवसायों के लिए स्टैंडअलोन सॉफ्टवेयर अनुप्रयोगों के रूप में भी। “इनमें से कुछ कार्य विशिष्ट छोटे भाषा मॉडल हैं और अन्य खुले एलएलएम के विशेष अनुकूलन हैं। ये मॉडल हमारे फ्लैगशिप की नींव भी बन गए हैं संवादी विश्लेषण ConvoZen.AI नामक उपकरण। हमें लगता है कि यह एक और स्टार्टअप है जिसने NoBroker के भीतर जन्म लिया है, ”अखिल कहते हैं।
उनके एसएलएम-आधारित एआई मॉडल लोकप्रिय होने का मुख्य कारण यह है कि वे कई भारतीय भाषाओं को समझ सकते हैं, यहां तक ​​कि हिंग्लिश जैसी लोकप्रिय भाषा को भी समझ सकते हैं। वे भी उल्लेखनीय रूप से उपयोगी हैं. उदाहरण के लिए, एआई मॉडल किसी ग्राहक के साथ एजेंट की बातचीत के दौरान हुई गलतियों को सारांशित और उजागर कर सकते हैं, सटीक भावना विश्लेषण दे सकते हैं, और यहां तक ​​कि एजेंट को वे सभी प्रासंगिक जानकारी भी प्रदान कर सकते हैं जिनकी उन्हें अपने ग्राहक को बेहतर सेवा देने के लिए आवश्यकता हो सकती है। एलएलएम महंगे हैं, अखिल इस बात पर जोर देते हैं कि उन्होंने और उनकी टीम ने कभी भी बाजार में उपलब्ध दूसरों को टक्कर देने के लिए एक भाषा मॉडल बनाने की योजना नहीं बनाई थी और इसके बजाय वे बस एक समस्या को हल करने की कोशिश कर रहे थे। “बहुत सी कंपनियां अपना खुद का बेस मॉडल बनाने की कोशिश कर रही हैं। मैं यह नहीं करना चाहता. मैं एक समस्या का समाधान करने का प्रयास कर रहा हूँ।”
और वे कुछ सौ मध्यम शक्तिशाली जीपीयू और लगभग 25 इंजीनियरों की एक टीम के साथ ऐसा करने में सक्षम थे।
“हमारे भाषण और भाषा मॉडल की श्रृंखला को आंतरिक रूप से भाषण और भाषा मॉडल की माया श्रृंखला नाम दिया गया है। मायाकॉनफॉर्मर (50 मिलियन पैरामीटर मॉडल) हमारा अत्याधुनिक संवादात्मक ट्रांसक्रिप्शन मॉडल है जो कई भारतीय भाषाओं में 35,000+ घंटे के ओपन डेटा सेट और 1,500+ घंटे के इनहाउस एनोटेटेड डेटा सेट पर प्रशिक्षित कंफर्मर स्टाइल आर्किटेक्चर पर आधारित है। हमने भाषिनी और कॉमनवॉइस से उपलब्ध डेटासेट का भी उपयोग किया है।
अखिल का कहना है कि सही प्रशिक्षण डेटा के साथ, छोटे भाषा मॉडल संकीर्ण, विशिष्ट उपयोग के मामलों के लिए अविश्वसनीय रूप से प्रभावी हो सकते हैं। “आप किसी विशेष उपयोग के मामले के लिए एक मॉडल बना सकते हैं। आप इसे वहां मौजूद बड़े मॉडलों से भी उधार ले सकते हैं। इसे रिट्रीवल ऑगमेंटेड जेनरेशन मॉडलिंग कहा जाता है। उदाहरण के लिए, खुदरा क्षेत्र में हमारी शब्द त्रुटि दर 20% हो सकती है। लेकिन फिर केवल दस घंटे की रिकॉर्डिंग (विशिष्ट खुदरा डेटा की) के साथ, हम शब्द त्रुटि दर को एकल अंकों में ला सकते हैं, केवल थोड़े से क्यूरेशन की आवश्यकता है।
अरबी की समझ जब उन्होंने शुरू की, तो अखिल कहते हैं कि वे हिंदी, अंग्रेजी, तमिल और तेलुगु जैसी सभी भाषाओं के लिए अलग-अलग मॉडल बनाते थे, लेकिन अब वे एक ऐसे मॉडल में विकसित हो गए हैं जो कई भाषाओं को समझ सकता है। अखिल का कहना है कि उन्हें विश्वास है कि वे अब दुनिया की किसी भी भाषा के लिए कोई भी मॉडल बना सकते हैं – जब तक कि यह विशिष्ट उपयोग के मामलों के लिए हो। यही कारण है कि उन्होंने अरबी भाषा में भी महारत हासिल कर ली।
“मैं दुबई में शेख के लिए एक डेमो कर रहा था। हमने एक कॉल लिया, एक प्रतिलेख बनाया (नोब्रोकर के मॉडल के साथ) और मैंने उसे दिखाया, और मैंने उसे बताया कि मुझे अरबी समझ में नहीं आती है और पूछा कि क्या वह कृपया इसे पढ़ सकता है। उनकी प्रतिक्रिया थी कि यह एकदम सही था।”

LEAVE A REPLY

Please enter your comment!
Please enter your name here