
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
Microsoft और चीनी शोधकर्ताओं ने टेक्स्ट-टू-स्पीच को परिवर्तित करने का एक प्रभावी तरीका खोजा होगा। अब तक, यह रूपांतरण बहुत कल्पनाशील और चतुराई से विकसित हो रहा था; हालाँकि, प्राकृतिक ध्वनि उत्पन्न करने के लिए प्रशिक्षण समय और संसाधनों के मुद्दे देरी का कारण बन रहे थे।
संबंधित: नई OECD कलात्मक एकीकरण के सिद्धांत: सरकार के लिए अंतर्राष्ट्रीय मानकों पर कृषि एजेंसियों को सहमत
Microsoft और चीनी शोधकर्ताओं ने जो किया है वह AI टेक्स्ट-टू-स्पीच आर्टिफिशियल इंटेलिजेंस (AI) बनाने के लिए है जो 200 वाॅयस सैंपल का इस्तेमाल करके ट्रांसक्रिप्शन से मेल खाने के लिए रियलिस्टिक-साउंड स्पीकिंग तैयार करता है। इसका मतलब लगभग 20 मिनट का मूल्य है।
यह मस्तिष्क से कैसे जुड़ा हुआ है?
मस्तिष्क के न्यूरॉन्स के समान, सिस्टम आंशिक रूप से ट्रांसफॉर्मर, या गहरे तंत्रिका नेटवर्क का उपयोग करता है। जैसे हमारा मस्तिष्क सिंक करता है, ट्रांसफॉर्मर चलते-फिरते सभी इनपुट और आउटपुट जानकारी को संसाधित करते हैं। इससे उन्हें एक सुव्यवस्थित तरीके से जटिल और लंबे दृश्यों के माध्यम से चलने में मदद मिलती है - उदाहरण के लिए, एक जटिल वाक्य।
मिश्रण में जोड़े गए वॉयस रिमूवर एनकोडर सहित अपेक्षाकृत कम जानकारी के साथ काम करना, जैसा कि इस मामले में है, एआई बहुत अच्छी तरह से प्रबंधन कर सकता है।
यहां तक कि थोड़ा रोबोट ध्वनियों के साथ, रिकॉर्डिंग की शब्द-समझदारी 99.84 प्रतिशत पर आती है। इसके शीर्ष पर, यह पाठ को अधिक सुलभ भाषण के लिए ला सकता है। यथार्थवादी-मधुर आवाज पैदा करने के लिए, यह अधिक कठिन काम नहीं करेगा।
शोधकर्ता सिस्टम को बेहतर बनाने के लिए लगातार काम कर रहे हैं, और उम्मीद है कि भविष्य में, यह आजीवन संभोग उत्पन्न करने के लिए और भी कम काम करेगा।
यहाँ दोष नहीं हो सकता?
इस संस्करण को हटा दिया गया है
नहीं, मुझे यह पसंद नहीं है!
क्या वाक्यांश ... सुपर, उल्लेखनीय विचार
मेरी राय में आप सही नहीं हैं। मुझे पीएम में लिखें, हम इसे संभाल लेंगे।