दिलचस्प

जनरेटिव एडवरसरी नेटवर्क्स: टेक बिहाइंड डीपफेक एंड फेसएप

जनरेटिव एडवरसरी नेटवर्क्स: टेक बिहाइंड डीपफेक एंड फेसएप

पिछले कुछ वर्षों में जेनेरिक एडवांसरल नेटवर्क या GAN की चर्चा तेजी से हुई है। यदि आप 10 साल पीछे चले जाते हैं, तो आपको ऐसे किसी भी विषय का कोई निशान नहीं मिलेगा। तो, जनरेटेड एडवांसरियल नेटवर्कों को क्या सबसे आगे आया और आपको क्यों ध्यान रखना चाहिए? चलो चर्चा करते हैं।

जब भी जनरेटिव एडवांसरल नेटवर्क्स या GAN के बारे में चर्चा होती है, तो यह हमेशा AI, मशीन लर्निंग या डीप लर्निंग के संदर्भ में होता है। जबकि यह विषय काफी विस्तृत है, यह लेख सरल शब्दों में इसे समझने में आपकी मदद करने के लिए है।

आइए शुरुआत स्वयं शब्द से करें - जनरेटिव एडवांसरियल नेटवर्क्स।

संबंधित: यह नया AI सिस्टम क्या है जो आप सोच रहे हैं

जीएएन मौलिक रूप से गहरी सीखने के तरीकों का उपयोग करते हुए जेनेरिक मॉडलिंग के लिए एक दृष्टिकोण है। शब्द में "जनरेटिव" शब्द GANs की संपत्ति की ओर इशारा करता है कि वह अपना कुछ बना सके।

किसी कार्यक्रम को अपनी खुद की कुछ बनाने की रचनात्मकता कैसे हो सकती है? हम इसे मशीन लर्निंग की शक्ति देते हैं जहां यह पिछले डेटा से सीख सकता है।

इसलिए, यदि आप एक टन छवियों के साथ जीएएन को खिलाने के लिए थे, तो यह अपनी खुद की एक अनूठी छवि बना सकता है। डेटा के किसी भी सेट के लिए भी यही सच है।

इस परिभाषा को देखते हुए, हम एक ऐसी समस्या में भाग लेते हैं जहाँ जेनरेटर के आउटपुट की जाँच के लिए कोई फ़िल्टर नहीं होता है। जनरेटर अपने संदर्भ डेटा सेट से संबंधित कुछ भी बना सकता है बिना यह जाने कि वह हमारे लिए स्वीकार्य होगा या नहीं।

इस समस्या को हल करने के लिए, GAN एक भेदभावपूर्ण नेटवर्क के साथ आते हैं जो वास्तविक डेटा के साथ उत्पन्न डेटा की जांच करते हैं। यह एक जनरेटिव एडवरसरी नेटवर्क का एडवरसैरियल हिस्सा है। हम अनिवार्य रूप से एक-दूसरे के साथ जेनरेटर नेटवर्क और भेदभावपूर्ण नेटवर्क को एक दूसरे के साथ प्रतिकूलता पैदा कर रहे हैं।

डिस्क्रिमिनेटर नेटवर्क या एक डिस्क्रिमिनेटर का उपयोग जनरेटर के उत्पन्न मूल्यों को जांच में रखने के लिए किया जाता है। और जनरेटर का कार्य यह सोचकर विवेकशील को मूर्ख बनाना है कि उत्पन्न मूल्य वास्तव में वास्तविक हैं और कंप्यूटर जनित नहीं हैं।

यह गण की मूल अवधारणा है।

GANs को इयान गुडफेलो और मॉन्ट्रियल विश्वविद्यालय के अन्य शोधकर्ताओं द्वारा जनरेटेड एडवरसियर नेटवर्क्स शीर्षक वाले पेपर में अधिक विस्तार से समझाया गया है।

कागज में, उन्होंने स्पष्ट रूप से उल्लेख किया है कि जेनेरिक नेटवर्क का पूरा उद्देश्य भेदभावपूर्ण नेटवर्क को एक गलती करने में धकेलना है। और भेदभावपूर्ण नेटवर्क केवल एक गलती करेगा जब यह मशीन-जनित डेटा और प्रशिक्षण डेटा के बीच अंतर नहीं कर सकता है।

GAN को प्रशिक्षित करने का सबसे अच्छा तरीका MNIST डेटाबेस (संशोधित राष्ट्रीय मानक संस्थान और प्रौद्योगिकी डेटाबेस) का उपयोग करना है।

डेटाबेस में 60,000 उदाहरणों का एक प्रशिक्षण सेट और 10,000 उदाहरणों का एक परीक्षण सेट शामिल है। MNIST प्रशिक्षण हस्तलिखित संख्यात्मक मूल्यों का उपयोग करता है।

वे नेटवर्क को प्रशिक्षित करने के लिए संसाधनों की तलाश करने वाले किसी भी व्यक्ति के लिए एक शानदार शुरुआत हैं। यह डेटा का एक सेट है जिसका उपयोग इयान और उनकी टीम द्वारा मॉडल को प्रशिक्षित करने के लिए किया गया था।

इस डेटा से, GAN के लिए हम जिस सर्वश्रेष्ठ सादृश्य का उपयोग कर सकते हैं, वह यह है कि यह एक दो-खिलाड़ियों का खेल है, जहाँ प्रत्येक खिलाड़ी एक दूसरे को हराने के लिए अपनी पूरी कोशिश कर रहा है।

एआई द्वारा जनित यथार्थवादी दिखने वाली छवियों के बारे में आपको दिसंबर 2018 के अंत में आने वाली खबरों की लहर याद होगी। खैर, वह गण था!

यदि आप उन चित्रों की समीक्षा करते हैं, तो यह देखना आसान है कि यह इतनी बड़ी कहानी क्यों थी। चित्र मानव चेहरे के वास्तविक जीवन के चित्रों से अविभाज्य थे।

परियोजना के पीछे के लोग NVidia, लोकप्रिय कंप्यूटर ग्राफिक्स हार्डवेयर और सॉफ्टवेयर डेवलपर थे। परियोजना के पीछे के शोधकर्ताओं ने इसके विकास और उनके परिणामों पर एक पेपर तैयार किया, जिसे जनरेशनल एडवरटाइजिंग नेटवर्क के लिए ए-स्टाइल-आधारित जनरेटर आर्किटेक्चर शीर्षक दिया गया है।

एनवीडिया के शोधकर्ताओं ने 8 सप्ताह तक नेटवर्क का प्रशिक्षण लिया, और यह उनके टेस्ला रेंज के आठ ग्राफिक कार्ड का उपयोग कर रहा था।

यह निश्चित रूप से कुछ सवाल उठाता है कि हम कैसे चित्रात्मक डेटा पर भरोसा कर सकते हैं। इसके अलावा, यदि हम संदर्भ चित्रों से मानवीय चेहरे बनाने में सक्षम हैं, तो इससे पहले कि हम सही चेहरे बना सकें, इससे बहुत पहले ही मॉडल तैयार हो जाएंगे!

कई लोग न्यायपालिका प्रणाली में सचित्र डेटा के उपयोग के बारे में चिंता जताते हैं यदि सॉफ्टवेयर छवियों को प्रभावी ढंग से बदल सकता है। यह निश्चित रूप से सोचने के लिए कुछ है!

इस विषय पर वापस जाएं कि जीएएन विकास कितना दूर है, कुछ भी एनवीडिया से प्रयोग की तुलना में प्रौद्योगिकी की स्पष्ट तस्वीर नहीं दिखाता है। हम यथार्थवादी दिखने वाले चेहरे बनाने में सक्षम हैं जो न केवल विश्वसनीय हैं, बल्कि कंप्यूटर द्वारा अत्यधिक अनुकूलन योग्य हैं।

यथार्थवादी डेटा बनाने और कम बिजली की भूख आवश्यकताओं के साथ GAN को अधिक शक्तिशाली बनाने के लिए अभी भी अनुसंधान चल रहा है।

GAN का उपयोग विभिन्न प्रकार के अनुप्रयोगों में किया जा सकता है, ज्यादातर छवि संबंधित हैं, लेकिन यह निश्चित रूप से बदलने वाला है। वर्तमान में, गण का उपयोग किया जाता है:

नई सामग्री (इमेजरी) बनाना: जीएएन का उपयोग आजीवन चित्र बनाने के लिए स्रोत चित्रों के सेट से किया जा सकता है। इस तरह की प्रणाली का उपयोग विशुद्ध रूप से गणों की क्षमताओं को समझने के लिए है।

कुछ का तर्क है कि इस तकनीक का उपयोग अपने माता-पिता की तस्वीरों से एक बच्चे के रूप को निर्धारित करने के लिए किया जा सकता है।

बुढ़ापा या डे-एजिंग: नमूना चित्रों के एक मजबूत सेट के साथ, GAN सफलतापूर्वक मानव चेहरों की आयु या उम्र को कम कर सकता है। फेसऐप नामक एक ऐप की हालिया लोकप्रियता से पता चलता है कि इस तरह की तकनीक जनता के बीच बहुत लोकप्रिय है।

अगर आप फेसप्ले के पीछे की तकनीक के बारे में सोच रहे हैं, तो इसके जी.ए.एन.

ब्लैक एंड व्हाइट फ़ोटो को रंगीन करना: जब GAN को अच्छी तरह से प्रशिक्षित किया जाता है, तो यह तस्वीरों को रंगीन कर सकता है और उल्लेखनीय रूप से कर सकता है। यह तकनीक वास्तव में पुरानी तस्वीरों के लिए जीवन ला सकती है और हमें उस समय के रंग में झलक सकती है।

संकल्प वृद्धि: यदि आपने किसी चित्र में कम परिणाम के रिज़ॉल्यूशन को बढ़ाने की कोशिश की है, तो परिणाम हमेशा ब्लो आउट पिक्सल के साथ एक धुंधली गड़बड़ है। हालाँकि, GAN प्रत्येक अतिरिक्त चित्र को प्रतिस्थापित करता है और उनके रिज़ॉल्यूशन के कम होने पर भी उच्च-गुणवत्ता वाले वृद्धि चित्र बनाता है।

दुनिया ने काम पर GANs के कई उदाहरण देखे हैं, और इस दिशा में चल रहे शोध भविष्य में GAN के कई और अप्रत्याशित अनुप्रयोगों की ओर इशारा करते हैं।

संबंधित: अयोग्य लोगों के संबंध में एआई के लिए संपर्क करना, हमें क्या करना चाहिए?

प्रौद्योगिकी क्रांतिकारी है और हम एक से अधिक तरीकों से अपने उपकरणों पर GANs दिखाने की उम्मीद कर सकते हैं। हालांकि, इस तकनीक के परिपक्व होने से पहले, इस तरह के शक्तिशाली गहरे सीखने के तरीकों के नैतिक उपयोग पर गंभीर चर्चा की आवश्यकता है।


वीडियो देखना: Face App Prank. Malayalam Vine. Ikru (जनवरी 2022).