जानकारी

जीएसएम ऑडियो कोडेक / वोकोडर

जीएसएम ऑडियो कोडेक / वोकोडर

ऑडियो कोडेक या वोडर के विभिन्न प्रकार सामान्य उपयोग के लिए उपलब्ध हैं, और जीएसएम प्रणाली कई विशिष्ट ऑडियो कोडेक का समर्थन करती है। इनमें RPE-LPC, आधी दर और AMR कोडेक्स शामिल हैं। प्रत्येक वॉयस कोडेक का प्रदर्शन अलग-अलग होता है और इनका उपयोग अलग-अलग परिस्थितियों में किया जा सकता है, हालाँकि AMR कोडेक अब सबसे अधिक उपयोग किया जाता है। साथ ही नए AMR वाइडबैंड (AMR-WB) कोडेक को जीएसएम सहित कई क्षेत्रों में पेश किया जा रहा है

वॉयस कोडेक तकनीक उपलब्ध प्रसंस्करण शक्ति के परिणामस्वरूप हाल के वर्षों में काफी डिग्री से उन्नत हुई है। इसका मतलब यह है कि पहले जीएसएम फोन पेश किए जाने के बाद से जीएसएम प्रणाली में उपयोग किए जाने वाले वॉइस कोडेक्स में बड़े सुधार हुए हैं।

Vocoder / कोडेक मूल बातें

वोकॉडर्स या स्पीच कोडेक्स का उपयोग ध्वनि संचार के कई क्षेत्रों में किया जाता है। जाहिर है कि यहां फोकस जीएसएम ऑडियो कोडेक्स या वोकॉडर्स पर है, लेकिन वही सिद्धांत कोडेक के किसी भी रूप पर लागू होते हैं।

यदि भाषण को एक रेखीय अंदाज़ में डिजिटाइज़ किया जाता है तो इसके लिए एक उच्च डेटा दर की आवश्यकता होगी जो एक बहुत व्यापक बैंडविड्थ पर कब्जा कर लेगा। चूंकि बैंडविड्थ आम तौर पर किसी भी संचार प्रणाली में सीमित है, इसलिए उपलब्ध चैनल के माध्यम से इसे भेजने के लिए डेटा को संपीड़ित करना आवश्यक है। एक बार चैनल के माध्यम से इसे फिर से एक फैशन में ऑडियो को फिर से संगठित करने के लिए विस्तारित किया जा सकता है जो मूल के करीब है।

कोडेक सिस्टम की आवश्यकताओं को पूरा करने के लिए, भाषण को उच्च पर्याप्त नमूना दर और मूल ध्वनि के स्पष्ट प्रजनन की अनुमति देने के लिए संकल्प पर कब्जा करना चाहिए। फिर इसे इस तरह से संपीड़ित किया जाना चाहिए ताकि सीमित बिट दर, त्रुटि-प्रवण वायरलेस ट्रांसमिशन चैनल पर ऑडियो की निष्ठा बनाए रखी जा सके।

ऑडियो कोडेक्स या वोकॉडर्स कई प्रकार की तकनीकों का उपयोग कर सकते हैं, लेकिन कई आधुनिक ऑडियो कोडक एक तकनीक का उपयोग करते हैं जिसे रैखिक भविष्यवाणी के रूप में जाना जाता है। कई मायनों में इसकी तुलना मानव मुखर पथ के गणितीय मॉडलिंग से की जा सकती है। इसे प्राप्त करने के लिए सिग्नल के वर्णक्रमीय लिफाफे को एक फिल्टर तकनीक का उपयोग करके अनुमानित किया जाता है। यहां तक ​​कि जहां कई गैर-सामंजस्यपूर्ण रूप से संबंधित संकेतों के साथ सिग्नल का उपयोग किया जाता है, वहां आवाज कोडेक्स के लिए संपीड़न के बहुत बड़े स्तर देना संभव है।

जीएसएम कोडेक्स के लिए विभिन्न प्रकार के अलग-अलग कोडेक तरीके का उपयोग किया जाता है:

  • CELP: CELP या कोड एक्साइटेड लीनियर प्रिडिक्शन कोडेक एक वोडर एल्गोरिथ्म है जिसे मूल रूप से 1985 में प्रस्तावित किया गया था और इसने दिन के अन्य वॉयस कोडेक्स में महत्वपूर्ण सुधार दिया। CELP कोडेक का मूल सिद्धांत ACELP, RCELP, VSELP, आदि सहित अन्य वॉयस कोडक के आधार के रूप में विकसित और उपयोग किया गया है, जैसे कि CELP कोडेक कार्यप्रणाली अब सबसे व्यापक रूप से उपयोग किया जाने वाला स्पीच कोडिंग एल्गोरिथ्म है। तदनुसार CELP का उपयोग अब किसी विशेष वर्ग के वोकॉडर्स या स्पीच कोडेक्स के लिए जेनेरिक शब्द के रूप में किया जाता है न कि किसी विशेष कोडेक के लिए।

    CELP कोडेक के पीछे मुख्य सिद्धांत यह है कि "संश्लेषण द्वारा विश्लेषण" नामक सिद्धांत का उपयोग किया जाता है। इस प्रक्रिया में, बंद लूप सिस्टम में डिकोड किए गए सिग्नल को अवधारणात्मक रूप से अनुकूलित करके एन्कोडिंग का प्रदर्शन किया जाता है। एक तरीका जिसमें यह हासिल किया जा सकता है, विभिन्न प्रकार की उत्पन्न बिट धाराओं की तुलना करना और सबसे अच्छा लगने वाला संकेत उत्पन्न करने वाला चुनना।

  • ACELP कोडेक: ACELP या बीजगणित कोड उत्साहित रैखिक भविष्यवाणी कोडक। ACELP कोडक या वोडर एल्गोरिथ्म CELP मॉडल का विकास है। हालाँकि ACELP कोडक कोडबुक में एक विशिष्ट बीजीय संरचना है जैसा कि नाम से संकेत मिलता है।
  • वीएसईएलपी कोडेक: वीएसईएलपी या वेक्टर सम एक्सिसिटी लीनियर प्रीडिक्शन कोडेक। वीएसईएलपी कोडेक की प्रमुख कमियों में से एक गैर-भाषण ध्वनियों को कोड करने की इसकी सीमित क्षमता है। इसका मतलब है कि यह शोर की उपस्थिति में खराब प्रदर्शन करता है। परिणामस्वरूप यह वॉयस कोडेक अब उतना व्यापक रूप से उपयोग नहीं किया जाता है, अन्य नए स्पीच कोडेक्स को प्राथमिकता दी जा रही है और बेहतर प्रदर्शन की पेशकश की जा रही है।

जीएसएम ऑडियो कोडेक्स / गायक

विभिन्न प्रकार के जीएसएम ऑडियो कोडेक्स / वोकॉडर्स समर्थित हैं। इन्हें अलग-अलग समय पर पेश किया गया है, और प्रदर्शन के विभिन्न स्तर हैं .. हालाँकि कुछ शुरुआती ऑडियो कोडेक इन दिनों व्यापक रूप से उपयोग नहीं किए जाते हैं, फिर भी उन्हें यहाँ वर्णित किया जाता है क्योंकि वे जीएसएम प्रणाली का हिस्सा बनते हैं।


जीएसएम ऑडियो कोडेक
कोडेक नामबिट दर
(Kbps)
संपीड़न तकनीक
पूर्ण दर13आरटीई-LPC
EFR12.2ACELP
आधा दर5.6VSELP
एएमआर12.2 - 4.75ACELP
एएमआर-पश्चिम बंगाल23.85 - 6.60ACELP

जीएसएम पूर्ण दर / RPE-LPC कोडेक

RPE-LPC या रेगुलर पल्स एक्साइटेड - लीनियर प्रेडिक्टिव कोडर। वॉइस कोडेक का यह रूप जीएसएम के साथ उपयोग किया जाने वाला पहला भाषण कोडेक था और इसे दिन की अन्य कोडेक योजनाओं के साथ तुलना करने के लिए परीक्षणों के बाद चुना गया था। भाषण कोडेक नियमित पल्स उत्तेजना एलपीसी पर दीर्घकालिक भविष्यवाणी के साथ आधारित है। मूल योजना दो पिछले भाषण कोड से संबंधित है, अर्थात्: RELP, अवशिष्ट उत्तेजित रैखिक भविष्यवाणी और MPE-LPC, मल्टी पल्स एक्साइटेड LPC। आरईएलपी के फायदे बेसबैंड कोडिंग के उपयोग के परिणामस्वरूप अपेक्षाकृत कम जटिलता है, लेकिन इसका प्रदर्शन सिस्टम द्वारा निर्मित तानवाला शोर द्वारा सीमित है। MPE-LPC अधिक जटिल है, लेकिन प्रदर्शन का बेहतर स्तर प्रदान करता है। RPE-LPC कोडेक ने समय की तकनीक के लिए प्रदर्शन और जटिलता को संतुलित करते हुए दोनों के बीच एक समझौता किया।

इष्टतम प्रदर्शन प्रदान करने के लिए किए गए काम के बावजूद, जैसा कि तकनीक आगे विकसित हुई, RPE-LPC कोडेक को खराब गुणवत्ता के आवाज की पेशकश के रूप में देखा गया। जैसा कि अन्य पूर्ण दर ऑडियो कोडेक उपलब्ध थे, ये सिस्टम में शामिल किए गए थे।

GSM EFR - एन्हांस्ड फुल रेट कोडेक

बाद में एन्हांस्ड फुल रेट (ईएफआर) वोकोडर नामक एक अन्य वेकोडर को मूल आरपीई-एलपीसी कोडेक के उपयोगकर्ताओं द्वारा कथित खराब गुणवत्ता के जवाब में जोड़ा गया था। इस नए कोडेक ने ध्वनि की बेहतर गुणवत्ता दी और इसे जीएसएम द्वारा अपनाया गया। ACELP कम्प्रेशन तकनीक के प्रयोग से मूल LPC-RPE एनकोडर की गुणवत्ता में महत्वपूर्ण सुधार हुआ। यह संभव हो गया क्योंकि प्रसंस्करण शक्ति जो कि मोबाइल फोन में उपलब्ध थी, उनके कम वर्तमान खपत के साथ संयुक्त प्रसंस्करण शक्ति के उच्च स्तर के परिणामस्वरूप बढ़ी।

जीएसएम हाफ रेट कोडेक

जीएसएम मानक दो उप-चैनलों में एक पूर्ण दर आवाज चैनल के विभाजन की अनुमति देता है जो अलग-अलग कॉल को बनाए रख सकता है। ऐसा करने से, नेटवर्क ऑपरेटर बहुत कम अतिरिक्त निवेश के साथ नेटवर्क द्वारा नियंत्रित किए जा सकने वाले वॉयस कॉल की संख्या को दोगुना कर सकते हैं।

इस सुविधा को सक्षम करने के लिए एक आधे दर के कोडेक का उपयोग किया जाना चाहिए। आधी दर के कोडेक को जीएसएम के शुरुआती वर्षों में पेश किया गया था, लेकिन अन्य भाषण कोडेक्स की तुलना में यह बहुत ही कम आवाज की गुणवत्ता देता था। हालाँकि यह तब लाभ देता था जब माँग अधिक होती थी और नेटवर्क क्षमता प्रीमियम पर होती थी।

जीएसएम हाफ रेट कोडेक वीएसईएलपी कोडेक एल्गोरिथ्म का उपयोग करता है। यह 5.6 kbps की डेटा दर देने के लिए 112 बिट्स को ले जाने वाले प्रत्येक 20 एमएस फ्रेम के डेटा को कोड करता है। इसमें एक मोड संकेतक के लिए 100 बीपीएस डेटा दर शामिल है जो यह विवरण करता है कि सिस्टम का मानना ​​है कि फ़्रेम में ध्वनि डेटा है या नहीं। यह भाषण कोडेक को इस तरह से संचालित करने की अनुमति देता है जो इष्टतम गुणवत्ता प्रदान करता है।

हाफ रेट कोडेक प्रणाली 1990 के दशक में शुरू की गई थी, लेकिन कथित खराब गुणवत्ता के मद्देनजर, इसका व्यापक रूप से उपयोग नहीं किया गया था।

GSM AMR कोडेक

AMR, एडेप्टिव मल्टी-रेट कोडेक अब सबसे व्यापक रूप से इस्तेमाल किया जाने वाला GSM कोडेक है। AMR कोडेक को अक्टूबर 1988 में 3GPP द्वारा अपनाया गया था और इसका उपयोग GSM और सर्किट स्विच्ड UMTS / WCDMA दोनों वॉयस कॉल के लिए किया जाता है।

एएमआर कोडेक नीचे दी गई तालिका में वर्णित आठ विभिन्न बिट दरों में से एक के लिए कई विकल्प प्रदान करता है। बिट दर फ्रेम पर आधारित होते हैं जो 20 मिलीसेकंड लंबे होते हैं और 160 नमूने होते हैं। एएमआर कोडेक डेटा संपीड़न प्रदान करने के लिए विभिन्न तकनीकों का उपयोग करता है। ACELP कोडेक का उपयोग समग्र भाषण कोडेक के आधार के रूप में किया जाता है, लेकिन इसके अलावा अन्य तकनीकों का उपयोग किया जाता है। असंतोषजनक संचरण को नियोजित किया जाता है ताकि जब भाषण गतिविधि न हो तो संचरण कट जाता है। इसके अतिरिक्त वॉयस एक्टिविटी डिटेक्शन (VAD) का उपयोग यह बताने के लिए किया जाता है कि केवल बैकग्राउंड नॉइज़ है और कोई भाषण नहीं है। इसके अलावा उपयोगकर्ता के लिए फीडबैक प्रदान करने के लिए कि कनेक्शन अभी भी मौजूद है, एक कम शोर शोर जेनरेटर (CNG) का उपयोग कुछ पृष्ठभूमि शोर प्रदान करने के लिए किया जाता है, तब भी जब कोई भाषण डेटा प्रसारित नहीं किया जा रहा हो। यह रिसीवर में स्थानीय रूप से जोड़ा जाता है।

एएमआर कोडेक के उपयोग के लिए यह भी आवश्यक है कि अनुकूलित लिंक अनुकूलन का उपयोग किया जाए ताकि वर्तमान रेडियो चैनल स्थितियों की आवश्यकताओं को पूरा करने के लिए इष्टतम डेटा दर का चयन किया जाए, जिसमें इसका संकेत शोर अनुपात और क्षमता शामिल है। यह स्रोत कोडिंग को कम करके और चैनल कोडिंग को बढ़ाकर प्राप्त किया जाता है। हालांकि आवाज की स्पष्टता में कमी है, नेटवर्क कनेक्शन अधिक मजबूत है और लिंक को बिना ड्रॉपआउट बनाए रखा गया है। 4 और 6 डीबी के बीच के सुधार स्तर का अनुभव किया जा सकता है। हालाँकि, नेटवर्क ऑपरेटर गुणवत्ता या क्षमता के लिए प्रत्येक स्टेशन को प्राथमिकता देने में सक्षम हैं।

AMR कोडेक की कुल आठ दरें हैं: आठ पूर्ण दर (FR) पर उपलब्ध हैं, जबकि छह आधी दर (HR) पर उपलब्ध हैं। यह कुल चौदह अलग-अलग मोड देता है।


AMR कोडेक डेटा दरें
मोडबिट दर
(Kbps)
पूर्ण दर (एफआर) /
आधी दर (HR)
एएमआर 12.212.2एफआर
एएमआर 10.210.2एफआर
एएमआर 7.957.95एफआर / एचआर
एएमआर 7.407.40एफआर / एचआर
एएमआर 6.706.70एफआर / एचआर
एएमआर 5.905.90एफआर / एचआर
एएमआर 5.155.15एफआर / एचआर
एएमआर 4.754.75एफआर / एचआर

AMR-WB कोडेक

एडेप्टिव मल्टी-रेट वाइडबैंड, एएमआर-डब्लूबी कोडेक, जिसे जी -22.2 के आईटीयू पदनाम के तहत भी जाना जाता है, पहले के लोकप्रिय एडेप्टिव मल्टी-रेट, एएमआर कोडेक पर आधारित है। एएमआर-डब्लूबी भी अपने ऑपरेशन के लिए एक एसीईएलपी आधार का उपयोग करता है, लेकिन इसे और विकसित किया गया है और एएमआर-डब्लूबी व्यापक भाषण बैंडविड्थ के परिणामस्वरूप बेहतर भाषण गुणवत्ता प्रदान करता है जो इसे एन्कोड करता है। एएमआर-डब्लूबी में 50 - 7000 हर्ट्ज से एक बैंडविड्थ है जो मानक टेलीफोन द्वारा उपयोग किए जाने वाले 300 - 3400 हर्ट्ज बैंडविथ से काफी व्यापक है। हालांकि यह अतिरिक्त प्रसंस्करण की लागत पर आता है, लेकिन हाल के वर्षों में आईसी प्रौद्योगिकी में प्रगति के साथ, यह पूरी तरह से स्वीकार्य है।

AMR-WB कोडेक में कई कार्यात्मक क्षेत्र शामिल हैं: इसमें मुख्य रूप से निश्चित दर भाषण और चैनल कोडेक मोड का एक सेट शामिल है। इसमें अन्य कोडेक फ़ंक्शन भी शामिल हैं: एक वॉइस एक्टिविटी डिटेक्टर (VAD); जीएसएम के लिए असंतत संचरण (DTX) कार्यक्षमता; और UMTS अनुप्रयोगों के लिए स्रोत नियंत्रित दर (SCR) कार्यक्षमता। आगे की कार्यक्षमता में कोडेक मोड ट्रांसमिशन के लिए इन-बैंड सिग्नलिंग और मोड चयन के नियंत्रण के लिए लिंक अनुकूलन शामिल हैं।

AMR-WB कोडेक में 16 kHz नमूना दर है और कोडिंग 20 ms के ब्लॉक में की जाती है। दो आवृत्ति बैंड हैं जिनका उपयोग किया जाता है: 50-6400 हर्ट्ज और 6400-7000 हर्ट्ज। कोडेक जटिलता को कम करने के लिए इन्हें अलग से कोडित किया गया है। यह विभाजन विषयगत रूप से सबसे महत्वपूर्ण आवृत्ति रेंज में बिट आवंटन को केंद्रित करने के लिए भी कार्य करता है।

निचले आवृत्ति बैंड एक ACELP कोडेक एल्गोरिथ्म का उपयोग करता है, हालांकि ऑडियो की व्यक्तिपरक गुणवत्ता में सुधार के लिए कई अतिरिक्त सुविधाओं को शामिल किया गया है। रैखिक भविष्यवाणी विश्लेषण 20 एमएस फ्रेम प्रति एक बार किया जाता है। इसके अलावा, निश्चित और अनुकूली उत्तेजना कोडबुक इष्टतम कोडेक पैरामीटर मानों के लिए हर 5 एमएस की खोज की।

उच्च आवृत्ति बैंड आवाज में स्वाभाविकता और व्यक्तित्व की कुछ विशेषताएं जोड़ता है। ऑडियो निचले बैंड से मापदंडों के साथ-साथ यादृच्छिक उत्तेजना का उपयोग करके पुन: निर्मित किया जाता है। चूंकि इस बैंड में शक्ति का स्तर निचले बैंड की तुलना में कम है, इसलिए लाभ निचले बैंड के सापेक्ष समायोजित किया गया है, लेकिन आवाज की जानकारी के आधार पर। उच्च बैंड की सिग्नल सामग्री को एक रैखिक भविष्य कहनेवाला फ़िल्टर का उपयोग करके पुनर्निर्माण किया जाता है जो निचले बैंड फ़िल्टर से जानकारी उत्पन्न करता है।


एएमआर-डब्ल्यूबी कोडेक
बिट दर
(Kbps)
टिप्पणियाँ
6.60यह AMR-WB के लिए सबसे कम दर है। इसका उपयोग जीएसएम और यूएमटीएस के लिए सर्किट स्विच किए गए कनेक्शन के लिए किया जाता है और इसका उपयोग केवल अस्थायी रूप से गंभीर रेडियो चैनल स्थितियों के दौरान या नेटवर्क कनेक्शन के दौरान उपयोग किया जाता है।
8.85यह 6.6 kbps की दर से बेहतर गुणवत्ता देता है, लेकिन फिर से, इसका उपयोग केवल भीड़ की अवधि में या जब गंभीर रेडियो चैनल स्थितियों के दौरान उपयोग करने के लिए अनुशंसित है।
12.65यह मुख्य बिट दर है जो स्विच किए गए जीएसएम और यूएमटीएस के लिए उपयोग किया जाता है, जो मूल एएमआर कोडेक को बेहतर प्रदर्शन प्रदान करता है।
14.25उच्चतर बिट दर का उपयोग क्लीनर भाषण देने के लिए किया जाता है और विशेष रूप से उपयोगी होता है जब परिवेश ऑडियो शोर का स्तर अधिक होता है।
15.85उच्चतर बिट दर का उपयोग क्लीनर भाषण देने के लिए किया जाता है और विशेष रूप से उपयोगी होता है जब परिवेश ऑडियो शोर का स्तर अधिक होता है।
18.25उच्चतर बिट दर का उपयोग क्लीनर भाषण देने के लिए किया जाता है और विशेष रूप से उपयोगी होता है जब परिवेश ऑडियो शोर का स्तर अधिक होता है।
19.85उच्चतर बिट दर का उपयोग क्लीनर भाषण देने के लिए किया जाता है और विशेष रूप से उपयोगी होता है जब परिवेश ऑडियो शोर का स्तर अधिक होता है।
23.05पूर्ण दर वाले जीएसएम चैनलों के लिए सुझाव नहीं दिया गया है।
23.85पूर्ण दर वाले जीएसएम चैनलों के लिए सुझाव नहीं दिया गया है, और 64 kbps पर G.722 के समान भाषण गुणवत्ता प्रदान करता है।

एएमआर-डब्लूबी से लैस सभी फोन सभी डेटा दरों तक नहीं पहुंच पाएंगे - फोन पर विभिन्न कार्यों को उदाहरण के लिए सक्रिय होने की आवश्यकता नहीं हो सकती है। नतीजतन, नेटवर्क को सूचित करना आवश्यक है कि कौन सी दरें उपलब्ध हैं और इस तरह हैंडसेट और नेटवर्क के बीच बातचीत को सरल बनाता है। इसे प्राप्त करने के लिए तीन अंतर AMR-WB कॉन्फ़िगरेशन हैं जो उपलब्ध हैं:

  • कॉन्फ़िगरेशन A: 6.6, 8.85, और 12.65 kbit / s
  • कॉन्फ़िगरेशन B: 6.6, 8.85, 12.65, और 15.85 kbit / s
  • कॉन्फ़िगरेशन C: 6.6, 8.85, 12.65, और 23.85 kbit / s

यह देखा जा सकता है कि केवल 23.85, 15.85, 12.65, 8.85 और 6.60 kbit / s मोड का उपयोग किया जाता है। सुनने के परीक्षणों के आधार पर, यह माना जाता था कि ये पांच मोड उच्च गुणवत्ता वाले भाषण टेलीफोनी सेवा के लिए पर्याप्त थे। अन्य डेटा दरों को बनाए रखा गया था और इसका उपयोग मल्टीमीडिया संदेश, स्ट्रीमिंग ऑडियो आदि सहित अन्य उद्देश्यों के लिए किया जा सकता है।

हालाँकि, इन्हें GSM कोडेक्स के रूप में वर्णित किया गया है, इनका उपयोग कई अन्य क्षेत्रों में भी किया जाता है - कुछ का उपयोग UMTS में नियोजित सर्किट स्विच्ड वॉयस के साथ किया जाता है। पहले जीएसएम कोडेक को पेश किए जाने के बाद से कोडेक के प्रदर्शन में सुधार हुआ है: बैंडविड्थ की आवश्यकता के साथ भाषण की गुणवत्ता में सुधार हुआ है।

वायरलेस और वायर्ड कनेक्टिविटी विषय:
मोबाइल संचार के मूल बातें।
वायरलेस और वायर्ड कनेक्टिविटी पर लौटें


वीडियो देखना: How to set Bluetooth A2DP codec SBCAACAptXLDAC? (जनवरी 2022).