ابتكار الموسيقى. إتقان - الجزء 2
تكنولوجيا

ابتكار الموسيقى. إتقان - الجزء 2

كتبت عن حقيقة أن إتقان عملية إنتاج الموسيقى هو الخطوة الأخيرة في الطريق من فكرة الموسيقى إلى توصيلها إلى المتلقي في الإصدار السابق. لقد ألقينا أيضًا نظرة فاحصة على الصوت المسجل رقميًا ، لكنني لم أقم بعد بمناقشة كيفية تحويل هذا الصوت ، المحول إلى محولات جهد التيار المتردد ، إلى شكل ثنائي.

1. كل صوت معقد ، حتى وإن كان بدرجة عالية جدًا من التعقيد ، يتكون في الواقع من العديد من الأصوات الجيبية البسيطة.

أنهيت المقال السابق بالسؤال ، كيف يمكن في مثل هذه الموجة المتموجة (1) أن يتم تشفير كل المحتوى الموسيقي ، حتى لو كنا نتحدث عن العديد من الآلات التي تعزف على أجزاء متعددة الألحان؟ ها هي الإجابة: هذا يرجع إلى حقيقة أن أي صوت معقد ، حتى معقد للغاية ، هو حقًا يتكون من العديد من الأصوات الجيبية البسيطة.

تختلف الطبيعة الجيبية لهذه الأشكال الموجية البسيطة باختلاف الوقت والسعة ، فهذه الأشكال الموجية تتداخل ، وتضيف ، وتطرح ، وتعديل بعضها البعض ، وهكذا يتم أولاً إنشاء أصوات الآلات الفردية ، ثم عمليات المزج والتسجيلات الكاملة.

ما نراه في الشكل 2 عبارة عن ذرات معينة ، وجزيئات تشكل المادة الصوتية لدينا ، ولكن في حالة الإشارة التناظرية لا توجد مثل هذه الذرات - يوجد خط واحد زوجي ، بدون نقاط تحدد القراءات اللاحقة (يمكن رؤية الاختلاف في الشكل كخطوات يتم تقريبها بيانياً للحصول على التأثير المرئي المقابل).

ومع ذلك ، نظرًا لأن تشغيل الموسيقى المسجلة من المصادر التناظرية أو الرقمية يجب أن يتم باستخدام محول طاقة كهرومغناطيسي ميكانيكي مثل مكبر الصوت أو محول سماعة الرأس ، فإن الاختلاف بين الصوت التناظري النقي وطمس الصوت المعالج رقميًا يكون ساحقًا في معظم الحالات. في المرحلة النهائية ، أي عند الاستماع ، تصل إلينا الموسيقى بنفس طريقة وصول اهتزازات جزيئات الهواء التي تسببها حركة الحجاب الحاجز في محول الطاقة.

2. الجزيئات التي تتكون منها المادة الصوتية

رقم تناظري

هل هناك أي اختلافات مسموعة بين الصوت التناظري النقي (أي التناظرية المسجلة على مسجل شريط تناظري ، مختلطة على وحدة تحكم تناظرية ، مضغوطة على قرص تناظري ، تشغيلها على مشغل تناظري ومكبر صوت تناظري مضخم) والصوت الرقمي - تم تحويله من تمثيلي إلى رقمي ومعالج ومختلط رقميًا ثم معالجته مرة أخرى إلى الشكل التناظري ، هل هذا أمام مكبر الصوت مباشرةً أم في السماعة نفسها عمليًا؟

في الغالبية العظمى من الحالات ، بدلاً من ذلك ، على الرغم من أننا إذا سجلنا نفس المادة الموسيقية بكلتا الطريقتين ثم شغلناها مرة أخرى ، فمن المؤكد أن الاختلافات ستكون مسموعة. ومع ذلك ، فإن هذا يرجع إلى طبيعة الأدوات المستخدمة في هذه العمليات وخصائصها وخصائصها وقيودها في كثير من الأحيان ، أكثر من حقيقة استخدام التكنولوجيا التناظرية أو الرقمية.

في الوقت نفسه ، نفترض أن إحضار الصوت إلى شكل رقمي ، أي إلى التفتيت بشكل صريح ، لا يؤثر بشكل كبير على عملية التسجيل والمعالجة نفسها ، خاصة وأن هذه العينات تحدث بتردد - على الأقل نظريًا - يتجاوز بكثير الحدود العليا للترددات التي نسمعها ، وبالتالي فإن هذا التحبب المحدد للصوت المحول إلى شكل رقمي غير مرئي لنا. ومع ذلك ، من وجهة نظر إتقان المادة الصوتية ، فهي مهمة جدًا ، وسنتحدث عنها لاحقًا.

الآن دعنا نتعرف على كيفية تحويل الإشارة التناظرية إلى شكل رقمي ، أي صفر واحد ، أي واحد حيث يمكن أن يكون للجهد مستويين فقط: المستوى الرقمي الأول ، والذي يعني الجهد ، ومستوى الصفر الرقمي ، أي هذا التوتر غير موجود عمليا. كل شيء في العالم الرقمي إما واحد أو صفر ، ولا توجد قيم وسيطة. بالطبع ، هناك أيضًا ما يسمى بالمنطق الضبابي ، حيث لا تزال هناك حالات وسيطة بين حالات "التشغيل" أو "الإيقاف" ، ولكنها لا تنطبق على أنظمة الصوت الرقمية.

3. اهتزازات جزيئات الهواء الناتجة عن مصدر الصوت تعمل على تحريك بنية خفيفة للغاية من الغشاء.

التحولات الجزء الأول

أي إشارة صوتية سواء كانت غناء أو غيتار أكوستيك أو براميل ، يتم إرسالها إلى الكمبيوتر بشكل رقمي ، يجب أولاً تحويلها إلى إشارة كهربائية متناوبة. يتم ذلك عادةً باستخدام الميكروفونات حيث تؤدي اهتزازات جزيئات الهواء الناتجة عن مصدر الصوت إلى تكوين بنية غشائية خفيفة للغاية (3). يمكن أن يكون هذا هو الحجاب الحاجز المضمن في كبسولة مكثف ، أو شريط معدني في ميكروفون شريطي ، أو غشاء مع ملف متصل به في ميكروفون ديناميكي.

في كل من هذه الحالات تظهر إشارة كهربائية متذبذبة ضعيفة جدًا عند خرج الميكروفونوالتي تحافظ إلى حد أكبر أو أقل على نسب التردد والمستوى المقابلة لنفس معلمات جسيمات الهواء المتذبذبة. وبالتالي ، يعد هذا نوعًا من التناظرية الكهربائية لها ، والتي يمكن معالجتها بشكل أكبر في الأجهزة التي تعالج إشارة كهربائية متناوبة.

من البداية يجب تضخيم إشارة الميكروفونلأنه أضعف من أن يتم استخدامه بأي شكل من الأشكال. يكون جهد خرج الميكروفون النموذجي في حدود جزء من الألف فولت ، معبرًا عنه بالميليفولت ، وغالبًا ما يكون بالفولت الميكروي أو أجزاء المليون من الفولت. للمقارنة ، دعنا نضيف أن بطارية تقليدية من نوع الإصبع تنتج جهدًا قدره 1,5 فولت ، وهذا جهد ثابت لا يخضع للتعديل ، مما يعني أنه لا ينقل أي معلومات صوتية.

ومع ذلك ، هناك حاجة إلى جهد التيار المستمر في أي نظام إلكتروني ليكون مصدر الطاقة ، والذي سيقوم بعد ذلك بتعديل إشارة التيار المتردد. كلما كانت هذه الطاقة أنظف وأكثر كفاءة ، كلما قل تعرضها للأحمال الحالية والاضطرابات ، كلما كانت إشارة التيار المتردد التي تتم معالجتها بواسطة المكونات الإلكترونية أنظف. هذا هو السبب في أن مصدر الطاقة ، أي مصدر الطاقة ، مهم جدًا في أي نظام صوت تمثيلي.

4. مكبر الميكروفون ، المعروف أيضًا باسم المضخم الأولي أو المضخم الأولي

مكبرات صوت الميكروفون ، والمعروفة أيضًا باسم المضخمات الأولية أو المضخمات الأولية ، مصممة لتضخيم الإشارة من الميكروفونات (4). مهمتهم هي تضخيم الإشارة ، في كثير من الأحيان حتى عدة عشرات من الديسيبل ، مما يعني زيادة مستواها بمئات أو أكثر. وهكذا ، عند إخراج المضخم ، نحصل على جهد متناوب يتناسب طرديا مع جهد الدخل ، ولكنه يتجاوزه بمئات المرات ، أي عند مستوى من الكسور إلى وحدات فولت. يتم تحديد مستوى الإشارة هذا مستوى الخط وهذا هو مستوى التشغيل القياسي في أجهزة الصوت.

التحول الجزء الثاني

يمكن بالفعل تمرير إشارة تناظرية من هذا المستوى عملية الرقمنة. يتم ذلك باستخدام أدوات تسمى المحولات أو المحولات التناظرية إلى الرقمية (5). عملية التحويل في وضع PCM الكلاسيكي ، أي يتم تحديد تعديل عرض النبض ، وهو وضع المعالجة الأكثر شيوعًا حاليًا ، من خلال معلمتين: معدل أخذ العينات وعمق البت. كما تشك بحق ، كلما زادت هذه المعلمات ، كان التحويل أفضل وكلما زادت دقة الإشارة إلى الكمبيوتر في شكل رقمي.

5. المحول أو المحول التناظري إلى الرقمي.

قاعدة عامة لهذا النوع من التحويل أخذ العينات، أي أخذ عينات من المواد التناظرية وإنشاء تمثيل رقمي لها. هنا ، يتم تفسير القيمة اللحظية للجهد في الإشارة التناظرية ويتم تمثيل مستواها رقميًا في النظام الثنائي (6).

هنا ، ومع ذلك ، من الضروري أن نتذكر بإيجاز أساسيات الرياضيات ، والتي بموجبها يمكن تمثيل أي قيمة عددية في أي نظام رقمي. على مدار تاريخ البشرية ، كانت أنظمة الأرقام المختلفة وما زالت مستخدمة. على سبيل المثال ، تعتمد مفاهيم مثل دزينة (12 قطعة) أو فلس واحد (12 دزينة ، 144 قطعة) على النظام الاثني عشري.

6. قيم الجهد في إشارة تناظرية وتمثيل مستواها في شكل رقمي في نظام ثنائي

بالنسبة للوقت ، نستخدم أنظمة مختلطة - ستيني للثواني والدقائق والساعات ، مشتق الاثني عشر للأيام والأيام ، النظام السابع لأيام الأسبوع ، النظام الرباعي (يتعلق أيضًا بالنظام الاثني عشري والنظام الستيني) لأسابيع في الشهر ، النظام الاثني عشري للإشارة إلى شهور السنة ، ثم ننتقل إلى النظام العشري ، حيث تظهر العقود والقرون والآلاف من السنين. أعتقد أن مثال استخدام أنظمة مختلفة للتعبير عن مرور الوقت يوضح بشكل جيد للغاية طبيعة أنظمة الأرقام وسيسمح لك بالتنقل بشكل أكثر فعالية في القضايا المتعلقة بالتحويل.

في حالة التحويل من التناظرية إلى الرقمية ، سنكون الأكثر شيوعًا تحويل القيم العشرية إلى قيم ثنائية. عشري لأن القياس لكل عينة يُعبر عنه عادةً بالفولتات الدقيقة والميليفولت والفولت. ثم سيتم التعبير عن هذه القيمة في النظام الثنائي ، أي باستخدام بتين يعملان فيه - 0 و 1 ، مما يدل على حالتين: لا يوجد جهد أو وجوده ، متوقف أو قيد التشغيل ، تيار أم لا ، إلخ. وهكذا ، نتجنب التشويه ، وتصبح جميع الإجراءات أبسط بكثير في التنفيذ من خلال تطبيق ما يسمى بتغيير الخوارزميات التي نتعامل معها ، على سبيل المثال ، فيما يتعلق بالموصلات أو المعالجات الرقمية الأخرى.

انت صفر أو واحد

باستخدام هذين الرقمين ، الأصفار والآحاد ، يمكنك التعبير كل قيمة عدديةبغض النظر عن حجمها. كمثال ، ضع في اعتبارك الرقم 10. المفتاح لفهم التحويل من عشري إلى ثنائي هو أن الرقم 1 في النظام الثنائي ، تمامًا كما هو الحال في النظام العشري ، يعتمد على موضعه في سلسلة الأرقام.

إذا كان 1 في نهاية السلسلة الثنائية ، فعندئذٍ 1 ، إذا كان في الثاني من النهاية - ثم 2 ، في الموضع الثالث - 4 ، وفي الموضع الرابع - 8 - الكل في النظام العشري. في النظام العشري ، نفس 1 في النهاية هو 10 ، قبل الأخير 100 ، والثالث 1000 ، والرابع XNUMX هو مثال لفهم القياس.

لذا ، إذا أردنا تمثيل الرقم 10 في الصورة الثنائية ، فسنحتاج إلى تمثيل 1 و 1 ، لذا كما قلت ، سيكون 1010 في المركز الرابع و XNUMX في الثانية ، وهو XNUMX.

إذا احتجنا إلى تحويل الفولتية من 1 إلى 10 فولت بدون قيم كسرية ، أي باستخدام الأعداد الصحيحة فقط ، يكفي المحول الذي يمكن أن يمثل متواليات 4 بت في ثنائي. 4 بت لأن هذا التحويل لرقم ثنائي سيتطلب ما يصل إلى أربعة أرقام. في الممارسة العملية سيبدو كما يلي:

0 0000

1 0001

2 0010

3 0011

4 0100

5 0101

6 0110

7 0111

8 1000

9 1001

10 1010

تلك الأصفار البادئة للأرقام من 1 إلى 7 ببساطة تبطئ السلسلة إلى أربع بتات كاملة بحيث يكون لكل رقم ثنائي نفس الصيغة ويشغل نفس القدر من المساحة. في شكل رسومي ، يظهر في الشكل 7 ترجمة الأعداد الصحيحة من النظام العشري إلى النظام الثنائي.

7. تحويل الأعداد الصحيحة في النظام العشري إلى النظام الثنائي

يمثل كل من الأشكال الموجية العلوية والسفلية نفس القيم ، باستثناء أن الأول مفهوم ، على سبيل المثال ، للأجهزة التناظرية ، مثل مقاييس مستوى الجهد الخطي ، والثاني للأجهزة الرقمية ، بما في ذلك أجهزة الكمبيوتر التي تعالج البيانات على هذه اللغة. هذا الشكل الموجي السفلي يشبه موجة مربعة ذات تعبئة متغيرة ، أي نسبة مختلفة من القيم القصوى إلى القيم الدنيا بمرور الوقت. يشفر هذا المحتوى المتغير القيمة الثنائية للإشارة المراد تحويلها ، ومن هنا جاء اسم "تعديل رمز النبض" - PCM.

عد الآن إلى تحويل إشارة تناظرية حقيقية. نحن نعلم بالفعل أنه يمكن وصفه بخط يصور المستويات المتغيرة بسلاسة ، ولا يوجد شيء مثل التمثيل السريع لهذه المستويات. ومع ذلك ، بالنسبة لاحتياجات التحويل التناظري إلى الرقمي ، يجب أن نقدم مثل هذه العملية حتى نتمكن من قياس مستوى الإشارة التناظرية من وقت لآخر وتمثيل كل عينة تم قياسها في شكل رقمي.

كان من المفترض أن التردد الذي ستُجرى به هذه القياسات يجب أن يكون على الأقل ضعف أعلى تردد يمكن أن يسمعه الشخص ، ولأنه يقارب 20 كيلو هرتز ، وبالتالي ، فإن أكثر لا يزال 44,1 كيلو هرتز معدل عينة شائع. يرتبط حساب معدل أخذ العينات بعمليات رياضية معقدة نوعًا ما ، والتي ، في هذه المرحلة من معرفتنا بطرق التحويل ، لا معنى لها.

المزيد هل هو أفضل؟

كل ما ذكرته أعلاه قد يشير إلى أنه كلما زاد تكرار أخذ العينات ، أي قياس مستوى الإشارة التناظرية على فترات منتظمة ، كلما زادت جودة التحويل ، لأنه - على الأقل بالمعنى البديهي - أكثر دقة. هل هذا صحيح حقا؟ سنعرف عن هذا في غضون شهر.

إضافة تعليق