نقدم انتباهكم إلى مقال مع تحليل تفصيليرأس ملف WAV وهيكله.
لذلك ، دعونا نلقي نظرة على ملف WAV الأكثر شيوعًا (Windows PCM). إنه يمثل منطقتين منفصلتين بشكل واضح. أحدهما هو رأس الملف والآخر هو منطقة البيانات. يخزن رأس الملف معلومات حول:
ولكن من أجل فهم أفضل لمعنى القيم في العنوان ، يجب أن نتحدث أيضًا عن منطقة البيانات ورقمنة الصوت. يتكون الصوت من اهتزازات تكتسب مظهرًا متدرجًا عند رقمنتها. يرجع هذا النوع إلى حقيقة أن الكمبيوتر يمكن أن ينتج في أي فترة زمنية قصيرة صوتًا ذا سعة معينة (جهارة الصوت) وهذه اللحظة القصيرة بعيدة عن أن تكون قصيرة بشكل غير محدود. تحدد مدة هذا الفاصل الزمني معدل أخذ العينات. على سبيل المثال ، لدينا ملف بمعدل أخذ عينات يبلغ 44.1 كيلو هرتز ، مما يعني أن هذا الفاصل الزمني القصير هو 1/44100 من الثانية (يتبع من بُعد القيمة Hz = 1 / s). تدعم بطاقات الصوت الحديثة معدلات أخذ العينات حتى 192 كيلو هرتز. لذلك ، بمرور الوقت توصلنا إلى حلها.
الآن ، فيما يتعلق بالسعة (حجم الصوت في فترة زمنية قصيرة). أقول إن دقة الصوت تعتمد عليه. يتم التعبير عن السعة بالرقم المشغول في الذاكرة (ملف) 8 ، 16 ، 24 ، 32 بت (نظريًا ، من الممكن المزيد). كما تعلم ، 8 بت = 1 بايت ، لذلك ، أي سعة واحدة في فترة قصيرة من الوقت في الذاكرة (ملف) يمكن أن تأخذ 1 ، 2 ، 3 ، 4 بايت ، على التوالي. اذا رقم أكثريشغل مساحة في الذاكرة (ملف) ، كلما زاد نطاق القيم لهذا الرقم ، وبالتالي للسعة.
في الإصدار الأحادي ، تكون قيم الاتساع متسلسلة. في الاستريو ، على سبيل المثال ، تأتي أولاً قيمة السعة للقناة اليسرى ، ثم لليمين ، ثم لليسار مرة أخرى ، وهكذا.
يسمى الجمع بين السعة وفترة زمنية قصيرة عينة.
الآن جدول يوضح هيكل ملف WAV.
موقع | حقل | وصف |
---|---|---|
0..3 (4 بايت) | chunkId | يحتوي على أحرف "RIFF" في ترميز ASCII (0x52494646 بالتدوين الكبير). إنها بداية سلسلة RIFF. |
4..7 (4 بايت) | حجم قطعة | هذا هو حجم السلسلة المتبقي من هذا الموضع. بمعنى آخر ، هذا هو حجم الملف - 8 ، أي ، يتم استبعاد حقلي chunkId و chunkSize. |
8..11 (4 بايت) | صيغة | يحتوي على أحرف "WAVE" (0x57415645 بالتدوين الكبير) |
12..15 (4 بايت) | subchunk1Id | يحتوي على الأحرف "fmt" (0x666d7420 بالتدوين الكبير) |
16..19 (4 بايت) | الحجم | 16 للشكل PCM... هذا هو الحجم المتبقي للسلسلة من هذا الموضع. |
20..21 (2 بايت) | صيغة صوتية | صيغة صوتية، القائمة الكاملةيمكنك الحصول عليه. ل PCM= 1 (أي التكميم الخطي). تشير القيم بخلاف 1 إلى بعض تنسيقات الضغط. |
22..23 (2 بايت) | عدد القنوات | عدد القنوات. أحادي = 1 ، استريو = 2 ، إلخ. |
24..27 (4 بايت) | معدل العينة | تردد أخذ العينات. 8000 هرتز ، 44100 هرتز ، إلخ. |
28..31 (4 بايت) | بايت | عدد البايت المنقولة في الثانية من التشغيل. |
32..33 (2 بايت) | blockAlign | عدد البايت لعينة واحدة ، بما في ذلك جميع القنوات. |
34..35 (2 بايت) | بت لكل عينة | عدد البتات في العينة. ما يسمى ب "عمق" أو دقة الصوت. 8 بتات ، 16 بت ، إلخ. |
36..39 (4 بايت) | subchunk2Id | يحتوي على الأحرف "البيانات" (0x64617461 بالتدوين الكبير) |
40..43 (4 بايت) | الحجم | عدد البايت في منطقة البيانات. |
44.. | البيانات | بيانات WAV مباشرة. |
هذا هو العنوان بالكامل ، والذي يبلغ طوله 44 بايت ، متبوعًا بكتلة من البيانات التي وصفتها بالفعل أعلاه.
في الواقع ، من الواضح أنه يمكن تغيير أنواع البيانات المستخدمة. على سبيل المثال ، في C (MSVS) ، يمكن استخدام __int32 أو DWORD مع مصفوفة char ، ولكن بعد ذلك قد لا تكون المقارنة مع بعض ثابت السلسلة ، على سبيل المثال ، ملائمة جدًا. أود أيضًا أن أحذرك من تأثير أسلوب 64 بت الجديد على البرامج. وهي: من الجدير دائمًا أن نتذكر أنه في لغة C ، سيكون طول نوع متغير int في نظام 64 بت 8 بايت ، وفي نظام 32 بت - 4 بايت. في مثل هذه الحالات ، يمكنك استخدام نوع المتغير __int32 أو __int64 المذكور أعلاه ، اعتمادًا على حجم المتغير في الذاكرة الذي تحتاجه. هناك أنواع __int8 و __int16 و __int32 و __int64 ، وهي متوفرة فقط لمترجم MSVC ++ من الإصدار 7 على الأقل (Microsoft Visual Studio 2003.NET) ، ولكن لا يمكنك أن تخطئ في اختيار حجم نوع البيانات .
اقرأ أيضا:
|
الخام- شكل بيانات يحتوي على بيانات خام. تحتوي هذه الملفات على ملفات معلومات كاملةحول الإشارة المخزنة. في حالة معالجة الصوت ، يشير RAW إلى البيانات الصوتية بدون ضغط أو رؤوس.
PCMيرمز إلى تعديل شفرة النبض ويوفر تمثيلًا رقميًا للإشارة التناظرية ، والتي يتم أخذ عينات منها (مرقمًا) على فترات منتظمة (بتردد محدد بالهرتز) ويتم تمثيلها في ثنائي (بدقة محددة - عرض بت). بالإضافة إلى استخدام PCM للصوت الرقمي في الكمبيوتر وعلى الأقراص المضغوطة الصوتية ، فإنه يُستخدم أيضًا في بعض أنظمة الهاتف الرقمية وفي عدد من تنسيقات الفيديو الرقمية.
في تنسيق PCM ، يتم تمثيل قيم سعة الصوت باستخدام أرقام مختلفةبت (الطول) ؛ عادةً ما يتم ترقيم الصوت في 12 إلى 24 بت ، ولكن غالبًا ما يتم استخدام 16 بت في ترميز استوديو PCM لأقراص Blu-ray.
WAV (موجة)- تنسيق حاوية الملفات لتخزين تسجيل الدفق الصوتي الرقمي. تحت Windows ، يتم استخدام هذا التنسيق بشكل شائع كغلاف للصوت غير المضغوط (PCM). يمكن وضع الصوت المضغوط باستخدام أي برنامج ترميز تقريبًا في حاوية WAV (ولكن قد تظهر مشكلات في تشغيل مثل هذه الملفات).
الهيكل: يتكون من ثلاثة رؤوس متبوعة ببيانات ملف الصوت نفسه ، أي تسلسل البايت للإشارة الصوتية نفسها.
الأول هو رأس RIFF. يستغرق 8 بايت من بداية الملف ويحتوي على معلومات حول طول الملف
يحتوي الرأس الثاني - رأس WAV على معلومات حول عدد القنوات (أحادية أو ستيريو)
الرأس الثالث - معلومات حول عدد البايتات المخصصة لبيانات WAV نفسها
آبل AIFF.هذا هو تنسيق الملف القياسي لحفظ بيانات الصوت على نظام Macintosh الأساسي. تكمن خصوصيته في أنه يسمح لك بوضع معلومات إضافية مع الموجة الصوتية ، على وجه الخصوص ، عينات WaveTable (أمثلة على صوت الآلات مع معلمات المزج) ، مما يحسن جودة النتيجة النهائية.
بيانات الصوت في ملف AIFF القياسي هي PCM غير مضغوط. هناك أيضًا نسخة مضغوطة من تنسيق AIFF ، والتي تسمى AIFC (أحيانًا AIFF-C) ، حيث يمكن استخدام العديد من برامج الترميز للضغط.
يعد AIFF ، جنبًا إلى جنب مع SDII و WAV ، أحد التنسيقات المستخدمة في تطبيقات الصوت والفيديو الاحترافية ، لأنه على عكس تنسيق mp3 الأكثر شيوعًا ، فإنه لا يفقد الجودة.
ريف- أحد تنسيقات ملفات الحاويات لتخزين بيانات الوسائط المتعددة المتدفقة (فيديو ، صوت ، ربما نص). أشهر التنسيقات التي تستخدم RIFF كحاوية هي: AVI (فيديو) ، WAV (صوت) ، RMI (مسارات MIDI).
RIFF له حد حجم بيانات 2 جيجا بايت.
يحتوي ملف RIFF على أجزاء متداخلة مع بيانات من نفس النوع ؛ يتكون الجزء الخارجي من رأس ومنطقة بيانات.
البنية: تحدد الكلمة المزدوجة الأولى من الرأس البيانات المخزنة في المقطع. الكلمة المزدوجة الثانية للرأس هي حجم منطقة البيانات بالبايت (باستثناء حجم الرأس نفسه).
مساحة البيانات متغيرة الطول ، ولكن يجب أن تكون محاذاة للكلمات (مبطن في النهاية مع صفر بايت إلى عدد صحيح من الكلمات إذا لزم الأمر).
لقد تلقيت مؤخرًا البريد الإلكتروني التالي:
موقع مرحبًا ، MP3 هو تنسيق الصوت الأكثر شيوعًا ، ولكن هناك العديد من التنسيقات الأخرى مثل AAC و FLAC و OGG و WMA التي لست متأكدًا حقًا من التنسيق الذي يجب أن أستخدمه. ما الفرق بينهما وأيهما يجب أن أستخدمه لتخزين الموسيقى الخاصة بي؟
السؤال شائع جدًا ، سأحاول الإجابة عليه بطريقة بسيطة ولكن مفهومة.
لقد تحدثنا بالفعل عن الفرق بين ضياع وخسارة ، ولكن باختصار ، هناك نوعان من جودة الصوت:
يحتفظ تنسيق Lossless بجودة الصوت الكاملة ، في معظم الحالات ، على مستوى القرص المضغوط ، بينما يقوم تنسيق Lossless بضغط الملفات لتوفير مساحة (بالطبع ، تتدهور جودة الصوت).
إذا كنت ترغب فقط في الاستماع إلى الموسيقى هنا والآن ، فمن المحتمل أنك ستستخدم تنسيقًا ضائعًا. إنها توفر قدرًا كبيرًا من الذاكرة ، مما يترك لك مساحة أكبر للأغاني على المشغل المحمول ، وإذا كانت عالية بما يكفي ، فلن يمكن تمييزها عن المصدر الأصلي. فيما يلي التنسيقات التي من المحتمل أن تصادفها:
الآن بعد أن فهمت الفرق بين كل تنسيق ، ما الذي يجب عليك استخدامه لنسخ الموسيقى الخاصة بك أو تنزيلها؟ بشكل عام ، نوصي باستخدام MP3 أو AAC. إنها متوافقة مع كل قرص دوار تقريبًا ولا يمكن تمييز كلاهما عن الأصل إذا. إذا لم يكن لديك الاحتياجات الخاصةمما يوحي بخلاف ذلك ، فإن MP3 و AAC هما أفضل الخيارات.
ومع ذلك ، هناك شيء يمكن قوله حول تخزين الموسيقى الخاصة بك بتنسيق غير ضياع مثل FLAC. بينما ربما لن تلاحظ المزيد جودة عاليةتعتبر ميزة "بلا خسائر" رائعة لتخزين الموسيقى إذا كنت تخطط لتحويلها إلى تنسيقات أخرى لاحقًا ، حيث إن تحويل تنسيق ضياع إلى تنسيق آخر غير ضائع (مثل AAC إلى MP3) سيؤدي إلى ملفات أكبر بشكل ملحوظ جودة منخفضة. لذلك ، لأغراض الأرشفة ، نوصي FLAC... ومع ذلك ، يمكنك استخدام أي تنسيق بدون فقدان حيث يمكنك التحويل بين تنسيقات غير ضائعة دون تغيير جودة الملف.
إعلان
تم إنشاء ملفات WAV (WAVE) بواسطة IBM و Microsoft. أنها تحتوي على مجموعة متنوعة من البيانات الصوتية - الأصوات والمؤثرات الصوتية والموسيقى والتسجيلات الصوتية. يمكن لبرامج تشغيل الوسائط (Windows Media Player و QuickTime وما إلى ذلك) تشغيل هذه الملفات وفتحها. ملفات WAV أكبر بكثير من ملفات MP3 ، وهذا هو سبب عدم شعبيتها. سمة مميزةملفات WAV هي تقنية ضغط الصوت بدون فقدان البيانات. الملفات الناتجة ذات جودة عالية وكبيرة الحجم ، مما يضر بشعبيتها بشكل كبير. يستغرق إرسال مثل هذه الملفات وتنزيلها الكثير من الوقت ومساحة القرص.
تستخدم ملفات WAV تنسيق ملف تبادل الموارد المستخدم لتخزين البيانات. يتم تخزين البيانات في مجموعات تحتوي على علامة مكونة من 4 أحرف وعدد البايتات في المجموعة. التناظرية لهذا التنسيق لنظام التشغيل Mac OS هي ملفات AIFF. يمكن أخذ عينات من ملفات WAV من 8 إلى 16 بت بترددات من 11025 إلى 44100 هرتز. أقصى جودة لملفات WAV هي 16 بت ، 44100 هرتز ، وهذا هو معدل أخذ العينات لمسارات القرص المضغوط ، حيث "تزن" ثانية الصوت 88 كيلو بايت. عند ترميز دفق رقمي ، يتم استخدام تنسيق PCM الخطي عادةً. أصوات النظام في نظام التشغيل Windows عند بدء تشغيل نظام التشغيل ، والنقر على الاختصارات ، وعند عرض الأخطاء ، وإيقاف تشغيل الكمبيوتر ، وما إلى ذلك. هي ملفات WAV غير مضغوطة.
امتداد الملف | .wav |
فئة الملف | |
ملف مثال | (6.1 ميجابايت) (1.5 ميغا بايت) |
البرامج ذات الصلة | برنامج CyberLink PowerDirector مايكروسوفت ويندوز ميديا بلاير روكسيو كرياتور 2009 |