Обробка звуку

цілі роботи
1. Аудіо інформація в управлінні
2. Фізичні основи цифрового звукозапису
3. Формати зберігання аудіоінформації
4. Про вибір технічних засобів цифрового звукозапису
5. Цифровий запис мови
6. Програмні засоби обробки аудіо інформації
7. Індивідуальне завдання
8. Контрольні питання
9. Вимоги до звіту
10. Джерела

- вивчення використання коштів роботи з аудіо інформацією в управлінні організацією;
- освоєння принципів вибору техніки цифрового звукозапису і обробки аудіо файлів;
- оволодіння практичними навичками використання он-лайн сервісів для обробки аудіо файлів.

цілі роботи

- вивчення використання коштів роботи з аудіо інформацією в управлінні організацією;

- освоєння принципів вибору техніки цифрового звукозапису і обробки аудіо файлів;

- оволодіння практичними навичками використання он-лайн сервісів для обробки аудіо файлів.

наверх

1. Аудіо інформація в управлінні

Управлінська діяльність пов'язана з обробкою інформації, яка може представлятися в найрізноманітніших формах, в тому числі, у вигляді відео-та аудіо фрагментів.
Можливості використання звукової інформації в управлінні різноманітні. Перш за все, це фіксація процесу ділових переговорів, нарад, конференцій і т.п., потім автоматичне розпізнавання мови і зворотна задача читання текстів, представлених в електронному вигляді.
Обробка звукової інформації так само може знадобитися при створенні звукового супроводу презентацій і навчальних програм.
Подібні завдання виникають, наприклад, при необхідності забезпечити доступ для людей з вадами зору користувачів до інформації на сайті організації.
У будь-якому випадку, при вирішенні зазначених завдань створюється або використовується раніше створений «звуковий файл», тобто файл, який зберігає в цифровій формі аудіо інформацію.

наверх

2. Фізичні основи цифрового звукозапису

Звук являє собою пружні хвилі механічних коливань, які розповсюджуються в твердій, рідкому або газоподібному середовищі. Як і будь-яка хвиля, звук характеризується амплітудою і спектром частот. Амплітуда звукових коливань сприймається людиною як гучність, а частота коливань як висота тону звуку. Звичайна людина здатна чути звукові коливання в діапазоні частот від 16-20 Гц до 15-20 кГц. При записи і наступному відтворенні звуку проводиться ряд перетворень сигналу, характер яких змінюється в залежності від обраного способу збереження звуку і використовуваних технологій. Загальна послідовність перетворень показана на рис.1 [1].

Малюнок 1. Схема перетворення сигналу під час запису-відтворення звуку [1]

Перш за все, звукові коливання повітря перетворюються в механічні коливання чутливого елемента - мембрани.

При механічного звукозапису коливання мембрани передаються на жорстко пов'язаний з нею різець, який прорізає канавку на стінці циліндра (отримаємо фонограф) або на поверхні диска (отримаємо грамофон). При відтворенні голка, що рухається по канавці, передає коливання на пружну мембрану, яка випромінює звук. Звук посилюється за допомогою рупора.

Механічні коливання мембрани можна перетворити в електричний сигнал. Для цього використовується мікрофон.

У конденсаторному мікрофоні (і його різновиди - електретні мікрофоні) мембрана з'єднана з рухомою пластиною конденсатора. Її коливання змінюють відстань між пластинами, а тим самим, ємність конденсатора, що в свою чергу змінює електричну напругу. Таким чином, отримуємо коливання у вигляді змін напруги, відповідні вступнику на мікрофон звуку. Для підтримки заряду на пластині конденсаторного мікрофона потрібно подати напругу від батареї або по мікрофонному кабелю.

У динамічному мікрофоні коливання мембрани передаються сердечника котушки індуктивності, в результаті його переміщення в магнітному полі виникає змінний струм, коливаннями і амплітудою відповідний звуковим сигналом, що надійшов на мембрану. Динамічний мікрофон не вимагає подачі зовнішнього живлення.

Отримані від мікрофона електричний сигнал можна направити на лампу розжарювання і зафіксувати зміну її світності на кіноплівці (так озвучуються кінофільми). Той же електричний сигнал можна направити на магнітну головку магнітофона і зберегти «копію» звуку на стрічці магнітофона.

У всіх розглянутих випадках (фонограф, грамофон, оптична і магнітний запис) на фізичний носій записується сигнал таким чином, щоб пристрій відтворення справляло коливання і створювало звукові хвилі аналогічні тим, що були отримані при збереженні. Це - аналогова запис. Щоб мати можливість обробляти звук за допомогою комп'ютера, аналогову запис необхідно перетворити в дискретну, яку можна описати (закодувати) в вигляді послідовності чисел. Таку операцію називають оцифруванням.

Основну ідею оцифровки ілюструє рис.2.

Малюнок 2 Дискретизація аналогового сигналу

Електрична напруга, що представляє собою аналог звукового сигналу, вимірюється з певним часовим кроком Δ t, званим кроком дискретизації. Кількість замірів величини сигналу, що здійснюються в одну секунду, називають частотою дискретизації або частотою вибірки, або частотою семплірованія (від англ. «Sampling» - «вибірка»). Чим менше крок, тим правдивіше більша їх кількість і тим більш точне уявлення про сигнал буде отримано.

Щоб аналоговий сигнал точно описувався дискретними значеннями його амплітуди, частота дискретизації повинна бути як мінімум удвічі більше найвищої частоти спектра сигналу (теорема Котельникова). Практично це означає, що для того, щоб оцифрований сигнал містив інформацію про все діапазоні чутних частот вихідного аналогового сигналу (0 - 20 кГц) необхідно, щоб вибране значення частоти дискретизації становило не менше 40 кГц.

Таким чином, замість безперервно змінюється сигналу (електричної напруги), отримуємо набір чисел, кожне з яких відповідає певному значенню напруги. Для зберігання цих чисел може відводитися певна кількість розрядів (біт), і для запису кожного окремого значення амплітуди, його необхідно округлити до найближчого рівня квантування (рис.3). Цей процес носить назву квантування по амплітуді. Квантування по амплітуді - процес заміни реальних значень амплітуди сигналу значеннями, наближеними з деякою точністю.

Квантування по амплітуді - процес заміни реальних значень амплітуди сигналу значеннями, наближеними з деякою точністю

Малюнок 3 Похибка квантування при різній розрядності

Точність округлення залежить від кількості біт (N), відведених для запису значення амплітуди. Число N називають розрядністю квантування або бітової глибиною, а отримані в результаті округлення значень амплітуди числа - отсчетами або семплами (від англ. «Sample» - «завмер»). Вважається, що похибки квантування при семплах в 16 біт, залишаються для слухача майже непомітними.

При збереженні в пам'яті комп'ютера результати кодуються, тобто використовуються не самі результати вимірювання, а числа, що відповідають номеру рівня квантування. Крім того, при кодуванні виконується стиснення: відкидаються дані, які не впливають на сприйняття звуку.

Операції перетворення вхідного аналогового сигналу в дискретний код - дискретизація, квантування і кодування - виконується спеціальним пристроєм - аналого-цифровим перетворювачем (АЦП).

Для відтворення цифрового запису виконаються зворотна ланцюжок операцій:

- дискретний сигнал розкодовується і перетворюється в безперервний аналоговий, для чого служить цифро-аналоговий перетворювач (ЦАП);

- отриманий електричний сигнал посилюється і подається на магнітну котушку електродинамічної акустичної системи або на пластину електростатичного системи;

- переміщення котушки або пластини динаміка передається дифузора, який і створює чутні звукові хвилі.

наверх

3. Формати зберігання аудіоінформації

Отримані в результаті оцифровки дані зберігаються в файлах одного з аудіо форматів.

Основні характеристики аудіо форматів:

Розрядність квантування - число розрядів для зберігання одного семпли, зазвичай 16 b, 24 b, 32 b, рідко - 64 b і більш.

Частота дискретизації - кількість сигналів, заміряються в секунду, приймає значення 22; 44,1; 48, ..., 192 кГц.

Швидкість потоку (швидкість) - кількість біт, що використовуються для зберігання однієї секунди мультимедійного контенту. Характеризує ступінь стиснення потоку, за величиною бітрейта оцінюється швидкість передачі потоку в бітах або кілобітах в секунду, типові значення 64 kbps, 128 kbps, ..., 320 kbps. Для Audio DVD бітрейт може досягати 6912 kbps.

Формати аудіо файлів також відрізняються:

- можливістю створювати теги файлів, тобто зберігати в файлі довідкову інформацію про записи;
- програмним забезпеченням, яке необхідно для запису і відтворення звуку;
- технічними пристроями, які призначаються для створення, відтворення та обробки звуку в певному форматі.

Налічується кілька десятків різних форматів аудіо файлів. Багато виробників цифрових звукозаписних пристроїв розробляють власні формати зберігання аудіо даних. Щоб програми обробки цифрового звуку могли «розуміти» нові формати на комп'ютері встановлюються кодеки. Кодек (від ко складованої / дек одіровать) - це невелика програма, яка виконує перетворення (кодування або розкодування) сигналу з одного формату в інший.

Поширені формати аудіо файлів

Audio - формат для запису на оптичні диски (CD-Rom), в цьому форматі зберегти звуковий файл на іншому пристрої неможливо. При перегляді в провіднику або файловому менеджері треки оптичного диска відображаються тільки ярликом звукової доріжки, наприклад Track01.cda. Ступінь стиснення 1: 1 (без стиснення). Типові властивості: 16 b /44.1 kHz / 1411,2 kbps.

wav - використовується як контейнер для зберігання нестислого звуку, при цьому алгоритми кодування можуть відрізнятися, тому і властивості можуть відрізнятися, звичайні значення: 16 b / любая / до 6,144 kbps. Порівняємо за якістю із записом на аудіо диск. Не дозволяє зберігати теги.

mp3 - один з найпоширеніших форматів цифрового кодування звукової інформації з втратами. Належить до групи стандартів на формати зберігання MPEG (Moving Picture Experts Group). Типові властивості 16 b /44.1 kHz / 128 kbps. При цьому ступінь стиснення досягає 1:11 до розміру оригінального файлу з CD-audio. Відтворюється практично всіма сучасними пристроями.

wma - (Windiws Media Audio) - система кодування звуку, розроблена компанією Microsoft. Якість звучання і середні характеристики практично ідентичні формату МРЗ. Дозволяє встановлювати захист авторських прав і обмежувати поширення записів за допомогою DRM (Digital rights management). У цьому форматі зберігається звук, записаний за допомогою стандартної програми Windows «Звукозапис». Відтворюється більшістю пристроїв.

Ogg \ Vorbis - контейнер, що дозволяє зберігати дані, закодовані з втратами в форматах Vorbis, Opoos, Speex або без втрат в форматі FLAC. Розробляється Xiph.Org Foundation - фондом створення іпродвіженія вільного програмного забезпечення. На використання немає патентних або ліцензійних обмежень. Характеристики: до 32 b / до 193 kHz / до 1000 kbps.

m4 a - один з форматів Advanced Audio Coding (AAC) - формат аудіофайлу і алгоритму кодування з меншою, ніж у mp3 втратою якості при кодуванні з однаковими бітрейтами. Зазвичай використовується в мобільних пристроях - смартфонах, планшетах. Варіанти формату: m4 b - використовується для аудіо книг; m4 p - використовується для захисту файлу від копіювання при завантаженні музики в онлайн-магазинах; m4 r - файли рингтонів. Характеристики 16 b /44.1 kHz / 128 kbps, розпізнаються більшістю пристроїв.

dss - Digital Speech Standard File, спеціальний цифровий формат для запису мови. Забезпечує високий ступінь стиснення при відносно невисокій якості. Зазвичай має характеристики 16 b / 22 kHz / 64 kbps. Використовується в диктофонах і інших мобільних пристроях. Для відтворення потрібна спеціальна програма, наприклад, Olympus DSS Player або конвертація файлу в один з більш популярних форматів.

наверх

4. Про вибір технічних засобів цифрового звукозапису

Вибір технічних засобів цифрового звукозапису визначається призначенням записи і умовами, в яких вона буде виконуватися і використовуватися. Створення музичних тиражованих записів вимагає використання високоякісної професійної апаратури для запису і відтворення, а також залучення професійних звукорежисерів та операторів. Для описаних в першому розділі цілей зазвичай необхідно записати лише мова, причому вимоги до діапазону сприйманих частот, точності відтворення та ін., Можна трохи знизити в порівнянні з вимогами до запису музичних композицій. Тому в подальших розділах розглядаються ті кошти, які можуть бути доступні практично в будь-якій організації.

Під мобільними пристроями звукозапису будемо розуміти цифрові диктофони і записуючим пристроєм, відео камери, мобільні телефони, що мають функцію диктофона.

Для вибору пристрою звукозапису можна дати наступні, найзагальніші, рекомендації.

Спеціалізований пристрій завжди краще універсального: при одній ціні пристрою диктофон дозволить отримати кращу якість, ніж телефон з функцією диктофона.

У мобільних телефонах і диктофонах часто використовуються формати аудіофайлів, розроблені виробником пристрою і вимагають конвертації в більш поширені формати для використання цих записів в інших пристроях (комп'ютерах або програвачах).

Диктофони і записуючим пристроєм призначені для одних цілей і чіткої межі між цими пристроями немає. Диктофони орієнтовані, перш за все, для запису мови, відрізняються невисокою частотою дискретизації (22 кГц) і невисокою якістю вбудованого мікрофона. Можливості рекордеров ширше - від запису звуків природи до малобюджетной записи альбомів музичних груп. У рекордерах використовуються якісні вбудовані мікрофони, існує можливість підключення зовнішніх мікрофонів і запису з лінійного входу, підтримуються формати запису без стиснення або з низьким стисненням.

Якщо для отримання аудіозапису використовується відео камера або цифровий фотоапарат в режимі відео, то так само виникає необхідність конвертації відео формату в аудіо формат.

При виборі мобільних пристроїв цифрового звукозапису слід розглядати такі параметри.

Тип запису - моно або стерео.

Формат запису - wav, mp3 або один із спеціальних форматів виробника (буде потрібно конвертація).

Обсяг пам'яті, підтримка змінних карт.

Якість вбудованого мікрофона - чутливість, діапазон робочих частот, спрямованість, рівень шумів.

Можливість підключення зовнішніх мікрофонів.

Параметри оцифровки сигналу: частота дискретизації, квантування, бітрейт.

Підключення до комп'ютера: по USB (обмін швидше) або по аудіо виходу на вхід звукової карти (потрібна програма звукозапису).

Харчування - вбудований або змінний акумулятор, можливість використання батарейок формату АА або ААА.

Індикація - візуальний контроль рівня запису, обсягу вільної пам'яті, рівня зарядки акумулятора.

Список моделей мобільних пристроїв для звукозапису оновлюється ледь не щомісяця. На даний час (лютий 2015 г.) можна назвати наступні моделі популярних за даними Яндекс-маркет пристроїв (виробник / модель):

- цифрові диктофони Sony (ICD-UX543 / BC, ICD-SX733, ICD-BX112), Ritmix (RR-100, RR-850, RR-600), Olympus (LS-3, LS-11, DM-5, WS -812, WS-650S);

- аудіо рекордер Zoom (H6, Q2HDB, H1), Tascam (DR-07mkII, DR-100 MKII, DR-40), Sony (PCM-D100, PCM-M10, MZ-RH10 /

З характеристиками моделей можна ознайомитися на сайтах виробників або продавців аудіо техніки.

наверх

5. Цифровий запис мови

Можливі різні способи отримання цифрового аудіозапису:

- можна записати звук за допомогою автономного устрою (мобільного телефону, цифрового диктофона, аудіо рекордера, відеокамери), а потім перенести отриманий файл на диск комп'ютера і при необхідності конвертувати в потрібний формат. Послідовність операцій записи визначаються обраним пристроєм;

- запис можна створити за допомогою мікрофона, підключеного до звукової карти стаціонарного комп'ютера або вбудованого мікрофона ноутбука. При цьому потрібно одна з програм звукозапису.

У стаціонарному комп'ютері зовнішній мікрофон підключається до звукової плати. Найчастіше це так званий «мультимедійний» мікрофон ( «гусяча шия») - електретний мікрофон, як правило, не дуже високої якості, може входити до складу гарнітури (навушники + мікрофон) або забезпечуватися гнучкою підставкою. Характеризуються високим рівнем шумів, всенаправленной діаграмою спрямованості, вузьким діапазоном сприйманих частот.

Зовнішній мікрофон підключають штекером 3.5 мм до гнізда звукової плати, зазвичай забарвленого в той же колір, що і штекер мікрофона або позначеному піктограмою мікрофона (рис. 4).

Малюнок 4 Роз'єми звукової плати зліва направо: мікрофон, лінійний вхід, вихід на динаміки

Швидше за все, може знадобитися налаштування мікрофону. Діалоги настройки і спосіб їх виклику залежать від того, яка звукова плата встановлена. На рис. 5. показаний діалог настройки для драйвера RealTek High Definition Audio Codecs однойменної карти. У діалозі налаштування встановлюється рівень запису, посилення, змінювані характеристики формату запису. Можна дати наступні рекомендації:

- рівень запису встановлюйте примерно в середіні шкали, щоб Зменшити вікрівлення гучніх звуків;
- Посилення при запісі мови НЕ слід задаваті більше 10 дб, Щоб не запісуваті навколішні шуми;
- при запису мови досить встановити формат «якість компакт диска».

Малюнок 5 Діалог настройки мікрофона в диспетчері Realtek

Для інших аудіо карт настройка здійснюється аналогічно.

Такі ж настройки можна виконати, якщо з контекстного меню аудіо вибрати пункт «Записуючі пристрої», потім вкладку «Запис», виділити мікрофон в списку пристроїв і натиснути кнопку «Властивості». При цьому рівень запису і посилення встановлюються на вкладці «Рівні», додаткові можливості включаються на вкладці «Поліпшення», а вибір формату файлу здійснюється на вкладці «Додатково» (рис.6).

Малюнок 6 Діалог настройки властивостей мікрофона (п. «Звуки» контекстного меню аудіо)

Найпростіше програмний засіб для запису стандартна програма Windows «Звукозапис». Вона запускається через меню «Пуск» - «Всі програми» - «Службові» - «Звукозапис» (для Windows XP: «Пуск» - «Всі програми» - «Службові» - «Розваги» - «Звукозапис»).

Все управління записом складається в натисканні кнопок «Почати запис» і «Зупинити запис» (рис.7)

Малюнок 7 Вікно програми перед початком і в процесі запису

Після натискання кнопки «Зупинити» відкриється стандартний діалог збереження файлу. Файл буде збережений у форматі Windiws Media Audio з розширенням wma. Якщо відмовитися від збереження файлу, то програма запропонує відновити запис, таким чином можна організувати паузу під час запису.

Існує безліч інших програм, що дозволяють отримати запис не тільки з мікрофонів, а й з лінійного входу, інтернет-радіо і з інших джерел. Ці програми відрізняються можливостями для настройки, різноманітністю форматів для збереження записів, різними функціями контролю і обслуговування.

Серед безкоштовних і умовно безкоштовних можна вказати:

Free Audio Recorder (http://www.accmeware.com /)

Power Sound Editor Free (http://www.free-sound-editor.com/download.html)

Free Sound Recorder (http://www.sound-recorder.biz/download_freesoundrecorder.html)

У більшість цих програм включені кошти для редагування аудіо файлів.

Основні недоліки описаної технології:

- невисока якість запису, пов'язане з низькими характеристиками застосовуваного мікрофона;
- відсутність мобільності при використанні стаціонарного комп'ютера.

Зазвичай запис створюється засобами мобільного пристрою, а потім обробляється і відтворюється на комп'ютері.

наверх

6. Програмні засоби обробки аудіо інформації

Ця назва об'єднує дуже різні за призначенням програми.

Програми розпізнавання мови забезпечують перетворення мовного сигналу в цифрову інформацію, представлену, наприклад, у вигляді тексту. Використовуються для голосового управління інформаційними системами, голосового введення тексту, голосового пошуку і т.п. Вимагають чіткої артикуляції і ясності мови, чутливі до шуму.

Приклади: голосове введення текстів Dragon NaturallySpeaking (www. Nuance. Com / dragon /), RealSpeaker (realspeaker. Net / ru /), програмне забезпечення для систем контактних центрів VoiceNavigator (www. Voicenavigator. Ru).

Існує кілька он-лайн сервісів для голосового створення текстів, наприклад, «Голосовий блокнот» (www. Speechpad. Ru) і «Інтернет-диктування» (www.Dictation.io), обидва сервісу працюють з оглядачем Chrome, вимагають установки розширення «Голосовий введення тексту »і використовують движок« Google-голосовий пошук »для розпізнання.

Програми синтезу мови вирішують зворотну задачу генерації мовного сигналу по тексту. Використовуються для допомоги сліпим і німим, для управління людиною з боку комп'ютера, в інформаційно-довідкових системах, наприклад, для передачі оголошень про відправлення поїздів. Поки, синтезовану мову можна відразу ж відрізнити від голосу людини.

Приклади програм: Acapela (www.acapela-group.com/ на сайті можна прослухати приклади синтезу мови по введеному короткому тексту), Vokalizer (www.nuance.com), вітчизняна розробка RHVoice (www.tiflo.info/rhvoice/).

Аудіо редактори - програми для редагування цифрового звукозапису з метою усунення дефектів запису або створення певних ефектів.

Основні функції аудіо редактора:
- запис звукового сигналу, що надходить з входу звукової плати. Зазвичай проводиться без стиснення;
- відтворення звукового сигналу використовується в редакторі для контролю виконаних операцій;
- відображення звукового сигналу у вигляді послідовності відліків, які об'єднані однією обвідної, відповідної амплітуді звукового сигналу, званої сигналограмма або хвильової формою (рис.8). Таке відображення дозволяє візуально виявляти місця необхідних змін;
- перетворення звуку:

усунення сторонніх звуків,
придушення шумів,
видалення або вставка пауз,
зміна гучності,
створення наростання або затухання звуку і багато іншого.

Одним з часто використовуваних перетворень є нормалізація - процес вирівнювання гучності, щодо будь-якого рівня, наприклад, до максимально можливого значення для цифрового звуку без появи перекручувань (пікова нормалізація) або по середньоквадратичного значення рівня звуку в файлі (RMS-нормалізація);

- створення і редагування мета-даних (тегів), тобто. довідкової текстової інформації, що зберігається в тому ж файлі, що і звук;
- збереження запису в аудіофайл з необхідними характеристиками, на цьому етапі проводиться стиснення аудіо даних.

Рекомендується проміжні результати обробки зберігати в форматі без стиснення, і тільки остаточний варіант - в форматі з необхідною ступенем стиснення.

Малюнок 8 Відображення сигналу в аудіо редакторі (запис голосу в режимі моно)

Кілька популярних аудіо редакторів.

Soudne Forge напівпрофесійний продукт Sony Creative Software, забезпечує виконання більшості необхідних функцій (запис, обрізка, фільтрація, придушення шуму), підтримує більше 20 звукових форматів. Платний.

Adobe Audition (раніше називався Cool Edit Pro) - повнофункціональний аудіо редактор, виробництва фірми Adobe. Підтримує практично всі звукові формати файлів. Входить в пакет Adobe Creative Suite. Крім іншого дозволяє виконувати зведення звукозапису. Платний.

Audacity підтримує запис (в тому числі, кількох каналів), редагування, зведення. Вимагає установки кодеків libmad або LAME. Вільно розповсюджуваний (ліцензія GNU General Public License).

WavePad професійна програма для обробки звуку, підтримує більшість аудіофункція, розробник NCH Software. Серед інших можливостей, підтримує пакетну обробку файлів. Спочатку встановлюється полегшена версія, в міру звернення до тих або інших функцій завантажуються додаткові модулі. Безкоштовний (показує вбудовану рекламу).

Великий список і короткі характеристики аудіо редакторів наведені в [8].

Більшість редакторів дозволяють зберігати аудіо файли в одному з декількох підтримуваних форматів. Таким чином, вони грають роль конверторів звукових файлів. Існують і спеціалізовані конвертори.
Вдале рішення пропонує компанія DVDVideoSoft. Поширювана нею програма FreeStudio Manager дозволяє вибрати для запуску або завантаження програму з декількох категорій (для роботи з сервісом YouTube, для завантаження файлів з популярних ресурсів, для конвертації, редагування і запису аудіо та відео файлів, див. Рис. 9.). При установці програм від DVDVideoSoft слід вибирати режим установки для досвідченого користувача і не дозволяти встановлювати пропоновані програми (Opera, Skype, антивірус і ін.). Програма і завантажувані компоненти безкоштовні, тому постійно демонструють рекламні заставки і настирливо пропонують оновити програмне забезпечення до преміум класу (платного).

Програма і завантажувані компоненти безкоштовні, тому постійно демонструють рекламні заставки і настирливо пропонують оновити програмне забезпечення до преміум класу (платного)

Мал. 9. Менеджер FreeStudio: вибір конвертора

Конвертори від DVDVideoSoft прості і дозволяють конвертувати медіа файли популярних форматів. Так аудіо конвертор Free Audio Converter (рис.10) дозволяє конвертувати одночасно декілька файлів різних форматів з різних джерел в файли обраного формату з необхідною якістю. Файли-результати поміщаються в обрану папку або зберігаються в папці вихідного файлу.

Файли-результати поміщаються в обрану папку або зберігаються в папці вихідного файлу

Малюнок 10 Конвертор аудіо файлів

Якісна обробка звуку вимагає спеціальних знань, гарного слуху, професійної техніки і програмного забезпечення.

Можна дати кілька найзагальніших рекомендацій по непрофесійної обробці звуку засобами аудіо редакторів.

1) Якщо не передбачається створення плей-листа для послідовного відтворення декількох треків, то на початку і кінці треку корисно створити паузу тривалістю ~ 2 сек. (Операції Insert Silence | Mute | Вставити тишу і т.п.)

2) Слід дуже акуратно використовувати програмні засоби шумозаглушення. Вони видаляють постійну складову шуму, наприклад, шум стрічки при оцифрування магнітних касет, але одночасно втрачається і частина корисної інформації, і виникає ефект «голосу в металевій бочці».

3) Нормалізація - вирівнювання рівня звуку по довжині треку - проводиться після видалення різких клацань, стукотів і тому подібних шумів.

4) Всі проміжні результати зберігаються в форматах без втрат. Конвертація в будь-який формат із стисненням повинна бути останньою операцією зі звуковим файлом.

Обробка коротких мовних записів часто може бути обмежена порівняно невеликою кількістю операцій:

- видалення фрагмента запису (сторонній шум, непотрібна пауза);
- вставка або видалення пауз в початок і кінець запису;
- створення наростання звуку на початку запису і загасання в кінці.

Якщо потреба в обробці звуку виникає епізодично, для виконання цих функцій можна скористатися одним з он-лайн сервісів.

Як приклад такого сервісу розглянемо ресурс Mp3Cut.ru. На малюнку 11 показані три кроки, що дозволяють отримати з аудіозаписи необхідний фрагмент. Для цього потрібно завантажити аудіо файл на сайт (крок 1), встановити межі обрізування (крок 2) і завантажити результат на свій комп'ютер (крок 3).

Малюнок 11 Обробка записи на сайті Mp3Cut.ru

Так само просто виробляється склейка декількох фрагментів в одну нову запис - мікст (рис.12).

12)

Малюнок 12 Склеювання записи з двох фрагментів на сайті Mp3Cut.ru

Для створення міксту на сайт завантажуються або надиктував треки-фрагменти (1), для кожного треку встановлюються межі обрізування, якщо необхідно, включається кросфейд (функція плавного з'єднання треків), і функції наростання \ загасання звуку для першого і останнього треку (2). Після з'єднання треків (3) отриманий мікст можна скачати.

Крім обрізки і склейки треків ресурс дозволяє конвертувати аудіо файли в кілька популярних форматів, конвертувати і обрізати відео (файлу до 500 Мв), зробити аудіо запис через мікрофон або веб-камеру.

7. Індивідуальне завдання

За допомогою будь-якого з доступних вам технічних засобів створіть аудіо запис такого змісту:

- уявлення (студент такий-то групи ...);
- виступ тривалістю 1.5-2 хвилини по темі вашого індивідуального завдання по курсу.

Збережіть запис на комп'ютері у форматі mp3 з максимальним доступним якістю (при необхідності виконайте конвертацію).

Використовуючи он-лайн сервіс або аудіо редактор, встановлений на вашому комп'ютері, треба редагувати запис:

- виріжте паузи, кашель і слова-паразити і інші сторонні шуми;
- розділіть запис на два треки: уявлення і виступ;
- збережіть отримані треки в форматі mp3, 64kbps.

Завантажте в навчальну систему вихідний файл і результат обробки.

наверх

8. Контрольні питання

1. Що означають написи "A to D" і "D to A" на рис. 1?

2. На якому - лівому або правому - зображенні на рис. 3 забезпечується краще наближення записи до вихідного звучанням? Чому?

3. Яким параметром характеризується ступінь стиснення звукового потоку?

4. Що таке кодек?

5. Чому рекомендується проміжні результати обробки звуку зберігати без стиснення?

6. Наведіть характеристики використаного пристрою звукозапису (використовуйте перелік параметрів, рекомендованих для вибору пристроїв в розділі 5.)

7. Наведіть характеристики створеного вами аудіо файлу.

8. Порівняйте якість створеної вами аудіо записи з якістю конвертованих результатів редагування.

наверх

9. Вимоги до звіту

Звіт оформляється як документ Word.

У звіті зазначаються номер і назва лабораторної роботи, номер навчальної групи та прізвище студента,

Звіт повинен містити:

- відповіді на контрольні питання;
- опис пристрою, на якому була отримана аудіозапис;
- опис використаних програмних засобів (назва конверторів, аудіо редакторів або url веб-ресурсів для обробки он-лайн);
- характеристики вихідного і отриманого аудіо файлів в наступних вигляді:

Початковий файл

ім'я

тип (формат)

розмір файлу

час звучання

Файл після редагування

ім'я

тип (формат)

розмір файлу

час звучання

Звіт завантажується в навчальну систему

наверх

10. Джерела

Analog to Digital Conversion // Introduction to Audio Storage. [Електронний ресурс] - Url: http://mediaintro.teeks99.com/Audio/Audio-1-Storage.html - Загл. з екрану.
Портал: Цифровий звук [Електронний ресурс] - Url: https://ru.wikipedia.org/wiki/Портал:Цифровой _звук - Загл. з екрану.
Меерзон Б.Я. Акустичні основи звукорежисури, 2 видавництва. Аспекс-прес, 2002.
Кузюренко Ю.І. Звукозапис з мікрофона. 2 изд., Перераб. и доп. - М .: Радио и связь, 1988.
Єресь звукозапису // Петро Семілєтов. [Електронний ресурс] - Url: http://semiletov.org/eres-zvukozapisi/ - Загл. з екрану.
11 конденсаторних мікрофонів // Єгор Курчаткин. Музичне Устаткування, січень 2000 [Електронний ресурс] - Url: http://www.muzoborudovanie.ru/equip/studio/condmics/11/11condmics.php - Загл. з екрану.
Лекція: мікрофонна практика // А.Н.Костромін [Електронний ресурс] - Url: http://www.ksp-msk.ru/uploads/school/442_1227091175/mp.pdf - Загл. з екрану.
Редактори // MyDiv.net [Електронний ресурс] - Url: http://soft.mydiv.net/win/cname47/cname48/cname51/ - Загл. з екрану.

наверх

Забезпечується краще наближення записи до вихідного звучанням?
Чому?
3. Яким параметром характеризується ступінь стиснення звукового потоку?
4. Що таке кодек?
5. Чому рекомендується проміжні результати обробки звуку зберігати без стиснення?

IRC-сервер - Irc.Online.com.ua

Обробка звуку

цілі роботи

1. Аудіо інформація в управлінні

2. Фізичні основи цифрового звукозапису

3. Формати зберігання аудіоінформації

4. Про вибір технічних засобів цифрового звукозапису

5. Цифровий запис мови

6. Програмні засоби обробки аудіо інформації

7. Індивідуальне завдання

8. Контрольні питання

9. Вимоги до звіту

10. Джерела