Jeśli kupujemy muzykę online, pobieramy pliki audio z sieci P2P, bądź zgrywamy ulubione płyty CD na dysk twardy, to prawdopodobnie kolekcja zawiera nagrania w różnych formatach audio. Warto zrobić z tym porządek i przekonwertować pliki do jednego standardu. Jak zmienić format i parametry zbiorów audio?
Zmiana formatu
GX::Transcoder to darmowe narzędzie służące do konwersji plików dźwiękowych. Program obsługuje kilkanaście popularnych formatów audio (m.in. AAC, APE, FLAC, MP2, MP3, MPC, OGG, WMA, WAV). Oprócz zmiany formatu podczas konwersji można zmienić parametry plików, takie jak częstotliwość próbkowania, bitrate, liczbę kanałów itd. Poniżej pokazujemy krok po kroku, w jaki sposób przekonwertować pliki za pomocą tej aplikacji.
{tlo_1}
Z menu Function wybieramy opcję Transcoder (1), która otwiera okno służące do zarządzania konwersją plików (2).
{/tlo}
{tlo_0}
Następnie tworzymy listę plików audio, które chcemy poddać konwersji. Do tego celu przeznaczone są trzy polecenia: Add file (dodaj plik) (3), Add folder (dodaj katalog) (4) oraz Add playlist (dodaj listę odtwarzania) (5).
{/tlo}
{tlo_1}
Najbardziej rozbudowaną opcją jest Add folder, gdyż pozwala na wyszukiwanie plików określonych typów. Uruchomienie opcji powoduje otwarcie okna, w którym możemy podać interesujący nas katalog (6) oraz wybrać rodzaje plików audio (7).
{/tlo}
{tlo_0}
Kliknięcie polecenia Search (8) spowoduje przeszukanie folderu i jego podkatalogów, a następnie wyświetlenie plików pasujących do zapytania. Znalezione nagrania możemy następnie dopisać do listy konwersji. Pliki możemy dodawać pojedynczo (9) lub skorzystać z przycisku Add all (dodaj wszystkie) (10).
{/tlo}{tlo_1}
Następnie określamy katalog docelowy, w którym zostaną umieszczone przekonwertowane pliki muzyczne. W tym celu klikamy prawym przyciskiem myszy w oknie Transcodera i z menu podręcznego wybieramy polecenie Select Dest. Directory (11). W kolejnym kroku wybieramy format, do którego mają zostać przetworzone pliki.
Możemy to zrobić osobno określając typ dla każdego nagrania z listy (12), bądź też zaznaczyć wszystkie pliki i z menu podręcznego wybrać plecenie Multiselect Dest. Format (format docelowy zaznaczonych plików) (13). Po wybraniu formatu plików określamy parametry konwersji (14).
{/tlo}
{tlo_0}
Jakie opcje będziemy mogli ustawić zależy od wybranego typu plików docelowych. W przypadku formatu MP3 możemy określić częstotliwość próbkowania (15), liczbę i sposób zapisu kanałów (16) oraz rodzaj kodowania: stały (17) lub zmienny (18) bitrate. Jeśli chcemy skorzystać z jednego z predefiniowanych ustawień, to zaznaczamy opcję Use Preset (19).
{/tlo}
{tlo_1}
Po określeniu parametrów konwersji zaznaczamy wszystkie pliki (Ctrl+A) i wybieramy polecenie Start Transcoder (20). Przebieg kodowania możemy śledzić na pasku stanu, gdzie wyświetlane są dwa wskaźniki postępu: dla aktualnie przetwarzanego pliku (21) oraz dla całej listy (22).
{/tlo}
Normalizacja
Bardzo często spotykamy się z sytuacją, gdy odtwarzane pliki z muzyką różnią się poziomem głośności. Rozwiązaniem tego problemu jest normalizacja, która pozwala wyrównać poziom głośności różnych nagrań. Jednym z programów normalizujących pliki audio jest MP3Gain.
Istotną zaletą tej aplikacji jest to, że zmiana głośności następuje bez dekodowania i ponownego kodowania ścieżek audio. Dzięki temu możemy dokonywać wielokrotnych konwersji bez ryzyka utraty jakości nagrania.
Obsługa programu jest bardzo prosta. W pierwszym kroku określamy pliki, które mają zostać poddane normalizacji, wybierając polecenie Dodaj plik(i) (1) lub Dodaj katalog (2). Jeśli chcemy sprawdzić aktualną głośność poszczególnych utworów, klikamy przycisk Analiza [utwór] (3), co spowoduje wyświetlenie poziomów głośności dla wszystkich plików z listy (4).
Aby dokonać normalizacji, wystarczy wpisać docelowy poziom głośności (5) i wybrać polecenie Głośność [utwór] (6).
Dzielenie plików audio
CUE Splitter to bezpłatne narzędzie służące do podziału dużych plików audio (zawierających np. pełne albumy) na pojedyncze utwory muzyczne.
Podział dokonywany jest w oparciu o dołączony plik tekstowy .cue, który zawiera informacje o wykonawcy oraz tytułach i długościach piosenek. Pliki CUE to najczęściej tworzone automatycznie programy zgrywające na dysk twardy ścieżki audio z płyt CD.
Obsługa programu jest następująca. Z menu Plik wybieramy opcję Otworz plik CUE (1). Po znalezieniu i wczytaniu pliku program wyświetli informacje o poszczególnych ścieżkach (2). Jeśli chcemy, aby do plików docelowych został dołączony komentarz oraz informacje o roku wydania i gatunku muzycznym, to musimy wpisać te dane w odpowiednie pola (3).
Następnie definiujemy nazwy dla tworzonych zbiorów. W tym celu ustawiamy znacznik Wlaczone (4) i klikamy ikonkę Modyfikuj (5). Spowoduje to otwarcie okna, w którym możemy określić maskę pliku (6). Poniżej pola z maską znajdziemy pomoc na temat dostępnych symboli oraz ich znaczeń (7). Po zatwierdzeniu nowej maski (8) klikamy przycisk Podziel! (9) i podajemy katalog, w którym zostaną utworzone pliki.
Słowniczek
Kodek
Program służący do kompresji i dekompresji danych. Pozwala przekształcić dane nieskompresowane do postaci zakodowanej (koder) jak również przywrócić oryginalny zbiór danych (dekoder). Każdy format kompresji ma swój własny kodek. Tak więc kodek MP3 służy do kodowania/dekodowania plików MP3, kodek Ogg Vorbis pozwala kodować lub dekodować pliki Ogg Vorbis itd.
Kompresja
Gdzie znaleźć opisywane programy?
- GX::Transcoder – http://www.germanixsoft.de
- CUE Splitter – http://www.enfis.it
- MP3Gain – http://mp3gain.sourceforge.net
Proces przekształcania danych cyfrowych do postaci charakteryzującej się mniejszą objętością poprzez usunięcie ze zbioru źródłowego danych nadmiarowych. Procesem przeciwnym do kompresji jest dekompresja. Istnieją dwa rodzaje kompresji. Kompresja bezstratna pozwala na dokładne odtworzenie informacji pierwotnej ze spakowanego pliku. W przypadku kompresji stratnej następuje utrata pewnej części informacji – w efekcie dekompresji otrzymujemy więc dane różniące się od oryginału.
Kwantyzacja, rozdzielczość (ang. bits per sample)
Drugi etap tworzenia danych cyfrowych z sygnału analogowego, polegający na przypisaniu pobranym próbkom reprezentacji liczbowej. W przypadku danych audio stosuje się najczęściej rozdzielczość 16 bitów na próbkę, co pozwala na rejestrację 65536 różnych poziomów wartości. Ograniczenie liczby bitów do 8 pozwala dwukrotnie zmniejszyć rozmiar pliku, ale pociąga za sobą znaczny spadek jakości, gdyż pozwala rejestrować tylko 256 typów próbek.
Próbkowanie, częstotliwość próbkowania (ang. sample rate)
Próbkowanie to pierwszy etap przetwarzania sygnału analogowego na postać cyfrową. Polega na odczytywaniu poziomu sygnału źródłowego w określonych interwałach czasowych. Odstęp czasu pomiędzy pobraniami kolejnych próbek jest określany jako częstotliwość próbkowania i jest podawany w Hz. Zgodnie z twierdzeniem Kotielnikowa-Shannona, aby móc przywrócić sygnał analogowy z postaci cyfrowej, częstotliwość próbkowania powinna być co najmniej dwukrotnie większa od maksymalnej częstotliwość próbkowanego sygnału.
Przepustowość (ang. bitrate)
Ilość danych przesyłanych w jednostce czasu, mierzona najczęściej w bitach na sekundę. W przypadku plików dźwiękowych bitrate określa liczba bitów przypadających na jedną sekundę nagrania. W praktyce spotykamy dwa rodzaje przepustowości.
Stała przepustowość (ang. Constant Bit Rate – CBR) oznacza, że cały plik został zakodowany z identycznym bitrate. W przypadku zmiennej przepustowości (ang. Variable Bit Rate – VBR) mamy do czynienia z różnymi bitrate dla różnych fragmentów pliku. VBR zapewnia zazwyczaj lepszą jakość niż CBR (przy tej samej objętości pliku), gdyż pozwala lepiej dostosować algorytm kompresji do specyfiki nagrania (skomplikowane fragmenty są kodowane z wyższym bitrate, a przy prostszych używa się mniejszej przepustowości).
Formaty plików audio
WAV
WAV to format opracowany przez Mircosoft i IBM, służący za kontener dla danych audio. Plik WAV może zawierać dźwięk skompresowany za pomocą różnych kodeków, ale najczęściej przechowuje dane w formacie PCM (Pulse Code Modulation). Jest to standard bezstratny zapewniający jakość płyty kompaktowej. Jego wadą jest brak kompresji, co powoduje, że jedna sekunda nagrania stereo zajmuje ponad 172 KB. WAV był przez pewien czas podstawowym formatem służącym do przechowywania dźwięków na pecetach, ale stracił na popularności wraz z pojawieniem się sieci P2P i plików MP3.
MP3
MP3 (MPEG-1/2 Audio Layer-3) to najpopularniejszy format dystrybucji muzyki w internecie, który pojawił się w pierwszej połowie lat 90. Prawdziwą furorę zrobił wraz z powstaniem sieci P2P, kiedy to stał się podstawowym standardem służącym do wymiany plików audio.
Do jego sukcesu przyczyniła się popularność odtwarzacza Winamp, jak również niewielkie wymagania sprzętowe (dekodowanie muzyki w czasie rzeczywistym jest już możliwe na komputerze z procesorem 486 DX2-66). Przy standardowym kodowaniu z bitrate 128 kb/s plik MP3 pozwala osiągnąć współczynnik kompresji na poziomie 11:1.
RealAudio
Format RealAudio został stworzony przez firmę RealNetworks w 1995 roku, a jego głównym przeznaczeniem była strumieniowa transmisja dźwięku za pośrednictwem łączy modemowych. Format stosuje kilka różnych kodeków, z których każdy koduje dane audio przeznaczone dla innej prędkości transmisji.
RealAudio jest obecnie jednym z najpopularniejszych formatów wykorzystywanych przez radia internetowe, natomiast pliki muzyczne w tym standardzie są znacznie rzadziej spotykane. Pliki RealAudio mają rozszerzenie .ra, .rm lub .ram, a do ich odtwarzania służy aplikacja RealPlayer.
MPC
MPC (Musepack, MPEGplus, MP+) to format oparty na algorytmie MP2 (MPEG-1 Audio Layer-2), który jednak został znacznie udoskonalony w stosunku do pierwowzoru. W przeciwieństwie do AAC, Vorbis czy WMA, Musepack został zoptymalizowany pod kątem wyższych bitrate (powyżej 160 kb/s) i pozwala na kodowanie dźwięku z maksymalną prędkością 1300 kb/s.
Format stworzony w 1997 roku przez Andree Buschmanna rozwijany jest obecnie przez Franka Klemma oraz Musepack Development Team. MPC był w przeszłości oskarżany o naruszanie różnych patentów, co doprowadziło do usunięcia kontrowersyjnego kodu z kodeka.
AAC
Specyfikacja AAC (Advanced Audio Coding) została opublikowana po raz pierwszy w 1997 roku jako część standardu MPEG-2. Dalsze prace prowadzone nad formatem przez grupę MPEG zaowocowały powstaniem udoskonalonej wersji – MPEG-4 AAC. Format ten był promowany jako następca MP3, który ma zapewniać wyższą jakość przy mniejszym rozmiarze plików oraz pozwalać obsłużyć do 48 kanałów audio próbkowanych z maksymalną częstotliwością 96 kHz.
AAC zyskał popularność dzięki firmie Apple, która w 2003 roku zdecydowała się wykorzystać go w sklepie internetowym iTunes oraz w przenośnych odtwarzaczach z serii iPod. W efekcie skrót AAC zaczęto błędnie interpretować jako Apple Audio Codec. Pliki zawierające dane audio w formacie AAC mają najczęściej rozszerzenie .mp4, .m4a lub .m4p.
WMA
WMA (Windows Media Audio) to opracowany przez Microsoft format kompresji dźwięków wchodzący w skład platformy Windows Media. Dane audio są przechowywane w plikach ASF (Advanced Systems Format) i mają rozszerzenie .asf lub .wma. Do odtworzenia plików WMA służy aplikacja Windows Media Player, ale dostępne są również alternatywne programy działające pod kontrolą innych niż Windows systemów operacyjnych.
Pliki WMA są odczytywane przez sporą liczbę urządzeń muzycznych, takich jak przenośne odtwarzacze plików cyfrowych, odtwarzacze CD czy DVD. Pod względem liczby urządzeń wspierających standard WMA ustępuje tylko formatowi MP3.
OGG
OGG to rozwijany przez Xiph.Org Foundation format pojemnika danych multimedialnych, który może przenosić strumienie audio, wideo oraz tekst (np. napisy do filmów). Najczęściej w plikach OGG znajdziemy ścieżki audio skompresowane przy użyciu kodeka Vorbis.
Vorbis jest bezpłatnym i nieopatentowanym formatem, którego algorytm zapewnia przy tej samej wielkości pliku lepszą jakość niż MP3, RealAudio czy WMA.
OGG Vorbis potrafi obsłużyć do 255 kanałów z ponad 16-bitowym dźwiękiem w zakresie od 6 kHz do 48 kHz. Inne formaty audio występujące w kontenerze OGG to Speex (kompresja mowy ludzkiej) oraz bezstratny kodek FLAC przeznaczony do rejestracji dźwięku wysokiej jakości oraz do przechowywania nagrań archiwalnych.