Kompresja wielopasmowa na mp3

_marek · Post autor: **_marek** » czwartek 21 sty 2010, 22:11

Obym nie miał racji, ale chyba mylisz pojęcie kompresji danych (mp3) z kompresja dynamiki...

MB · Post autor: MB » poniedziałek 25 sty 2010, 16:46

NIE WOLNO tak robić. Sygnał zakodowany psychoakustycznie nie może już być dalej obrabiany dynamicznie ani za pomocą EQ, gdyż wtedy gwałtownie demaskowane są wszelkie zniekształcenia, które koder dodał do sygnału z założeniem, że będzie on liniowo reprodukowany.

Talon · Post autor: **Talon** » poniedziałek 25 sty 2010, 17:19

NIE WOLNO tak robić. Sygnał zakodowany psychoakustycznie nie może już być dalej obrabiany dynamicznie ani za pomocą EQ, gdyż wtedy gwałtownie demaskowane są wszelkie zniekształcenia, które koder dodał do sygnału z założeniem, że będzie on liniowo reprodukowany.

Nie wiem czy dobrze to rozumiem, ale jeśli tak... to jak tu działa tkz. Crystalizer w kartach SB X-Fi ? Podobno działa on na zasadzie podbijania fragmentów pasma. Niestety nie analizowałem tego na widmie.

MB · Post autor: MB » poniedziałek 25 sty 2010, 18:28

Nie wiem czy dobrze to rozumiem, ale jeśli tak... to jak tu działa tkz. Crystalizer w kartach SB X-Fi ? Podobno działa on na zasadzie podbijania fragmentów pasma. Niestety nie analizowałem tego na widmie.
**********************
Istnieją pewne zaawansowane algorytmy poprawiające subiektywną jakość dźwięku uszkodzonego przez zbyt silną kompresję MP3 oraz AAC. Generalnie idea polega na heurystycznym "łataniu" widma, czyli odgadywaniu, w którym miejscu fragment sygnału został uszkodzony i wklejaniu w to miejsce czegoś co jest najbardziej prawdopodobną brakująca częścią. Sukces takiego przedsięwzięcia zależy od tego, na ile algorytm dobrze "zgaduje". Przykładowy opis TUTAJ

Nie wiem natomiast, jak działa Crystalizer, ale znając radosną twórczość firmy Creative i nonszalancję z jaką jej szefostwo podchodzi do problemu jakości dźwięku, jestem pełen jak najgorszych obaw.

matiz · Post autor: **matiz** » poniedziałek 25 sty 2010, 20:04

pluginem vst np. Waves L2

Wszystko fajnie, ale akurat L2 jest pelnopasmowy...

gatto · Post autor: **gatto** » poniedziałek 25 sty 2010, 23:28

...NIE WOLNO tak robić. Sygnał zakodowany psychoakustycznie nie może już być dalej obrabiany dynamicznie ani za pomocą EQ, gdyż wtedy gwałtownie demaskowane są wszelkie zniekształcenia, które koder dodał do sygnału z założeniem, że będzie on liniowo reprodukowany....

Te słowa należy potraktować z najwyższym szacunkiem. Ale obecnie w muzyce i akustyce większość nie zna słowa "nie wolno". Prawie każda rozgłośnia radiowa ma muzykę na twardym dysku w postaci MP3 i puszcza przez wielopasmowy kompresor żeby było głośniej:))) Nie wiem czy warto tak nobilitować MP3 określeniem "Sygnał zakodowany psychoakustycznie". Raczej topornie zakodowane widmo z psychoakustycznym usuwaniem skladników. Przypuszczam, że algorytm kompresji MP3 po prostu wycina składniki harmoniczne żeby się zmieścić w zadanym bitrate. Wcale nie optymalizuje brzmienia biąrąc pod uwagę co zostało z sygnału wyrzucone, ignoruje liniowość reprodukcji. Osobiście mam doświadczenie z "poprawianiem" MP3. Jestem skłonny uznać, że rozsądna(!) korekcja EQ nie demaskuje zniekształceń i daje przyjemniejszy dla ucha efekt niż łątanie pasma. Takie łatanie robi między innymi popularny AAC+ i kto ma uszy ten słyszy jak kaleczy dźwięk. Zastosowanie wielopasmowej kompresji (o ile ma sens) nie koniecznie wyeksponuje zawarte w MP3 zniekształcenia, ale zawsze łatwiej jest popsuć niż zrobić dobrze:)

MB · Post autor: MB » wtorek 26 sty 2010, 00:35

Prawie każda rozgłośnia radiowa ma muzykę na twardym dysku w postaci MP3 i puszcza przez wielopasmowy kompresor żeby było głośniej:)))
*************************
Jest to przejaw koszmarnej amatorszczyzny i technicznej degrengolady radiowców. Niestety, żyjemy w czasach gdy ignorancja jest przepustką do wszystkiego. Techniczni abnegaci pracują w mediach, ekonomiczni dyletanci rządzą naszymi pieniędzmi. Można się na to milcząco godzić albo głośno protestować. Ja wybieram to drugie.

Nie wiem czy warto tak nobilitować MP3 określeniem "Sygnał zakodowany psychoakustycznie". Raczej topornie zakodowane widmo z psychoakustycznym usuwaniem skladników.
************************
Ależ właśnie na tym polega kodowanie psychoakustyczne. To znaczy nie na psychoakustycznym usuwaniu składników a raczej na psychoakustycznym ukrywaniu zniekształceń kodowania poniżej progu słyszenia w dziedzinie częstotliwości i czasu.

Wcale nie optymalizuje brzmienia biąrąc pod uwagę co zostało z sygnału wyrzucone, ignoruje liniowość reprodukcji.
***********************
Nie wiem, co rozumiesz przez "optymalizowanie brzmienia" - brzmienie jest mechanizmem psychologicznym, tego się nie "optymalizować". Nie zgadzam się, że kompresja MP3 ignoruje liniowość. Wręcz przeciwnie. Model psychoakustyczny jak najbardziej, bierze pod uwagę to czego nie słychać. Ale coś trzeba założyć jeśli chodzi o słyszalność poszczególnych składowych. I to założenie jest całkiem racjonalne: że rekonstrukcja będzie liniowa.

Przypuszczam, że algorytm kompresji MP3 po prostu wycina składniki harmoniczne żeby się zmieścić w zadanym bitrate.
*********************
Mylisz się w swoim wyobrażeniu tego jak działa koder psychoakustyczny. Kompresja nie polega na wycinaniu. Koder MP3 kwantuje reprezentację częstotliwościową czyli zmniejsza liczbę bitów kosztem wprowadzenia wąskopasmowego szumu kwantyzacji w niektóre miejsca w widmie. Oczywiście w skrajnym przypadku, gdy ktoś ustawi kuriozalnie małą prędkość transmisji liczba bitów przypadających na część składników faktycznie musi być zero (bo ich nie starcza) - wtedy w widmie pojawia się słyszalna dziura. To właśnie o łataniu tych dziur pisałem w poprzednim poście. Ale w normalnej pracy takich dziur nie powinno być. Takiej dziury nie poprawi się żadnym korektorem, bo zero razy dowolne wzmocnienie to zawsze jest zero, co więcej dziury nie są stale w tym samym miejscu lecz pojawiają się na ułamek sekundy w różnych miejsach (proszę obejrzeć spektrogram pliku zakodowanego MP3). Taką dziurę można załatać generując fragment sygnału na podstawie tego, co znajduje się w okolicy, przy (najczęściej słusznym) założeniu, że widmo nie zmienia się w sposób gwałtowny. To oczywiście wymaga zaawansowanej analizy czasowo-częstotliwościowej oraz mechanizmów sztucznej inteligencji.

Osobiście mam doświadczenie z "poprawianiem" MP3. Jestem skłonny uznać, że rozsądna(!) korekcja EQ nie demaskuje zniekształceń i daje przyjemniejszy dla ucha efekt niż łątanie pasma.
************************
Obawiam się, że się oszukujesz, ale nie będę Cię uszczęśliwiać na siłę. Każdy ma prawo uznawać za przyjemniej brzmiący dowolnie odkształcony sygnał.

Takie łatanie robi między innymi popularny AAC+ i kto ma uszy ten słyszy jak kaleczy dźwięk.
**********************
Nie, takiego łatania nie stosuje AAC+. Tam jest wykorzystany mechanizm rekonstrukcji składowych wysokoczęstotliwościowych na podstawie składowych niskoczęstotliwościowych oraz dodatkowej informacji pobocznej. Ta technika była wielokrotnie testowana przez niezależne zespoły ekspertów (testy oczywiście w ciemno) i jednoznacznie bije na głowę MP3 w zakresie prędkości bitowych, dla których jest przeznaczona, to znaczy poniżej 48kb/s. Osobiście też robiłem takie testy i zapewniam Cię, że różnica jest dramatyczna na korzyść AAC+. Być może masz na myśli porównanie jakości AAC+ przy małej prędkości z MP3 przy znacznie większej prędkości bitowej, ale takie porównanie kompletnie nie ma sensu. Zapraszam do siebie na demonstrację.

Zastosowanie wielopasmowej kompresji (o ile ma sens) nie koniecznie wyeksponuje zawarte w MP3 zniekształcenia
**********************
Stanowczo twierdzę, że zawsze popsuje. Kompresja wielopasmowa uwydatnia słabe składowe sygnału, a tam w zakodowanym programie jest szum kwantyzacji. Właśnie o to w psychoakustycznym kodowaniu chodzi, że te słabe składowe są maskowane przez sąsiednie silniejsze. Uwydatnienie słabych składowych przez kompresję zawsze spowoduje gwałt na krzywej progu słyszenia i zawsze pogorszy odstęp poziomu sygnału od szumu kwantyzacji czyli zawsze uwydatni zniekształcenia.

Kompresja wielopasmowa na mp3

Re: Kompresja wielopasmowa na mp3

Re: Kompresja wielopasmowa na mp3

Re: Kompresja wielopasmowa na mp3

Re: Kompresja wielopasmowa na mp3

Re: Kompresja wielopasmowa na mp3

Re: Kompresja wielopasmowa na mp3