Abeceda
16. září 2009 • 8:55

V tomto článku je nadhozena kvalita, respektive nekvalita komprese zvuku. Zde problém nevidím, protože pokud je článek pouze nástinem problematiky... Jenže jemně řečeno, udivuje že se autor článku pouští do problematiky, kde tančí na slabém ledě.Ve vzorcích se uvadí datový tok max. 128 kb/s. Co je to za nesmysl? Když už něco dělá, proč to samé není testováno příkladem na cca 320 kb/s. Pak by byly výsledky zcela jiné - ve všech uvedených formátech! Nevedly by k zatracování komprese jako takové.

Zumik
29. května 2010 • 9:14

Aby tym mohli dát vyšší bitrate, to by se muselo vše otestovat znovu a ne jen vyštrachat tabulky a vlastně i většinu informací z 10 let starého článku.

Koko
12. června 2009 • 10:03

Nebylo by dobré řící taky něco o formátu VQF, když už ho máte v grafech. Dnes již trošku zapomenutý formát a to tenkrát (1997-98) z toho důvodu že komprese jedné skladby delší trvala třeba i celý den a tak se moc neujal, nicméně zvukově jde o povedenou věc.

muziker
11. června 2009 • 16:33

Fyziologický předpoklad u sluchového vnímání, potřebný pro fungování v článku uvedeného maskovacího principu využívaného ke komprimaci zvukových dat, není u všech lidí stejný. Souvisí to se schopností ’klastrového slyšení’ - zjednodušeně to popisuji v diskuzi zde: http://avmania.zive.cz/default.aspx?section=21&server=1&article=1748&forum
Takže co jeden slyší, druhý slyšet nemusí.

jan386
17. června 2009 • 16:15

To, co tu píšete, je velice zajímavé. Mohl byste doporučit nějakou literaturu (ať už online či klasickou), kde by se o těchto ne zcela zjevných vlastnostech sluchu dalo vyhledat více?
Děkuji.

muziker
11. června 2009 • 16:06

Tento článek je postaven na polopravdách. Takový způsob publikování zjednodušených tezí a polopravd je bohužel na internetu dost častý. Doba seriózního přístupu mizí. Nastupuje technický bulvár.
Na subjektivní vjem z poslechu hudby v oblasti vyšších kmitočtů má zásadnější vliv fázové zkreslení. To dobře dokumentuje pro zasvěcenější známý, dnes již historický, experiment - byly porovnávány slepým testem cívkové magnetofony vyšší třídy od různých světových firem. Většina z nich měla objektivně změřený frekvenční rozsah minimálně do 24 kHz, a některé až do 27 kHz. Mezi nimi se svým rozsahem do 15 kHz krčila Nagra Kudelski (pro neznalé - excelentní špičkově provedené reportážní profesionální magnetofony, které jako jediné byly schopny fungovat v náročných klimatických podmínkách, jako je poušť apod.). A kdo byl vítězem v oblasti subjektivně nejlepšího přenosu výšek? Ta Nagra s rozsahem pouze do těch 15 Khz! To mnohým vrtalo hlavou. Tehdy se ještě nevědělo tolik o psychofyziologických vlastnostech sluchu. Ono to totiž bylo tím, že Nagra měla konstrukcí zaručenou minimální fázovou chybu mezi frekvenčními pásmy, což ty ostatní magnetofony neměly. A na fázovou chybu je ucho dost citlivé (o dle mého názoru nekorektních praktikách výrobců, jak toho využít k vytváření cenových hladin, jsem psal v diskuzi zde:
http://avmania.zive.cz/default.aspx?section=21&server=1&article=1748&forum ).
Fázové chyby ovlivňují vnímání výšek víc jak konkrétní frekvenční rozsah, a také způsobují zásadní posun v barvě zvuku hudebních nástrojů a dalších složek, ve zvuku přítomných, takže hudba pak zní nepřirozeně. Proto jsou pro lidi, kteří ještě slyší, neposlouchatelné MP3ky pod 256kb/s, protože u MP3 jsou fázové chyby dost velkým problémem. Zvláště u nízkých bitrate, join stereu a variable bitrate. Kdo má možnost, ať si nějakou komparační metodou, ev. harmonickou a fázovou analýzou takové měření udělá. Ale pro ty co slyší není třeba nic měřit - je to výrazně slyšitelné. Pokud už používám MP3ky, tak min. 256 kb/s a konstatní bitrate.
Ještě větším (vlastně největším) vrahem zvuku u digitálních formátu je jitter v D/A převodu. To je velmi podceňovaný jev, na který je i poměrně neškolené ucho dost citlivé. Ale je to na popis dost složité a rozsáhlé.

Milan
8. srpna 2009 • 8:08

Souhlasím naprosto s tímhle příspěvkem. Mám stejnou zkušenost a výhodu, možná i nevýhodu v dnešní době, že prostě dobře slyším ! MP3 když už nahrávám, tak s 320 a konstantní .

abbe
11. června 2009 • 13:44

V grafech vychází skoro nejlépe formát .vqf. Proč o něm v článku není zmínka?

tombik
11. června 2009 • 2:27

Hezky clanek, pasaz o maskovani mi konecne dala aspon trochu poroozumet ztratove kompresi. Doted jsem vedel jen o frekvencnim orezu, coz mi prislo trochu malo na to aby to usetrilo tolik dat.Jinak i 320kbps MP3 je poznat. Pokud si clovek poslechne WAV pisne Closer od kapely Joy Division, kde hned ze zacatku slysi odfukovani pary z lokomotivy a pak si to same poslechne v MP3 bude silne znechucen. Nemuzu si pomoct ale tohle musi slyset i silne nahluchly jedinec. Zadne netopiri ucho ani hifistickou zkusenost na to netreba.Hezke by bylo akorat zminit ze i CD je svym zpusobem komprimovane (z principu vzorkovaci frekvence nikdy nedostihne gramofonovou desku a dynamicky rozsah CD je proti desce pomerne ubohy) Kez by se nekdy poradne rozsirilo SACD. Mno, snad to vyjde aspon v oblasti videa s blueray...

Aminux
11. června 2009 • 6:33

Co sem pleteš blueeeray?

Emokid
11. června 2009 • 14:53

Tak ten ubohý dynamický rozsah CD by mě opravdu zajímal. :-D"Kompaktní disky CD převyšují gramofonové desky po všech stránkách - podstatně nižší úrovní šumu, nesrovnatelně větším dynamickým rozsahem, odolností vůči poškození, neexistuje opotřebení přehráváním, menší rozměry a podstatně snadnější manipulace."Viz zde: http://astronuklfyzika.cz/Minidisk.htm

muziker
11. června 2009 • 16:25

Člověče, poslechněte si někdy CD-DA (samozřejmě nějaké dobře natočené a zmastrované, nikoliv něco z prodejen typu „Levné knihy") na nějakém seriózní CD přehrávači (pod 50 tisíc to ale asi nebude) přes kvalitní aparaturu, ev. dobrá sluchátka. Možná pak změníte názor. Gramofonová deska má řádově nižší dynamický rozsah (max. 45 dB), než audio CD (>90 dB). A také si někdy zkuste do CD signálu namixovat to, co automaticky obsahuje gramofonová deska - tedy šum. Gram. deska takto vlastně obsahuje nativní dithering. Šum má maskovací schopnosti (maskuje různé neduhy) a proto se záměrně přimíchává (říká se tomu dithering) do nahrávek, ev. jiných digitálních zvukových dat (třeba do zvukových vzorků v některých syntetizátorech). Existují dokonce SW, které do přehrávané hudby přimíchávají šum a praskání, typické pro gramofonové desky.
S tím, že lze rozeznat i při vysokých bitrate MP3 od originálu souhlasím. Dělal jsem v této oblasti dost experimentů. Musí jít ale o přímé srovnání. Už jen z toho, že se v článku píše o datových tocích max. 128 kb/s, mě „bolí uši". ;-) To je opravdu neposlouchatelné.

Milan
8. srpna 2009 • 8:03

Dobrý den, právě se chystám si přehrát některé své oblíbené audiokazety ke kterým mám vztah s doby kdy jsem byl "náctiletý" do MP3. Přemýšlím nad bitrate 320 kbps konstantní....Měl bych dotaz, hodně slyším HZ kolem 12500 prostě vnímám zvuk jako takový. Nějakých 10000 HZ je pro mě něco jako telefonní sluchátko - nedostačujicí. Celkově můžu říci, že hudba je nyní dostupnější, ale kvalita reprodukce, respektive záznamu jako by nějak pokulhávala. Rád bych doporučení nastavení MP3 parametrů tak, aby to bylo ještě slušné.Nebo bude vhodnější vše přímo ukládat jako WAV....

Polaris
19. září 2009 • 18:48

Nezlob se, ale vždy mne znovu pobaví tyhle proklamace o schopnosti rozeznat jednoduše mp3 a nekomprimovaný zdroj u lidí, kteří absolutně neměli možnost vyzkoušet si, jak je (nejen v oboru pychoakustiky) jejich mozek obelhává. Něco bych ti poradil - nastuduj si metodiku slepých, nebo dokonce dvojitě slepých testů, pozvi kamaráda a vyzkoušejte si to. Budeš se hodně divit.Před pár lety jsem četl článek o jakémsi experimentu, jehož cílem bylo zjistit, jak je to se schopností "hifistů" mp3 poznat. Byla to dost monstrózní akce, nevím už počet, ale přihlásilo se jich rozhodně stovky, možná i tisíc. Výsledek? Nula. Neprokázala se schopnost mp3 poznat, výsledky byly asi tak někde v oblasti, kde by byly, kdyby testované subjekty házely kostkou.O tom LP vs. CD nemá smysl diskutovat, tahle pověra odejde postupně s těmi, kdo prostě potřebují rituály kolem mytí desek a chtějí z toho slyšet sem - tam lupnutí. Prožil jsem si dětství na gramo a magnetofonech se vším, co k tomu náleží a jsem rád, že je to bezpečně za mnou.Kdo si chce užít hudbu skutečně s velkým H, bude muset stejně nakonec zajít do katedrály, do koncertního sálu, na stadion... protože to, co hudbu dělá hudbou je neuvěřitelně komplexní prožitek vnímaný celým tělem, který doma reprodukovat nelze, bez ohledu na bitrate... ;-)

Mikrob
1. listopadu 2014 • 15:27

"dynamicky rozsah CD je proti desce pomerne ubohy"
Nezlob se, ale tohle je buď lež, nebo vůbec nic nevíš o technologii vinylu a CD. Přesný opak je pravda. Poslechni si někdy demonstrační CD Sony Super Bit Mapping, tam je ukázka zvuku stáda ovcí v úrovních -50 až -80 dB. Z CD je to po zesílení docela dobře slyšet. Vinyl by byl se svými maximálně 45 dB odstupu (a to možná i tady přeháním) už úplně v háji a nebylo by v hluku a šumu drážky slyšet vůbec, ale vůbec nic užitečného.
Včera mi přišly docela náhodou společně dva shodné záznamy od MFSL. Dark Side od Pink Floyd. Vinyl a CD. Hrajou skvěle, ale musím říci, že CD hraje lépe Je slyšet, že když se provede mastering pečlivě, dovede CD využít své vlastnosti. LP je ale také výborné, určitě i proto, že je ryto poloviční rychlostí, čímž se při masteringu dosáhne daleko snadněji až ke 20 kHz. Pravda, mám jen Ortofon 2M Blue, která svojí cenou přesahuje celý CD přehrávač...
A kdyby někdo tvrdil, že LP má teoreticky daleko větší kmitočtový rozsah než CD, nechť si uvědomí, že je nahoře omezen velikostí zaoblení hrotu přenosky úplně stejně, jako je digitál omezen svojí vzorkovací frekvencí. LP mají u středu, kde je záznamová rychlost méně jak poloviční, velké problémy už okolo 18-20 kHz. Záleží pak už silně na tvaru hrotu, ale nejen přehrávacího, ale i záznamového. Nejlepší přenosky jsou s hrotem Shibata...

DaewooMaster
10. června 2009 • 15:16

Ne, že by na tom dnes záleželo, ale IFF byl nativní formát nejen pro zvuk, ale i grafiku, také u Amigy...

tomix26
10. června 2009 • 13:16

Po delší době jsem si zas s chutí přečetl celý článek. Hlavně mě zaujalo a mělo pro mě informační hodnotu, vysvětlení principu frekvenčního a časového maskování ve spojení se vnímáním zvuku lidským uchem. Super článek jen tak dále ;-)

Vestor
10. června 2009 • 12:27

Probůh ty grafy v první části článku jsou hrůza, ať si někdy páni fekťáci zaběhnou na druhou stranu budovy, k nám na chemickou a nějaký student druhého ročníku je naučí pracovat s Excelem.

nocom
10. června 2009 • 12:42

Hlavně ten formát, co nám redakce poskytla k náhledu... :-D

m13xx
10. června 2009 • 9:46

Článek hezký, precizně zpracovaný, ale pro úplnost mi chybí nastavení jednotlivých kodeků. Např u MP3 lze frekvenci, která bude ořezávána nastavit nehledě na další nespočet parametrů u všech kodeků. Ořezávání frekvencí u MP3 je z toho důvodu, že většinou bývají hloubky více požadované než výšky, ale toto omezení lze jednoduše vypnout (u kodeku Lame přepínačem -k) a hned budou vycházet naprosto jiné hodnoty ve srovnávacích tabulkách.Ale pokud někdo vezme standardní nastavení aniž by si o variantách kódování cokoliv přečetl, tak toto srovnání asi může být užitečné.

zoro
10. června 2009 • 4:01

Super, konečně někdo alespoň trochu pojmenoval problémy běžně užívaných kompresí zvuku :-)...nejlepší na test v praxi se mi osvědčuje elektronika (Vangelis, Jarre, apod.), neboť ta má neobvyklé spektrum; technicky by to pak mohlo řešit zobrazení "plovoucích" spekter (změna spektra v čase) před komprimací a po ni, případně i přechodové charakteristiky (odezva na skok nebo impulz)

nocom
10. června 2009 • 8:18

Tys ses dostal k internetu asi teprve letos, co? :-D Podle mě redakci docházejí články... Prodleva mezi články a témata ze šuplíku... Koho tohle dneska zajímá - informační rešerše v obecné rovině...
"Zjednodušeně se dá říci, že pokud zvolíme pro kompresi hudby stejný kodek i stejný datový tok, bude se velikost výsledného souboru významně lišit podle stylu hudby."To jakože při konstantním datovém toku a stejné stopáži se budou lišit, jo?

Bohouš
10. června 2009 • 8:57

To asi vychází z axiomu, že konstanty jsou proměnné :-)
Praktický problém je ovšem zcela jinde: mp3 přehraje dneska málem i lednička, cokoliv jiného je problém. Takže se všechno redukuje na to, jak si ty mp3 věci ukládat (když to můžu ovlivnit).
Ostatně, i v těch tabulkách jsou nějaké nesrovnalosti (AAC neomezeně od 48kb/s, ale 128kb/s má 15kHz omezení). Pokud jsou i ostatní hodnoty stejně věrohodné...

john
10. června 2009 • 9:47

Ano mp3 je velmi rozsirene.Preto treba pouzivat 320kbps kompresiu.

nocom
10. června 2009 • 10:01

Spíše jak datový tok, tak správné parametrické nastavení. LAME má i jiné parametry, které jsou v manuálu skryté a funkční jen v nějakých extreme defaultních předvolbách. Určitě vypínat frekvenční ořezání, taky to umí něco jako analýzu toho co bude kódovat, než s tím vůbec začne, atd.

Reakce pod tímto příspěvkem se už neodsazují.
zoro
10. června 2009 • 23:40

...očividně jste mě nepochopili ...spousta běžných lidí stále nechápe, že i se 128kbps (mnohdy i s podstatně vyšší kódovací rychlostí) je ztrátové kódování značně slyšet (a nemám rozhodně na mysli zaryté "HiFisty", kteří údajně rozeznají i "pálené" CD).
Porovnání kodeků, které jsem navrhl jsem zatím nikde neviděl, ale právě při něm by mohl být hezky vidět rozdíl.PS: Sám používám jen "Loss Less", ale jeho podpora v běžných zařízeních (přenosné přehrávače, autorádia, apod.) je dosti bídná, resp. nejednotná (FLAC, ALL, Monky,...).

JeCh
10. června 2009 • 14:56

Ona spousta enkodérů automaticky přepíná z AAC do AAC-HE podle datového toku. Takže při 128 kbps to je AAC, při 48 kbps to je AAC-HE, které si vysoké frekvence v podstatě vymýšlí, takže tam žádný ořez není. Jsou tam nesmyslná data, ale to lidem nevadí, protože to stejně neni slyšet. Hlavně, že to při spektrální analýze vypadá líp. :-DAle za ten blábol s datovými toky a velikostmi souborů, to by se měl autor vrátit do 3. třídy ZŠ a nechat se poučit o trojčlence.

IO
10. června 2009 • 22:47

pocut to je,....

Nejste přihlášen
11. června 2009 • 11:22

To "plovouci spektrum" se jmenuje spektrogram.

Určitě si přečtěte

Články odjinud