MPEG1 Audio Coding Algorithm ISO/IEC JTC1/WG11 Presented by Chai-Yeol Rim
Contents Physiology of Human Ear ■ Data Reduction ■ Encoding structure of MPEG1 Audio ■
Physiology of Human Ear (1) ■
Psychoacoustics ◆ 귀의
구조
Physiology of Human Ear (2) ■
Psychoacoustics ◆ 주파수
분별력
1000Hz 와 1002Hz 의 구분 ? ◆ Loosely
coupled brain’s function
좌우 귀가 좌우 뇌와 꼬여 존재 좌측 뇌는 Speech, 우측 뇌는 melodic 정보에 익숙 ◆ 주파수에
logarithmic 한 특징을 갖는다
100~200Hz 구간과 1K~2KHz 의 구간이 같게 느낌
◆ Wide 한
dynamic range
0dB~120dB 의 인지도
Physiology of Human Ear (3) ■
Robinson-Dadson equal loudness contour
Physiology of Human Ear (4) ■
Critical Bands ◆ 주파수
분별력
주파수 고저에 따라 차이 Critical Bandwidth = 24.7(4.37F +1) ◆ Eberhard
Zwicker
15KHz 이하에서의 24 critical band 를 작성
Physiology of Human Ear (5)
Physiology of Human Ear (6) ■
청각의 Threshold 와 Masking
Physiology of Human Ear (7) ■
Masking curve
A : 주파수 B :Critical-Band
Physiology of Human Ear (8) ■
Masking threshold sound pressure level 에 따라 가변
Data Reduction (1) ■
Perceptual coding Sampling 주파수의 변경 : Nyquist theorem 에 제한 Dynamic range 변경 : Quantization Noisy 가중
Data Reduction (2) ■
Two type of frequency domain coder ◆ Transform
Coder : Good frequency resolution Poor time resolution ◆ Subband Coder : Poor frequency resolution Good time resolution
Data Reduction (3) ■
Basic structure of Encoder / Decoder
Data Reduction (4) ■
Sub-Band Coder
Data Reduction (5) ■
Sub-Band Coding 의 과정 (1)
Data Reduction (6) ■
Sub-Band Coding 의 과정 (2)
Data Reduction (7) ■
Bit allocation Audible 신호의 크기에 따라서 bit 할당
MPEG1 Audio Encoding 구조 (1) ■
MPEG-1 Audio Standard ◆ Sampling rate : 32, 44.1, 48KHz ◆ Bit rate : 32~224kbps/channel 64~448kbps for stereo ◆ Background Two Algorithm MUSCAM (Masking-pattern Adaptive Subband Coding And Multiplexing) ASPEC (Adaptive Spectral Perceptual Entropy Coding)
MPEG1 Audio Encoding 구조 (2) ■
MPEG-1 Audio Standard ◆ 3 Layer coding : Layer I, II, III ◆ Layer I : 상대적으로 High rate 인 경우 사용 ◆ Layer II : 채널당 96~128kbps 전송율 Layer IIA 는 joint stereo version ◆ Layer III : Low data rate 을 대상 , 가장 복잡 ◆ Layer I,II 는 MUSCAM 을 Layer III 는 ASPEC
MPEG1 Audio Encoding 구조 (3) ■
MPEG-1 Layer I Coding ◆ MUSCAM 방식의 응용 ◆ 32 개의 subband coding ◆ 512 point 의 FFT 로 psychoacoustic modeling ◆ Subband data 에 대한 bit allocation 수행 ◆ 12 subband sample 에 대한 coding
MPEG1 Audio Encoding 구조 (4)
MPEG1 Audio Encoding 구조 (5) ■
MPEG-1 Layer II Coding ◆ MUSCAM 방식의 응용 ◆ 32 개의 subband coding ◆ 1024 point 의 FFT 로 psychoacoustic modeling ◆ Subband data 에 대한 bit allocation 수행 ◆ 3 개의 12 subband sample 에 대한 coding ◆ Layer I 에 비한 효과적인 Coding 수행
MPEG1 Audio Encoding 구조 (6) MPEG-1 Layer I/II 의 비교 ■
MPEG1 Audio Encoding 구조 (7) ■
MPEG-1 Layer III Coding ◆ MUSCAM 과 ASPEC 방식의 합성 ◆ Layer I,II 비교 좋은 품질의 audio coding ◆ 32 개의 subband coding ◆ Subband 계수를 MDCT 수행 ◆ 1024 point 의 FFT 로 psychoacoustic modeling ◆ Subband data 에 대한 bit allocation 수행 ◆ Huffman & Run-length coding
MPEG1 Audio Encoding 구조 (8)
MPEG1 Audio Encoding 구조 (9) ■
MDCT block for Layer III coding
MPEG1 Audio Encoding 구조 (10) ■
Psychoacoustic Modeling ◆ 512, 1024 FFT 수행 ◆ Subband data coding 을 위한 최대 SPL 결 정 ◆ Quiet 상태의 absolute threshold 구함 ◆ Tonal 과 nontonal 성분을 구함 ◆ Masking threshold 를 구함 ◆ Global masking threshold 를 구함 ◆ 각 subband 에 대한 Minimum masking threshold 를 구함 ◆ NMR = SNR - SMR 계산
MPEG1 Audio Encoding 구조 (11) ■
MPEG1 LayerI,II Encoding Flow-chart
정리 ■
■
MPEG1 Layer I,II,III Coding Psychoacoustic modeling Subband Coding Transform coding (MDCT) Bit allocation Huffman entropy coding MPEG1 의 음질의 결정 요인 Psychoacoustic modeling Bit allocation