Mpeg1 Audio Coding Algorithm

  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Mpeg1 Audio Coding Algorithm as PDF for free.

More details

  • Words: 657
  • Pages: 29
MPEG1 Audio Coding Algorithm ISO/IEC JTC1/WG11 Presented by Chai-Yeol Rim

Contents Physiology of Human Ear ■ Data Reduction ■ Encoding structure of MPEG1 Audio ■

Physiology of Human Ear (1) ■

Psychoacoustics ◆ 귀의

구조

Physiology of Human Ear (2) ■

Psychoacoustics ◆ 주파수

분별력

1000Hz 와 1002Hz 의 구분 ? ◆ Loosely

coupled brain’s function

좌우 귀가 좌우 뇌와 꼬여 존재 좌측 뇌는 Speech, 우측 뇌는 melodic 정보에 익숙 ◆ 주파수에

logarithmic 한 특징을 갖는다

100~200Hz 구간과 1K~2KHz 의 구간이 같게 느낌

◆ Wide 한

dynamic range

0dB~120dB 의 인지도

Physiology of Human Ear (3) ■

Robinson-Dadson equal loudness contour

Physiology of Human Ear (4) ■

Critical Bands ◆ 주파수

분별력

주파수 고저에 따라 차이 Critical Bandwidth = 24.7(4.37F +1) ◆ Eberhard

Zwicker

15KHz 이하에서의 24 critical band 를 작성

Physiology of Human Ear (5)

Physiology of Human Ear (6) ■

청각의 Threshold 와 Masking

Physiology of Human Ear (7) ■

Masking curve

A : 주파수 B :Critical-Band

Physiology of Human Ear (8) ■

Masking threshold sound pressure level 에 따라 가변

Data Reduction (1) ■

Perceptual coding Sampling 주파수의 변경 : Nyquist theorem 에 제한 Dynamic range 변경 : Quantization Noisy 가중

Data Reduction (2) ■

Two type of frequency domain coder ◆ Transform

Coder : Good frequency resolution Poor time resolution ◆ Subband Coder : Poor frequency resolution Good time resolution

Data Reduction (3) ■

Basic structure of Encoder / Decoder

Data Reduction (4) ■

Sub-Band Coder

Data Reduction (5) ■

Sub-Band Coding 의 과정 (1)

Data Reduction (6) ■

Sub-Band Coding 의 과정 (2)

Data Reduction (7) ■

Bit allocation Audible 신호의 크기에 따라서 bit 할당

MPEG1 Audio Encoding 구조 (1) ■

MPEG-1 Audio Standard ◆ Sampling rate : 32, 44.1, 48KHz ◆ Bit rate : 32~224kbps/channel 64~448kbps for stereo ◆ Background Two Algorithm MUSCAM (Masking-pattern Adaptive Subband Coding And Multiplexing) ASPEC (Adaptive Spectral Perceptual Entropy Coding)

MPEG1 Audio Encoding 구조 (2) ■

MPEG-1 Audio Standard ◆ 3 Layer coding : Layer I, II, III ◆ Layer I : 상대적으로 High rate 인 경우 사용 ◆ Layer II : 채널당 96~128kbps 전송율 Layer IIA 는 joint stereo version ◆ Layer III : Low data rate 을 대상 , 가장 복잡 ◆ Layer I,II 는 MUSCAM 을 Layer III 는 ASPEC

MPEG1 Audio Encoding 구조 (3) ■

MPEG-1 Layer I Coding ◆ MUSCAM 방식의 응용 ◆ 32 개의 subband coding ◆ 512 point 의 FFT 로 psychoacoustic modeling ◆ Subband data 에 대한 bit allocation 수행 ◆ 12 subband sample 에 대한 coding

MPEG1 Audio Encoding 구조 (4)

MPEG1 Audio Encoding 구조 (5) ■

MPEG-1 Layer II Coding ◆ MUSCAM 방식의 응용 ◆ 32 개의 subband coding ◆ 1024 point 의 FFT 로 psychoacoustic modeling ◆ Subband data 에 대한 bit allocation 수행 ◆ 3 개의 12 subband sample 에 대한 coding ◆ Layer I 에 비한 효과적인 Coding 수행

MPEG1 Audio Encoding 구조 (6) MPEG-1 Layer I/II 의 비교 ■

MPEG1 Audio Encoding 구조 (7) ■

MPEG-1 Layer III Coding ◆ MUSCAM 과 ASPEC 방식의 합성 ◆ Layer I,II 비교 좋은 품질의 audio coding ◆ 32 개의 subband coding ◆ Subband 계수를 MDCT 수행 ◆ 1024 point 의 FFT 로 psychoacoustic modeling ◆ Subband data 에 대한 bit allocation 수행 ◆ Huffman & Run-length coding

MPEG1 Audio Encoding 구조 (8)

MPEG1 Audio Encoding 구조 (9) ■

MDCT block for Layer III coding

MPEG1 Audio Encoding 구조 (10) ■

Psychoacoustic Modeling ◆ 512, 1024 FFT 수행 ◆ Subband data coding 을 위한 최대 SPL 결 정 ◆ Quiet 상태의 absolute threshold 구함 ◆ Tonal 과 nontonal 성분을 구함 ◆ Masking threshold 를 구함 ◆ Global masking threshold 를 구함 ◆ 각 subband 에 대한 Minimum masking threshold 를 구함 ◆ NMR = SNR - SMR 계산

MPEG1 Audio Encoding 구조 (11) ■

MPEG1 LayerI,II Encoding Flow-chart

정리 ■



MPEG1 Layer I,II,III Coding Psychoacoustic modeling Subband Coding Transform coding (MDCT) Bit allocation Huffman entropy coding MPEG1 의 음질의 결정 요인 Psychoacoustic modeling Bit allocation

Related Documents