초당 수집된 오디오 샘플 수는 "샘플링 주파수"를 의미하며, 이는 초당 샘플 또는 헤르츠 단위로 측정됩니다. 샘플 속도가 낮다는 것은 초당 샘플 수가 적다는 것을 의미하며, 이는 오디오 양을 나타내는 샘플 포인트가 적기 때문에 오디오 데이터가 적다는 것을 의미합니다. 샘플 속도가 높을수록 처리하는 데 더 많은 저장 공간과 처리 능력이 필요합니다.
이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.
오디오 처리에 관해서는 대부분의 사람들이 이전에 들어봤지만 잘 이해하지 못하는 용어가 많이 있습니다. 나는 오디오 처리 분야에 들어가기 전에도 이런 사람들 중 한 명이었습니다. 이를 위해 저는 이러한 용어 중 일부에 대해 이야기하고, 그것이 무엇인지 설명하고, 오디오 녹음 또는 스트리밍 품질에 대한 의미가 무엇인지 보여주고 싶습니다. 이 기사의 나머지 부분에서는 압축되지 않은 오디오의 한 채널만 다루고 있다고 가정합니다.
1. 샘플링 속도/샘플링 주파수
우리가 가장 먼저 듣는 용어는 샘플링 속도 또는 샘플링 주파수이며 둘 다 동일한 것을 나타냅니다. 당신이 접할 수 있는 일부 값은 8kHz, 44.1kHz 및 48kHz입니다. 오디오 파일의 샘플링 속도는 정확히 무엇입니까?
샘플링 속도는 초당 녹음되는 오디오 샘플 수를 나타냅니다. 이는 초당 샘플 또는 헤르츠(Hz 또는 kHz로 축약됨, 1kHz는 1000Hz임)로 측정됩니다. 오디오 샘플은 단순히 특정 시점에서 측정된 음파 값을 나타내는 숫자입니다. 이러한 샘플을 1초 이내에 동일한 순간에 채취하는 것이 매우 중요합니다. 예를 들어 샘플링 속도가 8000Hz인 경우 1초에 8000개의 샘플을 갖는 것만으로는 충분하지 않으며 1/8000초 내에 정확하게 수집되어야 합니다. 이 경우 1/8000이라는 숫자를 샘플링 간격(초)이라고 하며 샘플링 속도는 해당 간격의 곱셈 역수에 불과합니다.
샘플링 속도는 비디오의 프레임 속도 또는 FPS(초당 프레임 수) 측정과 유사합니다. 비디오는 단순히 "프레임"이라고 불리는 일련의 사진으로 매우 빠르게 연속해서 표시되어 (적어도 우리 인간에게는) 연속적이고 중단되지 않는 동작이나 움직임의 환상을 제공합니다.
오디오 샘플 속도와 비디오 프레임 속도는 비슷하지만 각각의 유용성을 보장하는 일반적인 최소 수치는 매우 다릅니다. 비디오의 경우 동작을 정확하게 설명하려면 초당 최소 24프레임이 필요합니다. 이 숫자보다 적으면 동작이 매끄럽지 않게 나타날 수 있으며 연속적이고 중단 없이 움직이는 듯한 느낌을 유지할 수 없습니다. 특히 프레임 간에 모션이 더 많이 발생할수록 더욱 그렇습니다. 또한 초당 1~2프레임의 비디오에는 프레임 사이에서 누락되는 "순간" 이벤트가 있을 수 있습니다.
오디오의 경우 영어 음성을 명확하게 표현하기 위해 초당 최소 샘플 수는 8000Hz입니다. 이 숫자보다 낮은 샘플링 속도를 사용하면 여러 가지 이유로 음성을 이해할 수 없게 됩니다. 그 중 하나는 유사한 발화를 서로 구별할 수 없다는 것입니다. 샘플링 속도가 낮으면 상당한 고주파 에너지가 있는 언어의 음소나 소리를 혼동할 수 있습니다. 예를 들어 5000Hz에서는 /s/를 /sh/ 또는 /f/와 구별하기 어렵습니다.
비디오 프레임에 대해 언급했으니, 자세히 설명할 만한 또 다른 용어는 오디오 프레임입니다. 오디오 샘플과 오디오 프레임은 모두 헤르츠 단위로 측정되지만 동일한 것은 아닙니다. 오디오 프레임은 하나 이상의 오디오 채널의 한 번 인스턴스의 오디오 샘플 그룹입니다.
가장 일반적인 샘플링 속도 값은 앞서 언급한 8kHz(전화 통신에서 가장 일반적), 44.1kHz(음악 CD에서 가장 일반적) 및 48kHz(영화 사운드트랙에서 가장 일반적)입니다. 샘플링 속도가 낮다는 것은 초당 샘플 수가 적다는 것을 의미하며, 이는 오디오 양을 나타내는 샘플 포인트가 적기 때문에 오디오 데이터가 적다는 것을 의미합니다. 샘플링 속도의 선택은 수집해야 하는 음향 아티팩트에 따라 달라집니다. 음성 억양과 같은 일부 음향 인공물은 음악 CD의 음악과 같은 음향 인공물보다 낮은 샘플링 속도를 요구합니다. 샘플링 속도가 높을수록 처리하기 위해 더 많은 저장 공간과 처리 능력이 필요하다는 점은 주목할 가치가 있지만, 과거에 디지털 저장 및 처리 능력이 주요 관심사였던 지금은 이것이 큰 문제가 아닐 수 있습니다.
2. 샘플링 깊이/샘플링 정확도/샘플링 크기
우리가 가지고 있는 오디오 데이터 포인트의 수를 나타내는 샘플링 속도 외에도 샘플링 깊이도 있습니다. 샘플당 비트 수로 측정되는 샘플 깊이(샘플 정밀도 또는 샘플 크기라고도 함)는 오디오 파일 또는 오디오 스트림의 두 번째 중요한 속성이며 각 샘플의 세부 수준 또는 "품질"을 나타냅니다. 위에서 언급했듯이 각 오디오 샘플은 단지 숫자일 뿐이며, 숫자가 많으면 오디오를 표현하는 데 도움이 되지만, 각 샘플이나 데이터 포인트를 정확하게 표현하려면 각 개별 숫자의 범위 또는 "질량"이 충분히 커야 합니다. "품질"은 무엇을 의미합니까? 오디오 샘플의 경우 이는 단순히 오디오 샘플이 더 높은 진폭 범위를 나타낼 수 있음을 의미합니다. 샘플링 깊이가 8비트라는 것은 2^8=256개의 서로 다른 진폭이 있음을 의미하고, 샘플링 깊이가 16비트라는 것은 2^16=65,536개의 서로 다른 진폭이 있음을 의미하며, 더 높은 샘플링 깊이의 경우에도 마찬가지입니다. 전화 오디오의 가장 일반적인 샘플 깊이는 16비트와 32비트입니다. 디지털 녹음에서는 진폭이 다양할수록 디지털 녹음이 원래 음향 이벤트에 더 가깝게 들립니다.
이 역시 이미지 품질에 대해 들을 수 있는 8비트 또는 16비트 숫자와 유사합니다. 이미지나 비디오의 경우 이미지나 비디오 프레임의 각 픽셀에는 색상을 나타내는 특정 수의 비트도 있습니다. 픽셀의 비트 심도가 높을수록 결과 픽셀 색상이 더 정확해집니다. 왜냐하면 픽셀에는 화면에 표시되는 색상을 "설명"하는 데 더 많은 비트가 있고 픽셀이나 이미지 전체가 사람들이 보는 것과 더 유사해 보이기 때문입니다. 실생활에서. 기술적으로 픽셀의 비트 심도는 해당 픽셀이 표현할 수 있는 색상의 수를 나타냅니다. R, G, B 각각을 8비트로 표현하도록 허용하면 각 픽셀은 3 x 8 = 24비트로 표현됩니다. 이는 해당 픽셀이 표현할 수 있는 2^2400만~1700만 가지의 다양한 색상이 있음을 의미합니다.
3. 비트율
샘플링 속도와 샘플링 깊이를 연결하는 것은 비트율이며, 이는 둘의 간단한 곱입니다. 샘플링 속도는 초당 샘플 단위로 측정되고 샘플링 깊이는 샘플당 비트 단위로 측정되므로 (초당 샘플 수) x(샘플당 비트 수) = 초당 비트 단위로 측정되며 bps 또는 kbps로 축약됩니다. 샘플 깊이와 비트 전송률은 서로 관련되어 있기 때문에 종종 같은 의미로 사용되지만 잘못 사용되기도 한다는 점은 주목할 가치가 있습니다.
오디오의 비트 전송률은 앱마다 다릅니다. 음악과 같이 높은 오디오 품질이 필요한 애플리케이션은 일반적으로 더 높은 비트 전송률을 사용하여 더 높은 품질 또는 "더 선명한" 오디오를 생성합니다. 콜센터 오디오를 포함한 전화 오디오에는 높은 비트 전송률이 필요하지 않으므로 일반 전화 통화의 비트 전송률은 일반적으로 음악 CD의 비트 전송률보다 훨씬 낮습니다. 샘플링 속도든 비트 전송률이든 값이 낮을수록 더 나쁘게 들릴 수 있지만, 응용 프로그램에 따라 값이 낮을수록 저장 공간 및/또는 처리 능력이 절약될 수 있습니다.
요약하자면, 오디오에서 압축이란 정확히 무엇을 의미하나요? AAC 또는 MP3와 같은 압축 오디오 형식의 비트 전송률은 샘플 속도와 샘플 심도의 실제 곱보다 작습니다. 이러한 형식은 비트스트림에서 정보를 "수술적으로" 제거하여 구현됩니다. 즉, 동적 상황에서 사람의 귀에 생물학적으로 들리지 않는 주파수나 진폭이 저장되지 않아 전체 파일 크기가 작아집니다.
더 많은 관련 지식은 FAQ 칼럼을 방문해주세요!
위 내용은 초당 수집된 오디오 샘플 수는 얼마입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!