인간의 청각 척도에 관한 고찰
이 연구는 1997학년도 동의대학교 자체학술 연구조성비에 의하여 연구되었음.

(A Study on the Human Auditory Scaling)
양 병 곤
(Byunggon Yang)
동의대학교 인문대학 영어영문학과

ABSTRACT
Human beings can perceive various aspects of sounds including loudness, pitch, length, and timber. Recently many studies were conducted to clarify complex auditory scales of the human ear. This study critically reviewed some of those scales (decibel, sone, phon for loudness perception; mel and bark for pitch) and proposed to apply the scales to normalize acoustic correlates of the human speech. One of the most important aspects of the human auditory perception was the nonlinearity which should be incorporated into the linear speech analysis and synthesis system. Further studies are desirable to refine those scales through the analysis of human auditory perception of complex waves or speech with sophisticated equipment, which will lead scientists to develop better speech recognition and synthesis devices.

1. 서론

인간은 소리의 크기와 높이, 길이, 음색 등의 특징을 귀로서 구분할 수 있다. 오늘날 이러한 귀의 구조와 기능에 대한 여러 가지 연구 조사가 있었으며 이들 각각의 특징을 구체적으로 나타내는 다양한 형태의 척도들이 제안되어 있다. 예를 들어, 소리의 크기에 대한 척도로는 sone, phon(고도흥외 1993)등이 있으며, 소리의 높이에 대한 척도로는 mel(Fant 1960), bark(Zwicker 1962) 등이 있다. 이러한 척도들은 소수의 실험자들에 의해 설정된 주관적인 척도이긴 하지만 상당히 일관성 있는 결과를 보여준다. 음파의 길이의 변화에 대한 청각적인 구별은 약 2ms의 차이에도 쉽게 소리의 차이를 구분할 정도의 귀가 있는 반면에 보통 4-5 ms정도의 차이를 인식의 한 계로 지적하기도 한다. 반면, 촉각에서는 약 10ms차이의 신호를 인지할 수 있으며, 시각에서는 약 100ms차이를 구분할 수 있다고 한다 (Fraisse 1981). 따라서, 소리 정보가 사람에게는 시각적인 정보보다는 빨리 인지된다고 할 수 있다. 또한, 음색은 성대의 크기나 질량, 탄성도 등에 의해 사람마다 독특한 음색을 나타내거나 기타와 나팔 등의 차이를 보인다. 사람의 귀는 이러한 음의 높이나 크기를 아주 다양하고 정밀하게 구분하고 있다.
본 논문에서는 이러한 청각척도에 대해 보다 깊이 이해하기 위해서 귀의 구조와 기능을 살펴본 뒤 소리의 높이와 크기에 대한 몇가지 대표적인 청각척도를 조사해보고 이들의 활용에 대한 가능성을 제시한다. 이러한 청각 척도에 대한 연구 결과는 앞으로 컴퓨터에 입력된 물리음향적인 신호를 사람이 듣는 청각척도로 변환시킴으로써 남녀 차이와 같은 성별에 의한 물리음향적 척도사이의 괴리를 해결하여 보다 정확한 음성인식 장치 개발에 도움을 줄 수 있을 것이다. 또한, 컴퓨터 합성에 의한 청각 실험이나 귀의 기능에 대한 생리학적인 실험을 유도하여 보다 정밀한 청각척도 설정을 위한 기초를 마련하는데 중요하다.

2. 귀의 구조와 기능

사람의 청각척도를 상세히 이해하기 위해서는 먼저 청각기관인 귀의 구조와 기능을 살펴봐야한다. 귀는 머리의 양 옆에 위치하고 있으며 외이 중이 내이로 구분된다. 외이는 귓바퀴와 고막에 이르는 이도로 나눠지고, 중이는 고막안쪽의 공간을 말하며 고막에 연결된 추골, 침골, 등골이 고막의 진동을 내이의 타원창으로 전달하는 역할을 한다. 등골의 움직임은 타원창을 피스톤처럼 내이의 점액질의 액체를 밀고 당기는 작용을 하며, 이러한 액체의 이동은 타원창을 따라 달팽이관의 끝부분을 거쳐 기저막으로 칸이 지워진 반대쪽 원형창으로 파동을 전달한다. 이때 내이의 코르치기관에 있는 섬모세포가 액체의 움직임에 따라 서로 마주치며 전기화학적인 신호를 유발하게 된다. 이러한 신호는 코르치기관에 연결된 신경다발에 의해 척수를 통해 대뇌의 청각피질로 전달되어 대뇌에 이미 학습된 음성 자료의 패턴과 비교하는 작업을 통해 "음성"으로 인식하게 된다. 지금까지 이러한 청각구조와 기능에 대해 상당한 정보가 수집되었고, 인조로 만든 달팽이관의 이식수술도 행해지고 있는 실정이다. 특히, 달팽이관의 구조에서 살펴보면 타원창에 가까운 쪽이 가늘고 단단하며 주로 고주파의 진동을 받아들이는 것으로 알려져 있다. 정점에 가까운 안쪽은 굵고 연하며 저주파에 해당하는 주파수를 받아들인다고 한다. 그림 1은 이러한 달팽이관을 펼쳤을 때 음향적 주파수에 공명하는 위치를 나타내고 있다 (Johnson 1997:76).

그림 1. 달팽이관의 음향적 주파수 공명위치

이 그림에서 보면 인간의 음성에서 가장 중요한 정보를 담고 있는 3000Hz까지의 정보가 반 이상을 차지하고 있음을 볼 수 있다. 그 위의 주파수에 해당하는 부분은 좁은 영역이 할당되어 있음을 알 수 있다.
귀의 구조에서 음향물리적으로 특기할 점은 외이에서 고막까지의 약 2.5cm의 공간이다. 한쪽이 막힌 관의 공명주파수는 물리적으로 밝혀진 바에 따르면 1/4파장의 음이 되고 이 음의 홀수배에 해당하는 음파가 공명한다 (Kent and Read 1992). 따라서, 완전한 사이클의 파장은 10cm가 되고 이는 상온에서의 소리의 전달속도인 34000 cm/sec를 고려해 보면 약 3400Hz에 해당하는 음성이 가장 잘 공명하게 된다. 이것의 3배인 6800Hz 에서 또 한번의 공명이 있고 또한 5배인 17000Hz에서 공명이 있을 것이다. 이러한 계산적인 주파수의 선택성은 전형적인 미국인들의 절대가청한 계의 조사그림 (고도흥외 1993:94, 그림 5.9 참고)에서 나타난다. 실제 사람의 가청 범위가 20Hz에서 20000Hz에 걸쳐있기 때문에 경계선의 인접한 8000Hz이상의 범위에서는 이러한 공명효과가 크게 나타나지 않고 있으나 많은 수의 사람들이 3400Hz 전후에서 아주 낮은 강도의 신호를 주었는데도 이를 쉽게 지각했다.
덧붙여, 청자가 일정한 거리에서 떨어져서 확성기에서 들리는 소리를 듣는 것과 이어폰을 착용하고 들을 때 약 '6dB'정도 차이를 보인다. 이것은 이어폰을 착용했을 때는 이도의 양쪽이 막힌 관을 형성하기 때문에 공명주파수가 이동하기 때문인 것으로 설명된다 (Newby and Popelka 1992:54).

3. 소리의 크기에 대한 청각 척도

소리의 크기는 주로 소리의 강도와 연관이 있다. 강도는 정상적인 사람들이 겨우 들을 수 있는 기준음인 10-16watt/cm2을 1dB로 하고 비교하고자 하는 음의 비율의 대수값을 취해 10을 곱한 것이 dB 척도다. 이 척도에 따르면 1m 정도 떨어진 거리에서 사람은 대체로 60 - 70 dB에 이르는 강도로 대화를 한다. 아주 이상적인 상태에서 1000Hz음의 강도를 변화시켜 들려주면 약 280개를 구별할 수 있으며, 가청영역(20-20000Hz)에서 사람이 구별할 수 있는 소리의 크기는 약 30만에서 40만개에 이를 정도로 엄청난 구별능력을 갖고 있다 (고도흥외 1993:104).
이러한 크기에 대한 척도로는 정현파음을 들려주어 피험자가 주관적으로 판단하게 하여 구한 phon과 sone이 있다. phon 척도는 1000Hz 음의 강도값에 해당하는 값을 의미한다. 예를 들어, 40dB크기의 1000Hz음을 두 귀로 들으면서 피험자는 100Hz의 음의 강도를 이와 같은 크기의 음이 되도록 조정하여 약 63dB에서 동일한 크기가 됨을 표시하였다. 즉, 63dB 크기의 100Hz음의 크기청각 척도는 40 phon이 된다. 이런 방법을 통해 가청 주파수 범위에서 데시벨 척도와 같은 크기의 음위치를 연결하면 그림 2와 같은 phon곡선이 된다.
그림 2. 크기수준과 강도 수준. 곡선은 phon으로 측정한 강도값을 나타낸다 (고도흥외 1993:97 그림 5.10)

이 그림에 따르면 저주파에서는 상당히 크기가 높아야만 지각이 됨을 알 수 있으며 고주파로 갈수록 특히, 3400Hz를 전후해서 아주 민감하고 그 이후에는 다시 둔 감해지는 도표를 보이고 있다. 이러한 비선형적인 청각특성을 보상하기 위해 음악감상시 저주파를 증폭시키고 고주파는 줄이는 장치를 사용한다. 이러한 phon척도는 두 개의 음을 비교해서 그저 더 크다는 것을 알려줄 뿐 한 값이 다른 값보다 몇 배 더 큰가를 나타내지 못한다. 따라서, 심리학자들은 이러한 값 사이의 배수 관계로 쉽게 알 수 있는 척도를 고안했는데 이것이 sone척도이다.
sone은 피험자에게 두 개의 음을 들려주어서 그들 중 하나의 강도를 다른 것의 두배(또는 반 정도)크기로 조정하게 하는 실험을 통해 상대적인 배율을 포착하려 했다. 기준크기인 1 sone은 40dB의 1000Hz음으로 정했다. 그래서 2 sone은 1 sone의 두 배로 지각함을 나타내고 0.1sone의 100 배는 10sone이 된다. 그런데 phon의 변화와 sone의 변화를 비교해보면 40phon이 100phone으로 약 60phon의 변화(60dB 1000000배의 차이)를 가져올 때 sone의 변화는 1sone에서 거의 100sone으로 약 100배의 변화를 나타낸다. 따라서, 사람이 지각하는 크기 변화는 강도값보다는 훨씬 적다. 그러나 이러한 sone과 phon의 분석은 순음에 대한 실험에 불과하기 때문에 복합음에 대해서는 또 다른 정밀한 실험이 있어야 할 것이다.

4. 소리의 높이에 대한 청각 척도

인간이 구분할 수 있는 주파수의 범위는 변한다. 아이들은 20Hz-20,000Hz까지 구분할 수 있으나 30세가 되면 보통 18kHz이상을 구분할 수 없게되고 50세 때는 14kHz까지 70세에서는 10 kHz까지 구분할 수 있다(Sumikawa 1985). 따라서, 모든 연령에 알맞게 적용할 수 있는 장치로는 130-5000Hz까지의 유효주파수 범위가 되면 좋다. 우리는 소리를 듣고 쉽게 나이나 성별을 추정할 수 있는데, 그 단서로는 서로 다른 길이나 크기, 무게를 가진 화자의 성대와 긴장도가 있다. 예를 들어, 남자는 120-150Hz로 발성하고 여자는 210-240Hz의 기본주파수를 갖고 있다. 그러나 전화통화에서는 300Hz이하의 음성을 전달하지 않지만 여전히 상대방이 남녀를 구분할 수 있는 이유는 인간의 귀는 모양은 같지만 서로 다른 주파수 높이의 분포를 보이는 스펙트럼을 받아들이므로써 남녀구분을 할 수 있기 때문이다. 귀는 특히, 500Hz와 505Hz음을 들었을 때 이 들의 차이인 5Hz음을 동시에 듣는다. 즉, 두 개의 음파는 서로 다른 위상을 갖고 있으며 5Hz마다 한 번씩 일치하게 되어 두음의 합이 가장 크게 되고 이것을 귀가 듣는 것이다. 예를 들어, 1500Hz와 2000Hz를 들려주었을 때 두음의 차이인 500Hz에 해당하는 음이 동시에 들리게 되어(Newby and Popelka 1992:59), 실제로는 세 개의 음을 듣는 것과 같은 청각적 인상을 주게 된다. 따라서, 음성합성에 의한 청각실험에서 피험자가 연이어 제시된 소리의 차이를 판단할 때 이러한 차이음을 듣고 판단한 것이 아닌지 주의해야 할 것이다.
소리의 높이에 대한 청각척도로는 mel과 bark가 흔히 사용된다. mel척도는 Fant(1960)의 실험에 제시되어 있는데 실험방법은 1000Hz(40dB)의 음을 기준으로 이것의 두 배가 되는 음을 2000mel이라하고 이것의 반음에 해당하는 주파수를 500mel로 나타내고 있다. 이러한 방식으로 조사하면 주파수로는 9000Hz가 mel단위로는 1000Hz의 세 배인 3000mel에 해당한다. 이러한 mel척도를 이용하면 음향적 단위를 사람이 듣는 단위로 환산할 수 있다. 하지만 이 척도는 소수의 피험자를 대상으로 한 실험으로 주관성이 개입되어있고 또한 정현파 신호에 국한하여 설정한 척도이기 때문에, 앞으로 음성파를 이용하거나, 보다 근본적인 청각기관에 대한 생리적 실험을 통해 뒷받침이 되야 할 것이다. 음향적 척도인 주파수를 청각 척도인 TM(technical mel)으로 환산하는 공식(Fant 1973)은 다음과 같다.

TM=(1000/log2)log(f/1000+1)

인간의 청각계는 서로 다른 주파수에 조율된 여러 개의 중첩된 필터를 사용하는 것처럼 작용한다. 어떤 주파수 주위에 그 주파수를 가장 효과적으로 차폐할 수 있는 주파수를 보통 경계주파수역(Critical Band:CB)이라고 한다. 이 CB는 고주파에서는 넓 은 대역을 차지하고 저주파에서는 매우 좁은 대역을 나타낸다. 이것을 수치로 도표화하여 나타낸 것이 bark척도이다. 음향적척도를 청각척도로 환산하는 공식은 다음과 같다(Zwicker and Terhardt 1980).

B=13 arctan(0.76f/1000)+3.5 arctan(f/7500)2

그림 3은 주파수 해상영역을 bark와 mel로 환산하여 나타낸 것이다.

그림 3. 음향적 주파수와 청각척도의 비교. y축은 mel 척도와 bark값에 118을 곱하여 1000Hz가 1000bark가 되도록 변환한 값을 넣었다.


이 그림을 살펴보면, 약 500Hz 까지 매우 정교한 주파수 해상도를 나타내고 있으며 그 위로는 대체로 대수함수처럼 곡선을 이루고 있다. 예를 들어, 500 Hz는 4.9Z이고, 1000Hz는 8.5Z에 해당한다. 음향적 주파수로는 두 배에 해당하지만 bark척도로는 3.6Z의 차이에 해당한다. 5000Hz에서는 19.2Z에 해당하고, 5500Hz에서는 19.8Z로 그 차이가 6.6Z에 불과하다. 이것은 내이의 구조와 연관되어 있는데 앞서 제시된 그림 1처럼 타원창에 가까운 딱딱한 곳에 고주파가 반응하며 안쪽으로 갈수록 보다 많은 청각세포가 저주파 영역에 세분되어 할당되어 있음을 알 수 있다. 이것은 bark곡선과 일치하는 결과를 나타내고 있다(Johnson 1997:56). 저주파에 대한 세밀한 정보는 결국 모음이나 공명자음 등에 대한 정보를 구분하는데 매우 중요한 단서를 얻을 수 있게 한 다. 파찰음 등의 소음성 비공명자음들은 2000Hz이상의 높은 대역에 분포되어 있는데 실제 대화에서 차지하는 비율은 대체로 낮다. 따라서, 300-3500Hz전후로 주파수가 통과되게하는 전화 장치를 사용하더라도 일상대화에는 전혀 지장이 없다. 이것은 고주파 영역이 일상대화에서 중요한 역할을 하지 않음을 단적으로 보여주는 예라 하겠다.
이러한 실험들은 주로 단순한 정현파를 합성하여 청각실험을 한 결과이다. 복합음에서도 이와 비슷한 비선형성을 보인다. 복합음에 대한 지각 실험의 예를 들어보면, 양병곤(1995)의 경우에 단모음의 포먼트를 추출하여 이를 합성하고 제 1-2 포먼트를 각각 50Hz로 증가시키거나 감소시켜서 합성한 뒤 이미 합성한 기준 모음과 비교하여 같은지 다른지를 20명의 남녀대학생에게 판단하게 하는 청각실험을 실시한 바 있다. 이 실험의 결과 제 1포먼트의 경우는 남자그룹은 약 163Hz의 변화에도 그 차이를 보이지 않았고, 제 2포먼트에서는 약 415Hz의 변화에도 동일한 음으로 판단했으며, 제 3포먼트의 경우에는 약 843Hz의 변화를 거의 다르게 느끼지 않았음을 보였다. 이와 비슷하게 여자그룹에서는 남자보다 약 40Hz 정도 더 높은 주파수에서 동일하게 지각하고 있음이 나타났다. 이러한 결과는 사람이 저주파에서는 대역을 좁게 세분하여 들으며 고주파에서는 상당한 주파수 변화에도 동일한 음으로 듣고 있다는 결과를 보인다.
이중모음의 합성실험 (양병곤 1996)에서도 이와 비슷한 청각현상을 보이는 결과가 나왔다. 이중모음은 처음부터 끝까지 포먼트가 계속 변하는 양상을 보이고 있는데 이를 앞서의 단모음 실험과 같이 동일한 간격으로 변화시켰을 때는 제 1포먼트에서는 남녀 평균 약 120Hz, 제 2포먼트에서는 약 342Hz 제 3포먼트에서는 약 806Hz의 변화에도 동일한 이중모음으로 지각함을 보였다. 물론 전이부의 일부분만 변화시킨 합성음을 들려주었을 때는 이것보다 약 두 배의 예민도를 나타냈는데, 지각범위의 예민도에 있어서는 주파수가 상승할수록 보다 넓은 영역을 동일하게 지각하는 비선형적인 청각현상을 뒷받침한다.

5. 청각 척도의 활용

이러한 청각척도의 활용 방법 가운데 하나는 음향적으로 측정한 음성에 대한 정보를 청각 척도로 전환시킴으로써 음성에서 많은 정보를 담고 있는 저주파의 정보가 보다 상세히 나타나고 고주파의 정보는 줄어들게 되어 음성인식장치등을 이용하여 각각의 음성을 구분할 때 도움이 된다. 최근에 개발된 Praat 음성분석프로그램에 포함된 cochleagram은 그림 4와 같이 음성의 저주파 부분이 확대되고 고주파부분은 축소되어 필요한 정보를 충분히 파악할 수 있도록 했다.
두번째로 이런 청각척도를 활용할 수 있는 방안은 컴퓨터에 입력된 음향적 음성분 석값을 변환시킴으로써 사람이 듣는 것과 같이 처리하는 기술의 출발점이 된다. 예를 들어, 사람의 음성은 성별과 나이 방언등에 따라 여러 가지로 변한다. 또한 시끄러운 곳이나 조용한 곳과 같이 상황이 바뀌면 발성 방식도 변한다(Lindblom 1990). 다시 말해서, 사람이 발성할 때 여러가지 환경조건들이 바뀌기 때문에 정확히 측정해보면 매번 다르게 발성함에도 이를 쉽게 알아들을 수 있는 것은 귀가 이러한 차이를 모두 감안하기 때문이라고 할 수 있다. 그래서, 사람이 발성한 음성을 컴퓨터에 입력한 뒤 이를 mel이나 bark척도로 변환하여 보면이들의 차이가 상당히 줄어져 있음을 알 수 있다.

그림 4.영어 발음 /ba,ga/의 광역스펙트로그램과 cochleagram(Johnson 1997:139)

그림 5는 한국인 남녀화자 20명이 발성한 국어 단모음의 발음 구간 가운데 1/3 지점에 위치한 스펙트럼을 분석하여 각 그룹의 제 1-3 포먼트 값의 평균을 구하여 나타낸 것이다(Yang 1990). 안이 검게 차있는 표시는 남자의 발음 평균을 나타내고 안이 비어있는 기호는 여자의 발음 평균을 나타낸다. 네모는 제 1포먼트 원은 제 2포먼트를 세모는 제 3포먼트를 나타낸다.

그림 5.국어 단모음의 남여 화자가 발성한 모음의 제 1,2포먼트 값을 청각 척도로 나타낸 그림.



이 그림에서 살펴보면 음향적 척도에서는 명백한 차이가 보이지만 청각척도에서는 이것이 매우 비슷한 위치를 차지하고 있음을 알 수 있다. 즉 사람의 귀로는 남여의 차이가 나는 음성을 동일하게 듣는다는 것을 보여주고 있다. 이러한 정규화(normalization)에 대한 문제(Yang 1990)는 여전히 보다 깊은 연구가 필요하지만, 앞서의 청각척도가 매우 정밀하게 된다면 상당부분 그 차이를 해결할 수 있을 것이며 응용할 수 있는 범위가 넓을 것이다.

6. 결론

지금까지 사람의 청각척도에 관해 통합적으로 살펴보았다. 이러한 소리에 대한 다양한 청각척도들은 비선형적인 특성을 나타내고 있다. 이러한 비선형성을 컴퓨터 음성인식장치 등에 활용하면 남녀차이와 같은 여러 가지 문제를 해결할 수 있는 단서를 찾을 수 있음을 보았다. 제안된 청각척도들은 주관적인 방식에 의해 수집되었기 때문에 앞으로 보다 정밀한 척도를 구하는 연구가 있어야 할 것이다. 또한 , 이러한 결과들은 순음을 이용하여 합성한 음을 기준으로 하였기 때문에 그 결과가 반드시 복합음에도 적용될 수 있을 것이라고 가정할 수는 없지만 기존 합성음의 청각실험연구(양병곤 1995;1996)에서도 보았듯이 거의 비슷한 비선형적인 결과를 보여주고 있다. 따라서, 청각척도들을 보다 더 정밀하게 하기 위해서는 여러 개의 정현파가 섞여있는 복합파를 합성하여 청각 척도를 개발하고, 아울러 보다 정밀한 포먼트 음성합성방식을 응용하여 실제의 음성과 동일한 음파를 만들어서 청각 실험을 실시할 필요가 있다. 특히, 달팽이관의 반응에 대한 생리적인 자료가 뒷받침되는 척도의 개발이 바람직할 것이다.
덧붙여, 이러한 청각 척도 실험에서 피험자는 상당히 모국어 구조에 의존하기 때문에 주의해야한다. 예를 들어, 모음이 3개인 모국어를 사용하는 화자나 그 몇 배에 해당하는 모음을 사용하는 언어권의 화자는 분명히 다른 청각 예민도를 갖고 있으리라 예상된다. 이렇게 서로 다른 잣대에서 생성된 자료를 어느 언어권에나 동일하게 적용하는 것은 무리가 있을 것이다. 아울러, 사람은 의사소통을 할 때 그저 소리를 전달하고 각각의 분절음을 듣는 다기보다는 오히려 자주 듣는 표현 등에 의해 축적된 지식이란 요소가 개입됨을 알 수 있다. 예를 들어, 어떤 사람이 "소 일꼬 에양깐 고친다"라고 사투리로 발음을 했을 때 이를 들은 사람들에게 무슨 말을 했느냐고 물어보면, 대체로 그 사람의 각각의 발음을 듣지 않고 전체적인 속담을 알고 있기 때문에 쉽게 추정하여 원래의 소리를 복원할 수 있는 것이다. 이러한 것은 외국인이 한국어를 배운 뒤 이러한 속담에 대한 지식이 전혀 없다면 화자의 의도를 파악하는데 순전히 분절음에 의존해야 하는 부담을 갖게 되는 것이다. 이러한 통합적인 청각체제에 대해서도 앞으로 보다 많은 연구가 뒤따라야 할 것이다.

참고 문헌


고도흥, 구희산, 김기호, 양병곤 역.1995. 음성언어의 이해.
서울: 한신문화사.
양병곤 역. 1993. 음성학 입문. 부산:진영문화사.
양병곤.1995. "합성한 한국어 단모음의 지각실험 연구." 언어 20(3), 127-146.
양 병곤. 1996. "합성한 한국어 이중모음의 지각실험 연구." 언어 21(3), 829-843.
Clark, J and C. Yallop. 1992. An Introduction to Phonetics
and Phonology.
Cambridge, MA: Blackwell.
Fant, G. 1960. Acoustic Theory of Speech Production. Mouton, 's- Gravenhage, The Netherlands.
Fant, G. 1973. Speech Sounds and Features. Cambridge, MA: MIT Press.
Fraisse, P. 1981. "Multisensory aspects of rhythm." R.D. Walk &
H.L. Pick(eds.), Intersensory Perception and Sensory-integration,
217-245. New York: Plenum Press.
Johnson, K. 1997. Acoustic Auditory Phonetics. Cambridge, MA:Blackwell.
Kent, R.D. and C. Read. 1992. The Acoustic Analysis of Speech.
San Diego, CA: Singular Publishing Group, Inc.
Lindblom, B. 1990. "Explaining phonetic variation: a sketch of the H-H
theory." W.J. Hardcastle & A. Marchal, eds. Speech Production and Speech Modeling,
403-439. Dordrecht:Kluwer.
Newby, H.A. and G.R. Popelka. 1992. Audiology. Englewood Cliffs, NJ: Prentice Hall.
Pickett, J.M. 1980. The Sounds of Speech Communication. Austin, Tx: Pro- Ed, Inc.
Sumikawa, D.A. 1985. "Guidelines for the integration of audio cues into
computer user interfaces." Technical Report no. UCRL 53656.
Lawrence Livermore National Laboratory.
Yang, B. 1990. Development of Vowel Normalization Procedures: English and
Korean.
Seoul: Hanshin Publishing Co.
Yang, B. 1992. "An acoustical study of Korean monophthongs produced by male and female speakers."
JASA 91(4)
, 2280-2283.
Yang, B. 1993. "A comparative study of American English and Korean vowels
produced by male and female speakers." Journal of Phonetics 24, 245-261.
Zwicker, E. 1962. "Subdivision of the audible frequency range into critical
bands (frequenzgruppen)." JASA 33, 248-249.
Zwicker, E. and E. Terhardt. 1980. "Analytical expressions for critical- band rate and critical
bandwidth as a function of frequency." JASA 68, 1523-1525.


접수일자: 1997.10.10.
게재결정: 1997.11.10.


부산시 진구 가야동 산 24
동의대학교 인문대학 영어영문학과 (우편번호: 614-714)
Tel:(051) 890-1227 (O), 896-7636 (H)
Fax:(051) 890-1209
e-mail: bgyang@hyomin.dongeui.ac.kr