Journal List > Korean J Otorhinolaryngol-Head Neck Surg > v.65(7) > 1516079731

비침습적 전기자극을 통한 충추신경계로의 언어 전달

Abstract

Recent advances in neuroscience and precise electric stimulation have enabled us to deliver complex signals to the central nervous system. But most of the successful electric stimulation devices such as cochlear implant and deep brain stimulation require surgery. Considering that most of the patients with hearing loss have a significant residual hearing, it is not feasible to open up the round window and insert an electrode in a functional cochlea. The concept of non-invasive electric stimulation of the auditory system may have a role in the future to overcome this unmet need in the clinic. Until now, many researchers have tried to delivery speech signal to the brain by means of non-invasive electric stimulation. Trans-cranial electric stimulation have most extensively been studied and interesting outcomes have recently been published. Some studied were able to prove that the envelope of the speech can be delivered by non-invasive electric stimulation. This new technology is called speech entrainment. By inducing speech entrainment, researchers were able to enhance the speech recognition score in noisy environments. But there are also some limitations in this approach. For instance, the time delay of the auditory sound and brain entrainment must be matched which is quite challenging. Although some limitation needs to be resolved, recent advancements in this new field is very interesting. More developments will follow in the next few years that can help patients with hearing loss in the near future.

서 론

전기자동차 회사 Tesla와 민간 우주발사체 회사 SpaceX를 통해 잘 알려진 미국의 기업가 Elon Musk는 최근, 뇌에 3072개의 전기자극/측정용 전극을 삽입하여 뇌와 컴퓨터를 연결하는 사업에 큰 투자를 진행중이다[1,2]. 2020년 본 장비를 돼지의 뇌에 이식하는 전임상 연구가 진행중이고, 이 돼지가 언론을 통해 알려지면서 유명세를 타기도 하였다. Neuralink라는 회사를 통해 진행중인 본 사업은 사람의 뇌와 컴퓨터를 서로 연결하여 정보를 주고받는 것은 물론, 전기적 자극을 통해 뇌전증을 치료하거나, 로봇 팔을 조정하고, 생각을 언어로 바꾸는 등의 다양한 기능을 수행하는 것을 목표로 한다[1]. 기존 연구들과 달리 극도로 얇은 생체적합 전극을 사용하고, 전극 이식용 로봇을 함께 개발하며, 수 많은 전극을 고밀도로 이식한다는 점이 이 사업의 차별점이다[1)]. 그러나 전극이 얼마나 오래 유지 가능하고, 뇌의 신호를 완전하게 이해하고 조절하는 것이 실제 가능할 것인지에 대해서 회의적인 평가를 받기도 한다. 또 하나의 현실적인 걸림돌은 뇌 속으로 5-50 μm 두께의 전극을 수 천개 삽입하는 침습적인 수술을 거쳐야 한다는 점이다. 이에 새로운 기술의 도움이 필요한 모든 환자들이 뇌수술을 받기는 어려울 것이며, 대안으로 비침습적인 방법으로 유사한 임상적 효과를 얻으려는 연구들도 활발하다.
중추 청각신경경로를 전기적으로 자극하는 방법에 대해서는 오래전부터 연구가 이루어졌으며, 현재는 인공와우를 통해 성공적으로 언어 정보를 뇌에 전달할 수 있게 되었다. 인공와우는 청신경을 통하여 중추신경계로 전기적 신호를 전달한다는 점에서[3], 직접적으로 대뇌 신경세포를 자극하는 위 방법과는 기전이 다소 다르다. 그러나 인공적인 이식장치를 이용한다는 점, 신경세포에 전기적 신호를 전달한다는 점, 뇌와 기계장치가 상호 이해 가능한 정보를 주고받는다는 점에서는 개념이 유사하다. 현재의 인공와우는 speech envelope과 같이 느린 주기의 정보를 뇌가 이해할 수 있는 상태로 가공하여 효과적으로 전달할 수 있다. 그러나 인공와우도 300-800 μm 두께의 전극(CI522 and Contour Advanced, Cochlear Ltd., Sydney, Australia)을 와우 속으로 이식해야 하기에, 모든 환자들에서 본 기술을 이용하기에는 제약이 있다.
중등도 난청 환자의 경우 침습적인 인공와우 수술을 받기에는 청력이 너무 좋기 때문에 보청기를 사용하게 된다. 그러나 보청기는 소음 환경 또는 다자 대화 상황에서 환자가 듣고자 하는 언어정보와 주변 소음(또는 대화 상대가 아닌 사람의 목소리)을 모두 함께 증폭하여 언어의 구별과 인지가 쉽지 않은 문제가 있다. 이에 비침습적인 전기자극을 통해 피험자가 듣고자 하는 언어 정보를 선별적으로 중추신경계로 전달할 수 있다면 유용한 기술이 될 것이다. 본 글에서는 비침습적 전기자극을 이용하여 중추신경계로 언어를 전달하는 기술이 어디까지 발전하였고 현재 기술의 한계점, 향후 연구개발의 방향에 대해 정리해 보고자 한다.

전기자극을 통해 전달하고자 하는 언어정보

마치 음악과 같이 대화에서 사용되는 언어도 일정한 리듬을 가지고 있다. 이러한 리듬은 대체로 음절과 휴지기로 구성된다. 예를 들어 “The box contained a thin letter from Italy”라는 영어 문장을 살펴보면, 12개의 음절과 11개의 휴지기로 구성되어 있다. 1-2개의 음절은 단어를 형성하는데, contained, letter는 2개의 음절로 구성된 단어이고, Italy는 3개의 음절로 구성된 단어이다[4]. 이에 위에서 제시한 예시 문장은 8개의 단어, 12개의 음절로 구성된 리듬을 내포한다. 시간축에서 음압을 분석하는 경우 이러한 음절은 진폭이 큰 구간으로 나타나며 휴지기는 진폭이 작은 구간으로 나타난다. 시간에 따른 진폭의 변화 그래프에서 fine structure를 지우고, 최대 진폭 정보만 추출하면 언어의 리듬을 보다 직관적으로 시각화 할 수 있다[4]. 이를 speech envelope라고 하며, 음성 언어는 1-8 Hz의 느린 시간적 변동성을 가지고 있다[5,6]. 특히 4-8 Hz 구간에서 가장 강한 주기성을 보이는데, 뇌파 중 이 진동주기 구간을 theta 구간이라고 한다[7]. 일반적으로 theta(4-8 Hz) 구간에서의 entrainment는 어음의 시작을 추적하는 등 하위 음향 정보 처리와 관련이 있고,8) delta (1-4 Hz)구간에서의 entrainment는 언어의 구문과 의미 등 고위 언어 정보 처리와 관련이 있다[8,9].
초기 연구들은 기초적인 청각 처리 능력을 조절하는 것이 목표였다면[10,11], 최근 연구들은 언어 처리 능력을 조절하는 것을 목표로 한다[12]. 더불어 초기 전기자극 연구들은 전기적 신호 속에 언어적인 정보를 포함하지 않았다. 최근에는 전기적 자극 속에 언어 성분을 포함하여 자극을 생성하는 연구들이 활발하게 수행되고 있다. 전기자극 속에 언어적 정보를 포함하지 않는 대표적인 자극 방법은 직류자극이다. 맥걸크 효과(McGurk effect)는 청각자극(예: /ba/)과 시각자극(예: /ga/)이 상이할 때 피험자가 중간 성격의 어음(예: /da/)으로 자극을 지각하는 효과이다. 일차청각피질에 인가된 직류자극은 맥걸크 효과를 약화시킬 수 있다고 보고되었다. 또 일차청각피질에 직류자극을 인가하면 단음절을 구분하는 능력(예: /ta/와 /da/)이 개선되는 것으로 생각된다. 이들 결과는 전기자극을 통해 언어 능력을 조절할 수 있다는 점에서 고무적이기는 하나, 자극이 다소 단순하여 확장성과 임상적 활용 가능성이 크지 못하다.
교류자극을 이용하는 경우 다양한 언어적 특성을 전기자극 속에 반영할 수 있다. 즉 교류자극의 주기, 강도, 위상 정보를 적절히 조정하여 전달하고자 하는 문장과 유사한 리듬의 전기자극을 생성하는 것이 가능하다. 예를 4 Hz의 교류 자극을 제시하면 소음 속에서 비언어적 목표음을 분리해내는 시간이 단축된다는 보고가 있다[13]. 또 어음을 분류하는 학습 능력(예: /ta/와 /da/)은 40 Hz 전기자극에 의해 악화되고 6 kHz 자극에 의해 호전된다고 한다[14]. 이상의 예시는 매우 기초적인 언어 정보를 활용한 예시이며, 최근 전기자극 연구들은 speech envelope를 전기적으로 전달하여 언어 이해 능력을 개선하고자 한다. 경두개 전기자극을 통한 speech envelope 전달은 2018년 이후 개념 검증이 시작되었으며, 현재까지 발표된 논문이 10편 미만일 정도로 새로운 연구 영역 이다[15-19]. 이들 연구의 결과와 의미에 대해서 후속 문단에서 자세히 설명하고자 한다.

Speech Entrainment의 개념

사전적 의미로 entrainment란 “탑승시키다”라는 의미이며 특히 기차에 탑승시킨다는 뜻을 가지고 있다. 이를 뇌신경계의 전기자극 측면에서 조금 더 풀어 설명하면, 생체 내부의 리듬을 외부 환경에 존재하는 리듬에 맞추어 동기화시켜준다는 의미이다[20]. 예를 들어 일정한 주기성을 가진 문장을 듣게 되면 대뇌 청각 피질에서 나타나는 뇌파의 반응도 동일한 주기를 따라 동기화되는 특성이 있다[21,22]. 청각을 통해 전달된 언어의 경우는 envelope를 따라 주기가 동기화되기 때문에 이를 envelope-following neural response라고도 부른다[17]. 이러한 특성은 비침습적인 뇌파도, 수술을 통한 침습적 뇌파도, 뇌자도 등 다양한 실험 기법을 통해 재차 확인되었다[17]. Entrainment는 피험자의 주의 집중, 주기에 대한 기대, 내재적인 뇌 활동 주기성 등 다양한 요소의 영향을 받는다. 즉 외부 자극에 의해 뇌반응의 주기가 동기화되듯이, 반대로 내재적인 뇌 활동 주기 또는 주기에 대한 기대에 의해 외부 자극을 보다 잘 지각할 수 있다. 예를 들어 뇌의 내재적인 주기성과 일치하는 언어 신호가 주어지는 경우 피험자는 소음 속에서도 해당 신호를 선별적으로 집중할 수 있게 된다[23,24]. 이에 전기적 자극에 따른 entrainment를 조절하면 소음속 언어인지 명료도에 기여할 수 있는 것으로 생각된다[18].
전기자극을 통해 유도한 entrainment의 효과를 극대화하기 위해서는 전기적 신호와 소음속에서 선별하고자 하는 목표 음성 언어의 위상이 일치하여야 한다. 즉 교류자극 전압의 상승구간/하강구간이 음성 언어 envelop의 상승구간/하강구간과 정확히 일치하는 경우에 중추신경계의 언어 처리 능력이 유의하게 좋아진다. 그러나 전기적 자극이 신경세포를 entrainment하는 경로/시간지연은 음성 언어가 내이를 거쳐 청각 중추신경계를 활성화하는 경로/시간지연과 전혀 다른 것으로 알려져 있다. 이에 어느 정도의 시간차로 서로 다른 두 가지 자극(전기자극과 음성 언어자극)을 전달해야 하는지가 매우 난해한 문제이다. 더불어 이 시간차는 자극 위상, 제시방법, 피험자 개인별로 차이가 있을 수 있기에 손쉬운 해결 방법이 존재하지 않는다[19]. 이에 교류자극을 이용하는 많은 연구들은 6-8가지 서로 다른 여러 시간차를 모두 시험하는 방법을 이용한다[15,16,18]. 우연히 위상이 일치하는 실험 조건(최적 시간차)이 존재한다면, 이 조건에서 언어인지 명료도가 유의하게 향상될 것이다. 최적 시간차는 아니지만, 이와 매우 근접한 시간차 실험 조건에서는 비교적 좋은 언어인지 명료도 성적을 보일 것으로 유추된다. 한편 최적 시간차와 위상이 180도 반대인 조건에서는 언어인지 명료도가 유의하게 나빠지게 되어, 언어인지 명료도는 시간차에 따라 사인파형과 같이 주기성을 보이게 된다[17,18]. 이러한 특성에 근거하여 교류자극에 따른 entrainment 결과가 시간차에 따라 사인파형 주기성을 보이는지 여부가 entrainment 효과를 증명하는 수단으로 사용된다. 몇몇 연구들은 100-300 ms 사이의 지연이 최적 시간차라고 보고하는 반면[17,18], 연구에 따라서는 시간차에 따른 영향이 크지 않다는 보고도 있어[15,16] 향후 더 연구가 필요한 주제이다[19].

뇌신경계의 전기자극 역사와 방법들

200년 전인 1800년대 Volta [25)]의 실험에 의해 전기자극이 뇌에서 소리를 정보로 지각될 수 있다는 점이 밝혀졌다. 그는 다양한 신체 부위에 전기적 자극을 인가하고 시각, 청각, 미각, 촉각 등의 감각이 유발될 수 있음을 보고하였다. 이 당시 발견한 중요한 개념은 인체가 인지하는 감각이 전기적 자극의 종류에 의해 결정되는 것이 아니고, 어느 신경 또는 뇌영역이 자극되었는지에 의해 결정된다는 점이다[26]. 이후 경두개 전기자극술은 1960년대에 급격한 발전을 이루고, 현재는 우울증, 기억력[27], 집중력[28], 인지[29], 운동능력[30] 등 다양한 분야에서 활용되고 있다.
한편 중추신경계로 언어를 전달하려는 경두개 전기자극 연구는 그 역사가 약 10년 이내로 길지 않다[12]. 초기 연구는 직류자극을 통한 언어 이해 능력의 변동을 관찰하였으며, 교류자극을 이용한 연구는 2015년 이후 시작되었다[31]. 전형적인 경두개 전기자극 연구는 비침습적인 두피 전극을 통해 일차 청각피질로 언어 정보를 전달하는 것을 목표로 한다. 후상측두엽 또는 하전두엽을 자극하여 언어 이해 능력을 조절하는 연구도 발표되었으나, 일차청각피질에 비하면 결과의 편차가 크다는 문제가 있다[12]. 한편 청각 정보를 전달하기 위해 두피에 접촉하는 전극 뿐만 아니라, 귀 주변에 접착하는 전극, 외이도에 삽입하는 전극, 고막에 접촉하는 전극도 사용되었다[32]. 다소 침습적인 방법이기는 하나, 고막을 절개하고 전극을 정원창에 접촉하는 방법도 보고되었다[31].

자극 방법과 작동 기전

경두개 전기자극의 경우 전류가 대뇌를 통과하면서 신경세포의 전위를 변경하는 것으로 알려져 있다. 즉 직류 전기는 신경세포의 세포막 이온 전위를 변화시켜 활동전위가 발생할 가능성을 높이거나 낮추게 된다[17,20,33]. 세포막 전위 변화가 신경세포의 흥분성에 미치는 영향에 대해서는 운동중추에서 많은 연구가 이루어 졌다. 예를 들어 직류 전위를 전달할 때 양극을 목표하는 피질 가까이 위치시키면 흥분성 반응이 유발되는 반면, 음극을 가까이 위치시키면 억제성 반응을 유발할 수 있다[34]. 그러나 운동중추 이외의 다른 뇌영역에서도 동일한 특성이 유효한지에 대해서는 다소 의문이 있다. 운동중추 외 다른 뇌영역에서 이루어진 실험 결과를 보면, 자극의 위치, 크기, 기간, 과제에 따라 흥분성/억제성 반응이 달라질 수 있다[12,35,36]. 한편 전류가 흐르는 동안 발생하는 중추신경계의 변화를 online effect라고 하고 자극이 종료된 이후까지 지속되는 효과를 offline effect라고 하는데, 직류 전기자극의 경우 offline effect가 약 90분까지 지속되는 것으로 알려져 있다. Offline effect는 시냅스 수준에서 발생하는 장기상승 또는 장기억압 효과에 의해 발생하는 것으로 추정된다[37].
교류 전기자극의 경우 주기적인 전압의 변동이 신경세포의 흥분성 리듬의 변동에 직접 영향을 주는 것으로 생각된다[38]. 교류 전기자극이 대뇌의 주기적 반응에 영향을 준다는 점은 기능적 MRI 영상[39], 뇌전도[40], 뇌자도 등을 통해 입증되었다. 이러한 결과는 피험자 뇌의 주기적 반응성을 연구자가 인위적으로 조절할 수 있음을 의미한다. 보다 구체적으로는 피험자의 뇌를 entrainment할 수 있음을 의미하며, 이 개념에 대해서는 이후 더 자세히 논의할 예정이다. 교류자극에 의한 offline effect는 30분 정도 지속되는 것으로 알려져 있으며[41], 신경세포 세포막의 과분극으로 인하여 시냅스 기능에 영향이 남기 때문으로 추정되고 있다.
이상과 같은 경두개 전기자극 방법의 문제는 전류 확산효과로 인하여 중추 청각신경경로 외에 다른 뇌영역이 함께 자극될 수 있다는 점이다. 예를 들어 전기자극을 통해 언어 이해 능력의 변화가 성공적으로 유도되었을 때, 이 효과는 언어 중추에 작용한 전기자극 효과 때문일 수도 있지만, 청각 역치 변화와 같은 음향 인지 기능의 변화 때문일 수도 있고, 귀 속 근육의 반사반응에 의한 차이 때문일 수도 있다[42]. 심지어는 언어, 청각과 전혀 관련이 없는 다른 뇌영역이 자극되어 시험 결과의 차이를 유발하는 경우도 발생할 수 있다. 이러한 점에서 청신경을 통하여 중추신경계를 국소적으로 자극하는 것이 비특이적으로 대뇌 전체를 자극하는 방법에 비하여 효율적일 가능성이 있다.
귀 주변의 전기자극을 통해 전기적 신호가 청신경, 그리고 중추신경계로 전달되는 기전에 대해서는 최소 3가지 서로 다른 가설이 존재한다[32,43,44]. 첫째는 전기자극이 고막의 물리적 진동을 유발하는 기전이다. 둘째는 전기자극이 외유모세포의 수축운동을 유발하여 기저막 진동과 진행파가 형성되는 기전이다. 셋째는 전기적 자극이 청신경 자체를 직접 자극하는 기전이다. 마지막 기전은 우리가 익숙한 인공와우의 기전과 동일하다. 그러나 실제 피험자에서 발견되는 다양한 심리음향학적인 결과들은 이상의 3가지 가설로 완전히 설명되지 않는 문제가 있다. 특히 교류자극의 주파수와 피험자가 인지하는 주파수가 서로 다른 현상에 대한 설명이 쉽지 않다. 예를 들어 1 kHz의 교류 전기를 인가하는 경우, 피험자는 일반적으로 1 kHz의 소리를 들었다고 느끼게 된다. 그러나 전기자극의 위치가 변경되는 경우 동일한 자극 조건에서 2 kHz를 들었다고 느끼는 경우가 발생하게 되는데, 이를 제곱법칙이라고 부른다[45]. 사인함수를 제곱하게 되면 주파수는 2배가 되고 진폭은 절반으로 줄게 되는데, 피험자가 인지하는 심리 음향학적 특성이 이와 동일하기 때문에 붙여진 이름이다(즉 2 kHz 소리가 들리고 소리의 크기가 절반정도로 작게 들림). 아직까지 왜 제곱법칙이 발생하는지에 대한 명확한 설명이 존재하지 않으며 이상의 가설 외에 다른 기전이 존재할 가능성이 있다.

성공적인 언어정보 전달 연구들

비침습적인 전기자극으로 envelope를 전달할 수 있다는 것은 2018년 독일 연구자들에 의해 처음 제시되었다(Table 1) [18]. 이전까지의 연구들은 직류자극을 이용하거나, 교류자극 중에서도 언어 성분이 배제된 단순 사인파형 전기 자극을 이용하였다. 반면 본 연구를 시작으로 음성 언어의 envelope 정보를 전기자극의 신호로 활용하기 시작하였다. 해당 연구자들은 두피 전기자극에 의해 언어인지 능력을 향상시킬 수 있음을 보고하였다. 보다 구체적으로는 소음 환경에서 다섯개의 단어로 이루어진 음성 언어 문장을 인지하는 Oldenburger sentence test를 이용하였다. 여섯 가지 서로 다른 시간차를 이용하였으며 두 가지 직류자극과 sham 자극을 포함하여 아홉가지 조건을 실험 진행하였다. 활성전극은 양측 일차청각피질에 근접한 두피(T3, T4)에 접착하였으며 회귀전극은 정수리 두피(Cz)에 접착하였다. 그 결과 sham 조건에서 signal to noise ratio (SNR) -7.3 dB까지 언어인지가 가능하였던 것이 교류자극에 의해 SNR -7.7 dB까지 성적이 호전되었다. 가장 성적이 우수한 시간차는 100 ms였다. 즉 교류자극이 먼저 시작되고 100 ms 이후 소리자극이 전달되는 경우 소음속 언어인지 성적이 가장 우수했다. 반대로 시간차가 50 ms인 경우 소음속 언어인지 성적이 가장 나빴다. 언어인지 점수의 사인 파형 변동 주기는 5.12 Hz였다. 파워스펙트럼 분석 결과에서도 언어인지 점수는 5.38 Hz 주기를 가진 사인파형 변동을 보였다. 사용한 문장들의 envelope를 주파수 축에서 분석하 면 5.3 H z의 주파수 성분이 가장 강력했다. 이에 저자들은 언어인지 성적에 5.12-5.38 Hz 주기의 변동이 발생하는 이유는 5.3 Hz에 해당하는 entrainment가 발생했기 때문이라고 주장하였다.
지금까지 보고된 연구 중 많이 알려지고 유의한 효과를 잘 입증한 연구로 네덜란드 연구자들이 진행한 연구가 있다[17]. 해당 연구팀은 교류자극을 제시하면서, 1) 다자 대화 환경에서 목표 언어를 인지하는 실험과 2) envelope를 제거하여 이해가 어려운 언어를 인지하는 실험 결과를 발표하였다. 전극의 위치는 위 실험과 동일하였다. 교류자극은 제시된 문장의 envelope 주기와 일치하는 4 Hz 사인파형 전류를 이용하였다. 다자 대화 실험의 경우 한쪽 귀에서는 남성이 말을 하고 반대쪽 귀에서는 여성이 다른 주제의 문장을 들려주었다. 피험자는 남성의 목소리에만 집중하도록 지시를 받고 하나의 문장이 끝나면, 문장 속 단어 중 몇 개를 정확히 인지할 수 있었는지 평가하였다. 그 결과 평균적인 언어 명료도가 56.2%±2.1%인 조건에서 최적 시간차 조건의 성적은 63.4%±2.1%로 향상되었다. 최적 시간차(위상차 각도)는 전기자극을 먼저 제시하고 음성 언어 자극을 316°±23° 늦게 제시한 경우였다. 위상차를 시간차인 초 단위로 변환하면 약 219.5 ms의 시간차가 최적임을 알 수 있었다. 그러나 피험자별로 최적 시간차는 표준편차가 매우 커서 평균값 하나로 이해하기에는 어려움이 있었다. 언어 명료도의 변동을 사인파형으로 분석하는 경우 성적의 변동 주기는 예상대로 4 Hz에 가까웠다. 즉 다양한 시간차에 따라 성적이 좋아지기도 하고 나빠지기도 하는데 이 성적 변동 주기가 실험 조건에서 사용한 음성 언어의 envelope과 일치하므로, 효과적인 entrainment가 발생한 것으로 해석이 가능하다. 이러한 언어인지도 변동은 sham 자극 조건에 비해서도 유의하게 좋았다. 두 번째 실험은 화자가 한 명인 조건에서 신호처리를 통해 음성 언어의 envelop를 제거한 음성을 상용하였다. 상기 설명한 전기자극을 인가하면서 음성 언어 명료도를 측정하였다. 그 결과 평균적인 언어 명료도가 61.1%±1.7%인 조건에서 최적 시간차 조건의 성적이 4.7%±1.8% 향상되었다. 이상의 결과는 일차청각피질에 교류자극을 제시하여 언어인지도를 유의하게 조절할 수 있음을 의미한다.
최근 발표된 흥미로운 실험으로, 모음의 길이에 따라 뜻이 전혀 달라지는 단어들을 이용한 실험이 있다[46]. 이 실험에서도 3.0-5.5 H z에 해당하는 사인파형 교류자극이 주어졌다. 그 결과 동일한 음성 언어가 주어지는 경우에도 교류자극의 종류에 따라 피험자가 인지하는 단어의 의미가 달라짐을 증명할 수 있었다. 다만 단어만을 별도로 분리해서 제시하는 경우는 교류자극에 따른 차이가 거의 없었다. 단어를 문장에 넣어 제시하는 경우에만 교류자극의 효과가 나타났는데, 이는 목표 단어가 제시되기 이전에 먼저 대뇌의 주기성 반응이 존재해야만 교류자극을 통해 이 주기성 반응을 변화시키고 entrainment하는 것이 가능하기 때문이라고 추정된다.
또 다른 연구에서는 entrainment가 이루어진 주파수 대역에 따라 언어 이해 능력이 달라진다는 보고가 있다. 즉 delta 영역(1-4 Hz) 교류자극을 제시하는 경우는 언어 명료도에 별다른 영향이 없었으나, theta 영역(4-8 Hz) 교류자극을 제시하는 경우에 언어 명료도를 유의하게 향상시킬 수 있었다[16]. 이는 theta 영역 entrainment가 음향 정보를 언어에 맞게 어구화하는데 도움을 주기 때문으로 추정된다. 한편 delta영역에 해당하는 상위 언어 이해 능력은 아마도 entrainment의 역할이 작은 것으로 생각된다. 전기자극을 통해 개선되는 소음 속 언어 명료도는 약 6% 정도였다. 이 정도의 개선은 보청기에서 소음 감쇄 알고리즘을 적용한 것과 유사하며, 임상적으로 실제 환자들에게 도움이 되는 수준이다. 본 연구에서 흥미로운 점은 피험자들 사이 최적의 시간차가 비교적 일정한 결과를 보였다는 점이다(36°±30°). 이는 앞선 연구들에서 envelope의 주파수 범위가 넓은(1-8 Hz) 문장을 사용했거나 인위적으로 envelope 리듬을 조작했기 때문으로 추정된다.

현재 기술의 한계점

비침습적인 전기자극을 통해 중추신경계로 envelop를 전달할 수 있다는 것은 매우 흥미로는 결과이고 미래에 확장 가능성이 크다. 그러나 앞서 소개한 연구들을 자세히 살펴보면 몇 가지 중요한 한계가 존재한다. 첫째, 전기자극 조건과 대조군 조건에서의 언어인지 능력 차이가 크지 않다. 소개한 연구들은 모두 통계적으로 유의한 차이를 입증하였지만, 점수 차이가 비교적 작았다. 연구마다 사용한 언어 검사의 종류가 서로 다르기 때문에 어느 정도 차이를 임상적으로 유의한 수준으로 정할지 명확하지 않다. 그러나 지금까지 보고된 차이는 아마도 환자들이 명확히 인지하기 어려운 정도의 차이일 가능성이 있다. 둘째, 전기자극과 음성 언어자극의 최적 시간차가 불명확하고 피험자별 개인차가 크다. 음향정보가 뇌까지 전달되는 중추 청각신경경로는 약 100 ms의 지연이 있는 것으로 알려져 있다. 한편 전기적 정보는 진행과정에서 시간 지연이 거의 없는 것으로 알려져 있다. 이에 어느 정도 시간차가 있어야 두 정보가 뇌에 동시에 전달될 가능성이 높다. 그러나 최적 시간차는 연구에 따라, 0 ms에서부터 200 ms까지 다양한 결과들이 보고되고 있다. 셋째, 대부분 연구들이 인위적인 가정과 복잡한 통계적 방법을 사용하고 있다. 즉 전기자극과 뇌의 entrainment 사이 연관 관계가 명확하지 않기 때문에, 많은 후처리를 해야만 비로소 인과관계를 확인할 수 있는 상황으로 이해된다. 넷째, 교류 전기자극의 방향성이 완전히 반대인 피험자들이 일부 존재한다. 보고에 따르면, 일부 환자는 좋은 결과가 예상되는 조건에서 오히려 정반대로 가장 나쁜 성적이 나타나게 되어 보정이 필요했다는 설명이 있었다. 다섯째, 자극의 조건과 방법이 표준화되지 않아 결과의 재현성에 있어 의문점이 있다[35,47,48]. 여섯째, 가장 효율적인 전극의 위치, 모양, 방향, 재질에 대해 아직 알려진 바가 적다[49] 이론적인 모델을 이용한 모의 실험에 따르면 활성전극 뿐만 아니라 회귀전극의 특성과 두 전극 사이 전류의 방향성도 결과에 중요한 영향을 미칠 수 있다고 한다.

미래 연구개발 방향과 결어

지난 10여년 사이 비침습적인 전기자극을 통해 언어를 충추신경계로 전달하고자 하는 연구는 많은 발전이 이루어졌다. 특히 언어의 envelope 성분을 전기 신호로 변환하여 비침습적으로 전달하는 방법은 유망한 기술로 생각된다. 다만 지금까지 발표된 대부분의 연구는 두피에 전극을 접촉하는 방법을 이용하였다. 전기의 확산을 고려하면 이 방법은 효율성이 낮은 방법이다. 두피와 구개골의 전도성을 고려했을 때 실제 청각 신경세포까지 전달되는 전압의 크기는 매우 낮을 가능성이 있다. 전류의 방향과 진행 경로도 매우 난해하고 일정하지 않을 가능성이 있다. 이에 대한 해결책으로 청각 신경전달경로 가까이에 전극을 위치시키는 경우 더 효율적인 자극이 가능하다. 예를 들어 전극을 귀 근처에 접촉하거나 외이도에 삽입하는 경우[32] 언어 전달 효율성이 크게 향상될 수 있을 것이다.
본 기술은 다양한 분야에 활용될 수 있다. 예를 들어 언어를 신경학적으로 분석할 수 있다. 또 언어보다 복잡하고 행동학적 의미가 깊은 정보 또는 명령을 중추신경계로 전달하는 장치로 발전이 가능하다. Developmental dyslexia의 치료에도 활용이 가능할 것으로 기대된다. 비침습적인 인공와우 장비가 개발된다면 많은 난청 환자들에게 도움이 될 수 있다. 비침습적 인공와우는 수술이 필요하지 않다는 점에서 보청기와 매우 비슷하다. 그러나 단순히 모든 음향 정보를 증폭하여 전달하는 것이 아니고, 언어 정보 중 envelope를 추출하여 전달한다는 측면에서 인공와우와 유사한 측면이 많다. 또 중추 청각신경경로의 전기자극은 이명 치료에 기여할 수 있다[31]. 더불어 향후 전기 뇌간유발반응검사, promontory stimulation test와 같은 검사를 개발하는 데도 이러한 정보가 이용될 수 있을 것이다.

ACKNOWLEDGMENTS

This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT) (No. NRF-2021R1A2C1094147).

REFERENCES

1. Musk E; Neuralink. An integrated brain-machine interface platform with thousands of channels. J Med Internet Res. 2019; 21(10):e16194.
2. Pisarchik AN, Maksimenko VA, Hramov AE. From novel technology to novel applications: comment on “an integrated brainmachine interface platform with thousands of channels” by Elon Musk and Neuralink. J Med Internet Res. 2019; 21(10):e16356.
3. Han JJ, Suh MW, Park MK, Koo JW, Lee JH, Oh SH. A predictive model for cochlear implant outcome in children with cochlear nerve deficiency. Sci Rep. 2019; 9(1):1154.
4. Peelle JE, Davis MH. Neural oscillations carry speech rhythm through to comprehension. Front Psychol. 2012; 3:320.
5. Ghitza O. On the role of theta-driven syllabic parsing in decoding speech: Intelligibility of speech with a manipulated modulation spectrum. Front Psychol. 2012; 3:238.
6. Ding N, Patel AD, Chen L, Butler H, Luo C, Poeppel D. Temporal modulations in speech and music. Neurosci Biobehav Rev. 2017; 81(Pt B):181–7.
7. Koning R, Wouters J. Speech onset enhancement improves intelligibility in adverse listening conditions for cochlear implant users. Hear Res. 2016; 342:13–22.
8. Ding N, Simon JZ. Cortical entrainment to continuous speech: Functional roles and interpretations. Front Hum Neurosci. 2014; 8:311.
9. Etard O, Reichenbach T. Neural speech tracking in the theta and in the delta frequency band differentially encode clarity and comprehension of speech in noise. J Neurosci. 2019; 39(29):5750–9.
10. Neuling T, Rach S, Wagner S, Wolters CH, Herrmann CS. Good vibrations: Oscillatory phase shapes perception. Neuroimage. 2012; 63(2):771–8.
11. Riecke L, Formisano E, Herrmann CS, Sack AT. 4-Hz transcranial alternating current stimulation phase modulates hearing. Brain Stimul. 2015; 8(4):777–83.
12. Zoefel B, Davis MH. Transcranial electric stimulation for the investigation of speech perception and comprehension. Lang Cogn Neurosci. 2017; 32(7):910–23.
13. Riecke L, Sack AT, Schroeder CE. Endogenous delta/theta soundbrain phase entrainment accelerates the buildup of auditory streaming. Curr Biol. 2015; 25(24):3196–201.
14. Rufener KS, Zaehle T, Oechslin MS, Meyer M. 40 Hz-transcranial alternating current stimulation (tACS) selectively modulates speech perception. Int J Psychophysiol. 2016; 101:18–24.
15. Keshavarzi M, Reichenbach T. Transcranial alternating current stimulation with the theta-band portion of the temporally-aligned speech envelope improves speech-in-noise comprehension. Front Hum Neurosci. 2020; 14:187.
16. Keshavarzi M, Kegler M, Kadir S, Reichenbach T. Transcranial alternating current stimulation in the theta band but not in the delta band modulates the comprehension of naturalistic speech in noise. Neuroimage. 2020; 210:116557.
17. Riecke L, Formisano E, Sorger B, Başkent D, Gaudrain E. Neural entrainment to speech modulates speech intelligibility. Curr Biol. 2018; 28(2):161–9. e5.
18. Wilsch A, Neuling T, Obleser J, Herrmann CS. Transcranial alternating current stimulation with speech envelopes modulates speech comprehension. Neuroimage. 2018; 172:766–74.
19. Kadir S, Kaza C, Weissbart H, Reichenbach T. Modulation of speech-in-noise comprehension through transcranial current stimulation with the phase-shifted speech envelope. IEEE Trans Neural Syst Rehabil Eng. 2020; 28(1):23–31.
20. Thut G, Schyns PG, Gross J. Entrainment of perceptually relevant brain oscillations by non-invasive rhythmic stimulation of the human brain. Front Psychol. 2011; 2:170.
21. Gross J, Hoogenboom N, Thut G, Schyns P, Panzeri S, Belin P, et al. Speech rhythms and multiplexed oscillatory sensory coding in the human brain. PLoS Biol. 2013; 11(12):e1001752.
22. Steinschneider M, Nourski KV, Fishman YI. Representation of speech in human auditory cortex: Is it special? Hear Res. 2013; 305:57–73.
23. Schroeder CE, Lakatos P. Low-frequency neuronal oscillations as instruments of sensory selection. Trends Neurosci. 2009; 32(1):9–18.
24. Millman RE, Johnson SR, Prendergast G. The role of phaselocking to the temporal envelope of speech in auditory perception and speech intelligibility. J Cogn Neurosci. 2015; 27(3):533–45.
25. Volta A. XVII. On the electricity excited by the mere contact of conducting substances of different kinds. Phil Trans R Soc. 1800; 90:403–31.
26. Piccolino M. The bicentennial of the Voltaic battery (1800-2000): The artificial electric organ. Trends Neurosci. 2000; 23(4):147–51.
27. Fregni F, Boggio PS, Nitsche M, Bermpohl F, Antal A, Feredoes E, et al. Anodal transcranial direct current stimulation of prefrontal cortex enhances working memory. Exp Brain Res. 2005; 166(1):23–30.
28. Moos K, Vossel S, Weidner R, Sparing R, Fink GR. Modulation of top-down control of visual attention by cathodal tDCS over right IPS. J Neurosci. 2012; 32(46):16360–8.
29. Kanai R, Chaieb L, Antal A, Walsh V, Paulus W. Frequency-dependent electrical stimulation of the visual cortex. Curr Biol. 2008; 18(23):1839–43.
30. Horvath JC, Forte JD, Carter O. Evidence that transcranial direct current stimulation (tDCS) generates little-to-no reliable neurophysiologic effect beyond MEP amplitude modulation in healthy human subjects: A systematic review. Neuropsychologia. 2015; 66:213–36.
31. Zeng FG, Richardson M, Tran P, Lin H, Djalilian H. Tinnitus treatment using noninvasive and minimally invasive electric stimulation: Experimental design and feasibility. Trends Hear. 2019; 23:2331216518821449.
32. Zeng FG, Tran P, Richardson M, Sun S, Xu Y. Human sensation of transcranial electric stimulation. Sci Rep. 2019; 9(1):15247.
33. Herrmann CS, Rach S, Neuling T, Strüber D. Transcranial alternating current stimulation: A review of the underlying mechanisms and modulation of cognitive processes. Front Hum Neurosci. 2013; 7:279.
34. Nitsche MA, Paulus W. Excitability changes induced in the human motor cortex by weak transcranial direct current stimulation. J Physiol. 2000; 527(Pt 3):633–9.
35. Monte-Silva K, Kuo MF, Hessenthaler S, Fresnoza S, Liebetanz D, Paulus W, et al. Induction of late LTP-like plasticity in the human motor cortex by repeated non-invasive brain stimulation. Brain Stimul. 2013; 6(3):424–32.
36. Bestmann S, de Berker AO, Bonaiuto J. Understanding the behavioural consequences of noninvasive brain stimulation. Trends Cogn Sci. 2015; 19(1):13–20.
37. Stagg CJ, Nitsche MA. Physiological basis of transcranial direct current stimulation. Neuroscientist. 2011; 17(1):37–53.
38. Buzsáki G, Draguhn A. Neuronal oscillations in cortical networks. Science. 2004; 304(5679):1926–9.
39. Vosskuhl J, Huster RJ, Herrmann CS. BOLD signal effects of transcranial alternating current stimulation (tACS) in the alpha range: A concurrent tACS-fMRI study. Neuroimage. 2016; 140:118–25.
40. Neuling T, Rach S, Herrmann CS. Orchestrating neuronal networks: Sustained after-effects of transcranial alternating current stimulation depend upon brain states. Front Hum Neurosci. 2013; 7:161.
41. Veniero D, Vossen A, Gross J, Thut G. Lasting EEG/MEG aftereffects of rhythmic transcranial brain stimulation: Level of control over oscillatory network activity. Front Cell Neurosci. 2015; 9:477.
42. Zoefel B, Heil P. Detection of near-threshold sounds is independent of EEG phase in common frequency bands. Front Psychol. 2013; 4:262.
43. Tran P, Richardson ML, Zeng FG. Input-output functions in human heads obtained with cochlear implant and transcranial electric stimulation. Neuromodulation. 2021; 24(8):1402–11.
44. Stevens SS, Jones RC. The mechanism of hearing by electrical stimulation. J Acoust Soc Am. 1939; 10(4):261–9.
45. Jones RC, Stevens SS, Lurie MH. Three mechanisms of hearing by electrical stimulation. J Acoust Soc Am. 1940; 12(2):281–90.
46. Kösem A, Bosker HR, Jensen O, Hagoort P, Riecke L. Biasing the perception of spoken words with transcranial alternating current stimulation. J Cogn Neurosci. 2020; 32(8):1428–37.
47. Antal A, Keeser D, Priori A, Padberg F, Nitsche MA. Conceptual and procedural shortcomings of the systematic review “evidence that transcranial direct current stimulation (tDCS) generates littleto-no reliable neurophysiologic effect beyond MEP amplitude modulation in healthy human subjects: A systematic review” by Horvath and co-workers. Brain Stimul. 2015; 8(4):846–9.
48. Parkin BL, Ekhtiari H, Walsh VF. Non-invasive human brain stimulation in cognitive neuroscience: A primer. Neuron. 2015; 87(5):932–45.
49. Saturnino GB, Antunes A, Thielscher A. On the importance of electrode parameters for shaping electric field patterns generated by tDCS. Neuroimage. 2015; 120:25–35.

Table 1.
Examples of delivering speech information by non-invasive electric stimulation
Year Author Electric stimulation Outcome
2018 Wilsch, et al. [18] Speech envelope Better signal to noise ratio (-7.3 dB vs. -7.7 dB)
2018 Riecke, et al. [17] 4 Hz sine Better speech recognition (56.2% vs. 63.4%)
2020 Kösem, et al. [46] 3.0-5.5 Hz sine Changed the meaning of the word
2020 Keshavarzi, et al. [16] 4-8 Hz theta AC Better speech in noise (difference of 6%)

AC, alternating current

TOOLS
Similar articles