잠시만 기다려 주세요. 로딩중입니다.

딥러닝-워드임베딩을 기반으로 한 말더듬 대상자의 읽기과제 비유창성 분석

Analyzing the Disfluency of Reading Tasks of Persons Who Stutter Based on Deep Learning and Word Embedding

Communication Sciences & Disorders 2020년 25권 3호 p.721 ~ 737
송상헌, 전희정, 이수복,
소속 상세정보
송상헌 ( Song Sang-Houn ) - Korea University Department of Linguistics
전희정 ( Chon Hee-Cheong ) - Chosun University Department of Speech-Language Pathology
이수복 ( Lee Soo-Bok ) - Woosong University Department of Speech-Language Therapy and Aural Rehabilitation

Abstract

배경 및 목적: 최근의 딥러닝 자연어 처리는 언어단위를 수치 벡터로 변환하여 공간상에서 연산을 도모하는 임베딩 기술을 활용한다. 본 연구는 이 기법을 언어병리학 유창성장애 데이터에 적용하여 비유창성의 위치와 분포 특성을 파악하고자 하였다.

방법: 110명의 중학생 이상 청소년 및 말더듬 성인의 읽기발화(800음절) 데이터를 음소 단위로 분절한 뒤 수치 벡터로 변환하여 거리 연산을 수행하였다. Word2Vec을 활용하여 코사인 유사도를 측정하여 각 비유창성 유형 별 유사성을 도출하고, 또한 전체 데이터를 t-SNE 그림으로 모델을 시각화하여 제시하였다. 또한, 음소 환경을 분석하고자 파라다이스-유창성검사-II의 읽기발화와 세종 코퍼스 데이터를 비교 분석하였다.

결과: 첫 번째, 총 8개의 ND 유형(‘UR’, ‘I’, ‘H’, ‘R1’)과 AD 유형(‘URa’, ‘Ia’, ‘Ha’, ‘R1a’)은 .9 이상의 유사도로 근접하여 출현하였다. 두 번째, ND 유형과 AD 유형 간의 분포적 차이를 분석한 결과, 분포적 차이가 크지 않은 것으로 나타났다. 또한, AD 유형은 상당히 높은 유사도로 AD 유형 간에 발생 위치가 중첩되는 것으로 나타났고 ‘R2’와 ‘DP’는 다른 비유창성 유형과 다른 양상을 보였다. 마지막으로, 음소 환경에 따른 비유창성 출현 빈도는 ‘ㅁ’, ‘ㄷ’, ‘ㅈ’ 음소에서 비유창성 빈도가 비교적 높게 나타났다.

논의 및 결론: 본 연구는 딥러닝 기법을 활용하여 비유창성 유형들 간의 군집화 특성, 정상적 비유창성과 비정상적 비유창성 사이의 분포적 차이가 크지 않다는 것, 그리고 비유창성 출현 음소 등을 확인하였고 이러한 결과는 유창성장애 진단과 치료에 활용될 수 있을 것이다.

Objectives: Recent natural language processing systems employ embedding techniques, which convert linguistic expressions into numerical vectors in order to measure the geometric distance between expressions. Using skills and focusing on the reading tasks, the present study aims to reveal the distributional properties of disfluencies.

Methods: The current work segmented the reading data of 110 adolescents and adults who stutter, transformed the data into a vector space, and then conducted the embedding calculation. Utilizing Word2Vec, the cosine similarity was measured so as to look at how the types of disfluencies were co-related to each other.

Results: The eight ND (Normal disfluencies) and AD (Abnormal disfluencies) types, excluding the R2 (Repetition 2) and DP (Disrhythmic Phonation) types, were close to each other with respect to the cosine similarity (>.9). In particular, the AD types such as Ha (Abnormal hesitation), Ia (Abnormal interjection), URa (Abnormal unfinished/revision word), and R1a (Abnormal Repetition1) largely overlapped with each other. R2 and DP showed different distributional properties from other types of disfluencies. The results also indicated that each ND and AD pair seldom differed in their distributional properties. Finally, this study it found that several consonants tended to appear more often when the speakers produced disfluencies.

Conclusion: This study draws the distributional patterns of fluency disorders in an automatic way using deep learning skills. The findings are of use for the diagnosis and treatment of the fluency disorders.

키워드

딥러닝; 워드임베딩; 코사인 유사도; 말더듬 읽기과제; 정상적 비유창성; 비정상적 비유창성
Deep learning; Word embedding; Cosine similarity; Stuttering reading task; Normal disfluencies; Abnormal disfluencies

원문 및 링크아웃 정보

등재저널 정보