(PaperReview) CNN for Sentence Classification
이강희 교수님 인공지능특론 대학원수업 발표에 사용한 PPT입니다. 문장 수준의 분류 문제에 word vector와 합성곱 신경망(CNN)을 도입한 연구와 한국어에 최적화된 단어 임베딩 학습 방법을 분석하고, 최적의 성능을 낼 수 있는 말뭉치 및 하이퍼 파라미터가 모델 성능에 미치는 영향을 분석한 연구를 공유합니다.
- review date: 2017/10/10 (by Meyong-Gyu.LEE @Soongsil Univ.)
- Korean review of 'Convolutional Neural Networks for Sentence Classification'(EMNLP2014) and 'A Syllable-based Technique for Word Embeddings of Korean Words'(HCLT 2017)
이강희 교수님 인공지능특론 대학원수업 발표에 사용한 PPT입니다. 첫 번째로 리뷰한 논문은 ‘CNN for Sentence Classification’으로, 2014년 EMNLP(Empirical Methods on Natural Language Processing)에서 발표된 논문입니다. 저자는 New York University의 Yoon Kim이라는 유명한 분입니다. 문장 수준의 분류 문제에 word vector와 합성곱 신경망(CNN)을 도입한 연구로, NLP에 CNN을 적용했을 때 모델이 단순해도 word2vec 모델로 미리 훈련하면 높은 성능을 낼 수 있을까? 라는 의문점에서 시작된 연구입니다.
두 번째로 리뷰한 논문은 ‘A Syllable-based Technique for Word Embeddings of Korean Words’로, 2017년 ‘The 28th Annual Conference on HCLT(Human & Cognitive Language Technology)’ 논문집에 수록된 논문입니다. 한국어에 최적화된 단어 임베딩 학습 방법을 분석하고 한국어에 대해 최적의 성능을 낼 수 있는 학습용 말뭉치와 적합한 하이퍼 파라미터를 찾음과 동시에 파라미터가 성능에 미치는 영향 및 결과를 분석한 연구입니다.