전체 글 2

[캡스톤디자인프로젝트B] Konlpy & Word2Vec - 자연어 처리를 이용하여 문제 자동 생성하기

현재 진행 중인 프로젝트의 이름은 '글눈'으로, 기초 문해력 강화를 위한 자기주도형 학습 웹 서비스입니다. 사용자가 학습을 원하는 지문을 입력하면, 문해력 강화를 위한 요약 문제와 어휘 문제를 생성하여 제공합니다. 제가 맡은 부분은 어휘 파트로, 어휘 문제 유형은 총 4가지입니다. 1. 용례의 빈칸에 들어갈 단어 찾기 2. 동음이의어의 의미와 용례 연결하기 3. 사전적 의미에 부합하는 단어 찾기 4. 단어의 용례를 보고 해당 단어의 유의어 찾기 위의 어휘 문제를 구현하기 위해서 아래와 같은 과정으로 구현하였습니다. 저희가 사용한 모델은 KoNLPy의 Kkma, bs4의 BeautifulSoup, gensim, Word2Vec(ko.bin) 입니다. 1. 사용자가 학습할 텍스트를 입력받기 2. 텍스트 토큰..

카테고리 없음 2022.05.17

[캡스톤디자인프로젝트A] 한글 자연어 처리 - konlpy의 형태소 분석기 활용하여 토큰화하기

konlpy 사용을 위해서는 Anaconda3, JDK, JPype 가 설치되어있어야 한다 요구되는 버전과 설치하면서 발생한 오류 및 해결방안은 하단에 적어두었다 프로젝트 주제를 간략히 말하자면 '문장 요약 문제, 어휘 문제를 통한 청소년의 문해력 및 어휘력 향상 웹서비스'로 문제를 출제하기 위해서는 지문의 문장과 단어를 토큰화하는 자연어 처리 과정이 필수적이다. 파이썬으로 자연어 처리를 하는 경우 KSS로 문장 토큰화를 할 수 있으며 KoNLPy의 형태소 분석기를 사용할 수 있다. KoNLPy에는 Okt(Open Korea Text), 꼬꼬마(Kkma), 한나눔(Hannanum), 코모란(Komoran), 메캅(Mecab)이 있으며 각 분석기로 같은 문장을 토큰화하고 결과를 비교해보고자 한다. KoNL..

카테고리 없음 2021.11.22