[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.3 한국어를 위한 KoNLPy 2

프로그램
홈 > 프로그래밍(40)
프로그래밍

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.3 한국어를 위한 KoNLPy 2

김동준
강의구성 20강
제작년도 2020년
강좌개요
본 과정은 한국어 텍스트마이닝을 위한 KoNLPy 패키지에 대한 학습과정입니다. 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 KoNLPy 패키지에 기반하여 한국어 자연어 처리를 분석하고 관련된 여러 라이브러리를 학습하는 과정입니다.
학습대상
1. 한국어 자연어 처리 및 KoNLPy 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 KoNLPy 패키지 및 관련 라이브러리를 배우고자 하는 자.
학습목표
KoNLPy 패키지를 이용한 한국어 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 한국어를 분석할 수 있도록 목표한다.
참고사항
  • 수강 기간 중 언제든지 반복 수강이 가능합니다.
  • 수강 여부 체크는 현재 동영상 강좌에만 가능합니다. (증빙 서류 발급은 준비중입니다.)
  • 수강 신청 완료 후 수강 가능합니다.
커리큘럼
차시 강의제목 수강여부
01 021_KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2)[24:53]
02 022_KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3)[17:13]
03 023_KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1)[25:12]
04 024_KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2)[21:18]
05 025_KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3)[09:18]
06 026_단어주머니란 무엇인가 - Bag of words[25:54]
07 027_빈도 수 기반의 핵심어 추출[20:13]
08 028_TF-IDF 어휘 빈도 문서 역빈도[10:33]
09 029_자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리[19:39]
10 030_자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer[13:42]
11 031_Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리[12:33]
12 032_Bag of words 구현하기(4) - stopwords, punctuation 제거[14:28]
13 033_사이킷런 BoW 구현1[27:34]
14 034_사이킷런 BoW 구현2 - Count Vector 수치화[19:42]
15 035_사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기[09:43]
16 036_CountVectorizer 파라미터 옵션(1) - max_df, min_df[27:08]
17 037_CountVectorizer 파라미터 옵션(2) - max_features, stop_words[32:22]
18 038_CountVectorizer 파라미터 옵션(3) - ngram_range[24:21]
19 039_TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1)[27:03]
20 040_TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2)[19:18]