[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2

프로그램
홈 > 프로그래밍(40)
프로그래밍

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2

김동준
강의구성 20강
제작년도 2020년
강좌개요
본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.
학습대상
1. 영어 자연어 처리 및 NTLK 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 NLTK 패키지 및 관련 라이브러리를 배우고자 하는 자.
학습목표
NLTK 패키지를 이용한 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 영어를 분석할 수 있도록 목표한다.
참고사항
  • 수강 기간 중 언제든지 반복 수강이 가능합니다.
  • 수강 여부 체크는 현재 동영상 강좌에만 가능합니다. (증빙 서류 발급은 준비중입니다.)
  • 수강 신청 완료 후 수강 가능합니다.
커리큘럼
차시 강의제목 수강여부
01 파이썬 코드로 n-gram 구현하기[30:19]
02 nltk stopwords를 활용한 불용어 제거하기(1)[20:55]
03 nltk stopwords를 활용한 불용어 제거하기(2)[16:49]
04 nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항[15:13]
05 한국어 불용어 제거하기[11:49]
06 Stemming(스테밍)이란 무엇이고 왜 필요한가[31:17]
07 Stemmer를 사용한 어간 추출[27:03]
08 PorterStemmer vs LancasterStemmer 어간 추출 비교[16:18]
09 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용[11:38]
10 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습[22:06]
11 주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습[08:35]
12 lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법[23:29]
13 WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기[22:46]
14 WordNetLemmatizer에서 제대로 처리하지 못하는 단어들[05:07]
15 품사 정보를 제공하여 기본형(표제어) 추출[13:16]
16 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1)[26:42]
17 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2)[22:16]
18 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3)[30:23]
19 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4)[12:16]
20 구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기[13:22]