박조은

안녕하세요, 오늘코드 박조은입니다.

파이썬을 이용하여 데이터를 살펴보고 분석하는 것을 좋아합니다.


유튜브 <오늘코드> 채널을 운영하고 있습니다 :)

https://www.youtube.com/c/todaycode

펼쳐보기
언제 어디서나 수강할 수 있습니다.
PC, 모바일, 태블릿으로 언제 어디서나 수강이 가능합니다.
PC, 모바일, 태블릿으로 언제 어디서나 수강 가능
강좌 소개


안녕하세요. 오늘코드 박조은입니다.

https://www.youtube.com/channel/UCLR3sD0KB_dWpvcsrLP0aUg


이 강좌에서는 캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해봅니다.

파이썬 툴을 이용하여 텍스트 분석을 할 수 있도록 데이터를 살펴보고 전처리와 여러 분석 기법을 다룹니다.

자연어처리는 챗봇이나 텍스트분석 뿐만 아니라 머신러닝/딥러닝 모델 개발시 데이터 전처리 과정에서 널리 사용됩니다.



1. 수강대상

복잡하고 비정형적인 텍스트 데이터를 분석해보고 싶은 분, 텍스트 분석을 통하여 비정형 데이터의 의미를 탐색해보고 싶으신 분이 들으시면 좋습니다.

챗봇개발자, 데이터 분석가, 머신러닝, 딥러닝 등에 관심을 갖게 되신 분들이 함께 실습해보는 강좌입니다.


2. 목표

 

자연어처리뿐 아니라 데이터 전처리부터 Word2Vec 패키지를 활용한 머신러닝 기법과 딥러닝 기법을 두루다루며, 지도학습과 비지도학습의 활용 방안도 다룹니다.

캐글에 있는 기본 튜토리얼에 텍스트데이터 시각화나 전처리 과정, 파이프라인을 통한 병렬처리로 성능개선을 추가로 다루고 있습니다.


할 수 있게 되는 것들

텍스트 데이터를 전처리하고 데이터 분석 및 분류

복잡한 컨텍스트를 정제하고 분석

다양한 측면으로 텍스트 데이터를 바라보는 시각

머신러닝의 지도학습과 비지도 학습을 배우고 활용에 대한 감각

파이썬 표준 라이브러리를 통해 초기의 퍼셉트론을 밑바닥부터 구현


배우는 것들

IMDB 영화 리뷰 데이터를 통해 머신러닝의 분류 기법을 배울 수 있습니다.

머신러닝의 지도학습과 비지도 학습에 대한 활용방안을 두루 배우게 됩니다.

지도 학습으로는 머신러닝을 통한 감정 분석을 하게 되며, 비지도 학습으로 차원 축소와 클러스터링 기법을 배우게 됩니다.

 

Keywords

자연어처리, 텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법), 데이터 분석, 텍스트 데이터 시각화 기법(Matplotlib, Seaborn), 머신러닝(Scikit-learn), 딥러닝, 데이터 분석, 파이썬 표준 라이브러리를 통한 간단한 퍼셉트론 구현, 온라인 러닝, Vowpal Wabbit 개념, 다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec), 파이프라인 구현을 통해 성능 최적화, 앙상블(Random Forest)과 부스팅(Xgboost)기법


3. 준비해야 하는 것

파이썬(아나콘다)이 설치된 PC


4. 이 강좌의 특징

백번 보는 것보다 한번 분석하는게 낫다! 실제 데이터의 분석을 보면서 직접 연습하면 실전에서 활용할 수 있습니다.

하나의 분석 방법을 한 가지 방법으로만 배우는 것이 아니라, 경험이 녹아있는 여러 가지 분석 방법을 배웁니다.

분석 과정을 함께 진행하면서 혼자 분석한다면 훨씬 더 많이 겪을지도 모를 시행착오를 줄일 수 있습니다.

커리큘럼을 따라 꼼꼼히 학습하시고, 궁금한 점은 댓글을 이용해 주세요!

공개 및 수정일
2019년 10월 24일 공개
2019년 11월 4일 최종 수정
수강평
4.4
3명
5
1명
4
2명
3
0명
2
0명
1
0명
커리큘럼
IMDB 영화리뷰 데이터를 통한 자연어처리 강좌 소개
Word2Vec을 사용한 영화리뷰 분석 튜토리얼 소개 - 캐글 머신러닝 자연어처리 NLP
13:04
Chapter 1. 캐글 영화 리뷰 분석 튜토리얼 1
[1/4] Pandas로 데이터 불러오기 맛보기
7:26
[2/4] NLP 텍스트 데이터 전처리
24:26
[3/4] CountVectorizer로 텍스트 데이터 벡터화
8:09
[4/4] 랜덤포레스트로 영화 감성 예측 평가 ROC / AUC
17:39
Chapter 2. 캐글 영화 리뷰 분석 튜토리얼 2
[1/3] 딥러닝 기법인 Word2Vec 소개 - IMDB 영화 리뷰 분석 캐글 머신러닝
9:20
[2/3] Gensim을 통해 벡터화, t-SNE로 시각화하기
9:45

텍스트 분석과 자연어 처리를 활용하여 IMDB 영화리뷰를 파이썬으로 분석하기

4.4
₩16,500
3시간 18분 분량
30일 동안 무제한 수강 가능
중급 레벨의 강좌