NLP 2

노개북 챌린지 Final Mission! - 이번년도 개발 공부 계획 설계

개발 공부 계획 세우기 2주간의 노개북 챌린지를 진행했었고 오늘은 그 마지막 날이다. 마지막날의 미션은 개발 공부 계획 설계하는 것이다. 그리고 SMART 방법론을 이용하여 계획을 세워보라는 추천을 해주셨다. SMART 방법론이란, 아래와 같다. Specific(구체적) Measurable(측정 가능한) Achievable(달성 가능한) Realistic(현실적) Time-bound(기한이 있는) Object(목표) 코드스테이츠에서 배웠던 DL 및 NLP이론 복습 및 이해하기(Section4) 남에게 설명할 수 있을 정도까지!!! Activity(구체적인 활동) 공부시간 : 매일 아침 6-8시 2시간 공부해야할 노트 목록 : n411 ~ n434 공부 계획 월화수목 - 이론 공부 금 - 블로그 정리 및 ..

TIL/TIL - 노개북 2023.01.26

NSMC 영화리뷰 데이터 감성분석(Sentiment Analysis) - Word2Vec + LSTM

데이터 EDA 데이터 셋에는 id, document, label이렇게 세개의 칼럼이 있다. 학습에 필요한 부분은 document(리뷰텍스트)와 label(부정:0, 긍정:1) 이 두 칼럼데이터 이다. # 네이버 영화리뷰 데이터 불러오기 train = pd.read_table(r"data\nsmc\ratings_train.txt") test = pd.read_table(r"data\nsmc\ratings_test.txt") train.head() 학습데이터 150000, 테스트데이터 50000개로 총 200000개의 영화리뷰가 있다. 라벨은 50:50으로 균형 # 데이터 개수 print(train.shape) # (150000, 3) print(test.shape) # (50000, 3) # 라벨의 비율 ..