분류 전체보기
-
[08.27 Special 강의] 통계와 차트 (Seaborn 🌊 정리)네이버 부스트캠프 AI Tech 2기 2021. 8. 29. 17:56
SeaBorn SeaBorn 이란? : Matplotlib 라이브러리 기반 통계 시각화 라이브러리이다. 특징 통계 정보 : 구성, 분포, 관계 등등 Matplotlib이 기반이라서 커스텀 가능하다. 쉬운 문법과 깔끔한 디자인이 특징이다. 설치 (아직 1.0 version이 나오지 않아서 언제든 업데이트 가능성이 있다.) 강의는 0.11로 진행 !pip install seaborn==0.11 import seaborn as sns 다양한 API 제공 Categorical API Distribution API : 분포 Relational API : 관계 Regression API : 회귀 Multiples API Theme API 실습 Countplot : 범주를 이산적으로 세서 막대 그래프로 그려주는 함수..
-
[08.27 P Stage Day5] - 🔥 First Week Retrospective(Image Classification)네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:44
첫번째 P Stage 전체 회고 😵💫 개요 및 아무말 대잔치 사실 본 글은 매일 매일 회고를 하면서 작성해야 하는데, 이번주는 유독 특별한 한 주였던 터라 수업을 듣고 나면 바로 대회 문제를 직행했다. 그래서인지 깜빡 해버렸다.(엄청난 핑계 ...😃) 그래서 이번주를 돌아보면서 느낀 모든 것들을 정리해 보려고 한다. 여러가지 좋았던 점들을 이야기 해보겠다. 요약을 하자면 ~ Competition이라는 환경의 경험 나만의 서버를 통해서 자유롭게 학습을 진행할 수 있던 점(Colab과는 다른 환경), 딥러닝 모델 파이프라인을 전체 다 구현할 수 있던 점 이제 딥러닝이라는 넘과 좀 더 친해진 것 같은 느낌적 느낌 정도 겠다. 아쉬웠던 점들도 몇가지 있다. 물론 지금 팀 피어세션이 잘 진행되고 있지만, 팀 피..
-
[08.27 P Stage Day5] - 🔨 Ensemble & Experiment Toolkits네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:15
Ensemble 여러 실험 하다 보면 여러가지 모델로 여러 결과를 만들게 된다. 그런데, 이런 여러가지 모델을 결합해서 더 좋은 모델을 만들 수 있지 않을까? → 그래서 이를 활용하는 '앙상블' 기법이 있다. 의미 : 싱글 모델보다 더 나은 성능을 위해서 서로 다른 여러 학습 모델을 활용하는 것이다. 살펴봐야 할 것들 : Overfitting(High Variance → Boosting), Under Fitting(High Bias → Bagging) Voting Model Averaging이 잘 동작하는 이유는 , 서로 다른 모델에서 같은 에러는 테스트에서 만들지 않게 되기 때문에 효과가 좋다. Hard Voting → 다수결 방식(단점, 다른 모델에서 소수의 의견(?)이 무시될 수 있다는 것) Sof..
-
[08.26 P Stage Day4] - 📝 Training & Inference네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:10
모델 훈련(Train) 과 Inference 요소 Loss : Loss 함수 = Cost 함수 = Error 함수, Backpropagation을 진행할 때, Output과 Target 값을 가지고 Loss 값을 구할 때 사용하는 함수이다. nn.Loss 패키지에서 확인할 수 있다.Loss 함수 또한 forward 함수를 가지고 있기 때문에, Model과 연결되어 학습이 진행된다. loss.backward() 재미있는 것은 net이라는 Model에서 output이 만들어 지고, output과 label 값을 통해서 Loss 값을 구해준다. 또한 중요한 사실은, forward 함수를 통해서 Model 부터 loss 과정 전체가 Chain 으로 연결이 된다. : 이 함수가 실행되면 모델의 파라미터의 grad..
-
[08.25 P Stage Day3] - 🤖 Models네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:05
Model 오늘은 PyTorch 에서 Model을 만드는 방식에 대해서 학습한다. Modeling 이 전에는 Vanila Data를 모델의 입력에 맞도록 Data Processing까지 처리가 되었다. 모델의 정의 : 모델은 Object, 사람, 시스템의 정보를 대표하는 것이다. Using PyTorch PyTorch 부스트 캠프 AI Tech에서는 PyTorch를 기반으로 하고 있다. PyTorch는 연구하기도 좋고 공부를 시작하는 사람에게 이 프레임워크만한 것이 없다. 이유는 파이토닉한 특징도 있고, Runtime에 Dynamic하게 Graph가 그려지는 특징도 있다. 자유도도 높아 개발하는데 장점이 있다. PyTorch의 특징 Low-Level : Low-level로 짜여져 있어서, 부분적으로 내용..
-
[08.24 P Stage Day2] - 💽 Dataset과 DataGeneration네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:02
DataSet : Vanilla 한 데이터를 원하는 모델에 맞게 잘 일반화, 수정하는 작업을 통해 새 DataSet형태로 변환이 필요하다. 이미지 분류를 풀기 위해서 과정 이미지가 어떤 형태, 어떤 구조로 저장되어 있는지 확인 모델에 맞게 재구성해야 한다. Pre-Processing : 굉장히 중요한 작업. 생각보다 시간이 많이 차지하는 작업이다. 왜 중요한 작업일 까? 실제 데이터들을 보면 Noise도 굉장히 많고 데이터도 부족하기 때문에 이 부분에 많은 시간을 투자한다고 한다. 계산의 효율을 위해서 Resize를 시킨다. 큰 사이즈의 이미지 같은 경우들은 학습하는데 시간이 굉장히 오래 걸리기 때문에 작업의 효율을 위해서 이미지를 적절하게 줄이는 것도 중요하다. 또한, 도메인의 형식에 따라서 다양한 C..
-
[08.23 P Stage Day1] - 🧑🔬 이미지 분류? 와 EDA(탐색적 데이터 분석)네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:00
이번 수업에서는 Data Analysis 파트를 중점으로 볼 것이다. Data Analysis 이미지를 분류한다?! 이미지를 Input으로 들어가고 → 엄청난 작용 → Class로 분류가 됨 Output ⭐️ EDA(탐색적 데이터 분석) : "데이터를 이해하기 위한 노력"이다. EDA는 반드시 모든 작업에서 거쳐가야할 Task이다. 풀어서 이야기하면 데이터를 하나하나 살펴보면서 어떻게 구성되어 있나? 왜 이것을 주었을까? 를 생각해보는 과정이다. 내가 가진 고민을 강의에서 설명해 주셨다. 우선, Import 해서 라이브러리는 뭐, 가져오는 것은 할 수 있다.. 그 다음 문제 정의도 할 수 있는데? 이 다음이 어렵다... → 이런 상황.. 그래서 이런 식으로 접근하자. 주어진 데이터에 대한 본인의 생각을 ..
-
[08.23 P Stage Day1] - 🚀 Competition with AI Stages! 출발네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 18:58
😷 이미지 분류 대회[마스크 착용 분류 AI 모델] 개요 P Stage 는 경진대회를 통해 프로젝트를 진행한다. 실습 위주의 Practical Skill들을 학습한다. → 전처리, 학습, 추론, output 까지 직접 다루면서 손으로 익히는 과정이다. 얻을 수 있는 점 : 머신러닝 파이프라인을 전체적으로 경험한다. 학습 플랫폼 : AI Stage, Boostcourse, Github, Slack Competitions 세부사항 : 왜 Competition을 진행할까? 내가 하고자 하는 것에 방향성을 부여한다. 문제가 있다면 문제를 정의할 수 있다. 그리고 정의된 문제로부터 데이터를 통해서 해결할 수 있나? 없나? 를 고민한다. 데이터를 해결할 수 있다면 AI로 해결할 수 있는 것인지 고민을 한다. AI로..