-
[08.23 P Stage Day1] - 🧑🔬 이미지 분류? 와 EDA(탐색적 데이터 분석)네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:00728x90반응형
이번 수업에서는 Data Analysis 파트를 중점으로 볼 것이다.
Data Analysis
이미지를 분류한다?!
이미지를 Input으로 들어가고 → 엄청난 작용 → Class로 분류가 됨 Output
⭐️ EDA(탐색적 데이터 분석)
: "데이터를 이해하기 위한 노력"이다.
EDA는 반드시 모든 작업에서 거쳐가야할 Task이다.
풀어서 이야기하면 데이터를 하나하나 살펴보면서 어떻게 구성되어 있나? 왜 이것을 주었을까? 를 생각해보는 과정이다.
내가 가진 고민을 강의에서 설명해 주셨다.
우선, Import 해서 라이브러리는 뭐, 가져오는 것은 할 수 있다.. 그 다음 문제 정의도 할 수 있는데? 이 다음이 어렵다...
→ 이런 상황..
그래서 이런 식으로 접근하자.
- 주어진 데이터에 대한 본인의 생각을 자유롭게 서술하라.사실 처음 보는 사람들은 어떻게 접근해야할 지 잘 모른다.만일 어렵다고 느껴진다면 그 어렵다고 생각하는 것을 계속 remind하라.
- 그리고 정답이란 것이 있을까? EDA가 너무 어렵다고 생각하는 것이 아닌가?
- 고민.. 이게 맞을까? 하다가 틀리면 어떻하지..? → 나랑 똑같은 생각이다.🤣
- 진짜 궁금한 것이 무엇인가?: EDA는 그냥 우리가 데이터를 이해하기 위한 어떤 다양한 방법들 중에 뭐든지 상관 없다. 그리고 궁금한 것을 알아보는 과정이다!!!→ 그냥 데이터를 이해하는 것이 주 목적! 어떤 방법이든 상관은 없다는 것결국 Data Analysis ↔ Data processing 이런 것들이 지속적으로 반복된다. (내가 궁금한 것들이 계속 생겨나거나 다른 아이디어가 생각날 때 그 호기심을 풀고 싶기 때문이다.)
- 그 다음, Python, R 등 다양한 언어나 도구를 통해서 필요성을 느끼면 그 것들을 부분적으로 찾아서 학습하면서 진행하면 된다!
- 굳이 코딩이 아니더라도 눈으로 보면서 데이터를 보고 이해, 해석하는 것도 전부 EDA이다.
- 자, EDA는 이렇게 이야기 해주셨다.
🚀 Image Classification
Image란?
: 시각적 인식을 표현한 인공물(Artifact)
모델링 과정
→ 이를 이미지 도메인으로 바꾸면?
- 어떻게 이미지를 Model에 넣어야 하는가?
- 이미지마다 다양한 이미지를 띄고 있을 텐데 어떻게 효율적으로 집어 넣게 될까?
- 모델이 만들어지고 학습은 어떻게 되고 에러가 있으면 어떻게 에러를 줄일까?
반응형'네이버 부스트캠프 AI Tech 2기' 카테고리의 다른 글
[08.25 P Stage Day3] - 🤖 Models (0) 2021.08.28 [08.24 P Stage Day2] - 💽 Dataset과 DataGeneration (0) 2021.08.28 [08.23 P Stage Day1] - 🚀 Competition with AI Stages! 출발 (0) 2021.08.28 [08.20 Special 강의] 📈 차트의 요소 (0) 2021.08.22 [08.20] Day14 - 🔥 'PyTorch 활용' (0) 2021.08.21