네이버 부스트캠프 AI Tech 2기

[08.23 P Stage Day1] - 🧑‍🔬 이미지 분류? 와 EDA(탐색적 데이터 분석)

Jay x 2 2021. 8. 28. 19:00
728x90
반응형

이번 수업에서는 Data Analysis 파트를 중점으로 볼 것이다.

Data Analysis

이미지를 분류한다?!

이미지를 Input으로 들어가고 → 엄청난 작용 → Class로 분류가 됨 Output

⭐️ EDA(탐색적 데이터 분석)

: "데이터를 이해하기 위한 노력"이다.

EDA는 반드시 모든 작업에서 거쳐가야할 Task이다.

풀어서 이야기하면 데이터를 하나하나 살펴보면서 어떻게 구성되어 있나? 왜 이것을 주었을까? 를 생각해보는 과정이다.


내가 가진 고민을 강의에서 설명해 주셨다.

우선, Import 해서 라이브러리는 뭐, 가져오는 것은 할 수 있다.. 그 다음 문제 정의도 할 수 있는데? 이 다음이 어렵다...

→ 이런 상황..

그래서 이런 식으로 접근하자.

  1. 주어진 데이터에 대한 본인의 생각을 자유롭게 서술하라.사실 처음 보는 사람들은 어떻게 접근해야할 지 잘 모른다.만일 어렵다고 느껴진다면 그 어렵다고 생각하는 것을 계속 remind하라.
  2. 그리고 정답이란 것이 있을까? EDA가 너무 어렵다고 생각하는 것이 아닌가?
  3. 고민.. 이게 맞을까? 하다가 틀리면 어떻하지..? → 나랑 똑같은 생각이다.🤣
  4. 진짜 궁금한 것이 무엇인가?: EDA는 그냥 우리가 데이터를 이해하기 위한 어떤 다양한 방법들 중에 뭐든지 상관 없다. 그리고 궁금한 것을 알아보는 과정이다!!!→ 그냥 데이터를 이해하는 것이 주 목적! 어떤 방법이든 상관은 없다는 것결국 Data Analysis ↔ Data processing 이런 것들이 지속적으로 반복된다. (내가 궁금한 것들이 계속 생겨나거나 다른 아이디어가 생각날 때 그 호기심을 풀고 싶기 때문이다.)
  5. 그 다음, Python, R 등 다양한 언어나 도구를 통해서 필요성을 느끼면 그 것들을 부분적으로 찾아서 학습하면서 진행하면 된다!
  6. 굳이 코딩이 아니더라도 눈으로 보면서 데이터를 보고 이해, 해석하는 것도 전부 EDA이다.
  7. 자, EDA는 이렇게 이야기 해주셨다.

🚀 Image Classification

Image란?

: 시각적 인식을 표현한 인공물(Artifact)

모델링 과정

→ 이를 이미지 도메인으로 바꾸면?

  • 어떻게 이미지를 Model에 넣어야 하는가?
  • 이미지마다 다양한 이미지를 띄고 있을 텐데 어떻게 효율적으로 집어 넣게 될까?
  • 모델이 만들어지고 학습은 어떻게 되고 에러가 있으면 어떻게 에러를 줄일까?
반응형