네이버 부스트캠프 AI Tech
-
[08.24 P Stage Day2] - 💽 Dataset과 DataGeneration네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:02
DataSet : Vanilla 한 데이터를 원하는 모델에 맞게 잘 일반화, 수정하는 작업을 통해 새 DataSet형태로 변환이 필요하다. 이미지 분류를 풀기 위해서 과정 이미지가 어떤 형태, 어떤 구조로 저장되어 있는지 확인 모델에 맞게 재구성해야 한다. Pre-Processing : 굉장히 중요한 작업. 생각보다 시간이 많이 차지하는 작업이다. 왜 중요한 작업일 까? 실제 데이터들을 보면 Noise도 굉장히 많고 데이터도 부족하기 때문에 이 부분에 많은 시간을 투자한다고 한다. 계산의 효율을 위해서 Resize를 시킨다. 큰 사이즈의 이미지 같은 경우들은 학습하는데 시간이 굉장히 오래 걸리기 때문에 작업의 효율을 위해서 이미지를 적절하게 줄이는 것도 중요하다. 또한, 도메인의 형식에 따라서 다양한 C..