네이버 부스트캠프 AI Tech 2기
-
🏃 Mask Image Classification [P Stage Wrap up 개별 리포트]네이버 부스트캠프 AI Tech 2기 2021. 9. 6. 18:25
1. 프로젝트 목표 및 결과 AI 프로세스를 이해하고 스스로 전체 파이프라인을 구축하면서 이해한다. 원활한 커뮤니캐이션을 위하여 팀원들의 아이디어를 추합하고 정리한다. 모델의 성능 향상을 위해서 시도해 볼만한 것들을 시도해본다. 결과 : 1등!🏅 2. 목표를 위해 노력한 것들 우선 내용을 쓰기 이전에 본인의 AI 수준에 대해서 이야기하자면, AI 프로젝트는 경험해보았지만 코드를 복사하고 붙여 넣어서 살짝 바꾸기만 하는 정도(?) 였다. 즉, 과제같은 스스로 처음부터 모든 것들을 구축하기에는 어려움이 많았고 파이프라인을 언젠간 전체적으로 이해 및 구현하고자 하는 목표가 있었다. 일주일 동안, 팀원모두 AI 파이프라인을 이해하고자 스스로 공부하는 시간을 가졌다. 나는 아무것도 없는 코드부터 시작했다. 무엇부..
-
논문 리뷰 - Improving Language Understanding by Generative Pre-Training(GPT-1)네이버 부스트캠프 AI Tech 2기 2021. 8. 30. 01:37
Improving Language Understanding By GPT-1 Intro 자연어 처리같은 경우, 질의 응답이나,의미 유사성 파악 등등 다양한 과제가 있다. 데이터 뭉치(Corpus)는 많은데, Labeled된 데이터는 많이 부족하다는 것. 그래서 적절히 모델에 적용하기 어렵다. 그래서 Unlabeled 된 다양한 Corpus 에 대해 GPT라는 작업(Generative Pre-Training)을 수행한 후에 어떤 특정 작업에 대해 차별적인 모델을 제시함으로써 해결하려고 한다. ⇒ Unlabeled 된 데이터를 이용해 다양한 특성들을 학습할 수 있다. 그리고 이런 학습된 결과를 추가적인 Supervision(Fine-Tuning)을 통해서 성능 향상도 가능하다. (Pre-Trained Word..
-
[08.25 P Stage Day3] - 🤖 Models네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:05
Model 오늘은 PyTorch 에서 Model을 만드는 방식에 대해서 학습한다. Modeling 이 전에는 Vanila Data를 모델의 입력에 맞도록 Data Processing까지 처리가 되었다. 모델의 정의 : 모델은 Object, 사람, 시스템의 정보를 대표하는 것이다. Using PyTorch PyTorch 부스트 캠프 AI Tech에서는 PyTorch를 기반으로 하고 있다. PyTorch는 연구하기도 좋고 공부를 시작하는 사람에게 이 프레임워크만한 것이 없다. 이유는 파이토닉한 특징도 있고, Runtime에 Dynamic하게 Graph가 그려지는 특징도 있다. 자유도도 높아 개발하는데 장점이 있다. PyTorch의 특징 Low-Level : Low-level로 짜여져 있어서, 부분적으로 내용..
-
[08.23 P Stage Day1] - 🧑🔬 이미지 분류? 와 EDA(탐색적 데이터 분석)네이버 부스트캠프 AI Tech 2기 2021. 8. 28. 19:00
이번 수업에서는 Data Analysis 파트를 중점으로 볼 것이다. Data Analysis 이미지를 분류한다?! 이미지를 Input으로 들어가고 → 엄청난 작용 → Class로 분류가 됨 Output ⭐️ EDA(탐색적 데이터 분석) : "데이터를 이해하기 위한 노력"이다. EDA는 반드시 모든 작업에서 거쳐가야할 Task이다. 풀어서 이야기하면 데이터를 하나하나 살펴보면서 어떻게 구성되어 있나? 왜 이것을 주었을까? 를 생각해보는 과정이다. 내가 가진 고민을 강의에서 설명해 주셨다. 우선, Import 해서 라이브러리는 뭐, 가져오는 것은 할 수 있다.. 그 다음 문제 정의도 할 수 있는데? 이 다음이 어렵다... → 이런 상황.. 그래서 이런 식으로 접근하자. 주어진 데이터에 대한 본인의 생각을 ..
-
[08.06] Day5 - '🐼들'(Pandas)네이버 부스트캠프 AI Tech 2기 2021. 8. 6. 22:48
Pandas(Python 마지막 강의) [수업 내용] 강사 : 최성철 교수님 데이터를 다루는 Numpy 이외에 또 다른 Pandas를 배운다. : 구조화된 데이터의 처리를 지원하는 Python 라이브러리이다. Numpy와 통합이 되면서 강력한 "스프레드 시트"처리 기능을 제공한다. Indexing, Operation Function, Preprocessing Function 지원한다. → 데이터 처리 및 통계 분석을 위해 사용! 데이터 구조에서 사용하는 용어들 1. 데이터 Load data_url = ".csv" df_data = pd.read_csv(data_url, sep=구분자, header=None) df_data.head(N) #상위 N개 , default는 5개 df_data.tail(N) #..
-
[08.04] Day3 - '확통공부 다시..😵💫 + Numpy 기능들 + CNN'네이버 부스트캠프 AI Tech 2기 2021. 8. 6. 22:32
🧐 통계학 맛보기(AI Math 7강) [수업 내용] 강사 : 임성빈 교수님 모수란? 통계적 모델링은 적절한 가정 위에서 데이터의 확률분포를 추정하는 것이 목표. 유한한 개수의 데이터만으로 모집단의 분포를 정확하게. 알아내는 것은 불가능하다. 그래서 근사적으로 확률분포를 추정할 수 밖에 없다. 모수 방법론 : 데이터가 어떤 확률분포가 따른다고 가정하고(선험적) 그 분포를 결정하는 모수를 추정하는 방법(모수는 모집단의 특성을 나타내는 값이다.) 비모수 방법론 : 확률분포를 가정하지 않고 데이터에 따라 모델의 구조, 모수의 개수가 유연히 바뀐다.(모수가 없는 것이 아니다. 무한히 많거나 데이터에 따라 바뀌는 것이다. 그래서 모수가 없다라고 하는 것은 아니니 주의한다.) 확률분포 가정하기 히스토그램을 통해서 ..