분류 전체보기
-
[08.11] Day8 - 'CNN(Convolution Neural Network)'네이버 부스트캠프 AI Tech 2기 2021. 8. 13. 19:53
CNN [수업 내용] 강사 : 최성준 조교수님 Convolution 이란? : f, g 두 함수를 잘 섞어주는 Operator 로 정의할 수 있다. Convolution 연산 과정 → 도장 찍는 느낌! (element wise 곱의 합) 의미 : 해당 이미지를 적용하고자 하는 filter를 통해서 찍어준다. 일반적인 이미지는 RGB로 되어 있기 때문에, 3개의 channel을 가지게 된다.) 4개의 filter(kernel)을 가지고 Output도 4개가 적용된 것들의 모임으로 구해진다. 32323 짜리 이미지를 28284를 얻기 위해서 따져줘야 할 것들이 있다.또한, 하나의 Convolution 연산을 거친 후, Non-linear Function인 Relu함수가 적용이 된 것을 볼 수 있다. 학습해야..
-
[08.10] Day7 - '🏃Optimization'네이버 부스트캠프 AI Tech 2기 2021. 8. 13. 19:45
Optimization(최적화) [수업 내용] 강사 : 최성준 조교수님 우선 여러가지 용어들에 대해서 명확한 이해를 한다. Gradient Descent : 선형 함수에 대한 Gradient를 구해서 가중치 및 Bias를 빼주는 과정이 Gradient Descent이다. 내가 찾고자 하는 파라미터로 Loss Function을 미분한 편미분 값을 이용해서 빼주는 과정이다. → Local Minimum으로 갈 수 밖에 없다.(국소적) Generalization(일반화) : 많은 경우 일반화 성능을 높이는 것이 목적. 일반화는 ? Iteration이 늘어나면 Train Error가 줄어들지만 Test Error(우리가 예측할 Test)에 대해서는 성능이 떨어지게 된다. 그래서 두개의 차이가 적을 수록 좋다. ..
-
[08.09 Special 강의] Introduction to Visualization 🤓네이버 부스트캠프 AI Tech 2기 2021. 8. 13. 19:34
📊 시각화 소개 [수업 내용] 강사 : 안수빈 강사님 데이터 시각화 : 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것 아래의 6가지 요소들을 생각하면서 시각화를 적용하는 것이 중요하다고 하셨다. 목적 : 왜 시각화를 하는가? 독자 : 시각화 결과는 누구를 위한 것인가? 데이터 : 어떤 데이터를 시각화 할 것인가? 스토리 : 어떤 흐름으로 인사이트를 전달할 것인가? 방법 : 전달하고자 하는 내용에 맞게 효과적인 방법을 사용하고 있나? 디자인 : UI에서 만족스러운 디자인을 가지고 있는가? 시각화는 Score가 존재하지 않는다! 연구에서의 시각화 ≠ 개발에서의 시각화, 이론 ≠ 소비자 → 여러가지 모범 사례를 보면서 좋은 시각화가 무엇인지 알려주신다. 👀 [시각화의 요소] 데이터를 이해한다. 시각화..
-
[08.09] Day6 - '🧑🏫 DeepLearning Overview + MLP'네이버 부스트캠프 AI Tech 2기 2021. 8. 13. 19:30
딥러닝 기본 용어와 History [수업 내용] 강사 : 최성준 조교수님 어떻게 좋은 Deep learner가 될 수 있나? 구현하는 스킬들(Tensorflow, Pytorch) 수학적 기술(선형 대수, 확률론) 최근 연구 결과를 살펴본다. 인공지능이란 → 사람의 지능을 모방하는 것이라고 하셨다. Deep Learning의 중요한 Key 요소들 The Data that the model can learn from The Model how to transform the data The Loss Function that quantifies the badness of the model The Algoritm to adjust the parameters to minimize the loss [Data] : 데이..
-
[08.06] Day5 - '🐼들'(Pandas)네이버 부스트캠프 AI Tech 2기 2021. 8. 6. 22:48
Pandas(Python 마지막 강의) [수업 내용] 강사 : 최성철 교수님 데이터를 다루는 Numpy 이외에 또 다른 Pandas를 배운다. : 구조화된 데이터의 처리를 지원하는 Python 라이브러리이다. Numpy와 통합이 되면서 강력한 "스프레드 시트"처리 기능을 제공한다. Indexing, Operation Function, Preprocessing Function 지원한다. → 데이터 처리 및 통계 분석을 위해 사용! 데이터 구조에서 사용하는 용어들 1. 데이터 Load data_url = ".csv" df_data = pd.read_csv(data_url, sep=구분자, header=None) df_data.head(N) #상위 N개 , default는 5개 df_data.tail(N) #..
-
[08.05] Day4 - 'RNN 맛보기' 🍽네이버 부스트캠프 AI Tech 2기 2021. 8. 6. 22:44
RNN 첫걸음(AI Math 10강) [수업 내용] 강사 : 임성빈 교수님 모델의 설계는 그렇게 어렵지는 않지만, 왜 이렇게 설계했는 지에 대해서 생각해보고 설계해야 한다. 어떤 데이터들을 다루나? : 시퀀스 데이터(소리, 문자열, 주가 등)의 데이터들을 시퀀스 데이터로 분류한다. 즉, 시간의 흐름대로 나열된 데이터를 시퀀스 데이터라고 한다. 시퀀스 데이터는 독립동등분포(i.i.d) 가정을 위배하기 쉽다.→ 순서를 바꾸거나 과거 정보의 손실이 발생하면 데이터의 확률분포도 바뀌게 된다.(데이터의 분포가 달라지게 되어 정보가 바뀌게 된다.) 시퀀스 데이터를 다루는 방법 시퀀스의 정보를 가지고 앞으로 발생할 데이터 확률분포를 다루기 위해 조건부 확률을 이용한다. 이전 1~t-1까지의 조건부 확률을 이용한 베이..
-
[08.04] Day3 - '확통공부 다시..😵💫 + Numpy 기능들 + CNN'네이버 부스트캠프 AI Tech 2기 2021. 8. 6. 22:32
🧐 통계학 맛보기(AI Math 7강) [수업 내용] 강사 : 임성빈 교수님 모수란? 통계적 모델링은 적절한 가정 위에서 데이터의 확률분포를 추정하는 것이 목표. 유한한 개수의 데이터만으로 모집단의 분포를 정확하게. 알아내는 것은 불가능하다. 그래서 근사적으로 확률분포를 추정할 수 밖에 없다. 모수 방법론 : 데이터가 어떤 확률분포가 따른다고 가정하고(선험적) 그 분포를 결정하는 모수를 추정하는 방법(모수는 모집단의 특성을 나타내는 값이다.) 비모수 방법론 : 확률분포를 가정하지 않고 데이터에 따라 모델의 구조, 모수의 개수가 유연히 바뀐다.(모수가 없는 것이 아니다. 무한히 많거나 데이터에 따라 바뀌는 것이다. 그래서 모수가 없다라고 하는 것은 아니니 주의한다.) 확률분포 가정하기 히스토그램을 통해서 ..
-
[08.03] Day2 - 'Python과 딥러닝 기초'😮네이버 부스트캠프 AI Tech 2기 2021. 8. 6. 22:00
📖 Python 2강(변수, 함수, 조건문, String, etc..) Python 강의는 기본적인 것은 어느정도 알고 있기 때문에, 중요한 개념에 대한 것만 정리해 놓겠다! 👨🏻💻 강사 : 최성철 교수님 [배운 점] 변수는 메모리 주소를 가지고 있고 변수에 들어가는 값은 메모리 주소에 할당된다.(물리적으로 할당) → DRAM어딘가에 저장이 되어버린다. Python 같은 경우는 카맬케이스가 아니라 Snake_case를 사용한다! 변수명은 대소문자를 구분한다. Data Type (각 타입별로 차지하는 메모리 공간이 다르다.) integer : 정수형 float : 실수형 string : 문자형 ('/'가 들어가 있다.) boolean : 참/거짓 파이썬의 장점 : 이런 Data Type이 프로그램이 실행..