1) 강의 복습 내용
1. Conditional Genrative Model
https://ltsgod.tistory.com/112
Conditional Generative Model
1) Conditional generative model 이것은 무엇인가?? 조건이 주어졌을 때 image를 해석해주는 것을 말한다. 예를 들어 위와 같이 실제 이미지를 가방으로 번역하는 함수가 있다고 한다. 이러한 모델은 조건
ltsgod.tistory.com
2. Multi- Modal(보강 필요)
https://ltsgod.tistory.com/116
Multi-Modal
1) Multi-Modal learning Overview Multi-Modal-learning이란 다른 특성을 갖는 data(ex. text, sound)를 같이 활용하는 것을 말한다. 이러한 Multi-Modal이 마주하는 challenge는 다음과 같다. 1. Different representations between mod
ltsgod.tistory.com
3. 3D understanding
https://ltsgod.tistory.com/113
3D에 대해 이해해보자
1) 3D Overview 왜 3D가 중요한가?? 우리가 일상적으로 사는 공간이 3D이기 때문이다. 따라서 앞으로 사용하게 될 프로그램에서 이러한 3D를 인식하는 것이 중요할 것이다. 이러한 3D를 적용하는 다양
ltsgod.tistory.com
4. Recent Trends on Vision Transformers
https://ltsgod.tistory.com/114
Vision Transformer
1) Transformer https://ltsgod.tistory.com/94 Transformer 1) Transformer Sequential model이 다루기 힘든 문제들 중간에 시퀀스 데이터가 누락되거나, 순서가 바뀌거나 잘리는 문제들은 Sequential model로 다루기가 쉽지
ltsgod.tistory.com
https://ltsgod.tistory.com/115
Vision + Language Transformers, Unified Transformer
1) CLIP(Contrastive Language-Image Pre-training) OpenAI에서 개발한 인공지능 모델입니다. 이 모델은 이미지와 텍스트를 함께 학습하여 이를 활용하여 각각의 정보를 서로 연결하고, 이미지에서 텍스트를 생
ltsgod.tistory.com
2) 과제 수행 과정 / 결과물 정리
cGAN, CLIP을 이용한 Multi-Modal 을 이용한 과제를 했다. 먼저 GAN 을 학습시켜보면서 학습시키기 어려운 것을 몸소 체감했다. 그래도 결과가 괜찮게 나왔었을 때는 괜찮았다. 따로 정리를 해야하는데 시간 남으면 해야겠다.
3) 피어세션 정리
cGAN과제를 하며 모르는 부분에 대해 서로 질의응답을 하며 과제를 에 대해 모르는 부분을 해결해나갔다. 또 수요일에는 ResNet 논문 리뷰를 했는데 발표를 맡아 ResNet 논문을 요약하는 것을 했다. 이것도 정리하고 싶은데 정리를 시간 남으면 해야겠다.
4) 학습 회고
이번 주는 약간의 공부리듬이 흐트러지는 주였던 것 같다. 내용도 점점 어려워지고 어려운데 다루는 Network 개념들은 많다보니 더욱 더 머리에 들어오지 않았다. 심화과제, 기본과제, ResNet 논문 요약 정리, 강의 내용 정리 등등...... 항상 정리할 건 산더미 인데..... 다시 복습을 하는 건 정말 쉽지 않은 것 같다.
한 강의 듣고 정리하는데 3시간은 걸리는 것 같고.. 거기에 다음 주부터 플젝을 시작하다보니 팀까지 짜야해서 공지내용도 많고, 노션 자기소개도 써야하고 너무너무 할게 많은데 하기 싫은 주였다. 부랴부랴 주말까지 시간내서 겨우 회고를 쓴다. 일단 다음주부터는 좀 더 정신을 차려야할 것 같다는 생각이 들었다. 강의에서 모르는 내용은 차차 공부하면 되니까....!
쨋든 담주부터는 좀 더 열심히 살아야겠다ㅠ.