본문 바로가기

논문리뷰30

[논문리뷰] GAN 논문 리뷰 GAN 논문 리뷰입니다.논문 :Generative Adversarial Nets저자 : Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, Département d’informatique et de recherche opérationnelle [1] Introduction딥러닝은 이미지, 음성, 자연어 등 다양한 데이터 도메인에서 탁월한 성능을 보이는 모델 개발을 가능하게 했습니다. 논문에서는 이러한 발전을 ‘풍부하고 구조화된 모델의 발견’이라고 표현하며, 특히 복잡한 데이터 분포를 잘 포착해내는 능력에 주목했습.. 2025. 5. 24.

[논문리뷰] VAE 논문 리뷰 VAE 논문 리뷰입니다.논문 : Auto-Encoding Variational Bayes저자 : Diederik P. Kingma, Max Welling [1] Background 1) Auto Encoder VAE는 Variational Auto Encoder의 약자로 기본적으로 위와 같은 모델 구조를 가지고 있습니다. 그럼 일단 Auto Encoder가 뭔지부터 알아야겠죠. Auto Encoder는 위처럼 이미지를 Encoder 에 입력하고 Input Image와 동일한 Output 을 Decoder 가 생성하도록 학습되는 모델입니다. 위 예시에서는 2 Image를 입력하고 latent vector를 만든 후 latent vector를 Decoder에 전달해 2 Image 를 생성합니다. 일반적인.. 2025. 2. 17.

[논문리뷰] Mask R-CNN 논문 리뷰 Mask R-CNN 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Mask R-CNN저자 : Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick[1] Background여느 Mask R-CNN 모델 리뷰와 동일하게 Instance segmentation과 R-CNN 계열 모델의 발전 과정을 살펴보고 들어가겠습니다. Instance Segmentation 본 논문의 Introduction 부분에 이 모델은 Instance Segmentation에서 강력한 모델을 만들겠다는 이야기를 합니다. Instance Segmentation 이란, Object Detection과 Semantic Segmentation이 결합된 형태의 CV Task.. 2025. 2. 17.

[논문리뷰] EfficientNet 논문리뷰 EfficientNet 논문 리뷰입니다.본 논문은 2019년도에 등장한 논문입니다.논문 : EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 저자 : Mingxing Tan, Quoc V. Le[1] Background전통적으로 CNN 모델의 성능을 높이기 위해서는 모델 규모를 키우는 것이 일반적인 방법입니다. 예를 들어, ResNet은 Layer의 개수를 늘려서 ResNet-18 에서 ResNet-200 까지도 증가시킬 수 있고, GPipe는 기본 모델을 4배 확장하여 ImageNet 데이터셋에서 top1 정확도 84.3%를 달성하기도 했다고 하네요. 이렇게 CNN 모델의 규모를 키우는 방법은 여러 가지가 있지만, 어떤 방.. 2025. 2. 5.

[논문리뷰] RetinaNet 논문 리뷰 RetinaNet 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Focal Loss for Dense Object Detection 저자 : Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollar [1] Background Object Dection 분야에서 전통적으로 두 단계 검출기 모델과 한 단계 검출기 모델로 구분할 수 있습니다. R-CNN 계열 (Selective Search, Faster R-CNN 등) 의 모델들은 물체가 있을 법한 제안 영역을 찾고(1), 해당 영역을 CNN 기반 분류기를 통해 어떤 물체인지 분류하는(2) 두 단계로 구분되어 작동됩니다.이러한 Two stage 방식은 소수의 후보 영역만 추려.. 2025. 2. 3.

[논문리뷰] RoBERTa 논문 리뷰 RoBERTa 논문 리뷰입니다.본 논문은 2019년도에 등장한 논문입니다.논문 : RoBERTa: A Robustly Optimized BERT Pretraining Approach저자 : Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov [1] BackgroundRoBERTa : A Robustly Optimized BERT Pretraining Approach 본 논문은 이름에서 알 수 있듯이 BERT 모델을 더 발전시킨 언어 모델입니다. 그래서 기존 BERT 모델에 비해 어떤 점이 달라졌고 발전되었는지 비교하면서 보면.. 2025. 2. 2.

[논문리뷰] GPT-1 논문 리뷰 GPT-1 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Improving Language Understanding by Generative Pre-Training 저자 : Alec Radford, Karthik Narasimhan, Tim Salimans, Ilya Sutskever [1] Background 논문에서 Abstract 부분에 Unlabeled Data가 Labeled Data 보다 양이 비교할 수 없을만큼 많다고 주장합니다. 당연한 얘기죠. Labeled Data는 사람이 직접 라벨링을 해야 하니까 양이 적을 수밖에 없습니다. 또한 Labeled Data를 만들기 위해서 시간과 비용, 인력이 소요됩니다. 논문 저자들은 자연스럽게 Unlabeled Data를 언어 .. 2025. 1. 26.

[논문리뷰] YOLO 논문 리뷰 YOLO 논문 리뷰입니다.본 논문은 2016년도에 등장한 논문입니다.논문 : You Only Look Once: Unified, Real-Time Object Detection 저자 : Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi[1] Background최근 몇 년 간 CV 분야에서 객체 탐지 기술이 눈에 띄게 발전해왔습니다. Object Detection, 객체 탐지란 Localization + Classification 의 개념으로어떤 객체가 어느 위치에 있는지 탐지하는 Task를 얘기합니다. 기존의 객체 탐지 Model 들은 주로 Classifier, 분류기를 기반으로 한 접근 방식을 사용해왔습니다. 대표적으로 DPM / R-CNN 등.. 2025. 1. 25.

이전 1 2 3 4 다음

728x90

티스토리툴바