본문 바로가기

전체 글66

[논문리뷰] VAE 논문 리뷰 VAE 논문 리뷰입니다.논문 : Auto-Encoding Variational Bayes저자 : Diederik P. Kingma, Max Welling [1] Background 1) Auto Encoder  VAE는 Variational Auto Encoder의 약자로 기본적으로 위와 같은 모델 구조를 가지고 있습니다. 그럼 일단 Auto Encoder가 뭔지부터 알아야겠죠.  Auto Encoder는 위처럼 이미지를 Encoder 에 입력하고 Input Image와 동일한 Output 을 Decoder 가 생성하도록 학습되는 모델입니다. 위 예시에서는 2 Image를 입력하고 latent vector를 만든 후 latent vector를 Decoder에 전달해 2 Image 를 생성합니다. 일반적인.. 2025. 2. 17.
[논문리뷰] Mask R-CNN 논문 리뷰 Mask R-CNN 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Mask R-CNN저자 : Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick[1] Background여느 Mask R-CNN 모델 리뷰와 동일하게 Instance segmentation과 R-CNN 계열 모델의 발전 과정을 살펴보고 들어가겠습니다. Instance Segmentation 본 논문의 Introduction 부분에 이 모델은 Instance Segmentation에서 강력한 모델을 만들겠다는 이야기를 합니다.   Instance Segmentation 이란, Object Detection과 Semantic Segmentation이 결합된 형태의 CV Task.. 2025. 2. 17.
[논문리뷰] EfficientNet 논문리뷰 EfficientNet 논문 리뷰입니다.본 논문은 2019년도에 등장한 논문입니다.논문 : EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 저자 : Mingxing Tan, Quoc V. Le[1] Background전통적으로 CNN 모델의 성능을 높이기 위해서는 모델 규모를 키우는 것이 일반적인 방법입니다. 예를 들어, ResNet은 Layer의 개수를 늘려서 ResNet-18 에서 ResNet-200 까지도 증가시킬 수 있고, GPipe는 기본 모델을 4배 확장하여 ImageNet 데이터셋에서 top1 정확도 84.3%를 달성하기도 했다고 하네요. 이렇게 CNN 모델의 규모를 키우는 방법은 여러 가지가 있지만, 어떤 방.. 2025. 2. 5.
[논문리뷰] RetinaNet 논문 리뷰 RetinaNet 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Focal Loss for Dense Object Detection 저자 : Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollar [1] Background Object Dection 분야에서 전통적으로 두 단계 검출기 모델과 한 단계 검출기 모델로 구분할 수 있습니다. R-CNN 계열 (Selective Search, Faster R-CNN 등) 의 모델들은 물체가 있을 법한 제안 영역을 찾고(1), 해당 영역을 CNN 기반 분류기를 통해 어떤 물체인지 분류하는(2) 두 단계로 구분되어 작동됩니다.이러한 Two stage 방식은 소수의 후보 영역만 추려.. 2025. 2. 3.
[논문리뷰] RoBERTa 논문 리뷰 RoBERTa 논문 리뷰입니다.본 논문은 2019년도에 등장한 논문입니다.논문 : RoBERTa: A Robustly Optimized BERT Pretraining Approach저자 : Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov [1] BackgroundRoBERTa : A Robustly Optimized BERT Pretraining Approach 본 논문은 이름에서 알 수 있듯이 BERT 모델을 더 발전시킨 언어 모델입니다. 그래서 기존 BERT 모델에 비해 어떤 점이 달라졌고 발전되었는지 비교하면서 보면.. 2025. 2. 2.
[논문리뷰] GPT-1 논문 리뷰 GPT-1 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Improving Language Understanding by Generative Pre-Training 저자 : Alec Radford, Karthik Narasimhan,  Tim Salimans, Ilya Sutskever [1] Background 논문에서 Abstract 부분에 Unlabeled Data가 Labeled Data 보다 양이 비교할 수 없을만큼 많다고 주장합니다. 당연한 얘기죠. Labeled Data는 사람이 직접 라벨링을 해야 하니까 양이 적을 수밖에 없습니다. 또한 Labeled Data를 만들기 위해서 시간과 비용, 인력이 소요됩니다. 논문 저자들은 자연스럽게 Unlabeled Data를 언어 .. 2025. 1. 26.
[논문리뷰] YOLO 논문 리뷰 YOLO 논문 리뷰입니다.본 논문은 2016년도에 등장한 논문입니다.논문 : You Only Look Once: Unified, Real-Time Object Detection 저자 : Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi[1] Background최근 몇 년 간 CV  분야에서 객체 탐지 기술이 눈에 띄게 발전해왔습니다. Object Detection, 객체 탐지란 Localization + Classification 의 개념으로어떤 객체가 어느 위치에 있는지 탐지하는 Task를 얘기합니다. 기존의 객체 탐지 Model 들은 주로 Classifier, 분류기를 기반으로 한 접근 방식을 사용해왔습니다.  대표적으로 DPM / R-CNN 등.. 2025. 1. 25.
[논문리뷰] U-Net 논문 리뷰 U-Net 논문 리뷰입니다.본 논문은 2015년도에 등장한 논문입니다.논문 : U-Net: Convolutional Networks for Biomedical Image Segmentation저자 : Olaf Ronneberger, Philipp Fischer, and Thomas Brox[1] BackgroundDeep CNN Network는 CV Task에서 뛰어난 성능을 보여왔습니다. ImageNet 와 같은 규모 데이터셋의 등장과 함께 딥러닝의 성능이 크게 향상되었습니다. 이러한 CNN 은 보통 이미지 분류 작업에 쓰이는데, 의료 도메인에서는 이미지 분류만으로는 충분하지 않으며 이미지의 각 픽셀이 어떤 상태인지, 어떤 구조인지를 알아야 하는 경우가 많아 적용되기 힘든 문제가 있습니다. (이미지 내.. 2025. 1. 23.
[논문리뷰] Faster R-CNN 논문 리뷰 Faster R-CNN 논문 리뷰입니다.본 논문은 2015년도에 등장한 논문입니다.논문 : Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 저자 : Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun  [1] Background여느 Faster R-CNN 모델 리뷰와 동일하게 R-CNN, Fast R-CNN의 모델 구조와 문제점을 찍먹하고 Faster R-CNN 리뷰를 하겠습니다. Object Detection 그 전에 Object Detection Task에 대해 간단히 살펴보고 가겠습니다. 객체 탐지 Task는 말 그대로 이미지에서 객체가 어디에 있고, 그 객체가 .. 2025. 1. 20.
[논문리뷰] ELMo 논문 리뷰 ELMo 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다. 논문 : Deep contextualized word representations 저자 : Matthew E. Peters , Mark Neumann , Mohit Iyyer , Matt Gardner, Christopher Clark∗ , Kenton Lee∗ , Luke Zettlemoyer  [1] Background 본 논문은 Embeddings from Language Model 인 만큼 자연어를 임베딩하는 방법을 새롭게 제시하는 논문입니다. Word2Vec이나 GloVe 등 전통적인 단어 임베딩 방식은 고정된 벡터 형태로 단어를 표현하는 방식입니다. 단어를 고정된 벡터로 변환해 단어 간 유사성을 측정하거나 언어적 관계를 추론.. 2025. 1. 19.
[논문리뷰] Attention 논문 리뷰 Attention 논문 리뷰입니다.본 논문은 2014년도에 등장한 논문입니다. 논문 : NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE 저자 : Dzmitry Bahdanau Jacobs University Bremen, Germany KyungHyun Cho Yoshua Bengio∗ Universite de Montr ´ eal  [1] Background 해당 논문은 제목에서 알 수 있듯이 신경망을 활용한 기계번역 Task에 집중하고 있습니다. 확률적 관점에서 번역은 목표 문장을 찾는 개념과 같습니다. 어떤 문장 x가 등장했을 때 조건부 확률을 통해 x 다음에 나올 확률이 가장 높은 문장 y를 생성하는 방식으로 진행되죠. .. 2025. 1. 16.
[논문리뷰] MoblieNet 논문 리뷰 MobileNet 논문 리뷰입니다.본 논문은 2017년도에 등장한 논문입니다.  논문 : MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications저자 : Andrew G. Howard Menglong Zhu Bo Chen Dmitry Kalenichenko Weijun Wang Tobias Weyand Marco Andreetto Hartwig Adam   합성곱 신경망 모델은 AlexNet 이후로 CV 분야에서 널리 사용되고 있습니다. 그리고 더 높은 정확도를 달성하기 위해 깊고 복잡한 네트워크를 설계하는 것이 일반적인 추세입니다. 그러나, 이러한 정확도 향상은 네트워크를 크기와 속도 측면에서 항상 효율적으로 만.. 2025. 1. 12.
728x90
반응형