본문 바로가기

논문리뷰24

[논문리뷰] VAE 논문 리뷰 VAE 논문 리뷰입니다.논문 : Auto-Encoding Variational Bayes저자 : Diederik P. Kingma, Max Welling [1] Background 1) Auto Encoder  VAE는 Variational Auto Encoder의 약자로 기본적으로 위와 같은 모델 구조를 가지고 있습니다. 그럼 일단 Auto Encoder가 뭔지부터 알아야겠죠.  Auto Encoder는 위처럼 이미지를 Encoder 에 입력하고 Input Image와 동일한 Output 을 Decoder 가 생성하도록 학습되는 모델입니다. 위 예시에서는 2 Image를 입력하고 latent vector를 만든 후 latent vector를 Decoder에 전달해 2 Image 를 생성합니다. 일반적인.. 2025. 2. 17.
[논문리뷰] Mask R-CNN 논문 리뷰 Mask R-CNN 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Mask R-CNN저자 : Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick[1] Background여느 Mask R-CNN 모델 리뷰와 동일하게 Instance segmentation과 R-CNN 계열 모델의 발전 과정을 살펴보고 들어가겠습니다. Instance Segmentation 본 논문의 Introduction 부분에 이 모델은 Instance Segmentation에서 강력한 모델을 만들겠다는 이야기를 합니다.   Instance Segmentation 이란, Object Detection과 Semantic Segmentation이 결합된 형태의 CV Task.. 2025. 2. 17.
[논문리뷰] RetinaNet 논문 리뷰 RetinaNet 논문 리뷰입니다.본 논문은 2018년도에 등장한 논문입니다.논문 : Focal Loss for Dense Object Detection 저자 : Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollar [1] Background Object Dection 분야에서 전통적으로 두 단계 검출기 모델과 한 단계 검출기 모델로 구분할 수 있습니다. R-CNN 계열 (Selective Search, Faster R-CNN 등) 의 모델들은 물체가 있을 법한 제안 영역을 찾고(1), 해당 영역을 CNN 기반 분류기를 통해 어떤 물체인지 분류하는(2) 두 단계로 구분되어 작동됩니다.이러한 Two stage 방식은 소수의 후보 영역만 추려.. 2025. 2. 3.
[논문리뷰] RoBERTa 논문 리뷰 RoBERTa 논문 리뷰입니다.본 논문은 2019년도에 등장한 논문입니다.논문 : RoBERTa: A Robustly Optimized BERT Pretraining Approach저자 : Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov [1] BackgroundRoBERTa : A Robustly Optimized BERT Pretraining Approach 본 논문은 이름에서 알 수 있듯이 BERT 모델을 더 발전시킨 언어 모델입니다. 그래서 기존 BERT 모델에 비해 어떤 점이 달라졌고 발전되었는지 비교하면서 보면.. 2025. 2. 2.
[논문리뷰] YOLO 논문 리뷰 YOLO 논문 리뷰입니다.본 논문은 2016년도에 등장한 논문입니다.논문 : You Only Look Once: Unified, Real-Time Object Detection 저자 : Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi[1] Background최근 몇 년 간 CV  분야에서 객체 탐지 기술이 눈에 띄게 발전해왔습니다. Object Detection, 객체 탐지란 Localization + Classification 의 개념으로어떤 객체가 어느 위치에 있는지 탐지하는 Task를 얘기합니다. 기존의 객체 탐지 Model 들은 주로 Classifier, 분류기를 기반으로 한 접근 방식을 사용해왔습니다.  대표적으로 DPM / R-CNN 등.. 2025. 1. 25.
[논문리뷰] U-Net 논문 리뷰 U-Net 논문 리뷰입니다.본 논문은 2015년도에 등장한 논문입니다.논문 : U-Net: Convolutional Networks for Biomedical Image Segmentation저자 : Olaf Ronneberger, Philipp Fischer, and Thomas Brox[1] BackgroundDeep CNN Network는 CV Task에서 뛰어난 성능을 보여왔습니다. ImageNet 와 같은 규모 데이터셋의 등장과 함께 딥러닝의 성능이 크게 향상되었습니다. 이러한 CNN 은 보통 이미지 분류 작업에 쓰이는데, 의료 도메인에서는 이미지 분류만으로는 충분하지 않으며 이미지의 각 픽셀이 어떤 상태인지, 어떤 구조인지를 알아야 하는 경우가 많아 적용되기 힘든 문제가 있습니다. (이미지 내.. 2025. 1. 23.
[논문리뷰] Faster R-CNN 논문 리뷰 Faster R-CNN 논문 리뷰입니다.본 논문은 2015년도에 등장한 논문입니다.논문 : Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 저자 : Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun  [1] Background여느 Faster R-CNN 모델 리뷰와 동일하게 R-CNN, Fast R-CNN의 모델 구조와 문제점을 찍먹하고 Faster R-CNN 리뷰를 하겠습니다. Object Detection 그 전에 Object Detection Task에 대해 간단히 살펴보고 가겠습니다. 객체 탐지 Task는 말 그대로 이미지에서 객체가 어디에 있고, 그 객체가 .. 2025. 1. 20.
[논문리뷰] Attention 논문 리뷰 Attention 논문 리뷰입니다.본 논문은 2014년도에 등장한 논문입니다. 논문 : NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE 저자 : Dzmitry Bahdanau Jacobs University Bremen, Germany KyungHyun Cho Yoshua Bengio∗ Universite de Montr ´ eal  [1] Background 해당 논문은 제목에서 알 수 있듯이 신경망을 활용한 기계번역 Task에 집중하고 있습니다. 확률적 관점에서 번역은 목표 문장을 찾는 개념과 같습니다. 어떤 문장 x가 등장했을 때 조건부 확률을 통해 x 다음에 나올 확률이 가장 높은 문장 y를 생성하는 방식으로 진행되죠. .. 2025. 1. 16.
728x90
반응형