본문 바로가기

Google2

[논문리뷰] Inception v2, v3 논문 리뷰 오랜만에 돌아온 논문 리뷰 시간입니다.본 논문은 2015년에 등장한 논문입니다.    Rethinking the Inception Architecture for Computer Vision 저자 : Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon Shlens, Zbigniew Wojna  [0] Background인셉션의 구조를 알아보기 전에 인셉션이 나오게 된 배경에 대해서 먼저 알아보겠습니다. 2012년 이후 : ImageNet 대회에서 AlexNet이 등장해 객체 탐지, 세분화 등 다양한 CV Task에 성공적으로 적용되었습니다. 2014년 이후 : 더 깊고 넓은 아키텍쳐를 사용하면서 광범위한 CV Task에서 높은 성능 향상을 보였고, .. 2025. 1. 4.
[논문리뷰] Whisper 논문 리뷰 오늘은 Whisper 논문 리뷰를 가져왔습니다.Robust Speech Recognition via Large-Scale Weak Supervision저자 : Alec Radford, Jong Wook Kim, Tao Xu, Greg Brockman, Christine McLeavey, Ilya Sutskever[1] Introduction1) 기술적 배경 음성 인식, STT 분야의 발전은 Wav2Vec 2.0과 같은 비지도 사전 훈련 기술의 발전에 크게 기인합니다. 보통 좋은 성능의 딥러닝 모델을 구현하기 위해서는 많은 양의 라벨링 데이터가 필요합니다. 그리고 전통적인 음성인식 모델들은 이러한 라벨링 오디오, 텍스트 데이터에 대해 주로 훈련되었는데, 이는 몇몇 특정 언어에 대해서만 가능하다는 문제가 .. 2024. 8. 27.
728x90
반응형