[논문리뷰] CoT 논문 리뷰
CoT 논문 리뷰입니다. 논문 : Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 저자 : Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed Chi, Quoc Le, Denny Zhou [1] IntroductionChinchilla 논문에서도 언급됐던 내용인데, 최근 LLM의 급격한 발전이 이루어졌지만 단순히 모델 크기를 확장한다고 해서 무조건적으로 성능이 좋아지지는 않음을 본 논문에서도 지적하고 있습니다. 특정 질문에 대한 응답을 생성하는 데에는 탁월하지만, 복잡한 문제 해결 과정에서 중간 사고 단계를 생략하거나 비논리적인 답변을..
2025. 7. 22.
[논문리뷰] ChinChilla 논문 리뷰
ChinChilla 논문 리뷰입니다. 논문 : Training Compute-Optimal Large Language Models 저자 : Jordan Hoffmann★, Sebastian Borgeaud★, Arthur Mensch★, Elena Buchatskaya, Trevor Cai, Eliza Rutherford, Diego de Las Casas, Lisa Anne Hendricks, Johannes Welbl, Aidan Clark, Tom Hennigan, Eric Noland, Katie Millican, George van den Driessche, Bogdan Damoc, Aurelia Guy, Simon Osindero, Karen Simonyan, Erich Elsen, Jack..
2025. 7. 15.
[논문리뷰] RAG 논문 리뷰
RAG 논문 리뷰입니다.논문 : Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks저자 : Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela [1] IntroductionGPT와 같은 대형 언어모델, 즉 LLM은 사전학습된 내용을 통해 여러 NLP Downstream Task에서 좋은 성능을 보이고 있습니다. 하지만 정말 정확한 지식이 필요한 분야(법률, 의료 ..
2025. 6. 30.
[논문리뷰] GAN 논문 리뷰
GAN 논문 리뷰입니다.논문 :Generative Adversarial Nets저자 : Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, Département d’informatique et de recherche opérationnelle [1] Introduction딥러닝은 이미지, 음성, 자연어 등 다양한 데이터 도메인에서 탁월한 성능을 보이는 모델 개발을 가능하게 했습니다. 논문에서는 이러한 발전을 ‘풍부하고 구조화된 모델의 발견’이라고 표현하며, 특히 복잡한 데이터 분포를 잘 포착해내는 능력에 주목했습..
2025. 5. 24.