'Diffusion' 태그의 글 목록

프로그래밍/기술2025. 10. 1. 18:00CNN: 이미지 인식의 기본으로 적용된 신경망

딥러닝 모델 중에서 가장 많이 들어본 이름 중 하나가 아마 CNN(Convolutional Neural Networks, 합성곱 신경망)일 겁니다.오늘은 제가 정리한 CNN의 핵심 개념과 응용 사례에 대해 글을 작성하려고 합니다.CNN이 필요한 이유일반적인 신경망(MLP, 다층 퍼셉트론)에 이미지를 그대로 넣으면, 픽셀 수만큼 입력 노드가 필요합니다.예를 들어 224x224 크기의 컬러 이미지라면 224×224×3 = 약 150,000개의 입력이 생깁니다.문제 1: 파라미터가 너무 많아짐 → 계산량 폭발문제 2: 이미지의 공간적 구조(위치, 패턴)를 잘 반영하지 못함CNN은 이 문제를 해결하기 위해 등장했습니다. 이미지의 국소적인 패턴(엣지, 선, 질감)을 필터로 추출하는 방식을 사용합니다.CNN의 핵심..

프로그래밍/기술2025. 9. 1. 18:30확장되는 Diffusion 모델: 이미지 너머 3D·비디오·오디오·과학으로

Diffusion 모델, 한 줄 정의와 배경Diffusion은 데이터→노이즈로 가는 전향 과정과, 노이즈→데이터로 복원하는 역과정(생성)을 학습하는 모델 계열입니다. DDPM(Ho et al., 2020)이 현대적 틀을 잡았고, Score-based SDE(Song et al., 2020)는 연속시간 해석을 통해 역확률 미분방정식으로 일반화했습니다. Latent Diffusion(Rombach et al., 2022)은 픽셀 공간 대신 오토인코더 잠재공간에서 생성해 메모리/연산 비용을 크게 낮춘 게 포인트고, “Diffusion이 GAN을 앞질렀다”는 상징적 결과(Dhariwal & Nichol, 2021)가 대중화에 불을 붙였습니다. 왜 ‘확장’이 중요한가텍스트-이미지 생성에 머무르지 않고, 형식이 다..

티스토리툴바