Computer Vision 개요
Computer Vision에 대한 주요 문제들은 다음과 같습니다.

Image Classification(Image Recognition)
64 * 64 이미지를 input으로 받아 "이것이 고양이인가?"를 0 /1로 판단하는 문제죠. 가장 기본적인 task 입니다.
Object Detection
자율주행차에서 다른 차의 위치까지 알아내야 하는 경우처럼, 단순히 객체가 존재하는지만이 아니라 이미지 내 어디에 있는지를 bounding box로 표시하는 문제. 한 이미지에 여러 객체가 있을 수도 있습니다.
Neural Style Transfer
Content image(원본 이미지)를 style image(e.g. 피카소 그림)의 화풍으로 다시 그리는 문제. 새로운 형태의 예술을 가능케 합니다.
Parameter 폭발
큰 이미지를 다룰 때의 문제
Computer Vision의 어려움 중 하나는 input의 차원이 매우 커진다는 겁니다.
- 64×64 RGB 이미지: 64 × 64 × 3 = 12,288 차원. 비교적 다룰 만함.
- 1000×1000 RGB 이미지(1 megapixel): 1000 × 1000 × 3 = 3,000,000 차원 (= 3M).
만약 클래식 fully connected network로 처리한다고 가정해 볼께요. 첫 hidden layer에 1,000개의 unit이 있다면
$$W^{[1]} \in \mathbb{R}^{1000 \times 3,000,000}$$
즉 30억 개의 parameter가 첫 layer에만 필요합니다. 이로 인해 문제가 발생하죠.
- Overfitting: 30억 개의 parameter를 학습시키면서 overfitting을 막을 만큼의 데이터를 확보하기 어렵습니다.
- 연산 / 메모리 한계: 학습 자체가 computationally infeasible
Convolution 연산
Computer vision 문제에서 큰 이미지를 다루기 위해서는 convolution operation을 활용해야 합니다. Convolution은 CNN(Convolutional Neural Network)의 가장 기본이 되는 building block입니다.
이 convolution을 도입하기 위해, 먼저 edge detection을 먼저 이해해봅시다.
https://neverthe1ess.tistory.com/316
[Coursera] CNN - Edge Detection / Deep Learning Specialization
신경망의 초기 layer가 edge를 검출한 다음 일부 이후 layer가 객체의 원인을 감지하고 이후의 layer가 사람의 얼굴과 같은 완전한 객체의 원인을 감지하는 원리 이미지에서 edge를 어떻게 감지하는가?
neverthe1ess.tistory.com
'CS & AI > Computer Vision' 카테고리의 다른 글
| [Coursera] CNN - Pooling / Deep Learning Specialization (0) | 2026.05.18 |
|---|---|
| [Coursera] CNN - Padding & Stride / Deep Learning Specialization (0) | 2026.05.13 |
| [Coursera] CNN - Edge Detection / Deep Learning Specialization (0) | 2026.05.05 |
| <영상처리> Digital Image / Image Fundamental (1) | 2026.04.07 |
| <영상처리> Histogram Equalization (0) | 2026.03.27 |
나의 성장 드라마
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!