[Computer Vision] 04 KLT algorithm, VOT, MOT, SORT algorithm

**Autonomous driving tech./*Computer Vision

2wnswoo 2025. 3. 10. 14:13

KLT Algorithm, Kanade-Lucas-Tomasi Algorithm

VOT, Visual Object Tracking, 단일 물체 추적

MOT, Multi-Object Tracking, 다중 물체 추적

SORT, Simple Online and Real-time Tracking

전통적인 Computer Vision Algorithm
Object Detection + Kalman Filter + Hungarian Algorithm을 조합하여 작동
- Hungarian Algorithm은 여러 개의 선택지 중에서 최적의 매칭을 찾아주는 알고리즘, 최고의 짝을 찾는 방법
Real-Time Multi-Object Tracking algorithm으로, 빠르고 가벼운 것이 장점

Transformer

NLP와 CV분야에서 강력한 성능을 보이는 딥러닝 모델이다.
트랜스포머는 Encoder 와 Decoder 로 구성
- Encoder > 입력 데이터를 통하여 분석하고 이해
- Decoder > 분석된 정보를 바탕으로 행동을 결정
- Self-Attention : 중요한 정보에 더 집중하도록 도와주는 기술
원래 Transformer는 언어 번역, NLP를 위해 개발되었음
- *NLP, Natural Language Processing : 자연어 처리는 컴퓨터가 인간의 언어, 자연어를 이해하고 처리할 수 있는 기술을 의미 Ex. 번역, 챗봇, 음성인식
단어들로 구성된 문장은 1차원 구조의 데이터인 반면 영상, 화소는 2차원 구조여서 기존의 Transformer의 형태를 변형해야 했음 > 이때 등장한 것이 바로 ViT, Vision Transformer

DETR, DEtection TRansformer

2020년 05월 Facebook AI Research 팀의 Nicolas Carion이 개발
최초로 Transformer를 사용해서 객체 탐지를 수행한 모델, CNN 없이 Transformer 만으로 객체 탐지가 가능하다는 걸 증명한 최초 모델

ViT, Vision Transformer

Swin Transformer

*Swin = Shifted Windows : 창을 이동하며 학습

*Self-Attention : 전체를 참고하면서 중요한 부분에 더 집중하는 기술 Ex. 사람 얼굴

Active Sensor VS Passive Sensor, 능동 센서 VS 수동 센서

Active Sensor : 자체적으로 신호( 빛( laser ) , 전파 신호 , 초음파 등 ) 를 발사하여 데이터를 수집
- Ex. LiDAR( laser ), Radar, 초음파 센서
Passive Sensor : 외부 환경( 빛, 열 등 )에서 발생하는 신호를 수집
- Ex. 카메라, 적외선 센서, 온도 센서

[ViT] AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE (0)	2025.09.05
Transformer (1)	2025.06.27
[Computer Vision] 03 IoU, mAP, BCS, Backbone Architecture (0)	2025.03.08
[Computer Vision] 02 Machine Learning 4-Step (0)	2025.03.06
[Computer Vision] 01 (0)	2025.03.05

2wnswoo 님의 블로그

Be a first mover, not a fast follower

티스토리챌린지, 오블완, 우,

2wnswoo 님의 블로그