**Autonomous driving tech.

ㄷRegularization vs Normalization, Dropout, 도메인의 개념, 멀티스케일?, 디스크립터?

2wnswoo 2025. 6. 7. 14:32

  • GAN(갠): 데이터를 생성하는 Generator와 진짜 데이터인지 판별하는 Discriminator
    • 실제 이미지와 비슷한 형태의 출력을 생성하도록 학습이 목표

  • Regularization vs Normalization
    • Regularization (규제) 와 Normalization (정규화) 를 두 개를 비교를 잘 함.
    • Regularization은 핵심 목적이 overfitting 과적합 방지임, 여기에는 Dropout과 L1, L2가 존재
    • Normalization 정규화는, 학습 하는 데이터를 일정한 스케일로 맞춰주는 것임, 핵심 목적은 학습이 잘 되도록 하기 위함
      • 예를 들면, [0,1] 사이 값으로 조정 or 평균 0 표준편차 1로 만드는 것
  •  Dropout
    • 드롭아웃 (Dropout)방식은 과대적합이 발생하기 쉬운 심층 신경망 구조에서 이를 방지할 수 있는 정규화 기법의 하나이다. 작동방식은 레이어의 사이마다 드롭아웃을 실행하면 훈련이 반복되는 과정 중에 무작위, P 확률로 해당 레이어의 뉴런을 삭제하여 이를 가능하게 함

 

  • DeepLabV3:
    • google tensorflow팀이 2018년에 만듦
    • 이미지 분할(Semantic Segmentation) 모델
    • ASPP와 Depthwise Separable Convolution을 결합한 Encoder-Decoder 구조의 이미지 분할 모델로,
      정확한 경계 복원을 위해 U-Net처럼 중간 feature를 연결 (Skip Connection) 하여 성능을 개선한 것이 특징
      • ASPP란? (Atrous Spatial Pyramid Pooling) : ASPP는 다양한 크기의 필터를 동시에 적용하여, 이미지 내의 다양한 크기의 객체를 더 잘 인식하도록 도와주는 모듈
  • Transformer : Key, Query, Value 가 핵심!!  key, Query간 유사도 계산을 통해 어떤 부분을 집중할지 Attention score을 얻어서 결정하고, 거기서 얻은 값을 Value 가 가져옴
  • 도메인, domain : 데이터 자체 뿐만 아니라 데이터를 얻는데 있어서 모든 요소들( 환경(조명의 세기, 그림자, 회전의 정도), 장비 등 ) 을 말함
    • 도메인 adaptation : 한 개의 (Source Domain) 을 다른 도메인( Target Domain)에 잘 적응(adapt) 시키는 것
  • Knowlege Distillation : 성능은 좋으나 속도 느린 모델(티쳐)의 지식 작은 80% 정도? 되는 작은 네트워크를 가진 모델(스튜던트)로 학습 시키는 것
  • 멀티 스케일 : 하나의 입력(예: 이미지)을 여러 크기(스케일)로 분석하여,
    작은 것부터 큰 것까지 다양한 크기의 패턴이나 객체 인식 방식
    • e.g. 자율주행차에서, / 작은 스케일 : 횡단보도, 차선 / 중간 스케일 : 앞 차량 범퍼 / 큰 스케일 : 전체적인 주위 차량들
    • 뭐가 좋음? : 작고 다양한 크기의 객체들을 안정적으로 인식이 가능해짐
  • 분야대표 멀티스케일 모델
    객체 검출 FPN, YOLOv3, SSD
    이미지 분할 DeepLabV3+, PSPNet, U-Net
    거리 추정 PSMNet, GA-Net
    비전 트랜스포머 Swin Transformer, HRNet
  • 디스크립터 : 이미지에서 중요한 부분만 벡터로 수치화해서 표현한 것
    • 디스크립터는 작은 차원 벡터로 중요한 정보만 표현
    • 빠르고 정확한 매칭, 검색, 분류가 가능
    • SIFT, ORB, SURF → 이미지의 코너, 엣지, 패턴을 벡터로 표현