Notice
Recent Posts
Recent Comments
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Archives
Today
Total
관리 메뉴

SYDev

[기계학습] Chapter 1. Introduction to Machine Learning 본문

4학년 1학기 전공/기계학습

[기계학습] Chapter 1. Introduction to Machine Learning

시데브 2025. 3. 24. 10:39
경희대학교 최진우 교수님의 기계학습 수업을 기반으로 정리한 글입니다.

 

1. ML Definitions 

데이터를 기반으로 Black Box를 생성

  • 명시적으로 프로그램하지 않아도, 기계가 스스로 무언가 배울 수 있는 능력을 가지도록 연구하는 분야
  • Machine Learning: 기계가 Experience E에 따라서, 특정 Task T를 Performance P만큼의 성능을 수행할 수 있도록 학습시키는 것
  • ex) 손글씨 인식
    • Task T: 손글씨 사진이 어떤 숫자인지 구별하는 것
    • Performance measure P: 100개 중에서 몇 개를 정확히 인식하는지
    • Training experience E: 데이터

 

2. ML Types

  • Supervised Learning: 특징 벡터(input) X목푯값(output) Y가 모두 주어진 상황
    • 회귀 문제(Regression): continuous output(y = f(x))
    • 분류 문제(Classification): discrete output(categories)
  • Unsupervised Learning: 특징 벡터(input) X는 주어지는데 목푯값(output) Y가 주어지지 않는 상황
    • 군집화(Clustering)
    • 밀도 추정(Density Estimation)
    • 차원 축소(Dimensionality Reduction)
  • Semi-Supervised Learning: 일부 이미지에는 label이 주어지고, 일부에는 주어지지 않는 상황
  • Reinforcement Learning: 행동(action)을 수행하고 얻은 전체 보상(reward)을 최대화하는 일련의 행동을 학습

강화학습

2.1. Supervised Leraning

  • Labeled data: correct output을 알고 있는 Data
  • ex) 집값 예측, 암 판별, 스팸 메일 필터링

2.2. Unsupervised Learning

  • result 정보가 없는 상황에서의 학습

 

3. AI & ML

 

4. Datasets

4.1. Public Datasets

4.2. Sparsity of Datasets

  • 데이터셋의 크기(샘플 개수)는 통상 특징 공간의 크기에 비해서 매우 작다(매우 희소하다).
  • ex) MNIST: 28*28 흑백 비트맵이라면 서로 다른 총 샘플 수는 2^784가지이지만, MNIST는 고작 6만 개 샘플

4.3. Data Visualization

  • 4차원 이상의 초공간은 한꺼번에 가시화 불가능
  • ex) 2개씩 조합하여 여러 개 그래프로 표현

 

'4학년 1학기 전공 > 기계학습' 카테고리의 다른 글

[기계학습] Chapter 2. Linear Algebra  (0) 2025.03.24