4학년 1학기 전공/기계학습
[기계학습] Chapter 1. Introduction to Machine Learning
시데브
2025. 3. 24. 10:39
경희대학교 최진우 교수님의 기계학습 수업을 기반으로 정리한 글입니다.
1. ML Definitions
- 명시적으로 프로그램하지 않아도, 기계가 스스로 무언가 배울 수 있는 능력을 가지도록 연구하는 분야
- Machine Learning: 기계가 Experience E에 따라서, 특정 Task T를 Performance P만큼의 성능을 수행할 수 있도록 학습시키는 것
- ex) 손글씨 인식
- Task T: 손글씨 사진이 어떤 숫자인지 구별하는 것
- Performance measure P: 100개 중에서 몇 개를 정확히 인식하는지
- Training experience E: 데이터
2. ML Types
- Supervised Learning: 특징 벡터(input) X와 목푯값(output) Y가 모두 주어진 상황
- 회귀 문제(Regression): continuous output(y = f(x))
- 분류 문제(Classification): discrete output(categories)
- Unsupervised Learning: 특징 벡터(input) X는 주어지는데 목푯값(output) Y가 주어지지 않는 상황
- 군집화(Clustering)
- 밀도 추정(Density Estimation)
- 차원 축소(Dimensionality Reduction)
- Semi-Supervised Learning: 일부 이미지에는 label이 주어지고, 일부에는 주어지지 않는 상황
- Reinforcement Learning: 행동(action)을 수행하고 얻은 전체 보상(reward)을 최대화하는 일련의 행동을 학습
2.1. Supervised Leraning
- Labeled data: correct output을 알고 있는 Data
- ex) 집값 예측, 암 판별, 스팸 메일 필터링
2.2. Unsupervised Learning
- result 정보가 없는 상황에서의 학습
3. AI & ML
4. Datasets
4.1. Public Datasets
4.2. Sparsity of Datasets
- 데이터셋의 크기(샘플 개수)는 통상 특징 공간의 크기에 비해서 매우 작다(매우 희소하다).
- ex) MNIST: 28*28 흑백 비트맵이라면 서로 다른 총 샘플 수는 2^784가지이지만, MNIST는 고작 6만 개 샘플
4.3. Data Visualization
- 4차원 이상의 초공간은 한꺼번에 가시화 불가능
- ex) 2개씩 조합하여 여러 개 그래프로 표현