'KHUDA 4th' 카테고리의 글 목록 (5 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록KHUDA 4th (35)

SYDev

Chapter 02-2: 데이터 전처리

넘파이로 데이터 준비 넘파이를 이용해서 이전보다 간편하게 데이터를 준비할 수 있다. np.column_stack() 및 훈련 데이터 준비 import numpy as np np.column_stack(([1,2,3], [4,5,6])) array([[1, 4], [2, 5], [3, 6]]) -> np.column_stack() 함수는 전달받은 리스트를 일렬로 세운 다음 차례대로 나란히 연결한다. 연결할 리스트는 파이썬 튜플(tuple)로 전달한다. 더보기 튜플은 리스트처럼 원소에 순서가 있지만 수정할 수 없다는 차이점이 있다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, ..

KHUDA 4th/머신러닝 기초 세션 2023. 7. 30. 22:01

Chapter 02-1: 훈련 세트와 테스트 세트

지도 학습과 비지도 학습 지도 학습(supervised learning): 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는 데 활용한다. 비지도 학습(unsupervised learning): 타깃 데이터 없이 학습한다. 따라서 입력 데이터에서 어떤 특징을 찾는 데 주로 활용한다. 지도학습에서 데이터와 정답을 입력(input)과 타깃(target)이라 부르며, 이 둘을 합쳐 훈련 데이터라 부른다. 훈련 세트와 테스트 세트 훈련 세트(train set): 모델을 훈련할 때 사용하는 데이터이다. 보통 훈련 세트는 크면 클수록 좋다. 테스트 세트(test set): 훈련된 모델을 평가할 때 사용하는 데이터이다. 보통 전체 데이터에서 20~30%를 테스트 세트로 사용하는 경우가 많다. 전체 ..

KHUDA 4th/머신러닝 기초 세션 2023. 7. 30. 19:46

Chapter 01-3: 마켓과 머신러닝

생선 분류 문제 생선의 특성인 '길이'와 '무게' 데이터를 가지고 생선 '도미'와 '빙어'를 분류하는 모델을 만들어보자. 용어 정리 분류(classification): 머신러닝에서 여러 개의 종류(혹은 클래스(class)) 중 하나를 구별해내는 문제를 이르는 말. 특성(feature): 학습 모델로 정답을 도출해내기 위해 고려하는 데이터 샘플(sample): 학습 데이터에 포함된 하나의 특징벡터 위 문제에서는 '도미'와 '빙어'가 각각 분류해야 하는 클래스이며, 생선의 길이와 무게가 특성에 해당된다. 마지막으로 생선의 길이 데이터에 포함된 각각의 값(예를 들어 25.4cm)이 샘플이다. 도미, 빙어 데이터 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29...

KHUDA 4th/머신러닝 기초 세션 2023. 7. 30. 16:44

이전 Prev 1 2 3 4 5 Next 다음

목록KHUDA 4th (35)

SYDev

티스토리툴바