일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- Classification
- 지도학습
- 딥러닝
- 오블완
- supervised learning
- AI
- Machine Learning
- 해커톤
- regression
- gpt
- 티스토리챌린지
- deep learning
- PCA
- 머신러닝
- LLM
- OpenAI
- LG Aimers 4th
- LG
- GPT-4
- 분류
- ChatGPT
- LG Aimers
- 회귀
- Today
- Total
목록KHUDA 4th (35)
SYDev

넘파이로 데이터 준비 넘파이를 이용해서 이전보다 간편하게 데이터를 준비할 수 있다. np.column_stack() 및 훈련 데이터 준비 import numpy as np np.column_stack(([1,2,3], [4,5,6])) array([[1, 4], [2, 5], [3, 6]]) -> np.column_stack() 함수는 전달받은 리스트를 일렬로 세운 다음 차례대로 나란히 연결한다. 연결할 리스트는 파이썬 튜플(tuple)로 전달한다. 더보기 튜플은 리스트처럼 원소에 순서가 있지만 수정할 수 없다는 차이점이 있다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, ..

지도 학습과 비지도 학습 지도 학습(supervised learning): 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는 데 활용한다. 비지도 학습(unsupervised learning): 타깃 데이터 없이 학습한다. 따라서 입력 데이터에서 어떤 특징을 찾는 데 주로 활용한다. 지도학습에서 데이터와 정답을 입력(input)과 타깃(target)이라 부르며, 이 둘을 합쳐 훈련 데이터라 부른다. 훈련 세트와 테스트 세트 훈련 세트(train set): 모델을 훈련할 때 사용하는 데이터이다. 보통 훈련 세트는 크면 클수록 좋다. 테스트 세트(test set): 훈련된 모델을 평가할 때 사용하는 데이터이다. 보통 전체 데이터에서 20~30%를 테스트 세트로 사용하는 경우가 많다. 전체 ..

생선 분류 문제 생선의 특성인 '길이'와 '무게' 데이터를 가지고 생선 '도미'와 '빙어'를 분류하는 모델을 만들어보자. 용어 정리 분류(classification): 머신러닝에서 여러 개의 종류(혹은 클래스(class)) 중 하나를 구별해내는 문제를 이르는 말. 특성(feature): 학습 모델로 정답을 도출해내기 위해 고려하는 데이터 샘플(sample): 학습 데이터에 포함된 하나의 특징벡터 위 문제에서는 '도미'와 '빙어'가 각각 분류해야 하는 클래스이며, 생선의 길이와 무게가 특성에 해당된다. 마지막으로 생선의 길이 데이터에 포함된 각각의 값(예를 들어 25.4cm)이 샘플이다. 도미, 빙어 데이터 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29...