일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
Tags
- LG Aimers
- LLM
- 딥러닝
- 머신러닝
- regression
- PCA
- OpenAI
- GPT-4
- LG
- 해커톤
- ChatGPT
- AI
- gpt
- 회귀
- Machine Learning
- LG Aimers 4th
- 분류
- supervised learning
- 지도학습
- deep learning
- 티스토리챌린지
- 오블완
- Classification
Archives
- Today
- Total
목록2024/04/11 (1)
SYDev

데이터 엔지니어링 심화트랙 5주차 정리 내용 Chapter 29. 비지도 학습 29.1. 활용 사례 데이터 이상치 탐지: 데이터셋 내 다수의 값이 하나의 큰 그룹으로 군집화되고, 나머지 값은 몇몇 소그룹으로 군집화되는 경우 해당 소그룹을 추가 조사하여 이상치를 탐지할 수 있다. 토픽 모델링: 많은 양의 텍스트 문서를 사전에 학습하여 서로 다른 텍스트 문서 사이의 공통적인 주체를 도출할 수 있다. 29.2. 모델 확장성 29.3 k-평균 >>> from pyspark.ml.feature import VectorAssembler >>> va = VectorAssembler()\ ... .setInputCols(["Quantity", "UnitPrice"])\ ... .setOutputCol("features..
KHUDA 5th/Data Engineering
2024. 4. 11. 02:08