일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- 분류
- LLM
- regression
- 머신러닝
- 딥러닝
- deep learning
- ChatGPT
- PCA
- LG Aimers
- 오블완
- GPT-4
- supervised learning
- gpt
- OpenAI
- 티스토리챌린지
- AI
- LG
- LG Aimers 4th
- 회귀
- 해커톤
- 지도학습
- Classification
- Machine Learning
- Today
- Total
목록2024/04 (17)
SYDev

데이터 엔지니어링 심화트랙 5주차 정리 내용 Chapter 29. 비지도 학습 29.1. 활용 사례 데이터 이상치 탐지: 데이터셋 내 다수의 값이 하나의 큰 그룹으로 군집화되고, 나머지 값은 몇몇 소그룹으로 군집화되는 경우 해당 소그룹을 추가 조사하여 이상치를 탐지할 수 있다. 토픽 모델링: 많은 양의 텍스트 문서를 사전에 학습하여 서로 다른 텍스트 문서 사이의 공통적인 주체를 도출할 수 있다. 29.2. 모델 확장성 29.3 k-평균 >>> from pyspark.ml.feature import VectorAssembler >>> va = VectorAssembler()\ ... .setInputCols(["Quantity", "UnitPrice"])\ ... .setOutputCol("features..

경희대학교 유인태 교수님의 컴퓨터네트워크 수업을 기반으로 정리한 글입니다. 라우팅 개념과 정적 라우팅 구성 거리 벡터 라우팅 프로토콜(Distant Vector Routing Protocol) 라우팅 테이블을 자신과 직접 연결된 장치들에 전송한다. 네트워크의 변화가 없어도 무조건 라우팅 정보의 전송이 이뤄진다. -> 네트워크 규모가 커지면 업데이트 양이 증가하는 단점. 소규모 네트워크에 적합 토폴로지가 커지면 수렴에 상당한 시간이 소요될 수 있음 -> 수렴(convergence) 동일한 라우팅 프로토콜을 사용하는 라우터들이 같은 라우팅 정보를 가지게 되는 상태 링크 상태 라우팅 프로토콜(Link State Routing Protocol) 다익스트라(Dijkstra) 혹은 최단 경로 우선(SPF; Shor..

경희대학교 유인태 교수님의 컴퓨터네트워크 수업을 기반으로 정리한 글입니다. IPv4 32bits로 정의된 IPv4주소 -> 8bits씩 나누어 4개의 octets(8비트, 바이트와 같은 표현)로 표현 4개의 octets는 4개의 10진수로 변환 -> 이들을 구두점(.)으로 구분하여 표현 11111111 = 128 + 64 + 32 + 16 + 8 + 4 + 2 + 1 = 255 10101000 = 128 + 0 + 32 + 0 + 8 + 0 + 0 + 0 = 168 00001010 = 0 + 0 + 0 + 0 + 8 + 0 + 2 + 0 = 10 00000001 = 0 + 0 + 0 + 0 + 0 + 0 + 0 + 1 = 1 11111111.10101000.00001010.00000001 -> 255.1..

자바 애너테이션Java Annotation: 자바로 작성한 코드에 추가하는 표식, 보통 @기호 사용메타 데이터로 사용하는 경우가 가장 많음@Override: 선언된 메서드가 오버라이드 됨@Deprecated: 더 이상 사용되지 않음@SuppressWarnings: 컴파일 경고를 무시함 <h2 data-ke-size="siz..

경희대학교 컴퓨터공학부 김정욱 교수님의 컴퓨터 구조 강의 내용을 기반으로 한 정리글 Compiled MIPS Code Examples program variables에 registers 할당 procedure code 작성 호출되면서 preserve registers Swap Function void swap(int v[], int k) { int temp; temp = v[k]; v[k] = v[k + 1]; v[k + 1] = temp; } 1. Allocate registers to program variables v[], k -> $a0, $a1에 저장 temp -> $t0 2. Produce code for the body of the procedure swap: sll $t1, $a1, 2#k..

경희대학교 컴퓨터공학부 김정욱 교수님의 컴퓨터 구조 강의 내용을 기반으로 한 정리글 Explanation of 32 Registers $zero: contains 0 value $a0 ~ $a3: function argument $v0, $v1: return values $t0 ~ $t9: temporary register $s0 ~ $s7: saved registers(preserve) $gp: global pointer (정적 데이터 접근, const value같은) $sp: stack pointer (stack에서 현위치) $fp: frame pointer (stack의 first item을 point) $ra: 이전 함수의 주소를 저장 Supporting Procedures in Computer ..

데이터 엔지니어링 심화트랙 4주차 정리 내용 6부에서는 스파크에서 제공하는 고급 분석 및 머신러닝을 위한 다양한 API를 다룰 예정 Chapter 24. 고급 분석과 머신러닝 개요 6부에서 다룰 스파크 고급 분석 도구는 다음과 같다. 데이터 전처리: 데이터 정제 및 피처 엔지니어링 지도 학습(supervised learning) 비지도 학습(unsupervised learning) 추천 엔진(recommendation learning) 그래프 분석(graph analytics) 딥러닝(deep learning) 24.1. 고급 분석 고급 분석: 데이터 기반의 인사이트를 도출 -> 핵심 문제 해결 or 예측 or 추천을 하기 위한 기술 머신러닝에서 일반적으로 활용되는 작업 features 기반 label ..