일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- OpenAI
- PCA
- regression
- gpt
- ChatGPT
- 머신러닝
- supervised learning
- Machine Learning
- Classification
- GPT-4
- 지도학습
- 분류
- 오블완
- LLM
- deep learning
- AI
- 회귀
- 해커톤
- LG Aimers
- LG
- 티스토리챌린지
- 딥러닝
- LG Aimers 4th
- Today
- Total
목록전체 글 (355)
SYDev

Git Git: Git이란 분산형 버전 관리 시스템(Version Control System)의 한 종류이며, 빠른 수행 속도에 중점을 둔다. 버전 관리: 파일변화를 시간에 따라 기록했다가 나중에 특정시점의 버전을 다시 꺼내올 수 있는 시스템이다. Git 기본 용어 원격 저장소(Remote Repository): 파일을 원격 저장소 전용 서버에서 관리, 여러 사람이 함께 공유하는 저장소이다. 로컬 저장소(Local Repository): 내 PC에 파일이 저장되는 개인 전용 저장소. 저장소를 새로 만들거나, 이미 존재하는 원격 저장소를 로컬 저장소로 복사해 올 수 있다. Working Tree(Working Directory): 작업자의 현재 시점. 파일 수정, 저장 등의 작업을 하는 Directory를..

자료구조와 알고리즘에 대한 기본적인 개념을 이해하고, 알고리즘의 성능분석 방법에 대해 알아보자. 자료구조 프로그램이란 데이터를 표현하고, 그렇게 표현된 데이터를 처리하는 것이다. 여기서 데이터의 표현은 데이터의 저장을 포함하는 개념이고, 이런 데이터의 저장을 담당하는 것이 자료구조이다. 쉽게 말해서 자료구조란, 데이터 값의 모임, 또 데이터 간의 관계, 그리고 데이터에 적용할 수 있는 함수나 명령을 의미한다. 자료구조 종류 선형구조 비선형구조 파일구조 단순구조 리스트 트리 순차파일 정수 스택 그래프 색인파일 실수 큐 직접파일 문자 문자열 자료구조와 알고리즘 알고리즘은 표현 및 저장된 데이터를 대상으로하는 '문제 해결 방법'을 뜻한다. 알고리즘은 자료구조에 의존적이다. 자료구조의 형태에 따라 알고리즘의 선..
CPU 언어인 ISA가 무엇인지 이해하고, 현대 CPU 주요 설계 방식인 CISC와 RISC의 정의와 차이점에 대해 알아보자. 명령어 집합 명령어 집합(instruction set) 혹은 명령어 집합 구조(ISA; Instruction Set Architecture): CPU가 이해할 수 있는 명령어들의 모음 ISA가 같은 CPU끼리는 서로의 명령어 이해 가능, ISA가 다르면 서로의 명령어 이해하지 못함. CISC CISC(Complex Instruction Set Computer): 복잡하고 다양한 종류의 가변 길이 명령어 집합을 활용하는 CPU 적은 수의 명령어로 프로그램을 실행할 수 있다. -> 메모리 공간 절약 하지만, 활용하는 명령어가 복잡하고 다양한 기능을 제공하는 탓에 명령어의 크기, 실행..

명령어를 빠르고 효율적으로 처리하는 대표적인 명령어 병렬 처리 기법인 명령어 파이프라이닝, 슈퍼 스칼라, 비순차적 명령어 처리에 대해 알아보자. 명령어 파이프라인 명령어 파이프라이닝: 동시에 여러 개의 명령어를 겹쳐 실행하는 기법 단계가 겹치지만 않으면 명령어를 동시에 처리할 수 있다. 파이프라인 위험 데이터 위험 데이터 위험(data harzard): 명령어 간 '데이터 의존성'에 의해 발생 명령어1: R2 레지스터와 R3 레지스터에 저장된 값을 더한 값을 레지스터 R1에 저장 명령어2: R1 레지스터와 R5 레지스터에 저장된 값을 더한 값을 레지스터 R4에 저장 -> 명령어2는 명령어1보다 먼저 실행될 수 없음 제어 위험 제어 위험(control harzard): 분기 등으로 인한 '프로그램 카운터의..
클럭과 코어, 스레드라는 개념을 학습하고, 빠른 CPU를 만드는 설계 기법인 멀티 코어와 멀티 스레드를 이해해보자. 클럭 클럭 속도가 높은 CPU는 빠르게 작동한다. 클럭 속도는 헤르츠(Hz) 단위로 측정한다. 1초에 100번 반복되면 100Hz 오버클럭킹(overclocking): 순간적으로 최대 클럭 속도를 강제로 끌어올려 성능을 향상시키는 기법 코어와 멀티코어 코어: CPU 내에서 명령어를 실행하는 부품 멀티코어 프로세서: 여러 개의 코어를 포함하는 CPU (dual-core, triple-core, quad-core, hexa-core ...) 스레드와 멀티스레드 스레드(thread)는 '실행 흐름의 단위'로, 하드웨어적 스레드와 소프트웨어적 스레드가 있다. 하드웨어적 스레드: 하나의 코어가 동시..

여러 특성을 사용한 다중 회귀에 대해 학습하고, 복잡한 모델의 과대적합을 막기 위해 릿지와 라쏘 회귀를 이용해보자. 다중 회귀 다중 회귀(multiple regression): 여러 개의 특성을 사용하는 선형 회귀 모델. 특성이 많으면 선형 모델은 강력한 성능을 발휘한다. 특성 공학(feature engineering): 기존의 특성을 사용해 새로운 특성을 만드는 일련의 작업 과정이다. 데이터 준비 import pandas as pd df = pd.read_csv('https://bit.ly/perch_csv_data') #pandas를 사용해 농어 데이터를 데이터프레임에 저장 perch_full = df.to_numpy() #데이터프레임에 저장된 csv 파일을 numpy 배열로 바꾸는 method pr..

k-최근접 이웃의 한계를 인지하고, 선형·다항 회귀 알고리즘으로 문제를 해결하자. k-최근접 이웃의 한계 chapter 03-1에서 다룬 모델로 길이가 50cm인 샘플의 무게를 예측해보자. import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 28.0, 28.7, 30.0, 32.8, 34.5, 35.0, 36.5, 36...

k-최근접 이웃 회귀를 이용하여 농어의 무게를 예측하는 모델을 만들어보자. k-최근접 이웃 회귀 지도 학습 알고리즘은 크게 분류와 회귀(regression)로 나뉜다. 회귀분석: 데이터 변수들 간에 함수 관계를 파악하여 통계적 추론을 하는 기술, 다시 말해서 독립변수에 대한 종속변수값의 평균을 구하는 방식 k-최근접 알고리즘은 회귀에도 작동 -> 최근접 샘플 k개의 평균으로 예측 타깃값 결정 농어의 무게를 예측하는 모델 데이터 준비 import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22...