LG Aimers 4th/Phase 1. AI Essential Course
[LG Aimers 4th] Module 3. Machine Learning 개론
시데브
2024. 1. 15. 18:22
Part 1. Introduction to Machine Learning
Part 2. Bias and Variance
Part 3. Recent Progress of Large Language Models
GPT-3
- Generative Pre-trained Transfomer
- GPT-3부터 소스코드를 비공개
Instruct GPT(GPT-3.5)
- 모델에게 자연어로 '직접적으로' 명령 제시 가능
- RLHF(Reinforcement Learning from Human Feedback)
- SFT(Supervised fine-tuning) -> RM (Reward Model) training -> RL via PPO
ChatGPT
- Instruct GPT에 대화 UI를 붙인 형태
- 빠른 속도로, 주기적으로 문제점들이 개선되고있다.
GPT-4
- A large multimodal language model: 이미지, 텍스트가 인풋으로 주어졌을 때, 적절한 텍스트 아웃풋 반환
- No technical detatils
- context length: 나눈 대화 중에서 몇 개의 토큰까지를 고려해서 output을 내는지 나타냄 -> GPT-4: 32768 tokens
Limitation
- Hallucination: 없는 사실을 만들어내는 errors
- Prompt Engineering좋은 질문이 필요함
Anthropic Claude
- Anthropic AI: OpenAI 퇴사자들이 설립
- ChatGPT와 유사한 task
Google Bard
- 구글 검색 기능과 연결됨
Google PaLM
- Google Pathway LM system
- 5000억 parameter 모델도 구동 가능
Meta OPT & LLaMA
- Open Pretrained Transfomer -> open source 형태
- Large Language Model Meta Ai
Self-instruct Tuning on LLaMA
- Instruction dataset(사람이 지시하고 그 지시를 이행한 데이터셋)이 필요
- 해당 데이터셋을 GPT에서 가져오는 방식
- LMsys Vicuna: LLaMA 모델, ShareGPT.com 사이트에서 50만개의 데이터 가져와 학습
참고자료
728x90
반응형