본문 바로가기
  • GDG on campus Ewha Tech Blog

3-2기 스터디/MLOps7

[8주차] Data Management Full Stack Deep Learning 강의를 듣고 정리한 내용입니다. Common Data Management Path for Deep Learning 딥러닝 과정 중에는 가지고 있는 데이터를 GPU 옆의 local filesystem에 옮기는 작업이 필요하다. 데이터를 train가능한 형태로 옮기는 방법은 프로젝트나 회사마다 다르다. 예를 들면: train your images on ImageNet, and all the images are just S3 URLs -> simply download them over to the local filesystem. a bunch of text files -> use Spark to process them on a cluster and Pandas da.. 2022. 6. 29.
[7주차] Troubleshooting Fullstack Deeplearning 강의를 듣고 정리한 내용입니다. https://fullstackdeeplearning.com/spring2021/lecture-7/ 딥러닝 모델 문제 해결이 어려운 이유 버그가 존재하는지 알아차리기 어렵다. Data, Model, Infrastructure 등 모델 성능을 떨어뜨리는 원인이 다양함 hyperparameters and dataset makeup에 성능이 민감함 모델 성능이 낮은 이유 Implementation bugs : Most DL bugs are invisible Models are sensitive to hyperparameters (learning rate varies a lot by hyperparameters) Data-Model fit.. 2022. 6. 21.
[5주차] ML Projects Lecture 5 | ML Projects Full Stack Deep Learning 5강을 듣고 정리한 글입니다. 영어 강의라서 해석이 모호한 부분은 강의 내용을 영어 그대로 인용했습니다. 5강에서는 머신러닝 프로젝트를 하기 위한 필요한 모든 것에 대해 다룹니다. 1. Why do ML projects fail? AI 프로젝트의 85%는 실패한다. ML 프로젝트는 대부분 “RESEARCH” 프로젝트이기 때문에 100%의 성공률을 목표로 해서는 안된다. ML 프로젝트는 실패하기 쉬운데, 이유는 다음과 같다. Many ML projects are technically infeasible or poorly scoped. 기술적으로 불가능하다. Many ML projects never leap product.. 2022. 5. 31.
[4주차] Transformers Full Stack Deep Learning 1. Transfer Learning in Computer Vision 이미지 데이터 1 만장으로 새 분류→ 과적합 발생할 수 있음 → fine tuning → Resnet-50가 좋은 성능을 보일 것 큰 데이터로 학습 시킨 large model (=pretrained model) 학습 되어있는 모델을 가져와 새로운 레이어를 더하거나 교체해 학습 → 더 적은 데이터로 빠르고 정확하게 학습 가능전이 학습이란? Model zoo pretrained-model tensorflow, pytorch 둘 다 사용 가능 2. Embeddings and Language Models 자연어 처리에서 실제 input은 단어이지만, 딥러닝에서는 벡터임 단어를 벡터로 어떻게 바꿀까.. 2022. 5. 17.
[3주차] RNNs Full Stack Deep Learning 강의를 듣고 정리한 내용입니다. 📌Sequence Problems Sequence Problem 종류 - one-to-many: input -> single value, output -> sequence인 경우 - many-to-one: input -> sequence, output -> single value인 경우 -many-to-many: input -> sequence, output -> sequence인 경우 Sequence Problem 예시 Why not use feedforward networks instead? Problem 1: Variable Length Inputs 모든 sequence에 padding을 추가해 max length와 동일한.. 2022. 5. 10.
[2주차] CNNs 2주차에는 Convolutional neural network와, computer vision tasks에 대해 공부했습니다. Convolution ▶ Image 데이터에 대해 Fully Connected layer를 사용할 경우, Flattening image and fully connecting every node : Too many parameters. Only few regions are important in telling what is in the image. FC cannot understand the image as the same, if slight translation is made. Translation invariance is what we need for computer visio.. 2022. 5. 3.