3-2기 스터디78 [기술 면접 대비] 4주차 - 데이터베이스 1. 키 종류에 대해 설명해주세요 슈퍼키(Super Key) : 유일성을 만족하는 키 복합키(Composite Key) : 2개 이상의 속성(attribute)를 사용한 키 후보키(Cnadidate Key) : 유일성과 최소성을 만족하는 키. 기본키가 될 수 있는 후보이기 때문에 후보키라고 불린다. 기본키(Primary key) : 후보키에서 선택된 키. NULL 값이 들어갈 수 없으며, 기본키로 선택된 속성은 동일한 값이 들어갈 수 없다. 대체키(Surrogate key) : 후보키 중에서 기본키로 선택되지 않은 키 외래키(Foreign Key) : 어떤 테이블(Relation)간의 기본키를 참조하는 속성이다. 테이블들 간의 관계를 나타내기 위해서 사용된다. 2. 인덱스란 무엇이고, 어떻게 동작 하나요.. 2022. 5. 2. [5주차] NLP Chapter 5.2 RNN이란 ~ 6. 게이트가 추가된 RNN 5.3. RNN 구현 Time RNN Truncated BPTT 방식을 적용하여 T개씩 처리 5.4. 시계열 데이터 처리 계층 구현 RNNLM (RNN Language Model) RNN을 사용한 언어 모델 *Time Softmax with Loss 계층에서는 데이터 1개당 평균 손실을 구함 5.5. RNNLM 학습과 평가 Perplexity : $L = -{1\over N}\sum\sum t \cdot logy \; , \quad perplexity=e^L$ 확률의 역수로, 다음에 취할 수 있는 선택사항의 수(작을수록 좋음), 기하평균 분기 수 RNNLM 학습 미니배치를 순차적으로 만들기 모델의 순전파, 역전파 호출 optimizer로 가중치 갱신 perplexity 구하기 Chapter6. 게이트가 .. 2022. 5. 2. [4주차] NLP Chapter 4. word2vec 속도 개선 ~ 5.2 RNN이란 이 포스트는 "밑바닥부터 시작하는 딥러닝2 - 파이썬으로 직접 구현하며 배우는 순환 신경망과 자연어 처리 (한빛미디어, 사이토 고키 지음)" 책을 기반으로 공부해서 정리한 내용이다. Chapter4: word2vec 속도 개선 4.1 word2vec 개선(1) & 4.2 word2vec 개선(2) 앞 장에서 구현한 간단한 word2vec의 CBOW 모델의 문제점: 말뭉치 크기가 많이 크다면 그에 따라 계산량도 굉장히 많아진다 (아래와 같은 예시) 입력층의 원핫 표현과 가중치 W_in의 곱 계산 단어 임베딩 or 단어의 분산 표현 (통계기반기법-> distributional representation, 신경망 추론기반기법 -> distributed representation) - 순전파 & 역전파 - 미니.. 2022. 5. 2. [3주차] NLP Chapter3. word2vec Chapter3. word2vec 3.1. 추론 기반 기법과 신경망 통계 기반 기법의 문제점 : 대규모 말뭉치를 다룰 때 현실적으로 계산하기 어려움, 말뭉치 전체의 통계를 1회만에 처리함(배치 학습) 추론 기반 기법의 이점 : 미니배치로 학습해서 어휘 수가 많아 계산량이 큰 작업을 처리하기 어려운 경우에도 신경망을 학습시킬 수 있음, 병렬 계산 가능(미니배치 학습) 공통점 : 분포 가설에 기초, ‘단어의 동시발생 가능성을 얼마나 잘 모델링 하는가’가 중요 3.2. 단순한 word2vec CBOW (Continuous bag-of-words) $W_{in}$의 각 행이 각 단어의 분산 표현에 해당 $W_{out}$에 단어의 의미가 인코딩 된 벡터가 저장됨(열 방향) word2vec에서는 최종적으로 이용하는.. 2022. 4. 22. [기술 면접 대비] 3주차- 네트워크 1. OSI 7계층과 각 층에 대한 설명 OSI 7계층은 네트워크 프로토콜 디자인과 통신을 계층으로 나누어 설명한 것입니다. 응용 계층, 표현 계층, 세션 계층, 전송 계층, 네트워크 계층, 데이터링크 계층, 물리 계층으로 이루어져 있습니다. osi 7계층은 이론적인 모델이고, 실제로 데이터를 전송하는 데 사용되는 모델은 tcp/ip 모델이라고 한다. osi는 통신 전반에 대한 표준이고, tcp/ip는 데이터 전송기술에 특화되어 있다. 각각이 헤더를 붙여 캡슐화했기 때문에 문제가 발생했을때 빠르게 대응할 수 있다. 7계층-응용 계층(Application Layer) HTTP, DNS등을 이용해 사용자가 네트워크에 접속할 수 있도록 해주는 계층 6계층-표현 계층(Presentation Layer) 데이터를.. 2022. 4. 17. [3주차] 클린코드 7~10장 정리 🚩 7장 오류처리 7장에서는 오류처리를 처리를 하는 기법과 고려사항을 소개한다. 사실 과제나 개인 프로젝트를 하는데 오류를 따로 처리한적이 많지 않았던것 같다. 특히나 java 언어를 쓸때 예외처리를 catch, throw과 같은 코드를 종종 배우는 과정에서 사용했던건 기억나는데 실제로 어떤 프로그램을 혼자 만들때는 잘 쓰지 않았다.. 이 장에서도 돌아가기만 하면 되는 방식으로 코드를 작성했던 방식이 자각이 되었다. 너무 시간이 촉박한 상황에서 코딩해야 하는때가 대부분이었다는것과 예외처리를 하는것에 대한 중요성을 크게 못느꼈다는게 요인이 아니었다 싶다. 하지만 실제로 서비스되는 프로그램의 코드를 짜게된다면 예외처리를 깔끔하게 잘하는것이 정말 중요할것같다. 오류를 처리하는 방법 명시적으로 많은 오류코드를 .. 2022. 4. 15. 이전 1 ··· 7 8 9 10 11 12 13 다음