대규모 언어 모델, 핵심만 빠르게! 챌린지 5/5
1장. 머신러닝과 기초 2장. 언어 모델링 기초 3장. 순환 신경망 4장. 트랜스포머 5장. 대규모 언어 모델 대규모의 의미 파라미터 수 문맥 크기 최적화 기법 대규모 데이터셋 계산 인프라 다음 …
쓸만한 걸 쓰는 개발자 블로그
1장. 머신러닝과 기초 2장. 언어 모델링 기초 3장. 순환 신경망 4장. 트랜스포머 5장. 대규모 언어 모델 대규모의 의미 파라미터 수 문맥 크기 최적화 기법 대규모 데이터셋 계산 인프라 다음 …
재입고 알림 봇 만들기(python + telegram bot)는 내 블로그에서 가장 많은 사람들이 찾는 포스트이다. 그만큼 많은 사람들이 필요로 하는 기능인 것 같다. 글을 올린지 오래됐고 인터넷 상황도 많이 바뀌어서 간단한 …
1장. 머신러닝과 기초 2장. 언어 모델링 기초 3장. 순환 신경망 4장. 트랜스포머 트랜스포머 모델의 유형 인코더-디코더 기반 구조 : 기계 번역 인코더 기반 구조 : 분류 디코더 기반 구조 …
1장. 머신러닝과 기초 2장. 언어 모델링 기초 RNN은 복잡하고 발전 과정상 다양한 형태가 있다보니 이해가 어려웠던 경험이 있어 이번 장은 부담이 됐는데 다행히(?) 짧게 끝났다. 3장. 순환 신경망 트랜스포머가 …
1장. 머신러닝과 기초 2장. 언어 모델링 기초 단어와 문서를 수치형 포맷으로 변환하는 방법 기초적인 언어 모델링 카운트 기반 모델 언어 모델의 성능을 측정하는 방법 용어 정의, 함수 정의 BoW(Bag of …
새로 나온 책에 챌린지가 떴길래 바로 신청을 해봤다. 책은 대규모 언어 모델, 핵심만 빠르게! 이고 챌린지는 인프런 에서 진행. 요새 책과 챌린지, 인강이 결합하는 방식이 눈에 많이 띈다. 머신 …
요약 트윌리오(Twilio)라는 미국의 SaaS 기업 창업자인 제프 로슨(Jeff Lawson)이 쓴 책이다. DT(Digital Transformation)에 있어서 개발자의 중요성과 개발자를 잘 사용하기 위해서 알아야 할 것들을 다룬다. 개발자를 리딩해 프로덕트를 만들어야 하는 관리자, …
한 달 만에 올린다. 일정관리를 안 하니 한없이 늘어지는 Magic.. 이번 장에서는 이미지 분류 문제에 적용할 수 있는 CNN(Convolution Neural Network)에 대해 학습했다. 과정에서 패션 MNIST 데이터 세트를 샘플로 다루었다. …
이번 장에서는 인공신경망을 이용한 딥러닝에 대해서 배웠다. 이걸론 혼공은 마지막이지만.. 책은 끝까지 봐야지 😊 노트북 링크 : https://github.com/samsee/hgmldl2023 인공 신경망 TensorFlow and Keras 미션 1: 7장-1절 확인 문제 심층 신경망 …
이번 장은 비지도 학습(Unsupervised Learning) 중 군집 알고리즘과 차원 축소에 대해 배웠다. 군집 알고리즘 k-평균 미션 : k-평균 알고리즘의 작동 방식 이를 설명한 그림 주성분 분석