꼰대코더

  • 홈
  • 태그
  • 방명록

2025/10/26 1

Transformer (GPT) 가장 쉽게 이해하기 - Part 2

GPT2 - Small 모델의 예 (GPT2 - Small) Multi Block과 하나의 Block 내에서의 Multi-head Attention 아래는 내 나름대로 궁금했던 점들을 해소한 후에 간소하게 정리한 다이어그램이다. 실질적으로는 중간 중간에 세부 처리가 들어가는 경우가 있다. 입력으로 "I am a" 있을 경우 GPT는 다음에 올 가장 적절한 단어(토큰)을 제시해야 한다. ・입력은 토큰으로 분리되고 다시 Embedding으로 768 차원으로 변환된다. (그 후엔 Positioning Embedding은 생략됐다.)・그 후 12개의 Block(GPT2-Small model의 경우)에 전달된다.(Dropout과 Normalization은 생략됐다.)・각 12개의 Block은 학습(Train)에 ..

data science/Artificial Intelligence 2025.10.26
이전
1
다음
더보기
프로필사진

꼰대코더

50대 c/c++ .net reactjs flutter deep learning 프로그래머

  • 분류 전체보기 (229)
    • 잡동사니 (3)
    • frontend (React) 개발 (19)
    • backend (Flask) 개발 (7)
    • backend (Go) 개발 (5)
    • opencv (22)
    • data science (66)
      • pandas (7)
      • python (29)
      • Artificial Intelligence (12)
      • signal processing (3)
      • AI Agents (15)
    • youtube english (46)
    • 뉘우스로 보는 일본 (7)
    • Programming Languages (6)
      • Swift (6)
    • Health (8)
      • 심전도(ECG) 분석 (7)
      • Sleep 분석 (1)
    • Commands (22)
      • conda (1)
      • docker (doccker-compose) (7)
      • Linux (6)
      • git + github (7)
      • tools (1)
    • 재미있는 수학 (4)
    • Web Security (7)

Tag

ㅜ, Docker, docker-compose, OpenCV, pandas, PDF, ECG, react #useEffect, dockerfile, word2vec,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/10   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

  • Flutter documentation
  • 더미 JSON 제공 서버
  • JSON 모델 자동변환
  • dart flutter package repositor…
  • 날씨정보 RESTAPI(끝에 영문 도시명을 지정)
  • 자바스크립트 레퍼런스
  • flutter cookbook
  • free icons
  • C#
  • 공짜 사진

티스토리툴바