파이토치 2.0 torch.compile() 이 얼마나 빠른지 알아보자

AI Engineering Topic/AI 모델 배포

파이토치 2.0 torch.compile() 이 얼마나 빠른지 알아보자

Young_Metal 2023. 4. 25. 13:53

출처 : https://discuss.pytorch.kr/t/accelerating-large-language-models-with-accelerated-transformers/1417

파이토치 2를 사용한 가속화된 생성 확산 모델(Accelerated Generative Diffusion Models with PyTorch 2) 🎉

PyTorch 공식 블로그에 게시된 Accelerated Generative Diffusion Models with PyTorch 2 글을 퍼왔습니다. 🙂 아래는 원문과 함께 DeepL이 번역한 내용입니다 - Translated with DeepL Accelerated Generative Diffusion Models with PyT

discuss.pytorch.kr

Introduction

생성모델의 경우 생성 루프 안에서 돌아가는 코드의 최적화가 생성속도를 높이는 주요 요인이 된다.

pytorch 2.0에서 compile과 빠른 attention 구현으로 생성속도를 높였다. 원래 xFormers를 실행하는 1.0버전의 토치와 2.0 버전의 토치를 비교해서

Optimized Attention

Diffusion 모델에서 Attention을 U-Net의 여러 트랜스포머 블록으로 사용하고 이 U-Net은 모든 샘플링 단계에서 실행되므로 속도를 줄이는 주요한 포인트다. 구현이 된 nn.MultiHeadAttention 은 처음에는 아래와 같이 쓰이지만 후에는

class CrossAttention(nn.Module):
    def __init__(self, ...):
        # Create matrices: Q, K, V, out_proj
        # 행렬을 생성합니다: Q, K, V, out_proj
        ...
    def forward(self, x, context=None, mask=None):
       # Compute out = SoftMax(Q*K/sqrt(d))V
       # Return out_proj(out)
       # out_proj(out) 반환
       …

아래와 같이 대체된다.

class CrossAttention(nn.Module):
    def __init__(self, ...):
        self.mha = nn.MultiheadAttention(...)
    def forward(self, x, context):
	return self.mha(x, context, context)

model = torch.compile(model)

동적 컴파일러

기본 동작으로 PyTorch는 내부적으로 TorchDynamo를 사용하여 코드를 컴파일하고 TorchInductor 3를 사용하여 코드를 더욱 최적화합니다

파이토치가 컴파일 할 수 없는 부분, graph break를 피해야 한다. 예전과 달리 graph break에 컴파일이 중단되지 않는다. 성능은 저하될 수 있다. 컴파일러가 지원하지 않는 라이브러리에서 함수를 지운다.

저작자표시 비영리 변경금지 (새창열림)

'AI Engineering Topic > AI 모델 배포' 카테고리의 다른 글

MiniGPT-4 Colab (0)	2023.07.04
3. MiniGPT-4 (0)	2023.06.29
[custom image-to-text generator] 2. deeplearning.ai의 short 강의 요약정리 with code (0)	2023.06.29
[custom image-to-text generation] 1. huggingface에서multimodal image-to-text 모델 선택기 (0)	2023.06.29
Whisper (0)	2023.03.18

현재글파이토치 2.0 torch.compile() 이 얼마나 빠른지 알아보자

movie5

랭체인코리아, 나는리뷰어다, 구름코딩테스트, 알고리즘먼데이해설, 인프라백엔드, 아직도멀었다, 잔재미코딩, 알고리즘먼데이챌린지, 너는몰라도되지만, 공감은받고싶은데, 알고리즘먼데이출석부, 누구한테말하지, 알고리즘먼데이, 한빛미디어나는리뷰어다, 탈탈털려버렸다, 글또9기, 알고리즘먼데이3주차, 하고싶은말은많지만, 알고리즘먼데이2주차, 알고리즘먼데이챌린지3주차,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

movie5