AI Engineering Topic/AI 모델 배포 6

MiniGPT-4 Colab

https://colab.research.google.com/gist/movie5/fe356735fb45c2e037422310e94659d1/use_minigpt4.ipynb use_minigpt4_final.ipynb Run, share, and edit Python notebooks colab.research.google.com 공식 github에서 제공하는 colab은 버전 문제, LLaMA 모델 다운받는 문제로 한번에 사용하기 힘들다. 그래서 이번에 Colab에서 requirements만 다운받으면 실행할 수 있도록 버전을 수정한 코드를 작성했다.

파이토치 2.0 torch.compile() 이 얼마나 빠른지 알아보자

출처 : https://discuss.pytorch.kr/t/accelerating-large-language-models-with-accelerated-transformers/1417 파이토치 2를 사용한 가속화된 생성 확산 모델(Accelerated Generative Diffusion Models with PyTorch 2) 🎉 PyTorch 공식 블로그에 게시된 Accelerated Generative Diffusion Models with PyTorch 2 글을 퍼왔습니다. 🙂 아래는 원문과 함께 DeepL이 번역한 내용입니다 - Translated with DeepL Accelerated Generative Diffusion Models with PyT discuss.pytorch.kr Int..

Whisper

모든 데이터에서 최고의 성능을 뽑아낸다 Weakly supervised ASR : 음성 데이터 68만 96개 언어의 음성인식 지원, x-> en 지원 Self training 없이 결과를 달성 Whisper : 음성인식의 최종목적은 Out of Distribution data LibriSpeech is like ImageNet, but for Speech -Indomain 데이터로 관측 but Whisper는 Libri unseen으로 정확도를 높이겠다 인터넷에서 전사가 있는 데이터를 구축했다 다양한 화자, 환경 인식기가 만든거 같은 데이터는 버림 언어 검출기를 개발 ex 한국인이 한국어가 아닌 영어를 말하는 걸 검출해야한다 Hallucination 이 나온다. 한국어 8000시간 : low perfor..