Whisper

AI Engineering Topic/AI 모델 배포

Whisper

Young_Metal 2023. 3. 18. 16:55

모든 데이터에서 최고의 성능을 뽑아낸다
Weakly supervised ASR : 음성 데이터 68만
96개 언어의 음성인식 지원, x-> en 지원
Self training 없이 결과를 달성

Whisper : 음성인식의 최종목적은

Out of Distribution data
LibriSpeech is like ImageNet, but for Speech
-Indomain 데이터로 관측
but Whisper는 Libri unseen으로 정확도를 높이겠다

인터넷에서 전사가 있는 데이터를 구축했다
다양한 화자, 환경

인식기가 만든거 같은 데이터는 버림
언어 검출기를 개발 ex 한국인이 한국어가 아닌 영어를 말하는 걸 검출해야한다

Hallucination 이 나온다.
한국어 8000시간 : low performance, low-resource languages, no speaker recognition

realtime이 아닌 끝나야 wav로 인식해서 학습

'AI Engineering Topic > AI 모델 배포' 카테고리의 다른 글

MiniGPT-4 Colab (0)	2023.07.04
3. MiniGPT-4 (0)	2023.06.29
[custom image-to-text generator] 2. deeplearning.ai의 short 강의 요약정리 with code (0)	2023.06.29
[custom image-to-text generation] 1. huggingface에서multimodal image-to-text 모델 선택기 (0)	2023.06.29
파이토치 2.0 torch.compile() 이 얼마나 빠른지 알아보자 (0)	2023.04.25

현재글Whisper

movie5

알고리즘먼데이2주차, 구름코딩테스트, 잔재미코딩, 랭체인코리아, 아직도멀었다, 알고리즘먼데이챌린지3주차, 공감은받고싶은데, 인프라백엔드, 탈탈털려버렸다, 알고리즘먼데이챌린지, 알고리즘먼데이3주차, 나는리뷰어다, 한빛미디어나는리뷰어다, 알고리즘먼데이출석부, 알고리즘먼데이해설, 너는몰라도되지만, 글또9기, 하고싶은말은많지만, 누구한테말하지, 알고리즘먼데이,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

movie5

Whisper

'AI Engineering Topic > AI 모델 배포' 카테고리의 다른 글

'AI Engineering Topic/AI 모델 배포'의 다른글

티스토리툴바

Whisper

'AI Engineering Topic > AI 모델 배포' 카테고리의 다른 글

'AI Engineering Topic/AI 모델 배포'의 다른글

관련글

티스토리툴바