강의 내용이 너무 많아서 2개로 나눕니다 Introduction to Vector Database (blog.sionic.ai) 모든 정보들을 임베딩 형태로 들고 있다. 그래서 ANN 검색이 필요하다! Brute Force 모든 벡터와 비교해서 찾는 방식 O(N) 검색 연산량 K-means nlist 개의 그룹으로 나누어서 해당 그룹에서 찾는 방식 검색할 때 가장 가까운 k개의 벡터를 뽑아서 메모리에 저장한다 차원의 저주 : 모든 검색 과정이 O(N)일 때 ANN의 사용이 연산량 및 메모리 접근법상 필연적 차원의 저주 문제를 피하기 위해 trade-off을 통해 O(n^(x))로 줄인 것이다. Indexing Inverted File(Traditional Approach) Graph-based HNSW(..