본문 바로가기
인터넷, 통신, 플랫폼, 컨텐츠 산업

LLM의 추론 성능 향상을 위한 RAG 사용 시, 알아두어야 할 것들

by 뜨리스땅 2024. 6. 20.
728x90
반응형

 

 

https://www.youtube.com/watch?v=NfQrRQmDrcc&list=WL&index=1&t=45s

 

 

출처: 테디노트

 

뜨리스땅

 

 

https://tristanchoi.tistory.com/651

 

AI 모델 추론을 위한 VLLM이란 무엇인가? (feat. by Paged Attention)

1. LLM inference의 특징 chatGPT 이후로 LLM에 대한 연구가 많이 활성화되었고, 그에 따라 최근에는 LLM 서빙을 다루는 경우가 많아지고 있다. 최근 LLM모델이 매우 커짐에 따라 serving비용이 매우 증가하

tristanchoi.tistory.com

 

728x90
반응형

댓글