본문 바로가기

Embedding2

LLM의 추론 성능 향상을 위한 RAG 사용 시, 알아두어야 할 것들 https://www.youtube.com/watch?v=NfQrRQmDrcc&list=WL&index=1&t=45s  출처: 테디노트 뜨리스땅  https://tristanchoi.tistory.com/651 AI 모델 추론을 위한 VLLM이란 무엇인가? (feat. by Paged Attention)1. LLM inference의 특징 chatGPT 이후로 LLM에 대한 연구가 많이 활성화되었고, 그에 따라 최근에는 LLM 서빙을 다루는 경우가 많아지고 있다. 최근 LLM모델이 매우 커짐에 따라 serving비용이 매우 증가하tristanchoi.tistory.com 2024. 6. 20.
로봇 기술 탐구: 인공지능 용어 정리 새로운 개념들이 많아서 정리해보았습니다. 퍼셉트론(Perceptron) 1958 년 프랑크 로젠블럿이 제시한 인공 신경망의 초기 개념이다. 인간의 뉴런이 신호를 주고받는 방식에서 노드를 착안하여 사람의 신경망과 유사한 인공 신경망을 구축했다. 활성화 함수 (Activation Function) 입력된 데이터의 가중 합을 출력 신호로 변환하는 함수이다. 인공 신경망의 직전 Layer 의 가중치 합의 크기에 따라 활성화 (변환) 유무를 결정한다. 또한 신경망의 목적이나 Layer 의 역할에 따라 선택적으로 적용한다. 가중치 가중치는 인공 신경망을 구성하는 노드에 대한 중요도를 나타내며, 일반적으로 Weight 로 표시한다. 인공 신경망의 학습은 각 노드의 비중치를 업데이트하며 이루어진다. 인공신경망의 비용함.. 2022. 12. 30.