본문 바로가기
인터넷, 통신, 플랫폼, 컨텐츠 산업

생성형 AI의 기술 트렌드

by 뜨리스땅 2024. 4. 13.
728x90
반응형

1. 빠른 기술 확산의 속도: 비즈니스 전략의 중요성 확대

 

대형언어모델은 대량의 데이터를 대규모 모델로 학습하기 때문에 학습과 파인튜닝(특정 업무를 수행하기 위해 관련 데이터를 추가 학습하는 과정), 추론(학습된 모델을 사용하는 과정)에 많은 시간과 비용이 든다. 그래서 챗GPT 같은 모델을 구축하기도 어렵고 이를 기반으로 다양한 서비스를 하려고 하면 서버 부족 등 한계가 있었다.

 

 

그러나 최근 빅테크와 스타트업을 중심으로 다수의 대형언어모델이 개발되고 있다. 유사한 데이터셋과 아키텍처를 사용하는 이들 모델들은 정확도 측면에서 ‘GPT 4’만큼은 아니지만 상용화 가능한 수준이고 안전성, 속도 등에서는 더 뛰어난 측면도 있다. 마이크로소프트 등 클라우드 업체들도 다양한 모델을 지원해 사용자들이 원하는 모델을 선택해서 사용할 수 있게 제공하고 있다.

 

또한 다양한 오픈소스 모델이 등장하고 있으며, 특히 메타의 오픈소스 전략에 따라 ‘GPT 3.5’ 급의 성능을 가진 모델을 구하기 쉬워지고 있다. 메타에서 발표한 ‘LLaMA 2’는 GPT 3.5 급의 정확도를 가진 것으로 평가되는데, 이를 기반으로 다양한 주체들이 개발에 참여하여 성능 및 보안 등의 기능을 발전시키고 있다. 최근에는 매개변수가 1800억개나 되는 Falcon-180B (UAE 기술혁신협회에서 개발)이 오픈 소스로 공개되어 커뮤니티에서 가장 높은 점수를 받기도 했다.

 

 

특히 데이터 중심의 접근법이 확산되면서 추론에서 연산 부담이 줄어들고 있다.

 

메타의 ‘LLaMA 2’는 ‘GPT 3.5’ 대비 매개 변수가 작지만 학습 데이터의 양을 크게 늘려 유사한 정확도를 구현했다. 오픈 AI 진영에서도 ‘GPT 3.5’ 파인튜닝을 통해 특정 영역에서 매개 변수가 10배 이상인 ‘GPT 4’ 급 성능을 구현하는 기법을 공개했다. 매개 변수가 적으면 추론 연산 부담이 줄어들어 상용화에 유리하다.

 

 

이와 함께 특정 분야에 적용 가능한 소형 언어모델도 확산되고 있다. 소형 언어모델은 매개 변수를 줄이는 대신 질 좋은 데이터를 학습시키고 파인 튜닝하는 방식으로 성능을 개선시키는데 특정 분야에 한정되어 있지만 훈련 비용과 시간을 줄이고 정확도를 높일 수 있다. 신속하고 저렴하게 만들 수 있는 데다 보유한 데이터를 활용해 맞춤형으로 구축할 수 있기 때문에 기업에서 도입하기에도 유리하다. 다양한 소형 언어모델의 등장으로 AI 기술을 상용화하기가 좀더 용이해졌다.

 

 

상용화 가능한 수준의 기술을 확보하기가 용이해지고 추론 비용이 하락함에 따라 기술 자체보다는 이를 적용해 제품화하는 기업의 비즈니스 전략이 점차 중요해질 전망이다.

 

얼마나 많은 고객군과 질 좋은 데이터를 확보하고 있는지, 어떻게 사용자 니즈를 만족시키고 빠른 제품화로 시장을 선점할 수 있는지, 바뀌는 기술과 시장 상황에 얼마나 민첩하게 대응할 수 있는지, 저작권 등 법적 이슈를 얼마나 잘 대응할 수 있는지 등이 관건이 될 전망이다.

 

 

예를 들어 성공적인 상용화 사례로 꼽히는 어도비의 파이어플라이는 출시 이후 20억장의 이미지를 생성해 당초 예상을 크게 뛰어넘었다. 텍스트를 이미지로 바꾸어주는 기술은 이미 상용화되어 있었다. 그러나 파이어플라이는 기존 포토샵 등 이미 방대한 고객군을 가진 제품에 통합했고 사용자가 텍스트 프롬프트만 넣으면 편리하게 사용할 수 있도록 했으며 라이선스를 확보한 이미지로만 학습(2.7억개 이상의 이미지를 보유하고 있는 Adobe Stock 등을 이용)하고 저작권 문제가 발생할 경우 보상해 준다는 정책을 제시해 사용자가 저작권 문제로부터 벗어날 수 있게 하였다.

 

 

24년에 주요 기업들의 생성 AI 제품이 쏟아질 것으로 예상된다. 마이크로소프트 MS 코파일럿처럼 기존 제품에 생성 AI 기능을 통합해 고객을 확보하거나 판매 가격을 인상시키는 전략부터 개인, 기업용 AI 어시스턴트 도입을 통한 생산성 개선 및 소비자 효용 증대, 원가 절감, 컨텐츠 생성 플랫폼 제공 등 다양한 전략이 준비되고 있다. 이들 전략의 설득력에 따라 기업 가치의 차별화가 예상된다.

 

 

 

 

 

2. 예상을 상회할 응용 서비스의 성장: 추론 중요성 확대 예상

 

상용화 가능한 수준의 기술을 확보하기가 용이해진 가운데 주요 기업들의 경쟁적인 제품화로 생성 AI 어플리케이션은 급격히 성장할 것으로 예상된다. 관련해서 추론 비용을 줄일 수 있는 소프트웨어와 전용 반도체의 중요성이 부각될 전망이다.

 

 

챗GPT 이후 글로벌 주요 기업들은 앞다퉈 생성 AI 전략을 발표하고 있다. 이는 생성 AI 기술을 도입해 판매 가격을 인상하거나 점유율을 확대할 수 있기 때문이기도 하지만, 도입하지 않으면 경쟁에서 뒤처질 수 있기 때문이다.

 

주가 흐름도 이를 반영하고있다. 포토샵에 생성 AI를 도입한 신제품 파이어 플라이가 좋은 반응을 얻자 어도비의 실적 추정치와 주가는 상승했다. 언어학습 플랫폼 업체인 듀오링고는 역할극 등의 기능을 추가하면서 기존 제품 가격을 최대 50% 인상하겠다고 밝히면서 수혜주로 부각되었지만 과제 도움 서비스 업체인 체그는 챗GPT로 인해 사용자들의 관심이 줄었다는 언급에 주가가 폭락하였다.

 

 

실제 사용자가 자연어로 물어보면 답변해주는 AI 어시스턴트와 같은 기능은 대부분의 업체들이 출시할 계획이다.

 

특히 주요 기업의 출현으로 생성 AI 적용 범위가 획기적으로 넓어질 전망이다. 주요 기업은 스타트업과 달리 1) 고객 기반이 방대하며, 2) 편리한 이용 환경을 제공할 수 있고, 3) 저작권 등의 법적 이슈를 보완할 수 있다는 점에 기인 한다.

 

 

또한 생성 AI 기술 특성상 재생산의 비용이 제로에 가깝게 하락하기 때문에 급격한 물량 증가가 예상된다. 과거 인터넷/모바일 혁명으로 비디오 등 컨텐츠 제조 비용이 급감했듯 생성 AI 기술의 도입으로 컨텐츠 제조 비용은 급감하고 이를 생성해 내는 플랫폼의 가치가 확대될 전망이다.

 

어플리케이션의 확대와 함께 추론의 효율성이 점차 중요해질 전망이다. 현재 학습용 반도체 시장을 장악하고 있는 엔비디아가 추론 시장에서도 경쟁 우위를 지켜낼 지 주목할 필요가 있다.

 

 

 

 

 

3. 빠르게 발전하는 기술: 시장 규모와 경쟁 구도의 급변 가능성

 

인터넷/모바일 기술과 차별화되는 생성 AI 기술의 특징은 기반 기술 자체가 빠르게 발전 중이라는 점이다. 생성 AI 기술은 답변의 정확도/신뢰도 개선, 멀티 모달 모델로의 발전, 도구 사용, Agent간 상호 작용을 통한 발전 등의 방향으로 이루어지고 있으며 그 진전 정도에 따라 AI가 할 수 있는 일의 범위와 신뢰도, 선발 업체의 경쟁 우위 정도 등이 달라질 수 있다.

 

 

생성 AI는 기본적으로 다음에 나올 확률이 가장 높은 단어를 내 놓기 때문에 답변의 정확도가 떨어질 수 있다. 이에 현재는 상대적으로 정확도의 요구가 낮은 컨텐츠 생성, 흥미 위주의 대화, 브레인 스토밍 등의 용도에 사용되고 있지만, 정확도가 일정 수준을 넘어서면 부가가치가 높은 전문적인 분야에서도 사용할 수 있게 된다.

 

이를 위해 오픈 AI에서는 사람이 직접 피드백을 주고 이를 통해 모델을 강화학습시키는 RLHF를 통해 정확도를 개선시켰고, 최근 오픈 AI 출신이 설립한 스타트업인 앤트로픽은 사람의 피드백을 AI의 피드백으로 대체하는 RLAIF이라는 기술로 모델의 안전성을 획기적으로 개선시킬 계획이다.

 

학습하는 데이터의 양을 늘리거나 원하는 영역에 대해 추가 학습하는 것도 정확도를 개선시킬 수 있는 방법이다. 입력/출력하는 토큰(단어)수를 늘림으로써 AI가 맥락을 좀 더 잘 이해하고 사용자가 원하는 답변을 내 놓을 수 있도록 모델을 조정할 수도 있다. 모델이 사용자에 대한 데이터를 축적할 수 있도록 벡터 데이터베이스와 같은 기능을 통해 메모리 기능을 개선시키는 것도 답변의 완성도를 높이는 방법이다.

 

 

AI가 도구를 사용하는 기술(툴포머, Toolformer)도 발전하고 있는데, 외부 데이터 베이스를 활용해 성능을 개선시키고 필요한 업무를 대신 수행할 수 있다. 오픈 AI의 플러그인 기능이 대표적인데, 챗GPT를 주요 어플리케이션에 연결해 해당 영역의 데이터를 활용하고 업무를 수행한다. 플러그인 중 하나인 코드 인터프리터는 AI가 직접 코딩을 하고 해당 코드를 실행까지 할 수 있어 데이터 분석 등 다양한 기능을 수행할 수 있다.

 

 

생성적 에이전트(Generative Agents) 기술도 주목할 필요가 있다. 언어 모델로 다양한 AI Agent를 만든 뒤 이들끼리 서로 상호 작용하면서 복잡한 업무를 수행하는 기술이다.

 

23년 8월 공개된 ‘메타 GPT’는 제품 매니저, 개발자, 리뷰어 등 7개의 에이전트를 만들어 게임 소프트웨어를 개발하도록 했는데 이들 Agent들은 각자의 역할을 기반으로 서로에서 조언도 하고 피드백도 주면서 업무를 진행시켜 나갔다.

 

복잡한 업무는 사람이 단계별로 지시하거나 직접 가이드를 줘야 하는데 메타 GPT에서는 AI Agent가 이를 대신하기 때문에 개발 속도가 훨씬 빨라질 수 있을 뿐 아니라 그 성과도 크게 개선될 잠재력이 있다.

 

 

 

 

4. 어플리케이션: AI 비서, 사용자 트래픽에 주목

 

어떤 서비스가 킬러 어플리케이션이 되고 누가 그 시장을 장악할 지는 향후 2~3년 내에 결정될 것으로 예상된다. 현재 몇 가지 시그널은 나타나고 있는데 완전히 개인화된 AI 비서가 새로운 플랫폼으로 부상할 가능성이 있고, 단순한 생산성 개선 서비스는 빠르게 커머디티화되고 ‘재미’ 등 차별적인 효용으로 고객을 확보하고 플랫폼을 구축하는 것이 중요할 것으로 예상된다는 점이다. 이는 향후 사용자 트래픽을 보면서 확인해 나
갈 필요가 있다. 나아가 메타버스, 로보틱스 등 유관 산업의 잠재력도 높아 보인다.

 

빌 게이츠는 최근 컨퍼런스에서 AI 비서 시장을 장악하는 업체가 산업의 승자가 될 것으로 전망한 바 있다. 모델의 메모리 기능이 강화되어 사용자에 대한 정보를 축적하게 되면 완전히 개인화된 검색, 쇼핑 등 최적화된 서비스를 제공할 수 있기 때문이다. 도구를 사용하는 툴포머 기능도 발전하면 원하는 업무를 수행해 줄 수도 있다. 나아가 최근에는 AI가 단순히 정확한 답변을 주는 것뿐 아니라 친구처럼 공감하고 조언을 해줄 수 있는 기능도 발전하고 있다.

 

한편 단순한 생산성 개선 서비스는 차별화가 쉽지 않을 전망이다. 글쓰기 서비스를 제공하는 스타트업 재스퍼 AI나 웹사이트 개인화를 지원하는 Mutiny AI은 최근 구조조정을 시작했다. 반면 개인화된 챗봇 서비스를 제공하는 캐릭터 AI는 최근 월간 방문자 수가 오픈 AI를 넘어설 정도로 인기를 끌고 있다. 챗GPT와 차별화되는 캐릭터 AI의 특징은 사용자들이 답변에 대한 피드백을 통해 캐릭터를 창조해내고 여기서 재미를 느끼
는 젊은 사용자들이 증가하고 있다는 점이다.

 

 

중기적으로 메타버스, 로보틱스 등 유관 산업의 성장도 기대된다. 생성 AI 기수로 인해 컨텐츠 수가 늘어나면 메타버스의 효용이 증대될 수 있고 언어 모델이 발전할수록 로봇의 인지 및 판

 

단 능력이 개선되면서 할 수 있는 일의 범위와 성능이 획기적으로 발전할 수 있기 때문이다.

 

 

출처: 미래에셋증권

 

뜨리스땅

728x90
반응형

댓글