@주3회 발행하는 유료 뉴스레터 [스타트업]입니다. 무료 가입은 https://page.stibee.com/subscriptions/143087 입니다. 무료 구독자에겐 본문의 절반을, 유료 구독자에겐 전문을 공개합니다. 유료 구독은 https://page.stibee.com/subscriptions/158656 입니다. 감사합니다.

@그때 투자(나는 그때 투자하기로 했다)에선 현업 투자자가 왜 이 스타트업에 투자했는지를 공유합니다.

AI가 연신 인간을 놀라게 하고 있는 요즘이다. 알파고를 만든 기업으로 유명한 딥마인드의 알파 코드는 코딩 콘테스트에서 상위 30% 수준을 기록했다. AI 프로그램인 미드저니가 만들어낸 그림 ‘스페이스 오페라’는 미술대회에서 우승을 차지했다. 지난 달 공개된 Chat-gpt는 인간의 구어적 표현과 농담까지 반영한 문장을 생성해내어 인공지능의 범용적, 일반적 가능성을 시사했고 출시 5일만에 100만명의 유저를 돌파하며 대중들의 상상력을 자극했다.

이러한 가능세계를 열어준 것은 Generative AI(이하 ‘생성AI’)의 발전이다. 데이터와 패턴을 학습하여 대상을 이해한 뒤 분류 작업을 수행하던 Discriminant AI와 달리, 생성AI는 기존 데이터와의 비교학습을 통해 유사하지만 동일하지는 않은, 새로운 결과물을 ‘생성’해낸다. 이처럼 수학적 경계조건에서 시작한 생성AI는 현재 시장에서 보다 더 복합적으로 활용, 혼용되고있으나 크게 Foundation Model을 개발하는 기업과 Foundation Model의 API를 기반으로 한 스타트업으로 구분할 수 있다.

초거대AI라고도 많이 칭하는 Foundation Model은, 말 그대로 압도적인 컴퓨팅 인프라와 데이터 규모를 기반으로한 초고성능 AI를 의미한다. 인간 뇌의 시냅스에 해당하는 AI모델의 ‘파라미터’ 수와 학습 데이터 규모가 성능을 측정하는 지표가 된다. 일례로 최고수준으로 평가받았던 Open AI의 GPT-3의 파라미터 수는 1,750억개에 달했으며 학습 데이터는 45TB를 기록할 정도였다. 현재 각국의 빅테크 기업들은 경쟁적으로 해당 모델 개발에 힘쓰고 있으며 국내에서는 네이버를 선두로 카카오, LG, KT등이 개발중에 있다. 물론 새로운 아키텍처의 등장과 컴퓨터 성능의 개선으로 Foundation Model의 하이퍼스케일링은 효율화, 가속화 되고 있다고 하지만 여전히 천문학적인 비용이 투입되는 현실이다. 이에 각국의 Foundation Model 개발사들은 개별 서비스를 운영하기보다는 모델 성능 고도화에 리소스를 집중하였다. 이는 스타트업에게 기회가 되었다.

미국 시장이 먼저 움직였다. GPT-3의 API를 활용한 새로운 서비스들이 우후죽순 등장했다. 무조건 대량의 데이터를 학습시키는 것이 아니라, 이미 개발된 모델 위에 적절한 고품질 데이터를 활용하여 특정 기능을 수행하는 솔루션들이 주목받은 것이다. 현재 유니콘 반열에 오른 Jasper의 경우 마케팅 카피라이트 생성에 집중했다. 이외에도 코드 생성, 법률 검토 등 다양한 산업 분야에서 생성AI 스타트업이 성장하고 있다. 현재 GPT-3 API를 기반으로 한 스타트업은 수백개에 달하는 것으로 알려져있다.

/뤼튼테크놀로지스

◇비즈니스 콘텐츠 생성 툴, 뤼튼

미국 시장의 선례에서 볼 수 있듯 생성AI 모델을 서비스화하는 차원에서의 경쟁력은 모델 자체를 개발하는 기업과는 문법이 다르다. 특정한 페인포인트가 존재하는 유의미한 규모의 시장을 타겟해야하고, 모델 API를 적절하게 활용할 수 있는 프롬프트/파인튜닝 기술력을 보유해야하며, 타겟 시장 및 솔루션 정합한 양질의 데이터를 확보해야한다. 스타트업에 투자하는 VC 입장에서는 마이크로소프트, 구글 등 빅테크가 주도하는 Foundation Model에서 벗어나, 앞의 세 가지 경쟁력을 보유한 기업을 발굴해야했다. 현재 비즈니스 콘텐츠 생성 툴로서 오픈베타 서비스를 진행중인 뤼튼은 세 가지 경쟁력을 모두 보유한 국내 유일 기업이었기에 투자에 망설임이 없었다.

먼저 시장성이다. 뤼튼은 먼저 비즈니스 콘텐츠라는 시장에 집중했다. 이메일, 마케팅 카피라이트, 블로그 포스팅 등 비즈니스 영역에서 인간의 규격화되고 반복적인 작문 활동이 필수였기 때문이다.  뤼튼은 한국어, 영어 초거대 언어모델을 기반으로 약 50여개의 카테고리를 포괄하는 서비스 오픈베타를 지난 10월 런칭했다. 시장 반응은 폭발적이었다. 런칭 후 1개월만에 약 3만명의 유저가 가입했고 2개월만에 10억 단어를 생성해냈다. 명확한 페인포인트가 존재하는 시장을 타겟한 결과였다.

뤼튼의 기술력 또한 괄목할만하다. 초거대 모델로부터 원하는 결과값을 도출하는 프롬프트 엔지니어링은 일종의 노하우가 필요한 영역이다. 특정한 케이스에서 적절한 예제와 규모를 찾은 뒤 이를 가속화하는 방식이기 때문이다. 뤼튼은 21년 9월부터 오픈베타까지 약 1년간 GPT-3을 기반으로 다양한 실험을 해왔고 이를 기반으로 경험적인 노하우를 구축했다. 또한 Foundation Model에 추가적인 학습을 더해 특정 성능을 고도화시키는 방식인 파인튜닝 역시 준비되어있다. 서비스를 운영하며 축적되는 유저 데이터를 기반으로 툴의 성능은 높이고 비용을 줄이는 방식으로 기술적 장벽을 꾸준히 높여갈 계획이다.

마지막으로 데이터 영역의 경쟁력이다. AI 기업의 핵심 경쟁력인 데이터의 경우 시장을 선점할수록 더욱 많은 데이터를 확보하게 되는 선순환구조를 가진다. 뤼튼은 그동안 작문 컨퍼런스를 개최하며 활용가능한 양질의 작문데이터를 확보해온 바 있고 충분한 테스트 이후 완성도 높은 서비스를 안정적으로 제공하며 시장을 선점했다. 출시 3개월차 생성량은 15억 단어 수준으로 2조원 밸류의 해외 유니콘 기업 Jasper의 월간 생성량의 67% 가까이 따라잡으며 양질의 유저 데이터를 확보해나가고 있다. 경험을 통해 고도화되는 AI 서비스의 구조 상 잠재적 경쟁사로부터 지속적인 해자를 구축하게 된 것이다.

CES2023에서의 팀 단체사진. /뤼튼테크놀로지스

◇국내 생성AI의 선두주자가 되기까지

성장하는 시장에 초기 플레이어가 된다는 것은 누군가에게는 그저 운이 좋았던 것처럼 보일 수도 있다. 2021년도에 설립된 뤼튼이 1년만에 오픈베타 서비스를 출시하고, 그 직후 Chat-GPT의 등장과 함께 생성AI의 메가 트렌드가 시작된 것 역시 행운의 타이밍으로 보이기도 한다. 하지만 그 기저에는 이세영대표와 C레벨 임원들의 지난 8년간의 경험이 누적되어있다.

96년생의 젊은 나이인 이세영대표는 17세에 청소년 작문 컨퍼런스인 ‘한국청소년학술대회 KSCY’를 설립하였다. 이후 8년 넘게 대회를 운영하며 아시아 최대 규모의 청소년 학술대회로 성장시켰으며, 13개국의 3만명 청소년을 대상으로 글쓰기 평가 및 교육을 실시해왔다. 코로나19는 이들에게 오히려 기회가 되었다. 대회와 교육을 전면적으로 온라인으로 전환하며 텍스트 데이터를 활용한 사업기회를 모색하기 시작했다. 그러던 중 등장한 GPT-3에서 AI 작문시장의 태동을 보았고, 함께 한국청소년학술대회를 운영하던 구성원들과 뤼튼테크놀로지스를 창업한 것이다. 이 구성원들에는 SBS 올림픽을 담당한 디자인 감독과 GPT-2 부터 응용 서비스를 구축한 인공지능 전문가등이 있었다 장기간 호흡을 맞춰왔던 뤼튼 팀은 젊은 나이가 무색하게 고도화된 팀이었다. 비전에 대한 공감과 상호 신뢰가 기반이 된 젊고 빠른 팀은 투자자에게 또 다른 투자 결정 포인트로 다가왔다.

창작(創作)이란 예술적 감흥을 작품으로서 독창적으로 표현하는 일을 뜻한다. 인간의 고유한 영역이라 생각되었던 창작이 AI에게 대체된다는 느낌은 섬짓하기도 하다. 작문 또한 그렇다. 작문을 AI가 수행한다는 것이 시류이며 필연이지만,  문장력은 갈고 닦아지는 역량인만큼 고유의 가치에 대한 의문을 떨쳐내기는 어렵다. 한 번은 이세영 대표에게 직접 물었다. 생성AI와 뤼튼 서비스가 인간의 고유하고 존엄한 영역을 대체하는 것이 아니냐고. 구글에 비유하여 설득하던 그의 대답은 명쾌했다. 구글이 등장하기 전 암기를 잘하는 것이 지식인의 영역이었다면, 이제는 구글 엔진을 기반으로 정보를 잘 찾아내고 잘 활용하는 것이 지식인이 되었음을 짚었다. 생성 AI 서비스를 제공하는 뤼튼 또한 같은 맥락이었다. 인간과 AI가 함께 창작하고 업무할 수 있도록 도우며 인간 창의성의 새로운 정의를 앞당기겠다는 그의 포부가 담긴 답변은 투자자를 동화시켰다. 다시 창작의 정의를 떠올려보았다. 감흥을 표현해내는 일인 창작은, 결국 상상력과 구현력으로 나뉘어진다. 그리고 AI는 구현력을 보조하고 있다. 인간의 창의적 사고력은 더욱 고유하고 중요해질 것이며 이를 구현하는 일은 점점 편리해질 것이다. 새로운 패러다임의 창작 영역을 작문에서부터 개척하고 있는 뤼튼테크놀로지스의 행보를 기대하며, 투자자로서 진심으로 믿고 응원해본다.