골드 러시가 유행일 때 결국 돈을 버는 사람은 광산 옆에서 청바지를 파는 사람들이었다는 이야기를 잘 아실껍니다. 사실 이는 모든 새로운 산업에 통용되는 이야기인데요. 이번 AI 시대에서도 같은 일이 발생할 것은 자명하기 때문에 AI 시대의 청바지 비즈니스에 주목해보는 것도 매우 합리적인 고민이라고 생각합니다.
앞으로 셀 수 없이 많은 기회들이 파생될텐데, 오늘은 제가 주목하고 있는 대표적인 AI 청바지 비즈니스 사례를 몇가지 소개해보도록 하겠습니다. 주로 미들 레이어 사업자들에 대한 소개입니다.
Yes, The World Needs Another Database | by Erin Price-Wright | Index Ventures
앞으로 AI 모델에 적절한 데이터 넣어주는게 가장 중요할텐데, 모델이 멀티모달로 나아갈 것이 자명해지면서 벡터 데이터베이스의 중요성이 지금과는 비교할 수 없을 만큼 올라갈 것이라고 생각합니다. 현재 전 세계 데이터의 약 80%-90%가 비정형 데이터 (이미지, 영상, 음악 등)인데, 이러한 비정형 데이터를 임베딩을 통해 벡터로 변환해서 저장하는 것이 벡터 데이터베이스이기 때문입니다.
또한 데이터가 벡터 값으로 저장되면 서로간의 유사도가 파악되기 때문에 유사도 검색이 가능해진다는 특성을 가지고 있는데, 벡터 데이터베이스에 기반한 유사도 검색은 제품 추천, FAQ 답변, 개인화, 오디오 검색, 중복 제거, IT 이벤트 로그의 위협 감지 등에 기본적으로 사용될 것으로 보입니다.
그리고 LLM 작동 방식과 벡터 데이터베이스는 결이 아주 잘 맞으면서도 (LLMs also operate on vector embeddings — so by storing data in Pinecone in this format, part of the AI work has effectively been pre-processed and offloaded to the database), 벡터 데이터베이스는 마치 LLM에 있어 ‘메모리’ 처럼 작동할 수도 있어서 AI의 기억력을 늘려주고 연속성을 부여 가능하게 해주는 역할을 할 것으로 기대됩니다.
참고로 Pinecone이라는 업체가 벡터 데이터베이스 스타트업들 중에서 대표주자로 언급되며, 올해 4월 $750m 밸류에이션에 $100m 펀딩에도 성공했습니다 (기사).
“범용적(general)인 LLM을 그대로 쓰는 것만으로는 맞춤형 AI 어시스턴스를 만드는 데 한계가 있었습니다. 한계를 해결하는 수많은 솔루션 중 임베딩을 활용한 RAG(검색 증강 생성) 방식의 효과가 증명되면서 데이터 관리의 중요성이 더욱 커졌고, B2B 클라우드 데이터 관리 플랫폼을 제공하는 Databricks가 또다시 큰 관심을 받게 되었습니다.”
위와 같은 이유로 Snowflake와 Databricks와 같이 데이터 저장소 역할을 하는 플레이어들 또한 중요성이 높아질 것으로 보입니다. 실제로 Databricks는 최근에 무려 $43b 밸류에이션으로 $500m을 레이즈했고 (참고), 당분간 흑자 전환 없이 성장에만 집중하여 매년 50% 이상의 매출 성장률이 예상된다고 합니다 (참고).
Snowflake와 Databricks 두 기업 모두 각자만의 방식으로 AI 대응을 잘해나가고 있는데, 둘을 비교하면 스노우플레이크가 폐쇄적이고 수직 통합적인 접근이라면(스노우플레이크 안에서 모든걸 해결하려는 방향) 데이터브릭스는 조금 더 열린 느낌으로 데이터 인프라를 깔아놓고 있습니다 (여러 사업자와의 협업을 통해 생태계 확장). 최근의 행보로는 스노우플레이크는 엔비디아와 협력해서 AI 서비스를 제공한다고 밝혔고, 데이터브릭스는 MosiacML 인수를 통해 직접 모델을 개발하고 소유하려는 움직임을 보여주고 있습니다 (참고 아티클).
특히 Databricks는 ‘데이터 인텔리전스 플랫폼’이라는 방향성을 설정했는데, 이제부터 데이터 관리에 AI가 접목되면서 자연어를 기반으로 데이터를 관리할 수 있고, 고도화된 데이터 검색 기능을 제공하거나, 데이터 사용량에 따라 알아서 최적화를 하거나, 스스로 보안 수준을 강화하는등 AI를 통해 데이터 관리의 새로운 혁신이 일어나고 있음을 밝히고 있습니다. 앞으로 데이터 관리 방식이 완전히 바뀔 수 있겠다는 생각이 드네요.
Align AI - analytics for AI-native products
한국의 콕스웨이브 팀이 만드는 Align AI는 대화 분석 툴입니다. 이 팀은 인터페이스 측면에서 ‘대화’가 핵심이 되는 AI-native Application들이 유의미하게 커질 것이라고 예상하고 있는데, 그렇다면 대화 데이터를 가장 잘 수집하고 가공하는 것이 AI 프로덕트의 핵심이 되지 않을까 가정하고 있고, 이에 필요한 분석 도구를 만들고 있습니다.
특히 이 팀은 생성 AI 서비스에는 사용자들의 ‘의도’가 중요하고, 서비스가 사용자를 배워야한다고 이야기합니다. 즉, 사용자들이 무엇을 보고 무엇을 선택하는지 알아야만 제안을 더 잘 제공해줄 수 있을 것이고, 따라서 중요한건 어떻게 제품을 잘 만들어서 개인화의 영역으로 잘 넘어갈 수 있게 만들 것인가를 핵심으로 보고 있습니다. Align AI는 이러한 제품을 잘 만들기 위한 핵심 분석 도구가 되고자 하고 있고요.
생각해보시면 모든 성공한 디지털 프로덕트들은 더 올바른 의사결정을 위한 제품 분석 툴의 사용 아래 만들어졌습니다. 대표적으로 모바일 시대에는 구글 애널리틱스와 앰플리튜드를 이용해서 더 나은 어플리케이션들을 만들곤 했죠. 이는 이번 AI 시대에도 마찬가지일 것이라고 생각하고, 이에 걸맞는 분석 프로덕트들이 나올 것으로 예상합니다. 그리고 아마 이러한 프로덕트들은 (위의 Databricks ‘데이터 인텔리전스 플랫폼’과 같이) AI를 잘 활용한 AI-native한 서비스이지 않을까 싶습니다.
이외에도 랭체인(Langchain) 같은 개발 라이브러리, Hugging Face같은 모델 호스팅 플랫폼, CoreWeave 같은 GPU 컴퓨팅 인프라 제공 업체 등 다양한 미들 레이어 기업들이 이미 큰 수혜를 가져가고 있습니다.
다른 관점에서 레거시 기업들의 AI 도입 니즈가 최근들어서 급속히 늘어나고 있는데, 달파와 같은 기업들이 B2B 고객을 타겟으로 한 서비스를 제공하면서 이러한 수혜를 노리고 있기도 합니다.