IT트렌드 알아보기 - 생성형 AI를 활용한 음원 시장 전망

 ChatGPT를 시작으로 한 텍스트 기반의 생성형 AI들은 짧은 시간에 많은 것들을 변화시키곤 했습니다. 여러 포털사이트들은 AI검색 서비스를 제공하고 있고, 기업의 챗봇, 뉴스 요약, 번역 등 여러 방면의 텍스트 기반 서비스는 생성형 AI가 모두 적용되고 있다고 해도 과언이 아닌 지경입니다.

 심지어 최근에는 생성형 AI가 멀티 모달 기술과 융합하여 텍스트뿐만 아니라 이미지, 영상, 오디오 등 더 많은 분야에 활용되고 있는 상황입니다. 때문에 게임이나 광고, 영상제작 등 지식재산권을 생상하는 창작의 영역에 한 발 더 깊숙이 들어옴에 따라서 창작자의 생태계에도 큰 파장을 불러일으키고 있는 것입니다.

 이번 포스트에서는 그중에서도 음원시장에서의 생성형 AI에 대한 이야기를 나누어보려고 합니다.

IT트렌드 알아보기, 생성형 AI를 활용한 음원 시장 전망의 썸네일
IT트렌드 알아보기, 생성형 AI를 활용한 음원 시장 전망 (프리픽 이미지 활용)


반응형

1. 생성형 AI를 활용한 음원 시장

앞서 말씀드린 것과 같이 생성형 AI의 발전과 멀티 모달 기술과의 융합으로 인해 음성, 비디오 등 다양한 형태의 콘텐츠를 생성하는 수준에 이르렀습니다. 음원시장에서도 마찬가지입니다. 작곡가나 프로듀서, 음향 감독 등 기존의 음원 창작자들은 원하는 곡의 분위기, 장르, 사용할 악기 등을 AI에게 설명하고 이를 기반으로 음원을 만들어낼 수 있습니다.

 작곡, 작사, 보컬, 샘플링, 믹싱, 마스터링, 가상 악기 등 음악이 만들어지는 과정에서도 세부적으로 AI가 활용될 수 있는 영역이 무궁무진하기 때문에, 스타트업뿐만 아니라 빅테크 기업까지 시장을 선점하기 위한 다양한 기능과 서비스들을 출시하고 있습니다.

 그 결과로, 시장분석 전문업체인 Market.US은 음악 생성형 AI 시장이 급속하게 성장할 것이라고 전망하고 있으며, 2022년 2억 2,900만 달러(약 2,900억 원)에서 2032년에는 26억 6,000만 달러(약 3조 3,800억)로 11배 이상 성장할 것으로 전망했습니다.

생성형 AI를 활용한 음악 시장 전망 그래프
생성형 AI를 활용한 음악 시장 전망 (출처 : market.us)


2. 빅테크 기업 사례

 구글(Google)은 사용자가 누구나 간단하게 음원을 만들 수 있게 한다는 취지로, 2024년 초에 '뮤직FX(MusicFX)'를 업데이트했습니다. 2023년에 공개된 구글 자체 AI 모델인 '뮤직LM(MusicLM)'을 기반으로 해서 간단한 텍스트를 통해 모든 장르의 음원을 생성할 수 있는 서비스입니다. 참고로 뮤직LM 약 28만 시간 분량의 음향 데이터를 학습한 것으로 알려져 있습니다.

 또한 유튜브 쇼츠에 사용할 수 있는 음악 AI서비스인 '드림 트랙(Dream Track)'을 공개하기도 했습니다. 드림 트랙은 만들고자 하는 주제를 설명하는 프롬프트를 입력하고, 활용하고자 하는 아티스트를 선택하면 자동으로 해당 아티스트의 목소리를 활용해서 30초 분량의 사운드 트랙을 만들어주는 서비스입니다. 드림 트랙 서비스에는 구글 딥마인드의 음악 생성 모델인 '리리아(Lyria)'가 사용된다고 합니다.


 메타(Meta)는 2023년 8월에 오디오와 음악에 특화된 생성형 AI인 '오디오크래프트(AudioCraft)'를 공개했습니다. 오디오크래프트는 텍스트를 입력하는 것만으로도 음악을 작사/작곡하거나 사운드 효과를 만들 수 있는 생성형 AI입니다.

 음악의 장르와 스타일, 악기 등을 지정하면 음악을 생성해 주는 뮤직젠(MusicGen) 모델과, 사운드 효과나 배경음을 생성하는데 활용되는 오디오젠(AudioGen) 모델, 오디오 파일을 압축하거나 복원하는 엔코덱(EnCodec) 모델의 세 가지로 구성된 '오디오크래프트(AudioCraft)'는 저작권에 문제가 없는 음악 1만 곡과 악기소리만 담은 음악 39만 곡을 학습한 것으로 알려져 있습니다.


 마이크로소프트(MS)는 음악 생성 AI 스타트업인 수노(Suno)와의 협력으로 서비스를 제공하고 있습니다(2023년). MS 코파일럿에 수노 플러그인을 탑재한 형식이며, 위의 서비스들과 마찬가지로 프롬프트 입력을 통해 음원을 생성할 수 있는 서비스를 제공합니다. 유료로 서비스를 사용하는 사용자의 경우 생성한 곡에 상업적인 권리를 부여한다는 점이 특징이라고 할 수 있으며, 이를 통해 새로운 수익을 창출할 수 있다는 점에서 많은 관심을 받게 될 것 같습니다.


3. 스타트업 사례

 사실 빅테크 기업이 본격적으로 시장에 참여하기 전부터 음원 생성 AI시장에서는 스타트업이 먼저 두각을 보이고 있었습니다.

 해외에서 알려진 스타트업으로는 사운드로우(Soundraw.io), 험탭(Humtap), 부미(Boomy) 등이 있습니다.

< 해외 스타트업 음악 생성 AI >
이름 특징
Soundraw.io  - 사용자가 노래 장르, 길이, 빠르기 등을 선택해 몇 번의 클릭만으로 개인화 된 음악 생성
Humtap  - 사용자가 자신의 목소리나 리듬 입력을 통해 독창적인 음악 작곡
Boomy  - 생성한 읍악을 스포티파이에 유통하여 저작권 수익 창출 가능
Amper Music  - 일렉트로닉, 오케스트라, 팝, 록 등 다양한 음악 패턴과 장르 제공
AIVA  - 사용자 입력과 선택에 따라 멜로디, 하모니, 편곡을 포함한 독특한 음악 생성
Amadeuse code  - 사용자가 입력한 음악 분위기, 속도, 스타일, 주요 매개변수에 따라 멜로디 생성
(출처 : 뉴스투데이 기사를 참조, 참고자료 5번)

 국내에서는 뉴툰(Neutune)과 포자랩스(Pozalabs)가 대표적인 스타트업이라고 할 수 있습니다.

 뉴툰은 멀티모달을 적극적으로 활용하는 '믹스오디오' 서비스를 제공하는 것으로 유명합니다. 일반적인 음원 생성 AI들이 텍스트로 입력하는 프롬프트에 기반하여 음원을 생성해 주는 것과 달리 이미지나 오디오 등 입체적인 입력을 통해서 음원을 생성할 수 있는 것이 큰 차별점입니다.

 예를 들어, 벚꽃이 흩날리는 거리 영상에 어울리는 배경음악을 생성하고 싶을 때, 긴 문장의 텍스트로 프롬프트를 입력하는 것이 아니라 해당 장면을 업로드하기만 하면 되는 방식입니다. 이 외에도, 음원 계약을 통해 저작권에 문제없이 리믹스 버전의 음원을 만들 수 있는 'AI리믹스' 서비스도 제공하고 있습니다.

 포자랩스는 AI 음악 창작 플랫폼인 '라이브(LAIVE)'를 서비스 중입니다. 간단한 선택과 키워드 입력을 통해, 음악/가사/보컬이 한 번에 합성된 음원을 생성할 수 있는 것이 특징입니다.


 이번 포스트에서는 생성형 AI를 활용한 음원 시장의 전망과 주요 기업/서비스들을 말씀드렸습니다. 소개드린 서비스 외에도 영화음악, 게임음악 등 다양한 분야에서 AI 활용을 적극적으로 시도하고 있는 트렌드가 나타나고 있는데요.

 점차 많은 창작 및 예술분야에 AI가 적용되는 것을 목격하고 있는 상황에서, AI에 대한 경외심과 호기심 그리고 한편으로는 두려움까지도 느껴지는 것 같습니다.

[참고자료]
1) Generative AI in Music Market - market.us(2023.11)
2) 음원 시장 '생성형 AI' 10년 뒤 11배 볼륨 키운다 - 전자신문(2023.08)
3) "수십만 대군 함성 만들어줘"… 생성AI가 음향효과까지 '뚝딱' - 매일경제(2024.02)
4) 유튜브, 노래 만들어주는 생성AI 내놨다 - ZDNET Korea(2023.11)
5) "누구나 팝송 만들어 발표 가능"...MS, '코파일럿'에 음악 생성 AI 탑재 - AI타임즈(2023.12)
6) [메타버스와 웹3.0이 여는 새로운 세상 (17)] ‘생성형 AI’, 메타버스에 날개를 달다③ - 뉴스투데이(2023.09)
반응형