21세기 창작자의 오른팔, 칼로
생성형 AI와 프롬프트 디자인
2022년 12월 카카오브레인이 공개한 칼로는 초거대 AI 이미지 생성 모델이다. AI 기술 개발을 통해 사람들의 라이프스타일를 혁신하겠다는 목표 아래 국내 생성형 AI 시장의 새로운 생태계를 구축하고 있는 카카오브레인의 행보를 살펴봤다.
명령어와 제시어 만으로 고품질의 이미지를 생성한다고?
지난해 12월 카카오브레인이 공개한 칼로는 초거대 AI 이미지 생성 모델이다. 현재 칼로를 기반으로 한 플랫폼 ‘비 디스커버B^DISCOVER’ 서비스에서 이용할 수 있다. 앱에서 간단한 명령어를 직접 입력하거나 대상, 화풍, 장소, 시간, 색상에 관해 다양한 제시어를 고르면 단 몇 초 만에 고품질의 이미지를 생성할 수 있는 데다 팝아트, 그라피티 아트, 일러스트레이션 등 총 30가지의 화풍도 제공한다. 지난 3월에는 칼로를 체험할 수 있는 두 번째 서비스로 ‘비 에디트B^EDIT’를 오픈 베타로 공개했는데, 이는 생성형 AI 기능의 대중화와 전문 창작인의 수고를 덜어주는 것이 목적이다.
칼로 2.0 공개를 앞둔 카카오브레인의 김재인 리더는 “2023년은 생성형 AI가 새로운 국면을 맞이한 해”라며 “생성형 AI 중심 서비스 생태계의 토대를 마련하는 것과 동시에 사용자가 혁신적인 창작물을 창출할 수 있도록 돕겠다”라고 전했다. 이는 AI 기술 개발을 통해 사람들의 라이프스타일에 혁신을 일으키고자 하는 카카오브레인의 기업 철학과도 맞닿아 있다. 국내 생성형 AI 시장의 새로운 생태계를 구축하고 있는 카카오브레인의 행보를 살펴봤다.
AI가 인간과 협력할 수 있는 관계로 성장할 것
카카오브레인 칼로사업실
김재인
칼로 2.0 개발 과정에서 이전 버전보다 발전시키고 있는 부분은 무엇인지 궁금하다.
이미지 세부 묘사 기능이 탁월한 모델을 개발하는 데 주력하고 있다. 칼로 2.0은 기존 버전에 비해 동물, 건축물 등을 실사에 가까운 이미지로 생성할 수 있는 게 특징이다. 프롬프트로 표현하는 내용을 충실히 반영하여 이미지를 생성하기 때문에 입력하는 명령어가 구체적일수록 이미지의 정확도를 더욱 높일 수 있다. 프롬프트를 입력하는 사용자의 창의력과 표현 능력이 매우 중요하게 작용하는 부분이다. 앞으로 멀티모달을 학습하고 출력할 수 있는 모델로 발전시킬 계획이다.
최근 ‘AI 프로필’ 서비스 오픈과 함께 한국어로 프롬프트를 입력하면 프로필 이미지가 생성되도록 업데이트하기도 했다.
AI 프로필 서비스는 사용자가 지정한 이미지를 바탕으로 AI가 다양한 프로필 이미지를 생성하는 기능이다. ‘비 디스커버’ 앱에서 연령과 성별을 선택하고 이미지 파일을 업로드한 후 생성 버튼을 선택하면 사용자 정보에 기반해 다양한 콘셉트의 프로필 이미지 100개를 약 1분 이내로 그려낸다. 연내에는 생성된 AI 프로필 이미지에 사용자의 목소리와 모션을 입혀 비디오로 생성하는 ‘AI 모션 서비스’를 선보일 예정이며, 이와 함께 사용자의 요구 사항을 반영해 서비스를 발전시킬 계획이다.
칼로를 활용해 창작자, 기업과 활발한 협업을 이어오고 있다.
카카오브레인은 그동안 다양한 분야의 창작자와 협업한 결과물을 활용해 프로젝트를 진행해왔다. 칼로는 2022년 6월, 정식 출시 전부터 현대미술가 고상우 작가와 사비나미술관 전시회 〈Forever Free-그러므로 나는 동물이다〉에서 공동 작업을 통해 1000개의 다양한 호랑이 이미지를 조합해 거대한 하트 형태 디지털 작품을 재탄생시킨 바 있다. 또 삼성전자와 협업으로 ‘갤럭시 북 아트 프로젝트’를 진행하고, 미술품 종합 거래 플랫폼 ‘아트투게더’, 극사실주의 화가 두민 작가와 합을 맞추기도 했다. 생성형 AI가 인간에게 도움을 주며 협력할 수 있는 관계로 성장할 것이라고 생각한다.
요즘 저널리즘과 생성형 AI의 협업도 화제다. 일례로 지난해 6월 영국 〈이코노미스트〉와 〈코스모폴리탄〉 미국판에서는 표지로 생성 모델 미드저니와 달리가 만든 이미지를 활용했다.
칼로 역시 AI·빅데이터 전문 기업 바이브컴퍼니와 함께 AI 작품 ‘칼로의 얼굴’을 선보이며 이러한 흐름에 궤를 같이했다. 이 작품은 경제 전문지 〈포춘코리아〉의 2023년 2월호 표지를 장식했다. 또 카카오브레인 김일두 대표가 대담을 마련해 우리가 지향하는 바를 전달하기도 했다.
생성형 AI가 창작자와 앞으로 어떤 관계를 맺을 수 있을 것이라 전망하나? 전문 창작인이 칼로를 어떻게 활용하길 바라는지도 말해달라.
디자인 스킬이 없는 대중에게는 칼로가 그림을 그릴 수 있는 손이 되었으면 하고, 디자이너에게는 영감을 불러일으킬 수 있는 도구로 활용되었으면 한다. 최근 챗GPT를 비롯한 대규모 언어 모델(LLM) 등 생성형 AI 기술이 한층 더 대중에게 가깝게 다가섰음을 느낀다. 인간 수준의 범용 인공지능(AGI)이 인류의 일상에 자리하는 시점이 머지않아 보인다.
추후 카카오브레인이 생성형 AI 서비스를 고도화하기 위한 전략과 계획은 무엇인가?
AI 전문 연구 개발 인력의 역할도 중요하지만, 경쟁력을 갖춘 생성형 AI 기술을 만들기 위해서는 사용자의 목소리를 바탕으로 기술을 발전시켜야 한다. 디자이너를 포함한 대중의 의견에 귀 기울여 만족도를 확인하고 사용자 데이터를 모델 고도화에 활용할 것이다. 그 연장선으로 국내 스타트업과 협력해 생성형 AI 모델 서비스를 개발하기 위한 ‘100X 프로그램’을 진행하고 있다. 이를 통해 국내 AI 중심 서비스 생태계의 단단한 토대를 마련하기 위해 힘쓸 계획이다. 앞서 설명한 우리의 자취가 이를 증명하고 있다고 생각한다.
비 에디트 사이트