레고와 챗GPT가 만나면? ‘레고GPT’

레고 GPT가 품은 가능성은?

레고와 챗GPT가 만나면 어떤 일이 벌어질까? 상상 속 조립이 현실이 되는 ‘레고GPT’가 그 답을 보여준다. 텍스트 한 줄만 입력하면 AI가 직접 설계도를 만들고, 실제로 조립까지 가능한 레고 구조물을 제안해준다. 장난감을 넘어, AI와 창의력이 만나는 새로운 방식의 놀이를 만나보자.

레고와 챗GPT가 만나면? ‘레고GPT’

요즘 사람들에게 즐거움을 주는 대표적인 기술은 인공지능(AI), 그중에서도 ‘생성형 AI’라고 할 수 있다. 이 기술은 단순한 정보 분석이나 생성에 그치지 않고, 창의적인 콘텐츠 제작을 돕는 도구로 발전하며 우리의 일상에 자연스럽게 스며들었다. 그리고 그 중심에 있는 것이 바로 ‘챗GPT’다. 사용자가 대화를 걸듯 질문을 하면, 이 툴은 즉시 그림, 사진, 영상, 글, 코딩 등 다양한 형태의 콘텐츠를 만들어낸다.

resize 01 1
사진 출처: Pexels

최근 챗GPT가 크게 주목받은 이유는 사진을 지브리, 스누피, 디즈니 스타일로 변환하는 기능이 인기를 끌었기 때문이다. 이런 기능은 기존의 AI 툴에서도 볼 수 있었지만, 보다 자연스럽고 빠르게 결과물을 접할 수 있다는 점이 사람들의 마음을 사로잡기에 충분했다.

챗GPT를 개발한 오픈 AI의 CEO 샘 알트먼도 자신의 사진을 지브리 스타일로 바꿔 공유하며 큰 화제를 모았다. 이러한 열풍에 힘입어 국내 일간 활성 이용자 수(DAU)는 출시 이후 처음으로 120만 명을 돌파했다. 챗GPT의 인기가 얼마나 뜨거운지를 보여주는 대목이다.

02 1
사진 출처: StockCake

AI 기술이 빠르게 일상에 자리 잡는 만큼, 생성형 AI 툴도 점차 다양해지고 있다. 그리고 각기 특화된 분야로 세분화되고 있는 추세다. 글쓰기나 전반적인 작업에는 챗GPT, 구글의 제미나이, 마이크로소프트의 코파일럿이 주로 사용되며, 이미지 생성은 미드저니, 플럭스(FLUX), 이미지 편집은 포토샵과 어도비의 파이어플라이(Firefly), 영상 생성은 오픈 AI의 소라(Sora), 디자인 작업은 캔바(Canva) 와 피그마(Figma), 정보 요약과 검색은 퍼플렉시티(Perplexity) 등으로 나뉜다. 이처럼 목적에 따라 AI 툴을 골라 쓰는 시대가 되면서 이제는 이 기술이 없는 삶을 상상하기 어려워졌다는 목소리도 점점 늘어나고 있다.

03 1
사진 출처: Pixabay

이처럼 첨단 기술의 발전이 하루가 다르게 발전하고 있지만, 이와 반대로 아날로그 감성을 중요시하게 여기는 움직임도 꾸준히 확산되고 있다. 기술의 힘에 의존하지 않고 손으로 직접 만들며 창의력을 발휘할 수 있는 일에 즐거움을 느끼는 사람들이 늘어나고 있는 것이다. 이런 성향을 가진 이들이 좋아하는 놀잇감은 바로 ‘레고(Lego)’다.

1932년 덴마크에서 탄생한 이 블록 장난감은 100년이 가까운 세월 동안 어린이들에게 창의력과 즐거움을 선사했다. 그리고 이제는 세대를 넘어 전 세계적으로 사랑받는 콘텐츠로 자리 잡았다. 이 같은 흐름 속에서 레고는 어른들의 취미이자 예술 작품을 만들 수 있는 존재로도 인정받고 있다.

04 1
사진 출처: 레고 홈페이지

이런 트렌드에 발맞춰 레고는 아이들을 위한 제품도 만드는 동시에 어른용 레고 시리즈를 내며 전 세계 키덜트들의 관심을 끌고 있다. 어른들을 위한 제품은 건축물, 자동차, 식물, 아트 피스 등의 테마를 기반으로 섬세하고 정교한 조립을 요하는 것이 특징이다. 이런 제품을 통해 복잡한 디지털 세계에서 잠시 벗어나 스트레스 해소는 물론, 몰입과 창조의 성취감을 느끼는 이들이 늘어나고 있다. 덕분에 점차 제품군이 늘어나고 있는 중이다.

resize 05
사진 출처: 레고 홈페이지

일부 마니아들은 자신만의 레고 작품을 설계하고 조립하여 제품화하거나, 예술 작품으로 선보이기도 한다. 전 세계 레고 창작자들의 모여드는 ‘레고 아이디어스(LEGO Ideas)’ 플랫폼에서는 일반인들이 제안한 아이디어가 투표를 통해 실제 제품으로 출시되는 과정을 엿볼 수 있다. 이와 같이 레고는 창의력과 상상력을 마음껏 펼칠 수 있는 도구인 동시에 개인의 취향과 정체성을 표현하는 수단으로 인정받고 있다.

06 1
사진 출처: StockCake

최근 들어 화제가 되고 있는 AI 기술과 오랫동안 사람들의 사랑을 받았던 레고가 합쳐진다면 어떤 결과가 이루어질까?누구나 이런 궁금증을 한 번쯤 가졌을 것이다. 이 질문에 대해서 카네기멜론대학교(Carnegie Mellon University) 연구팀은 흥미로운 답을 내놓았다. 이들이 공개한 ‘레고GPT(LegoGPT)’는 챗GPT처럼 텍스트로 이루어진 설명을 입력하면, 이를 기반으로 하여 실제 조립 가능한 레고 모델을 생성한다.

07 1
사진 출처: Github

기술이 작동하는 방식은 비교적 단순하다. 레고 구조물과 그에 대한 설명 문구가 짝지어진 데이터셋을 기반으로 한 이 기술의 핵심은 ‘다음 토큰 예측1 모델’을 통해 각각의 레고 블록이 어디에 배치되어야 할지를 판단하는 것이다. 이후 각 블록이 적절한 곳에 위치했는지를 확인하는 유효성 검사를 수행해 안정성을 높인다. 이런 과정을 통해 완성된 설계도를 바탕으로 사용자는 상황에 맞춰 조립을 시작하기만 하면 된다.

08 1
사진 출처: Github

툴의 작동 방식은 얼핏 보면 단순해 보일 수도 있다. 하지만 그 뒤에는 연구팀이 들인 오랜 시간과 노력이 촘촘히 깔려 있다. 팀은 이 기술을 만들기 위해 ‘StableText2Lego’라는 방대한 데이터셋을 구축했다. 여기에는 4만 7천 개가 넘는 안정적인 레고 구조물과 2만 8천 개 이상의 고유한 3D 객체가 포함돼 있으며, 각각의 구조물에는 GPT-4o를 활용해 생성한 자세한 설명도 함께 담겨 있다.

resize 09
사진 출처: Github

데이터셋을 만들기 위해 연구팀은 실제 레고로 만든 모델을 스캔해 디지털 형식으로 변환했고, 이렇게 추출된 구조는 컴퓨터가 분석하고 저장할 수 있는 형태로 바뀌었다. 각 디자인은 개별 블록을 나타내는 텍스트 토큰의 시퀀스로 변환되며, 그 시퀀스는 해당 구조물을 설명하는 캡션과 짝지어졌다. 이런 방식으로 AI가 학습할 수 있는 훈련용 데이터셋이 만들어졌다. 이를 통해 언어 모델은 레고 블록이 어떤 순서와 방식으로 배치되는지를 익히게 된다.

10 2
사진 출처: Github

텍스트 프롬프트만 입력하면 원하는 모양으로 레고 블록을 쌓을 수 있게 해주는 이 기술에서 특히 주목할 만한 점은, 실제로 조립할 수 없는 설계는 자동으로 걸러낸다는 것이다. 생성 과정에서 불안정하거나 유효하지 않은 블록은 감지되어 제거되며, 필요한 경우 구조물의 균형을 해치는 요소들도 함께 정리된다. 색상이나 표면 질감을 지정할 수 있는 기능도 포함돼 있어, 결과물의 완성도를 한층 높여준다. 조립은 사람이 직접 해도 되지만, 로봇 팔을 이용해 자동으로 진행할 수도 있다.

11 4
사진 출처. Hugging Face

연구팀은 깃허브(Github)를 통해 이번 프로젝트에 사용된 전체 데이터셋, 학습된 모델, 소스 코드를 모두 공개했다. 누구나 공개된 자료를 통해 기술의 전반적인 내용을 파악하는 것은 물론이고, 기타나 의자, 소파처럼 다양한 형태의 구조물이 어떻게 레고 블록으로 구현됐는지도 확인할 수 있다.

또한 데모 사이트에서는 원하는 대로 프롬프트를 입력하여 블록을 직접 생성해 보는 것도 가능하다. 미리 만들어진 구조물이 어떤 과정으로 완성되었는지도 추적할 수 있어 기술의 작동 과정을 좀 더 다채롭게 경험할 수 있다.

레고GPT는 기존의 가상 시뮬레이션이나 디지털 모델링 툴을 한 단계 넘어선 기술이다. 텍스트 기반 프롬프트만으로 실제 조립 가능한 레고 설계도를 만들어낸다는 점에서, 그리고 물리적으로도 안정적인 형태를 스스로 만들어낸다는 점에서 기존의 생성형 AI 기술들과는 뚜렷한 차별점을 보여준다. 그저 그럴듯한 이미지를 생성하는 수준이 아니라, 손으로 직접 만지고 조립할 수 있는 실체를 만들어낸다는 것은 매우 중요한 진보다. 생성형 AI가 이제 디지털 세계를 넘어서 현실과 연결되고 있다는 신호이기도 하다.

12 3
사진 출처. StockCake

특히 레고GPT는 물리적인 제약까지 고려한 구조 설계를 가능하게 한다. 이처럼 안정성과 기능성을 갖춘 결과물을 AI가 스스로 완성한다는 점은, 향후 이 기술이 다양한 분야로 확장될 수 있다는 가능성을 암시한다.

지금은 레고라는 제한된 재료로 구조물을 설계하고 조립하는 단계에 머물러 있지만, 만약 이 기술이 금속, 플라스틱, 나무 등 다양한 재료를 다루게 된다면 어떨까? 텍스트 몇 줄로 튼튼한 가구를 설계하거나, 드론과 로봇같이 복잡한 기계 구조를 조립하고 배치하는 일이 현실이 될지도 모른다. 더 나아가, AI가 생성한 설계가 인간보다 더 효율적이고 정밀하다는 평가를 받는 날이 머지않아 도래할지도 모른다.

이처럼 인간의 언어를 이해한 AI가 그것을 실제 구조물로 구현하고, 사람은 그 가능성을 끊임없이 실험하고 확장해가면서 언어와 설계, 디지털과 물리 세계 사이의 경계는 점차 흐려지고 있다. 그런 의미에서 레고GPT는 장난감 조립의 도구를 넘어, 생성형 AI의 새로운 가능성을 엿볼 수 있는 출발점이라 할 수 있다.

  1. 다음 토큰 예측(next-token prediction): 이는 AI 언어 모델이 작동하는 핵심 원리 중 하나이다. 문장을 구성하는 단어, 글자, 단어의 일부를 ‘토큰 token’이라고 부르며, ‘다음 토큰 예측(next-token prediction) 모델’은 말 그대로 다음에 올 단어(토큰)을 예측하는 것이다. 레고GPT는 문장 대신 레고 블록 배치 정보를 예측한다.
    ↩︎

관련 기사