글로벌 빅테크의 생성형 인공지능, 지금 어디까지 왔나?

각축전 벌어지는 AI 시장

인공지능 시대, 그 선두에 올라서기 위한 글로벌 빅테크들의 경쟁이 치열하다. 최근 이들의 행보는 어디에 이르렀는지 살펴본다.

글로벌 빅테크의 생성형 인공지능, 지금 어디까지 왔나?

인공지능은 예상을 훌쩍 뛰어넘는 속도로 발전하고 있다. 얼마 전 오픈 AI가 공개한 새로운 생성형 인공지능 모델은 이전 버전인 Chat GPT 4 터보를 소개한 지 불과 몇 개월 만에 다시 한번 세상을 놀라게 했다. 다음 날 맞불을 놓듯이 글로벌 빅테크 구글이 구글의 인공지능 ‘제미나이’ 시대를 선포했다. 이처럼 지금 인공지능 영역은 글로벌 빅테크들의 각축전이 벌어지고 있다. 인공지능을 활용한 빅테크들의 행보는 지금 어디에 이르렀는지 살펴보자.


제미나이 시대를 선언한 구글

제미나이 시대를 선포한 구글 개발자 콘퍼런스 I/O 2024

오픈 AI가 ‘GPT-4o’를 공개한 바로 다음 날, 구글 CEO 순다이 피차이는 연례 개발자 콘퍼런스 ‘I/O 2024’에서 구글이 개발한 인공지능 ‘제미나이(Gemini)’의 시대를 선포했다. “구글은 완전한 제미나이 시대에 들어섰다”라고 밝힌 순다이 피차이는 기조연설 중 ‘인공지능’을 무려 121번 언급했을 정도다. 구글은 인공지능 제미나이를 자사가 제공하는 서비스 대부분에 반영할 계획을 밝혔다. 검색 엔진부터 사진, 지도, 워크스페이스, 스마트폰 운영체제 안드로이드까지 제미나이를 적용해 한 단계 업그레이드된 서비스를 제공할 예정이다.

제미나이 시대에 들어선 구글이 소개한 가장 큰 변화는 검색, 바로 구글링이다. 구글은 새로운 검색 서비스 ‘AI 오버뷰’를 소개했다. 업계에서는 구글의 25년 만의 최대 변화라는 평가다. 기존의 검색 프로세스가 사용자가 직접 키워드를 입력하는 방식이었다면, ‘AI 오버뷰’는 키워드가 아니라 필요한 정보 조건을 한 번에 입력할 수 있다.

AI 오버뷰 적용에 따라 변화가 예상되는 구글의 검색 홈 화면
구글 포토에도 인공지능 ‘제미나이’가 적용될 전망이다.

예컨대 이번 시연에서 ‘보스턴 비컨힐에서 걸어서 30분 거리에 있고, 평점 4.1점 이상인 가장 좋은 요가나 필라테스 스튜디오를 찾아줘’라는 문장을 입력했는데, AI 오버뷰가 검색 요건에 맞는 결과를 도출해 줬다. 과거 키워드를 입력하고 스크롤을 내리며 일일이 찾던 필요한 정보를 단 몇 초 만에 확인할 수 있게 된 것. 해당 서비스는 빠르게는 이번 주부터 미국 내에서 사용 가능할 예정이다. 한편, 검색 엔진의 변화에 따라서 변하지 않는 검색 화면으로 유명했던 UX 디자인에도 변화가 가미될 지도 주목할 부분이다.

아울러 구글은 인공지능 기반의 동영상 생성형 모델 ‘비오(Veo)’도 함께 선보였다. 지난해 세간을 들썩이게 한 오픈 AI의 동영상 플랫폼 ‘소라’에 대항한 모델이다. 1분 이상 길이의 고화질 영상을 제작할 수 있다. 특히 타임랩스(timelaps)와 항공 촬영 풍경(aerial shots of a landscape)와 같은 영화 촬영 용어를 이해할 수 있는 점이 특징이다. 사람부터 동물, 사물이 영상 전체에서 사실적으로 표현되며, 일관된 움직임을 보여줘 일관성 있는 영상 제작이 가능한 툴이다.


사람처럼 말하는 인공지능, GPT-4o

생성형 인공지능 선두로 손꼽히는 오픈 AI가 지난 13일 새로운 인공지능 모델을 공개했다. 바로 ‘GPT-4o’. 이름에 들어간 영문자 ‘o’는 전체를 아우른다는 뜻의 라틴어 ‘옴니(Omni)’에서 가져왔다. 이전 버전인 GPT-4 터보에 비해 2배 빠르고, 비용은 50%를 줄였다. 무엇보다 앞서 출시된 인공지능 모델들이 텍스트를 입력하고, 답변을 얻는 것과는 다른 구동 방식으로 눈길을 끈다. GPT-4o는 텍스트는 물론 이미지와 음성 인식이 가능해 마치 눈앞에 있는 사람과 대화를 나누듯이 이야기를 주고받을 수 있다. 이처럼 다양한 인터페이스를 바탕으로 정보를 주고 받는 인공지능을 두고 멀티 모달(Multi Modal) AI라고 부르는데 GPT-4o는 완성형 멀티모달에 가깝다는 평가다.

오픈 AI는 새로운 인공지능 모델 소개와 함께 기능에 대해서 직접 시연을 선보여 눈길을 끌었다. 예컨대 무대 위에 올라온 시연자가 긴장된다고 말하자 GPT-4o가 숨을 크게 들이마시고 천천히 내쉬라며 호흡에 대한 조언을 건넸다. 그뿐만이 아니다. 첫 시연 행사라는 이야기를 듣고선 흥분되는 목소리로 신난다고 말하는 등 하나의 인격체에 가까운 모습을 보였다. 무엇보다 놀라운 건 대답을 건네는 반응 속도. 이전까지 인공지능과의 대화 경험에는 일종의 간격이 있기 마련이었다. 하지만 GPT-4o는 최소 232밀리초(ms), 평균 320밀리초(ms)의 속도로 대답을 건넬 수 있다. 이는 앞선 버전과 비교해 무려 20배가 증가한 속도로 실제 사람들 사이의 대화 중간에 끼어들어도 무리 없이 이어나갈 수 있을 정도의 수준이다.

오픈AI CEO 샘 알트먼은 자신의 소셜미디어 X에 GPT-4o 발표와 함께 ‘her’라는 글을 남겼다.

한편 오픈 AI의 이번 시연을 두고 많은 이들이 영화 <Her>를 언급했다. 영화에 등장하는 인공지능 비서 ‘사만다’가 현실에서 구현된 것과 다름없는 기술의 수준이라는 평가다. 심지어 오픈 AI의 CEO인 샘 올트먼도 GPT-4o의 공개를 앞두고 자신의 소셜미디어에서 ‘her’라는 피드를 올렸을 정도. 현재 GPT-4o는 무료로 사용할 수 있다. 유료로 사용할 경우 무료 사용자보다 5배 많은 질문이 가능하다.


생성형 인공지능 입은 어도비 군단

어도비는 지난해 3월 ‘파이어플라이’ 베타 버전을 출시했다.

디자이너를 비롯해 크리에이터와 가장 긴밀한 서비스를 제공하는 회사가 있다면 단연 어도비Adobe일테다. 어도비 또한 인공지능 시대에 뒤처지지 않기 위한 행보를 연일 이어가고 있다. 특히 지난해 3월 베타 버전으로 공개한 생성형 인공지능 툴 ‘파이어플라이’는 크리에이티브 신에서 큰 파장을 일으켰다. 특히 어도비가 제공하는 대표 서비스 중 하나이자 그래픽 디자인을 위한 가장 기본 툴이 되는 ‘포토샵’에 파이어플라이를 기반으로 한 기능을 추가해 주목받았다.

최근에는 ‘파이어플라이 이미지 3’를 공개했다. 기존 버전보다 이미지의 퀄리티가 향상된 것은 물론 디테일, 정확성, 다양성 측면에서도 확장된 이미지 생성 모델이다. 현재 파이어플라이 웹 앱, 어도비 포토샵, 그리고 어도비 인디자인에서 베타 버전으로 사용 가능하다. 아울러 지난 어도비 서밋Adobe Summit에서는 기업의 콘텐츠와 마케팅 관리를 위한 툴인 ‘젠스튜디오GenStudio’도 공개했다. 브랜드 가이드를 준수하는 콘텐츠를 기획, 제작, 관리, 배포, 그리고 측정까지 할 수 있도록 해주는 생성형 인공지능 도구이다. 디자인부터 마케팅 그리고 광고까지, 어도비의 인공지능 행보도 눈여겨봐야 할 이유이다.

관련 기사