영화 〈Her〉가 현실로? 사람처럼 말하는 인공지능 ‘GPT-4o’

단순한 운영체제가 아닌 하나의 인격체?

오픈 AI가 보고, 듣고, 말하고, 심지어 농담도 가능한 인공지능 모델 'GPT-4o'를 공개했다.

영화 〈Her〉가 현실로? 사람처럼 말하는 인공지능 ‘GPT-4o’

생성형 인공지능 기업 오픈AI가 새로운 인공지능 모델 ‘GPT-4o’를 공개했다. 모두를 뜻하는 라틴어 ‘옴니(Omni)’에서 이름을 가져왔다. 텍스트를 입력해 결과를 도출하는 이전 버전의 모델과 달리 음성과 이미지 인식할 수 있는 점이 특징이다. 보고, 듣고, 말하는 마치 사람처럼 대화를 나눌 수 있는 인공지능의 탄생이다.

GPT-4o는 단순히 보고, 듣고, 말하는 것이 아니다. 대화의 뉘앙스나 맥락을 파악해 적절한 대답은 물론 농담도 가능하다. 특히 대화 중간에 끼어들어도 자연스럽게 이야기를 이어갈 수 있을 정도로 반응 속도도 빠르다. 음성 인식 후 대답까지 걸리는 시간은 최소 232밀리초(ms), 평균 320밀리초(ms)로 이는 인간의 대화 반응 속도와도 비슷한 수준이다.

오픈 AI는 GPT-4o 공개와 함께 다양한 상황과 기능에 대한 시연을 직접 선보였다. 한국어를 포함해 50개의 언어 기능을 갖추고 있는데 외국어 음성을 실시간으로 통역해 대화를 나누는 것부터 이미지 인식 기능으로 수학 문제를 풀이하고, 개발자의 코딩 내용을 검토하며, 심지어 스마트폰 두 대로 인공지능끼리 대화를 나누는 모습까지 소개했다.

상상을 초월한 인공지능 발전의 모습은 영화 <Her>를 떠올리게 한다. 인공지능 비서 ‘사만다’와 사랑에 빠진 남자 ‘테오도르’의 이야기다. 오픈AI CEO 샘 올트먼 역시 자신의 소셜미디어 피드에 ‘her’라는 글을 올려 눈길을 끌기도 했다. 아울러 오픈AI는 GPT-4o를 공개하면서 애플(Apple) 기기만 사용한 점도 눈길을 끈다. 이를 두고 애플이 기기에 오픈AI의 인공지능을 탑재하는 것 아니냐는 추측도 나오는 상황. 이는 오는 6월 10일 열릴 애플의 연례 개발자 콘퍼런스 행사 ‘WWDC 2024’ 에 귀추가 주목되는 또 다른 이유다.

한편 현재 GPT-4o는 텍스트와 이미지 기능만이 공개되었다. 음성 기능은 2~3주 후 공개될 예정이다.

관련 기사