MS '애저 AI'에 GPT-4o 탑재…속도·성능·멀티모달
소형 멀티모달AI 출시…코파일럿 기능 한단계 UP
마이크로소프트(MS)와 오픈AI 대 구글의 'AI 패권 전쟁'이 심화하고 있다. 오픈AI가 '현실판 자비스'로 불린 GPT-4o(포오)를 선보인 다음날 구글이 최신 AI모델 '제미나이'로 응수하자 일주일 만에 다시 MS가 자사 클라우드에 GPT-4o 탑재하며 맞불을 놨다.
마이크로소프트는 미국 워싱턴주 레드먼드에서 21일(현지 시각) 개최된 개발자 컨퍼런스 '빌드 2024'에서 이 같은 내용을 공개했다. 기조연설에 나선 사티아 나델라 MS 최고경영자(CEO)는 "모든 애저 AI 이용자들은 오늘부터 GPT-4o를 이용할 수 있게 된다"고 선언했다.
이날부터 GPT-4o는 MS의 AI 개발 플랫폼 '애저 AI 스튜디오'와 API에서 이용할 수 있다. GPT-4o는 오픈AI는 지난 13일 오픈AI가 공개한 최신 AI모델이다. 더 빨라진 속도와 이해 성능, 멀티모달 기능까지 적용돼 SF영화의 AI가 현실화했다는 평을 받았다.
MS는 이제 모든 웹사이트를 본질적으로 완전한 다중모델로 이용할 수 있다는 점을 강조했다. 이어 무대에 오른 라제시 자 MS 부사장은 "5만개 이상의 기업이 애저 AI를 이용하고 있다"며 "이제 이용자는 이미지·음성·텍스트에 응답할 수 있는 애플리케이션(앱)을 만들기 위해 GPT-4o를 사용해 자체 AI 모델인 코파일럿을 개발할 수 있다"고 설명했다.
시연 영상에선 MS가 운영하는 게임 ‘마인크래프트’를 하다 막혔을 때 이용자가 GPT-4o에게 도움을 요청하는 모습이 나왔다. 또 AI로부터 실시간 피드백을 받는 모습도 공개됐다.
예를 들어 이용자가 "하룻밤 캠핑 하이킹을 할건데 어둡고 추울 예정이다. (실물을 카메라에 보여주며) 이 신발을 신는 건 어떨까?"라고 물으면, AI가 "그건 제일 나은 선택이 아닙니다. 00부츠를 신읍시다. 장바구니에 추가하겠습니다. 결제할 준비가 됐나요?"라고 답하는 식이다.
음성을 인식하고 카메라를 통해 이미지를 확인한 다음 최적의 분석 결과를 내놓는 데 수초밖에 걸리지 않는다. 원하는 언어로 자유롭게 변경해 안내도 가능하다.
전날 새로운 윈도우 카테고리 '코파일럿+PC'를 공개한 MS는 이번 행사에서 AI 개발을 가속화하는 윈도우용 코파일럿 스택을 비롯해 팀 코파일럿, 코파일럿 스튜디오 등 50여가지 신규 솔루션을 소개한다. 자체 소형언어모델(SLM) 제품군인 파이-3(Phi-3)에 새로운 멀티모달 모델인 파이-3 비전(Phi-3 Vision)을 추가했다.
애저 코발트, AMD AI 가속기 가상머신 (AMD AI Accelerator VMs)도 공개한다. 애저 코발트 가상 머신은 맞춤형 반도체를 기반으로 사용자에게 폭넓은 효율성과 선택권을 제공하며, 팀즈와 같은 자체적인 애플리케이션 기능을 개선한다. 또 MS는 AMD의 MI300x AI 가속 칩을 가상머신에 통합한 최초의 클라우드 공급업체로, 이를 GPT-4에 최적화해 사용자의 AI 추론 및 학습 능력을 향상시킨다.
이날 MS의 빌드 2024 무대에는 샘 올트먼 오픈AI CEO가 깜짝 등장해 이목을 끌었다. 올트먼 CEO는 케빈 스코트 MS 최고기술책임자(CTO)와 무대에 올라 MS와의 끈끈한 협력관계를 다시 한 번 확인했다.
구글은 같은날 자사 주력 매출원인 광고에 생성형AI 도입하겠다고 발표했다. 앞서 구글은 지난 주 연례 개발자 회의(I/O)에서 검색 엔진에 자사 초거대AI '제미나이' 탑재를 알렸다. 가동비용에 대한 우려는 있지만 구글은 생성형AI 검색 서비스를 통해 광고 효율을 높이고 이는 수익성 증가로 연결시키겠다는 전략이다.