당신의 현재 위치는:서울뉴스오피니언 > 여가
오픈AI "글자 입력하면 영상 생성" vs 구글 "1시간 동영상 한 번에 분석"
서울뉴스오피니언2024-03-29 23:11:37【여가】0사람들이 이미 둘러서서 구경했습니다.
소개멀티모달 AI '샅바 싸움'이 기사는 국내 최대 해외 투자정보 플랫폼 한경 글로벌마켓에 게재된 기사입니다.'여러 마리의 거대한 털북숭이 매머드가 눈 덮인 초원을 밟고 다가온다'는
멀티모달 AI '샅바 싸움'
‘여러 마리의 거대한 털북숭이 매머드가 눈 덮인 초원을 밟고 다가온다.’
이 같은 내용을 텍스트로 입력하자 매머드가 하얀 눈밭을 성큼성큼 걸어오는 영상이 등장했다. ‘두 척의 해적선이 커피 한 잔 안에서 항해하면서 서로 싸우는 모습을 사실적으로 클로즈업한 비디오’라고 입력하자 거친 파도를 일으키는 커피잔 속에서 대결을 벌이는 검은 해적선 영상이 만들어졌다.
이는 챗GPT 개발사인 오픈AI가 문자 명령어를 영상으로 변환해주는 새로운 인공지능 AI 모델 ‘소라’에서 만든 것들이다. 오픈AI는 15일(현지시간) 웹사이트를 통해 소라의 영상물을 소개하며 “실제 서비스에 앞서 피드백을 얻기 위해 다수의 시각 예술가, 디자이너, 영화제작자에게도 접근권을 부여했다”고 밝혔다.
AI 기술이 빠른 속도로 고도화하면서 빅테크 업체 간의 멀티모달 AI 경쟁이 본격화하고 있다. 멀티모달은 문서 이외에 이미지와 영상, 음성 등 다양한 데이터를 분석하고 추론할 수 있는 기술을 말한다. 생성AI 문서와 이미지에 이어 영상을 생성하는 분야에서도 기술 주도권 경쟁이 벌어지고 있다.
오픈AI에 따르면 소라는 최대 1분 길이의 영상을 제작할 수 있다. 기존 비디오 생성 AI가 4초 단위의 영상만이 제작했던 것에 비해 생성 능력이 많이 증가했다. 오픈AI 측은 “소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 묘사를 통해 복잡한 장면을 생성할 수 있다”며 “소라가 일반인공지능(AGI) 달성을 위한 중요한 이정표가 될 것”이라고 강조했다. 다만, 오픈AI는 소라가 공간적 세부사항을 혼동할 수 있고, 특정 카메라 궤적을 따라가는 데 어려움을 겪을 수 있다고 덧붙였다. 오픈AI는 영상이 소라에 의해 생성됐는지 식별할 수 있는 도구도 개발 중이다. 가짜 영상 유포 등으로 인한 부작용 등을 방지하기 위해서다.
같은 날 구글도 차세대 AI 모델 ‘제미나이 1.0 프로’의 업데이트 버전인 ‘제미나이 1.5 프로’ 공개하며 맞불을 놨다. 제미나이는 학습 규모에 따라 울트라·프로·나노로 나뉜다. 이날 공개한 제미나이 1.5 프로는 텍스트·이미지·음성·영상을 생성하는 중급 멀티모달 모델이다. 기존 모델을 개선하면서 구글의 최신 AI 모델인 ‘제미나이 1.0 울트라’와 비슷한 수준으로 성능을 높였다고 구글 측은 설명했다.
제미나이는 학습 규모에 따라 울트라·프로·나노로 나뉘는데, 이날 공개한 '제미나이 1.5 프로'는 구글의 최신 AI 모델인 '제미나이 1.0 울트라'와 비슷한 수준으로 텍스트·이미지·음성·영상을 생성하는 중형 멀티모달 모델이다. 구글에 따르면 제미나이 1.5 프로는 최대 100만개의 토큰 처리 능력을 갖췄다. 이는 기존 1.0 프로(3만200개)의 토큰 처리 규모를 30배 이상 확대한 것이다.
구글은 “제미나이 1.5 프로는 1시간 분량의 동영상과 11시간 분량의 음성 파일, 3만 줄 이상의 코드, 70만 단어 이상의 텍스트에 해당하는 방대한 정보를 한 번에 처리할 수 있다”고 설명했다. 실제로 데모 영상에서 구글은 미국 배우 버스터 키튼의 44분 분량의 영화 줄거리를 요약하는 모습을 보여줬다. 제미나이 1.5 프로는 영상을 분석한 뒤 영화 구성과 사건 등을 설명하고 놓치기 쉬운 세부 내용까지도 파악했다.
이들 외에 메타도 작년에 이미지 생성 모델인 ‘에뮤(Emu)’의 기능을 개선해 텍스트로 영상을 편집하고 생성할 수 있는 기능을 추가했다. 메타는 올해 엔비디아의 고성능 그래픽처리장치(GPU) 등을 수십만개를 구입해 자사 컴퓨팅 파워를 강화해 지금보다 더 강력한 AI 모델을 개발할 방침이다.
실리콘밸리=최진석 특파원 [email protected]
이 기사는 국내 최대 해외 투자정보 플랫폼 한경 글로벌마켓에 게재된 기사입니다.
'여러 마리의 거대한 털북숭이 매머드가 눈 덮인 초원을 밟고 다가온다'는 내용의 명령어를 입력하자 생성된 영상 중 일부. 자료 : 오픈AI
‘여러 마리의 거대한 털북숭이 매머드가 눈 덮인 초원을 밟고 다가온다.’
이 같은 내용을 텍스트로 입력하자 매머드가 하얀 눈밭을 성큼성큼 걸어오는 영상이 등장했다. ‘두 척의 해적선이 커피 한 잔 안에서 항해하면서 서로 싸우는 모습을 사실적으로 클로즈업한 비디오’라고 입력하자 거친 파도를 일으키는 커피잔 속에서 대결을 벌이는 검은 해적선 영상이 만들어졌다.
'두 척의 해적선이 커피 한 잔 안에서 항해하면서 서로 싸우는 모습을 사실적으로 클로즈업한 비디오'라는 명령어로 생성된 영상 중 일부 자료 : 오픈AI
이는 챗GPT 개발사인 오픈AI가 문자 명령어를 영상으로 변환해주는 새로운 인공지능 AI 모델 ‘소라’에서 만든 것들이다. 오픈AI는 15일(현지시간) 웹사이트를 통해 소라의 영상물을 소개하며 “실제 서비스에 앞서 피드백을 얻기 위해 다수의 시각 예술가, 디자이너, 영화제작자에게도 접근권을 부여했다”고 밝혔다.
AI 기술이 빠른 속도로 고도화하면서 빅테크 업체 간의 멀티모달 AI 경쟁이 본격화하고 있다. 멀티모달은 문서 이외에 이미지와 영상, 음성 등 다양한 데이터를 분석하고 추론할 수 있는 기술을 말한다. 생성AI 문서와 이미지에 이어 영상을 생성하는 분야에서도 기술 주도권 경쟁이 벌어지고 있다.
오픈AI에 따르면 소라는 최대 1분 길이의 영상을 제작할 수 있다. 기존 비디오 생성 AI가 4초 단위의 영상만이 제작했던 것에 비해 생성 능력이 많이 증가했다. 오픈AI 측은 “소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 묘사를 통해 복잡한 장면을 생성할 수 있다”며 “소라가 일반인공지능(AGI) 달성을 위한 중요한 이정표가 될 것”이라고 강조했다. 다만, 오픈AI는 소라가 공간적 세부사항을 혼동할 수 있고, 특정 카메라 궤적을 따라가는 데 어려움을 겪을 수 있다고 덧붙였다. 오픈AI는 영상이 소라에 의해 생성됐는지 식별할 수 있는 도구도 개발 중이다. 가짜 영상 유포 등으로 인한 부작용 등을 방지하기 위해서다.
같은 날 구글도 차세대 AI 모델 ‘제미나이 1.0 프로’의 업데이트 버전인 ‘제미나이 1.5 프로’ 공개하며 맞불을 놨다. 제미나이는 학습 규모에 따라 울트라·프로·나노로 나뉜다. 이날 공개한 제미나이 1.5 프로는 텍스트·이미지·음성·영상을 생성하는 중급 멀티모달 모델이다. 기존 모델을 개선하면서 구글의 최신 AI 모델인 ‘제미나이 1.0 울트라’와 비슷한 수준으로 성능을 높였다고 구글 측은 설명했다.
제미나이는 학습 규모에 따라 울트라·프로·나노로 나뉘는데, 이날 공개한 '제미나이 1.5 프로'는 구글의 최신 AI 모델인 '제미나이 1.0 울트라'와 비슷한 수준으로 텍스트·이미지·음성·영상을 생성하는 중형 멀티모달 모델이다. 구글에 따르면 제미나이 1.5 프로는 최대 100만개의 토큰 처리 능력을 갖췄다. 이는 기존 1.0 프로(3만200개)의 토큰 처리 규모를 30배 이상 확대한 것이다.
구글은 “제미나이 1.5 프로는 1시간 분량의 동영상과 11시간 분량의 음성 파일, 3만 줄 이상의 코드, 70만 단어 이상의 텍스트에 해당하는 방대한 정보를 한 번에 처리할 수 있다”고 설명했다. 실제로 데모 영상에서 구글은 미국 배우 버스터 키튼의 44분 분량의 영화 줄거리를 요약하는 모습을 보여줬다. 제미나이 1.5 프로는 영상을 분석한 뒤 영화 구성과 사건 등을 설명하고 놓치기 쉬운 세부 내용까지도 파악했다.
이들 외에 메타도 작년에 이미지 생성 모델인 ‘에뮤(Emu)’의 기능을 개선해 텍스트로 영상을 편집하고 생성할 수 있는 기능을 추가했다. 메타는 올해 엔비디아의 고성능 그래픽처리장치(GPU) 등을 수십만개를 구입해 자사 컴퓨팅 파워를 강화해 지금보다 더 강력한 AI 모델을 개발할 방침이다.
실리콘밸리=최진석 특파원 [email protected]
대박입니다!(98)
관련 기사
- 美 인태사령관 中, 2027년까지 대만 침공할 준비 마칠 것
- 코스피, 사흘만에 하락 마감 2,650대 후퇴…코스닥은 올라
- 강원랜드 "소통과 논의로 글로벌 복합리조트 도약"
- 보안기업 지니어스 작년 역대 최대 매출…영업이익은 6%대 감소
- 엘리자베스 2세와 6·25전쟁 [김태훈의 의미 또는 재미]
- [마켓톺] 저PBR 랠리 소외됐던 반도체주, 미국발 AI모멘텀에 '활짝'
- [속보] 중국, 디플레이션 우려 속 기준금리 6개월만에 전격 인하
- [마켓인사이트] 연휴 경계감 속 반등…'저PBR 랠리' 지속될까
- [인터뷰 전문] 홍영표 이재명, 트럼프 벤치마킹…조국혁신당은 민주당 또 다른 위성정당
- "가속화하는 산업계…사전적정성 검토제서 '패스트트랙' 필요"(종합)
인기 기사
역장추천
우정 링크
- 가족 모욕에 협박까지…안산이 화살 당긴 '악성리뷰' 일파만파
- 한국이 자극 방산 수출 빗장 푼 日의 진격, K파트너도 넘본다
- [뉴욕증시]FOMC 대기하며 S&P500 최고치…국채금리 ↓·엔비디아 1% ↑
- 비례 재선 '꽃길'에 조국 돌아온다…취지 거스른 비례대표제
- 층간소음에 전화했던 신혼부부, 어느 날 문 앞엔…[아살세]
- ‘0점 있다’고 웃었던 이재명, 박용진 득표율 직접 공개
- ‘0점 있다’고 웃었던 이재명, 박용진 득표율 직접 공개
- 트럼프 경제책사 나바로, 1·6사태 관련 의회 소환 거부로 수감
- 프랑스에서 샤넬백 살 때 '이 서류'만 있으면 관세 '0원'
- 日, 17년만에 기준금리 인상… 디플레 탈출해 ‘금리있는 세계’로
- 부양 필요한 中 '부동산' 띄운다…주담대 금리 '깜짝' 인하
- 머스크 인간 뇌에 칩 이식 환자, 생각만으로 마우스 조작
- 엔비디아 4.35% 급락, 하루새 시총 133조 증발(종합)
- 헤일리, 사우스캐롤라이나 중도층서 앞서지만 트럼프에 역부족
- 예멘 반군 미사일과 드론으로 이스라엘·미국 선박 공격
- 포드, 美 전기차 가격 최대 1천만원 인하…테슬라 주가 3%↓(종합)
- 중국 해경, 타이완 유람선 ‘무단 검문’…“공포에 떨었다”
- 美 ‘가자 휴전’ 안보리 결의에 세번째 거부권
- 머스크 “뇌에 칩 이식 환자, 생각만으로 마우스 조작 가능”
- 국제유가 1% 하락…심각한 中 수요 우려, 중동긴장 상쇄
- 중국, 영상 생성 AI 소라 등장에 '충격'…뉴턴 모멘트
- 헤일리, 사우스캐롤라이나 중도층서 앞서지만 트럼프에 역부족(종합)