JIINSI
기술 트렌드

구글의 새로운 '무엇이든 가능한' AI 모델, 제미나이 옴니 공개

구글 제미나이(Gemini) 옴니(Omni) 로고와 함께 다양한 미디어(텍스트, 이미지, 비디오) 아이콘이 유기적으로 연결된 그래픽
구글 제미나이(Gemini) 옴니(Omni) 로고와 함께 다양한 미디어(텍스트, 이미지, 비디오) 아이콘이 유기적으로 연결된 그래픽
구글(Google)이 새로운 '무엇이든 가능한' 에이아이(AI) 모델인 제미나이 옴니(Omni)를 공개하며 멀티모달(multimodal) 에이아이 분야에서 야심 찬 비전을 제시했습니다. 옴니는 텍스트, 이미지, 비디오, 음성 등 다양한 형태의 데이터를 동시에 이해하고 생성할 수 있는 능력을 갖춘 것으로 알려졌습니다. 작년에 구글이 시연했던 제미나이 광고에서 아이의 인형을 움직이는 이미지로 바꾸는 것과 같은 고도의 창작 활동을 이제는 더욱 자연스럽고 유연하게 수행할 수 있다는 것이 핵심입니다. 이는 기존의 단일 모달 에이아이 모델의 한계를 뛰어넘어, 인간의 인지 방식에 더 가깝게 다가서는 기술 진보를 의미합니다. 예를 들어, 사용자가 복잡한 시각적 정보를 설명하고 질문하면 옴니가 이를 분석하고 텍스트나 새로운 이미지로 응답할 수 있게 됩니다. 이러한 멀티모달 능력은 교육, 디자인, 미디어 콘텐츠 제작 등 다양한 산업에서 혁신적인 변화를 가져올 잠재력을 가지고 있습니다. 구글은 옴니를 통해 차세대 검색 경험을 제공하고 개인 비서 기능을 강화하는 등 자사 서비스 전반에 걸쳐 에이아이 역량을 확대할 계획입니다.
인사이트

구글 제미나이 옴니의 등장은 멀티모달 에이아이 기술의 진화를 상징하며, 인간의 인지 방식에 더욱 근접한 에이아이를 통해 다양한 산업의 혁신을 이끌 잠재력을 보여줍니다.

공유XTelegram

이 기사 어땠어요?

피드백을 남겨주시면 더 나은 맞춤 추천을 만듭니다.

이런 뉴스를 매일 받아보세요

매일 아침 7시, 그날의 정리를 이메일과 Telegram으로 받아보세요.