Google анонсировал ИИ Gemini для работы с аудио, фото и видео. Он будет доступен в трех версиях:

– Nano для решения простых задач. Её уже можно попробовать на смартфонах Pixel 8 Pro;
– Pro для сложных задач, которая с сегодняшнего дня работает в чат-боте Bard;
– Ultra самая мощная модель, которая обходит GPT-4 и GPT-4V, заработает в следующем году.

Разработчики смогут получить доступ к API от Gemini Pro уже 13 декабря.

Мы протестировали. Изображения определяет хорошо — может отличить объекты и прочитать код. Но почему-то пока не работает с лицами людей.

От