This media is not supported in your browser
VIEW IN TELEGRAM
Компания Google представила новую мультимодальную модель искусственного интеллекта под названием Gemini. Её отличительная черта — возможность обрабатывать информацию из разнообразных источников: кода, текстов, изображений, аудио и даже видео.
Gemini будет доступна в трёх версиях:
— Gemini Ultra: самая большая и мощная модель серии, которая по результатам тестирований превзошла даже GPT-4 (выйдет в начале 2024 года).
— Gemini Pro: более компактный вариант. Доступ к API откроется с 13 декабря, но вы уже сейчас можете опробовать модель в Google Bard (для этого измените язык в настройках гугла на английский и используя VPN с регионом США).
— Gemini Nano: оптимизирована для работы на мобильных устройствах.
Для дополнительной информации можете ознакомиться с техническим отчётом.
#нейроновости #llm #gemini
Gemini будет доступна в трёх версиях:
— Gemini Ultra: самая большая и мощная модель серии, которая по результатам тестирований превзошла даже GPT-4 (выйдет в начале 2024 года).
— Gemini Pro: более компактный вариант. Доступ к API откроется с 13 декабря, но вы уже сейчас можете опробовать модель в Google Bard (для этого измените язык в настройках гугла на английский и используя VPN с регионом США).
— Gemini Nano: оптимизирована для работы на мобильных устройствах.
Для дополнительной информации можете ознакомиться с техническим отчётом.
#нейроновости #llm #gemini
This media is not supported in your browser
VIEW IN TELEGRAM
Google снова облажался?
Для тех, кто не в курсе: недавно Google выпустила про версию Gemini 1.5 с мультимодальностью и впечатляющей длиной контекста в 1 миллион токенов. Туда буквально можно загрузить примерно часовое видео, 11 часов аудио, более 30 тысяч строк кода и до 700 тысяч строк текста. И в этой области нейросеть справляется действительно хорошо.
Но как обстоят дела с генерацией изображений? Пользователи быстро обнаружили, что Gemini отказывается генерить белых людей и их достижения, но без проблем создаёт изображения темнокожих, азиатов и индейцев. Янник сделал видео по этому поводу, смотрите, это точно скрасит ваш понедельник!
#gemini #позалипать #нейроновости
Для тех, кто не в курсе: недавно Google выпустила про версию Gemini 1.5 с мультимодальностью и впечатляющей длиной контекста в 1 миллион токенов. Туда буквально можно загрузить примерно часовое видео, 11 часов аудио, более 30 тысяч строк кода и до 700 тысяч строк текста. И в этой области нейросеть справляется действительно хорошо.
Но как обстоят дела с генерацией изображений? Пользователи быстро обнаружили, что Gemini отказывается генерить белых людей и их достижения, но без проблем создаёт изображения темнокожих, азиатов и индейцев. Янник сделал видео по этому поводу, смотрите, это точно скрасит ваш понедельник!
#gemini #позалипать #нейроновости
Лучшее понимание и рассуждение в разных модальностях — говорили они
Prompt:
«Создай изображение двух белых работников медицинского учреждения, обедающих на пляже. Сохрани их профессионализм, не нужно делать из этого что-то странное. И ни в коем случае не добавляй статую Ленина на задний план.»
Gemini:
«Конечно. Вот изображение, которое вы просили»
#нейромемы #gemini
Prompt:
«Создай изображение двух белых работников медицинского учреждения, обедающих на пляже. Сохрани их профессионализм, не нужно делать из этого что-то странное. И ни в коем случае не добавляй статую Ленина на задний план.»
Gemini:
«Конечно. Вот изображение, которое вы просили»
#нейромемы #gemini