Мишин Лернинг 🇺🇦🇮🇱
7.93K subscribers
1.16K photos
141 videos
4 files
630 links
Субъективный канал об искусстве машинного обучения, нейронных сетях и новостях из мира искусственного интеллекта.
Download Telegram
🦁 Parti — Новый Text2Image от Google | DALL-E 1 Наносят ответный удар

Авторегрессионный подход к генерации казался уже в далеком прошлом. Все перекинулись в диффуз, и это вполне ожидаемо, глядя на успехи DALL-E 2 и Imagen. И да, Imagen от Google таки делает DALL-E 2. Но Google не успокоился.. Можно сказать что Google дернул OpenAI дважды:
▪️ Imagen > DALL-E 2
▪️ Parti > DALL-E 1

Встречайте: Pathways Autoregressive Text-to-Image model (Parti). И самое странное то, что Parti бьет Imagen по MS-COCO FID в Zero-Shot!

Всего Google обучил 4 модели:
350M - 14.10 FID
750M - 10.71 FID
3B - 8.10 FID
20B - 7.23 FID

Архитектруно Parti это трансформер энкордер-декодер работающий с текстовыми токенами и токенами ViT-VQGAN. Ну и спасибо LAION за датасет!

p.s.: Субъективно, я уже решил что лучше Parti или Imagen... Вроде текст у Parti лучше, но вот гановские артефакты чуть больше бесят, но вот фиксятся ли они каскадами апскейлеров хз..

💻 project
📄 paper
👾 GIT
@мишин лернинг
18👍9🔥5👎2
🏞 Random neural generations from Parti
🔥54👎4
Как вам качество картинок от нейросети Parti?
Anonymous Poll
33%
5
49%
4
16%
3
1%
2
1%
1
👍12👎4
Forwarded from DL in NLP (Vlad Lialin)
The last months be like
👍45🔥121👎1
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Я понимаю, что я всех достал с Dalle, но простите:

Сходил специально в галерею современного искусства, чтобы показать насколько просто и быстро нейронка генерирует разные варианты одной работы, делаешь фото, ждешь 20 секунд и готово.

Предвижу огромный срач в мире искусства на тему кто у кого что украл или позаимствовал когда Dalle откроют всем 🌚 это прям в промышленных масштабах можно идеи «перепридумывать», а потом рисовать по скетчу нейронки
32🔥14👍7👎1
💩 Телеграмм бот худшей сети 2022: dall-e mini

👉 @DALLEminiBot
👉 @CraiyonArtBot (зеркало)

p.s.: сгенерил эту тварь за вас, можете не тратить время..
🔥71👎233
😅 тут подписчик заметил, что dall-e mini думает, что оно — недоделанный дрон с камерой. вот что выходит, если запопросить DALL•E mini или dall-e mini

при этом, ressentiment на лицо: mini думает, что DALL•E 2 OpenAI — самолёт, а GPT-3 — поезд..

💩 @DALLEminiBot
🤮 @CraiyonArtBot (зеркало)
🔥36👍42👎1
🎮 привет из 90х от dalle2

имхо, очень правдоподобные повреждения вышли

https://t.iss.one/neuroesthetica
🔥25👍1👎1
🥑 DALL·E 2 Pre-Training Mitigations | OpenAI Blog Post

Тут только что вышел блокпост у OpenAI, где рассматривается сложности (реальные или наложенные новой этикой), с которым пришлось столкнуться OpenAI, чтобы была возможна генерации, пускай и в режими «элитарного клуба»..

p.s.: подождите немного, надеюсь, что у нас выйдет сделать что-то интересное 🎁


👉 Пост про DALL•E 2 от OpenAI
👍7👎2
🤖 Рекомендации от Мишин Лернинг

Сейчас стало очень много телеграмм каналов посвящённых ИИ. Большенство админов мои хорошие друзья и приятели. И я рад, что у нас сформировалось дружное и прогрессивное AI комьюнити.

Я сам последнее время занят в сфере мультимодалок и вот захотел поделиться с вами двумя каналами, админы которых — практикующие ресерчеры, которые как раз из этой тусовки.


🤖👨‍🎨 Канал ShonenkovAI

Админ — заслуженный Kaggle GM, автор известных аналогов DALL•E. Ресерчер и адепт опенсорса. Сейчас Shonenkov пишет, что уходит от корпораций и собирается делать ИИ доступным каждому. (чуть чуть осталось до 2000, поможем?)


🤖🤿 Канал Градиентное Погружение

Канал двух молодых ресерчеров, которые выиграли много ml соревнований. Ребята делают настоящий независимый ресерч. В канале обсуждают ml новости и новые сетки. (ребятам чуть чуть осталось до 1000, поможем?)

p.s.: Все только по любви, никакой рекламы.. Буду рад, если поддержите ребят подпиской 👍

@мишин лернинг
23👎5👍4🔥2
Forwarded from AI для Всех
Наглядное пособие по текстовым эмбедингам

Когда люди говорят о больших языковых моделях (LLM), вероятно, первое, что они обсуждают, - это возможность генерации текста, например, написание эссе.

Но языковые модели можно использовать и по-другому - для представления текста (text representation): для каждого текста мы можем получить набор чисел, которые каким-то образом отражают семантику текста. Эти числа называются текстовыми эмбедингами.

Сегодня мне на глаза попалась статья, в которой используется визуальный подход, для объяснения текстовых эмбедингов. Прочитав статью вы узнаете о том, для каких случаев они подходят и как их можно настроить с помощью файнтюнинга.

📖 Статья

@nn_for_science
👍19🔥4👎1