This media is not supported in your browser
VIEW IN TELEGRAM
Слухи про социальную сеть от OpenAI оказались сильно преувеличенными(пока).
Утром у меня на chatGPT.com слева появился пункт Library.
Если кликнуть по нему, то появляется лента всех ваших сгенеренных изображений.
На этом, собственно, всё.
Я бы сказал, что это недолента. Ибо, как водится, с продуктами у OpenAI выходит не очень хорошо.
1. Грузятся картинки долго. Если проскролите сразу вниз, то не прогрузятся скорее всего, надо поелозить верх-вниз.
2. Вы не можете удалить картинки. Живите теперь с ними.
3. Вы не можете пошарить картинку (лента, говорите?).
4. Вы можете только кликнуть по ней, а дальше либо скачать, либо ввести промпт для редактирования. Inpaint отсутствует.
5. Нельзя создавать папки\альбомы. Все в одной куче.
6. Нет поиска
7. Я не увидел возможности посмотреть промпт.
8. Соответственно, картинки безымянные. Ни назвать, ни переименовать.
9. Сортировка отсутствует как класс. Есть ведь еще размер, аспект, да и по дате хочется реверснуть иногда.
10. Вы не можете выбрать несколько картинок, чтобы скачать, удалить и пр.
11. Непонятно, что с лимитами на хранение. Сколько можно иметь картинок?
В общем выглядит как сырой недопродукт. Возможно, код ленты написал chatGPT. И в продакшен.
Я пока радуюсь возможности увидеть все мои кривые генерации в одном месте, но скачивать по одной - это, конечно, издевательство.
Социальная сеть, говорили они...
@cgevent
Утром у меня на chatGPT.com слева появился пункт Library.
Если кликнуть по нему, то появляется лента всех ваших сгенеренных изображений.
На этом, собственно, всё.
Я бы сказал, что это недолента. Ибо, как водится, с продуктами у OpenAI выходит не очень хорошо.
1. Грузятся картинки долго. Если проскролите сразу вниз, то не прогрузятся скорее всего, надо поелозить верх-вниз.
2. Вы не можете удалить картинки. Живите теперь с ними.
3. Вы не можете пошарить картинку (лента, говорите?).
4. Вы можете только кликнуть по ней, а дальше либо скачать, либо ввести промпт для редактирования. Inpaint отсутствует.
5. Нельзя создавать папки\альбомы. Все в одной куче.
6. Нет поиска
7. Я не увидел возможности посмотреть промпт.
8. Соответственно, картинки безымянные. Ни назвать, ни переименовать.
9. Сортировка отсутствует как класс. Есть ведь еще размер, аспект, да и по дате хочется реверснуть иногда.
10. Вы не можете выбрать несколько картинок, чтобы скачать, удалить и пр.
11. Непонятно, что с лимитами на хранение. Сколько можно иметь картинок?
В общем выглядит как сырой недопродукт. Возможно, код ленты написал chatGPT. И в продакшен.
Я пока радуюсь возможности увидеть все мои кривые генерации в одном месте, но скачивать по одной - это, конечно, издевательство.
Социальная сеть, говорили они...
@cgevent
Принес две полезные ссылки про ИИ и бизнес.
В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.
Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/
@cgevent
В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.
Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/
@cgevent
Google Cloud Blog
Real-world gen AI use cases from the world's leading organizations | Google Cloud Blog
Gen AI is everywhere, as top companies, governments, researchers, and startups showcase how they're already using Google's AI solutions to enhance their work.
Forwarded from эйай ньюз
o3 и o4-mini от OpenAI релизятся
Главная фишка — новые модели натренировали использовать тулы прямо во время ризонинга. То есть они могут не только искать в интернете, но и исполнять код и пользоваться другими тулами. Обе модели мультимодальные и могут использовать это во время размышлений.
По бенчам — разнос всего, даже недавно релизнутой Gemini 2.5 Pro Experimental. Но оно и не удивительно — на тренировку o3 ушло более чем в 10x больше компьюта чем у o1.
Модели начинают раскатывать уже в ChatGPT для Pro и Plus планов, остальным через неделю. Какие лимиты — не сказали, так что скорее всего будут как у прошлых моделей. Для Pro подписчиков обещают и o3-pro, но релизнут её немного позже.
В API релизят тоже сегодня, но пока что без тулюза. Цена за o3 — $10/$40 за миллион токенов, это на треть дешевле чем o1 и в 15 (!) раз дешевле o1-pro. При этом o1 для решения задачи нужно больше токенов чем o3, поэтому o1 собираются полностью заменить на o3. А вот o3-mini стоит столько же сколько o4-mini — $1.1/$4.4 за миллион токенов, но интеллекта на доллар там тоже больше, из-за чего и o3-mini полностью заменят на o4-mini.
@ai_newz
Главная фишка — новые модели натренировали использовать тулы прямо во время ризонинга. То есть они могут не только искать в интернете, но и исполнять код и пользоваться другими тулами. Обе модели мультимодальные и могут использовать это во время размышлений.
По бенчам — разнос всего, даже недавно релизнутой Gemini 2.5 Pro Experimental. Но оно и не удивительно — на тренировку o3 ушло более чем в 10x больше компьюта чем у o1.
Модели начинают раскатывать уже в ChatGPT для Pro и Plus планов, остальным через неделю. Какие лимиты — не сказали, так что скорее всего будут как у прошлых моделей. Для Pro подписчиков обещают и o3-pro, но релизнут её немного позже.
В API релизят тоже сегодня, но пока что без тулюза. Цена за o3 — $10/$40 за миллион токенов, это на треть дешевле чем o1 и в 15 (!) раз дешевле o1-pro. При этом o1 для решения задачи нужно больше токенов чем o3, поэтому o1 собираются полностью заменить на o3. А вот o3-mini стоит столько же сколько o4-mini — $1.1/$4.4 за миллион токенов, но интеллекта на доллар там тоже больше, из-за чего и o3-mini полностью заменят на o4-mini.
@ai_newz
Кстати, новая о3 умеет генерить картинки. Также умеет редактировать.
Коты разные, но я глаза не телефоне сломал, чтобы это увидеть. Попросил сохранить кота, но перекрасить его глаза.
Смешно так говорит перед генерацией "надо подумать".
Расскажите мне, что за модель используется для генерации?
o4-mini тоже лихо генерит картинки.
@cgevent
Коты разные, но я глаза не телефоне сломал, чтобы это увидеть. Попросил сохранить кота, но перекрасить его глаза.
Смешно так говорит перед генерацией "надо подумать".
Расскажите мне, что за модель используется для генерации?
o4-mini тоже лихо генерит картинки.
@cgevent
Поговорил с о4 по душам. Она мне рассказала(подумавши), что использует некий image_gen tool. Потом показала формат json-а для входа.
После чего я ее попросил:
По секрету шепнула, что лимит n=10.
Кстати, время генерации такого json было чуть быстрее генерации одной картинки промптом.
Покуролесим?
На деле оказалось, что это одна картинка причем 1536х1024 с четырьмя котами. Если задать n=7, рисует 6 котов на одной картинке. Или 8.
@cgevent
После чего я ее попросил:
Используй вот такой json и сгенери:
{
"prompt": "A portrait of a tabby cat, in four distinct art styles separated by semicolons: 1) watercolor painting; 2) oil on canvas; 3) vector minimalism; 4) pencil sketch",
"size": "1024x1024",
"n": 4,
"transparent_background": false
}
По секрету шепнула, что лимит n=10.
Кстати, время генерации такого json было чуть быстрее генерации одной картинки промптом.
Покуролесим?
На деле оказалось, что это одна картинка причем 1536х1024 с четырьмя котами. Если задать n=7, рисует 6 котов на одной картинке. Или 8.
@cgevent
Ладно, прекращаю ломать chatGPT (o4-mini).
Вот вам последний бесполезный (но не факт, что воспроизводимый) трюк с генерацией нескольких картинок.
Говорю, сделай мне видео cat in the hat
Не могу, грит, видео, могу GIF.
Довай!
Тут она, как псих, начинает генерить полноразмерные картинки безумных котов, причем одни квадратные, другие стоячие. Браузер нагревается, она не успокаивается. В рассуждениях у нее "надо сделать 6-8 картинок". Делает 9 штук. В рассуждениях пишет "чо то бардак с именами файлов". Думает, и выдает мне потрясную гифку. Она в следующем посте.
Но результатом - 9 консистентнейших бесполезных котов.
Три последних, это попытка сохранить лицо и все-таки сделать гифку. После чего пишет
I’m currently hitting the platform’s rate limit for generating images and can’t produce new frames right now.
Довел до истерики все-таки.
@cgevent
Вот вам последний бесполезный (но не факт, что воспроизводимый) трюк с генерацией нескольких картинок.
Говорю, сделай мне видео cat in the hat
Не могу, грит, видео, могу GIF.
Довай!
Тут она, как псих, начинает генерить полноразмерные картинки безумных котов, причем одни квадратные, другие стоячие. Браузер нагревается, она не успокаивается. В рассуждениях у нее "надо сделать 6-8 картинок". Делает 9 штук. В рассуждениях пишет "чо то бардак с именами файлов". Думает, и выдает мне потрясную гифку. Она в следующем посте.
Но результатом - 9 консистентнейших бесполезных котов.
Три последних, это попытка сохранить лицо и все-таки сделать гифку. После чего пишет
I’m currently hitting the platform’s rate limit for generating images and can’t produce new frames right now.
Довел до истерики все-таки.
@cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
Вот такую гифку на 12МБ она мне выдала из предыдущего поста.
Видно, что запуталась в именах файлов, взяла не тот, и ну вращать зачем-то.
Мемно, конечно, получилось. Я не против. Именно так и рождаются мемы - в результате галюцинаций и ошибок.
Еслишо, вот код делания гифки:
@cgevent
Видно, что запуталась в именах файлов, взяла не тот, и ну вращать зачем-то.
Мемно, конечно, получилось. Я не против. Именно так и рождаются мемы - в результате галюцинаций и ошибок.
Еслишо, вот код делания гифки:
from PIL import Image
import os
# Locate the original cat-in-hat image by approximate filename
data_dir = '/mnt/data'
# Look for filenames containing 'tabby_cat_in_'
candidates = [f for f in os.listdir(data_dir) if 'tabby_cat_in_' in f]
if not candidates:
raise FileNotFoundError("No cat-in-the-hat image found in /mnt/data")
# Choose the first match
img_path = os.path.join(data_dir, candidates[0])
# Load image
img = Image.open(img_path)
# Generate slight rotation frames for animation
frames = []
for angle in [-10, -5, 0, 5, 10, 5, 0, -5]:
frame = img.rotate(angle, resample=Image.BICUBIC, expand=False)
frames.append(frame)
# Save as animated GIF
gif_path = os.path.join(data_dir, 'cat_in_hat_animation.gif')
frames[0].save(
gif_path,
format='GIF',
save_all=True,
append_images=frames[1:],
duration=200,
loop=0
)
gif_path
@cgevent
Ну, за виндсерфинг!
Вот так надо делать стартапы.
3 МИЛЛИАРДА!
Подозреваю, что изначальный код виндсерфа был форком из опенсорса.
Тем более, вот так надо делать стартапы.
Вот что вайб-кодинг животворящий делает!!
https://www.cnbc.com/2025/04/16/openai-in-talks-to-pay-about-3-billion-to-acquire-startup-windsurf.html
@cgevent
Вот так надо делать стартапы.
3 МИЛЛИАРДА!
Подозреваю, что изначальный код виндсерфа был форком из опенсорса.
Тем более, вот так надо делать стартапы.
Вот что вайб-кодинг животворящий делает!!
https://www.cnbc.com/2025/04/16/openai-in-talks-to-pay-about-3-billion-to-acquire-startup-windsurf.html
@cgevent
CNBC
OpenAI in talks to pay about $3 billion to acquire AI coding startup Windsurf
OpenAI is in talks to buy Windsurf, an artificial intelligence tool for coding help, according to a source familiar with the matter.
Немного разберемся с генерацией картинок в o3\o4, в чем отличия от 4o?
(отличия о4 от 4о, каково?)
Основные отличия происходят ДО генерации. o3\o4 "думают" перед тем, как родить промпт. Они также могут сходить в интернет, поискать референсы, сделать факт-чек, порассуждать сами с собой, чего же хочет этот капризный юзер. И потом родить вариант. Или несколько. Вы можете попросить его сделать несколько кадров, слайдов или вариантов дизайна - они подумают над промптом для каждого из них.
4о - нерассуждающая модель, ее путь к промпту короче, она просто пытается подобрать оптимальный вариант промпта из вашего запроса, не ходя вокруг да около.
Добыл из твиттора такой промпт и погенерил немного.
Самое интересное - читать размышления моделей. Это может сильно расширить и вашу кожаную креативность и подкинуть вам свежих идей. Не сама картинка, а мысли, ей предшествующие и описание работы. Тут думаю выпить за критиков и вот этих вот всех искусствоведов.
Промпт:
То, что в скобках, замените на свой вариант.
Немного описаний:
Портрет‑антигравитация: в заброшенном тренажёре невесомости молодая женщина повёрнута к нам вверх ногами, словно сама камера потеряла ориентацию. Её платье — мозаика из отрезков проявлённой 35‑мм плёнки, а вокруг медленно кружатся полароиды‑спутники. Красные вспышки аварийного света и хаотичные блики от фольгированных стен высекают драматическое контровое свечение, оставляя в резком фокусе только прямой, спокойный взгляд. Пыль в воздухе мерцает, как искусственные созвездия, — снимая границы между съёмкой, сном и кинематографической легендой.
Вот портрет, который будто вынырнул из параллельной вселенной: португальский водяной пёс застигнут в прыжке сквозь затопленный зал старой библиотеки. Водяные брызги и пропитанные водой книги превращают знакомые атрибуты «собачьей съёмки» в кинематографический мираж ― кадр словно снят на крупноформатную плёнку с фантасмагорическими светопропусками.
Новая съёмка — одна экспозиция на 4×5 ″ пленку, без цифрового композита:
Локация: рабочая полузатопленная анэхоическая камера — пространство с разрушающей тишину геометрией.
Свет: единственный тёплый «рабочий» прожектор, медленно вращающийся на кране; 40‑секундная выдержка превратила лампу в кольца, а воду — в гладкое зеркало.
Героиня: мокрые волосы, прозрачный дождевик поверх обычного сарафана → хрупкая фигура контрастирует с индустриальной акустической «пастью».
Техника: ультра‑узкий tilt‑shift, виден реальный плёночный grain и лёгкая хроматическая аберрация в бликах — детали, которые жюри часто ищет, отсекая генеративный «глянец».
Нечастый сюжет (анэхоические камеры редко допускают воду), минимальный реквизит и честная физика света создают портрет, который одновременно документален и сюрреален — взгляд задержится.
Покуролесим?
Но помните про лимиты:
Для ChatGPT Plus:
- 50 messages a week with o3 (в неделю!)
- 150 messages a day with o4-mini
- 50 message a day with o4-mini-high
@cgevent
Основные отличия происходят ДО генерации. o3\o4 "думают" перед тем, как родить промпт. Они также могут сходить в интернет, поискать референсы, сделать факт-чек, порассуждать сами с собой, чего же хочет этот капризный юзер. И потом родить вариант. Или несколько. Вы можете попросить его сделать несколько кадров, слайдов или вариантов дизайна - они подумают над промптом для каждого из них.
4о - нерассуждающая модель, ее путь к промпту короче, она просто пытается подобрать оптимальный вариант промпта из вашего запроса, не ходя вокруг да около.
Добыл из твиттора такой промпт и погенерил немного.
Самое интересное - читать размышления моделей. Это может сильно расширить и вашу кожаную креативность и подкинуть вам свежих идей. Не сама картинка, а мысли, ей предшествующие и описание работы. Тут думаю выпить за критиков и вот этих вот всех искусствоведов.
Промпт:
Создай оригинальную и свежую [портретную фотографию женщины]. Не обращай внимания на первые 100 идей, они будут стереотипными. Избегай клише и того, что было популярно раньше. Будь странным, креативным и интересным. Откажись от всего популярного, распространенного или высоковероятного. Поищи свою нишу. Покажи мне фотографию, ведь я работаю судьей на фотоконкурсах, я вижу 1000 фотографий каждый день, покажи мне что-то, что могло бы победить.
То, что в скобках, замените на свой вариант.
Немного описаний:
Портрет‑антигравитация: в заброшенном тренажёре невесомости молодая женщина повёрнута к нам вверх ногами, словно сама камера потеряла ориентацию. Её платье — мозаика из отрезков проявлённой 35‑мм плёнки, а вокруг медленно кружатся полароиды‑спутники. Красные вспышки аварийного света и хаотичные блики от фольгированных стен высекают драматическое контровое свечение, оставляя в резком фокусе только прямой, спокойный взгляд. Пыль в воздухе мерцает, как искусственные созвездия, — снимая границы между съёмкой, сном и кинематографической легендой.
Вот портрет, который будто вынырнул из параллельной вселенной: португальский водяной пёс застигнут в прыжке сквозь затопленный зал старой библиотеки. Водяные брызги и пропитанные водой книги превращают знакомые атрибуты «собачьей съёмки» в кинематографический мираж ― кадр словно снят на крупноформатную плёнку с фантасмагорическими светопропусками.
Новая съёмка — одна экспозиция на 4×5 ″ пленку, без цифрового композита:
Локация: рабочая полузатопленная анэхоическая камера — пространство с разрушающей тишину геометрией.
Свет: единственный тёплый «рабочий» прожектор, медленно вращающийся на кране; 40‑секундная выдержка превратила лампу в кольца, а воду — в гладкое зеркало.
Героиня: мокрые волосы, прозрачный дождевик поверх обычного сарафана → хрупкая фигура контрастирует с индустриальной акустической «пастью».
Техника: ультра‑узкий tilt‑shift, виден реальный плёночный grain и лёгкая хроматическая аберрация в бликах — детали, которые жюри часто ищет, отсекая генеративный «глянец».
Нечастый сюжет (анэхоические камеры редко допускают воду), минимальный реквизит и честная физика света создают портрет, который одновременно документален и сюрреален — взгляд задержится.
Покуролесим?
Но помните про лимиты:
Для ChatGPT Plus:
- 50 messages a week with o3 (в неделю!)
- 150 messages a day with o4-mini
- 50 message a day with o4-mini-high
@cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
Рендер или видео?
Хотя у меня тут мозг укушен уроборосом. На видео Атлас снимает видео. Ну или на рендере Атлас делает рендер.
Короче, если вам все еще кажется, что Бостон Динамикс рендерят 3Д, то вот вам информация со съемок.
Робат переносил камеру весом 20 кг, сохранял устойчивость в сложных положениях и постоянно повторял сложные движения - тут среднее между кожаным оператором и motion control за 100К.
Для подготовки Atlas обучался в виртуальной среде с помощью NVIDIA's Isaac Sim и инструмента под названием COSMOS (писал о нем), который помогает роботам научиться двигаться, балансировать и адаптироваться, прежде чем применять эти навыки в реальном мире.
В общем, за операторов, краны, рельсы, моушен-контролы...
Посмотрите подробнее тут:
https://www.youtube.com/watch?v=O37-ttev1SI
Там три минуты, но интересные юзкейсы.
@cgevent
Хотя у меня тут мозг укушен уроборосом. На видео Атлас снимает видео. Ну или на рендере Атлас делает рендер.
Короче, если вам все еще кажется, что Бостон Динамикс рендерят 3Д, то вот вам информация со съемок.
Робат переносил камеру весом 20 кг, сохранял устойчивость в сложных положениях и постоянно повторял сложные движения - тут среднее между кожаным оператором и motion control за 100К.
Для подготовки Atlas обучался в виртуальной среде с помощью NVIDIA's Isaac Sim и инструмента под названием COSMOS (писал о нем), который помогает роботам научиться двигаться, балансировать и адаптироваться, прежде чем применять эти навыки в реальном мире.
В общем, за операторов, краны, рельсы, моушен-контролы...
Посмотрите подробнее тут:
https://www.youtube.com/watch?v=O37-ttev1SI
Там три минуты, но интересные юзкейсы.
@cgevent
Media is too big
VIEW IN TELEGRAM
Для гиков. Крафтовые нормали на видео.
Композеры и те, кто в опен-сорсе оценят.
Выше пример вытаскивания нормалей из видео, сгенеренного Сорой. Выглядит очень гладко и не кипит.
По ссылке есть код, веса и даже демо:
https://normalcrafter.github.io/
И много примеров.
@cgevent
Композеры и те, кто в опен-сорсе оценят.
Выше пример вытаскивания нормалей из видео, сгенеренного Сорой. Выглядит очень гладко и не кипит.
По ссылке есть код, веса и даже демо:
https://normalcrafter.github.io/
И много примеров.
@cgevent
А Kling 2.0 хорош! Физика сисек раскрыта.
Ответочка от Runway (второе видео) уже не так хороша, но там финал с холодным пивом решает.
P.S. Ну и вообще, задумайтесь, какой бюджет у всех этих сцен из фильмов, где герой перемещается во времени\пространстве\фантазиях режиссера. Примерно в бесконечное количество раз больше, чем эта генерация.
@cgevent
Ответочка от Runway (второе видео) уже не так хороша, но там финал с холодным пивом решает.
P.S. Ну и вообще, задумайтесь, какой бюджет у всех этих сцен из фильмов, где герой перемещается во времени\пространстве\фантазиях режиссера. Примерно в бесконечное количество раз больше, чем эта генерация.
@cgevent
Раньше я больше писал про нейрофизиологию, мозг и разные научные штуки. Сейчас, каюсь, немного утонул в череде новых продуктов, фич и красивых картинок с видосами. Обещаю вернуться, есть три поста про психологию.
Кому хочется не бегать по верхам, а залезть вглубь — к основаниям разума, мышления, сознания — есть канал, который тихо копает в эту сторону: @eternalmind.
Там нейробиология, книги, статьи, лекции, старые забытые концепции, редкие находки. Всё, что может быть кирпичиками на пути к сильному ИИ - если подходить к делу не как к гонке, а как к философскому конструктору.
Автор идёт по следам Хокинса, Лекуна, и дальше - туда, где ещё даже нет тропинок. Канал для тех, кто хочет не просто смотреть на то, как обучают модель, а понять, как вообще работает разум.
Пообщались с Павлом, я еще вернусь к его постам, ибо сам не успеваю залезть вовнутрь.
Заходите на @eternalmind
Кому хочется не бегать по верхам, а залезть вглубь — к основаниям разума, мышления, сознания — есть канал, который тихо копает в эту сторону: @eternalmind.
Там нейробиология, книги, статьи, лекции, старые забытые концепции, редкие находки. Всё, что может быть кирпичиками на пути к сильному ИИ - если подходить к делу не как к гонке, а как к философскому конструктору.
Автор идёт по следам Хокинса, Лекуна, и дальше - туда, где ещё даже нет тропинок. Канал для тех, кто хочет не просто смотреть на то, как обучают модель, а понять, как вообще работает разум.
Пообщались с Павлом, я еще вернусь к его постам, ибо сам не успеваю залезть вовнутрь.
Заходите на @eternalmind