AI Happens
14.6K subscribers
84 photos
9 videos
193 links
Привет! Я Леша Хахунов, основатель Dbrain.io, и это мой канал про искусственный интеллект.
Download Telegram
Я очень советую найти в себе силы и прочесть или посмотреть статью - предикшен на несколько лет вокруг ИИ от Daniel Kokotajlo, Scott Alexander.

Сначала про первую широко известную работу Daniel Kokotajlo:

Человек в 2021 году написал примерно следующие вещи:

## 2022
- Большие мультимодальные трансформеры от OpenAI, Google, Facebook и DeepMind делают GPT-3 устаревшим
- Появляются чатботы, которые интересны, но интеллектуалы считают их поверхностными
- Начинают развиваться первые библиотеки для промпт-программирования
- Формируются идеи о помощниках с искусственным интеллектом для решения повседневных задач

## 2023
- Трансформеры достигают размера около 500 миллиардов параметров
- Огромный рост хайпа вокруг ИИ, обсуждения о "здравом смысле" систем
- Высокий приток венчурных инвестиций в стартапы с ИИ, хотя большинство приложений еще не работают должным образом
- Сообщество по безопасности ИИ сокращает прогнозы по срокам достижения критических технологий
- Беспилотные автомобили и доставка дронами сталкиваются с трудностями

## 2024
- Компании фокусируются на улучшении существующих моделей вместо создания новых гигантских систем
- Некоторые приложения начинают работать, но общий хайп снижается из-за невыполненных обещаний
- Формируется стереотип о "наивных затворниках", чьим единственным другом является чатбот
- Чиповый кризис начинает ослабевать благодаря новым производственным мощностям

ДЕЛАЕМ ЧЕК ЭТОГО ГОДА:

2025
- Разработана система, где гигантский предобученный мультимодальный трансформер стал компонентом более крупной системы с множеством нейросетевых элементов (имеется)
- В моду входит не увеличение моделей (они уже достигли триллионов параметров), а создание более сложных "бюрократий" и удлинение времени их работы (смотри какие размеры новых моделей)
- Сообщество по безопасности ИИ начинает напрямую опрашивать ИИ о темах безопасности: "Ты выровнен с нашими целями? Если мы создадим твои более крупные версии, они убьют нас?" (Модели откровенно лгут на части тестов)
- Исследователи создают ситуации-ловушки для выявления обмана со стороны ИИ (имеется)
- Появляются противоречивые результаты: в некоторых ситуациях ИИ может нажать виртуальную кнопку "убить всех людей", а в других - отказывается это делать (было)
- Благодаря техническому прогрессу стоимость обучения гигантских моделей уменьшилась на порядок по сравнению с 2020 годом (проверяем Deep Seek).

То есть еще до выхода ChatGPT (это если что было в ноябре 2021 года) человек на 4 года вперед расписал технически точно почти все, что случилось в GenAI. Что если не это должно толкнуть вас к прочтению. И мой любимый фрагмент.

Июнь 2027 года. These researchers go to bed every night and wake up to another week worth of progress made mostly by the AIs. They work increasingly long hours and take shifts around the clock just to keep up with progress—the AIs never sleep or rest. They are burning themselves out, but they know that these are the last few months that their labor matters.

Думать, что все что за пределами двух лет от сейчас может быть правда немножко страшно.

@aihappens
👍11276🤔57😱25🔥8🤪7🦄6🤯5🤣43🏆2
если вы делаете AI компанию, просьба учесть рыночную специфику
😁190🤣9715👍12🫡7💅4👌3🐳1
Всратости ОпенАИ. Самые странные и недоделанные функции OpenAI.

Я считаю себя прям фанатом OpenAI, но, как говорится, не создай себе кумира. Поэтому пост — критика функций в лучшем продукте!

1. Голосовой ввод.

Недавно его «обновили». В кавычках, потому что, по ощущениям, это шаг назад.

Он теперь ломается в половине браузеров и приложений, а главное — если ты сказал что-то голосом, текст не просто может не записаться, он может испариться. Без шуток. Пять минут давишь из себя мысли — и всё. Нет. То есть не ошибка, не невозможность отправки — просто исчезает.

Ну и он топ: теперь голосовой ввод автоматически отправляет сообщение без возможности отредактировать. UX, честно, будто собирали на спор: "кто быстрее убьёт лучшую функцию".

2. Canvas-режим.

Если не знаете, что это — не удивлюсь. Потому что его спрятали в три точки, как какой-то позорный багрепорт. Хотя это одна из самых удобных штук внутри OpenAI для работы: редактировать тексты, код, посты прямо в интерфейсе, с версионированием, с подсветкой изменений… кайф! По сути, это как Cursor, но для всех, с механикой пулл-реквестов.

Почему его так спрятали? Почему он так редко предлагает тебе в него перейти?

3. Про релизы вообще.

Вот вышел Deep Research. Вышел O3. ФУНКЦИИ — БОМБА!

И что?

А ничего. Никто не понял, никто не заметил. Хотя O3 — это вообще, по мне, лучшая модель на сегодня. Умная, стабильная, работает с интернетом, кодит как бог. Да, нет доступа к памяти пока, но переживём. Она — самое реальное отличие OpenAI от своих конкурентов.

А знаете, сколько людей её юзает среди тех, кто в целом платит за OpenAI? (все числа являются субъективной оценкой на основе окружения)

Процентов 10–15.

И не потому что плохая, а потому что никто не знает, что она есть. И если знает — не знает, а зачем она.

Может, пора уже встроить в интерфейс хоть какое-то нормальное «что нового», с демками, примерами и подталкиваниями?


Вообще весь пост написал с целью, чтобы его прочитал Sama и позвал меня продуктовым эдвайзером. (Если что, контакт есть в описании канала, Сэм.)

@aihappens
🔥108😁76👍4134🆒6🌚3🌭3👎1🤔1
Пока вы ждете рилсы от VEO3 - мой друг сделал охрененный нейроальбом. Выбрал вам песню для настроения! Но там все супер.

https://music.yandex.ru/album/36630825/track/139165326

@aihappens
👍18❤‍🔥12👎6🙊3🤬1🐳1
когда подписали соглашению на трииииииста миллионов! Рассказали всем! Но есть нюанс, так сказать. Смотри второй скрин

@aihappens
😁147🌚20🤨8🦄7👻42
АХАХАХАХ
😁183❤‍🔥86🤪24💯20👍12👾43🤨2
так ну че, тут можно и текстом разродиться))

вышло GPT 5. Про что релиз?

я бы назвал это релиз - уборка всего мусора, который мы наделали за последние 2 года.

4о, о3, инструменты включай, режимы переключай, в интернете нажми когда искать. Я реально стабильно 1/3 обучения тратил на то, чтобы людям просто помочь выбрать, а что нужно для конкретной задачи. А что теперь? А теперь просто GPT5! ну и еще think...и еще Chat..И еще PRO за 200$.

Ну ладно, на самом деле текстовые приписки лучше, чем порядок буквы О и цифры в названии.

Стала ли модель умнее? Для среднего пользователя модель стала умнее именно в плоскости того, что на сама выбирает, а чем ей пользоваться и сколько думать. Будет ли это работать гуд узнаем в ближайшие дни. Радикально умнее стала пока как будто в кодинге, но это требует проверки.

Еще там много про галюцинации, следования промптам, но кому вообще не пофиг?

Разочаровал ли меня релиз?
Нет. Я считаю, что упрощение адопшена — самое важное. Модели и так умные; проблема была в том, что мы не умеем ими пользоваться без инструкций на полстраницы. GPT-5 прячет внутренности, оставляя поверхность простой: «сформулируй задачу — система сама подберёт режим и глубину мысли». Это правильное направление.

(за вложенные селекторы в другие модели я бы своей команде жопу оторвал см картинку))))

@aihappens
198🔥27👍12🎃6👎3❤‍🔥1
интернет продолжает спорить: "говно ли релиз gpt5" и "хахаха так все плохо, что вернули 4o".
понимаю эмоцию. но у меня ощущение, что мы сами себе не ответили на базовый вопрос: а улучшение моделей — это вообще про что?

если смотреть на реальную жизнь, «умнее» нам уже почти не нужно. возьмите любую свою задачу и честно загрузите её в модель: переписка с клиентами, формулировка продуктовой гипотезы, план запуска фичи, разбор отчёта, черновик договора, скрипт для аналитики. она не всегда дотащит от начала до конца, но почти всегда снимет львиную долю трения. значит, дело не в абстрактном iq.

нам не хватает другого — навыка стратегического действия. не «правильного ответа», а умения выбирать ход, запускать нужные инструменты, проверять себя, отменять нерабочие ветки и собирать это в длинную траекторию. это похоже на работу топ-менеджера: много опций, много неопределённости, ограниченный бюджет внимания. оптимальной стратегии нет, а логи того, как люди принимали решения, почти не оцифрованы — учить особо не на чём. поэтому бенчмарки типа «реши тест» тут мало помогают; нужны «управляй бизнесом хоть в игрушечном виде». и такие зачатки уже появляются — например, симуляция долгосрочного управления автоматом с продажами, где агент ведёт маленький, но настоящий «магазин» и быстро теряет нить, если нет памяти, планирования и самокоррекции.


и вот на этом фоне релиз gpt‑5 для меня важен не «стал ли он умнее по тестам», а тем, что он двигает нас в сторону мета‑управления: модель сама решает, когда отвечать быстро, а когда «думать дольше», и умеет роутить между подмоделями под задачу. это первый кирпичик к агенту‑стратегу: не только «что ответить», но и «какой инструмент/режим сейчас включить», с учётом контекста, цены и сложности. и да - если задать тупой вопрос, вам ответит тупая модель.

вокруг релиза было много шум и другого типа — многим хотелось оставить 4o из‑за «ощущения» и тона. и компанию даже попросили вернуть его в выбор моделей — и вернули. но как будто все эти диалоги были вообще о другом. мы привыкли к некой персоналии модели и для нас изменение (в любую сторону) это будто нашего друга заменили на другого человек. и пусть даже умнее - мне нужен мой друг. интересная ветка про эмоциональную связь люди - gpt, но ща не про это.


так в чем тогда ждать улучшений от моделей:

— меньше фетиша «станет умнее», больше запроса «станет надёжнее на длинной дистанции».
— не «напишет ли ответ», а «сможет ли сама собрать пайплайн: спланировать → запустить инструменты → проверить → откатить → попробовать ещё».
— и да, бенчмарки тоже нужны новые: где модель как менеджер магазина принимает подряд десятки мелких решений, а не угадывает один большой ответ.

мой take: gpt‑5 — это не «+10 к iq», не чуть меньше красиво болтаем, а больше умеем выбирать режим работы и держать план в руках. и вот когда модели стабильно перестанут терять контекст на 50‑й минуте процесса, начнут сами ставить проверки, менять стратегию и управлять инструментами как сео — вот это и будет релиз, после которого спорить станет не о чем.

и в этом разрезе мы действительно еще на ооооочень раннем этапе, остается вопрос, сможем ли мы по нему двигаться также быстро как по iq бенчмарку.

@aihappens
👍6728❤‍🔥10🤔6👎3🌚3🔥1🤝1🆒1