ChatGPT против Gemini
Недавно выкладывал таблицу с LLM моделями внутри Perplexity - и вам такой формат контента зашел, а у меня его много, так как постоянно что-то с чем-то приходится сравнивать. Вот и сегодня будет таблица сравнения ChatGPT и Gemini: https://docs.google.com/spreadsheets/d/1SiSmj5shvXux4vV23RZ82voC6kl1jMBL_B0WOCICjcU/edit?usp=sharing
Недавно выкладывал таблицу с LLM моделями внутри Perplexity - и вам такой формат контента зашел, а у меня его много, так как постоянно что-то с чем-то приходится сравнивать. Вот и сегодня будет таблица сравнения ChatGPT и Gemini: https://docs.google.com/spreadsheets/d/1SiSmj5shvXux4vV23RZ82voC6kl1jMBL_B0WOCICjcU/edit?usp=sharing
✍10❤7👍5⚡2🔥2🙏2🤗1
Media is too big
VIEW IN TELEGRAM
Китай, конечно, уделывает весь мир в создании роботов. Недавно Unitree анонсировали нового - H2
1🔥39👍10💯6❤1👏1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Только все привыкли к Comet от Perplexity, а уже удалять… OpenAI, видимо, представит сегодня свой ИИ-браузер. Меньше чем через пару часов…
1🔥34🤣23😁4❤3👍2🦄2💯1😎1
Силиконовый Мешок
Только все привыкли к Comet от Perplexity, а уже удалять… OpenAI, видимо, представит сегодня свой ИИ-браузер. Меньше чем через пару часов…
Вот по этой ссылке будет трансляция (уже через час). И мы уже знаем, что называться браузер будет - ChatGPT Atlas
https://www.youtube.com/live/8UWKxJbjriY?si=Rum03fHyYkrpWhtt
https://www.youtube.com/live/8UWKxJbjriY?si=Rum03fHyYkrpWhtt
YouTube
Introducing ChatGPT Atlas
Introducing our new browser, ChatGPT Atlas.
Sam Altman, Will Ellsworth, Adam Fry, Ben Goodger, Ryan O’Rouke, Justin Rushing, and Pranav Vishnu introduce ChatGPT Atlas — our new browser. Now available globally on macOS. Windows, iOS, and Android are coming…
Sam Altman, Will Ellsworth, Adam Fry, Ben Goodger, Ryan O’Rouke, Justin Rushing, and Pranav Vishnu introduce ChatGPT Atlas — our new browser. Now available globally on macOS. Windows, iOS, and Android are coming…
🔥10❤7👍4👎1🤝1
Только сегодня полез смотреть, что за зверь этот DeepSeek OCR, хотя анонсировали его уже несколько дней назад. И я немного в шоке, что эта новость не особо форсится: ну выпустили очередную распознавалку изображений и что тут такого? А нифига, китайцы там очередную ML-революцию учинили, хотя есть подозрение, что Google был раньше, но молчал. Но давайте обо всём поподробнее.
Вы все уже знаете, что LLM оперирует токенами. Например, когда вы что-то пишете в ChatGPT, модель не читает это по буквам. Она разбивает ваш текст на токены - это могут быть целые слова (например, «мешок») или части слов (допустим, «силико-новый»). Для модели «силиконовый мешок» - это три текстовых токена. Модель работает с этими токенами, а не с буквами.
А когда вы работаете с мультимодальной моделью (которая понимает и текст, и картинки) и закидываете ей картинку, она тоже не «видит» там каждый пиксель - их миллионы, не хватит ресурсов.
Вместо этого модель делает следующее:
1) Нарезка (Patching): Модель «нарезает» изображение на сетку из небольших квадратиков, как мозаику. Эти квадратики называются «патчами» (patches).
2) Кодирование (Encoding): Затем специальная часть модели (энкодер) «смотрит» на каждый этот квадратик и превращает его в набор чисел (вектор).
3) Создание токена: Этот набор чисел (вектор), который описывает один квадратик изображения, и есть визуальный токен.
Для LLM этот визуальный токен просто говорит: «вот в этой части картинки находится вот такой набор линий, цветов и текстур».
И вот, допустим, вы загружаете в мультимодальную LLM несколько отсканированных страниц текста, где написано 10 000 слов. Как было раньше: модель нарезает эти сканы на тысячи квадратиков. Многие из этих квадратиков содержат лишь части букв или пустое белое пространство. Чтобы описать все эти бесполезные квадратики, ей требовалось, скажем, 60 000 визуальных токенов. А если бы вы просто скопировали и вставили эти 10 000 слов как текст, они превратились бы всего в 15 000 текстовых токенов. То есть визуальные токены были менее эффективны.
И тут на сцену выходит DeepSeek, который придумал, как сжимать информацию в 10 раз лучше визуальными токенами, чем текстовыми!
Теоретически, вы могли бы сохранить эти 10 000 слов всего в 1 500 их специально сжатых визуальных токенах.
Как я понял, они применили некий механизм визуальной памяти в своей модели. Это похоже на то, как вы ищете отрывок текста в уже прочитанной книге, представляя его визуально и зная, на какой стороне разворота и в каком месте страницы он был.
И главная прелесть DeepSeek в том, что они сделали все это open source с открытыми весами и объяснили, как они этого добились. Так что теперь каждый может это поизучать.
Даже если новая система сжатия визуальных токенов будет работать с бо́льшими потерями, сама возможность получить LLM с контекстным окном в 20 миллионов токенов - это очень круто.
А причем тут Google? - спросит внимательный читатель дочитавший до этого места. Есть подозрение, что подобное решение применяется в Gemini, но компания об этом умолчала.
Вы все уже знаете, что LLM оперирует токенами. Например, когда вы что-то пишете в ChatGPT, модель не читает это по буквам. Она разбивает ваш текст на токены - это могут быть целые слова (например, «мешок») или части слов (допустим, «силико-новый»). Для модели «силиконовый мешок» - это три текстовых токена. Модель работает с этими токенами, а не с буквами.
А когда вы работаете с мультимодальной моделью (которая понимает и текст, и картинки) и закидываете ей картинку, она тоже не «видит» там каждый пиксель - их миллионы, не хватит ресурсов.
Вместо этого модель делает следующее:
1) Нарезка (Patching): Модель «нарезает» изображение на сетку из небольших квадратиков, как мозаику. Эти квадратики называются «патчами» (patches).
2) Кодирование (Encoding): Затем специальная часть модели (энкодер) «смотрит» на каждый этот квадратик и превращает его в набор чисел (вектор).
3) Создание токена: Этот набор чисел (вектор), который описывает один квадратик изображения, и есть визуальный токен.
Для LLM этот визуальный токен просто говорит: «вот в этой части картинки находится вот такой набор линий, цветов и текстур».
И вот, допустим, вы загружаете в мультимодальную LLM несколько отсканированных страниц текста, где написано 10 000 слов. Как было раньше: модель нарезает эти сканы на тысячи квадратиков. Многие из этих квадратиков содержат лишь части букв или пустое белое пространство. Чтобы описать все эти бесполезные квадратики, ей требовалось, скажем, 60 000 визуальных токенов. А если бы вы просто скопировали и вставили эти 10 000 слов как текст, они превратились бы всего в 15 000 текстовых токенов. То есть визуальные токены были менее эффективны.
И тут на сцену выходит DeepSeek, который придумал, как сжимать информацию в 10 раз лучше визуальными токенами, чем текстовыми!
Теоретически, вы могли бы сохранить эти 10 000 слов всего в 1 500 их специально сжатых визуальных токенах.
Как я понял, они применили некий механизм визуальной памяти в своей модели. Это похоже на то, как вы ищете отрывок текста в уже прочитанной книге, представляя его визуально и зная, на какой стороне разворота и в каком месте страницы он был.
И главная прелесть DeepSeek в том, что они сделали все это open source с открытыми весами и объяснили, как они этого добились. Так что теперь каждый может это поизучать.
Даже если новая система сжатия визуальных токенов будет работать с бо́льшими потерями, сама возможность получить LLM с контекстным окном в 20 миллионов токенов - это очень круто.
А причем тут Google? - спросит внимательный читатель дочитавший до этого места. Есть подозрение, что подобное решение применяется в Gemini, но компания об этом умолчала.
🔥76❤25✍11👏9👍8 3💯2⚡1🤓1🤗1🦄1
Perplexity опубликовала большой документ, как применять ее решения в работе. Десятки страниц с промптами, инструкциями и лайфхаками, как лучше использовать Comet, Research, Labs, Spaces и т. д., чтобы повысить свою личную продуктивность.
Мне очень понравилась подача материала, не через сухой текст в формате «делай это, получишь такой результат», а через сторителлинг, где объясняется философия инструментов и как это можно использовать лично вам.
В общем, как я понял, они позиционируют Perplexity и браузер Comet как личных помощников или «экзоскелет для мозга», который усиливает импульсы, а не работает вместо вас.
Еще раз убеждаюсь, что инвестиция по цене пары чашек кофе за годовой Pro-аккаунт - это лучшее, что может сделать для себя любой сотрудник.
А документ я вам перевел на русский, читайте: https://teletype.in/@prompt_design/pplx-at-work
Мне очень понравилась подача материала, не через сухой текст в формате «делай это, получишь такой результат», а через сторителлинг, где объясняется философия инструментов и как это можно использовать лично вам.
В общем, как я понял, они позиционируют Perplexity и браузер Comet как личных помощников или «экзоскелет для мозга», который усиливает импульсы, а не работает вместо вас.
Еще раз убеждаюсь, что инвестиция по цене пары чашек кофе за годовой Pro-аккаунт - это лучшее, что может сделать для себя любой сотрудник.
А документ я вам перевел на русский, читайте: https://teletype.in/@prompt_design/pplx-at-work
Teletype
Perplexity в работе
"Введение"
6❤95🔥51👍18⚡3🤯2🦄2😘2❤🔥1🤣1🤓1
Если у вас есть время на этих выходных и непреодолимое желание разобраться в робототехнике и современных подходах на базе искусственного интеллекта — советую изучить новый курс от Hugging Face.
Он, конечно же, бесплатный и основан на «Robot Learning Tutorial», который создавался для их проекта Le Robot. Я, кстати, уже начал переводить его в формате конспектов, пока сам прохожу: https://docs.google.com/document/d/1dVZIDOmTeJe2DmFM4JzCdO1BZYFJ9qDqI2dKBrw5IDM/edit?tab=t.0
Он, конечно же, бесплатный и основан на «Robot Learning Tutorial», который создавался для их проекта Le Robot. Я, кстати, уже начал переводить его в формате конспектов, пока сам прохожу: https://docs.google.com/document/d/1dVZIDOmTeJe2DmFM4JzCdO1BZYFJ9qDqI2dKBrw5IDM/edit?tab=t.0
1❤18✍12🔥9👍3👏2🤗2🤝1
Силиконовый Мешок
Если у вас есть время на этих выходных и непреодолимое желание разобраться в робототехнике и современных подходах на базе искусственного интеллекта — советую изучить новый курс от Hugging Face. Он, конечно же, бесплатный и основан на «Robot Learning Tutorial»…
This media is not supported in your browser
VIEW IN TELEGRAM
Кстати, о роботах. Недавно в китайском Ханчжоу состоялась робоконференция — IROS 2025. Выглядит довольно весело
❤19🔥12🤣6🤯5👍4
Интересный сабреддит завирусился несколько дней назад на Реддите. Люди, которые потеряли работу из-за ИИ, делятся своими историями. Сначала я просто почитывал их, а потом решил расчехлить Cursor, спарсить RSS-поток с комментариями и подсчитать, в каких областях замещение «кожаных» на «силиконовых» идет особенно бурно. Результат вы можете посмотреть на графике, а самые интересные истории я перевел и их можно почитать тут: https://teletype.in/@prompt_design/people-who-lost-their-jobs-to-AI
1❤33👍15🤯13👏3🦄2⚡1🔥1😁1🤬1💯1
В последнее время немного закопался в биг-дату, и я не про анализ комментариев на Реддите. Сижу копаю бесконечные датасеты на Hugging Face: сколько же всего люди нафотографировали, напарсили и написали - уму непостижимо.
Вот, например, база на 5 млн строк уличных фотографий авомобилей с указанием модели, цвета и других параметров. Так как датасет российский (одной известной компании), можно узнать, какие самые популярные цвета и типы кузова катаются по местным дорогам. А еще удивиться, что почти 2% машин сфотографированы - ночью.
Вот, например, база на 5 млн строк уличных фотографий авомобилей с указанием модели, цвета и других параметров. Так как датасет российский (одной известной компании), можно узнать, какие самые популярные цвета и типы кузова катаются по местным дорогам. А еще удивиться, что почти 2% машин сфотографированы - ночью.
❤7😁7👍4🤗4🔥2👏1🤓1
Павел Дуров сегодня на форуме Blockchain Life 2025 в Дубае объявил о запуске - Cocoon, (Confidential Compute Open Network). Децентрализованная сеть, где разработчики смогут разворачивать ИИ-модели, а владельцы графических процессоров (GPU), будут получать вознаграждение тонкоинах за сдачу своих мощностей.
🔥72❤22👏9👍5😱2🤬1💊1
Силиконовый Мешок
Павел Дуров сегодня на форуме Blockchain Life 2025 в Дубае объявил о запуске - Cocoon, (Confidential Compute Open Network). Децентрализованная сеть, где разработчики смогут разворачивать ИИ-модели, а владельцы графических процессоров (GPU), будут получать…
This media is not supported in your browser
VIEW IN TELEGRAM
С того же самого выступления, где Паша презентовал Cocoon.
Поднимите руку, кого заскамили через Telegram Mini Apps? О-о-у, немало рук в зале, неожиданно. Я лично не знаю никого, кого заскамили. Зато все мои друзья стали богаче
🤣94👏7😁5👍3❤2💯2
Силиконовый Мешок
Павел Дуров сегодня на форуме Blockchain Life 2025 в Дубае объявил о запуске - Cocoon, (Confidential Compute Open Network). Децентрализованная сеть, где разработчики смогут разворачивать ИИ-модели, а владельцы графических процессоров (GPU), будут получать…
Кстати, сегодня досмотрел подкаст Соколовского с братьями Либерман, которые рассказывали про свой новый проект «Gonka» - тоже сеть распределённых GPU-мощностей с вознаграждением майнеров токенами. Как и у Павла. А еще Либерманы рассказали, как два года назад приходили с этой идей к братьям Дуровым:
"— Давид Либерман: Мы как раз с Дуровым два года назад обсуждали, что единственная альтернатива — это децентрализация. Потому что децентрализация может сделать это таким дешёвым, что [каждый может себе позволить это внедрение]. Но тогда Николай [Дуров] сказал, что децентрализация не сработает."
🤣48👍16🔥9❤4😁1💯1
Еще никогда нас так тщательно не изучали, как сейчас…
ChatGPT, Gemini, Claude и другие сервисы постоянно выцеживают информацию о нас из наших же запросов к ним: что нас интересует, чем увлекаемся, над чем работаем и что ищем в сети…
Например, если написать Perplexity «покажи подробные заметки о персонализации, которые ты обо мне хранишь» — вы увидите довольно много интересной информации о себе. Но только не забудьте сначала отключить веб-поиск, нажав на иконку «глобус».
А еще можно зайти в раздел «Personalization»
Как бы я был рад покопаться в датасете на 22 млн строк из интересов пользователей…
ChatGPT, Gemini, Claude и другие сервисы постоянно выцеживают информацию о нас из наших же запросов к ним: что нас интересует, чем увлекаемся, над чем работаем и что ищем в сети…
Например, если написать Perplexity «покажи подробные заметки о персонализации, которые ты обо мне хранишь» — вы увидите довольно много интересной информации о себе. Но только не забудьте сначала отключить веб-поиск, нажав на иконку «глобус».
А еще можно зайти в раздел «Personalization»
— там в меню «Memory» есть ваши «saved memories». В этом разделе (если вы не отключили сохранение данных о вас) информация уже размечена хэштегами: #Language (Язык), #Travel (Путешествия), #Interests (Интересы), #Work (Работа), #Projects (Проекты).Как бы я был рад покопаться в датасете на 22 млн строк из интересов пользователей…
❤31🔥22😁5✍4🤯3💯3👏2🤗2🙏1
Обвешался я этими ИИ-браузерами в надежде понять, какой из них самый удобный в работе.
С одной стороны, Atlas более нативный в плане общения с ассистентом, а с другой, Comet больше фич имеет. Но я вам так скажу, работаю я все равно в Mozilla — хоть он и тупой, как пробка.
Но вы просили делиться опытом работы с ИИ-браузерами, так что начнем с Comet от Perplexity (годовую подписку на который все еще можно купить за несколько баксов).
1) Чтобы Comet Agent не просто искал, а делал за вас (заполнял формы, управлял вкладками), начните свой запрос с волшебной фразы: «Возьми управление моим браузером и...»
2) Когда открыто несколько вкладок, можно «тэгать» их в своем запросе.
Пример: Откройте два сайта и напишите: «Сравни цены и характеристики в @[tab1] и @[tab2], а затем создай сводную таблицу».
3) Для повторяющихся задач (например, «собрать еженедельный отчет») можно настроить быстрые команды. После этого достаточно будет ввести / в браузере и выбрать ее.
Пример: Создайте команду /prep-next-meeting с инструкцией: «Подготовь меня к следующей встрече: список участников, цели, повестка и что мне нужно просмотреть».
4) Comet может управлять открытыми вкладками. Пример: «Сгруппируй вкладки по темам и закрой все, что не относится к моему текущему проекту» или «Закрой все вкладки с соцсетями, оставь только рабочие сайты», а еще можно попросить: «Открой список всех вкладок по теме "маркетинг" за эту неделю».
5) Удобно, что можно выделить текст на странице, нажать правую кнопку и выбрать «Открыть в ассистенте», чтобы работать с конкретным куском текста, а не всей страницей.
6) А еще я сделал файлик со своими данными и описанием проекта, которые обычно запрашивают, когда подаешься на гранты от ИИ-компаний (кто-то токены дает, кто-то хостинг).
Пример: «Подай заявку на грант, открытую в этом окне, используя данные из файла».
7) Ну и использую Comet Assistant для «второго мнения».
Пример: «Проанализируй этот контракт и выдели потенциальные юридические риски», «Сделай факт-чекинг финансовых данных в этом посте» или «Сделай подробное саммари и дай все ссылки, упомянутые в этом видео».
С одной стороны, Atlas более нативный в плане общения с ассистентом, а с другой, Comet больше фич имеет. Но я вам так скажу, работаю я все равно в Mozilla — хоть он и тупой, как пробка.
Но вы просили делиться опытом работы с ИИ-браузерами, так что начнем с Comet от Perplexity (годовую подписку на который все еще можно купить за несколько баксов).
1) Чтобы Comet Agent не просто искал, а делал за вас (заполнял формы, управлял вкладками), начните свой запрос с волшебной фразы: «Возьми управление моим браузером и...»
2) Когда открыто несколько вкладок, можно «тэгать» их в своем запросе.
Пример: Откройте два сайта и напишите: «Сравни цены и характеристики в @[tab1] и @[tab2], а затем создай сводную таблицу».
3) Для повторяющихся задач (например, «собрать еженедельный отчет») можно настроить быстрые команды. После этого достаточно будет ввести / в браузере и выбрать ее.
Пример: Создайте команду /prep-next-meeting с инструкцией: «Подготовь меня к следующей встрече: список участников, цели, повестка и что мне нужно просмотреть».
4) Comet может управлять открытыми вкладками. Пример: «Сгруппируй вкладки по темам и закрой все, что не относится к моему текущему проекту» или «Закрой все вкладки с соцсетями, оставь только рабочие сайты», а еще можно попросить: «Открой список всех вкладок по теме "маркетинг" за эту неделю».
5) Удобно, что можно выделить текст на странице, нажать правую кнопку и выбрать «Открыть в ассистенте», чтобы работать с конкретным куском текста, а не всей страницей.
6) А еще я сделал файлик со своими данными и описанием проекта, которые обычно запрашивают, когда подаешься на гранты от ИИ-компаний (кто-то токены дает, кто-то хостинг).
Пример: «Подай заявку на грант, открытую в этом окне, используя данные из файла».
7) Ну и использую Comet Assistant для «второго мнения».
Пример: «Проанализируй этот контракт и выдели потенциальные юридические риски», «Сделай факт-чекинг финансовых данных в этом посте» или «Сделай подробное саммари и дай все ссылки, упомянутые в этом видео».
❤48👍28🔥12👏4✍1💯1🤗1👾1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот это я понимаю праздничный апдейт прошивки (это если что робот Unitree G1)
🤣55🔥19❤7🤯4👾3😭2😇2👏1😁1💯1
Силиконовый Мешок
Возможно я становлюсь фанатом техники от EcoFlow, но взял еще и их повербанк. И это пушка-бомба: заряжается до 100% менее чем за час, а телефону отдает по кабелю почти 30 Вт, что тоже заряжает его почти за час. Два порта работают в обе стороны (и заряжает…
Первый раз попробовал зарядить от этого малыша ноутбук - офигел, что он больше 60 ватт отдает. Все еще помню, как удивлялся комплектной зарядке MacBook Air на 30 Вт… а тут коробочка с ладонь за 15 минут заряжает ноутбук (!) наполовину.
🤯22❤16🔥11👍2😍2👾2⚡1❤🔥1💯1
Немного улегся новостной хайп и откровенные вбросы после реструктуризации OpenAI. Кто-то пишет, что Альтману выдали долю в новой компании, а кто-то говорит о том, что они переписали определение AGI (сильный ИИ) и вообще закрыли некоммерческую компанию. На самом деле, вся информация об изменениях есть в открытых источниках.
Вот краткая сводка основных фактов:
⁃ У OpenAI уже несколько лет существует основная коммерческая компания LLC (организация, занимающаяся основными исследованиями и созданием продуктов) и non-profit (некоммерческая организация). Теперь они преобразовали свою LLC в PBC (public benefit company - компанию, работающую на общественное благо), которая, как и некоммерческая организация, теперь несет юридические обязательства сделать так, чтобы AGI «приносил пользу всему человечеству».
⁃ У прежней коммерческой компании (LLC) было ограничение прибыли в 100-кратном размере (100X) для каждого инвестора (на его долю, как я понял), тогда как у нынешней PBC (новой компании) такого ограничения нет.
⁃ Структура собственности PBC (новой компании) распределена следующим образом: Microsoft владеет 27%, некоммерческая организация OpenAI - 26%, сотрудники OpenAI - 26%, а другие инвесторы - оставшиеся 21%.
⁃ Некоммерческая организация теперь оценивается в 130 миллиардов долларов (ранее у нее не было публичной оценки) и берет на себя первоначальное обязательство потратить 26 миллиардов долларов на: здравоохранение, лечение болезней и «устойчивость ИИ» (AI resilience), а также экономическое влияние, кибербезопасность и многое другое, что будет взаимодействовать с искусственным интеллектом.
⁃ Как только OpenAI объявит о создании AGI, эта информация будет проверяться независимой экспертной комиссией. Их уставное определение AGI не изменилось: «высокоавтономные системы, которые превосходят людей в большинстве видов экономически ценной работы».
⁃ Права Microsoft на интеллектуальную собственность (ИС) в области исследований, определяемые как конфиденциальные методы, используемые при разработке моделей и систем, сохранятся либо до тех пор, пока экспертная комиссия не подтвердит создание AGI, либо до 2030 года, в зависимости от того, что наступит раньше. А вот права Microsoft на модели и продукты OpenAI (за исключением аппаратных продуктов) продлены до 2032 года и теперь включают модели, созданные после AGI, с соответствующими мерами безопасности.
⁃ Директора PBC (новой компании) будут обязаны учитывать только миссию (и не могут учитывать денежные (финансовые) интересы акционеров или любые другие интересы) в вопросах безопасности и защиты, связанных с предприятием OpenAI и его технологиями.
⁃ В течение одного года после рекапитализации (изменения структуры капитала) в правлении некоммерческой организации будет как минимум два директора (включая председателя Комитета по безопасности и защите), которые не будут входить в правление PBC.
⁃ OpenAI объявила о своих планах по запуску «автоматизированных ИИ-стажеров-исследователей» на сотнях тысяч GPU к сентябрю 2026 года и «полностью автоматизированных ИИ-исследователей» к марту 2028 года.
⁃ OpenAI теперь имеет утвержденные планы по развертыванию около 30 ГВт (GW) вычислительных мощностей на общую сумму 1,4 триллиона долларов в течение следующих нескольких лет (срок не уточняется - 5, 10 лет или более). Долгосрочная цель - в конечном итоге построить «фабрику ИИ», которая сможет производить 1 ГВт в неделю (52 ГВт в год).
Официальные обязательства по реструктуризации OpenAI на Delaware.gov, 28 октября
Официальная информация OpenAI о их новой структуре компании и их новом соглашении с Microsoft
Официальная информация OpenAI об их предыдущей структуре компании
Вот краткая сводка основных фактов:
⁃ У OpenAI уже несколько лет существует основная коммерческая компания LLC (организация, занимающаяся основными исследованиями и созданием продуктов) и non-profit (некоммерческая организация). Теперь они преобразовали свою LLC в PBC (public benefit company - компанию, работающую на общественное благо), которая, как и некоммерческая организация, теперь несет юридические обязательства сделать так, чтобы AGI «приносил пользу всему человечеству».
⁃ У прежней коммерческой компании (LLC) было ограничение прибыли в 100-кратном размере (100X) для каждого инвестора (на его долю, как я понял), тогда как у нынешней PBC (новой компании) такого ограничения нет.
⁃ Структура собственности PBC (новой компании) распределена следующим образом: Microsoft владеет 27%, некоммерческая организация OpenAI - 26%, сотрудники OpenAI - 26%, а другие инвесторы - оставшиеся 21%.
⁃ Некоммерческая организация теперь оценивается в 130 миллиардов долларов (ранее у нее не было публичной оценки) и берет на себя первоначальное обязательство потратить 26 миллиардов долларов на: здравоохранение, лечение болезней и «устойчивость ИИ» (AI resilience), а также экономическое влияние, кибербезопасность и многое другое, что будет взаимодействовать с искусственным интеллектом.
⁃ Как только OpenAI объявит о создании AGI, эта информация будет проверяться независимой экспертной комиссией. Их уставное определение AGI не изменилось: «высокоавтономные системы, которые превосходят людей в большинстве видов экономически ценной работы».
⁃ Права Microsoft на интеллектуальную собственность (ИС) в области исследований, определяемые как конфиденциальные методы, используемые при разработке моделей и систем, сохранятся либо до тех пор, пока экспертная комиссия не подтвердит создание AGI, либо до 2030 года, в зависимости от того, что наступит раньше. А вот права Microsoft на модели и продукты OpenAI (за исключением аппаратных продуктов) продлены до 2032 года и теперь включают модели, созданные после AGI, с соответствующими мерами безопасности.
⁃ Директора PBC (новой компании) будут обязаны учитывать только миссию (и не могут учитывать денежные (финансовые) интересы акционеров или любые другие интересы) в вопросах безопасности и защиты, связанных с предприятием OpenAI и его технологиями.
⁃ В течение одного года после рекапитализации (изменения структуры капитала) в правлении некоммерческой организации будет как минимум два директора (включая председателя Комитета по безопасности и защите), которые не будут входить в правление PBC.
⁃ OpenAI объявила о своих планах по запуску «автоматизированных ИИ-стажеров-исследователей» на сотнях тысяч GPU к сентябрю 2026 года и «полностью автоматизированных ИИ-исследователей» к марту 2028 года.
⁃ OpenAI теперь имеет утвержденные планы по развертыванию около 30 ГВт (GW) вычислительных мощностей на общую сумму 1,4 триллиона долларов в течение следующих нескольких лет (срок не уточняется - 5, 10 лет или более). Долгосрочная цель - в конечном итоге построить «фабрику ИИ», которая сможет производить 1 ГВт в неделю (52 ГВт в год).
❤16✍3 3⚡2🔥2👍1🙏1💯1🦄1
Гранты для ИИ-проектов
Недавно выкладывал пост про ИИ-браузеры, но самый популярный вопрос в комментариях был не про браузеры, а про кейс с автоматическим заполнением заявок на гранты. Точнее, комментаторы удивлялись, что вообще можно какие-то гранты получать, а я, в свою очередь, удивлялся, что мало кто знает про такие программы. Ну и решил сделать отдельный пост про это.
Довольно много крупных ИТ-компаний, особенно в сфере ИИ, имеют грантовые программы; живые деньги там получить сложно, а вот раздобыть ресурсов в виде токенов для LLM, мощностей для вычислений или облачного хостинга довольно просто. Основные требования - это рабочий сайт и корпоративный email. Кто-то просит предоставить прототип или MVP продукта. Так что, если у вас есть проект и вы хотите существенно сэкономить на хостинге и токенах, начните с этого списка:
1) Google Cloud - Дают от $2,000 до $350,000 на облачные сервисы, AI/ML и Firebase. Условия: стартапу <5/10 лет, нужен веб-сайт и корпоративный email.
2) Google pre-funded - $2,000 на те же сервисы, но специально для стартапов на pre-funded стадии.
3) AWS Startup Credits - От $1,000 до $100,000 на облачные сервисы, AI/ML и базы данных. Условия: стадия Pre-Series B, <10 лет, нужен новый аккаунт.
4) Cloudflare for Startups - От $5,000 до $250,000 на сетевые сервисы, безопасность, Workers и R2. Нужен новый аккаунт и валидная карта, действует 1 год.
5) Microsoft for Startups - От $1,000 до $5,000 на облачные сервисы Azure, AI и базы данных. Для новых клиентов, на 90/180 дней.
6) Alibaba Cloud - От $1,000 до $120,000 на облачные сервисы, ML/AI. Условия: стартапу <10 лет, есть MVP, сайт и корпоративный email.
7) Startup with IBM - До $120,000 в год на IBM Cloud, Watson, AI/ML и Security. Условия: стартапу <10 лет, есть MVP, грант на 1 год.
8) DigitalOcean for Startups - Индивидуальные условия на DO Cloud, Droplets и GPU. Приоритет для AI/ML стартапов, нужен сайт и email. Действует 1 год.
9) Scaleway Startup Program - От €1,000 до €36,000 на облачные сервисы, серверы и хранилище. Срок действия 6–12 месяцев.
10) Modal for Startups - От $500 до $50,000 на GPU для ML/AI (B200, H100 и др.). Условия: стартапу <5 лет, есть сайт, действует 1 год.
11) Groq for Startups - $10,000 в виде кредитов на сверхбыстрый inference для LLM/AI. Подача через отбор или VC-партнёров, действует 90 дней.
12) Perplexity for Startups - Кредиты на API и облачный поисковой сервис.
13) Thesys Startups - $1,000 на Generative UI API. Условия: <$3M фондирования или <$1M выручки, наличие AI-продукта. Действует 12 месяцев.
14) ElevenLabs Startup Grants - 33 млн символов в месяц (эквивалент ~$4K) на Voice AI (TTS, STT, SFX). Для стартапов ранних стадий с MVP, действует 12 месяцев.
Если не нашли подходящий для себя грант, просто напишите в поиске: "[название сервиса] for startups", например "anthropic for startups" - ну или попросите Perplexity этим заняться.
Недавно выкладывал пост про ИИ-браузеры, но самый популярный вопрос в комментариях был не про браузеры, а про кейс с автоматическим заполнением заявок на гранты. Точнее, комментаторы удивлялись, что вообще можно какие-то гранты получать, а я, в свою очередь, удивлялся, что мало кто знает про такие программы. Ну и решил сделать отдельный пост про это.
Довольно много крупных ИТ-компаний, особенно в сфере ИИ, имеют грантовые программы; живые деньги там получить сложно, а вот раздобыть ресурсов в виде токенов для LLM, мощностей для вычислений или облачного хостинга довольно просто. Основные требования - это рабочий сайт и корпоративный email. Кто-то просит предоставить прототип или MVP продукта. Так что, если у вас есть проект и вы хотите существенно сэкономить на хостинге и токенах, начните с этого списка:
1) Google Cloud - Дают от $2,000 до $350,000 на облачные сервисы, AI/ML и Firebase. Условия: стартапу <5/10 лет, нужен веб-сайт и корпоративный email.
2) Google pre-funded - $2,000 на те же сервисы, но специально для стартапов на pre-funded стадии.
3) AWS Startup Credits - От $1,000 до $100,000 на облачные сервисы, AI/ML и базы данных. Условия: стадия Pre-Series B, <10 лет, нужен новый аккаунт.
4) Cloudflare for Startups - От $5,000 до $250,000 на сетевые сервисы, безопасность, Workers и R2. Нужен новый аккаунт и валидная карта, действует 1 год.
5) Microsoft for Startups - От $1,000 до $5,000 на облачные сервисы Azure, AI и базы данных. Для новых клиентов, на 90/180 дней.
6) Alibaba Cloud - От $1,000 до $120,000 на облачные сервисы, ML/AI. Условия: стартапу <10 лет, есть MVP, сайт и корпоративный email.
7) Startup with IBM - До $120,000 в год на IBM Cloud, Watson, AI/ML и Security. Условия: стартапу <10 лет, есть MVP, грант на 1 год.
8) DigitalOcean for Startups - Индивидуальные условия на DO Cloud, Droplets и GPU. Приоритет для AI/ML стартапов, нужен сайт и email. Действует 1 год.
9) Scaleway Startup Program - От €1,000 до €36,000 на облачные сервисы, серверы и хранилище. Срок действия 6–12 месяцев.
10) Modal for Startups - От $500 до $50,000 на GPU для ML/AI (B200, H100 и др.). Условия: стартапу <5 лет, есть сайт, действует 1 год.
11) Groq for Startups - $10,000 в виде кредитов на сверхбыстрый inference для LLM/AI. Подача через отбор или VC-партнёров, действует 90 дней.
12) Perplexity for Startups - Кредиты на API и облачный поисковой сервис.
13) Thesys Startups - $1,000 на Generative UI API. Условия: <$3M фондирования или <$1M выручки, наличие AI-продукта. Действует 12 месяцев.
14) ElevenLabs Startup Grants - 33 млн символов в месяц (эквивалент ~$4K) на Voice AI (TTS, STT, SFX). Для стартапов ранних стадий с MVP, действует 12 месяцев.
Если не нашли подходящий для себя грант, просто напишите в поиске: "[название сервиса] for startups", например "anthropic for startups" - ну или попросите Perplexity этим заняться.
❤6✍3👏2🔥1🙏1💯1🤗1