Последние пару дней тестирую китайский "чудо-стартап" в области ИИ - DeepSeek. Тот самый, который обрушил капитализацию Nvidea на 600 миллиардов долларов. Ну и акции других технологических компаний кремниевой долины тоже, т.к. был анонсирован с легендой, что за на несколько порядков меньшие деньги можно создать ИИ ничем не уступающий ChatGPT.
Тестирую в формате head-to-head с ChatGPT версии o1.
Могу сказать, что это соревнование без соревнования. Никакой конкуренции с o1 там и близко нет. Ни по скорости решения задач, ни по точности (правильности) ответа. Из 30 типовых заданий, который требовали рассуждения или решения DeepSeek не нашел ни одного верного ответа. ChatGPT-o1 справился с 28 из 30.
Делаю вывод, что какие-то умные люди оценили запредельную перегретость темы ИИ и сопутствующих технологий и грамотным информационным вбросом качнули рынок, заработав на шорт-позиция какие-то совершенно сумасшедшие состояния.
Смотрим и завидуем. Ну, или учимся. Кому что ближе.
#будущее #нейросети #openai #deepseek
Тестирую в формате head-to-head с ChatGPT версии o1.
Могу сказать, что это соревнование без соревнования. Никакой конкуренции с o1 там и близко нет. Ни по скорости решения задач, ни по точности (правильности) ответа. Из 30 типовых заданий, который требовали рассуждения или решения DeepSeek не нашел ни одного верного ответа. ChatGPT-o1 справился с 28 из 30.
Делаю вывод, что какие-то умные люди оценили запредельную перегретость темы ИИ и сопутствующих технологий и грамотным информационным вбросом качнули рынок, заработав на шорт-позиция какие-то совершенно сумасшедшие состояния.
Смотрим и завидуем. Ну, или учимся. Кому что ближе.
#будущее #нейросети #openai #deepseek
👍3🤔1💯1
С интересом наблюдаю за информационной войной между лидером гонки ИИ - компанией OpenAI (разработчик ChatGPT) и китайским стартапом DeepSeek, мощно качнувшим на релизе рынок акций технологических компаний кремниевой долины вниз.
С разницей менее 24 часов в мировых СМИ появляются 2 новости:
1. Компания Wyz заявила, что китайская нейросеть DeepSeek допустила утечку данных на более чем миллион записей, в том числе с логами переписки с чат-ботом, паролями и API.
и
2. Американская OpenAI располагает данными, указывающими на использование ее моделей китайским ИИ-стартапом DeepSeek для обучения собственной.
Что примечательно, по словам Дэвида Сакса, назначенного Дональдом Трампом руководителем политики его президентской администрации в области ИИ и криптовалют, есть "существенные доказательства" того, что DeepSeek "дистиллировала знания из моделей OpenAI" (Дистиллировали = "сжимали" выдачу ChatGPT для оптимизации своей модели).
Не удивлюсь, если в отношении реальных конкурентов американских компаний в области ИИ, США начнет ставить условия аналогичные поставленным TikTok. Потому что свободный рынок и открытые для торговли границы это, конечно, хорошо, но национальные интересы важнее.
#будущее #нейросети #openai #deepseek
С разницей менее 24 часов в мировых СМИ появляются 2 новости:
1. Компания Wyz заявила, что китайская нейросеть DeepSeek допустила утечку данных на более чем миллион записей, в том числе с логами переписки с чат-ботом, паролями и API.
и
2. Американская OpenAI располагает данными, указывающими на использование ее моделей китайским ИИ-стартапом DeepSeek для обучения собственной.
Что примечательно, по словам Дэвида Сакса, назначенного Дональдом Трампом руководителем политики его президентской администрации в области ИИ и криптовалют, есть "существенные доказательства" того, что DeepSeek "дистиллировала знания из моделей OpenAI" (Дистиллировали = "сжимали" выдачу ChatGPT для оптимизации своей модели).
Не удивлюсь, если в отношении реальных конкурентов американских компаний в области ИИ, США начнет ставить условия аналогичные поставленным TikTok. Потому что свободный рынок и открытые для торговли границы это, конечно, хорошо, но национальные интересы важнее.
#будущее #нейросети #openai #deepseek
👍2
В продолжение о соперничестве (на самом деле нет) OpenAI и DeepSeek.
По моему сугубо личному предубеждению так выглядит чуть менее, чем всё, что делал, делает и будет делать Китай.
#будущее #нейросети #openai #deepseek
По моему сугубо личному предубеждению так выглядит чуть менее, чем всё, что делал, делает и будет делать Китай.
#будущее #нейросети #openai #deepseek
👍4
Еще интересная публикация в Nature.
Может ли искусственный интеллект помочь врачам не только в постановке диагноза, но и назначении лечения?
Исследование с 92 врачами показало, что использование GPT-4 + традиционные ресурсы помогло врачам лучше справляться с клиническими случаями, чем одни только традиционные методы (+6.5% к результату). Но было и «побочное действие» – врачи тратили больше времени на анализ каждого случая (+2 минуты).
Интересный факт: если дать задачи только GPT-4 (без врачей), его результат почти не отличался от врачей, использующих его помощь.
Осталось только пациентам объяснить, что врач, спрашивающий у ChatGPT "что за фигня с пациентом?", – это не нонсенс, а новая реальность медицины :)
#будущее #нейросети #openai
Может ли искусственный интеллект помочь врачам не только в постановке диагноза, но и назначении лечения?
Исследование с 92 врачами показало, что использование GPT-4 + традиционные ресурсы помогло врачам лучше справляться с клиническими случаями, чем одни только традиционные методы (+6.5% к результату). Но было и «побочное действие» – врачи тратили больше времени на анализ каждого случая (+2 минуты).
Интересный факт: если дать задачи только GPT-4 (без врачей), его результат почти не отличался от врачей, использующих его помощь.
Осталось только пациентам объяснить, что врач, спрашивающий у ChatGPT "что за фигня с пациентом?", – это не нонсенс, а новая реальность медицины :)
#будущее #нейросети #openai
Nature
GPT-4 assistance for improvement of physician performance on patient care tasks: a randomized controlled trial
Nature Medicine - In a prospective study involving 92 physicians from multiple institutions, access to large language model assistance on top of conventional resources increased a score expressing...
😁2
Пропагандистский штамп, конечно. Но недалеко от истины и очень смешно )
#будущее #нейросети #openai #deepseek
#будущее #нейросети #openai #deepseek
😁4👎1
Мощный текст от Сэма Альтмана (OpenAI, если кто не знает) о текущем моменте.
Тезисно:
1. AGI — уже не гипотеза, а реальность. И она приближается существенно быстрее, чем ожидалось. ИИ уже не инструмент, а фактор глобальных перемен.
2. Скорость удешевления ИИ — беспрецедентна. ИИ удешевляется в 10 раз каждый год. Для справки: закон Мура фиксировал удвоение мощностей каждые 18 месяцев.
3. Экономический эффект AGI — взрывной. Линейный рост интеллекта системы ведёт к сверхэкспоненциальному увеличению его полезности. Инвестиции в ИИ будут только ускоряться.
4. ИИ-агенты уже здесь. В ближайшие годы они станут виртуальными сотрудниками, способными выполнять задачи уровня квалифицированного специалиста. Представьте миллион таких коллег в каждой отрасли.
5. Некоторые профессии останутся без изменений, но наука ускорится многократно. Развитие ИИ может дать прорывы в медицине и других сложных областях. Потенциально мы ждем мир без болезней.
6. ИИ изменит баланс экономики. Многие товары станут копеечными, но цены на ограниченные ресурсы (земля, предметы роскоши) взлетят. Зафиксировали во что вкладываться? :)
7. Окончательная форма ИИ пока неизвестна. Технологии развиваются, но остаётся главный вопрос: кто и как будет контролировать этот процесс?
Кто первым возьмёт AGI под контроль — общество, корпорации или государства? И если ответ не "общество", то есть ли у нас вообще шанс на будущее?
#будущее #нейросети #openai
Тезисно:
1. AGI — уже не гипотеза, а реальность. И она приближается существенно быстрее, чем ожидалось. ИИ уже не инструмент, а фактор глобальных перемен.
2. Скорость удешевления ИИ — беспрецедентна. ИИ удешевляется в 10 раз каждый год. Для справки: закон Мура фиксировал удвоение мощностей каждые 18 месяцев.
3. Экономический эффект AGI — взрывной. Линейный рост интеллекта системы ведёт к сверхэкспоненциальному увеличению его полезности. Инвестиции в ИИ будут только ускоряться.
4. ИИ-агенты уже здесь. В ближайшие годы они станут виртуальными сотрудниками, способными выполнять задачи уровня квалифицированного специалиста. Представьте миллион таких коллег в каждой отрасли.
5. Некоторые профессии останутся без изменений, но наука ускорится многократно. Развитие ИИ может дать прорывы в медицине и других сложных областях. Потенциально мы ждем мир без болезней.
6. ИИ изменит баланс экономики. Многие товары станут копеечными, но цены на ограниченные ресурсы (земля, предметы роскоши) взлетят. Зафиксировали во что вкладываться? :)
7. Окончательная форма ИИ пока неизвестна. Технологии развиваются, но остаётся главный вопрос: кто и как будет контролировать этот процесс?
Кто первым возьмёт AGI под контроль — общество, корпорации или государства? И если ответ не "общество", то есть ли у нас вообще шанс на будущее?
#будущее #нейросети #openai
Sam Altman
Three Observations
Our mission is to ensure that AGI (Artificial General Intelligence) benefits all of humanity.
Systems that start to point to AGI* are coming into view, and so we think it’s important to...
Systems that start to point to AGI* are coming into view, and so we think it’s important to...
👎1🔥1🤓1
Товарищ подкинул интересный препринт о возможностях современных нейросетей в программировании. Сказать, что впечатляет, - ничего не сказать.
ChatGPT o3 от OpenAI прошла отбор на золото Международной олимпиады по информатике (IOI 2024) и получила топовый рейтинг на CodeForces – площадке, где соревнуются лучшие программисты мира. Модель самостоятельно разрабатывает стратегии решения задач, самостоятельно анализирует код, самостоятельно проверяет свои решения и даже учится на своих ошибках – без какой-либо помощи программистов!
Что получилось:
1. На CodeForces o3 получил рейтинг 2724 (это 99,8-й процентиль) – это уровень лучших программистов мира (примерно топ-200 среди людей).
2. На IOI 2024 он превзошел половину участников, а если бы ему дали больше попыток, он получил бы золотую медаль.
Как было:
Раньше AlphaCode от Google работал по принципу: 1. Делаем сотни тысяч решений. 2. Выбираем лучшие десять. 3. "Ручными" эвристиками от кожаных мешков выбирается финальное решение.
Как стало:
o3 от OpenAI действует иначе: 1. Пишет сложное, оптимизированное решение для задачи. 2. Затем он пишет простое решение, которое не оптимизировано, но точно правильно. Обычно это перебор всех возможных вариантов или очень медленный, но корректный алгоритм. 3. ChatGPT o3 сравнивает результаты обоих решений на тестовых примерах. Если они совпадают – значит, сложное решение, скорее всего, правильное. Если нет – модель анализирует, какие части кода привели к расхождению. 4. На основе этой информации o3 пересматривает своё сложное решение, исправляя только проблемные части, а не переписывая всё с нуля.
А выводы следующие: 1. ИИ уже не помощник, а конкурент. 2. В 90% рутинных задач кожаные мешки могут быть заменены ИИ. Инженеры смогут сосредоточиться на архитектуре, стратегиях и инновациях.
Возможно, уже в самом ближайшем будущем программистам платить будут не за код, а за то, чтобы не мешали ИИ его писать.
#будущее #нейросети #openai #deepmind
ChatGPT o3 от OpenAI прошла отбор на золото Международной олимпиады по информатике (IOI 2024) и получила топовый рейтинг на CodeForces – площадке, где соревнуются лучшие программисты мира. Модель самостоятельно разрабатывает стратегии решения задач, самостоятельно анализирует код, самостоятельно проверяет свои решения и даже учится на своих ошибках – без какой-либо помощи программистов!
Что получилось:
1. На CodeForces o3 получил рейтинг 2724 (это 99,8-й процентиль) – это уровень лучших программистов мира (примерно топ-200 среди людей).
2. На IOI 2024 он превзошел половину участников, а если бы ему дали больше попыток, он получил бы золотую медаль.
Как было:
Раньше AlphaCode от Google работал по принципу: 1. Делаем сотни тысяч решений. 2. Выбираем лучшие десять. 3. "Ручными" эвристиками от кожаных мешков выбирается финальное решение.
Как стало:
o3 от OpenAI действует иначе: 1. Пишет сложное, оптимизированное решение для задачи. 2. Затем он пишет простое решение, которое не оптимизировано, но точно правильно. Обычно это перебор всех возможных вариантов или очень медленный, но корректный алгоритм. 3. ChatGPT o3 сравнивает результаты обоих решений на тестовых примерах. Если они совпадают – значит, сложное решение, скорее всего, правильное. Если нет – модель анализирует, какие части кода привели к расхождению. 4. На основе этой информации o3 пересматривает своё сложное решение, исправляя только проблемные части, а не переписывая всё с нуля.
А выводы следующие: 1. ИИ уже не помощник, а конкурент. 2. В 90% рутинных задач кожаные мешки могут быть заменены ИИ. Инженеры смогут сосредоточиться на архитектуре, стратегиях и инновациях.
Возможно, уже в самом ближайшем будущем программистам платить будут не за код, а за то, чтобы не мешали ИИ его писать.
#будущее #нейросети #openai #deepmind
👍3🔥2👎1
Сэм Альтман анонсировал релиз GPT-4.5 и GPT-5 в ближайшие недели /месяцы.
Замерли в предвкушении.
#будущее #нейросети #openai
Замерли в предвкушении.
#будущее #нейросети #openai
👎1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
На видео OpenAI model генерит команды для Replit Agent, фактически выполняя роль "менеджера проекта".
Replit Agent выступает в роли "разработчика": пишет код, исправляет ошибки, автоматически обменивается учётными данными (подключает API-ключи, базы данных и прочее) и тестирует приложение.
Один AI-агент работает с другим AI-агентом без участия человека.
В качестве примера на видео создано "Real Estate Ticketing App", использующее React, Express, PostgreSQL.
Будущее, в которое на с вами не позвали.
#будущее #нейросети #openai #replit
Replit Agent выступает в роли "разработчика": пишет код, исправляет ошибки, автоматически обменивается учётными данными (подключает API-ключи, базы данных и прочее) и тестирует приложение.
Один AI-агент работает с другим AI-агентом без участия человека.
В качестве примера на видео создано "Real Estate Ticketing App", использующее React, Express, PostgreSQL.
Будущее, в которое на с вами не позвали.
#будущее #нейросети #openai #replit
🔥3🤯2
"Мой друг недавно ходил к врачу.
Врач поставил ему серьёзный диагноз.
Друг взял медицинские снимки и загрузил их в ChatGPT.
ChatGPT поставил другой диагноз — менее серьёзный и с меньшим риском.
Друг отправил результаты ChatGPT врачу.
Врач подтвердил, что допустил ошибку, и что ChatGPT оказался прав.
Сумасшедшая ситуация.
Но очевидно, в каком направлении движется мир…"
К людям все больше приходит осознание в каком мире они буду жить уже в самое ближайшее время.
Я несколькими месяцами ранее публиковал результаты исследования, где ChatGPT (не приспособленная для медицинской диагностики нейросеть!) в сравнительном тестировании показывал результаты не хуже врачей.
Представьте что может делать модель специально на это заточенная.
#будущее #нейросети #openai
Дисклеймер: это не медицинская рекомендация; обращайтесь только за квалифицированной медицинской помощью к опытным дипломированным специалистам.
Врач поставил ему серьёзный диагноз.
Друг взял медицинские снимки и загрузил их в ChatGPT.
ChatGPT поставил другой диагноз — менее серьёзный и с меньшим риском.
Друг отправил результаты ChatGPT врачу.
Врач подтвердил, что допустил ошибку, и что ChatGPT оказался прав.
Сумасшедшая ситуация.
Но очевидно, в каком направлении движется мир…"
К людям все больше приходит осознание в каком мире они буду жить уже в самое ближайшее время.
Я несколькими месяцами ранее публиковал результаты исследования, где ChatGPT (не приспособленная для медицинской диагностики нейросеть!) в сравнительном тестировании показывал результаты не хуже врачей.
Представьте что может делать модель специально на это заточенная.
#будущее #нейросети #openai
Дисклеймер: это не медицинская рекомендация; обращайтесь только за квалифицированной медицинской помощью к опытным дипломированным специалистам.
👍6
О том как обустроить Россию могут думать не только карикатурные депутаты из Нашей Раши, но и нейросети :)
head-to-head сравнение выдачи ChatGPT, DeepSeek, Gemini, Grok и Perplexity.
Как по мне, мало чем отличается от тех тезисов, что звучат каждую кампанию. Так зачем платить больше? 🤭
#нейросети #будущее #openai #grok #deepseek #gemini #perplexity
head-to-head сравнение выдачи ChatGPT, DeepSeek, Gemini, Grok и Perplexity.
Как по мне, мало чем отличается от тех тезисов, что звучат каждую кампанию. Так зачем платить больше? 🤭
#нейросети #будущее #openai #grok #deepseek #gemini #perplexity
😁4
ixbt.com пишет:
"23-летний Кенжебек Исмаилов не просто оспорил выписанный ему штраф за нарушение ПДД, а сделал это с помощью ChatGPT. Во время заседания, которое длилось всего 10 минут, мужчина использовал бесплатный чат-бот, который в режиме синтеза речи понимал вопросы судьи и подсказывал правильные ответы. В итоге суд признал доводы молодого человека убедительными и вынес решение в пользу истца.
Теперь же парень планирует подать еще один иск против полиции, требуя компенсации за потраченное время."
Если Вы или Ваш ребенок думаете пойти учиться на юриста в ближайшие год-два - подумайте еще раз. Может так случиться, что к моменту получения заветного диплома ваше профессия окажется никому не нужной.
#будущее #нейросети #openai
"23-летний Кенжебек Исмаилов не просто оспорил выписанный ему штраф за нарушение ПДД, а сделал это с помощью ChatGPT. Во время заседания, которое длилось всего 10 минут, мужчина использовал бесплатный чат-бот, который в режиме синтеза речи понимал вопросы судьи и подсказывал правильные ответы. В итоге суд признал доводы молодого человека убедительными и вынес решение в пользу истца.
Теперь же парень планирует подать еще один иск против полиции, требуя компенсации за потраченное время."
Если Вы или Ваш ребенок думаете пойти учиться на юриста в ближайшие год-два - подумайте еще раз. Может так случиться, что к моменту получения заветного диплома ваше профессия окажется никому не нужной.
#будущее #нейросети #openai
😁3🔥2👎1
Похоже, OpenAI начинает прощупывать еще одно крайне перспективное направление - роботостроение. Уверен, у Альтмана и Ко и здесь получится не менее впечатляюще.
"Наша команда в @OpenAI нанимает механического архитектора, робототехника. Мы ищем опытных кандидатов, умеющих проектировать сложные робототехнические системы.
Мы ищем специалистов в двух областях: двигатели/структуры/приводы и батареи/сенсоры/кремний/зарядка/тепловые системы — это может быть один человек или двое, в зависимости от опыта и квалификации."
В одной запрещенной в РФ организации Кейтлин Калиновски не так давно рулила разработкой очков дополненной реальности.
#будущее #hightech #robotics #openai
"Наша команда в @OpenAI нанимает механического архитектора, робототехника. Мы ищем опытных кандидатов, умеющих проектировать сложные робототехнические системы.
Мы ищем специалистов в двух областях: двигатели/структуры/приводы и батареи/сенсоры/кремний/зарядка/тепловые системы — это может быть один человек или двое, в зависимости от опыта и квалификации."
В одной запрещенной в РФ организации Кейтлин Калиновски не так давно рулила разработкой очков дополненной реальности.
#будущее #hightech #robotics #openai
🔥1
Сильно раньше, чем мы думаем, использование ИИ в работе докторов станет обычным делом. И, более того, неиспользование ИИ будет неэтичным и предосудительным.
Перевод с картинки:
#будущее #нейросети #openai
Перевод с картинки:
Отвёз отца к врачу, потому что он порезал палец ножом, а врач пользовался ChatGPT 😂
Судя по истории чатов, он использует его для каждого пациента.
#будущее #нейросети #openai
👍3
Интересная публикация в TIME о способностях существующих нейросетей решать задачи в области вирусологии.
Исследование показало, что современные ИИ-модели (OpenAI o3, Google Gemini 2.5 Pro, Anthropic Claude) в среднем вдвое точнее решают сложнейшие практические задачи по ведению вирусологических опытов, чем PhD-вирусологи в своих областях экспертизы.
Результаты: PhD-вирусологи - 22,1 % точности, o3 - 43,8 %, Gemini - 37,6 %
Методика: «сложные, негуглимые» сценарии. От диагностики сбоев в культивировании до оптимизации протоколов BSL-рабочих процессов.
Еще раз: ChatGPT-o3 не тренированный специально для решения таких задач дает точность в 2 раза выше, чем PhD-вирусолог.
С одной стороны это ускорение разработки вакцин и лекарств, помощь исследователям в странах с ограниченными ресурсами, автоматизированная поддержка при работе с опасными патогенами.
С другой стороны - доступ к «не-сужающим» инструкциям по созданию биоружия.
#нейросети #будущее #openai #anthropic #deepmind
Исследование показало, что современные ИИ-модели (OpenAI o3, Google Gemini 2.5 Pro, Anthropic Claude) в среднем вдвое точнее решают сложнейшие практические задачи по ведению вирусологических опытов, чем PhD-вирусологи в своих областях экспертизы.
Результаты: PhD-вирусологи - 22,1 % точности, o3 - 43,8 %, Gemini - 37,6 %
Методика: «сложные, негуглимые» сценарии. От диагностики сбоев в культивировании до оптимизации протоколов BSL-рабочих процессов.
Еще раз: ChatGPT-o3 не тренированный специально для решения таких задач дает точность в 2 раза выше, чем PhD-вирусолог.
С одной стороны это ускорение разработки вакцин и лекарств, помощь исследователям в странах с ограниченными ресурсами, автоматизированная поддержка при работе с опасными патогенами.
С другой стороны - доступ к «не-сужающим» инструкциям по созданию биоружия.
#нейросети #будущее #openai #anthropic #deepmind
🤯1
Кто боялся, что из-за нейросетей человечество отупеет. Хорошие новости. В Nature вышла публикация (метаанализ 51 исследования), подтверждающая значительный рывок в успеваемости студентов благодаря ChatGPT (g = 0.87). ChatGPT также позитивно влияет на то, как студенты воспринимают обучение (g = 0.46), и стимулирует их критическое мышление (g = 0.46).
В исследовании отмечено:
1. Успеваемость растет сильнее, если правильно подобрать курс, модель обучения и не бросать использование ChatGPT на полпути.
2. Чтобы студенты лучше воспринимали обучение, важно обеспечить достаточную продолжительность взаимодействия с ChatGPT.
3. Для развития критического мышления особенно важен тип учебного курса и то, как именно ChatGPT используется в процессе.
Фактов финансирования исследования со стороны OpenAI не зафиксировано. Пока.
#будущее #нейросети #openai
В исследовании отмечено:
1. Успеваемость растет сильнее, если правильно подобрать курс, модель обучения и не бросать использование ChatGPT на полпути.
2. Чтобы студенты лучше воспринимали обучение, важно обеспечить достаточную продолжительность взаимодействия с ChatGPT.
3. Для развития критического мышления особенно важен тип учебного курса и то, как именно ChatGPT используется в процессе.
Фактов финансирования исследования со стороны OpenAI не зафиксировано. Пока.
#будущее #нейросети #openai
Nature
The effect of ChatGPT on students’ learning performance, learning perception, and higher-order thinking: insights from a meta-analysis
Humanities and Social Sciences Communications - The effect of ChatGPT on students’ learning performance, learning perception, and higher-order thinking: insights from a meta-analysis
👍3🤔1
Тем временем экспериментальная модель OpenAI (разработчик ChatGPT) решает задачи на уровне золотых медалистов Международной олимпиады по математике.
Нет, это не копипаст решения из гугла. Такие тестирования проводится на заданиях, которые никогда не были опубликованы в интернете ранее.
Да, теперь и математике, как ранее в шахматах и го, соревнование человека и нейросети не имеет смысла.
AGI близко.
#будущее #нейросети #openai
Нет, это не копипаст решения из гугла. Такие тестирования проводится на заданиях, которые никогда не были опубликованы в интернете ранее.
Да, теперь и математике, как ранее в шахматах и го, соревнование человека и нейросети не имеет смысла.
AGI близко.
#будущее #нейросети #openai
🔥3