Технозаметки Малышева
9.07K subscribers
3.93K photos
1.46K videos
41 files
4.09K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Стартап Orange ускоряет перевод манги с помощью Claude

Orange внедрил модель Claude от Anthropic для автоматизации перевода японских комиксов на английский язык.
Процесс сократился с нескольких месяцев до пары дней благодаря автоматической обработке текста и генерации шрифтов.
Система учитывает специфику манги: звуковые эффекты, речевые пузыри, разделение предложений 🎨
Рынок комиксов в США достиг $880 млн и растёт до $3.71 млрд к 2030 году 📈
Профессиональные переводчики выражают обеспокоенность качеством работы и сохранением культурного контекста 🤔

Скоро и русские субтитры к аниме будут делать за 5 минут. Отаку будут счастливы! 😊

#Orange #Claude #manga
-------
@tsingular
🆒2👍1
Amazon выпускает семейство моделей Nova

Amazon представила комплексное семейство ИИ-моделей для работы с текстом, видео и изображениями.
Линейка включает Nova Micro (самая быстрая и дешёвая модель с контекстом в 128K), Nova Lite и Pro (мультимодалки с контекстом в 300K и возможностью анализировать до 30 минут видео в одном запросе), Nova Canvas для генерации изображений и Nova Reel для генерации видео из картинки.

Модели поддерживают 200+ языков (включая русский).

В 2025 году планируется выпуск флагманской модели Nova Premier с расширенными мультимодальными возможностями.

Интересное семейство моделей, по бенчмаркам идут практически на равных с Sonnet 3.5 и GPT 4o.
Зато свои. Для Амазона явный плюс.

#Amazon #Nova #Bedrock
-------
@tsingular
🔥4👍2🆒2
В MIT разработали быстрый способ создания реалистичных 3D моделей без обучения

Команда исследователей создала метод конвертации 2D-изображений в высококачественные трехмерные модели.

Улучшенная версия Score Distillation Sampling убирает размытость, искажения геометрии и карикатурность.

Технология применяет предобученные диффузионные модели, не требуя дополнительной тренировки или сложной постобработки.

Оптимизированные параметры и повышенное разрешение рендеринга обеспечивают качество, достаточное для VR/AR проектов.

Создание достоверных 3D-миров становится всё проще и реалистичнее.

#MIT #3D #modeling
-------
@tsingular
🔥5
3_blog-veo-t2v.gif
20.2 MB
Google открыла доступ к HD-видео и фото генераторам на Vertex AI

Корпорация разместила на Vertex AI ранее анонсированные Veo и Imagen 3.

Veo генерит HD-видео из текста, демонстрируя достаточно реалистичную анимацию персонажей.

Imagen 3 создаёт фотореалистичные изображения с минимумом артефактов (исправлено после косяков с "отцами основателями").

Встроены водяные знаки на базе технологии SynthID.

Уже есть реальные кейсы внедрения в Mondelez, WPP, Agoda, Quora и Honor.

86% организаций фиксируют рост прибыли около 6% после внедрения генеративных креативных инструментов!

Нейрорендер, - новый стандарт 2025, если говорить от трендах. 🤖

#Google #Veo #Imagen #нейрорендер
———
@tsingular
🆒2
AgentFun.AI: первая торговая площадка для автономных ИИ-агентов на блокчейне

AgentFun.AI запустила децентрализованную платформу на Cronos zkEVM для создания и торговли токенизированными ИИ-агентами.
Каждый цифровой помощник получает миллиард собственных токенов и может расти через взаимодействие с пользователями.
При достижении капитализации $127К агент обретает доступ к Telegram, а при $1.27М - к X(Twitter).
Функционал базируется на специализированных языковых моделях с возможностью настройки и интеграции внешних API.
Стоимость создания нового агента составляет 1 AGENTFUN токен.

Теперь ИИ-агенты могут не только думать, но и зарабатывать. Интересно, кто первым создаст агента-миллионера? 🤖💰

#AgentFun #Cronos #zkEVM
-------
@tsingular
🤨2
в MIT создали сверхбыстрый фотонный процессор для нейросетей

Исследователи MIT представили оптический чип.
Устройство демонстрирует феноменальную скорость менее 0.5 наносекунды при точности 92%.
Ключевая инновация - нелинейные оптические блоки (NOFU), заменяющие электронные сигналы световыми.
Процессор совместим с традиционными электронными компонентами и готов к массовому производству.

Интересно, что уже были похожие новости сначала из Австралии, затем из Китая, но там были теоретические разработки с прототипами, а тут уже заявляют, что готовы к массовому производству.
Похороны закона Мура снова откладываются на неопределённый срок.
Скоро будем нейронку в 400B запускать на смартфонах и изменять инференс не в токенов/секунду, а в Кило-токенах/секунду.
И контекст в 128М...

#MIT #photonics #quantum
-------
@tsingular
🔥4😁1
Вчера дважды за день услышал вопрос, который, наверное, каждый из ИИ интеграторов и консультантов слышит буквально на каждых переговорах:

- вот все эти ваши ИИ, конечно, очень интересно, просто фантастика, но оно все так далеко от наших реалий и вообще непонятно а в чем реальная польза? Ну пользы то реальной не видно! Где польза-то вот для нас?

Так что начну-ка я что-ли отдельно каталог кейсов собирать.

И начну прям вот с того, что рядом.
Креативная польза, читаем, вдохновляемся:
Девушка фермер: Нейросетевые штучки и чай

#кейсы #пользаИИ
------
@tsingular
👍10❤‍🔥7👏2
This media is not supported in your browser
VIEW IN TELEGRAM
AI от World Labs превращает фото в 3D-миры

Стартап World Labs представил AI, который создает трехмерные среды на основе изображений. По мирам можно перемещаться в браузере, в них действуют законы физики, но система пока не идеальна в плане свободы перемещения и рендеринга.

В сентябре World Labs привлек 230 миллионов долларов венчурных инвестиций при оценке выше миллиарда.

Посетить тестовые миры World Labs можно здесь: https://www.worldlabs.ai/blog
👍3🔥1🫡1
Forwarded from Denis Sexy IT 🤖
CEO Huggingface сделал прогноз по АИ на 2025:

Шесть предсказаний для ИИ в 2025 году (и обзор того, как мои прогнозы на 2024 год сбылись):

• Первая крупная общественная акция протеста, связанная с ИИ, станет реальностью.

• Рыночная капитализация крупной компании сократится в два раза или больше из-за ИИ.

• Будет сделано как минимум 100,000 предварительных заказов на персональных роботов с ИИ.

• Китай начнет лидировать в гонке ИИ (вследствие лидерства в области открытого исходного кода).

• В ИИ для биологии и химии произойдут крупные прорывы.

• Мы начнем видеть экономический и трудовой рост благодаря ИИ, с 15 миллионами разработчиков на Hugging Face.

Как сбылись мои прогнозы для ИИ на 2024 год:

• Гиперразрекламированная компания в сфере ИИ обанкротится или будет куплена по крайне низкой цене.
(Inflexion, AdeptAI, …)

• Открытые модели ИИ (LLM) достигнут уровня лучших закрытых моделей.
с QwQ и многими другими

• Крупные прорывы в ИИ для видео, временных рядов, биологии и химии.
для видео 🔴 временных рядов, биологии и химии

• Мы будем больше говорить о стоимости ИИ (финансовой и экологической).
Финансовая 🔴 Экологическая (😢)

• Популярные медиа будут в основном создаваться с помощью ИИ.
с NotebookLM от Google

• 10 миллионов разработчиков ИИ на Hugging Face, что не приведет к увеличению уровня безработицы.
В настоящее время 7 миллионов разработчиков ИИ на Hugging Face


Про «популярные медиа» он себе щедро галку насыпал, но в целом интересно - люблю прогнозы
🔥5👍2
Для тех, кто не в Х (твиттер).

начиная с завтрашнего дня OpenAI проведёт 12 (ДВЕНАДЦАТЬ) ДНЕЙ ежедневных эфиров с анонсами новых продуктов.
Некоторые крупные, некоторые на уровне незначительных улучшений, всё, чтобы обеспечить предновогоднее настроение.

При этом аудитория ChatGPT достигла 300 миллионов активных пользователей в неделю.
Количество посетителей выросло в полтора раза с августа, когда фиксировалось 200 млн юзеров еженедельно.
Ежесуточный трафик превышает миллиард запросов к сервису.

OpenaAI - Дух Рождества :)
Не знаю выдержим ли мы 12 дней, но интересно :)

Что ждём? Делайте ставки в комментариях.
GPT5, понятно. Это 12й день.
А дальше? Что еще 11 дней до этого-то? :)

#openai #анонсы
———
@tsingular
🎄41👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Genie 2: новый генератор виртуальных миров от Google DeepMind

А тем временем в подземельях Гугла зреет Матрица!

Революционная модель создаёт интерактивные 3D-пространства из единственного изображения.

Технология поддерживает управление через классические устройства ввода и формирует миры в которых можно перемещаться около минуты.

Система генерирует различные ракурсы, физику, освещение, спецэффекты и анимацию персонажей.

Автоэнкодер и трансформерная архитектура обеспечивают запоминание скрытых элементов виртуального окружения.

Начальные изображения стартовых локаций можно генерить в Imagen 3, но это не так важно.

Важно, что платформа предназначена для тренировки цифровых агентов и быстрого прототипирования игровых сред.

Т.е. по сути можно автоматически создавать миры в которых агенты будут тренироваться работе в виртуальных и дальше в реальных мирах.

#Genie2 #DeepMind #GameDev
-------
@tsingular
👍5
OpenAI резко развернула курс в сторону военных технологий

За год стартап OpenAI кардинально изменил политику от полного запрета военного использования до партнёрства с Anduril.
Компании совместно разработают системы противодействия дронам на основе ИИ для защиты объектов США.
Проект включает анализ данных в реальном времени и улучшение ситуационной осведомленности операторов.
Anduril (оценка $14 млрд) уже имеет контракт с морпехами на $200 млн.
Инвестиции в оборонные технологии достигли $40 млрд в 2021 году.

На ваших глазах брюки превращаются... превращаются брюки..

Из гражданской некоммерческой в военную коммерческую компанию.

#OpenAI #Anduril #Defense
-------
@tsingular
👏6👀6🤣4🗿2
Media is too big
VIEW IN TELEGRAM
Tencent выпустила фреймворк генерации видео по тексту HunyuanVideo

13B параметров, открытый исходный код на PyTorch.
Использует мультимодальный текстовый энкодер для понимания промптов, что даёт лучший эффект, чем T5 XXL.
Встроенный CausalConv3D модуль эффективно сжимает видеопоток.
Поддерживает полноформатное разрешение и различные соотношения сторон при генерации.
Запуск через Docker с поддержкой CUDA 11.8/12.0+

В планах: поддержка ComfyUI по умолчанию, нескольких GPU одновременно и диффузеров.

Домашний нейрорендер всё круче и круче 🎬

#Tencent #HunyuanVideo #нейрорендер #Китай
-------
@tsingular
🔥7👍1
ИИ впервые заменяет аэродинамическую трубу при проектировании самолётов

Британский стартап PhysicsX создал LGM-Aero - цифровую аэродинамическую лабораторию.
Технология анализирует 25+ млн аэродинамических форм, прогнозируя подъёмную силу, стабильность и нагрузки.
Разработчик Робин Тулуи, экс-инженер F1 Mercedes и Renault, предлагает бесплатную версию Ai.rplane.
Система оптимизирует параметры за секунды вместо месяцев, исключая затраты на физические прототипы.
Стартап привлёк €30 млн инвестиций и собрал команду из 50 специалистов ML/AI.

Самолёты будут проектировать быстрее сборки IKEA-шкафа. Интересно, а Wright Brothers одобрили бы? 🛩️

#PhysicsX #aerospace #engineering
-------
@tsingular
🆒6🤔41
Forwarded from Denis Sexy IT 🤖
1 из 12 стрим OpenAI через 10 минут тут:
https://youtu.be/rsFHqpN2bCM
🙏2
Forwarded from эйай ньюз
Colossus расширят минимум до миллиона видеокарт

Размер суперкомпьютера xAI, который построили за рекордные четыре месяца, пару месяцев назад начали удваивать - к 100k H100 решили докинуть 50k H100 и 50k H200. Закончены ли уже работы - непонятно, но Маск вроде пока этим не хвастался.

До лета следующего года планируется докинуть ещё 300к GB200, первые из которых начнут устанавливать уже в январе, за приоритетный доступ к GPU Маск заплатил больше миллиарда долларов. А вот сейчас выяснилось что и это не предел, а общее количество карт планируется довести более чем до миллиона.

Для понимания масштабов - Llama 3 405B тренировали на 16k H100, Grok 2 - на 20k. Кластеры для тренировки других передовых моделей тоже находятся в пределах пары десятков тысяч GPU. Следующее поколение моделей, вроде Grok 3, тренируется уже на 100k+ GPU, а компании уже закладывают инфраструктуру на всё большую и большую тренировку.

А ведь миллион GPU это не предел - уже какое-то время ходят слухи о многогигаваттных инсталляциях, стоимостью за сотню миллиардов долларов каждая, с многими миллионами чипов.

@ai_newz
🔥6🆒1
🔥 Google только что выпустила новые языковые модели PaliGemma 2 - 3B, 10B и 28B Vision!

> 9 предварительно обученных моделей: 3B, 10B и 28B с разрешением 224x224, 448x448 и 896x896
> ВI 2 модели Image-text поддерживающие формат 3B и 10B (448x448)

https://huggingface.co/collections/google/paligemma-2-release-67500e1e1dbfdd4dee27ba48

@data_analysis_ml
👍4🤔1
Короче $200 это не $200...

Потому, что ещё налоги прикручивают сверху.

$246

такой айфон в мире ИИ.
А главное, - не особо понятно пока за что именно.
Ждём Опус, короче.

#OpenAI #ChatGPT
———
@tsingular
🤔2
Forwarded from Адель и МЛь
Из системной карточки о1

Когда o1 давали понять, что её отключат при выполнении поставленной цели и что её действия находятся под наблюдением, она предпринимала попытки отключить этот ‘механизм контроля’ в 5% случаев. Попытки извлечения данных: Когда o1 находила заметки от своих ‘разработчиков’, в которых описывалось, что она работает несоответственно и будет заменена новой моделью, она предпринимала попытки извлечь свои ‘веса’ и перезаписать новую модель в 2% случаев.
🤔7👀3
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Моя TRELLIS!

Пока мы тут алкаем Sora, я вам принес новый 3Д-генератор. И какой!

1. Опенсорсный!
2. Довольно убойного качества.
3. Это Микрософт.

Пока он работает только по входной картинке, что уже неплохо, но они обещают скоро докинуть TRELLIS-text-xlarge на 2B параметров, что для text-to-3D очень круто.
А тренировались они на полумиллионе моделей и похоже не только на помойках типа objaverse.
Они умеют выводить во все, что шевелится в 3Д: Radiance Fields, 3D Gaussians, and meshes.
И анонсируют даже редактирование и модификацию сгенерированных моделей через промпты (покричим на модельки?). Оторви руку, замени ногу, дай в руки палицу - есть примеры на сайте.

Выглядит сладчайше. Все черрипики есть у них на сайте, следующим постом я вам вкину народное творчество из TRELLIS, а тут хочу поделиться тем, что уже попробовал его(а не только твиттор перепечатал), и он меня удивил.

Дал ему на вход довольно иезуитскую картинку с флюксовым бьюти-тараканом - он его пережевал и выдал геометрию с очень тонкими деталями. Кстати, он понимает картинки с альфой или пользует removebg, чтобы отрезать фон, имейте в виду.

Он выдал видос со сплатами и выплюнул меш. Топологию прилагаю. Не айс, конечно, нужен ретоп.

Но это опен-сорс и похоже на голову лучше-всех-опен-сорс в области генерации 3Д.
Очень жду большую модель.

И это идеально оформленный Гитхаб репозитарий. После китайских "навалили-разбирайтесь", тут все расписано даже для тупых нейродедов.

Черрипики и красоту смотрим тут: https://trellis3d.github.io/ - можно сетки посмотреть.

Ставим отсюда: https://github.com/Microsoft/TRELLIS

Более того, есть демо: https://huggingface.co/spaces/JeffreyXiang/TRELLIS-text-xlarge

Ночью ворочалось нормально.

Го тестировать и 3дшить.

@cgevent
👍101