Технозаметки Малышева
9.17K subscribers
3.95K photos
1.47K videos
41 files
4.11K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Моя TRELLIS!

Пока мы тут алкаем Sora, я вам принес новый 3Д-генератор. И какой!

1. Опенсорсный!
2. Довольно убойного качества.
3. Это Микрософт.

Пока он работает только по входной картинке, что уже неплохо, но они обещают скоро докинуть TRELLIS-text-xlarge на 2B параметров, что для text-to-3D очень круто.
А тренировались они на полумиллионе моделей и похоже не только на помойках типа objaverse.
Они умеют выводить во все, что шевелится в 3Д: Radiance Fields, 3D Gaussians, and meshes.
И анонсируют даже редактирование и модификацию сгенерированных моделей через промпты (покричим на модельки?). Оторви руку, замени ногу, дай в руки палицу - есть примеры на сайте.

Выглядит сладчайше. Все черрипики есть у них на сайте, следующим постом я вам вкину народное творчество из TRELLIS, а тут хочу поделиться тем, что уже попробовал его(а не только твиттор перепечатал), и он меня удивил.

Дал ему на вход довольно иезуитскую картинку с флюксовым бьюти-тараканом - он его пережевал и выдал геометрию с очень тонкими деталями. Кстати, он понимает картинки с альфой или пользует removebg, чтобы отрезать фон, имейте в виду.

Он выдал видос со сплатами и выплюнул меш. Топологию прилагаю. Не айс, конечно, нужен ретоп.

Но это опен-сорс и похоже на голову лучше-всех-опен-сорс в области генерации 3Д.
Очень жду большую модель.

И это идеально оформленный Гитхаб репозитарий. После китайских "навалили-разбирайтесь", тут все расписано даже для тупых нейродедов.

Черрипики и красоту смотрим тут: https://trellis3d.github.io/ - можно сетки посмотреть.

Ставим отсюда: https://github.com/Microsoft/TRELLIS

Более того, есть демо: https://huggingface.co/spaces/JeffreyXiang/TRELLIS-text-xlarge

Ночью ворочалось нормально.

Го тестировать и 3дшить.

@cgevent
👍101
Forwarded from эйай ньюз
Вышла Llama 3.3!

70B модельку дотюнили так, что она порами обгоняет 405B. Особенно большой прирост на математике и кодинге, в которых Llama традиционно была послабее. В этот раз релизят только 70B, других размеров и VLM нету.

Веса

@ai_newz
👍21
2 день из 12ти эфира OpenAI.
https://www.youtube.com/watch?v=fMJMhBFa_Gc

Ждём корпоративную Сору за $2000 в месяц,видимо уже.



RL finetune.
Прикольная штука, - загружаешь свои данные, ждёшь 2 дня и получаешь свою собственную локальную модель О1-мини заточенную под свои задачи.
Фабрика кастомных моделей!

#OpenAI #advent
———
@tsingular
🤔5
Загнал в бесплатного бота @ai_gptfreebot
ollama llama 3.3 70B 42Gb версию.

Пришлось ради этого выключить генератор картинок.
Поиск оставил.

Но зато все могут попробовать новую модель на 2х4090.

В понедельник верну картинки и переключу обратно на gemma2:27b

А пока, - развлекайтесь :)

#llama3-3 #ollama #freeGPTbot
———
@tsingular
👍5😐4
По мнению сотрудника OpenAI, они уже достигли AGI

"По моему мнению, мы уже достигли AGI, и это еще более очевидно с O1.

Мы не достигли «лучше, чем любой человек в любой задаче», но то, что у нас есть, это «лучше, чем большинство людей в большинстве задач».

Некоторые говорят, что LLM знают только, как следовать инструкции.

Во-первых, никто не может на самом деле объяснить, чему может научиться глубокая нейронная сеть с триллионом параметров.

Но даже если вы в это верите, весь научный метод можно обобщить как инструкцию: наблюдать, выдвигать гипотезы и проверять.

Хорошие ученые могут выдвигать лучшие гипотезы, основываясь на своей интуиции, но сама эта интуиция была создана путем многих проб и ошибок.

Нет ничего, чему нельзя было бы научиться на примерах."


#AGI #OpenAI
———
@tsingular
👍9😁2👌1
Уязвимости в популярных ML-фреймворках угрожают безопасности организаций

Специалисты JFrog обнаружили серию критических брешей в известных системах машинного обучения.

В MLflow найдена опасность XSS-атак через Jupyter Notebooks (CVE-2024-27132).

Фреймворк H2O подвержен рискам небезопасной десериализации при загрузке внешних моделей (CVE-2024-6960).

PyTorch содержит уязвимость обхода каталогов в TorchScript.

В MLeap выявлена проблема с загрузкой zip-архивов (CVE-2023-5245).

Даже Safetensors может быть скомпрометирован через загрузку вредоносного кода на облачные площадки.

Всего исследователи выявили 22 проблемы безопасности в клиентских компонентах ML-платформ.

Доверяй, но проверяй, в общем как всегда.

#MLflow #PyTorch #SecurityVulnerabilities
———
@tsingular
Китай отказывается от процессоров США в пользу отечественных чипов

Правительство КНР вводит запрет на использование процессоров Intel, AMD и Nvidia в продуктах малого и среднего бизнеса.
Ограничения затронули четыре ключевых промышленных региона страны.
Основные причины: проблемы безопасности, частые уязвимости и высокий процент отказов американского оборудования.
Параллельно введены ограничения на экспорт редкоземельных металлов.
Бизнесу рекомендовано переходить на локальные технологические решения.

Неожиданный поворот. :)
Технологический железный занавес опускается всё ниже. Скоро будем жить в трёх параллельных цифровых мирах - западном, восточном и отечественном :)

#Intel #AMD #Nvidia #Китай
-------
@tsingular
6👏4👌2
Forwarded from Denis Sexy IT 🤖
Первые выводы про o1 Pro

TL;DR
: o1 Pro — модель, нацеленная на глубину и точность ответов, особенно полезная для людей, уже разбирающихся в теме и способных оценить качество выдачи. Без чётких вводных модель может быть поверхностной, но при грамотных запросах способна дать действительно ценные инсайты. Но это все еще не AGI.

— o1 Pro ориентирована на специалистов, глубоко погружённых в свою область. Она легко разбирает сложные научные данные, тексты любой сложности и код, но настоящую пользу приносит тем, кто может понять, где модель поверхностна или ошибается, и скорректировать её ход мыслей.

— Я использовал эту модель в бизнесе и пытался применить её для решения маркетинговых задач. По умолчанию она выдавала лишь «первого уровня» посылы, просто перечисляя фичи. Но опытный маркетолог знает, что клиенты покупают не функционал, а историю и идею. Например, Apple не говорит: «Мы добавили камеру получше», а показывает, как люди сохраняют важные моменты. Чтобы o1 Pro смогла сделать то же самое, нужно направлять её, задавая правильные вопросы и требуя глубины, а не просто сводки преимуществ.

— Визуальный анализ у o1 Pro серьёзно продвинулся: она лучше распознаёт детали на изображениях по сравнению с предыдущими моделями, которые я пробовал.

— При создании художественных текстов (я пробовал сделать что-то вроде интерактивной текстовой игры с зомби-апокалипсисом) o1 Pro пишет шикарно. Она хорошо держит логику сюжета, помнит детали и героев, не скатывается в бессвязный поток. Однако без новых вводных идей от пользователя сама модель не двигается дальше и не создаёт неожиданные сюжетные повороты, полагаясь на креативность пользователя.

— В написании кода o1 Pro не лучше других моделей. Ничего сверхъестественного в её программных навыках я не заметил, еще и учитывая как долго она думает.

— Модель обрабатывает запросы довольно долго: иногда около минуты, а порой и до пяти. Это значит, что быстро спросить у неё, например, рецепт прямо в магазине, не получится. Скорее, o1 Pro ассистент для вдумчивого взаимодействия, когда вы можете задать вопрос и заняться своими делами, пока она «думает».

— В плане факт-чекинга o1 Pro показала себя с лучшей стороны. За всё время тестирования мне не удалось поймать её на откровенной фактической ошибке. Если модель сталкивается с сомнительной информацией, она либо отказывается отвечать, либо указывает на неточность, демонстрируя глубину самопроверки, либо говорит мне, что я не прав.

— Этот пост написан моделью o1 Pro по моей надиктовке, без последующего редактирования. На подготовку текста ушло примерно столько же времени, сколько заняло бы самостоятельное наборное редактирование с ноутбука.

Вывод: Пока у меня есть сомнения насчёт того, окупит ли o1 Pro стоимость в 200 долларов в месяц. Нынешняя версия «обычной» O1 решает многие схожие задачи не хуже. Посмотрим, что будет дальше, когда OpenAI покажет все обновления.
👍81
в X (twitter) добавили Aurora - рисовалка в Grok с минимальным цензором

X выпустила фотореалистичный генератор изображений Aurora с доступом для всех пользователей через интерфейс Grok.

Уникальная особенность - минимум ограничений на контент, включая возможность генерации защищённых авторским правом персонажей.

Функционал доступен через опцию Grok 2 + Aurora beta в меню выбора моделей.

Точность в анатомии и деталях пока хромает.

Полный доступ только для владельцев Premium-подписки в X.

UPD: Пока в бете. Уже отключили на доработку.

#Aurora #Grok #XAI
———
@tsingular
Популярная ИИ-библиотека Ultralytics подверглась атаке

Разработчики популярного фреймворка компьютерного зрения Ultralytics обнаружили вредоносный код в своей библиотеке.
Злоумышленники внедрили троян в PyPI-пакет ultralytics, использующийся для работы с YOLO.
Вредоносная версия 8.0.228 загружалась более 2000 раз до обнаружения.
Троян собирал системную информацию и отправлял её на удалённый сервер.
Команда оперативно удалила скомпрометированную версию и выпустила патч 8.0.229.

Если кто использует, - обновляемся.

#Ultralytics #YOLO #cybersecurity
-------
@tsingular
Alibaba выпускает ClearerVoice-Studio: Open-Source фреймворк для обработки звука

Alibaba Speech Lab представили набор инструментов с открытым кодом для обработки речи.
Система интегрирует SOTA-модели для шумоподавления, разделения голосов и выделения целевого спикера.
В основе лежат технологии FRCRN и MossFormer.

Фреймворк включает компоненты для обработки, обучения и оценки качества речи с поддержкой до 48кГц.

Проект доступен на GitHub и в Hugging Face и идет в наборе с готовыми предобученными моделями.

Теперь даже домашний подкаст можно записывать в студийном качестве. Шах и мат, звукорежиссеры! 🎙

#Alibaba #ClearerVoice #MossFormer #Китай
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini в Google Docs - теперь создаёт документы с нуля

Google запустил функцию "Help me create" для автоматической генерации форматированных документов через Gemini.

Виртуальный помощник формирует меню, брифы, бюллетени, КП и блог-посты по текстовому запросу.

Нововведение доступно в веб-версии через File > New > Help me create.

Система поддерживает естественные диалоги и референсы на файлы через @filename.

Сервис развёртывается поэтапно для участников Workspace Alpha и Labs.

Ограничения: работает только с пустыми документами, без картинок и фото людей.

Кому нужен MS Office, когда в Google Docs теперь ИИ создаёт документы!
Мой Офис, когда уже добавит подобное?
Пусть даже с ГигаЧатом, раз своих моделей нет.

#Google #Gemini #Workspace
———
@tsingular
👍3
🚀 Разбор o1-pro на Reddit: первые дни новой модели от OpenAI

Народ активно тестирует новую модель, и делится первыми результатами:

💎 Что нового:
- Контекстное окно 128K
- Безлимитное использование - никаких "подождите немного"
- Pro режим - улучшенное "мышление" на сложных задачах
- Ценник: $200/месяц (около $250 с налогами)

🔥 Первые впечатления пользователей:
- Data scientists в восторге: "снижает когнитивную нагрузку при решении сложных задач"
- Разработчики: "one-shot написание рекурсивного Reversi на C в 500+ строк и работает!"
- Есть даже случаи, когда джуны с помощью AI делают за месяц то, что команда из 5 человек делала год (хотя тут, конечно, стоит учитывать правило 80/20 😉)

⚡️ В чём реально силён:
- Глубокий анализ сложных больших баз кода
- Мастерски поддерживает и переписывает legacy-код
- Стабильно решает комплексные технические задачи
- Выдаёт более последовательные и надёжные ответы

🤔 Где пока спотыкается:
- Простые тесты всё ещё проблема (те самые пресловутые подсчёты букв и головоломки)
- В некоторых задачах Claude по-прежнему впереди
- Некоторые пишут, что o1-preview был лучше

💰 Кому точно пригодится:
- Data scientists и аналитикам
- Разработчикам сложных систем
- Исследователям
- Техническим специалистам, которые регулярно сталкиваются со сложными задачами

💡 Интересная мысль из обсуждения: "если вам действительно нужна модель такого уровня, странно не суметь заработать с её помощью $200 в месяц"

🎯 Итого:
- Обычному пользователю хватит базового o1 за $20/месяц
- Pro версия - для тех, кто может монетизировать её возможности
- Возможно, стоит подождать: цены могут измениться, функционал улучшиться и конкуренты подтянутся заодно.

#o1pro #OpenAI
———
@tsingular
👍4🤔21