Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

Моя TRELLIS!

Пока мы тут алкаем Sora, я вам принес новый 3Д-генератор. И какой!

1. Опенсорсный!
2. Довольно убойного качества.
3. Это Микрософт.

Пока он работает только по входной картинке, что уже неплохо, но они обещают скоро докинуть TRELLIS-text-xlarge на 2B параметров, что для text-to-3D очень круто.
А тренировались они на полумиллионе моделей и похоже не только на помойках типа objaverse.
Они умеют выводить во все, что шевелится в 3Д: Radiance Fields, 3D Gaussians, and meshes.
И анонсируют даже редактирование и модификацию сгенерированных моделей через промпты (покричим на модельки?). Оторви руку, замени ногу, дай в руки палицу - есть примеры на сайте.

Выглядит сладчайше. Все черрипики есть у них на сайте, следующим постом я вам вкину народное творчество из TRELLIS, а тут хочу поделиться тем, что уже попробовал его(а не только твиттор перепечатал), и он меня удивил.

Дал ему на вход довольно иезуитскую картинку с флюксовым бьюти-тараканом - он его пережевал и выдал геометрию с очень тонкими деталями. Кстати, он понимает картинки с альфой или пользует removebg, чтобы отрезать фон, имейте в виду.

Он выдал видос со сплатами и выплюнул меш. Топологию прилагаю. Не айс, конечно, нужен ретоп.

Но это опен-сорс и похоже на голову лучше-всех-опен-сорс в области генерации 3Д.
Очень жду большую модель.

И это идеально оформленный Гитхаб репозитарий. После китайских "навалили-разбирайтесь", тут все расписано даже для тупых нейродедов.

Черрипики и красоту смотрим тут: https://trellis3d.github.io/ - можно сетки посмотреть.

Ставим отсюда: https://github.com/Microsoft/TRELLIS

Более того, есть демо: https://huggingface.co/spaces/JeffreyXiang/TRELLIS-text-xlarge

Ночью ворочалось нормально.

Го тестировать и 3дшить.

@cgevent

👍10❤1

736 views12:54

Технозаметки Малышева

Forwarded from эйай ньюз

Вышла Llama 3.3!

70B модельку дотюнили так, что она порами обгоняет 405B. Особенно большой прирост на математике и кодинге, в которых Llama традиционно была послабее. В этот раз релизят только 70B, других размеров и VLM нету.

Веса

@ai_newz

👍2❤1

702 views16:59

Технозаметки Малышева

2 день из 12ти эфира OpenAI.
https://www.youtube.com/watch?v=fMJMhBFa_Gc

Ждём корпоративную Сору за $2000 в месяц,видимо уже.

—

RL finetune.
Прикольная штука, - загружаешь свои данные, ждёшь 2 дня и получаешь свою собственную локальную модель О1-мини заточенную под свои задачи.
Фабрика кастомных моделей!

#OpenAI #advent
———
@tsingular

YouTube

12 Days of OpenAI: Day 2

Begins at 10am PT

Join Mark Chen, SVP of OpenAI Research, Justin Reese, Computational Researcher in Environmental Genomics and Systems Biology, Berkeley Lab, and some team members from OpenAI as they demo and discuss Reinforcement Fine-Tuning.

🤔5

803 viewsedited 17:56

Технозаметки Малышева

Загнал в бесплатного бота @ai_gptfreebot
ollama llama 3.3 70B 42Gb версию.

Пришлось ради этого выключить генератор картинок.
Поиск оставил.

Но зато все могут попробовать новую модель на 2х4090.

В понедельник верну картинки и переключу обратно на gemma2:27b

А пока, - развлекайтесь :)

#llama3-3 #ollama #freeGPTbot
———
@tsingular

👍5😐4

1.02K viewsedited 20:03

Технозаметки Малышева

По мнению сотрудника OpenAI, они уже достигли AGI

"По моему мнению, мы уже достигли AGI, и это еще более очевидно с O1.

Мы не достигли «лучше, чем любой человек в любой задаче», но то, что у нас есть, это «лучше, чем большинство людей в большинстве задач».

Некоторые говорят, что LLM знают только, как следовать инструкции.

Во-первых, никто не может на самом деле объяснить, чему может научиться глубокая нейронная сеть с триллионом параметров.

Но даже если вы в это верите, весь научный метод можно обобщить как инструкцию: наблюдать, выдвигать гипотезы и проверять.

Хорошие ученые могут выдвигать лучшие гипотезы, основываясь на своей интуиции, но сама эта интуиция была создана путем многих проб и ошибок.

Нет ничего, чему нельзя было бы научиться на примерах."

#AGI #OpenAI
———
@tsingular

👍9😁2👌1

822 viewsedited 06:48

Технозаметки Малышева

Уязвимости в популярных ML-фреймворках угрожают безопасности организаций

Специалисты JFrog обнаружили серию критических брешей в известных системах машинного обучения.

В MLflow найдена опасность XSS-атак через Jupyter Notebooks (CVE-2024-27132).

Фреймворк H2O подвержен рискам небезопасной десериализации при загрузке внешних моделей (CVE-2024-6960).

PyTorch содержит уязвимость обхода каталогов в TorchScript.

В MLeap выявлена проблема с загрузкой zip-архивов (CVE-2023-5245).

Даже Safetensors может быть скомпрометирован через загрузку вредоносного кода на облачные площадки.

Всего исследователи выявили 22 проблемы безопасности в клиентских компонентах ML-платформ.

Доверяй, но проверяй, в общем как всегда.

#MLflow #PyTorch #SecurityVulnerabilities
———
@tsingular

799 views07:07

Технозаметки Малышева

Китай отказывается от процессоров США в пользу отечественных чипов

Правительство КНР вводит запрет на использование процессоров Intel, AMD и Nvidia в продуктах малого и среднего бизнеса.
Ограничения затронули четыре ключевых промышленных региона страны.
Основные причины: проблемы безопасности, частые уязвимости и высокий процент отказов американского оборудования.
Параллельно введены ограничения на экспорт редкоземельных металлов.
Бизнесу рекомендовано переходить на локальные технологические решения.

Неожиданный поворот. :)
Технологический железный занавес опускается всё ниже. Скоро будем жить в трёх параллельных цифровых мирах - западном, восточном и отечественном :)

#Intel #AMD #Nvidia #Китай
-------
@tsingular

✍6👏4👌2

918 viewsedited 07:11

Технозаметки Малышева

Будьте осторожны с chatGPTи 😀
https://t.iss.one/bugnotfeature/14027

1:37

Не баг, а фича

После такого любой сеньор напьётся.

🙂 Не баг, а фича

🔥11🤣6😢1

886 views13:34

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

Первые выводы про o1 Pro

TL;DR: o1 Pro — модель, нацеленная на глубину и точность ответов, особенно полезная для людей, уже разбирающихся в теме и способных оценить качество выдачи. Без чётких вводных модель может быть поверхностной, но при грамотных запросах способна дать действительно ценные инсайты. Но это все еще не AGI.

— o1 Pro ориентирована на специалистов, глубоко погружённых в свою область. Она легко разбирает сложные научные данные, тексты любой сложности и код, но настоящую пользу приносит тем, кто может понять, где модель поверхностна или ошибается, и скорректировать её ход мыслей.

— Я использовал эту модель в бизнесе и пытался применить её для решения маркетинговых задач. По умолчанию она выдавала лишь «первого уровня» посылы, просто перечисляя фичи. Но опытный маркетолог знает, что клиенты покупают не функционал, а историю и идею. Например, Apple не говорит: «Мы добавили камеру получше», а показывает, как люди сохраняют важные моменты. Чтобы o1 Pro смогла сделать то же самое, нужно направлять её, задавая правильные вопросы и требуя глубины, а не просто сводки преимуществ.

— Визуальный анализ у o1 Pro серьёзно продвинулся: она лучше распознаёт детали на изображениях по сравнению с предыдущими моделями, которые я пробовал.

— При создании художественных текстов (я пробовал сделать что-то вроде интерактивной текстовой игры с зомби-апокалипсисом) o1 Pro пишет шикарно. Она хорошо держит логику сюжета, помнит детали и героев, не скатывается в бессвязный поток. Однако без новых вводных идей от пользователя сама модель не двигается дальше и не создаёт неожиданные сюжетные повороты, полагаясь на креативность пользователя.

— В написании кода o1 Pro не лучше других моделей. Ничего сверхъестественного в её программных навыках я не заметил, еще и учитывая как долго она думает.

— Модель обрабатывает запросы довольно долго: иногда около минуты, а порой и до пяти. Это значит, что быстро спросить у неё, например, рецепт прямо в магазине, не получится. Скорее, o1 Pro ассистент для вдумчивого взаимодействия, когда вы можете задать вопрос и заняться своими делами, пока она «думает».

— В плане факт-чекинга o1 Pro показала себя с лучшей стороны. За всё время тестирования мне не удалось поймать её на откровенной фактической ошибке. Если модель сталкивается с сомнительной информацией, она либо отказывается отвечать, либо указывает на неточность, демонстрируя глубину самопроверки, либо говорит мне, что я не прав.

— Этот пост написан моделью o1 Pro по моей надиктовке, без последующего редактирования. На подготовку текста ушло примерно столько же времени, сколько заняло бы самостоятельное наборное редактирование с ноутбука.

Вывод: Пока у меня есть сомнения насчёт того, окупит ли o1 Pro стоимость в 200 долларов в месяц. Нынешняя версия «обычной» O1 решает многие схожие задачи не хуже. Посмотрим, что будет дальше, когда OpenAI покажет все обновления.

👍8❤1

759 views17:17

Технозаметки Малышева

в X (twitter) добавили Aurora - рисовалка в Grok с минимальным цензором

X выпустила фотореалистичный генератор изображений Aurora с доступом для всех пользователей через интерфейс Grok.

Уникальная особенность - минимум ограничений на контент, включая возможность генерации защищённых авторским правом персонажей.

Функционал доступен через опцию Grok 2 + Aurora beta в меню выбора моделей.

Точность в анатомии и деталях пока хромает.

Полный доступ только для владельцев Premium-подписки в X.

UPD: Пока в бете. Уже отключили на доработку.

#Aurora #Grok #XAI
———
@tsingular

766 views06:51

Технозаметки Малышева

Популярная ИИ-библиотека Ultralytics подверглась атаке

Разработчики популярного фреймворка компьютерного зрения Ultralytics обнаружили вредоносный код в своей библиотеке.
Злоумышленники внедрили троян в PyPI-пакет ultralytics, использующийся для работы с YOLO.
Вредоносная версия 8.0.228 загружалась более 2000 раз до обнаружения.
Троян собирал системную информацию и отправлял её на удалённый сервер.
Команда оперативно удалила скомпрометированную версию и выпустила патч 8.0.229.

Если кто использует, - обновляемся.

#Ultralytics #YOLO #cybersecurity
-------
@tsingular

696 views08:12

Технозаметки Малышева

Alibaba выпускает ClearerVoice-Studio: Open-Source фреймворк для обработки звука

Alibaba Speech Lab представили набор инструментов с открытым кодом для обработки речи.
Система интегрирует SOTA-модели для шумоподавления, разделения голосов и выделения целевого спикера.
В основе лежат технологии FRCRN и MossFormer.

Фреймворк включает компоненты для обработки, обучения и оценки качества речи с поддержкой до 48кГц.

Проект доступен на GitHub и в Hugging Face и идет в наборе с готовыми предобученными моделями.

Теперь даже домашний подкаст можно записывать в студийном качестве. Шах и мат, звукорежиссеры! 🎙

#Alibaba #ClearerVoice #MossFormer #Китай
-------
@tsingular

761 viewsedited 08:16

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini в Google Docs - теперь создаёт документы с нуля

Google запустил функцию "Help me create" для автоматической генерации форматированных документов через Gemini.

Виртуальный помощник формирует меню, брифы, бюллетени, КП и блог-посты по текстовому запросу.

Нововведение доступно в веб-версии через File > New > Help me create.

Система поддерживает естественные диалоги и референсы на файлы через @filename.

Сервис развёртывается поэтапно для участников Workspace Alpha и Labs.

Ограничения: работает только с пустыми документами, без картинок и фото людей.

Кому нужен MS Office, когда в Google Docs теперь ИИ создаёт документы!
Мой Офис, когда уже добавит подобное?
Пусть даже с ГигаЧатом, раз своих моделей нет.

#Google #Gemini #Workspace
———
@tsingular

👍3

763 views08:22

Технозаметки Малышева

🚀 Разбор o1-pro на Reddit: первые дни новой модели от OpenAI

Народ активно тестирует новую модель, и делится первыми результатами:

💎 Что нового:
- Контекстное окно 128K
- Безлимитное использование - никаких "подождите немного"
- Pro режим - улучшенное "мышление" на сложных задачах
- Ценник: $200/месяц (около $250 с налогами)

🔥 Первые впечатления пользователей:
- Data scientists в восторге: "снижает когнитивную нагрузку при решении сложных задач"
- Разработчики: "one-shot написание рекурсивного Reversi на C в 500+ строк и работает!"
- Есть даже случаи, когда джуны с помощью AI делают за месяц то, что команда из 5 человек делала год (хотя тут, конечно, стоит учитывать правило 80/20 😉)

⚡️ В чём реально силён:
- Глубокий анализ сложных больших баз кода
- Мастерски поддерживает и переписывает legacy-код
- Стабильно решает комплексные технические задачи
- Выдаёт более последовательные и надёжные ответы

🤔 Где пока спотыкается:
- Простые тесты всё ещё проблема (те самые пресловутые подсчёты букв и головоломки)
- В некоторых задачах Claude по-прежнему впереди
- Некоторые пишут, что o1-preview был лучше

💰 Кому точно пригодится:
- Data scientists и аналитикам
- Разработчикам сложных систем
- Исследователям
- Техническим специалистам, которые регулярно сталкиваются со сложными задачами

💡 Интересная мысль из обсуждения: "если вам действительно нужна модель такого уровня, странно не суметь заработать с её помощью $200 в месяц"

🎯 Итого:
- Обычному пользователю хватит базового o1 за $20/месяц
- Pro версия - для тех, кто может монетизировать её возможности
- Возможно, стоит подождать: цены могут измениться, функционал улучшиться и конкуренты подтянутся заодно.

#o1pro #OpenAI
———
@tsingular

👍4🤔2❤1

783 views09:55

About

Blog

Apps

Platform