Технозаметки Малышева

Невозможно: французский стартап Kyutai этой ночью уделал OpenAI. Ребята показали голосового ассистента, который идентичен тому, что должен появиться в ChatGPT, но до сих пор не появился.

Moshi — это нейронка, которая говорит с использованием 70 разных эмоций и акцентов. Код обещают опубликовать в опенсорсе, а сам ИИ сделать проще, чтобы запускался даже на ноутбуках.

Русский язык тулза пока не понимает, но зато у неё уже есть демо — чекаем тут.

🙂

Не баг, а фича

Please open Telegram to view this post

VIEW IN TELEGRAM

163 views12:06

Технозаметки Малышева

Forwarded from Не баг, а фича

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

ChatGPT официально убит — вышла GPT4All v3. Нейронка позволяет запускать больше 1000 моделей локально на вашем ПК! Это — настоящая революция в мире чатботов и вот, почему:

• Это первый клиент, куда можно загружать любые свои файлы — код, диплом, статьи, что угодно, и задавать по материалу любые вопросы. Ответ будет дан немедленно;

• Это идеально оптимизированный клиент — подгрузка файлов не нагружает систему, а боты работают очень быстро;

• Это уникальный клиент, который работает локально — вы можете дать ИИ всё, что угодно, не боясь утечки данных.

GPT4All v3 доступна для всех актуальных ОС, а установить её можно тут.

🙂

Не баг, а фича

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5

160 views12:10

Технозаметки Малышева

🚀 Всем привет! Запилил нового бота для учёта времени и активностей.

Он поможет отслеживать, какое время вы тратите на различные задачи в течение дня. 🕒

Что умеет бот:
1. Начало отслеживания новой активности — бот анализирует ваш текст и автоматически классифицирует его по категориям.
2. Просмотр текущих и недавних активностей — узнайте, что и как долго вы делали, и получите сводку по прошлым задачам.
3. Анализ данных по активностям — бот предоставляет анализ времени, потраченного на различные категории, с детальным описанием.

Главная функция бота - секундомер и отчет.
Тут нет поиска в интернете или ответов на расширенные вопросы.

Есть идеи добавить биллингуемые задачи и поддержку плана работы, но пока это только запись текущей активности.

Ссылка на бота: @ai_ttracker_bot

Буду благодарен за любую обратную связь и предложения по доработке! 🙌

#Dev #Claude #TimeTracker
———
@tsingular

❤3

201 viewsedited 14:10

Технозаметки Малышева

Forwarded from эйай ньюз

Вопрос ИИ индустрии на 600 миллиардов долларов

В прошлом году один из партнёров в Sequoia (одна из крупнейших VC фирм в мире) написал статью: AI’s $200B Question. В ней он соотносил мировые траты на GPU с выручкой компаний от ИИ. Методика проста: на основе выручки Nvidia считаются мировые траты на ИИ датацентры, которые в прошлом году по проекции составляли бы 100 миллиардов в год.

А ведь компании не могут тратиться на одни датацентры: сотрудникам нужно платить, офисы арендовать, да и прибыль инвесторам показывать. На всё это нужно было 200 миллиардов долларов выручки, тогда как вся индустрия показывала от силы 75, то есть был бы разрыв в 125 лярдов.

Спойлер: реальная цифра была более чем 146% от проецируемой, 147 миллиардов. То есть разрыв между реальной выручкой и необходимой выручкой на прошлый год составил 220 миллиардов

Сейчас вышел обновлённый репорт, на основе современных данных. Результаты шокируют: на конец этого года, при текущих темпах роста, траты на датацентры вырастут до 300 миллиардов в год. То есть для поддержания таких трат индустрии нужна выручка в 600 миллиардов в год. Это, если что, выручка Microsoft и Apple вместе взятых.

Хоть выручка от ИИ, по его оценкам, тоже выросла до 100 миллиардов, её роста всё равно не хватает. Пропасть между реальной и необходимой выручкой выросла в более чем 2 раза, с 220 до 500 миллиардов долларов.

А можно ещё вспомнить что, кроме чипов Nvidia, у бигтеха тоже есть ещё куча своих чипов. Они тоже производятся огромными партиями и на них тоже тратятся миллиарды долларов, так что реальные траты на датацентры могут быть значительно выше.

Так что пацаны, пузырь?

@ai_newz

130 views16:10

Технозаметки Малышева

Китай лидирует в гонке патентов на генеративный ИИ

Патентные заявки на инновации в сфере генеративного ИИ выросли в 8 раз за 6 лет.
За десятилетие подано 54 000 патентов, четверть из них - в последний год.
Китай возглавляет список с 38 000 инноваций, за ним следуют США, Южная Корея и Япония.
Индия демонстрирует рекордный рост в 56% ежегодно.
Лидируют китайские гиганты: Tencent, Ping An Insurance, Baidu. IBM на пятом месте.
Преобладают патенты в областях изображений, видео, текста и речи.
Растет интерес к молекулярным, генетическим и белковым данным.

У кого патенты, - тот и лидер.
Правильной дорогой идут товарищи.

#China #patents #generativeAI
-------
@tsingular

❤‍🔥1

159 views05:48

Технозаметки Малышева

Cloudflare запускает защиту от ИИ-ботов

Компания Cloudflare представила новый инструмент "AIndependence" для защиты веб-ресурсов.
Функционал позволяет одним кликом блокировать ботов, скрайперов и краулеров, использующих ИИ.
Цель разработки - предотвратить несанкционированный сбор данных с сайтов для обучения нейросетей.
Решение обеспечивает владельцам веб-платформ контроль над использованием контента в ИИ-проектах.
Технология призвана защитить интеллектуальную собственность и сохранить конфиденциальность информации в сети.

Следующий шаг, как в ZeroTrust - режим запрета доступа ИИ по умолчанию к веб сайтам.
Платный доступ для роботов, - оплата криптой автоматом через микроплатежи.

#Cloudflare #AIndependence #websecurity
-------
@tsingular

207 views05:52

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

Одно из направлений развития AI индустрии которое лично мне очень нравится, это «предсказательные» модели – вы ей данные на вход, а она вам предсказывает погоду, курсы, счета за воду, что угодно.

Так вот, IBM выпустила маленькую модель «Tiny Time Mixer (TTM)», с нормальной лицензией для коммерческого использования, которая для своего размера бьет много крупных моделей такого же типа – если вы любите попытку предсказания будущего, то вот полезная ссылка про эту модельку, передавайте привет там в будущем

P.S. Любопытно, что модель не на архитектуре трансформеров (на которой все эти GPT4 и тп)

187 views18:09

Технозаметки Малышева

Forwarded from что-то на DL-ском

Когда Microsoft дропнули код для нового способа построения графа для RAG системы, первая мысль в голове: а что изменилось в сравнении с такими фреймворками, как ontotext , NebulaGraph и Neo4j

❔

Почитала их статью от апреля, рассказываю и вам, чтобы вы сэкономили свое время 😊 :

💛Разделение текста на чанки оптимального размера для баланса между эффективностью и и длинной контекста в излеченной информации

💛Использование многоэтапного LLM-промпта для извлечения сущностей, их отношений и дополнительных атрибутов из каждого чанка текста.

💛Возможность настройки промптов под конкретную предметную область путем подбора few-shot примеров.

💛Применение нескольких раундов "доизвлечения" (gleanings) для обнаружения пропущенных сущностей, что позволяет использовать более крупные чанки без потери качества.

💛Использование LLM для создания абстрактных сводок извлеченных элементов, включая описания сущностей, отношений и утверждений.

💛Дополнительный этап суммаризации для объединения информации о повторяющихся элементах графа.

💛Применение алгоритма Leiden для разделения графа на иерархические community с более сильными внутренними связями. А далее описание каждой такой группы для детальной детализации семантики документов

💛Многоэтапный процесс генерации глобального ответа на запрос пользователя:
😅Подготовка и случайное перемешивание сводок сообществ.
🙋‍♀️Параллельная генерация промежуточных ответов для каждого чанка с оценкой релевантности.
🙃Объединение наиболее релевантных
промежуточных ответов в финальный глобальный ответ.

🖥Сама репа

🖥

Тут подсобрали быстрый деплой GraphRAG на Azure

📖

Статья

Please open Telegram to view this post

VIEW IN TELEGRAM

217 views17:57

Технозаметки Малышева

Китайские AI-гиганты поощряют разработчиков на фоне запретов OpenAI

OpenAI заблокировала доступ к своим сервисам из Китая, что вызвало активный ответ местных AI-компаний.

SenseTime представила мультимодальную модель SenseNova 5.5, сравнимую с GPT-4 и предлагает 50 млн бесплатных токенов и помощь в миграции.
https://www.sensetime.com/en/news-detail/51168278

Baidu, Zhipu AI и Tencent Cloud также предоставляют бесплатные токены для своих AI-моделей.

Китай на сегодня располагает 130 крупными языковыми моделями, что составляет 40% мирового объёма.

Таким образом, ограничения OpenAI могут, по факту, ускорить развитие китайских AI-компаний и усилить их независимость.

#SenseTime #SenseNova #ChinaTech
-------
@tsingular

❤‍🔥3🔥3🫡2

190 viewsedited 05:23

Технозаметки Малышева

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

Xiaomi запускает безлюдное производство смартфонов

Китайский техногигант Xiaomi представил новую "тёмную фабрику" - полностью автоматизированное предприятие по выпуску гаджетов.
Инновационное производство функционирует круглосуточно без участия человека.
Роботизированные линии самостоятельно осуществляют все этапы сборки устройств.
Компания демонстрирует стремление к повышению эффективности и технологичности производственных процессов.
Внедрение подобных решений может существенно снизить издержки и ускорить выпуск новых моделей смартфонов.

Роботы победили в производстве, получается.
И построить такие безлюдные фабрики можно, технически, где угодно.

#Xiaomi #DarkFactory #Automation
-------
@tsingular

❤4❤‍🔥1👀1

558 viewsedited 13:00

Технозаметки Малышева

Иран запускает государственную ИИ-организацию

В Тегеране открыта Национальная организация по ИИ Ирана при участии вице-президента по науке и технологиям.
Цель - вывести страну в топ-10 по ИИ за 10 лет.
Создается стратегический совет из министров для реализации нацпрограммы по ИИ.
Организация под прямым контролем президента призвана развивать исламский мир и укреплять научную базу.
Ранее утвержден национальный документ по искусственному интеллекту.

Новый президент, - новые приоритеты.

#Iran #NationalAIStrategy #TechnologyDevelopment
-------
@tsingular

🔥4😢2

172 views05:29

Технозаметки Малышева

Tencent совершенствует AI-кластеры: сеть Xingmai 2.0 поддерживает уже 100 000 GPU

Китайский гигант Tencent модернизировал сеть Xingmai 2.0 для высокопроизводительных вычислений:
• Поддержка 100 000 GPU в одном кластере
• Рост эффективности сетевого взаимодействия на 60%
• Увеличение скорости обучения LLM на 20%
Компания оптимизирует существующую инфраструктуру одновременно с закупками новых процессоров.
Tencent продвигает свои LLM в корпоративном секторе и предлагает услуги по разработке ИИ-моделей.
В Китае постоянно появляются новые выгодные предложения в сфере ИИ: Tencent сделала облегченную версию Hunyuan бесплатной.

Согласно опросам, Поднебесная лидирует по внедрению генеративного ИИ в мире.

При этом, ожидается рост рынка ИИ-чипов на $389,25 млрд к 2027му году.

Пора, все-таки, выучить китайский уже.

#Tencent #Xingmai #HPC
-------
@tsingular

❤1

183 viewsedited 05:35

Технозаметки Малышева

Microsoft покидает совет директоров OpenAI из-за антимонопольного давления

Корпорация Microsoft приняла решение выйти из состава совета директоров OpenAI.
Причина - усиление антимонопольного контроля со стороны регуляторов.
Это не повлияет на партнерство компаний и инвестиции Microsoft в размере $13 млрд.
Шаг направлен на снижение рисков обвинений в монополизации рынка ИИ.
OpenAI сохранит независимость в принятии решений по развитию технологий.
Ожидается продолжение тесного сотрудничества в области исследований и разработок ИИ.

Интересное кино.
Прокачали Copilot и все.
Или тоже устали ждать GPT5 ?

#Microsoft #OpenAI #antitrust
———
@tsingular

⚡1

178 views09:33

Технозаметки Малышева

Forwarded from эйай ньюз

Набор инструкций H100 и 4090 теперь задокументирован

👏

Умелец смог при помощи фаззера задокументировать набор инструкций актуальных карт Nvidia. Сама Nvidia такое в паблик не пускает, чтобы всё шло через CUDA, максимум PTX. Таким образом они добиваются вендорлока к картам Nvidia в целом, а не одной конкретной архитектуре.

Проблема в том, что без такой документации заметно сложнее делать оптимизации под конкретные архитектуры. А вот с ней и альтернативные компиляторы для карт Nvidia делать будет проще, может, будут даже такие, что не качают пять гигов зависимостей (что-то я замечтался).

Дальше автор собирается добавить данные о производительности каждой инструкции, что потребует кучу микробенчмарков.

H100
RTX 4090
Код

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤‍🔥1🔥1

165 views15:00

Технозаметки Малышева

ИИ ускоряет автономную кибербезопасность

ИИ трансформирует операции безопасности, делая их более автономными и эффективными.
Автономные системы безопасности (ASS) смогут самостоятельно обнаруживать, анализировать и реагировать на угрозы.
Концепция Автономного центра операций безопасности (ASOC) предполагает 6 уровней автоматизации, аналогично автопилоту.
ИИ позволит одному аналитику обрабатывать несколько инцидентов одновременно, повышая производительность.
С ростом автономности снижается необходимость вмешательства человека в рутинные процессы.
Аналитики смогут сфокусироваться на стратегическом планировании и сложных задачах.
Внедрение ИИ устанавливает новые стандарты в скорости и объеме обработки данных о безопасности.

Очень детальный разбор от SentinelOne по структуре центров безопасности с использованием ИИ.

#ASOC #cybersecurity #autonomousystems
-------
@tsingular

171 views14:46

Технозаметки Малышева

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Claude представляет функции публикации и ремикса артефактов

Anthropic расширяет возможности Claude, внедряя систему публикации и ремикса артефактов.
Пользователи могут делиться своими творениями, предоставляя публичный доступ к конкретным версиям.
Опубликованный контент получает уникальную ссылку и отображается на отдельном сайте в защищенной среде.
Функция ремикса позволяет модифицировать чужие работы, создавая новый диалог с ИИ-помощником.
Предусмотрена возможность отмены публикации и удаления артефактов.

Получается, в своём роде, конкуренция GitHub на базе ИИ.

#Anthropic #Claude #ContentSharing

👍1

196 views14:49

Технозаметки Малышева

Forwarded from эйай ньюз

1:30

Media is too big

VIEW IN TELEGRAM

Видео модель с максимальным уровнем контроля.

Стартап Odyssey врывается с двух ног в генеративный AI. Да не с одной моделью, а сразу с 4-мя! Каждая из которых отвечает за свой аспект картинки.
Загибаем пальцы, модель для генерации:
1) high-quality геометрии
2) фотореалистичных материалов
3) освещения
4) подконтрольного моушена
(последний палец видимо мы)

Анонс направлен на Голливуд, и ну конечно же самый пафосный, ощущение, что текст писал сам маэстро:

Мы должны предъявлять к ИИ более высокие требования. Небольшое путешествие по Сети покажет, что мы наводнены низкокачественным контентом, созданным ИИ. Контент-фермы, спам-боты и даже благонамеренные компании используют ИИ для создания текстов и изображений, стремясь придать алгоритмам игровой характер и захватить ваше внимание. Если не сделать все правильно, создание видео с помощью ИИ может пойти в том же направлении, когда мы будем наводнены случайными видео, в которых нет ни искры, ни сюжета. Возможно, через достаточно большой промежуток времени мы пристрастимся к этим нездоровым видео, забыв о том, как выглядит качественное человеческое повествование. Возможно, люди превратятся в наблюдателей за сюжетом, а не в рассказчиков.

В Odyssey мы отвергаем такое будущее.

Короче, все говно, а мы крутые. Ну а начали они, конечно же, с небольшой исторической справочки про то, как наши прародители рассказывали нам истории перед костром. На вот почитайте.

В остальном очевидно, что они нацелены на профессионалов. Я бы сказал, это первый такой серьезный проект. Обещают невиданный ранее контроль изображения с их многослойной системой и интеграцию в существующие киношные пайплайны.

Дата релиза пока не известна, но обещают soon.

Подробности

@ai_newz

164 views18:46

Технозаметки Малышева

Forwarded from эйай ньюз

GPT-2 (1.6B) за 24 часа и всего $672

Карпатый затвитил, что примерно 5 лет назад анонсировали GPT-2. Тогда на тренировку этой модели у OpenAI ушло целых ~$100,000.

Сейчас же, чтобы воспроизвести те результаты потребуется одна нода 8XH100 на 24 часа, что обойдется вам в районе $500-$672.

Карпатый показывает как это легко и дешево сделать на его минималистичном llm.c в 5000 строк кода:
https://github.com/karpathy/llm.c/discussions/677

Далее у Андрея в планах заимплементировать операции в fp8, файнтюнинг, мультимодальность и заонбордить на llm.c более современные архитектуры вроде LLama и Gemma.

Приятно наблюдать, как за 5 лет стоимость обучения модели упала аж в 150-200 раз, благодаря улучшению технологий и, конечно, ускорению железа. Так и до GPT-3 на рисоварке действительно недалеко!

@ai_newz

🔥3👍1

180 views09:23

Технозаметки Малышева

Forwarded from Малоизвестное интересное

В Рунете вирусится анализ ТГ-канала Кримсон Дайджест о «Голдман Сакс и Искусственном Интеллекте (и немного про капитализацию Nvidia)».
Имхо, авторы анализа порхают по кликбейтным вершкам новости, не опускаясь до ее корешков. А корешок этот прост, понятен и полезен для понимания (как у морковки для здоровья)).
Новый отчет Голдман Сакс [3] (он 3-й по счету вышел) следует читать в паре с отчетом их главного конкурента ЖПМорган [2] (он вышел 2-м). И при этом, держа в памяти предыдущий отчет Голдман Сакс, вышедший всего на месяц раньше [1] (опубликован 1-м).
Согласно этим отчетам:
• Отчет #1 - перспективы ИИ для экономики и вообще «очень позитивны»
• Отчет #2 - перспективы ИИ для экономики и вообще «большие и сияющие»
• Отчет #3 - перспективы ИИ для экономики и вообще «совсем не блестящие и сильно переоценены»

По прочтению всех 3х отчетов становится очевидно, что к инвест аналитике они имеют лишь условное отношение. И это всего лишь замаскированные под аналитические отчеты способы влияния на рынок со стороны быков и медведей. И проблема лишь в том, что Голдман Сакс и ЖПМорган никак не определятся, кто из них будут медведем, а кто быком.

— 13 мая Голдман Сакс отчетом #1 решил застолбить за собой место главного быка на ИИ рынках
— 23 мая ЖПМорган отчетом #2 попросил Голдман Сакс подвинуться на этом хлебном месте
— но не желающий делиться местом главного животного, Голдман Сакс всего через месяц отчетом #3 решил превратиться в медведя

Так что делать хоть какие-то серьезные выводы о перспективах ИИ-рынков (HW, SW, Services) на основе наблюдения за подковерной битвой быков и медведей я бы никому не советовал.

Картинка https://telegra.ph/file/e70dc925fbc66b236b1a1.jpg
1 https://www.goldmansachs.com/intelligence/pages/gs-research/gen-ai-too-much-spend-too-little-benefit/report.pdf
2 https://www.jpmorgan.com/insights/investing/investment-trends/how-to-invest-in-ais-next-phase
3 https://www.goldmansachs.com/intelligence/pages/AI-is-showing-very-positive-signs-of-boosting-gdp.html?ref=wheresyoured.at

#ИИ #Экономика

❤1

173 views14:02

Технозаметки Малышева

Forwarded from Machinelearning

🌟

AuraFlow v0.1 — релиз новой open-source большой генеративной модели с собственной архитектурой.

Создание AuraFlow - результат сотрудничества разработчиков Fal.Ai и южнокорейского исследователя генеративных моделей Simo, (наиболее известные работы Simo: адаптация LoRA для LLM и эксперименты в реализации MMDiT с нуля)

Одна из ключевых особенностей AuraFlow - ее архитектура.
Удаление части слоев и замена отдельными блоками DiT дали увеличение масштабируемости и эффективности вычислений. Использование Torch Dynamo + Inductor и torch.compile PT2 оптимизировало тренировочный процесс, повысив производительность модели, а zero-shot learning rate transfer и повторного аннотирования набора данных улучшило качество следования инструкциям и предсказуемость обучения.

В планах развития семейства моделей AuraFlow продолжить совершенствование AuraFlow и удовлетворить потребности потребительских графических карт путем оптимизации внутренней структуры младших моделей и разработка моделей MoE.

При тестировании или использовании AuraFlow следует иметь ввиду, что версия 0.1 является zero-day релизом, в котором, безусловно, не все идеально и на сегодняшний день модель знает не все концепты и стили. Выпуск серии моделей AuraFlow уникальный за последнее время прецедент, он служит напоминанием о том, что ИИ с открытым исходным кодом не стоит на месте.

⚠️ Для локального запуска требуется 24 Gb VRAM (3090, 4090 Nvidia series)

Рекомендации по построению промптов от разработчиков:

- все слова лучше писать в нижнем регистре, разделяя объекты и стиль запятыми, так же как для семейства Stable Diffusion;
- уточните позиционную информацию, цвета, количество объектов, другие визуальные аспекты и особенности. Обязательно включите как можно больше деталей в описание;
- опишите пространственные отношения, которые должны быть на генерируемом изображении. Вы можете использовать такие слова, как "слева/справа", "выше/ниже", "спереди/сзади", "далеко/рядом", "внутри/снаружи";
- включите, при необходимости, взаимодействия объектов, такие как «стол находится перед кухонной кастрюлей» и «на столе есть корзины»;
- опишите относительные размеры объектов, которые должны быть на генерируемом изображении;
- для получения фотографического контента, включите описание фотографических деталей, такие как боке, большое поле зрения и т. д., но не указывайте их просто так, делайте это только тогда, когда это имеет смысл;
- для получения художественного результата, включите детали о стиле, например, минимализм, импрессионизм, масляная живопись и т.д;
- добавьте описания объектов с учетом временных периодов, если это имеет смысл, например, Chevrolet 1950-х годов и т. д.

🟡

Демо HF

🟡

Модель на HF

🟡

Страница проекта

🟡

Workflow для ComfyUI

@ai_machinelearning_big_data

#Generative #ComfyUI #AuraFlow #Diffusers #ML

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM