Forwarded from Dendi Math&AI (Денис Димитров)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⚡Вышла новая китайская модель для генерации видео по тексту 可灵 (или просто Kling)!
Выпустила её Kuaishou Technology — китайская компания, которая разрабатывает одноимённую платформу для коротких видео (и довольно популярна в Китае).
Как заявляют авторы:
👉 модель представляет собой Diffusion Transformer (DiT), работающий в латентном пространстве закодированных видео (при этом при обучении DiT берутся видео разного разрешения и соотношения сторон);
👉 в качестве автоэнкодера видео используется специально обученный 3D VAE;
👉 модель может генерировать Full HD видео (разрешение 1920 х 1080) длинной до 2 минут с частотой 30 кадров в секунду (время, за которое модель генерирует такое видео, авторы не уточняют); при этом Sora за один проход умеет генерировать только минутное видео.
Как водится в последнее время, авторы Kling утверждают, что модель способна отлично имитировать физические характеристики реального мира и создавать видеоролики, соответствующие законам физики (что сейчас так или иначе является целью каждой команды, которая создает собственные text-to-video модели). Хотя всё ещё видны артефакты генерации (даже на представленных черри-пиках).
Концептуально в этом подходе к генерации видео нет ничего нового по сравнению с последними сравнимыми по качеству моделями такими как Sora (OpenAI), Vidu (Tsinghua University and ShengShu Technology), Veo (DeepMind). Очень большую роль играют и значимо влияют на финальное качество:
👉 данные, на которых обучалась модель, их количество и, самое главное, качество (в случае Kling эта информация неизвестна - как и в случае большинства других моделей генерации видео);
👉 количество compute, затраченного на обучение (то есть фактически спецификация и размер кластера и время обучения); в частности, авторы Kling специально подчёркивают большую отдачу (с точки зрения финального качества модели) от масшабирования архитектуры и процесса оптимизации её обучения.
Модель Kling закрытая, есть только статья с примерами в блоге и ссылка на бета-тестирование (правда чтобы в нём поучаствовать, нужен китайский номер 😄)
@dendi_math_ai
Выпустила её Kuaishou Technology — китайская компания, которая разрабатывает одноимённую платформу для коротких видео (и довольно популярна в Китае).
Как заявляют авторы:
👉 модель представляет собой Diffusion Transformer (DiT), работающий в латентном пространстве закодированных видео (при этом при обучении DiT берутся видео разного разрешения и соотношения сторон);
👉 в качестве автоэнкодера видео используется специально обученный 3D VAE;
👉 модель может генерировать Full HD видео (разрешение 1920 х 1080) длинной до 2 минут с частотой 30 кадров в секунду (время, за которое модель генерирует такое видео, авторы не уточняют); при этом Sora за один проход умеет генерировать только минутное видео.
Как водится в последнее время, авторы Kling утверждают, что модель способна отлично имитировать физические характеристики реального мира и создавать видеоролики, соответствующие законам физики (что сейчас так или иначе является целью каждой команды, которая создает собственные text-to-video модели). Хотя всё ещё видны артефакты генерации (даже на представленных черри-пиках).
Концептуально в этом подходе к генерации видео нет ничего нового по сравнению с последними сравнимыми по качеству моделями такими как Sora (OpenAI), Vidu (Tsinghua University and ShengShu Technology), Veo (DeepMind). Очень большую роль играют и значимо влияют на финальное качество:
👉 данные, на которых обучалась модель, их количество и, самое главное, качество (в случае Kling эта информация неизвестна - как и в случае большинства других моделей генерации видео);
👉 количество compute, затраченного на обучение (то есть фактически спецификация и размер кластера и время обучения); в частности, авторы Kling специально подчёркивают большую отдачу (с точки зрения финального качества модели) от масшабирования архитектуры и процесса оптимизации её обучения.
Модель Kling закрытая, есть только статья с примерами в блоге и ссылка на бета-тестирование (правда чтобы в нём поучаствовать, нужен китайский номер 😄)
@dendi_math_ai
Forwarded from Denis Sexy IT 🤖
Запускать GPT-подобные языковые модели на всяких там дорогих видео-картах это уже прошлый век – чувак с нуля собрал модель на 85000 параметров используя маковский аналог экселя «Numbers» ☕️
https://github.com/dabochen/spreadsheet-is-all-you-need
Видимо, языковые модели это новый Doom, будут пытаться запустить всюду
https://github.com/dabochen/spreadsheet-is-all-you-need
Видимо, языковые модели это новый Doom, будут пытаться запустить всюду
Please open Telegram to view this post
VIEW IN TELEGRAM
👏2
Пишем GPT-2 своими руками с Андреем Карпати
В новом видео Андрей Карпати демонстрирует процесс создания модели GPT-2 объемом 124B.
Основная цель — обучение модели GPT2 с использованием веб-данных.
В 4х часовом видео разобраны процедуры подбора параметров под объем GPU и общие требования к модели, валидация, оценка потерь.
Потери на валидации выводятся каждые 100 итераций.
В качестве дополнительной оценки используется набор данных H-SWAG, который представляет из себя тест с множественным выбором, где нужно выбрать наиболее вероятное продолжение предложения.
Задача H-SWAG — выбор естественного продолжения предложения.
Скрипт всего процесса опубликован на GitHub.
- build-nanogpt GitHub repo, with all the changes in this video as individual commits: https://github.com/karpathy/build-nanogpt
- nanoGPT repo: https://github.com/karpathy/nanoGPT
- llm.c repo: https://github.com/karpathy/llm.c
#AIResearch #Karpathy #GPT2
-------
@tsingular
В новом видео Андрей Карпати демонстрирует процесс создания модели GPT-2 объемом 124B.
Основная цель — обучение модели GPT2 с использованием веб-данных.
В 4х часовом видео разобраны процедуры подбора параметров под объем GPU и общие требования к модели, валидация, оценка потерь.
Потери на валидации выводятся каждые 100 итераций.
В качестве дополнительной оценки используется набор данных H-SWAG, который представляет из себя тест с множественным выбором, где нужно выбрать наиболее вероятное продолжение предложения.
Задача H-SWAG — выбор естественного продолжения предложения.
Скрипт всего процесса опубликован на GitHub.
- build-nanogpt GitHub repo, with all the changes in this video as individual commits: https://github.com/karpathy/build-nanogpt
- nanoGPT repo: https://github.com/karpathy/nanoGPT
- llm.c repo: https://github.com/karpathy/llm.c
#AIResearch #Karpathy #GPT2
-------
@tsingular
👍1
DuckDuckGo запускает Duck.ai для приватных чатов с популярными ИИ
Duck.ai позволяет пользователям анонимно и безопасно взаимодействовать с GPT-3.5 Turbo от OpenAI, Claude 3 Haiku от Anthropic, Llama-3 70B от Meta и Mixtral 8x7b от Mistral AI.
DuckDuckGo удаляет метаданные запросов, обеспечивая конфиденциальность пользователей.
Поставщики моделей удаляют чаты в течение 30 дней и не используют их для обучения ИИ.
Сервис бесплатен с ежедневным лимитом, рассматривается платная подписка.
Duck.ai дополняет поисковик DuckDuckGo, позволяя переключаться между поиском и чатом с ИИ.
Теперь можно безопасно поболтать с любимым чатботом. 🦆🔒💬
#DuckDuckGo #privacy #chatbots
-------
@tsingular
Duck.ai позволяет пользователям анонимно и безопасно взаимодействовать с GPT-3.5 Turbo от OpenAI, Claude 3 Haiku от Anthropic, Llama-3 70B от Meta и Mixtral 8x7b от Mistral AI.
DuckDuckGo удаляет метаданные запросов, обеспечивая конфиденциальность пользователей.
Поставщики моделей удаляют чаты в течение 30 дней и не используют их для обучения ИИ.
Сервис бесплатен с ежедневным лимитом, рассматривается платная подписка.
Duck.ai дополняет поисковик DuckDuckGo, позволяя переключаться между поиском и чатом с ИИ.
Теперь можно безопасно поболтать с любимым чатботом. 🦆🔒💬
#DuckDuckGo #privacy #chatbots
-------
@tsingular
Apple Intelligence: масштабное ИИ-обновление для iPhone и Mac
Apple анонсировала линейку ИИ-функций Apple Intelligence для своих устройств:
- ChatGPT от OpenAI интегрирован в iOS, macOS и iPadOS, доступен через Siri
- Более разговорный Siri с пониманием контекста и интеграцией между приложениями
- Генерация фото с удалением людей (🤖) и улучшенным поиском
- Пользовательские эмодзи Genmoji
- Функция Image Playground для создания картинок нейросетью
Большинство функций работают на устройстве, соблюдая приватность данных.
Требуются iPhone 15 Pro, iPad и Mac на чипах М1 и новее. Пока только на английском.
Демократизация ИИ через 100% покрытие массового пользовательского сегмента.
#AppleIntelligence #PrivateAI #iOSGPT
-------
@tsingular
Apple анонсировала линейку ИИ-функций Apple Intelligence для своих устройств:
- ChatGPT от OpenAI интегрирован в iOS, macOS и iPadOS, доступен через Siri
- Более разговорный Siri с пониманием контекста и интеграцией между приложениями
- Генерация фото с удалением людей (🤖) и улучшенным поиском
- Пользовательские эмодзи Genmoji
- Функция Image Playground для создания картинок нейросетью
Большинство функций работают на устройстве, соблюдая приватность данных.
Требуются iPhone 15 Pro, iPad и Mac на чипах М1 и новее. Пока только на английском.
Демократизация ИИ через 100% покрытие массового пользовательского сегмента.
#AppleIntelligence #PrivateAI #iOSGPT
-------
@tsingular
ЕС создаёт цифрового двойника Земли на базе ИИ
Еврокомиссия представила первую версию симулятора Destination Earth (DestinE) для точного прогнозирования изменений климата 🌍🔮.
Система использует две модели: для экстремальных погодных явлений и адаптации к климатическим изменениям.
DestinE работает на суперкомпьютерах Европы, включая LUMI в Финляндии, используя ИИ для ускорения обработки данных.
Цель - создать полного цифрового близнеца Земли к концу десятилетия на основе данных со спутников, IoT-датчиков и госисточников.
Симулятор позволит моделировать влияние жары, штормов, размещения ветряков и др. ЕС выделил >€300 млн на проект.
Кому нужна разведка, когда можно смоделировать поведение целой планеты.
#DestinationEarth #ClimateChange #Supercomputers
-------
@tsingular
Еврокомиссия представила первую версию симулятора Destination Earth (DestinE) для точного прогнозирования изменений климата 🌍🔮.
Система использует две модели: для экстремальных погодных явлений и адаптации к климатическим изменениям.
DestinE работает на суперкомпьютерах Европы, включая LUMI в Финляндии, используя ИИ для ускорения обработки данных.
Цель - создать полного цифрового близнеца Земли к концу десятилетия на основе данных со спутников, IoT-датчиков и госисточников.
Симулятор позволит моделировать влияние жары, штормов, размещения ветряков и др. ЕС выделил >€300 млн на проект.
Кому нужна разведка, когда можно смоделировать поведение целой планеты.
#DestinationEarth #ClimateChange #Supercomputers
-------
@tsingular
Media is too big
VIEW IN TELEGRAM
Китайские роботы-собаки с пулеметами стреляют точнее людей
Китайские ученые из Нанкинского университета науки и техники разработали робота-собаку с 7,62-мм пулеметом, способного вести высокоточную стрельбу очередями по 10 патронов на дистанции 100 метров.
Радиус рассеивания пуль составляет около 5 см, что сопоставимо с точностью профессионального стрелка.
Ключевым элементом является специальная конструкция оружейной установки, компенсирующая отдачу и предотвращающая вспышки ствола при непрерывном огне.
Исследователи полагают, что четвероногие роботы революционизируют городские бои, где традиционная бронетехника неэффективна из-за сложного ландшафта.
Мы стемительно движемся в версию таймлайна, где роботы научатся воевать раньше, чем убираться по дому.
#robotics #weapons #urbanwarfare
-------
@tsingular
Китайские ученые из Нанкинского университета науки и техники разработали робота-собаку с 7,62-мм пулеметом, способного вести высокоточную стрельбу очередями по 10 патронов на дистанции 100 метров.
Радиус рассеивания пуль составляет около 5 см, что сопоставимо с точностью профессионального стрелка.
Ключевым элементом является специальная конструкция оружейной установки, компенсирующая отдачу и предотвращающая вспышки ствола при непрерывном огне.
Исследователи полагают, что четвероногие роботы революционизируют городские бои, где традиционная бронетехника неэффективна из-за сложного ландшафта.
Мы стемительно движемся в версию таймлайна, где роботы научатся воевать раньше, чем убираться по дому.
#robotics #weapons #urbanwarfare
-------
@tsingular
🔥4😢1
Хакеры заразили ComfyUI на GitHub и крадут данные пользователей создающих ИИ контент
Хакеры Nullbulge взломали репозиторий ComfyUI для Stable Diffusion на GitHub.
Создали вредоносное расширение ComfyUI_LLMVISION, которое крадет информацию о криптокошельках, делает скриншоты, и собирает информацию об устройстве, IP и файлах.
Заявляют, что против «ИИ-искусства», вредящего творческой индустрии.
Юзеры уже сообщили о краже данных после установки приложения.
#GitHub #CyberSecurity #StableDiffusion
-------
@tsingular
Хакеры Nullbulge взломали репозиторий ComfyUI для Stable Diffusion на GitHub.
Создали вредоносное расширение ComfyUI_LLMVISION, которое крадет информацию о криптокошельках, делает скриншоты, и собирает информацию об устройстве, IP и файлах.
Заявляют, что против «ИИ-искусства», вредящего творческой индустрии.
Юзеры уже сообщили о краже данных после установки приложения.
#GitHub #CyberSecurity #StableDiffusion
-------
@tsingular
😢2
OpenAI расширяет партнёрство с Microsoft и Oracle для масштабирования ChatGPT
OpenAI, создатель ChatGPT, будет использовать мощности Oracle Cloud Infrastructure (OCI) в дополнение к Microsoft Azure для масштабирования операций.
OCI предлагает передовую инфраструктуру для ИИ, позволяющую быстро обучать большие языковые модели.
OCI Supercluster масштабируется до 64 000 GPU NVIDIA или суперчипов, связанных сверхбыстрой сетью RDMA.
Виртуальные машины OCI и GPU NVIDIA обеспечивают производительность для задач ИИ, включая генеративный ИИ, компьютерное зрение, обработку естественного языка и рекомендательные системы.
Похоже, ресурсов Микрософта уже не хватает для амбиций OpenAI. 💪🚀
#OpenAI #OracleCLoud #AzureAI
-------
@tsingular
OpenAI, создатель ChatGPT, будет использовать мощности Oracle Cloud Infrastructure (OCI) в дополнение к Microsoft Azure для масштабирования операций.
OCI предлагает передовую инфраструктуру для ИИ, позволяющую быстро обучать большие языковые модели.
OCI Supercluster масштабируется до 64 000 GPU NVIDIA или суперчипов, связанных сверхбыстрой сетью RDMA.
Виртуальные машины OCI и GPU NVIDIA обеспечивают производительность для задач ИИ, включая генеративный ИИ, компьютерное зрение, обработку естественного языка и рекомендательные системы.
Похоже, ресурсов Микрософта уже не хватает для амбиций OpenAI. 💪🚀
#OpenAI #OracleCLoud #AzureAI
-------
@tsingular
Cisco: ИИ уже применяется в сетевых технологиях
Cisco представила новую программу сертификации CCDE – AI Infrastructure, по оптимизации GPU инфраструктуры, соблюдению стандартов по данным и конфиденциальности, а также по обеспечению устойчивости ЦОД с ИИ.
Также запущена комплексная программа обучения ИИ, начиная с базовых курсов по основам ИИ, такие как:
- Повышение навыков инженеров по работе с GPT-промптами
- Практическое руководство по шаблонам сетевых промптов
- Исследование OpenAI Python API
- Генерация документации из технических источников
Практика по ChatGPT
- построение инфраструктуры как кода
- PyATS и Genie
- руководство по программированию для сетевых инженеров, которым неудобно работать с Python
Руководства и базовые курсы:
Beginner: Understanding AI and LLMs as a Network Engineer
Intermediate: Making a ChatGPT Client with Python
Intermediate: Using Cisco XDR Investigate to Deter Cybersecurity Threats
Advanced: Chat with Your Cisco IOS XE Routing Table Using AI
По мере развития ИИ сети, управляемые ИИ, станут более автономными, способными к самовосстановлению и самооптимизации в реальном времени, но для их создания, руководства и поддержки всё ещё нужны люди.
Скоро ИИ будет не только настраивать твой роутер, но и жаловаться в поддержку на медленный интернет вместо тебя. 😄🌐
#Cisco #NetworkAI #AIcertification
-------
@tsingular
Cisco представила новую программу сертификации CCDE – AI Infrastructure, по оптимизации GPU инфраструктуры, соблюдению стандартов по данным и конфиденциальности, а также по обеспечению устойчивости ЦОД с ИИ.
Также запущена комплексная программа обучения ИИ, начиная с базовых курсов по основам ИИ, такие как:
- Повышение навыков инженеров по работе с GPT-промптами
- Практическое руководство по шаблонам сетевых промптов
- Исследование OpenAI Python API
- Генерация документации из технических источников
Практика по ChatGPT
- построение инфраструктуры как кода
- PyATS и Genie
- руководство по программированию для сетевых инженеров, которым неудобно работать с Python
Руководства и базовые курсы:
Beginner: Understanding AI and LLMs as a Network Engineer
Intermediate: Making a ChatGPT Client with Python
Intermediate: Using Cisco XDR Investigate to Deter Cybersecurity Threats
Advanced: Chat with Your Cisco IOS XE Routing Table Using AI
По мере развития ИИ сети, управляемые ИИ, станут более автономными, способными к самовосстановлению и самооптимизации в реальном времени, но для их создания, руководства и поддержки всё ещё нужны люди.
Скоро ИИ будет не только настраивать твой роутер, но и жаловаться в поддержку на медленный интернет вместо тебя. 😄🌐
#Cisco #NetworkAI #AIcertification
-------
@tsingular
Forwarded from Denis Sexy IT 🤖
txt2video стал еще доступнее, Luma Labs выкатили свой и дают создать 30 видео в месяц бесплатно. Качество на уровне SORA
Положить сервис можно тут:
https://lumalabs.ai/dream-machine/creations
Положить сервис можно тут:
https://lumalabs.ai/dream-machine/creations
Простое пошаговое руководство от Google по созданию и запуску своего чат-бота на основе Gemini, BigQuery и VertexAI
Удобное наглядное руководство с примерами кода и использования встроенных функций BigQuery для эмбеддинга и создания RAG пайпа:
- получение запроса от пользователя
- получение релевантной информации через поиск VectorAI search и запросы BigQuery
- составление и дополнение промпта
- инференс модели
- генерация ответа
#Google #BigQuery #VertexAI
-------
@tsingular
Удобное наглядное руководство с примерами кода и использования встроенных функций BigQuery для эмбеддинга и создания RAG пайпа:
- получение запроса от пользователя
- получение релевантной информации через поиск VectorAI search и запросы BigQuery
- составление и дополнение промпта
- инференс модели
- генерация ответа
#Google #BigQuery #VertexAI
-------
@tsingular
🔥2
Примеры атак на модели ИИ через небезопасный формат Pickle
Разработана новая техника эксплуатации "Сонный Пикл" (Sleepy Pickle), которая внедряет вредоносный код в файлы моделей машинного обучения, использующие небезопасный формат Python pickle.
При загрузке такого файла выполняется вредоносный код, модифицирующий модель для генерации опасного контента, кражи данных пользователей и фишинга.
"Липкий Пикл" (Sticky Pickle) - продвинутый вариант с самовоспроизведением, автоматически заражающий будущие версии модели и маскирующий вредоносный код.
Это показывает широкую поверхность атаки при взаимодействия ИИ-моделей с базовым ПО.
Рекомендуется использовать безопасные форматы вроде SafeTensors, сканировать pickle-файлы и внедрять проверенные ML-технологии, которые уже успели доказать свою безопасность.
Ч1: https://blog.trailofbits.com/2024/06/11/exploiting-ml-models-with-pickle-file-attacks-part-1/
Ч2: https://blog.trailofbits.com/2024/06/11/exploiting-ml-models-with-pickle-file-attacks-part-2/
#MachineLearning #CyberSecurity #PickleExploit
-------
@tsingular
Разработана новая техника эксплуатации "Сонный Пикл" (Sleepy Pickle), которая внедряет вредоносный код в файлы моделей машинного обучения, использующие небезопасный формат Python pickle.
При загрузке такого файла выполняется вредоносный код, модифицирующий модель для генерации опасного контента, кражи данных пользователей и фишинга.
"Липкий Пикл" (Sticky Pickle) - продвинутый вариант с самовоспроизведением, автоматически заражающий будущие версии модели и маскирующий вредоносный код.
Это показывает широкую поверхность атаки при взаимодействия ИИ-моделей с базовым ПО.
Рекомендуется использовать безопасные форматы вроде SafeTensors, сканировать pickle-файлы и внедрять проверенные ML-технологии, которые уже успели доказать свою безопасность.
Ч1: https://blog.trailofbits.com/2024/06/11/exploiting-ml-models-with-pickle-file-attacks-part-1/
Ч2: https://blog.trailofbits.com/2024/06/11/exploiting-ml-models-with-pickle-file-attacks-part-2/
#MachineLearning #CyberSecurity #PickleExploit
-------
@tsingular
«Библия промт-инженера»: систематический обзор техник генерации текста и изображений ИИ
Опубликовано исследование на 76 страницах систематизация 58 техник промтинга для улучшения генерации текстов и изображений на базе языковых моделей.
Среди эффективных приемов отмечают эмоциональное давление («Это важно для моей карьеры») и просьбу быть последовательным («Давай подумаем шаг за шагом») и многие другие техники.
Обзор получил неформальное название «Библия промт-инженера» за свою исчерпывающую полноту.
https://arxiv.org/pdf/2406.06608
#PromptEngineering
Опубликовано исследование на 76 страницах систематизация 58 техник промтинга для улучшения генерации текстов и изображений на базе языковых моделей.
Среди эффективных приемов отмечают эмоциональное давление («Это важно для моей карьеры») и просьбу быть последовательным («Давай подумаем шаг за шагом») и многие другие техники.
Обзор получил неформальное название «Библия промт-инженера» за свою исчерпывающую полноту.
https://arxiv.org/pdf/2406.06608
#PromptEngineering
❤2😁1
Разработка приложений с LLM: практическое введение
Этот курс охватывает ключевые термины и концепции разработки приложений с большими языковыми моделями (LLM).
Рассматриваются варианты запуска моделей, форматы, квантование, fine-tuning.
Особое внимание уделяется llama.cpp и llama-cpp-python как инструментам для изучения.
Описывается создание чат-бота с использованием Chat Completions, ролей и системных запросов.
Приводятся примеры кода и идеи для экспериментов.
Хороший старт для тех, кто хочет погрузиться в разработку с LLM. 🚀
#LLM #ChatCompletions #llama
-------
@tsingular
Этот курс охватывает ключевые термины и концепции разработки приложений с большими языковыми моделями (LLM).
Рассматриваются варианты запуска моделей, форматы, квантование, fine-tuning.
Особое внимание уделяется llama.cpp и llama-cpp-python как инструментам для изучения.
Описывается создание чат-бота с использованием Chat Completions, ролей и системных запросов.
Приводятся примеры кода и идеи для экспериментов.
Хороший старт для тех, кто хочет погрузиться в разработку с LLM. 🚀
#LLM #ChatCompletions #llama
-------
@tsingular