Технозаметки Малышева
8.76K subscribers
3.87K photos
1.45K videos
40 files
4.04K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Anthropic раскрывает системные промпты Claude

Anthropic, оказывается, опубликовала системные промпты для своего ИИ-ассистента Claude еще аж в июле.

И так же выложили гайды по промптингу на гитхаб в виде интерактивных курсов:
https://github.com/anthropics/courses/tree/master/prompt_engineering_interactive_tutorial

Теперь можно посмотреть, что под капотом у лучшей ИИ модели в мире! (по моему скромному мнению, само собой :) все эти тесты LLM - врут и предвзяты)

#Anthropic #Claude #SystemPrompts
-------
@tsingular
😐2
Cisco объявила о намерении купить Robust Intelligence

Robust Intelligence предлагает платформу защиты моделей ИИ на всех этапах разработки и эксплуатации.
Интеграция решений Robust Intelligence в Cisco Security Cloud позволит защитить ИИ-приложения и модели от таких угроз, как промпт-иньекции, отравление данных, взлом и провокация на генерацию моделями неразрешённых результатов.
С операционной точки зрения интеграция обеспечит упрощение конфигурации, прогнозирование атак, адаптивное применение политик и улучшит пользовательский опыт.
Все детекты и тесты соответствуют стандартам OWASP и MITRE ATLAS.

Делай добро и -бросай его в воду- продавай крупным вендорам.

#Cisco #RobustIntelligence #SecurityCloud
-------
@tsingular
👍2
Forwarded from GigaChat
Сбер открыл приём заявок на соревнование AI Journey Contest с призовым фондом 8,5 млн рублей 🤖

AI Journey Contest — это международное онлайн-соревнование, которое проводит Сбер при поддержке Института AIRI. Его участники предлагают собственные решения AI-задач — в этом году можно выбрать одну или несколько из четырёх:

⭕️ Emotional FusionBrain 4.0 — создание мультимодальной модели для работы с видео, аудио и текстом. В рамках дополнительной номинации к задаче лучшие решения должны не только ответить на вопросы по игре и определить роли её участников, но и выяснить, кто из них говорит неправду.

⭕️ Multiagent AI — построение мультиагентной RL-системы (reinforcement learning, обучение с подкреплением), агенты которой смогут решать задачи, объединяясь в различные схемы кооперации.

⭕️ Embodied AI — создание роботов для решения сложных задач, требующих взаимодействия с окружающей средой и пользователем, а также общения с людьми на естественном языке. Задачу подготовили совместно с Центром робототехники Сбера.

⭕️ E-com AI Assistant — разработка AI-ассистента на основе большой языковой модели GigaChat. Лучшие из предложенных методов могут лечь в основу развития рекомендательных сервисов и специализированных AI-агентов.

Принять участие в AIJ Contest 2024 могут участники старше 18 лет до 28 октября 2024 года. Церемония награждения пройдёт на международной конференции по искусственному интеллекту и машинному обучению Сбера «Путешествие в мир искусственного интеллекта» (AI Journey).

🖥 Решить задачи можно на платформе DS Works
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
Cost-of-a-Data-Breach-Report-2024.pdf
2.2 MB
📊 Новый отчет IBM о стоимости утечек данных 2024

Ключевые выводы об ИИ и автоматизации в кибербезопасности:

Использование ИИ и автоматизации выросло на 10% по сравнению с прошлым годом

Компании, активно применяющие ИИ, сэкономили в среднем $1.88 млн на утечках данных

ИИ помог сократить время обнаружения и сдерживания утечек на 100 дней

Наибольший эффект ИИ показал в предотвращении утечек, снизив затраты на $2.22 млн

ИИ становится ключевым инструментом в борьбе с киберугрозами, значительно снижая финансовые и временные потери при утечках данных.

#кибербезопасность #IBM #отчёт
———
@tsingular
🤔1🍾1
Forwarded from Data Secrets
⚡️ Зацените: за последние 18 месяцев стоимость за 2М токенов (input+output) упала в 240 раз! В начале 23 года она равнялась 180 долларам, а сейчас в среднем приближается к 75 центам.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Обнаружена самая большая коллекция RAG техник на GitHub

Репозиторий NirDiamant представляет мощнейшую коллекцию передовых техник RAG (Retrieval-Augmented Generation).

Охватывает множество сценариев: от базовых подходов до сложных многоуровневых систем.

Ключевые направления: оптимизация поиска, обработка контекста, адаптивное извлечение и интеграция различных типов данных.

Просто оглавление для понимания:
1. Simple RAG
2. Context Enrichment Techniques
3. Multi-faceted Filtering
4. Fusion Retrieval
5. Intelligent Reranking
6.Query Transformations
7. Hierarchical Indices
8. Hypothetical Questions (HyDE Approach)
9. Choose Chunk Size
10. Semantic Chunking
11. Contextual Compression
12. Explainable Retrieval
13. Retrieval with Feedback Loops
14. Adaptive Retrieval
15. Iterative Retrieval
16. Ensemble Retrieval
17. Knowledge Graph Integration (Graph RAG)
18. Multi-modal Retrieval
19. RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval
20. Self RAG
21. Corrective RAG
22. Document Augmentation through Question Generation for Enhanced Retrieval
23. Sophisticated Controllable Agent for Complex RAG Tasks

Коллекция продолжает пополняться.
Заносим в избранное.

#GitHub #RAG #NLP
———
@tsingular
2🔥1
DeNube: Революция в облачных GPU-вычислениях

Стартап DeNube запускает децентрализованную облачную GPU-сеть для AI-инфраструктуры нового поколения.
Платформа токенизирует простаивающие ресурсы дата-центров, делая их доступными для пользователей.
Ключевые преимущества: снижение затрат, масштабируемость и экологичность решения.
DeNube использует глобальную сеть независимых узлов для распределения вычислительной нагрузки.
Система обеспечивает доступ к GPU/CPU по требованию, без крупных предварительных инвестиций.

Похоже, майнеры нашли новое применение своим фермам. 🖥💨

#DeNube #decentralizedComputing #cloudGPU
-------
@tsingular
👍1
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
В последней версии Claude приложения появилась поддержка «артефактов» – мини приложений которые собираются на лету под ваши задачи

Нужно вам собрать какой-то калькулятор который разобьет чек между друзьями, или быстрый UX прототип, или игру как я заказал – просто пишете что хотите и оно собирает

Это пример того куда все идет – AI Software On Demand, думаю через пару лет будет такой же обычной вещью как все эти генераторы картинок

Скачать:
iOS 💻 Android
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Forwarded from эйай ньюз
Сверхзвуковые LLM

Llama 3 70B запустили на скорости в 450 токенов в секунду. А 8B - на бешенных 1800 токенов в секунду. Это всё без квантизации, да и цена не кусается - API стоит 10 центов за лям токенов для 8B и 60 для 70B. Предыдущий рекорд по скорости побили в более чем два раза для 8B. В будущем обещают добавить больше моделей, начиная с Llama 3.1 405B

Сделал это стартап Cerebras. Он производит железо для нейронок, известен самым большим чипом в мире (в 57 раз больше по размеру H100!). Предыдущий рекорд по скорости поставил тоже стартап со своим железом - Groq.

Хороший пример того что специализированные только под нейронки чипы вроде могут в разы превосходить видеокарты по скорости инференса, а ведь скоро ещё будут чипы которые заточены под конкретные модели, например Sohu. Кстати, давно хотел разобрать разные стартапы по производству железа и разницу их подходов. Интересно?

Попробовать можно тут.

@ai_newz
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
GameNGen: Нейросетевой движок генерирует DOOM в реальном времени

Исследователи создали GameNGen - первый игровой движок на нейронной модели.
Система интерактивно симулирует DOOM со скоростью 20+ кадров в секунду на одном TPU.
Качество генерации сопоставимо с JPEG-сжатием (PSNR 29.4).
Архитектура включает RL-агента для игрового процесса и диффузионную модель для генерации кадров.
Применены техники стабилизации для длительной авторегрессивной генерации.
Люди с трудом отличают реальную игру от симуляции на коротких отрезках.

Скоро нейросети будут генерировать игры быстрее, чем мы успеем в них играть! 🎮🤖

Когда мощность чуть подтянут - можно будет генерить миры неотличимые от реального в реальном времени.

Wake up Neo! Matrix has you.

#GameNGen #DOOM #neuralrendering
-------
@tsingular
👍27😐16🤔4🤯1
Утечки данных с LLM-сервисов

Исследование выявило сотни уязвимых серверов с LLM и векторными базами данных, раскрывающих конфиденциальную информацию в открытых сегментах интернета.

Компании, спеша внедрить ИИ, пренебрегают безопасностью.
В результате, например, обнаружены уязвимости в популярном инструменте Flowise (CVE-2024-31621) для создания LLM-приложений.

Выявлено 438 скомпрометированных сервера с доступом к токенам, ключам API и паролям.
Около 30 векторных баз оказались без аутентификации.

Утечки затрагивают личные, финансовые и медицинские данные.

В AI-first не забывайте по ИБ-first!
SDLC подход, ZeroTrust и вот это вот всё, чтобы не попасть в новости с тэгом #утечки

#LLM #Flowise #DataLeak
-------
@tsingular
1👍1
NVIDIA улучшает Multi-LoRA в RTX AI Toolkit

NVIDIA интегрировала Multi-LoRA в RTX AI Toolkit, что позволяет одновременно использовать несколько дообученных моделей с одной базовой.
Технология увеличивает производительность до 6 раз, снижая требования к памяти и пропускной способности GPU.
Multi-LoRA дает возможность параллельно обрабатывать запросы с разными адаптерами, что идеально для приложений с несколькими вариантами использования.
Пример: генерация диалогов, сюжетов и изображений для игр одной моделью с различными настройками.
Это позволит разработчикам эффективнее применять ИИ-модели в своих рабочих процессах.

Теперь одна нейронка может отвечать от лица разных предобученных датасетов меняя их "на лету".
Удобно же ж. 🎭🎨🎵

#NVIDIA #RTXAIToolkit #MultiLoRA
-------
@tsingular
👍3
Google Gemini: персональные эксперты и улучшенная генерация изображений

Google анонсировал масштабное обновление Gemini, включающее две ключевые функции:
Custom Gems - инструмент для создания персонализированных AI-экспертов по любой теме. Доступен пользователям Gemini Advanced, Business и Enterprise в 150+ странах.
Imagen 3 - усовершенствованная модель генерации изображений с улучшенным качеством и разнообразием стилей.
Новая версия Imagen включает встроенные средства защиты, соответствует принципам дизайна Google и использует SynthID для водяных знаков.
Пользователи смогут легко корректировать сгенерированные изображения и создавать изображения людей с ограничениями на фотореалистичность.
Внедрение функций будет постепенным, с планами расширения на большее количество пользователей и языков.

Говорят еще предвзятость рисовалки починили, но это не точно.

#Google #CustomGems #Imagen3
-------
@tsingular
👍1
Немного примеров работы Phi-3.5-vision-instruct: компактной мультимодальный модельки от Microsoft

Около месяца назад MS выпустили открытую малую мультимодальную модель обученную на синтетических данных и отфильтрованных веб-ресурсах, поддерживающую контекст до 128 тысяч токенов.

Так вот тут примеры подъехали с возможностями распознавания.

Модель прекрасно справляется и со сложным рукописным текстом и с таблицами.

Попробовать можно тут:
https://huggingface.co/spaces/MaziyarPanahi/Phi-3.5-Vision

#Microsoft #Phi35vision #multimodalAI
———
@tsingular
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Vidu Studio - Генератор видео из Китая

Платформа создаёт ролики на основе текстовых описаний, используя разные шаблоны и стили.

Ключевая фишка, - точное удержание образа ключевого персонажа в кадре.

Есть бесплатные кредиты.
Работает без VPN.

#Vidu #видео #Китай
———
@tsingular
👍4
!!! Qwen2-VL: обновление мультимодальных моделей

Alibaba представила Qwen2-VL - усовершенствованную версию мультимодальной модели, способную:

• Анализировать изображения разного разрешения и пропорций
• Понимать видео длительностью более 20 минут
• Управлять мобильными устройствами и роботами
• Работать с текстом на разных языках, включая рукописный

Доступны три версии модели : 72B, 7B и 2B (оптимизирована для мобильных).
Улучшены навыки распознавания объектов, математических вычислений и кодирования.
Модель демонстрирует потенциал визуального агента с расширенными возможностями анализа видеоконтента.

По описанию, - очень круто! Надо пробовать.

DEMO

HuggingFace


#Qwen2VL #ComputerVision #Multimodal #Китай
-------
@tsingular
🍾1
Magic: 100 миллионов токенов контекста!

Компания Magic представила LTM-модели с контекстным окном до 100 млн токенов.

LTM-2-mini - первая модель с таким огромным контекстным окном.
Разработан специальный метод оценки HashHop - цепочка хэшей - для проверка качества поиска иголки в стоге сена.
COMPLETION Hash 1 → Hash 2 | Hash 3 | Hash 4 | Hash 5 | Hash 6

Компания строит суперкомпьютеры на базе Google Cloud и GPU NVIDIA.
Сейчас в штате 23 человека и 8000 H100s (планируют миграцию на GB200) :) продолжают нанимать.
Привлекли инвестиций на $465млн в дополнение к предыдущим $320 млн.

Теперь ИИ сможет прочитать и понять целую библиотеку, прежде чем ответить на вопрос.

600 книг в одном запросе, получается.

Полная документация по строительству ракеты вместе с космодромом и прилегающей атомной станцией.

#Magic #LTM #ContextWindow
-------
@tsingular
🔥2
вот зачем на самом деле нужны ИИ ассистенты. :)

#humor
———
@tsingular