Вышла новая версия Code Llama
70 миллиардов параметров делают базовую модель одной из самых мощных.
Используется для синтеза и анализа кода на разных языках программирования.
Доступные версии модели: 7B, 13B, 34B и 70B параметров для 3х подтипов:
Code Llama базовая, Python и Instruct модели - всего 12 вариаций
Подготовлена и обучена в период с января 2023 по январь 2024.
Суммарно на обучение 12 вариантов ушло 1400тыс GPU часов на железе A100-80GB
Больше деталей по модели
#CodeLlama #HF #Meta
70 миллиардов параметров делают базовую модель одной из самых мощных.
Используется для синтеза и анализа кода на разных языках программирования.
Доступные версии модели: 7B, 13B, 34B и 70B параметров для 3х подтипов:
Code Llama базовая, Python и Instruct модели - всего 12 вариаций
Подготовлена и обучена в период с января 2023 по январь 2024.
Суммарно на обучение 12 вариантов ушло 1400тыс GPU часов на железе A100-80GB
Больше деталей по модели
#CodeLlama #HF #Meta
❤2⚡1
Meta* разрешила военное применение Llama моделей в США
Корпорация Meta* радикально изменила политику использования своих ИИ-моделей, открыв доступ оборонному сектору США.
К проекту присоединились AWS, Microsoft, IBM, Lockheed Martin, Oracle, Palantir и другие федеральные подрядчики.
Технологии планируется задействовать для диагностики военной техники, планирования операций, кибербезопасности и борьбы с терроризмом.
Стратегическая цель - укрепление технологического превосходства США в сфере ИИ-разработок.
Документация приводится к соответствию с реалиями. Вполне предсказуемо.
Meta* - запрещенная на территории Российской Федерации организация.
#Meta #Llama #Military
-------
@tsingular
Корпорация Meta* радикально изменила политику использования своих ИИ-моделей, открыв доступ оборонному сектору США.
К проекту присоединились AWS, Microsoft, IBM, Lockheed Martin, Oracle, Palantir и другие федеральные подрядчики.
Технологии планируется задействовать для диагностики военной техники, планирования операций, кибербезопасности и борьбы с терроризмом.
Стратегическая цель - укрепление технологического превосходства США в сфере ИИ-разработок.
Документация приводится к соответствию с реалиями. Вполне предсказуемо.
Meta* - запрещенная на территории Российской Федерации организация.
#Meta #Llama #Military
-------
@tsingular
🚀 Цукерберг идёт ва-банк: гигантский ИИ-центр и миллионы GPU
Марк Цукерберг выдал анонс про амбициозные планы на 2025 год.
Во-первых, масштаб: дата-центр размером с половину Манхэттена (!) мощностью 2+ ГВт.
- 1.3 миллиона GPU к концу года
- $60-65 млрд инвестиций
- 1 миллиард пользователей их ИИ-ассистента
Особенно интригует заявление про ИИ-инженера, который будет сам писать код для их R&D.
Похоже, Марк решил не просто догнать OpenAI и Anthropic, а перепрыгнуть их одним махом.
Забавно, что ещё год назад все говорили про "метавселенную" (не прокатило, не взлетело :) ), а теперь Цукерберг полностью переключился на ИИ.
Ну и про Llama 4 заявление смелое - назвать её заранее "ведущей" моделью года...
Хотя, с такими инвестициями, может, и правда что-то революционное готовят?
Но ведь для этого им придётся перегнать уже открытую DeepSeekR1, которая уже в открытом доступе... 🤔
В общем будет весело.🍿
#Zuckerberg #Meta - запрещённая в РФ организация.
———
@tsingular
Марк Цукерберг выдал анонс про амбициозные планы на 2025 год.
Во-первых, масштаб: дата-центр размером с половину Манхэттена (!) мощностью 2+ ГВт.
- 1.3 миллиона GPU к концу года
- $60-65 млрд инвестиций
- 1 миллиард пользователей их ИИ-ассистента
Особенно интригует заявление про ИИ-инженера, который будет сам писать код для их R&D.
Похоже, Марк решил не просто догнать OpenAI и Anthropic, а перепрыгнуть их одним махом.
Забавно, что ещё год назад все говорили про "метавселенную" (не прокатило, не взлетело :) ), а теперь Цукерберг полностью переключился на ИИ.
Ну и про Llama 4 заявление смелое - назвать её заранее "ведущей" моделью года...
Хотя, с такими инвестициями, может, и правда что-то революционное готовят?
Но ведь для этого им придётся перегнать уже открытую DeepSeekR1, которая уже в открытом доступе... 🤔
В общем будет весело.🍿
#Zuckerberg #Meta - запрещённая в РФ организация.
———
@tsingular
👍12
🔥 Llama 4: Meta* выпускает новое поколение ИИ и готовит двухтриллионного монстра
Пока вышли две первые модели нового поколения — Scout и Maverick.
Обе используют архитектуру (MoE)
Llama 4 Scout:
- 17 млрд активных параметров (109 млрд всего)
- 16 экспертов
- Контекстное окно в 10 миллионов токенов (!)
- Работает даже на одном GPU H100
"Scout — наша самая эффективная модель в своем классе. Она превосходит Llama 3, оставаясь более масштабируемой"
Llama 4 Maverick:
- Те же 17 млрд активных параметров, но уже с 128 "экспертами"
- 400 млрд параметров всего
- Эффективно работает с мультимодальными задачами
Бенчмарки на платформе LMArena зафиксировали рейтинг Elo 1417 для чат версии Maverick
Получается открытая модель на 2м месте в мире.
Самое интересное — третья модель семейства, условно названная "Behemoth" (Бегемот), всё ещё находится в разработке, и именно она должна стать настоящим прорывом
- 288 млрд активных параметров,
- 16 экспертов
- 2T параметров!!!
По внутренним тестам Behemoth уже превосходит GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro (хотя пока и уступает Gemini 2.5 Pro) в задачах, связанных с математикой и научными дисциплинами
Новые модели уже доступны через:
Официальный сайт Llama.com
Платформу Hugging Face
В качестве ассистента Meta AI в WhatsApp, Messenger, Instagram в 40 странах.
29 апреля Meta проведёт свою первую конференцию LlamaCon по искусственному интеллекту, - может будет больше новостей про Бегемота.
(*Meta - запрещённая в РФ организация)
#Meta #Llama
———
@tsingular
Пока вышли две первые модели нового поколения — Scout и Maverick.
Обе используют архитектуру (MoE)
Llama 4 Scout:
- 17 млрд активных параметров (109 млрд всего)
- 16 экспертов
- Контекстное окно в 10 миллионов токенов (!)
- Работает даже на одном GPU H100
"Scout — наша самая эффективная модель в своем классе. Она превосходит Llama 3, оставаясь более масштабируемой"
Llama 4 Maverick:
- Те же 17 млрд активных параметров, но уже с 128 "экспертами"
- 400 млрд параметров всего
- Эффективно работает с мультимодальными задачами
Бенчмарки на платформе LMArena зафиксировали рейтинг Elo 1417 для чат версии Maverick
Получается открытая модель на 2м месте в мире.
Самое интересное — третья модель семейства, условно названная "Behemoth" (Бегемот), всё ещё находится в разработке, и именно она должна стать настоящим прорывом
- 288 млрд активных параметров,
- 16 экспертов
- 2T параметров!!!
По внутренним тестам Behemoth уже превосходит GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro (хотя пока и уступает Gemini 2.5 Pro) в задачах, связанных с математикой и научными дисциплинами
Новые модели уже доступны через:
Официальный сайт Llama.com
Платформу Hugging Face
В качестве ассистента Meta AI в WhatsApp, Messenger, Instagram в 40 странах.
29 апреля Meta проведёт свою первую конференцию LlamaCon по искусственному интеллекту, - может будет больше новостей про Бегемота.
(*Meta - запрещённая в РФ организация)
#Meta #Llama
———
@tsingular
🔥6⚡2🤩2❤1👍1
🛡 Meta представила новые инструменты для безопасности ИИ: LlamaFirewall и другие защитные решения
Meta* выпустила целый арсенал открытых инструментов для защиты ИИ-систем от различных типов атак.
Самое ценное тут — системный подход к безопасности агентов ИИ и открытость технологий для разработчиков.
LlamaFirewall: новая система защиты для ИИ-агентов
Система спроектирована как многоуровневая защита для предотвращения:
• Прямых атак на промпты (prompt injection)
• Непрямых манипуляций с целями агентов (goal hijacking)
• Рисков небезопасного кода
• Злонамеренного кода через инъекции промптов
Llama Guard 4: мультимодальная защита:
Мультимодальный классификатор с 12 млрд параметров — защищает как текст, так и изображения
Поддерживает классификацию при работе с несколькими изображениями
Создан на базе Llama 4 Scout и стандартизированной таксономии рисков MLCommons
PromptGuard 2
• Легковесные классификаторы (86M и 22M параметров) для определения прямых атак на промпты
• Работает в реальном времени благодаря BERT-архитектуре
• Обнаруживает до 97.5% атак при всего 1% ложных срабатываний
• 22M версия работает в 5 раз быстрее с минимальной потерей эффективности
• Показывает результаты более качественные, чем существующие открытые аналоги
AlignmentCheck
• Экспериментальный аудитор рассуждений, который инспектирует chain-of-thought агентов
• Обнаруживает отклонения от изначальной цели пользователя
• Перехватывает скрытые манипуляции, которые не улавливаются статическими фильтрами
• Показывает 80%+ точность обнаружения скомпрометированных целей
CodeShield
• Статический анализатор кода, генерируемого ИИ
• Поддерживает 8 языков программирования
• Покрывает более 50 типов уязвимостей (CWE)
• Архитектура с двумя уровнями проверки
CyberSec Eval 4: комплексный набор бенчмарков для оценки безопасности ЛЛМ:
AutoPatchBench — для оценки способности ИИ автоматически исправлять уязвимости в нативном коде до их эксплуатации
CyberSOCEval — разработан совместно с CrowdStrike для измерения эффективности ИИ в центрах управления безопасностью (SOC)
Оценивает не только риски, но и защитные возможности ИИ в реальных сценариях:
• Распознавание сложной вредоносной активности в системных логах
• Анализ инцидентов безопасности
• Обработка данных из отчетов разведки угроз
Другие важные компоненты:
Automated Sensitive Doc Classification Tool — автоматически применяет метки безопасности к внутренним документам организации
Llama Generated Audio Detector & Watermark Detector — выявляет ИИ-генерированный контент для предотвращения мошенничества
Партнерская программа Llama Defenders — объединяет партнеров (ZenDesk, Bell Canada, AT&T и др.) для интеграции защитных механизмов в их системы
Практическое применение:
• Для стартапов: защита автономных агентов без необходимости создавать собственные механизмы безопасности
• Для предприятий: снижение рисков при развертывании ИИ-инструментов в критичных средах
• Для разработчиков: создание более безопасных приложений с ИИ за счет интеграции готовых компонентов
Одно из главных преимуществ — система полностью открыта и доступна на GitHub.
Система уже используется в производственной среде Meta и помогает защитить их собственные ИИ-приложения.
(*Meta - запрещённая в РФ террористическая организация)
#Meta #LlamaFirewall #безопасность #PromptGuard #CodeShield #CybersecEval
———
@tsingular
Meta* выпустила целый арсенал открытых инструментов для защиты ИИ-систем от различных типов атак.
Самое ценное тут — системный подход к безопасности агентов ИИ и открытость технологий для разработчиков.
LlamaFirewall: новая система защиты для ИИ-агентов
Система спроектирована как многоуровневая защита для предотвращения:
• Прямых атак на промпты (prompt injection)
• Непрямых манипуляций с целями агентов (goal hijacking)
• Рисков небезопасного кода
• Злонамеренного кода через инъекции промптов
Llama Guard 4: мультимодальная защита:
Мультимодальный классификатор с 12 млрд параметров — защищает как текст, так и изображения
Поддерживает классификацию при работе с несколькими изображениями
Создан на базе Llama 4 Scout и стандартизированной таксономии рисков MLCommons
PromptGuard 2
• Легковесные классификаторы (86M и 22M параметров) для определения прямых атак на промпты
• Работает в реальном времени благодаря BERT-архитектуре
• Обнаруживает до 97.5% атак при всего 1% ложных срабатываний
• 22M версия работает в 5 раз быстрее с минимальной потерей эффективности
• Показывает результаты более качественные, чем существующие открытые аналоги
AlignmentCheck
• Экспериментальный аудитор рассуждений, который инспектирует chain-of-thought агентов
• Обнаруживает отклонения от изначальной цели пользователя
• Перехватывает скрытые манипуляции, которые не улавливаются статическими фильтрами
• Показывает 80%+ точность обнаружения скомпрометированных целей
CodeShield
• Статический анализатор кода, генерируемого ИИ
• Поддерживает 8 языков программирования
• Покрывает более 50 типов уязвимостей (CWE)
• Архитектура с двумя уровнями проверки
CyberSec Eval 4: комплексный набор бенчмарков для оценки безопасности ЛЛМ:
AutoPatchBench — для оценки способности ИИ автоматически исправлять уязвимости в нативном коде до их эксплуатации
CyberSOCEval — разработан совместно с CrowdStrike для измерения эффективности ИИ в центрах управления безопасностью (SOC)
Оценивает не только риски, но и защитные возможности ИИ в реальных сценариях:
• Распознавание сложной вредоносной активности в системных логах
• Анализ инцидентов безопасности
• Обработка данных из отчетов разведки угроз
Другие важные компоненты:
Automated Sensitive Doc Classification Tool — автоматически применяет метки безопасности к внутренним документам организации
Llama Generated Audio Detector & Watermark Detector — выявляет ИИ-генерированный контент для предотвращения мошенничества
Партнерская программа Llama Defenders — объединяет партнеров (ZenDesk, Bell Canada, AT&T и др.) для интеграции защитных механизмов в их системы
Практическое применение:
• Для стартапов: защита автономных агентов без необходимости создавать собственные механизмы безопасности
• Для предприятий: снижение рисков при развертывании ИИ-инструментов в критичных средах
• Для разработчиков: создание более безопасных приложений с ИИ за счет интеграции готовых компонентов
Одно из главных преимуществ — система полностью открыта и доступна на GitHub.
Система уже используется в производственной среде Meta и помогает защитить их собственные ИИ-приложения.
(*Meta - запрещённая в РФ террористическая организация)
#Meta #LlamaFirewall #безопасность #PromptGuard #CodeShield #CybersecEval
———
@tsingular
👍5⚡1✍1
Media is too big
VIEW IN TELEGRAM
Meta* представила V-JEPA-v2: продвинутую ИИ-модель для понимания роботами окружающего пространства
Ян ЛеКун представил V-JEPA-v2 — новую версию самообучающейся модели компьютерного зрения, которая работает без размеченных данных.
Модель использует архитектуру joint embedding predictive, что обеспечивает более эффективное обучение и лучшую адаптацию к различным визуальным задачам.
Прорыв откроет возможности в автономных авто, ритейл-аналитике и медицинской визуализации, снизив затраты на разметку данных и ускорив внедрение ИИ-систем зрения.
Всего с 1.2 млрд параметров роботы смогут понимать окружающий мир без сложных размышлений, обучаясь непосредственно во время работы.
GitHub
HuggingFace
Сайт проекта
Paper
*Meta - запрещённая в РФ организация
#VJEPA #ComputerVision #Meta
———
@tsingular
Ян ЛеКун представил V-JEPA-v2 — новую версию самообучающейся модели компьютерного зрения, которая работает без размеченных данных.
Модель использует архитектуру joint embedding predictive, что обеспечивает более эффективное обучение и лучшую адаптацию к различным визуальным задачам.
Прорыв откроет возможности в автономных авто, ритейл-аналитике и медицинской визуализации, снизив затраты на разметку данных и ускорив внедрение ИИ-систем зрения.
Всего с 1.2 млрд параметров роботы смогут понимать окружающий мир без сложных размышлений, обучаясь непосредственно во время работы.
GitHub
HuggingFace
Сайт проекта
Paper
*Meta - запрещённая в РФ организация
#VJEPA #ComputerVision #Meta
———
@tsingular
✍5⚡5👍3❤2🍓1
Meta* переманивает еще троих исследователей из Google DeepMind
Meta продолжает охоту за талантами для команды суперинтеллекта.
На этот раз перешли три специалиста, работавших над версией Gemini, которая взяла золото на математической олимпиаде IMO 2025. Система решила 5 из 6 задач, набрав 35 из 42 баллов.
Цукерберг строит лабораторию суперинтеллекта отдельно от FAIR, предлагая девятизначные зарплаты. Цель — создать ИИ, превосходящий человека во всех интеллектуальных задачах.
По слухам, Meta может отказаться от открытого кода в пользу закрытых моделей.
Вот DeepMind особенно жалко, если попилят, - очень эффективная команда.
*Мета - запрещенная в России организация.
#Meta #DeepMind #Gemini
———
@tsingular
Meta продолжает охоту за талантами для команды суперинтеллекта.
На этот раз перешли три специалиста, работавших над версией Gemini, которая взяла золото на математической олимпиаде IMO 2025. Система решила 5 из 6 задач, набрав 35 из 42 баллов.
Цукерберг строит лабораторию суперинтеллекта отдельно от FAIR, предлагая девятизначные зарплаты. Цель — создать ИИ, превосходящий человека во всех интеллектуальных задачах.
По слухам, Meta может отказаться от открытого кода в пользу закрытых моделей.
Вот DeepMind особенно жалко, если попилят, - очень эффективная команда.
*Мета - запрещенная в России организация.
#Meta #DeepMind #Gemini
———
@tsingular
🤔7⚡4❤2👍1👀1