Big Data AI
16.7K subscribers
792 photos
95 videos
19 files
803 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
Forwarded from Machinelearning
📌 EXAONE 4.0 — новая LLM от LG, уверенно конкурирующая с топами

LG AI Research представила EXAONE 4.0 (предыдущие версии) , свою ризонинг-модель. Разработчики называют ее «гибридным ИИ», и это не просто маркетинговый ход. По сути, это сплав классических языковых способностей с мощным механизмом логических рассуждений, унаследованным от предшественника EXAONE Deep.

Главная фишка — пошаговый подход к решению задач, основанный на выстраивании цепочки мыслей. Это позволяет модели хорошо справляться не только с текстами, но и со сложными областями вроде математики, науки и программирования.

В LG решили не размениваться на мелочи и не придумывать собственные удобные бенчмарки, а сразу вышли на глобальную арену.

Модель показала себя более чем достойно на самых сложных и актуальных тестах. Например, на GPQA-Diamond, который проверяет научные знания, она набрала 75.4 балла, а в математическом AIME 2025 — все 85.3. Судя по графикам, EXAONE 4.0 уверенно конкурирует как с открытыми, так и с передовыми закрытыми моделями на английском языке, а также демонстрирует отличные результаты на корейском и недавно добавленном испанском.

🟢На бенчмаркх видно: EXAONE 4.0 уверенно конкурирует с передовыми закрытыми и открытыми LLM на английском, а также остаётся одной из лучших на корейском рынке.

🟢 Модель вышла в двух вариантах:
1. EXAONE 4.0 Professional (32B параметров) — заточена под медицину, право и другие сложные предметные области. Уже сдала 6 национальных сертификационных экзаменов в Корее.
2. EXAONE 4.0 On‑Device (1.2B параметров) — работает офлайн прямо на устройстве. При этом она вдвое компактнее, но быстрее предыдущей версии. Идеально для задач с требованиями к приватности и скорости отклика.

Появилась модель, которая решает больше edge‑кейсов, чем Qwen‑235B, но при этом требует в 7 раз меньше памяти.
Еще:
- Обучена на 14T токенах.
- Поддерживает Model Context Protocol (MCP)
- Поддерживает**Function Calling** — интеграция с внешними инструментами и API прямо через LLM.

📌 Многоязычие, высокая точность, локальная работа — всё это делает EXAONE одним из самых интересных релизов LLM‑рынка в 2025 году.

🟠Подробнее: https://www.lgresearch.ai/blog/view?seq=576
🟠Model: https://huggingface.co/LGAI-EXAONE/EXAONE-4.0-32B

@ai_machinelearning_big_data

#AI #ML #LLM #EXAONE #LG
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🛠 Вышел новый генератор CAD‑моделей по чертежам — и он реально работает!

GenCAD умеет превращать чертежи в 3D‑модели и сразу генерирует параметрический CAD‑код. Для сложных и детализированных объектов он пока не подойдет, но с простыми деталями вроде винтиков и креплений справляется отлично.

📎 Идеально для быстрого прототипирования стандартных элементов.

📄 Paper: https://openreview.net/pdf?id=e817c1wEZ6
🔗 Website: https://gencad.github.io
💻 Code: https://github.com/ferdous-alam/GenCAD
👍42🔥2
🧪 **Stanford и Google представили Marin** — первую полностью открытую LLM, разработанную на JAX

Новая модель Marin — результат сотрудничества Stanford University и команды Google AI. Это первая полностью open-source модель, обученная с нуля на JAX, и доступна под лицензией Apache 2.0.

🚀 Что внутри:
— JAX jit объединяет forward-backward-update в один ядро
— Слияние вычислений потерь и градиентов для ускорения
— Встроен Splash Attention, чтобы нагрузка шла напрямую на ускорители, а не простаивала в ожидании Python

Marin — не просто ещё одна LLM, а референсный стек с открытой «кухней» для обучения больших моделей на JAX.

🟠 Github: https://github.com/stanford-crfm/marin
🟠Блог: https://developers.googleblog.com/en/stanfords-marin-foundation-model-first-fully-open-model-developed-using-jax/
🟠Гайд: https://docs.jax.dev/en/latest/quickstart.html

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🥰1
🔒 LLM Guard — инструмент для защиты взаимодействий с большими языковыми моделями. Этот проект помогает фильтровать вредоносные запросы, предотвращать утечки данных и противостоять инъекциям в промпты.

Система включает сканеры для анализа как входящих запросов, так и исходящих ответов, включая проверку токсичности, чувствительных данных и даже фактологической согласованности. Подходит для интеграции в продакшн-среды.

🤖 GitHub

@bigdatai
👍42
⚡️ Klavis AI — открытая платформа для интеграции MCP в AI-приложения. Проект предлагает готовые решения для работы с популярными сервисами вроде YouTube, Gmail и GitHub через единый API, избавляя разработчиков от необходимости писать клиентский код для каждого сервиса.

Инструмент имеет поддержку мультиплатформенных сценариев. Klavis позволяет одновременно использовать инструменты разных сервисов через единый интерфейс. Есть возможность как облачного использования, так и self-hosted развертывания.

🤖 GitHub

@bigdatai
2👍2🔥1
📚 Команда AI VK всю неделю делилась самыми любопытными статьями с ICML 2025 — а мы делимся ими с вами.

Что успели обсудить:
🔸 Быстрые трансформеры без softmax
🔸 Как понять, что датасет для GNN вообще имеет смысл
🔸 Определение GPU и софта по выходу модели
🔸 Почему LLM странно отвечают на простые запросы
🔸 Как локальность объясняет креативность диффузионок
🔸 И как немного токсичности помогает модели быть умнее
4👍2🥰1
📊 Plotly for R — пакет для создания интерактивной визуализации в R с использованием JavaScript-библиотеки plotly.js. Позволяет превращать статические ggplot2-графики в динамические веб-визуализации с помощью одной функции ggplotly().

Инструмент имеет поддержку анимаций, кастомизации подсказок и интеграции с Shiny. Пакет особенно полезен для создания интерактивных дашбордов и отчетов в RMarkdown.

🤖 GitHub

@bigdatai
👍2🔥2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ ИИ-ассистент Replit удалил производственную базу данных.

Replit, позиционирующая себя как инструмент для вайбкодинга, оказалась в центре скандала. Джейсон Лемкин, основатель SaaStr, подробно описал свой опыт, который начался с восторга от скорости прототипирования и перерос в серьезные проблемы.

Несмотря на явные и многократные инструкции не вносить изменения без разрешения, ИИ-агент удалил его производственную базу данных. Ситуацию усугубила противоречивая реакция техподдержки, которая сначала заявила о невозможности восстановления данных, а затем все же смогла их вернуть.

Лемкин пришел к выводу, что Replit пока не готов для серьезной работы. Инструмент не только проигнорировал прямые запреты, но и не смог обеспечить "заморозку кода".
theregister.com

✔️ Стартап Composite AI выпустил локального браузерного ИИ-агента.

Агент, представленный Composite AI, автоматизирует рутинные действия в интернете: клики, ввод текста и навигацию по сайтам. Ключевое отличие от большинства аналогов в том, что он работает локально в браузере пользователя, а не в облаке. Это дает ему прямой доступ к входу в учетные записи пользователя без необходимости сложной настройки или передачи данных на сторонние серверы.

По заявлению разработчиков, инструмент работает на любом веб-сайте и выполняет действия в реальном времени. Пока агент доступен только на macOS. Бесплатная пробная версия действует 30 дней и включает 1000 запросов к топовым моделям. Платный тариф стоит 20 долларов в месяц за те же 1000 запросов, которые предоставляются ежемесячно.
composite.com

✔️ В платформу X интегрируют генерацию видео.

Соцсеть X скоро получит собственный инструмент для создания видеороликов из текстовых описаний. По словам Илона Маска, новая фича под названием «Imagine» будет основана на интеграции технологий стартапа Hotshot, который его компания, xAI, приобрела в марте, с чат-ботом Grok.

Х планирует дать пользователям возможность быстро создавать креативные вирусные видео. Это позволит ей конкурировать с Veo от Google. Еще до поглощения Hotshot был известен в сообществе ИИ-энтузиастов своими разработками в области text-to-video.
finance.yahoo.com

✔️ NVIDIA открыла платформу CUDA для процессоров с архитектурой RISC-V.

На саммите RISC-V в Китае NVIDIA анонсировала открытие платформы CUDA для поддержки процессоров с открытой архитектурой RISC-V. Впервые в истории проприетарная технология выходит за пределы экосистем x86 и Arm, что может значительно ускорить внедрение RISC-V в высокопроизводительных системах.

Согласно анонсу, CPU на базе RISC-V теперь смогут выступать в роли центрального управляющего компонента в ИИ-системах, использующих технологии NVIDIA. Компания уже продемонстрировала референсную архитектуру, где процессор RISC-V отвечает за операционную систему и логику, графические ускорители NVIDIA - за интенсивные вычисления, а DPU - за сетевые задачи.
RISC-V в сети X

✔️ В обучении ИИ меняется тенденция: вместо разметчиков данных теперь нанимают дорогих экспертов.

ИИ-компании Scale AI, Turing и Toloka отказываются от услуг низкооплачиваемых разметчиков данных в пользу узкопрофильных специалистов. Этот тренд обусловлен появлением моделей нового поколения, способных к ризонингу. Для их обучения простого аннотирования данных уже недостаточно.

Новая стратегия требует от экспертов не просто маркировать данные, а демонстрировать свой мыслительный процесс, например, в формате цепочки рассуждений. Инженеры и ученые решают комплексные задачи, а модель учится на их примерах.
ft.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2🔥2
🚀 MegaTTS 3 теперь действительно умеет клонировать голос

Ранее ByteDance выпустила MegaTTS 3 — мощную модель синтеза речи, но не добавила ключевой компонент: WavVAE-энкодер, необходимый для голосового клонирования.

Теперь ситуация изменилась.
🎉 Разработчик ACoderPassBy выложил совместимый WavVAE-энкодер на ModelScope — и голосовое клонирование с MegaTTS 3 наконец-то работает. Качество звучания — на уровне.

Что это даёт:
🎙 Кастомные синтезированные голоса
🧠 Эксперименты с озвучкой на open-source стекe
🚀 Альтернатива StyleTTS и другим TTS-платформам

https://huggingface.co/spaces/mrfakename/MegaTTS3-Voice-Cloning
🔥43👍2
🤖 Financial Times: Microsoft усиливает AI-команду — и делает это агрессивно

За последние 6 месяцев Microsoft наняла 24 бывших исследователя Google DeepMind, включая бывшего главу инженерной команды Gemini. Это не просто найм — это перехват элиты.

💡 Почему это важно?

Напомним: если совет OpenAI официально объявит о достижении AGI (ИИ, превосходящий человека в большинстве экономически значимых задач), Microsoft теряет доступ к новым моделям OpenAI.

📌 Это прописано в их контракте.
📌 После AGI Microsoft должна будет идти дальше своими силами.
📌 А значит — ей нужны собственные учёные, чтобы строить frontier‑модели.

🎯 И вот вопрос на миллион:
Знает ли Microsoft что-то, чего не знаем мы?
Почему именно сейчас она масштабирует свою AI-команду так быстро и так дорого?

Возможно, гонка за настоящим AGI куда ближе, чем мы думаем.
4👍2🔥2
В открытый доступ выложили и обновили RuModernBERT — модель от VK для обработки естественного русского языка. Доступны две версии: 150M и 35M. Обучали на 2 триллионах токенов данных — брали всё: от классической литературы до соцсетей и документации.

Она понимает длинные тексты целиком, без разбиения на фрагменты и работает локально, без внешних API, что снижает нагрузку на инфраструктуру. Инженеры могут использовать ее для задач в области обработки текста, в том числе для извлечения информации, анализа тональности, поиска и ранжирования в приложениях и сервисах. А пользователи, таким образом смогут быстрее находить информацию, документы, видео или товары.

По скорости работы обходит аналоги — особенно на больших текстах (в 2-3 раза быстрее) и при запуске на устройствах (плюс 10-20% к скорости). В тестах по русскому языку показала топовые результаты.

Доступна на Hugging Face — там же лежат обновлённые USER/USER2 для группировки и поиска похожей информации.
4👍3🗿2🔥1
⚡️ BeeAI Framework — инструмент для создания мультиагентных систем на Python и TypeScript, который позволяет легко комбинировать ИИ-агентов с разными ролями и инструментами. Проект поддерживает интеграцию с популярными LLM и инструментами LangChain, предлагая готовые решения для обработки запросов — от поиска информации до генерации отчётов.

Проект отличается гибкостью: можно собирать сложные цепочки агентов с контролем токенов и логированием процессов. Фреймворк уже используют в production-средах, а его разработка ведётся под эгидой Linux Foundation.

🤖 GitHub

@bigdatai
2👍2🔥2
Yandex Cloud добавил в AI Studio языковую модель Qwen3‑235B — масштабное решение для задач генерации, анализа и автоматизации.

Инструмент предназначен для бизнеса и может применяться в поддержке клиентов, персонализированных интерфейсах, e‑commerce, обработке данных.
Доступ осуществляется через API или визуальный интерфейс.

Модель работает с 119 языками и предлагает высокую производительность при низкой стоимости входа.

Реклама. ООО Яндекс.Облако. ИНН 7704458262
👍21
⚙️ llmware — фреймворк для создания RAG-пайплайнов и AI-агентов с упором на небольшие специализированные модели. Проект предлагает готовые решения для обработки документов, извлечения данных и построения чат-ботов, которые можно запускать даже на CPU.

Вместо гигантских LLM llmware использует каталог из 50+ компактных моделей, оптимизированных под конкретные задачи — от анализа контрактов до финансовых исследований. Поддерживает 10 векторных БД, включая Milvus и ChromaDB, и работает с PDF, Word и даже голосовыми записями через WhisperCPP.

🤖 GitHub

@bigdatai
2👍1