Big Data AI
16.8K subscribers
836 photos
98 videos
19 files
837 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🔥 OuteTTS-0.2-500M — модель, которая предназначена для задач синтеза речи (Text-to-Speech)!

🌟 Она имеет 500 миллионов параметров и обучена для создания естественного звучания голоса, поддерживая высокое качество аудиовыхода. Основное применение — преобразование текстового ввода в реалистичную речь, что может быть полезно для создания виртуальных ассистентов, озвучивания текста и других сценариев, связанных с генерацией речи.

🔗 Ссылка: *клик*

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
Media is too big
VIEW IN TELEGRAM
📹 OpenAI представила Sora: новую модель для создания видеороликов по текстовому описанию.

Компания OpenAI на онлайн-стриме анонсировала запуск Sora – инструмента для создания видео по текстовому запросу. Sora доступна подписчикам ChatGPT Plus и Pro, с ограничениями по региону (недоступна на территории ЕС и Великобритании), количеству генераций и качеству видео. Plus-пользователи смогут создавать до 5 видео в месяц длиной до 5 секунд в разрешении до 720p.

Pro-подписка позволяет сгенерировать до 500 коротких видео длиной до 20 секунд в разрешении до 1080p. Sora предлагает различные инструменты для редактирования и управления процессом создания видео: Storyboard для покадровой режиссуры и функции для добавления начала, концовки и объединения нескольких видео.
openai.com
👍43💩2🔥1🤡1🙉1
Forwarded from Machinelearning
📌 Пятидневный интенсивный курс по GenAI от Google и Kaggle.

Google совместно с Kaggle представили пятидневный интенсивный курс по генеративному искусственному интеллекту, который доступен в формате самостоятельного обучения.

Курс, который проходил в прямом эфире с 11 по 15 ноября 2024 года, охватывает базовые технологии и методы генеративного ИИ. Программа включает изучение базовых моделей, инженерии промптов, векторных баз данных и эмбедингов, ИИ-агентов, специализированных моделей для конкретных областей и MLOps для GenAi.

Каждый день курса посвящен определенной теме и включает теоретические материалы, практические задания и возможность взаимодействия с экспертами Google.

Участники изучат развитие LLM, начиная с трансформеров и заканчивая техниками тонкой настройки и ускорения инференса. Познакомятся с методами инженерии промптов для оптимизации взаимодействия с LLM.

В рамках курса будут рассмотрены концепции эмбедингов и векторных баз данных, алгоритмы векторного поиска и научатся создавать ИИ-агентов, понимая их основные компоненты и итеративный процесс разработки.

Курс включает создание и применение специализированных LLM: SecLM и Med-PaLM, с комментариями разработчиков. Участники узнают, как адаптировать практики MLOps для генеративного ИИ и использовать инструменты Vertex AI для базовых моделей и приложений генеративного ИИ.

В рамках практических занятий на платформе Kaggle участники смогут применить полученные знания, создавая системы вопросов и ответов на основе извлечения информации, нейронные сети классификации и агентные системы заказа.

Курс разработан экспертами Google: Анантой Навалгарией, Марком Макдональдом, Пейдж Бейли и другими.

⚠️ Для доступа к коду курса необходимы аккаунты на Kaggle (c верификацией номера телефона), Google Ai Studio (для создания API KEY).


🟡Страница курса
🟡Сообщество в Discord


@ai_machinelearning_big_data

#AI #ML #LLM #GenAI #Course
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥2
🔥 LaVague — это фреймворк для разработки AI-агентов, способных автоматизировать веб-процессы!

🌟 Агенты анализируют данную веб-страницу, определяют шаги для выполнения задач и реализуют их с помощью встроенных инструментов, таких как Selenium или Playwright. Подходит для разных задач автоматизации, от навигации по сайтам до тестирования!

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥2
🔍 RAGLite — это инструмент для работы с Retrieval-Augmented Generation (RAG), подходом, который улучшает качество генерации текстов с помощью поиска релевантной информации!

🌟 RAGLite упрощает интеграцию поиска и генерации, предоставляя средства для работы с векторным поиском, поиском по ключевым словам и гибридными методами. Его функционал включает внедрение документов, извлечение фрагментов, ранжирование и создание ответов на основе найденных данных.

🌟 Инструмент поддерживает использование различных моделей машинного обучения для поиска и генерации, интеграцию с базами данных и настройку пользовательского интерфейса в стиле ChatGPT. RAGLite может быть развернут локально или на платформах, таких как Slack или Microsoft Teams, что делает его полезным для приложений, требующих адаптивной генерации текста, как, например, интеллектуальные чат-боты или системы поиска знаний.

🔐 Лицензия: MPL-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3🔥3
🔥 Курс по Ollama — создавайте ИИ-приложения локально!

🌟 C такими инструментами, как Ollama, вы можете привнести передовые возможности ИИ прямо в свою локальную среду. Изучение того, как использовать локальные большие языковые модели (LLM), может открыть целый мир возможностей. Локальные LLM обеспечивают больший контроль, настройку и конфиденциальность данных по сравнению с облачными системами ИИ.

🕞 Продолжительность: 2:57:23

🔗 Ссылка: *клик*

#курс #ollama #machinelearning


@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21👎1
Forwarded from Machinelearning
✔️ OpenAI представила функцию «Проекты» для ChatGPT.

OpenAI анонсировала новую функцию «Проекты» для своего чат-бота ChatGPT. Эта функция позволит пользователям группировать чаты и данные, упрощая использование ChatGPT для конкретных задач.

Пользователи смогут объединять в проекты пользовательские данные, разговоры, GPT и простые чаты. Каждый чат в проекте будет иметь доступ ко всей информации внутри него. OpenAI продемонстрировала "Проекты" на седьмом по счету стриме цикла анонсов "12 Days of OpenAI"
openai.com

✔️ Anthropic разработала платформу для анализа использования больших языковых моделей.

Anthropic создала платформу Clio для изучения особенностей применения больших языковых моделей в реальных условиях. Clio использует LLM для анализа миллионов диалогов, выявляя общие закономерности использования без нарушения конфиденциальности пользователей. Платформа группирует диалоги по схожести, создаёт обобщённые описания тем и определяет возможные нарушения правил использования. В отличие от традиционных методов, Clio не предполагает просмотра диалогов людьми.

Anthropic применяет Clio для повышения безопасности Claude. Clio помогает выявлять скоординированные злоупотребления и отслеживать неизвестные угрозы, особенно в важные периоды запуска новых функций. Компания планирует сделать Clio доступной для общественности с целью формирования культуры прозрачности в сфере ИИ.
anthropic.com

✔️ NVIDIA QUEEN: алгоритм потоковой передачи видео с произвольной точкой обзора.

QUEEN (QUantized Efficient ENcoding) - это новый алгоритм, разработанный NVIDIA для эффективного кодирования и потоковой передачи видео с произвольной точкой обзора. QUEEN использует динамические гауссианы для представления сцены, что позволяет достичь высокого качества изображения при минимальном размере модели.

Алгоритм способен сократить размер модели до 0,7 МБ на кадр, обеспечивая при этом быстрое обучение (менее 5 секунд) и высокую скорость рендеринга (около 350 кадров в секунду). QUEEN основан на квантовании и разрежении атрибутов гауссиан и использует адаптивную маскирующую технику для разделения статического и динамического контента.
research.nvidia.com

✔️ Microsoft представила новую модель Phi-4.

Новая языковая модель Phi-4 от Microsoft Research демонстрирует производительность, сравнимую с гораздо более крупными моделями, используя всего 14 миллиардов параметров. Phi-4 превосходит свою обучающую модель, GPT-4, в ответах на вопросы по науке и технике и демонстрирует особую эффективность в математике: 56,1% правильных ответов на вопросы университетского уровня и 80,4% на задачи из математических олимпиад.

Phi-4 уже доступна в рамках ограниченного превью на платформе Azure AI Foundry для исследовательских целей. В открытый доступ Phi-4 будет опубликована на следующей неделе.
techcommunity.microsoft.com

✔️ Cadbury борется с искусственным интеллектом, засоряя обучающие данные бессмыслицей.

Индийский филиал кондитерской компании Cadbury начал рекламную кампанию под названием «Сделаем ИИ посредственным снова», целью которой является замедлить развитие искусственного интеллекта путем внесения искажений в обучающие данные.

Компания создала «первую в мире серверную ферму», генерирующую тысячи синтетических веб-сайтов, заполненных бессмысленным текстом. Цель состоит в том, чтобы «загрязнить» данные, которые модели искусственного интеллекта собирают из Интернета, вызывая ошибки, требующие постоянного вмешательства человека.
techspot.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3🔥2👎1
Media is too big
VIEW IN TELEGRAM
🔥 Курс Математика Машинного обучения: Что такое тензоры.

📌 Видео
📌Colab с кодом

@data_math
Please open Telegram to view this post
VIEW IN TELEGRAM
3👎1👌1
🔥 Bolt.diy — это проект с открытым исходным кодом, позволяющий разрабатывать полнофункциональные веб-приложения с использованием генеративных AI-моделей!

🌟 Инструмент поддерживает интеграцию с такими моделями, как OpenAI, Anthropic, HuggingFace и другими, через единый API.

🔐 Лицензия: MIT

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1👌1
🔥 Gemini Cookbook от Google — руководство для работы с API Gemini!

🌟 В нем собраны быстрые стартовые инструкции, учебные примеры и руководство по использованию различных функций API, таких как обработка текста, изображений, аудио и видео, а также интеграция с кодом.

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Steel Browser — инструмент для автоматизации браузера с поддержкой API, который работает в облаке!

🌟 Он позволяет запускать сессии Puppeteer, Playwright, и Selenium, обеспечивая низкое время запуска (менее секунды при нахождении клиента в том же регионе) и продолжительные сессии до 24 часов. Steel предлагает возможности управления сессиями, включая сохранение и повторное использование cookies и локального хранилища, а также встроенные механизмы для обхода CAPTCHA и маскировки подлинности браузера.

🌟 Проект направлен на упрощение автоматизации браузеров, предоставляя интеграцию с популярными инструментами и обеспечивая высокую производительность. Steel предназначен для разработчиков, работающих с браузерной автоматизацией, и предоставляет функции мониторинга и отладки через встроенный Session Viewer.

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥1
🔥 gitdigest — это инструмент для анализа истории репозиториев Git и создания сводной статистики по изменениям в коде!

💡 Он собирает данные о коммитах, авторах, частоте изменений, а также об общем объеме внесенных правок, предоставляя метрики для анализа активности разработчиков и структуры проекта.

🔍 Основные возможности:

🌟 Анализ истории коммитов: Сбор данных о количестве коммитов, их авторах и временных интервалах.

🌟 Извлечение информации о типах изменений: добавления, удаления строк и файлов.

🌟 Визуализация статистики: Генерация отчетов о вкладе разработчиков.

🌟 Возможность анализа продуктивности и выявления "узких мест" в разработке.

🌟 Интеграция с CI/CD: Подходит для автоматического анализа репозитория в процессе разработки.

🔐 Лицензия: MIT

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2
⚡️Announcing Groq Summary!

Расширение с открытым исходным кодом для использования Groq в браузере.

📌 Github: https://github.com/jose-mdz/groq-chrome-ext

📌 Расширение: summary/lfehmciachpbanabhdgccidilnnkffjn

@bigdatai
2👍2🔥2🤡2
Forwarded from Machinelearning
⚡️ Релиз IBM Granite 3.1.

IBM представила Granite 3.1, обновление семейства открытых и высокопроизводительных LLM, оптимизированных для корпоративного использования. Обновление принесло семейству повышение производительности, точности в критически важных корпоративных сценариях: использование инструментов, RAG и рабочие процессы на основе AI агентов.

В этом релизе особое внимание уделялось улучшению обработки длинных текстов благодаря расширенному контекстному окну и детекту галлюцинаций. Все модели семейства Granite 3 получили длину контекстного окна в 128 тысяч токенов. Для сравнения, это примерно 300-страничная книга.

Набор LLM Granite 3.1 8B и 2B, базовые и инструктивные версии. Флагманская Granite 3.1 8B достигает одних из самых высоких средних баллов среди открытых моделей своего класса на Hugging Face OpenLLM Leaderboard.

MoE-модели Granite 3.1 3B и 1B c 800M и 400M активных параметров соответственно и их инструктивные версии.

Granite Embedding в 4 размерах (125M и 30M для английского языка и 278M и 107М - мультиязычные), которые поддерживают 12 языков: английский, немецкий, испанский, французский, японский, португальский, арабский, чешский, итальянский, корейский, голландский и китайский.

Granite Guardian 3.1 8B и 2B - специализированные модели обнаружения галлюцинаций при вызовах функций. Они отслеживают каждый вызов функции на предмет синтаксических и семантических отклонений, повышая достоверность и управляемость в рабочих процессах.

▶️Вместе с моделями, IBM представила инструменты и фреймворки с открытым исходным кодом:

🟠Docling - инструмент для подготовки документов к RAG, предобучению и тонкой настройке ( извлечение информации из форматов PDF, DOCX, изображения, PPTX, XLSX, HTML и AsciiDoc).

🟠Bee - фреймфорк создания масштабируемых приложений на основе AI агентов.

⚠️ Все модели Granite 3.1, Granite Guardian 3.1 и Granite Embedding доступны в средах: IBM watsonx.ai, Hugging Face, LM Studio, Ollama и Replicate.


📌Лицензирование: Apache 2.0 license.


🟡Статья
🟡Набор моделей
🟡Документация


@ai_machinelearning_big_data

#AI #ML #LLM #Embeddings #IBM #Granite
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1🤮1
🔥 PSHuman — новый инструмент для генерации 3D-модели человека из одного изображения!

🌟 Он создает подробную геометрию и реалистичный трехмерный облик человека в различных позах в течение всего одной минуты!

🔐 Лицензия: MIT

🔗 Страница проекта: *клик*
📖 Arxiv
🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍1