Big Data AI
16.8K subscribers
840 photos
99 videos
19 files
838 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🔥 LaVague — это фреймворк для разработки AI-агентов, способных автоматизировать веб-процессы!

🌟 Агенты анализируют данную веб-страницу, определяют шаги для выполнения задач и реализуют их с помощью встроенных инструментов, таких как Selenium или Playwright. Подходит для разных задач автоматизации, от навигации по сайтам до тестирования!

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥2
🔍 RAGLite — это инструмент для работы с Retrieval-Augmented Generation (RAG), подходом, который улучшает качество генерации текстов с помощью поиска релевантной информации!

🌟 RAGLite упрощает интеграцию поиска и генерации, предоставляя средства для работы с векторным поиском, поиском по ключевым словам и гибридными методами. Его функционал включает внедрение документов, извлечение фрагментов, ранжирование и создание ответов на основе найденных данных.

🌟 Инструмент поддерживает использование различных моделей машинного обучения для поиска и генерации, интеграцию с базами данных и настройку пользовательского интерфейса в стиле ChatGPT. RAGLite может быть развернут локально или на платформах, таких как Slack или Microsoft Teams, что делает его полезным для приложений, требующих адаптивной генерации текста, как, например, интеллектуальные чат-боты или системы поиска знаний.

🔐 Лицензия: MPL-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3🔥3
🔥 Курс по Ollama — создавайте ИИ-приложения локально!

🌟 C такими инструментами, как Ollama, вы можете привнести передовые возможности ИИ прямо в свою локальную среду. Изучение того, как использовать локальные большие языковые модели (LLM), может открыть целый мир возможностей. Локальные LLM обеспечивают больший контроль, настройку и конфиденциальность данных по сравнению с облачными системами ИИ.

🕞 Продолжительность: 2:57:23

🔗 Ссылка: *клик*

#курс #ollama #machinelearning


@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21👎1
Forwarded from Machinelearning
✔️ OpenAI представила функцию «Проекты» для ChatGPT.

OpenAI анонсировала новую функцию «Проекты» для своего чат-бота ChatGPT. Эта функция позволит пользователям группировать чаты и данные, упрощая использование ChatGPT для конкретных задач.

Пользователи смогут объединять в проекты пользовательские данные, разговоры, GPT и простые чаты. Каждый чат в проекте будет иметь доступ ко всей информации внутри него. OpenAI продемонстрировала "Проекты" на седьмом по счету стриме цикла анонсов "12 Days of OpenAI"
openai.com

✔️ Anthropic разработала платформу для анализа использования больших языковых моделей.

Anthropic создала платформу Clio для изучения особенностей применения больших языковых моделей в реальных условиях. Clio использует LLM для анализа миллионов диалогов, выявляя общие закономерности использования без нарушения конфиденциальности пользователей. Платформа группирует диалоги по схожести, создаёт обобщённые описания тем и определяет возможные нарушения правил использования. В отличие от традиционных методов, Clio не предполагает просмотра диалогов людьми.

Anthropic применяет Clio для повышения безопасности Claude. Clio помогает выявлять скоординированные злоупотребления и отслеживать неизвестные угрозы, особенно в важные периоды запуска новых функций. Компания планирует сделать Clio доступной для общественности с целью формирования культуры прозрачности в сфере ИИ.
anthropic.com

✔️ NVIDIA QUEEN: алгоритм потоковой передачи видео с произвольной точкой обзора.

QUEEN (QUantized Efficient ENcoding) - это новый алгоритм, разработанный NVIDIA для эффективного кодирования и потоковой передачи видео с произвольной точкой обзора. QUEEN использует динамические гауссианы для представления сцены, что позволяет достичь высокого качества изображения при минимальном размере модели.

Алгоритм способен сократить размер модели до 0,7 МБ на кадр, обеспечивая при этом быстрое обучение (менее 5 секунд) и высокую скорость рендеринга (около 350 кадров в секунду). QUEEN основан на квантовании и разрежении атрибутов гауссиан и использует адаптивную маскирующую технику для разделения статического и динамического контента.
research.nvidia.com

✔️ Microsoft представила новую модель Phi-4.

Новая языковая модель Phi-4 от Microsoft Research демонстрирует производительность, сравнимую с гораздо более крупными моделями, используя всего 14 миллиардов параметров. Phi-4 превосходит свою обучающую модель, GPT-4, в ответах на вопросы по науке и технике и демонстрирует особую эффективность в математике: 56,1% правильных ответов на вопросы университетского уровня и 80,4% на задачи из математических олимпиад.

Phi-4 уже доступна в рамках ограниченного превью на платформе Azure AI Foundry для исследовательских целей. В открытый доступ Phi-4 будет опубликована на следующей неделе.
techcommunity.microsoft.com

✔️ Cadbury борется с искусственным интеллектом, засоряя обучающие данные бессмыслицей.

Индийский филиал кондитерской компании Cadbury начал рекламную кампанию под названием «Сделаем ИИ посредственным снова», целью которой является замедлить развитие искусственного интеллекта путем внесения искажений в обучающие данные.

Компания создала «первую в мире серверную ферму», генерирующую тысячи синтетических веб-сайтов, заполненных бессмысленным текстом. Цель состоит в том, чтобы «загрязнить» данные, которые модели искусственного интеллекта собирают из Интернета, вызывая ошибки, требующие постоянного вмешательства человека.
techspot.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3🔥2👎1
Media is too big
VIEW IN TELEGRAM
🔥 Курс Математика Машинного обучения: Что такое тензоры.

📌 Видео
📌Colab с кодом

@data_math
Please open Telegram to view this post
VIEW IN TELEGRAM
3👎1👌1
🔥 Bolt.diy — это проект с открытым исходным кодом, позволяющий разрабатывать полнофункциональные веб-приложения с использованием генеративных AI-моделей!

🌟 Инструмент поддерживает интеграцию с такими моделями, как OpenAI, Anthropic, HuggingFace и другими, через единый API.

🔐 Лицензия: MIT

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1👌1
🔥 Gemini Cookbook от Google — руководство для работы с API Gemini!

🌟 В нем собраны быстрые стартовые инструкции, учебные примеры и руководство по использованию различных функций API, таких как обработка текста, изображений, аудио и видео, а также интеграция с кодом.

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Steel Browser — инструмент для автоматизации браузера с поддержкой API, который работает в облаке!

🌟 Он позволяет запускать сессии Puppeteer, Playwright, и Selenium, обеспечивая низкое время запуска (менее секунды при нахождении клиента в том же регионе) и продолжительные сессии до 24 часов. Steel предлагает возможности управления сессиями, включая сохранение и повторное использование cookies и локального хранилища, а также встроенные механизмы для обхода CAPTCHA и маскировки подлинности браузера.

🌟 Проект направлен на упрощение автоматизации браузеров, предоставляя интеграцию с популярными инструментами и обеспечивая высокую производительность. Steel предназначен для разработчиков, работающих с браузерной автоматизацией, и предоставляет функции мониторинга и отладки через встроенный Session Viewer.

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥1
🔥 gitdigest — это инструмент для анализа истории репозиториев Git и создания сводной статистики по изменениям в коде!

💡 Он собирает данные о коммитах, авторах, частоте изменений, а также об общем объеме внесенных правок, предоставляя метрики для анализа активности разработчиков и структуры проекта.

🔍 Основные возможности:

🌟 Анализ истории коммитов: Сбор данных о количестве коммитов, их авторах и временных интервалах.

🌟 Извлечение информации о типах изменений: добавления, удаления строк и файлов.

🌟 Визуализация статистики: Генерация отчетов о вкладе разработчиков.

🌟 Возможность анализа продуктивности и выявления "узких мест" в разработке.

🌟 Интеграция с CI/CD: Подходит для автоматического анализа репозитория в процессе разработки.

🔐 Лицензия: MIT

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2
⚡️Announcing Groq Summary!

Расширение с открытым исходным кодом для использования Groq в браузере.

📌 Github: https://github.com/jose-mdz/groq-chrome-ext

📌 Расширение: summary/lfehmciachpbanabhdgccidilnnkffjn

@bigdatai
2👍2🔥2🤡2
Forwarded from Machinelearning
⚡️ Релиз IBM Granite 3.1.

IBM представила Granite 3.1, обновление семейства открытых и высокопроизводительных LLM, оптимизированных для корпоративного использования. Обновление принесло семейству повышение производительности, точности в критически важных корпоративных сценариях: использование инструментов, RAG и рабочие процессы на основе AI агентов.

В этом релизе особое внимание уделялось улучшению обработки длинных текстов благодаря расширенному контекстному окну и детекту галлюцинаций. Все модели семейства Granite 3 получили длину контекстного окна в 128 тысяч токенов. Для сравнения, это примерно 300-страничная книга.

Набор LLM Granite 3.1 8B и 2B, базовые и инструктивные версии. Флагманская Granite 3.1 8B достигает одних из самых высоких средних баллов среди открытых моделей своего класса на Hugging Face OpenLLM Leaderboard.

MoE-модели Granite 3.1 3B и 1B c 800M и 400M активных параметров соответственно и их инструктивные версии.

Granite Embedding в 4 размерах (125M и 30M для английского языка и 278M и 107М - мультиязычные), которые поддерживают 12 языков: английский, немецкий, испанский, французский, японский, португальский, арабский, чешский, итальянский, корейский, голландский и китайский.

Granite Guardian 3.1 8B и 2B - специализированные модели обнаружения галлюцинаций при вызовах функций. Они отслеживают каждый вызов функции на предмет синтаксических и семантических отклонений, повышая достоверность и управляемость в рабочих процессах.

▶️Вместе с моделями, IBM представила инструменты и фреймворки с открытым исходным кодом:

🟠Docling - инструмент для подготовки документов к RAG, предобучению и тонкой настройке ( извлечение информации из форматов PDF, DOCX, изображения, PPTX, XLSX, HTML и AsciiDoc).

🟠Bee - фреймфорк создания масштабируемых приложений на основе AI агентов.

⚠️ Все модели Granite 3.1, Granite Guardian 3.1 и Granite Embedding доступны в средах: IBM watsonx.ai, Hugging Face, LM Studio, Ollama и Replicate.


📌Лицензирование: Apache 2.0 license.


🟡Статья
🟡Набор моделей
🟡Документация


@ai_machinelearning_big_data

#AI #ML #LLM #Embeddings #IBM #Granite
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1🤮1
🔥 PSHuman — новый инструмент для генерации 3D-модели человека из одного изображения!

🌟 Он создает подробную геометрию и реалистичный трехмерный облик человека в различных позах в течение всего одной минуты!

🔐 Лицензия: MIT

🔗 Страница проекта: *клик*
📖 Arxiv
🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍1
Forwarded from Machinelearning
📌Как линейная алгебра может помочь при разработке web-приложения.

Интересная и познавательная статья разработчика Ивана Шубина о том, как он использовал матрицы для создания интерактивного редактора диаграмм Schemio.

Изначально, редактор позволял создавать простые фигуры и манипулировать ими, но с введением иерархии объектов возникла необходимость в сложных преобразованиях координат. Матрицы стали ключом к решению этой проблемы, позволяя эффективно управлять перемещением, вращением и масштабированием объектов.

Для преобразования глобальных и локальных координат между собой использовались матричные преобразования. Умножение матриц дало возможность комбинировать преобразования, а инверсия матрицы помогает переводить координаты из глобальных в локальные.

Иван подробно описывает, как матрицы помогают управлять поворотом и масштабированием объектов относительно опорной точки и как они используются при монтировании и демонтировании объектов, чтобы избежать нежелательных коллизий.

Таким образом, матричная математика стала решением для расширения возможностей редакторе Schemio.

🔜 Читать полную версию статьи

#Math #LinearAlgebra #Webdev
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍1