Big Data AI
16.8K subscribers
829 photos
98 videos
19 files
831 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
⚡️ Большое обновление для бенчмарка Massive Text Embedding Benchmark (MTEB), призванное упростить поиск подходящей модели для эмбедингов!

Удобная фильтрация моделей, поиск, использование памяти, размер модели по параметрам.

Обновленный лидерборд: https://huggingface.co/spaces/mteb/leaderboard

@bigdatai
👍42🔥2
Нейросеть для генерации изображений YandexART стала доступна для тестирования внешним компаниям!

В режиме закрытого превью нейросеть уже попробовали несколько внешних компаний. Например, крупная e-com сеть тестирует YandexART для создания уникального дизайна подарочных карт. Клиенты сети смогут ввести текстовый запрос и самостоятельно выбрать собственное оформление для карты.

Теперь на облачной платформе Yandex Cloud с помощью YandexART компании смогут создавать визуалы для рекламы и социальных сетей, дизайн-макеты, иллюстрации для диджитала и книг. Нейросеть можно встроить через API в различные сервисы и веб-приложения.
👍82
📌Spotify тестирует ИИ-плейлисты

Spotify запустила бета-версию ИИ-плейлистов для пользователей из Великобритании и Австралии. С её помощью можно генерировать плейлисты с помощью подсказок на естественном языке.

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2
🖥 100 вопросов для подготовки к собесу Python

Держите супер полезную статью, которая поможет освежить в памяти самые основные концепции Python и во всеоружии предстать на собесе)
Детально разбираются все 100 вопросов, так что после прочтения всё должно уложиться по полочкам 🌟

📎 Статья

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112🔥2🤝1🤗1
🎓 Курс квантового машинного обучения

Бесплатный курс от сообщества ODS, который содержит лекции разных уровней сложности и глубины.

Все объяснения идут с кодом.

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍32
🔥 Новый огромный многоязычный датасет для LLM" [Удалено дублирование ~5,6 трлн токенов]. 🔥

Доступно 75 языков (22 ТБ необработанных файлов, 11 ТБ дедуплированных файлов и 8,4 ТБ чистых файлов), которые представлены в формате JSON, сжатых с помощью zstd.

Для удобства данные разделены на несколько сегментов по несколько ГБ каждый. Количество фрагментов для каждого языка зависит от размера конкретного корпуса.

Формат - JSONL, в котором каждая строка представляет собой допустимое значение JSON и полный документ с метаданными.

- Статья: https://arxiv.org/abs/2403.14009
- Страница проекта: https://hplt-project.org
- Датасет: https://hplt-project.org/datasets/v1.2

@bigdatai
👍5🔥31
🔥Подборка лучших обучающих каналов для программистов.

➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять

Машинное обучение

Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат

🏆 Golang
Golang - изучи один из самых перспективных языков на ит-рынке
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест

💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность

🚀 Data Science

Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data

🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных

#️⃣C#

С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа

🐍 Python

Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги

Java

Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги

💻 C++

C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии

⚡️ Frontend
Javascript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend

🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов

📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки

🇬🇧 Английский для программистов

🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence

🔥 DevOPs
Devops для программистов
Книги Devops

🌟 Docker/Kubernets
Docker
Kubernets

📓 Книги
Библиотеки Книг для программситов

💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
🔥4👍31
Нам не нужен AGI.
Нам нужен только RAG 🧵


@bigdatai
👍6🔥2😁21
OmniFusion 1.1 представляет собой гибридную LLM, способную взаимодействовать с изображениями.

В дополнение к стандартному текстовому диалогу, OmniFusion 1.1 может отвечать на вопросы, основанные на изображениях. Например, она способна анализировать рукописные задачи, интерпретировать карты или предоставлять рецепты на основе фотографий продуктов.

Эта модель построена на базе Mistral, однако легко заменяема другими языковыми моделями.

Разработчики обеспечили доступ к модели как для некоммерческого, так и для коммерческого использования.

Модель доступна на платформе Hugging Face.

https://github.com/AIRI-Institute/OmniFusion

@bigdatai
👍4🔥21
Julia_Cheat_Sheet.pdf
1.9 MB
🔥 Крутая Шпаргалка по языку Julia

Если вы хотите узнать, чем синтаксис Julia отличается от пайтоновского, то эта шпаргалка — отличный материал для быстрого изучения.

Содержит информацию об использовании:
▪️пакетов;
▪️операторов;
▪️векторов;
▪️разных функций;
▪️датафреймов.
4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Adobe объявила о выпуске ИИ-редактора для Premiere Pro.

На видео продемонстрированы возможности модели Adobe Firefly. В ближайшее время в Premiere Pro появится новая вкладка Generative, предлагающая следующие функции:

🔸Добавление объектов — это позволит выделить область на сцене и указать, что именно должно быть добавлено туда. Необходимые объекты будут автоматически сгенерированы на выбранном месте.
🔸Удаление объектов — помимо добавления, теперь можно также удалять объекты. Процесс выделения объектов выглядит очень просто, и следы удаленных объектов не остаются.
🔸Расширение контента — функция Generative Extend позволит увеличить длительность ваших видеороликов, чтобы достичь нужной продолжительности.

Все эти нововведения появятся в Premiere Pro "позже в этом году". Кроме того, программа будет поддерживать интеграцию с другими видеомоделями (Pika, Runway и, возможно, Sora от OpenAI).

https://www.adobe.com/products/premiere/ai-video-editing.html

@bigdatai
👍4🔥21
🤗 Основы квантования: Новый краткий курс, созданный в сотрудничестве DeepLearning.AI
с Hugging


Узнайте, как сжать модели с открытым исходным кодом с помощью метода квантования, чтобы сделать их более быстрыми и доступными.

https://www.deeplearning.ai/short-courses/quantization-fundamentals-with-hugging-face/

@bigdatai
👍63🔥1
🔥 Анонс альфа-релиза torch tune от Pytorch!

torchtune - это библиотека, созданная на базе PyTorch для файнтюнинга LLM.

Она сочетает в себе функции файнтюнинга, которые можно использовать, экономя память. Они легко интегрируются в ваши любимые инструменты.

Начните файнтюнить уже сегодня!

Github
Анонс

@bigdatai
👍72🔥2
▶️Meta бросила вызов ChatGPT — все сервисы компании получили «самого умного» ИИ-помощника

🟡Совсем недавно Meta представила не только новое поколение собственных языковых моделей Llama 3, но и подключила их к поисковым строкам своих основных приложений — Facebook, Messenger, Instagram и WhatsApp, пусть и не во всех странах. Кроме того, компания запустила отдельный сайт для своего чат-бота, meta.ai.

🟡Meta AI запустили ещё в прошлом году, и он по-прежнему поддерживает лишь английский язык, однако работает во многих странах, включая Австралию, Канаду, Гану, Ямайку, Малави, Новую Зеландию, Нигерию, Пакистан, Сингапур, Южную Африку, Уганду, Замбию и Зимбабве.
Среди новых функций Meta AI — возможность попросить ИИ найти определённую информацию в Google и Bing. Разработчики не просто ускорили генерацию изображений с помощью Meta AI, но и наделили ИИ возможностью анимировать картинки, а также улучшили функцию размещения текста на генерируемых изображениях.

🟡Стремясь как можно сильнее расширить присутствие ИИ в своих продуктах, Meta добавила его не только в поисковые строки, но и в индивидуальные и групповые чаты, и даже в ленты приложений. Например, увидев в ленте Facebook фотографию северного сияния можно спросить ИИ, когда лучше отправиться в Исландию, чтобы наблюдать его своими глазами. Помимо этого, Meta AI добавили в умные очки Ray-Ban, вскоре он появится и в VR-гарнитуре Meta Quest.

📎 Подробнее

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🤔2👎1
🌐 AutoCrawler: Интеллектуальный веб-агент для парсинга.

AutoCrawler - крутой фреймворк, который использует иерархическую структуру HTML для разбора веб страниц

https://arxiv.org/abs/2404.12753

@bigdatai
👍112👎1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️Open Interface

Инструмент, который позволяет управлять любым компьютером через LLM.

Способен автоматически выполнять действия, эмулируя ввод с клавиатуры и мыши.

Корректирует курс, отправляя текущий снимок экрана в LLM при необходимости.

Подробное руководство по установке представлено для MacOS, Linux и Windows.

Github

@bigdatai
👍82🥰2