—
pip install git+https://github.com/ManuelFay/colpaliМетод ColPali опирается на такие VLM (Vision Language Models) как модель PaliGemma от команды Google Zürich, и использует улучшенный векторный поиск, предложенный в модели ColBERT.
🤗 Hugging Face
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
SmolLM: новые модели SOTA, 135M, 360M и 1.7B, которые идеально подходят для работы на эйдж девайсах! 🔥
▪Модели: huggingface.co/blog/smollm
▪Demo: https://huggingface.co/spaces/HuggingFaceTB/SmolLM-360M-Instruct-WebGPU
@machinelearning_ru
▪Модели: huggingface.co/blog/smollm
▪Demo: https://huggingface.co/spaces/HuggingFaceTB/SmolLM-360M-Instruct-WebGPU
@machinelearning_ru
👍6❤3🔥2
На базовом уровне Mathstral опирается на модель Mistral 7B, но больше заточена по STEM-задачи.
В различных стандартных отраслевых тестах Mathstral демонстрирует отличные результаты в своей размерной категории (7B). В частности, модель достигает показателя 56.6% в MATH и 63.47% в MMLU.
🤗 Hugging Face
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤3🔥3
🔥 Официальный документальный фильм о PyTorch: Революция в области искусственного интеллекта:
https://youtube.com/watch?v=rgP_LBtaUEc
@machinelearning_ru
https://youtube.com/watch?v=rgP_LBtaUEc
@machinelearning_ru
YouTube
Official PyTorch Documentary: Powering the AI Revolution
This film unveils the authentic narrative of PyTorch’s inception, attributing its existence to a dedicated group of unsung heroes driving technological innovation.
The documentary shares the strength of the PyTorch community, resonating with our communities…
The documentary shares the strength of the PyTorch community, resonating with our communities…
👍6❤4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Действительно забавно исследовать пространство представления больших моделей, используя текстовый ввод для создания поз 😂
https://europe.naverlabs.com/research/publications-enhanced/bridging-environments-and-language-with-rendering-functions-and-vision-language-models/
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3🔥1
🔥 Apple только что выпустила LLM с открытым исходным кодом 7B, весами, обучающим кодом и набором данных! 👀
TL;DR:
🧠 Базовая модель 7B, обученная на 2,5 Т токенах в открытых наборах данных
✅ Данные в основном на английском языке и контекстное окно 2048
✅ Объединенные данные DCLM-BASELINE, StarCoder и ProofPile2
✅ MMLU 0.6372 > Mistral & < Llama3
✅ Открытая лицензия с лицензией Apple
✅ Соответствует моделям с закрытыми наборами данных, таким как Mistral
✅ Обучен с использованием Python и OpenLM framework
✅ Доступно на huggingface и в Transformers
▪Модель: https://huggingface.co/apple/DCLM-7B
▪Репозиторий: https://github.com/mlfoundations/dclm
▪Набор данных: https://huggingface.co/datasets/mlfoundations/dclm-baseline-1.0
▪Документация: https://arxiv.org/abs/2406.11794
@machinelearning_ru
TL;DR:
🧠 Базовая модель 7B, обученная на 2,5 Т токенах в открытых наборах данных
✅ Данные в основном на английском языке и контекстное окно 2048
✅ Объединенные данные DCLM-BASELINE, StarCoder и ProofPile2
✅ MMLU 0.6372 > Mistral & < Llama3
✅ Открытая лицензия с лицензией Apple
✅ Соответствует моделям с закрытыми наборами данных, таким как Mistral
✅ Обучен с использованием Python и OpenLM framework
✅ Доступно на huggingface и в Transformers
▪Модель: https://huggingface.co/apple/DCLM-7B
▪Репозиторий: https://github.com/mlfoundations/dclm
▪Набор данных: https://huggingface.co/datasets/mlfoundations/dclm-baseline-1.0
▪Документация: https://arxiv.org/abs/2406.11794
@machinelearning_ru
👍6🔥5❤3
🔥 ZeroEval: простая унифицированная платформа для оценки LMS.
Двумя первоначальными задачами являются MMLU-Redux и GSM.
▪ Github: https://github.com/yuchenlin/ZeroEval
@machinelearning_ru
Двумя первоначальными задачами являются MMLU-Redux и GSM.
▪ Github: https://github.com/yuchenlin/ZeroEval
@machinelearning_ru
👍3🔥3❤2
🎓 Архив открытых курсов прямо в телеграм!
Вот огромная база материалов, которая пополлняется каждый день!
>Python (96гб видео)
>C# (45гб курсов)
>Английский (101гб курсов)
>Java (23гб видео)
>PHP (43гб видео)
>Мобильная разработка (22гб курсов)
>Go ( 132гб видео)
>Rust (35 гб видео)
>SQL (43гб видео)
>MySQL (31гб видео)
>Другое (234гб видео)
⛓ Крутейший Архив на 20241Гб: Курсов, книг, шпаргалок, стаетй, лекция ресурсы — всё собрано в одном месте: @datacours
Вот огромная база материалов, которая пополлняется каждый день!
>Python (96гб видео)
>C# (45гб курсов)
>Английский (101гб курсов)
>Java (23гб видео)
>PHP (43гб видео)
>Мобильная разработка (22гб курсов)
>Go ( 132гб видео)
>Rust (35 гб видео)
>SQL (43гб видео)
>MySQL (31гб видео)
>Другое (234гб видео)
⛓ Крутейший Архив на 20241Гб: Курсов, книг, шпаргалок, стаетй, лекция ресурсы — всё собрано в одном месте: @datacours
❤5
🚨LaSe-E2V: К преобразованию событий в видео с учетом семантики, ориентируясь на язык
Новый фреймворк под названием LaSe-E2V, который может обеспечить высококачественную реконструкцию E2V с учетом семантики с точки зрения языка.моделями распространения с учетом текстовых условий.
🌟𝐏𝐫𝐨𝐣: https://vlislab22.github.io/LaSe-E2V/
🚀𝐀𝐛𝐬: https://arxiv.org/abs/2407.05547
@machinelearning_ru
Новый фреймворк под названием LaSe-E2V, который может обеспечить высококачественную реконструкцию E2V с учетом семантики с точки зрения языка.моделями распространения с учетом текстовых условий.
🌟𝐏𝐫𝐨𝐣: https://vlislab22.github.io/LaSe-E2V/
🚀𝐀𝐛𝐬: https://arxiv.org/abs/2407.05547
@machinelearning_ru
👍6❤2🔥1
📢 Stable Audio Open!
Stability AI открывает модель генерации звука со стереозвуком переменной длительности (до 47 секунд) на частоте 44,1 кГц на основе текстовых прометав
proj: https://stability-ai.github.io/stable-audio-open-demo/
abs: https://arxiv.org/abs/2407.14358
@machinelearning_ru
Stability AI открывает модель генерации звука со стереозвуком переменной длительности (до 47 секунд) на частоте 44,1 кГц на основе текстовых прометав
proj: https://stability-ai.github.io/stable-audio-open-demo/
abs: https://arxiv.org/abs/2407.14358
@machinelearning_ru
👍7🔥3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Его цель — сделать большие языковые модели доступными путем объединения потребительских устройств в гетерогенный кластер, включающий iOS, Android, macOS, Linux и Windows. Это позволяет эффективно использовать устаревающие устройства, делая ИИ более доступным и демократичным.
Cake распределяет блоки трансформеров среди нескольких устройств, что делает возможным вывод моделей, превышающих ограничения памяти отдельных GPU-устройств.
Фреймворк настраивается как для рабочих, так и для главных узлов с REST API, совместимым с OpenAI, для управления задачами распределенного вывода. Конфигурационные файлы определяют топологию, назначая слои модели конкретным рабочим узлам, что обеспечивает эффективное распределение ресурсов в кластере.
**Ключевые особенности:**
* Распределенный вывод крупных моделей
* Гетерогенный кластер устройств
* Настраиваемые рабочие и главные узлы
* Совместимость с REST API OpenAI
* Оптимальное распределение ресурсов
На видео энтузиаст запускает Llama3 8B на собственном кластере, состоящем из, iPad Pro, MacBook Pro, iPhone 15 Pro Max, NVIDIA GeForce 3080 и 2x NVIDIA Titan X Pascal.
🔗 Github
@rust_code
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤3🔥3
Компания Postgres Professional заявила о выпуске обновлённого курса по администрированию свободно распространяемой СУБД PostgreSQL. DBA-1 представляет собой базовый курс для администраторов PostgreSQL, разработанный специалистами Postgres Professional. Материал доступен для самостоятельного изучения на сайте разработчиков и в авторизованных учебных центрах.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥2❤1
⚡️ Новая разработка Яндекса и IST Austria для качественного сжатия нейросетей
Команда Yandex Research разработала новые методы сжатия больших языковых моделей. С их помощью размер модели можно уменьшить до 8 раз, при этом сохранив качество ответов на 95%. Эти алгоритмы помогут стартапам по всему миру сократить ресурсы для работы больших языковых моделей и позволят запускать их на устройствах с небольшой вычислительной мощностью.
habr: https://habr.com/ru/companies/yandex/articles/830410/
@machinelearning_ru
Команда Yandex Research разработала новые методы сжатия больших языковых моделей. С их помощью размер модели можно уменьшить до 8 раз, при этом сохранив качество ответов на 95%. Эти алгоритмы помогут стартапам по всему миру сократить ресурсы для работы больших языковых моделей и позволят запускать их на устройствах с небольшой вычислительной мощностью.
habr: https://habr.com/ru/companies/yandex/articles/830410/
@machinelearning_ru
👍12❤6🔥6
📢✨ Новые модели LLaMA от Meta уже здесь! ✨📢
Ученые обучили большую модель с параметрами значительно превышающими 8/70B, а затем провели дистилляцию, создавая компактные и эффективные модели. Этот инновационный подход обещает опенсорс на уровне GPT-4!
📈 В сравнении версий 3.1 и 3.0, благодаря дистилляции 405B в меньшие модели, бенчмарки заметно улучшились.
🦙 Теперь понятно, почему OpenAI недавно представила GPT-4 Mini – конкуренция усиливается! Скоро у нас будут суперумные модели, которые быстро работают на любом железе.
Будущее ИИ становится еще ярче! 🚀
#ml #machinelearning #ai #robots
📌Релиз моделей
@machinelearning_ru
Ученые обучили большую модель с параметрами значительно превышающими 8/70B, а затем провели дистилляцию, создавая компактные и эффективные модели. Этот инновационный подход обещает опенсорс на уровне GPT-4!
📈 В сравнении версий 3.1 и 3.0, благодаря дистилляции 405B в меньшие модели, бенчмарки заметно улучшились.
🦙 Теперь понятно, почему OpenAI недавно представила GPT-4 Mini – конкуренция усиливается! Скоро у нас будут суперумные модели, которые быстро работают на любом железе.
Будущее ИИ становится еще ярче! 🚀
#ml #machinelearning #ai #robots
📌Релиз моделей
@machinelearning_ru
👍8❤2🔥2
DJL — это удобная библиотека машинного обучения для языка Java, особенностью которой является зоопарк моделей (Model Zoo), позволяющий получить готовую модель по описываемым параметрам из списка доступных моделей. Также имеется возможность создать свою модель, сохранить на диск и загрузить для дальнейшего использования.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥3👍2