Big data world – Telegram

Big data world

2.37K subscribers

412 photos

64 videos

18 files

1.25K links

Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime

Download Telegram

About

Blog

Apps

Platform

2.37K subscribers

Autogen от Microsoft взрывается на Github. Это платформа, которая позволяет агентам LLM общаться друг с другом для решения ваших задач. Агенты AutoGen настраиваемы, доступны для общения и легко допускают участие человека. Это также замена openai. https://github.com/microsoft/autogen

533 views07:11

Дообучение ruGPT-3.5 13B с LoRA.

Сегодня я рад представить вам подробное руководство по обучению модели ruGPT-3.5 13B с использованием датасетов модели Saiga-2/GigaSaiga, технологии Peft/LoRA и технологии GGML. Эта статья призвана стать полезным и практичным ресурсом для всех, кто интересуется машинным обучением, искусственным интеллектом и глубоким обучением, а также для тех, кто стремится глубже понять и освоить процесс обучения одной из самых мощных и перспективных русскоязычных моделей.

В данной публикации мы разберем каждый этап обучения модели, начиная от подготовки данных и заканчивая конвертацией в формат GGML. Буду рад, если мой опыт и знания помогут вам в вашем исследовании и экспериментах в этой захватывающей области!

Читать далее https://habr.com/ru/articles/766096/

Дообучение ruGPT-3.5 13B с LoRA

Добрый день, уважаемые читатели и авторы Хабра! Сегодня я рад представить вам подробное руководство по обучению модели ruGPT-3.5 13B с использованием датасетов модели Saiga-2 / GigaSaiga , технологии...

589 views07:48

Разложение языковых моделей на понятные компоненты.

https://www.anthropic.com/index/decomposing-language-models-into-understandable-components

Decomposing Language Models Into Understandable Components

Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.

540 views08:38

Не начинайте свое путешествие по науке о данных без этих 5 обязательных шагов — полное руководство Spotify Data Scientist

Полное руководство по всему, что я хотел бы сделать перед тем, как начать свое путешествие в области науки о данных, чтобы добиться успеха в свой первый год работы с данными. https://towardsdatascience.com/dont-start-your-data-science-journey-without-these-5-must-do-steps-from-a-spotify-data-scientist-c9cec11fd1b

Don’t Start Your Data Science Journey Without These 5 Must-Do Steps From a Spotify Data Scientist

A complete guide to everything I wish I’d done before starting my Data Science journey, here’s to acing your first year with data

585 views14:30

Пожалуй, лучший курс линейной алгебры. Преподает легендарный профессор Массачусетского технологического института Гилберт Стрэнг. Создайте прочную математическую основу для машинного обучения

https://www.youtube.com/watch?v=7UJ4CFRGd-U&list=PL221E2BBF13BECF6C&index=1

An Interview with Gilbert Strang on Teaching Linear Algebra

MIT 18.06SC Linear Algebra, Fall 2011
Instructor: Gilbert Strang, Sarah Hansen
View the complete course: https://ocw.mit.edu/18-06SCF11
YouTube Playlist: https://www.youtube.com/playlist?list=PLUl4u3cNGP63uMA4q8GaU6Eg5nzeOc8tx

In this video, Professor Gilbert…

👍3

667 views14:39

Новая модель искусственного интеллекта Replit теперь доступна на Hugging Face

"Миссия в Replit — дать возможность следующему миллиарду создателей программного обеспечения. Вчера мы усилили наши обязательства, объявив, что Replit AI теперь бесплатен для всех пользователей . За последний год мы стали свидетелями преобразующей силы совместной разработки программного обеспечения с возможностями искусственного интеллекта. Мы считаем, что искусственный интеллект станет частью набора инструментов каждого разработчика программного обеспечения, и мы рады бесплатно предоставить Replit AI нашему более чем 25-миллионному сообществу разработчиков." https://blog.replit.com/replit-code-v1_5

Replit — Replit’s new AI Model now available on Hugging Face

At Replit, our mission is to empower the next billion software creators. Yesterday, we strengthened our commitment by announcing that Replit AI is now free for all users. Over the past year, we’ve witnessed the transformative power of building software collaboratively…

623 views06:06

Привет! Это команда МТС и мы запустили бесплатный курс для тех, кто хочет стать сильным ML-разработчиком

Что будет: 10 месяцев онлайн обучения от экспертов Big Data МТС с возможностью трудоустройства в компанию

Что в программе: Python, математика, основы машинного обучения, ML Ops, ML System design и все, что необходимо для работы в Data Science

Ждем на обучении тех, кто хочет развиваться и в анализе данных, и в ML, и в IT одновременно.

Оставляй заявку и решай вступительное испытание. Лучших пригласим к обучению

Подробности по ссылке, ждем тебя!

Реклама. ПАО "МТС". ИНН 7740000076. erid: LjN8K21rT

670 views13:11

LLaMA 2, RWKV, Santacoder и другие LLM на iOS

Однажды я решил изучить язык Swift и разработать свое первое приложение для iOS. Для этого я решил создать реальный проект, который заключался в оптимизации нашумевшего LLaMA.cpp под iOS. Я поставил перед собой задачу обеспечить запуск 3B и 7B моделей на iPhone 12 Pro с приемлемой скоростью. Под «приемлемой» скоростью я имею в виду такую, чтобы пользователь не успевал заскучать, читая предсказанный текст, пока генерируется новая часть. Что из этого получилось (и какие трудности были при реализации) читайте в статье. https://habr.com/ru/articles/764598/

LLaMA 2, RWKV, Santacoder и другие LLM на iOS

Однажды я решил изучить язык Swift и разработать свое первое приложение для iOS. Для этого я решил создать реальный проект, который заключался в оптимизации нашумевшего LLaMA.cpp...

👍2💩1

603 views15:45

This media is not supported in your browser

VIEW IN TELEGRAM

Генеративные модели, обученные на интернет-данных, произвели революцию в способах создания текста, изображений и видеоконтента. Возможно, следующей вехой в развитии генеративных моделей станет моделирование реалистичного опыта в ответ на действия, выполняемые людьми, роботами и другими типами интерактивных агентов.

Interactive website: https://universal-simulator.github.io
Paper: https://arxiv.org/abs/2310.06114

640 views12:08

Введение в современную статистику (2-е изд.)

https://openintro-ims2.netlify.app/

openintro-ims.netlify.app

Introduction to Modern Statistics (2e)

630 views12:50

Как «воспитать ламу» и ускорить ML-эксперименты.

Часто проведение ML-экспериментов сводится к долгому поиску и загрузке нужных датасетов и моделей, скрупулезной настройке гиперпараметров с целью проверки гипотез. Но что делать, когда времени мало, а за ночь нужно зафайнтюнить ламу? Давайте это и узнаем.

Статья написана по мотивам доклада Ефима Головина, MLOps-инженера в отделе Data- и ML-продуктов Selectel.

Читать дальше →https://habr.com/ru/companies/selectel/articles/767076

Как «воспитать ламу» и ускорить ML-эксперименты

Часто проведение ML-экспериментов сводится к долгому поиску и загрузке нужных датасетов и моделей, скрупулезной настройке гиперпараметров с целью проверки гипотез. Но что делать, когда времени мало, а...

681 views07:16

Понимание глубокого обучения

https://udlbook.github.io/udlbook/

804 views07:34

Kornia — библиотека компьютерного зрения.

Kornia это open source библиотека для решения задач компьютерного зрения. Она использует PyTorch в качестве основного бэкенда и состоит из набора дифференцируемых процедур и модулей. Создатели библиотеки вдохновлялись OpenCV, и поэтому Kornia является его аналогом, но при этом в некоторых моментах превосходит. Главным преимуществом Kornia по сравнению с тем же OpenCV, scikit-image или с Albumentations является возможность обрабатывать изображения батчами, а не по одному изображению и возможность обрабатывать данные на GPU.

Читать далее https://habr.com/ru/articles/765176

Kornia — библиотека компьютерного зрения

Приветствую, Хабр! Меня зовут Дмитрий. На момент написания этой статьи я являюсь магистрантом второго курса в ИТМО. Компьютерным зрением начал заниматься четыре года назад. В этой статье я хочу...

750 views09:50

Генеративное расширение искусственного интеллекта для JupyterLab.

https://github.com/jupyterlab/jupyter-ai

GitHub - jupyterlab/jupyter-ai: A generative AI extension for JupyterLab

A generative AI extension for JupyterLab. Contribute to jupyterlab/jupyter-ai development by creating an account on GitHub.

629 views07:29

Harvard CS50 – бесплатный университетский курс информатики

https://www.freecodecamp.org/news/harvard-cs50/

freeCodeCamp.org

Harvard CS50 – Free Computer Science University Course

Harvard University's CS50 is one of the most popular beginner computer science courses in the world. We just released the entire CS50 course–all 25 hours–on the freeCodeCamp.org YouTube channel. David J. Malan is widely considered to be one of the b...

691 views08:26

Fuyu-8b: мультимодальная архитектура для агентов ИИ.

https://www.adept.ai/blog/fuyu-8b

Fuyu-8B: A Multimodal Architecture for AI Agents

We’re open-sourcing Fuyu-8B - a small version of the multimodal model that powers our product.

646 views11:37

Антон Мальцев про удобные NPU, Computer Vision для коботов и восстание неуклюжих машин.

У нас в гостях специалист с 15-летним опытом в Machine Learning который совмещает пару высокоуровневых должностей в разных компаниях — Head of ML в Cherry Labs и CTO в Rembrain. За полтора часа мы обсудили: позабытые ML-фреймворки и перспективы Reinforcement Learning, выяснили, какие платы с NPU лучше подходят для pet-project и зачем норвежцам роборуки.

Читать далее https://habr.com/ru/companies/magnus-tech/articles/768476/

Антон Мальцев про удобные NPU, Computer Vision для коботов и восстание неуклюжих машин

У нас в гостях специалист с 15-летним опытом в Machine Learning который совмещает пару высокоуровневых должностей в разных компаниях — Head of ML в Cherry Labs и CTO в Rembrain. За полтора часа мы...

693 views06:21

Построение ML модели для оценки текста языкового экзамена.

Путешествуя по просторам Kaggle, я встретила обычный, на первый взгляд, датасет с результатами письменной части языкового экзамена IELTS. Так как недавно я сама активно готовилась к сдаче подобного экзамена, тема меня чрезвычайно заинтересовала и я решила попробовать создать модель, способную предсказывать оценку на основе текста эссе.

Итак, сначала определимся с постановкой задачи. Результаты экзамена оцениваются по шкале от 0.0 до 9.0, с шагом 0.5, поэтому я рассматривала задачу как многоклассовую классификацию.

Читать далее https://habr.com/ru/companies/otus/articles/768594

Построение ML модели для оценки текста языкового экзамена

Автор статьи: Наталья Золотарева Выпускница курса Machine Learning. Professiona l Путешествуя по просторам Kaggle, я встретила обычный, на первый взгляд, датасет с результатами письменной части...

695 views14:47

LoRA — один из наиболее широко используемых и эффективных по параметрам методов точной настройки для обучения пользовательских LLM. В этой статье представлены практические советы для тех, кто заинтересован в ее применении: от экономии памяти с помощью QLoRA до выбора оптимальных настроек LoRA. https://lightning.ai/pages/community/lora-insights

Finetuning LLMs with LoRA and QLoRA: Insights from Hundreds of Experiments - Lightning AI

LoRA is one of the most widely used, parameter-efficient finetuning techniques for training custom LLMs. From saving memory with QLoRA to selecting the optimal LoRA settings, this article provides practical insights for those interested in applying it.

❤‍🔥3👍1

789 views17:33

800 бесплатных курсов Computer Science с видеолекциями.:

https://github.com/Developer-Y/cs-video-courses

GitHub - Developer-Y/cs-video-courses: List of Computer Science courses with video lectures.

List of Computer Science courses with video lectures. - Developer-Y/cs-video-courses

873 views08:19