Data Science
39.6K subscribers
1.52K photos
2 videos
47 files
1.96K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
Microsoft Build 2025: The age of AI agents and building the open agentic web

📚 Read

@datascienceiot
🛢 В мире, где данные — новая нефть, растёт спрос на дата-инженеров.

Ведь именно они знают, как такую нефть добывать, обрабатывать и хранить. И пока компании осознают потребность в этих специалистах, конкуренция на рынке низкая, а зарплаты — высокие.

Освоить ключевые компетенции дата-инженера поможет онлайн-магистратура Нетологии и НИУ ВШЭ «Инженерия данных».

За 2 года вы на практике:
— изучите Python, Java, Scala, Kotlin и SQL,
— научитесь проектировать пайплайны и обрабатывать данные,
— научитесь работать с системами хранения данных и базами данных в облаке.

Программа даёт широкий простор для переквалификации, поэтому после учёбы сможете перейти в MLOps, DevOps или менеджмент.

Онлайн-формат позволяет учиться без отрыва от привычной жизни и совмещать занятия с работой. При этом у вас будет отсрочка от армии, льготы на проезд и все остальные бонусы очного обучения.

Станьте магистром программной инженерии с дипломом одного из лучших вузов страны и получите веское преимущество при приёме на работу: https://netolo.gy/efQE

Реклама. ООО "Нетология". ИНН 7726464125 Erid: 2VSb5yWrH6g
Understanding Gradients

📚 Read

@datascienceiot
How to Optimize Your Python Code Even If You’re a Beginner

📚 Read

@datascienceiot
🧠 А вы уверены, что датасет, на котором вы тестируете GNN, вообще имеет смысл?

В обзоре с ICML 2025 команда AI VK разбирает свежую статью о том, как оценивать качество графовых датасетов для задач машинного обучения.
Reflections on OpenAI


📚 Читать

@datascienceiot
Forwarded from 📚Python Books
Audio, Video, and Webcams in Python (Lost Chapter from Automate the Boring Stuff)

📕 Book

@pythonlbooks
Изучить все разделы современного Data Science — этой осенью в НИУ ВШЭ

Центр непрерывного образования факультета компьютерных наук Вышки предлагает возможность обучения на различных IT-курсах и программах: от базовых курсов по математике и Python до продвинутых специализаций по Data Science.

Программа профессиональной переподготовки «Специалист по Data Science»
- Полный цикл обучения Data Science: от базовых разделов математики и программирования до нейросетей и работы c Big Data. Первая программа переподготовки, аккредитованная Альянсом в сфере ИИ.

Очные курсы:
- «Математика для анализа данных»
- «Алгоритмы и структуры данных»
- «Python для автоматизации и анализа данных»
- «Прикладная статистика для машинного обучения»
- «Машинное обучение»
- «Глубинное обучение»

При подаче заявки до 31 июля вы сохраняете старую цену в новом учебном году.

Реклама. НИУ "ВШЭ". ИНН 7714030726. erid: 2SDnjcLngeJ
How to Train Your LLM Web Agent: A Statistical Diagnosis

📕 Книга

@pythonlbooks
Открыт приём статей в научный журнал Международной конференции по ИИ — AI Journey.

Главный приз за лучшую статью — 1 миллион рублей. Ключевые работы опубликуют в спецвыпуске «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics.

Что даёт участие:
• Шанс выиграть 1 000 000₽
• Публикация в авторитетном журнале с индексацией Scopus/WoS
• Возможность представить исследование на площадке конференции AI Journey 2025

Условия:
— Статья должна быть оригинальной (не опубликована ранее)
— Принимаются работы на русском и английском
— Дедлайн — 20 августа 2025
Как подать заявку: https://aij.ru/science
Anthropic just released a research paper.

Inverse Scaling in Test-Time Compute


📚 Читать

@datascienceiot
Forwarded from AI VK Hub
В рекомендациях есть две точки зрения:

1. Бигтех: закинем в нейросеть пару петабайт данных, добавим побольше трансформерных блоков, тысячи видеокарт — и вот вам рексис нового поколения. Но вы не сможете это проверить, потому что только у нас столько данных.
2. Академия: пораскинем мозгами, добавим inductive bias в линейный автоэнкодер и получим соту на всех открытых датасетах. Обучаем на макбуке 19 года.

Мы любим оба подхода, но на ридинг-группе поговорим про второй. Роман Логойда, ML-инженер AI VK, представит статью Why is Normalization Necessary for Linear Recommenders?
🔹Начало встречи 24 июля в 18:00.

Зум: ссылка
ID: 313 292 5940
Код: 473906

Параллельно запустим стрим прямо в канале AI VK Hub.
Please open Telegram to view this post
VIEW IN TELEGRAM
AI Comes Up with Bizarre Physics Experiments. But They Work.

👉 Read

@datascienceiot
Альфа-Банк и ВШЭ запустили магистратуру — «Продуктовый подход и аналитика данных в HR-менеджменте»

Магистранты будут:
— работать с HR-аналитикой и DevRel
— разрабатывать web- и мобильные HR-сервисы
— учиться формировать, развивать и мотивировать команды

Учиться можно бесплатно. Студенты пройдут оплачиваемую стажировку в банке, лучшие получат оффер в команду. Заявки принимают до 8 августа.

@datascienceiot
The Era of DiffusionLM might be upon us

📚 Читать

@datascienceiot
Разработан метод, который позволяет видеть, как внутри ИИ появляются смыслы и менять их в процессе генерации без переобучения модели

Исследователи из T-Bank AI Research представили на ICML 2025 метод, позволяющий анализировать и управлять поведением языковых моделей без переобучения. Он отслеживает, как смыслы формируются внутри модели, и позволяет точечно усиливать или подавлять темы в генерации текста. Метод не требует дополнительных расходов и применим для уже обученных LLM.

📚Paper

@datascienceiot
Deep Research Agents with Test-Time Diffusion

Google keeps pushing on diffusion.

📚Paper

@datascienceiot
Андрей Рыбинцев, более 10 лет развивавший ИИ в Авито, стал управляющим директором по ИИ и вошел в состав правления. Сейчас платформа масштабирует внедрение ИИ в продукты, сервисы и внутренние процессы компании.

Теперь все ключевые ИИ-команды компании — около 900 специалистов из департаментов Data Science, Поиска и Рекомендаций, Аналитики данных — объединятся под его управлением. Также в компании будет сформирован новый кластер AI Experience, который сосредоточится на развитии ассистентов на базе генеративного ИИ.

По словам Рыбинцева, он с командой планирует масштабировать уже работающие решения и внедрить новые технологии, которые будут ощутимы для миллионов пользователей и тысяч бизнесов по всей стране.

Рыбинцев стоял у истоков построения ИИ-инфраструктуры в компании: внедрял Trust & Safety, антифрод, развивал ML-модерацию, масштабировал Data Science. Под его руководством также было запущено семейство генеративных моделей — текстовая A-Vibe и мультимодальная A-Vision.
Schmidhuber’s Fast-Weight work of 1991-92 introduced an explicit mechanism for token-to-token interaction inside recurrent neural networks (RNNs).

Each time step wrote an outer-product fast weight that linked the current hidden state (a “key”) with a “value.”

📚Статья

@datascienceiot
The Many Faces of Information Geometry

📚 Read

@datascienceiot