Data Science
40.1K subscribers
1.54K photos
3 videos
47 files
1.98K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
🖥 Вайбкодим с GPT-5 как профи — OpenAI выкатили офиц. гайд по работе с моделью. С ним выжмете из нейронки МАКСИМУМ.

1️⃣Будьте предельно ТОЧНЫ и не давайте противоречий — иначе модель запутается.

2️⃣Подбирайте правильный уровень рассуждений (reasoning effort): простое → низкий, сложное → высокий.

3️⃣Структурируйте промпты XML-подобным синтаксисом. GPT-5 лучше держит контекст в таких блоках:

<code_editing_rules>
<guiding_principles>
- Every component should be modular and reusable
</guiding_principles>
<frontend_stack_defaults>
- Styling: TailwindCSS
</frontend_stack_defaults>
</code_editing_rules>


4️⃣Избегайте ультра-жёстких требований. Фразы «будь ПРЕДЕЛЬНО тщателен» → тонна лишнего текста.

5️⃣Давайте ИИ пространство для планирования и саморефлексии. Например, при создании приложений с нуля:

<self_reflection>
- Think of a rubric first
- Deeply analyze each part
- Use rubric to iterate best solution
</self_reflection>


6️⃣ Контролируйте «синдром отличника». GPT-5 сам любит усложнять. Чтобы держать в узде:

<persistence>
- Don’t ask human for confirmation
- Make best assumption
- Document it after acting
</persistence>

📌 Полный PDF со всеми деталями — тут
🚀 Генератор/оптимизатор промптов для GPT-5 — тут.

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 📚Python Books
Introduction to Python for
Econometrics, Statistics and Data Analysis


📚 Github

@pythonlbooks
Собеседование — больше переговоры, чем экзамен.

Если вы уже работаете в аналитике, то знаете: чем выше позиция, тем сложнее этапы. Здесь проверяют не просто SQL и продуктовые метрики, а глубину мышления, умение защищать решения, видеть бизнес-задачу за цифрами. И часто именно это решает, дадут ли вам оффер и с какими условиями.

21 августа в 18:00 (МСК) Павел Бухтик, экс-руководитель продуктовой аналитики в Яндексе, разберет, как проходит процесс найма аналитиков, какие бывают этапы и вопросы на собеседованиях, как выделиться среди кандидатов и получить оффер на лучших условиях.

Подключайтесь — расскажем, как выжить на многоэтапном собесе: https://clc.to/erid_2W5zFJsrVje 

Это третий вебинар Data-интенсива: от новичка до оффера, который поможет сориентироваться в сфере Data Science и перейти к первым шагам.

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJsrVje
Awesome Claude Code 🤝 Awesome Claude Code Agents

📌 Github

@datascienceiot
Ведущие ML- и DS-инженеры соберутся 13 и 14 сентября на E-CODE.
Это масштабное IT-событие создано командой Ozon Tech. Вы приглашены, но нужно зарегистрироваться: https://s.ozon.ru/63nnD27

Что будет:
6 контентных треков — один из них для ML/DS.
Выступления известных учёных.
Качественный нетворк — комьюнити middle+ специалистов.
Интеллектуальные интерактивы — и эксклюзивный мерч в подарок.
Вечеринки каждый день — на сцене НТР, Заточка, ILWT и Нейромонах Феофан.

E-CODE — комьюнити-пространство, в котором стоит быть 💙
Please open Telegram to view this post
VIEW IN TELEGRAM
From GPT-2 to gpt-oss: Analyzing the Architectural Advances

📚Read

@datascienceiot
Генеративный ИИ — уже не фантастика, а рабочий инструмент, но используем ли мы его на полную? В интервью Ъ FM Иван Гуз, управляющий партнер Авито, раскрыл, как GenAI трансформирует бизнес-процессы и почему его массовое внедрение неизбежно.

В Авито генеративный ИИ уже оптимизирует работу: автоматически создает контент, повышает точность рекомендаций через технологии трансформеров и сокращает рутинные задачи. «Уровень использования ИИ растет экспоненциально — сомнений в его повсеместном применении нет», — отмечает Гуз. Будущее, по словам эксперта, за «агентским ИИ» и world models, которые понимают контекст, а не просто слова.

Подпишитесь на полезные каналы Авито
ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents

📚 Read

@datascienceiot
This media is not supported in your browser
VIEW IN TELEGRAM
Станьте разработчиком нейро-сотрудников на Python и зарабатывайте от 150.000р в месяц 🔥🔥🔥

Мы научим вас создавать топовых нейро-сотрудников на базе GPT-4 Omni, и вы сможете:
1️⃣ Устроиться разработчиком в крупную компанию и зарабатывать от 150 тысяч ₽ в месяц
2️⃣ Разрабатывать такие проекты на заказ и зарабатывать от 500 тысяч ₽ за проект
3️⃣ Создать нейро-сотрудника в вашей компании и вырасти на +30-100% в зарплате

Что будет на интенсиве?
🧬 Теория: как создаются нейро-сотрудники с GPT-4o на Python
🧬 Практика: мы создадим нейро-консультанта, нейро-HR, нейро-маркетолога и др.

Ведущий интенсива - Senior AI разработчик нейросетей и основатель Университета искусственного интеллекта
🔥 Регистрируйтесь на бесплатный интенсив! Встречаемся в ближайший четверг!
🔋 Goldman Sachs выпустил 26-страничный отчёт об энергии и ИИ: **Powering the AI Era**

Главный вывод: дата-центры для ИИ потребляют электричество быстрее, чем энергетики успевают строить новые мощности.
Будущее индустрии будет зависеть не только от быстрых чипов, но и от того, кто сможет найти деньги и схемы финансирования для строительства.

🧵 Кратко по пунктам 👇

🚂 Каждый технологический бум имел опору
- XIX век — железные дороги
- 1990-е — оптоволоконные сети
- 2020-е — стойки с GPU
Одна «AI-фабрика» мощностью 250 МВт обойдётся примерно в $12 млрд.

📈 Почему обучение ИИ так прожорливо
- Кластеры состоят из тысяч GPU с жидкостным охлаждением.
- К 2027 году одна стойка будет потреблять в 50 раз больше энергии, чем облачная стойка 2022 года.
- Даже с оптимизациями мировой спрос на энергию дата-центров вырастет на 160% к 2030 году.

Энергосети не справляются
- Средний возраст ЛЭП в США — 40 лет.
- Разрешение на газовую станцию занимает до 7 лет.
- Goldman оценивает распределение новых источников:
- 30% комбинированные газовые станции
- 30% газовые «пикеры»
- 27,5% солнечная энергетика
- 12,5% другие источники

🔌 Как выкручиваются операторы
- Строят дата-центры прямо рядом с генераторами.
- Используют микросети, чтобы сглаживать пики нагрузки.
- Это ускоряет запуск, но создаёт конфликты с соседями — круглосуточно шумят дизельные или газовые турбины.

🟠 Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Yandex B2B Tech и ШАД представили первую в России нейросеть для анализа МРТ головного мозга младенцев до года. Система работает в облаке и определяет соотношение серого и белого вещества с точностью >90%, что позволяет ускорить диагностику нарушений ЦНС.

Модель обучалась на 1500 обезличенных снимках пациентов и датасете MICCAI Grand Challenge. Для автоматической разметки использовалась BIBSNet, для сегментации применялись ResNet и U-Net. Разработчики отмечают, что ограниченный объем данных и сложность разметки были основными вызовами.

Сервис уже проходит пилот в клинике и планируется к публикации в опенсорс, что открывает возможности для дальнейших исследований и интеграции в медицинские проекты.