Блог о Data Science 💻
4.18K subscribers
75 photos
4 videos
21 files
115 links
Работаю аналитиком в Яндексе, учусь NLP в Вышке и веду этот канал про применение Data Science в компаниях, новости индустрии, рынок труда, мероприятия и другие активности вокруг науки о данных

Чат канала: t.iss.one/notedatasciencechat

Автор: @travelwithtagir
Download Telegram
Forwarded from Кот Масляков
Всем привет!

А вот и запись недавно прошедшего мероприятия «ML practice»!

👉🏻Посмотреть можно по ссылке: https://youtu.be/XyfIE77JQzU

В этом видео Данил Картушов из Karpov.Courses расскажет, как войти в машинное обучение, почему обработка данных перед обучением модели очень важна, и с помощью каких инструментов нарабатывать практический опыт.
🎉22😢2🐳2
Жду репосты...
🐳15😢1
Спасибо, что вы со мной!

Нас уже так много и при этом мы сохраняем какую то аутентичность и ламповость канала. Я очень рад, что мое такое небольшое хобби выливается во что-то большее и помогает другим развиваться!

Кстати эту картинку сгенерировал ИИ по запросу a party at which 2000 people subscribed to the public notes on Data Science gathered

Поздравляю вас с юбилеем!)
🐳25🎉63🔥1
Почему всем нужно использовать Kaggle?

Поиск хорошего комьюнити при изучении анализа данных или Data Science может быть затруднительным. Кажется, что сложно найти место, где люди делятся своим кодом, данными, идеями и поддержкой. Но есть платформа, где сходятся все эти пункты. Название ей — Kaggle 🎩

Я рекомендую Kaggle всем, кто хоть как-то взаимодействует с данными. И неважно, новичок вы или профессионал — занятие по душе найдется каждому. Сейчас я расскажу, почему вам стоит зарегистрироваться на Kaggle

Попасть в комьюнити

Напомню, что это крупнейшее Data Science сообщество в мире. Можно подписываться на людей, следить за их успехами, общаться и обмениваться опытом. Люди указывают ссылки на свои LinkedIn профили. Заводить знакомства через Kaggle весьма просто.

Построить портфолио

Солидный профиль с медалями на Kaggle скажет о вас больше, чем любое мотивационное письмо. Потенциальный работодатель может расценивать это как стремление к развитию и самообразованию, а это то, без чего нельзя быть хорошим специалистом.

Когда новички только создают свои pet-project'ы, за датасетами я советую идти именно сюда. Статистика заболеваний COVID-19, виды растений, типы машин, нарушения разметки — данные здесь можно найти на любой вкус.

Учиться у лучших

Хотите погрузиться в NLP? Откройте соответствующее соревнование, возьмите несколько тетрадок с чужим кодом с комментариями и идите пункт за пунктом. Не знаете, как подойти иначе к решению задачи? Посмотрите, как это делают другие. Люди на реальных данных показывают, как можно решать реальные задачи. Здесь же можно задавать вопросы и предлагать свои решения.

К примеру, мой друг из @notedatascience постоянно делится своими решениями и поэтому имеет звание Notebooks Master'а. Вы только посмотрите, как он оформляет свои тетрадки на Kaggle.

Решать прикладные задачи

Многие компании и лаборатории приходят туда с реальными задачами с солидным призовым фондом. Можно заняться распознаванием жестов, отслеживанием касаний касаний игроков футбола, прогнозированием распространения микробизнеса, подбором расписания для учеников и распознаванием рака. Все, что я перечислил выше — реальные задачи с соревнований, которые идут прямо сейчас.

Ваше решение может помочь бизнесу или науке продвинуться вперед, в то время как вы можете получить хороший опыт или призы, поработав на реальных данных. Опыт участия в соревнованиях может помочь вам устроиться на работу в компанию, которая решает такие задачи.

Именно в соревновании на Kaggle я научился оптимизировать работу с текстовыми данными, понял векторизацию и стал использовать эти методы в своей работе. А ещё на эту тему я общался с кем-то на собеседовании — удобно, когда узнаешь такие вещи на практике.

Участвовать в соревнованиях

Здесь постоянно проходят денежные соревнования в самых разных сферах. Среди заказчиков — гиганты вроде MasterCard, Google, NFL, правительства разных стран и исследовательские лаборатории. Большой призовой фонд мотивирует людей улучшать свои решения, а немного азарта делает соревнования ещё интереснее.

Я искренне рекомендую всем интересующимся данными поработать с данной платформой — возможно, вы получите заряд мотивации, выйдете из цикла монотонной работы и найдёте что-то интересное для себя 👀

Далее я планирую рассказывать о соревнованиях, в которых я участвовал и планирую участвовать. Рассказывайте в комментариях, знакомы ли вы с данной платформой 🎲

Давайте наберем 250 китов 🐳, а пойду писать следующий пост про полезности, которые может принести ChatGPT в вашей работе. Кстати, нам осталось набрать немного реакций на прошлую статью про резюме. Спасибо за репосты 🥺
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳85🔥621😢1
Чисто ли вы испытываете тревогу или неприятные психологические состояния?
Anonymous Poll
69%
Да, часто
31%
Нет, не часто
😢6
Искусство и ИИ

Я сделал канал про AI Design, в котором буду публиковать свои работы и возможно какие то посты про это, я пока не придумал

https://t.iss.one/noteaidesign
7🔥31😢1
Forwarded from BOGDAN
принял сложное решение и завёл канал @brain_go_brrr
🐳11😢8🔥42🎉2
Forwarded from Сиолошная
Вышла! Вышла! Вышла!

Я думал, что с таких слов и криков восторга начну сообщение в день, когда OpenAI опубликует статью по GPT-4. Время шло, статьи или даже блогпоста не было, зато в наш мир пришла ChatGPT. Про неё, кажется, слышали уже все - даже три моих преподавателя по английскому (из трёх!) спрашивают про эту модель!

Однако есть очевидная проблема - очень мало кто понимает, по каким принципам работает ChatGPT, что за магия происходит у неё внутри? А главное - пора ли уже перемещать весь цикл фильмов про Терминатора в раздел «документальное кино» на Кинопоиске?

Ответы на эти и бесчисленное множество других вопросов мы запихнули в новую статью под названием «Эволюция нейросетей от Т9 до ChatGPT: объясняем на простом русском, как работают языковые модели».

Я пишу "мы" потому, что эта статья - результат совместной работы с Павлом Комаровским, автором канала @RationalAnswer про разумные ответы на жизненные вопросы про финансы. Я его читаю уже больше года точно, и был ОЧЕНЬ удивлён предложению поработать вдвоём над объяснением для широких масс от столь опытного автора.

Мы потратили много усилий и времени, чтобы сделать материал интересным и понятным для каждого, особенно для не-технарей.

Читать статью: https://habr.com/ru/company/ods/blog/716918/

Если текст вам понравился, то мы будем благодарны за ваши лайки. Вопросы в комментариях тут и на сайте - приветствуются!

P.S. Не забудьте еще посмотреть на контент из канала @RationalAnswer Павла, уверен, что сейчас его советы и опыт актуальны для людей как никогда - всё таки человек больше 10 лет трудился в сфере фин. аудита и консалтинга (привет рыбятам из Маккинзи). Все его лонгриды я перечитал на два раза за последние 3 месяца, так как регулярно перелетаю из одной страны в другую 🙃 Но помимо этого есть куча познавательных видео и интервью, да хоть с тем же Вастриком.
🔥121
Тревога, депрессия и Голливуд [part 1]

Тревога - это состояние, когда человек чувствует беспокойство, страх или напряжение. В последнее время, люди чаще стали испытывать тревогу из-за повышенного уровня стресса на работе, в школе и в социальных сетях, а также из-за пандемии коронавируса.

По опросу в канале 67% часто испытывают тревогу, что достаточно большой показатель. А постоянное ощущение тревоги приводит к депрессивному состоянию.

От такого состояния быстро избавиться нельзя, возможно нельзя вовсе, но мы можем его ослабить.

Что важно понимать?

1) Не перерабатывайте и не соотносите себя с другими, только самим с собой
Даже если Богдан делает вещи в 20 раз быстрее вас, а Игорь знает в 10 раз больше вас, они в другой лодке, в другом темпе, со своими проблемами, у всех нас совершенно разный опыт, давайте не сравнивать крокодилов с обезьянами

2) Спите 8 часов и делайте регулярные вещи в одно и тоже время
Я как то рассказывал про soft-skills, это все отлично вам поможет, сон это супер важно. Например я при любом недосыпе чувствую тревожность. А регулярность поможет организму адаптироваться и делать это на автомате. Мозг не будет испытывать неожиданные вещи, которые создают тревогу.

3) Медитация и йога
Интересный факт про тревогу и личности - известный американский актер и режиссер Вуди Аллен известен своими страхами и тревожными мыслями. Несмотря на свой творческий успех и многолетнюю карьеру в индустрии развлечений, Аллен испытывает тревогу почти каждый день и даже не выходит из дома, если необходимо выступить перед большой аудиторией. Он открыто говорит о своих боязнях и рассказывает, как ему помогают медитация и другие стратегии для справления с тревогой. Это показывает, что даже у успешных и талантливых людей могут быть свои личные борьбы с тревогой.

4) Большинство проблем возникают в вашей голове.
Воспользуйтесь когнитивной терапией, проведите анализ, почему вы так подумали, а на самом деле ли так? Ваши мысли вас быстрее вылечат, нежели АД

Почитать можно тут
🐳2313😢3👨‍💻1
Тревога, депрессия и нейромедиаторы [part 2]

Вы уже знаете, что такое тревога и как с ней бороться. Однако, возможно, вам предыдущий пост мог показаться банальным, давайте я вам расскажу про нейромедиаторы.

Знаете ли вы от чего зависит наше настроение?
По нейронам бегают электрические импульсы, однако не только они, между нейронами остаются некоторые вещества, которые называют нейромедиаторы.

Серотонин - он регулирует работу желудочно-кишечного тракта, «отвечает» за двигательную активность, мышечный тонус и, конечно, за хорошее настроение. Для того, чтобы серотонин вырабатывался в организме, необходимы два вещества: аминокислота триптофан и глюкоза. Поэтому мы невербально заедам все сладким!

Дофамин - прославился он как ответственный за производство чувства удовольствия, а если точнее — ожидание удовольствия. А дофамин — это та самая сладкая морковка, подаренная эволюцией. Максимальный уровень дофамина достигается, кстати, во время еды и секса. При этом достаточно даже подумать о предстоящем удовольствии — дофамин тут как тут.

Окситоцин - он отвечает за доверительные и теплые отношения между людьми. Проведенные исследования показали, что люди, получившие окситоцин, охотнее доверяют окружающим, в том числе незнакомцам. Сам же нейромедиатор вырабатывается при близком контакте с человеком, при прикосновениях и поглаживаниях. Особенно много его выделяется во время секса.

Фенилэтиламин - строго говоря, не является нейромедиатором — он лишь запускает выработку дофамина и норадреналина — медиатора бодрствования и романтики (он повышает давление и сужает сосуды). . Стоит ему появиться, как в животе начинают порхать бабочки, а логика отключается. Предполагалось, что так как это вещество содержится еще и в шоколаде, то люди, мечтающие о любовных эмоциях, могут найти утешение в нем.

Эндорфины - получили свое название за схожесть их действия с опиатами, производимыми в лаборатории — в первую очередь с морфием. Эндорфины обладают обезболивающим и антистрессовым действием, снижают аппетит, нормализуют давление и частоту дыхания, ускоряют процессы регенерации в организме. Кроме того, уровень эндорфина в крови повышается в стрессовых ситуациях — он позволяет мобилизовать внутренние ресурсы и не чувствовать боль.

Каждый из способов предыдущего поста так или иначе влияет на нормализацию работы нейромедиаторов. В то время как антидепрессанты просто блокируют нейромедиаторы. Это как гипс, а если вы продолжите ломать себе ногу, то и гипс не поможет. Поэтому важно дать кости зажить, а это мы будем делать самостоятельно, разибраясь с нашим ментальным и физическим состоянием!
🐳19🔥53
Привет подписчечики!

Хочу поделиться своими социальными сетями!

Я завел блоги в других социальных сетях что бы расширять аудиторию. Призываю вас поддержать и подписаться на них.

Социальные сети
DTF
VCRU
HABR
DZEN
Linkendin

Мои каналы
t.iss.one/notedatascience
t.iss.one/noteaidesign

Чаты
t.iss.one/notedatasciencechat
t.iss.one/noteaidesignchat
Please open Telegram to view this post
VIEW IN TELEGRAM
11🐳5👨‍💻3
Без сна без отдыха, без жизни: почему у нас больше данных, чем здравого смысла

Приглашаю вас в наш уютный чатик в это воскресенье (9 апреля 20:00 UTC+3) в котором мы поговорим про машинное обучение и ментальное здоровье!

Вход бесплатный!
🐳153👨‍💻3
Подключил донаты 😎

Кто хочет поддержать автора кидайте 🥰

Там просто картинка красивой девушки в stable diffusion 🌞

Upd: донаты для кое чего интересного... Ждите 😏
Please open Telegram to view this post
VIEW IN TELEGRAM
😢43
Телеграм каналы, которые вам нужны

Мир технологий постоянно развивается и мы, как эксперты в области искусственного интеллекта, не можем остаться в стороне. В нашем небольшом сообществе собрались настоящие энтузиасты, увлеченные и глубоко погруженные в мир AI

Однако, с ростом популярности ИИ, можно легко потеряться среди множества каналов, сообществ и репостеров. Именно поэтому наша папочка с Telegram каналами может оказаться не только полезной, но и необходимой. Мы тщательно отбираем для вас только самые актуальные и интересные материалы по искусственному интеллекту, чтобы вы могли быть в курсе всех последних новостей и тенденций

Давайте вместе изучать и расширять свои знания в области AI и оставаться на шаг впереди

Подписывайтесь на нашу папочку и будьте в курсе всех событий!
🐳9
Промт инженерия - навык, который изменит будущее вашей карьеры?

Когда-то давным-давно люди искали информацию в специальных книгах, через библиотеки и справочные службы. Но это было так ласт дизейдн! Современные люди используют для поиска нужной информации гугл... Или все таки нет? 📱

Загуглить?.. Это слово стало частью нашего обихода, даже моя бабушка умеет гуглить, но как мы знаем - чему то всегда приходит конец. Ушли кирки, люди вооружились бурами, машинами. Ушли кнопочные телефоны, теперь у каждого второго есть смартфон, который оптимизирует чуть ли не всю нашу жизнь. Ушёл гугл, а что пришло на замену? 🗯

Новая эра - neuralization. Нейросети способны на многое, генерировать, творить и помнить весь интернета. И недавние LLMки подтвердили это. Нейросети они уже умнее нас и они буквально везде. И внедрении их в поисковики это был лишь вопрос времени. И знаете, в скором времени мы дойдём до того момента, когда мы полностью перестанем "гуглить" и начнём "промтить" (уже начали). А умение правильно составлять промт станет для нас чем-то более важным, чем просто написать текст. 🤔

Скорее всего ваши промпты - обычные запросы аналогичные запросы в гугл. Но, вы можете получить более релевантные ответы, описав модели широту мира. А глубину (точность ответа) можно уже получать step by step.

Почитайте инструкции от официальных разработчиков, в различных тредах и чатах о промт инженерии.

А теперь самое сочное. Добавляйте это в свои резюме. Это буквально значит, что вы развиваетесь и не стоите на одном месте. Это очень ценят. Если яндекс может найти все, то Вы - сможете нагенерить всё. И рано или поздно, но все люди начнут учиться этому, так почему бы не начать сейчас. А что бы не просто поймать волну, но и удержаться на ней приглашаю вас на симулятор мл.
Не будьте в тренде - задавайте тренды с 🔥

Так же напомню всем, у нас есть прекрасный ламповый чатик, где можно пообщаться и поговорить об этом - @notedatasciencechat
Please open Telegram to view this post
VIEW IN TELEGRAM
126🐳4👨‍💻1
Forwarded from BOGDANISSSIMO
ML LINKS

В недрах своего Notion откопал несколько подборок полезных статей, ссылок, видео по разным направлениям Machine Learning с которыми работал. Собрал их в одну кучу и делюсь с вами.

https://www.notion.so/uberkinder/b15ba7ccc032439bb5d282c8352f2e4e?v=0f9696310752456db047e94ab21c627f&pvs=4

Что имеем на момент 12/05/2023:

• Антифрод (36 ссылок)
• Ценообразование и прогноз спроса (17)
• Рекомендательные системы (42)
• A/B тесты (33, спасибо Валере)
• ML System Design (7)
• Ранжирование и поиск (6)

Список будет активно пополняться.
Буду благодарен репостам в ваши каналы и чаты.

#notion #links #ml #ml_system_design #mlsd #digest
🔥243🐳3😢1
😬 My First Data Project
Недавно я защитил свой проект в ITMO AI Tallent hub и хочу поделиться с вами отзывом! Вы знаете, что сейчас я пишу диплом и поэтому немного забросил контент.

😯 Что он из себя представляет?
По сути это просто pet project, который курируют несколько экспертов. Есть несколько этапов от проблемы, построение бизнес задачи, до деплоя и питча проекта в каждый из которых вам нужно сдать домашнее задание по которому вы получаете некоторый фидбек.

Несмотря на то, что времени было достаточно, почти два месяца. Я умудрился упустить один шаг из-за написания диплома и защиты практики. Поэтому организатором на будущее славно, если подумают об этом.

Вам предоставят так же лекции по каждому этапу, но они больше имеют обозревательный характер и self education. Что я категорически поддерживаю. Мне очень понравилось как кураторы дают фидбек, отдельное спасибо Саше и Кристине, которые заставили подумать и посмотреть на проект под другим углом.

👨‍💻 Что в итоге у меня получилось?
Я собрал проект, который решает проблему отсутствия времени для любителей читать книги. Построил сервис рекомендательной системы для книг, а килфича стала интеграция GPT4ALL и T5 для LLM-based рекомендательной системы и Суммаризации текста. А так же задеплоил это все на Streamlit и написал документацию. И на самом деле ничего бы не получилось без Симулятора МЛ, который помогает разбираться во многих интересных вещах и знакомствах с другими ребятами.

С ребятами из Хаба я познакомился ещё в прошлом году и их магистратурой в ИТМО! Оказалось, что ее запускают ребята из Napoleon It, которыми я уже тогда вдохновлялся и это была любовь с первого взгляда... Очень рад, что мои труды окупились! А так же поздравляю всех своих коллег!

Набираем 200 китов 🐳 и я выпускаю лонгрид о том как Streamlit поможет вам за час вывести проект в прод!

А так же не забываем заходить в чат, задавать вопросики и лампово общаться @notedatasciencechat 🗯
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳1235🔥5