Forwarded from Записки Ппилифа (Ppilif [GMT+1])
Почему кандидат впал в ступор? Либо он умница, но стрессует, либо он плохой кандидат. Наша задача, как интервьюеров, — отделить одних от вторых. Без подсказок тут не получится. Нельзя ставить на людях крест из-за ступора или стресса. Надо дисконтировать на него ваше общение, пока не создашь более комфортную обстановку для кандидата. Помогите умнице почувствовать себя увереннее и раскрыться.
А на какие штуки вы обращаете внимание во время собесов?
А на какие штуки вы обращаете внимание во время собесов?
#dl #cv
Stable Diffusion для создания видео
https://github.com/nateraw/stable-diffusion-videos
https://dreamix-video-editing.github.io/
Stable Diffusion для создания видео
https://github.com/nateraw/stable-diffusion-videos
https://dreamix-video-editing.github.io/
GitHub
GitHub - nateraw/stable-diffusion-videos: Create 🔥 videos with Stable Diffusion by exploring the latent space and morphing between…
Create 🔥 videos with Stable Diffusion by exploring the latent space and morphing between text prompts - nateraw/stable-diffusion-videos
Forwarded from Глеб Михайлов
На английском канале провел эксперимент с интересной штукой под названием (нет, не ChatGPT, хотя его я тоже там юзал) PyScript: она позволяет использовать python вместо JavaScript на веб-страницах.
За два стрима я сделал АБ тест калькулятор лучше, чем у Эвана Миллера. Лучше потому, что он позволяет рассчитывать размеры выборок для групп разных по размеру. В остальном у меня просто MVP получился, почти без дизайна и т.д.
И весь прикол в том, что мне не надо делать никакой бэкэнд для того, чтобы использовать python. Python встраивается в веб-страницу, и все расчеты выполняются на стороне пользователя.
Если у тебя была идея сделать какой-то простой пет-проект, но тебя останавливал ненавистный джава скрипт или сложность написания отдельного бэкэнда, то можно попробовать реализовать это с помощью PyScript и любимого python. Там можно и pandas юзать, и csv загружать, и ml делать. Все что хочешь короче.
За два стрима я сделал АБ тест калькулятор лучше, чем у Эвана Миллера. Лучше потому, что он позволяет рассчитывать размеры выборок для групп разных по размеру. В остальном у меня просто MVP получился, почти без дизайна и т.д.
И весь прикол в том, что мне не надо делать никакой бэкэнд для того, чтобы использовать python. Python встраивается в веб-страницу, и все расчеты выполняются на стороне пользователя.
Если у тебя была идея сделать какой-то простой пет-проект, но тебя останавливал ненавистный джава скрипт или сложность написания отдельного бэкэнда, то можно попробовать реализовать это с помощью PyScript и любимого python. Там можно и pandas юзать, и csv загружать, и ml делать. Все что хочешь короче.
Forwarded from эйай ньюз
Stanford Webinar - GPT-3 & Beyond
Вчера посмотрел эту прелестную лекцию из Стенфорда о новейших Языковых моделях. Проф С. Potts очень классно дал общий обзор языковых моделей и быстренько рассказал, как мы докатились до таких чудес как, например, GPT-3 и ChatGPT. Затем он порассуждал о том, в каких подтемах NLP можно еще что-то привнести обычному смертному, если у вас нет миллионов долларов на обучение SOTA моделей.
И вот какие актуальные темы для рисерча:
🔵 Retrival augmented in-context learning (условно, как поженить поиск и LLM)
🔵 Создание лучших бенчмарков, датасетов
🔵 "Last mile" for productive apps: Адаптация огромных моделей для конечных приложений, упрощающих жизнь
🔵 Исследования в сторону объяснения и верификации результатов, выданных LLM (огромными языковыми моделями).
Сами они в научной группе этого профа, с его слов, почти перестали тренировать модели и, кажется, занимаются промт-инженирингом и докручиванием уже натренированных LLM по вышеуказанным направлениям.
Получилась не очень тяжелая, но очень вдохновляющая лекция! Может после этого вы захотите написать диссер в области NLP. Ну, либо создать стартап.
@ai_newz
Вчера посмотрел эту прелестную лекцию из Стенфорда о новейших Языковых моделях. Проф С. Potts очень классно дал общий обзор языковых моделей и быстренько рассказал, как мы докатились до таких чудес как, например, GPT-3 и ChatGPT. Затем он порассуждал о том, в каких подтемах NLP можно еще что-то привнести обычному смертному, если у вас нет миллионов долларов на обучение SOTA моделей.
И вот какие актуальные темы для рисерча:
🔵 Retrival augmented in-context learning (условно, как поженить поиск и LLM)
🔵 Создание лучших бенчмарков, датасетов
🔵 "Last mile" for productive apps: Адаптация огромных моделей для конечных приложений, упрощающих жизнь
🔵 Исследования в сторону объяснения и верификации результатов, выданных LLM (огромными языковыми моделями).
Сами они в научной группе этого профа, с его слов, почти перестали тренировать модели и, кажется, занимаются промт-инженирингом и докручиванием уже натренированных LLM по вышеуказанным направлениям.
Получилась не очень тяжелая, но очень вдохновляющая лекция! Может после этого вы захотите написать диссер в области NLP. Ну, либо создать стартап.
@ai_newz
YouTube
Stanford Webinar - GPT-3 & Beyond
GPT3 & Beyond: Key concepts and open questions in a golden age for natural language understanding
Listen in as Professor Christopher Potts discusses the significance and implications of recent Natural Language Understanding developments including GPT-3.…
Listen in as Professor Christopher Potts discusses the significance and implications of recent Natural Language Understanding developments including GPT-3.…
Forwarded from Ivan
Добавлю еще хороший курс: https://rail.eecs.berkeley.edu/deeprlcourse/ , видео лекций разных годов есть на ютубе
Forwarded from Dmitry M.
Есть какие-то записи на ютубе: https://www.youtube.com/playlist?list=PLp9ABVh6_x4G5gt4gk68XAuHbpTmYuvl0
Forwarded from Artificial stupidity
#statistics
Что такое Population Stability Index (PSI)?
Population Stability Index (PSI) - это метрика, которая позволяет измерить то, насколько распределение некоторой переменной меняется между двумя выборками с течением времени. Она широко используется для мониторинга изменений характеристик популяции и диагностики возможных проблем с эффективностью моделей машинного обучения.
Как считается PSI?
1. Делим выборку на децили по нашему целевому значению (децили считаем по одной из выборок, для нас логично это сделать по более ранней выборке);
2. Для обеих выборок считаем процент значений, попавших в конкретный дециль;
3. Далее считаем
4. Суммируем полученные на шаге 3 значения по всем децилям.
Типичные значения для принятия решения:
1. PSI < 0.1 - разница незначительна;
2. PSI >= 0.1, PSI < 0.2 - небольшая разница между выборками;
3. PSI >= 0.2 - сильная разница между выборками, произошло смещение в данных.
Зачем вообще используется PSI?
Это полезная метрика для систем слежения за качеством данных во времени. Конкретно, с помощью PSI можно отслеживать так называемый data drift, чтобы понимать, когда наши данные начали резко меняться и нам нужно предпринимать те или иные действия (запустить новый процесс доразметки данных, переобучить модель, исследовать новые данные на предмет ошибок и качества поступающих данных и т.д.)
Что такое Population Stability Index (PSI)?
Population Stability Index (PSI) - это метрика, которая позволяет измерить то, насколько распределение некоторой переменной меняется между двумя выборками с течением времени. Она широко используется для мониторинга изменений характеристик популяции и диагностики возможных проблем с эффективностью моделей машинного обучения.
Как считается PSI?
1. Делим выборку на децили по нашему целевому значению (децили считаем по одной из выборок, для нас логично это сделать по более ранней выборке);
2. Для обеих выборок считаем процент значений, попавших в конкретный дециль;
3. Далее считаем
(%Actual - %Expected) * ln(%Actual / %Expected) для каждого дециля;4. Суммируем полученные на шаге 3 значения по всем децилям.
Типичные значения для принятия решения:
1. PSI < 0.1 - разница незначительна;
2. PSI >= 0.1, PSI < 0.2 - небольшая разница между выборками;
3. PSI >= 0.2 - сильная разница между выборками, произошло смещение в данных.
Зачем вообще используется PSI?
Это полезная метрика для систем слежения за качеством данных во времени. Конкретно, с помощью PSI можно отслеживать так называемый data drift, чтобы понимать, когда наши данные начали резко меняться и нам нужно предпринимать те или иные действия (запустить новый процесс доразметки данных, переобучить модель, исследовать новые данные на предмет ошибок и качества поступающих данных и т.д.)
Forwarded from DevFM
Manticore Search
Для полнотекстового поиска во многих проектах активно применяется Elasticsearch. Он же работает в системах для аналитики логов. Пример тому – всем известный ELK-стек. Но не эластиком единым.
Мы начали смотреть в сторону разных поисковых движков и пока остановились на Manticore Search.
Рекомендуем статью Manticore — альтернатива Эластику на C++. Автор начинает с исторической справки, как появился и развивался проект.
Дальнейшее повествование строится на сравнении с главным конкурентом – эластиком. Автор приводит множество интересных бенчмарков. Не будем говорить конкретные, загляните в статью и найдёте для себя что-то интересное. Особенно, если имеете опыт работы с эластиком.
Конечно, стоит критически относиться ко всем описанным тестам. Статья всё-таки подготовлена ребятами из мантикоры. Если бы статью писал кто-то из эластика, он бы нашел, о чём хорошем рассказать. Как говорится: если вы такие умные, то почему такие бедные?
Потрогать мантикору можно прямо из браузера в удобном интерактивном тренажере. А еще в тг у них есть небольшой ламповый чатик, где можно задать свои вопросы и получить ответы. Проверенный лайфхак: если на вопрос не ответили, то повтори его с припиской "думаю переходить на эластик". Подробный ответ будет получен в самое ближайшее время.
Планируем попробовать мантикору в своём проекте. О причинах выбора и результатах расскажем позже.
В заключение, Manticore Search – заслуживающий внимания проект, о котором стоит знать, как о потенциальной альтернативе эластику.
#skills #database
Для полнотекстового поиска во многих проектах активно применяется Elasticsearch. Он же работает в системах для аналитики логов. Пример тому – всем известный ELK-стек. Но не эластиком единым.
Мы начали смотреть в сторону разных поисковых движков и пока остановились на Manticore Search.
Рекомендуем статью Manticore — альтернатива Эластику на C++. Автор начинает с исторической справки, как появился и развивался проект.
Дальнейшее повествование строится на сравнении с главным конкурентом – эластиком. Автор приводит множество интересных бенчмарков. Не будем говорить конкретные, загляните в статью и найдёте для себя что-то интересное. Особенно, если имеете опыт работы с эластиком.
Конечно, стоит критически относиться ко всем описанным тестам. Статья всё-таки подготовлена ребятами из мантикоры. Если бы статью писал кто-то из эластика, он бы нашел, о чём хорошем рассказать. Как говорится: если вы такие умные, то почему такие бедные?
Потрогать мантикору можно прямо из браузера в удобном интерактивном тренажере. А еще в тг у них есть небольшой ламповый чатик, где можно задать свои вопросы и получить ответы. Проверенный лайфхак: если на вопрос не ответили, то повтори его с припиской "думаю переходить на эластик". Подробный ответ будет получен в самое ближайшее время.
Планируем попробовать мантикору в своём проекте. О причинах выбора и результатах расскажем позже.
В заключение, Manticore Search – заслуживающий внимания проект, о котором стоит знать, как о потенциальной альтернативе эластику.
#skills #database
Manticoresearch
Manticore Search – easy-to-use fast search database
Manticore Search is an easy-to-use open source fast database for search. Elasticsearch alternative, vector search, SQL interface, full-text search capabilities
Forwarded from DevFM
Практикуем Kubernetes
Кубер — слон, которого нужно есть по частям. В прошлый раз начали с лайтового введения, где познакомились с основными концепциями, но только в теории.
В этот раз посмотрим практическое руководство на официальном сайте кубера.
В первой части создаём кластер. Во второй деплоим приложение с использованием kubectl. В третьей доступаемся до внутренностей, смотрим на поды и логи. В четвёртой переходим к сервисам и выставляем развёрнутое приложение наружу. В пятой части одна из важных фишек кубера — создание реплик. В заключительной части тоже супер важная штука — обновление приложения без даунтайма.
Все руководства, помимо практической части, сопровождаются теоретическими материалами.
Из приятного — можно ничего не устанавливать себе на компьютер, а пройти всё в терминале на сайте. Для большего погружения рекомендуем всё-таки развернуть у себя Minikube и делать практику локально.
#skills
Кубер — слон, которого нужно есть по частям. В прошлый раз начали с лайтового введения, где познакомились с основными концепциями, но только в теории.
В этот раз посмотрим практическое руководство на официальном сайте кубера.
В первой части создаём кластер. Во второй деплоим приложение с использованием kubectl. В третьей доступаемся до внутренностей, смотрим на поды и логи. В четвёртой переходим к сервисам и выставляем развёрнутое приложение наружу. В пятой части одна из важных фишек кубера — создание реплик. В заключительной части тоже супер важная штука — обновление приложения без даунтайма.
Все руководства, помимо практической части, сопровождаются теоретическими материалами.
Из приятного — можно ничего не устанавливать себе на компьютер, а пройти всё в терминале на сайте. Для большего погружения рекомендуем всё-таки развернуть у себя Minikube и делать практику локально.
#skills
Telegram
DevFM
Введение в Kubernetes
В повседневной разработке без докера не жизнь, а каторга. Мы делились нашим опытом, какие именно задачи решает докер.
С ростом размера проекта растёт количество подсистем, особенно быстро в микросервистной архитектуре. Деление на подсистемы…
В повседневной разработке без докера не жизнь, а каторга. Мы делились нашим опытом, какие именно задачи решает докер.
С ростом размера проекта растёт количество подсистем, особенно быстро в микросервистной архитектуре. Деление на подсистемы…