Борис опять
15.1K subscribers
1.44K photos
72 videos
30 files
1.48K links
life = curiosity + irreducible noise

Whois: https://t.iss.one/boris_again/3400

Лс: @btseytlin
Download Telegram
# Воспроизводим взрыв и затухание градиентов

Сделал коллаб про взрыв и затухание градиентов. Сначала вызываем проблемы захутания и взрыва, анализируем, в том числе с помощью Wandb, и наконец чиним. Материал для того, чтобы поиграться с практикой, а не изучать теорию.

https://colab.research.google.com/drive/1Sek-YbosXLIhOwpX4BNRdsHMo4j109d4?usp=sharing

Когда я что-то изучаю мне нравится делать прототип-демонстрацию. Взять и вызвать взрыв градиентов, а затем попытаться починить. Я провел много маленьких экспериментов, так как мне надо было повторить эту тему. Теперь собрал материалы в один стройный коллаб, причесал и получилась этакая лабораторная работа.

Ставьте лайки, если материал нравится и хочется, чтобы я делал такое еще.
🔥128👍26
😁32👍6
В Anywhere Club опубликовали интервью со мной, немного присыпав кликбейтом заголовок. Внутри коротко про то, как устроены техничесике интервью. Будет полезно новичкам

https://aw.club/global/ru/blog/work/how-to-pass-a-technical-interview
🔥18👍53
Про петиции

История с петицией (https://t.iss.one/gonzo_ML/1444) как-то заметно поляризовала общество. Выход статьи Юдковского (https://t.iss.one/gonzo_ML/1441) добавил масла в огонь, особенно его пассажи про бомбардировку датацентров.

По моему ощущению от того, что я вижу вокруг, сторонников петиции (той, которая про сделать паузу на 6 месяцев) сильно меньше, чем противников. Аргументация противников, которую я чаще всего наблюдаю, при этом сосредоточивается вокруг утверждений, которые я бы сгруппировал в такие кучки:

1)
- Прогресс не остановить
- Это придумали конкуренты OpenAI
- Китай ждать не будет

2)
- Бояться надо не AI, а людей.
- У GPT нет сознания, воли, стремлений, агентности, поэтому бояться нечего
- GPT-4 безумно далека от порабощения мира потому что она ничего не понимает, совершает глупые ошибки, и вообще тупая
- GPT-4 не сможет поработать мир потому что у неё нет ручек/ножек

3)
- Третья кучка обычно связана с переходом на личности в духе, что те, кто опасается, ничего в технологиях не понимают.

Кажется, из больших кучек это всё. Добавьте, если я что-то упустил, обновлю пост.

Хочу добавить свои пять копеек к этим разговорам.

Хочется сразу выкинуть третью кучку, потому что, во-первых, она не по сути (было бы по сути, были бы конкретные претензии не к людям), а во-вторых ну тот же Юдковский настолько глубже большинства в этой теме, что даже не знаю как это серьёзно можно обсуждать. Что конечно не отменяет, что есть люди и непонимающие тоже, но они есть с обеих сторон.

Про первую кучку и неостановимость прогресса в силу разных причин. Содержание у перечисленных тезисов несколько разное, но, кажется, что в пределе все эти тезисы как минимум не отрицают способности и перспективы текущих подходов к AI.

Первый тезис про неостановимость прогресса -- это имхо просто лозунг, не обязанный быть правдой. Какие-то биологические эксперименты люди вроде как остановили, а сколько ещё прогресса в прошлом было остановлено инквизицией, сжиганием книг и убийствами учёных в Китае, или просто какими-то иными причинами, связанными с конкретными людьми (умер, влюбился, муза/музык улетел/а, отвлекли, …), мы и близко не знаем, ибо survivorship bias.

Другие тезисы про то, что надо просто бежать дальше, потому что “если не мы, то они”, более понятные, и я сходу не знаю какое правильное решение этой проблемы, но это всё очень походе на дилемму заключённого и теория игр знает, что делать, и видимо нужна какая-то критическая масса здравомыслящих людей в разных местах, чтобы такие проблемы решались. В современном мире многое вызывает сомнения относительно наделённости всех мест достаточным количеством таких людей.

Вторая кучка самая интересная, и я с ней по фактам даже согласен, но есть несколько но.

Да, нет сознания, воли, агентности и вот этого всего. Ну нет, но можно придумать кучу сценариев, когда такая штука делает своё дело и перечисленные атрибуты ей для этого не нужны. У коронавируса тоже ничего из этого нет, и у более опасных вирусов тоже, но можно представить, что какой-нибудь вирус потенциально выкосит всю популяцию. И не надо апеллировать к тому, что вирус не sustainable, если он выкашивает популяцию и ему негде дальше себя поддерживать, он не обязан быть sustainable, и так же может исчезнуть с лица Земли по завершению этой оказии.
👍13👎4🔥3
https://today.yougov.com/topics/technology/survey-results/daily/2023/04/03/ad825/3

Интересно: я бы предполагал, что разделение будет близко к 90% и 10% не в пользу позиции “AI bad"
😁66🔥6
#ml_digest
# ML дайджест: начало апреля

https://borisagain.substack.com/p/ml-digest-april-i

Не знаю как у вас, но лично у меня голова взрывается в попытках следить за происходящим в ML и AI. Каждый день выходит новая вундервафля, но большая часть из них забывается через пару дней. Было бы клево вместо обрывочных релизов читать выжимку самого важного, что произошло за две недели или месяц. Вероятно я такой не один. Поэтому пробую новый формат: дайджест нового в ML и ИИ.

Предлагаю вам первую пробную версию дайджеста, покрывающую первые недели апреля. Следующие будут выходить каждые две недели.

Если такая штука была бы вам полезна, то ставьте лайки / подписывайтесь на substack.
👍1016👎1🔥1
Кстати, из дайджеста.

Предлагаю сравнить позиции OpenAI и Anthropic по AI Safety.
OpenAI: https://openai.com/blog/our-approach-to-ai-safety
Anthroic: https://www.anthropic.com/index/core-views-on-ai-safety

Заметьте кто льет больше воды, дает меньше специфики и и в целом не особо потрудился раскрыть свою позицию. Явно видно кто больше беспокоится о безопасности своих решений.
6
#лонгрид
https://borisagain.substack.com/p/understanding-the-normal-distribution

Мой первый лонгрид: как по-настоящему понять Нормальное распределение.

Внутри:
* Разбираем каждый кусочек формулы PDF до тех пор, пока не получится объяснить “на пальцах" зачем он нужен.
* Исследуем связь между Биномиальным и Нормальным распределениями. Я стараюсь показать, что про Нормальное тоже можно думать через интуитивно понятные вещи как монетки, шары и прочее.
* Рассматриваем основные этапы вывода Нормального распределения.

@boris_again
🔥46👍65👎1
Внезапно кое-что для дизайнеров (и тех, кто знает дизайнеров).

Моя подруга Полина делает проект по помощи в поиске работы дизайнерам. Если вы начинающий дизайнер или знаете начинающего дизайнера, которому нужна помощь в поиске работы — можете поучаствовать в кастдеве. Вы ей — рассказ о себе и своих болях, она вам — разбор вашего портфолио и CV глазами человека, который регулярно нанимает дизайнеров.

За компетенции Полины я ручаюсь. Из прикольного мы когда-то делали игру вместе
6👍2
Я сделала анкету 📞

На работе в Газпроме мы (я и моя начальница Лена) периодически занимаемся поиском дизайнеров в команду. Каждый раз мы сталкиваемся с тем, что очень трудно искать людей - молодые дизайнеры не очень умеют себя презентовать (а те, что умеют, уже трудоустроены). Возникла идея сделать продукт по помощи начинающим дизайнерам в поиске работы - такие лайфхаки глазами hr)

И вот провожу кастдевы - хочу пообщаться с целевой аудиторией. Вы мне - рассказ о поиске работы и болях, я вам - взгляд на ваше портфолио и резюме со стороны того, кто ищет дизайнеров.

Если интересно поучаствовать - заполните плиз анкету до конца завтрашнего дня, а потом я с вами свяжусь и проведем кастдев 🔥

https://forms.gle/AEcUmRTVmAU3mLGy9
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
😁27
Cursed
😁32
Хороший аргумент в пользу вот этого
😢3
🤔3
Ищем Data Engineer в Planet Farms

Tldr:
* Мы занимаемся вертикальными фермами.
* Вакансия в офис с гибридным режимом, Коимбра, Португалия. Релокация, помощь юристов за счет компании.
* Задача основать команду по дате и вырасти в ее лида. Сначала будете только вы, но в течение года в команду планируется нанять еще двух человек.
* Нужно заложить фундамент Data Mesh и культуры данных в компании, который позволит масштабироваться на десятки фабрик.
* В начале нужно много работать руками по части бекенда и инфраструктуры: поднимать БД, писать API и все прочее.
* Зарплата обсуждаемая. Учтите: начинать торговаться придется с вилок Португалии. Можно выторговать стоки.
* Работа вместе со мной. Не в одной команде, но будем много взаимодействовать.

Мы в Planet Farms делаем вертикальные фермы: фабрики, которые выращивают растения. Это позволяет производить еду и сырье в любых погодных условиях, в любой точке мира, без длинных логистических цепочек и непредсказуемости агропромышленности. Наша главная фабрика среди крупнейших вертикальных ферм в мире и мы строим вторую еще больше.

Мы ищем дата инженера, чтобы строить инфраструктуру и культуру данных в компании. Сейчас лидирует идея построить Data Mesh. Требуется как уметь делать вещи руками, так и общаться с людьми, пушить идеи и доводить вещи до запуска.

В компании уже убеждены в необходимости культуры данных и у вас будет хорошая поддержка со стороны команды, поэтому в одиночку воевать за дату не придется. Тем не менее, нам нужен человек, который станет основным драйвером проекта. Это шанс построить с нуля и сделать хорошо.

Что мы ожидаем:
* Fluent English
* Python, Git, Docker, Flask/FastAPI и прочие базовые инструменты.
* Боевой опыт: RabbitMQ/Kafka, Prefect/Airflow, Minio/S3, PostgreSQL, Apache Spark.
* Вы можете выбрать между двумя технологиями и обосновать решение с учетом долгосрочных последствий.
* 3-5 лет опыта.

Что предлагаем:
* Зарплату.
* Macbook M1 и другие необходимые для жизни вещи.
* Страховку.
* Культуру без культа геройства. У нас больше ценится сразу сделать хорошо, чем героически чинить прод в три часа ночи. В PF учиться на работе это норма.
* Релокацию.
* Командировки в Милан.
* Отсутствие бюрократии и ненужных встреч.
* Причастность к борьбе с голодом в мире (небольшая).
* Физически осязаемый результат работы. Его можно есть!

Ссылка на вакансию на linkedin

Присылайте CV мне: @btseytlin
🔥52👍4👎1
#лабораторный_журнал
Лайфхак:

На встрече стал клевать носом когда кто-то предложил идею для нашей команды. Я ничего не слышал, а меня спрашивают: “Do you think it’s a good project for us?”

Надо что-то ответить. Нашел выход: “Could you please send a link with more info?”

Кризис миновал
😁654
#лабораторный_журнал

Мы запустили наш проект.

Со стороны выглядит неприлично просто. На одном экране видишь карту фабрики и статус локаций с растениями. По клику на локацию переходишь в инструмент разметки. Если отмечаешь там проблему, то на карте иконка становится красной. Размечаешь как отсутствие проблемы — становится зеленой.

Удивительно как много сложности скрывается за этим фасадом. Пользователю не видно, что для этой простой работы нужно было связать между собой изображения, данные о засеянных продуктах и данные о прогонах робота. Не видно как нам пришлось связывать координаты фотографий от робота с локацией на фабрике. Не видно и всех бекграунд джоб, мониторинговых штук и прочей обвязки.

Показали результат агрономам. Я постоянно ожидаю, что мне скажут: “Это все очень круто, вы молодцы, но это не то, что нужно.” Но нет: им снова понравилось. С понедельника они будут это использовать. Во время демонстрации мы даже вместе нашли проблему с растениями на фото и агрономы пошли разбираться. Вообще постоянно ожидаю, что мы что-то не учли, но все подозрительно хорошо работает и даже с первого раза.

Тем временем у нас накопилось более 400к свеженьких фотографий. Примерно по 60к поступает каждый день. Благодаря тому, что мы связали изображения с данными о растениях, мы уже можем обучать модели на некоторые задачи. Например, предсказывать возраст растения и классифицировать тип. Это позволит претрейнить модели для других задач. С такими объемами даты нам даже доступен self-supervised learning. Уверен, что скоро у нас будет самая крутая модель для растений среди всех компаний занимающихся вертикальными фермами, если не вообще в мире. Мы начинаем делать ML!

Теперь я могу сказать, что есть компания, где я сделал ML с нуля.
👍76🔥714👏2