Boris Burkov
995 subscribers
712 photos
34 videos
2 files
806 links
Download Telegram
Oxford Nanopore гроизтся выпустить новый секвенатор ProemthION c 48 ячейками в первой половине 2019: https://nanoporetech.com/products/promethion.

С точки зрения понимания мира, очень интересно проследить за тем, как эффективность технологии нанопорового секвенирования возрастает на порядки за счет умножения прогресса в каждом из нескольких измерений - усовершенствование идет в разные стороны.

Сейчас PromethION работает на 24 ячейках, а остальные 24 слота пока заменены затычками, но ожидается, что к 2019 они выведут машину на полную мощьность. Ожидается, что к середине 2019 они также увеличат число пор на одну ячейку, так что количество информации с нее утроится. Скорость чтения с одной поры за последнее время удалось увеличить в 4 раза при том же качестве.

Вот и выходит, что за последние несколько лет каждая группа инженеров в компании достигла скромного инкрементального прогресса в своем направлении в 2-4 раза, а в итоге боевая версия PromethION будет превосходить прототип в десятки раз и, такими темпами, выведет нас в совершенно другую эпоху.

Как раз сегодня наткнулся на интервью, где о подобном же умножении, только в области AI, говорит Демис Хассабис из лондонского Deep Mind: https://www.techrepublic.com/article/google-deepmind-founder-demis-hassabis-three-truths-about-ai/. Он считает, что точно так же будут подобраны оптимальные подоходы AI для разных задач, подобно тому, как по-разному устроены разные области нашего мозга, отвечающие за разные функции. Не едиными нейронками и бустингом жива машинка - лично меня, например, интересует область knowledge representation and reasoning, потому что я не верю, что нельзя придумать ничего более умного, чем semantic web, онтологии или фреймы Минского.

Но я отвлекся. Расчетный модуль для PromethION - это шумный горячий ящик с кучей видеокарт. Раньше они собирались апгрейдить его с GPU на FPGA, но сейчас вроде передумали - может, на биткойн посмотрели.

Новая фишка, которую они хотели внедрить - это борьба с контаминацией. Например, если вы знаете, что хотите прочитать человеческую ДНК, а у вас начало секвенироваться что-то, и это похоже на бактериальную - она выплевывается из поры. К сожалению, фирма, у которой они хотели купить эту технологию, предложила им лицензионное соглашение по принципу "мы можем отобрать у вас все, включая первенца, мы вам не должны ничего", так что дело встало за переговорщиками и юристами.

Будут доступны сырые данные. Так что можно смотреть, например, модифированные основания ДНК и эпигенетику. Если не устраивает дефолтный basecaller Guppy, можно использовать альтерантивный Albacore или что-то еще.

Мир Нанопоровского секвенирования совершенно отличается от традиционного Иллюминовского. Посмотрим, кто победит. Пока что секвенирование одного генома человека на PremethION должно будет стоить менее $1000. Как серьезно шутил Панчин-старший, сейчас секвенаторы - это гигантские ящики, а ваши дети будут вынимать из кармана смартфон и секвенировать свой завтрак. =)
Один из самых известных фронтендщиков и thought leader'ов из Фейсбука, замечательный Ли Байрон, автор Immutable.js и соавтор GraphQL и React, этой весной ушел из компании после 10 лет в Facebook.

Говорит, что с 2008 компания выросла в 20 раз, универсальный человек-оркестр вроде него уже не нужен - а нужны суперузкие специалисты, превосходно знающие свою нишу. Кроме того, после скандала с Cambridge Analytica, у него сложилось впечатление, что от него ничего уже не зависит, он винтик в машине (хотя Марк Цукерберг и по-прежнему открыт к мнению сотрудников).

Поэтому он предпочел сделать смыслом своей жизни демократизацию доступа к брокерским услугам в США и ушел работать в Robinhood. Мне эта компания тоже всегда казалась очень интересной, посмотрим, как у них теперь пойдут дела.

https://medium.com/@leeb/goodbye-facebook-hello-robinhood-8734cfa2737a
Думаю, многие из вас слышали про развеселого израильского статфизика Ури Алона (https://www.youtube.com/watch?v=yhncg6GXYq8), который спустя какое-то время подался в биологи/биоинформатики.

У него еще была мегапопулярная стратегическая статья про то, как правильно выбирать тему кандидатской диссертации: https://www.weizmann.ac.il/mcb/UriAlon/sites/mcb.UriAlon/files/uploads/nurturing/howtochoosegoodproblem.pdf

Внезапно обнаружил сейчас его статью по генерации текста на естественных языках на основе машинного кода. Ты ему программу - а оно тебе описание того, зачем она нужна: https://arxiv.org/abs/1808.01400.

Боже, это у меня перегруз, или в машинке сейчас и правда год за три? А мне еще в 2015 казалось, что голова пухнет от javascript-фреймворков. Где там Sanity Preserver Карпатого?
Прошу прощения, прошлый пост - дезинформация. Это другой Ури Алон: https://scholar.google.co.il/citations?user=QBn7vq8AAAAJ&hl=en
Опять призрак рецессии?

Как мальчик, который кричал "волк", я предупреждал об опасности рецессии в феврале, и тогда пронесло. Однако на этих выходных я посмотрел на то, что творится с котировками, и мне стало страшновато. Я опять не могу утверждать, что это рецессия, но призываю всех начать внимательно следить за финансовыми рынками и готовиться (если это рецессия, то надо быть готовым уходить в доллары, снимать рубли с депозитов и переводить в доллары, не растрачивать деньги на удовольствия, а чуть прикопить, продавать всякие ваши ликвидные инвестиции впроде акций и облигаций, не менять скучную, но надежную работу на творческую и низкооплачиваемую, не делать капитальных покупок вроде жилья, автомобилей и т.п. прямо сейчас - напротив, надо подумать, что вы будете покупать когда мы уйдем на самое дно кризиса - недвижимость, акции S&P500, криптовалюты, что-то еще - тогда они будут очень дешевы), потому что возможно мы прямо сейчас начали вкатываться в новый кризис.

Какие индикаторы:

1) Акции крупнейших американских компаний из индекса S&P 500 в начале октября обвалились и продолжают падать: https://www.google.com/search?tbm=fin&q=INDEXSP:+.INX&stick=H4sIAAAAAAAAAONgecRowi3w8sc9YSntSWtOXmNU5eIKzsgvd80rySypFBLnYoOyeKW4uTj1c_UNDM0qi4t5AEZhN345AAAA&biw=1280&bih=607#scso=_Scb6W-X0NuuxrgT94p442:0

2) За полтора месяца нефть обвалилась в полтора раза с $75 до $50 за баррель: https://uk.investing.com/commodities/crude-oil

3) Биткойн за 2 недели рухнул с $6000 до $3700: https://www.google.com/search?q=bitcoin&source=lnms&sa=X&ved=0ahUKEwjguc7C9O_eAhVtqYsKHbDGAAUQ_AUIDSgA&biw=1280&bih=607

4) Безработица в США на минимумах, что обычно случается перед рецессиями - посмотрите 1987-1990, 2001 и 2007 и сейчас: https://ru.investing.com/economic-calendar/unemployment-rate-300

4) ФРС продолжает повышать ключевую ставку: https://www.fxclub.org/centralnye-banki/federalnaya-rezervnaya-sistema/protsentnaya-stavka/

5) ЕЦБ свернул печать новых евро, которые раньше были основным источником денег на финансовых рынках: https://www.vestifinance.ru/articles/102853/print

Призываю всех быть внимательными и прошу делиться интересными новостями и инвестиционными идеями. Например, в ближайшее время я хотел бы посоветоваться с соображающими людьми, во что лучше вкладывать деньги после рецессии, чтобы посильнее "отскочить". Недвижимость в Москве или акции из S&P 500 вполне могут дать доходность на инвестиции где-то в 1.7-2 раза года за 3, но уверен, что на чем-то более рисковом, вроде криптовалют, можно "отскочить" гораздо сильнее.
Alexey_Murzin-150x105.jpg
32.1 KB
Сегодня в кафе нежданно-негаданно налетел на знаменитого Алексея Мурзина, точнее, даже он "сбежался" к нам, заслышав русскую речь =)

Мурзин - биоинформатик из Института Белка в Пущино, вотчины А. Спирина, Финкельштейна и Птицына, в чьей лаборатории он работал.

В 1991 35-летний Мурзин перебрался на Запад, а в 1994, в 38 лет, начал проект по классификации 3D-доменов белков под названием SCOP, который так и ведет до настоящего времени сам (хотя году в 2009 я вроде слышал, что он ушел на пенсию или что-то такое).

Сегодня он договаривался в EBI с PDB - банком 3D-структур - о сотрудничестве.

Я думал, что Мурзин совсем пожилой, но ему всего 62 года.

Меня эта встреча заставила вновь задуматься о том, как будучи ученым или программистом, ты положишь жизнь фактически на одну тему. Могу ли я так?

Знаменитый Ричард Ленский 25 лет занимается тем, что каждый день пересевает бактерии и откладывает образец, чтобы потом их секенировали.

"Не бойся поставить цель и не достичь ее - бойся растратить жизнь по пустякам"
Подразумевается юбилей начала Первой мировой, но почему-то мои первые ассоциации связаны с другим усачем.

Кстати, усы были обязательным атрибутом униформы британского офицера времен Первой мировой - считалось, что они повышают уважение к нему со стороны солдат.
This media is not supported in your browser
VIEW IN TELEGRAM
Ашманов рассказывал известную историю про продавца жестких дисков на "Горбушке". У того была целая пачка битых жесктих дисков, про которые тот знал, что они заведомо битые, но тем не менее продавал. Если диск приносили возвращать - отдавал деньги без вопросов. В итоге вся коробка разошлась...

Мошенничество это или нет?

А вот профессор, который делает научную работу руками постдока и знает, что статьи достаточно высокого уровня из этой работы не выйдет, и постдок все равно пойдет работать в индустрию, просто потеряет время, делая рутину у профессора. Отличается ли он от продавца тех дисков?

Мошенничество это или нет?
Помню, мой дед за пару лет до смерти почувствовал, что дело к финишу, и пытался рассказать мне историю своей жизни.

Он очень хотел вспомнить что-нибудь значимое, что-то большое и важное. А смог рассказать только как получил квартиру.

А у кого-то получается вот такое резюме. Какую из этих жизней выбрали бы вы?
Forwarded from Boris A. Burkov
Если я еще надумаю жаловаться на жизнь, покажите мне это =)
Недавно разговаривал с очень классным софтверным архитектором Расселлом, работавшим в куче интересных мест.

Расселлу 48, его "девушке" (они до сих пор не женаты, хотя она ждет ребенка), я бы сказал, чуть за 40 (западный мир сходит с ума, сдвигая рождение детей куда-то далеко за пределы предусмотренного биологией).

В конце 90-ых они с другом сделали компанию, подключавшую к интернету пол Кембриджа. За несколько лет они выросли с 4 клиентов до 2000. Им очень повезло, что Эппл обратил на них внимание и сделал их своим де-факто субподрядчиком в Кембридже.

В этот момент Расселл осознал, что им очень сильно повезло, они оказались в нужном месте в нужное время, и повернись дело иначе, они бы остались на бобах.

Поэтому он закончил MBA, чтобы что-то понимать в бизнесе и продвинуться выше по карьерной лестнице. Замечу от себя, что не сильно помогло. Когда мы разговаривали про Китай, Рассел заявил, что те вложили $100 миллиардов в спутник для квантового шифрования. Я, разумеется, не поверил и правильно: $100 миллиардов - это годовая выручка Гугла с почти 100 тысячами сотрудников. Оказалось $100 миллионов - и то, что человек легко ошибается на 3 порядка говорит о его плохом понимании крупных бизнесов.

Кстати, еще забавные новости пришли из Убера. Там сменился исполнительный директор, и новый начал резать косты. При этом дата сайнтистов внезапно тоже начали считать кост-центром, что мне кажется совершенно самоубийственной идеей.

Потом Расселл был одним из ведущих инженеров в GSK лет 10 назад. Как технарь - очень компетентный, в 48 лет - за всем успевает следить, от телекомовского железа и квантовых компов до js-фреймворков и машинки. Что-то я не уверен, что у меня хватит пороху в 48 гоняться за очередными Аурелиями и Дюрандалями, а он все успевает. Плюс, основал парочку стартапов аккурат под крах доткомов и под ипотечный кризис - было бы очень уместно сейчас еще один открыть...

Рассказывает, что всего у GSK минимум 4 больших отдела в UK и минимум 3 в US, всего 110,000 сотрудников; тот отдел, где работал он, был R&D SmithKline Beecham, там было 4000 сотрудников и 400 программистов/инженеров, которые их всячески автоматизировали. Фактически, они там написали собственный EBI (400 и 500 человек - примерно равные по количеству штаты, но наверное не по качеству - в EBI я таких компетентных людей как он не встречал вообще).

Так вот, он утверждает, что фармы сейчас режут свои R&D-отделы и отдают поиски лидов на аутсорс маленьким компаниям, а сами фокусируются на третьем этапе клинических испытаний, который дико дорогой и опасный.
Дофамин

Недавно мы с друзьями обсуждали 2 статьи про работу в Google:

https://habr.com/ru/post/438328/
https://habr.com/ru/post/350374/

В первой говорится, как здорово работать в Гугле: поддерживаешь легаси-проекты, получаешь за это $200-300k в год за 8 часов работы в день без переработок и уходишь домой курить бамбук. По мнению автора, это гораздо круче, чем пахать по 12 часов в день за те жи деньги врачом, юристом или консультантом.

Во второй говорится, как ужасно работать в Гугле: поддерживаешь легаси-проекты, их все время закрывают, а тебя не повышают в менеджеры, автор ушел работать за гроши независимым разработчиком.

Я встречал цифры, что около 66% технологических стартапов проваливаются, а около 80% софтверных проектов не находят спроса и закрываются.

И вот подумаешь: пусть были 9 хороших программистов, они разбились на 3 команды и делали стартапы по 5 лет каждая в гугловском акселераторе. Одна преуспела, и продалась после нескольких раундов инвестирования, положим, за 30 миллионов долларов, доля каждого сооснователя составила например 4.5 миллиона долларов.

А теперь предположим, что эти же сооснователи сидели в Гугле и спокойно работали по 8 часов в день над теми же проектами, только под присмотром Гугловских менеджеров вместо менторов акселератора. 2 проекта менеджеры закрыли, один взлетел. Все 9 человек получили по 1.5 миллиона долларов каждый.

То есть Гугл просто хеджировал риски и перераспределил прибыль везунчиков равномерно между всеми 9 программистами.

Но что-то мне подсказывает, что сооснователем стартапа я бы хотел быть, а добросовестно писать код, будучи линейным сотрудником Гугла - нет.

Предположим, что фишка стартапов не в технологии, а в бизнес-модели, то есть ежедневная работа программистов состоит в одном и том же - КРУДы писать. Тогда в чем разница? В системе мотивации.

Линейному работнику гаранитровано вознаграждение от повременной работы и его могут только наказать, если он проседает.

Стартапщик же испытывает положительную мотивацию от мысли о возможном успехе и отрицательную от страха все запороть. Плюс, стартапщик еще может гордиться тем, что он - первопроходец в чем-то, ему в будущем приятно будет вспомнить, какой он был молодец, как здорово поработал когда-то.
О докладах 7 февраля:

Про доклад DeepMind AlphaFold в EMBL-EBI:
https://borisburkov.net/blog/2019-02-07-1

Про доклады Amazon Alexa в Amazon Research Cambridge:
https://borisburkov.net/blog/2019-02-07-2
Continuous Integration/Continuous Delivery (CI/CD)

Я на прошлой неделе ненароком снес сервер, хостивший мой персональный сайт (borisburkov.net), так что вчера вновь был вынужден заняться обзором CI/CD-решений, чтобы его воскресить. Этих решеий по-моему уже сотни, а толку все равно никакого...

На всякий случай, еще одна копия моего сайта хостится непосредственно гитхабом (BurkovBA.github.io).

На днях я разговаривал с товарищем, который много по долгу службы общался с техподдержкой популярнейшего облачного Continuous Integration-сервиса Travis CI и стал их большим фанатом, поскольку они хорошие ребята.

Так вот, недавно их купил какой-то стратегический инвестор (https://www.crunchbase.com/organization/travis-ci#section-recent-news-activity) и в первый же месяц уволил половину сотрудников, даже не сообщив об этом их линейным менеджерам. Так что, по-видимому, Трэвис все =(

А я между тем хочу сказать, что все эти CI/CD может и CI, но ни одно из них нифига не CD.

После надоевшего всем Дженкинса я уже перепробовал GoCD, Github Actions и вот теперь CircleCI, и ни один из них мне так и не нравится.

Concourse еще посмотреть, говорите?
Здравствуйте, мои дорогие дата сайнтисты. Решите задачку о динамике вас и вашей карьеры во времени.

На свете около 10 тысяч исследователей машинного обучения и около миллиона индустриальных дата-сайнтистов. Стало быть, на то, чтобы внедрить в продакшн открытие одного машиниста-исследователя, уходит где-то 100 индустриальных машинистов (потому что всякие банки имеют свои заморочки с безопасностью данных, и просто один раз написать одно общее API на каждую технологию и потом его повторно использовать не выйдет - модели придется в каждом банке писать по новой).

Предположим, что каждый десятый индустриальный дата-сайнтист/дата-инженер чутка шарит за науку, хочет быть не хуже исследователей (которые вроде бы лучше и важнее) и мечтает за 5 лет заработать на всю оставшуюся жизнь в своей индустрии и сам начать заниматься исследованиями (на исчезающе низкую з/п, но ему пофиг, он уже накопил и хочет поработать в науке потому что приятно никому не подчиняться и потому что чувствует, что в этом есть какая-то миссия).

При этом если исследователей машинки станет не 10, а 20 тысяч, то пренебрегая падением их качества с ростом количества, можем предположить, что число делаемых ими открытий тоже примерно удвоится (или нет - интересно, какова зависимость количества практически значимых открытий от количества исследователей? Еще хотелось бы понять, какова зависимость спроса на индустриальных дата-сайнтистов от численности исследователей машинки?).

Это должно привести в свою очередь к еще большему росту спроса индустрии на новых дата-сайнтистов для внедрения этих новых открытий.

Вопрос: как тогда будут распределены популяции исследователей машинки и индустриальных дата-сайнтистов через 5 лет?
Поступило мнение, что падение качества исследований машинистов с ростом их числа будет значительным. На первый взгляд, да, а на второй - может и нет, я не знаю:

Берем лес знаний всего человечества, и на нем отмечаем знания каждого отдельного исследователя машинки. Площадь знаний одного человека мала, лимитирована его продолжительностью жизни и большинство знаний очень сильно повторяются между людьми. Скажем, тот кусок знаний, что покрыт курсом Эндрю Ына будут знать все 10 тысяч человек. А теорию категорий из них знают, к примеру, только 2 тысячи. А топологию - только тысяча.

Теперь, стало быть, новые открытия каждой группы могут быть только новыми листьями этого графа. Окажется, что зачастую новые открытия будут делать вовсе не AI-профессионалы, а прибежавшие из других областей ребята с другим бэкграундом, потому что машинисты будут топтаться по одному и тому же поддереву, а настоящий свежак - где-то в стороне от этой столбовой дороги.