Code Mining
932 subscribers
90 photos
4 videos
8 files
173 links
ML4Code во всей красе, анализ кода и артефактов: лицензии, уязвимости, процессы. Комментарии к актуальным и не очень новостям, аналитика, эпизодический авторский контент, мемасики.

При поддержке: ods.ai, @codescoring
По вопросам — @alsmirn
Download Telegram
Внедрение машинного обучения в IDE: опыт JetBrains

В #видоснавечер предлагаем познакомиться с крайне увлекательной лекцией нашего уважаемого подписчика, Тимофея Брыксина ;)

Тимофей Брыксин, доцент, кандидат физико-математических наук, преподаватель программы «Разработка программного обеспечения» Университета ИТМО, руководитель лаборатории Machine Learning Methods in Software Engineering в JetBrains Research.

Видео: https://www.youtube.com/watch?v=N_dn-bLxKMs

Тезисы:

На лекции мы обсудили, как IDE может быть улучшена при помощи методов машинного обучения. В качестве примера поговорили про механизм работы инструмента, используемого миллионами программистов каждый день — автодополнение кода. Разобрали то, зачем вообще разработчикам нужен подобный инструмент и какими качествами должна обладать модель машинного обучения, лежащая в его основе. Рассмотрели возможные проблемы со сбором датасета для обучения в этой задаче, а также неочевидный способ векторизации кода и событий автодополнения. В завершение лекции познакомились с несколькими текущими проектами JetBrains Research по применению машинного обучения в IDE.
🔥7🤮1
Если у кого-нибудь есть время, настроение и желание участвовать в хакатонах с призами, то мы вот обнаружили один такой. Даже немного тематичный (см. Кейс №2).

Организаторы в описании довольно странным образом объединяют понятия эффективности, трудоемкости по COCOMO и некой сложности. Что на вход-выход совсем непонятно, но почему бы и не поучаствовать и не узнать подробности.

В добавок, предлагается задачка по блокчейну и telegram-боту, и, судя по всему, призовой фонд в 500к пошарен между задачами, а там уже кто сколько наберет.

🗓 Даты хакатона: 18-20 марта 2022 года
📌 Дедлайн регистрации: 16 марта 23:59
👉 Регистрация: https://tfalliance.ru
👍2
Сегодня вечером поговорим о безопасной разработке в пилотном выпуске подкаста Python's Tail. Подключайтесь!
2
Forwarded from PiterPy Сonf Сhannel
Пилотный выпуск подкаста Python's Tail — уже сегодня, 6 апреля, 19:00 (Мск, GMT+3), прямой эфир

Тема выпуска: Безопасность цепочек поставки артефактов разработки


Открытого ПО на его основе становится всё больше. Казалось бы, много качественных проектов в сообществе — это здорово. Но есть проблема: как и в любом коде, в open source годами живут ошибки и уязвимости. Исследователи утверждают, что примерно половина python-пакетов в каталоге PyPI содержат уязвимости разных уровней.

В этом эпизоде мы пообщаемся о примерах уязвимостей и уязвимых компонентов, атаках на Software Supply Chain Management и человеческом факторе. А самое главное — о методах и средствах контроля: например, SAST и DAST & SCA.

Гости выпуска — основатель решения композиционного анализа CodeScoring Алексей Смирнов и технический руководитель Positive Technologies Владимир Кочетков.

Ведущие — Андрей Дмитриев и Илья Беда.


Кликайте на колокольчик, чтобы не пропустить эфир: https://www.youtube.com/watch?v=zhbDOqUCjJM
🔥2👍1
Как наш мозг осознает код

В нашей рубрике #видоснавечер сегодня абсолютно свежее видео с Григорием Петровым, который заглянул в гости на подкаст Python's Tail.

В видео говорится о том, как работает человеческий мозг и как эти знания можно применять для создания более читаемого кода. Про мозговой кэш, как его греть и зачем всё это нужно.

Приятного просмотра: https://youtu.be/kZmfdaEUdJk?t=23
👍5🔥2
Увернуться от рефакторинга. Или как применять инженерные метрики кода во благо?

Продолжая тематику сложности кода, продолжим докладом Алексея Смирнова про цикломатическую сложность.

В докладе раскрыты особенности измерения цикломатической сложности исходного кода, сопоставление с когнитивными метриками и иными способами измерения и оценки качества программ. Рассматриваются риски, которых можно избежать, если следить за значением цикломатической сложности смолоду: от предсказания рефакторинга и вероятности появления новых багов, до оценки сложности автоматизации тестирования и сопровождения ПО.

Доклад снабжен расчетными примерами на известных open source проектах и освещает необходимые средства автоматизации: от свободных библиотек и утилит, до применения коммерческих решений управления безопасностью и качеством разработки.

Сам доклад 40 минут, дальше беседа с пайтон сообщестом в Барнауле.

Приятного просмотра: https://youtu.be/amDn9nnXGHg
2🔥2👍1
Полезный тул binocle

Если интересно вкуривать, что происходит в бинарниках, то может быть полезной утилита binocle. При помощи инструмента можно воспринять общую картину содержимого и найти что-нибудь интересное 😏.

Можно управлять оффсетом, шагом и шириной прямоугольного выделения. Подробнее на картинке и в описании.

Написано на Rust, лицензия: Apache 2.0 AND MIT.

Короткое ревью: https://shark.fish/binocle.mp4

👀 https://github.com/sharkdp/binocle
👍4
Doomfana

В рамках хакатона, ребята напилили Doom в Графане, что было приурочено к 25й годовщине выхода Doom 64.

Юзабельно? Не очень. Но, как мы понимаем, цель не в этом :).

Подробности | Исходники

Поиграться можно тут, а повыше разрешение будет здесь.
👍2🔥2👏1
Мой опыт с резиновым мужиком. Github Copilot

Вчера вышла хорошая статейка про Copilot. Автор в красочных эпитетах описывает свой опыт и делает, на наш взгляд, правильные выводы относительно текущего стейта: "Github Copilot - это джун без тормозов" (c).

Всё предсказуемо, и понятно, что такого гламура как показывают во всевозможных ютубчиках от этого инструмента пока ждать не стоит, но это и не значит, что область нереальна или мертва.

Насладиться слогом можно здесь: https://habr.com/ru/post/666538/
👍2🔥1
Data Fest Online 3.0 🎉🎉🎉

Абсолютно внезапная для многих новость-молния, в конце недели стартует Data Fest Online, аж 3.0 версии уже.

Важное, ODS переезжает из Slack в [Matrix] и сообществу предстоит приличное обновление.

Об этом всём мы узнаем 4 июня, где помимо ананосов будет представлено огромное количество тематических направлений: Reliable ML, NLP, RecSys, PyData + MLOps, DL in Finance, etc.

CodeMining (это мы :), тоже не останется в стороне и обо всех наших задумках мы расскажем в прямом эфире на Youtube-канале ODS AI RU в эту субботу (4 июня).

Сам фест продлится с 4 июня по 26 июня, поэтому следите за обновлениями. Подробности по участию и движам здесь, на ютубчике и в telegram-канале ODS.

Доклады, нетворкинг и вот это вот всё. Урра!
🎉4👍2
Code Mining pinned a photo
Семинары-семинары!

Помимо радостной новости про Datafest, в ближайшие две недели будет ещё пара интересных семинаров от JetBrains Research, ICTL.


3 июня, 2022 (пятница)
Evolutionary Intelligence for automated test generation

О современных методах и подходах к автоматической генерации тестов.

Спикер: Pouria Derakhshanfar (TU Delft)

Тезисы & регистрация: https://www.meetup.com/ictl-seminar/events/286112645/


10 июня, 2022 (пятница)
Software readability

О сложностях и методах измерения читаемости исходного кода и почему эту метрику не надо путать со сложностью программ.

Спикер: Kirill Bochkarev (JetBrains Research, ICTL)

Тезисы & регистрация: https://www.meetup.com/ictl-seminar/events/286258310/


Рекомендуем посетить, темы отличные!
🔥4
Code Mining
Data Fest Online 3.0 🎉🎉🎉 Абсолютно внезапная для многих новость-молния, в конце недели стартует Data Fest Online, аж 3.0 версии уже. Важное, ODS переезжает из Slack в [Matrix] и сообществу предстоит приличное обновление. Об этом всём мы узнаем 4 июня, где…
Па-бам!

Датафест стартует уже через пару минут.

Следить за стримом можно здесь: https://www.youtube.com/watch?v=7A7UviE-rBg

В 13:00 будет пара слов про наш замечательный кодмайнинг и что вообще происходит, а потом, в Spatial.Chat мы проведем наши знаменитые Собеседования в Никуда в золотом составе менторов :)

О том, как подключаться к эпическому нетворкингу на целый день можно почитать здесь, а его расписание — тут.

До встречи!
👍31
Code Mining pinned «Па-бам! Датафест стартует уже через пару минут. Следить за стримом можно здесь: https://www.youtube.com/watch?v=7A7UviE-rBg В 13:00 будет пара слов про наш замечательный кодмайнинг и что вообще происходит, а потом, в Spatial.Chat мы проведем наши знаменитые…»
StackOverflow Developer Survey 2022

Тут у StackOverflow вышел обзорчик очередной. Какждый в нем найдет своё, но увлекательно посмотреть как смещается фокус у начинающих и профиков, как с точки зрения языков, так и тулинга. Также довольно интересно посмотреть, кто куда смотрит из своего огорода с точки зрения дополнительных навыков.

Облистаться тут: https://survey.stackoverflow.co/2022.
👍4
OpenSource & BugBounty

Если вы вдруг хотели попробовать позаниматься вопросами безопасности, но ваши проекты почему-то не устраивают, то в этом может помочь сервис баг баунти программ huntr.dev, который нацелен строго на Open Source.

Целая платформа и сообщество посвященное поиску уязвимостей в Open Source-пакетах. Можно поднять $$$ за найденные артефакты. Там и лидерборды и возможность пообщаться.

Есть много мировых и не только баг баунти программ, но если вы вдруг знаете именно про Open Source пакеты, будем признательны за коммент.

hackerone не предлагать ;)
🔥5
Последние месяцы мы не очень много чего писали в канал, но будем обязательно исправляться. А пока поделимся результатами последней "работы на конференциях", в рамках пропаганды композиционного анализа программного обеспечения, коим мы активно занимаемся у себя в компании :).
Forwarded from CodeScoring Updates
Наши последние выступления

А пока мы готовим очередной релиз, предлагаем посмотреть наши последние доклады о проблематике композиционного анализа программного обеспечения (да-да, тот самый Software Composition Analysis).

Highload Foundation
Безопасность цепочки поставки Open Source-компонентов
Видео | Презентация

PHDays 11
Актуальные вызовы композиционному анализу ПО
Видео | Презентация

DevOpsConf 2022
Protestware. Как много в этом слове!
Видео | Презентация
🔥5