✍️ Независимые исследователи и аналитики ОВД-Инфо признали седьмой созыв Госдумы самым «продуктивным» — несмотря на сокращения заседаний в пандемию.
По статистике, каждый созыв Госдумы принимает больше законов и работает быстрее. Яркий пример — в марте 2020 года «коронавирусные поправки» к статье 236 УК прошли все три чтения за один день, обсуждения заняли меньше десяти минут. Закон вступил в силу через неделю после того, как его законопроект внесли в Госдуму.
Депутаты седьмого созыва приняли 2673 закона — больше, чем кто-либо раньше. Из них только два закона в итоге отклонил президент.
По статистике, каждый созыв Госдумы принимает больше законов и работает быстрее. Яркий пример — в марте 2020 года «коронавирусные поправки» к статье 236 УК прошли все три чтения за один день, обсуждения заняли меньше десяти минут. Закон вступил в силу через неделю после того, как его законопроект внесли в Госдуму.
Депутаты седьмого созыва приняли 2673 закона — больше, чем кто-либо раньше. Из них только два закона в итоге отклонил президент.
Подборка лучших материалов 2021 года
По традиции 31 декабря мы публикуем подборку лучших материалов уходящего года 🎅.
• Спецпроект «WWW вместо СССР». К 30-летию крушения Советского Союза «Системный Блокъ» сделал свой первый большой спецпроект. Мы рассказали о трёх постсоветских десятилетиях через историю IT и интернета. Кстати, вместе со спецпроектом вышел тест, где можно проверить, хорошо ли вы помните новейшую историю IT.
• Блог-пост года: сбитые самолеты, русские стихи и другие жестокие вещи. Авторские блоги — еще одна инновация 2021 года. Блоги ведут эксперты, которые разбираются в том, что нам интересно: от цифровых исследований литературы до биологии. Цифровой стиховед Артем Шеля рассказал, как «ошибка выжившего» влияет на филологические исследования и почему дошедшие до нас стихи — это «бомбардировщик, выбравшийся из зенитного огня истории».
• Тьюториал: как превратить текст в генеалогическое древо с помощью Python. Здесь мы рассказываем, как автоматизировать довольно сложную процедуру — визуализацию генеалогического древа по текстовому описанию. Собрать такую штуку на Python оказывается довольно легко — благодаря использованию готовых библиотек для NLP и отрисовки графов.
• Визуализация года: как инвалидность оказывается токсичной в глазах HR-алгоритмов. Алгоритмы отбора кандидатов считают «токсичными» упоминания глухоты, слепоты и других физических ограничений. Это может стать большой проблемой в эпоху, когда роботы заменят людей в качестве первой линии HR-рекрутеров.
• Цифровая история года: что показывает сетевой анализ византийских писем. Мы рассказали о том, как математическая теория графов (network theory) помогает историку-медиевисту опознать разобщённость элит, за которой последовал политический кризис.
• Тест: кто такой педель и как получить матпомощь в XIV веке? В этом году мы сделали сложный тест, в котором вы можете проверить знания об университетской жизни в Средневековье. А быть студентом в Средние века — это вам не с айфона шпоры списывать.
• Шуточный тест года: какой ты цифровой гуманитарий? Здесь можно узнать, на кого из известных деятелей цифровых гуманитарных исследований вы похожи. И заодно узнать что-то об их удивительных биографиях.
• Дата-журналистика года: исследование зарплат российских учителей. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Наш автор — дата-журналист Артур Хисматуллин — собрал и визуализировал статистику по доходам и рабочей нагрузке учителей, чтобы показать, что до мировых стандартов среднего класса все это точно не дотягивает.
• MVP года: определяем дату написания картины онлайн без регистрации и СМС. Авторы этой статьи — студенты МИСиС, которые разработали систему датировки картин на нейросетях. Их разработка умеет определять дату как для известных полотен вроде «Звездной ночи» или «Мона Лизы», так и для картин малоизвестных художников. Читайте у нас о принципах работы сервиса.
• Аудио: почему искусственный интеллект врёт и как его от этого отучить? В выпуске подкаста «Неопознанный искусственный интеллект» с Давидом Дале (Сколтех, экс-Яндекс) сочетаются истории из жизни датасаентистов, популярный рассказ о раскрученных технологиях вроде GPT-3, а также весьма глубокие рассуждения о науке и ИИ будущего.
• Видео года: «Мы — Системный Блокъ». Если вам интересно, кто делает наше абсолютно волонтерское и некоммерческое издание, что движет этими людьми и какие у нас планы на будущее — смотрите этот ролик.
• Оцифровка года: проект «Пишу тебе». Под конец вспомним о том, с чего начался 2021 год для команды «Системного Блока». Мы запустили собственный проект по оцифровке культурного наследия под названием «Пишу тебе». В этом проекте мы собираем, расшифровываем и публикуем в открытом доступе старые почтовые открытки. В нашей коллекции уже больше 3 тысяч открыток.
А если вы просто хотите стать частью команды «Системного Блока» — то заполните эту форму. В будущем году мы сделаем еще больше классных штук — и вы можете внести вклад в общее дело. Присоединяйтесь!
С Новым годом! 🥂
По традиции 31 декабря мы публикуем подборку лучших материалов уходящего года 🎅.
• Спецпроект «WWW вместо СССР». К 30-летию крушения Советского Союза «Системный Блокъ» сделал свой первый большой спецпроект. Мы рассказали о трёх постсоветских десятилетиях через историю IT и интернета. Кстати, вместе со спецпроектом вышел тест, где можно проверить, хорошо ли вы помните новейшую историю IT.
• Блог-пост года: сбитые самолеты, русские стихи и другие жестокие вещи. Авторские блоги — еще одна инновация 2021 года. Блоги ведут эксперты, которые разбираются в том, что нам интересно: от цифровых исследований литературы до биологии. Цифровой стиховед Артем Шеля рассказал, как «ошибка выжившего» влияет на филологические исследования и почему дошедшие до нас стихи — это «бомбардировщик, выбравшийся из зенитного огня истории».
• Тьюториал: как превратить текст в генеалогическое древо с помощью Python. Здесь мы рассказываем, как автоматизировать довольно сложную процедуру — визуализацию генеалогического древа по текстовому описанию. Собрать такую штуку на Python оказывается довольно легко — благодаря использованию готовых библиотек для NLP и отрисовки графов.
• Визуализация года: как инвалидность оказывается токсичной в глазах HR-алгоритмов. Алгоритмы отбора кандидатов считают «токсичными» упоминания глухоты, слепоты и других физических ограничений. Это может стать большой проблемой в эпоху, когда роботы заменят людей в качестве первой линии HR-рекрутеров.
• Цифровая история года: что показывает сетевой анализ византийских писем. Мы рассказали о том, как математическая теория графов (network theory) помогает историку-медиевисту опознать разобщённость элит, за которой последовал политический кризис.
• Тест: кто такой педель и как получить матпомощь в XIV веке? В этом году мы сделали сложный тест, в котором вы можете проверить знания об университетской жизни в Средневековье. А быть студентом в Средние века — это вам не с айфона шпоры списывать.
• Шуточный тест года: какой ты цифровой гуманитарий? Здесь можно узнать, на кого из известных деятелей цифровых гуманитарных исследований вы похожи. И заодно узнать что-то об их удивительных биографиях.
• Дата-журналистика года: исследование зарплат российских учителей. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Наш автор — дата-журналист Артур Хисматуллин — собрал и визуализировал статистику по доходам и рабочей нагрузке учителей, чтобы показать, что до мировых стандартов среднего класса все это точно не дотягивает.
• MVP года: определяем дату написания картины онлайн без регистрации и СМС. Авторы этой статьи — студенты МИСиС, которые разработали систему датировки картин на нейросетях. Их разработка умеет определять дату как для известных полотен вроде «Звездной ночи» или «Мона Лизы», так и для картин малоизвестных художников. Читайте у нас о принципах работы сервиса.
• Аудио: почему искусственный интеллект врёт и как его от этого отучить? В выпуске подкаста «Неопознанный искусственный интеллект» с Давидом Дале (Сколтех, экс-Яндекс) сочетаются истории из жизни датасаентистов, популярный рассказ о раскрученных технологиях вроде GPT-3, а также весьма глубокие рассуждения о науке и ИИ будущего.
• Видео года: «Мы — Системный Блокъ». Если вам интересно, кто делает наше абсолютно волонтерское и некоммерческое издание, что движет этими людьми и какие у нас планы на будущее — смотрите этот ролик.
• Оцифровка года: проект «Пишу тебе». Под конец вспомним о том, с чего начался 2021 год для команды «Системного Блока». Мы запустили собственный проект по оцифровке культурного наследия под названием «Пишу тебе». В этом проекте мы собираем, расшифровываем и публикуем в открытом доступе старые почтовые открытки. В нашей коллекции уже больше 3 тысяч открыток.
А если вы просто хотите стать частью команды «Системного Блока» — то заполните эту форму. В будущем году мы сделаем еще больше классных штук — и вы можете внести вклад в общее дело. Присоединяйтесь!
С Новым годом! 🥂
Системный Блокъ
WWW вместо СССР: 30 лет спустя - Системный Блокъ
Специальный проект интернет-издания “Системный Блокъ” и образовательной программы по политологии PolitIQ о том, как технологии влияли на общественные
Любители пофоткать природу помогают большой науке
Международные платформы типа eBird или iNaturalist становятся всё популярнее. После регистрации на такой платформе вы делитесь своими наблюдениями за живой природой, общаетесь с единомышленниками и узнаёте что-то новое. А специалисты берут данные, накопленные «гражданской наукой», и делают на их основе настоящие исследования.
Что делают с данными, собранными любителями?
• Определяют с их помощью ареал обитания редких видов животных и растений.
• Составляют карты, визуализирующие вероятность получить укус ядовитой змеи.
• Изучают влияние урбанизации на биоразнообразие и находят проблемы на урбанизированных территориях — например, частые столкновения птиц с окнами зданий.
• Выясняют степень распространённости болезней — например, постодиплостомоза у рыб.
• Обучают нейросети распознавать животных на изображениях.
https://sysblok.ru/biologija/mne-nuzhny-tvoja-geolokacija-kamera-i-telefon-dlja-chego-uchenym-vashi-foto-ptic-i-rastenij/
Международные платформы типа eBird или iNaturalist становятся всё популярнее. После регистрации на такой платформе вы делитесь своими наблюдениями за живой природой, общаетесь с единомышленниками и узнаёте что-то новое. А специалисты берут данные, накопленные «гражданской наукой», и делают на их основе настоящие исследования.
Что делают с данными, собранными любителями?
• Определяют с их помощью ареал обитания редких видов животных и растений.
• Составляют карты, визуализирующие вероятность получить укус ядовитой змеи.
• Изучают влияние урбанизации на биоразнообразие и находят проблемы на урбанизированных территориях — например, частые столкновения птиц с окнами зданий.
• Выясняют степень распространённости болезней — например, постодиплостомоза у рыб.
• Обучают нейросети распознавать животных на изображениях.
https://sysblok.ru/biologija/mne-nuzhny-tvoja-geolokacija-kamera-i-telefon-dlja-chego-uchenym-vashi-foto-ptic-i-rastenij/
Системный Блокъ
Фотографии птиц и растений из вашего смартфона помогут гражданской науке
Что такое «гражданская наука» (citizen science)? Как определить редкий вид орхидеи? И зачем фотографировать углозубов? Читайте в новом материале СБъ
Движения глаз выдают неуверенного читателя
Исследователи Центра языка и мозга Высшей школы экономики и Городского университета Нью-Йорка применили новый метод айтрекинга к русскоязычным текстам.
Традиционные методы айтрекинга описывают локальные параметры того, как двигаются глаза читающего при чтении отдельных слов. Благодаря им мы узнали, что глаз не скользит по предложению, а скачет по словам, а ещё часто возвращается к предыдущим словам и перечитывает их.
Сканпаф (от англ. scanpath) — новый метод, который описывает глобальный рисунок чтения целых предложений в разных группах. При анализе составляется график движения глаз каждого участника исследования, сравниваются их паттерны чтения, а затем похожие паттерны объединяют в кластеры (группы) .
Что стало известно после применения сканпафа к чтению на русском языке?
• Русскоязычные подростки и молодые люди в возрасте 13-24 лет, которые живут в США и усваивают язык через родителей, читают по-разному — настолько, что их невозможно объединить в один кластер.
• Если человек быстро читает вслух, то про себя он тоже читает бегло — и наоборот.
• Дети с риском дислексии достигают беглого уровня чтения, но для этого им нужно больше времени, чем сверстникам.
https://sysblok.ru/neuroscience/ajtreking-i-skanpafy-kak-dvizhenija-glaz-vydajut-neuverennogo-chitatelja/
Исследователи Центра языка и мозга Высшей школы экономики и Городского университета Нью-Йорка применили новый метод айтрекинга к русскоязычным текстам.
Традиционные методы айтрекинга описывают локальные параметры того, как двигаются глаза читающего при чтении отдельных слов. Благодаря им мы узнали, что глаз не скользит по предложению, а скачет по словам, а ещё часто возвращается к предыдущим словам и перечитывает их.
Сканпаф (от англ. scanpath) — новый метод, который описывает глобальный рисунок чтения целых предложений в разных группах. При анализе составляется график движения глаз каждого участника исследования, сравниваются их паттерны чтения, а затем похожие паттерны объединяют в кластеры (группы) .
Что стало известно после применения сканпафа к чтению на русском языке?
• Русскоязычные подростки и молодые люди в возрасте 13-24 лет, которые живут в США и усваивают язык через родителей, читают по-разному — настолько, что их невозможно объединить в один кластер.
• Если человек быстро читает вслух, то про себя он тоже читает бегло — и наоборот.
• Дети с риском дислексии достигают беглого уровня чтения, но для этого им нужно больше времени, чем сверстникам.
https://sysblok.ru/neuroscience/ajtreking-i-skanpafy-kak-dvizhenija-glaz-vydajut-neuverennogo-chitatelja/
Системный Блокъ
Айтрекинг: как мы читаем предложения на русском
Анализ движения глаз при чтении позволяет выявить, как читают тексты носители языка, изучающие язык на разных уровнях и как на чтение влияет дислексия.
Русская классика глазами нейросети ruDALLE
Нейросетевая модель DALL E от OpenAI впечатлила мир способностью генерировать действительно адекватные и реалистичные картинки по произвольному описанию (ну хотя бы иногда). Сгенерированные этой моделью «кресла в форме авокадо» и «влюбленной редьки» многократно облетели интернет.
Недавно появился русский аналог под названием ruDALLE — и с ним (или с ней) уже тоже проделали много веселых экспериментов. Мы решили проверить, как эта модель представляет себе русскую классику. Картинки ниже — результат генерации изображений моделью ruDALLE на основе первых строк выдающихся произведений русской классической литературы. Попробуйте угадать, начала каких произведений заставили нейросеть увидеть ЭТО.
Учтите, что мы исключали посвящения, эпиграфы, перечисления героев, не относящиеся к сюжету вступления и прочее. В нашем тесте использовались именно первые строки основного текста: первых глав, действий, реплик и т.п. Как правило, именно эти строки считаются начальными в произведении, например: «Мой дядя самых честных правил» или «Я пригласил вас, господа, с тем чтобы сообщить вам пренеприятное известие».
https://sysblok.ru/test/russkaja-klassika-glazami-nejroseti-rudalle/
Нейросетевая модель DALL E от OpenAI впечатлила мир способностью генерировать действительно адекватные и реалистичные картинки по произвольному описанию (ну хотя бы иногда). Сгенерированные этой моделью «кресла в форме авокадо» и «влюбленной редьки» многократно облетели интернет.
Недавно появился русский аналог под названием ruDALLE — и с ним (или с ней) уже тоже проделали много веселых экспериментов. Мы решили проверить, как эта модель представляет себе русскую классику. Картинки ниже — результат генерации изображений моделью ruDALLE на основе первых строк выдающихся произведений русской классической литературы. Попробуйте угадать, начала каких произведений заставили нейросеть увидеть ЭТО.
Учтите, что мы исключали посвящения, эпиграфы, перечисления героев, не относящиеся к сюжету вступления и прочее. В нашем тесте использовались именно первые строки основного текста: первых глав, действий, реплик и т.п. Как правило, именно эти строки считаются начальными в произведении, например: «Мой дядя самых честных правил» или «Я пригласил вас, господа, с тем чтобы сообщить вам пренеприятное известие».
https://sysblok.ru/test/russkaja-klassika-glazami-nejroseti-rudalle/
Системный Блокъ
Русская классика глазами нейросети ruDALLE
Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями
Как работает автоматический поиск рифмы
Проводим тест-драйв на примере двух стихотворений — на русском и английском.
Искать рифмы можно через анализ последних звуков в строках, но такой способ упускает неточные рифмы и слова, произношение которых изменилось со временем. Чтобы решить проблему, в 2018 году чешский стиховед Петр Плехач предложил использовать для поиска рифм коллокации и машинное обучение.
«Системный Блокъ» решил проверить, как алгоритм справится со стихотворением Маяковского «А вы могли бы?» и 117-м сонетом Шекспира. Мы написали свою программу, используя RhymeTagger — библиотеку на Python, созданную Плехачем в 2021 году.
Спойлер: знаменитой «Лесенке» Маяковского всё-таки удалось сбить алгоритм с толку. Но несмотря на это, он смог узнать неточную рифму.
https://sysblok.ru/philology/programma-dlja-poiska-rifmy-kak-ona-rabotaet-i-kogda-lomaetsja/
Проводим тест-драйв на примере двух стихотворений — на русском и английском.
Искать рифмы можно через анализ последних звуков в строках, но такой способ упускает неточные рифмы и слова, произношение которых изменилось со временем. Чтобы решить проблему, в 2018 году чешский стиховед Петр Плехач предложил использовать для поиска рифм коллокации и машинное обучение.
«Системный Блокъ» решил проверить, как алгоритм справится со стихотворением Маяковского «А вы могли бы?» и 117-м сонетом Шекспира. Мы написали свою программу, используя RhymeTagger — библиотеку на Python, созданную Плехачем в 2021 году.
Спойлер: знаменитой «Лесенке» Маяковского всё-таки удалось сбить алгоритм с толку. Но несмотря на это, он смог узнать неточную рифму.
https://sysblok.ru/philology/programma-dlja-poiska-rifmy-kak-ona-rabotaet-i-kogda-lomaetsja/
Telegram
Системный Блокъ
Rhyme Tagger: создан инструмент для автоматической разметки рифмы
#news
Чешский стиховед Патер Плехач опубликовал библиотеку Python, предназначенную для поиска рифмы в стихотворениях.
Алгоритм рассчитывает вероятность рифмы путем анализа текста:
• …
#news
Чешский стиховед Патер Плехач опубликовал библиотеку Python, предназначенную для поиска рифмы в стихотворениях.
Алгоритм рассчитывает вероятность рифмы путем анализа текста:
• …
Идеальная формула депрессивной песни
Если вы когда-нибудь думали: «Эх, вот бы кто-то посчитал, насколько мне грустно от этой музыки!», то ваше странное желание исполнено.
Мы уже писали о том, как изменились тексты поп-песен за последние 50 лет. Но в анализе песни важны не только слова, но и мелодия.
Британская рок-группа Radiohead известна как пишущая «грустную» музыку. Поклонник группы, дата-сайентист Чарли Томпсон решил вычислить их самую депрессивную песню с помощью языка программирования R, опираясь на музыкальную и текстовую составляющую.
Ученый придумал «индекс уныния» — формулу депрессивной песни, которая усредняет показатели музыкальной позитивности, процента «грустных» слов и лирической плотности (насколько важно каждое грустное слово). В итоге самой грустной песней оказалась «True Love Waits», а самой бодрой — «15 Step» из альбома In Rainbows.
Ещё Томпсон создал Sentify — сайт, где можно визуализировать настроение песен вашего любимого исполнителя. Достаточно вбить имя любимого исполнителя, и вы увидите график настроения всех его мелодий.
https://sysblok.ru/musicology/idealnaja-formula-depressivnoj-pesni-na-primere-radiohead/
Если вы когда-нибудь думали: «Эх, вот бы кто-то посчитал, насколько мне грустно от этой музыки!», то ваше странное желание исполнено.
Мы уже писали о том, как изменились тексты поп-песен за последние 50 лет. Но в анализе песни важны не только слова, но и мелодия.
Британская рок-группа Radiohead известна как пишущая «грустную» музыку. Поклонник группы, дата-сайентист Чарли Томпсон решил вычислить их самую депрессивную песню с помощью языка программирования R, опираясь на музыкальную и текстовую составляющую.
Ученый придумал «индекс уныния» — формулу депрессивной песни, которая усредняет показатели музыкальной позитивности, процента «грустных» слов и лирической плотности (насколько важно каждое грустное слово). В итоге самой грустной песней оказалась «True Love Waits», а самой бодрой — «15 Step» из альбома In Rainbows.
Ещё Томпсон создал Sentify — сайт, где можно визуализировать настроение песен вашего любимого исполнителя. Достаточно вбить имя любимого исполнителя, и вы увидите график настроения всех его мелодий.
https://sysblok.ru/musicology/idealnaja-formula-depressivnoj-pesni-na-primere-radiohead/
Telegram
Системный Блокъ
Как изменились тексты поп-песен за последние 50 лет
#society #arts
Поп-музыка — практически неограниченное пространство для исследователя. Можно изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин, но самый простой…
#society #arts
Поп-музыка — практически неограниченное пространство для исследователя. Можно изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин, но самый простой…
Что говорит о дневниках 1917 года анализ данных
«Системный Блокъ» выяснил, что волновало участников событий и о чем писали газеты.
Восстания, Первая мировая война, броневики, голод, бедность… И в это же время Русские сезоны, последняя выставка Бубнового валета и «Смутное» Кандинского. За бешеным калейдоскопом событий 1917 года стояли живые люди — политики, интеллигенты, генералы и другие.
Мы уже писали о проекте «1917. Свободная история», который собрал дневники больше 1500 героев. Нам было сложно удержаться от анализа такого обширного корпуса данных, и вот что из этого вышло.
Взглянем на революцию глазами очевидцев:
• Больше всего авторы писали о революции, войне и культуре, а ещё — про экзистенциальные вопросы.
• Часть тем про революцию связаны с конкретными событиями, остальные объединяют общие рассуждения о революции.
• Бедность и проблемы с продовольствием — единственная тема, которая регулярно всплывает с октября 1916 года по январь 1918-го.
https://sysblok.ru/linguistics/vperedi-sushhij-saharnyj-golod-chto-govorit-o-dnevnikah-1917-goda-analiz-dannyh/
«Системный Блокъ» выяснил, что волновало участников событий и о чем писали газеты.
Восстания, Первая мировая война, броневики, голод, бедность… И в это же время Русские сезоны, последняя выставка Бубнового валета и «Смутное» Кандинского. За бешеным калейдоскопом событий 1917 года стояли живые люди — политики, интеллигенты, генералы и другие.
Мы уже писали о проекте «1917. Свободная история», который собрал дневники больше 1500 героев. Нам было сложно удержаться от анализа такого обширного корпуса данных, и вот что из этого вышло.
Взглянем на революцию глазами очевидцев:
• Больше всего авторы писали о революции, войне и культуре, а ещё — про экзистенциальные вопросы.
• Часть тем про революцию связаны с конкретными событиями, остальные объединяют общие рассуждения о революции.
• Бедность и проблемы с продовольствием — единственная тема, которая регулярно всплывает с октября 1916 года по январь 1918-го.
https://sysblok.ru/linguistics/vperedi-sushhij-saharnyj-golod-chto-govorit-o-dnevnikah-1917-goda-analiz-dannyh/
Telegram
Системный Блокъ
Тиндер 1917 года и революция в цифре
#digitalmemory #history
Историческое знание нуждается в новых формах представления, особенно онлайн. Публичная история (public history) связывает современного человека и историю в медиапространстве, образуя активный…
#digitalmemory #history
Историческое знание нуждается в новых формах представления, особенно онлайн. Публичная история (public history) связывает современного человека и историю в медиапространстве, образуя активный…
Как Джордж Вашингтон стал эмо в ТикТок трендах
Пользователи ТикТока находят современные понятия в книгах 17-го века, и мы решили их проверить.
Пару месяцев назад в ТикТоке начали набирать сотни тысяч просмотров записи экрана с Google Books Ngram Viewer. Сайт показывает популярность слова в текстах разного времени, и любопытные находят слово «эмо» в 1803 году, а упоминание «Звёздных войн» — ещё в 1696-м.
«Системный Блокъ» решил разобраться, в чём секрет такой статистики. Причин оказалось много: от банальной многозначности слов до некорректного распознавания текста.
Например, слово emo встречается не только в англоязычных книгах, но и учебниках по латыни — там оно переводится как «покупаю». А если искать слово эмо среди русских книг, то мы увидим пик в 1820-х — но не из-за распространения романтизма, а из-за проблем с оцифровкой.
Другой пример «star wars» тоже оказался связан с оцифровкой: словосочетание из скриншота в тексте 1681 года почти невозможно разобрать.
https://sysblok.ru/philology/kak-dzhordzh-vashington-stal-jemo-google-n-grams-v-tiktok-trendah/
Пользователи ТикТока находят современные понятия в книгах 17-го века, и мы решили их проверить.
Пару месяцев назад в ТикТоке начали набирать сотни тысяч просмотров записи экрана с Google Books Ngram Viewer. Сайт показывает популярность слова в текстах разного времени, и любопытные находят слово «эмо» в 1803 году, а упоминание «Звёздных войн» — ещё в 1696-м.
«Системный Блокъ» решил разобраться, в чём секрет такой статистики. Причин оказалось много: от банальной многозначности слов до некорректного распознавания текста.
Например, слово emo встречается не только в англоязычных книгах, но и учебниках по латыни — там оно переводится как «покупаю». А если искать слово эмо среди русских книг, то мы увидим пик в 1820-х — но не из-за распространения романтизма, а из-за проблем с оцифровкой.
Другой пример «star wars» тоже оказался связан с оцифровкой: словосочетание из скриншота в тексте 1681 года почти невозможно разобрать.
https://sysblok.ru/philology/kak-dzhordzh-vashington-stal-jemo-google-n-grams-v-tiktok-trendah/
Системный Блокъ
Google Ngram Viewer в трендах ТикТока
Как пользователи ТикТока находят современные понятия в книгах XVIII века
Пушкин — сексист или всё-таки нет?
Продолжаем разбирать произведения из школьной программы через призму современных ценностей.
Мы уже рассказывали о том, какими видятся мужчины и женщины в произведениях школьной программы. Тогда в анализ текста Пушкина вошли «Евгений Онегин» и «Руслан и Людмила». Внимательные читатели заметили, что в анализе не хватает значимых произведения классика — «Повести покойного Ивана Петровича Белкина» и «Капитанской дочки» 📖
Что изменится, если мы включим эти тексты в исследование?
• Женщины по-прежнему реже участвуют в диалогах, а женским персонажам писатель уделяет меньше внимания — количество лексем женского рода в три раза меньше, чем мужского.
• Героини Пушкина оказались активнее, чем мы предполагали: в «Повестях Белкина» и «Капитанской дочке» они чаще всего возражают, кричат и ожидают — хотя в прошлый раз они только ждали, любили, плакали и знали.
• У мужских и женских персонажей одинаково активная позиция, и при этом мужчины выглядят более рациональными, а женщины — эмоциональными.
• Герои Пушкина по-прежнему много думают, но теперь они чаще велят, меньше читают и любят 💔
• Прилагательное «бедная» описывает тяжелую судьбу героинь, а если оно относится к герою — то он либо старик, либо покойный, либо материально беден.
https://sysblok.ru/philology/russkie-klassiki-seksisty-ili-vse-taki-net-korpusnyj-analiz-teksta-pushkina/
Продолжаем разбирать произведения из школьной программы через призму современных ценностей.
Мы уже рассказывали о том, какими видятся мужчины и женщины в произведениях школьной программы. Тогда в анализ текста Пушкина вошли «Евгений Онегин» и «Руслан и Людмила». Внимательные читатели заметили, что в анализе не хватает значимых произведения классика — «Повести покойного Ивана Петровича Белкина» и «Капитанской дочки» 📖
Что изменится, если мы включим эти тексты в исследование?
• Женщины по-прежнему реже участвуют в диалогах, а женским персонажам писатель уделяет меньше внимания — количество лексем женского рода в три раза меньше, чем мужского.
• Героини Пушкина оказались активнее, чем мы предполагали: в «Повестях Белкина» и «Капитанской дочке» они чаще всего возражают, кричат и ожидают — хотя в прошлый раз они только ждали, любили, плакали и знали.
• У мужских и женских персонажей одинаково активная позиция, и при этом мужчины выглядят более рациональными, а женщины — эмоциональными.
• Герои Пушкина по-прежнему много думают, но теперь они чаще велят, меньше читают и любят 💔
• Прилагательное «бедная» описывает тяжелую судьбу героинь, а если оно относится к герою — то он либо старик, либо покойный, либо материально беден.
https://sysblok.ru/philology/russkie-klassiki-seksisty-ili-vse-taki-net-korpusnyj-analiz-teksta-pushkina/
Telegram
Системный Блокъ
Какими видели женщин писатели из школьной программы?
Создательницы проекта «Толстой сексист? А Пушкин?» проанализировали 19 текстов Льва Толстого, Александра Пушкина, Владимира Набокова, Михаила Булгакова и Федора Достоевского.
Оказалось, что:
• Женщины…
Создательницы проекта «Толстой сексист? А Пушкин?» проанализировали 19 текстов Льва Толстого, Александра Пушкина, Владимира Набокова, Михаила Булгакова и Федора Достоевского.
Оказалось, что:
• Женщины…
«Мы заставили нейронную сеть креативить»
Исследователи из университетов Страсбурга, Казани и Хоккайдо придумали систему, которая поможет в поиске новых лекарств.
Еще пять лет назад использование ИИ для генерации новых молекул казалось фантастикой. Теперь же алгоритм придумывает химические реакции почти как человек, хотя иногда и фантазирует слишком сильно. Тимур Маджидов из Казанского федерального университета рассказал «Системному Блоку» об истории и работе нейросети — а заодно и о будущем химии. 🧪
Создание нейросети началось с тренировок автокодировщика на SMILES — это способ представления химических соединений с помощью буквенных строк. Полученные наборы чисел превращали в двухмерные карты и использовали для анализа пустот в химическом пространстве или предсказания свойств молекул на основе их близости.
Сейчас технология состоит из трех частей. Первая — это нейронная сеть, которая создаёт новые тексты, если дать ей прочесть много старых. Вторая часть представляет всю химическую реакцию в виде текста и кодирует информацию о реагентах, продуктах и связях в ходе реакции. Третья — это фильтр, который выкидывает уже известные или неинтересные реакции.
В будущем поиском и синтезом молекул будут заниматься химические роботы, но это только начальный этап разработки лекарств. Дальнейшие этапы — поиск безопасных вариантов, тестирование на побочную активность, испытания на животных и клинические испытания — требуют участия человека.
https://sysblok.ru/interviews/my-zastavili-nejronnuju-set-kreativit-kak-algoritmy-modelirujut-himicheskie-reakcii/
Исследователи из университетов Страсбурга, Казани и Хоккайдо придумали систему, которая поможет в поиске новых лекарств.
Еще пять лет назад использование ИИ для генерации новых молекул казалось фантастикой. Теперь же алгоритм придумывает химические реакции почти как человек, хотя иногда и фантазирует слишком сильно. Тимур Маджидов из Казанского федерального университета рассказал «Системному Блоку» об истории и работе нейросети — а заодно и о будущем химии. 🧪
Создание нейросети началось с тренировок автокодировщика на SMILES — это способ представления химических соединений с помощью буквенных строк. Полученные наборы чисел превращали в двухмерные карты и использовали для анализа пустот в химическом пространстве или предсказания свойств молекул на основе их близости.
Сейчас технология состоит из трех частей. Первая — это нейронная сеть, которая создаёт новые тексты, если дать ей прочесть много старых. Вторая часть представляет всю химическую реакцию в виде текста и кодирует информацию о реагентах, продуктах и связях в ходе реакции. Третья — это фильтр, который выкидывает уже известные или неинтересные реакции.
В будущем поиском и синтезом молекул будут заниматься химические роботы, но это только начальный этап разработки лекарств. Дальнейшие этапы — поиск безопасных вариантов, тестирование на побочную активность, испытания на животных и клинические испытания — требуют участия человека.
https://sysblok.ru/interviews/my-zastavili-nejronnuju-set-kreativit-kak-algoritmy-modelirujut-himicheskie-reakcii/
Системный Блокъ
«Мы заставили нейронную сеть креативить»: как алгоритмы моделируют химические реакции - Системный Блокъ
Учёные придумали систему, которая поможет в поиске синтеза новых лекарств. В разработке участвовали исследователи из университетов Страсбурга, Казани и Хоккайдо. Один из руководителей проекта, Тимур Маджидов из Казанского федерального университета, подробно…
Обзор блогов «Системного Блока»
Как стриминговым платформам мешает отсутствие чувства юмора, где снимают фильмы одного дубля и почему фильтры для воды покупают, даже если они плохо фильтруют воду
В новом дайджесте блогов «Системного Блока» эксперты рассуждают о судьбе гиперреалистичных персонажей из видеоигр и выборе локации для съемки цифрового кино, а наш главный редактор делится историями из жизни нашей редакции. Выбирайте:
— Способность машин обрабатывать текст или распознавать изображения нельзя считать признаком их «интеллектуальности», а более сложный ИИ — пока фантастика. Борис Орехов объясняет, что такое искусственный интеллект, как связаны машинное обучение и демократия и какое место занимают ученые из России в гонке искусственных интеллектов.
Искусственный интеллект: визионеры и инженеры
— В конце января редакция «Системного Блока» устроила оцифровочный выезд в Санкт-Петербург. За один субботний вечер в музее мы отсканировали с двух сторон 477 старых почтовых открыток. А еще мы пожили в Доме паломника, выпили пива на Невском, увернулись от сосуль и познакомились с высокоэффективными методами организации революционного террора… О наших приключениях рассказывает в своем блоге главный редактор «СБъ» Даниил Скоринкин.
Как мы оцифровали попугаев в платьях и скелетов-скайдайверов
— Многие IT-компании пытаются добиться гиперреалистичности видеоигр с помощью дополненной реальности или цифровых аватаров. В начале 90-х Мортал Комбат решил эту проблему гениально: оцифровал боевых персонажей с реальных актеров с помощью покадровой съёмки. Своими наблюдениями за тем, как изюминка легендарной видеоигры мешает продвижению серии в мире алгоритмов, делится социолог Константин Глазков.
Фаталити алгоритмов
— Незадолго до пандемии в Эрмитаже сняли пятичасовой фильм без склеек. Но в музее и раньше случались громкие съемки длинного безмонтажного кино: в 2002 году Александр Сокуров одним дублем снял фильм «Русский ковчег». Почему такие фильмы можно снимать только на цифровые камеры и в чем причина исключительной любви киношников к Эрмитажу — в новом посте Бориса Орехова.
Эрмитаж и безмонтажное кино
— Что общего между фильтрами для воды в России и зимбабвийским втулочным насосом? Социолог Константин Глазков рассказывает о том, чем японские картриджи отличаются от «обычных» и в чем секрет успеха фильтрации воды как технологии.
Не нужно знать, как устроен фильтр, чтобы пить чистую воду
Как стриминговым платформам мешает отсутствие чувства юмора, где снимают фильмы одного дубля и почему фильтры для воды покупают, даже если они плохо фильтруют воду
В новом дайджесте блогов «Системного Блока» эксперты рассуждают о судьбе гиперреалистичных персонажей из видеоигр и выборе локации для съемки цифрового кино, а наш главный редактор делится историями из жизни нашей редакции. Выбирайте:
— Способность машин обрабатывать текст или распознавать изображения нельзя считать признаком их «интеллектуальности», а более сложный ИИ — пока фантастика. Борис Орехов объясняет, что такое искусственный интеллект, как связаны машинное обучение и демократия и какое место занимают ученые из России в гонке искусственных интеллектов.
Искусственный интеллект: визионеры и инженеры
— В конце января редакция «Системного Блока» устроила оцифровочный выезд в Санкт-Петербург. За один субботний вечер в музее мы отсканировали с двух сторон 477 старых почтовых открыток. А еще мы пожили в Доме паломника, выпили пива на Невском, увернулись от сосуль и познакомились с высокоэффективными методами организации революционного террора… О наших приключениях рассказывает в своем блоге главный редактор «СБъ» Даниил Скоринкин.
Как мы оцифровали попугаев в платьях и скелетов-скайдайверов
— Многие IT-компании пытаются добиться гиперреалистичности видеоигр с помощью дополненной реальности или цифровых аватаров. В начале 90-х Мортал Комбат решил эту проблему гениально: оцифровал боевых персонажей с реальных актеров с помощью покадровой съёмки. Своими наблюдениями за тем, как изюминка легендарной видеоигры мешает продвижению серии в мире алгоритмов, делится социолог Константин Глазков.
Фаталити алгоритмов
— Незадолго до пандемии в Эрмитаже сняли пятичасовой фильм без склеек. Но в музее и раньше случались громкие съемки длинного безмонтажного кино: в 2002 году Александр Сокуров одним дублем снял фильм «Русский ковчег». Почему такие фильмы можно снимать только на цифровые камеры и в чем причина исключительной любви киношников к Эрмитажу — в новом посте Бориса Орехова.
Эрмитаж и безмонтажное кино
— Что общего между фильтрами для воды в России и зимбабвийским втулочным насосом? Социолог Константин Глазков рассказывает о том, чем японские картриджи отличаются от «обычных» и в чем секрет успеха фильтрации воды как технологии.
Не нужно знать, как устроен фильтр, чтобы пить чистую воду
Системный Блокъ
Искусственный интеллект: визионеры и инженеры - Системный Блокъ
Вопросы и ответы про искусственный интеллект, как его видят футурологи и что он представляет собой на самом деле. Вопросы и ответы про искусственный интеллект, как его видят футурологи и что он представляет собой на самом деле. Конкурируют ли за него страны…
Может ли Дарвин объяснить Конан Дойла и футуризм
В день рождения знаменитого английского натуралиста вспоминаем наш материал об эволюции в литературе.
В отличие от биологии, в филологии нет общепринятой теории эволюции литературы. Никто до конца не понимает, почему одни книги оказываются в центре внимания и становятся классикой, другие быстро забываются, а третьи так и остаются неизвестными.
Но есть те, кто пытается адаптировать теорию эволюции к анализу словесности. Рассказываем о двух подходах к объяснению эволюции литературы, один из которых придумали русские филологи еще в начале XX века.
Немного инсайтов:
• В отличие от природы, литература развивается только через скачки.
• На контрасте с теорией эволюции в литературе сильнейшим оказывается «слабейший» — тот, кто поначалу находится на периферии и не воспринимается опасным для литературных конкурентов.
• По мнению социолога литературы Франко Моретти, тексты канонизируют именно читатели, а не ученые.
https://sysblok.ru/philology/jevoljucija-literatury-mozhet-li-darvin-objasnit-konan-dojla-i-futurizm/
В день рождения знаменитого английского натуралиста вспоминаем наш материал об эволюции в литературе.
В отличие от биологии, в филологии нет общепринятой теории эволюции литературы. Никто до конца не понимает, почему одни книги оказываются в центре внимания и становятся классикой, другие быстро забываются, а третьи так и остаются неизвестными.
Но есть те, кто пытается адаптировать теорию эволюции к анализу словесности. Рассказываем о двух подходах к объяснению эволюции литературы, один из которых придумали русские филологи еще в начале XX века.
Немного инсайтов:
• В отличие от природы, литература развивается только через скачки.
• На контрасте с теорией эволюции в литературе сильнейшим оказывается «слабейший» — тот, кто поначалу находится на периферии и не воспринимается опасным для литературных конкурентов.
• По мнению социолога литературы Франко Моретти, тексты канонизируют именно читатели, а не ученые.
https://sysblok.ru/philology/jevoljucija-literatury-mozhet-li-darvin-objasnit-konan-dojla-i-futurizm/
Системный Блокъ
Эволюция литературы: может ли Дарвин объяснить Пушкина
Как соседствуют друг с другом эволюционные подходы для описания эволюции литературы: антидарвинистский vs. давринистский подходы
Как «писательский» талант влияет на карьеру депутата
Считаем KPI депутатов Госдумы и проверяем, попадают ли «эффективные» депутаты в рай или хотя бы в следующий созыв.
Шестой и седьмой созывы Государственной Думы прославились беспрецедентной активностью. Все больше депутатов становятся авторами новых законов — в седьмом созыве группа из 10+ депутатов выдвинула целых 713 принятых законов, а в пятом таких было всего 145. Эксперты объясняют это стремлением депутатов повысить свой рейтинг в партии и избраться на второй срок. Мы решили проверить, как это предположение бьется с реальностью.
В нашу выборку попали больше 1300 депутатов шестого и седьмого созыва из всех фракций. Кроме Правительства и Президента, самыми инициативными «писателями» оказались депутаты фракции «Единая Россия» — список возглавили Иванов Валерий Викторович, Водолацкий Виктор Петрович, Выборный Анатолий Борисович, Гаджиев Магомед Тажудинович, Гетта Антон Александрович. Их перу принадлежат самые резонансные законы: о поправке в Конституцию, о пенсионной реформе, о СМИ-иноагентах и об увеличении НДС.
По статистике, соавторство в большем количестве законов немного увеличивает шансы на переизбрание. Но несмотря на это, лидеры рейтинга не попали в восьмую Думы — в отличие от некоторых малоактивных коллег. Когда мы провели тест на выборке депутатов, ставших соавторами минимум 10 законопроектов, связь почти исчезла. Следовательно, в топе законотворцев большая или меньшая активность никак не повышает шансы на переход в новую Госдуму.
https://sysblok.ru/society/vydajushhiesja-pisateli-gosdumy-izuchaem-kpi-deputatov-s-pomoshhju-python/
Считаем KPI депутатов Госдумы и проверяем, попадают ли «эффективные» депутаты в рай или хотя бы в следующий созыв.
Шестой и седьмой созывы Государственной Думы прославились беспрецедентной активностью. Все больше депутатов становятся авторами новых законов — в седьмом созыве группа из 10+ депутатов выдвинула целых 713 принятых законов, а в пятом таких было всего 145. Эксперты объясняют это стремлением депутатов повысить свой рейтинг в партии и избраться на второй срок. Мы решили проверить, как это предположение бьется с реальностью.
В нашу выборку попали больше 1300 депутатов шестого и седьмого созыва из всех фракций. Кроме Правительства и Президента, самыми инициативными «писателями» оказались депутаты фракции «Единая Россия» — список возглавили Иванов Валерий Викторович, Водолацкий Виктор Петрович, Выборный Анатолий Борисович, Гаджиев Магомед Тажудинович, Гетта Антон Александрович. Их перу принадлежат самые резонансные законы: о поправке в Конституцию, о пенсионной реформе, о СМИ-иноагентах и об увеличении НДС.
По статистике, соавторство в большем количестве законов немного увеличивает шансы на переизбрание. Но несмотря на это, лидеры рейтинга не попали в восьмую Думы — в отличие от некоторых малоактивных коллег. Когда мы провели тест на выборке депутатов, ставших соавторами минимум 10 законопроектов, связь почти исчезла. Следовательно, в топе законотворцев большая или меньшая активность никак не повышает шансы на переход в новую Госдуму.
https://sysblok.ru/society/vydajushhiesja-pisateli-gosdumy-izuchaem-kpi-deputatov-s-pomoshhju-python/
Системный Блокъ
Кто из самых активных законотворцев прошел в нынешнюю Госдуму
Сравниваем списки депутатов Госдумы и выясняем, влияет ли их активность на попадание в новый созыв
Что такое геоданные
Раскладываем по полочкам географические объекты.
Мы заказываем такси и еду, строим маршруты по навигатору, отыскиваем нужные организации на картах — и все благодаря им.
Геоданные — это информация о местонахождении объектов, их точные координаты. С геоданными работает геоинформационная система (ГИС), которая похожа на слоёный пирог: каждый слой включает определенный тип объектов — реки, леса, дороги, города.
Существуют два типа представления геоданных: векторный и растровый. Векторный тип описывает объект — например, реку или дерево — с помощью геометрических фигур или математических формул. Растровый «покрывает» территорию сплошным слоем и хранит числовое значение: это может быть крутизна склона, высота над уровнем моря, тип растительности или экономические показатели. Чаще всего ГИС работает с обеими моделями.
Геоданные используют практически все. Например, городские администрации и ЖКХ применяют ГИС при планировании построек и для анализа всех жилищных коммуникаций, чтобы быстро устранить неполадки. С помощью геоданных бизнес выбирает выгодное местоположение своих офисов, а экологи могут предсказывать природные катаклизмы и содействовать их устранению.
https://sysblok.ru/glossary/chto-takoe-geodannye/
Раскладываем по полочкам географические объекты.
Мы заказываем такси и еду, строим маршруты по навигатору, отыскиваем нужные организации на картах — и все благодаря им.
Геоданные — это информация о местонахождении объектов, их точные координаты. С геоданными работает геоинформационная система (ГИС), которая похожа на слоёный пирог: каждый слой включает определенный тип объектов — реки, леса, дороги, города.
Существуют два типа представления геоданных: векторный и растровый. Векторный тип описывает объект — например, реку или дерево — с помощью геометрических фигур или математических формул. Растровый «покрывает» территорию сплошным слоем и хранит числовое значение: это может быть крутизна склона, высота над уровнем моря, тип растительности или экономические показатели. Чаще всего ГИС работает с обеими моделями.
Геоданные используют практически все. Например, городские администрации и ЖКХ применяют ГИС при планировании построек и для анализа всех жилищных коммуникаций, чтобы быстро устранить неполадки. С помощью геоданных бизнес выбирает выгодное местоположение своих офисов, а экологи могут предсказывать природные катаклизмы и содействовать их устранению.
https://sysblok.ru/glossary/chto-takoe-geodannye/
Системный Блокъ
Что такое геоданные
Рассказываем о видах геоданных, для чего они нужны и где применяются
Стимул, правда, дурачок: визуализация текстов Гражданской Обороны
Вспоминаем творчество Егора Летова к 14-летию со дня его смерти
Даже если вы не знакомы с его песнями, в вашей жизни точно была компания, назойливо распевающая «Все идет по плану». А если нет, то всегда любопытно взглянуть, как менялось творчество популярной рок-группы на разломе российской государственности.
В нашем материале мы проанализировали около 200 текстов, автором которых был Егор Летов.
https://sysblok.ru/visual/novyj-mertvyj-horoshij-vizualizacija-tekstov-grazhdanskoj-oborony/
Вспоминаем творчество Егора Летова к 14-летию со дня его смерти
Даже если вы не знакомы с его песнями, в вашей жизни точно была компания, назойливо распевающая «Все идет по плану». А если нет, то всегда любопытно взглянуть, как менялось творчество популярной рок-группы на разломе российской государственности.
В нашем материале мы проанализировали около 200 текстов, автором которых был Егор Летов.
https://sysblok.ru/visual/novyj-mertvyj-horoshij-vizualizacija-tekstov-grazhdanskoj-oborony/