Шерлок Холмс XXI века: как цифровые технологии меняют криминалистику
Сегодня метаданные, Google Maps и нейросети могут помочь раскрыть реальные преступления. Причем делать это теперь могут не только эксперты, но и пользователи соцсетей. Рассказываем об интернет-ищейках и их методах подробнее в новой статье.
🕵🏻♂️ Кто этим занимается?
Интернет-ищейки (internet sleuths) — это сообщества энтузиастов, которые используют цифровые инструменты для расследования преступлений, поиска пропавших людей и разоблачения мошенников.
В Китае этот феномен известен под интригующим названием «поиск человеческой плоти» (human flesh search engine), когда тысячи пользователей скоординировано ищут информацию о человеке через соцсети и блоги. А крупнейшее англоязычное сообщество интернет-ищеек — форум Websleuths — было создано ещё в 1999 году для обсуждения нераскрытых дел. Сегодня у него больше 240 тысяч пользователей.
🌎 Какими технологиями они пользуются?
Одни из самых популярных сервисов среди онлайн-сыщиков — Google Maps и Google Earth. Google Maps предлагает интерактивные карты и панорамы Street View, а Google Earth — детальные спутниковые снимки с возможностью анализировать изменения местности за разные годы. Чем они могут быть полезны? Например, на одном из снимков в Google Street View обнаружили мужчину, укладывающего в багажник нечто, завернутое в пакеты. Позже в таких же пакетах нашли тело пропавшего на кладбище неподалеку.
🗂️ Может, что-то ещё?
Метаданные! Например, дата и время создания файла, автор, геолокация и т.д. Сами по себе они не являются технологией, но часто именно геотеггинг становится одной из важнейших зацепок в расследовании. Яркий пример — дело Габи Петито, в котором интернет-сыщики и полиция опирались на данные социальных сетей. Когда её жених вернулся из путешествия один, пользователи обратили внимание на видео и снимки Габи из соцсетей. Они включали геотеги, даты создания, технические параметры устройств.
Интернет-ищейки проверяли алиби жениха по временным меткам и искали свидетелей. Спойлер:на видео одной женщины, которая была в парке тогда же, как раз нашёлся фургон Габи и её жениха, а затем поблизости нашлось и тело пропавшей.
🤖 А как же нейросети?
Распознавание лиц с помощью нейросетей тоже может пригодиться. Благодаря ним журналист-раследователь Майкл Колборн обнаружил на фото 65-летнюю Даниэлу Клетте, которая когда-то состояла в террористической организации «Фракция Красной Армии» (RAF). В феврале 2024 года немецкие власти её арестовали.
Ещё об одной технологии, веб-скрейпинге, узнаете из полной версии статьи. Именно веб-скрейпинг, кстати, оказался особенно важен при расследовании захвата Капитолия в 2021 году, когда погибли пять человек, были ранены десятки полицейских, а также разграблено Национальное законодательное собрание Америки.
Время чтения: 20 минут
🤖 «Системный Блокъ» @sysblok
Сегодня метаданные, Google Maps и нейросети могут помочь раскрыть реальные преступления. Причем делать это теперь могут не только эксперты, но и пользователи соцсетей. Рассказываем об интернет-ищейках и их методах подробнее в новой статье.
🕵🏻♂️ Кто этим занимается?
Интернет-ищейки (internet sleuths) — это сообщества энтузиастов, которые используют цифровые инструменты для расследования преступлений, поиска пропавших людей и разоблачения мошенников.
В Китае этот феномен известен под интригующим названием «поиск человеческой плоти» (human flesh search engine), когда тысячи пользователей скоординировано ищут информацию о человеке через соцсети и блоги. А крупнейшее англоязычное сообщество интернет-ищеек — форум Websleuths — было создано ещё в 1999 году для обсуждения нераскрытых дел. Сегодня у него больше 240 тысяч пользователей.
🌎 Какими технологиями они пользуются?
Одни из самых популярных сервисов среди онлайн-сыщиков — Google Maps и Google Earth. Google Maps предлагает интерактивные карты и панорамы Street View, а Google Earth — детальные спутниковые снимки с возможностью анализировать изменения местности за разные годы. Чем они могут быть полезны? Например, на одном из снимков в Google Street View обнаружили мужчину, укладывающего в багажник нечто, завернутое в пакеты. Позже в таких же пакетах нашли тело пропавшего на кладбище неподалеку.
🗂️ Может, что-то ещё?
Метаданные! Например, дата и время создания файла, автор, геолокация и т.д. Сами по себе они не являются технологией, но часто именно геотеггинг становится одной из важнейших зацепок в расследовании. Яркий пример — дело Габи Петито, в котором интернет-сыщики и полиция опирались на данные социальных сетей. Когда её жених вернулся из путешествия один, пользователи обратили внимание на видео и снимки Габи из соцсетей. Они включали геотеги, даты создания, технические параметры устройств.
Интернет-ищейки проверяли алиби жениха по временным меткам и искали свидетелей. Спойлер:
🤖 А как же нейросети?
Распознавание лиц с помощью нейросетей тоже может пригодиться. Благодаря ним журналист-раследователь Майкл Колборн обнаружил на фото 65-летнюю Даниэлу Клетте, которая когда-то состояла в террористической организации «Фракция Красной Армии» (RAF). В феврале 2024 года немецкие власти её арестовали.
Ещё об одной технологии, веб-скрейпинге, узнаете из полной версии статьи. Именно веб-скрейпинг, кстати, оказался особенно важен при расследовании захвата Капитолия в 2021 году, когда погибли пять человек, были ранены десятки полицейских, а также разграблено Национальное законодательное собрание Америки.
Время чтения: 20 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Цифровой Шерлок Холмс: технологии в руках сыщиков-любителей - Системный Блокъ
Когда у канадца Шона Пауэра украли MacBook, он с помощью программы для отслеживания получил фото человека, который использовал его устройство. Пауэр написал об этом в Twitter (сейчас X), и интернет-детективы, активно включившись в расследование, установили…
👍23❤🔥12🤔10❤4
Многолесый и старомозгий: как неологизмы Маяковского (не) вошли в речь
Маяковский стремился реформировать язык в разных текстах и разными способами, создавая не только новые поэтические формы, но и новые слова. В новой статье изучаем судьбу его авторских неологизмов с помощью НКРЯ.
Напомните, что за неологизмы
Слова, которые появились в языке совсем недавно и еще не успели в нем закрепиться, называются неологизмами. Ещё лет 20-25 назад такими были, например, привычный сегодня ноутбук и крутой в значении отличный. Это общеязывковые неологизмы, но бывают и авторские. Например, появлением слова влюбленность мы обязаны Николаю Карамзину. Придумывал новые слова — и очень активно — и Маяковский, но не все из них, конечно, ушли в народ.
Как создавались новые слова
Маяковский использовал как стандартные модели словообразования: префиксацию (добавление приставки), сложение (соединение основ или слов), сращение (превращение словосочетания в одно слово), аббревиацию, так и необычные. Например, часто в качестве одного из компонентов в его слова входят числительное, наречие или местоимение: у него найдутся стоугольный Гигант, стодомый содом, многолесый скат и даже всенэповское загорание. А ещё у поэта обнаружатся слова старомозгий и синеволный.
Судьба неологизмов Маяковского
Попасть в разговорную речь и литературу смогли лишь немногие неологизмы поэта. Трижды в корпусе русского языка можно обнаружить придуманное им двухметроворостый. Но есть слово, которое использовали намного более активно: особенно часто в 1940-х и 1970-х.
Что это за слово? Предлагаем вам догадаться в опросе ниже!
🤖 «Системный Блокъ» @sysblok
Маяковский стремился реформировать язык в разных текстах и разными способами, создавая не только новые поэтические формы, но и новые слова. В новой статье изучаем судьбу его авторских неологизмов с помощью НКРЯ.
Напомните, что за неологизмы
Слова, которые появились в языке совсем недавно и еще не успели в нем закрепиться, называются неологизмами. Ещё лет 20-25 назад такими были, например, привычный сегодня ноутбук и крутой в значении отличный. Это общеязывковые неологизмы, но бывают и авторские. Например, появлением слова влюбленность мы обязаны Николаю Карамзину. Придумывал новые слова — и очень активно — и Маяковский, но не все из них, конечно, ушли в народ.
Как создавались новые слова
Маяковский использовал как стандартные модели словообразования: префиксацию (добавление приставки), сложение (соединение основ или слов), сращение (превращение словосочетания в одно слово), аббревиацию, так и необычные. Например, часто в качестве одного из компонентов в его слова входят числительное, наречие или местоимение: у него найдутся стоугольный Гигант, стодомый содом, многолесый скат и даже всенэповское загорание. А ещё у поэта обнаружатся слова старомозгий и синеволный.
Судьба неологизмов Маяковского
Попасть в разговорную речь и литературу смогли лишь немногие неологизмы поэта. Трижды в корпусе русского языка можно обнаружить придуманное им двухметроворостый. Но есть слово, которое использовали намного более активно: особенно часто в 1940-х и 1970-х.
Что это за слово? Предлагаем вам догадаться в опросе ниже!
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Языковая революция Маяковского: как поэтические неологизмы (не) вошли в речь - Системный Блокъ
Владимир Маяковский — революционный поэт не только по содержанию, но и стилистически, что отражается в том числе в игре слов. Экспрессивные неологизмы поэта ярко и точно выражают авторский замысел. Но какова дальнейшая судьба этих дерзких слов? Узнать об…
🔥21👍15❤11👏1👌1
Какой из этих неологизмов, вошедших в речь, придумал Маяковский?
Anonymous Quiz
48%
Краснозвездный
7%
Промышленность
23%
Бездарь
22%
Стушеваться
🤩15🤔7😱6
Браузер от OpenAI, DeepSeek предлагает заменить текст картинками
Рассказываем, что произошло в мире ИИ за последнее время.
Браузер от OpenAI
Компания OpenAI представила браузер ChatGPT Atlas со встроенными ИИ-функциями.
Во время посещения веб-сайтов пользователь может задавать вопросы ChatGPT, который будет использовать содержимое страницы как контекст. Например, находясь на сайте отеля, у чат-бота можно узнать о ближайших достопримечательностях. Модель также способна автономно выполнять задачи вроде сборки заказа по предоставленному списку или заполнения таблиц.
Ещё одна функция — умный поиск по истории браузера. В целях безопасности агенту запрещено скачивать файлы и исполнять код. На определённых сайтах при выполнении задач систем будет требовать ручного подтверждения потенциально опасных действий — например, денежных переводов. Кроме того, пользователь может вручную запретить ChatGPT доступ к выбранным страницам.
ChatGPT Atlas доступен для пользователей Mac. Количество запросов зависит от типа подписки.
Новый способ подачи текста языковой модели от DeepSeek
Лаборатория DeepSeek предложила представлять текст для языковых моделей в виде изображения.
Обычно текст разбивают на токены — слова или их фрагменты. У этого подхода есть недостатки: одна фраза может разбиваться по-разному, качество разбиения хуже для неанглийских языков, а эффективность сжатия низкая — один токен соответствует лишь 2–3,5 символам. При обработке длинных текстов модель начинает забывать контекст, а потребление памяти растёт.
Изображения разбиваются на «визуальные» токены: картинку делят на квадраты 16×16 пикселей. Такие токены можно агрегировать, сжимая последовательность в несколько раз без потери информации.
DeepSeek применили этот подход к тексту: представили его как изображение и преобразовали в визуальные токены.
Эксперименты показали, что это позволяет уменьшить длину последовательности в 10 раз (по сравнению с текстовым представлением) без ущерба качеству. Даже при сжатии в 20 раз модель сохраняет 60% исходного качества.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время.
Браузер от OpenAI
Компания OpenAI представила браузер ChatGPT Atlas со встроенными ИИ-функциями.
Во время посещения веб-сайтов пользователь может задавать вопросы ChatGPT, который будет использовать содержимое страницы как контекст. Например, находясь на сайте отеля, у чат-бота можно узнать о ближайших достопримечательностях. Модель также способна автономно выполнять задачи вроде сборки заказа по предоставленному списку или заполнения таблиц.
Ещё одна функция — умный поиск по истории браузера. В целях безопасности агенту запрещено скачивать файлы и исполнять код. На определённых сайтах при выполнении задач систем будет требовать ручного подтверждения потенциально опасных действий — например, денежных переводов. Кроме того, пользователь может вручную запретить ChatGPT доступ к выбранным страницам.
ChatGPT Atlas доступен для пользователей Mac. Количество запросов зависит от типа подписки.
Почему это важно?
Многие компании разрабатывают продукты для автоматизации поиска и выполнения задач в интернете. Google встроила языковую модель Gemini в браузер Chrome, Perplexity выпустила ИИ-браузер Comet.
Высокий интерес к этой области объясняется тем, что люди решают огромное количество задач онлайн. Получая доступ к информации о посещаемых сайтах и действиях на них, компании лучше понимают потребности и интересы пользователей. Это открывает возможности как для улучшения продуктов, так и для монетизации.
Например, ChatGPT потенциально сможет встраивать релевантную рекламу в ответы, основываясь на контексте просматриваемой страницы. Компании также могут собирать историю взаимодействия с различными сайтами для обучения своих агентов.
Новый способ подачи текста языковой модели от DeepSeek
Лаборатория DeepSeek предложила представлять текст для языковых моделей в виде изображения.
Обычно текст разбивают на токены — слова или их фрагменты. У этого подхода есть недостатки: одна фраза может разбиваться по-разному, качество разбиения хуже для неанглийских языков, а эффективность сжатия низкая — один токен соответствует лишь 2–3,5 символам. При обработке длинных текстов модель начинает забывать контекст, а потребление памяти растёт.
Изображения разбиваются на «визуальные» токены: картинку делят на квадраты 16×16 пикселей. Такие токены можно агрегировать, сжимая последовательность в несколько раз без потери информации.
DeepSeek применили этот подход к тексту: представили его как изображение и преобразовали в визуальные токены.
Эксперименты показали, что это позволяет уменьшить длину последовательности в 10 раз (по сравнению с текстовым представлением) без ущерба качеству. Даже при сжатии в 20 раз модель сохраняет 60% исходного качества.
Почему это важно?
Исследователи уже давно пытаются заменить процесс разбиения текста на символьные токены более универсальными и надежными способами. Решение этой задачи поможет повысить качество работы LLM не в одной конкретной области, а во всех сразу, поскольку языковые модели оперируют токенами как фундаментальными строительными блоками.
Методы, позволяющие более компактно представлять текст, особенно актуальны для эффективной работы с длинными документами. Способность обрабатывать объемные тексты необходима для применения LLM в задачах анализа больших массивов данных — например, архивных материалов или кодовых баз. Кроме того, это важно для разработки ИИ-агентов, которые на каждом промежуточном шаге выполнения задачи генерируют развернутые рассуждения.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤12👍8🤔3
Большие данные Большого террора
Сегодня, накануне Дня памяти жертв политических репрессий, проходит день возвращения имен. В этот день в десятках городов России и мира читают имена погибших в годы Большого террора. Эти имена взяты из документов, которые оставила после себя бюрократическая машина, сопровождавшая репрессии. Память об уничтоженных людях хранят расстрельные списки, архивы с уголовными делами, посмертные справки о реабилитации. Теперь эта память стала цифровой. Вспоминаем, какие базы жертв репрессий существуют.
Жертвы политического террора
Сбором и оцифровкой данных о репрессиях занимается «Международный Мемориал»*: cегодня их база содержит более 3 миллионов записей с информацией о дате и месте рождения, месте проживания и работы, дате ареста и приговоре.
Это прямо здесь
География репрессий волнует многих исследователей, поэтому на основе данных «Мемориала» созданы несколько ресурсов с геопривязкой. Самый известный — московский «Это прямо здесь». Здесь можно обнаружить места массовых расстрелов, здания тюрем, лагерей и лагпунктов, захоронения расстрелянных. Всего — свыше 830 объектов.
Не только жертвы, не только репрессий
Информация есть не только о жертвах системы, но и о тех, кто в ней работал – в отдельной базе данных собрано почти 50 тысяч имен сотрудников органов государственной безопасности СССР с 1935 по 1939 годы.
Еще одна крупная база посвящена остарбайтерам — жителям оккупированных территорий СССР, перемещенных для работы в Германию и возвратившихся после войны.
Узнать подробнее об этих базах данных и о том, какие сложности возникают при их создании и дальнейшей стандартизацией информации, можно из полной версии статьи. А если вы знаете о других проектах и базах данных, которые помогают изучать тему Большого террора — расскажите о них в комментариях.
🤖 «Системный Блокъ» @sysblok
*Международный Мемориал ликвидирован решением ВС РФ 28 февраля 2022 года
Сегодня, накануне Дня памяти жертв политических репрессий, проходит день возвращения имен. В этот день в десятках городов России и мира читают имена погибших в годы Большого террора. Эти имена взяты из документов, которые оставила после себя бюрократическая машина, сопровождавшая репрессии. Память об уничтоженных людях хранят расстрельные списки, архивы с уголовными делами, посмертные справки о реабилитации. Теперь эта память стала цифровой. Вспоминаем, какие базы жертв репрессий существуют.
Жертвы политического террора
Сбором и оцифровкой данных о репрессиях занимается «Международный Мемориал»*: cегодня их база содержит более 3 миллионов записей с информацией о дате и месте рождения, месте проживания и работы, дате ареста и приговоре.
Это прямо здесь
География репрессий волнует многих исследователей, поэтому на основе данных «Мемориала» созданы несколько ресурсов с геопривязкой. Самый известный — московский «Это прямо здесь». Здесь можно обнаружить места массовых расстрелов, здания тюрем, лагерей и лагпунктов, захоронения расстрелянных. Всего — свыше 830 объектов.
Не только жертвы, не только репрессий
Информация есть не только о жертвах системы, но и о тех, кто в ней работал – в отдельной базе данных собрано почти 50 тысяч имен сотрудников органов государственной безопасности СССР с 1935 по 1939 годы.
Еще одна крупная база посвящена остарбайтерам — жителям оккупированных территорий СССР, перемещенных для работы в Германию и возвратившихся после войны.
Узнать подробнее об этих базах данных и о том, какие сложности возникают при их создании и дальнейшей стандартизацией информации, можно из полной версии статьи. А если вы знаете о других проектах и базах данных, которые помогают изучать тему Большого террора — расскажите о них в комментариях.
*Международный Мемориал ликвидирован решением ВС РФ 28 февраля 2022 года
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Большие данные Большого террора - Системный Блокъ
Каждый год 29 октября в десятках городов России и мира читают имена жертв репрессий. Эти имена взяты из документов, которые оставила после себя бюрократическая машина, сопровождавшая репрессии. Вспоминаем, какие базы жертв репрессий существуют.
🕊35❤26❤🔥10👍6💔3🥱2🤣2👎1
Российские кинофестивали в девяти карточках: что (не) изменилось после 2022
Правда ли, что западные кинорежиссеры массово бойкотируют Россию? Действительно ли на российских международных смотрах больше не показывают фильмы из США и Британии? Кто ушел совсем, а кто — только на время? Ответы на эти и другие вопросы ищите в карточках, а подробности и комментарии экспертов — в нашем материале. «Системный Блокъ» изучил, как изменилась география участников нескольких российских кинофестивалей после февраля 2022 года.
🤖 «Системный Блокъ» @sysblok
Правда ли, что западные кинорежиссеры массово бойкотируют Россию? Действительно ли на российских международных смотрах больше не показывают фильмы из США и Британии? Кто ушел совсем, а кто — только на время? Ответы на эти и другие вопросы ищите в карточках, а подробности и комментарии экспертов — в нашем материале. «Системный Блокъ» изучил, как изменилась география участников нескольких российских кинофестивалей после февраля 2022 года.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18👍5🔥5👀3
Калифорния обязывает чат-ботов сообщать, что они — ИИ
Согласно закону, если пользователь может принять бота за человека, система обязана выдать «ясное и заметное» уведомление, что это искусственный интеллект.
13 октября в Калифорнии подписали новый закон SB 243, который устанавливает правила для разработчиков «компаньон-ботов» — ИИ, имитирующих диалог с человеком.
Согласно закону, если пользователь может принять бота за человека, система обязана выдать «ясное и заметное» уведомление, что это искусственный интеллект.
По тому же закону с 2026 года разработчики должны будут отчитываться о том, как их ИИ реагирует на сообщения о суицидальных мыслях. Эти отчеты будут публиковаться на сайте офиса по предотвращению самоубийств.
🤖 «Системный Блокъ» @sysblok
Согласно закону, если пользователь может принять бота за человека, система обязана выдать «ясное и заметное» уведомление, что это искусственный интеллект.
13 октября в Калифорнии подписали новый закон SB 243, который устанавливает правила для разработчиков «компаньон-ботов» — ИИ, имитирующих диалог с человеком.
Согласно закону, если пользователь может принять бота за человека, система обязана выдать «ясное и заметное» уведомление, что это искусственный интеллект.
По тому же закону с 2026 года разработчики должны будут отчитываться о том, как их ИИ реагирует на сообщения о суицидальных мыслях. Эти отчеты будут публиковаться на сайте офиса по предотвращению самоубийств.
Почему это важно?
ИИ-компаньоны становятся все более реалистичными. Многие пользователи воспринимают таких ботов как настоящих собеседников, делятся личными данными или просят поддержки в кризисных ситуациях.
Принятый в Калифорнии закон — одна из первых попыток регулировать это направление, обозначить рамки безопасности и сделать взаимодействие с ИИ более прозрачным. Он также может повлиять на мировые практики: разработчики ИИ-систем для глобального рынка базируются в США и будут вынуждены учитывать эти ограничения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏16❤11👍9🫡5🔥3🤔2
Litmaps и Connected Papers: как нейросети помогают искать научные статьи
Современные исследователи часто сталкиваются с проблемой поиска релевантных источников. Разбираем, как нейросети могут помочь в решении этой задачи:
📎 Litmaps
— Находит статьи, связанные с вашей темой по цитированиям и ссылкам;
— Показывает самых цитируемых авторов в выбранной области;
— В платной версии есть синхронизация с Zotero, в бесплатной — поиск по DOI, названию и другим идентификаторам;
— Функция Visualize строит графики связей между работами;
— Поддерживает ручной импорт статей.
🖇️ Connected Papers
— Определяет статьи-«предшественники» и «преемники» по теме исследования;
— Есть возможность загрузки датасета.
Этот материал — часть нашего спецпроекта «ИИ-лайфхаки для вашей профессии». Подробнее о других задачах читайте в разделе «ИИ для исследователей».
Какими инструментами для поиска статей пользуетесь вы? Делитесь в комментариях.
🤖 «Системный Блокъ» @sysblok
Современные исследователи часто сталкиваются с проблемой поиска релевантных источников. Разбираем, как нейросети могут помочь в решении этой задачи:
📎 Litmaps
— Находит статьи, связанные с вашей темой по цитированиям и ссылкам;
— Показывает самых цитируемых авторов в выбранной области;
— В платной версии есть синхронизация с Zotero, в бесплатной — поиск по DOI, названию и другим идентификаторам;
— Функция Visualize строит графики связей между работами;
— Поддерживает ручной импорт статей.
🖇️ Connected Papers
— Определяет статьи-«предшественники» и «преемники» по теме исследования;
— Есть возможность загрузки датасета.
Этот материал — часть нашего спецпроекта «ИИ-лайфхаки для вашей профессии». Подробнее о других задачах читайте в разделе «ИИ для исследователей».
Какими инструментами для поиска статей пользуетесь вы? Делитесь в комментариях.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как использовать ИИ для работы — гид по нейросетям
ИИ-лайфхаки для вашей работы: узнайте, как применять искусственный интеллект для работы, исследований и автоматизации рутинных задач.
❤29🔥21👍6👏2
Что говорит о дневниках 1917 года анализ данных?
Сегодня очередная годовщина Октябрьской революции. 25 октября 1917 года (7 ноября по новому стилю), когда Россия во второй раз за год радикально сменила курс. Жизнь человека в 1917 году была чередой шокирующих неожиданностей. Что волновало в эти дни простых граждан? Какие темы поднимали в газетах? О чем думал Николай II в день отречения? Рассказываем, как анализ дневников цифровыми методам позволяют изучать историю революции.
Кратко: о чем статья?
Чтобы разобраться в мыслях современников 1917 года, необходимо учитывать их уровень жизни и образования, социальный статус.
Проанализировав их, мы выяснили, что в основном авторы дневников — люди с отличным образованием, достигшие определенного успеха в своей сфере. Поэтому интерпретации, которые можно получить на основе их текстов, отражают мысли не всего общества в тот момент, а скорее его верхнего слоя.
Среди тем, которые волновали этих людей, ожидаемо оказались революция и другие политические события. Но встречались и другие записи: о Первой мировой войне, об искусстве и об экзистенциальных вопросах.
Ключевые слова, позволившие выявить эти темы, и самые активные авторы дневников — в нашей инфографике. А подробности о том, как проводилось это исследование, — в полной версии статьи.
Время чтения: 13 минут
🤖 «Системный Блокъ» @sysblok
Сегодня очередная годовщина Октябрьской революции. 25 октября 1917 года (7 ноября по новому стилю), когда Россия во второй раз за год радикально сменила курс. Жизнь человека в 1917 году была чередой шокирующих неожиданностей. Что волновало в эти дни простых граждан? Какие темы поднимали в газетах? О чем думал Николай II в день отречения? Рассказываем, как анализ дневников цифровыми методам позволяют изучать историю революции.
Кратко: о чем статья?
Чтобы разобраться в мыслях современников 1917 года, необходимо учитывать их уровень жизни и образования, социальный статус.
Проанализировав их, мы выяснили, что в основном авторы дневников — люди с отличным образованием, достигшие определенного успеха в своей сфере. Поэтому интерпретации, которые можно получить на основе их текстов, отражают мысли не всего общества в тот момент, а скорее его верхнего слоя.
Среди тем, которые волновали этих людей, ожидаемо оказались революция и другие политические события. Но встречались и другие записи: о Первой мировой войне, об искусстве и об экзистенциальных вопросах.
Ключевые слова, позволившие выявить эти темы, и самые активные авторы дневников — в нашей инфографике. А подробности о том, как проводилось это исследование, — в полной версии статьи.
Время чтения: 13 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28❤17👍6👌3🤔2
Криминалистическая биоинформатика: как растения помогают детективам
Вы хорошо знаете, как убийц находят по их ДНК и отпечаткам пальцев, а ещё наверняка помните, что Шерлок Холмс мог легко различать образца разных почв. Не меньше расследователям могут рассказать ДНК растений или животным. В новой статье объясняем, как методы генетики помогают уголовному розыску.
🪵 Деревья-улики и травы-свидетели
Первое преступление, раскрытое с помощью анализа нечеловеческой ДНК, произошло в 1993 году в Аризоне. Преступника обличило дерево, под которым нашли жертву. Его ствол был поврежден столкновением с грузовиком, а в кузове машины подозреваемого следователи нашли плоды такого же дерева, паркинсонии.
Еще одно растение, которое выступало в суде в качестве свидетеля — птичий горец Polygonum aviculare, известный также как… трава-мурава. Убийца увез тело жертвы подальше от дома и сбросил его в ручей. На берегу рос горец, и его семена прилипли к шинам автомобиля, где их и нашли криминалисты.
Растения-потерпевшие
Анализ ДНК помогает и в тех случаях, когда жертвой оказались сами растения или животные. Оставленные на вырубке пни могут стать решающими в расследовании браконьерства: если найдутся срубленные деревья, их можно сопоставить с пнями по ДНК. Так удалось доказать вину нарушителей, уничтоживших клены в национальном парке Олимпик (Вашингтон, США), и защитить от нелегальной рубки кипарисовики на Тайване.
Иногда идентифицировать дерево можно и без ДНК: например, если удалось перехватить необработанные бревна, можно сличить спилы; но ДНК-фингерпринтинг позволяет опознать даже доски и опилки.
🌳 Перспективырасследований исследований
Индивидуальные ДНК-паттерны растений помогают искать не только убийц и браконьеров. Например, с их помощью также можно проверить сорт оливок, из которого произведено масло, или определить источник наркотиков растительного происхождения. В перспективе, если человечество не задумается о защите персональных данных растений, каждая доска и каждый в поле колосок будут иметь генетический паспорт с указанием происхождения, который невозможно подделать.
Подробнее о том, как устроены исследования ДНК-растений в криминалистике, а ещё о том, как убийцу нашли с помощью кота по кличке Снежок, узнаете из полной версии статьи.
Время чтения: 14 минут
🤖 «Системный Блокъ» @sysblok
Вы хорошо знаете, как убийц находят по их ДНК и отпечаткам пальцев, а ещё наверняка помните, что Шерлок Холмс мог легко различать образца разных почв. Не меньше расследователям могут рассказать ДНК растений или животным. В новой статье объясняем, как методы генетики помогают уголовному розыску.
🪵 Деревья-улики и травы-свидетели
Первое преступление, раскрытое с помощью анализа нечеловеческой ДНК, произошло в 1993 году в Аризоне. Преступника обличило дерево, под которым нашли жертву. Его ствол был поврежден столкновением с грузовиком, а в кузове машины подозреваемого следователи нашли плоды такого же дерева, паркинсонии.
Еще одно растение, которое выступало в суде в качестве свидетеля — птичий горец Polygonum aviculare, известный также как… трава-мурава. Убийца увез тело жертвы подальше от дома и сбросил его в ручей. На берегу рос горец, и его семена прилипли к шинам автомобиля, где их и нашли криминалисты.
Растения-потерпевшие
Анализ ДНК помогает и в тех случаях, когда жертвой оказались сами растения или животные. Оставленные на вырубке пни могут стать решающими в расследовании браконьерства: если найдутся срубленные деревья, их можно сопоставить с пнями по ДНК. Так удалось доказать вину нарушителей, уничтоживших клены в национальном парке Олимпик (Вашингтон, США), и защитить от нелегальной рубки кипарисовики на Тайване.
Иногда идентифицировать дерево можно и без ДНК: например, если удалось перехватить необработанные бревна, можно сличить спилы; но ДНК-фингерпринтинг позволяет опознать даже доски и опилки.
🌳 Перспективы
Индивидуальные ДНК-паттерны растений помогают искать не только убийц и браконьеров. Например, с их помощью также можно проверить сорт оливок, из которого произведено масло, или определить источник наркотиков растительного происхождения. В перспективе, если человечество не задумается о защите персональных данных растений, каждая доска и каждый в поле колосок будут иметь генетический паспорт с указанием происхождения, который невозможно подделать.
Подробнее о том, как устроены исследования ДНК-растений в криминалистике, а ещё о том, как убийцу нашли с помощью кота по кличке Снежок, узнаете из полной версии статьи.
Время чтения: 14 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как секвенирование ДНК растений помогает найти преступников и браконьеров
Криминалисты всё чаще анализируют ДНК растений, животных и древесины. Рассказываем, как фингерпринтинг помогает раскрывать преступления и защищать природу.
🔥33❤16👀9👏3😱2👍1
От Гумилева до Шаламова: что такое акростих, и как найти зашифрованные послания в тексте
Акростих — поджанр поэзии, который позволяет зашифровать в тексте множество посланий: от романтических до провокационных. Такие послания можно различить в первых буквах строк или предложений, которые складываются в отдельные слова или фразы. Примеры можно найти и у Николая Гумилева, и у Льюиса Кэррола. DH-исследователь Женя Дуненков создал алгоритм для автоматического поиска таких шифров в корпусе из десятков тысяч текстов русской классики. Рассказываем, что из этого вышло.
Что за алгоритм?
На первый взгляд, алгоритм поиска акростихов довольно простой. Нужно собрать по исследуемому тексту первые буквы (слов/предложений/абзацев — в зависимости от уровня поиска), нарезать из них «скользящим окном» потенциальные слова, а затем оставить только те, которые найдутся в словаре настоящих слов (о словаре ниже). Правда, так может получиться слишком много случайных совпадений. Чтобы их отфильтровать, можно искать несколько словоформ подряд, поскольку очень часто акростихи состоят из целых фраз.
Какие результаты?
Среди 72 137 текстов с az.lib.ru нашлось 1763 потенциальных акростиха. Проверить их пришлось вручную, и… к сожалению, скрытых сокровищ, про которые срочно писать во все литературоведческие журналы и ехать с ними на конференции, не нашлось. Среди интересных примеров – политическое высказывание Амфитеатрова о цензуре и акростих в рассказе «Заклинатель змей» Варлама Шаламова.
А какие перспективы?
Хотя этот случай не предложил неожиданных открытий, работу точно можно продолжить. Например, обратиться к поиску по поэтическому корпусу, новостным и публицистическим сайтам. Можно взяться за корпуса на других языках, если найти подходящий словарь (на английском с его неизменяемостью слов должно быть гораздо проще).
Подробнее о процессе работы с корпусом, найденных примерах и акростихах (а еще о мезостихах, телестихах и абецедариях!) узнаете из полной версии статьи.
Время чтения: 16 минут
🤖 «Системный Блокъ» @sysblok
Акростих — поджанр поэзии, который позволяет зашифровать в тексте множество посланий: от романтических до провокационных. Такие послания можно различить в первых буквах строк или предложений, которые складываются в отдельные слова или фразы. Примеры можно найти и у Николая Гумилева, и у Льюиса Кэррола. DH-исследователь Женя Дуненков создал алгоритм для автоматического поиска таких шифров в корпусе из десятков тысяч текстов русской классики. Рассказываем, что из этого вышло.
Что за алгоритм?
На первый взгляд, алгоритм поиска акростихов довольно простой. Нужно собрать по исследуемому тексту первые буквы (слов/предложений/абзацев — в зависимости от уровня поиска), нарезать из них «скользящим окном» потенциальные слова, а затем оставить только те, которые найдутся в словаре настоящих слов (о словаре ниже). Правда, так может получиться слишком много случайных совпадений. Чтобы их отфильтровать, можно искать несколько словоформ подряд, поскольку очень часто акростихи состоят из целых фраз.
Какие результаты?
Среди 72 137 текстов с az.lib.ru нашлось 1763 потенциальных акростиха. Проверить их пришлось вручную, и… к сожалению, скрытых сокровищ, про которые срочно писать во все литературоведческие журналы и ехать с ними на конференции, не нашлось. Среди интересных примеров – политическое высказывание Амфитеатрова о цензуре и акростих в рассказе «Заклинатель змей» Варлама Шаламова.
А какие перспективы?
Хотя этот случай не предложил неожиданных открытий, работу точно можно продолжить. Например, обратиться к поиску по поэтическому корпусу, новостным и публицистическим сайтам. Можно взяться за корпуса на других языках, если найти подходящий словарь (на английском с его неизменяемостью слов должно быть гораздо проще).
Подробнее о процессе работы с корпусом, найденных примерах и акростихах (а еще о мезостихах, телестихах и абецедариях!) узнаете из полной версии статьи.
Время чтения: 16 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Акростих: как найти зашифрованные послания в корпусе текстов русской классики
Что такое акростих, и как искать зашифрованные послания в текстах? Рассказываем об исследовании по корпусу русской классической литературы и делимся инструментами для самостоятельного анализа.
🔥24❤🔥13❤8👍5😁4💋3
ИИ-поисковик: как пользоваться Perplexity
В новом гайде объясняем, как зарегистрироваться в Perplexity и начать использовать эту нейросеть для повседневных задач и работы с научными источниками.
Что за Perplexity?
Perplexity AI — это поисковая система на основе искусственного интеллекта (ИИ). Использовать ее можно для как для обычных, так и для учебных или исследовательских задач.
Как её использовать?
Если вы хотите спросить нейросеть о чем-то повседневном (например, порекомендовать вам фильм), советуем режим быстрого поиска.
А для более сложных вопросов, связанных с исследованиями, лучше активировать режим глубокого поиска. В этом режиме нейросеть формирует ответ дольше, но с большей точностью.
Можно еще и установить дополнительный фокус — настроить Perplexity на поиск только по академическим источникам и дополнительно изучить ссылки на них.
Больше информации о возможностях нейросети и примеры запросов найдете в гайде на сайте.
Этот материал — часть нашего спецпроекта «ИИ-лайфхаки для вашей профессии». Подробнее о других задачах читайте в разделе «ИИ для исследователей».
🤖 «Системный Блокъ» @sysblok
В новом гайде объясняем, как зарегистрироваться в Perplexity и начать использовать эту нейросеть для повседневных задач и работы с научными источниками.
Что за Perplexity?
Perplexity AI — это поисковая система на основе искусственного интеллекта (ИИ). Использовать ее можно для как для обычных, так и для учебных или исследовательских задач.
Как её использовать?
Если вы хотите спросить нейросеть о чем-то повседневном (например, порекомендовать вам фильм), советуем режим быстрого поиска.
А для более сложных вопросов, связанных с исследованиями, лучше активировать режим глубокого поиска. В этом режиме нейросеть формирует ответ дольше, но с большей точностью.
Можно еще и установить дополнительный фокус — настроить Perplexity на поиск только по академическим источникам и дополнительно изучить ссылки на них.
Больше информации о возможностях нейросети и примеры запросов найдете в гайде на сайте.
Этот материал — часть нашего спецпроекта «ИИ-лайфхаки для вашей профессии». Подробнее о других задачах читайте в разделе «ИИ для исследователей».
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как использовать Perplexity
Что такое Perplexity, и как пользоваться этой нейросетью? В нашем гайде вы узнаете, как легко решать повседневные и исследовательские задачи.
🔥39❤21🥰10👍6👎1