Системный Блокъ
11.3K subscribers
290 photos
2 videos
1 file
1K links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
От периодики до личных документов: как работает контент-анализ исторических источников?

Контент-анализ — один из основных методов работы с данными на основе компьютерных вычислений. Его суть заключается в том, что информация из качественной переводится в количественную, а результаты подсчитываются. Но как возможно трансформировать воспоминания, публикации в газете или анекдоты в цифры? Рассказываем в новом материале,

Кратко: о чем статья?

Применяя метод контент-анализа к историческим документам, исследователи выделяют из массива информации повторяющиеся элементы — это могут быть словосочетания, имена, географические названия. Благодаря такому подходу можно больше узнать, например, о характере исторических личностей и даже о повседневной жизни… в советском трудовом лагере. Если для решения первой задачи можно обратиться к мемуарам и перепискам, то для второй отлично подойдет периодика.

К. А. Зингис изучила газету «Новые Соловки», которая издавалась заключенными во второй половине 1920-х гг. Для начала она выделила смысловые категории, описывающие будни заключенных: «работа», «культура», «санитария», «наука», «любовь», «женщины в лагере», «монастырь» и т. д. После – отобразила перемены в содержании газеты с помощью облака тегов, отражающего наиболее характерные (то есть часто используемые) для каждого периода слова. Это позволило наглядно проследить, как газета из пространства для творческой самореализации превратилась в инструмент идеологического воздействия.

Контент-анализ позволяет также проводить сравнительные исследования. Например, Е. А. Еремеева решила сопоставить образы, характерные для официального и неофициального юмора в советский период. Для этого она изучила советские журналы и анекдоты и выяснила, что через юмор осуществлялся диалог между народом и властью. В официальном журнале «Перец» преобладала категория «советские граждане», а неофициальный юмор чаще всего затрагивал тему «советское руководство».

О других примерах применения контент-анализа для изучении истории и о том, остается ли в таких исследованиях фактор субъективности, узнаете из полной версии статьи.

Время чтения: 7,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2913🔥7👏2
Нагугли мелодию: поисковики для музыкантов

Бывает ли у вас, что в голове засела знакомая мелодия, а название ускользает? Не беда! Рассказываем про поисковики, в которых можно сыграть фрагмент на виртуальной клавиатуре, напеть мелодию или настучать ритм!

🎹 IncipitSearch

IncipitSearch — это метапоисковик, который ищет информацию по нотным текстам, доступным в открытых базах данных. Сейчас он подключен к нескольким крупным музыкальным хранилищам, которые позволяют пользователям найти произведения классической музыки по небольшим фрагментам. Правда, придется наиграть мелодию на виртуальной клавиатуре, но хватит и совсем небольшого отрывка. Например, по девяти нотам ми-фа-соль-соль-соль-до-до-си-си поисковик легко обнаружит арию Орфея из оперы Глюка.

🎤 Musipedia

Если вы не можете наиграть произведение, попробуйте найти его в Musipedia: здесь есть целых пять вариантов поиска, включая возможность напеть или насвистеть мелодию в микрофон и настучать её ритм на клавиатуре. Плюс, спектр композиций здесь значительно шире: от сонат Бетховена до The Rolling Stones. Подробнее о Musipedia мы, кстати, писали здесь.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
32🔥16👍12🥰3🎃1
Как это будет по-русски? Цифровые технологии для изучения русского как иностранного

20 декабря 2024 года Совет Федерации одобрил закон, согласно которому дети мигрантов, не владеющие русским языком, не смогут быть зачислены в школы. Теперь иностранным ученикам нужно не только иметь документы, подтверждающие их легальное пребывание в России, но и сдавать тест на знание русского. Рассказываем, как сделать изучение изучение РКИ (русского как иностранного) интереснее и продуктивнее с помощью цифровых инструментов.

🎤 Буквы и звуки

Изучение любого языка начинается со знакомства с алфавитом и правилами чтения. Познакомиться с русским алфавитом, произношением и написанием букв поможет интерактивная таблица от проекта Russian For Everyone. В таблице к каждой букве добавлен пример со словом с выделенной ударной гласной, а также картинка, позволяющая лучше запомнить слово.

📖 Лексика и чтение

Большое значение в изучении языка имеет расширение словарного запаса, регулярное повторение выученных слов и навык чтения. Для развития этих навыков и предназначена онлайн-платформа Readlang, а сайт RussianGram облегчит понимание и чтение текста, расставив в нем все ударения.

📝 Письмо

Сайт Tobemum предлагает онлайн-генератор, где учителя и родители могут создавать прописи, адаптированные под потребности и уровень подготовки учащегося. Ученикам постарше для проверки орфографии, пунктуации, грамматики и стилистики текстов поможет онлайн-сервис Орфограммка. Программа не только выделяет ошибки, но и дает пояснения к каждой.

🎧 Аудирование

Еще один важный навык — умение воспринимать речь на слух. Сформировать его помогут подкасты от проекта Very Much Russian, слушая которые, можно одновременно учить разные слова, поговорки, шутки и песни.

☑️ Создание заданий и тестов

Одна из самых полезных программ для создания заданий и тестов — Hot Potatoes, позволяющая создавать задания в виде кроссвордов, с заполнением пропусков, тесты на установление соответствий или с выбором альтернативных и коротких ответов и упражнения с перепутанными предложениями. А создать анимированные уроки можно с помощью Animaker — это онлайн-платформа для создания видео с простым интерфейсом и возможностью конструировать своих персонажей.

Ещё больше цифровых инструментов для развития и тренировки разных языковых компетенций, а также для того, чтобы сделать уроки разнообразнее и увлекательнее, найдете в полной версии подборки.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
27👍219👏3😁2💯1
Вас слили: как личные данные утекают через онлайн-сервисы и умные устройства 

Скандалы с утечкой личных данных регулярно появляются в новостях, причем в их центре могут оказаться самые разные сайты и сервисы: от онлайн-переводчиков до умных колонок. Разбираемся, как это происходит и вспоминаем несколько показательных случаев.

🚰 Почему происходят утечки?

У утечек данных может быть несколько причин. Например, технические уязвимости: кибератаки случаются, а системы защиты не всегда срабатывают моментально. А иногда пользователи сами фактически соглашаются на потенциальную утечку, автоматически принимая условия сервиса, который оставляет за собой право сохранять и использовать загруженный контент. Ну и о недобросовестных сотрудниках, конечно, не стоит забывать.

📓 Утечки из переводчиков

В 2017 году стало известно об утечках сразу из двух крупных онлайн-переводчиков. Первым был Translate.com — платформа для перевода текстов на более чем 90 языков. Специалисты из норвежской исследовательской организации Tekna обнаружили, что тексты, переведенные с помощью Translate.com, можно найти простым поиском в Google. Многие из этих документов не были предназначены для широкой публики.

Правда, и сам Google оказался не лучше. Журналистка Свеа Эккерт и дата-сайентист Андреас Дьюс ради эксперимента создали поддельный ИИ-стартап и получили бесплатную базу данных якобы для машинного обучения. И благодаря URL-адресам Google Translate, которые хранятся в полном тексте любого запроса, они узнали о тайной операции полиции. Следователь, который работал по делу о киберпреступности, переводил через Google Translate запросы о содействии, направленные в адрес иностранных коллег.

📻 Утечки из умных колонок

В 2019 году британская газета The Guardian сообщила, что подрядчики Apple «регулярно прослушивают записи с конфиденциальной информацией» через голосового помощника Siri. Похожая история произошла и с «Алисой» ещё раньше: в 2017 году на сервисе «Яндекс.Толока» появились задания по транскрибированию коротких аудиофайлов, из содержания которых стало ясно, что это записи голосовых запросов пользователей «Яндекса».

Другие подобные утечки происходили в разное время с сайтами для редактирования текста и проверки на плагиат. О них, а также о том, можно ли защитить свои личные данные, пользуясь подобными сервисами, узнаете из полной версии статьи на сайте (спойлер: увы, общий принцип таков: если вы пользуетесь бесплатным онлайн-сервисом, вы можете быть почти уверены, что ваш текст будет использоваться для «улучшения предоставляемых услуг».)

Время чтения: 13 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2213👍12🤯4🤔1
Европейцы чуть не вымерли в последний ледниковый максимум

Что? Да! Об этом рассказали их… зубы. А теперь мы рассказываем вам.

Кратко: как так вышло?


Последний ледниковый период закончился ~11,7 тыс. лет назад, и начался голоценовый период. Предполагалось, что генетический состав европейских охотников-собирателей к тому моменту был относительно однородным на протяжении нескольких тысячелетий в Западной и Восточной Европе.

Оказалось, что разрыв был только в западной популяции, а альтернативные предковые линии не получили подтверждения после анализа данных. Западная популяция практически растворилась в восточной, и только некоторые ее представители смогли добраться до «‎убежищ» в южный землях. Можно сказать, что этот разрыв говорит о том, что западные популяции практически вымерли около 27 тыс. лет назад.

Установить это удалось благодаря разнообразию зубных рядов. Дело в том, что в восточной популяции оно сильно снизилось, а западные вариации практически исчезли. Но почему исследовали именно зубы?

Во-первых, данные о зубных признаках гораздо более многочисленны, чем любые другие типы палеобиологических данных. Во-вторых, эти признаки умеренно наследуются и по материнской, и по отцовской линии и не сильно привязаны к полу ребенка, что делает их удобными для анализа. Наконец, зубы — самая твердая ткань в организме, они имеют больше шансов сохраниться, даже если памятник поврежден и извлечь ДНК невозможно.

Правда, на некоторые загадки в истории европейской популяции этот метод ответов не дает. Подробнее о них и о том, как с этим связано изучение граветтской культуры и украшений в погребальном инвентаре, узнаете из полной версии статьи.

Время чтения: 10,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
27🔥11👍7
Что такое список Сводеша?

С каких слов начать сравнение языков? Почему «компьютер» не подойдет, но подойдет «мясо» (а «шашлык» — уже нет)? Рассказываем о списке Сводеша — инструменте, созданном американским лингвистом Моррисом Сводешем для сравнения языков.

Кратко: что это такое?

Список Сводеша — список самых распространенных, базовых лексем, который используется для оценки родства языков, как правило, внутри одной языковой семьи.
В него входят понятия, которые претендуют на культурную универсальность и наименее склонны к изменению в конкретном языке.

В первом варианте списка Сводеша, опубликованном в 1952 году, было 215 значений. В 1971 году был опубликован финальный список, состоящий из 100 значений.

При этом выбор слов для списка – процесс долгий и не всегда очевидный. Например, из слов, обозначающих названия животных, в финальный список попали «собака», «птица», «рыба» и «вошь». А вот понятия «муж» и «жена» пришлось убрать, поскольку они встречались только в 57% и 51% рассмотренных языков. Сложной оказалась и ситуация со словами, обозначающими родителей: в их основе часто лежит детский лепет (ма-ма, па-па), и во многих языках мира они будут похожи, даже если родство между языками отдаленное.

Отдельный вариант списка Сводеша есть и для жестовых языков. Примечательно, что в нем нет, например, значений для частей тела («рука», «голова») или некоторых местоимений («я», «это»). Дело в том, что в разных жестовых языках эти жесты часто похожи не из-за родства языков, а из-за логики жестовой речи, где значение «я» часто передается указыванием на себя, а значение «голова» — касанием головы.

Подробнее о списке Сводеша, его трансформациях и вариациях узнаете из полной версии текста в нашем глоссарии.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3521🔥20
Неравенство, женщины в DH и гендерная социолингвистика

Продолжаем праздновать Международный женский день! Собрали для вас подборку полезных и познавательных публикаций, в которых мы напоминаем о сферах, где все еще сохраняется неравенство, изучаем, чем занимаются DH-исследовательницы, и ищем различия между мужской и женской речью.  

👩‍💻 Женщина и программист: исследуем гендерное неравенство в IT-сфере

Несмотря на быстрый рост рынка и востребованность специалистов, проблема гендерного неравенства очень заметна в сфере IT. Мы изучили, какова доля женщин среди профессионалов в области информационных технологий, сколько девушек готовы обучаться компьютерным наукам в России и какие стереотипы ограничивают их на рынке труда.

👨🏻‍🏫 Учителя-мужчины в школе: сколько их и что они преподают

Мы проанализировали открытые данные Минпросвещения и выяснили соотношение мужчин и женщин среди учителей. Насколько силен гендерный дисбаланс в профессии, насколько ситуация различается между российскими регионами и зависит ли доля мужчин и женщин от преподаваемого предмета (спойлер: ОБЖ — самый мужской предмет, Русский язык и литература — самые женские), читайте в нашей дата-истории. 

👩🏻‍🔬 «Игнорируется и не ценится»: вклад женщин в науку через цифры

Если в сфере школьного образования женщин больше, чем мужчин, то в науке дело обстоит по-другому. Здесь женщины иногда оказываются невидимыми. Почитайте нашу статью о работе ученых из Северо-восточного университета в Бостоне и вы узнаете, с какими проблемами сталкиваются исследовательницы, когда речь идет просто об указании авторства. 

👩🏼‍🎓 От первого лица: исследовательницы о своей работе

Если проблемы гендерного неравенства вас расстраивают, почитайте наши интервью с исследовательницами гуманитарных наук. Мы говорили об искусственном интеллекте — с Татьяной Шавриной, руководительницей исследовательской команды в проекте LLAMA, о нейролингвистике — с Ольгой Драгой, директоркой Центра языка и мозга НИУ ВШЭ, о цифровизации аудиоархивов — со Светланой Подрезовой, заведующей Фонограммархивом Пушкинского Дома.

🕵🏽‍♀️ Тест: Знаете ли вы различия между мужской и женской речью

И в завершение — пройдите наш тест, основанный на результатах исследований в области гендерной социолингвистики. Из него вы узнаете, кто — мужчины или женщины — чаще использует абстрактную лексику или слова-паразиты и больше следит за правильностью речи.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
26❤‍🔥10🎉9👍3🔥2👎1🤡1
Огромная GPT, новая модель от Anthropic и OCR от Mistral

Рассказываем, что произошло в мире ИИ за последнее время.

Новая GPT — большая, человечная и дорогая

Компания OpenAI представила новую версию своей языковой модели — GPT-4.5, обновление ранее выпущенной GPT-4o. В отличие от моделей линейки «o», ориентированных на решение сложных задач в области точных наук, в GPT-4.5 сделали упор на естественность ответов и на эмоциональный интеллект — это подтверждается первыми реакциями пользователей. Также модель меньше подвержена галлюцинациям.

По словам компании, версия 4.5 — их самая большая модель на данный момент. Правда, ее размер сказался на скорости генерации ответа — она существенно медленнее GPT-4o. Кроме того, использование GPT-4.5 обходится в десятки раз дороже аналогичных моделей: стоимость обработки миллиона входных токенов составляет $75, а миллиона выходных — $150, что в 30 и 15 раз превышает стоимость GPT-4o соответственно.

Обновление Claude Sonnet

Компания Anthropic, один из главных конкурентов OpenAI, выпустила обновление своей языковой модели — Claude Sonnet 3.7.

Главным нововведением стала поддержка режима рассуждений, при котором модель генерирует длинные цепочки логических выводов, существенно повышающие качество финального ответа. В отличие от конкурентов, Anthropic не стала разрабатывать две отдельные модели — одну для быстрых ответов, другую для ответов с предварительными рассуждениями, а объединила оба режима в одной модели.

В обоих режимах Claude Sonnet 3.7 либо превосходит конкурирующие модели, либо демонстрирует сопоставимые результаты. Особенно заметное преимущество наблюдается в задачах, связанных с программированием.

Цены у Sonnet 3.7 такие же, как и прошлой версии: $3 за миллион входных токенов и $15 за миллион выходных.

Anthropic была основана выходцами из OpenAI. В качестве приоритета компания считает разработку безопасного и интерпретируемого ИИ. По заявлениям гендиректора Anthropic, появление общего искусственного интеллекта можно ожидать уже к 2027 году.

Сервис для OCR от Mistral

Французская компания Mistral представила сервис для распознавания текста на фотографиях и сканах (OCR). Модель способна распознавать не только текстовую информацию, но и таблицы, изображения, графики и формулы.

По качеству распознавания сервис Mistral превосходит аналогичные решения от Google, Microsoft и OpenAI. Особое внимание разработчики уделили мультиязычности: модель нативно поддерживает письменности на основе латиницы, кириллицы и многие азиатские системы письма.

Сервис также позволяет использовать цифровой документ в качестве промта — пользователи могут задавать модели вопросы по содержанию или извлекать из документа необходимую информацию в структурированном виде (например, в формате JSON).

Доступ к сервису предоставляется через API по цене $1 за 1000 страниц. Для клиентов, которым важна конфиденциальность данных, есть возможность развернуть модель на собственных серверах.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍15🔥8👀1
Как 3D-моделирование спасает памятники древнерусской письменности: «Corpus Inscriptionum Rossicarum»

Могут ли новые технологии помочь прочесть нечитаемую древнюю надпись на камне? Как трехмерные модели старинных надгробий, крестов, камней и эпиграфических табличек позволяют не только сохранить эти памятники в цифровой форме, но и добыть новое знание о прошлом? Знакомимся с проектом «Свод русских надписей», проблемами работы эпиграфистов и методами их решения.

Благодарим за помощь в написании материала сотрудника проекта «Свод русских надписей» Анну Зиганшину

Кратко: о чем статья?

Изучением надписей на твердых материалах в России занимаются очень давно: истоки эпиграфики (науки о таких текстах) прослеживаются ещё в в XVI-XVII веках, когда появились первые подробные описания святынь, надгробий и памятников архитектуры. А в XIX веке появились первые эпиграфические своды, куда также вошли письменные источники об изучаемых надписях. Например, черновики текстов памятников и учетные монастырские записи.

Сегодня назревает необходимость в унифицированной публикации и републикации как известных, так и ранее неизвестных памятников, а также тех, которые сохранились в ранних сведениях, но ныне утрачены. Эту задачу призван решить проект «Свод русских надписей».

Участники проекта используют для составления свода современные цифровые технологии: трехмерное моделирование — на этапе документирования объектов — и ГИС и базы данных — на этапе систематизирования учетных данных о надписях. Эти методы значительно расширяют возможности исследователя при подготовке публикации. Но работа «Свода» не кончается на моделировании — необходимо также создать высококачественные рендеры и применить к моделям алгоритмы визуализации текста. Это позволяет прочитать даже те надписи, которые не слишком хорошо сохранились или дошли до современных ученых в поврежденном виде.

Сегодня в базе «Свода» можно найти 2075 документированных плит и фрагментов от 1905 памятников, 1597 моделей памятников, 1424 подготовленные к исследованию надписи и 864 описания надписей.

Подробнее о процессах работы «Свода» и технологических горизонтах проекта можно узнать из полной версии статьи. Там же найдёте примеры древних памятников, которые изучают с помощью условных цветовых схем, рассчитанных математическими алгоритмами, и других цифровых методов.

Время чтения: 16 минут


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👍129
Технологии в Большом египетском музее: 3D-модели, VR и цифровой двойник

Большой египетский музей (The Grand Egyptian Museum, или GEM) — один из самых многообещающих долгостроев в сфере культурного наследия. Его история началась еще в 2002 году, а первым экспонатом стала 11-метровая гранитная статуя Рамзеса II, размещённая в главном холле музея с помощью виртуальной 3D-копии. Рассказываем, как цифровые инновации вписались в проектирование и строительство музея.

Кратко: что за музей?

GEM — самый большой археологический музей и самый большой музей, посвященный одной цивилизации. Официально он откроется 3 июля 2025-го, но 12 залов постоянной экспозиции уже доступны посетителям.

Цифровые технологии сопровождали музей на протяжении всего строительства, но главным новаторством в архитектурном проекте стало применение технологии digital twin. Это создание полной динамически обновляемой виртуальной модели всего музейного комплекса и его окрестностей. Благодаря ней все люди, занятые в строительстве, оставались в курсе ежедневных изменений, неизбежных для работ подобного (огромного!) размаха. Вместе с реальной постройкой рос и ее двойник.

Другие технологии призваны разнообразить опыт посетителей музея. Например, с официальным открытием в GEM должны стать доступны VR-реконструкция гробницы, 3D-модель Сфинкса и виртуальная лодочная прогулка вдоль Нила времени фараонов.

Подробнее о том, как цифровые технологии помогли сделать проекта музея менее дорогим, но более экологичным и интересным посетителю, узнаете из полной версии статьи.

Время чтения: 11,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥148👍5❤‍🔥1
Искусственный интеллект в помощь благотворительности

Технологии способны облегчить изматывающий труд благотворительных организаций: найти доноров, помочь с заявкой на грант или спрогнозировать социальные изменения. «Системный Блокъ» рассказывает, в чем цифровые интсрументы полезны в мире добрых дел и почему это сопряжено с рисками.

🤖 Как часто НКО используют ИИ?

Поворот НКО в сторону современных технологий идет не быстро, однако некоторые организации уже активно ими пользуются. Например, в 2024 году для подачи заявки на грант в Фонд Потанина ИИ использовала почти половина опрошенных НКО: искусственный интеллект помог сформулировать цели и задачи проекта, посчитать и описать качественные и количественные показатели, создать шаблон писем для партнеров.

Тем не менее, так было не всегда. Например, как в России, так и за рубежом НКО медленно осваивают технологии, редко используют современные инструменты, такие как чат-боты и искусственный интеллект.

💸 С чем ещё может помочь ИИ?

Платформа Grantable может сгенерировать текст для грантовой заявки, а для большей точности и этичности формулировок можно использовать инструмент AI Grant Writer.

Незаменимым инструментом ИИ может стать и для повышения эффективности фандрайзинга: он может выявить потенциальных крупных доноров на основе анализа данных из внешних и внутренних источников, а ещё — помочь донорам выбрать программу или организацию для пожертвования с учетом прошлых отчислений.

⚠️ Что важно учитывать?

Применение искусственного интеллекта сопряжено с определенными рисками. Например, сгенерированные изображения или видео могут вызвать недоверие к работе НКО у потенциального донора. Кроме того, для обучения качественных и полезных алгоритмов нужно большое количество хороших данных, которых в сфере НКО часто недостаточно.

Более подробно о том, с какими проблемами могут столкнуться НКО, как чат-боты способны облегчить сбор пожертвований и работу сотрудников, и почему использование ИИ в сфере благотворительности не всегда оптимально, читайте в полной версии статьи.

Время чтения: 11 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥862
Подборка про историю интернета

В новой подборке рассказываем, как писатели в начале XX века предсказали интернет, как в Советском Союзе пытались создать суверенную электронную сеть и почему советские и русские программисты стали цениться во всем мире.

Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети

1908 год. Упал Тунгусский метеорит, родился лауреат Нобелевской премии Лев Ландау, Сергей Дягилев представил Русские сезоны в Париже. А еще в этом году вышла книга Александра Богданова «Красная звезда». Фантаст описал распределенную информационную систему для сбора статистики на Марсе, которая сильно напоминает интернет.

Интернет на службе коммунизма: как СССР создавал свою электронную сеть

В 60-е гг. XX века в СССР кибернетика из лженауки стала популярной идеей. Читайте в нашем материале про утопичный проект Общегосударственной автоматизированной системы учета и обработки информации (ОГАС) для создания идеального коммунистического будущего.

Утечка в IT: как эмигранты создали бренд русского программиста

В 2007 году президент Intel Russia Стив Чейз заявил: «Если проблема нерешаема, мы передаем ее русским». Это высказывание подчеркнуло высокую репутацию российских программистов на мировом IT-рынке. Рассказываем, как советские и русские программисты стали мировым брендом.

Прокачиваем гуманитария до программиста: инструкция

И бонус! Читайте наш гайд, как из филолога, культуролога, философа — одним словом, гуманитария — стать программистом. Рассказываем, как направить себя, к чему быть готовым и какие ресурсы использовать, если вы увлеклись идеей программирования, но не знаете, с чего начать, и не уверены, сможете ли вы.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1610👍8👏2
Digital Humanities Awards 2024: две номинации «Системного Блока»

Привет, это команда «Системного Блока»! Сегодня делимся хорошими новостями, рассказываем про важную премию и обращаемся с небольшой просьбой, но обо всём по порядку!

🎉 Новости

«Системный Блокъ» номинирован на ежегодную премию DH Awards сразу в двух категориях: Best DH Resource (Лучший DH-ресурс) — за наш портал с подборкой материалов по Digital Humanities, и Best DH Data Visualization (Лучшая визуализация) — за проект «Классное чтение» о школьном литературном каноне.

🏆 Премия

DH Awards вручается ежегодно с 2012 года, это профессиональная общественная премия в области Digital Humanities. В этот раз в ней семь номинаций: от большой и, пожалуй, главной, Best DH Resource до Best Use of DH for Fun. Основная цель этой премии — популяризировать цифровые методы в гуманитарных науках и показать, насколько разными могут быть проекты в этой сфере, поскольку награды не зависят ни от языка, ни от географии, ни от темы проекта.

👉👈 Просьба

Победители премии определяются голосованием, так что у нас есть простая и очевидная просьба — если вам нравятся наши спецпроекты, пожалуйста, проголосуйте за них до 4 апреля.

А мы напомним, что на странице точки входа в DH собрали статьи, блоги, глоссарий и рекомендации экспертов в этой области. Ну а в серии материалов «Классное чтение» рассказали о том, как менялся состав зарубежной, региональной и русской литературы в школах от Октябрьской революции до наших дней.

👣 Четыре простых шага 👣

1. Открыть голосование
2. Найти и выбрать Classroom reading (Systemniy Block media) в категории BEST DH DATA VISUALIZATION
3. Найти и выбрать Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа в категории BEST DH RESOURCE
4. Отправить форму!

Спасибо, что читаете и поддерживаете ❤️

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
48🔥27🎉14👍53
На словах или на деле? Подборка про Льва Толстого в цифровой гуманитаристике!

Лев Толстой — один из самых значимых русских писателей, чье влияние выходит далеко за пределы литературы. Именно его мы упоминали в канале «Системного Блока» чаще всех остальных русских классиков в прошлом году (и едва ли что-то поменяется в этом). В новой подборке собрали для вас наши главные материалы о Толстом.

📚 Цифровые ресурсы 📚

На нашем сайте регулярно выходят статьи, в которых мы рассказываем об онлайн-архивах произведений Толстого. Например, из обзора интернет-ресурсов о писателе можно узнать о семантическом издании «Толстой Digital» и о проекте «Слово Толстого», который открывает читателю доступ к 90-томному собранию сочинений. Подробнее об этом проекте Анастасия Бонч-Осмоловская рассказала в своем интервью.

💻 Цифровые исследования 💻

Цифровые методы позволяют изучить неочевидные аспекты творчества Толстого: например, благодаря корпусной лингвистике мы можем узнать что говорит о персонажах «Войны и мира» их речь.

Векторно-семантические модели помогут изучить стиль писателя и увидеть, что слова «обожать» и «боготворить» в его текстах свидетельствуют о чувствах ложных и зыбких, а «любят» у классика по-настоящему. А изучение других глаголов подскажет, какие действия чаще характеризуют женщин и мужчин в текстах русских писателей (спойлер: в случае Толстого женщины чаще всего улыбаются и плачут, а мужчины — понимают и кричат).

😎 Бонус! Тесты 😎

Для тех, кто хочет проверить знания о Толстом (а иногда и о себе!), мы создали несколько тестов. Например такие:

Вы Лев Толстой на словах или на деле? Викторина по редким словам из корпуса текстов писателя — узнайте, насколько хорошо вы понимаете редкие слова из его произведений.

С какими героями «Войны и мира» вы говорите на одном языке? — определите, чей стиль речи вам ближе всего. 

Ещё больше наших материалов о Толстом — на его персональной странице на сайте.

😎 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍13🥰742👨‍💻1
OpenAI против китайского ИИ, новая open-source модель от Google и Mistral Small

Рассказываем, что произошло в мире ИИ за последнее время.

OpenAI против китайского ИИ

В рамках инициативы администрации Трампа AI Action Plan компания OpenAI предложила изменить правила экспорта вычислительных чипов американского производства. AI Action Plan — это инициатива, в которой могут участвовать компании, научные организации и политики, предлагая свои идеи по стратегическому развитию ИИ в США. По итогам обсуждений будет сформирована государственная политика, направленная на «укрепление позиций Америки» в глобальной конкуренции в сфере ИИ.

Вместо полного запрета экспорта чипов в некоторые страны предлагается разрешить поставки при условии, что дата-центры не будут использоваться для работы китайских моделей ИИ. Такое ограничение обусловлено опасениями OpenAI, что китайские разработки вынуждены подчиняться требованиям правительства КНР, что может привести к утечке пользовательских данных при использовании китайских моделей.

Сейчас Китай — главный конкурент США в ИИ-гонке. Китайские компании и лаборатории вносят существенный вклад в развитие ИИ за счет публикации передовых моделей и подробной технической документации в открытый доступ. Многие корпорации используют китайские модели как основу: в частности, последние языковые модели Яндекса и Т-Банка являются дообученными версиями Qwen2.5, разработанной Alibaba Group.

Gemma 3 — обновленная open-source LLM от Google

Компания Google обновила свою open-source языковую модель Gemma.

Третья версия модели доступна в четырех размерах: 1, 4, 12, 27 млрд параметров. Все модели, кроме самой маленькой, поддерживают обработку текста и изображений, версия с 1 млрд параметров умеет работать только с текстом.

По оценкам пользователей LMArena, где каждый желающий может сравнить ответы разных LLM, Gemma 3 c 27 млрд параметров опережает существенно более крупные модели DeepSeek-V3 (671 млрд), Llama 3 405B (405 млрд) и o3-mini.

Модель «из коробки» поддерживает 35 языков, при этом обучающие данные содержали данные на 140 языках. Gemma 3 доступна для коммерческого использования с некоторыми ограничениями. 

Mistral Small 3.1

Французская компания Mistral выпустила обновление своей миниатюрной языковой модели Mistral Small. Размер обновленной LLM составил 24 млрд параметров.

По заявлениям компании, в основных тестах на понимание естественного языка, умение логически рассуждать и писать код новая Mistral Small опережает Gemma 3 с 27 млрд параметров (кроме тестов на математику) и GPT-4o mini.

Из других особенностей выделяется поддержка работы с изображениями, мультиязычность (24 языка), скорость работы, а также возможность использовать модель для дальнейшего обучения режиму «рассуждений».

Модель может быть использована в коммерческих целях без ограничений.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥209👍6
Студенческое средневековье: изучаем базу данных средневековых университетов

Что мы знаем о средневековых студентах? Очень многое! Происхождение, статус и другие характеристики европейских студентов тщательно документировались, так что сегодня ученые могут создавать базы данных выпускников и преподавателей прошлого. Об одной из них — Repertorium Academicum Germanicum — рассказываем в нашем новом материале

Кратко: о чем статья?

Коллективные биографии и данные об исторических личностях позволяют составить «обобщённый социальный портрет» разных сообществ. А изучают их с помощью методов просопографии (мы уже рассказывали о них на примере Японии и Древнего Рима). Проект Repertorium Academicum Germanicum (RAG) использует эти методы для исследования средневековых университетов Европы.

Сегодня в базе можно найти данные около 62 тысяч ученых и выпускников университетов, находившихся на территории Священной Римской империи за 1250–1550 гг. (а также сведения об отдельных деятелях XVII столетия). Каждая запись содержит сведения о датах рождения и смерти, географическом и социальном происхождении, времени обучения и получении ученой степени, деятельности после окончания университета, специальности и перемещениях между университетами.  

Интерфейс сайта позволяет составлять графики и карты, чтобы изучить географию происхождения студентов или типичные маршруты их перемещений между университетами. Например, можно выяснить, что немецкие дворяне-протестанты часто приезжали учиться в Марбург, а особенно сильной тенденция стала в середине XVI в., когда у них не было возможности занимать высокие должности из-за своего вероисповедания. 

Другие опции для исследований — изучение маршрутов отдельных личностей или сетей их коммуникаций. Только за последние пять лет на материалах RAG было опубликовано более 20 исследовательских работ (включая статьи, главы в коллективных монографиях и т.д.).

Узнать подробнее о возможностях, которые предлагает эта база данных, сможете благодаря полной версии статьи.

Время чтения: 8 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27🔥24161
10 из 10: русские писатели в стиле студии Ghibli

Интернет захватила эстетика мультфильмов Миядзаки. Все из-за новой модели внутри ChatGPT, которая хорошо обрабатывает пользовательские картинки. С её помощью в стиле студии Ghibli уже нарисовали почти все знаменитые фотографии, от Сталина на берегу канала Москва-Волга до окровавленного уха Трампа. Мы тоже присоединились — и стилизовали под Миядзаки портреты 10 русских писателей и поэтов/поэтесс. Сможете угадать всех?

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
77👎22👍16😍16🤡5😁4