Х_Т ©
2.05K subscribers
137 photos
1 video
47 links
Личный уютный бложек, входить на свой страх и риск. Упарываемся по Ядерной химии и Ловленду, читаем Веббера вслух и моем руки. Обсуждаем нейросетки и статистику с математикой. Пифагору слава!
Download Telegram
Решил сегодня отпраздновать первый пост и написать тут же второй, благо Владимир из предыдущего поста не унимался и нарывался еще больше. Штош! В следующей поучительной заметке мы продолжим копаться в подноготной исследований, которые вам могут кидать в качестве пруфов своей точки зрения.

Не бойтесь отстаивать свое мнение, не поддавайтесь авторитетам! И поехали!

https://telegra.ph/Kak-statistika-prevrashchaet-korolej-v-demokratov-05-29

#математика #статистика #регрессия #плохиеданные
Please open Telegram to view this post
VIEW IN TELEGRAM
После нескольких жарких дней войны с ботами, вернёмся к основной теме канала - к заблуждениям. И сегодня у нас праздник, а именно парадоксы теории вероятностей, которые в строгом понимании даже парадоксами не являются, и это тоже парадокс. Математики угорали по пост-иронии до того, как это стало мейнстримом!

С какого начнём? С моего любимого, С парадокса дней рождений! Перекатываемся в телеграф по ссылке и читаем с наслаждением. И не забудьте помыть руки, если пришли с украинских пабликов (да, тот канал тоже считается за украинский).

https://telegra.ph/Paradoks-chetyreh-muzhikov-v-sinem-polo-06-08

#математика #теорвер #парадокс
Меня в личке попросили (в отличие от пустобрехов, я договорился раскрыть личность того, кто спросил) написать продолжение к этому посту. Попытаемся с помощью нейросетей от яндекса провернуть какую-нибудь интересную штуку. Например, попробуем узнать на сколько сильно любит т-щ Семен Уралов Россию. Да, вна нашем канале учат правильно Родину любить!

Но предупреждаю сразу, там будет много моментов, связанных с программированием, которые мы объясним максимально просто. Если интересно, то смело переходим в телеграф и наслаждаемся статьей.

https://telegra.ph/Nejroseti-i-kak-ih-primenyat-06-29

#ИИ #нейросети #геометрия #математика #блогеры
Ошибка выжившего: Почему мы все еще верим в чудеса?

Когда мы слышим истории о невероятных успехах, мы часто забываем о тех, кто не добился успеха. Это и есть ошибка выжившего. Давайте разберемся, что это такое и почему она так важна, а потом покекаем с некоторых примерчиков.

Что такое ошибка выжившего?

Ошибка выжившего — это логическая ошибка, при которой мы делаем выводы на основе тех, кто "выжил" или добился успеха, игнорируя тех, кто не достиг успеха. Это как если бы мы решили, что все программисты становятся миллиардерами, потому что знаем о Билле Гейтсе и Марке Цукерберге, но забываем о тысячах программистов, которые работают в подвалах и программируют за еду.

Примеры ошибки выжившего

1. Самолеты и дыры от пуль

Наф сэд. Укреплять надо было не те места, которые были изрешечены пулями при посадке, а все остальные, так как прочности именно им не хватало, чтобы вернуться.

2. Дельфины спасают людей

Многие слышали красивые истории о том, какие дельфины умные и спасают моряков с затонувших кораблей? Толкают их к берегу, помогают доплыть? Рассказывают это, конечно, выжившие моряки. А вот те моряки, которых дельфины уносили в открытое море, обычно не рассказывают прохладные истории. И это мы еще не касаемся других особенностей дельфинов: ни в коем случае не гуглите ничего про дельфинов, иначе ваша жизнь не будет прежней!

3. Истории успеха


Мы часто слышим истории о людях, которые бросили школу и стали миллиардерами. "Если Билл Гейтс смог, то и я смогу!" — думаем мы. Но мы забываем о миллионах людей, которые бросили школу и не стали миллиардерами. Возможно, они стали экспертами по доставке пиццы? Или аналитиками, которые уже два года не могут написать бота, который бы постил правила чата?

Как избежать ошибки выжившего?

1. Смотреть на всю картину


Не стоит делать выводы на двух-трех примерах. Стоит понимать "вес" этих примеров в генеральной совокупности. И не забывайте про негативные случаи, их тоже всегда стоит рассматривать. Помните, что всегда есть исключения, которые подтверждают правило.

2. Анализировать данные

Используйте статистику и анализ данных, чтобы принимать обоснованные решения. Именно этому мы будем тут учиться - использовать статистику в любой непонятной ситуации.

Вывод

Ошибка выжившего — это распространенная логическая ошибка, которая может привести к неверным выводам и решениям. Будьте критичны и анализируйте всю информацию, а не только истории успеха. И помните, что за каждым успешным человеком стоит множество неудач, о которых мы никогда не узнаем.

#статистика #математика
Надеюсь, дружочки-пирожочки, вы все соскучились по нашим любимым нейросеткам? И мы снова вернулись к коронной теме! Руки мы уже вымыли как следует, а теперь попробуем снова потрогать нашего любимого блогера-программиста. И снова разберем его тексты с помощью YaGPT. Примерно месяц назад я скачал большую часть его постов, и теперь будем строить аналитику над ними. И в этот раз познакомимся с бинарной классификацией!

https://telegra.ph/Nejrosetevoj-klassifikator-07-22

#ИИ #нейросети #БинарнаяКлассификация #математика #блогеры
Статистика и ложь: противодействие обману

После вскрытия нейросетками лжи и манипуляций блогера из поста выше, решил начать серию заметок полезных для не слишком погруженных в математологию людей, где мы будем разбирать техники манипулирования сознанием читателя. Научимся находить в математических исследованиях места, которые авторы пытаются замылить. Такое часто можно встретить при чтении экономических новостей, например, заметки о стоимости акций Apple и Tesla. Готовы? Тогда пристегните ремни – мы отправляемся! И первая остановка – графики.

Графики не просто инструмент анализа данных — они обладают удивительной способностью создавать визуальные иллюзии. Изменение масштаба оси Y может значительно изменить восприятие данных. Например, даже небольшой прирост в процентах может выглядеть как внушительный рост, если начать шкалу с достаточно высокого значения.

Давайте поглядим на картинку в шапке поста. Сначала взглянем на график «БЫЛО», а потом на «СТАЛО». Где рост кажется внушительным, на первом или втором графике? Как вам резкое падение почти к «нулю» в центре и на конце на втором? Выглядит угрожающе?

Но не стоит сразу записывать всех, кто использует эту технику в манипуляторы. Иногда действительно очень удобно менять масштаб, например, когда график строится для очень больших значений, такое часто можно встретить на фондовом рынке. Тем не менее, каждый должен научиться «читать» это изменение масштаба и понимать на сколько оно было уместным и не пытается кто-то вам «навязать» мысль о падении к нулю, как у нас на втором примере.

Вывод: Использование графиков с измененной шкалой Y – это не только способ визуализации данных, но и мощный инструмент воздействия на аудиторию. Эффект визуального увеличения изменений делает небольшие достижения более заметными и впечатляющими, а небольшое падение угрожающим. Именно по этой причине важно видеть этот прием, чтобы понимать не искаженное, а истинное положение дел.

P.S. Вопросик к моим читателям. Я взял данные из какого-то источника для графиков из нашего поста, но пока источник будет тайной. У него было два столбца: real и rnd. Накидайте вариантов расшифровки этих столбцов в комментариях, только чур не подглядывать!

#математика #статистика #графики #манипуляции #ложь
Этот месяц богат на вдохновления и лонгриды! Большой поклон комментаторам "зеркала", которые мотивировали меня на небольшой разбор. Хотя тема политики и военных действий не является основной для канала, но и там есть место, где можно развернуться со статистикой! Сравним же с помощью статистики два громких события для 2023 и 2024 годов: Контрнаступ ВСУ и Наступление ВС РФ.

Кроме того, хотелось бы обратить внимание, что это не окончательный анализ совершившихся событий, а второе мы сейчас наблюдаем в динамике и это далеко не конец. А если вы не согласны с моей оценкой, то добро пожаловать в комментарии!

https://telegra.ph/Statistika-nastupleniya-07-25

#статистика #математика
Парадокс береговой линии

Нахрюк ботами не удался, очередная битва осталась за нами, и наступает пора для нового математического парадокса. Сегодня речь пойдет о загадочном парадоксе береговой линии. Ну что, готовы посмеяться и узнать что-то новое? Тогда возьмем в качестве примера побережье Сахалина.

Представьте, что вы измеряете береговую линию с помощью линейки длиной в 100 км. Вы получите одну длину. Но если взять линейку длиной в 1 км, вы обнаружите, что длина увеличивается, потому что начинаете учитывать все мелкие бухты и заливы. А если взять линейку длиной в 1 метр, береговая линия станет еще длиннее! Это потому, что чем мельче измерительный инструмент, тем больше деталей вы замечаете. Природа обожает мелочи!

Давайте просто глянем на измерения с помощью линейки из гугл-карт. Сначала измерили «крупной» на картинке 1, потом увеличили масштаб на картинке 2 и заметили, что измерили не совсем точно, после чего перемерили на картинке 3 и тем самым «прибавили» еще 11 километров к изначальной и без того немаленькой цифре. И чем меньше масштаб – тем больше мы прибавим.

Этот парадокс можно сравнить с уборкой дома. Когда вы быстро убираетесь, все выглядит чистым. Но если начать убираться основательно, то заметите каждую пылинку, и уборка затянется на весь день. Так же и с береговой линией: чем подробнее измеряете, тем длиннее она становится!

Парадокс береговой линии — это веселое напоминание о том, что чем больше вникаешь в детали, тем сложнее все становится. Так что в следующий раз, когда услышите о сложностях измерений, улыбнитесь и вспомните: иногда лучше посмотреть на все шире и с улыбкой. Наш мир полон удивительных парадоксов, и это делает его еще интереснее и смешнее!

#математика #геометрия #парадокс
Вчера Дуров внезапно заявил, что стал отцом для более чем 100 детям в 12 странах мира, и мы не могли обойти эту завораживающую новость. А так как наш канал любит разные математические задачки, то предлагаю следующую: какова вероятность детям создателя нашего Телеграмма случайно найти своего братика или сестричку? Ну и немного формализуем задачу, а именно ограничимся только Россией и только 100 (прописью сотней) детей. А дальше будем опираться на данные Росстата и другие источники. Готовы? Тогда томно произносим «Oni-chan~» и приступаем к самому приятному – расчетам!

https://telegra.ph/Bratik-i-sestrichka-Durovy-07-30

#математика #теорвер #статистика #Дуров
Продолжим анализировать текущие события с помощью математики на основе экономических данных. Попытаемся в аналитику на основе нескольких цифр: 2.5 тысяч семей, 1.8 млрд и 11 млрд рублей. Что они могут означать? Заглядывайте в лонгрид по ссылке!

https://telegra.ph/Zametka-ob-ehkonomike-RF-08-08

#экономика #математика #прогноз #лонгрид
Тайна геометрической прогрессии

Лучше 1 раз увидеть, чем 100 раз услышать! Именно по этой причине мы устроили «информационный детокс» на целую неделю, а сейчас возрващаемся к вам с новыми постами. И в первом же речь пойдет о геометрической прогрессии. Почему именно о ней? У нас намечается целая серия постов, но для этой серии нам понадобится некая математическая база. Ну и давайте устроим небольшую викторину в комментариях - чему же будут посвящены следующие большие посты? Первый, кто отгадает - сможет заказать статью на любую тему (кроме запрещенных в РФ)! А пока вернемся к текущей теме.

Геометрическая прогрессия представляет собой важный математический инструмент, который находит широкое применение в различных областях науки и практики. Это последовательность чисел, где каждое следующее число получается умножением предыдущего на фиксированный множитель, который называется знаменателем прогрессии.

Формально, последовательность чисел a₁, a₂, a₃,… является геометрической прогрессией, если для любого n≥1 верно, что:
aₙ₊₁ = aₙ • r,
где r — постоянный множитель, называемый знаменателем прогрессии. Например, если начальное число равно 2 и знаменатель равен 3, то последовательность будет 2, 6, 18, 54 и так далее. Такое поведение чисел объясняет их экспоненциальный рост или спад.

Есть легенда, согласно которой шахматы были изобретены мудрецом, который принес игру к индийскому правителю и попросил за её изобретение лишь небольшое вознаграждение: положите по одному рисовому зерну на первую клетку шахматной доски, два зерна на вторую, четыре на третью и так далее, пока не будете покрывать все 64 клетки. Раджа согласился, не подозревая, что это простое вознаграждение приведет к его разорению. Когда же он увидел, что на последних клетках количество зерен стало колоссальным – более 18 триллионов, – он осознал, что это было умное применение геометрической прогрессии. Количество зерен растет по степени двойки, что демонстрирует мощь экспоненциального роста.

Теперь же поговорим о практическом применении. В области финансов геометрическую прогрессию часто используют для расчета сложных процентов. А на нашем канале очень любят сложные проценты и финансы! Если деньги размещены на счёте с процентной ставкой, которая начисляется и добавляется к основному капиталу регулярно, итоговая сумма будет расти по геометрической прогрессии. Это позволяет вычислить будущую стоимость инвестиций с учетом накопленных процентов.

В науке геометрическая прогрессия может быть использована для моделирования популяционного роста, например для милых няшных котиков. Если каждое поколение организмов их численность удваивается, то этот рост описывается геометрической прогрессии.

Также геометрическая прогрессия играет важную роль в инженерии и технологиях. В задачах, связанных с измерением или управлением ресурсами, такие как определение нагрузки на устройства или планирование потребностей в энергии, её использование позволяет оптимизировать процессы и предсказывать потребности. Кто сказал «незалежная энергетика»?

Да и в армейской практике геометрическая прогрессия используется для управления большими группами людей и ресурсов. При планировании формирования и развертывания подразделений, которое требует оценки роста численности и распределения ресурсов, знание принципов геометрической прогрессии позволяет более эффективно организовывать ресурсы и обеспечивать их нужды.

Все затронутые варианты использования геометрической прогрессии такие вкусные и интересные. Что же мы для вас подготовили? Узнаем совсем скоро! А вы пока оставляйте свои догадки в комментариях.

#математика
Сегодня на сон грядущий выпускаем очень нужную в наше неспокойное время статью, которую я обещал в предыдущем посте.

В последнее время мы часто читаем новости про батальоны, бригады, полки, но не все осознают, что это значит. Нет, конечно, понятно, что это какое-то подразделение, но как быстро оценить размеры этого подразделения? И тут к нам на помощь приходят геометрические прогрессии! В данной статье мы расскажем, как формируются армейские подразделения и при чем тут этот страшный математический зверь. Так что добро пожаловать под кат.

https://telegra.ph/Geometricheskie-progressii-v-armii-08-28

#математика #лонгрид
Самая важная тайна вселенной: 2 маленьких пиццы или 1 большая?

Часто во время встреч в кафе мы стоим перед дилеммой – сколько пиццы взять на компанию. Каждый помнит, что злобные маркетологи спят и видят, чтобы с помощью хитроумных акций заставить нас расстаться с нашими кровными денюжками. Кто же нас защитит от этих злодеев? Конечно же математика! И сегодня мы научимся покупать не пустоту и обещания, а самую лучшую пиццу.

Прежде чем приступать к вычислениям, стоит вспомнить формулу для площади круга:

S = πr²
Где:
S - это площадь вашей пиццы, то есть количество теста и начинки, которое вы получите.
r - радиус пиццы, или половина её диаметра (то есть та самая цифра, которую вы видите в меню - 30 см, 40 см и т.д. - разделённая пополам).
π (пи) - константа, которая равна примерно 3.14.

Настало время сравнить 25-сантиметровую пиццу и 40-сантиметровую! Подставим в нашу формулу числа 25/2 и 40/2, после чего получим 156π и 400π. Ого! Оказывается, что 40-сантиметровая пицца почти в 2.5 раза больше 25-сантиметровой. Почему же так выходит, ведь увеличив диаметр всего на 15 сантиметров, что меньше чем в 2 раза, площадь увеличилась гораздо больше, чем в 2 раза! Это все из-за возведения в квадрат радиуса, поэтому наша формула зависит от радиуса нелинейно. То есть изменив радиус в два раза, площадь увеличится в 2², или 4 раза! Поэтому-то 50-сантиметровой пиццы вы почти нигде не увидите, она в 4 раза больше, чем 25-сантиметровая.

Теперь осталось посчитать на сколько выгоднее взять одну большую пиццу, чем пару маленьких, и похвалить себя за знание математики. Славься Пифагор!

#математика #геометрия #экономика
Суперигра!

Продолжаем исследовать блогосферу с помощью математики и статистики. В этот раз без ИИ. Любой, кто прочитает данный материал, получит 100% способ найти скрытого агента СБУ всего с помощью одного слова. Кто-то скажет, что это кликбейт и в статье ничего подобного не будет, но не в этот раз. Мы с вами сыграем в увлекательную игру, найдем с помощью простого теста этнических украинцев, а за одно протестируем анонимного блогера на украинство.

В ваших руках будет супер-оружие, которому бы позавидовали даже ФСБ. Не волнуйтесь, товарищу майору мы отправили копию статьи на флешке. Если готовы, то добро пожаловать к нам!

https://telegra.ph/Najdi-chub-po-grafiku-09-12

#лонгрид #аналитика #математика #статистика
Немного о корреляции

Привет, друзья! Сегодня я хочу рассказать вам о корреляции в лингвистике и о том, как она может помочь нам лучше понимать языковые явления.

Корреляция — это линейная связь между двумя переменными. В лингвистике мы можем использовать корреляционный анализ для изучения связей между различными языковыми явлениями, такими как грамматика, лексика и фонетика. Например, как мы делали в предыдущем посте, найдя связь между употреблением "на сейчас" и "национальностью". Но нам надо пойти дальше в наших исследованиях, придать им больше веса. И для этого нам надо понять базу, и этой базой будет корреляция.

Предположим, мы хотим изучить связь между употреблением определенных слов и их частотой встречаемости в тексте. Мы можем обнаружить положительную корреляцию между употреблением определенного слова и его частотой встречаемости в тексте. Это может указывать на то, что это слово является ключевым в данном тексте и часто употребляется автором.

Однако, следует помнить, что корреляция не всегда означает причинно-следственную связь между переменными. В данном случае, мы не можем утверждать, что употребление определенного слова приводит к повышению частоты встречаемости в тексте или наоборот.

Таким образом, корреляционный анализ в лингвистике — это очень интересный и полезный инструмент, который помогает нам лучше понимать языковые явления и изучать языковые изменения. А чем мы будем изучать корреляцию? Конечно, с помощью нашего любимого python и пакета pandas в частности. И как обычно, после полного изучения инструментария, мы снова проведем крутой анализ, хотя и не будем менять последнюю тему. Так что советую приготовиться как следует, следующий материал будет сложным, но интересным!

#математика #статистика #обзор
Продолжаем исследовать "на сейчас"

На прошлой неделе мы нашли шибболет по которому можно определить национальность того, кто писал этот пост. Но в первом исследовании было не так уж много подопытных. "На сегодня" их всего 6 подтвержденных. Так давайте проверим еще немного блогеров! Готовы? Тогда добро пожаловать в короткую заметку по ссылке ниже. Там нас ждет Шарий и еще два таинственных блогера, у которых мы нашли "на сейчас". И поверьте, вы будете удивлены!

https://telegra.ph/Proverka-metoda-na-SHarii-i-drugih-blogerah-09-17

#аналитика #математика #статистика
Статистика языка

Сегодня предлагаю выпить за граммы! Нет, не те, а за биграммы и триграммы! Что это такое? На самом деле мы уже разбирались в этом вопросе, но не использовали этот термин. Сейчас мы исправим это досадное упущение и рассмотрим данный метод анализа еще раз.

Один из часто используемых инструментов – подсчет частоты слов. Он нужен для того, чтобы понять, какие слова наиболее популярны в языке и как они связаны друг с другом. Например, если мы возьмем простенькую фразу: «А я вот сегодня на сейчас пошел в магазин и купил яблоки», то сможем посчитать, сколько раз встречается каждое слово, и узнать, что понятие «я» в коротком отрывке встречается два раза («я пошел» и «я купил»), а слово «сейчас» – один раз.

Также статистика, применительно к языку, позволяет анализировать биграммы и триграммы. Почти как в детективе, где нужно вычислить, кто с кем и когда общался: биграмма - это два слова, которые идут друг за другом, а триграмма - соответственно, три слова подряд. Анализ биграмм и триграмм позволяет нам понять, какие слова часто используются вместе.

Оба анализа, вернее, результаты таких исследований, позволяют предсказывать следующее слово в предложении. Например, если мы возьмем текст «Сегодня я пошел в магазин и купил…», то на основе того, какие слова часто используются вместе, можно предположить следующее слово. К примеру, «яблоки», как в тексте выше: размышляя над тем, что именно можно купить в магазине, мы будем перебирать явно не глаголы, а «яблоки» статистически являются примером часто употребляемых слов.

Так статистика помогает лучше понимать алгоритмы и правила языка и использовать его более эффективно. Инструменты статистики могут быть полезны для автоматического перевода, создания языковых моделей и машинного обучения.

#математика #статистика #лингвистика
Частотные диаграммы

Вот так выглядит частотная диаграмма для блогера. Какого? Пока секрет! Давайте попробуем отгадать в комментариях, а я пока немного поясню как эта картинка получается.

Для начала мы нормализуем все слова, то есть приводим их в именительный падеж единственного числа для всяких существительных, и в неопределенную форму несовершенного вида глаголы. Это нужно, чтобы считать смыслы, а не формы: одел или оделся, не так уж важно, но по этому слову мы поймем, что блог скорее всего про моду, например.

Вторым заходом мы чистим с помощью стоп-листа от незначащих слов. В первую очередь это союзы, предлоги и прочие бессмысленные слова, которые связывают другие слова. Например, одно из самых частотных слов - союз и. Примерно та же ситуация и с предлогами, которые обходят по популярности многие слова со смыслом.

И вот когда мы все почистили - можем выводить на экран диаграмму. Слева видим количество слов в тексте, то есть частоту, а снизу сами слова. Высота каждого ряда показывает точное значение этих слов. И вот теперь на экране 20 самых популярных! Если кого-то заинтересует код, который такую простенькую манипуляцию над данными проводит, то не стесняйтесь и пишите в ЛС или в комментарии. Кстати, сейчас вы уже можете называть себя лингвистами!

Какой следующий шаг? Такой же анализ биграмм и триграмм! Кидайте варианты блогеров на проверку, постараемся всем помочь!

#математика #статистика #лингвистика
Пара слов о горизонте, Угледаре и оперативном просторе

Давно хотел рассказать зачем использую карту высот и чем она так важна. Наконец, дошли руки. И не просто дошли, а на примере Угледара. Заметка не очень длинная, но очень важная. Угледар добавил, так как выше в комментариях подписчики очень просили это сделать. А я очень люблю радовать своих подписчиков! Оставляйте новые темы для следующих постов в комментариях, не стесняйтесь.

https://telegra.ph/Vazhen-li-Ugledar-ili-net-10-02

#математика #геометрия #горизонт #аналитика