Forwarded from Data Funk
Желание разложить что-угодно по группам на основе схожести - естественная черта человека, но задача кластеризации данных, почти всегда как плохое ТЗ для дизайнера - делай красиво, а не красиво не делай. Какой алгоритм кластеризации хороший, а какой плохой если сравнивать результат их работы не с чем? Джон Клейнберг из Корнеллского университета в 2002 году сформулировал три критерия хорошего алгоритма кластеризации:
- Масштабная инвариантность. Если все расстояния между точками умножить на положительное число, это не должно менять результат работы хорошего алгоритма.
- Насыщенность/разнообразие. Хороший алгоритм способен создать любую произвольную комбинацию разбиения входных данных.
- Согласованность. Если уменьшаем внутрикластерные расстояния и/или увеличиваем межкластерные, алгоритм должен возвращать то же разбиение на кластеры.
- Масштабная инвариантность. Если все расстояния между точками умножить на положительное число, это не должно менять результат работы хорошего алгоритма.
- Насыщенность/разнообразие. Хороший алгоритм способен создать любую произвольную комбинацию разбиения входных данных.
- Согласованность. Если уменьшаем внутрикластерные расстояния и/или увеличиваем межкластерные, алгоритм должен возвращать то же разбиение на кластеры.
🤔2👍1
Forwarded from Data Funk
В своей работе "Теорема о невозможности кластеризации" Клейнберг доказывает что никакой алгоритм кластеризации не может удовлетворять одновременно трем названным условиям. Масштабная инвариантность нарушается когда для определения принадлежности точки к кластеру используются относительные расстояния с заданным порогом. Насыщенность нарушается, если заранее фиксируется количество кластеров. Согласованность нарушается когда для объединения точек в кластеры используются абсолютные расстояния не превышающие некоторый порог. С другой стороны указанные критерии это субъективное представление о красивом/полезном разбиении множества на группы, с которым необязательно соглашаться. Максимально понятно, без математики, теорема описана тут.
👍2
#prog #rust хайлайты:
Поменяли реализацию сортировки. Те же гарантии по сложности, та же или более хорошая производительность (в зависимости от типа), а самое заметное — новая сортировка теперь может (пусть и не гарантированно) отлавливать случаи, когда реализация Ord на самом деле не реализует отношение порядка, и сообщать об этом через панику с соответствующим сообщением.
Также уменьшает объём генерируемого кода для нестабильной сортировки, увеличивает для стабильной и за счёт организации кода быстрее компилируется на многоядерных системах.
Поменяли реализацию сортировки. Те же гарантии по сложности, та же или более хорошая производительность (в зависимости от типа), а самое заметное — новая сортировка теперь может (пусть и не гарантированно) отлавливать случаи, когда реализация Ord на самом деле не реализует отношение порядка, и сообщать об этом через панику с соответствующим сообщением.
Также уменьшает объём генерируемого кода для нестабильной сортировки, увеличивает для стабильной и за счёт организации кода быстрее компилируется на многоядерных системах.
GitHub
Replace sort implementations by Voultapher · Pull Request #124032 · rust-lang/rust
This PR replaces the sort implementations with tailor-made ones that strike a balance of run-time, compile-time and binary-size, yielding run-time and compile-time improvements. Regressing binary-s...
🔥16👍1
Я не пользуюсь тиндером.
Мне и так знакомо, каково это, когда люди тебе не отвечают
Мне и так знакомо, каково это, когда люди тебе не отвечают
👍3😢1
Я не выкладываю селфи. Не хочу, чтобы мои папищеки влюблялись и страдали от неразделённой любви.
🤡18😁9💩6❤🔥3🤮2🍌2🤨1
#prog #article
Adventures in CI land, or how to speed up your CI
Большинство описанного в статье не привязано к конкретному языку.
Adventures in CI land, or how to speed up your CI
Большинство описанного в статье не привязано к конкретному языку.
👍3👎2
Forwarded from Tech Crimes (Architector #4)
🤡12
#культурнаяпрограмма
They're Made out of Meat
(короткий научно-фантастический рассказ, читается за пару минут)
They're Made out of Meat
(короткий научно-фантастический рассказ, читается за пару минут)
www.mit.edu
They're Made out of Meat
👍4🔥1
Почему так много людей интеллектуально деградируют прямо на глазах при виде маленьких детей?
🤡22💯6❤2💩2🤨2🥰1
#game #abnormalprogramming #article
Simulating Rule 110 in Opus Magnum
Ввиду того, что симуляция сколько-нибудь большого пространства в игре затруднена, решение делается для закольцованного поля в 6 клеток. Но даже так это очень впечатляет.
Simulating Rule 110 in Opus Magnum
Ввиду того, что симуляция сколько-нибудь большого пространства в игре затруднена, решение делается для закольцованного поля в 6 клеток. Но даже так это очень впечатляет.
a blog by biggiemac42
Simulating Rule 110 in Opus Magnum - a blog by biggiemac42
As part of the 2022 Opus Magnum tournament, players had to design a machine to simulate the famous Rule 110 cellular automaton.
Знаешь, в чём разница между тобой и ChatGPT?
ChatGPT обучается при помощи интернета.
ChatGPT обучается при помощи интернета.
😁1
Блог*
Причины переехать в Армению: 1. Можно читать twitter без VPN
Причины переехать в Армению:
1. Можно смотреть YouTube без замедления.
1. Можно смотреть YouTube без замедления.
🤡22👌3👍1🤮1💩1😭1