1.83K subscribers
3.29K photos
130 videos
15 files
3.57K links
Блог со звёздочкой.

Много репостов, немножко программирования.

Небольшое прикольное комьюнити: @decltype_chat_ptr_t
Автор: @insert_reference_here
Download Telegram
Forwarded from Data Funk
Желание разложить что-угодно по группам на основе схожести - естественная черта человека, но задача кластеризации данных, почти всегда как плохое ТЗ для дизайнера - делай красиво, а не красиво не делай. Какой алгоритм кластеризации хороший, а какой плохой если сравнивать результат их работы не с чем? Джон Клейнберг из Корнеллского университета в 2002 году сформулировал три критерия хорошего алгоритма кластеризации:

- Масштабная инвариантность. Если все расстояния между точками умножить на положительное число, это не должно менять результат работы хорошего алгоритма.
- Насыщенность/разнообразие. Хороший алгоритм способен создать любую произвольную комбинацию разбиения входных данных.
- Согласованность. Если уменьшаем внутрикластерные расстояния и/или увеличиваем межкластерные, алгоритм должен возвращать то же разбиение на кластеры.
🤔2👍1
Forwarded from Data Funk
В своей работе "Теорема о невозможности кластеризации" Клейнберг доказывает что никакой алгоритм кластеризации не может удовлетворять одновременно трем названным условиям. Масштабная инвариантность нарушается когда для определения принадлежности точки к кластеру используются относительные расстояния с заданным порогом. Насыщенность нарушается, если заранее фиксируется количество кластеров. Согласованность нарушается когда для объединения точек в кластеры используются абсолютные расстояния не превышающие некоторый порог. С другой стороны указанные критерии это субъективное представление о красивом/полезном разбиении множества на группы, с которым необязательно соглашаться. Максимально понятно, без математики, теорема описана тут.
👍2
Forwarded from шитпостинг.
👍20😁13🌚3🔥1
#prog #rust хайлайты:

Поменяли реализацию сортировки. Те же гарантии по сложности, та же или более хорошая производительность (в зависимости от типа), а самое заметное — новая сортировка теперь может (пусть и не гарантированно) отлавливать случаи, когда реализация Ord на самом деле не реализует отношение порядка, и сообщать об этом через панику с соответствующим сообщением.

Также уменьшает объём генерируемого кода для нестабильной сортировки, увеличивает для стабильной и за счёт организации кода быстрее компилируется на многоядерных системах.
🔥16👍1
Я не пользуюсь тиндером.

Мне и так знакомо, каково это, когда люди тебе не отвечают
👍3😢1
ノ┬─┬ノ ︵ ( \o°o)\
😁16🥰1
Я не выкладываю селфи. Не хочу, чтобы мои папищеки влюблялись и страдали от неразделённой любви.
🤡18😁9💩6❤‍🔥3🤮2🍌2🤨1
🌚19👏31
#prog #article

Adventures in CI land, or how to speed up your CI

Большинство описанного в статье не привязано к конкретному языку.
👍3👎2
— Почему ты не используешь отступы в коде?
— Природа не терпит пустоты
🍌9👍1💯1
Forwarded from Tech Crimes (Architector #4)
🤡12
#культурнаяпрограмма

They're Made out of Meat

(короткий научно-фантастический рассказ, читается за пару минут)
👍4🔥1
Почему так много людей интеллектуально деградируют прямо на глазах при виде маленьких детей?
🤡22💯62💩2🤨2🥰1
#game #abnormalprogramming #article

Simulating Rule 110 in Opus Magnum

Ввиду того, что симуляция сколько-нибудь большого пространства в игре затруднена, решение делается для закольцованного поля в 6 клеток. Но даже так это очень впечатляет.
Forwarded from memegusto
ну я
❤‍🔥5
Знаешь, в чём разница между тобой и ChatGPT?

ChatGPT обучается при помощи интернета.
😁1
😢14😁6👎2🥴1💔1
Блог*
Причины переехать в Армению: 1. Можно читать twitter без VPN
Причины переехать в Армению:

1. Можно смотреть YouTube без замедления.
🤡22👌3👍1🤮1💩1😭1