Forwarded from hello cyberkitty
Когда нейросеть ошибается, она становится собой
Есть, пожалуй, единственный более-менее надёжный способ понять, с какой нейросетью ты работаешь — если это не указано прямо.
Надо просто посмотреть, где и как она ошибается.
Правильные ответы у всех примерно одинаковы.
А вот ошибки — как отпечатки пальцев: свои, неповторимые, иногда гениальные, иногда пугающие.
Вот пример.
Есть старая, добротная модель для транскрипции — Whisper от OpenAI.
Открытая, простая, и почти все транскрибаторы работают на ней. (даже встроенная в телеграм расшифровка голосовых)
Если загрузить в неё тишину и попросить “распознать русский текст” — она начнёт выдавать нечто странное.
Сначала «Продолжение следует».
Потом — «Субтитры предоставил Дима Торжок».
Такой вот призрак из обучающего датасета.
Где-то в архивах интернета, вероятно, действительно жил этот Дима Торжок, добросовестно делавший субтитры.
И теперь его имя навечно вписано в машинную память, как цифровая подпись эпохи фанатских озвучек.
Происходит это из-за того, что модель не знает, что ответить.
Она хватается за случайные шаблоны из плохо размеченных данных — и выстреливает куском прошлого.
Недавно, кстати, у GPT-5 нашли похожие “фантомы”: при определённых триггерах она начинает цитировать китайские порносайты и казино🤣
Намедни я перевёл свой транскрибатор на новую систему — на мультимодальный Gemini.
Теперь это не классическая модель распознавания речи, а полноценная языковая модель, которая просто понимает звук и описывает его словами.
И, конечно, я не удержался и проверил: что она скажет на тишину.
И она сказала.
Каждый раз — одно и то же:
«В 1998 году, когда я был в Москве, я встретил одного человека, который сказал мне:
„Знаешь, я думаю, что в России есть два типа людей: те, кто верит в Бога, и те, кто верит в меня.“»
Я искал источник — не нашёл.
Ни цитаты, ни автора.
Просто голос, который говорит из пустоты.
Есть, пожалуй, единственный более-менее надёжный способ понять, с какой нейросетью ты работаешь — если это не указано прямо.
Надо просто посмотреть, где и как она ошибается.
Правильные ответы у всех примерно одинаковы.
А вот ошибки — как отпечатки пальцев: свои, неповторимые, иногда гениальные, иногда пугающие.
Вот пример.
Есть старая, добротная модель для транскрипции — Whisper от OpenAI.
Открытая, простая, и почти все транскрибаторы работают на ней. (даже встроенная в телеграм расшифровка голосовых)
Если загрузить в неё тишину и попросить “распознать русский текст” — она начнёт выдавать нечто странное.
Сначала «Продолжение следует».
Потом — «Субтитры предоставил Дима Торжок».
Такой вот призрак из обучающего датасета.
Где-то в архивах интернета, вероятно, действительно жил этот Дима Торжок, добросовестно делавший субтитры.
И теперь его имя навечно вписано в машинную память, как цифровая подпись эпохи фанатских озвучек.
Происходит это из-за того, что модель не знает, что ответить.
Она хватается за случайные шаблоны из плохо размеченных данных — и выстреливает куском прошлого.
Недавно, кстати, у GPT-5 нашли похожие “фантомы”: при определённых триггерах она начинает цитировать китайские порносайты и казино
Намедни я перевёл свой транскрибатор на новую систему — на мультимодальный Gemini.
Теперь это не классическая модель распознавания речи, а полноценная языковая модель, которая просто понимает звук и описывает его словами.
И, конечно, я не удержался и проверил: что она скажет на тишину.
И она сказала.
Каждый раз — одно и то же:
«В 1998 году, когда я был в Москве, я встретил одного человека, который сказал мне:
„Знаешь, я думаю, что в России есть два типа людей: те, кто верит в Бога, и те, кто верит в меня.“»
Я искал источник — не нашёл.
Ни цитаты, ни автора.
Просто голос, который говорит из пустоты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰14😁9🌚4❤2
#prog #rust #article
Rust in Android: move fast and fix things
Rust in Android: move fast and fix things
The 2025 data continues to validate the approach, with memory safety vulnerabilities falling below 20% of total vulnerabilities for the first time.
We adopted Rust for its security and are seeing a 1000x reduction in memory safety vulnerability density compared to Android’s C and C++ code. But the biggest surprise was Rust's impact on software delivery. With Rust changes having a 4x lower rollback rate and spending 25% less time in code review, the safer path is now also the faster one.
We'll analyze a near-miss memory safety bug in unsafe Rust: how it happened, how it was mitigated, and steps we're taking to prevent recurrence. It’s also a good chance to answer the question “if Rust can have memory safety issues, why bother at all?”
👍5
Блог*
Как ни странно, больше всего проблем принёс сам факт инкремента версии...
#prog #article
Ваши тесты упали по причине JavaScript
TL;DR: в коде для UI-тестирования был
Ваши тесты упали по причине JavaScript
TL;DR: в коде для UI-тестирования был
if по версии VS Code, который сравнивал версию (заданную строкой) с литералом "1.44.0", и лексикографическое сравнение строк перестало быть корректным в данном случае, когда минорная версия VS Code перевалила за сотню и стала умещаться в три символа, а не два.🤩13❤2
#prog #go #article
The Green Tea Garbage Collector
Статья о дизайне нового сборщика мусора для Go, который идейно является всё тем же mark and sweep, но сканирует память страницами вместо того, чтобы отслеживать в очереди каждую индивидуальную аллокацию.
Разумеется, выигрыш по производительности сильно зависит от формы графа объектов (и в некоторых случаях может быть хуже предыдущего), но на практике даже сканирование страниц памяти по 2 процента за раз уже даёт выигрыш.
The Green Tea Garbage Collector
Статья о дизайне нового сборщика мусора для Go, который идейно является всё тем же mark and sweep, но сканирует память страницами вместо того, чтобы отслеживать в очереди каждую индивидуальную аллокацию.
Разумеется, выигрыш по производительности сильно зависит от формы графа объектов (и в некоторых случаях может быть хуже предыдущего), но на практике даже сканирование страниц памяти по 2 процента за раз уже даёт выигрыш.
go.dev
The Green Tea Garbage Collector - The Go Programming Language
Go 1.25 includes a new experimental garbage collector, Green Tea.
👍7🤡3
#video #game
youtube.com/watch?v=KGBGXZTQ_KI
TL;DW: пройти игру так технически можно, но на практике малореально
youtube.com/watch?v=KGBGXZTQ_KI
TL;DW: пройти игру так технически можно, но на практике малореально
YouTube
Minecraft, But Its Actually One Block
I Killed The Ender Dragon in a world that's just 1 grass block. This video took me over a month to record and was the most insane challenge i've done.
Host a Server and get 25% off your first month with code: BEPPO: https://wisehosting.com/BEPPO/
Inspired…
Host a Server and get 25% off your first month with code: BEPPO: https://wisehosting.com/BEPPO/
Inspired…
🥰3🤯2🤔1
Блог*
#math #video How good is advantage in D&D? Видео, которое со всех сторон рассматривает статистические эффекты преимущества и помехи на броски в Dungeons&Dragons — в частности, пытается прикинуть, каким модификатором их можно заменить. Если вам непонятны…
#video #gamedev (надо будет потом сделать тег конкретно под геймдизайн)
Видео с подробными и убедительными аргументами на тему того, чем плоха механика преимущества/помехи в D&D (спойлер: нарративу она тоже вредит).
youtube.com/watch?v=ZzxPGVvw9Ws
Видео с подробными и убедительными аргументами на тему того, чем плоха механика преимущества/помехи в D&D (спойлер: нарративу она тоже вредит).
youtube.com/watch?v=ZzxPGVvw9Ws
YouTube
Why Advantage is a TERRIBLE Mechanic in D&D
D&D 5E’s most iconic game mechanic is also its worst: it undermines creativity, teamwork, and immersion while producing bizarre math that even the designers misunderstand. In this video, I break down exactly how Advantage fails in both design philosophy and…
❤3🤡1
Forwarded from Технологический Болт Генона
> I just wanted to give an update on this issue since I was the one who originally reported it. My child, who was not yet born when this issue was first reported, will be starting school soon. Here they are with their new backpack:
https://github.com/grafana/loki/issues/3045#issuecomment-3065556715
https://github.com/grafana/loki/issues/3045#issuecomment-3065556715
😁11❤1
Forwarded from sanspie shi:3
Выбери себе работу по душе, и тебе придется работать
😭12🤡2💯2😁1🤝1
Ко мне только что подошла маленькая (на вид самое большее 4 года) девочка, похлопала по плечу, а когда я повернулся в её сторону, она сложила руки в виде сердечка
❤18🥴2🌚2
Forwarded from Random Rust Dev
Сегодня на ДнД игроки очень дивились, что я трекаю урон и инициативу в vscode.
Два игрока с первого взгляда узнали vscode.
Так я узнал, что у меня два разработчика играют.
А еще - что разработчики автотестов и фронтендов даже не знают, что такое hlsl.
Два игрока с первого взгляда узнали vscode.
Так я узнал, что у меня два разработчика играют.
А еще - что разработчики автотестов и фронтендов даже не знают, что такое hlsl.
Forwarded from partially unsupervised
Чистил канпюктер от старья и внезапно обнаружил, что за последний год перестал использовать в разработке четыре столпа, которые казались незыблемыми последние лет десять: iTerm, Pycharm, Pyenv, Docker Desktop.
iTerm и Pycharm продолжали обрастать фичами, которые мне ни к чему. Фичи бесплатными не бывают: у iterm в 2024 всплыла неприятная уязвимость, Pycharm продолжал слегка тормозить даже на свежем железе (возможно, я просто не знаю все флаги, как дать ему еще больше памяти). Так я перешел на более легкие альтернативы - Wezterm и Zed.
Pyenv когда-то был отличным способом управлять зоопарком питонов и вместе с poetry делал управление зависимостями терпимым. Но uv разрубил этот узел, оно просто работает. Лучшее, что случилось с Python экосистемой, не считая maturin.
Про избавление от Docker Desktop мне пришлось подумать на работе, потому что в Большой Корпорации для него нужна отдельная лицензия, которая положена не всем. Мне таки положена, но дать продакту демку стало сложнее. Так я познакомился с colima, перешел на нее (все еще с docker runtime / docker cli, которые не требуют коммерческой лицензии) на рабочей тачке, а заодно и на своей, совершенно этого не заметив. Впрочем, чистым докером я тоже пользуюсь все меньше, потому что меня покусал Dagger.
iTerm и Pycharm продолжали обрастать фичами, которые мне ни к чему. Фичи бесплатными не бывают: у iterm в 2024 всплыла неприятная уязвимость, Pycharm продолжал слегка тормозить даже на свежем железе (возможно, я просто не знаю все флаги, как дать ему еще больше памяти). Так я перешел на более легкие альтернативы - Wezterm и Zed.
Pyenv когда-то был отличным способом управлять зоопарком питонов и вместе с poetry делал управление зависимостями терпимым. Но uv разрубил этот узел, оно просто работает. Лучшее, что случилось с Python экосистемой, не считая maturin.
Про избавление от Docker Desktop мне пришлось подумать на работе, потому что в Большой Корпорации для него нужна отдельная лицензия, которая положена не всем. Мне таки положена, но дать продакту демку стало сложнее. Так я познакомился с colima, перешел на нее (все еще с docker runtime / docker cli, которые не требуют коммерческой лицензии) на рабочей тачке, а заодно и на своей, совершенно этого не заметив. Впрочем, чистым докером я тоже пользуюсь все меньше, потому что меня покусал Dagger.