Самое ценное — не сам челлендж, а разборы решений. Статья от QuestDB показывает путь от наивных 71 секунды до 1.7 секунды: SIMD, branchless-парсинг, memory-mapped files, кастомные хеш-таблицы. Есть аналогичные разборы для Go и Python (от 10 минут до 4 секунд через Polars).
Идеальный материал, чтобы разобраться как реально работает низкоуровневая оптимизация — branch prediction, cache locality, SIMD. Сохраняйте на выходные.
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤1
RetroAssembly — опенсорсный веб-кабинет ретро-игр. Открываете страницу, закидываете ROM-ы, играете. Прогресс сохраняется и синхронизируется между устройствами.
Можно поднять self-hosted через Docker. Эмуляция происходит прямо в браузере, NAS только хранит файлы. Есть тёмная тема, полноэкранный режим, автозагрузка последнего сейва.
Если хотите глубже — под капотом libretro/RetroArch, скомпилированный в WebAssembly. Похожий подход использует PCjs, где можно запустить DOS, Windows 3.1, OS/2 и даже поиграть в оригинальный Spacewar! на эмуляторе PDP-1.
@prog_stuff
Можно поднять self-hosted через Docker. Эмуляция происходит прямо в браузере, NAS только хранит файлы. Есть тёмная тема, полноэкранный режим, автозагрузка последнего сейва.
Если хотите глубже — под капотом libretro/RetroArch, скомпилированный в WebAssembly. Похожий подход использует PCjs, где можно запустить DOS, Windows 3.1, OS/2 и даже поиграть в оригинальный Spacewar! на эмуляторе PDP-1.
@prog_stuff
👍2❤1
Как создать свой язык программирования — подборка на сохранение:
🔘 Видео от Computerphile — 15-минутный разбор как написать интерпретатор с нуля, объясняет Laurie Tratt из King's College
🔘 Плейлист Building a Parser from scratch — полный курс: лексер → парсер → AST → интерпретатор → компилятор в ассемблер
🔘 Nand2Tetris — легендарный курс, где вы строите компьютер от логических вентилей до ОС и компилятора своего языка. Занимает ~6 месяцев, но после него вы понимаете всё
Для тех, кто давно хотел разобраться как работают языки изнутри, но руки не доходили.
@prog_stuff
Для тех, кто давно хотел разобраться как работают языки изнутри, но руки не доходили.
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
65 идей новогодних подарков для айтишников
Tproger собрал подборку по категориям: эргономичные аксессуары для работы, гаджеты, товары для сна и креативный мерч. Всё со ссылками на маркетплейсы и разбито по ценам:
🔘 до 1000 ₽;
🔘 от 1000 до 3000 ₽;
🔘 больше 3000 ₽.
Пригодится для тайного Санты в команде или если не знаете, что дарить знакомому разработчику / сисадмину / тимлиду.
@prog_stuff
Tproger собрал подборку по категориям: эргономичные аксессуары для работы, гаджеты, товары для сна и креативный мерч. Всё со ссылками на маркетплейсы и разбито по ценам:
Пригодится для тайного Санты в команде или если не знаете, что дарить знакомому разработчику / сисадмину / тимлиду.
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
Tproger
65 идей новогодних подарков для айтишников: по категориям и бюджету
Ищете идеальный новогодний подарок для программиста, сисадмина или разработчика? В подборке 65 актуальных идей: эргономичные аксессуары для работы, гаджеты, товары для сна и креативные сюрпризы. Все варианты можно найти на маркетплейсах.
🎄1
Инструмент, который создаёт страницы ошибок, выглядящие точь-в-точь как настоящие от Cloudflare. Можно кастомизировать и встроить на свой сайт.
Зачем это нужно? Во-первых, ни за чем, просто весело. Во-вторых, чисто визуально это хорошее решение на самом деле, привычное для юзера. Можно иконки заменить и в понятном стиле показывать юзерам когда что-то пошло не так.
Как использовать
1️⃣ Python-библиотека:
2️⃣ Есть визуальный редактор, где можно просто натыкать статусы и тексты.
📎 GitHub
@prog_stuff
Зачем это нужно? Во-первых, ни за чем, просто весело. Во-вторых, чисто визуально это хорошее решение на самом деле, привычное для юзера. Можно иконки заменить и в понятном стиле показывать юзерам когда что-то пошло не так.
Как использовать
pip install cloudflare-error-page
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5🌚2👍1
Forwarded from Нейроканал
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
Сергей Долгов перевёл «The Smol Training Playbook» — самую популярную публикацию на HuggingFace о том, как создают, тренируют и дообучают языковые модели.
➡️ Что внутри
🔘 Архитектура: MHA → GQA → MLA, позиционные кодировки (RoPE, NoPE), почему DeepSeek выбрал именно такие решения
🔘 Претрейн: как собирать данные, выбирать learning rate, batch size, schedulers (WSD vs Cosine vs Multi-Step)
🔘 Scaling laws: сколько данных нужно для модели N параметров, как считать FLOPs
🔘 Post-training: SFT, DPO, GRPO, RLVR — когда что использовать и почему on-policy лучше off-policy
🔘 Практика: как команда SmolLM3 обучала модель на 384×H100 за 11 триллионов токенов
➡️ Для кого
Для тех, кто хочет понять, как реально устроен процесс обучения LLM — не на уровне «скачал модель с HuggingFace», а на уровне «почему GQA ratio 4, а не 8» и «когда WSD лучше cosine decay».
Сергею — огромное спасибо за качественную вёрстку и время на перевод. Настольная книга для всех, кто копает в сторону ML.
📎 Оригинал на HF, версия на русском в прикреплённой PDF.
@neuro_channel
Для тех, кто хочет понять, как реально устроен процесс обучения LLM — не на уровне «скачал модель с HuggingFace», а на уровне «почему GQA ratio 4, а не 8» и «когда WSD лучше cosine decay».
Сергею — огромное спасибо за качественную вёрстку и время на перевод. Настольная книга для всех, кто копает в сторону ML.
@neuro_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Computer History Museum выложил исходный код Adobe Photoshop 1.0.1 (1990) для некоммерческого использования. Можно скачать и покопаться — с разрешения Adobe.
➡️ История
Томас Нолл писал программу для отображения картинок, пока работал над PhD по компьютерному зрению в Мичигане. Брат Джон работал в Industrial Light & Magic и начал юзать её для редактирования фото. В 1988-м поняли, что это можно продавать, назвали Photoshop. Adobe купила лицензию в апреле 1989-го, версия 1.0 вышла в начале 1990-го.
➡️ Что внутри
🔘 179 файлов, ~128 000 строк
🔘 75% — Pascal, 15% — ассемблер Motorola 68000
🔘 Почти без комментариев, но структура чистая
Версию 1.0 писал один инженер (Томас), на 2.0 — уже двое. Джон делал плагины обработки изображений
➡️ Зачем смотреть
Grady Booch (Chief Scientist в IBM Research) сказал: «Исходный код — это литература для computer scientists. Его надо изучать и ценить». Редкий шанс посмотреть, как выглядел production-код того времени — когда 3 млн копий продавали силами двух человек.
@prog_stuff
Томас Нолл писал программу для отображения картинок, пока работал над PhD по компьютерному зрению в Мичигане. Брат Джон работал в Industrial Light & Magic и начал юзать её для редактирования фото. В 1988-м поняли, что это можно продавать, назвали Photoshop. Adobe купила лицензию в апреле 1989-го, версия 1.0 вышла в начале 1990-го.
Версию 1.0 писал один инженер (Томас), на 2.0 — уже двое. Джон делал плагины обработки изображений
Grady Booch (Chief Scientist в IBM Research) сказал: «Исходный код — это литература для computer scientists. Его надо изучать и ценить». Редкий шанс посмотреть, как выглядел production-код того времени — когда 3 млн копий продавали силами двух человек.
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤2
Anna's Archive (известны бэкапом книг и научных статей) заявили, что скачали почти весь Spotify: 256 млн треков метаданных, 86 млн аудиофайлов — это 99,6% всех прослушиваний. Раздаётся торрентами (пока только мета-данные, обещают постепенно выкладывают).
➡️ Зачем
Позиционируют как «архив на всякий случай». Популярная музыка бэкапится хорошо, но редкие треки могут исчезнуть, если платформа потеряет лицензии. Нет единого открытого архива музыки, как для книг.
Spotify, конечно, такой ход не оценил. Но есть нюансы.
1️⃣ Ирония #1: Spotify сам так начинался
Забавно требовать уважения к копирайту от платформы, которая в ранние годы индексировала пиратские MP3 с торрентов, чтобы набрать каталог. Теперь, когда кто-то делает то же самое с ними — это сразу «нарушение».
2️⃣ Ирония #2: ИИ-компании делают то же самое
OpenAI, Google, Anthropic скрейпят весь интернет — книги, статьи, код, музыку — и называют это «обучением». А Anna's Archive говорит: мы тоже просто «обучаем свои уши». Если можно одним — почему нельзя другим?
Часть комьюнити считает, что AA перегнули. После скрейпинга WorldCat они и так под прицелом, а теперь ещё лейблы. Ради музыки могут погубить важный литературный архив.
А мы в «Сохранёнках» пока просто запасаемся попкорном и наблюдаем🍿
@prog_stuff
Позиционируют как «архив на всякий случай». Популярная музыка бэкапится хорошо, но редкие треки могут исчезнуть, если платформа потеряет лицензии. Нет единого открытого архива музыки, как для книг.
Spotify, конечно, такой ход не оценил. Но есть нюансы.
Забавно требовать уважения к копирайту от платформы, которая в ранние годы индексировала пиратские MP3 с торрентов, чтобы набрать каталог. Теперь, когда кто-то делает то же самое с ними — это сразу «нарушение».
OpenAI, Google, Anthropic скрейпят весь интернет — книги, статьи, код, музыку — и называют это «обучением». А Anna's Archive говорит: мы тоже просто «обучаем свои уши». Если можно одним — почему нельзя другим?
Часть комьюнити считает, что AA перегнули. После скрейпинга WorldCat они и так под прицелом, а теперь ещё лейблы. Ради музыки могут погубить важный литературный архив.
А мы в «Сохранёнках» пока просто запасаемся попкорном и наблюдаем
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4❤2👌1
Forwarded from Типичный программист
YeaHub: база вопросов на русском для подготовки к собесам
На ресурсе собраны вопросы по всем популярным направлениям: бэк, фронт, DevOps, ML, мобилка, QA, DS, gamedev. Можно выбирать по языкам, технологиям и уровню сложности.
Помимо этого есть разделы по Git, Docker и другим инструментам, а также трекер прогресса и тренажёр для закрепления знаний.
#полезности #собеседование
На ресурсе собраны вопросы по всем популярным направлениям: бэк, фронт, DevOps, ML, мобилка, QA, DS, gamedev. Можно выбирать по языкам, технологиям и уровню сложности.
Помимо этого есть разделы по Git, Docker и другим инструментам, а также трекер прогресса и тренажёр для закрепления знаний.
#полезности #собеседование
❤4☃1
cheatsheets.zip — коллекция шпаргалок для разработчиков в одном месте
Сайт с быстрыми справочниками по языкам, фреймворкам, инструментам. Без воды — только синтаксис, команды, горячие клавиши. Когда нужно вспомнить regex, git-команду или синтаксис Python, а лезть в документацию лень.
Что есть
🔘 Языки: Python, JavaScript, Go, Rust, C/C++, Java, PHP, Kotlin, Swift, Dart
🔘 Инструменты: Docker, Kubernetes, Git, Vim, Bash, RegEx, LaTeX
🔘 Фреймворки: Laravel, Express, jQuery, GraphQL
🔘 Форматы: JSON, YAML, TOML, Markdown
🔘 Горячие клавиши: VS Code, IntelliJ, Figma, Photoshop, Obsidian, Slack, Chrome DevTools
➡️ Для кого: когда переключаешься между языками и забываешь синтаксис. Когда нужен быстрый reminder, а не 50 страниц документации.
📎 Сам сайт со шпаргалами, код на GitHub
@prog_stuff
Сайт с быстрыми справочниками по языкам, фреймворкам, инструментам. Без воды — только синтаксис, команды, горячие клавиши. Когда нужно вспомнить regex, git-команду или синтаксис Python, а лезть в документацию лень.
Что есть
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Весь год вы носили футболки и джинсы… Хватит!
Заглядывайте к нам в виртуальную примерочную и выбирайте себе идеальный скин для встречи Нового года.
Осторожно, эти наряды могут наповал сразить ваших коллег…
Реклама
Заглядывайте к нам в виртуальную примерочную и выбирайте себе идеальный скин для встречи Нового года.
Осторожно, эти наряды могут наповал сразить ваших коллег…
Реклама
🎄1
Представьте: продакшен падает ночью. Причина —
А теперь другая история: разработчик 20 минут борется с ошибками компиляции. Исправляет. Деплоит. Всё работает. Никто не просыпается ночью.
Сегодня рассказываю про одну интересную статью. Автор утверждает: компилятор бесполезен не потому что он слабый, а потому что мы постоянно его обманываем:
1️⃣ Null — говорим "это String", но на самом деле может быть
2️⃣ Unchecked exceptions — говорим "возвращает String", но может выкинуть исключение
3️⃣ Касты — говорим компилятору "trust me bro, это точно Dog", а через месяц там оказывается Cat
4️⃣ Side-effects — функция возвращает
➡️ Что происходит когда перестаёшь лгать
Вместо
Вместо кастов —
Вместо "это просто int" —
➡️ Реальный кейс
Google Cloud outage в июне 2025 — причина
📎 В общем, статья годная
@prog_stuff
null где-то в глубине сервиса. Никто не знал, что он там может быть. Компилятор молчал.А теперь другая история: разработчик 20 минут борется с ошибками компиляции. Исправляет. Деплоит. Всё работает. Никто не просыпается ночью.
Сегодня рассказываю про одну интересную статью. Автор утверждает: компилятор бесполезен не потому что он слабый, а потому что мы постоянно его обманываем:
nullvoid, но делает что-то критичное. Компилятор не знает что
Вместо
null — Option<String>. Теперь компилятор видит разницу и заставляет обработать отсутствие значения.Вместо кастов —
union types. Добавили новый case? Компилятор покажет ВСЕ места, где нужно обработать новую логику.Вместо "это просто int" —
UserId, AppId, PostId. Теперь их невозможно перепутать.
Google Cloud outage в июне 2025 — причина
null в неожиданном месте. Автор показывает, как диалог с компилятором мог бы предотвратить это: изменил тип поля на опциональное → получил сотни ошибок компиляции → понял, что дизайн неправильный → переделал на union type → компилятор показал все места, где нужна новая логика → добавил валидацию → скомпилировалось → задеплоил → спокойно спит.@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁16
Обзор статьи от Herb Sutter: почему C++ растёт быстрее всех, несмотря на Rust, безопасность и AI
Главный архитектор C++ в Microsoft подводит итоги 2025 года. Тезис: «Software taketh away faster than hardware giveth» — наши задачи растут быстрее, чем мощность железа. Так было 80 лет, так будет и дальше.
➡️ Главные ограничения 2025 года
🔘 Электричество — не чипы. Все сделки OpenAI теперь в гигаваттах. Microsoft CFO: «Нам не хватает не GPU, а места и электричества для них»
🔘 Чипы — NVIDIA самая дорогая компания мира, TSMC — главная точка отказа планеты
➡️ Рост языков 2022-2025
Самые быстрорастущие: Rust и C++. При этом C++ за год добавил столько разработчиков, сколько всего Rust-программистов в мире.
➡️ А как же «C++ небезопасен»?
🔘 Только 3 из топ-10 уязвимостей MITRE связаны с языком
🔘 79% кибератак вообще без malware — атакуют другое
🔘 Проблемный язык — C, не C++. Единственное исследование, разделившее их (Mend.io), показывает: C++ по безопасности ближе к другим языкам, чем к C
➡️ Про ИИ
🔘 «Если ваша работа — следовать сложным инструкциям и нажимать кнопки, ИИ за ней придёт. Но это не большинство программистов»
🔘 AWS CEO: «Заменить джунов на ИИ — одна из самых тупых идей, что я слышал»
📎 Полная статья
@prog_stuff
Главный архитектор C++ в Microsoft подводит итоги 2025 года. Тезис: «Software taketh away faster than hardware giveth» — наши задачи растут быстрее, чем мощность железа. Так было 80 лет, так будет и дальше.
Самые быстрорастущие: Rust и C++. При этом C++ за год добавил столько разработчиков, сколько всего Rust-программистов в мире.
@prog_stuff
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Forwarded from Нейроканал
Себастьян Рашка подвёл итоги года в LLM-мире. Рашка — автор книги «Build A Large Language Model (From Scratch)» и независимый исследователь, который пишет код руками и разбирается в деталях. Его обзоры ценны тем, что это взгляд практика, а не маркетинговый пересказ пресс-релизов.
➡️ Главное открытие года — RLVR и GRPO
DeepSeek R1 в январе показал, что reasoning-поведение можно развить через reinforcement learning с проверяемыми наградами. Модель стоила ~$5M вместо ожидаемых $50–500M. После этого буквально все крупные лабы выпустили свои "думающие" модели.
GRPO стал любимым алгоритмом исследователей — он концептуально интересный и не требует безумных бюджетов для экспериментов.
➡️ Тренды года
🔘 Inference-time scaling — тратим больше на генерацию ответа, получаем лучше результат. DeepSeekMath-V2 так дошёл до золотого уровня на математических олимпиадах
🔘 Tool use — LLM учатся использовать поиск и калькуляторы вместо галлюцинаций
🔘 Benchmaxxing — модели оптимизируют под бенчмарки, а не под реальные задачи. Llama 4 — яркий пример: цифры отличные, а пользователи разочарованы
➡️ Про использование LLM в работе
Рашка пишет: если модель делает всю работу, а человек только смотрит — это путь к выгоранию. Удовольствие от решения сложной задачи пропадает, когда LLM выдаёт ответ за секунду.
Его подход: критичный код пишет сам (чтобы понимать и расти), а рутину типа argparse-бойлерплейта отдаёт модели.
➡️ Прогнозы на 2026
🔘 Diffusion-модели для текста выйдут в продакшн (Gemini Diffusion первый)
🔘 RLVR расширится за пределы математики и кода — химия, биология
🔘 RAG начнёт уступать длинному контексту
🔘 Прогресс будет больше от inference-оптимизаций, чем от самих моделей
Статья на ~13k слов, но читается легко. Рашка не просто перечисляет события — он объясняет, почему это важно, и добавляет свой опыт. Особенно полезны секции про практическое использование LLM и честный разговор про burnout.
📎 https://magazine.sebastianraschka.com/p/state-of-llms-2025
@neuro_channel
DeepSeek R1 в январе показал, что reasoning-поведение можно развить через reinforcement learning с проверяемыми наградами. Модель стоила ~$5M вместо ожидаемых $50–500M. После этого буквально все крупные лабы выпустили свои "думающие" модели.
GRPO стал любимым алгоритмом исследователей — он концептуально интересный и не требует безумных бюджетов для экспериментов.
Рашка пишет: если модель делает всю работу, а человек только смотрит — это путь к выгоранию. Удовольствие от решения сложной задачи пропадает, когда LLM выдаёт ответ за секунду.
Его подход: критичный код пишет сам (чтобы понимать и расти), а рутину типа argparse-бойлерплейта отдаёт модели.
Статья на ~13k слов, но читается легко. Рашка не просто перечисляет события — он объясняет, почему это важно, и добавляет свой опыт. Особенно полезны секции про практическое использование LLM и честный разговор про burnout.
@neuro_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1