Сохранёнки программиста

📎

One Billion Row Challenge — челлендж, который взорвал твиттер в начале года: обработать файл с миллиардом строк температурных измерений и посчитать min/max/avg для каждой станции.

Самое ценное — не сам челлендж, а разборы решений. Статья от QuestDB показывает путь от наивных 71 секунды до 1.7 секунды: SIMD, branchless-парсинг, memory-mapped files, кастомные хеш-таблицы. Есть аналогичные разборы для Go и Python (от 10 минут до 4 секунд через Polars).

Идеальный материал, чтобы разобраться как реально работает низкоуровневая оптимизация — branch prediction, cache locality, SIMD. Сохраняйте на выходные.

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤1

893 views07:17

Сохранёнки программиста

RetroAssembly — опенсорсный веб-кабинет ретро-игр. Открываете страницу, закидываете ROM-ы, играете. Прогресс сохраняется и синхронизируется между устройствами.

Можно поднять self-hosted через Docker. Эмуляция происходит прямо в браузере, NAS только хранит файлы. Есть тёмная тема, полноэкранный режим, автозагрузка последнего сейва.

Если хотите глубже — под капотом libretro/RetroArch, скомпилированный в WebAssembly. Похожий подход использует PCjs, где можно запустить DOS, Windows 3.1, OS/2 и даже поиграть в оригинальный Spacewar! на эмуляторе PDP-1.

@prog_stuff

👍2❤1

1.04K views10:18

Сохранёнки программиста

Как создать свой язык программирования — подборка на сохранение:

🔘

Видео от Computerphile — 15-минутный разбор как написать интерпретатор с нуля, объясняет Laurie Tratt из King's College

🔘

Плейлист Building a Parser from scratch — полный курс: лексер → парсер → AST → интерпретатор → компилятор в ассемблер

🔘

Nand2Tetris — легендарный курс, где вы строите компьютер от логических вентилей до ОС и компилятора своего языка. Занимает ~6 месяцев, но после него вы понимаете всё

Для тех, кто давно хотел разобраться как работают языки изнутри, но руки не доходили.

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍1

2.65K views11:21

Сохранёнки программиста

Forwarded from IT Юмор

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Прямо по бэкапам 😳

@ithumor

😁7💯1

1.11K views10:20

Сохранёнки программиста

Крутой шаблон для README на GitHub, забирать здесь. Есть немного доработанный форк.

@prog_stuff

❤6

911 views06:20

Сохранёнки программиста

65 идей новогодних подарков для айтишников

Tproger собрал подборку по категориям: эргономичные аксессуары для работы, гаджеты, товары для сна и креативный мерч. Всё со ссылками на маркетплейсы и разбито по ценам:
🔘до 1000 ₽;
🔘от 1000 до 3000 ₽;
🔘больше 3000 ₽.

Пригодится для тайного Санты в команде или если не знаете, что дарить знакомому разработчику / сисадмину / тимлиду.

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

Tproger

65 идей новогодних подарков для айтишников: по категориям и бюджету

Ищете идеальный новогодний подарок для программиста, сисадмина или разработчика? В подборке 65 актуальных идей: эргономичные аксессуары для работы, гаджеты, товары для сна и креативные сюрпризы. Все варианты можно найти на маркетплейсах.

🎄1

944 viewsedited 14:03

Сохранёнки программиста

Инструмент, который создаёт страницы ошибок, выглядящие точь-в-точь как настоящие от Cloudflare. Можно кастомизировать и встроить на свой сайт.

Зачем это нужно? Во-первых, ни за чем, просто весело. Во-вторых, чисто визуально это хорошее решение на самом деле, привычное для юзера. Можно иконки заменить и в понятном стиле показывать юзерам когда что-то пошло не так.

Как использовать
1️⃣Python-библиотека:

pip install cloudflare-error-page

2️⃣Есть визуальный редактор, где можно просто натыкать статусы и тексты.

📎

GitHub

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5🌚2👍1

15.8K viewsedited 18:23

Сохранёнки программиста

Forwarded from Нейроканал

SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf

14.6 MB

Сергей Долгов перевёл «The Smol Training Playbook» — самую популярную публикацию на HuggingFace о том, как создают, тренируют и дообучают языковые модели.

➡️ Что внутри

🔘Архитектура: MHA → GQA → MLA, позиционные кодировки (RoPE, NoPE), почему DeepSeek выбрал именно такие решения

🔘Претрейн: как собирать данные, выбирать learning rate, batch size, schedulers (WSD vs Cosine vs Multi-Step)

🔘Scaling laws: сколько данных нужно для модели N параметров, как считать FLOPs

🔘Post-training: SFT, DPO, GRPO, RLVR — когда что использовать и почему on-policy лучше off-policy

🔘Практика: как команда SmolLM3 обучала модель на 384×H100 за 11 триллионов токенов

➡️ Для кого
Для тех, кто хочет понять, как реально устроен процесс обучения LLM — не на уровне «скачал модель с HuggingFace», а на уровне «почему GQA ratio 4, а не 8» и «когда WSD лучше cosine decay».

Сергею — огромное спасибо за качественную вёрстку и время на перевод. Настольная книга для всех, кто копает в сторону ML.

📎 Оригинал на HF, версия на русском в прикреплённой PDF.

@neuro_channel

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

880 views15:55

Сохранёнки программиста

Computer History Museum выложил исходный код Adobe Photoshop 1.0.1 (1990) для некоммерческого использования. Можно скачать и покопаться — с разрешения Adobe.

➡️

История

Томас Нолл писал программу для отображения картинок, пока работал над PhD по компьютерному зрению в Мичигане. Брат Джон работал в Industrial Light & Magic и начал юзать её для редактирования фото. В 1988-м поняли, что это можно продавать, назвали Photoshop. Adobe купила лицензию в апреле 1989-го, версия 1.0 вышла в начале 1990-го.

➡️

Что внутри

🔘179 файлов, ~128 000 строк
🔘75% — Pascal, 15% — ассемблер Motorola 68000
🔘Почти без комментариев, но структура чистая

Версию 1.0 писал один инженер (Томас), на 2.0 — уже двое. Джон делал плагины обработки изображений

➡️

Зачем смотреть

Grady Booch (Chief Scientist в IBM Research) сказал: «Исходный код — это литература для computer scientists. Его надо изучать и ценить». Редкий шанс посмотреть, как выглядел production-код того времени — когда 3 млн копий продавали силами двух человек.

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤2

702 views14:19

Сохранёнки программиста

Anna's Archive (известны бэкапом книг и научных статей) заявили, что скачали почти весь Spotify: 256 млн треков метаданных, 86 млн аудиофайлов — это 99,6% всех прослушиваний. Раздаётся торрентами (пока только мета-данные, обещают постепенно выкладывают).

➡️

Зачем
Позиционируют как «архив на всякий случай». Популярная музыка бэкапится хорошо, но редкие треки могут исчезнуть, если платформа потеряет лицензии. Нет единого открытого архива музыки, как для книг.

Spotify, конечно, такой ход не оценил. Но есть нюансы.

1️⃣

Ирония #1: Spotify сам так начинался

Забавно требовать уважения к копирайту от платформы, которая в ранние годы индексировала пиратские MP3 с торрентов, чтобы набрать каталог. Теперь, когда кто-то делает то же самое с ними — это сразу «нарушение».

2️⃣Ирония #2: ИИ-компании делают то же самое

OpenAI, Google, Anthropic скрейпят весь интернет — книги, статьи, код, музыку — и называют это «обучением». А Anna's Archive говорит: мы тоже просто «обучаем свои уши». Если можно одним — почему нельзя другим?

Часть комьюнити считает, что AA перегнули. После скрейпинга WorldCat они и так под прицелом, а теперь ещё лейблы. Ради музыки могут погубить важный литературный архив.

А мы в «Сохранёнках» пока просто запасаемся попкорном и наблюдаем 🍿

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥4❤2👌1

718 viewsedited 15:28

Сохранёнки программиста

Forwarded from Типичный программист

YeaHub: база вопросов на русском для подготовки к собесам

На ресурсе собраны вопросы по всем популярным направлениям: бэк, фронт, DevOps, ML, мобилка, QA, DS, gamedev. Можно выбирать по языкам, технологиям и уровню сложности.

Помимо этого есть разделы по Git, Docker и другим инструментам, а также трекер прогресса и тренажёр для закрепления знаний.

#полезности #собеседование

❤4☃1

630 views09:53

Сохранёнки программиста

cheatsheets.zip — коллекция шпаргалок для разработчиков в одном месте

Сайт с быстрыми справочниками по языкам, фреймворкам, инструментам. Без воды — только синтаксис, команды, горячие клавиши. Когда нужно вспомнить regex, git-команду или синтаксис Python, а лезть в документацию лень.

Что есть
🔘Языки: Python, JavaScript, Go, Rust, C/C++, Java, PHP, Kotlin, Swift, Dart
🔘Инструменты: Docker, Kubernetes, Git, Vim, Bash, RegEx, LaTeX
🔘Фреймворки: Laravel, Express, jQuery, GraphQL
🔘Форматы: JSON, YAML, TOML, Markdown
🔘Горячие клавиши: VS Code, IntelliJ, Figma, Photoshop, Obsidian, Slack, Chrome DevTools

➡️

Для кого: когда переключаешься между языками и забываешь синтаксис. Когда нужен быстрый reminder, а не 50 страниц документации.

📎 Сам сайт со шпаргалами, код на GitHub

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

748 views10:12

Сохранёнки программиста

Весь год вы носили футболки и джинсы… Хватит!

Заглядывайте к нам в виртуальную примерочную и выбирайте себе идеальный скин для встречи Нового года.

Осторожно, эти наряды могут наповал сразить ваших коллег…

Реклама

🎄1

891 views11:27

Выбрать скин

Сохранёнки программиста

10:56

Media is too big

VIEW IN TELEGRAM

Можно ли выйти в интернет в 2025 году через Windows 95? Какие сайты откроются?

@prog_stuff

❤2😍1

14.3K views11:21

Сохранёнки программиста

Представьте: продакшен падает ночью. Причина — null где-то в глубине сервиса. Никто не знал, что он там может быть. Компилятор молчал.

А теперь другая история: разработчик 20 минут борется с ошибками компиляции. Исправляет. Деплоит. Всё работает. Никто не просыпается ночью.

Сегодня рассказываю про одну интересную статью. Автор утверждает: компилятор бесполезен не потому что он слабый, а потому что мы постоянно его обманываем:

1️⃣Null — говорим "это String", но на самом деле может быть null

2️⃣

Unchecked exceptions — говорим "возвращает String", но может выкинуть исключение

3️⃣Касты — говорим компилятору "trust me bro, это точно Dog", а через месяц там оказывается Cat

4️⃣

Side-effects — функция возвращает void, но делает что-то критичное. Компилятор не знает что

➡️ Что происходит когда перестаёшь лгать

Вместо null — Option<String>. Теперь компилятор видит разницу и заставляет обработать отсутствие значения.

Вместо кастов — union types. Добавили новый case? Компилятор покажет ВСЕ места, где нужно обработать новую логику.

Вместо "это просто int" — UserId, AppId, PostId. Теперь их невозможно перепутать.

➡️ Реальный кейс

Google Cloud outage в июне 2025 — причина null в неожиданном месте. Автор показывает, как диалог с компилятором мог бы предотвратить это: изменил тип поля на опциональное → получил сотни ошибок компиляции → понял, что дизайн неправильный → переделал на union type → компилятор показал все места, где нужна новая логика → добавил валидацию → скомпилировалось → задеплоил → спокойно спит.

📎 В общем, статья годная

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥2

812 views18:05

Сохранёнки программиста

«Ага! Теперь мне всё ясно. Напишу код, который точно решит твою проблему! 🚀»

Please open Telegram to view this post

VIEW IN TELEGRAM

😁16

703 viewsedited 17:05

Сохранёнки программиста

Обзор статьи от Herb Sutter: почему C++ растёт быстрее всех, несмотря на Rust, безопасность и AI

Главный архитектор C++ в Microsoft подводит итоги 2025 года. Тезис: «Software taketh away faster than hardware giveth» — наши задачи растут быстрее, чем мощность железа. Так было 80 лет, так будет и дальше.

➡️ Главные ограничения 2025 года

🔘Электричество — не чипы. Все сделки OpenAI теперь в гигаваттах. Microsoft CFO: «Нам не хватает не GPU, а места и электричества для них»

🔘Чипы — NVIDIA самая дорогая компания мира, TSMC — главная точка отказа планеты

➡️ Рост языков 2022-2025

Самые быстрорастущие: Rust и C++. При этом C++ за год добавил столько разработчиков, сколько всего Rust-программистов в мире.

➡️ А как же «C++ небезопасен»?

🔘Только 3 из топ-10 уязвимостей MITRE связаны с языком

🔘79% кибератак вообще без malware — атакуют другое

🔘Проблемный язык — C, не C++. Единственное исследование, разделившее их (Mend.io), показывает: C++ по безопасности ближе к другим языкам, чем к C

➡️ Про ИИ

🔘«Если ваша работа — следовать сложным инструкциям и нажимать кнопки, ИИ за ней придёт. Но это не большинство программистов»

🔘AWS CEO: «Заменить джунов на ИИ — одна из самых тупых идей, что я слышал»

📎

Полная статья

@prog_stuff

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

573 viewsedited 13:27

Сохранёнки программиста

Forwarded from Нейроканал

Себастьян Рашка подвёл итоги года в LLM-мире. Рашка — автор книги «Build A Large Language Model (From Scratch)» и независимый исследователь, который пишет код руками и разбирается в деталях. Его обзоры ценны тем, что это взгляд практика, а не маркетинговый пересказ пресс-релизов.

➡️ Главное открытие года — RLVR и GRPO

DeepSeek R1 в январе показал, что reasoning-поведение можно развить через reinforcement learning с проверяемыми наградами. Модель стоила ~$5M вместо ожидаемых $50–500M. После этого буквально все крупные лабы выпустили свои "думающие" модели.

GRPO стал любимым алгоритмом исследователей — он концептуально интересный и не требует безумных бюджетов для экспериментов.

➡️ Тренды года

🔘

Inference-time scaling — тратим больше на генерацию ответа, получаем лучше результат. DeepSeekMath-V2 так дошёл до золотого уровня на математических олимпиадах

🔘

Tool use — LLM учатся использовать поиск и калькуляторы вместо галлюцинаций

🔘Benchmaxxing — модели оптимизируют под бенчмарки, а не под реальные задачи. Llama 4 — яркий пример: цифры отличные, а пользователи разочарованы

➡️ Про использование LLM в работе

Рашка пишет: если модель делает всю работу, а человек только смотрит — это путь к выгоранию. Удовольствие от решения сложной задачи пропадает, когда LLM выдаёт ответ за секунду.

Его подход: критичный код пишет сам (чтобы понимать и расти), а рутину типа argparse-бойлерплейта отдаёт модели.

➡️ Прогнозы на 2026

🔘Diffusion-модели для текста выйдут в продакшн (Gemini Diffusion первый)
🔘RLVR расширится за пределы математики и кода — химия, биология
🔘RAG начнёт уступать длинному контексту
🔘Прогресс будет больше от inference-оптимизаций, чем от самих моделей

Статья на ~13k слов, но читается легко. Рашка не просто перечисляет события — он объясняет, почему это важно, и добавляет свой опыт. Особенно полезны секции про практическое использование LLM и честный разговор про burnout.

📎

https://magazine.sebastianraschka.com/p/state-of-llms-2025

@neuro_channel

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

524 views18:12

About

Blog

Apps

Platform