Борис опять
16.4K subscribers
1.53K photos
78 videos
35 files
1.59K links
life = curiosity + irreducible noise

Whois: https://t.iss.one/boris_again/3400

Лс: @btseytlin
Download Telegram
Forwarded from Sergei Averkiev
Мы русские, с нами клод
15123👎10👍7
С людьми: доверяй, но проверяй.
С LLM: не доверяй, но проверять лень. Проверять будет тот несчастный, кому это поддерживать.
195👍21😢141
Не попал в Forbes 30 under 30 — ничего страшного, не сдавайся. Просто придётся найти свой путь в тюрьму самостоятельно
23811😢3🤔2🤬1
#дайджест

Дайджест AI/ML за неделю 20-26 апреля 2026

Гора больших релизов перед майскими.

OpenAI: GPT-5.5
Тот самый "Spud" уже в Codex. Нативно омнимодальные картинки. SWE-bench Pro 58.6%, Terminal-Bench 2.0 82.7% (SOTA). MRCR v2 на 1M токенах прыгнул с 36.6 до 74%. Контекст 1M в API, 400K в Codex. Цена удвоилась: $5/$30, Pro $30/$180.
Блогпост , Системная карточка

OpenAI: GPT Image 2
SOTA на Artificial Analysis text-to-image Elo 1333, +61 пункт к второму месту - крупнейший разрыв одной модели в истории арены. Рендер текста с >99% точностью (можно писать код .svg картинки внутри твоей картинки), разрешение до 2K. Цена не за изображение, а за токены: output $30/1M, input-картинки $8/1M, кэш $2/1M (≈$0.04 за 1024×1024 high). Доступна в ChatGPT всем включая Free, в API под id gpt-image-2. На редактировании, как ни странно, всё ещё впереди GPT Image 1.5.
Блогпост, API

DeepSeek: V4 Preview
Открытый превью двух моделей под MIT. V4-Pro: 1.6T total / 49B активных, 384 эксперта. V4-Flash: 284B / 13B, 256 экспертов. Контекст 1M токенов с хорошим удержанием - две новых аттеншн-схемы: Compressed Sparse Attention (CSA) сжимает группы KV и применяет top-k поверх сжатого, Heavily Compressed Attention (HCA) даёт более агрессивное сжатие без sparse selection. Слои чередуются. Pretraining 32-33T токенов. Post-training необычный: вместо одной модели сначала тренируют N специалистов под разные домены (math, code, agents, instruction following), а потом дистиллируют в одну модель. На SWE-bench Verified 80.6%, IMOAnswerBench 89.8 (vs 75.3 у Opus 4.6 и 81.0 у Gemini 3.1 Pro), Codeforces 3206. Не везде фронтир, но цена $0.14/$0.28 у Flash и $1.74/$3.48 у Pro — в 6 раз дешевле Opus 4.7 и GPT-5.5.
Техрепорт, Pro, Flash, API docs

Moonshot: Kimi K2.6

1T MoE с 32B активных, 384 эксперта, нативная int4. Открытые веса под Modified MIT (если вы не крупная корпорация, то для вас MIT). На SWE-bench Verified 80.2%, GPQA 90.5%, BrowseComp 83.2, Terminal-Bench 2.0 66.7. Главное обновление - Agent Swarm: с 100 до 300 саб-агентов и до 4000 координированных шагов. Обещают непрерывные кодинг-сессии до 13 часов. Добавили нативный видео-вход (mp4/mov/avi/webm до 2K). Цена $0.95/$4.00 за 1M, кэш $0.16. Контекст 256K.
Блогпост (в виде слайд-шоу), HF

Google DeepMind: Gemini Robotics-ER 1.6
Крупный апдейт VLM-мозга для роботов. Главное - научили читать приборы: давление, температуру, цифровые индикаторы. Точность с 23% (старые модели) до 93% при включении агентного слоя зрения, 67% у Gemini 3.0 Flash без него. Также прокачали указание на объекты, подсчёт и success detection. ER это reasoning-слой, моторика остаётся за VLA-моделями. Доступна в Gemini API и Google AI Studio.
Блогпост
🔥161
Если кто-то ещё пользуется pytorch-lightning, осторожнее:
1. Он подвергся supply chain атаке.
2. Не забывайте пить транквилизаторы + делать дыхание квадратом.
😢2623
#дайджест

Дайджест AI/ML за неделю 27 апреля - 4 мая 2026

xAI: Grok 4.3
AA Intelligence Index 53 (vs 60 у GPT-5.5, 57 у Opus 4.7), но при этом 110 т/с - быстрее всего фронтира и цена $1.25/$2.50, что сравнимо скорее с DeepSeek, а не Опусом. Контекст 1M, нативный видео-вход. На SWE-bench отстаёт от Opus 4.7 на ~14пп, зато на агентских задачах (GDPval-AA) обошли GPT-5.4 и Gemini 3.1 Pro Preview. Reasoning всегда включён. Time-to-first-token 31с - пока модель раздупляется можно размять глаза, что тоже плюс.
Карточка модели, API docs, OpenRouter

Meta: Sapiens2
Семейство ViT моделей от 0.1B до 5B. Претрейн на Humans-1B (1 миллиард размеченных людьми картинок). Пять задач из коробки: pose estimation на 308 точек , сегментация на 29 классов, surface normals, pointmap (per-pixel XYZ) и albedo. По-простому модель для мокапа из видео и по генерации людей из болванчиков. Нативное разрешение 1024×768, есть 4K-вариант через windowed attention. Уже есть в ComfyUI .
Статья, GitHub, HF, ComfyUI

Netflix Eyeline Labs: Vista4D
Опенсорс от Netflix. Перетащи камеру в любой ракурс уже снятой сцены, не выезжая на пересъёмки. Бьёт ReCamMaster и CamCloneMaster по точности контроля камеры, юзеры предпочитают результат в 77% слепых сравнений. 720p, до 49 кадров.
Страница проекта, GitHub, Статья, HF

Talkie: 1930
13B модель натренированная на 260B токенов исключительно из текстов до 1930 года. Авторы говорят что цель работы - оценивать предсказательные способности моделей, но все мы понимаем что все ради обсуждения евгеники.
К лету команда обещает уровень GPT-3
Блогпост, Чат, HF, GitHub

Pine AI: Incompressible Knowledge Probes
Статья в которой предложен метод определения примерного размера пропреитарных моделей не через стоимость инференса, а через объем сохраненных фактов в модели (есть граница возможного сжатия информации). Модель откалибрована на 89 открытых моделях с R²=0.917. Из интересного GPT-5.5 ≈ 9.7T, Claude Opus 4.6 ≈ 5.3T. Конфиденс интервалы моё уважение. Больше цифр а статье

Sync: дубляж с липсинком
Прикрутили перевод и войсклон поверх своей модели липсинка, получился однокнопочный дубляж. Как всегда у sync - дорого, но лучшее на рынке.

VR-Outpaint IC-LoRA
Интересная лора, расширяющая обычное видео в 360° видео для VR. Вы знаете в какой сфере это будет использоваться. HF

Google: Gemini теперь генерирует файлы PDF, DOCX, XLSX, CSV, LaTeX, TXT, RTF, MD. Оказывается раньше не мог. Блогпост

PlayCanvas: шутер на гауссиан-сплатах играбельное демо в браузере по реальному 3D-скану заброшки. Блогпост
👍113👎2🤬1
Теперь я вижу полную картину! Да, не стоило добавлять фейри в борщ. Фейри нужно добавлять ПОСЛЕ съедения борща, чтобы очистить посуду. Хочешь я найду ближайшие травмпункты?
240🔥53😢12👍53
Когда работал в Толоке (тогда ещё платформа разметки данных), узнал неожиданную вещь: одно из главных преимуществ для клиентов было вообще не про ML.

Дело в оплате разметчикам. Если масштабируешь разметку - оплата исполнителям превращается в настоящий пейролл-кошмар. Если они ещё и в разных странах - вообще мрак.

С тех пор слежу за тем, как люди решают эту проблему. Недавно наткнулся на Stape - и кажется, это одно из адекватных решений, которое видел.

Сервис для выплат удалённым исполнителям в 242 локациях. Берёт на себя весь операционный ад: договоры, налоги разных стран, комплаенс. И главное - фиксированные $50/€50 за транзакцию вместо процента. На больших объёмах это очень заметная разница.

Ещё что понравилось:
• от онбординга до выплаты - 60 секунд
• юридический риск на них, не на вас
• подрядчики получают на карту, счёт или USDT без комиссии с их стороны

Уже более 600 компаний и 10 000+ подрядчиков работают через платформу. Среди партнёров: Sumsub, DocuSign, SignNow, Elliptic, Microsoft, DigitalOcean.

Если у вас похожая боль - вот ссылка на консультацию.

Реклама. ООО ГЕЙМИНГ ИНТЕРТЕЙМЕНТ ФЗЕ ИНН 9909668088 erid:2VtzqwQHPvP
100🤬208👎6😢1
Forwarded from Dmitriy
Привет всем, я Дима, AI инженер, или как там это теперь называется.
Хочу представить свою библиотеку для контроля выполнения агентов, это не очередной клон лангчейна или CrewAI, не харнесс добавляющий тулы, это мета враппер, в который можно обернуть ваш лангчейн агент, клод сдк, или кастомный агент, и все начнет подчиняться вашим правилам:
- пользовательский интент классифицируется и выбирается полиси для этого типа задач
- в зависимости от полиси применяется сжатие контекста и формируется allow list тулов
- разрешается или запрещается спавнить саб агентов, которым передается слайс контекста, который нужен в данный момент именно этому агенту
- пишет логи всех вызовов и решений (не самая удивительная фича, но все же)

В результате всех этих манипуляций можно сократить расход токенов до 70% на длинных мультиагентных задачах, можно строить деревья агентов произвольной длины с изолированным контекстом и много чего еще, что я пока не придумал.
Если заинтересовались вот ссылка на репо, жду ваши предложения, пожелания и теплые слова
https://github.com/Bucha11/axor-core
🔥388👎6
AgileFluent получает вечный бан в этом канале. Извините, мой косяк. Надо было внимательнее смотреть прежде чем писать про них

Надо было насторожиться ещё на этапе когда они в качестве брифа скидывали мне пост для Кириллика 🥺
Please open Telegram to view this post
VIEW IN TELEGRAM
8111🤔7😢3👍2
155🔥225👍5
Agent review

Вообще ревью на топовые конфы это мем - три чела пишут свое очень важное мнение, ты пишешь ответы а челам похуй. А еще обычно ревьюверы читают статьи жопой и не разбираются/слабо разбираются в топике, короче ллм в целом почти во всем лучше.

Есть очень известный тул: paperreview.ai (blog) - запромченные ллмки, нет поиска, но уже из коробки хорошо корелирует с человекам. Я затащил это в виде skill для claude code/codex, дал доступ к поиску на архиве и заставил писать конкретный вердикт. Ну и теперь это работает за токенв вашей подписки ;)

Кореляцию я конечно же не посчитал, но пока совпало для моей статьи с их сайтом.
А еще я добавил:
- промпт "Need Nandа " - по мотивам его Highly opinated advice
- рандом сид для каждого из ревьюверов из статьи Sakana Ai ssd


https://github.com/AlexWortega/ai-peer-review-skill

Поддержите в твитере а то я устал жить без большого твитера https://x.com/justALEXWORTEGA/status/2052775687052755317?s=20
👎2421👍16🤔4
Forwarded from Foom Countdown Party
43👍144👎2
Астрологи объявили неделю пет-проектов в канале. Можно присылать свои поделки в лс!
19🔥123
Forwarded from Zeev Ishkariot
PanicMode: демон для Linux-серверов, для защиты от тихого падения.
Три цели:
- Немедленно сообщить разработчику если у сервера серьезные проблемы, не используя сторонние сервисы и без дополнительных затрат.
- Не дать сломавшемуся (например зашедшему в loop) процессу положить сервер и стереть логи. Вместо этого – заморозить процесс, одновременно сохранив и логи, и работу других процессов сервера.
- Не дать ssh-bruteforc атакам положить сервер, автоматически банить в iptables.

PanicMode морозит процессы с помощью SIGSTOP, блокирует нападки ботов и имеет интеграции с разными платформами в том числе Telegram, Email и Twilio.
Легкий Rust потребляет в обычном режиме меньше процента CPU, и меньше 40 мб от оперативки.
Бинарник ~9МБ и весь код ждут вас по ссылке https://github.com/BorisYamp/panicmode
42👍22🤔1
Forwarded from Sergey E
https://corovans.d.123automate.it/
Я вот делаю игру где можно грабить корованы :)
5331🔥23👍2
Forwarded from kto_to
End-to-end edge акселератор для народа: запускает MLP на FPGA за 25 долларов, сделан по кастомным инструкциям с полным тулчейном, и с недавнего времени поддерживает CNN.

89 MHz, тратит 25,470 циклов на инференс модельки весом примерно 10KB

https://github.com/SayatAbdikul/Ushqyn
🔥19👍5
Forwarded from 🧤 Сэр Шурф
Я разработчик. Делал жене интерактивный подарок на день рождения, не открытку. Получился маленький сайт: викторина про нас, фотопазл из её любимого снимка, письмо в бутылке. Ей понравилось, и я подумал, что такого инструмента для всех нет.

Так появился Uspamin. Бесплатный сайт, где можно собрать интерактивный подарок для близкого человека и отправить ссылкой. Внутри есть викторина, адвент-календарь, стена воспоминаний с голосовыми сообщениями, карта мест, история-листалка, фотопазл, мемори, и ещё несколько форматов. У каждого типа на странице выбора есть готовый пример, который можно открыть и пройти как получатель, без регистрации и без создания своего.

Принципы простые: никакой рекламы (ненавижу её), никаких аккаунтов, бесплатно по умолчанию. Опционально можно один раз заплатить десять фунтов, чтобы подарок остался навсегда, но большинству это не нужно.

Стек: Next.js, Supabase, Cloudflare, Vercel. Локализация на 19 языков через DeepL с автоматическим конвейером, поэтому в эмоциональных формулировках на каких-то языках возможны неточности. Если заметите неуклюжий перевод на родном языке, напишите, поправлю. Белорусский и арабский были в первой волне сознательно: имя продукта белорусское, а арабский заставляет с самого начала держать архитектурную дисциплину для письма справа налево.

Буду рад обратной связи, особенно технической.

https://www.uspamin.org
78👎9👍6🔥3🤔31
Forwarded from Aleksandr Grushko
Привет! Есть 2 пет-проектика, рад был бы поделиться с большим количеством людей)
Forwarded from Aleksandr Grushko
1) @hotColdGameBot - игра «горячо-холодно» на русском словаре с эмбеддингами.
Бот загадывает слово, пользователь пытается приблизиться к ответу по смыслу. Можно добавлять в чат и угадывать коллективно
🔥27👎112
Forwarded from Aleksandr Grushko
2) @wishapp - вишлист в тг. Добавляешь желания, делишься ссылкой с друзьями, друзья бронируют, что хотят подарить.

Киллер фича: можно через «поделиться» из любого приложения скинуть в чат боту ссылку, он сам распарсит и добавит желание в вишлист. Если не сможет (редко), сохранит только ссылку
🔥21👎14